Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

(インフラ分科会) 入力・校正支援システム #aozorahack

6,540 views

Published on

「Code for 青空文庫」アイデアソン #1 : ATND / https://atnd.org/events/66230 で発表したスライドです。

Published in: Internet
  • Be the first to comment

(インフラ分科会) 入力・校正支援システム #aozorahack

  1. 1. 自動校正システム + 入力支援 @silicagel, カシタニ, @key_amb
  2. 2. 概要 ● GitHub ライクな入力・校正フロー支援システム を作る ● OCR が利用可能であれば、更に自動化できる
  3. 3. GitHub ライクなシステム (1) ● Git 的な SCM をバックエンドに持つ ● Web UI を用意する ○ 非エンジニアでもわかりやすいインタフェース ● 入力も校正も複数人で共同作業 ○ 差分を検出してある程度自動マージする ○ コンフリクトしたら手動対応 ● 校正のため原著のデータが必要 ○ 画像形式でシステムにアップロードする
  4. 4. GitHub ライクなシステム (2) ● コントリビューションを可視化し、貢献者にメリッ トがある形にする ○ 入力・校正した人はトロフィー獲得 ○ ランキングを公開 ○ 表彰 ● 入力文書を郵送してる人に対しては ○ システムへの入力を代行する人を募る
  5. 5. GitHub ライクなシステム (3) ● 校正の信頼性を上げるために ○ 複数人の目に触れればOKとする ● 校正作業のゲーミフィケーション ○ 楽しく校正できるように ○ 例えば原本との差分をモンスター化する ○ 他) ■ 「いいね」が押せるようにする ■ 進捗をプログレスバー表示
  6. 6. GitHub ライクなシステム (4) ● 炎上が発生しないような仕組みづくりが求めら れる
  7. 7. OCR 活用について ● 現在はそれほど精度が高くない ● 活用できれば以上のワークフローの自動化が できそう ● 大学・研究機関と提携して進めればよいのでは ないか ○ データを提供する代わりに文字認識の精度を上げてもら う
  8. 8. インフラ何やるの? ● ストレージ周りは少し考えないといけなさそう ○ 画像などサイズがかなり大きくなることが予想される ○ => クラウドチームの成果に期待
  9. 9. 参考 ● GitHubで雑誌・書籍を作る ● Github を使って雑誌原稿を書く - naoyaのはてなダイアリー

×