クラウドソーシングによる	
  
文献情報メタデータ整備の可能性	
  
Discussions	
  on	
  metadata	
  refinement	
  
by	
  crowdsourcing	
清田陽司(Yoji	
  Kiyota)*+	
  日向野達郎(Tatsuro	
  Higano)*	
  
中村早紀(Saki	
  Nakamura)* 増田英孝(Hidetaka	
  Masuda)*  
山田剛一(Koichi	
  Yamada)*	
  
*東京電機大学	
  (Tokyo	
  Denki	
  University)	
  
+株式会社ネクスト	
  (NEXT	
  Co.,	
  Ltd.)	
  
2013年9月1日	
  
Code4Lib	
  Conference	
  JAPAN	
  2013	
  
@宮城県本吉郡南三陸町 「南三陸プラザ」	
  
hTps://www.facebook.com/MiningExploraZon
研究者にとってのサーベイ手段	
•  パッケージ媒体(レファ本、専門書)	
  
•  論文、研究報告	
  
•  ふだんの活動の場(キャンパスなど)	
  
•  リアルイベント(学会主催の会議、研究会)	
  
•  ソーシャルネットワーク
ヒトを手がかりとした文献情報の入手	
•  直接のコンタクト	
  
•  研究者ホームページ	
  
•  業績データベース	
  
•  論文検索サービス
著者レコード整備にまつわる諸問題	
•  コストと品質のトレードオフ	
  
–  人手での整備か機械的処理か?	
  
•  名寄せ問題	
  
–  同姓同名	
  
–  組織の移動	
  
–  改姓	
  
•  グローバルなIDの不在	
  
–  日本であれば科研費の研究者番号などがあるが…	
  
•  組織どうしの連携の難しさ	
  
–  整備のエフォートが共有されない	
  
ゆるふわメタデータ?	
•  各々の機関が管理しているメタデータは気軽
に編集できない	
  
•  気づいた人が編集・訂正できるメタデータって
あり?	
  
– Wikipediaみたいに	
  
NDL	
 NII	
JST	
民間	
  
MARC	
公共図書館	
 大学図書館	
各種研究機関	
 出版社	
Web	
サーチエンジン	
オンライン書店	
  
(Amazonなど)	
Wikipedia	
連携Wiki
誰が編集する?	
•  Wikipediaと同じ動機づけはうまくいかなそう	
  
•  知らない人については判断が難しいだろう	
  
	
  
親しい人にフィードバックしてもらう仕組みを作
れないか?	
  
•  知り合いに関するメタデータをきれいにするこ
となら、インセンティブはあるだろう	
  
•  知り合いの研究かどうかは容易に判断できる
だろう
14
著者同定タスクの
クラウドソーシング
15
氏名 : 著者A	
学歴 : ○○高校	
  
	
  
	
  ☓☓大学	
職歴 : ☓☓大学	
  
	
  
	
  △△株式会社	
氏名 : 著者A	
  
所属機関:☓☓大学	
  
論文名 : 論文1	
氏名 : 著者A	
  
所属機関:☓☓大学	
  
	
   □□学部	
  
論文名 : 論文1	
	
  
	
  
	
  
比
較	
ユーザ	
情報取得	
判別
Facebookのメタデータ
16
Facebookから取
得するメタデータ	
  
	
  
氏名・学歴・職歴
CiNiiのメタデータ
17
CiNiiから取得する	
  
メタデータ	
  
	
  
氏名・所属機関・論文名
何を作ればできる?	
•  Facebookアプリ	
  
– FB上の友達の名前でCiNii著者レコードを検索し、
リスト表示	
  
– 自分が知っている著者レコードを選んでもらい、
情報をバックエンドに送信	
  
– 友達の新着論文を表示	
  
•  バックエンド(Web	
  API)	
  
– FBレコードと著者レコードを対応づけるDB	
  
– DBの編集機能
デモ 1/3
友人一覧取得結果
デモ 2/3
Facebookから取得し
た詳細情報	
CiNii著者検索から取得した結果
デモ 3/3
検討すべき課題	
•  本人の意思と関係なく紐付けがなされること
への抵抗はないか?	
  
– 研究者の情報発信は実名でなされるべき	
  
– FaceBookは実名主義	
  
– 紐付けを可とするかどうかは別の問題をはらむ	
  
•  間違った紐付けがされた場合はどうする?	
  
– 自分の研究業績が他人のものに見られてしまう
可能性
ベストエフォート・メタデータの	
  
存立可能性	
•  「間違いもありうるが、多くの場合は役に立
つ」というメタデータは存在できるのか?	
  
– 現行の提供形態は無謬性が前提	
  
– Webではむしろベストエフォートが主流	
  
•  ベストエフォートであることがユーザーに伝わ
るデザインが必要だろう	
  
みんなのメタデータへ	
•  メタデータ基盤を維持していくためには、だれ
もが「我が事」だと感じられる仕組みが必要	
  
•  メタデータ編集への心理的ハードルを下げる
ための工夫	
  
– 動機づけ	
  
– タスクを細分化する仕組み

クラウドソーシングによる文献情報メタデータ整備の可能性 / Discussions on metadata refinement by crowd souring