なぜ研究者の名寄せが必要か ~世界の動向と研究者リゾルバー~CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」     2011年2月17日,学術総合センター,主催:金沢大学        蔵川 圭     国立情報学研究所...
学術研究における貢献• 学術研究成果の多くは論文として出版され公表  される• すでに存在する論文を引用しながらそれが表す  知識の体系を位置づける• 誰が貢献したか、どのような組織が貢献したか  がわかるように内容とともに著者名や所属組織  ...
名前の曖昧性の問題     (Name Ambiguity Problem)•   同姓同名•   旧姓•   ペンネーム•   漢字異体字•   ジャーナルごとに異なる姓名表記フォーマット    – 姓名の順    – イニシャル表記    ...
名前の翻字(transliterate)• ラテン文字への翻字によって、同姓同名が増  える王伟,王薇,王维,王蔚,汪卫,汪玮,汪威,汪巍         Wei Wang       “Which Wei Wang?”,Phys. Rev. ...
名寄せ(Name Disambiguation)• 名前の問題を解決して、同一性を判定すること  を「名寄せ」という• 研究者の名寄せによって、 – 研究者ごとに正確に論文やその他研究成果をリスト   化でき、リストは知識体系への貢献度を正確に...
日本の図書館目録• NACSIS-CAT  –   国立情報学研究所の運営  –   日本の大学図書館の所蔵する図書・雑誌の総合目録  –   洋書が多く含まれる  –   USMARC準拠  –   日本目録規則,およびAACR2• JAPA...
図書館目録の著者名典拠•   NACSIS-CAT著者名典拠ファイル     – 個人名,団体名の典拠     – 個人名1,263,685件(西洋人著者名含む, 2008年12月18日)•   JAPAN/MARC典拠ファイル     – 個...
登録件数                                                 登録件数                                                 登録件数            ...
著者名典拠における                   異なり姓名順位トップ20     NACSIS--CAT           JAPAN/MARC                       TRC/MARC順位   姓名       ...
母集団の大きさに依存する    同姓同名の割合• 文献によると – 田中康仁,同姓同名の発生頻度,計算言語学   10-1,1977 – 昭和51年当時の日本人の漢字姓名107万人の   名簿を用いて機械的に数え上げ              ...
研究者の名寄せの方法• 図書館の目録のように、閉じたデータベースの中では  人手で著者に英数字記号の識別子(Identity: ID)を付  けて区別した• 学術論文のデータベースでは、2つの方法がとられて  きた – 計算機による名寄せ – ...
学術論文データベースにおける      これまでの2つのアプローチ• 計算機による名寄せ – 論文書誌を対象に著者でまとめる – 論文情報システムの著者名検索結果として機能 – プロダクションシステムとして必要な99%以上の精度を求める   に...
研究者ID付与コミュニティORCID• Open Researcher and Contributor ID   –   Open : 公開された   –   Researcher : 研究者   –   Contributor : 貢献者  ...
ORCIDの参加組織• 2010年11月では144機関。 – 学術機関47、出版者28、企業19、学会15、政府   11、NPO17、その他7 – 米国70、英国30、ドイツ8、オーストラリア6、日本   3、イタリア3、インド3、スペイン2...
ORCID IDシステム• アイデンティティとして扱う基本的な情報 – 著者/貢献者自身の記述 – 著者/貢献者とその出版物間の関係の記述• ハイブリッド型による登録 – 著者/貢献者による登録                  プロファイル ...
ORCID IDシステムのシナリオ       エンド                               パートナー      ユーザー                               システム              ...
プロファイルの交換とマッチング                                                                                           可能なマッチングアルゴリズム  ...
著作者にIDを付ける活動• バーチャル国際典拠ファイル VIAF (Virtual International Authority  File),  –   米国OCLC  –   LC  –   ドイツDNB  –   フランスBnF• 国際...
VIAF • 各国の名前典拠ファイルをリンク • 今は個人名のみ• 1050万件(2010-03)の  名前レコード• 抽出元 – 1300万件名前レコード – 8000万件の引用レコード                            ...
ISNI・16ケタの数字・クリエーター一般・少なくとも2000万件のIDを想定                 ブリッジ識別子                               20        http://www.nii.ac....
機関リポジトリを対象とした      著者にIDを付ける活動• DAI (Digital Author Identifier), オランダ  SURF財団• Names Project, 英国 Mimas, JISC funded• arXiv...
JAIRO著者同定                              日本の機関リポジトリからJAIROがハーベストした                              書誌メタデータに書かれた著者を同定するために研究者リゾル...
IRにおける研究者典拠IDの付与                     DSpace 1.6                     Authority Control                                  23 ...
研究者リゾルバーの目的•   日本の研究者を対象としたWeb上の名前典拠    – Web上にアーカイブされたリソースをターゲット       •   例1) 機関リポジトリ       •   例2) 論文アーカイブ    – さらに、日本の...
研究者リゾルバーのアプローチ• 日本の研究者を対象としたURIベースのIDスキーム  – 研究者リゾルバーID  – http://rns.nii.ac.jp/nr/xxxxxxxxxxxxx (xxxxxxxxxxxxxはID)• KAKEN...
研究者同定スキーム•            研究者が同じ人物であることを示すこと                           研究者同定• 研究者/著者を同定しマネージメントするひとつの方法      – 番号IDスキーム       ...
IDの特徴• KAKEN ID (科研費研究者番号)  – 科学研究費補助金における研究者番号  – 文部省(現・文部科学省)が1939年に開始した,多様    な研究分野・研究組織・研究段階を対象とした,日本    で最大唯一の研究費配分制度...
機関担当者による          データアップローディング研究者リゾルバーIDと機関のローカル研究者IDとのマッピングテーブルを構築し、研究者名を解決する                         機関は何をすべきか?         ...
機関担当者の視点•   IR     – 機関固有のローカルな研究者IDが埋       め込まれた書誌メタデータが様々な                                      OAIster       OAIサービスプロ...
異なる研究者リソース間のリンキング• 異なる研究者ID集合間のIDマッチング   研究者ID集合A   研究者ID集合B                                        30                 htt...
研究者Webリソースリンキング• Web上の研究者ID集合 – 大学研究者ディレクトリ – J-Global (ReaD) – KAKEN• 集合間のIDマッチング                                  大学研究者デ...
大学研究者ディレクトリへのリンク• Web上の大学研究者ディレクトリへのクローリ  ング – 研究者ページのURLを特定 – それぞれのURLに対して研究者名を特定• 研究者リゾルバーIDと大学研究者ディレクトリ  のローカルIDを同定する方法...
研究者同定のひとつの方法• KAKENと研究者ディレクトリのそれぞれのID  に対して以下のとき、同一人物と判定する – 漢字氏名の一致 – 所属の一致 – 所属内でユニーク名(同姓同名がいない)• IDが以下のとき、同一人物である – KAK...
システム間連携の概略                             2010年度                                                                          論文著...
研究者リゾルバー β1.0            現在の実装• 研究者ごとのページ  – 現在はKAKENに登録された研究者に対しページを提供  – 約18万研究者  – 同姓同名解決された研究者• Web上の研究者リソースとのリンク  – 直...
研究者リゾルバー β1.0 研究者ページ(概略)     研究者姓名 (漢字,カタカナ,ローマ字)            研究者基本情報            直接リンク            検索質問フォーマットURLリンク         ...
研究者リゾルバー β1.0        研究者ページ(上側)              研究者姓名 (漢字,カタカナ,ローマ字)               研究者リゾルバーID研究者               科研費研究者番号基本情報  ...
研究者リゾルバー β1.0              研究者ページ(上側)直接リンク•KAKEN(NII)•大学研究者ディレクトリ•J-Global(ReaD)                                          ...
研究者リゾルバー β1.0            研究者ページ(上側)検索質問フォーマットURLリンク(漢字姓名と所属)•Google                                            39         ...
研究者リゾルバー β1.0            研究者ページ(上側)検索質問フォーマットURLリンク(漢字姓名)•CiNii•Webcat Plus•ReaD•Google Scholar•Google                    ...
研究者リゾルバー β1.0            研究者ページ(上側)検索質問フォーマットURLリンク (英語姓名)•CiNii•Webcat Plus•ReaD•Google Scholar•Google                   ...
研究者リゾルバー β1.0            研究者ページ(下側)科研費研究課題の研究分野科研費研究課題のキーワードこのページのURI                                            42       ...
Webの波• Web技術のパラダイムシフト  – Web of Documentsから  – Web of Dataへ• Linking Open Dataの潮流  – RDFによって事実を記述して、データとして公開  – RDFでは、事実は2...
Linked Data Web of Open Repositories in 2010 - 2015                     2010-07-28, Kei Kurakawa, NII                     ...
Linked Data Webのための       検索質問応答API• OpenSearch1.1• RDF/XML                                         45                  ht...
研究者IDリダイレクトWebサービス    • 研究者IDとターゲットサービスをURLで指定      して,研究者ページへリダイレクトするWebサ      ービス                                       ...
サービス連携の例• 京都大学リポジトリ                • 静岡大学リポジトリ(SURE)  (KURENAI)                 – dc.contributor.author – dc.contributor.a...
国際連携・協力• 研究者・著者名システム間連携                                      48               http://www.nii.ac.jp/cscenter/
まとめ• 研究者の学術研究の貢献度を正確に測るために  は,名前の曖昧性の問題を解決して,研究成果  に記述された著者の名寄せを行う必要がある.• 日本人姓名に関しては,図書館典拠ファイルを調  査したところ,同姓同名が50万人規模で10パー ...
Upcoming SlideShare
Loading in …5
×

なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

5,559 views

Published on

CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」 2011年2月17日,学術総合センター,主催:金沢大学

なぜ研究者の名寄せが必要か ~ 世界の動向と研究者リゾルバー ~

  1. 1. なぜ研究者の名寄せが必要か ~世界の動向と研究者リゾルバー~CSI委託事業ワークショップ「名寄せのこれから~研究者IDサミット~」 2011年2月17日,学術総合センター,主催:金沢大学 蔵川 圭 国立情報学研究所学術コンテンツサービス研究開発センター http://www.nii.ac.jp/cscenter/
  2. 2. 学術研究における貢献• 学術研究成果の多くは論文として出版され公表 される• すでに存在する論文を引用しながらそれが表す 知識の体系を位置づける• 誰が貢献したか、どのような組織が貢献したか がわかるように内容とともに著者名や所属組織 名が明記される。助成機関に対して謝辞を加え ることも多い• ある研究者がどのくらい知識の体系化に貢献し たかを測ってみたいとき、研究者の論文を並べ てみればよい 2 http://www.nii.ac.jp/cscenter/
  3. 3. 名前の曖昧性の問題 (Name Ambiguity Problem)• 同姓同名• 旧姓• ペンネーム• 漢字異体字• ジャーナルごとに異なる姓名表記フォーマット – 姓名の順 – イニシャル表記 – 大文字・小文字 3 http://www.nii.ac.jp/cscenter/
  4. 4. 名前の翻字(transliterate)• ラテン文字への翻字によって、同姓同名が増 える王伟,王薇,王维,王蔚,汪卫,汪玮,汪威,汪巍 Wei Wang “Which Wei Wang?”,Phys. Rev. Lett. 99, 230001 (2007) DOI:10.1103/PhysRevLett.99.230001 4 http://www.nii.ac.jp/cscenter/
  5. 5. 名寄せ(Name Disambiguation)• 名前の問題を解決して、同一性を判定すること を「名寄せ」という• 研究者の名寄せによって、 – 研究者ごとに正確に論文やその他研究成果をリスト 化でき、リストは知識体系への貢献度を正確に測る 情報源となる – 研究者が正確に過去の業績によってプロファイルさ れることで、そのプロファイルは新たな研究チームを 構成する際の正確な情報源として活用できる – 学術コミュニケーションにおける様々な場面において 、研究者を特定した情報交換が可能となる 5 http://www.nii.ac.jp/cscenter/
  6. 6. 日本の図書館目録• NACSIS-CAT – 国立情報学研究所の運営 – 日本の大学図書館の所蔵する図書・雑誌の総合目録 – 洋書が多く含まれる – USMARC準拠 – 日本目録規則,およびAACR2• JAPAN/MARC – 国立国会図書館の運営 – 国会図書館の所蔵する,日本で刊行された出版物および外国で刊行された日 本語出版物の目録 – UNIMARC準拠 目録 – 日本目録規則 参照する• TRC/MARC 参照する – 図書館流通センターの運営 書誌 典拠 – 日本で刊行される出版物の目録 – UNIMARC準拠 – 日本目録規則 著者名 (統一)書名 6 http://www.nii.ac.jp/cscenter/
  7. 7. 図書館目録の著者名典拠• NACSIS-CAT著者名典拠ファイル – 個人名,団体名の典拠 – 個人名1,263,685件(西洋人著者名含む, 2008年12月18日)• JAPAN/MARC典拠ファイル – 個人名,家名,団体名,および統一書名の典拠 – 個人名681,924件(西洋人著者名含む, 2008年7月5日)• TRC/MARC著者名典拠ファイル – 個人名,機関名の典拠 – 個人名566,249件(西洋人著者名含む, 2009年3月29日) 人名データベース 登録件数 同一姓名が 同一姓名が 同一姓名に 同一姓名が (漢字圏の東洋 複数存在す 複数存在す 対する最大 複数存在す 人の統一形標目 る登録件数 る異なり姓 登録件数 る登録件数 を抜粋) 名数 の割合 NACSIS-CAT 著者名典拠ファイル 329,864 32,034 13,344 20 9.71% (2008年12月18日) JAPAN/MARC 典拠ファイル 572,638 73,138 28,067 29 12.77% (2008年7月5日) TRC/MARC 著者名典拠ファイル 464,962 58,979 22,969 27 12.68% (2009年3月29日) 7 http://www.nii.ac.jp/cscenter/
  8. 8. 登録件数 登録件数 登録件数 件 10 15 20 25 30 10 15 20 25 件 30 10 15 20 25 件 30 0 5 0 5 0 5 1 1 1 501 501 501 1001 1001 1001 1501 1501 1501 2001 2001 2001 2501 2501 2501 27 29 20 3001 3001 3001 3501 3501 3501 4001 4001 4001 4501 4501 4501 5001 5001 5001 5501 5501 5501 6001 6001 6001 6501 6501 6501 7001 7001 7001 7501 7501 7501 8001 8001 8001 8501 8501 8501 9001 9001 9001 9501 9501 9501 10001 10001 10001 10501 10501 13,344 10501 11001 11001 11001 11501 11501 11501 12001 12001 12001 12501 12501 12501 13001 13001 13001 13501 13501 14001 14001 14501 14501 15001 15001 15501 15501 16001 16001 16501 16501 17001 異なり姓名順位 17001 NACSIS-CAT 17501 JAPAN/MARC 17501 18001 18001 18501 18501 19001 19001 19501 19501 20001 TRC/MARC 22,969 20001 20501 20501 21001 21001 21501 21501 22001 22001 22501 22501 23001 311,174 23501 24001 24501 25001 28,067 25501 著者名典拠における 26001 26501 異なり姓名順位 27001 27501 28001 428,952 異なり姓名順位 異なり姓名ごとの登録件数の分布 8 527,567http://www.nii.ac.jp/cscenter/
  9. 9. 著者名典拠における 異なり姓名順位トップ20 NACSIS--CAT JAPAN/MARC TRC/MARC順位 姓名 登録件数 姓名 登録件数 姓名 登録件数1 高橋徹 20 鈴木博 29 鈴木博 272 鈴木博 17 田中実 29 田中実 263 佐藤進 17 伊藤博 28 小林茂 244 田中実 16 小林茂 26 高橋徹 235 伊藤博 16 鈴木一郎 24 鈴木実 226 高橋進 13 高橋一郎 22 佐藤進 217 高橋清 13 佐藤正 22 渡辺誠 198 鈴木一郎 13 高橋徹 21 佐藤正 199 小林茂 13 鈴木実 21 伊藤博 1910 吉田豊 13 田中豊 21 田中稔 1811 高橋誠 12 (李〓) 21 小林一郎 1812 田中宏 12 鈴木茂 20 鈴木隆 1713 渡辺誠 12 吉田稔 20 鈴木茂 1714 渡辺茂 12 田中宏 19 田中宏 1715 小林哲夫 12 佐藤進 19 吉田豊 1716 田中明 11 高橋和子 18 佐藤博 1717 佐藤正 11 渡辺誠 18 高橋進 1618 中村宏 11 渡辺宏 18 田中豊 1619 高橋豊 10 高橋清 17 田中茂 16 9 高橋正明 10 (陳〓) 17 田中一郎 1620 http://www.nii.ac.jp/cscenter/
  10. 10. 母集団の大きさに依存する 同姓同名の割合• 文献によると – 田中康仁,同姓同名の発生頻度,計算言語学 10-1,1977 – 昭和51年当時の日本人の漢字姓名107万人の 名簿を用いて機械的に数え上げ 同姓同名がいる人の割合(%) % 40 30 20 10 0 母集団 0 50 100 150 万人 10 http://www.nii.ac.jp/cscenter/
  11. 11. 研究者の名寄せの方法• 図書館の目録のように、閉じたデータベースの中では 人手で著者に英数字記号の識別子(Identity: ID)を付 けて区別した• 学術論文のデータベースでは、2つの方法がとられて きた – 計算機による名寄せ – 手動で登録• 新たな名寄せの潮流 – ORCID (Open Researcher and Contributor ID) – 学術コミュニケーションに関与するすべてのステークホル ダーを包含した、研究者にIDを付与するコミュニティを形 成する 11 http://www.nii.ac.jp/cscenter/
  12. 12. 学術論文データベースにおける これまでの2つのアプローチ• 計算機による名寄せ – 論文書誌を対象に著者でまとめる – 論文情報システムの著者名検索結果として機能 – プロダクションシステムとして必要な99%以上の精度を求める には程遠い – 例 • Scopus Author Identifier (Elsevier社のScopusに実装) • Distinct Author Identification System (Thomson Reuters社のWeb of Scienceに実装)• 手動で登録 – 著者を対象に論文書誌を集める – 研究者業績ショーケースとして機能 – 簡単に著者と論文書誌を網羅できない – 例 • ResearcherID (Thomson Reuters社) 12 http://www.nii.ac.jp/cscenter/
  13. 13. 研究者ID付与コミュニティORCID• Open Researcher and Contributor ID – Open : 公開された – Researcher : 研究者 – Contributor : 貢献者 – ID : 本人証明• 設立趣旨(Mission Statement) – ORCIDは、学術コミュニケーションにおける著者/貢献者の名 前の曖昧性の問題を解決することを目的とし、個々の研究者 に対する固有の識別子の中央レジストリと、ORCIDと現存する 他の著者IDスキームとの間のオープンで透過的なリンクメカニ ズムを構築することによって実現する。これらの識別子及び識 別子間の関係は研究者のアウトプットにリンクすることが可能 であり、科学的発見プロセスを拡大させ、研究コミュニティにお ける研究助成や協働の効率性を改善する。• http://www.orcid.org/ 13 http://www.nii.ac.jp/cscenter/
  14. 14. ORCIDの参加組織• 2010年11月では144機関。 – 学術機関47、出版者28、企業19、学会15、政府 11、NPO17、その他7 – 米国70、英国30、ドイツ8、オーストラリア6、日本 3、イタリア3、インド3、スペイン2、中国2、カナ ダ2、トルコ1、スイス1 、スウェーデン1 、韓国1 、 シンガポール1 、セルビア1 、オランダ1 、イスラ エル1 、ギリシャ1 、フランス1 、エジプト1 、コロン ビア1 、ブラジル1 、ベルギー1 、オーストリア1 14 http://www.nii.ac.jp/cscenter/
  15. 15. ORCID IDシステム• アイデンティティとして扱う基本的な情報 – 著者/貢献者自身の記述 – 著者/貢献者とその出版物間の関係の記述• ハイブリッド型による登録 – 著者/貢献者による登録 プロファイル – 組織による登録 ORCID ID 出版物申告 15 http://www.nii.ac.jp/cscenter/
  16. 16. ORCID IDシステムのシナリオ エンド パートナー ユーザー システム たとえば、原稿追跡システム(だれが文書Xを書いたか? MTS : Manuscript Tracking System)にシングルサインオン(ID Yの人が書いた、 SSO)して、編集事務局、マーケまたは査読した文書はどれか? ティング部門、ロイヤルティ支払 いシステムなどと連絡先情報を 共有 コアシステム (ORCID identity system) 16 http://www.nii.ac.jp/cscenter/
  17. 17. プロファイルの交換とマッチング 可能なマッチングアルゴリズム • VIAF(OCLC) • Author Resolver (ProQuest) • OKKAM ORCID F67572010(By Howard Ratner, ORCID Update, Slides at CrossRef Annual Meeting, in London, 16 Nov. 2010) 17 http://www.nii.ac.jp/cscenter/
  18. 18. 著作者にIDを付ける活動• バーチャル国際典拠ファイル VIAF (Virtual International Authority File), – 米国OCLC – LC – ドイツDNB – フランスBnF• 国際標準名前識別子 ISNI (International Standard Name Identifier), ISO27729 – International Confederation of Societies of Authors and Composers (CISAC) www.cisac.org – International Federation of Reproduction Rights Organisations (IFRRO)www.ifrro.org – International Performers’ Database Association (ipda.sami.se) – Bowker (www.bowker.com ) – Online Computer Library Center (OCLC) (www.oclc.org) – Bibliotheque Nationale de France – The British Library 18 http://www.nii.ac.jp/cscenter/
  19. 19. VIAF • 各国の名前典拠ファイルをリンク • 今は個人名のみ• 1050万件(2010-03)の 名前レコード• 抽出元 – 1300万件名前レコード – 8000万件の引用レコード 19 http://www.nii.ac.jp/cscenter/
  20. 20. ISNI・16ケタの数字・クリエーター一般・少なくとも2000万件のIDを想定 ブリッジ識別子 20 http://www.nii.ac.jp/cscenter/
  21. 21. 機関リポジトリを対象とした 著者にIDを付ける活動• DAI (Digital Author Identifier), オランダ SURF財団• Names Project, 英国 Mimas, JISC funded• arXiv.org Author Identifiers, 米国コーネル 大学• Networking Names, 米国OCLC• 研究者リゾルバー,NII 21 http://www.nii.ac.jp/cscenter/
  22. 22. JAIRO著者同定 日本の機関リポジトリからJAIROがハーベストした 書誌メタデータに書かれた著者を同定するために研究者リゾルバーIDと機関のローカル研究者IDとのマッピングテーブル メタデータをハーベストする間、 ローカル研究者IDを解決する 研究者リゾルバー JAIRO NII (国レベル) 書誌メタデータ [ローカル研究者IDが組み込まれている] IR著者名典拠 IR (研究者ディレクトリ) 機関 (機関レベル) 双方のシステムで同一のローカル研究者 IDスキームが使われるべきである 著者名典拠 書誌レコード 22 http://www.nii.ac.jp/cscenter/
  23. 23. IRにおける研究者典拠IDの付与 DSpace 1.6 Authority Control 23 http://www.nii.ac.jp/cscenter/
  24. 24. 研究者リゾルバーの目的• 日本の研究者を対象としたWeb上の名前典拠 – Web上にアーカイブされたリソースをターゲット • 例1) 機関リポジトリ • 例2) 論文アーカイブ – さらに、日本の研究組織を対象とした名称典拠• 2種類のエンティティ、すなわち論文と研究者をベースとした情報マネージメント• 情報の質に応じた研究者情報マネージメント – 研究者情報の品質レベル • 機関担当者による \論文 機関担当者による 研究者自身に 機械による • 研究者自身による \ とりまとめ よるとりまとめ 自動処理 \ • 機械の自動処理による 高 研究者• Web上のリソースのリンキングハブ 機関担当 研究者ディレクトリ 機関にある – 研究者データベースへ直接リンク 者による ReaD ホームページ 登録 IR • 大学研究者ディレクトリ, KAKEN, ReaD KAKEN 情報の品質レベル 研究者のカバー率 – 学術関連データベースへ 研究者 検索問い合わせURLリンク リゾルバー • Google (Scholar), CiNii, WebcatPlus, ReaD 研究者自 ResearcherID• Linked Data Webのための、 身による 登録 Researchmap 日本の研究者と組織のURI表現 機械によ CiNii 著者検索 Google• 名前解決するWebサービス る自動処 Google 高 理 scholar• NIIの学術関連サービスへの 密接なデータ連携 24 http://www.nii.ac.jp/cscenter/
  25. 25. 研究者リゾルバーのアプローチ• 日本の研究者を対象としたURIベースのIDスキーム – 研究者リゾルバーID – http://rns.nii.ac.jp/nr/xxxxxxxxxxxxx (xxxxxxxxxxxxxはID)• KAKENから研究者を初期登録 (2010年3月19日現在、 177,558人)• 機関担当者による、IDに紐づいた研究者プロファイルのアップロード – 研究者リゾルバーIDと、他のIDスキームによるIDリスト • 機関による完全に永続的なID (例、職員番号、同姓同名を区別する) • ・・・・・ • 科研費研究者番号 • ReaD研究者コード • ResearcherID (Thomson Reuters) • 研究者リゾルバーID – 名前 – 所属履歴 – 業績リスト• 大学研究者ディレクトリへの自動リンキング – 大学研究者ディレクトリをWebクローリング – 自動研究者同定 25 http://www.nii.ac.jp/cscenter/
  26. 26. 研究者同定スキーム• 研究者が同じ人物であることを示すこと 研究者同定• 研究者/著者を同定しマネージメントするひとつの方法 – 番号IDスキーム • 13ケタの番号によって研究者を表す • 研究者リゾルバーIDと呼ぶ ID (13ケタの番号) 説明 10000xxxxxxxx 科研費登録者のID割り当て xxxxxxxx は、科研費研究者番号 (8 桁) 200xxxxxxxxxx ReaD登録者のID割り当て(科研費登録者は除く) xxxxxxxxxx は、ReaD研究者コード (10桁) 3xxxxxxxxxxxx それ以外のID割り当て 26 http://www.nii.ac.jp/cscenter/
  27. 27. IDの特徴• KAKEN ID (科研費研究者番号) – 科学研究費補助金における研究者番号 – 文部省(現・文部科学省)が1939年に開始した,多様 な研究分野・研究組織・研究段階を対象とした,日本 で最大唯一の研究費配分制度 – 約18万人が登録• ReaD ID – JST(科学技術振興機構)が運営する,研究者・研究 機関ディレクトリの研究者ID – 約22万人が登録 – 大学教員,研究スタッフのほか,大学院生含む 27 http://www.nii.ac.jp/cscenter/
  28. 28. 機関担当者による データアップローディング研究者リゾルバーIDと機関のローカル研究者IDとのマッピングテーブルを構築し、研究者名を解決する 機関は何をすべきか? 1. 機関自身を表明する 研究者リゾルバー 2. 機関のローカル研究者IDを登録するために、 NII a) ローカル研究者IDとそれに紐づいた国内で広く使われている研究者IDを知らせる A: KAKEN ID B:ReaD ID → KAKEN ID または ReaD ID ベースの研究者リゾルバーIDが 登録される a’) ローカル研究者IDを新規登録者として知らせる → 新しい研究者リゾルバーIDが割り当てられる 3. 機関のローカル研究者ID同士のマッピングのために、 a) ローカル研究者IDに紐づいた、別の外部スキーマによる研究者IDを知らせる A: KAKEN ID IR研究者典拠 B: ReaD ID 機関 (研究者ディレクトリ) C: ResearcherID D: その他サービスのIDs…. 4. 研究者のプロファイルをステートするために、 a) 研究者名、所属履歴、研究業績を知らせる 5. 研究者リゾルバーから研究者ディレクトリへ逆リンクをはるために、 a) それぞれのローカル研究者IDに割り当てられた研究者ディレクトリのURLを教える 日本人の名前とデータに適用し、IDマップを構築できるよう ResearcherIDのフォーマットを拡張したXMLファイルをアップロードする 28 http://www.nii.ac.jp/cscenter/
  29. 29. 機関担当者の視点• IR – 機関固有のローカルな研究者IDが埋 め込まれた書誌メタデータが様々な OAIster OAIサービスプロバイダーにハーベスト• IR研究者典拠(研究者ディレクトリ) – 機関がローカルな研究者IDに紐づいた IR JAIRO 研究者プロファイルを研究者を指向し たサービスプロバイダにアップロード – 研究者リゾルバーの研究者プロファイ NDLTD ルには以下の項目が含まれる (Networked Digital Library of Theses and Dissertations) • ローカルな研究者ID • 名前 • 外部サービスのID,たとえば (ResearcherID) – 科研費研究者番号 – ReaD研究者コード – ResearcherID – 研究者リゾルバーID IR研究者典拠 • 個々の研究者の研究者ディレクトリ 研究者リゾルバー (研究者ディレクトリ) URL • 所属履歴 • 業績リスト (ReaD) 29 http://www.nii.ac.jp/cscenter/
  30. 30. 異なる研究者リソース間のリンキング• 異なる研究者ID集合間のIDマッチング 研究者ID集合A 研究者ID集合B 30 http://www.nii.ac.jp/cscenter/
  31. 31. 研究者Webリソースリンキング• Web上の研究者ID集合 – 大学研究者ディレクトリ – J-Global (ReaD) – KAKEN• 集合間のIDマッチング 大学研究者ディレクトリ B 大学研究者ディレクトリ A 研究者リゾルバー KAKEN J-Global 31 http://www.nii.ac.jp/cscenter/
  32. 32. 大学研究者ディレクトリへのリンク• Web上の大学研究者ディレクトリへのクローリ ング – 研究者ページのURLを特定 – それぞれのURLに対して研究者名を特定• 研究者リゾルバーIDと大学研究者ディレクトリ のローカルIDを同定する方法を適用• 研究者リゾルバーの研究者ページから大学研 究者ディレクトリの研究者ページURLへリンク 32 http://www.nii.ac.jp/cscenter/
  33. 33. 研究者同定のひとつの方法• KAKENと研究者ディレクトリのそれぞれのID に対して以下のとき、同一人物と判定する – 漢字氏名の一致 – 所属の一致 – 所属内でユニーク名(同姓同名がいない)• IDが以下のとき、同一人物である – KAKEN IDが同一 – ReaD IDが同一 33 http://www.nii.ac.jp/cscenter/
  34. 34. システム間連携の概略 2010年度 論文著者フィールドに 機関の永続固定IDを組み込む 機関研究者ディレ 研究者サービス クトリ および 機関研究者ディレクトリ 機関リポジトリ 機関リポジトリ 機関の永続固定IDごとの 機関の永続固定IDごとの 研究者プロファイルと 研究者プロファイルと Web of 業績リスト 業績リスト 研究者と論文のサービスKnowledge ResearcherID(Thomson (Thomson Reuters) Reuters) 機関の永続固定IDと研究者リゾルバーIDを 変換するための質問と応答 JAIRO 論文サービス 研究者リゾルバー 日本の機関リポジトリ (NII) 横断検索サービス KAKEN IDとReaD IDの (NII) KAKEN ID、 CLS マッピングテーブル リンク 研究者姓名、所属、 分野、キーワード KAKEN CiNii データ連携 (NII) ALS (NII) J-Global (Including ReaD) (JST) Researchmap (NII) 34 http://www.nii.ac.jp/cscenter/
  35. 35. 研究者リゾルバー β1.0 現在の実装• 研究者ごとのページ – 現在はKAKENに登録された研究者に対しページを提供 – 約18万研究者 – 同姓同名解決された研究者• Web上の研究者リソースとのリンク – 直接リンク • KAKEN Webクローリングと • 機関の研究者DB(現在33大学を対象) KAKEN IDマッチング • J-Global (JST 旧ReaD) – 検索問い合わせリンク • Google, Google Scholar, CiNii, Webcat Plus, ReaDへの日本語・英語の氏名,所属 による問い合わせ• 機関担当者による研究者プロファイルと業績リストのアップロード• SemanticWebのための質問応答 – OpenSearch – RDF/XML• 研究者IDリダイレクトWebサービス• http://rns.nii.ac.jp/ 35 http://www.nii.ac.jp/cscenter/
  36. 36. 研究者リゾルバー β1.0 研究者ページ(概略) 研究者姓名 (漢字,カタカナ,ローマ字) 研究者基本情報 直接リンク 検索質問フォーマットURLリンク 科研費研究課題の研究分野 科研費研究課題のキーワード このページのURI 36 http://www.nii.ac.jp/cscenter/
  37. 37. 研究者リゾルバー β1.0 研究者ページ(上側) 研究者姓名 (漢字,カタカナ,ローマ字) 研究者リゾルバーID研究者 科研費研究者番号基本情報 所属 37 http://www.nii.ac.jp/cscenter/
  38. 38. 研究者リゾルバー β1.0 研究者ページ(上側)直接リンク•KAKEN(NII)•大学研究者ディレクトリ•J-Global(ReaD) 38 http://www.nii.ac.jp/cscenter/
  39. 39. 研究者リゾルバー β1.0 研究者ページ(上側)検索質問フォーマットURLリンク(漢字姓名と所属)•Google 39 http://www.nii.ac.jp/cscenter/
  40. 40. 研究者リゾルバー β1.0 研究者ページ(上側)検索質問フォーマットURLリンク(漢字姓名)•CiNii•Webcat Plus•ReaD•Google Scholar•Google 40 http://www.nii.ac.jp/cscenter/
  41. 41. 研究者リゾルバー β1.0 研究者ページ(上側)検索質問フォーマットURLリンク (英語姓名)•CiNii•Webcat Plus•ReaD•Google Scholar•Google 41 http://www.nii.ac.jp/cscenter/
  42. 42. 研究者リゾルバー β1.0 研究者ページ(下側)科研費研究課題の研究分野科研費研究課題のキーワードこのページのURI 42 http://www.nii.ac.jp/cscenter/
  43. 43. Webの波• Web技術のパラダイムシフト – Web of Documentsから – Web of Dataへ• Linking Open Dataの潮流 – RDFによって事実を記述して、データとして公開 – RDFでは、事実は2つのリソース(URI)と語彙で記 述される • 抽象的な概念を含めてすべてのモノをURIで表現 • モノの関係を表す語彙を定義して、2つのURIの関係を 語彙でつないで表す 43 http://www.nii.ac.jp/cscenter/
  44. 44. Linked Data Web of Open Repositories in 2010 - 2015 2010-07-28, Kei Kurakawa, NII URI based Identification of All Resources Fact Descriptions in RDF (Resource Description Framework) Scholarly Communications Vocabulary Open Repositories Open Repositories by Institutions by Institutions dcterms:Agent rdfs:Resource dcterms:creator Open Repositories Open Repositories by Institutions in the Cloud
  45. 45. Linked Data Webのための 検索質問応答API• OpenSearch1.1• RDF/XML 45 http://www.nii.ac.jp/cscenter/
  46. 46. 研究者IDリダイレクトWebサービス • 研究者IDとターゲットサービスをURLで指定 して,研究者ページへリダイレクトするWebサ ービス 研究者ID解決してhttp://rns.nii.ac.jp/services/redire 目的のサービスへct?source=resolver&id=1000010 リダイレクト295694&target=kaken sourceに指定できるID 研究者リゾルバーID KAKEN(NII) ReaD(JST) ResearcherID(Thomson Reuters) 機関の研究者ディレクトリ アップロードした機関のローカル研究者ID 46 http://www.nii.ac.jp/cscenter/
  47. 47. サービス連携の例• 京都大学リポジトリ • 静岡大学リポジトリ(SURE) (KURENAI) – dc.contributor.author – dc.contributor.author – dc.contributor.alternative – dc.contributor.transcription 47 http://www.nii.ac.jp/cscenter/
  48. 48. 国際連携・協力• 研究者・著者名システム間連携 48 http://www.nii.ac.jp/cscenter/
  49. 49. まとめ• 研究者の学術研究の貢献度を正確に測るために は,名前の曖昧性の問題を解決して,研究成果 に記述された著者の名寄せを行う必要がある.• 日本人姓名に関しては,図書館典拠ファイルを調 査したところ,同姓同名が50万人規模で10パー セント以上存在する.• 著者に識別子を付与して名寄せを行う活動は, 世界で行われている• 研究者リゾルバーは,日本の研究者の識別子を 与える 49 http://www.nii.ac.jp/cscenter/

×