Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

[All-in-one2016] 文献情報を利用したサービスの活用法

65 views

Published on

All-in-one 合同講習会 2016 ~バイオビッグデータ解析入門~
講師:山本 泰智(ライフサイエンス統合データベースセンター)
日時:2016年7月23日
場所:VisLab OSAKA(グランフロント大阪 北館タワーC 9F、大阪市北区)
YouTube:https://youtu.be/JO9erLFsD0s

Published in: Science
  • Be the first to comment

  • Be the first to like this

[All-in-one2016] 文献情報を利用したサービスの活用法

  1. 1. 文献情報関連サービス活用法 山本 泰智 ライフサイエンス統合データベースセンター Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  2. 2. PubMedは今年二十歳になりました
  3. 3. 0"" 200,000"" 400,000"" 600,000"" 800,000"" 1,000,000"" 1,200,000"" 0"" 5,000,000"" 10,000,000"" 15,000,000"" 20,000,000"" 25,000,000""1945" 1950" 1955" 1960" 1965" 1970" 1975" 1980" 1985" 1990" 1995" 2000" 2005" 2010" 2015" PubMed/MEDLINE 1996 11,937,110 456,362 追加件数 合計件数
  4. 4. PubMedのいま Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  2600万件を超える文献情報(7/3時点で26,207,567) l  2015年だけで1,103,448件追加(3023件/日) l  5500件を超える学術誌 l  一日当たり、 l  250万件の検索、160万人の利用者、830万件の書誌情報閲覧 l  モバイル端末からは、検索12万件超、利用者32000人、閲覧35万件
  5. 5. 随時更新 無料 Allie文献で使われる略語を検索 文献で使われる英語表現を検索 Colil 引用情報の検索
  6. 6. Allie(アリー) http://allie.dbcls.jp/ 文献で使われる略語とその展開形を検索 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) Allie
  7. 7. MEDLINE中の略語の数々 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  8. 8. 生命科学分野の文献には多数の略語がある Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  様々な研究者が自由に作る 毎月100前後の略語が生まれている l  多くの多義語、類義語がある l  読み手に誤解と混乱を生じさせうる PC: personal computer, primary care, prostate cancer, ... Alcoholic chronic pancreatitis: ACP, alcoholic CP, ... 2600万件 72000略語 (>9) 2016Year
  9. 9. 生命科学系の略語を簡単に調べられないか? 最新の略語にも対応して Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  10. 10. 計算機を用いて自動的に略語と展開形のペアを抽出 hemoglobin - Hb high performance liquid chromatograph - HPLC
  11. 11. hemoglobin A1c HbA1c myoglobin Mb hemoglobin Hgb hemoglobin Hb paroxysmal nocturnal hemoglobinuria PNH haptoglobin Hp MEDLINE全文献情報を対象に抽出 約1705ペア (Unique: 303.5万) h,p://0nyurl.com/allie-­‐paircount h,p://0nyurl.com/allie-­‐paircount-­‐unique
  12. 12. Allieの特徴 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  日本語訳があれば提示 hemoglobin / (赤血球にあって酸素を運搬する成分) ヘモグロビン, 血色素 l  よく使われる分野を提示、絞り込みも可能 Hematology / 血液学 l  出現文献情報を提示 Physiological characteristics of human red blood cell ghosts. (1958)
  13. 13. ペア出現頻度の経年変化 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  14. 14. 発展的な利用 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  ftpでデータベースのダウンロードが無料で可能 毎週更新 l  APIにより利用者の開発したプログラムから検索可能 l  SOAP / REST / SPARQL l  http://data.allie.dbcls.jp/
  15. 15. AllieデータベースへのSPARQL検索結果例 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) 頻度 略語 展開形 対訳 16036 AML acute myeloid leukemia (病名) 急性骨髄性白血病 9366 CML chronic myeloid leukemia (病名) 慢性骨髄性白血病 9002 BM bone marrow (解剖) 骨髄 8932 Hb hemoglobin (赤血球にあって酸素を運搬する成分) ヘモグ ロビン, 血色素 8741 GVHD graft-versus-host disease (病名) 移植片対宿主病 7652 RBC red blood cell 赤血球 7299 MM multiple myeloma (病名) 多発性骨髄腫 7259 CLL chronic lymphocytic leukemia (病名) 慢性リンパ性白血病, 慢性リンパ球性 白血病 7203 G-CSF granulocyte colony-stimulating factor 顆粒球コロニー刺激因子 6297 MDS myelodysplastic syndrome (造血幹細胞異常による造血障害) 骨髄異形成 症候群 研究分野がHematologyである文献中に出現する略語 h,p://0nyurl.com/allie-­‐hematology
  16. 16. UniProtとの連合検索例 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  17. 17. http://allie.dbcls.jp/ 略語のアリー 検索
  18. 18. 動画チュートリアル(統合TV) Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) http://togotv.dbcls.jp/20100831.html#p01
  19. 19. 実習 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  略語MERSの展開形を検索 l  共起略語をみて、MERSよりも MERS-CoVとして使われてい る文献が多いことを確認する l  目的の展開形について、詳細情 報として実際に利用されている 表現や文献リストを確認する
  20. 20. inMeXes (インメクセズ) http://docman.dbcls.jp/im/ 文献中に書かれている英語表現を検索 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  21. 21. 英作文をしていると出くわす悩み Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  is associated に続く前置詞は何だったっけ? l  リン酸化に対応する英単語、phosの続きはどう綴ったかな? l  associated with を修飾する副詞、文献でよく使われているも のは何だろう? l  thermodynamic parameters には the が付くことが多い? 付いている場合の実際の文章は? is associated ...
  22. 22. inMeXes Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  高速 MEDLINEに含まれる全ての題目、要旨中の表現を高速に検索 l  軽快 4文字以上入力すると、キーを叩く毎に検索結果を表示 l  便利 結果は頻度順、気になる表現をクリックすると関連情報を表示
  23. 23. 関連情報例: PubMedアブストラクト中の表現 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  24. 24. やや高度な使い方: 正規表現フィルタ Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  例: was _ correlated withの_にはどのような表現があるかを知りたい
  25. 25. 発展的な利用 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  API (JSONP) による検索が可能 l  ご自身のブログやホームページに検索サービスを埋め込めます l  API Keyなどの認証は不要
  26. 26. http://docman.dbcls.jp/im/ インメクセズ 検索
  27. 27. 動画チュートリアル(統合TV) h,p://togotv.dbcls.jp/20091216.html#p01 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  28. 28. 実習 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  contributeと入力して続く前置詞 を確認する l  informationと入力して下記の表現 の利用頻度をみる l  information of l  information on l  information about l  以上の表現について、実際の文章 を確認する
  29. 29. Colil(コリル) http://colil.dbcls.jp/ 文献の引用情報を検索 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  30. 30. ある文献に関する第三者からの視点 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  ある文献について、当該文献の著者ではない研究者による評価は? l  ある文献について、共によく引用されている文献は? l  引用したい文献について、特に英語での適切な記述例は? Colilがお答えします
  31. 31. Colil (Comments on literature in literature) Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  特定の論文について、その引用記述を検索します l  特定の論文について、他の論文から共に引用されている論文を表示します l  引用記述抽出対象はPMIDを持つPMC OA(Open Access)サブセットで す (約131万件、PubMed全体の5%強) l  約814万件のPMID付き文献がPMC OAサブセットから引用されています (PubMed全体の1/3強) l  現バージョンは2016年4月時点取得時のものです
  32. 32. PMID:17108360   引用記述と共引用(co-citation) Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) We  did  not  find  any  suitable  taxonomy  for  the   MI  field,  since  most  of  the  exis0ng  resource   taxonomies  were  focused  on  Bioinforma0cs   (BI)  [4,16,17].   Some  sites  provide  a  curated  collec0on  of  life-­‐ science-­‐related  online  resources  with  a  search   func0on  [[5,6],  etc]. PMID:17683589 PMID:22857741 文献A 文献B 文献1 文献2 文献3 文献4 文献Aを引いている文献は 文献Bも引いている 引用記述 共引用
  33. 33. PubMed ID or PubMed検索語を入力 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) ① PubMed ID もしくは ② PubMed検索語 ① ②
  34. 34. PubMed検索語を入力した場合 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  35. 35. 結果の並べ替え Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  36. 36. 発展的な使い方 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  ftpでデータベースのダウンロードが無料で可能 l  APIにより利用者の開発したプログラムから検索可能 l  REST / SPARQL l  http://colil.dbcls.jp/
  37. 37. SPARQLクエリ例 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS)
  38. 38. http://colil.dbcls.jp/ colil 検索
  39. 39. 動画チュートリアル(統合TV) Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) h,p://togotv.dbcls.jp/20150207.html#p01
  40. 40. 実習 Licensed under CC-BY 4.0 ©2016 山本泰智 (DBCLS) l  PDBの文献(PMID: 10592235) に対し、他の文献中でどのよう に触れられているのか概観する。 l  関連文献にはどのような研究課 題があるのかを確認する。 l  EMBL-EBIのバイオインフォ解 析ツールに関する文献(PMID: 20439314)についてはどうか。
  41. 41. Questions? yy@dbcls.rois.ac.jp @yayamamo

×