Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

wikidataへの化合物idの追加

433 views

Published on

第7回 LOD ハッカソン関西 in インターナショナルオープンデータデイ 大阪 2016 03-05

Published in: Science
  • Be the first to comment

wikidataへの化合物idの追加

  1. 1. 第7回 LODハッカソン関西 in インターナショナ ル・オープンデータ・ディ 大阪 データソン: wikidataへの化合物idの追加 @kozo2 @yayamamo
  2. 2. OpenLinkedData (RDF) をどう使いたいのか parseいらずのデータ取得 フィルタリング データ統合 データベースとデータベースをつなぎたい 複数のデータソースを比較、統合したい
  3. 3. さらに言うと IDのクロスリファレンステーブルがほしい 自分だけのExcelでは意味がない プログラムから再利用がしやすい形でオープン かつフリーな情報として公開したい
  4. 4. wikidata中に存在する化合物情報
  5. 5. wikidataを複数の化合物databaseを(idで)つなぐハブ として活用したい データを活用するユーザ ● 薬理活性 ● パスウェイ解析 メタデータを統合し ● 統計解析 ● ネットワーク可視化 SPARQLクエリ
  6. 6. ID 追加を試みた化合物データベース (KNApSAcK) 植物の2次代謝化合物に 特化 フリーなdatabaseとの クロスリファレンス が無い APIが無い
  7. 7. 手順 1. wikidata 中の CAS登録番号 を持つ 化合物を csv に書き出し
  8. 8. 手順 2. CASを鍵に wikidataの化合物 にKNApSAcKのID (wikidataのプロパ ティID Property:P2064) を 追加。
  9. 9. pywikibot を用いたwikidataの一括編集 KNApSAcK IDを付与したい wikidata 化合物は1万個以上 プログラムで自動化したい pywikibot https://pypi.python.org/pypi/pywikibot Wikidata:ボットの作成 https://www.wikidata.org/wiki/Wikidata:Creating_a_bot/ja
  10. 10. プログラム例 import pywikibot site = pywikibot.Site("wikidata", "wikidata") repo = site.data_repository() item = pywikibot.ItemPage(repo, u"Q415011") stringclaim = pywikibot.Claim(repo, u'P2064') stringclaim.setTarget(u"C00000674") item.addClaim(stringclaim) 化合物Luteolinのwikidata ID KNApSAcKのIDであることを 示すプロパティID LuteolinのKNApSAcK ID
  11. 11. 最後に バイオインフォマティクスのID cross reference DBとして有用、手軽 質確保、改ざん対策は?

×