SlideShare a Scribd company logo
1 of 11
第7回 LODハッカソン関西 in インターナショナ
ル・オープンデータ・ディ 大阪
データソン:
wikidataへの化合物idの追加
@kozo2 @yayamamo
OpenLinkedData (RDF) をどう使いたいのか
parseいらずのデータ取得
フィルタリング
データ統合
データベースとデータベースをつなぎたい
複数のデータソースを比較、統合したい
さらに言うと
IDのクロスリファレンステーブルがほしい
自分だけのExcelでは意味がない
プログラムから再利用がしやすい形でオープン
かつフリーな情報として公開したい
wikidata中に存在する化合物情報
wikidataを複数の化合物databaseを(idで)つなぐハブ
として活用したい
データを活用するユーザ
● 薬理活性
● パスウェイ解析
メタデータを統合し
● 統計解析
● ネットワーク可視化
SPARQLクエリ
ID 追加を試みた化合物データベース (KNApSAcK)
植物の2次代謝化合物に
特化
フリーなdatabaseとの
クロスリファレンス
が無い
APIが無い
手順
1. wikidata 中の CAS登録番号 を持つ 化合物を csv に書き出し
手順
2. CASを鍵に
wikidataの化合物
にKNApSAcKのID
(wikidataのプロパ
ティID
Property:P2064) を
追加。
pywikibot を用いたwikidataの一括編集
KNApSAcK IDを付与したい wikidata 化合物は1万個以上
プログラムで自動化したい
pywikibot https://pypi.python.org/pypi/pywikibot
Wikidata:ボットの作成
https://www.wikidata.org/wiki/Wikidata:Creating_a_bot/ja
プログラム例
import pywikibot
site = pywikibot.Site("wikidata", "wikidata")
repo = site.data_repository()
item = pywikibot.ItemPage(repo, u"Q415011")
stringclaim = pywikibot.Claim(repo, u'P2064')
stringclaim.setTarget(u"C00000674")
item.addClaim(stringclaim)
化合物Luteolinのwikidata ID
KNApSAcKのIDであることを
示すプロパティID
LuteolinのKNApSAcK ID
最後に
バイオインフォマティクスのID cross reference
DBとして有用、手軽
質確保、改ざん対策は?

More Related Content

What's hot

LODを使ってみよう!
LODを使ってみよう!LODを使ってみよう!
LODを使ってみよう!uedayou
 
SPARQLアプリケーション開発
SPARQLアプリケーション開発SPARQLアプリケーション開発
SPARQLアプリケーション開発Toshiaki Katayama
 
Linked Open Data 作成支援ツールの紹介
Linked Open Data作成支援ツールの紹介Linked Open Data作成支援ツールの紹介
Linked Open Data 作成支援ツールの紹介uedayou
 
Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発
Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発
Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発KnowledgeGraph
 
SciVerse ScienceDirect training 201103
SciVerse ScienceDirect training 201103SciVerse ScienceDirect training 201103
SciVerse ScienceDirect training 201103tsuneyoshi
 
情報の構造化@Linked Open Data連続講座(2014.6.2)
情報の構造化@Linked Open Data連続講座(2014.6.2)情報の構造化@Linked Open Data連続講座(2014.6.2)
情報の構造化@Linked Open Data連続講座(2014.6.2)Ikki Ohmukai
 
31st Integrated DB MTG in NIBIO
31st Integrated DB MTG in NIBIO31st Integrated DB MTG in NIBIO
31st Integrated DB MTG in NIBIOMaori Ito
 
LODを始めるにあたって「最初に試すとよい」ツールの紹介
LODを始めるにあたって「最初に試すとよい」ツールの紹介LODを始めるにあたって「最初に試すとよい」ツールの紹介
LODを始めるにあたって「最初に試すとよい」ツールの紹介Kouji Kozaki
 
SPARQLでマッシュアップ -LOD活用のための技術紹介-
SPARQLでマッシュアップ-LOD活用のための技術紹介-SPARQLでマッシュアップ-LOD活用のための技術紹介-
SPARQLでマッシュアップ -LOD活用のための技術紹介-uedayou
 
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開KnowledgeGraph
 
201126 Wikidata クラス階層 SPARQL検索
201126 Wikidata クラス階層 SPARQL検索201126 Wikidata クラス階層 SPARQL検索
201126 Wikidata クラス階層 SPARQL検索Satoshi Kume
 
Drupalを活用した Linked Open Dataの 実践的試行環境の構築
Drupalを活用した Linked Open Dataの実践的試行環境の構築Drupalを活用した Linked Open Dataの実践的試行環境の構築
Drupalを活用した Linked Open Dataの 実践的試行環境の構築Takanori Hayashi
 

What's hot (17)

LODを使ってみよう!
LODを使ってみよう!LODを使ってみよう!
LODを使ってみよう!
 
SPARQLアプリケーション開発
SPARQLアプリケーション開発SPARQLアプリケーション開発
SPARQLアプリケーション開発
 
Linked Open Dataとは
Linked Open DataとはLinked Open Dataとは
Linked Open Dataとは
 
RDF Refineの使い方
RDF Refineの使い方RDF Refineの使い方
RDF Refineの使い方
 
Linked Open Data 作成支援ツールの紹介
Linked Open Data作成支援ツールの紹介Linked Open Data作成支援ツールの紹介
Linked Open Data 作成支援ツールの紹介
 
Linked Data (再)入門
Linked Data (再)入門Linked Data (再)入門
Linked Data (再)入門
 
ガバメント分野におけるLODの活用例
ガバメント分野におけるLODの活用例ガバメント分野におけるLODの活用例
ガバメント分野におけるLODの活用例
 
Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発
Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発
Linked Open Data勉強会2020 後編:SPARQLの簡単な使い方、SPARQLを使った簡単なアプリ開発
 
SciVerse ScienceDirect training 201103
SciVerse ScienceDirect training 201103SciVerse ScienceDirect training 201103
SciVerse ScienceDirect training 201103
 
情報の構造化@Linked Open Data連続講座(2014.6.2)
情報の構造化@Linked Open Data連続講座(2014.6.2)情報の構造化@Linked Open Data連続講座(2014.6.2)
情報の構造化@Linked Open Data連続講座(2014.6.2)
 
31st Integrated DB MTG in NIBIO
31st Integrated DB MTG in NIBIO31st Integrated DB MTG in NIBIO
31st Integrated DB MTG in NIBIO
 
LODを始めるにあたって「最初に試すとよい」ツールの紹介
LODを始めるにあたって「最初に試すとよい」ツールの紹介LODを始めるにあたって「最初に試すとよい」ツールの紹介
LODを始めるにあたって「最初に試すとよい」ツールの紹介
 
オープン・データの技術としてのLinked Data
オープン・データの技術としてのLinked Dataオープン・データの技術としてのLinked Data
オープン・データの技術としてのLinked Data
 
SPARQLでマッシュアップ -LOD活用のための技術紹介-
SPARQLでマッシュアップ-LOD活用のための技術紹介-SPARQLでマッシュアップ-LOD活用のための技術紹介-
SPARQLでマッシュアップ -LOD活用のための技術紹介-
 
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
Linked Open Data勉強会2020 前編:LODの基礎・作成・公開
 
201126 Wikidata クラス階層 SPARQL検索
201126 Wikidata クラス階層 SPARQL検索201126 Wikidata クラス階層 SPARQL検索
201126 Wikidata クラス階層 SPARQL検索
 
Drupalを活用した Linked Open Dataの 実践的試行環境の構築
Drupalを活用した Linked Open Dataの実践的試行環境の構築Drupalを活用した Linked Open Dataの実践的試行環境の構築
Drupalを活用した Linked Open Dataの 実践的試行環境の構築
 

Similar to wikidataへの化合物idの追加

書誌データのLOD化: データソン的デモンストレーション
書誌データのLOD化: データソン的デモンストレーション書誌データのLOD化: データソン的デモンストレーション
書誌データのLOD化: データソン的デモンストレーションKouji Kozaki
 
Excelで始めるオープンデータ ~LinkData.orgを使った データセット・アプリ公開~
Excelで始めるオープンデータ ~LinkData.orgを使った データセット・アプリ公開~Excelで始めるオープンデータ ~LinkData.orgを使った データセット・アプリ公開~
Excelで始めるオープンデータ ~LinkData.orgを使った データセット・アプリ公開~Sayoko Shimoyama
 
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame IntroductionYu Ishikawa
 
AWSで作る分析基盤
AWSで作る分析基盤AWSで作る分析基盤
AWSで作る分析基盤Yu Otsubo
 
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13) CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13) Ikki Ohmukai
 
Code4Lib Conference 2012 : 参加報告 ( 常川真央 )
Code4Lib Conference 2012 : 参加報告 ( 常川真央 )Code4Lib Conference 2012 : 参加報告 ( 常川真央 )
Code4Lib Conference 2012 : 参加報告 ( 常川真央 )Code4Lib JAPAN
 
Hadoopの紹介
Hadoopの紹介Hadoopの紹介
Hadoopの紹介bigt23
 
LOD技術の概要と LinkData.orgを用いたLOD公開
LOD技術の概要とLinkData.orgを用いたLOD公開LOD技術の概要とLinkData.orgを用いたLOD公開
LOD技術の概要と LinkData.orgを用いたLOD公開Kouji Kozaki
 
Linked Dataとオントロジーによるセマンティック技術の実際
Linked Dataとオントロジーによるセマンティック技術の実際Linked Dataとオントロジーによるセマンティック技術の実際
Linked Dataとオントロジーによるセマンティック技術の実際Kouji Kozaki
 
「Linked dataとLinked Open Data」アート・ドキュメンテーション学会
「Linked dataとLinked Open Data」アート・ドキュメンテーション学会「Linked dataとLinked Open Data」アート・ドキュメンテーション学会
「Linked dataとLinked Open Data」アート・ドキュメンテーション学会KAMURA
 
実はとても面白い...Documentation library
実はとても面白い...Documentation library実はとても面白い...Documentation library
実はとても面白い...Documentation libraryKouta Shiobara
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムRecruit Technologies
 
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -National Institute of Informatics
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようHideo Takagi
 
DroidKaigi アプリの内部を見る
DroidKaigi アプリの内部を見るDroidKaigi アプリの内部を見る
DroidKaigi アプリの内部を見る健一 辰濱
 
1st LODandOntology studysession aboutRDF
1st LODandOntology studysession aboutRDF1st LODandOntology studysession aboutRDF
1st LODandOntology studysession aboutRDFTakeshi Masuda
 

Similar to wikidataへの化合物idの追加 (20)

Linked Data in Japan/Semantic Conference In Japan 2010
Linked Data in Japan/Semantic Conference In Japan 2010Linked Data in Japan/Semantic Conference In Japan 2010
Linked Data in Japan/Semantic Conference In Japan 2010
 
書誌データのLOD化: データソン的デモンストレーション
書誌データのLOD化: データソン的デモンストレーション書誌データのLOD化: データソン的デモンストレーション
書誌データのLOD化: データソン的デモンストレーション
 
Excelで始めるオープンデータ ~LinkData.orgを使った データセット・アプリ公開~
Excelで始めるオープンデータ ~LinkData.orgを使った データセット・アプリ公開~Excelで始めるオープンデータ ~LinkData.orgを使った データセット・アプリ公開~
Excelで始めるオープンデータ ~LinkData.orgを使った データセット・アプリ公開~
 
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
2015 03-12 道玄坂LT祭り第2回 Spark DataFrame Introduction
 
AWSで作る分析基盤
AWSで作る分析基盤AWSで作る分析基盤
AWSで作る分析基盤
 
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13) CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
CiNii Booksに見る学術情報サービスの理想と現実@ku-librarians勉強会(2012.07.13)
 
Code4Lib Conference 2012 : 参加報告 ( 常川真央 )
Code4Lib Conference 2012 : 参加報告 ( 常川真央 )Code4Lib Conference 2012 : 参加報告 ( 常川真央 )
Code4Lib Conference 2012 : 参加報告 ( 常川真央 )
 
Hadoopの紹介
Hadoopの紹介Hadoopの紹介
Hadoopの紹介
 
SQL Server 入門
SQL Server 入門SQL Server 入門
SQL Server 入門
 
LOD技術の概要と LinkData.orgを用いたLOD公開
LOD技術の概要とLinkData.orgを用いたLOD公開LOD技術の概要とLinkData.orgを用いたLOD公開
LOD技術の概要と LinkData.orgを用いたLOD公開
 
Linked Dataとオントロジーによるセマンティック技術の実際
Linked Dataとオントロジーによるセマンティック技術の実際Linked Dataとオントロジーによるセマンティック技術の実際
Linked Dataとオントロジーによるセマンティック技術の実際
 
Azure Datalake 大全
Azure Datalake 大全Azure Datalake 大全
Azure Datalake 大全
 
「Linked dataとLinked Open Data」アート・ドキュメンテーション学会
「Linked dataとLinked Open Data」アート・ドキュメンテーション学会「Linked dataとLinked Open Data」アート・ドキュメンテーション学会
「Linked dataとLinked Open Data」アート・ドキュメンテーション学会
 
実はとても面白い...Documentation library
実はとても面白い...Documentation library実はとても面白い...Documentation library
実はとても面白い...Documentation library
 
ビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラムビッグデータ活用支援フォーラム
ビッグデータ活用支援フォーラム
 
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知るAI・HPC・ビッグデータで利用される分散ファイルシステムを知る
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
 
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
学術情報流通のための識別子とメタデータDBを対象とした融合研究シーズ探索 - 超高層物理学分野における観測データを例として -
 
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しようMicrosoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
Microsoft Azureのビッグデータ基盤とAIテクノロジーを活用しよう
 
DroidKaigi アプリの内部を見る
DroidKaigi アプリの内部を見るDroidKaigi アプリの内部を見る
DroidKaigi アプリの内部を見る
 
1st LODandOntology studysession aboutRDF
1st LODandOntology studysession aboutRDF1st LODandOntology studysession aboutRDF
1st LODandOntology studysession aboutRDF
 

wikidataへの化合物idの追加