Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

LODオープンデータのつくりかたと項目名のつけかた

3,461 views

Published on

2014年12月に講習会をしたときの資料をアップします。
Linked Open Data(LOD) リンクトオープンデータをLinkData.orgをつかって公開する手順。
プロパティ名をIPA共通語彙基盤2.10をつかって設定する方法について書きました。

Published in: Technology

LODオープンデータのつくりかたと項目名のつけかた

  1. 1. スプレッドシートから Linked Open Dataをつくろう ATR Creative 高橋真知 2014年12月3日
  2. 2. Linked Open Dataをつくろう まず用意してください。 1.オンライン環境 2.できるだけ最新バージョンのブラウザ 3.ログイン用のFacebookやGoogleのアカウント オンラインでLinkData.orgを使います LODをつくるにはOpen Refineもつかえます。Open Refineの使いかたは、NPO法人Linked Open Data Initiativeのサイトにある資料が詳しいです。 http://linkedopendata.jp/?p=554 Ready!
  3. 3. 手順 0.ログイン用のアカウントを取得する 1.LODにしたいスプレッドシート(エクセル)を用意する 2.LinkDataでテーブルデータをつくる 3.テーブルデータにデータを入れてファイルをつくる 4.ファイルをLinkDataでRDF(turtle)に変換する 5.できたファイルをみながら項目を仕上げる 6.項目に「共通語彙」を付ける
  4. 4. ログインアカウント取得 アカウントを持ってない場合は、LinkDataが対応して いるアカウントを新規取得してください。
  5. 5. LODにしたいデータの準備 •スプレッドシート(エクセルなど)を使います •ひとつの行がひとつのデータです •ひとつの列がひとつの項目です •セルの分割と統合は厳禁です •場所を表したいときは緯度経度をそれぞれセルに入力し てください
  6. 6. LinkDataにアクセス http://linkdata.org/tutorial チュートリアルページがありますので参考にしてください
  7. 7. LinkDataにログインする 名前 名前 所属 メールアドレス この登録ボタンがよく隠れている。隠れている場合は、 見えるようになるまで文字サイズを縮小してください
  8. 8. テーブルデータ (ひな型ファイル)作成
  9. 9. テーブルデータをつくる エクセルの項目数(列) に、ひとつ数字を足した 列数を入力します。 ひとつめの項目はIDになります。
  10. 10. データテーブルをつくる 今回は14列(ID以外の項目が14個) ある表なので15に設定してOK
  11. 11. データテーブルをつくる このプロパティ名を ひとつの列につきひとつ 決めていきます。 「共通語彙」を使いますが、 まずは一通り作ってから あとで、考えます。 1列名は自動で作成される。 ひながたDL後に記述
  12. 12. テーブルのプロパティ(項目)の 名前を考える 項目(プロパティ)の名前を決めます。 x,yなど、緯度/経度情報の場合は geoとタイプすると項目名のURI候補がでます。 緯度/経度はlatitude/longitude lat, longと略されてます。 X=http://www.w3.org/2003/01/geo/wgs84_pos#long Y=http://www.w3.org/2003/01/geo/wgs84_pos#lat にしました。
  13. 13. テーブルのプロパティ(項目)の 名前を考える わかならい項目、たとえば「開催日」や「区」「グループ名」 などがある場合、最後に調整すればいいので、とりあえず 自分にわかる名前を日本語で入力しておきます。 日本語であれば 言語から日本語と選択します アプリなどで使われるときに 言語がわかってる方が便利です
  14. 14. テーブルのプロパティ(項目)の 整理が終わったら・・・ すべての項目を記入したら、 テーブルデータを ダウンロードします。
  15. 15. ダウンロードするときに テーブルデータの設定をします ファイルのタイトルは 英語でお願いします。 他の必須項目も入れます。 ダウンロードしたら、一旦、LinkDataからはなれて、 自分のPC環境でスプレッドシートを編集します
  16. 16. テーブルデータのファイルを ダウンロードして開く 列が初めのエクセルに比べて 左に1列増えてます。(赤いところ) ここにはあとでURLや数字をいれます 上から7行目までが、今回つくった テーブルデータなので、あまり さわらないようにお願いします。 青いところに自分のデータを コピー&ペーストして、 自分のデータファイルをつくります 自分のPC環境でデータを編集しています
  17. 17. テーブルデータファイルに 自分のデータをコピー&ペースト 赤いところに数字を入れて 連番にしました 青いところに自分のデータを コピー&ペーストして、 自分のデータファイルをつくりました Propertyの名前と合ってるデータか 確認をお願いします。 ファイルを保存します 自分のPC環境でデータを編集しています
  18. 18. 自分のデータをアップロード ふたたびLinkDataにもどってデータのアップロードします http://linkdata.org/upload ファイルを選んでアップします
  19. 19. 自分のデータをアップロード ふたたびLinkDataにもどってデータのアップロードします http://linkdata.org/upload アップロードができると 登録するデータセットを聞かれます。 新規のデータセットをつくりましょう
  20. 20. 自分のデータをアップロード データセットを公開するかどうか 決めることができます。 最初は非公開になってます。 データセットを登録すると データはこのデータ セットに入っていきます。
  21. 21. 自分のデータをアップロード ライセンスを決める(注意) 最初はパブリックドメインに なっていますので、CC-BYなど 希望するライセンスで登録します オープンデータをつくっているので オープンなライセンスを使います。 詳しくはCreative Commonsへ http://creativecommons.org/
  22. 22. アップロードしたデータを見る 自分のつくったデータ 一覧はログインしている 名前をクリックすると 見えます
  23. 23. アップロードしたデータをみる 自分のつくったデータのRDFを表示したり 地図から見ることができます 公開していいな!となれば設定を変えて「公開」にします
  24. 24. つくったデータを仕上げる LinkData.orgをつかってRDF(tutle)ができました。 さらにアプリやWebサイトからは読みやすくなるように仕上げます。 項目を一般的に使われている「共通語彙」にすることで、このデータ セットを公開したときに、他のデータと共通で使うことができるように なり、利便性が高まります。 「共通語彙」にすると 他のデータとも連携しやすい!
  25. 25. 共通語彙を考える IPA共通語彙基盤 コア語彙 2.10を使う http://imi.ipa.go.jp/ns/core/210/ 語彙を集めてあり、 URLにしてくれています
  26. 26. 共通語彙を考える 例: このページ内にある 「氏名」を含む項目を Ctrl+Fで検索 IPA共通語彙基盤 コア語彙 2.10を使う 氏名がみつかった
  27. 27. 共通語彙を考える http://imi.ipa.go.jp/ns/core/210/#氏名_姓名 氏名【種別】のなかの「姓名」というプロパティを採用する場合 http://imi.ipa.go.jp/ns/core/210/#氏名_姓名 ↑半角アンダーバー 氏名のなかの「名」というプロパティを採用する場合 http://imi.ipa.go.jp/ns/core/210/#氏名_名 (データ型がxsd.stringと表示されている段階まで記述) エクセル編集の作業に入ります。
  28. 28. 5行目のプロパティにつけた 名前を、URLで書き換えていきます たとえば「氏名」としていたところを http://imi.ipa.go.jp/ns/core/210/#氏名_姓名 に変更します。 語彙リストと行き来しながら、 できれば、全項目を編集します 項目名が決められない場合はオリジナル項目名の で公開できます。 ファイルを保存します 共通語彙を編集する 項目をURLをコピーしてエクセル編集の作業 http://imi.ipa.go.jp/ns/core/210/#氏名_姓名
  29. 29. 共通語彙例 IPA共通語彙基盤 コア語彙 2.10 http://imi.ipa.go.jp/ns/core/210 Schema.org http://schema.org/docs/schemas.html Schema.org(日本語訳サイト) http://schema-ja.appspot.com/ Linked Open Vocabularies (LOV) http://lov.okfn.org/dataset/lov/ DBPedia http://mappings.dbpedia.org/index.php/Main_Page Dublin Core http://dublincore.org/documents/dcmi-terms/ Friend of a Friend (FOAF) http://xmlns.com/foaf/spec/
  30. 30. 語彙編集後のデータをアップロード ふたたびLinkDataにもどってデータのアップロードします http://linkdata.org/upload ファイルを選んでアップします。 よければ上書き保存で完了です。
  31. 31. 最後に 項目を一般的に使われている「共通語彙」にすることでこのデータ セットを公開したときに、他のデータセットと共通で使うことができ るようになりました。 できあがったデータは公開したり、LODチャレンジ、アーバンデータ チャレンジなどに応募しましょう。 「大阪イノベーションハブ(ODI Osaka)」や、関西各地で開催されているオープン データのハッカソンやアイディアソン、NPO法人LODIによる講習会などに参加するとよ り技術的な情報を得ることができたり、オープンデータを使ったアプリ開発を学ぶこと ができます。 もっと気軽に、街歩きをしながらオープンデータをつくりたい方は「京都オープンデー タ実践会」にもご参加ください。 2015年2月21日はインターナショナルオープンデータディです。

×