ウィキメディア・コモンズを介したオープンアクセス画像の二次利用
2021.4.24 Georepublic Japan/オープン・ナレッジ・ジャパン 東修作(@higa4)
オープンデータとして公開された画像の活用事例の紹介
©OpenStreetMap contributors
歌川国貞(三代豊国)、国芳、広重による浮世絵シリーズ『東海道五十三対』
目次
1 モチベーション
2 今回の二次利用事例の全体図
3 LOD化のワークフロー
4 インポート(画像取込)
5 二次利用例
6 統計
7 構造化データ
8 まとめ
1 モチベーション
OKJP(オープン・ナレッジ・ジャパン)でオープンデー
タ、オープンガバメント、OpenGLAMの活動。
ウィキメディア財団提供サービスの利用をおすすめして
いるが、大阪市立図書館様の事例以降あまり話を
聞かない。
→浮世絵を例に、効果測定まで含めた手順を実践
してみたい。
2 今回の二次利用事例の全体図
書誌情報
(メタデータ)
ウィキデータ
ウィキメディア・コモ
ンズ
画像
主に作品の情報
主に画像の情報
ウィキペディア
その他誰でも利用可
・メタデータ:CC0
・画像:所蔵機関によるライセンス
API
SPARQLクエリー
アプリで利用
グラフ表示
データ出力
統計
NDLデジコレ
3 LOD化のワークフロー
出典 https://www.wikidata.org/wiki/Wikidata:Linked_open_data_workflow/ja
画像やメタ
データの準備
スキーマ検討
と現状確認
インポート 結果確認 二次利用 利用統計
4 インポート(画像取込)
https://commons.wikimedia.org/wiki/Commons:Pattypan/ja
画像ファイル名
+書誌情報をエ
クセルに出力し
て自由編集
エクセルを元にコ
モンズに画像とメ
タデータをアップ
ロード
5 二次利用例
情報源:NDLデジコレ
アップロード先:Images from NDL digital collection
期間:2020/11-2021/4
件数:11,297件(2021/4/21現在)
出典 https://commons.wikimedia.org/wiki/Category:Images_from_NDL_digital_collection
ウィキメディア・コモンズへのアップロード
5 二次利用例
出典 https://ja.wikipedia.org/wiki/%E7%8A%AC%E5%B1%B1%E5%9F%8E
ウィキペディア記事での利用:犬山城
5 二次利用例
出典 https://ja.wikipedia.org/wiki/%E6%9D%B1%E6%B5%B7%E9%81%93%E4%BA%94%E5%8D%81%E4%B8%89%E5%B0%8D
ウィキペディア記事での利用:東海道五十三對
6 統計(2020/11-2021/3)
出典 https://glamtools.toolforge.org/baglama2/#gid=561&month=202103&giu=jawiki&server=ja.wikipedia.org
6 統計(今回作業分)
(*1)オリジナルに加え、カラーパレット等余白の切り抜き版や複数組物の連結版を含むため、オリジナル画像数は約5,000件程度。
No 指標 値
① 期間 2020/11-2021/3
② 今回の作業によるコモンズへの画像アップロード件数(*1) 11,297件
③ ウィキメディア全体での二次利用ページ数 204ページ
④ ③の累計PV数 443,868件
⑤ 二次利用ページ全体の月平均PV(④/5ヶ月) 88,773件
⑥ 二次利用ページ当たりの月平均PV(⑤/③) 435件
6 参考(直近1年のウィキペディア日本語版のアクセス規模感)
出典 https://pageviews.toolforge.org/siteviews/?platform=all-access&source=pageviews&agent=user&start=2020-
04&end=2021-03&sites=ja.wikipedia.org
月平均:137億PV
記事数:126万件
記事当たり月間平均:約10,865PV
6 参考 大阪市立図書館 その後
出典 https://glamtools.toolforge.org/baglama2/#gid=560&month=202103&giu=jawiki&server=ja.wikipedia.org
2020/8-2021/3の間にカ
テゴリ配下の全画像に対
して1,196,935件のPV
2021/3月に22,956
件のPV
二次利用画像を配
置したページ数:74
2021/3月に
157,466件のPV
2021/3月に
236,187件のPV
6 参考 大阪市立図書館 その後
No 指標 値
① 期間 2020/8-2021/3
② コモンズへの累計画像アップロード件数 132件
③ ウィキメディア全体での二次利用ページ数 182ページ
④ ③の累計PV数 1,196,935件
⑤ 二次利用ページ全体の月平均PV(④/8ヶ月) 149,616件
⑥ 二次利用ページ当たりの月平均PV(⑤/③) 822件
7 構造化データ
出典 https://tinyurl.com/yzeqjbmu
所蔵機関別の浮世絵画像数
2021/4/22現在
7 構造化データ
出典 https://tinyurl.com/yzeqjbmu
作者別の浮世絵画像数
2021/4/22現在
7 構造化データ
出典 https://tinyurl.com/yzeqjbmu
描かれた題材別の浮世絵画像数
2021/4/22現在
7 構造化データ 歌川国貞(三代豊国)、国芳、広重によるシリーズ『東
海道五十三対』各宿場の位置を元に地図で可視化
2021/4/22現在
https://tinyurl.com/yz4tn3he
8 まとめと課題
◇今回の作業はほぼプログラミング知識なしでツール利用だけで可能。利用料も無し。
◇公開した画像を、今や有数のアクセス数上位サイトとなったウィキペディアの記事に掲載することで、
その膨大でロングテールなアクセスに乗せることができる。(今回の結果では平均435PV/ページ/月)
二次利用を広げたい場合の選択肢に考えて頂いてもよいのでは。
◇ウィキメディア財団によるグローバルなフレームワークであるため、国内に留まらず世界中からの利用が
徐々に、勝手に始まる。
◇画像ファイルの質と量
・すでに多くの画像が国内でもオープンデータとして利用可能になっているがまだあまり取り込めておらずこれから。
・画像の中には重複していたり、画質が低いものもある。
◇構造化データの質と量
・コモンズ上の「浮世絵」という領域の画像(2021/4現在約3万6千件)に対してはほぼ全てに
何らかの構造化データ(トリプル)が登録済。使い勝手のあるデータとしてはもう少し整備が必要。
・基本的にクラウドソーシングで更新されるので間違いもあるが、参加者や閲覧者が増えるにつれ
修正され、質が改善される傾向はある。
ご注意:本資料にはCC BY 4.0を適用しておりますが、一部それ以外の利用ライセンスの画像等を含む場合があります。
その場合は個々の利用ライセンスに従ってご利用ください。

Da 20210424