2012 09 06_sot_m_osm

813 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
813
On SlideShare
0
From Embeds
0
Number of Embeds
15
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

2012 09 06_sot_m_osm

  1. 1. OpenStreetMapのデータとコミュニティ活動について Tomomichi Hayakawa (@Tom_G3X) OpenStreetMap Foundation Japan Center for Green Computing, Nagoya Institute of Technology Yuma Imi, Takayuki Ito Department of Computer Science, Nagoya Institute of Technology
  2. 2. OpenStreetMap 自己紹介 早川 知道(はやかわ ともみち)Tomomichi Hayakawa •  OpenStreetMap Tokai •  OpenStreetMap Foundation Japan •  名古屋工業大学グリーンコンピューティング研究所 •  Malaika System – CEO •  FLOSSな活動 –  OpenStreetMap東海 •  - http://groups.google.co.jp/group/OSM-Tokai –  XOOPS Cube Project 〜 XOOPS Cube 東海 –  FLOSS桜山 〜 DS-Tokai •  名古屋のメタ・コミュニティ •  Twitter @Tom_G3X •  うえこみ春日井小牧 –  地域情報サイト運営- http://www.kasugai-komaki.jp/ •  その前は・・・株式会社ザクロ – 取締役 とか・・・・
  3. 3. 今回使用したデータについて 日本のデータについて調べてみました 日本のコミュニティ活動の調査 –  日本の履歴データ •  全球データより日本を抽出 (planet.openstreetmap.org) •  2007.11.7 ∼ 2012.04.30の期間 •  PostGISで拡張したPostgreSQLへ (データベースで約500GB 程度) •  加えて、藤澤さんのデータも –  http://wiki.openstreetmap.org/wiki/User:Techstrom/JapanData日本と他地域との比較調査 –  各地域のデータ(77地域) •  世界のデータ(Node, Way, Relation, User) –  http://odbl.de/ より取得 •  2012.4.30 現在
  4. 4. 日本のOpenStreetMap 履歴データ
  5. 5. OpenStreetMap の日本のデータ OpenStreetMap Japan の歴史 (2007.11 – 2012.7) 90,000,000 2010.12.24 2012.4.1 ODbLライセンス切り替え Object relation OpenStreetMap Foudation Japan 設立 2,162   2011. 9.23-10.380,000,000 way coastline 入れ替え作業 1,994   1,965   Yahoo/Alpsデータ node 1,842  70,000,000 user  60,000,000 1,543   1,514   1,590   1,468   1,440   1,391   3.11 1,364   1,338   1,298   1,272  50,000,000 1,238   2010.4 ‒ 1,179   国土数値情報(森林) インポート 2011.4 ‒ 2011.9 国土数値情報(公共施設) インポート40,000,000 2010.4 ‒ 2011.10 国土数値情報(河川) インポート 854   2011.4.1 825   Yahoo/Alps道路データ インポート開始 2008.4 ‒ 802   国土数値情報(行政区域) インポート 766   743  30,000,000 698   2011.3 671   国土数値情報(発電所) インポート 645   2008.3 ‒ 2010.4 606   592   584   578   567   国土数値情報(空港) インポート 558   544   542   2011.3.6 499   Yahoo/Alpsデータの提供発表20,000,000 472   2009.11 ‒ 2010.2 413   374   国土数値情報(海岸線) インポート 346   2010.12 ‒ 312   Bing衛星写真 提供開始 2008.3 - 218  237  10,000,000 国土数値情報(鉄道) インポート開始 171   206   155   121   2010.3.31 94  109   62   73   80   国土計画局オルソ空中写真提供終了 9   14   12   30   0 2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月 2012年7月
  6. 6. OpenStreetMap の日本のデータ Source Tag (All ObjectsèNode, Way, Relation) リソースの割合を調査、sourceタグの数を集計してみたが・・・・、 Nodeにタグがあったりで、正確な比率が出せなかった orz NRPB of PGS, 37,660 , 0.05% MLIT(国土数値情 MLIT Japan(オ 報/森林など), PGS ルソ), 80,873 , 292,056 , 0.35% NRPB of MLIT Japan(オルソ) 0.10% MLIT(国土数値情報/森林など) KSJ2(国土数値情報) Bing Yahoo/Alps KSJ2(国土数値情報), 25,007,061 , 30.36% Sourceタグなし Sourceタグなし, 52,482,876 , 63.72% Bing, 494,767 , 0.60% Yahoo/Alps, 3,970,862 , 4.82% 2012.04.30 現在
  7. 7. OpenStreetMap の日本のデータ Highway = * (道路タグの値) (2007.11 – 2012.4) 4,500,000     steps4,000,000     cycleway road3,500,000     living_street track 2011.4.13,000,000     path Yahoo/Alps道路データ インポート開始 footway2,500,000     pedestrian service2,000,000     residential unclassified1,500,000     tertiary secondary 3.11 1,000,000     primary trunk 500,000     motorway 0     2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月
  8. 8. Tag別 (Highway以外のタグ) (2007.11 – 2012.4) 800,000     3.11 landuse=700,000     natural=600,000     power= leisure=500,000     shop= 2010.4 ‒ 2011. 9.23-10.3 coastline 入れ替え作業 国土数値情報(森林) インポート Yahoo/Alpsデータ400,000     waterway= railway=300,000     2010.4 ‒ 2011.10 国土数値情報(河川) インポート200,000     2009.11 ‒ 2010.2 国土数値情報(海岸線) インポート 2008.3 - 2011.3100,000     国土数値情報(鉄道) インポート開始 国土数値情報(発電所) インポート 0     2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月
  9. 9. Shop=* Leisure=* (2007.11 – 2012.4) 淡々と増えている 16,000    14,000     shop= 3.11 12,000     leisure=10,000     8,000     6,000     4,000     2,000     0     2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月
  10. 10. Tagの数 (Wayの数と比較) (2007.11 – 2012.7) 9,000,000   way 8,000,000   通常のタグ 7,000,000   ※但し、 以下のタグは除外している 6,000,000   Source =* , Node =* 5,000,000   Created_by =* 2011.4.1 Yh:* =* Yahoo/Alps道路データ インポート開始4,000,000   KSJ2:* = * 3,000,000   2010.4 ‒ 2011.10 国土数値情報(河川) インポート2,000,000  1,000,000   0   2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月 2012年7月
  11. 11. 実は、当初、環境が整ってなくて、
 Gripで集計してた事は、内緒です。
 
 気が付いたら、
iMac3台を2週間くらい回してた orz
 
 今は、ちゃんとDBに入ってます。
  12. 12. 日本と他地域のデータを比較し、
興味深い結果が出ましたので
 紹介します。
  13. 13. OpenStretMapの品質 オブジェクトの数の指標 OSM Merit (オブジェクトの数の指標) •  OSM Merit –  http://odbl.de にて定義 –  Node,Way,Relationの複数の要素を一元化した指標 OSM Merit = Node + 5*Way + 20*Relation •  OSM Merit 密度 –  1000km2 あたりのOSM Merit –  他地域との比較に利用 OSM Merit密度 = (OSM Merit * 1000) / 面積 (km2) •  マッパー1人当たりのOSM Merit –  マッパー1人当たりのOSM Merit(オブジェクト数) –  他地域との比較に利用 マッパー1人当たりのOSM Merit = OSM Merit / マッパー数
  14. 14. データ分析 OSM Merit 密度 (上位20地域) OSM Merit密度 (単位面積当たりのオブジェクト数) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ Region monaco 11,289,000 netherlands 1,990,387 france 646,354 czech_republic 540,552 luxembourg 527,690 belgium 506,001 OSM Merit密度 = 1000km2あたりのOSM Merit(データ数) germany 490,827 gaza 441,267 ・日本は13番目 slovakia 437,450  ・まだ日本のコミュニティは小さいのだが、
 switzerland 421,356  OSM先進地域に迫るOSM Merit(データ数) austria 361,974 denmark 306,936 japan 280,999 ・日本は、ヨーロッパ平均と同程度 europe 258,064 ・3.11直前から、約一年でデータ数が約2倍に great_britain 253,014  ・日本でOSMが普及過程にあった事 italy 248,482  ・3.11にクライシスマッピングが行われた canary_islands 233,776  ・4/1よりYahoo!/Alpsデータのインポートが始まった bahrain 160,385 israel_and_palestine 122,655 slovenia 118,683 japan 20110309 124,471 0 200,000 400,000 600,000 800,000 1,000,000 1,200,000 1,400,000 1,600,000 1,800,000 2,000,000 OSM Merit / 1000km2
  15. 15. データ分析 マッパー1人あたりの人口 (OSM Merit上位20地域) 日本は普及率が低い!(マッパー人口比) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ Region monaco 339 netherlands 3,311 = 人口/マッパー数 france 4,684 czech_republic 2,842 luxembourg 786 ・日本は飛びぬけて多い belgium 2,947 ・OSM先進国と比べて、 germany 1,732  飛びぬけてOSM普及率が低い! gaza 13,355 slovakia 4,094 ・3.11直前は、さらにその倍以上低かった! switzerland 1,596 austria 1,873 denmark 2,365 japan 64,814 europe 4,003 great_britain 4,653 italy 6,253 canary_islands 2,348 bahrain 11,631 israel_and_palestine 12,402 slovenia 2,274 japan 20110309 149,133 0 20000 40000 60000 80000 100000 120000 140000 160000 Population / Mapper
  16. 16. データ分析 マッパー1人あたりの面積 (OSM Merit上位20地域) マッパー1人あたりのカバー面積が広すぎる! Region monaco 22 netherlands 8,196 france 41,129 = 面積(km2)/マッパー数 czech_republic 21,969 luxembourg 4,047 これも、日本は飛びぬけて広い 8,631 belgium OSM先進国と比べて、 germany 7,565 gaza 3,243 マッパーあたりのカバー面積が飛びぬけて広い! slovakia 36,703 switzerland 8,643 3.11直前は、さらに倍以上広かった! austria 19,122 denmark 18,479 japan 192,282 europe 34,624 great_britain 18,180 italy 32,437 canary_islands 8,475 bahrain 7,900 israel_and_palestine 29,126 slovenia 23,011 442,430 japan 20110309 0 50000 100000 150000 200000 250000 300000 350000 400000 450000 Area (1000km2)/Mapper 
  17. 17. つまり、日本は、・・・・・ •  データの密度は、ヨーロッパ並み   だけど •  マッパー人口比、ヨーロッパの10倍以上 •  マッパー面積比、ヨーロッパの5倍以上 èマッパー少なすぎ   それで •  マッパー1人当たりのデータ量は・・・・・・・
  18. 18. データ分析 マッパー1人あたりのOSM Merit (OSM Merit上位20地域) 1人あたりのデータ数が極端に多い!EUの6倍! 77地域(2012.04.30現在) と 2011.3.9の日本のデータ Region monaco 251 netherlands 16,312 france 26,584 czech_republic 11,875 マッパー1人あたりのOSM Merit = OSM Merit/マッパー数 luxembourg 2,136 belgium 4,367 ・日本は、マッパー1人あたりのOMS Meritが極めて多い。 germany 3,713 gaza 1,431 ・少数のマッパーで多くのデータを維持管理している状況 slovakia 16,056  ・ボランタリーなプロジェクトでは将来の持続に不安があるかも switzerland 3,642 austria 6,922 いい意味でも、悪い意味でも、日本の特徴 denmark 5,672 japan 54,031 europe 8,935 great_britain 4,600 italy 8,060 canary_islands 1,981 bahrain 1,267 israel_and_palestine 3,572 slovenia 2,731 japan 20110309 55,070 0 10,000 20,000 30,000 40,000 50,000 60,000 OSM Merit / Mapper
  19. 19. OpenStretMapの品質 汎用情報データベースのデータ数の指標 Node-Way比 (Wayのデータ数(情報量)の指標) –  OSMの仕様上、多様な情報を入力する場合
 それぞれWayを分断する必要がある。 Node-Way比 = Node/Way –  Node-Way比が高い •  Wayのデータ数(情報量)が少ない –  Node-Way比が低い •  Wayのデータ数(情報量)が多い –  但し、あくまで簡易な指標 –  試験的にやってみた
  20. 20. データ分析 Node-Way x OSM Merit by Region & Japan Node-Way比と OSM Merit密度(オブジェクト) 77地域(2012.04.30現在) と 2007.11〜2012.3の日本の履歴データ Node/Way 3.11 ・Node-Way比が高い時期 45.0  ・国土数値情報インポートの時期と一致する 2011.4.1 Yahoo/Alps道路データ 40.0 インポート開始 ・Node-Way比の急激な下降  ・Yahoo/Alps道路データのインポート開始時期と一致 35.0  ・Yahoo/Alps道路データはNode-Way比が低いデータ  情報量が多いデータといえる 2009 ‒ 2010 30.0 国土数値情報 ・他地域に比べ、まだ高い インポート  ・不要なデータ、重複データ、冗長なデータなどが多いかも 25.0 ・シンプルなマッピングも大事かも 20.0 15.0 Luxembourg Monaco Netherlands10.0 5.0 Gaza Bahrain Germany Belgium 0.0 France 0 100,000 200,000 300,000 400,000 500,000 600,000 700,000 OSM Merit密度 (オブジェクト)
  21. 21. まとめ 調査して分かった事 •  日本のデータ数は、約1年間で2倍以上増加 –  OSM先進地域に近づきつつある •  日本は、マッパー1人当りの編集量が極めて多い –  持続可能なコミュニティとして不安がある •  日本のデータ品質は、OSM先進地域のレベルに至っていない •  Yahoo/Alps道路データは、比較的情報量が多いデータ •  持続可能なコミュニティの為には、 –  更なる普及活動が必要 •  データ品質向上の為に、 –  重複・冗長・不要データなどの整理
  22. 22. 背景 研究の目的 •  OpenStreetMapèボランタリーなコミュニティ活動 –  社会への貢献を果たしている •  「コミュニティ活動」と「成果物の品質」 –  è相関関係にある •  OpenStreetMapの品質が向上すれば –  更に多様な社会への貢献が可能に •  「コミュニティ活動」と「成果物の品質」の研究成果 –  OSMコミュニティへフィードバック
  23. 23. OpenStretMap の品質

- Information Quarity of OpenStreetMap -
  24. 24. OpenStreetMap の品質 OpenStretMapの2つの可能性 地理情報DB と 汎用情報DB の側面がある OpenStretMap  DB •  地理情報データベース的な側面 –  緯度、経度 Objects (Latitude , Longitude) (Node, Way, Relation) –  位置、外観、形状 + •  汎用情報データベース的な側面 –  Tag ( key : Value) Tag –  地物の様々な情報(タグ情報)
  25. 25. OpenStretMapの品質 OSMの品質(精度&データ数) 地理情報 (Object) 汎用情報 (Tag) 位置精度 (形状精度) (緯度・経度・高度) 精度 繋がり精度 タグ精度 (交差・接続) (正確な情報である事) 時間精度 (最新の情報である事) データ数 オブジェクトの数 タグの数 (より多くのオブジェクト) (より多くのタグ情報)
  26. 26. データ分析 Node-Way x OSM Merit by Region Node-Way比(情報量)と OSM Merit密度(データ数) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ Node/Way 45.0 Japan 2011.3.9 40.0 35.0 30.0 Japan25.0 20.0 Luxembourg Monaco Netherlands15.0 10.0 5.0 Bahrain Germany Belgium Gaza France 0.0 0 100,000 200,000 300,000 400,000 500,000 600,000 700,000 OSM Merit密度 (データの数)
  27. 27. データ分析 Node-Way x OSM Merit (Japan 2007.11.7 – 2012.4.30) 日本の履歴データ (2007.11.7-2012.4.30) 50.00 45.00 40.00 Node/Way 35.00 30.00 Node/Way 25.00 20.00 15.00 10.00 5.00 0.00 0 50000 100000 150000 200000 250000 300000 OSM Merit密度 (データの数)
  28. 28. まとめ 今後の課題 •  品質の指標の明確化 –  品質指標を多様化し、多角的な調査 •  ユーザーの活動と品質の関係 –  より狭い地域での比較/調査 •  コミュニティ活動とインセンティブについて

×