「農研機構」は国立研究開発法人 農業・食品産業技術総合研究機構のコミュニケーションネームです。
第22回オープンデータ・トークシリーズ
オープンデータの形式は”CSV”の先にどこに向かうのか
地理データ形式のこれから
OSGeo財団日本支部
農研機構農業環境変動センター
岩崎 亘典
第22会オープンデータトーク 2017/12/19
#この発言は個人の見解であり
所属する組織の公式見解ではありません
#この発言は技術的正当性を
保証するものではありません
#この発言は多分に
個人の趣味です
2
/39
まず結論!
• Shapefileはやめましょう!!!!
– だめ、絶対ダメ!!!!
• 単ファイルの場合
– 画像データならGeoTIFF
• いわゆるラスタ
– 図形データならGeoJSON
• いわゆるベクタ
– SpatiaLite、 TopoJSON、 GeoPackage等もあり
» ちょっと決め手に欠ける・・・。Shapefileは手強い・・・
3はじめに
/39
まず結論!
• Web・APIの利用を前提とした場合
→ タイルにしましょう!!
– ラスタタイルの場合
• ファイル形式は気にしなくていい
– PNG、JPG、TIFF、CSV
– ベクタタイルの場合
• テキストベースならGeoJSON
• バイナリならMapbox Vector Tile(MVT)
– が、ここの説明はまだ上手くできません(汗
4はじめに
/39
現状の公開方法
• CSVの他に、Shapefile、RDFでも公開
– むろらんオープンデータの例
5はじめに
第22会オープンデータトーク 2017/12/19
GISに関する不安や不満
/397
第22会オープンデータトーク 2017/12/19
Shapefileはやめましょう!!!!
第22会オープンデータトーク 2017/12/19
けっこうShapefileのせい!!
/3910
第22会オープンデータトーク 2017/12/19
http://switchfromshapefile.org/
/39
Shapefileの問題点
• 複数ファイルフォーマット
– shp、dbf、shxが必須!!
• オプションファイルも沢山!
– sbn, fbn, ain ,atx, ixs, mxs, prj, xml, cpg!!
• 測地系と投影座標情報が必須ファイルにない!!
– prjファイルに含まれます
• データはdbfファイル(dBaseIV)に格納される!
– 色々と制限がって鬱陶しい
12Shapefileはやめましょう!!!!
/39
Esriさんでさえおっしゃってます!!
Esri では長年にわたり、地理情報を格納するために、カバレッジ、シェープファイル、ジオデータ
ベースという主な 3 つのデータ形式を開発してきました。シェープファイルは、地理情報と属性情
報を格納するためのシンプルなトポロジによらない形式を提供するために開発されました。このシン
プルな特徴から、シェープファイルは非常に一般的でオープンなデータ転送形式になっています。
シェープファイルはシンプルで扱いやすいのですが、制約があり、ジオデータベースにはできても
シェープファイルにはできないことがたくさんあります。シェープファイルを使用する際は、
その制限について注意する必要があります。一般的に、次の制限があります。
• 地理データは、シェープファイルに格納できる単なるフィーチャおよび属性ではありません。たとえば、アノテー
ション、属性リレーションシップ、トポロジ リレーションシップ、属性ドメインおよびサブタイプ、座標精度および解像
度、その他多くの機能は、ジオデータベースではサポートされている一方で、シェープファイルではサポートされていませ
ん。
• シェープファイルは、データ転送において一般的で、公開されているデータ形式であるため、Esri 製でない多くのソフト
ウェア パッケージはシェープファイルを出力します。ところが、これらのパッケージが作成するシェープファイルの形式
は、必ずしも適切ではありません。別のソースから破損したシェープファイルを受け取ることもあります。
• シェープファイルは、dBASE ファイル形式(*.dbf ファイル)を使用して属性を格納します。dBASE は 1980 年代の
初めに開発された非 Esri 製の形式で、その当時は、属性のテーブルを格納するための最も一般的な形式でした。しかし、
それから長い年月を経るうちに、Unicode 標準など世界のほとんどの表記体系をサポートするために、データ表現に対し
て多くの改良が施されています。そのため、シェープファイルは英語以外の言語で情報を格納するのに向かなくなっ
ています。
これらをはじめとする問題のために、シェープファイルはアクティブなデータベース管理には
適していません。シェープファイルは、データの作成、編集、バージョン対応、アーカイブと
いう現代のライフ サイクルを扱うことができません。
13Shapefileはやめましょう!!!!
http://resources.arcgis.com/ja/help/main/10.1/index.html#/na/005600000013000000/
/39
「アクティブなデータベース」じゃないからいい?
• そもそもの問題は解決されません!!
– 複数ファイルフォーマット、測地系と投影座標情報、
dbfフィル
• 他のフォーマットもあり〼
– 単純な地物ならGeoJSON、複雑な構造なら
SpatiaLite
• 次点OGC GeoPackage
14Shapefileはやめましょう!!!!
http://switchfromshapefile.org/
第22会オープンデータトーク 2017/12/19
が、ファイルでいいの?
第22会オープンデータトーク 2017/12/19
オープンデータトーク21回での要望
データだけでなく、APIも必要!
第22会オープンデータトーク 2017/12/19
APIも必要なら
地図タイルはいかがでしょうか?
/39
地図タイル形式とは?
• フォーマットではなく、データ分割の方法
– 形式は、ラスタなら何でも、ベクタなら
GeoJSON、MVT
• 多くのソフトから直接アクセス可能
– leaflet, OpenLayers, QGIS, ArcGIS, etc…
• http://hoge.hoge/{z}/{x}/{y}.ext で指定
18データ公開フォーマットとしての地図タイル
地図タイルの概念図
出典:国土地理院
/39
ファイルベースのデータの欠点
• データが可視化されていない、使いたいデータ
なのかどうか不明
• ファイル形式や座標系変換、データの結合、切
り出しなどの準備が必要
19データ公開フォーマットとしての地図タイル
/39
ファイルベースのデータの欠点→地図タイル形式の利点
• データが可視化されていない、使いたいデータ
なのかどうか不明
閲覧用データなので可視化されている
用途に合うかどうか確認できる
• ファイル形式や座標系変換、データの結合、切
り出しなどの準備が必要
座標系が統一されている、形式変換も容易
JPG、PNG、GeoJSONなどWebフレンドリー
{z}/{x}/{y}を指定すれば、必要なデータが
入手できる
ただし,原点に注意は必要
20データ公開フォーマットとしての地図タイル
/39
地図タイルの活用例
• ひなたGIS
– バイナリ・ベクタタイルの活用例
21データ公開フォーマットとしての地図タイル
https://hgis.pref.miyazaki.lg.jp/hinata/hinata.h
tml#15/35.659745/139.730330
/39
地図タイルの活用例
• 標高PNGタイルと WebGL
– ブラウザ上で動的に表示を変更
• 利用者によるデータ準備の簡略化
→活用場面の拡大が期待される
LODの説明の地図版みたいな感じ?
といっていいのだろうか?
22データ公開フォーマットとしての地図タイル
https://frogcat.github.io/leaflet-tilelayer-glue/https://frogcat.github.io/csmap-gl/#15/35.6598/139.7303
/39
5 ★ オープンデータとの比較
• ファイル、タイルともに3~4に該当なの?
– 5を目指すより、公開と利用しやすさを重視
23データ公開フォーマットとしての地図タイル
/39
LODへの道のり…?
• 一般化にはちょっと遠い・・・、か?
– あまりフォローできてません(汗
• いくつかデータベースはある模様
24データ公開フォーマットとしての地図タイル
https://www.w3.org/community/geosemweb/
http://geoknow.eu/Welcome.html
https://my.usgs.gov/confluence/display/cdi/Semantic+Web+Working+Group
https://my.usgs.gov/confluence/pages/viewpage.action?pageId=544870292
/39
まとめ
• Shapefileはやめましょう
– 混乱の原因です。
• ファイル公開のフォーマットは、
– ラスタはGeoTIFF
– ベクタはGeoJSONまたはSpatiaLite
• GeoPackageもあり
• おすすめは地図タイルにして公開
– Web、APIでの利用が可能
• データ活用の可能性が高い
– CC BY でGeoJSONを公開、他の人がタイル
変換でもいいと思う
25地理データのオープンデータの形式のこれからは?
/39
まとめ
• Shapefileはやめましょう
– 混乱の原因です。
• ファイル公開のフォーマットは、
– ラスタはGeoTIFF
– ベクタはGeoJSONまたはSpatiaLite
• GeoPackageもあり
• おすすめは地図タイルにして公開
– Web、APIでの利用が可能
• データ活用の可能性が高い
– CC BY でGeoJSONを公開、他の人がタイル
変換でもいいと思う
26地理データのオープンデータの形式のこれからは?
/39
地図タイルへの期待
• バイナリベクトルタイルもQGISでデータを取得、表示できるようになってきました。
ベクトルタイルは、データそのものなので、編集も着色も自由にできます。WebGIS
用と思われているベクトルタイルですが、その恩恵はデスクトップGISにもありそう
です。バイナリベクトルタイルの普及が進んで、県ごとのshpファイルを別々にダウ
ンロードして、解凍して、結合してみたいな面倒なことをしなくて済むようになる
と良いですね;-)
• RでGISをするときに、色々なデータをネット経由で簡単に取得できると良いなーと
思います。ベクトルタイルの普及が進めば、それが可能になるかもしれません。
– http://d.hatena.ne.jp/tmizu23/20171209/1512787590
– http://d.hatena.ne.jp/tmizu23/20171216/1513379233
27データ公開フォーマットとしての地図タイル

第22回オープンデータトーク 地理データ形式のこれから