Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Foss4 g公表用(柴田)

653 views

Published on

日本では政府のオープンデータ方針に基づき、地形や土地利用、人口分布などの様々なデータがインターネット上で公開されています。しかし、これらの膨大なデータを用いて新たな情報を得るためには、GISやRによるデータ処理など様々な工夫が必要です。本発表では、オープンデータを活用して日本国内の生態系サービス(自然が人々の暮らしにもたらす恵み)の評価・可視化を行なった事例を紹介します。

Published in: Technology
  • Be the first to comment

  • Be the first to like this

Foss4 g公表用(柴田)

  1. 1. ナショナルスケール地理 空間情報の取集と解析 〜オープンデータの活用事例〜 総合地球環境学研究所 柴田 嶺 2017/10/15
  2. 2. 自己紹介 • 柴田 嶺 (Rei Shibata) • 総合地球環境学研究所 研究員(2017.4 〜)(Research institute for Humanity and Nature) • 専門:森林生態学、生態系サービス (Forest ecology, Ecological Services) • よく使うソフトウェア (Software) • R (2010〜:統計処理、機械学習…) • STAN (2016〜:ベイズ) • QGIS (2016〜) • ArcGIS (2017.8〜)
  3. 3. なぜGIS+オープンデータ? Time-consuming Labor-intensive Money-consuming 詳細なデータ but… 狭い範囲 野外調査 Field work
  4. 4. なぜGIS+オープンデータ? Free! 広域データ!! (Large-scale data!) 広域の傾向を知りたいときに便利 GIS+オープンデータ
  5. 5. オープンデータの例 ・自然環境保全基礎調査(環境省) e.g.) Vegetation data ・国土数値情報(国土交通省) ・国勢調査(総務省)e.g. )Population density ・基盤地図情報(国土地理院)DEM ・衛星画像(Landsat等) ベクトルタイル?
  6. 6. ・湖沼 ・河川 ・標高・傾斜度3次メッシュ ・行政区域 ・平年値(気候メッシュ) ・自然公園地域 ・自然保全地域 ・道路密度・道路延長メッシュ ・高速道路時系列 ・鉄道 利用規約を守って正しく利用しましょう!
  7. 7. 植生図 最新データ ◯解像度が高い ×全地域そろっていない 足りないデータを 旧データでカバー 利用規約を守って正しく利用しましょう!
  8. 8. 使う人が増えれば。。。 するかも… ・データの質が向上 ・データの種類が増加 ・データの更新頻度が増加 みなさん、どんどん活用しましょう!
  9. 9. 事例
  10. 10. 生態系サービス • 生物・生態系に由来し、人類の利益になる機能 (サービス)のこと。 • つまり、「自然の恵み」 • 木材や山菜を供給 • きれいな水を供給 • 農作物の花粉を運ぶ • 自然の中で余暇を楽しむ(レクリエーション) • アウトドア(キャンプ・釣り・登山・紅葉刈り)
  11. 11. キャンプ場の分布を予測? • 日本国内のキャンプ場の分布を「自然環境」と 「社会環境」から予測することができるか? 自然環境 • 森林 • 湖 • 涼しい • 山麓 社会環境 • 近い • 高速道路 • コンビニ • 人が少ない
  12. 12. 流れ 地理情報データ (オープンデータ) • 自然環境保全基礎調査(環境省) • 植生図 • 国土数値情報(国土交通省) • 湖沼 • 河川 • 気候 • 道路密度 • 自然公園地域 • 自然保全地域 • 高速道路 • 鉄道 • 国勢調査(総務省) • 人口 • 基盤地図情報(国土地理院) • 地形(DEM) 統計モデル 機械学習 生態系サービスの 予測 (国内の分布の推定値) 例えば。。 • キャンプ場の分布 • 学校の野外学習の実施先 • 登山者数の分布
  13. 13. 今回はArcGISを使用 ・大規模データに対してQGISは… • ジオメトリエラー頻発(計算できない!) • Update機能が無い? • 計算がArcGISより遅い? • 落ちることが多い ArcGIS update機能 大規模データに対しては今 のところArcGISがリード? ※PostGISを使うと良いらしい!
  14. 14. 解像度を決める 3次メッシュ (1km×1km) →381,348mesh →重い →見た目はキレイ 2次メッシュ (10km×10km) →4,250mesh →データ処理・解析が楽
  15. 15. 作業イメージ 海 森林 インターセクト 森林100% のメッシュ 森林20% 海 80% のメッシュ 植生図データ 二次メッシュ
  16. 16. 植生図 最新データ ◯解像度が高い ×全地域そろっていない 足りないデータを 旧データでカバー
  17. 17. 第2〜5回植生調査データ(vg) 平成6〜10年度 シェープファイル:都道府県単位 フィーチャ(ポリゴン)数:2,163,943個 →解像度が荒い →ちょっと古い →日本全国をカバーしている 第6・7回植生調査データ(vg67) 平成11〜年度 シェープファイル:2次メッシュ単位 フィーチャ(ポリゴン)数:3,327,136個 →解像度が高い →最新データ →日本全国をカバーしていない アップデート ArcGIS >解析ツール >>オーバーレイ >>>アップデート ※vg67がある場合はvg67を、無い場合はvg5を使ったレイヤ ※事前に属性テーブルの判例を統一する必要あり
  18. 18. 第2〜5回+6・7回アップデート フィーチャ(ポリゴン)数:3,951,876個 →海と陸水との区別がついていない →どちらも植生図では「解放水域」 ユニオン ArcGIS >解析ツール >>オーバーレイ >>>ユニオン ※属性テーブルに内陸(1)と海(0)を区別する行を付 加することで、Rで集計する際に「解放水域」を「海」と 「陸水」とに分けることが可能となる 行政区域(国土数値情報) フィーチャ(ポリゴン)数:116,024個 →陸地のみのポリゴン →内陸と海を区別する「目印」
  19. 19. 第2〜5回+6・7回アップデート植生図+陸地タグ付加 フィーチャ(ポリゴン)数:4,299,524個 これがベースファイル
  20. 20. インターセクト ArcGIS >解析ツール >>オーバーレイ >>>インターセクト 2次メッシュ(10km*10km) フィーチャ(ポリゴン)数:4,250個 第2〜5回+6・7回アップデート植生図+陸地タグ付加 フィーチャ(ポリゴン)数:4,299,524個 ※属性テーブルに2次メッシュ番号を付与
  21. 21. 植生区分 陸or海 二次メッシュ番号 面積
  22. 22. CSVファイル完成! フィーチャー数(行数): 4,568,838行 ファイルサイズ:1.27GB 投影変換(Project) →正楕円筒図法 (面積が正確?) エクスポート →属性テーブルをcsvファイルで書き出し
  23. 23. II コケモモ-トウヒクラス域自然植生 04亜高山帯針葉樹林(北海道) 05亜高山帯針葉樹林 06亜高山帯広葉樹林 07高茎草原及び風衝草原 V ブナクラス域代償植生 22落葉広葉樹二次林 23常緑樹二次林 24落葉広葉低木群落 25二次草原 26伐採跡地群落 VII ヤブツバキクラス域代償植生 40常緑広葉樹二次林 41落葉広葉樹二次林 42常緑針葉樹二次林 43タケ・ササ群落 44低木群落 45二次草原 46伐採跡地群落 I 高山帯自然植生域 01高山低木群落 02高山ハイデ及び風衝草原 03雪田草原 III コケモモ-トウヒクラス域代償植生 08亜高山帯二次林 09二次草原 10伐採跡地群落 IV ブナクラス域自然植生 11落葉広葉樹林(日本海型) 12下部針広混交林 13落葉広葉樹林(太平洋型) 14冷温帯針葉樹林 15岩角地針葉樹林 16渓畔林 17沼沢林 18河辺林 19岩角地・風衝地低木群落 20なだれ地自然低木群落 21自然草原 VI ヤブツバキクラス域自然植生 27常緑広葉樹林 28暖温帯針葉樹林 29岩角地・海岸断崖地針葉樹林 30落葉広葉樹林 31沼沢林 32河辺林 33自然低木群落 34海岸風衝低木群落 35亜熱帯常緑広葉樹林 36亜熱帯常緑広葉樹林 (隆起石灰岩上) 37亜熱帯湿生林 (マングローブ林) 38亜熱帯常緑針葉樹林 39亜熱帯低木群落 VIII 河辺・湿原・沼沢地・砂丘植生 47湿原・河川・池沼植生 48塩沼地植生 49砂丘植生 50海岸断崖地植生 51岩角地・石灰岩地・蛇紋岩地植生 52火山荒原植生・硫黄孔原植生 53隆起珊瑚礁植生 X 市街地等 58市街地等 IX 植林地・耕作地植生 54植林地 55竹林 56牧草地・ゴルフ場・芝地 57耕作地
  24. 24. new.vg.group <- function(df) { primary <- c(1:7, 11:21, 27:39, 47:53) secondary <- c(8:10, 22:26, 40:46) plantation <- c(54, 55) pasture <- 56 cultivated <- 57 urban <- 58 sea <- 0 df$NEW <- ifelse( df$DAI_C %in% primary, "primary", ifelse( df$DAI_C %in% secondary, "secondary", ifelse( df$DAI_C %in% plantation, "plantation", ifelse( df$DAI_C %in% pasture, "pasture", ifelse( df$DAI_C %in% cultivated, "cultivated", ifelse( df$DAI_C %in% urban, "urban", ifelse(df$DAI_C %in% sea, "unknown", "unknown") ) ) ) ) ) ) df$NEW <- ifelse( df$NEW == "urban" & df$CHU_C == 6, "water", df$NEW ) df$NEW <- ifelse( df$NEW == "water", ifelse(df$LAND == 1, "inland.water", "sea.water"), df$NEW ) df$NEW <- ifelse( df$NEW == "unknown", ifelse(df$LAND == 1, "unknown", "sea.water"), df$NEW ) return(df) } Rで集計 Rでcsvファイルを読み込み、各 メッシュごとの被覆率を集計 ・自然植生 ・二次植生 ・植林 ・耕作地 ・牧草地 ・市街地 ・陸水 ・海
  25. 25. 森林率 (植生図) 人口密度 (国勢調査) 自然公園率 (国土数値情報) 平均標高 (基盤地図情報)
  26. 26. 機械学習に よる予測 Machine Learning (Gradient boosting ) オープンデータ (Natural & Social environment) 北海道・東北はキャンプ場 存在確率が低い Good natural environment But Low population density & Bad accessibility 長野・富士山周辺はキャンプ場存在確率が高い Good natural environment High population density Good accessibility 解析結果 Real Data Prediction 実際のキャンプ場 の分布
  27. 27. Thank you!! Research institute for Humanity and Nature(RIHN) Rei Shibata rei@chikyu.ac.jp

×