ロケーションデータの取り扱い方法
わかりやすいビジュアライズの方法
Georepublic Japan
Tajima Itsuro<tajima@georepublic.de>
13年8月5日月曜日
アジェンダ
• 地理空間データにどう取り組むか
• 統計とビジュアライゼーションの比較
• 地理空間データの実際
• ビジュアライゼーションの実際
13年8月5日月曜日
地理空間データに
どう取り組むか
• Geospatial Revolution(Penn State Univ.)
• 近年の地理空間データの変化は、このよ
うなことに変化を与える
• How we navigate(ナビゲート)
• How we make decisions(意志決定)
• How we share stories(物語の共有)
13年8月5日月曜日
地理空間データに
どう取り組むか
• Geospatial Revolution(Penn State Univ.)
• つまり、地図を使って意志決定をし
て、ストーリーを語る
• そのために技術に何ができるか?
• →わからないことをわかるようにする
技術
13年8月5日月曜日
地理空間データに
どう取り組むか
• わかりやすくする技術の誕生=集計データの誕生(18世紀)と同時期
• 1786年:棒グラフ、線グラフ
1829年:サーモマップ
(コンピュータの誕生)
1901年頃:主成分分析。この時期多変量解析などの完成
(戦争によりビジュアライゼーション技術は停滞)
1950年代 :ベイズ統計
1959年:機械学習
コンピュータが主なプラットフォームとなり、データベース、アル
ゴリズム、ビジュアライゼーション技術の向上へ
13年8月5日月曜日
解析と
ビジュアライゼーション
• 1つの方法:統計解析
• 5は4より大きい
• 大体5の集団と、大体4の集団は、大体どちらが大きいのか?
• →集団とは何か?
• →大きいとは何か?
• →大体とは何か?
• などを数学で定義することで、ある程度の目星を付けら
れる
13年8月5日月曜日
解析と
ビジュアライゼーション
• 1つの方法:統計解析
• 良い点
• 人の手に負えない大きな事柄に対して、
物を言える
• 意志決定や行動のための確かな根拠にな
る
13年8月5日月曜日
解析と
ビジュアライゼーション
• 1つの方法:統計解析
• 悪い点
• 数学の知識がないと、「この数字が何を言っているのか」がブ
ラックボックスになる
• 測度、モデル、情報量規準、機械学習アルゴリズムとそれを
高速化する手法…
• わからないものはわからない
• どれだけわからないかは、数学が言ってくれる
• 一般に、データが わないと精度は出ない
13年8月5日月曜日
解析と
ビジュアライゼーション
• もう一つの方法:ビジュアライゼーション
• 人は目で見て物事を判断できる
• その1つの技術として、代々使われていたのが地
図
• 私たちは、データを地図で見ることで、「これ
はどういうことが起こっているのだろう?」とい
うことを考えることができる
13年8月5日月曜日
解析と
ビジュアライゼーション
• もう一つの方法:ビジュアライゼーション
• 良い点
• 人の持っている詳細な知識、経験や感覚で地
図を見て物事を決定できる
• 間違っているかもしれないが、統計が十分に
機能しない場合でも、とりあえずの判断や共
有ができる
13年8月5日月曜日
解析と
ビジュアライゼーション
• もう一つの方法:ビジュアライゼーション
• 悪い点
• 見せ方によって印象が変わってしまう
• わからないものはわからない
• ビジュアライズしてみて「???」とな
る場合が多い
13年8月5日月曜日
どちらを選択するか?
• 場合に依ります
• 現状、オープンになっている行政のデ
ータは、都道府県単位の集計などの比
較的小さいデータである傾向にある
13年8月5日月曜日
今回は
ビジュアライゼーションを扱います
• ビジュアライゼーションは、様々な段階で
使うことができる
• わが町から世界まで
• データを多く整えなくても、ある程度物事
を良く把握できる
• →行政データなどとのマッシュアップが楽
13年8月5日月曜日
まとめ
• 地理空間データは、意志決定や物語の共有に使うこと
ができる
• それを可能にする統計解析やビジュアライゼーション
• 現状のオープンデータを活用するなら、ビジュアライ
ゼーションは良い手段ではないか
• →では、実際にあるデータをどうビジュアライズする
のか?
13年8月5日月曜日
何を
ビジュアライズするか?
• 実際に手に入る「地理空間データ」とは?
• 緯度経度
• POI:Point of Interest
• 都道府県、市区町村、道路、線路
• メッシュ
• 解析/ビジュアライズするようにできていない場合が多い
• ここではそのままでは解析/ビジュアライズできないデータ
を「地理空間に関する情報を含んだデータ」と呼ぶ
13年8月5日月曜日
一例:
• 「今日、カタリストBAで行われている
イベントに∼人が来ています」
• =地理に関する情報を含んだデータ
• →他の場所と比較できるかもしれな
い?
13年8月5日月曜日
一例:
• 「カタリストBA」をどう扱うか
• ポイントなら、どの緯度経度を取るか
• 建物や部屋の形状は必要か?
• そもそもそんなに精度は必要か?
• →不動産などでも問題になりうる
13年8月5日月曜日
難しい例
• 都市再生緊急整備地域(都市再生特別措置法第二条第三項の政令で定める地域)
• 横浜山内ふ頭地域
• 横浜市神奈川区の区域のうち、星野町(六番、六番一、七番、七番一及び七番二に限る。)、橋本町
2丁目(一番一及び一番十七から一番二十一までに限る。)及び山内町(一番五に限る。)の区域
(北緯三五度二八分一九秒・二二東経一三九度三八分一八秒・三二の地点から北緯三五度二八分一六
秒・六〇東経一三九度三八分一九秒・六四の地点まで、同地点から北緯三五度二八分一六秒・三一東
経一三九度三八分一九秒・二五の地点まで、同地点から北緯三五度二八分九秒・一四東経一三九度三
八分二二秒・八五の地点まで、同地点から北緯三五度二八分八秒・五七東経一三九度三八分二三秒・
〇八の地点まで、同地点から北緯三五度二八分八秒・四三東経一三九度三八分二三秒・一四の地点ま
で、同地点から北緯三五度二八分八秒・〇一東経一三九度三八分二三秒・二五の地点まで、同地点か
ら北緯三五度二八分七秒・四四東経一三九度三八分二三秒・三五の地点まで、同地点から北緯三五度
二八分六秒・八六東経一三九度三八分二三秒・三八の地点まで、同地点から北緯三五度二八分六秒・
二九東経一三九度三八分二三秒・三四の地点まで及び同地点から北緯三五度二八分六秒・〇六東経一
三九度三八分二三秒・三一の地点までそれぞれ引いた線以西の区域に限る。)
13年8月5日月曜日
難しい例
前のスライドの地理空間情報の表示
http://www.city.yokohama.lg.jp/toshi/kikaku/toshisaisei/pdf/
yamanouchi.pdf
13年8月5日月曜日
解析/ビジュアライゼーションに
地理データを使うには
• 様々な形で地理空間に関する情報を含ん
だデータを
• 地理データと結びつけて
• 実際の地球上に対応付けるという作業が
必要
• ここまでがビジュアライゼーション
13年8月5日月曜日
(1)地理データとは
• 二次元(緯度経度)の幾何学
• 点(緯度経度、POI)
• 線(道路、線路など)
• 面(地域の形=多角形の集まり)
13年8月5日月曜日
地理空間に関する情報を含んだ
データから、地理空間データへ
• 緯度経度→そのまま使える(精度には注意する必要)
• 都道府県など→最近は都道府県の境界は大きくは変
わっていないため、国が提供しているデータで多角
形に対応付け可能
• 市町村→多角形のデータはあるが、扱いが難しい。
頻繁に起こる市町村合併に加えて、「神奈川県横浜
市」「神奈川県横浜市中区」「横浜市中区」が混在
するなど、各データに合わせた対応が必要
13年8月5日月曜日
地理空間に関する情報を含んだ
データから、地理空間データへ
• e-statには、「どの粒度の地理情報があるか」のメタデータがない
• 都道府県、都道府県のうちの人口密集地、都道府県+大都市、市区町村、人口20
万人以上の市区町村、ここからここまでの市区町村…
• 「中野区 AND 中野市」で全文検索したものを市区町村のデータとみなしている
• 横浜市のデータはわかりやすい
http://www.city.yokohama.lg.jp/ex/stat/index2.html
13年8月5日月曜日
地理空間に関する情報を含ん
だデータから、地理データへ
• POI:「∼小学校における∼の観測デー
タ」などといった場合、GPSで緯度経度
を特定する必要がある場合がある
• 地図を使って特定する場合、利用規約
の問題がある
• メッシュ→規格化されている
13年8月5日月曜日
まとめ
• 地理情報を含んだデータをちゃんとし
た地理データにするには、最終的に場
合によるが、ある程度の標準化は可能
• ここで得られた点、線、面のデータを
ベースに、ビジュアライズを行うこと
になる
13年8月5日月曜日
地理データから
ビジュアライズへ
• ビジュアライゼーション=情報デザイ
ンの問題
• 様々な難しいテーマがあるが
• 基本的には地理データがあるなら、地
図を使わない手はない
13年8月5日月曜日
地理データから
ビジュアライズへ
• 地図を使ったデータのビジュアライズ
• =基本的には、地図に何かを提示する
• 高度な手法では、地図自体を変形させ
る(カルトグラム)
13年8月5日月曜日
地理データから
ビジュアライズへ
カルトグラムの例
http://www.pref.tokushima.jp/docs/2009082500765/
13年8月5日月曜日
地理データから
ビジュアライズへ
• 地図の形を残したまま情報を提示するには
• 点(分布を概観、画像などの付加データの
参照など)
• 線(経路や動きの提示など)
• 面(濃淡、棒グラフや円グラフなど)
• 3D(メッシュデータなどの可視化)
13年8月5日月曜日
地理データから
ビジュアライズへ
• 主題図:Thematic Map
• ある主題をわかりやすくした図
• 天気図
• 等高線
• ヒートマップ
13年8月5日月曜日
地理データから
ビジュアライズへ
• その中でも「コロプレスマップ(Choropleth
Map)」を取り上げます
• コロプレスマップ=各地域を色で塗り分けたもの
• 東京都は売上が高いから白、神奈川県は売上
が低いから黄色など、千葉県は売上がとても
低いから赤など
• 可視化しやすく、わかりやすい
13年8月5日月曜日
コロプレスマップの元祖
フランスにおける識字率統計(1826)
13年8月5日月曜日
コロプレスマップを並べた元祖
フランスの犯罪率と教育(1829)
13年8月5日月曜日
地理データから
ビジュアライズへ
• コロプレスマップ同士を目で見て比較
できる
• →新たな法則の発見の可能性
• 統計解析への糸口にもなりうる
13年8月5日月曜日
参考文献
• Maps and Geospatial Revolution(海外のオンライン講義「coursera」の講義)
• https://www.coursera.org/course/maps
• Geospatial Revolutionプロジェクト公式サイト
• http://geospatialrevolution.psu.edu/
• Milestones in the History of Thematic Cartography, Statistical Graphics, and DataVisualization
• http://datavis.ca/milestones/index.php
• 近代的グラフの発明者ウィリアム・プレイフェア
• http://id.fnshr.info/2012/07/12/playfair/
• Thematic map - Wikipedia
• http://en.wikipedia.org/wiki/Thematic_map
• イアン・ハッキング「偶然を飼いならす―統計学と第二次科学革命」
• http://www.amazon.co.jp/dp/4833222744
13年8月5日月曜日

ロケーションデータの取り扱い方法、わかりやすいビジュアライズの方法