• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
ロケーションデータの取り扱い方法、わかりやすいビジュアライズの方法
 

ロケーションデータの取り扱い方法、わかりやすいビジュアライズの方法

on

  • 2,368 views

 

Statistics

Views

Total Views
2,368
Views on SlideShare
912
Embed Views
1,456

Actions

Likes
6
Downloads
7
Comments
0

8 Embeds 1,456

http://okfn.jp 1448
http://translate.googleusercontent.com 2
http://www.newsblur.com 1
http://feeds.feedburner.com 1
http://www.feedspot.com 1
https://www.google.co.jp 1
http://www.google.co.jp 1
http://webcache.googleusercontent.com 1
More...

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    ロケーションデータの取り扱い方法、わかりやすいビジュアライズの方法 ロケーションデータの取り扱い方法、わかりやすいビジュアライズの方法 Presentation Transcript

    • ロケーションデータの取り扱い方法 わかりやすいビジュアライズの方法 Georepublic Japan Tajima Itsuro<tajima@georepublic.de> 13年8月5日月曜日
    • アジェンダ • 地理空間データにどう取り組むか • 統計とビジュアライゼーションの比較 • 地理空間データの実際 • ビジュアライゼーションの実際 13年8月5日月曜日
    • 地理空間データに どう取り組むか • Geospatial Revolution(Penn State Univ.) • 近年の地理空間データの変化は、このよ うなことに変化を与える • How we navigate(ナビゲート) • How we make decisions(意志決定) • How we share stories(物語の共有) 13年8月5日月曜日
    • 地理空間データに どう取り組むか • Geospatial Revolution(Penn State Univ.) • つまり、地図を使って意志決定をし て、ストーリーを語る • そのために技術に何ができるか? • →わからないことをわかるようにする 技術 13年8月5日月曜日
    • 地理空間データに どう取り組むか • わかりやすくする技術の誕生=集計データの誕生(18世紀)と同時期 • 1786年:棒グラフ、線グラフ 1829年:サーモマップ (コンピュータの誕生) 1901年頃:主成分分析。この時期多変量解析などの完成 (戦争によりビジュアライゼーション技術は停滞) 1950年代 :ベイズ統計 1959年:機械学習 コンピュータが主なプラットフォームとなり、データベース、アル ゴリズム、ビジュアライゼーション技術の向上へ 13年8月5日月曜日
    • 解析と ビジュアライゼーション • 1つの方法:統計解析 • 5は4より大きい • 大体5の集団と、大体4の集団は、大体どちらが大きいのか? • →集団とは何か? • →大きいとは何か? • →大体とは何か? • などを数学で定義することで、ある程度の目星を付けら れる 13年8月5日月曜日
    • 解析と ビジュアライゼーション • 1つの方法:統計解析 • 良い点 • 人の手に負えない大きな事柄に対して、 物を言える • 意志決定や行動のための確かな根拠にな る 13年8月5日月曜日
    • 解析と ビジュアライゼーション • 1つの方法:統計解析 • 悪い点 • 数学の知識がないと、「この数字が何を言っているのか」がブ ラックボックスになる • 測度、モデル、情報量規準、機械学習アルゴリズムとそれを 高速化する手法… • わからないものはわからない • どれだけわからないかは、数学が言ってくれる • 一般に、データが わないと精度は出ない 13年8月5日月曜日
    • 解析と ビジュアライゼーション • もう一つの方法:ビジュアライゼーション • 人は目で見て物事を判断できる • その1つの技術として、代々使われていたのが地 図 • 私たちは、データを地図で見ることで、「これ はどういうことが起こっているのだろう?」とい うことを考えることができる 13年8月5日月曜日
    • 解析と ビジュアライゼーション • もう一つの方法:ビジュアライゼーション • 良い点 • 人の持っている詳細な知識、経験や感覚で地 図を見て物事を決定できる • 間違っているかもしれないが、統計が十分に 機能しない場合でも、とりあえずの判断や共 有ができる 13年8月5日月曜日
    • 解析と ビジュアライゼーション • もう一つの方法:ビジュアライゼーション • 悪い点 • 見せ方によって印象が変わってしまう • わからないものはわからない • ビジュアライズしてみて「???」とな る場合が多い 13年8月5日月曜日
    • どちらを選択するか? • 場合に依ります • 現状、オープンになっている行政のデ ータは、都道府県単位の集計などの比 較的小さいデータである傾向にある 13年8月5日月曜日
    • 今回は ビジュアライゼーションを扱います • ビジュアライゼーションは、様々な段階で 使うことができる • わが町から世界まで • データを多く整えなくても、ある程度物事 を良く把握できる • →行政データなどとのマッシュアップが楽 13年8月5日月曜日
    • まとめ • 地理空間データは、意志決定や物語の共有に使うこと ができる • それを可能にする統計解析やビジュアライゼーション • 現状のオープンデータを活用するなら、ビジュアライ ゼーションは良い手段ではないか • →では、実際にあるデータをどうビジュアライズする のか? 13年8月5日月曜日
    • 何を ビジュアライズするか? • 実際に手に入る「地理空間データ」とは? • 緯度経度 • POI:Point of Interest • 都道府県、市区町村、道路、線路 • メッシュ • 解析/ビジュアライズするようにできていない場合が多い • ここではそのままでは解析/ビジュアライズできないデータ を「地理空間に関する情報を含んだデータ」と呼ぶ 13年8月5日月曜日
    • 一例: • 「今日、カタリストBAで行われている イベントに∼人が来ています」 • =地理に関する情報を含んだデータ • →他の場所と比較できるかもしれな い? 13年8月5日月曜日
    • 一例: • 「カタリストBA」をどう扱うか • ポイントなら、どの緯度経度を取るか • 建物や部屋の形状は必要か? • そもそもそんなに精度は必要か? • →不動産などでも問題になりうる 13年8月5日月曜日
    • 難しい例 • 都市再生緊急整備地域(都市再生特別措置法第二条第三項の政令で定める地域) • 横浜山内ふ頭地域 • 横浜市神奈川区の区域のうち、星野町(六番、六番一、七番、七番一及び七番二に限る。)、橋本町 2丁目(一番一及び一番十七から一番二十一までに限る。)及び山内町(一番五に限る。)の区域 (北緯三五度二八分一九秒・二二東経一三九度三八分一八秒・三二の地点から北緯三五度二八分一六 秒・六〇東経一三九度三八分一九秒・六四の地点まで、同地点から北緯三五度二八分一六秒・三一東 経一三九度三八分一九秒・二五の地点まで、同地点から北緯三五度二八分九秒・一四東経一三九度三 八分二二秒・八五の地点まで、同地点から北緯三五度二八分八秒・五七東経一三九度三八分二三秒・ 〇八の地点まで、同地点から北緯三五度二八分八秒・四三東経一三九度三八分二三秒・一四の地点ま で、同地点から北緯三五度二八分八秒・〇一東経一三九度三八分二三秒・二五の地点まで、同地点か ら北緯三五度二八分七秒・四四東経一三九度三八分二三秒・三五の地点まで、同地点から北緯三五度 二八分六秒・八六東経一三九度三八分二三秒・三八の地点まで、同地点から北緯三五度二八分六秒・ 二九東経一三九度三八分二三秒・三四の地点まで及び同地点から北緯三五度二八分六秒・〇六東経一 三九度三八分二三秒・三一の地点までそれぞれ引いた線以西の区域に限る。) 13年8月5日月曜日
    • 難しい例 前のスライドの地理空間情報の表示 http://www.city.yokohama.lg.jp/toshi/kikaku/toshisaisei/pdf/ yamanouchi.pdf 13年8月5日月曜日
    • 解析/ビジュアライゼーションに 地理データを使うには • 様々な形で地理空間に関する情報を含ん だデータを • 地理データと結びつけて • 実際の地球上に対応付けるという作業が 必要 • ここまでがビジュアライゼーション 13年8月5日月曜日
    • (1)地理データとは • 二次元(緯度経度)の幾何学 • 点(緯度経度、POI) • 線(道路、線路など) • 面(地域の形=多角形の集まり) 13年8月5日月曜日
    • 地理空間に関する情報を含んだ データから、地理空間データへ • 緯度経度→そのまま使える(精度には注意する必要) • 都道府県など→最近は都道府県の境界は大きくは変 わっていないため、国が提供しているデータで多角 形に対応付け可能 • 市町村→多角形のデータはあるが、扱いが難しい。 頻繁に起こる市町村合併に加えて、「神奈川県横浜 市」「神奈川県横浜市中区」「横浜市中区」が混在 するなど、各データに合わせた対応が必要 13年8月5日月曜日
    • 地理空間に関する情報を含んだ データから、地理空間データへ • e-statには、「どの粒度の地理情報があるか」のメタデータがない • 都道府県、都道府県のうちの人口密集地、都道府県+大都市、市区町村、人口20 万人以上の市区町村、ここからここまでの市区町村… • 「中野区 AND 中野市」で全文検索したものを市区町村のデータとみなしている • 横浜市のデータはわかりやすい http://www.city.yokohama.lg.jp/ex/stat/index2.html 13年8月5日月曜日
    • 地理空間に関する情報を含ん だデータから、地理データへ • POI:「∼小学校における∼の観測デー タ」などといった場合、GPSで緯度経度 を特定する必要がある場合がある • 地図を使って特定する場合、利用規約 の問題がある • メッシュ→規格化されている 13年8月5日月曜日
    • まとめ • 地理情報を含んだデータをちゃんとし た地理データにするには、最終的に場 合によるが、ある程度の標準化は可能 • ここで得られた点、線、面のデータを ベースに、ビジュアライズを行うこと になる 13年8月5日月曜日
    • 地理データから ビジュアライズへ • ビジュアライゼーション=情報デザイ ンの問題 • 様々な難しいテーマがあるが • 基本的には地理データがあるなら、地 図を使わない手はない 13年8月5日月曜日
    • 地理データから ビジュアライズへ • 地図を使ったデータのビジュアライズ • =基本的には、地図に何かを提示する • 高度な手法では、地図自体を変形させ る(カルトグラム) 13年8月5日月曜日
    • 地理データから ビジュアライズへ カルトグラムの例 http://www.pref.tokushima.jp/docs/2009082500765/ 13年8月5日月曜日
    • 地理データから ビジュアライズへ • 地図の形を残したまま情報を提示するには • 点(分布を概観、画像などの付加データの 参照など) • 線(経路や動きの提示など) • 面(濃淡、棒グラフや円グラフなど) • 3D(メッシュデータなどの可視化) 13年8月5日月曜日
    • 地理データから ビジュアライズへ • 主題図:Thematic Map • ある主題をわかりやすくした図 • 天気図 • 等高線 • ヒートマップ 13年8月5日月曜日
    • 地理データから ビジュアライズへ • その中でも「コロプレスマップ(Choropleth Map)」を取り上げます • コロプレスマップ=各地域を色で塗り分けたもの • 東京都は売上が高いから白、神奈川県は売上 が低いから黄色など、千葉県は売上がとても 低いから赤など • 可視化しやすく、わかりやすい 13年8月5日月曜日
    • コロプレスマップの元祖 フランスにおける識字率統計(1826) 13年8月5日月曜日
    • コロプレスマップを並べた元祖 フランスの犯罪率と教育(1829) 13年8月5日月曜日
    • 地理データから ビジュアライズへ • コロプレスマップ同士を目で見て比較 できる • →新たな法則の発見の可能性 • 統計解析への糸口にもなりうる 13年8月5日月曜日
    • 参考文献 • Maps and Geospatial Revolution(海外のオンライン講義「coursera」の講義) • https://www.coursera.org/course/maps • Geospatial Revolutionプロジェクト公式サイト • http://geospatialrevolution.psu.edu/ • Milestones in the History of Thematic Cartography, Statistical Graphics, and DataVisualization • http://datavis.ca/milestones/index.php • 近代的グラフの発明者ウィリアム・プレイフェア • http://id.fnshr.info/2012/07/12/playfair/ • Thematic map - Wikipedia • http://en.wikipedia.org/wiki/Thematic_map • イアン・ハッキング「偶然を飼いならす―統計学と第二次科学革命」 • http://www.amazon.co.jp/dp/4833222744 13年8月5日月曜日