Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

地図・位置情報のデータマイイング

5,357 views

Published on

Published in: Technology
  • Be the first to comment

地図・位置情報のデータマイイング

  1. 1. 地図・位置情報のデータマイニング 大城 将範 id oshiro40
  2. 2. アジェンダ <ul><li>自己紹介 </li></ul><ul><li>地理情報の取得 </li></ul><ul><li>地理情報の分析 </li></ul><ul><li>地理情報の加工 </li></ul>
  3. 3. 自己紹介 <ul><li>名前:大城 将範 </li></ul><ul><li>twitter : @oshiro40 </li></ul><ul><li>Web エンジニア </li></ul><ul><li>R言語 </li></ul><ul><li>地理情報系に興味がある </li></ul>
  4. 4. 学生時代の話 <ul><li>学生時代の研究 </li></ul><ul><ul><li>地域データの分類 </li></ul></ul><ul><ul><ul><li>人口,人口の属性 </li></ul></ul></ul><ul><ul><ul><li>商用施設,ネットワーク </li></ul></ul></ul><ul><ul><li>ジオデモグラフィクス </li></ul></ul>
  5. 5. モチベーション <ul><li>最近地理情報データが取得が容易に </li></ul><ul><ul><li>GPS (携帯, iphone...) </li></ul></ul><ul><ul><li>google Earth,MAP </li></ul></ul><ul><li>地理情報を使用して何かをしたい </li></ul><ul><ul><li>レコメンデーション? </li></ul></ul><ul><li>地理情報データを分析するまでのハードルを </li></ul><ul><li>低くしたい </li></ul>
  6. 6. 地理情報データを取得する <ul><li>地理情報として料理できるようにする </li></ul><ul><ul><li>住所・地名データから取得 </li></ul></ul><ul><ul><li>Web から取得 </li></ul></ul>
  7. 7. テキストから取得 <ul><li>ジオコーディング </li></ul><ul><ul><li>地名・住所に対して地理座標を与えること </li></ul></ul><ul><li>Yahoo! 地図 API ジオコーダ </li></ul><ul><li>Google Maps API   (getLatLng メソッド ) </li></ul><ul><li>東京大学空間情報科学研究センター </li></ul><ul><li>  ( CSV アドレスマッチングサービス) </li></ul>
  8. 8. ジオコーディング
  9. 9. 形態素解析 -> ジオコーディング 形態素解析API ( Yahoo! テキスト解析など) ジオコーディングAPI 経緯度データ取得
  10. 10. 形態素解析 -> ジオコーディング <ul><li>実際にその場所にいるかわからない </li></ul><ul><li>「どの場所を言及しているか?」 </li></ul><ul><ul><li>ホットな場所 </li></ul></ul>
  11. 11. ソーシャルな位置情報データ <ul><li>Web アプリで位置情報を登録する </li></ul><ul><li>GPS 端末などで位置情報を付与している </li></ul><ul><li>twitter </li></ul><ul><li>fouresquare </li></ul>
  12. 12. twittwr <ul><li>twitter API から location を取得できる </li></ul><ul><li>location がついたつぶやきはそんなに多くない </li></ul>
  13. 13. fouresuare <ul><li>位置情報付の SNS </li></ul><ul><li>自分の位置を通知することを「 check-in 」と呼び, check-in するたびにポイントがたまる </li></ul><ul><li>ある場所に他の友達より多く行くと「その場所の Mayor 」になる </li></ul><ul><li>Tips でその場所についてメモを残せる </li></ul><ul><li>  ( twitter のつぶやきみたいなもの) </li></ul>
  14. 15. fouresuare API <ul><li>認証が不要で手頃な tips 検索 </li></ul><ul><li>XML, JSON 形式で取得可能 </li></ul><ul><li>経緯度を指定して周辺の tips を取得 </li></ul><ul><li>http://api.foursquare.com/v1/tips?geolat=35.64421911536878&geolong=139.69914436340332 </li></ul>
  15. 16. fouresuare API
  16. 17. R で表示
  17. 18. 自分で作成 <ul><li>GPS ロガー </li></ul>
  18. 19. 位置情報データの分析 <ul><li>点データの集計 </li></ul><ul><ul><li>位置情報の精度の揺らぎ </li></ul></ul><ul><li>蓄積されたデータの活用 </li></ul><ul><ul><li>アンカーポイント </li></ul></ul><ul><ul><ul><li>地域の基盤となる場所でもって集計する </li></ul></ul></ul><ul><ul><ul><ul><li>駅,小学校, </li></ul></ul></ul></ul>
  19. 20. ボロノイ図 <ul><li>ある距離空間上の任意の位置に配置された複数個の点に対して、同一距離空間上の他の点がどの母点に近いかによって領域分けされた図のことである。特に二次元ユークリッド平面の場合、領域の境界線は、各々の母点の二等分線の一部になる。 </li></ul>
  20. 21. 点データ分析 <ul><li>空間集計 </li></ul>面データ 点データ
  21. 22. 点データ分析 <ul><li>空間集計 </li></ul>面データ 点データ ポイントデータの単純集計
  22. 23. 点データ分析 <ul><li>カーネル密度推定法 </li></ul><ul><ul><li>「カーネル関数」を用いて、重みつきの ( 重みなしでも可 ) ポイントの分布から密度によって色分けされた地図 を作成 </li></ul></ul><ul><li>R だとパッケージ spatialkernel </li></ul>
  23. 24. カーネル密度推定法
  24. 25. カーネル密度推定法
  25. 26. 地理情報データの加工 <ul><li>取得した点データに情報を付加したい </li></ul><ul><li>たとえば twitter のつぶやきと foursqure の tips を連携したい! </li></ul>
  26. 27. 空間結合 属性:人口データ     地域の特性 twitter の発言 発言者 etc.. 面データ 点データ
  27. 28. 空間結合 属性:人口データ     地域の特性 twitter の発言 発言者 etc.. + 属性:人口データ     地域の特性
  28. 29. 空間結合 駅等の母点の情報を 各要素に結合する ボロノイ図
  29. 30. 空間結合 twitter の発言 発言者 etc.. 面データ 点データ foursqare の tips 発言者 etc.. twitter の発言 発言者 etc.. + foursqare の tips 発言者 etc.. バッファの作成
  30. 31. まとめ <ul><li>地理情報データを分析にかけられる様にするまでのいくつかのテクニック </li></ul><ul><li>整形したデータでクラスタ分析など各種統計処理が可能 </li></ul>
  31. 32. <ul><li>ご静聴ありがとうございました </li></ul>

×