Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Lodチャレンジ2016 エリアベンチマーキング資料

176 views

Published on

LODチャレンジ2016の発表資料を修正、加筆したスライドです。

Published in: Technology
  • Be the first to comment

Lodチャレンジ2016 エリアベンチマーキング資料

  1. 1. エリアベンチマーキング LODと機械学習を使った地域課題発見ツール DOGRUN INC. オオイシナオヤ LOD チャレンジ2016発表資料(修正・追加)
  2. 2. エリアベンチマーキングとは 人口減少や高齢社会などこれまでに無かった状況を迎える地域社 会では、経験や生活の中の感覚からだけでは無く、データに基づ いた地域の課題や長所の発見が、地域住民へのサービス向上や地 域活性化への有効な手段になると考えられます。 エリアベンチマーキングは、社会構成・産業構造の近い地域同士 のデータを比較することが地域の特徴を発見する手段の一つとし て考え、政府統計データと機械学習によって集計された地域同士 の類似度のデータを探索的な可視化ツールとして提供します。
  3. 3. 利用したデータ 政府統計がLinked Open Dataとして公開される「統計LOD」から 社会統計データを中心に任意の測度のデータを利用。 http://data.e-stat.go.jp/lodw/
  4. 4. データ集計と可視化手法 • SPARQLにより統計LODよりデータを取得し、主成分分析した地 域間の類似度を散布図にプロット。 • D3.jsによる散布図はマウスのインタラクションにより表示エリ アをフォーカスすることが可能。個々のドットを選択しデータダ ウンロード用のフラグを起てることができる。 • 同様のデータをクラスタリングし、クラスターを動的にラベルし た日本地図を表示している。選択中の地域が大まかにどのような 地理的な分布の傾向を示すのか見ることができる。
  5. 5. http://area-benchmarking.meta-dog.com ソースコードも公開しています。
  6. 6. 類似地域の探索的な可視化
  7. 7. 地域の選択 都道府県名+市町村区名を入力すると、該当する地域がタグ付きでオ レンジ色のドットとして表示されます。直接ドットをクリックしても 選択状態になります。
  8. 8. 散布図の拡大 散布図をドラッグすることで、ドットが密集している部分など見 たい箇所を拡大して表示することができます。
  9. 9. 比較する地域の選択 検索対象の地域の近くのドットをクリックし、類似度の高い地域 にフラグを起てることができます。
  10. 10. サブセットの可視化 取得した全ての測度を使った類似度だけでなく、医療・教育や産業など カテゴリを絞った類似度をプロットし、異なる視点から類似した地域を 探すことができます。
  11. 11. 類似地域の統計データ取得 • 詳細な分析用に選択したエリアのデータがダウンロードできます。 • 同じような産業構造や人口統計のパターンの地域同士のデータを比較 することで、エリアの課題や特徴の再発見に役立ててください。
  12. 12. 類似する地域のクラスタリング • 選択した地域と同じクラスターに分類された地域をラベルして地図上でオレ ンジ色で表示することができます。 • 選択中の地域が属するクラスターが、大まかにどのように地理的に分布する か確認できます。
  13. 13. 地域課題×機械学習×統計LOD
  14. 14. 地域課題とLOD これからの地域課題の取組みは、公共データをいかに理解 し活用していくかが大きなテーマとなる。 LODはリソースの意味が明確で、データセットのあらゆる リソースを中間的なAPI無しで利用できるため、複数のデ ータセットを含む多次元の機械学習的データ分析に適して るのではと考えられる。
  15. 15. 統計LODへの期待 機械学習的データ解析の手法が急速に広まり、社会問題の 解決にオープンデータ分析が活用される土壌ができつつあ り、統計LODは地域課題の発見・解決における重要な公共 リソースに位置づけられる。 統計LODのデータセットが増えて行くことで、分析の精度 ・多様性も向上するはず。統計LODが多くの分野の統計デ ータに対応し、継続的にメンテナンスされ、発展していく ことを期待しています。

×