SlideShare a Scribd company logo
1 of 18
暇ツイートLOD
1
全18枚
概要
2
テキストマイニング 今後の展望
可視化LODマップ
暇ツイートLOD研究
 研究テーマ「 暇ツイートLOD」概要
Twitterで「暇」と単語が入ったツイー
トを分析,
ユーザーニーズを視覚的にわかるよう
にし,
マーケティングに応用する方法
3
研究に使うツール
Twitter API
→ツイートの取得に使用
SparqlEPCU (http://bit.ly/1UYtVDc)
→csvデータのLOD化に使用
LOD Browser (http://bit.ly/1UYtMjg)
→LODデータの可視化に使用
4
先行研究調査
CiNii(http://ci.nii.ac.jp/)
GoogleScholar(https://scholar.google.co.jp/)
で同様の研究は見つからなかった
→ 新規性のある研究と言える
5
収集したデータ量
収集したツイート総数が 348,027件
・テキストマイニングに利用できるツイート
→ 291,439件
・可視化マップに利用できるツイート
→ 7,594件
6
概要
7
テキストマイニング 今後の展望
可視化LODマップ
暇ツイートLOD研究
 暇ツイートをテキストマイニング
 ツイートから形態素のbigramを抽出し,
 T値とMI値を用いて,「暇」と共起度が高い
形態素を抽出して消費者ニーズを分析
 簡単なテキストマイニングを行った結果、
マーケティングにつながる言葉は「お菓子」
であった。 8
T値
• 共起頻度を,総語数や期待度数で調整した値
• Tスコアが2以上になると有意な組合せであると
される。
𝑇 =
𝐶𝑜 −
𝑁𝑜𝑁 ×
𝐴𝑙𝑙𝑁𝑜
𝐶𝑜
• NoN(NodeNo) :注目している語の頻度
(CollocateNo) :注目している語と共起
関係にある語の頻度
• AllNo(AllNode) :総語数
• Co(Collocate) :共起頻度 9
MI値
• 共起頻度を,その期待値で割り,さらに2を底に
した対数を取った値
• MI値も2以上で有意な組合せであるとされる。
• MI値は,低頻度の単語であっても共起関係を抽
出できるという特徴を持つ。
𝑀𝐼 = 𝑙𝑜𝑔2
𝐶𝑜 × 𝐴𝑙𝑙𝑁𝑜
𝑁𝑜𝑁 ×
• NoN(NodeNo) :注目している語の頻度
(CollocateNo) :注目している語と共起
関係にある語の頻度
• AllNo(AllNode) :総語数
• Co(Collocate) :共起頻度 10
概要
11
テキストマイニング 今後の展望
可視化LODマップ
暇ツイートLOD研究
 暇ツイートLODのスキーマイメージ
resource_i
d
schema:cr
eated_at
schema:Us
erTweets
geo:lat,
geo:long
schema:Us
erNeeds
schema:Ne
arPlaces
リソース
ID
ツイート
日
ツイート
文
位置情報 ユーザー
ニーズ
近隣施設
情報
 1行目がクラス
 2行目がプロパティ
12
 LOD可視化マップ(1)
作成したLODデータを
LODBrowserを利用し
LOD可視化マップ
に反映した結果
13
 LOD可視化マップ(2)
 渋谷駅周辺のマップ
 駅に近づくほど
ツイートは増え
 駅から遠ざかるほど
ツイートは減る
14
概要
15
テキストマイニング 今後の展望
可視化LODマップ
暇ツイートLOD研究
 テキストマイニングから
・共起度の高い単語上位3つは
1. お菓子
2. 家族
3. LINE
→家族で楽しめるお菓子カフェ
16
LOD可視化マップから
・単に駅に人が密集するため、
ツイートが多くなっているだけ
→データ量を増やし、
駅以外でツイートが多くされる場所の
特定が求められる
17
今後の課題
同様の研究がないか先行研究を進める
継続してツイートを取得する
Google Place APIとの連携
18

More Related Content

Similar to 暇ツイートLOD

Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用KAMURA
 
ATLにおけるBigDataへの取り組み
ATLにおけるBigDataへの取り組みATLにおけるBigDataへの取り組み
ATLにおけるBigDataへの取り組みRecruit Technologies
 
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみたJupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみたSatoshi Yazawa
 
LOD (Linked Open Data) の動向と今後の展望
LOD (Linked Open Data) の動向と今後の展望LOD (Linked Open Data) の動向と今後の展望
LOD (Linked Open Data) の動向と今後の展望Kouji Kozaki
 
地域デザイン×オープンデータ
地域デザイン×オープンデータ地域デザイン×オープンデータ
地域デザイン×オープンデータIwao KOBAYASHI
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Eric Sartre
 
RでTwitterテキストマイニング
RでTwitterテキストマイニングRでTwitterテキストマイニング
RでTwitterテキストマイニングYudai Shinbo
 
RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~江上 ゼミナール
 
130801_udct_05_04
130801_udct_05_04130801_udct_05_04
130801_udct_05_04CSISi
 
goパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現するgoパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現するTakuya Ueda
 
データアカデミー・エッセンス(東京)1
データアカデミー・エッセンス(東京)1データアカデミー・エッセンス(東京)1
データアカデミー・エッセンス(東京)1Hiroyuki Ichikawa
 
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイントRecruit Technologies
 
JTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun TzuJTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun Tzuirix_jp
 
Linked Dataの基本原則 -LODを公開するときに知っておきたい基本技術-
Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-
Linked Dataの基本原則 -LODを公開するときに知っておきたい基本技術-Kouji Kozaki
 

Similar to 暇ツイートLOD (18)

Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用
 
ATLにおけるBigDataへの取り組み
ATLにおけるBigDataへの取り組みATLにおけるBigDataへの取り組み
ATLにおけるBigDataへの取り組み
 
Trat_sprint5
Trat_sprint5Trat_sprint5
Trat_sprint5
 
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみたJupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
 
クイズ#ツイタレア
クイズ#ツイタレアクイズ#ツイタレア
クイズ#ツイタレア
 
LOD (Linked Open Data) の動向と今後の展望
LOD (Linked Open Data) の動向と今後の展望LOD (Linked Open Data) の動向と今後の展望
LOD (Linked Open Data) の動向と今後の展望
 
地域デザイン×オープンデータ
地域デザイン×オープンデータ地域デザイン×オープンデータ
地域デザイン×オープンデータ
 
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
 
RでTwitterテキストマイニング
RでTwitterテキストマイニングRでTwitterテキストマイニング
RでTwitterテキストマイニング
 
RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~
 
130801_udct_05_04
130801_udct_05_04130801_udct_05_04
130801_udct_05_04
 
goパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現するgoパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現する
 
データアカデミー・エッセンス(東京)1
データアカデミー・エッセンス(東京)1データアカデミー・エッセンス(東京)1
データアカデミー・エッセンス(東京)1
 
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
 
最終報告会
最終報告会最終報告会
最終報告会
 
JTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun TzuJTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun Tzu
 
Linked Dataの基本原則 -LODを公開するときに知っておきたい基本技術-
Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-
Linked Dataの基本原則 -LODを公開するときに知っておきたい基本技術-
 
Trat_sprint1
Trat_sprint1Trat_sprint1
Trat_sprint1
 

暇ツイートLOD