Submit Search
Upload
暇ツイートLOD
•
Download as PPTX, PDF
•
0 likes
•
355 views
Y
yuki1204
Follow
暇ツイートLOD スライド
Read less
Read more
Data & Analytics
Report
Share
Report
Share
1 of 18
Download now
Recommended
暇ツイートLOD
暇ツイートLOD
techan555
20130816infotalk odcライセンス導入事例紹介
20130816infotalk odcライセンス導入事例紹介
Shu Higashi
論文サーベイと管理のしかたについて
論文サーベイと管理のしかたについて
T-test
Rから利用するオープンデータAPI
Rから利用するオープンデータAPI
s3works
研究活動におけるTwitter活用法
研究活動におけるTwitter活用法
Hiroshi Unzai
PyAutoGUI等Pythonライブラリによる自動化支援
PyAutoGUI等Pythonライブラリによる自動化支援
H Iseri
NIPS2013読み会: Distributed Representations of Words and Phrases and their Compo...
NIPS2013読み会: Distributed Representations of Words and Phrases and their Compo...
Yuya Unno
Meta-Learning with Memory Augmented Neural Network
Meta-Learning with Memory Augmented Neural Network
Yusuke Watanabe
Recommended
暇ツイートLOD
暇ツイートLOD
techan555
20130816infotalk odcライセンス導入事例紹介
20130816infotalk odcライセンス導入事例紹介
Shu Higashi
論文サーベイと管理のしかたについて
論文サーベイと管理のしかたについて
T-test
Rから利用するオープンデータAPI
Rから利用するオープンデータAPI
s3works
研究活動におけるTwitter活用法
研究活動におけるTwitter活用法
Hiroshi Unzai
PyAutoGUI等Pythonライブラリによる自動化支援
PyAutoGUI等Pythonライブラリによる自動化支援
H Iseri
NIPS2013読み会: Distributed Representations of Words and Phrases and their Compo...
NIPS2013読み会: Distributed Representations of Words and Phrases and their Compo...
Yuya Unno
Meta-Learning with Memory Augmented Neural Network
Meta-Learning with Memory Augmented Neural Network
Yusuke Watanabe
Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用
KAMURA
ATLにおけるBigDataへの取り組み
ATLにおけるBigDataへの取り組み
Recruit Technologies
Trat_sprint5
Trat_sprint5
tratwakate
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Satoshi Yazawa
クイズ#ツイタレア
クイズ#ツイタレア
Tomoyuki Matsuura
LOD (Linked Open Data) の動向と今後の展望
LOD (Linked Open Data) の動向と今後の展望
Kouji Kozaki
地域デザイン×オープンデータ
地域デザイン×オープンデータ
Iwao KOBAYASHI
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Eric Sartre
RでTwitterテキストマイニング
RでTwitterテキストマイニング
Yudai Shinbo
RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~
江上 ゼミナール
130801_udct_05_04
130801_udct_05_04
CSISi
goパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現する
Takuya Ueda
データアカデミー・エッセンス(東京)1
データアカデミー・エッセンス(東京)1
Hiroyuki Ichikawa
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
Recruit Technologies
最終報告会
最終報告会
Kazuhiro Ikeda
JTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun Tzu
irix_jp
Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-
Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-
Kouji Kozaki
Trat_sprint1
Trat_sprint1
tratwakate
More Related Content
Similar to 暇ツイートLOD
Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用
KAMURA
ATLにおけるBigDataへの取り組み
ATLにおけるBigDataへの取り組み
Recruit Technologies
Trat_sprint5
Trat_sprint5
tratwakate
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Satoshi Yazawa
クイズ#ツイタレア
クイズ#ツイタレア
Tomoyuki Matsuura
LOD (Linked Open Data) の動向と今後の展望
LOD (Linked Open Data) の動向と今後の展望
Kouji Kozaki
地域デザイン×オープンデータ
地域デザイン×オープンデータ
Iwao KOBAYASHI
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Eric Sartre
RでTwitterテキストマイニング
RでTwitterテキストマイニング
Yudai Shinbo
RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~
江上 ゼミナール
130801_udct_05_04
130801_udct_05_04
CSISi
goパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現する
Takuya Ueda
データアカデミー・エッセンス(東京)1
データアカデミー・エッセンス(東京)1
Hiroyuki Ichikawa
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
Recruit Technologies
最終報告会
最終報告会
Kazuhiro Ikeda
JTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun Tzu
irix_jp
Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-
Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-
Kouji Kozaki
Trat_sprint1
Trat_sprint1
tratwakate
Similar to 暇ツイートLOD
(18)
Linked Open Dataの基礎と これからの情報活用
Linked Open Dataの基礎と これからの情報活用
ATLにおけるBigDataへの取り組み
ATLにおけるBigDataへの取り組み
Trat_sprint5
Trat_sprint5
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
Jupyterで手順再現!Elasticsearch構築・運用を実行可能ドキュメントで機械化してみた
クイズ#ツイタレア
クイズ#ツイタレア
LOD (Linked Open Data) の動向と今後の展望
LOD (Linked Open Data) の動向と今後の展望
地域デザイン×オープンデータ
地域デザイン×オープンデータ
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
Twitterにおける即時話題推定技術「どたばたかいぎ」の開発
RでTwitterテキストマイニング
RでTwitterテキストマイニング
RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~
130801_udct_05_04
130801_udct_05_04
goパッケージで型情報を用いたソースコード検索を実現する
goパッケージで型情報を用いたソースコード検索を実現する
データアカデミー・エッセンス(東京)1
データアカデミー・エッセンス(東京)1
研究を基にしたオープンソース開発チェックポイント
研究を基にしたオープンソース開発チェックポイント
最終報告会
最終報告会
JTF2016 The strategy and Sun Tzu
JTF2016 The strategy and Sun Tzu
Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-
Linked Dataの基本原則-LODを公開するときに知っておきたい基本技術-
Trat_sprint1
Trat_sprint1
暇ツイートLOD
1.
暇ツイートLOD 1 全18枚
2.
概要 2 テキストマイニング 今後の展望 可視化LODマップ 暇ツイートLOD研究
3.
研究テーマ「 暇ツイートLOD」概要 Twitterで「暇」と単語が入ったツイー トを分析, ユーザーニーズを視覚的にわかるよう にし, マーケティングに応用する方法 3
4.
研究に使うツール Twitter API →ツイートの取得に使用 SparqlEPCU (http://bit.ly/1UYtVDc) →csvデータのLOD化に使用 LOD
Browser (http://bit.ly/1UYtMjg) →LODデータの可視化に使用 4
5.
先行研究調査 CiNii(http://ci.nii.ac.jp/) GoogleScholar(https://scholar.google.co.jp/) で同様の研究は見つからなかった → 新規性のある研究と言える 5
6.
収集したデータ量 収集したツイート総数が 348,027件 ・テキストマイニングに利用できるツイート → 291,439件 ・可視化マップに利用できるツイート →
7,594件 6
7.
概要 7 テキストマイニング 今後の展望 可視化LODマップ 暇ツイートLOD研究
8.
暇ツイートをテキストマイニング ツイートから形態素のbigramを抽出し,
T値とMI値を用いて,「暇」と共起度が高い 形態素を抽出して消費者ニーズを分析 簡単なテキストマイニングを行った結果、 マーケティングにつながる言葉は「お菓子」 であった。 8
9.
T値 • 共起頻度を,総語数や期待度数で調整した値 • Tスコアが2以上になると有意な組合せであると される。 𝑇
= 𝐶𝑜 − 𝑁𝑜𝑁 × 𝐴𝑙𝑙𝑁𝑜 𝐶𝑜 • NoN(NodeNo) :注目している語の頻度 (CollocateNo) :注目している語と共起 関係にある語の頻度 • AllNo(AllNode) :総語数 • Co(Collocate) :共起頻度 9
10.
MI値 • 共起頻度を,その期待値で割り,さらに2を底に した対数を取った値 • MI値も2以上で有意な組合せであるとされる。 •
MI値は,低頻度の単語であっても共起関係を抽 出できるという特徴を持つ。 𝑀𝐼 = 𝑙𝑜𝑔2 𝐶𝑜 × 𝐴𝑙𝑙𝑁𝑜 𝑁𝑜𝑁 × • NoN(NodeNo) :注目している語の頻度 (CollocateNo) :注目している語と共起 関係にある語の頻度 • AllNo(AllNode) :総語数 • Co(Collocate) :共起頻度 10
11.
概要 11 テキストマイニング 今後の展望 可視化LODマップ 暇ツイートLOD研究
12.
暇ツイートLODのスキーマイメージ resource_i d schema:cr eated_at schema:Us erTweets geo:lat, geo:long schema:Us erNeeds schema:Ne arPlaces リソース ID ツイート 日 ツイート 文 位置情報 ユーザー ニーズ 近隣施設 情報
1行目がクラス 2行目がプロパティ 12
13.
LOD可視化マップ(1) 作成したLODデータを LODBrowserを利用し LOD可視化マップ に反映した結果 13
14.
LOD可視化マップ(2) 渋谷駅周辺のマップ
駅に近づくほど ツイートは増え 駅から遠ざかるほど ツイートは減る 14
15.
概要 15 テキストマイニング 今後の展望 可視化LODマップ 暇ツイートLOD研究
16.
テキストマイニングから ・共起度の高い単語上位3つは 1. お菓子 2.
家族 3. LINE →家族で楽しめるお菓子カフェ 16
17.
LOD可視化マップから ・単に駅に人が密集するため、 ツイートが多くなっているだけ →データ量を増やし、 駅以外でツイートが多くされる場所の 特定が求められる 17
18.
今後の課題 同様の研究がないか先行研究を進める 継続してツイートを取得する Google Place APIとの連携 18
Download now