SlideShare a Scribd company logo
1 of 24
インターン最終発表 大野健太
目次 自己紹介 テーマ1:twitterの引用関係の抽出 テーマ2:twitterの盛り上がり検出
自己紹介 大野健太 数学専攻 修士2年 専門:微分幾何学、共形幾何学 メンター 岡野原さん、西川さん プログラミング関係 中学時代:Basic, C言語 高校時代:VHDL インターン期間:Haskellを知る
勉強しました・・・
目次 自己紹介 テーマ1:twitterの引用関係の抽出 テーマ2:twitterの盛り上がり検出
テーマ1:twitterの引用関係の抽出 背景 日本での普及 ⇔ 関連研究が少ない 自然発生的に議論が起こる 社会的な事件の反応が多く現れる これらの自動的抽出が目標
引用の種類 公式RT 非公式RT(RT・・・、QT・・・、@・・・) 暗黙の言及
予備実験:特異値分解でグループ分け 実係数m×n行列AはA=UΣV*の形で書かれる。ここで、 U:m次正方直交行列 Σ:m×n行列、非負対角行列 Σの各成分を特異値という V:n次正方直交行列 特異値の集合はpermutationを除いて一意 参考:Web DB Press vol.49 「パターン認識と機械学習 - ベイズ理論による統計的予測」(上下)シュプリンガージャパン
予備実験:特異値分解でのグループ分け 特異値の分布(Rank1000の対角行列で近似) 特異値 特異値の順位
構成図 crawling log file Query Using Message Pack RPC
Extractor -> logtterの受け渡し  DOT言語 ・DOT言語形式 ・MessagePackRPC を用いて通信
発言抽出方法 (ex.中華)
デモ
まとめ Gather+Streamerが作ったTwitterのログファイルから、グラフを抽出し、logtterに投げるプログラムを作成した。
特異値分解のグループ分けへの応用 Σ=diag(s1, s2,・・・, sn)  (s1≧s2≧・・・≧sn) に対し、 Σ’=diag(s1, s2,・・, sm,0,0・・) とおくと、 M’=UΣ’V* はrank mの行列の中でMとの二乗誤差が最小となる行列である
目次 自己紹介 テーマ1:twitterの引用関係の抽出 テーマ2:twitterの盛り上がり検出
テーマ2:twitterでの盛り上がり検出 盛り上がりの例 ・2人の間の論争 ・ある事件に対して多くの人が反応 ・事件の顛末を少数の人が解説
今回行った手法 (1) 盛りあがっているキーワードを見つける (2) extractorにそのキーワードを投げる (3) logtterでグラフを加工する crawling JSON files Send DOT files  by Message Pack RPC
盛り上がりの定量化
盛り上がりの定量化 あるキーワードのある日にち(D)でのスコアを以下のように定義する キーワードを含む発言の数をカウント 同様のことを過去数日間で行い、平均を求める Dでのカウント数をC,数日の平均をAveとしたとき、スコアを(C - Ave)/Aveとする ただしAveが特定の値以下のときはスコアを0とする
盛りあがりの定量化 K := {k1,k2,…,kn}      :キーワードの集合 D := {…,d1,d2,d3,…}  :日付の集合 T := {t1,t2,…,tm}       :発言の集合 PK : T -> 2K  ,PD: T -> 2D  Ki := {t∈T | PK(t)∋ki} ,Dj:= {t∈T | PD(t)∋dj}   T = ∪i=1,…,nKi = Цj=…,1,2,…Dj c : K × D -> N c(ki,dj):=♯{t∈T | t∈Ki∩Dj} b : K × D -> R≧0 b(ki,dj):= (c(ki,dj) - Σp=0,…,Mc(ki,dj-p)/M)/c(ki,dj)  (if c(ki,dj) ≧ N)               0                                     (otherwise) Where N,M are some constants
デモ 実験データ:9月27日~29日、18:00~19:00 発言数    :約30万件/hour キーワード 種類     :約40万種類 出現数    :のべ約2万/hour
9月29日 「地震」が盛り上がる
キーワード抽出実行結果

More Related Content

More from Kenta Oono

Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...
Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...
Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...Kenta Oono
 
Deep learning for molecules, introduction to chainer chemistry
Deep learning for molecules, introduction to chainer chemistryDeep learning for molecules, introduction to chainer chemistry
Deep learning for molecules, introduction to chainer chemistryKenta Oono
 
Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017
Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017
Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017Kenta Oono
 
Comparison of deep learning frameworks from a viewpoint of double backpropaga...
Comparison of deep learning frameworks from a viewpoint of double backpropaga...Comparison of deep learning frameworks from a viewpoint of double backpropaga...
Comparison of deep learning frameworks from a viewpoint of double backpropaga...Kenta Oono
 
深層学習フレームワーク概要とChainerの事例紹介
深層学習フレームワーク概要とChainerの事例紹介深層学習フレームワーク概要とChainerの事例紹介
深層学習フレームワーク概要とChainerの事例紹介Kenta Oono
 
20170422 数学カフェ Part2
20170422 数学カフェ Part220170422 数学カフェ Part2
20170422 数学カフェ Part2Kenta Oono
 
20170422 数学カフェ Part1
20170422 数学カフェ Part120170422 数学カフェ Part1
20170422 数学カフェ Part1Kenta Oono
 
情報幾何学の基礎、第7章発表ノート
情報幾何学の基礎、第7章発表ノート情報幾何学の基礎、第7章発表ノート
情報幾何学の基礎、第7章発表ノートKenta Oono
 
GTC Japan 2016 Chainer feature introduction
GTC Japan 2016 Chainer feature introductionGTC Japan 2016 Chainer feature introduction
GTC Japan 2016 Chainer feature introductionKenta Oono
 
On the benchmark of Chainer
On the benchmark of ChainerOn the benchmark of Chainer
On the benchmark of ChainerKenta Oono
 
Tokyo Webmining Talk1
Tokyo Webmining Talk1Tokyo Webmining Talk1
Tokyo Webmining Talk1Kenta Oono
 
VAE-type Deep Generative Models
VAE-type Deep Generative ModelsVAE-type Deep Generative Models
VAE-type Deep Generative ModelsKenta Oono
 
Common Design of Deep Learning Frameworks
Common Design of Deep Learning FrameworksCommon Design of Deep Learning Frameworks
Common Design of Deep Learning FrameworksKenta Oono
 
Introduction to Chainer and CuPy
Introduction to Chainer and CuPyIntroduction to Chainer and CuPy
Introduction to Chainer and CuPyKenta Oono
 
Stochastic Gradient MCMC
Stochastic Gradient MCMCStochastic Gradient MCMC
Stochastic Gradient MCMCKenta Oono
 
Chainer Contribution Guide
Chainer Contribution GuideChainer Contribution Guide
Chainer Contribution GuideKenta Oono
 
2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用
2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用 2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用
2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用 Kenta Oono
 
Introduction to Chainer (LL Ring Recursive)
Introduction to Chainer (LL Ring Recursive)Introduction to Chainer (LL Ring Recursive)
Introduction to Chainer (LL Ring Recursive)Kenta Oono
 
日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料
日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料
日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料Kenta Oono
 
提供AMIについて
提供AMIについて提供AMIについて
提供AMIについてKenta Oono
 

More from Kenta Oono (20)

Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...
Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...
Minimax statistical learning with Wasserstein distances (NeurIPS2018 Reading ...
 
Deep learning for molecules, introduction to chainer chemistry
Deep learning for molecules, introduction to chainer chemistryDeep learning for molecules, introduction to chainer chemistry
Deep learning for molecules, introduction to chainer chemistry
 
Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017
Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017
Overview of Machine Learning for Molecules and Materials Workshop @ NIPS2017
 
Comparison of deep learning frameworks from a viewpoint of double backpropaga...
Comparison of deep learning frameworks from a viewpoint of double backpropaga...Comparison of deep learning frameworks from a viewpoint of double backpropaga...
Comparison of deep learning frameworks from a viewpoint of double backpropaga...
 
深層学習フレームワーク概要とChainerの事例紹介
深層学習フレームワーク概要とChainerの事例紹介深層学習フレームワーク概要とChainerの事例紹介
深層学習フレームワーク概要とChainerの事例紹介
 
20170422 数学カフェ Part2
20170422 数学カフェ Part220170422 数学カフェ Part2
20170422 数学カフェ Part2
 
20170422 数学カフェ Part1
20170422 数学カフェ Part120170422 数学カフェ Part1
20170422 数学カフェ Part1
 
情報幾何学の基礎、第7章発表ノート
情報幾何学の基礎、第7章発表ノート情報幾何学の基礎、第7章発表ノート
情報幾何学の基礎、第7章発表ノート
 
GTC Japan 2016 Chainer feature introduction
GTC Japan 2016 Chainer feature introductionGTC Japan 2016 Chainer feature introduction
GTC Japan 2016 Chainer feature introduction
 
On the benchmark of Chainer
On the benchmark of ChainerOn the benchmark of Chainer
On the benchmark of Chainer
 
Tokyo Webmining Talk1
Tokyo Webmining Talk1Tokyo Webmining Talk1
Tokyo Webmining Talk1
 
VAE-type Deep Generative Models
VAE-type Deep Generative ModelsVAE-type Deep Generative Models
VAE-type Deep Generative Models
 
Common Design of Deep Learning Frameworks
Common Design of Deep Learning FrameworksCommon Design of Deep Learning Frameworks
Common Design of Deep Learning Frameworks
 
Introduction to Chainer and CuPy
Introduction to Chainer and CuPyIntroduction to Chainer and CuPy
Introduction to Chainer and CuPy
 
Stochastic Gradient MCMC
Stochastic Gradient MCMCStochastic Gradient MCMC
Stochastic Gradient MCMC
 
Chainer Contribution Guide
Chainer Contribution GuideChainer Contribution Guide
Chainer Contribution Guide
 
2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用
2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用 2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用
2015年9月18日 (GTC Japan 2015) 深層学習フレームワークChainerの導入と化合物活性予測への応用
 
Introduction to Chainer (LL Ring Recursive)
Introduction to Chainer (LL Ring Recursive)Introduction to Chainer (LL Ring Recursive)
Introduction to Chainer (LL Ring Recursive)
 
日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料
日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料
日本神経回路学会セミナー「DeepLearningを使ってみよう!」資料
 
提供AMIについて
提供AMIについて提供AMIについて
提供AMIについて
 

PFI final presentation