Submit Search
Upload
text_mining_with_R
•
Download as PPTX, PDF
•
0 likes
•
629 views
亮
亮介 藤巻
Follow
社内発表用の資料
Read less
Read more
Engineering
Report
Share
Report
Share
1 of 21
Download now
Recommended
リア充コート
リア充コート
Hikaru Sugiura
RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~
江上 ゼミナール
Collecting corpus
Collecting corpus
Atsushi Hayakawa
20130727 cv machine_learning@tokyo webmining
20130727 cv machine_learning@tokyo webmining
Masahiro Imai
Hiroshimar3_rmecab
Hiroshimar3_rmecab
SAKAUE, Tatsuya
Uec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみた
Atsushi Hayakawa
あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~
あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~
antibayesian 俺がS式だ
Rによるテキストマイニングの一例
Rによるテキストマイニングの一例
LINE Corp.
Recommended
リア充コート
リア充コート
Hikaru Sugiura
RでTwitterテキストマイニング~スターバックス~
RでTwitterテキストマイニング~スターバックス~
江上 ゼミナール
Collecting corpus
Collecting corpus
Atsushi Hayakawa
20130727 cv machine_learning@tokyo webmining
20130727 cv machine_learning@tokyo webmining
Masahiro Imai
Hiroshimar3_rmecab
Hiroshimar3_rmecab
SAKAUE, Tatsuya
Uec.R#3 YjdnJlpを使ってみた
Uec.R#3 YjdnJlpを使ってみた
Atsushi Hayakawa
あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~
あんちべのすべらない話~俺のツイートがこんなにウケないはずがない~
antibayesian 俺がS式だ
Rによるテキストマイニングの一例
Rによるテキストマイニングの一例
LINE Corp.
Apache Mahout - Random Forests - #TokyoWebmining #8
Apache Mahout - Random Forests - #TokyoWebmining #8
Koichi Hamada
Introduction of RMeCab
Introduction of RMeCab
Atsushi Hayakawa
RでTwitterテキストマイニング
RでTwitterテキストマイニング
Yudai Shinbo
Sakuteki02 yokkuns
Sakuteki02 yokkuns
Yohei Sato
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
20161029 TVI Tokyowebmining Seminar for Share
20161029 TVI Tokyowebmining Seminar for Share
Yasushi Gunya
西野カナの歌詞をテキストマイニング
西野カナの歌詞をテキストマイニング
江上 ゼミナール
20130727 ソシャゲkpi分析 tokyowebmining28_izawa_up
20130727 ソシャゲkpi分析 tokyowebmining28_izawa_up
正志 井澤
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
Shota Yasui
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
Koichi Hamada
さくっとはじめるテキストマイニング(R言語) スタートアップ編
さくっとはじめるテキストマイニング(R言語) スタートアップ編
Yutaka Shimada
R による文書分類入門
R による文書分類入門
Takeshi Arabiki
More Related Content
Viewers also liked
Apache Mahout - Random Forests - #TokyoWebmining #8
Apache Mahout - Random Forests - #TokyoWebmining #8
Koichi Hamada
Introduction of RMeCab
Introduction of RMeCab
Atsushi Hayakawa
RでTwitterテキストマイニング
RでTwitterテキストマイニング
Yudai Shinbo
Sakuteki02 yokkuns
Sakuteki02 yokkuns
Yohei Sato
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
antibayesian 俺がS式だ
20161029 TVI Tokyowebmining Seminar for Share
20161029 TVI Tokyowebmining Seminar for Share
Yasushi Gunya
西野カナの歌詞をテキストマイニング
西野カナの歌詞をテキストマイニング
江上 ゼミナール
20130727 ソシャゲkpi分析 tokyowebmining28_izawa_up
20130727 ソシャゲkpi分析 tokyowebmining28_izawa_up
正志 井澤
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
Shota Yasui
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
Koichi Hamada
さくっとはじめるテキストマイニング(R言語) スタートアップ編
さくっとはじめるテキストマイニング(R言語) スタートアップ編
Yutaka Shimada
R による文書分類入門
R による文書分類入門
Takeshi Arabiki
Viewers also liked
(12)
Apache Mahout - Random Forests - #TokyoWebmining #8
Apache Mahout - Random Forests - #TokyoWebmining #8
Introduction of RMeCab
Introduction of RMeCab
RでTwitterテキストマイニング
RでTwitterテキストマイニング
Sakuteki02 yokkuns
Sakuteki02 yokkuns
さくさくテキストマイニング入門セッション
さくさくテキストマイニング入門セッション
20161029 TVI Tokyowebmining Seminar for Share
20161029 TVI Tokyowebmining Seminar for Share
西野カナの歌詞をテキストマイニング
西野カナの歌詞をテキストマイニング
20130727 ソシャゲkpi分析 tokyowebmining28_izawa_up
20130727 ソシャゲkpi分析 tokyowebmining28_izawa_up
計量経済学と 機械学習の交差点入り口 (公開用)
計量経済学と 機械学習の交差点入り口 (公開用)
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
オープニングトーク - 創設の思い・目的・進行方針 -データマイニング+WEB勉強会@東京
さくっとはじめるテキストマイニング(R言語) スタートアップ編
さくっとはじめるテキストマイニング(R言語) スタートアップ編
R による文書分類入門
R による文書分類入門
text_mining_with_R
1.
テキストマイニング with R 2014/12/26 株式会社クインテット
藤巻 亮介
2.
さて、この作品はなんでしょう? 2
3.
じゃあ、この作品は? 3
4.
最初のスライドは太宰治の”走れメロス”を、 2枚目のスライドは夏目漱石の”こころ”を それぞれ形態素解析したものである 4
5.
形態素解析って? 5
6.
文を形態素という最小の意味(単語)に分割し、 各形態素を原型に復元し、品詞を付与する処理 6 「今日のLTはめちゃくちゃ緊張するぜ!」 ↓ 「今日 / の
/ LT / は / めちゃくちゃ / 緊張 / する / ぜ / !」 「名詞」 「助詞」「名詞」「助詞」 「名詞」 「名詞」 「動詞」 「助詞」「名詞」
7.
形態素解析はテキスト マイニングの第一歩です! 7
8.
ん、テキストマイニング? 8
9.
テキストマイニングとは? 9 ● 定型化されていないテキストを自然言語解析し、統 計学、機械学習を用いて有用な情報を取り出すため の技術の総称 ● ブログや掲示板など定型化されていないものを対象 とするため、分析できるデータの範囲が広い
10.
プログラムで実装してみよう! 10
11.
11 でやりま す!
12.
● 統計解析用のプログラミング言語 ● オープンソース・フリーソフトウェア ●
優れたグラフィックス機能を持つので、データの視覚 化が素晴らしい! ● 様々なパッケージが公開されている! 12 とは?
13.
計算得意! 13
14.
作図も一瞬! > plot(UKgas) 14
15.
形態素解析してみる ● 単純に形態素解析をかけただけ なので、様々なノイズが乗って いる状態 ● 出てくる頻度(Freq)でソートした ほうがよさそう 15
16.
形態素解析してみる ● やっぱり、文を区切る句読点と、 助詞が多い。 ● けど、解析する上でそのふたつ はいらなくない? ●
とりあえず名詞だけ抽出してみ よう 16
17.
形態素解析してみる ● 名詞だけ抜き取ると、この単語 だけで何の作品か分かる人には 分かるっぽいな! 17
18.
まとめ テキストマイニングの流れは次のようにまとめられる 1. 自然言語処理によって、テキストを解析する 2. データをクリーニングする 3.
データを要約する 4. 統計的なアプローチによりデータをマイニングする 5. 結果を検証し、評価する 18
19.
まとめ テキストマイニングの流れは次のようにまとめられる 1. 自然言語処理によって、テキストを解析する 2. データをクリーニングする 3.
データを要約する 4. 統計的なアプローチによりデータをマイニングする 5. 結果を検証し、評価する 19 今回はここだけRでやってみました!
20.
今後の展望 口コミ広場の投稿評価(サクラかどうか)などを自動的に 判別できるようなものに発展させられればと思っています 20
21.
21 終わり
Download now