More Related Content
Similar to Introduction of RMeCab
Similar to Introduction of RMeCab (20)
More from Atsushi Hayakawa
More from Atsushi Hayakawa (20)
Introduction of RMeCab
- 3. ● 学祭でジャンク
市をやったり、
● 合宿で花火を打
ち上げたりして
ます。
- 4. ● 富士山に登ったり、
● 部誌を書いたり、
● 2011年度 S-PLUS学
生研究奨励賞で特別
賞を頂いたり、
● DBCLSでバイトしたり、
してます。
- 9. 形態素解析
> rlt <- RMeCabC("お腹が空いた",0)
> unlist(rlt)
名詞 助詞 動詞 助動詞
"お腹" "が" "空い" "た"
> rlt <- RMeCabC("お腹が空いた",1)
> unlist(rlt)
名詞 助詞 動詞 助動詞
"お腹" "が" "空く" "た"
- 10. ターム・文書行列をつくる
> novel <- docMatrix("novel",c("名詞","形容詞"))
> novel[4:15,]
docs
terms bocchan_NATUME hana_AKUTAGAWA kokoro_NATUME
[[LESS-THAN-1]] 0 0 0
[[TOTAL-TOKENS]] 12492 1646 34937
am 1 0 0
glad 1 0 0
see 1 0 0
to 1 0 0
you 1 0 0
?—— 1 0 0
あいつ 5 0 0
あした 1 0 0
あすこ 3 0 2
あそこ 1 0 0
- 11. ターム・文書行列をつくる
docMatrixの引数
minFreq=n:n回以上出現するタームを出力
kigo=1:記号を総語数にカウントする
weight:重み付け “tf*idf,”tf*idf*norm”
dic:ユーザー辞書の指定
co:共起語の行列を作る
などなど・・・
- 12. 参考
Rによるテキストマイニング入門
著:石田 基広
出版社:森北出版株式会社
RとLinuxと・・・
http://rmecab.jp/wiki/index.php?RMeCab