リアルタイム形態素解析
morph-websocket
chezou
13年9月25日水曜日
Who?
• @chezou
• Web系エンジニア
• Railsを使って新機能を作ったりとか
• 前職では自然言語処理を使った研究開発やって
ました
13年9月25日水曜日
形態素解析とは
• 文字列を形態素(単語)の
単位に分割して、品詞を
推定する基本的なテキ
スト解析
• MeCabが有名
裏庭	

 名詞,一般,*,*,*,*,裏庭,ウラニワ,ウラニワ
に	

 助詞,格助詞,一般,*,*,*,に,ニ,ニ
...
http://www.phontron.com/kytea/index-ja.html
13年9月25日水曜日
Kytea
• @neubigさん作の形態素解析器
• 部分アノテーションで学習できる
• マッシュルーム★アンチョビ/ガーリック
• 未知語の読み推定もできる!
13年9月25日水曜日
morph-websocket
• WebSocket + Kyteaでリアルタイム形態素解析
• KyteaをSWIGでbinding (MyKytea-ruby/python)
• NLTK本にあるがPythonからは使えなかった
• em...
デモ
13年9月25日水曜日
Upcoming SlideShare
Loading in...5
×

リアルタイム形態素解析 morph-websocket / kawasaki.rb #004

1,112

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,112
On Slideshare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
2
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

リアルタイム形態素解析 morph-websocket / kawasaki.rb #004

  1. 1. リアルタイム形態素解析 morph-websocket chezou 13年9月25日水曜日
  2. 2. Who? • @chezou • Web系エンジニア • Railsを使って新機能を作ったりとか • 前職では自然言語処理を使った研究開発やって ました 13年9月25日水曜日
  3. 3. 形態素解析とは • 文字列を形態素(単語)の 単位に分割して、品詞を 推定する基本的なテキ スト解析 • MeCabが有名 裏庭 名詞,一般,*,*,*,*,裏庭,ウラニワ,ウラニワ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 二 名詞,数,*,*,*,*,二,ニ,ニ 羽 名詞,接尾,助数詞,*,*,*,羽,ワ,ワ 鶏 名詞,一般,*,*,*,*,鶏,ニワトリ,ニワトリ が 助詞,格助詞,一般,*,*,*,が,ガ,ガ いる 動詞,自立,*,*,一段,基本形,いる,イル,イ ル EOS 13年9月25日水曜日
  4. 4. http://www.phontron.com/kytea/index-ja.html 13年9月25日水曜日
  5. 5. Kytea • @neubigさん作の形態素解析器 • 部分アノテーションで学習できる • マッシュルーム★アンチョビ/ガーリック • 未知語の読み推定もできる! 13年9月25日水曜日
  6. 6. morph-websocket • WebSocket + Kyteaでリアルタイム形態素解析 • KyteaをSWIGでbinding (MyKytea-ruby/python) • NLTK本にあるがPythonからは使えなかった • em-websocketでサーバ側の処理 13年9月25日水曜日
  7. 7. デモ 13年9月25日水曜日
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×