Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Kensuke Mitsuzawa
PPTX, PDF
1,242 views
形態素解析器の比較できるPythonパッケージつくった話
Package is available at https://pypi.python.org/pypi/JapaneseTokenizer
Data & Analytics
◦
Read more
1
Save
Share
Embed
Embed presentation
Download
Download to read offline
1
/ 18
2
/ 18
3
/ 18
4
/ 18
5
/ 18
6
/ 18
7
/ 18
8
/ 18
9
/ 18
10
/ 18
11
/ 18
12
/ 18
13
/ 18
14
/ 18
15
/ 18
16
/ 18
17
/ 18
18
/ 18
More Related Content
PDF
サポーターズ勉強会スライド 2018/2/27
by
Kensuke Mitsuzawa
PPTX
fastTextの実装を見てみた
by
Yoshihiko Shiraki
PDF
mecab-ipadic-NEologd の効果的な使い方
by
Toshinori Sato
PPTX
サポーターズ勉強会スライド
by
Kensuke Mitsuzawa
PDF
Pythonによる黒魔術入門
by
大樹 小倉
PPT
Smalltalk との比較で深まる Citrine の理解
by
TAKANO Mitsuhiro
PDF
bottle.pyをつかったチャットアプリ作成チュートリアル
by
Satoshi Yamada
PDF
運用で爆発四散しないためのメタプログラミングとの付き合い方
by
Yuki Ishikawa
サポーターズ勉強会スライド 2018/2/27
by
Kensuke Mitsuzawa
fastTextの実装を見てみた
by
Yoshihiko Shiraki
mecab-ipadic-NEologd の効果的な使い方
by
Toshinori Sato
サポーターズ勉強会スライド
by
Kensuke Mitsuzawa
Pythonによる黒魔術入門
by
大樹 小倉
Smalltalk との比較で深まる Citrine の理解
by
TAKANO Mitsuhiro
bottle.pyをつかったチャットアプリ作成チュートリアル
by
Satoshi Yamada
運用で爆発四散しないためのメタプログラミングとの付き合い方
by
Yuki Ishikawa
What's hot
PDF
モジュールの凝集度・結合度・インタフェース
by
Hajime Yanagawa
PDF
今さらながらRSpecに入門してみた
by
zaru sakuraba
PDF
pythonでemlファイルを扱う話
by
Satoshi Yamada
PDF
10年続いているwebサービスの画像サーバをノーメンテでftpサーバからs3互換のストレージサーバに移行している話
by
Masataka Kono
PPTX
XMPPクライアント・プログラミング
by
隆行 神戸
PDF
Laravelのeloquent だけ入れた話
by
Masataka Kono
PPTX
JMeterをWebでしか設定できないサーバの設定自動化に使う
by
隆行 神戸
PPTX
小学生3年生から使えるRubyのビジュアルプログラミングエディタ「スモウルビー」と、それを活用した任意団体「Rubyプログラミング少年団」[第7回フクオカ...
by
宏治 高尾
PPTX
テンプレート・エンジンVelocity
by
隆行 神戸
PPTX
本当のオブジェクト指向は可読性を上げる
by
Wataru Terada
PDF
クイズ・Python勝ち抜きバトル pycon jp_2017
by
Motohiro Ueki
PDF
PHPカンファレンス2013 今ドキのPHPの書き方 ~PHP逆引きレシピ改訂版~
by
Yuta Sakurai
PDF
Android道第1回公開用
by
Takaya Funabiki
PDF
Generating word clouds in python
by
AyakaHonda1
PDF
ゴールデンウィークに最適な学習コンテンツ
by
Yusuke Ando
PDF
Rubyist started to learn Groovy - things important to leran new LL
by
Uchio Kondo
PPTX
ジーノ先生の文系的オブジェクト指向(1) - ジーノ誕生
by
Satoru Kodaira
PDF
Requestsで始める5分前帰社
by
Satoshi Yamada
PDF
ぼくたちRubyプログラミング少年団!~小・中学生向けプログラミング言語Rubyの学習塾の運営、学習教材の開発・販売事業~
by
宏治 高尾
PPTX
TypeScriptからひも解く方向性
by
echigoya-jp
モジュールの凝集度・結合度・インタフェース
by
Hajime Yanagawa
今さらながらRSpecに入門してみた
by
zaru sakuraba
pythonでemlファイルを扱う話
by
Satoshi Yamada
10年続いているwebサービスの画像サーバをノーメンテでftpサーバからs3互換のストレージサーバに移行している話
by
Masataka Kono
XMPPクライアント・プログラミング
by
隆行 神戸
Laravelのeloquent だけ入れた話
by
Masataka Kono
JMeterをWebでしか設定できないサーバの設定自動化に使う
by
隆行 神戸
小学生3年生から使えるRubyのビジュアルプログラミングエディタ「スモウルビー」と、それを活用した任意団体「Rubyプログラミング少年団」[第7回フクオカ...
by
宏治 高尾
テンプレート・エンジンVelocity
by
隆行 神戸
本当のオブジェクト指向は可読性を上げる
by
Wataru Terada
クイズ・Python勝ち抜きバトル pycon jp_2017
by
Motohiro Ueki
PHPカンファレンス2013 今ドキのPHPの書き方 ~PHP逆引きレシピ改訂版~
by
Yuta Sakurai
Android道第1回公開用
by
Takaya Funabiki
Generating word clouds in python
by
AyakaHonda1
ゴールデンウィークに最適な学習コンテンツ
by
Yusuke Ando
Rubyist started to learn Groovy - things important to leran new LL
by
Uchio Kondo
ジーノ先生の文系的オブジェクト指向(1) - ジーノ誕生
by
Satoru Kodaira
Requestsで始める5分前帰社
by
Satoshi Yamada
ぼくたちRubyプログラミング少年団!~小・中学生向けプログラミング言語Rubyの学習塾の運営、学習教材の開発・販売事業~
by
宏治 高尾
TypeScriptからひも解く方向性
by
echigoya-jp
形態素解析器の比較できるPythonパッケージつくった話
1.
Pythonで形態素解析器の比較 できるパッケージつくった話する 2016/3/8 @ NLP若手の会 不満買取センター
三澤賢祐 @kensuke3238
2.
お話の内容 • Mecab, Juman,
KyteaをPythonで比較できる パッケージつくったお • みんなJumanとKyteaを愛でてね • 不満買取センターの話もするお
3.
パッケージの売りポイント • 比較できる • 簡単な形態素分割インターフェース •
簡単なフィルタリングインターフェース • pipで一発インストール!
4.
Mecab+neologd辞書で形態素分割 >>> import JapaneseTokenizer >>>
input=u'みんな、言語処理学会を楽しんでるかー!?' >>> path_mecab_config='/usr/local/bin' >>> dictType = "neologd" >>> res = JapaneseTokenizer.MecabWrapper(dictType=dictType, path_mecab_config=path_mecab_config).tokenize(input) >>> for token in res: print token ... みんな 、 言語処理学会 を 楽しむ でる カー わずか5行!
5.
Jumanで形態素分割 >>> import JapaneseTokenizer >>>
input=u'みんな、言語処理学会を楽しんでるかー!?’ >>> res = JapaneseTokenizer.JumanWrapper().tokenize(input) >>> for token in res: print token ... みんな 、 言語 処理 学会 を 楽しむ る か ! ? たった4行!
6.
Kyteaで形態素分割 >>> import JapaneseTokenizer >>>
input=u'みんな、言語処理学会を楽しんでるかー!?’ >>> res = JapaneseTokenizer.KyteaWrapper().tokenize(input) >>> for token in res: print token ... みんな 、 言語 処理 学会 を 楽し ん で る かー ! ? たった4行!
7.
結果をフィルタリングする >>> pos_condition =
[(u'名詞', u'固有名詞'), (u'動詞', u'自立')] >>> mecab_wrapper = JapaneseTokenizer.MecabWrapper(dictType=dictType, path_mecab_config=path_mecab_config) >>> res_obj = mecab_wrapper.tokenize(input, return_list=False) >>> filtered_obj = mecab_wrapper.filter( ... parsed_sentence=res_obj, ... pos_condition=pos_condition ... ) >>> for token_obj in filtered_obj.tokenized_objects: ... print(u'word_stem:{}, word_surafce:{}, pos:{}'.format( ... token_obj.word_stem, ... token_obj.word_surface, ... ', '.join(token_obj.tuple_pos))) ... word_stem:言語処理学会, word_surafce:言語処理学会, pos:名詞, 固有名詞, 一般 word_stem:楽しむ, word_surafce:楽しん, pos:動詞, 自立, *
8.
つくった理由 みんな!もっとJumanとKyteaを知ろうぜ!
9.
つくった理由 みんな!もっとJumanとKyteaを知ろうぜ! Juman人手チューニングって オワコンだよね (試したことないけど)
10.
つくった理由 みんな!もっとJumanとKyteaを知ろうぜ! Juman人手チューニングって オワコンだよね (試したことないけど) 点推定が試せるのは 小学生までだよね (試したことないけど)
11.
つくった理由 みんな!もっとJumanとKyteaを知ろうぜ! Juman人手チューニングって オワコンだよね (試したことないけど) 点推定が試せるのは 小学生までだよね (試したことないけど) やっぱMecabだよね (他は知らんが)
12.
つくった理由 みんな!もっとJumanとKyteaを知ろうぜ! Jumanの手作業チューニングって オワコンだよね (試したことないけど) 点推定が試せるのは 小学生までだよね (試したことないけど) やっぱMecabだよね (他は知らんが) まず試そう!
13.
Qiitaに記事書きました
14.
_人人人人人人人人人人人人人人人_ > あっという間に20ストック <  ̄Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y^Y ̄
15.
@mhangyoさんありがとう
16.
不満買取センターのお話
17.
不満買取センターのお話 不満買取センターは • 意見抽出 • 知識構築 •
クラスタリング とかやってる系企業だよ
18.
不満買取センターのお話 インターン募集中だよ!
Download