Chaki setup-nlp-seminar090930

1,112 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,112
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Chaki setup-nlp-seminar090930

  1. 1. ChaKi.NETでコーパスを検索するまで の流れ• ChaKi.NETのインストール – 環境によっては.NET Frameworkのインストールを求め られることがあります• テキストファイルをChaKi.NETにインポートできる 形式に変換 – あらかじめMeCabとCaboChaをインストールしておいて ください• コーパスをインポート(データベースファイル作成)• データベースファイルを検索対象として指定 1
  2. 2. ChaKi.NETのインストール 2
  3. 3. Setup.msiをダブルクリックして実行します 3
  4. 4. セキュリティの警告が出ることがあります。 「実行」をクリック 4
  5. 5. 「次へ」をクリック 5
  6. 6. 「次へ」をクリック 6
  7. 7. 「次へ」をクリック 7
  8. 8. しばらくお待ちください 8
  9. 9. 「次へ」をクリック 9
  10. 10. テキストファイルをChaKi.NETにインポートできる形式に変換する 10
  11. 11. ChaKi.NETにインポートしたい テキストファイルを用意します。ここでは例として、c:¥NAISTにインストール されているhana.txtを使用します。 11
  12. 12. このような、生のテキストです 12
  13. 13. TextFormatterをダブルクリックして実行します 13
  14. 14. 変換したいテキストファイルをTextFormatterのウィンドウにドラッグ&ドロップします 14
  15. 15. すると自動的にファイル名が入力されます 15
  16. 16. 変換結果格納ファイル名について• 格納先ファイル名は、変換元ファイル名の拡 張子を”.mecab”および”.cabocha”で置き換え たものになります変換元: c:¥NAIST¥hana.txt格納先(MeCab): c:¥NAIST¥hana.mecab格納先(CaboCha): c:¥NAIST¥hana.cabocha• 「参照」ボタンをクリックすることで格納先ファ イル名を変更できますが、必ずそれぞれ ”.mecab”と”.cabocha”で終わるファイル名とし てください 16
  17. 17. 「変換」ボタンをクリックすると変換 処理が始まります。 しばらくお待ちください。 17
  18. 18. 変換が完了しました。 18
  19. 19. これらが出力された ファイルです 19
  20. 20. コーパスのインポート変換結果ファイルからデータベース ファイルを作ります 20
  21. 21. Chaki.NETを実行します 21
  22. 22. メニューからCreate SQLite Corpus を クリック 22
  23. 23. Input File の 「Browse...」をクリック 23
  24. 24. C:¥NAISTに移動し、hana.cabochaを 選択して「開く」をクリックMeCabファイルをインポートする場合には、「ファイルの種類」を「MeCab files」にしてか ら.mecabファイルを選択します 24
  25. 25. Input Character Code: UTF-8 Input Type: Mecab|Cabocha とします。TextFormatterの出力文字コードはUTF-8です。 25
  26. 26. Output DBの 「Browse...」をクリック 26
  27. 27. 出力されるデータベースファイル名を指定します。ここではhana.dbと入 力して「開く」をクリック。 27
  28. 28. 「Launch」 をクリック 28
  29. 29. しばらくお待ちください。変換が完了したら、Enterキーを押してこのウィンド ウを閉じます。 29
  30. 30. 出力されたデータ ベースファイルCreate SQLite Corpus のウィンドウはもう 閉じて構いません 30
  31. 31. データベースファイルを検索対象として指定する 31
  32. 32. Corpusタブの「Add...」ボタンをクリック 32
  33. 33. 先ほど作成したデータベースファイル を指定して「開く」 33
  34. 34. 検索対象 Corpus List に追加されました 34

×