Home
Explore
Submit Search
Upload
Login
Signup
Advertisement
コーパス学習による Apache Solr の徹底活用
Report
Koji Sekiguchi
Follow
RONDHUIT Co.,Ltd. - Founder & CEO at RONDHUIT Co.,Ltd.
Sep. 2, 2014
•
0 likes
5 likes
×
Be the first to like this
Show More
•
5,249 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Check these out next
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
Koji Sekiguchi
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
Koji Sekiguchi
An Introduction to NLP4L
Koji Sekiguchi
Nlp4 l intro-20150513
Koji Sekiguchi
情報検索の基礎からデータの徹底活用まで
Koji Sekiguchi
LUCENE-5252 NGramSynonymTokenizer
Koji Sekiguchi
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
Koji Sekiguchi
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
Koji Sekiguchi
1
of
24
Top clipped slide
コーパス学習による Apache Solr の徹底活用
Sep. 2, 2014
•
0 likes
5 likes
×
Be the first to like this
Show More
•
5,249 views
views
×
Total views
0
On Slideshare
0
From embeds
0
Number of embeds
0
Download Now
Download to read offline
Report
Technology
第14回Solr勉強会の発表資料です。
Koji Sekiguchi
Follow
RONDHUIT Co.,Ltd. - Founder & CEO at RONDHUIT Co.,Ltd.
Advertisement
Advertisement
Advertisement
Recommended
情報検索におけるランキング計算の紹介
Koji Sekiguchi
3.1K views
•
15 slides
Geolocation gurunavi
Jun Chiba
782 views
•
13 slides
Geolocation4 system
Jun Chiba
882 views
•
6 slides
Pythonのガベージコレクション
Atsuo Ishimoto
4.5K views
•
10 slides
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
Koji Sekiguchi
22 views
•
14 slides
Solr から使う OpenNLP の日本語固有表現抽出
Koji Sekiguchi
3.7K views
•
14 slides
More Related Content
More from Koji Sekiguchi
(20)
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
Koji Sekiguchi
•
3.3K views
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
Koji Sekiguchi
•
3.6K views
An Introduction to NLP4L
Koji Sekiguchi
•
3.7K views
Nlp4 l intro-20150513
Koji Sekiguchi
•
7.6K views
情報検索の基礎からデータの徹底活用まで
Koji Sekiguchi
•
3.9K views
LUCENE-5252 NGramSynonymTokenizer
Koji Sekiguchi
•
3.3K views
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
Koji Sekiguchi
•
2.6K views
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
Koji Sekiguchi
•
1.8K views
Html noise reduction
Koji Sekiguchi
•
2.2K views
Lucene terms extraction
Koji Sekiguchi
•
8.4K views
Visualize terms network in Lucene index
Koji Sekiguchi
•
2.3K views
WikipediaからのSolr用類義語辞書の自動生成
Koji Sekiguchi
•
12.6K views
HMM viterbi
Koji Sekiguchi
•
15.2K views
NLP x Lucene/Solr
Koji Sekiguchi
•
2.5K views
OpenNLP - MEM and Perceptron
Koji Sekiguchi
•
5.1K views
自然言語処理における機械学習による曖昧性解消入門
Koji Sekiguchi
•
8.9K views
Similarity functions in Lucene 4.0
Koji Sekiguchi
•
8.5K views
Pre rondhuit-naming-story
Koji Sekiguchi
•
6.2K views
Lu solr32 34-20110912
Koji Sekiguchi
•
3.2K views
Lucene/Solr 3.1
Koji Sekiguchi
•
1.7K views
Recently uploaded
(20)
Kubernetes超入門
Takashi Suzuki
•
4 views
モバイル・クラウド・コンピューティング-データを如何に格納し、組み合わせ、情報として引き出すか
Masahiko Funaki
•
2 views
GitHub Copilotとともに次の開発体験へ
Kazumi IWANAGA
•
15 views
☀️【中央兰开夏大学毕业证成绩单留学生首选】
25mjhd12
•
4 views
統計学の攻略_統計的仮説検定の9パターン.pdf
akipii Oga
•
112 views
ネットワークパケットブローカー市場.pdf
HinaMiyazu
•
5 views
統計学の攻略_推測統計学の考え方.pdf
akipii Oga
•
115 views
JSTQB_テストプロセスの概念モデル.pdf
akipii Oga
•
109 views
☀️【麦吉尔大学毕业证成绩单留学生首选】
15sad
•
3 views
20230523_IoTLT_vol99_kitazaki_v1.pdf
Ayachika Kitazaki
•
107 views
Windows ChatGPT Bing AI.pptx
Atomu Hidaka
•
0 views
Üslup ve tercüme.pdf
1Hmmtks
•
2 views
TestSIP (1).pdf
DeependraSingh712859
•
2 views
☀️【杜兰大学毕业证成绩单留学生首选】
2125nuh
•
2 views
①【麦吉尔大学毕业证文凭学位证书|工艺完美复刻】
love445ds
•
2 views
☀️【卡尔顿大学毕业证成绩单留学生首选】
15sad
•
2 views
第2回Matlantis User Conference_20230421_畠山歓先生
Matlantis
•
396 views
CDLEハッカソン2022参加報告.pdf
SHOIWA1
•
7 views
①【阳光海岸大学毕业证文凭学位证书|工艺完美复刻】
vgh215w
•
2 views
《杨百翰大学毕业证|学位证书校内仿真版本》
d520dasw12
•
2 views
Advertisement
コーパス学習による Apache Solr の徹底活用
コーパス学習による Apache Solr
の徹底活用 関口宏司@ロンウイット 1
情報検索の性能指標 ドキュメントの全体集合 2
情報検索の性能指標 正解 3
情報検索の性能指標 システム出力正解 4
情報検索の性能指標 精度 :
P = B / ( A + B ) 再現率 : R = B / ( B + C ) A B C システム出力正解 5
精度と再現率 精度と再現率はトレードオフの関係にある! 6
精度と再現率 精度と再現率はトレードオフの関係にある! 正解
7
精度と再現率 精度と再現率はトレードオフの関係にある! システム出力正解
高精度 低再現率 8
精度と再現率 精度と再現率はトレードオフの関係にある! システム出力正解
低精度 高再現率 9
Apache Solr の徹底活用
表記揺れへの対応 絞り込み検索による 漸次的精度改善 ランキング チューニング 10
Apache Solr の徹底活用
表記揺れへの対応 絞り込み検索による 漸次的精度改善 ランキング チューニング 11
表記揺れへの対応後 システム出力正解 12
漸次的精度改善 13
漸次的精度改善 q=ハワイ システム出力正解
14
漸次的精度改善 システム出力正解 予算(10~15万円)
で絞り込む 15
漸次的精度改善 システム出力正解 予算(10~15万円)
で絞り込む 出発地(羽田空港) で絞り込む 16
構造化文書 ID ツアー名価格出発地
1 ハワイオアフ島7日間9万円成田 2 ハワイオアフ島&マウイ島燃油込み12万円羽田 17
非構造化文書はどうする? • 非構造化文書の例
• WordやPDFファイル • 新聞記事 • 書籍 18
非構造化文書 ID 記事
1 安倍首相は12日、甲府市で開かれた自民党ゴルフコンペで… 2 モスクワで開かれている世界陸上の男子100m予選で、日本の高校生桐 生が… : : 19
非構造化文書の構造化 ID 記事人名地名イベント…
1 安倍首相は12日、甲府市で開かれた 自民党ゴルフコンペで… 安倍甲府市ゴルフコ ンペ 2 モスクワで開かれている世界陸上の 男子100m予選で、日本の高校生桐生 が… 桐生モスクワ、 日本世界陸上 : : 20
アーキテクチャ Update Request
Processor CRFsuite Corpus Model InSdoelrx Docs 21
ビジネス志向のタグ ACCESS FOOD
PLAN DATETIME LANGUAGE PRINTING DISEASE LOCATION PRODUCT EVENT ORGANIZATION TITLE FACILITY PERSON VEHICLE 22
参考文献 • Apache
Solr 無料セミナー(毎月開催) • http://www.rondhuit.com/services/ seminars.html • 情報検索のための自然言語処理ツール群の開発 • https://dspace.jaist.ac.jp/dspace/handle/ 10119/12033 23
ご静聴ありがとう ございました 24
Advertisement