Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Koji Sekiguchi
5,295 views
コーパス学習による Apache Solr の徹底活用
第14回Solr勉強会の発表資料です。
Technology
◦
Read more
5
Save
Share
Embed
Embed presentation
Download
Downloaded 17 times
1
/ 24
2
/ 24
3
/ 24
4
/ 24
5
/ 24
6
/ 24
7
/ 24
8
/ 24
9
/ 24
10
/ 24
11
/ 24
12
/ 24
13
/ 24
14
/ 24
15
/ 24
16
/ 24
17
/ 24
18
/ 24
19
/ 24
20
/ 24
21
/ 24
22
/ 24
23
/ 24
24
/ 24
More Related Content
PDF
Apache Solr 検索エンジン入門
by
Yahoo!デベロッパーネットワーク
PPTX
WikipediaからのSolr用類義語辞書の自動生成
by
Koji Sekiguchi
PPTX
HMM viterbi
by
Koji Sekiguchi
PDF
Making AutoRun USB HID Device / 自動入力するHIDデバイスを安く簡単に作る
by
玲 佐藤
PDF
情報検索におけるランキング計算の紹介
by
Koji Sekiguchi
PDF
Geolocation gurunavi
by
Jun Chiba
PDF
Geolocation4 system
by
Jun Chiba
PDF
みんな現像ってどうしてる?
by
玲 佐藤
Apache Solr 検索エンジン入門
by
Yahoo!デベロッパーネットワーク
WikipediaからのSolr用類義語辞書の自動生成
by
Koji Sekiguchi
HMM viterbi
by
Koji Sekiguchi
Making AutoRun USB HID Device / 自動入力するHIDデバイスを安く簡単に作る
by
玲 佐藤
情報検索におけるランキング計算の紹介
by
Koji Sekiguchi
Geolocation gurunavi
by
Jun Chiba
Geolocation4 system
by
Jun Chiba
みんな現像ってどうしてる?
by
玲 佐藤
Viewers also liked
PDF
Build Features, Not Apps
by
Natasha Murashev
PDF
数式を(ちょっとしか)使わずに隠れマルコフモデル
by
Yuya Takashina
PDF
Poor Self-esteem: Just Beat It!
by
SlideShop.com
PDF
マーケティング科学第1回(スライドシェア用)
by
Shinya Fujimura
PPT
概要と具体例で学ぶHMM(隠れマルコフモデル)
by
thinkn1108
PDF
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
by
Kazuhito Miura
PDF
IoTって何が良いの? 〜言うてるオレもわからんわ〜 #kinoko_iot
by
Kazuhito Miura
Build Features, Not Apps
by
Natasha Murashev
数式を(ちょっとしか)使わずに隠れマルコフモデル
by
Yuya Takashina
Poor Self-esteem: Just Beat It!
by
SlideShop.com
マーケティング科学第1回(スライドシェア用)
by
Shinya Fujimura
概要と具体例で学ぶHMM(隠れマルコフモデル)
by
thinkn1108
10年前「Microsoftの社員だと思って働け!」と教育されて嫌気がさして出てった人から見た「外の世界」の話 #JCCMVP
by
Kazuhito Miura
IoTって何が良いの? 〜言うてるオレもわからんわ〜 #kinoko_iot
by
Kazuhito Miura
More from Koji Sekiguchi
PDF
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
by
Koji Sekiguchi
PPTX
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
by
Koji Sekiguchi
PPTX
Solr から使う OpenNLP の日本語固有表現抽出
by
Koji Sekiguchi
PPTX
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
by
Koji Sekiguchi
PPTX
OpenNLP - MEM and Perceptron
by
Koji Sekiguchi
PPTX
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
by
Koji Sekiguchi
PDF
LUCENE-5252 NGramSynonymTokenizer
by
Koji Sekiguchi
PPTX
NLP x Lucene/Solr
by
Koji Sekiguchi
PPTX
自然言語処理における機械学習による曖昧性解消入門
by
Koji Sekiguchi
PDF
An Introduction to NLP4L
by
Koji Sekiguchi
PPTX
Visualize terms network in Lucene index
by
Koji Sekiguchi
PDF
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
by
Koji Sekiguchi
PDF
情報検索の基礎からデータの徹底活用まで
by
Koji Sekiguchi
PDF
Learning-to-Rank meetup Vol. 1
by
Koji Sekiguchi
PPTX
Lucene terms extraction
by
Koji Sekiguchi
PDF
Nlp4 l intro-20150513
by
Koji Sekiguchi
PDF
Similarity functions in Lucene 4.0
by
Koji Sekiguchi
PPTX
Html noise reduction
by
Koji Sekiguchi
PPTX
Lucene 6819-good-bye-index-time-boost
by
Koji Sekiguchi
PPT
Pre rondhuit-naming-story
by
Koji Sekiguchi
20221209-ApacheSolrによるはじめてのセマンティックサーチ.pdf
by
Koji Sekiguchi
NLP4L - 情報検索における性能改善のためのコーパスの活用とランキング学習
by
Koji Sekiguchi
Solr から使う OpenNLP の日本語固有表現抽出
by
Koji Sekiguchi
Luceneインデックスの共起単語分析とSolrによる共起単語サジェスチョン
by
Koji Sekiguchi
OpenNLP - MEM and Perceptron
by
Koji Sekiguchi
系列パターンマイニングを用いた単語パターン学習とWikipediaからの組織名抽出
by
Koji Sekiguchi
LUCENE-5252 NGramSynonymTokenizer
by
Koji Sekiguchi
NLP x Lucene/Solr
by
Koji Sekiguchi
自然言語処理における機械学習による曖昧性解消入門
by
Koji Sekiguchi
An Introduction to NLP4L
by
Koji Sekiguchi
Visualize terms network in Lucene index
by
Koji Sekiguchi
An Introduction to NLP4L (Scala by the Bay / Big Data Scala 2015)
by
Koji Sekiguchi
情報検索の基礎からデータの徹底活用まで
by
Koji Sekiguchi
Learning-to-Rank meetup Vol. 1
by
Koji Sekiguchi
Lucene terms extraction
by
Koji Sekiguchi
Nlp4 l intro-20150513
by
Koji Sekiguchi
Similarity functions in Lucene 4.0
by
Koji Sekiguchi
Html noise reduction
by
Koji Sekiguchi
Lucene 6819-good-bye-index-time-boost
by
Koji Sekiguchi
Pre rondhuit-naming-story
by
Koji Sekiguchi
Recently uploaded
PDF
基礎から学ぶ PostgreSQL の性能監視 (PostgreSQL Conference Japan 2025 発表資料)
by
NTT DATA Technology & Innovation
PDF
安価な ロジック・アナライザを アナライズ(?),Analyze report of some cheap logic analyzers
by
たけおか しょうぞう
PDF
PCCC25(設立25年記念PCクラスタシンポジウム):東京大学情報基盤センター テーマ1/2/3「Society5.0の実現を目指す『計算・データ・学習...
by
PC Cluster Consortium
PDF
visionOS TC「新しいマイホームで過ごすApple Vision Proとの新生活」
by
Sugiyama Yugo
PDF
第25回FA設備技術勉強会_自宅で勉強するROS・フィジカルAIアイテム.pdf
by
TomohiroKusu
PPTX
DrupalCon Nara 2025の記録 .
by
iPride Co., Ltd.
基礎から学ぶ PostgreSQL の性能監視 (PostgreSQL Conference Japan 2025 発表資料)
by
NTT DATA Technology & Innovation
安価な ロジック・アナライザを アナライズ(?),Analyze report of some cheap logic analyzers
by
たけおか しょうぞう
PCCC25(設立25年記念PCクラスタシンポジウム):東京大学情報基盤センター テーマ1/2/3「Society5.0の実現を目指す『計算・データ・学習...
by
PC Cluster Consortium
visionOS TC「新しいマイホームで過ごすApple Vision Proとの新生活」
by
Sugiyama Yugo
第25回FA設備技術勉強会_自宅で勉強するROS・フィジカルAIアイテム.pdf
by
TomohiroKusu
DrupalCon Nara 2025の記録 .
by
iPride Co., Ltd.
コーパス学習による Apache Solr の徹底活用
1.
コーパス学習による Apache Solr
の徹底活用 関口宏司@ロンウイット 1
2.
情報検索の性能指標 ドキュメントの全体集合 2
3.
情報検索の性能指標 正解 3
4.
情報検索の性能指標 システム出力正解 4
5.
情報検索の性能指標 精度 :
P = B / ( A + B ) 再現率 : R = B / ( B + C ) A B C システム出力正解 5
6.
精度と再現率 精度と再現率はトレードオフの関係にある! 6
7.
精度と再現率 精度と再現率はトレードオフの関係にある! 正解
7
8.
精度と再現率 精度と再現率はトレードオフの関係にある! システム出力正解
高精度 低再現率 8
9.
精度と再現率 精度と再現率はトレードオフの関係にある! システム出力正解
低精度 高再現率 9
10.
Apache Solr の徹底活用
表記揺れへの対応 絞り込み検索による 漸次的精度改善 ランキング チューニング 10
11.
Apache Solr の徹底活用
表記揺れへの対応 絞り込み検索による 漸次的精度改善 ランキング チューニング 11
12.
表記揺れへの対応後 システム出力正解 12
13.
漸次的精度改善 13
14.
漸次的精度改善 q=ハワイ システム出力正解
14
15.
漸次的精度改善 システム出力正解 予算(10~15万円)
で絞り込む 15
16.
漸次的精度改善 システム出力正解 予算(10~15万円)
で絞り込む 出発地(羽田空港) で絞り込む 16
17.
構造化文書 ID ツアー名価格出発地
1 ハワイオアフ島7日間9万円成田 2 ハワイオアフ島&マウイ島燃油込み12万円羽田 17
18.
非構造化文書はどうする? • 非構造化文書の例
• WordやPDFファイル • 新聞記事 • 書籍 18
19.
非構造化文書 ID 記事
1 安倍首相は12日、甲府市で開かれた自民党ゴルフコンペで… 2 モスクワで開かれている世界陸上の男子100m予選で、日本の高校生桐 生が… : : 19
20.
非構造化文書の構造化 ID 記事人名地名イベント…
1 安倍首相は12日、甲府市で開かれた 自民党ゴルフコンペで… 安倍甲府市ゴルフコ ンペ 2 モスクワで開かれている世界陸上の 男子100m予選で、日本の高校生桐生 が… 桐生モスクワ、 日本世界陸上 : : 20
21.
アーキテクチャ Update Request
Processor CRFsuite Corpus Model InSdoelrx Docs 21
22.
ビジネス志向のタグ ACCESS FOOD
PLAN DATETIME LANGUAGE PRINTING DISEASE LOCATION PRODUCT EVENT ORGANIZATION TITLE FACILITY PERSON VEHICLE 22
23.
参考文献 • Apache
Solr 無料セミナー(毎月開催) • http://www.rondhuit.com/services/ seminars.html • 情報検索のための自然言語処理ツール群の開発 • https://dspace.jaist.ac.jp/dspace/handle/ 10119/12033 23
24.
ご静聴ありがとう ございました 24
Download