Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
EN
Uploaded by
Shinsuke Sugaya
PDF, PPTX
7,036 views
Elasticsearchで作る形態素解析サーバ
ElasticsearchにAnalyze APIプラグインをインストールすることで形態素解析サーバを作成することができます。
Technology
◦
Read more
14
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 22
2
/ 22
3
/ 22
4
/ 22
5
/ 22
6
/ 22
7
/ 22
8
/ 22
9
/ 22
10
/ 22
11
/ 22
12
/ 22
13
/ 22
14
/ 22
15
/ 22
16
/ 22
17
/ 22
18
/ 22
19
/ 22
20
/ 22
21
/ 22
22
/ 22
More Related Content
PDF
Elasticsearch at CrowdWorks
by
佑介 九岡
PDF
ElasticsearchとTasteプラグインで作るレコメンドシステム
by
Shinsuke Sugaya
PDF
Elasticsearchプラグインの作り方
by
Shinsuke Sugaya
PDF
elasticsearchソースコードを読みはじめてみた
by
furandon_pig
PDF
MySQLユーザ視点での小さく始めるElasticsearch
by
Kentaro Yoshida
PDF
ESFluteによるElasticsearchでのO/Rマッパーを用いた開発
by
Shinsuke Sugaya
PDF
Elasticsearch Authプラグインでアクセスコントロール
by
Shinsuke Sugaya
PDF
MySQLと組み合わせて始める全文検索プロダクト"elasticsearch"
by
Kentaro Yoshida
Elasticsearch at CrowdWorks
by
佑介 九岡
ElasticsearchとTasteプラグインで作るレコメンドシステム
by
Shinsuke Sugaya
Elasticsearchプラグインの作り方
by
Shinsuke Sugaya
elasticsearchソースコードを読みはじめてみた
by
furandon_pig
MySQLユーザ視点での小さく始めるElasticsearch
by
Kentaro Yoshida
ESFluteによるElasticsearchでのO/Rマッパーを用いた開発
by
Shinsuke Sugaya
Elasticsearch Authプラグインでアクセスコントロール
by
Shinsuke Sugaya
MySQLと組み合わせて始める全文検索プロダクト"elasticsearch"
by
Kentaro Yoshida
What's hot
PDF
Fess/Elasticsearchを使った業務で使える?全文検索への道
by
Shinsuke Sugaya
PDF
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
by
Kentaro Yoshida
PPTX
Elasticsearch 変わり種プラグインの作り方
by
Ryoji Kurosawa
PDF
Elasticsearchベースの全文検索システムFess
by
Shinsuke Sugaya
PDF
Kibanaでsysstatを可視化する
by
Kensuke Maeda
PDF
SolrとElasticsearchの比較
by
genta kaneyama
PDF
elasticsearchプラグイン入門
by
Shinsuke Sugaya
PDF
Elasticsearchのサジェスト機能を使った話
by
ktaro_w
PDF
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
by
VirtualTech Japan Inc.
PDF
Anemoneによるクローラー入門
by
Tasuku Nakano
PDF
ElasticSearch勉強会 第6回
by
Naoyuki Yamada
PDF
45分で理解する webクローリング入門 斉藤之雄
by
Yukio Saito
PDF
いろいろ考えると日本語の全文検索もMySQLがいいね!
by
Kouhei Sutou
PDF
ニコニコニュースと全文検索
by
techtalkdwango
PDF
MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索 〜InnoDB FTS編〜」
by
Kentaro Yoshida
PDF
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
by
Shinsuke Sugaya
PDF
SolrとElasticsearchを比べてみよう
by
Shinsuke Sugaya
ODP
mysqlftppc 紹介
by
Hiroaki Kawai
PDF
Crawler Commons
by
chibochibo
PPTX
Elasticsearchインデクシングのパフォーマンスを測ってみた
by
Ryoji Kurosawa
Fess/Elasticsearchを使った業務で使える?全文検索への道
by
Shinsuke Sugaya
ElasticSearch+Kibanaでログデータの検索と視覚化を実現するテクニックと運用ノウハウ
by
Kentaro Yoshida
Elasticsearch 変わり種プラグインの作り方
by
Ryoji Kurosawa
Elasticsearchベースの全文検索システムFess
by
Shinsuke Sugaya
Kibanaでsysstatを可視化する
by
Kensuke Maeda
SolrとElasticsearchの比較
by
genta kaneyama
elasticsearchプラグイン入門
by
Shinsuke Sugaya
Elasticsearchのサジェスト機能を使った話
by
ktaro_w
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
by
VirtualTech Japan Inc.
Anemoneによるクローラー入門
by
Tasuku Nakano
ElasticSearch勉強会 第6回
by
Naoyuki Yamada
45分で理解する webクローリング入門 斉藤之雄
by
Yukio Saito
いろいろ考えると日本語の全文検索もMySQLがいいね!
by
Kouhei Sutou
ニコニコニュースと全文検索
by
techtalkdwango
MySQL Casual Talks Vol.4 「MySQL-5.6で始める全文検索 〜InnoDB FTS編〜」
by
Kentaro Yoshida
LastaFluteに移行したFessとElasticsearch+ESFluteによるDBFlute環境
by
Shinsuke Sugaya
SolrとElasticsearchを比べてみよう
by
Shinsuke Sugaya
mysqlftppc 紹介
by
Hiroaki Kawai
Crawler Commons
by
chibochibo
Elasticsearchインデクシングのパフォーマンスを測ってみた
by
Ryoji Kurosawa
Viewers also liked
PDF
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
by
Shinsuke Sugaya
PDF
PredictionIOでSparkMLを使った開発方法
by
Shinsuke Sugaya
PDF
Tensor Decomposition and its Applications
by
Keisuke OTAKI
PPTX
AI社会論研究会
by
Hiroshi Nakagawa
PDF
Scala警察のすすめ
by
takezoe
PDF
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
by
Deep Learning JP
PDF
TensorFlowで逆強化学習
by
Mitsuhisa Ohta
PDF
生成モデルの Deep Learning
by
Seiya Tokui
全文検索サーバ Fess 〜 全文検索システム構築時の悩みどころ
by
Shinsuke Sugaya
PredictionIOでSparkMLを使った開発方法
by
Shinsuke Sugaya
Tensor Decomposition and its Applications
by
Keisuke OTAKI
AI社会論研究会
by
Hiroshi Nakagawa
Scala警察のすすめ
by
takezoe
[DL輪読会]A Bayesian Perspective on Generalization and Stochastic Gradient Descent
by
Deep Learning JP
TensorFlowで逆強化学習
by
Mitsuhisa Ohta
生成モデルの Deep Learning
by
Seiya Tokui
More from Shinsuke Sugaya
PDF
社内ドキュメント検索システム構築のノウハウ
by
Shinsuke Sugaya
PDF
LastaFluteでKotlinをはじめよう
by
Shinsuke Sugaya
PDF
PredictionIOのPython対応計画
by
Shinsuke Sugaya
PDF
PredictionIO構築入門
by
Shinsuke Sugaya
PDF
DBFlute Mavenプラグインを用いてCRUD作成
by
Shinsuke Sugaya
PDF
DBFluteを用いて開発されている全文検索システムFess
by
Shinsuke Sugaya
PDF
Solrベースの全文検索サーバ Fess
by
Shinsuke Sugaya
PDF
Sc2009autumn s2robot
by
Shinsuke Sugaya
PDF
オフィスに1台!全文検索Fess
by
Shinsuke Sugaya
社内ドキュメント検索システム構築のノウハウ
by
Shinsuke Sugaya
LastaFluteでKotlinをはじめよう
by
Shinsuke Sugaya
PredictionIOのPython対応計画
by
Shinsuke Sugaya
PredictionIO構築入門
by
Shinsuke Sugaya
DBFlute Mavenプラグインを用いてCRUD作成
by
Shinsuke Sugaya
DBFluteを用いて開発されている全文検索システムFess
by
Shinsuke Sugaya
Solrベースの全文検索サーバ Fess
by
Shinsuke Sugaya
Sc2009autumn s2robot
by
Shinsuke Sugaya
オフィスに1台!全文検索Fess
by
Shinsuke Sugaya
Elasticsearchで作る形態素解析サーバ
1.
Elasticsearchで作る形態素解析サーバ 第10回elasticsearch勉強会
2.
第10回elasticsearch勉強会 ■ 名前: 菅谷信介 ■
所属: N2SM, Inc. ■ オープンソース活動: • Apache Portals (Jetspeed2) コミッタ • Codehausコミッタ • Seasar Projectコミッタ • CodeLibsプロジェクト運営 などなど・・・ ■ Blog: http://www.chazine.com/ ■ Twitter: https://twitter.com/shinsuke_sugaya/ 自己紹介 2
3.
第10回elasticsearch勉強会 まずは背景から… 3
4.
第10回elasticsearch勉強会 今回の話の背景 4 ■ Elasticsearchにいろいろとデータを入れている ■ そのデータを使って、機械学習をいろいろと適用する ■
日本語のテキストデータだと、形態素解析が必要 ■ Java以外にもPythonを使ってみたり… ■ Mecabとか使うなら環境作らないと… ■ 動かしたいOSもLinuxだったり、Macだったり… ■ Mecabとかチューニングどうするのだろう… ➔ 環境構築とかいろいろと面倒なことが多すぎる…
5.
第10回elasticsearch勉強会 !? 5
6.
第10回elasticsearch勉強会 Elasticsearchに Analyze APIが あるではないか! 6
7.
第10回elasticsearch勉強会 Analyze API https://www.elastic.co/guide/en/elasticsearch/reference/1.5/indices-analyze.html 7 ■ Elasticsearchが提供するRESTなAPI ■
指定したAnalyzerでテキストを分解してくれる $ curl -XGET 'localhost:9200/_analyze?analyzer=standard' -d 'this is a test' { "tokens" : [ { "token" : "this", "start_offset" : 0, "end_offset" : 4, "type" : "<ALPHANUM>", "position" : 1 }, { "token" : "is", "start_offset" : 5, "end_offset" : 7, …
8.
第10回elasticsearch勉強会 日本語だと品詞とかも 取得して、 いろいろと調整したいな… 8
9.
第10回elasticsearch勉強会 Analyze APIで 取得できない… 9
10.
第10回elasticsearch勉強会 !? 10
11.
第10回elasticsearch勉強会 そういえば、 Extend _analyze APIなら いろいろと取得できたな… 11
12.
第10回elasticsearch勉強会 Extend _analyze API https://github.com/johtani/elasticsearch-extended-analyze 12 ■
@johtaniさんが提供するプラグイン ■ RESTなAPIでAnalyze情報を細かく取得できる $ curl -XGET 'localhost:9200/_extended_analyze?analyzer=standard' -d 'this is a test' { "custom_analyzer" : false, "analyzer" : { "standard" : [ { "token" : "this", "start_offset" : 0, "end_offset" : 4, "type" : "<ALPHANUM>", "position" : 1, "extended_attributes" : { "org.apache.lucene.analysis.tokenattributes.PositionLengthAttribute" : { "positionLength" : 1 },
13.
第10回elasticsearch勉強会 おー、 attributeもいろいろ取れて 便利、便利ー 13
14.
第10回elasticsearch勉強会 …がしかし、 ガンガン呼び出すと 遅い… パフォーマンス問題が… 14
15.
第10回elasticsearch勉強会 Extend _analyze APIは 詳細なAnalyze状況を 確認するものだから そもそも用途が 間違っている… 15
16.
第10回elasticsearch勉強会 !? 16
17.
第10回elasticsearch勉強会 作るしかない! 17
18.
第10回elasticsearch勉強会 要件 「最小限の情報だけ返す」 「複数のAnalyzeを1回で実行」 18
19.
第10回elasticsearch勉強会 Analyze APIプラグイン https://github.com/codelibs/elasticsearch-analyze-api 19 ■ RESTでAnalyzeするElasticsearchプラグイン ■
指定されたattribute情報だけを返却する ■ 1リクエストで複数のAnalzyeを実行することが可能 ■ Analyze用のインデックスを作成して利用 curl -XPOST "localhost:9200/_analyze_api" -d'{ "{target_name1}":{ "index":"{index_name}", "analyzer":"{analyzer_name}" "text":"{target_text1}" }, "{target_name2}":{ "index":"{index_name}", "analyzer":"{analyzer_name}" "text":"{target_text2}" }, … }'
20.
第10回elasticsearch勉強会 Analyze APIプラグインの例 https://github.com/codelibs/elasticsearch-analyze-api 20 $ curl
-XPOST “localhost:9200/_analyze_api?start_offset=true" -d '{“text1”:{“index”:”.analyzer”,”analyzer”:”standard”,”text”:”This is a Pen...”},...}’ { “text1”: [ { “term”: ”this”, “start_offset”: 0 }, { “term”: ”is”, “start_offset”: 5 }, ... “text2”: [ { “term”: ”that” } ...
21.
第10回elasticsearch勉強会 まとめ 21
22.
第10回elasticsearch勉強会 ■ Analyze APIプラグインを作成 ■
Analyze(形態素解析)サーバを構築することが可能 ➜ 構築が容易(プラグインをインストールするだけ) ■ Analyzerの構成をElasticsearchの機能で管理( ➜ 設定の変更もREST APIで可能 ■ 指定したAttributeだけを取得可能 ■ 複数のテキストを1つのリクエストで複数のAnalyzeが 可能 まとめ 22
Download