第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive

Amazon Web Services Japan
Amazon Web Services JapanAmazon Web Services Japan
Amazon CloudSearch Deep Dive 
2014年年12⽉月8⽇日 第15回 Solr勉強会 #SolrJP 
アマゾンデータサービスジャパン株式会社 篠原英治
Amazon CloudSearch Deep Dive 
! Agenda 
• Who am I 
• Amazon CloudSearch Overview 
• Amazon CloudSearch Update 
• Inside Amazon CloudSearch 
• Amazon CloudSearch Pro Tips 
• Wrap up
Amazon CloudSearch Deep Dive 
! Agenda 
• Who am I 
• Amazon CloudSearch Overview 
• Amazon CloudSearch Update 
• Inside Amazon CloudSearch 
• Amazon CloudSearch Pro Tips 
• Wrap up
Who am I 
! Name: 篠原 英治 / Eiji Shinohara 
! Role:  
AWS Solution Architect for Japanese Startups 
Amazon CloudSearch Subject Matter Expert 
! Twitter: @shinodogg 
! Blog: http://shinodogg.com
Who am I 
! schoo web-‐‑‒campus(schoo.jp)で先⽣生やりました
Amazon CloudSearch Deep Dive 
 
! AWSの授業を検索索して探して受講できます!
Amazon CloudSearch Deep Dive 
! 実はこの検索索機能、Amazon CloudSearchで動いています!
Amazon  CloudSearch Deep Dive 
! しかも超短期間(1週間)で導⼊入!! 
(勿論論schooのエンジニアの皆さんの技術⼒力力⾼高いからですが!) 
http://www.slideshare.net/hiromitsuito71/20141017-‐‑‒cloud-‐‑‒searchschoo
Amazon  CloudSearch Deep Dive 
! CloudSearchは⽇日本でも様々なところで使われています!
Who am I 
! Amazon CloudSearchを⽇日本に広める&⽇日本からのフィー 
ドバックをUSの開発者たちに伝える仕事をしています
Amazon(A9) が Gold Sponsor をした 
『Lucene/Solr Revolution 2014』に参加してきました 
! レポートブログ書いたのでよろしければご覧ください! 
http://shinodogg.com/?p=6163
Amazon CloudSearch Deep Dive 
! Agenda 
• Who am I 
• Amazon CloudSearch Overview 
• Amazon CloudSearch Update 
• Inside Amazon CloudSearch 
• Amazon CloudSearch Pro Tips 
• Wrap up
Amazon?A9? 
! Amazonで商品検索索すると下の⽅方に、、
Amazon CloudSearch Overview 
! Amazon CloudSearch は A9 で作っています
Amazon CloudSearch Overview 
! Amazon CloudSearch 
• A9 internal engine ! Apache Lucene/Solr 
– 2014年年3⽉月のリリースでLucene/Solrベースになりました ☺ 
• Take advantage of Solr features, especially languages 
– 特に⾔言語周り 
– CloudSearchの⽇日本語のサポートはSolrベースになってから 
• Easier to get started for new engineers 
– プロプライエタリなものより馴染みのあるもの 
• Apache Software Foundation project, with a defined 
process to contribute. No need to fork. 
– こちらは後ほどもう少し詳しく
Amazon CloudSearch Overview 
! Amazon CloudSearch in Amazon 
• Amazonの中でも様々なところで使われています。その中の⼀一部をご紹介 
amazon smile : Support Local Charities/10s of millions of products 
https://smile.amazon.com/
Amazon CloudSearch Overview 
! Amazon CloudSearch in Amazon 
• Amazonの中でも様々なところで使われています。その中の⼀一部をご紹介 
goodreads : 30 million members/900 million books/34 million reviews 
https://www.goodreads.com/
! Amazon CloudSearch 
§ フルマネージドなクラウド型検索索エンジン 
§ 検索索ソリューションが容易易に導⼊入可能 
§ 2014年年11⽉月現在 34 の⾔言語をサポート 
§ 豊富な検索索機能 
• ハイライト表⽰示 
• サジェスト(AutoComplete) 
• 地理理空間検索索
CloudSearch Feature 
! Per-‐‑‒Field Language Control 
※ “Multiple Languages”はCJKの場合Bi-‐‑‒gramによるインデクシング
! Highlighting 
CloudSearch Feature 
/searchq=iron+manhighlight.plot={format:text} 
hit: [{ 
id: tt1228705, 
fields: { 
title: Iron Man 2” 
}, 
highlights: { 
plot: Tony Stark has declared himself  
*Iron* *Man* and installed world... 
} },...
! Suggestions 
CloudSearch Feature 
※ ⽇日本語は読みでもサジェストもできます 
/suggest?q=irsuggester=title_̲sug 
suggest: {query: iro, found: 5, 
suggestions: [ 
{“suggestion”: “Iron Man”,…id: tt0371746}, 
{suggestion: Iron Man 2”,…id”:tt1228705}, 
...
CloudSearch Feature 
! Geo-‐‑‒Spatial support 
• Latitude-‐‑‒Longitude data types 
• 範囲/バウンディングボックス検索索 
• Distance sort 
• 球⾯面上の距離離(haversin) 
• near me 等
CloudSearch Feature 
! Enhanced Availability 
• Multi Availability-‐‑‒Zone
• Term Boosting 
CloudSearch Feature 
– (or 'man' 'woman')q.parser=structured 
When a Man Loves a Woman 
Wonder Woman 
The Woman in Black” 
... 
– (or (term boost=5 'manʼ’) 'woman')q.parser=structured 
The Lawnmower Man 
Dead Man 
Repo Man” 
...
例例えばサクっと東京メトロ南北北線の駅名検索索を⽴立立ち上げたい
CloudSearchの利利⽤用イメージ 
! ドメインの作成
CloudSearchの利利⽤用イメージ 
! データ投⼊入(東京メトロ南北北線の駅名&路路線)
CloudSearchの利利⽤用イメージ 
! フィールドの定義
CloudSearchの利利⽤用イメージ 
! “JR⼭山⼿手線”
CloudSearchの利利⽤用イメージ 
! “⿇麻布” or “⼀一丁⽬目”
Lucne/Solrベースの検索索エンジン 
! ⼤大量量のドキュメントから特定の⽂文字列列を検索索 
§ grepのように最初から1つ1つ探すのは⾮非常に時間がかかる 
§ 素早く引き当てられるよう予めインデックスを作っておく 
§ 転置インデックス 
§ TF-‐‑‒IDFによるスコアリング 
§ 複数のクエリパーサをサポート
CloudSearch – 様々なデータ形式をサポート 
! データの形式 
Literal 
Double 
Date 
Signed IntegerText
Ranking and Relevance(順位と適合性) 
! スコア(_̲score)によるソート
Ranking and Relevance(順位と適合性) 
! A/Bテスト 
• マネージメントコンソールで⽐比較しながら調整
Apache Lucene/Solrへのコントリビューション 
Expressions 
! Build arbitrary scoring functions using Javascript-‐‑‒like syntax.  
! Can refer to other fields and/or other expressions. 
! Are compiled at runtime.  
! To be added in Solr: SOLR-‐‑‒5707 
// compile an expression: 
Expression expr = JavascriptCompiler.compile(sqrt(_̲score) + ln(popularity)); 
 
// we use SimpleBindings: which just maps variables to SortField instances 
SimpleBindings bindings = new SimpleBindings();  
bindings.add(new SortField(_̲score, SortField.Type.SCORE)); 
bindings.add(new SortField(popularity, SortField.Type.INT)); 
 
// create a sort field and sort by it (reverse order) 
Sort sort = new Sort(expr.getSortField(bindings, true)); 
Query query = new TermQuery(new Term(body, contents)); 
searcher.search(query, null, 3, sort);
Apache Lucene/Solrへのコントリビューション 
Jack が作った 『Simple Query Parser』 
! Parse human readable query syntax 
! Can enable / disable “operations” 
! Really Simple 
! JackはVertical Keyboard使ってる ☺
Amazon CloudSearch Deep Dive 
! Agenda 
• Who am I 
• Amazon CloudSearch Overview 
• Amazon CloudSearch Update 
• Inside Amazon CloudSearch 
• Amazon CloudSearch Pro Tips 
• Wrap up
Amazon CloudSearch Update 
! 2014年年3⽉月のローンチに関してはWebinarの資料料 
AWS Black Belt Tech Webinar 毎週⽔水曜18時〜~ 
http://www.slideshare.net/AmazonWebServicesJapan/aws-black-belt-tech-amazon-cloudsearch
Amazon CloudSearch Update 
! 5⽉月29⽇日 ヘブライ語サポート&パーティション数の事前設定が可能に 
パーティションを増やす事で初期移⾏行行時など、短時間に⼤大量量のインデクシング処理理が可能
Amazon CloudSearch Update 
! 6⽉月26⽇日 CLI/SDKで検索索およびドキュメントの更更新処理理が可能に 
$ aws cloudsearchdomain search  
-‐‑‒-‐‑‒endpoint-‐‑‒url https://xxx.ap-‐‑‒northeast-‐‑‒1.cloudsearch.amazonaws.com/  
-‐‑‒-‐‑‒search-‐‑‒query james 
{ 
status: { 
rid: hNOPlP8oCgqnCm0=,  
time-‐‑‒ms: 3 
},  
hits: { 
found: 304,  
hit: [ 
{ 
fields: { 
rating: 7.5,
Amazon CloudSearch Update 
! 8⽉月14⽇日 Identity and Access Management(IAM)との連携強化 
• 特定のリソースに関する特定のオペレーションを制御 
{ 
Version:2012-‐‑‒10-‐‑‒17,  
Statement: [ 
{ 
Effect: Allow, 
Action: [cloudsearch:search, cloudsearch:List*], 
Resource: arn:aws:cloudsearch:us-‐‑‒east-‐‑‒1:xxx:domain/movies” 
Condition:{IpAddress:{aws:SourceIp:192.0.2.0/32}} 
} 
] 
}
Amazon CloudSearch Update 
! CloudTrail対応 
• AWS APIの呼び出しを記録するサービス。以下の情報を記録 
API 呼び出し元の ID 
API 呼び出し元のソース IP アドレス 
リクエストのパラメータ 
AWS サービスから返された応答要素
Amazon CloudSearch Update 
! Indexing Bigrams 
• Bi-‐‑‒gramでのインデクシング 
! Customizing Japanese Tokenization 
• 形態素解析辞書のカスタマイズ
! Indexing Bigrams 
• CJK(中国語、⽇日本語、韓国語)に対応 
• Analysis Scheme で Multiple Languages を選択いただく 
ことでBi-‐‑‒Gramでのインデクシングが可能になります 
• 検索索の取りこぼしを無くす事が可能 
• 但しノイズの対応が必要な場合も 
– 例例: “東京都”を”京都”で検索索 
– 形態素解析フィールドでヒットした際のスコアを上げる等
! Customizing Japanese Tokenization 
• 禿銅/ググる/⾹香具師といった辞書にない⾔言葉葉でもトークナイズ可能 
• 特に⽇日本のお客様から多くのご要望をいただいていた機能
! 以前のCloudSearch勉強会の⼤大須賀さん@Yahoo!のスライド
Tokenization Dictionary
Tokenization Dictionary
Tokenization Dictionary 
! CLIでも登録可能 
{   
AnalysisSchemeName: jascheme, 
AnalysisSchemeLanguage: ja, 
AnalysisOptions: { 
JapaneseTokenizationDictionary: [ 
[⽇日本経済新聞,⽇日本 経済 新聞,ニホン ケイザイ シンブン,カスタム名詞], 
[トートバッグ,トート バッグ,トート バッグ,かずカナ名詞], 
[朝⻘青⿓龍龍,朝⻘青⿓龍龍,アサショウリュウ,カスタム⼈人名] 
]  
} 
} 
$ aws cloudsearch define-‐‑‒analysis-‐‑‒scheme -‐‑‒-‐‑‒region us-‐‑‒east-‐‑‒1 -‐‑‒-‐‑‒domain-‐‑‒name mydomain  
-‐‑‒-‐‑‒analysis-‐‑‒scheme file://jascheme.txt
Amazon CloudSearch Deep Dive 
! Agenda 
• Who am I 
• Amazon CloudSearch Overview 
• Amazon CloudSearch Update 
• Inside Amazon CloudSearch 
• Amazon CloudSearch Pro Tips 
• Wrap up
Automatic Scaling 
! ドキュメントのサイズ/数および検索索リクエスト数によって⾃自動的にスケール 
データ量量増加に 
⾃自動対応 
検索索アクセス増加に 
⾃自動対応
Inside Amazon CloudSearch 
! Lucene/Solr Revolution 2014 で A9 の Tomás が詳細を発表
Inside Amazon CloudSearch 
! Amazon CloudSearch の Indexing 
Processing 
Script 
QueuingBatching 
Amazon EC2 
Amazon EC2 
Amazon 
CloudSearch 
Amazon 
SQS 
Source 
System 
Search Data Format (SDF)
! Amazon CloudSearch の Indexing 
P1 
EC2 
P2 
EC2 
EC2 
ELB 
P3 
batch 
§ どの Partition も Indexing Node になる 
§ ELB(AWSのマネージドなバランサ)での振り分け 
§ インスタンスタイプによってスレッド数が異異なる
! Amazon CloudSearch の Indexing 
S3DynamoDB 
EC2 
P1 
batch 
Document 
Service 
200 
§ BatchデータはS3。メタデータはDynamoDB 
§ Document Serviceは処理理を終えたら200(OK)を返す
! Amazon CloudSearch の Indexing 
S3DynamoDB 
Updater 
ProcessSolr 
EC2 
P1 
Document 
Service 
§ インデクシングしたバイナリをS3。メタデータを更更新 
§ 各ノードはS3から⾃自分が担当分のバイナリを取得してSolrへ
Amazon S3の概要 
東京リージョン 
世界中の拠点(リージョン)から選択 
3か所以上で 
⾃自動複製 
バケット 
⾼高い耐久性で 
データ失わない: 
99.999999999% 
データセンターA 
データ置くだけ。インフ 
ラ、電源、気にしない。 
容量量無制限。 
データセンターB 
ファイルデータセンターC 
⇒ テキスト、画像、動画 
保存するデータは、⾃自動 
で暗号化することも可能 
安価な従量量課⾦金金 
1GB/⽉月 : 約3.5円
! Amazon CloudSearch の Query 
P1 
EC2 
P2 
EC2 
EC2 
ELB 
P3 
query 
§ インデクシングと同じようにELB経由で割り振って分散検索索 
§ インスタンスタイプやクエリの重い軽いによって捌ける数が異異なる
! Amazon CloudSearch の Query 
u クエリの負荷状況によって Auto Scaling による Replication 
• Auto ScalingはEC2の負荷に応じて⾃自動的に拡⼤大/縮⼩小する仕組み 
• 例例) CPU使⽤用率率率が5分以上継続して70%以上だったら2台追加 
ELB 
EC2EC2 
Auto Scaling Group 
Auto Scaling 
負荷状況を監視 
CloudWatch 
ELBの振り分けに追加 
EC2EC2 
EC2を追加構築
! Amazon CloudSearch の Query 
Auto Scaling Group 
P1 
EC2 
Auto Scaling Group 
P2 
EC2 
Auto Scaling Group 
P3 
EC2
! Amazon CloudSearch の Query 
Auto Scaling Group 
P1 
EC2 
Auto Scaling Group 
P2 
EC2 
Auto Scaling Group 
P3 
EC2 
P1 
EC2 
P2 
EC2 
P3 
EC2 
P1 
EC2 
P2 
EC2 
P3 
EC2
! Amazon CloudSearch の Data Scaling 
SmallMediumLarge 
§ データサイズによってスケールアップ 
§ 古いインスタンスでリクエストを受け付けながら⾏行行うので 
”No downtime”でサービスを継続
! Amazon CloudSearch の Data Scaling 
Index 
Index P1 
Amazon Index P2 
EMR 
§ スケールアップでまかなえなくなったらEMR 
(AWSのHadoopサービス)でインデックスを分割してスケールアウト 
§ 分割中は古いインスタンスがリクエストを受け付けるので 
”No downtime”でサービスを継続 
§ 但し Eventual Consistency なモデルなので考慮は必要
! Amazon CloudSearch で Configuration が変更更された時 
Index A 
Amazon  
EMR 
Index B 
§ 検索索ドメインの設定が変更更されてインデックスをやり直さなければな 
らない場合は裏裏でEMRで実⾏行行 
§ 新しいインデックス作成中は古いインデックスでリクエストを受け付 
けるので”No downtime”でサービスを継続
Inside Amazon CloudSearch 
! 内部ではAWSの様々なサービスが使われています 
• CloudSearchを使う上ではユーザーの皆さまが意識識していただく 
必要はございません 
• 但し、CloudSearchは主に、インスタンスが何台・何時間稼働し 
たか?という課⾦金金体系であるため、重いクエリが頻繁に叩かれて 
レプリケーションが多くなると料料⾦金金がかさむ可能性があります 
• 現在どのような形でメトリクスを提供するか検討しています
Amazon CloudSearch Deep Dive 
! Agenda 
• Who am I 
• Amazon CloudSearch Overview 
• Amazon CloudSearch Update 
• Inside Amazon CloudSearch 
• Amazon CloudSearch Pro Tips 
• Wrap up
Amazon CloudSearch Pro Tips 
! 11⽉月に開催された『AWS re:Invent 2014』にて Jon Handler が 
Amazon CloudSearchの”Deep Dive and Best Practices”で登壇 
• Jonは5⽉月にCloudSearchを 
紹介しに東京に来てくれました!
Amazon CloudSearch Pro Tips 
! Pro Tips 1: Use Maximum Batches 
• CloudSearchは上限5MB(ドキュメント数は収まる範囲ならいくつでもOK)で 
インデクシングしていただくのが最も⾼高いスループットで低いレイテンシ 
• 1000件のインデクシングリクエスト毎に0.10USDなので、コスト的にも有利利 
• ⼿手前にSQSを挟んで処理理していただくケースも 
• SDK/CLIの CloudSearchDomainでインデクシングしていただくと便便利利 
例例: $ aws cloudsearchdomain upload-‐‑‒documents〜~
Amazon CloudSearch Pro Tips 
! Pro Tips 2: Increase Instance type for load-‐‑‒in 
• 多重度度を上げてデータ投⼊入で短時間に⼤大量量データのインデクシングをする 
• ⼤大量量のQueryが発⽣生する際はDesiredでレプリケーション数を上げておく 
• インスタンスタイプ毎のデータ量量やスレッド数の⽬目安の紹介も!
Amazon CloudSearch Pro Tips 
! Pro Tips 
• 他にも様々なTipsが紹介されているので是⾮非ご覧ください! 
• 発表資料料: http://goo.gl/pklAzW 
• Youtube: http://youtu.be/OeHaj1a66I4
Amazon CloudSearch Deep Dive 
! Wrap up 
• CloudSearchは⽇日本でも様々なサービスで利利⽤用されています 
• CloudSearchはフルマネージドなクラウド型検索索エンジンです 
• CloudSearchは2014年年に様々なアップデートを⾏行行いました 
• CloudSearchはLucene/SolrにContributeしています 
• CloudSearchはAWSの様々なサービスを利利⽤用しています 
• CloudSearchのTipsが公開されているので是⾮非御覧ください
Amazon CloudSearch Deep Dive 
! 導⼊入をご検討中の⽅方は是⾮非お声がけください 
• 2014年年11⽉月、最⼤大で50%の値下げを実施しました
Amazon CloudSearch Deep Dive 
! 最後に、、 
2015年年も多くのアップデートを予定しています! 
I believe we can make you say WOW!!
ありがとうございました!
1 of 74

Recommended

SolrとElasticsearchを比べてみよう by
SolrとElasticsearchを比べてみようSolrとElasticsearchを比べてみよう
SolrとElasticsearchを比べてみようShinsuke Sugaya
52.3K views30 slides
AWS Black Belt Techシリーズ Amazon CloudSearch by
AWS Black Belt Techシリーズ Amazon CloudSearchAWS Black Belt Techシリーズ Amazon CloudSearch
AWS Black Belt Techシリーズ Amazon CloudSearchAmazon Web Services Japan
11K views60 slides
Amazon Aurora - Auroraの止まらない進化とその中身 by
Amazon Aurora - Auroraの止まらない進化とその中身Amazon Aurora - Auroraの止まらない進化とその中身
Amazon Aurora - Auroraの止まらない進化とその中身Amazon Web Services Japan
22.2K views65 slides
AWS Database Migration Service ご紹介 by
AWS Database Migration Service ご紹介AWS Database Migration Service ご紹介
AWS Database Migration Service ご紹介Amazon Web Services Japan
15.1K views34 slides
Aurora by
AuroraAurora
Auroramaruyama097
3.3K views253 slides
LIFULL HOME'SでのSolrの構成と運用の変遷 by
LIFULL HOME'SでのSolrの構成と運用の変遷LIFULL HOME'SでのSolrの構成と運用の変遷
LIFULL HOME'SでのSolrの構成と運用の変遷LIFULL Co., Ltd.
718 views56 slides

More Related Content

What's hot

AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ... by
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...Amazon Web Services Japan
26K views103 slides
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤 by
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤Amazon Web Services Japan
5.1K views42 slides
はじめての検索エンジン&Solr 第13回Solr勉強会 by
はじめての検索エンジン&Solr 第13回Solr勉強会はじめての検索エンジン&Solr 第13回Solr勉強会
はじめての検索エンジン&Solr 第13回Solr勉強会Noritsugu Suzuki
25.6K views41 slides
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern by
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design PatternAWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design PatternAmazon Web Services Japan
58.1K views73 slides
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス by
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティスAmazon Web Services Japan
56.6K views64 slides
Best Practices for Running PostgreSQL on AWS by
Best Practices for Running PostgreSQL on AWSBest Practices for Running PostgreSQL on AWS
Best Practices for Running PostgreSQL on AWSAmazon Web Services Japan
5.3K views73 slides

What's hot(20)

AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ... by Amazon Web Services Japan
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
AWS Black Belt Tech Webinar 2016 〜 Amazon CloudSearch & Amazon Elasticsearch ...
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤 by Amazon Web Services Japan
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
はじめての検索エンジン&Solr 第13回Solr勉強会 by Noritsugu Suzuki
はじめての検索エンジン&Solr 第13回Solr勉強会はじめての検索エンジン&Solr 第13回Solr勉強会
はじめての検索エンジン&Solr 第13回Solr勉強会
Noritsugu Suzuki25.6K views
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern by Amazon Web Services Japan
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design PatternAWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス by Amazon Web Services Japan
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
[Aurora事例祭り]Amazon Aurora を使いこなすためのベストプラクティス
20190828 AWS Black Belt Online Seminar Amazon Aurora with PostgreSQL Compatib... by Amazon Web Services Japan
20190828 AWS Black Belt Online Seminar Amazon Aurora with PostgreSQL Compatib...20190828 AWS Black Belt Online Seminar Amazon Aurora with PostgreSQL Compatib...
20190828 AWS Black Belt Online Seminar Amazon Aurora with PostgreSQL Compatib...
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜 by Takahiko Ito
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Elasticsearch の検索精度のチューニング 〜テストを作って高速かつ安全に〜
Takahiko Ito1.4K views
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮 by Hibino Hisashi
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
【第26回Elasticsearch勉強会】Logstashとともに振り返る、やっちまった事例ごった煮
Hibino Hisashi13.6K views
Real World Azure RBAC by Toru Makabe
Real World Azure RBACReal World Azure RBAC
Real World Azure RBAC
Toru Makabe1.4K views
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス- by Amazon Web Services Japan
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
Aws auto scalingによるwebapサーバbatchサーバの構成例 by Takeshi Mikami
Aws auto scalingによるwebapサーバbatchサーバの構成例Aws auto scalingによるwebapサーバbatchサーバの構成例
Aws auto scalingによるwebapサーバbatchサーバの構成例
Takeshi Mikami3.4K views
3分でわかるAzureでのService Principal by Toru Makabe
3分でわかるAzureでのService Principal3分でわかるAzureでのService Principal
3分でわかるAzureでのService Principal
Toru Makabe30.5K views
ブレソルでテラバイト級データのALTERを短時間で終わらせる by KLab Inc. / Tech
ブレソルでテラバイト級データのALTERを短時間で終わらせるブレソルでテラバイト級データのALTERを短時間で終わらせる
ブレソルでテラバイト級データのALTERを短時間で終わらせる
KLab Inc. / Tech2.7K views
[社内勉強会]ELBとALBと数万スパイク負荷テスト by Takahiro Moteki
[社内勉強会]ELBとALBと数万スパイク負荷テスト[社内勉強会]ELBとALBと数万スパイク負荷テスト
[社内勉強会]ELBとALBと数万スパイク負荷テスト
Takahiro Moteki29.4K views
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント by Amazon Web Services Japan
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント

Viewers also liked

第15回Solr勉強会 - Solr at Yahoo! JAPAN #SolrJP by
第15回Solr勉強会 - Solr at Yahoo! JAPAN #SolrJP第15回Solr勉強会 - Solr at Yahoo! JAPAN #SolrJP
第15回Solr勉強会 - Solr at Yahoo! JAPAN #SolrJPYahoo!デベロッパーネットワーク
8.9K views18 slides
徹底比較!! Heliosearch vs Solr by
徹底比較!! Heliosearch vs Solr徹底比較!! Heliosearch vs Solr
徹底比較!! Heliosearch vs SolrEbisawa Shinobu
4.2K views22 slides
類義語検索と類義語ハイライト by
類義語検索と類義語ハイライト類義語検索と類義語ハイライト
類義語検索と類義語ハイライトShinichiro Abe
8K views18 slides
CloudSearchによる全文検索 - CM:道 2014/08/01 by
CloudSearchによる全文検索 - CM:道 2014/08/01 CloudSearchによる全文検索 - CM:道 2014/08/01
CloudSearchによる全文検索 - CM:道 2014/08/01 Shuji Watanabe
6.8K views34 slides
Deep Learningと画像認識   ~歴史・理論・実践~ by
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~nlab_utokyo
355.6K views100 slides
Spark MLlibではじめるスケーラブルな機械学習 by
Spark MLlibではじめるスケーラブルな機械学習Spark MLlibではじめるスケーラブルな機械学習
Spark MLlibではじめるスケーラブルな機械学習NTT DATA OSS Professional Services
37.2K views51 slides

Viewers also liked(20)

徹底比較!! Heliosearch vs Solr by Ebisawa Shinobu
徹底比較!! Heliosearch vs Solr徹底比較!! Heliosearch vs Solr
徹底比較!! Heliosearch vs Solr
Ebisawa Shinobu4.2K views
類義語検索と類義語ハイライト by Shinichiro Abe
類義語検索と類義語ハイライト類義語検索と類義語ハイライト
類義語検索と類義語ハイライト
Shinichiro Abe8K views
CloudSearchによる全文検索 - CM:道 2014/08/01 by Shuji Watanabe
CloudSearchによる全文検索 - CM:道 2014/08/01 CloudSearchによる全文検索 - CM:道 2014/08/01
CloudSearchによる全文検索 - CM:道 2014/08/01
Shuji Watanabe6.8K views
Deep Learningと画像認識   ~歴史・理論・実践~ by nlab_utokyo
Deep Learningと画像認識 ~歴史・理論・実践~Deep Learningと画像認識 ~歴史・理論・実践~
Deep Learningと画像認識   ~歴史・理論・実践~
nlab_utokyo355.6K views
Cloud search勉強会 20150122 by Daisuke Mii
Cloud search勉強会 20150122Cloud search勉強会 20150122
Cloud search勉強会 20150122
Daisuke Mii991 views
Lucene/Solr Revolution 2016 参加レポート by Shinpei Nakata
Lucene/Solr Revolution 2016 参加レポートLucene/Solr Revolution 2016 参加レポート
Lucene/Solr Revolution 2016 参加レポート
Shinpei Nakata5.3K views
Dictionary based Annotation at Scale with Spark, SolrTextTagger and OpenNLP by Sujit Pal
Dictionary based Annotation at Scale with Spark, SolrTextTagger and OpenNLPDictionary based Annotation at Scale with Spark, SolrTextTagger and OpenNLP
Dictionary based Annotation at Scale with Spark, SolrTextTagger and OpenNLP
Sujit Pal2.3K views
Build a Scalable Search Engine With Amazon CloudSearch by Jon Handler by Eiji Shinohara
Build a Scalable Search Engine With Amazon CloudSearch by Jon HandlerBuild a Scalable Search Engine With Amazon CloudSearch by Jon Handler
Build a Scalable Search Engine With Amazon CloudSearch by Jon Handler
Eiji Shinohara4.2K views
2014-10-17 「“A9共催! AWSプロダクトシリーズ よくわかる AWS CloudSearch” スクーでのCloudSearch利用実例」 by Hiromitsu Ito
2014-10-17 「“A9共催! AWSプロダクトシリーズ よくわかる AWS CloudSearch” スクーでのCloudSearch利用実例」2014-10-17 「“A9共催! AWSプロダクトシリーズ よくわかる AWS CloudSearch” スクーでのCloudSearch利用実例」
2014-10-17 「“A9共催! AWSプロダクトシリーズ よくわかる AWS CloudSearch” スクーでのCloudSearch利用実例」
Hiromitsu Ito3.4K views
∞-gram を使った短文言語判定 by Shuyo Nakatani
∞-gram を使った短文言語判定∞-gram を使った短文言語判定
∞-gram を使った短文言語判定
Shuyo Nakatani6.9K views
Transparent Hugepages in RHEL 6 by Raghu Udiyar
Transparent Hugepages in RHEL 6 Transparent Hugepages in RHEL 6
Transparent Hugepages in RHEL 6
Raghu Udiyar19.3K views
LUCENE-5252 NGramSynonymTokenizer by Koji Sekiguchi
LUCENE-5252 NGramSynonymTokenizerLUCENE-5252 NGramSynonymTokenizer
LUCENE-5252 NGramSynonymTokenizer
Koji Sekiguchi3.3K views
Expectation for cloudSearch by Minoru Osuka
Expectation for cloudSearchExpectation for cloudSearch
Expectation for cloudSearch
Minoru Osuka4.1K views
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会) by Ryuichi Tokugami
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)
CloudSearch初披露 (2012-05-18 JAWS-UG 札幌 第6回 勉強会)
Ryuichi Tokugami1.1K views

Similar to 第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive

AWS Search Services by
AWS Search ServicesAWS Search Services
AWS Search ServicesEiji Shinohara
3.3K views35 slides
Bay Area Startup Report - IVS CTO Night & Day in Miyazaki by
Bay Area Startup Report - IVS CTO Night & Day in MiyazakiBay Area Startup Report - IVS CTO Night & Day in Miyazaki
Bay Area Startup Report - IVS CTO Night & Day in MiyazakiEiji Shinohara
3.7K views70 slides
Search Solutions on AWS by
Search Solutions on AWSSearch Solutions on AWS
Search Solutions on AWSEiji Shinohara
5.3K views44 slides
20121221 AWS re:Invent 凱旋報告 by
20121221 AWS re:Invent 凱旋報告20121221 AWS re:Invent 凱旋報告
20121221 AWS re:Invent 凱旋報告真吾 吉田
1K views47 slides
スタートアップでのAWS(Amazon Web Services)活用事例 by
スタートアップでのAWS(Amazon Web Services)活用事例スタートアップでのAWS(Amazon Web Services)活用事例
スタートアップでのAWS(Amazon Web Services)活用事例schoowebcampus
17.5K views89 slides
JAWS DAYS 2015 by
JAWS DAYS 2015JAWS DAYS 2015
JAWS DAYS 2015陽平 山口
9K views69 slides

Similar to 第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive(20)

Bay Area Startup Report - IVS CTO Night & Day in Miyazaki by Eiji Shinohara
Bay Area Startup Report - IVS CTO Night & Day in MiyazakiBay Area Startup Report - IVS CTO Night & Day in Miyazaki
Bay Area Startup Report - IVS CTO Night & Day in Miyazaki
Eiji Shinohara3.7K views
20121221 AWS re:Invent 凱旋報告 by 真吾 吉田
20121221 AWS re:Invent 凱旋報告20121221 AWS re:Invent 凱旋報告
20121221 AWS re:Invent 凱旋報告
真吾 吉田1K views
スタートアップでのAWS(Amazon Web Services)活用事例 by schoowebcampus
スタートアップでのAWS(Amazon Web Services)活用事例スタートアップでのAWS(Amazon Web Services)活用事例
スタートアップでのAWS(Amazon Web Services)活用事例
schoowebcampus17.5K views
2013年 re:Invent報告会 by Aya Komuro
2013年 re:Invent報告会2013年 re:Invent報告会
2013年 re:Invent報告会
Aya Komuro4.4K views
Programming AWS with Perl at YAPC::Asia 2013 by Yasuhiro Horiuchi
Programming AWS with Perl at YAPC::Asia 2013Programming AWS with Perl at YAPC::Asia 2013
Programming AWS with Perl at YAPC::Asia 2013
Yasuhiro Horiuchi7.1K views
Accelerating AdTech on AWS #AWSAdTechJP by Eiji Shinohara
Accelerating AdTech on AWS #AWSAdTechJPAccelerating AdTech on AWS #AWSAdTechJP
Accelerating AdTech on AWS #AWSAdTechJP
Eiji Shinohara5.4K views
Anchors Aweigh!! - re:Invent報告@re:Port 2016 大阪 by 真吾 吉田
Anchors Aweigh!! - re:Invent報告@re:Port 2016 大阪Anchors Aweigh!! - re:Invent報告@re:Port 2016 大阪
Anchors Aweigh!! - re:Invent報告@re:Port 2016 大阪
真吾 吉田703 views
AWS Summit New York 2017 Keynote Recap by Eiji Shinohara
AWS Summit New York 2017 Keynote RecapAWS Summit New York 2017 Keynote Recap
AWS Summit New York 2017 Keynote Recap
Eiji Shinohara1.8K views
2013年 AWSサービスアップデート 一気ふりかえり at BP Study #76 by Yasuhiro Horiuchi
2013年 AWSサービスアップデート 一気ふりかえり at BP Study #76 2013年 AWSサービスアップデート 一気ふりかえり at BP Study #76
2013年 AWSサービスアップデート 一気ふりかえり at BP Study #76
Yasuhiro Horiuchi4.4K views
[CTO Night & Day 2019] よくある課題を一気に解説!御社の技術レベルがアップする 2019 秋期講習 #ctonight by Amazon Web Services Japan
[CTO Night & Day 2019] よくある課題を一気に解説!御社の技術レベルがアップする 2019 秋期講習 #ctonight[CTO Night & Day 2019] よくある課題を一気に解説!御社の技術レベルがアップする 2019 秋期講習 #ctonight
[CTO Night & Day 2019] よくある課題を一気に解説!御社の技術レベルがアップする 2019 秋期講習 #ctonight
[AWSマイスターシリーズ] AWS SDK for PHP / Ruby / boto(Python) / JavaScript in Node.js by Amazon Web Services Japan
[AWSマイスターシリーズ] AWS SDK for PHP / Ruby / boto(Python) / JavaScript in Node.js[AWSマイスターシリーズ] AWS SDK for PHP / Ruby / boto(Python) / JavaScript in Node.js
[AWSマイスターシリーズ] AWS SDK for PHP / Ruby / boto(Python) / JavaScript in Node.js
実践!AWSクラウドデザインパターン by Hiroyasu Suzuki
実践!AWSクラウドデザインパターン実践!AWSクラウドデザインパターン
実践!AWSクラウドデザインパターン
Hiroyasu Suzuki15.8K views
Cto48 aws 20100618_fin by 仁 上原
Cto48 aws 20100618_finCto48 aws 20100618_fin
Cto48 aws 20100618_fin
仁 上原1.2K views

More from Amazon Web Services Japan

202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM) by
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)Amazon Web Services Japan
7K views62 slides
Infrastructure as Code (IaC) 談義 2022 by
Infrastructure as Code (IaC) 談義 2022Infrastructure as Code (IaC) 談義 2022
Infrastructure as Code (IaC) 談義 2022Amazon Web Services Japan
3.3K views21 slides
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート by
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデートAmazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデートAmazon Web Services Japan
2K views52 slides
20220409 AWS BLEA 開発にあたって検討したこと by
20220409 AWS BLEA 開発にあたって検討したこと20220409 AWS BLEA 開発にあたって検討したこと
20220409 AWS BLEA 開発にあたって検討したことAmazon Web Services Japan
3.7K views28 slides
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介 by
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介Amazon Web Services Japan
4.1K views36 slides
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ by
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチAmazon Web Services Japan
884 views56 slides

More from Amazon Web Services Japan(20)

Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート by Amazon Web Services Japan
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデートAmazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介 by Amazon Web Services Japan
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ by Amazon Web Services Japan
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介 by Amazon Web Services Japan
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ... by Amazon Web Services Japan
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報 by Amazon Web Services Japan
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな by Amazon Web Services Japan
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
[AWS EXpert Online for JAWS-UG 18] 見せてやるよ、Step Functions の本気ってやつをな
AWS IoT Coreを オンプレミス環境と使う際の アーキテクチャ例 (AWS IoT Deep Dive #5) by Amazon Web Services Japan
AWS IoT Coreを オンプレミス環境と使う際の アーキテクチャ例 (AWS IoT Deep Dive #5)AWS IoT Coreを オンプレミス環境と使う際の アーキテクチャ例 (AWS IoT Deep Dive #5)
AWS IoT Coreを オンプレミス環境と使う際の アーキテクチャ例 (AWS IoT Deep Dive #5)
IoT@Loft#20 - IoTプラットフォームを進化さ せるAWSの活用方法 by Amazon Web Services Japan
IoT@Loft#20 - IoTプラットフォームを進化さ せるAWSの活用方法IoT@Loft#20 - IoTプラットフォームを進化さ せるAWSの活用方法
IoT@Loft#20 - IoTプラットフォームを進化さ せるAWSの活用方法
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤 by Amazon Web Services Japan
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤
202106 AWS Black Belt Online Seminar 小売現場のデータを素早くビジネス に活用するAWSデータ基盤

Recently uploaded

Windows 11 information that can be used at the development site by
Windows 11 information that can be used at the development siteWindows 11 information that can be used at the development site
Windows 11 information that can be used at the development siteAtomu Hidaka
80 views41 slides
SNMPセキュリティ超入門 by
SNMPセキュリティ超入門SNMPセキュリティ超入門
SNMPセキュリティ超入門mkoda
301 views15 slides
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) by
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)NTT DATA Technology & Innovation
18 views38 slides
さくらのひやおろし2023 by
さくらのひやおろし2023さくらのひやおろし2023
さくらのひやおろし2023法林浩之
94 views58 slides
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... by
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...NTT DATA Technology & Innovation
104 views42 slides

Recently uploaded(11)

Windows 11 information that can be used at the development site by Atomu Hidaka
Windows 11 information that can be used at the development siteWindows 11 information that can be used at the development site
Windows 11 information that can be used at the development site
Atomu Hidaka80 views
SNMPセキュリティ超入門 by mkoda
SNMPセキュリティ超入門SNMPセキュリティ超入門
SNMPセキュリティ超入門
mkoda301 views
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料) by NTT DATA Technology & Innovation
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
速習! PostgreSQL専用HAソフトウェア: Patroni(PostgreSQL Conference Japan 2023 発表資料)
さくらのひやおろし2023 by 法林浩之
さくらのひやおろし2023さくらのひやおろし2023
さくらのひやおろし2023
法林浩之94 views
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20... by NTT DATA Technology & Innovation
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
今、改めて考えるPostgreSQLプラットフォーム - マルチクラウドとポータビリティ -(PostgreSQL Conference Japan 20...
SSH応用編_20231129.pdf by icebreaker4
SSH応用編_20231129.pdfSSH応用編_20231129.pdf
SSH応用編_20231129.pdf
icebreaker4287 views
The Things Stack説明資料 by The Things Industries by CRI Japan, Inc.
The Things Stack説明資料 by The Things IndustriesThe Things Stack説明資料 by The Things Industries
The Things Stack説明資料 by The Things Industries
CRI Japan, Inc.51 views

第15回 Solr勉強会 #SolrJP Amazon CloudSearch Deep Dive

  • 1. Amazon CloudSearch Deep Dive 2014年年12⽉月8⽇日 第15回 Solr勉強会 #SolrJP アマゾンデータサービスジャパン株式会社 篠原英治
  • 2. Amazon CloudSearch Deep Dive ! Agenda • Who am I • Amazon CloudSearch Overview • Amazon CloudSearch Update • Inside Amazon CloudSearch • Amazon CloudSearch Pro Tips • Wrap up
  • 3. Amazon CloudSearch Deep Dive ! Agenda • Who am I • Amazon CloudSearch Overview • Amazon CloudSearch Update • Inside Amazon CloudSearch • Amazon CloudSearch Pro Tips • Wrap up
  • 4. Who am I ! Name: 篠原 英治 / Eiji Shinohara ! Role: AWS Solution Architect for Japanese Startups Amazon CloudSearch Subject Matter Expert ! Twitter: @shinodogg ! Blog: http://shinodogg.com
  • 5. Who am I ! schoo web-‐‑‒campus(schoo.jp)で先⽣生やりました
  • 6. Amazon CloudSearch Deep Dive ! AWSの授業を検索索して探して受講できます!
  • 7. Amazon CloudSearch Deep Dive ! 実はこの検索索機能、Amazon CloudSearchで動いています!
  • 8. Amazon CloudSearch Deep Dive ! しかも超短期間(1週間)で導⼊入!! (勿論論schooのエンジニアの皆さんの技術⼒力力⾼高いからですが!) http://www.slideshare.net/hiromitsuito71/20141017-‐‑‒cloud-‐‑‒searchschoo
  • 9. Amazon CloudSearch Deep Dive ! CloudSearchは⽇日本でも様々なところで使われています!
  • 10. Who am I ! Amazon CloudSearchを⽇日本に広める&⽇日本からのフィー ドバックをUSの開発者たちに伝える仕事をしています
  • 11. Amazon(A9) が Gold Sponsor をした 『Lucene/Solr Revolution 2014』に参加してきました ! レポートブログ書いたのでよろしければご覧ください! http://shinodogg.com/?p=6163
  • 12. Amazon CloudSearch Deep Dive ! Agenda • Who am I • Amazon CloudSearch Overview • Amazon CloudSearch Update • Inside Amazon CloudSearch • Amazon CloudSearch Pro Tips • Wrap up
  • 14. Amazon CloudSearch Overview ! Amazon CloudSearch は A9 で作っています
  • 15. Amazon CloudSearch Overview ! Amazon CloudSearch • A9 internal engine ! Apache Lucene/Solr – 2014年年3⽉月のリリースでLucene/Solrベースになりました ☺ • Take advantage of Solr features, especially languages – 特に⾔言語周り – CloudSearchの⽇日本語のサポートはSolrベースになってから • Easier to get started for new engineers – プロプライエタリなものより馴染みのあるもの • Apache Software Foundation project, with a defined process to contribute. No need to fork. – こちらは後ほどもう少し詳しく
  • 16. Amazon CloudSearch Overview ! Amazon CloudSearch in Amazon • Amazonの中でも様々なところで使われています。その中の⼀一部をご紹介 amazon smile : Support Local Charities/10s of millions of products https://smile.amazon.com/
  • 17. Amazon CloudSearch Overview ! Amazon CloudSearch in Amazon • Amazonの中でも様々なところで使われています。その中の⼀一部をご紹介 goodreads : 30 million members/900 million books/34 million reviews https://www.goodreads.com/
  • 18. ! Amazon CloudSearch § フルマネージドなクラウド型検索索エンジン § 検索索ソリューションが容易易に導⼊入可能 § 2014年年11⽉月現在 34 の⾔言語をサポート § 豊富な検索索機能 • ハイライト表⽰示 • サジェスト(AutoComplete) • 地理理空間検索索
  • 19. CloudSearch Feature ! Per-‐‑‒Field Language Control ※ “Multiple Languages”はCJKの場合Bi-‐‑‒gramによるインデクシング
  • 20. ! Highlighting CloudSearch Feature /searchq=iron+manhighlight.plot={format:text} hit: [{ id: tt1228705, fields: { title: Iron Man 2” }, highlights: { plot: Tony Stark has declared himself *Iron* *Man* and installed world... } },...
  • 21. ! Suggestions CloudSearch Feature ※ ⽇日本語は読みでもサジェストもできます /suggest?q=irsuggester=title_̲sug suggest: {query: iro, found: 5, suggestions: [ {“suggestion”: “Iron Man”,…id: tt0371746}, {suggestion: Iron Man 2”,…id”:tt1228705}, ...
  • 22. CloudSearch Feature ! Geo-‐‑‒Spatial support • Latitude-‐‑‒Longitude data types • 範囲/バウンディングボックス検索索 • Distance sort • 球⾯面上の距離離(haversin) • near me 等
  • 23. CloudSearch Feature ! Enhanced Availability • Multi Availability-‐‑‒Zone
  • 24. • Term Boosting CloudSearch Feature – (or 'man' 'woman')q.parser=structured When a Man Loves a Woman Wonder Woman The Woman in Black” ... – (or (term boost=5 'manʼ’) 'woman')q.parser=structured The Lawnmower Man Dead Man Repo Man” ...
  • 31. Lucne/Solrベースの検索索エンジン ! ⼤大量量のドキュメントから特定の⽂文字列列を検索索 § grepのように最初から1つ1つ探すのは⾮非常に時間がかかる § 素早く引き当てられるよう予めインデックスを作っておく § 転置インデックス § TF-‐‑‒IDFによるスコアリング § 複数のクエリパーサをサポート
  • 32. CloudSearch – 様々なデータ形式をサポート ! データの形式 Literal Double Date Signed IntegerText
  • 33. Ranking and Relevance(順位と適合性) ! スコア(_̲score)によるソート
  • 34. Ranking and Relevance(順位と適合性) ! A/Bテスト • マネージメントコンソールで⽐比較しながら調整
  • 35. Apache Lucene/Solrへのコントリビューション Expressions ! Build arbitrary scoring functions using Javascript-‐‑‒like syntax. ! Can refer to other fields and/or other expressions. ! Are compiled at runtime. ! To be added in Solr: SOLR-‐‑‒5707 // compile an expression: Expression expr = JavascriptCompiler.compile(sqrt(_̲score) + ln(popularity)); // we use SimpleBindings: which just maps variables to SortField instances SimpleBindings bindings = new SimpleBindings(); bindings.add(new SortField(_̲score, SortField.Type.SCORE)); bindings.add(new SortField(popularity, SortField.Type.INT)); // create a sort field and sort by it (reverse order) Sort sort = new Sort(expr.getSortField(bindings, true)); Query query = new TermQuery(new Term(body, contents)); searcher.search(query, null, 3, sort);
  • 36. Apache Lucene/Solrへのコントリビューション Jack が作った 『Simple Query Parser』 ! Parse human readable query syntax ! Can enable / disable “operations” ! Really Simple ! JackはVertical Keyboard使ってる ☺
  • 37. Amazon CloudSearch Deep Dive ! Agenda • Who am I • Amazon CloudSearch Overview • Amazon CloudSearch Update • Inside Amazon CloudSearch • Amazon CloudSearch Pro Tips • Wrap up
  • 38. Amazon CloudSearch Update ! 2014年年3⽉月のローンチに関してはWebinarの資料料 AWS Black Belt Tech Webinar 毎週⽔水曜18時〜~ http://www.slideshare.net/AmazonWebServicesJapan/aws-black-belt-tech-amazon-cloudsearch
  • 39. Amazon CloudSearch Update ! 5⽉月29⽇日 ヘブライ語サポート&パーティション数の事前設定が可能に パーティションを増やす事で初期移⾏行行時など、短時間に⼤大量量のインデクシング処理理が可能
  • 40. Amazon CloudSearch Update ! 6⽉月26⽇日 CLI/SDKで検索索およびドキュメントの更更新処理理が可能に $ aws cloudsearchdomain search -‐‑‒-‐‑‒endpoint-‐‑‒url https://xxx.ap-‐‑‒northeast-‐‑‒1.cloudsearch.amazonaws.com/ -‐‑‒-‐‑‒search-‐‑‒query james { status: { rid: hNOPlP8oCgqnCm0=, time-‐‑‒ms: 3 }, hits: { found: 304, hit: [ { fields: { rating: 7.5,
  • 41. Amazon CloudSearch Update ! 8⽉月14⽇日 Identity and Access Management(IAM)との連携強化 • 特定のリソースに関する特定のオペレーションを制御 { Version:2012-‐‑‒10-‐‑‒17, Statement: [ { Effect: Allow, Action: [cloudsearch:search, cloudsearch:List*], Resource: arn:aws:cloudsearch:us-‐‑‒east-‐‑‒1:xxx:domain/movies” Condition:{IpAddress:{aws:SourceIp:192.0.2.0/32}} } ] }
  • 42. Amazon CloudSearch Update ! CloudTrail対応 • AWS APIの呼び出しを記録するサービス。以下の情報を記録 API 呼び出し元の ID API 呼び出し元のソース IP アドレス リクエストのパラメータ AWS サービスから返された応答要素
  • 43. Amazon CloudSearch Update ! Indexing Bigrams • Bi-‐‑‒gramでのインデクシング ! Customizing Japanese Tokenization • 形態素解析辞書のカスタマイズ
  • 44. ! Indexing Bigrams • CJK(中国語、⽇日本語、韓国語)に対応 • Analysis Scheme で Multiple Languages を選択いただく ことでBi-‐‑‒Gramでのインデクシングが可能になります • 検索索の取りこぼしを無くす事が可能 • 但しノイズの対応が必要な場合も – 例例: “東京都”を”京都”で検索索 – 形態素解析フィールドでヒットした際のスコアを上げる等
  • 45. ! Customizing Japanese Tokenization • 禿銅/ググる/⾹香具師といった辞書にない⾔言葉葉でもトークナイズ可能 • 特に⽇日本のお客様から多くのご要望をいただいていた機能
  • 49. Tokenization Dictionary ! CLIでも登録可能 { AnalysisSchemeName: jascheme, AnalysisSchemeLanguage: ja, AnalysisOptions: { JapaneseTokenizationDictionary: [ [⽇日本経済新聞,⽇日本 経済 新聞,ニホン ケイザイ シンブン,カスタム名詞], [トートバッグ,トート バッグ,トート バッグ,かずカナ名詞], [朝⻘青⿓龍龍,朝⻘青⿓龍龍,アサショウリュウ,カスタム⼈人名] ] } } $ aws cloudsearch define-‐‑‒analysis-‐‑‒scheme -‐‑‒-‐‑‒region us-‐‑‒east-‐‑‒1 -‐‑‒-‐‑‒domain-‐‑‒name mydomain -‐‑‒-‐‑‒analysis-‐‑‒scheme file://jascheme.txt
  • 50. Amazon CloudSearch Deep Dive ! Agenda • Who am I • Amazon CloudSearch Overview • Amazon CloudSearch Update • Inside Amazon CloudSearch • Amazon CloudSearch Pro Tips • Wrap up
  • 51. Automatic Scaling ! ドキュメントのサイズ/数および検索索リクエスト数によって⾃自動的にスケール データ量量増加に ⾃自動対応 検索索アクセス増加に ⾃自動対応
  • 52. Inside Amazon CloudSearch ! Lucene/Solr Revolution 2014 で A9 の Tomás が詳細を発表
  • 53. Inside Amazon CloudSearch ! Amazon CloudSearch の Indexing Processing Script QueuingBatching Amazon EC2 Amazon EC2 Amazon CloudSearch Amazon SQS Source System Search Data Format (SDF)
  • 54. ! Amazon CloudSearch の Indexing P1 EC2 P2 EC2 EC2 ELB P3 batch § どの Partition も Indexing Node になる § ELB(AWSのマネージドなバランサ)での振り分け § インスタンスタイプによってスレッド数が異異なる
  • 55. ! Amazon CloudSearch の Indexing S3DynamoDB EC2 P1 batch Document Service 200 § BatchデータはS3。メタデータはDynamoDB § Document Serviceは処理理を終えたら200(OK)を返す
  • 56. ! Amazon CloudSearch の Indexing S3DynamoDB Updater ProcessSolr EC2 P1 Document Service § インデクシングしたバイナリをS3。メタデータを更更新 § 各ノードはS3から⾃自分が担当分のバイナリを取得してSolrへ
  • 57. Amazon S3の概要 東京リージョン 世界中の拠点(リージョン)から選択 3か所以上で ⾃自動複製 バケット ⾼高い耐久性で データ失わない: 99.999999999% データセンターA データ置くだけ。インフ ラ、電源、気にしない。 容量量無制限。 データセンターB ファイルデータセンターC ⇒ テキスト、画像、動画 保存するデータは、⾃自動 で暗号化することも可能 安価な従量量課⾦金金 1GB/⽉月 : 約3.5円
  • 58. ! Amazon CloudSearch の Query P1 EC2 P2 EC2 EC2 ELB P3 query § インデクシングと同じようにELB経由で割り振って分散検索索 § インスタンスタイプやクエリの重い軽いによって捌ける数が異異なる
  • 59. ! Amazon CloudSearch の Query u クエリの負荷状況によって Auto Scaling による Replication • Auto ScalingはEC2の負荷に応じて⾃自動的に拡⼤大/縮⼩小する仕組み • 例例) CPU使⽤用率率率が5分以上継続して70%以上だったら2台追加 ELB EC2EC2 Auto Scaling Group Auto Scaling 負荷状況を監視 CloudWatch ELBの振り分けに追加 EC2EC2 EC2を追加構築
  • 60. ! Amazon CloudSearch の Query Auto Scaling Group P1 EC2 Auto Scaling Group P2 EC2 Auto Scaling Group P3 EC2
  • 61. ! Amazon CloudSearch の Query Auto Scaling Group P1 EC2 Auto Scaling Group P2 EC2 Auto Scaling Group P3 EC2 P1 EC2 P2 EC2 P3 EC2 P1 EC2 P2 EC2 P3 EC2
  • 62. ! Amazon CloudSearch の Data Scaling SmallMediumLarge § データサイズによってスケールアップ § 古いインスタンスでリクエストを受け付けながら⾏行行うので ”No downtime”でサービスを継続
  • 63. ! Amazon CloudSearch の Data Scaling Index Index P1 Amazon Index P2 EMR § スケールアップでまかなえなくなったらEMR (AWSのHadoopサービス)でインデックスを分割してスケールアウト § 分割中は古いインスタンスがリクエストを受け付けるので ”No downtime”でサービスを継続 § 但し Eventual Consistency なモデルなので考慮は必要
  • 64. ! Amazon CloudSearch で Configuration が変更更された時 Index A Amazon EMR Index B § 検索索ドメインの設定が変更更されてインデックスをやり直さなければな らない場合は裏裏でEMRで実⾏行行 § 新しいインデックス作成中は古いインデックスでリクエストを受け付 けるので”No downtime”でサービスを継続
  • 65. Inside Amazon CloudSearch ! 内部ではAWSの様々なサービスが使われています • CloudSearchを使う上ではユーザーの皆さまが意識識していただく 必要はございません • 但し、CloudSearchは主に、インスタンスが何台・何時間稼働し たか?という課⾦金金体系であるため、重いクエリが頻繁に叩かれて レプリケーションが多くなると料料⾦金金がかさむ可能性があります • 現在どのような形でメトリクスを提供するか検討しています
  • 66. Amazon CloudSearch Deep Dive ! Agenda • Who am I • Amazon CloudSearch Overview • Amazon CloudSearch Update • Inside Amazon CloudSearch • Amazon CloudSearch Pro Tips • Wrap up
  • 67. Amazon CloudSearch Pro Tips ! 11⽉月に開催された『AWS re:Invent 2014』にて Jon Handler が Amazon CloudSearchの”Deep Dive and Best Practices”で登壇 • Jonは5⽉月にCloudSearchを 紹介しに東京に来てくれました!
  • 68. Amazon CloudSearch Pro Tips ! Pro Tips 1: Use Maximum Batches • CloudSearchは上限5MB(ドキュメント数は収まる範囲ならいくつでもOK)で インデクシングしていただくのが最も⾼高いスループットで低いレイテンシ • 1000件のインデクシングリクエスト毎に0.10USDなので、コスト的にも有利利 • ⼿手前にSQSを挟んで処理理していただくケースも • SDK/CLIの CloudSearchDomainでインデクシングしていただくと便便利利 例例: $ aws cloudsearchdomain upload-‐‑‒documents〜~
  • 69. Amazon CloudSearch Pro Tips ! Pro Tips 2: Increase Instance type for load-‐‑‒in • 多重度度を上げてデータ投⼊入で短時間に⼤大量量データのインデクシングをする • ⼤大量量のQueryが発⽣生する際はDesiredでレプリケーション数を上げておく • インスタンスタイプ毎のデータ量量やスレッド数の⽬目安の紹介も!
  • 70. Amazon CloudSearch Pro Tips ! Pro Tips • 他にも様々なTipsが紹介されているので是⾮非ご覧ください! • 発表資料料: http://goo.gl/pklAzW • Youtube: http://youtu.be/OeHaj1a66I4
  • 71. Amazon CloudSearch Deep Dive ! Wrap up • CloudSearchは⽇日本でも様々なサービスで利利⽤用されています • CloudSearchはフルマネージドなクラウド型検索索エンジンです • CloudSearchは2014年年に様々なアップデートを⾏行行いました • CloudSearchはLucene/SolrにContributeしています • CloudSearchはAWSの様々なサービスを利利⽤用しています • CloudSearchのTipsが公開されているので是⾮非御覧ください
  • 72. Amazon CloudSearch Deep Dive ! 導⼊入をご検討中の⽅方は是⾮非お声がけください • 2014年年11⽉月、最⼤大で50%の値下げを実施しました
  • 73. Amazon CloudSearch Deep Dive ! 最後に、、 2015年年も多くのアップデートを予定しています! I believe we can make you say WOW!!