More Related Content
Similar to JPN_Elastic Corporate Deck_March2016_Japan_v3
Similar to JPN_Elastic Corporate Deck_March2016_Japan_v3 (20)
JPN_Elastic Corporate Deck_March2016_Japan_v3
- 15. 15
Thu 31
Smooth Average Data Value Upper Control Limit
August Aug 03 Tue 05 Thu 07 Sat 09 Mon 11 Wed 13 Fri 15 Aug 17 Tue 19
10
20
30
40
50
60
70
10
20
30
40
50
60
70
パイプライン集計
平滑滑移動平均 データ値 上部管理理限界線
- 23. 23
取り込み
• データ収集とリッチ化:
200種類以上のプラグイン
• 次世代データパイプライ
ン:マイクロバッチ。イベ
ントのグループを処理理
ES-Hadoop
• 軽量量型データシッパーを
構築するためのプラット
フォーム
• ホストベースの数値指標
やあらゆるデータを
Elasticsearchに転送
• HDFS、Spark、
MapReduceなどとの統
合を⾏行行う双⽅方向型のコネ
クタ
• Hadoopデータに関する
リアルタイムの検索索クエ
リを実現
- 60. 60
ケーススタディ: 株式会社はてな(はてなブックマーク)
• 課題/背景
– はてなブックマークはユーザーの活動の集約と編集スタッフの編成
によるソーシャルブックマークサービスを提供
– 当初導⼊入したSolrでは、運⽤用⾯面、index・検索索クエリの仕様の貧弱さ、
リアルタイム検索索の弱さなどが課題であった
• ソリューション
– サービスに蓄積された過去から現在までの価値あるユーザーデータ
をより活⽤用するためElasticsearchへの移⾏行行を実施した
• 導⼊入効果
– 検索索基盤のリッチ化により、新企画の⾃自由度度が向上
– ニューストピックの⾃自動認識識、ユーザーの好みに応じた配信をする
ニュースアプリ、検索索精度度改善といった技術的にチャレンジな内容
に挑戦しやすくなった
• 今後
– はてなが運営するあらゆるサービスの価値ある情報を横断的に抽出
し、各サービスの価値を最⼤大化する検索索・集約基盤の構築を⽬目指す
- 61. 61
ケーススタディ: 株式会社ドワンゴ
• 課題/背景
– どのようにして、⽉月800万を超えるアクティブユーザーに対して、増えていくサービスの検索索を
提供していくかが課題であった
– 全⽂文検索索に求められる要件の質は⾼高まっており、導⼊入コストを下げるためにも全社的な統合検索索
基盤が求められていた
• ソリューション
– サービスを横断する統合検索索基盤として、全⽂文検索索を1秒以内という安定した応答性能で提供で
きるようにする
– 増加するサービスとユーザーに対して、無停⽌止かつ、適切切なタイミングで、スケールアウトでき
るようにするなど
• 導⼊入効果
– コンテンツ到達時間の短縮
– メンテナンスのコスト低下など
• 今後
– 数億件規模のユーザーのお気に⼊入りデータの検索索や、ユーザーのアクションを検索索することによ
るタイムライン機能への活⽤用などを計画
- 62. 62
ケーススタディ: 株式会社ビズリーチ
• 課題/背景
– 当初はクラウド型の全⽂文検索索サービスも検討していたが、
検索索精度度の詳細なチューニングができなかった
• ソリューション
– Elasticsearch / Elasticsearch for Hadoop 2.1
– Apache Spark 1.3 でのシステム構築
• 導⼊入効果
– プラグインを活⽤用することで検索索結果の柔軟な
チューニングを⾏行行うことができるようになった
– Apache Sparkと組み合わせることで⼤大量量データの
⾼高速なインデキシングが可能になった
• 今後
– 柔軟なクラスタ構成を活かし、負荷分散しつつメンテナ
ンスコストを下げる⼯工夫をしていきたい
⽇日本最⼤大級の求⼈人検索索エンジン
「スタンバイ」
- 63. 63
ケーススタディ – 株式会社ホットリンク
• 課題/背景
– 数百億のソーシャルメディアを瞬時に検索索が必要
– メディアに合わせた⾼高度度な分析がリアルタイムで必要
– 増え続けるデータに対して柔軟にスケールが必要
• ソリューション
– Elasticsearch
• 導⼊入効果
– 数百億の記事検索索が1秒以内に可能
– ⾃自然⾔言語処理理の分析プラグインをElasticsearch⽤用に作成し、
Elasticsearchを活⽤用したSNS分散分析フレームワークの構築
を実現。(Hazelcast,akka/Dynamoとの連動)
– データ増に対して柔軟にサーバーの台数増加で対応可能に
• 今後
– さらに世界各国のソーシャルメディアを投⼊入
– ⾼高度度な分析フレームワークをマルチランゲージ対応
- 64. 64
ケーススタディ– 株式会社インティメート・マージャー
• 課題/背景
– 既存のビッグデータソリューションでは、数億件のデー
タのアドホックな集計・分析が応答速度度的に困難であっ
たため、検索索エンジンで対応可能なものを探していた
• ソリューション
– Elasticsearch + Python Client
• 導⼊入効果
– 容量量や性能のスケールアウトが可能に
– 億件単位のデータの集計が数秒で⾏行行えるようになった
• 今後
– 検索索対象となるドキュメント数の増加や、スキーマの変
更更があったため、再度度パフォーマンスのチューニングを
⾏行行っていく予定
- 65. 65
ケーススタディ– BlogPeople
• 課題/背景
– 膨⼤大なブログ記事の全⽂文検索索をMySQLにより実装して
いたが、⽇日々増加するデータに耐えきれずにいた
• ソリューション
– Elasticsearch 1.5.2 + kuromoji1.5
• 導⼊入効果
– CPU負荷もほとんどかかることなくインデックス化及び
検索索処理理が可能に。
– 導⼊入及び実装にわずか数⽇日しかかからなかった。
• 今後
– Elasticsearchに対する理理解がまだ深くないので、今後よ
り学習しよりよい検索索結果が得られるようチューニング
していく
- 67. 67
ケーススタディ– 株式会社クラウドワークス
• 課題/背景
– 「クラウドワーカーや仕事の検索索」というコアな機能を
InnoDB FTSで実装していた
– サービスが成⻑⾧長するに伴いボトルネックに
• ソリューション
– Elasticsearch + analysis-‐‑‒kuromoji on Found
– 性能・リソース監視はNewRelicやDatadog
• 導⼊入効果
– クラウドワーカーや仕事の検索索が平均10倍速に
– サービス無停⽌止でスケールアップ・ダウン、
データ構造の変更更が可能に
• 今後
– サービスのより多くの機能にElasticsearchを横展開
- 68. 68
ケーススタディ– Increments株式会社
• 課題/背景
– Qiitaでは当初、MySQLでのLIKE SQLで検索索を⾏行行っていましたが、検索索対象や検索索回数の増
加、タグやストック数等のメタデータによる絞り込みなどを実現するために、Elasticsearch
を導⼊入しました。
• ソリューション
– 検索索アクションの応答性が改善しました。
– また、クエリの表現⼒力力が⾼高いので、新しくあがってくる要求にも、インデックスの変更更を伴わ
ない限りは、柔軟に対応できるようになりました。
• 導⼊入効果
– “Elasticsearchでこういうことができるけど、これをQiitaに⽣生かせないか?”という技術ドリブ
ンで施策を思いつくことがあります。
• 今後
– 検索索システム以外にも、情報の集約等を⾏行行っていきたいと考えています。また、Kibanaなど
のツールの導⼊入も検討していきたいです。