SlideShare a Scribd company logo
卢亿雷 from AdMaster(精硕科技)
ElasticSearch分析与实践
内容
• ElasticSearch特点及⽣生态圈

• Lucene原理

• ElasticSearch架构和插件

• ElasticSearch管理和监控⼯工具

• ElasticSearch应⽤用案例

• ELK实践
ElasticSearch特点及⽣生态圈
• 分布式实时分析与检索

• ⾼高可⽤用

• 多租户

• 全⽂文搜索

• ⾯面向⽂文档

• 易⽤用的Restful API

• 基于Apache Lucene
ElasticSearch特点及⽣生态圈
——ELK
ElasticSearch特点及⽣生态圈
——ES-Hadoop
ElasticSearch特点及⽣生态圈
——ES-Beats
ElasticSearch特点及⽣生态圈
Packetbeat Topbeat
Filebeat Winlogbeat
• 索引创建-Indexing
Lucene原理
• 索引查询-Search index
• 索引创建indexing
Lucene原理
Docs Token Term Index
• 倒排索引表
Lucene原理
• 索引查询
Lucene原理
query Term 语法树 doc
词法 语法 检索
result
打分
• 索引查询,权重计算,相关性判断
Lucene原理
• VSM向量空间模型
ElasticSearch架构和插件
• 分词插件

• 同步插件

• 数据传输插件

• 脚本插件

• Alert

• Shield
ElasticSearch架构和插件
ElasticSearch-Aggregations
Like facets but with more power
Can be nested to add additional dimensions
Give analytical insights into data
Allow complex visualizations
Major types: buckets and metrics
Types: terms, histogram, percentiles, etc.
ElasticSearch-Pipeline Aggregations
Work on outputs of other aggregations
Used for smoothing, prediction, etc.
Different types: avg, derivative, max, min, sum moving avg, cumulative sum, etc.
• kopf——优秀的监控和管理⼯工具
ElasticSearch管理和监控⼯工具
• big desk
ElasticSearch管理和监控⼯工具
• 集群整体和流量情况
• Marvel, 官⽅方监控插件
ElasticSearch管理和监控⼯工具
ElasticSearch应⽤用案例
测试条件:
• 记录条数分为100亿以内和1000亿条
• 服务器数量为70台,配置为:CPU 12核,内存96G,硬盘48T
• 测试语句:select count(*) from test where age > 25 and ge
0 and os > "500" and sc in
("0001009","0002036","0016030",”…") or bs>585 and gro
by age,gender,os,bs
• 总共14列(200列):动态列为3列(多值列),普通列为11列
ElasticSearch应⽤用案例
1000 5 10
ElasticSearch 19005ms 21005ms 27736ms
Pinot 19019ms failed failed
Mysql
Report
Web
数据采集服务	
  
WebService
数据收集服务  
Kafka
数据清洗服务	
  
Storm
API
API
V/C数据
项  目
量⼦子平台
数据中⼼心
SocialMaster
算法服务
Mysql
⼲⼴广告数据
外部合作数据
新闻等爬取数据
⼲⼴广告数据
外部合作数据
新闻等爬取数据
⼲⼴广告数据
外部合作数据
新闻等爬取数据
HBase	
  
HDFS
数据处理
API
ElasticSearch
API
分词
情感分
析
标签分
类
NLP	
  
Lap
NLP	
  服务
机器学习
核⼼心应⽤用模块
ElasticSearch数字营销案例
ELK实践
ELK实践
• 设置时间过滤器  
• 搜索并将搜索保存  
• 页面自动刷新  
• 按字段过滤  
• 文档列表排序  
• 查看字段数据统计
25
Kibana-Discover
• 创建图表:
• 选择可视化图表类型
• 选择数据源(已保存的搜索或新的搜索)
• 配置
Y轴的聚合类型:count, average, sum, min, max,
cardinality(unique count)
26
Kibana-Visualize
ELK实践
Q & A
  邮箱:johnlya@163.com  
  微信:johnlya  
源码:  
http://github.com/elastic  
英文社区:  
http://discuss.elastic.co  
中文社区:  
http://elasticsearch.cn  

More Related Content

What's hot

Elastic Stack 最新动态
Elastic Stack 最新动态Elastic Stack 最新动态
Elastic Stack 最新动态
Elasticsearch
 
Elastic stack day-2
Elastic stack day-2Elastic stack day-2
Elastic stack day-2
YI-CHING WU
 
Partner Session - Alibaba
Partner Session - Alibaba Partner Session - Alibaba
Partner Session - Alibaba
Elasticsearch
 
OpenResty & Node.js 开发GateWay
OpenResty & Node.js 开发GateWayOpenResty & Node.js 开发GateWay
OpenResty & Node.js 开发GateWay
Orangle Liu
 
CH09:Collection與Map
CH09:Collection與MapCH09:Collection與Map
CH09:Collection與Map
Justin Lin
 
查詢調校不求人
查詢調校不求人查詢調校不求人
查詢調校不求人
Rico Chen
 
Ch13 整合 Spring MVC/Security
Ch13 整合 Spring MVC/SecurityCh13 整合 Spring MVC/Security
Ch13 整合 Spring MVC/Security
Justin Lin
 

What's hot (7)

Elastic Stack 最新动态
Elastic Stack 最新动态Elastic Stack 最新动态
Elastic Stack 最新动态
 
Elastic stack day-2
Elastic stack day-2Elastic stack day-2
Elastic stack day-2
 
Partner Session - Alibaba
Partner Session - Alibaba Partner Session - Alibaba
Partner Session - Alibaba
 
OpenResty & Node.js 开发GateWay
OpenResty & Node.js 开发GateWayOpenResty & Node.js 开发GateWay
OpenResty & Node.js 开发GateWay
 
CH09:Collection與Map
CH09:Collection與MapCH09:Collection與Map
CH09:Collection與Map
 
查詢調校不求人
查詢調校不求人查詢調校不求人
查詢調校不求人
 
Ch13 整合 Spring MVC/Security
Ch13 整合 Spring MVC/SecurityCh13 整合 Spring MVC/Security
Ch13 整合 Spring MVC/Security
 

Viewers also liked

Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
VirtualTech Japan Inc.
 
Elassandra: Elasticsearch as a Cassandra Secondary Index (Rémi Trouville, Vin...
Elassandra: Elasticsearch as a Cassandra Secondary Index (Rémi Trouville, Vin...Elassandra: Elasticsearch as a Cassandra Secondary Index (Rémi Trouville, Vin...
Elassandra: Elasticsearch as a Cassandra Secondary Index (Rémi Trouville, Vin...
DataStax
 
Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search: S...
Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search: S...Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search: S...
Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search: S...
Spark Summit
 
Ken meter cashasta12.1
Ken meter cashasta12.1Ken meter cashasta12.1
Ken meter cashasta12.1
oursmartfarms
 
SEO Freelance
SEO FreelanceSEO Freelance
SEO Freelance
Simone Chiaromonte ✔
 
6 joseangelo-2confcmmiportugal-v3
6 joseangelo-2confcmmiportugal-v36 joseangelo-2confcmmiportugal-v3
6 joseangelo-2confcmmiportugal-v3
isabelmargarido
 
III Conferência CMMI Portugal, Presentation 6: Process Improvement in High Ma...
III Conferência CMMI Portugal, Presentation 6: Process Improvement in High Ma...III Conferência CMMI Portugal, Presentation 6: Process Improvement in High Ma...
III Conferência CMMI Portugal, Presentation 6: Process Improvement in High Ma...
isabelmargarido
 
III Conferência CMMI Portugal, Presentation 1: CMMI implementation using open...
III Conferência CMMI Portugal, Presentation 1: CMMI implementation using open...III Conferência CMMI Portugal, Presentation 1: CMMI implementation using open...
III Conferência CMMI Portugal, Presentation 1: CMMI implementation using open...
isabelmargarido
 
Ch1
Ch1Ch1
COL_P_MATHUR CV for Regional Manager
COL_P_MATHUR CV for Regional ManagerCOL_P_MATHUR CV for Regional Manager
COL_P_MATHUR CV for Regional Manager
Pradeep Mathur
 
Ameri doc bene presentation
Ameri doc  bene presentationAmeri doc  bene presentation
Ameri doc bene presentation
leeg69
 
測試用簡報
測試用簡報測試用簡報
測試用簡報
資訊 奇豐
 
Nom 001-sct-2-2012
Nom 001-sct-2-2012Nom 001-sct-2-2012
Nom 001-sct-2-2012
roberto0412
 
ความเฉื่อยในองค์กร
ความเฉื่อยในองค์กรความเฉื่อยในองค์กร
ความเฉื่อยในองค์กรLomony Tempopo
 
Prezentacja aplikacja ratownik
Prezentacja aplikacja ratownikPrezentacja aplikacja ratownik
Prezentacja aplikacja ratownikArtur Luzar
 
Uga 01
Uga 01Uga 01
Uga 01
Thangarasu A
 
Team 13365
Team 13365Team 13365
Team 13365
Wa'el Sabbagh
 
Esperimento della rana bollita di informazioni sanità
Esperimento della rana bollita di informazioni sanitàEsperimento della rana bollita di informazioni sanità
Esperimento della rana bollita di informazioni sanità
Valentina Mortini
 
Lxtees promo2012
Lxtees promo2012Lxtees promo2012
Lxtees promo2012
José Oliveira
 

Viewers also liked (20)

Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
Elastic Stackの紹介とOpenStackでの活用事例(Searchlightなど) - OpenStack最新情報セミナー 2016年5月
 
Elassandra: Elasticsearch as a Cassandra Secondary Index (Rémi Trouville, Vin...
Elassandra: Elasticsearch as a Cassandra Secondary Index (Rémi Trouville, Vin...Elassandra: Elasticsearch as a Cassandra Secondary Index (Rémi Trouville, Vin...
Elassandra: Elasticsearch as a Cassandra Secondary Index (Rémi Trouville, Vin...
 
Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search: S...
Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search: S...Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search: S...
Powering Predictive Mapping at Scale with Spark, Kafka, and Elastic Search: S...
 
Ken meter cashasta12.1
Ken meter cashasta12.1Ken meter cashasta12.1
Ken meter cashasta12.1
 
SEO Freelance
SEO FreelanceSEO Freelance
SEO Freelance
 
6 joseangelo-2confcmmiportugal-v3
6 joseangelo-2confcmmiportugal-v36 joseangelo-2confcmmiportugal-v3
6 joseangelo-2confcmmiportugal-v3
 
III Conferência CMMI Portugal, Presentation 6: Process Improvement in High Ma...
III Conferência CMMI Portugal, Presentation 6: Process Improvement in High Ma...III Conferência CMMI Portugal, Presentation 6: Process Improvement in High Ma...
III Conferência CMMI Portugal, Presentation 6: Process Improvement in High Ma...
 
III Conferência CMMI Portugal, Presentation 1: CMMI implementation using open...
III Conferência CMMI Portugal, Presentation 1: CMMI implementation using open...III Conferência CMMI Portugal, Presentation 1: CMMI implementation using open...
III Conferência CMMI Portugal, Presentation 1: CMMI implementation using open...
 
Ch1
Ch1Ch1
Ch1
 
COL_P_MATHUR CV for Regional Manager
COL_P_MATHUR CV for Regional ManagerCOL_P_MATHUR CV for Regional Manager
COL_P_MATHUR CV for Regional Manager
 
Ameri doc bene presentation
Ameri doc  bene presentationAmeri doc  bene presentation
Ameri doc bene presentation
 
測試用簡報
測試用簡報測試用簡報
測試用簡報
 
Nom 001-sct-2-2012
Nom 001-sct-2-2012Nom 001-sct-2-2012
Nom 001-sct-2-2012
 
ความเฉื่อยในองค์กร
ความเฉื่อยในองค์กรความเฉื่อยในองค์กร
ความเฉื่อยในองค์กร
 
Prezentacja aplikacja ratownik
Prezentacja aplikacja ratownikPrezentacja aplikacja ratownik
Prezentacja aplikacja ratownik
 
Uga 01
Uga 01Uga 01
Uga 01
 
Ihwal penerjemahan
Ihwal penerjemahanIhwal penerjemahan
Ihwal penerjemahan
 
Team 13365
Team 13365Team 13365
Team 13365
 
Esperimento della rana bollita di informazioni sanità
Esperimento della rana bollita di informazioni sanitàEsperimento della rana bollita di informazioni sanità
Esperimento della rana bollita di informazioni sanità
 
Lxtees promo2012
Lxtees promo2012Lxtees promo2012
Lxtees promo2012
 

Similar to elastic search分析与实践

搜索技术分享
搜索技术分享搜索技术分享
搜索技术分享endless_yy
 
全文搜尋引擎的進階實作與應用
全文搜尋引擎的進階實作與應用全文搜尋引擎的進階實作與應用
全文搜尋引擎的進階實作與應用建興 王
 
Elastic search
Elastic searchElastic search
Elastic search
Samchu Li
 
開放原始碼 Ch2.5 app - oss - 3rd party api(ver 1.0)
開放原始碼 Ch2.5   app - oss - 3rd party api(ver 1.0) 開放原始碼 Ch2.5   app - oss - 3rd party api(ver 1.0)
開放原始碼 Ch2.5 app - oss - 3rd party api(ver 1.0) My own sweet home!
 
Rest与面向资源的web开发
Rest与面向资源的web开发Rest与面向资源的web开发
Rest与面向资源的web开发
topgeek
 
Java 的開放原碼全文搜尋技術 - Lucene
Java 的開放原碼全文搜尋技術 - LuceneJava 的開放原碼全文搜尋技術 - Lucene
Java 的開放原碼全文搜尋技術 - Lucene
建興 王
 
01.uliweb介绍
01.uliweb介绍01.uliweb介绍
01.uliweb介绍modou li
 
开放源代码的全文检索Lucene
开放源代码的全文检索Lucene开放源代码的全文检索Lucene
开放源代码的全文检索Luceneyiditushe
 
Coreseek/Sphinx 全文检索实践指南
Coreseek/Sphinx 全文检索实践指南Coreseek/Sphinx 全文检索实践指南
Coreseek/Sphinx 全文检索实践指南
HonestQiao
 
RxJS 6 新手入門
RxJS 6 新手入門RxJS 6 新手入門
RxJS 6 新手入門
Will Huang
 
探索海量文章,Elasticsearch 建置和應用
探索海量文章,Elasticsearch 建置和應用探索海量文章,Elasticsearch 建置和應用
探索海量文章,Elasticsearch 建置和應用
Yi-Wei Lai
 
Sphinx 全文检索实践指南
Sphinx 全文检索实践指南Sphinx 全文检索实践指南
Sphinx 全文检索实践指南
Shaoning Pan
 
Itpub电子杂志第四期第二稿
Itpub电子杂志第四期第二稿Itpub电子杂志第四期第二稿
Itpub电子杂志第四期第二稿yiditushe
 
ElasticSearch Training#2 (advanced concepts)-ESCC#1
ElasticSearch Training#2 (advanced concepts)-ESCC#1ElasticSearch Training#2 (advanced concepts)-ESCC#1
ElasticSearch Training#2 (advanced concepts)-ESCC#1
medcl
 
基于 Flink 和 AI Flow 的实时推荐系统
基于 Flink 和 AI Flow 的实时推荐系统基于 Flink 和 AI Flow 的实时推荐系统
基于 Flink 和 AI Flow 的实时推荐系统
Dong Lin
 
CH1. 簡介 Web 應用程式
CH1. 簡介 Web 應用程式CH1. 簡介 Web 應用程式
CH1. 簡介 Web 應用程式
Justin Lin
 
DevOps Monitoring Tools 大亂鬥 - Azure Log Analytics 使用經驗分享
DevOps Monitoring Tools 大亂鬥 - Azure Log Analytics 使用經驗分享DevOps Monitoring Tools 大亂鬥 - Azure Log Analytics 使用經驗分享
DevOps Monitoring Tools 大亂鬥 - Azure Log Analytics 使用經驗分享
Robert Hu
 
ElasticSearch Introduction
ElasticSearch IntroductionElasticSearch Introduction
ElasticSearch Introduction
TsungWei Hu
 

Similar to elastic search分析与实践 (20)

搜索技术分享
搜索技术分享搜索技术分享
搜索技术分享
 
Lucene实践
Lucene实践Lucene实践
Lucene实践
 
全文搜尋引擎的進階實作與應用
全文搜尋引擎的進階實作與應用全文搜尋引擎的進階實作與應用
全文搜尋引擎的進階實作與應用
 
Elastic search
Elastic searchElastic search
Elastic search
 
開放原始碼 Ch2.5 app - oss - 3rd party api(ver 1.0)
開放原始碼 Ch2.5   app - oss - 3rd party api(ver 1.0) 開放原始碼 Ch2.5   app - oss - 3rd party api(ver 1.0)
開放原始碼 Ch2.5 app - oss - 3rd party api(ver 1.0)
 
Rest与面向资源的web开发
Rest与面向资源的web开发Rest与面向资源的web开发
Rest与面向资源的web开发
 
Java 的開放原碼全文搜尋技術 - Lucene
Java 的開放原碼全文搜尋技術 - LuceneJava 的開放原碼全文搜尋技術 - Lucene
Java 的開放原碼全文搜尋技術 - Lucene
 
01.uliweb介绍
01.uliweb介绍01.uliweb介绍
01.uliweb介绍
 
20130339广州
20130339广州20130339广州
20130339广州
 
开放源代码的全文检索Lucene
开放源代码的全文检索Lucene开放源代码的全文检索Lucene
开放源代码的全文检索Lucene
 
Coreseek/Sphinx 全文检索实践指南
Coreseek/Sphinx 全文检索实践指南Coreseek/Sphinx 全文检索实践指南
Coreseek/Sphinx 全文检索实践指南
 
RxJS 6 新手入門
RxJS 6 新手入門RxJS 6 新手入門
RxJS 6 新手入門
 
探索海量文章,Elasticsearch 建置和應用
探索海量文章,Elasticsearch 建置和應用探索海量文章,Elasticsearch 建置和應用
探索海量文章,Elasticsearch 建置和應用
 
Sphinx 全文检索实践指南
Sphinx 全文检索实践指南Sphinx 全文检索实践指南
Sphinx 全文检索实践指南
 
Itpub电子杂志第四期第二稿
Itpub电子杂志第四期第二稿Itpub电子杂志第四期第二稿
Itpub电子杂志第四期第二稿
 
ElasticSearch Training#2 (advanced concepts)-ESCC#1
ElasticSearch Training#2 (advanced concepts)-ESCC#1ElasticSearch Training#2 (advanced concepts)-ESCC#1
ElasticSearch Training#2 (advanced concepts)-ESCC#1
 
基于 Flink 和 AI Flow 的实时推荐系统
基于 Flink 和 AI Flow 的实时推荐系统基于 Flink 和 AI Flow 的实时推荐系统
基于 Flink 和 AI Flow 的实时推荐系统
 
CH1. 簡介 Web 應用程式
CH1. 簡介 Web 應用程式CH1. 簡介 Web 應用程式
CH1. 簡介 Web 應用程式
 
DevOps Monitoring Tools 大亂鬥 - Azure Log Analytics 使用經驗分享
DevOps Monitoring Tools 大亂鬥 - Azure Log Analytics 使用經驗分享DevOps Monitoring Tools 大亂鬥 - Azure Log Analytics 使用經驗分享
DevOps Monitoring Tools 大亂鬥 - Azure Log Analytics 使用經驗分享
 
ElasticSearch Introduction
ElasticSearch IntroductionElasticSearch Introduction
ElasticSearch Introduction
 

elastic search分析与实践