Monitorer l'inconnu, 1000 * 100 series par jour - talk avec @clementd à #devoxxFR 2018

@clementd & @waxzce
Monitoring the Unknown
1000*100 series a day
Quentin Adam / @waxzce
Clément Delafargue / @clementd

@clementd & @waxzce
Who are we?
Quentin 🐧
ADAM
CEO
@ Clever Cloud
@waxzce on twitter
Clément
DELAFARGUE🐇
CTO
@ Clever Cloud
@clementd on Twitter

@clementd & @waxzce
What is Clever Cloud?

@clementd & @waxzce
You need metrics

@clementd & @waxzce
Metrics are not just for ops

@clementd & @waxzce
… but most tools stay ops-oriented

@clementd & @waxzce
Developers also deserve metrics

@clementd & @waxzce
Not just for forensics

@clementd & @waxzce
We need metrics for devs and ops

@clementd & @waxzce
We need metrics for DevOps

@clementd & @waxzce
We still live in a serverful world

@clementd & @waxzce
Cross-compare application-level
and system-level metrics

@clementd & @waxzce
A brave new world

@clementd & @waxzce
An immutable new world
Understand immutable infrastructure
by @waxzce
https://www.youtube.com/watch?v=WrZCbgQsPVU

@clementd & @waxzce
Pet versus Cattle

@clementd & @waxzce
1 service, many servers

@clementd & @waxzce
More is more

@clementd & @waxzce
More volume

@clementd & @waxzce
More series

@clementd & @waxzce
How we do it at

@clementd & @waxzce
We don’t know the apps we have to monitor

@clementd & @waxzce
Metrics collection

@clementd & @waxzce
Collection agent

@clementd & @waxzce
We chose telegraf

@clementd & @waxzce
JVM agent
to grab
JMX data

@clementd & @waxzce
Extensibility with statsd

@clementd & @waxzce
Extensibility with prometheus

@clementd & @waxzce
Push / Pull metrics

@clementd & @waxzce
How do we store all that?

@clementd & @waxzce
Humongous volume

@clementd & @waxzce
Various access patterns

@clementd & @waxzce
Time Series DataBase

@clementd & @waxzce
What are time series?

@clementd & @waxzce
What you need to pay attention to

@clementd & @waxzce
Real time raw points access

@clementd & @waxzce
Analysis capabilities

@clementd & @waxzce
Cardinality

@clementd & @waxzce
Prometheus

@clementd & @waxzce
ElasticSearch

@clementd & @waxzce
Home-made solution based on Cassandra

@clementd & @waxzcehttps://github.com/cityzendata/warp10-platform / http://www.warp10.io/
Warp10
Plain old java
Standalone version fat jar using levelDB
GeoTime Series

@clementd & @waxzce
Awesome Distributed system

@clementd & @waxzce
Token-based access

@clementd & @waxzce
Consumption

@clementd & @waxzce
Raw data access

@clementd & @waxzce
WarpScript

@clementd & @waxzce
"<TOKEN>"
'cpu.usage_user'
{ 'host' '<instance>' 'app_id' '=<app_id>'}
NOW -140
FETCH
<open in Quantum>

@clementd & @waxzce
[
$POINTS
bucketizer.mean // bucketizer
0 // lastbucket
0 // bucketspan
5 // bucketcount
]
BUCKETIZE
<open in quantum>

@clementd & @waxzce
[
$POINTS
mapper.rate // mapper
1 // before
0 // after
0 // points
]
MAP
<open in quantum>

@clementd & @waxzce
[
$POINTS
[ ‘app_id’ ]
reducer.mean.exclude-nulls
]
REDUCE
<open in quantum>

@clementd & @waxzce
Full reference
http://www.warp10.io/reference/reference/

@clementd & @waxzce
Triggers / μBatching

@clementd & @waxzce
Build a new series on a series, recompute the
data, become smarter and smarter

@clementd & @waxzce
Poke, good place to get sample
https://poke.digital
https://docs.google.com/presentation/d/1RfpX-KdfAa5ZxsnuRYi34JbidbVVUcz7bYy5x-
k6BBE/edit?usp=sharing
https://www.pscp.tv/waxzce/1OwGWEEvapkxQ?t=4m51s

@clementd & @waxzce
We’ve got a lot of data points.
Good.
Now what?

@clementd & @waxzce
Graphs are good.

@clementd & @waxzce
Graphs without units… not so good

@clementd & @waxzce
Data good.
Meaning better.

@clementd & @waxzce
Metrics-spec
(collaboration with the OVH metrics team)
https://github.com/CleverCloud/metrics-spec

@clementd & @waxzce
What you should look for
when you build
your own metrics pipeline.

@clementd & @waxzce
List what you’ll need,

@clementd & @waxzce
Collect more

@clementd & @waxzce
Mind the ACLs (or lack thereof)

@clementd & @waxzce
Visualize, then analyze

@clementd & @waxzce
Thanks
@waxzce & @clementd
Try 💡☁, here is a voucher:
metrics4devoxx

Monitorer l'inconnu, 1000 * 100 series par jour - talk avec @clementd à #devoxxFR 2018

Recommended

Recommended

More Related Content

Similar to Monitorer l'inconnu, 1000 * 100 series par jour - talk avec @clementd à #devoxxFR 2018

Similar to Monitorer l'inconnu, 1000 * 100 series par jour - talk avec @clementd à #devoxxFR 2018 (20)

More from Quentin Adam

More from Quentin Adam (20)

Recently uploaded

Recently uploaded (20)

Monitorer l'inconnu, 1000 * 100 series par jour - talk avec @clementd à #devoxxFR 2018

Editor's Notes