Altitude NY 2018: Observability workshop

Fastly presents
Observability
workshop
April 17, 2018 · Peter Bourgon

NYC
presents
Context-setting:
The 3 Pillars
of Observability
Instrumentation
Methodology
Observability
Scenarios
Observability workshop

NYC
presents
Technique
Classification
Definition System
Classification
Context-setting:
The 3 Pillars of Observability

NYC
presents
☂ Observability is an
umbrella term

NYC
presents
☂
Monitoring and Observability, Cindy Sridharan

NYC
presents
Observability: a Manifesto, Honeycomb
☂ Manifesto

NYC
presents
Monitoring in the time of Cloud-Native, Cindy Sridharan
☂

“Observability is a system attribute.”
Monitoring isn’t Observability, Baron Schwartz, VividCortex

Corollary:
There are different techniques to
achieve observability in a system.

NYC
presents
Observability
Technique
Classification
Black-box White-box

NYC
presents
Observability
Technique
Classification
Black-box White-box
Gray-box

NYC
presents
Observability
Technique
Classification
CPU utilization Goroutine count
Memory utilization
HTTP 503s
Last GC pause duration

NYC
presents
Observability
Technique
Classification
CPU utilization Goroutine count
Memory utilization Last GC pause duration
Measurements, or
Observations
HTTP 503s

NYC
presents
Observability
Technique
Classification
Metrics
Logging
Tracing

NYC
presents
Observability
Technique
Classification
Metrics
Counter Gauge Histogram
Add Set Observe
Labels
K/V pairs

NYC
presents
Observability
Technique
Classification
Logging
Structured {"db_err_code": 14002, ...}
Unstructured "[WARN] DB error: 14002 ..."

NYC
presents
Observability
Technique
Classification Tracing
Trace T1
Span S1 < T1 Span S3 < T1
Span S2 < S1

NYC
presents
Observability
Technique
Logging
Aggregatable
Request-scoped
Discrete events
Metrics

NYC
presents
Observability
Technique
Logging
Aggregatable
Request-scoped
Discrete events
Metrics
Aggregatable
events
Request-scoped
metrics
Request-scoped
events
Request-scoped
aggregatable
events

NYC
presents
Observability
Technique
Classification
TracingLogging Metrics
Investigation
Reaction
OpEx
CapEx
May
Contain
Opinions

NYC
presents
Observability
Technique
Classification
Investigation
Reaction
OpEx
CapEx Low Medium High
May
Contain
Opinions

NYC
presents
Observability
Technique
Classification
Investigation
Reaction
OpEx
CapEx Low Medium
High Low Medium
High
May
Contain
Opinions

NYC
presents
Observability
Technique
Classification
Investigation
Reaction
OpEx
CapEx Low Medium
High Low
Low
Medium
Medium
High
High
May
Contain
Opinions

NYC
presents
Observability
Technique
Classification
Investigation
Reaction
OpEx
CapEx Low Medium
High Low
Low
Low
Medium
Medium
Medium
High
High
High
May
Contain
Opinions

All parts of a
Complete Breakfast

NYC
presents
Observability
Systems
Classification
White-box
Black-box

NYC
presents
Observability
Systems
Classification
White-box
Black-box
Fastly
Logging
Fastly
Real-time
Analytics
Envoy?
Istio?

NYC
presents
Observability
Systems
Classification
White-box
Black-box
Fastly
Logging
Fastly
Real-time
Analytics
Envoy?
Istio?
Elastic
OK Log
Splunk
Honeycomb
Prometheus
StatsD+etc.
Librato
Datadog
Zipkin
Jaeger
LightStep
AWS X-Ray

Black-box

NYC
presents
● https://docs.fastly.com/api/analytics
● Requires API token
● Requires Service ID
Fastly’s Real-time Analytics

NYC
presents
● https://docs.fastly.com/api/logging
● Configured entirely in web UI
Fastly’s Remote Logging

Black-box White-box

NYC
presents
Service architecture
Preprocessor DB Postprocessor
API
HTTP Request HTTP Response

NYC
presents
Logging
Logging
API

NYC
presents
● Middleware or Decorator pattern keeps code clean
● Structured logging whenever possible
● Minimize log events, maximize contextual information
○ More detail is generally better
Logging methodology

NYC
presents
Metrics
Metrics
API

NYC
presents
● RED or USE methods
● Be cognizant of label cardinality
● Be thoughtful about what you instrument
○ Fewer, more considered metrics are generally better
Metrics methodology

NYC
presents
Tracing
Tracing
API

NYC
presents
● 100% tracing “coverage” is essential
● Start small, add K/V as necessary
● Be aware of operational costs
○ In practice, traces are always highly sampled
Tracing methodology

NYC
presents
Fully instrumented
API

Scenario 1:
Elevated rates of 401s
The R & E in RED

Scenario 2:
Curious latency spikes
The D in RED

NYC
presents
Observability
Summary
Black-box White-box
Gray-box

NYC
presents
Observability
Summary Tracing
Logging
Aggregatable
Request-scoped
Discrete events
Metrics

NYC
presents
Observability
Summary

NYC
presents
Observability
Summary
Further reading...
● Monitoring and Observability, Cindy Sridharan
● Monitoring isn't Observability, Baron Schwartz
● Metrics, tracing, and logging, Peter Bourgon
● USE and RED methods, Baron Schwartz
● Ch. 6: Monitoring Distributed Systems, Google SRE book
● Instrumentation Best Practices, Prometheus

Altitude NY 2018: Observability workshop

Recommended

Recommended

More Related Content

Similar to Altitude NY 2018: Observability workshop

Similar to Altitude NY 2018: Observability workshop (20)

More from Fastly

More from Fastly (20)

Recently uploaded

Recently uploaded (20)

Altitude NY 2018: Observability workshop