SlideShare a Scribd company logo
1 of 16
Download to read offline
1
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
2
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
ZENTRALES METRIKEN SYSTEM
… UND IST DER FLÜGELSCHLAG DES SCHMETTERLINGS SICHTBAR?"
3
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
THEMEN
1. WAS IST MOTIVATION FÜR ZIG
MILLIONEN METRIKEN?
2. WAS IST INFLUXDB UND OPENTSDB?
3. WAS NÜTZT TELEGRAF?
4. DEMO
5. AUSBLICK
4
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
WARUM ZENTRALE METRIKEN?
VORHANDENE SITUATION
• > x00’000 RRD und Whisper-Files (25k System-Metriken, 25k zusätzliche für alle vergessene,
viele 10ks Nagios RRDs, 50k Netzwerkmetriken, Whisper für Backup, Redmine, …)
• Die meisten «alten» Tools habe eine eigene Vorstellung von Graphik-Lagerung und Erstellung
• Zugreibarkeit
• Performance
• Daten Korrelationen schwierig bis gar nicht automatisch erstellbar
5
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
WARUM ZENTRALE METRIKEN?
• Ziele und Nutzen für nine.ch:
• ein Zentraler Metrik Speicher
• Die Metriken sind verteilt über alle Datacenters
• Zugreifbarkeit
• Auswertbarkeit
• Korrelationen (!)
• Bereits vorhandene Mathematik
• Modere Schnittstellen
• Supporting Funktionalität (wie Ausdünnung oder Round-Robin)
• Überarbeitung des Monitorings und Alertings durch Anflanschen an Metriken
• Kunden haben Einsicht in die Metriken der eigenen Systeme
• InfluxDB gewann das erste Stechen vor OpenTSDB und Prometheus
6
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
WAS IST INFLUXDB?
• InfluxDB ist eine verteilte Time Series Database
• … ohne weitere Abhängigkeiten
• … und OpenSource (MIT License)
• Rising Star
• Backend und DB komplett in Go geschrieben
(Minimierung der Bibliotheken Abhängigkeiten, Webservices Stack, Concurreny)
• Optimiert auf die Speicherung, Organisation und Auswertung von Metriken
(Timestamps, Tags, Verteilung der Daten mit Shards, SQL like Abfragesprache)
• Automatisches Verdichten und Ausdünnen
• REST API und integriertes Admin-Webinterface
• InfluxDB.com (> 25 Mitarbeiter @ US)
7
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
INFLUXDB @ NINE.CH
DESIGN UND WO WAREN WIR TO EARLY TO USE?
• Design und Setup InfluxDB Cluster 0.8.7
(Dezember 2014)
• puppet-influxdb (rewrite)
• Letzte Feature Enhance und Fix
Version des 0.8.x Branches Ende 2014
• Performance Lags (5-30 Sekunden) & Crashes
bei > 50’000 Metriken pro Minute
• Refactoring mit InfluxDB 0.9.x (33 RCs zur 0.9.0)
• bis und mit Version 0.9.2 jeweils am
Datenmengengerüst von nine.ch
und im Cluster gecrashed
• Im August 2015 “InfluxDB: Quo-Vadis? – Krise”
 Wechsel auf OpenTSDB als zentraler Metrik-Speicher
8
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
INFLUXDB STAND HEUTE
• InfluxDB auf dem Weg zur Version 1.0.0
• Bestrebung: Speed, neues Clustering, neue und ressourcen schonendere Storage
Engine, Speed
• InfluxDB 0.9.5 stabiler (Single Node Usage)
• InfluxDB 0.9.6 mit neuer Storage Engine (TSM) (WIP, Multi-Node-Cluster)
9
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
WAS IST OPENTSDB?
• OpenTSDB ist eine skalierende Time Series Database
• Datenhaltung und Verteilung ist ausgelagert in ein Cluster Setup mit
• Apache HBase
• Apache Hadoop
• Apache Zookeeper
• Zusätzliche Schreibkapazität mit zusätzlichen Nodes / Slaves
• Die Schreib- und Lese-Performance im BigData Bereich
• 2 Writer - APIs (Line-Protokoll, REST)
• Webinterface zur einfachen und schnellen
Auswertung (Graphiken mit GnuPlot)
• OpenTSDB.net (3 Personen-Projekt)
•
10
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
OPENTSDB @ nine.ch
11
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
METRIKEN SAMMELN, WIE ?
INFLUXDB TELEGRAF UM METRIKEN ZU SAMMELN UND SENDEN
• Telegraf ist ein Metrics Collector Deamon und schreibt diese an ein Time Series Backend
• Programmiert in Go und relativ schlank
• Plugins für Input (System-Metriken, Apache, nginx, MySQL, PostgreSQL, Elasicsearch, …)
• Plugins für Outputs (InfluxDB, OpenTSDB, Kafka, …)
• nine.ch Contributions:
• OpenTSDB Output Plugin
• Libvirtd Input Plugin
(und weil externe Abhängigkeit von nine.ch unterhaltenes Linux Package)
• Oekosystem Contributions:
• puppet-telegraf (unterstützt zusätzlich pro-service Config-Snippets (DBs))
12
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
DEMO / BEISPIELE @ nine.ch
13
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
DEMO / BEISPIELE @ nine.ch
14
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
AUSBLICK
• nine.ch verfolgt die Entwicklung von OpenTSDB und InfluxDB weiter
• Unsere Tool-Erweiterungen sind so gestrickt, dass sie beide TSDB unterstützen.
• Mehr Disk-Space für mehr Metriken (längere History, Wiederholungseffekte sind einsehbar)
• Mehr Metriken für den Endkunden einsehbar
15
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
Nine Internet Solutions AG
Albisriederstr. 243a
CH-8047 Zürich
Tel +41 44 637 40 00
Fax +41 44 637 40 01
info@nine.ch
FRAGEN?
16
TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0
#TechTalkThursday
Nine Internet Solutions AG
Albisriederstr. 243a
CH-8047 Zürich
Tel +41 44 637 40 00
Fax +41 44 637 40 01
info@nine.ch
DANKE FÜR DIE
AUFMERKSAMKEIT!

More Related Content

Similar to TechTalkThursday: Zentrales Metriken-System - ist der Flügelschlag des Schmetterlings sichtbar?

Drahtwanderung: Wir machen den NeXTen Schritt
Drahtwanderung: Wir machen den NeXTen SchrittDrahtwanderung: Wir machen den NeXTen Schritt
Drahtwanderung: Wir machen den NeXTen Schritt
Falk Hartmann
 
Einsatz von Subversion bei der Entwicklung technisch-wissenschaftlicher Software
Einsatz von Subversion bei der Entwicklung technisch-wissenschaftlicher SoftwareEinsatz von Subversion bei der Entwicklung technisch-wissenschaftlicher Software
Einsatz von Subversion bei der Entwicklung technisch-wissenschaftlicher Software
Andreas Schreiber
 

Similar to TechTalkThursday: Zentrales Metriken-System - ist der Flügelschlag des Schmetterlings sichtbar? (20)

openHAB @ rheinJUG Düsseldorf
openHAB @ rheinJUG DüsseldorfopenHAB @ rheinJUG Düsseldorf
openHAB @ rheinJUG Düsseldorf
 
1. Cloud Native Meetup Innsbruck, 23.11.2023
1. Cloud Native Meetup Innsbruck, 23.11.20231. Cloud Native Meetup Innsbruck, 23.11.2023
1. Cloud Native Meetup Innsbruck, 23.11.2023
 
micro services
micro servicesmicro services
micro services
 
Modernes Rechenzentrum - Future Decoded
Modernes Rechenzentrum - Future DecodedModernes Rechenzentrum - Future Decoded
Modernes Rechenzentrum - Future Decoded
 
Adxis Produkt Beschreibung
Adxis Produkt BeschreibungAdxis Produkt Beschreibung
Adxis Produkt Beschreibung
 
Developer Best Practices (Robotic Enterprise Framework REF) – Anwendung und d...
Developer Best Practices (Robotic Enterprise Framework REF) – Anwendung und d...Developer Best Practices (Robotic Enterprise Framework REF) – Anwendung und d...
Developer Best Practices (Robotic Enterprise Framework REF) – Anwendung und d...
 
Python Academy
Python AcademyPython Academy
Python Academy
 
Python Mike Müller
Python Mike MüllerPython Mike Müller
Python Mike Müller
 
Citrix Day 2013: Citirx Networking
Citrix Day 2013: Citirx NetworkingCitrix Day 2013: Citirx Networking
Citrix Day 2013: Citirx Networking
 
Continuous Delivery as a Way of Life
Continuous Delivery as a Way of LifeContinuous Delivery as a Way of Life
Continuous Delivery as a Way of Life
 
Language Workbench
Language WorkbenchLanguage Workbench
Language Workbench
 
OSMC 2011 | Nagios AddOn: LConf by Tobias Redel
OSMC 2011 | Nagios AddOn: LConf by Tobias RedelOSMC 2011 | Nagios AddOn: LConf by Tobias Redel
OSMC 2011 | Nagios AddOn: LConf by Tobias Redel
 
OSMC 2011 | Monitoring "wer kennt wen" mit free and open source software by J...
OSMC 2011 | Monitoring "wer kennt wen" mit free and open source software by J...OSMC 2011 | Monitoring "wer kennt wen" mit free and open source software by J...
OSMC 2011 | Monitoring "wer kennt wen" mit free and open source software by J...
 
Anwender-Case Karl Storz GmbH & Co. KG auf OpenText Basis
Anwender-Case Karl Storz GmbH & Co. KG auf OpenText BasisAnwender-Case Karl Storz GmbH & Co. KG auf OpenText Basis
Anwender-Case Karl Storz GmbH & Co. KG auf OpenText Basis
 
Drahtwanderung: Wir machen den NeXTen Schritt
Drahtwanderung: Wir machen den NeXTen SchrittDrahtwanderung: Wir machen den NeXTen Schritt
Drahtwanderung: Wir machen den NeXTen Schritt
 
LAIK: A Library for Fault Tolerant Distribution of Global Data
LAIK: A Library for Fault Tolerant Distribution of Global DataLAIK: A Library for Fault Tolerant Distribution of Global Data
LAIK: A Library for Fault Tolerant Distribution of Global Data
 
Streaming Plattformen und die Qual der Wahl
Streaming Plattformen und die Qual der WahlStreaming Plattformen und die Qual der Wahl
Streaming Plattformen und die Qual der Wahl
 
Never Code Alone: Von Symfony Forms zu einer SPA auf APIs
Never Code Alone: Von Symfony Forms zu einer SPA auf APIsNever Code Alone: Von Symfony Forms zu einer SPA auf APIs
Never Code Alone: Von Symfony Forms zu einer SPA auf APIs
 
chapter zürich rpa best practices
chapter zürich rpa best practiceschapter zürich rpa best practices
chapter zürich rpa best practices
 
Einsatz von Subversion bei der Entwicklung technisch-wissenschaftlicher Software
Einsatz von Subversion bei der Entwicklung technisch-wissenschaftlicher SoftwareEinsatz von Subversion bei der Entwicklung technisch-wissenschaftlicher Software
Einsatz von Subversion bei der Entwicklung technisch-wissenschaftlicher Software
 

TechTalkThursday: Zentrales Metriken-System - ist der Flügelschlag des Schmetterlings sichtbar?

  • 1. 1 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday
  • 2. 2 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday ZENTRALES METRIKEN SYSTEM … UND IST DER FLÜGELSCHLAG DES SCHMETTERLINGS SICHTBAR?"
  • 3. 3 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday THEMEN 1. WAS IST MOTIVATION FÜR ZIG MILLIONEN METRIKEN? 2. WAS IST INFLUXDB UND OPENTSDB? 3. WAS NÜTZT TELEGRAF? 4. DEMO 5. AUSBLICK
  • 4. 4 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday WARUM ZENTRALE METRIKEN? VORHANDENE SITUATION • > x00’000 RRD und Whisper-Files (25k System-Metriken, 25k zusätzliche für alle vergessene, viele 10ks Nagios RRDs, 50k Netzwerkmetriken, Whisper für Backup, Redmine, …) • Die meisten «alten» Tools habe eine eigene Vorstellung von Graphik-Lagerung und Erstellung • Zugreibarkeit • Performance • Daten Korrelationen schwierig bis gar nicht automatisch erstellbar
  • 5. 5 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday WARUM ZENTRALE METRIKEN? • Ziele und Nutzen für nine.ch: • ein Zentraler Metrik Speicher • Die Metriken sind verteilt über alle Datacenters • Zugreifbarkeit • Auswertbarkeit • Korrelationen (!) • Bereits vorhandene Mathematik • Modere Schnittstellen • Supporting Funktionalität (wie Ausdünnung oder Round-Robin) • Überarbeitung des Monitorings und Alertings durch Anflanschen an Metriken • Kunden haben Einsicht in die Metriken der eigenen Systeme • InfluxDB gewann das erste Stechen vor OpenTSDB und Prometheus
  • 6. 6 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday WAS IST INFLUXDB? • InfluxDB ist eine verteilte Time Series Database • … ohne weitere Abhängigkeiten • … und OpenSource (MIT License) • Rising Star • Backend und DB komplett in Go geschrieben (Minimierung der Bibliotheken Abhängigkeiten, Webservices Stack, Concurreny) • Optimiert auf die Speicherung, Organisation und Auswertung von Metriken (Timestamps, Tags, Verteilung der Daten mit Shards, SQL like Abfragesprache) • Automatisches Verdichten und Ausdünnen • REST API und integriertes Admin-Webinterface • InfluxDB.com (> 25 Mitarbeiter @ US)
  • 7. 7 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday INFLUXDB @ NINE.CH DESIGN UND WO WAREN WIR TO EARLY TO USE? • Design und Setup InfluxDB Cluster 0.8.7 (Dezember 2014) • puppet-influxdb (rewrite) • Letzte Feature Enhance und Fix Version des 0.8.x Branches Ende 2014 • Performance Lags (5-30 Sekunden) & Crashes bei > 50’000 Metriken pro Minute • Refactoring mit InfluxDB 0.9.x (33 RCs zur 0.9.0) • bis und mit Version 0.9.2 jeweils am Datenmengengerüst von nine.ch und im Cluster gecrashed • Im August 2015 “InfluxDB: Quo-Vadis? – Krise”  Wechsel auf OpenTSDB als zentraler Metrik-Speicher
  • 8. 8 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday INFLUXDB STAND HEUTE • InfluxDB auf dem Weg zur Version 1.0.0 • Bestrebung: Speed, neues Clustering, neue und ressourcen schonendere Storage Engine, Speed • InfluxDB 0.9.5 stabiler (Single Node Usage) • InfluxDB 0.9.6 mit neuer Storage Engine (TSM) (WIP, Multi-Node-Cluster)
  • 9. 9 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday WAS IST OPENTSDB? • OpenTSDB ist eine skalierende Time Series Database • Datenhaltung und Verteilung ist ausgelagert in ein Cluster Setup mit • Apache HBase • Apache Hadoop • Apache Zookeeper • Zusätzliche Schreibkapazität mit zusätzlichen Nodes / Slaves • Die Schreib- und Lese-Performance im BigData Bereich • 2 Writer - APIs (Line-Protokoll, REST) • Webinterface zur einfachen und schnellen Auswertung (Graphiken mit GnuPlot) • OpenTSDB.net (3 Personen-Projekt) •
  • 10. 10 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday OPENTSDB @ nine.ch
  • 11. 11 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday METRIKEN SAMMELN, WIE ? INFLUXDB TELEGRAF UM METRIKEN ZU SAMMELN UND SENDEN • Telegraf ist ein Metrics Collector Deamon und schreibt diese an ein Time Series Backend • Programmiert in Go und relativ schlank • Plugins für Input (System-Metriken, Apache, nginx, MySQL, PostgreSQL, Elasicsearch, …) • Plugins für Outputs (InfluxDB, OpenTSDB, Kafka, …) • nine.ch Contributions: • OpenTSDB Output Plugin • Libvirtd Input Plugin (und weil externe Abhängigkeit von nine.ch unterhaltenes Linux Package) • Oekosystem Contributions: • puppet-telegraf (unterstützt zusätzlich pro-service Config-Snippets (DBs))
  • 12. 12 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday DEMO / BEISPIELE @ nine.ch
  • 13. 13 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday DEMO / BEISPIELE @ nine.ch
  • 14. 14 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday AUSBLICK • nine.ch verfolgt die Entwicklung von OpenTSDB und InfluxDB weiter • Unsere Tool-Erweiterungen sind so gestrickt, dass sie beide TSDB unterstützen. • Mehr Disk-Space für mehr Metriken (längere History, Wiederholungseffekte sind einsehbar) • Mehr Metriken für den Endkunden einsehbar
  • 15. 15 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday Nine Internet Solutions AG Albisriederstr. 243a CH-8047 Zürich Tel +41 44 637 40 00 Fax +41 44 637 40 01 info@nine.ch FRAGEN?
  • 16. 16 TECHTALKTHURSDAY METRIKEN / ÖFFENTLICH ROMAN PLESSL Version 1.0 #TechTalkThursday Nine Internet Solutions AG Albisriederstr. 243a CH-8047 Zürich Tel +41 44 637 40 00 Fax +41 44 637 40 01 info@nine.ch DANKE FÜR DIE AUFMERKSAMKEIT!