Nagios hatte weite Verbreitung im Bereich des IT-Infrastruktur-Monitorings gefunden. Die heutige IT konzentriert sich jedoch weniger auf Devices sondern bewegt sich eher in Richtung aktive Unterstützung der wertgenerierenden Geschäftsprozesse; in der Praxis finden sich hier oftmals komplexe Zusammenhänge. Wie können diese mit Nagios ebenfalls überwacht werden?
2. Ein Unternehmen der MEHLER AG
www.itnovum.de
Geschäftsprozess
Monitoring
Business Track Nagios Konferenz, 11.Oktober 2007
Michael Kienle
Geschäftsführer it-novum GmbH
m.kienle@itnovum.de
3. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Notwendigkeit der Überwachung von Geschäftsprozessen
– Stabilität und Verfügbarkeit
• Anforderungen aus der Praxis
– ServiceLevelAgreements (SLA)
• Nagios unter dem Aspekt “Geschäftsprozesse”
– Defizite und Probleme
• Umsetzungen – verschiedene Möglichkeiten
– Formale Beschreibung von Geschäftsprozessen
– End-2-End Monitoring
– Visualisierung
• Fazit: Genügt eine OpenSource Plattform den
Anforderungen der Überwachung von Geschäftsprozessen?
Agenda
4. Ein Unternehmen der MEHLER AG
www.itnovum.de
• IT-Lösungen für den gehobenen Mittelstand/Enterprise
– Sichere, zuverlässige und wirtschaftliche IT
• Komplette Wertschöpfungskette
– Beratung, Planung, Umsetzung, Betrieb
• Am externen Markt seit 1999
– Ca. 50% externer Umsatz, Trend: steigend
– Synergieeffekte & Innovationen durch Konzernzugehörigkeit (>2 Mrd €)
– Partnerschaften und Zertifizierungen
• Schwerpunkte & Kompetenzen:
– Systemmanagement (itcockpit/nagios)
– ServerBasedComputing
– Outsourcing/Datacenter/SAP
– Konzepte, Analysen und Betrieb
– Storage- und Servervirtualisierung, Konsolidierung
– IT-Sicherheit, Datenschutz, Datensicherheit
– Dokumentenmanagement / Archivierung / ECM
IT-Kompetenz-Zentrum eines Konzerns
5. Ein Unternehmen der MEHLER AG
www.itnovum.de
Wandel der IT-Organisation
Phasenmodell zum Einordnen des Kunden
Stabilität der IT: gering
Tools: Keine
Anforderungen: nicht definiert
Einführung IT Service
Management
6. Ein Unternehmen der MEHLER AG
www.itnovum.de
Wandel der IT-Organisation
Phasenmodell zum Einordnen des Kunden
Stabilität: mittel aber nicht genau
vorhersehbar
Tools: Insellösungen
Anforderungen: unklar und ungenau
Einführung IT Service
Management
7. Ein Unternehmen der MEHLER AG
www.itnovum.de
Wandel der IT-Organisation
Phasenmodell zum Einordnen des Kunden
Stabilität: gut
Tools: Einheitliches Systemmanagement
Anforderungen: gestiegen aber nicht genau definiert
Einführung IT Service
Management
8. Ein Unternehmen der MEHLER AG
www.itnovum.de
Wandel der IT-Organisation
Phasenmodell zum Einordnen des Kunden
Stabilität: Hoch
Tools: Einheitliches und umfassendes
Systemmanagement, Serviceorientierung
Anforderungen: qualitativ bekannt und hoch
Einführung IT Service
Management
9. Ein Unternehmen der MEHLER AG
www.itnovum.de
Wandel der IT-Organisation
Phasenmodell zum Einordnen des Kunden
Stabilität: Sehr hoch
Tools: Einheitliches und
umfassendes IT-Service-Management
Anforderungen: klar und quantitativ definierte
Geschäftsprozesse
Einführung IT Service
Management
10. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Unternehmenskritische IT-Anwendungen
– IT-Abteilungen befinden sich in einem dramatischen Wandel (Trend zur
Service-IT)
– Themen wie ITIL, ITSM, SOA, “Agilität” in der IT … werden immer wichtiger…
– Stabilität & Verfügbarkeit gefordert – und zwar nicht bei einzelnen Hardware-
Komponenten!
– Störung der Betriebsabläufe bedingen hohe Kosten
– Oftmals: Vereinbarung von SLAs (Service Level Agreements) für komplette
Geschäftsprozesse (insb. Outsourcing)
Einführung eines auf Geschäftsprozessen arbeitenden
BPM-Monitoring zwingend notwendig
sowohl für IT-Dienstleister (Reporting, proaktive Checks,
schnelle Fehlerbehebung)
als auch Leistungsnehmer/Kunden! (Transparenz & Kontrolle)
Notwendigkeit des BPM Monitorings
11. Ein Unternehmen der MEHLER AG
www.itnovum.de
Anforderungen an BPM
• BPM-Monitoring sollte dementsprechend:
• die Wahrscheinlichkeit eines Ausfalles deutlich verringen
• im Fehlerfall schnellere Fehlerlokalisierung ermöglichen
• Proaktiv die Gefährdung von vereinbarten SLAs vermeiden
• Steigende Bedeutung durch Outsourcing bzw. Outtasking (Transparenz)
• Übergreifend eine “angemessene” (im Sinne der getroffenen
Vereinbarungen) Nutzung sicherzustellen (dokumentieren/reporting)
In der Praxis bedeutet dieses an Einsatzgebieten:
Incident Management & Erkennen von Trends
Performance Management: Sizing, proaktive Erweiterung
SLA-Reporting (Verfügbarkeiten, Antwortzeiten)
für beide (!) Seiten (Dienstleister & Kunde)
12. Ein Unternehmen der MEHLER AG
www.itnovum.de
SLA –
ServiceLevelAgreements
• Notwendigkeit
– Quantifizierbare Kriteriendefinition
– BPM bedingt sinnvollerweise SLA
• Praxis
– Messkriterien:
• Nicht: Server x ist 95% per „ping“ erreichbar
• Eher: Zu 99% lässt sich die SAP-Transaktion vom Standort A innerhalb
von 10 Sekunden erfolgreich durchführen.
– Reporting:
• Hängt nicht an Diensten, Devices sondern am Kunden!
Tipp aus der Realität:
Definition nicht am „grünen Tisch“ sondern mit Schwerpunkt auf
einfach quantifizierbaren und einfach umsetzbaren Messpunkten!
13. Ein Unternehmen der MEHLER AG
www.itnovum.de
Nagios – Sichtweise I
• NAGIOS wurde als Überwachungswerkzeug für IT-Infrastruktur
konzipiert.
– Orientierung an Servern (Hosts) als zentrales Objekt der Konfiguration und den
darauf laufenden Diensten
• Trend in der Unternehmensorganisation hin zu einer Prozess-
orientierten Sichtweise.
– Nicht mehr die Verfügbarkeit eines einzelnen Systems steht im Vordergrund
sondern die Verfügbarkeit eines gesamten Geschäftsprozesses (der unter
Umständen aus vielen weltweit verteilten Systemen bestehen kann)
• Reporting, insb. SLA-Reporting ist wenig flexibel um notwendige
Transparenz herzustellen.
– In großen Umgebungen geforderte Umsetzungen, z.B. komplexe
kundenspezifische Anforderungen, können nur schwierig erreicht werden.
14. Ein Unternehmen der MEHLER AG
www.itnovum.de
Nagios Sichtweise II
• Abbildung solcher komplexen Strukturen in NAGIOS ist
„schwierig“.
– Möglichkeit über Host- und Service-Dependencies Strukturen und
grundsätzlich Abhängigkeiten wiederzugeben. Allerdings reichen die
Möglichkeiten nicht aus um die oft tiefe Verschachtelung eines
Geschäftsprozesses wiederzugeben.
– Auch ist es nicht immer möglich den Zustand eines Geschäftsprozesses
vollständig zu überwachen und klar in die Zustände (OK, Warning, und
Critical) die NAGIOS bietet einzuordnen. Als Beispiel sei an dieser Stelle der
Zustand Warning angeführt. Der Ausfall eines Dienstes kann den gesamten
Prozess nur minimal verlangsamen, während der Ausfall eines anderen
Dienstes zu einer erheblichen Beeinträchtigung führt, der Gesamtprozess ist
aber nach vor funktionstüchtig. Für solche Fälle wäre eine feinere Abstufung
erforderlich.
Diese Schwächen von NAGIOS im Hinblick auf die Überwachung
von Geschäftsprozessen machen die Entwicklung einer
zusätzlichen Logik erforderlich welche die oben genannten
Punkte ausgleichen kann und NAGIOS um die erforderliche
Prozesssicht erweitert.
15. Ein Unternehmen der MEHLER AG
www.itnovum.de
Nagios:
Anforderungen/Erweiterungen
• Optimierung bei der Nutzung von SLAs
– Verbesserungen im Bereich Definition von (kunden-
spezifischen) SLAs
– Flexibilisierung beim SLA-Reporting
• Einfacheres Monitoring von komplexen
Geschäftsprozessen, grundsätzlich verschiedene
Vorgehensweisen:
1. Direkte Messung eines simulierten End-Nutzers (End-2-
End; „induktiver“ Ansatz)
2. Formale Beschreibung eines Geschäftsprozesses und
Herleitung der notwendigen Überwachungen („deduktiver“
Ansatz)
3. Herstellung von Relationen durch simple Visualisierung
16. Ein Unternehmen der MEHLER AG
www.itnovum.de
Funktionen End-2-End
• Überwachung sämtlicher Komponenten der IT mit einer BPM Sichtweise (im
Vergleich zur Infrastruktur-Perspektive)
– Definition der (quantifizierbaren) Kriterien ist entscheidend!
– Performance aus Anwendersicht eine Kombination aus Datenbank, Applikationsserver,
Netzwerkanbindung, Workstation etc.
• Periodisches (natives) Simulieren von Benutzer-Interaktionen im
LAN/WAN/VPN (Enduser-Experience: Simulieren von Tastatureingaben,
Mausbewegungen und Reaktion auf Ereignisse wie z.B. Fenster,
Eingabeaufforderungen etc.)
– ERP / SAP Transaktionen
– Terminalserver Login / CITRIX
– Bestellfunktion in Online Shops
– E-Mail / Exchange
– …
• Vollständige Integration in Nagios
– Grafische Darstellung der Zeiten
– Benachrichtigungen über alle Medien
– Verfügbarkeitsreporting SLA-Reporting (Schwellwerte wurden
überschritten / nicht überschritten)
– Mandantenfähigkeit
17. Ein Unternehmen der MEHLER AG
www.itnovum.de
PC
Applikations-
Server
Router
Switch
Switch Routerz.B. MPLS
Oracle
Datenbank
Procurve Routing Switch 9308M
HP J4138A
Po wer
Fault
C ons ole
Re se t Cle ar
S elf
Test
Fan
Faul t L E D M od e S e le ctPower
S tatus
Modules
1 2 A B C D E F G H
Act F Dx M a x
use xl modules only
hp procurve
switch 5372xl
J4848A
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
Po wer
Fault
C ons ole
Re se t Cle ar
S elf
Test
Fan
Faul t L E D M od e S e le ctPower
S tatus
Modules
1 2 A B C D E F G H
Act F Dx M a x
use xl modules only
hp procurve
switch 5372xl
J4848A
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
Procurve Routing Switch 9308M
HP J4138A
End-2-End Monitoring, am Beispiel SAP
SupplyChain
Server (Partner)
18. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Scripting einer Anwendung aus Sicht eines Endnutzers,
inkl. Messen der Einzelzeiten
• Regelmäßiges Ausführen (geplante Tasks)
• Melden ins Nagios
• Weiterverarbeiten im Nagios (Schwellwerte,
Benachrichtigungen etc.)
Funktionsweise
22. Ein Unternehmen der MEHLER AG
www.itnovum.de
Formaler Ansatz
• Geschäftsprozessesmodellierung
– Nicht gerade neu; allerdings im Umfeld „Monitoring“ wenig
beschritten
• Viele formalen Modellierungen bekannt (ARIS…), z.B. im
Umfeld SOA
– optimalerweise: Direkte Generierung des Monitorings
• OpenSource Tools: Together Workflow Editor
(http://www.enhydra.org/workflow/jawe/index.html)
24. Ein Unternehmen der MEHLER AG
www.itnovum.de
Umsetzung in Nagios
Zuordnung zwischen Services
u. Geschäftsprozessen
Synchronisierung der
Status-Infos
Einbindung in Nagios
26. Ein Unternehmen der MEHLER AG
www.itnovum.de
Generierte Nagios
Konfiguration
define host {
use generic-host
name Enter_Order
alias Workflow Activity
address 127.0.0.1
}
define service {
use generic-service
host_name Enter_Order
service_description SAPA1
checkcommand check_workflow!SAPA1!1
}
define service {
use generic-service
host_name Enter_Order
service_description SRVELO02
checkcommand check_workflow!SRVELO02!1
}
Anm.: „check_workflow“ == Nagios Plugin
27. Ein Unternehmen der MEHLER AG
www.itnovum.de
Generierte Nagios-Konfiguration
• Derzeitige Defizite:
– Abhängigkeiten flexibler zu gestalten (Logik der Relationen)
– Darstellung von Zwischenzustände (nicht nur schwarz oder
weiß) besser verarbeiten zu können (SLA…)
– Bessere Einschätzbarkeit des Status „Warning“:
• Proaktive Sichtweise: Welche Konsequenzen bedingen derzeitige
Situationen
– Generierte Visualisierung
• Weiterentwicklung in der nahen Zukunft:
– Derzeitige Projekte, Diplomarbeit
– Ergebnisse unter www.itcockpit.de
W
ork-in-Progress!!!
28. Ein Unternehmen der MEHLER AG
www.itnovum.de
Visualisierung von
Prozessen
• Leistungskette inkl. der beteiligten
Komponenten und Services
• Hierarchisch abbildbar
29. Ein Unternehmen der MEHLER AG
www.itnovum.de
☺ Nagios kann als Monitoring-Plattform eine gute Unterstützung
leisten; zumal die Verbreitung und die Flexibilität klare Vorteile
bedingen.
Durch die dargestellten Anforderungen und den notwendigen
Wechseln in der Design-Philosophie werden jedoch wesentliche
Erweiterungen notwendig.
Letztendlich ist für eine erfolgreiche Umsetzung viel Know-How
und immer noch viel Entwicklungsarbeit notwendig. Der Weg End-
2-End erscheint in der praktischen Umsetzung einfacher und
schneller zu sein als der formalistische Ansatz.
Die Zukunft liegt in einer umfassenderen Überwachung der
kompletten IT (Framework Paradigma) und einer steigenden
Service- (Geschäftsprozesse) und Kundenorientierung (SLA…).
Die Bedeutung eines integrierten BPM wird deutlich steigen.
Angrenzende Themen wie End-2-End Monitoring
oder flexible Tools im Umfeld SLA werden wichtig.
“Genügt eine OpenSource Plattform
den Anforderungen für ein BPM-Monitoring?””
30. Ein Unternehmen der MEHLER AG
www.itnovum.de
Danke für Ihre Aufmerksamkeit!
Interesse oder mehr Info?
Michael Kienle
Geschäftsführer
m.kienle@itnovum.de
Looking for a job? Please apply.