Der Vortrag widmet sich den eher business-orientierten Aspekten des SAP Monitorings. Bereits vor Projektbeginn sollten man sich über die Bedeutung und Notwendigkeit eines SAP-Monitorings klar werden und das Optimierungspotential hinsichtlich Stabilität und Performance evaluieren.
Da selbst ein mittelgroßes SAP R/3 System eine Vielzahl an möglichen Messwerten liefert, liegt ein Schwerpunkt des Monitoring Projektes auf der Auswahl sinnvoller Parameter. Welche davon bedingen einen echten Mehrwert und welche sind überflüssig? Wie legt man dafür sinnvolle Warnschwellen fest? Die technische Integration der SAP R/3 Überwachung ist Gegenstand eines eigenen Vortrags und wird hier nur kurz angedeutet.
In der Zusammenfassung geht es um die Frage ob Nagios den Anforderungen eines Konzerns an das SAP Monitoring genügt und welche Erfahrungen in der Praxis gemacht wurden.
2. Ein Unternehmen der MEHLER AG
www.itnovum.de
SAP Monitoring
Exemplarische Projekterfahrungen
Business Track Nagios Konferenz, 22.September 2006
Michael Kienle, Geschäftsführer it-novum GmbH
3. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Bedeutung & Notwendigkeit der SAP Überwachung
• Kurze Einführung in das SAP-Monitoring-Tool: CCMS
– Möglichkeiten CCMS
– Warum Nagios benutzen wenn es CCMS gibt?
– Wie werden die Daten vom CCMS ins Nagios übernommen?
• Auswahl und Eingrenzung: Welche Werte sollten
überwacht werden?
– Welche Werte im CCMS sind sinnvoll?
– Verschiedene Reaktionszeiten
– Schwellwerte
• CCMS vs. SAP Solution Manager
• Fazit: Genügt eine OpenSource Plattform den
Anforderungen eines ERP-Monitorings?
Agenda
4. Ein Unternehmen der MEHLER AG
www.itnovum.de
• IT-Lösungen für den Mittelstand
– Sichere, zuverlässige und wirtschaftliche IT
• Komplette Wertschöpfungskette
– Beratung, Planung, Umsetzung, Betrieb
• Am externen Markt seit 1999
– Überwiegend Regional (FD + 150 km, ~ von KS bis F)
– Ca. 50% externer Umsatz, Trend: steigend
– Synergieeffekte & Innovationen durch Konzernzugehörigkeit (>2 Mrd €)
– Partnerschaften und Zertifizierungen
• Schwerpunkte & Kompetenzen:
– Systemmanagement
– ServerBasedComputing
– Outsourcing/Datacenter/SAP
– Konzepte, Analysen und Betrieb
– Storage- und Servervirtualisierung, Konsolidierung
– IT-Sicherheit, Datenschutz, Datensicherheit
IT-Kompetenz-Zentrum eines Konzerns
5. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Unternehmenskritische ERP-Anwendungen: Stabilität:
– Störung der Betriebsabläufe; bis zum kompletten Stillstand
– Vereinbarung SLA (Service Level Agreements)
– Daher: Kosten sind eher zu vernachlässigen
• Das Systemmanagement sollte dementsprechend:
– die Wahrscheinlichkeit eines Ausfalles deutlich verringen
– im Fehlerfall schnellere Fehlerlokalisierung ermöglichen
– übergreifend eine “angemessene” Nutzung sicherzustellen
• In der Praxis bedeutet dieses an Einsatzgebieten:
– Incident Management
– Performance Management: Sizing aber auch proaktive
Erweiterung
– SLA-Reporting: Verfügbarkeiten, Antwortzeiten
Notwendigkeit des SAP Monitorings
6. Ein Unternehmen der MEHLER AG
www.itnovum.de
„Die Verwaltung verteilter Client-Server-Systeme stellt hohe
Anforderungen an Systemadministratoren. Bei verteilten
Systemen, die über die Mindestkonfiguration hinausgehen,
sind Werkzeuge zur Unterstützung von
Systemadministratoren bei dieser Aufgabe unentbehrlich.“
SAP AG, Dokumentation CCMS
Der Monitor Ansatz von SAP
7. Ein Unternehmen der MEHLER AG
www.itnovum.de
CCMS I
• CCMS = Computing Center Management
System
• SAP Tool Überwachung und Verwaltung:
– SAP-Transaktion „rz20“
– Baumstruktur, Komplexität: >n-1.000
• If you can not control it you can not
manage it
• BUT do not measure what you will not
change
• Praxis (Zitate):
– “leicht den Durchblick verlieren…”
– “Schwierigkeiten zu unterscheiden ob
der angezeigte Fehler wirklich ein
Problem darstellt
oder nur zur
Information, temporär…”
8. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Durchschnitt Dialogschritt
• Durchschnitt Netzwerk-
Antwortzeit Frontend-
Applikationserver
• Durchschnitt 1 festgelegten
Transaktion
• Anzahl eingeloggte User
CCMS II – Dialog Overview
9. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Mittlere Zeit Dispatcher-
Warteschlange
• Mittlere Lade- und
Generierungszeit von
CUA-Objekte
• Durchschnitt
Datenbankanforderung
CCMS III – Dialog Application Service
11. Ein Unternehmen der MEHLER AG
www.itnovum.de
• TableSpaces
CCMS V - Database
12. Ein Unternehmen der MEHLER AG
www.itnovum.de
Betriebssystem
SAP / CCMS Netzwerkkomponenten
Umweltbedingungen
• Ziel: Umfassende Übersicht
– Nicht: Überwachung einer Summe von Einzelkomponenten
– Sondern: vom Enduser “gefühltes” Systemverhalten
– Sinnvoll: Übernahme der wichtigsten CCMS-Daten
Warum Nagios benutzen wenn es CCMS gibt? I
13. Ein Unternehmen der MEHLER AG
www.itnovum.de
• CCMS konzentriert sich
ausschließlich auf SAP
– z.B. Umweltbedingungen /RZ
oder Basissystem/Hardware
nicht berücksichtigt.
Warum Nagios benutzen wenn es CCMS gibt? II
14. Ein Unternehmen der MEHLER AG
www.itnovum.de
Workstation
Applikations-Server
Router
Switch
Switch
Router
z.B. MPLS
Oracle
Datenbank
• Performance aus Anwendersicht:
– Datenbank, Applikationsserver, Netzwerkanbindung, Workstation
• Übergreifende Überwachung notwendig
Procurve Routing Switch 9308M
HP J4138A
Po wer
Fault
C ons ole
Re se t Cle ar
S elf
Test
Fan
Faul t L E D M od e S e le ctPower
S tatus
Modules
1 2 A B C D E F G H
Act F Dx M a x
use xl modules only
hp procurve
switch 5372xl
J4848A
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
Po wer
Fault
C ons ole
Re se t Cle ar
S elf
Test
Fan
Faul t L E D M od e S e le ctPower
S tatus
Modules
1 2 A B C D E F G H
Act F Dx M a x
use xl modules only
hp procurve
switch 5372xl
J4848A
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
1
7
1
2 3
8 9
5
11
4
1 0
7 12 19
6
6
12
13
13
19
1 4 15
2 0 21
1 6
2 2
17
23
18
1 8
2 4
hp procurve
10/10 0TX
xl Module
J4 820A
J4 820A 24 p ort 10/100TX
24
Procurve Routing Switch 9308M
HP J4138A
Warum Nagios benutzen wenn es CCMS gibt? III
15. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Überwachung sämtlicher Komponenten der IT
– Business-Prozess-orientierte Sicht vs. eher Infrastruktur-Perspektive
• “Tactical Overview”
– systemweiter Überblick, aufkommende Probleme können effizient erkannt und
gezielt beseitigt werden
Warum Nagios benutzen wenn es CCMS gibt? IV
16. Ein Unternehmen der MEHLER AG
www.itnovum.de
Perfomance-Problem bei CCMS-Plugin, abhängig
vom Volumen der zu überwachenden Services
Die einzelnen benötigten Werte finden sich an
verschiedenen Stellen der Baumstrucktur. Das
Plugin meldet sich für jeden abzuholenden Wert
einzeln im SAP-System an: Nagios belastet
ständig das SAP-System mit mehreren
Benutzern.
Lösung: Neuer Monitor. Hier werden dann alle
gewünschten Werte eingefügt. Dieser Knoten
wird dann komplett vom Nagios-CCMS-Plugin
abgeholt.
Alternativ: SNMP-Traps möglich
Wie werden Daten vom CCMS ins Nagios übernommen? I
17. Ein Unternehmen der MEHLER AG
www.itnovum.de
Skript
Ablauf bei der Datenabholung
Nagios ruft ein (selbstentwickeltes) Skript auf, dieses ruft das CCMS-
Plugin auf, welches den gesamten Monitor „Nagios/Allgemein“ aus
dem SAP ausliest. Diese Daten werden von dem CCMS-Plugin
zurückgegeben, welches in eine Datendatei schreibt.
Je nach Erfolg dieser Transaktion, meldet das selbstgeschriebene
Skript den Status „OK“ oder „CRITICAL“ an Nagios zurück.
CCMS-Plugin
Datendatei
Wie werden Daten vom CCMS ins Nagios übernommen? II
18. Ein Unternehmen der MEHLER AG
www.itnovum.de
Um die Daten möglichst übersichtlich von der Datendatei ins Nagios
zu integrieren, wurde ein eigenes Skript entwickelt, welches die
gewünschten Information aus der Datendatei holt, den Wert in einen
Graph einträgt und den Status und den Wert ans Nagios
zurückmeldet.
Skript
Datendatei
ApanSQL
MySQL
RRD-File
Wie werden Daten vom CCMS ins Nagios übernommen? III
19. Ein Unternehmen der MEHLER AG
www.itnovum.de
Überwachen verschiedener SAP-
Puffer auf:
Kriterien
Space Used Pufferspeichers in Prozent
Hit Ratio Datenbankanfragen/Cache
Swap Auslagerungen Swaps pro Minute
Felder
GenericKey ganz/teilweise gepufferte DB-Tabellen
Program kompilierte SAP-Programme
Welche Werte im CCMS sind sinnvoll? II
20. Ein Unternehmen der MEHLER AG
www.itnovum.de
Welche Werte im CCMS sind sinnvoll? III
Diverse wichtige SAP interne Speicher:
R3RollUsed Belegung des Rollbereichs
Rollbereich: Speicherbereich fester, konfigurierbaren
Größe, der zu einem Workprozess gehört; enthält
benutzerspezifische Daten und ist der erste Speicher,
den ein Workprozess erhält.
EsAct Belegung des Erweiterungsspeichers
Der Erweiterungsspeicher enthält den größten Teil des
Benutzerkontexts. Die Seitenverwaltung dieses
Speichers erfolgt nicht durch das Betriebssystem,
sondern direkt durch das SAP-System.
HeapAct Belegung des privaten Speichers
Einem Workprozess wird erst dann privater Speicher
zugewiesen,wenn Rollbereich und Erweiterungsspeicher
belegt sind; der Workprozess ist dann bis zum Ende der
Transaktion für den aktuellen Benutzerkontext reserviert
(PRIV-Modus). Laufen zu viele Dialog-Workprozesse im
PRIV-Modus, entstehen Performance-Probleme.
21. Ein Unternehmen der MEHLER AG
www.itnovum.de
Spool-System:
Used Numbers Belegung der Spool-Nummern in Prozent.
(Sie müssen alte Ausgabeaufträge löschen, damit diese Zahl
nie 100 Prozent erreicht.)
WaitTime Wartezeit im Spool-Service in Sekunden
Utilisation Auslastung der Spool-Workprozesse in Prozent
Welche Werte im CCMS sind sinnvoll? IV
22. Ein Unternehmen der MEHLER AG
www.itnovum.de
Allgemeine Performance-Werte:
DialogSteps mittlere Anzahl von Dialogschritten pro Minute.
Ein hoher Wert in Verbindung mit einer hohen
ResponseTime weist auf generelle Überlastung hin, ein sehr
niedriger Wert auf eine Fehlfunktion
Eine der verschiedenen Antwortzeiten
Welche Werte im CCMS sind sinnvoll? V
23. Ein Unternehmen der MEHLER AG
www.itnovum.de
Welche Werte im CCMS sind sinnvoll? VI
Die Option „AbortedJobs“ meldet alle abgebrochenen (Background-)
Jobs im SAP. Im produktiven Einsatz kommt es immer wieder zu
Jobabbrüchen, die jedoch nicht immer systemkritische Bedeutung
haben.
z.B. Fehleranalyse: Transaktion “sm37” (Dumpanalyse Background)
24. Ein Unternehmen der MEHLER AG
www.itnovum.de
Verschiedene Reaktionszeiten I
Dialogantwortzeit = durchschnittliche Antwortzeit zur Verarbeitung eines Dialogschritts
Bei diesem Wert kann es zu Ausreißern kommen, die meist nur
durch einen einzigen großen Prozess hervorgerufen werden.
Diese hohen Werte haben aber leider keine wirkliche Aussage-
kraft, da die SAP-Clients der Anwender trotz hoher Werte an
dieser Stelle, keine Performanceeinbusen erleiden.
25. Ein Unternehmen der MEHLER AG
www.itnovum.de
Netzlaufzeit = Zeit für Datentransfer zwischen Frontend und Anwendungsserver
Durchschnittswert aller Netzlaufzeiten. Es lässt erkennen das
irgendwelche SAP-Clients durch das Netzwerk
verzögert ihre Daten erhalten, aber leider nicht welche Clients
genau betroffen sind oder durch welchen Teil des Netzwerks
diese Verzögerung ausgelöst wird.
Hier sind mit weiteren Tools genauere Analyse zu erstellen.
Verschiedene Reaktionszeiten II
26. Ein Unternehmen der MEHLER AG
www.itnovum.de
normierte Antwortzeit = Wie Dialogantwortzeit, nur für eine voreingestellte Standard-
transaktion.
Durch das Messen der Zeit die eine immer gleiche
Standardtransaktion zur Bearbeitung im SAP benötigt,
erhählt man einen realistischen Wert, der die Performance
des SAP-Systems gut wiederspiegelt.
Verschiedene Reaktionszeiten III
Das Auftreten von Spitzen deutet auf eine momentane Überlastung des
SAP-Systems hin; alle angeschlossenen SAP-Anwender werden
Performanceeinbußen erleben.
27. Ein Unternehmen der MEHLER AG
www.itnovum.de
• Überwachung SAP-Server mit einem direkten
benachbarten Nagios nicht besonders aussagekräftig
• Einbezug Standorte/RemoteUser („gefühlte Performance“)
• „Simulieren“ eines Benutzers; Zeitmessung:
– Einloggen, bestimmte Ein-/Ausgaben & Transaktionen, Ausloggen
– End-2-End Performance (generisch verwendbar)
Verschiedene Reaktionszeiten IV
28. Ein Unternehmen der MEHLER AG
www.itnovum.de
Schwellwerte I
Zur effizienten Alarmierung sind im Nagios Schwellwerte zu definieren.
Falls für abgefragte Werte noch keine Erfahrungen bestehen, ist es immer
empfehlenswert, die im CCMS durch SAP vordefinierten Standardschwellwerte erst
einmal zu übernehmen und dann sukzessive anzupassen.
Schwellwerte des
Monitorattributes auf
seiner
Eigenschaftsseite
29. Ein Unternehmen der MEHLER AG
www.itnovum.de
Individuelle Schwellwerte lassen sich gut über die aufgezeichneten Graphen bestimmen.
Sinnvoll aber zeitaufwändig (lange Erfahrungen/Messungen notwendig)
Als erster Schritt wurden die Schwellwerte vom CCMS übernommen. Danach erfolgt
eine längere Messung der “IST-Situation” mit abschließender Analyse der Ergebnisse
und der Neueinstellung der Schwellwerte.
CRITICAL WARNING
Schwellwerte II
31. Ein Unternehmen der MEHLER AG
www.itnovum.de
• CCMS:
– Stärken eher in der Infrastruktur
– „Tunnelblick“ auf Anwendungen
• Solution Manager:
– „Bietet Kunden ein Standard Management Konzept um die Business-
Prozesse in der zugrunde gelegten Systemlandschaft mit der optimalen
Verfügbarkeit, optimalen Performance und niedrigen Kosten zu betreiben.“
(SAP Solution Manager Dokumentation)
– Zukünftige Anforderungen: Einheitliche und umfassende Überwachung in
einem Umfeld das geprägt ist durch:
• Global
• Heterogene Lösungen / Systeme
• Business Prozesse
• Neue Technologien
CCMS vs. Solution Manager
34. Ein Unternehmen der MEHLER AG
www.itnovum.de
“Nagios entlastet mich von einem erheblichen Teil meiner turnusmäßigen
Kontrollen. Einige der per Nagios gemeldeten Alerts sind nicht sogleich
systemkritisch, zeigen aber einen evtl. vorhandenen Trend an, auf den
man dann gezielt reagieren kann. Eine komplette Ablösung von CCMS
halte ich – auch gerade da detaillierte Fehler im CCMS analysiert werden
– für verfrüht. Ich sehe den Mehrwert von Nagios eher im Bereich der
umfassenden Überwachung SAP/Infrastruktur bzw. der guten und
schnellen Benachrichtigung außerhalb des Büros und der üblichen
Dienstzeiten. Viel Know-How ist erforderlich, sowohl auf Seiten CCMS als
auch auf Seiten Nagios.”
K.K., Leiter SAP Basisysteme der Firma xxx GmbH
Statements aus der Praxis
35. Ein Unternehmen der MEHLER AG
www.itnovum.de
“Genügt eine OpenSource Plattform
den Anforderungen für ein SAP-Monitoring?””
• Nagios kann direkt auf das SAP eigene, integrierte Monitoring-Tool
CCMS zugreifen, dadurch ergeben sich viele Möglichkeiten.
• Nagios kann (mit Unterstützung) kostengünstig und schnell
implementiert werden; darüber hinaus wird nicht nur den Bereich SAP
abgedeckt sondern auch andere IT-Komponenten überwacht.
• Viel Know-How notwendig; sowohl Nagios als CCMS / SAP
• Wir sehen das Einsatzgebiet mit dem Schwerpunkt einer breiteren und
umfassenderen Überwachung, welche “weniger in die Tiefe” geht.
• Die Zukunft liegt klar im “Business Process Monitoring” (mySAP ERP
Solution Manager). In wie weit diese tiefgehende Integration
anderweitig sinnvoll zu realisieren ist, bleibt den zukünftigen Projekten
überlassen.
Fazit
36. Ein Unternehmen der MEHLER AG
www.itnovum.de
Danke für Ihre Aufmerksamkeit!
Michael Kienle
Geschäftsführer
m.kienle@itnovum.de