10. Jaki jest cel ?
Wymiarowanie ?
Diagnostyka ?
Wykrywanie awarii ?
Jakie jest pytanie ?
Jakie jest obciążenie …?
11. Rozwiązania …
~~~2 x Liczba core (w tym HT)
Konieczny kontekst!
Jakie jest obciążenie CPU ?
Wykorzystanie procesora per CPU
Kolejka procesora
opóźnienie (latency) na kolejce CPU
Jakie jest obciążenie IO?
iostat
IO latency
12.
13. Problem -
Niewyjaśnione przerwy w
replikacji
Kontekst:
Duży bank w USA,
PostgreSQL i Slony (replikacja East->West),
Dostęp do maszyny przez technika (?!?!),
Dostępny tylko podstawowy monitoring.
15. Przerwa w replikacji
Czas trwania przerwy to ok 4
godziny
W praktyce brak innych metryk (?!)
Sieć wskazana jako podejrzana
Rozwiązanie potrzebne ASAP
16. Jaki jest cel ?
Diagnostyka awarii
Jakie postawić pytania
Jaki jest stan klientów
bazy (w tym replikacji) ?
Czy była przerwa w sieci ?
Jak wyglądają połączenia
TCP_IP
17. Metryki
TCP Ping pomiędzy lokalizacjami
Stan połączeń zrzucony netstatem
Wyliczenie dokładnego czasu
przerwy na podstawie logów
On Linux, load averages are (or try to be) "system load averages", for the system as a whole, measuring the number of threads that are working and waiting to work (CPU, disk, uninterruptible locks). Put differently, it measures the number of threads that aren't completely idle. Advantage: includes demand for different resources.
On Linux, load averages are (or try to be) "system load averages", for the system as a whole, measuring the number of threads that are working and waiting to work (CPU, disk, uninterruptible locks). Put differently, it measures the number of threads that aren't completely idle. Advantage: includes demand for different resources.
On Linux, load averages are (or try to be) "system load averages", for the system as a whole, measuring the number of threads that are working and waiting to work (CPU, disk, uninterruptible locks). Put differently, it measures the number of threads that aren't completely idle. Advantage: includes demand for different resources.
On Linux, load averages are (or try to be) "system load averages", for the system as a whole, measuring the number of threads that are working and waiting to work (CPU, disk, uninterruptible locks). Put differently, it measures the number of threads that aren't completely idle. Advantage: includes demand for different resources.
On Linux, load averages are (or try to be) "system load averages", for the system as a whole, measuring the number of threads that are working and waiting to work (CPU, disk, uninterruptible locks). Put differently, it measures the number of threads that aren't completely idle. Advantage: includes demand for different resources.
Goal – jaki mamy cel?
Question – jakie pytanie mamy do rozwiązania
Metric – jakie metryki ono rozwiązuje