Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

M.Klasavičius - Kelias diegiant monitoringo sistemą - nuo 0 iki verslo metrikų

1,046 views

Published on

Published in: Technology
  • Be the first to comment

  • Be the first to like this

M.Klasavičius - Kelias diegiant monitoringo sistemą - nuo 0 iki verslo metrikų

  1. 1. Kelias diegiant monitoringo sistemą – nuo 0 iki verslo metrikų Mantas Klasavičius, IT architektas
  2. 2. Adform infrastruktūra 2 duomenų centrai 200 fizinių serverių 35k tranzakcijų per sekundę ~65 aplikacijos Ir mes augame… 2
  3. 3. Monitoringas ir Adform 3
  4. 4. Infrastruktūra Zabbix – monitorinimo aplikacija 2 serveriai > 230 stebimų įrenginių > 20 000 stebimų parametrų ~ 400 naujų reikšmių/sek 4
  5. 5. Metrikos – tai ką mes stebime Infrastruktūros metrikos Aplikacijų metrikos Verslo metrikos 5
  6. 6. DEV, PM ir metrikos Kiekviena SCRUM komanda prižiūri už savo aplikacijas Kas ir kaip bus stebima sprendžia ir įgyvendina komanda Produkto vadovai prižiūri verslo dalį Jeigu reikia “keltis naktį”, informuojami IT 6
  7. 7. 1 Aplikacijos pavyzdys – Aplikacijos metrikos 7
  8. 8. 1 Aplikacijos pavyzdys – Verslo metrikos 8
  9. 9. 1 Aplikacijos pavyzdys – SLA 9
  10. 10. 1 Aplikacijos pavyzdys – ekranai 10
  11. 11. Ar tai padeda? 11
  12. 12. TAIP 12
  13. 13. DEV komentarai "be metriku mes dabar kaip akli” “Labai norime zinoti kas darosi pasaulyje su musu skriptais, kokie yra errorai ir kitokie ivykiai, feature’su usage’a ir statusa po release’o. “ [2012.05.13 23:02:42] Ramunas Urbonas: va, gali paziuret praktiskai galutini reikala... 13
  14. 14. Kaip to siekėme 14
  15. 15. IT įrankis – “perfmon” 15
  16. 16. SCOM – natūralus (ne)pasirinkimas Pliusas  Idealus stebėti standartinius “counterius” Minusai  Nelabai tinkamas nestandartiniams parametrams  Nėra WEB konsoles SCOM nepasirinkome – Monitoringo projektas įstrigo 16
  17. 17. Nuolatinis diegimas – nauja galimybėmonitoringo sistemai 17
  18. 18. Nuolatinis diegimas – nauja galimybėmonitoringo sistemai 18
  19. 19. Nuolatinis diegimas – nauja galimybėmonitoringo sistemai Nagios+cacti, Zenoss, Splunk, SCOM, Zabbix Kodėl – ?  Šablonų sistema  Ekranai  Pasiekiamas per http  Atviro kodo – nemokamas 19
  20. 20. Nuolatinis diegimas – nauja galimybėmonitoringo sistemai Serveris automatiškai pradedamas monitorinti Taip pat visos aplikacijos serveryje Nuolatinis diegimas įstrigo Monitorinimo idėjos liko 20
  21. 21. Monitorinimas - (ne)IT sfera IT geriausiai žino serverių, tinklų infrastruktūrą IT “nežino” aplikacijų DEV turi “ilgą sarašą” parametrų “mums niekas nesakė” 21
  22. 22. DEV pritraukimas: dublis 1 Bendras IT ir DEV serveris DEV “tiekia” šablonus IT IT peržiūri ir įdiegia Viskas žlugo  DEV - “nereleasinsim kiekvienos smulkmenos”  IT – “DEV releasina per dažnai”  IT – “tai ne monitorinimas” 22
  23. 23. DEV pritraukimas: dublis 2 23
  24. 24. DEV pritraukimas: dublis 2 Monitoringo Serveris Metrikų serverisTikslas Ar mūsų sistema veikia Kaip sistema veikia, lyginti ir analizuoti pokyčiusStabilumas Kiek galima patikimesnis Patikimas, bet nebūtinai dubliuotasTeisės Tik IT DEV nariai gali daryti pakeitimusPakeitimai Ne tiek daug pakeitimų Labai dinaminė aplinka, greitai pritaikoma prie pasikeitusių reikalavimųAtsakingas IT DEV kartu su IT 24
  25. 25. Pataikėm!!! - Pirmieji pionieriai Per mėnesį - nuo 50 reikšmių/s iki 350 r/s “Stebime viską” ir “Stebime dažnai” Reikalingos metrikos “atsisijoja” 25
  26. 26. Tai kodėl vis dėlto suveikė? Parodėm realią naudą Tinkami įrankiai “Atrišom” rankas Vadovų palaikymas irgi padeda 26
  27. 27. Sudėtingesni/ įdomesni atvejai 1 27
  28. 28. Sudėtingesni/ įdomesni atvejai 2 28
  29. 29. Tolimesni žingsniai Atiderintos SLA metrikos Įtraukti visas komandas Pakeitimų logai Viešai prieinami ekranai 29
  30. 30. Klausimai? 30

×