This presentation is mainly about the system we've designed and developed for our internal purposes at work. Its name is: Data Center Physical Infrastructure Manager, DCPIM. This system is a mix of DMS (Document Management System), CMMS (Computerized Maintenance Management System), asset management, monitoring (via SNMP) and some basic DCIM (Data Center Infrastructure Management) features. It’s main purpose is to support our team in the daily tasks related to data center and physical infrastructure management, operations and maintenance. Currently, this system is in use not only by my team, in Poland, but also by our colleagues from the area of Baltic Countries (Lithuania, Latvia, Estonia).
Presented on DatacenterDynamics Converged Warsaw 2012:
http://www.datacenterdynamics.com/pl/conferences/2012/warsaw-2012
Presentation language: Polish
English title (translated): Data center ‘under control’: Data center infrastructure and physical infrastructure management, tools and processes facilitating the data center monitoring function
PLNOG15: Data Center Ecosystem - yesterday, today, tomorrow - Sylwester Biern...
DATA CENTER CONVERGED 2012 WARSAW
1. Data Centre pod kontrolą
Monitoring infrastruktury, procesy i
narzędzia wspomagające zarządzanie
data centre
Opracował: Paweł Wawrzyniak, Nordea Bank Polska S.A., 2012
3. Data Centre Services Team
Zakres odpowiedzialności
• Zespół 6 osób
• Odpowiedzialnośd za:
– Utrzymanie infrastruktury data centre w Polsce, w tym:
• Primary Data Centre – utrzymanie za pomocą zasobów własnych
• Service Management i nadzór nad jakością usługi Disaster Recovery Centre
• Service Management i nadzór nad jakością usługi Primary Data Centre (nowy ośrodek)
• Obsługa zleceo serwisowych dotyczących infrastruktury technicznej serwerowni w placówkach
na terenie Polski, a także bieżące utrzymanie (planowe przeglądy).
– Definiowanie standardów w dziedzinie data centre w ramach Organizacji (Polska, Kraje Bałtyckie).
– Wsparcie projektów (przedsięwzięd) realizowanych w powyższych obszarach odnośnie definicji
wymagao, definicji standardów i zgodności projektów oraz ich wykonania z wymaganiami Banku
– Wsparcie procesów outsourcingowych związanych z data centre
• Realizacja zmian w zakresie infrastruktury technicznej IT (zasilanie gwarantowane,
klimatyzacja serwerowni, okablowanie) na terenie całej Polski
• Współpraca w ramach powyższych obszarów z innymi jednostkami w ramach Grupy Nordea
4. Data Centre Services Team
Wyzwania
• Bardzo szeroki zakres odpowiedzialności
• Ogromna ilośd dokumentów powstających w czasie pracy (w różnych formatach:
.docx, .xlsx, .pdf, .dwg, .jpg itd.), dokumentacje projektowe, wykonawcze i
powykonawcze, protokoły z przeglądów, harmonogramy prac, specyfikacje
wymagao, raporty z awarii, ekspertyzy
• Bieżąca dokumentacja infrastruktury data centre – tworzenie, aktualizacja i
utrzymanie
• Efektywna komunikacja, przekazywanie informacji, planowanie i rejestracja działao
5. Data Centre Services Team
Kontekst zmian vs pomysły i narzędzia wsparcia
• Od roku 2008 w Organizacji:
– Rozbudowa Podstawowego Ośrodka Przetwarzania
– Szybki rozwój Banku w zakresie otwieranych placówek na terenie całej Polski (docelowo
– utrzymanie całości)
– Budowa nowego Disaster Recovery Centre
– Początki projektu budowy nowego Primary Data Centre
• Ponadto:
– Rozbudowa systemów monitorowania infrastruktury, sieci i systemów
– Dedykowany Zespół (24/7) odpowiedzialny za monitorowanie (integracja systemów
monitorowania, wspólny punkt zbierania alarmów i kontaktu)
– Dojrzewanie procesów w IT – zwiększenie świadomości w zakresie ITIL v3 pośród
wszystkich pracowników IT
6. Data Centre Services Team
Kontekst zmian vs pomysły i narzędzia wsparcia
• W ramach Zespołu DCS:
– Dalsza rozbudowa i rozszerzenie funkcjonalności systemu monitorowania
infrastruktury – SNMPc. Integracja z systemem Zabbix (poziom Organizacji)
– Wdrożenie systemu BMS – TAC Vista – w Primary Data Centre
– Wdrożenie systemu zarządzania infrastrukturą fizyczną data centre – DCPIM,
Data Centre Physical Infrastructure Manager
8. Data Centre Physical Infrastructure Manager
Początki…
• Wymagania zdefiniowane przez Zespół Data Centre Services
• System wdrożony i uruchomiony pierwszego dnia pracy przebudowanego Primary Data
Centre
• Ciągły rozwój i zmiana funkcjonalności w miarę definiowania nowych wymagao. Obecnie
praktycznie brak zmian – ustabilizowana funkcjonalnośd
• Gromadzenie całości wiedzy i dokumentacji na temat podległego obszaru
• Wsparcie realizacji i planowania prac:
– Awarie, zmiany, prace planowane, przeglądy zgodne z harmonogramem itp.
– Dane historyczne na potrzeby analiz
– Aktualna dokumentacja ośrodków
• System pierwotnie wdrożony – na próbę – w ramach Zespołu (in-house development),
obecnie znaczne rozwinięty, jeżeli chodzi o zakres funkcjonalności, architekturę rozwiązania i
zasięg
• Bardzo łatwa modyfikacja i możliwośd integracji z innymi narzędziami
10. Data Centre Physical Infrastructure Manager
Obecny stan systemu
• Zasięg geograficzny systemu:
– Wszystkie ośrodki przetwarzania i placówki Banku na terenie:
• Polski
• Litwy
• Łotwy
• Estonii
• Zarządzanie data centre i dokumentowanie zmian, awarii, prac itd.
• Dokumentacje operacyjne sprzętu (wsparcie przeglądów i obsługi awarii)
• Kilkanaście kont dla użytkowników, możliwośd dostępu R/O
• W trakcie integracji z systemem CMDB (osobny projekt w ramach
Organizacji), po udanych testach interfejsu integracyjnego w ramach PoC
(Proof-of-Concept)
11. Data Centre Services Team
Wsparcie procesów
• Kontrola dostępu / bezpieczeostwo
fizyczne
• Zarządzanie środkami trwałymi
• Zarządzanie zmianą
• Zarządzanie konfiguracją
• Zarządzanie pojemnością
• Zarządzanie zdarzeniami
• Zarządzanie incydentami
• Zarządzanie problemami
• Zarządzanie poziomem usług /
negocjacja i kontrola SLA,
kontraktów
35. Building Management
System
TAC Vista
• Building Management
System/SCADA. TAC Vista:
• Monitorowanie
parametrów pracy
infrastruktury PDC:
• Agregat prądotwórczy,
UPS, klimatyzacja,
parametry pomieszczeo,
kontaktrony, nagrywanie
Video.
36. Network Management System
SNMPc Enterprise Edition
• Monitorowanie infrastruktury na terenie Polski, w zakresie:
• Parametry pracy UPS:
• Napięcie WE/WY (wszystkie fazy), V
• Obciążenie (wszystkie fazy), W
• Napięcie bypassu (wszystkie fazy) V
• Pojemnośd baterii
• Parametry środowiskowe:
• Temperatura i wilgotnośd w pomieszczeniach technicznych
• Nagrywanie video
• NMS (Network Management Systems) – SNMPc Enterprise Edition
• SNMP (v1, v2, v3)
• Urządzenia sieciowe – ping;
• Usługi nie są monitorowane w tym systemie
• Podział na lokalizacje krytyczne i mniej priorytetowe (szachownica)
• Zintegrowany z systemem Zabbix, który działa w Centrum Monitorowania (24/7) –
alarmowanie SMS po przekroczeniu wartości progowych lub po nieoczekiwanym zdarzeniu
(notyfikacje SNMP) oraz telefon do administratora na dyżurze
37. Data Centre Physical Infrastructure Manager
SNMPc… Niestandardowa organizacja ekranu konsoli
Lokalizacje
krytyczne
Lokalizacje mniej
priorytetowe
38. Zarządzanie data centre
Przyszłośd?
• Dalsza integracja narzędzi i urządzeo do monitorowania z systemami zarządzania
infrastrukturą data centre
• Podejście procesowe (ITILv3) i traktowanie data centre jako całości, sumy zasobów
podlegających zarządzaniu (konwergencja)
• Dalszy rozwój i popularyzacja systemów DCIM – Data Centre Infrastructure Management
• Dlaczego?
– Większa kontrola nad podległym obszarem
– Efektywne wykorzystanie zasobów, przyjaznośd środowisku
– Mniejsze koszta utrzymania (regularny serwis i kontrola)
– Jeden wspólny punkt zarządzania całością
• Plany na przyszłośd?
– Integracja DCPI Manager z CMDB – zasilenie danymi z obszaru data centre
– Wdrożenie systemu DCIM dla kluczowych lokalizacji
– Dalszy rozwój systemu DCPI Manager
– Dalszy rozwój systemu SNMPc w ramach kompleksowego systemu monitorowania serwerowni (KMS)