SlideShare a Scribd company logo
1 of 9
Download to read offline
Rozwiązania
Data Center
36 wrzesień 2009
linux@software.com.pl
Data Center i wszytko
pod kontrolą
Każda współczesna organizacja, która swoje działanie opiera na usługach IT, może
być schematycznie pokazana jako piramida zależności, której podstawę stanowią
elementy Infrastruktury Krytycznej Serwerowni (IKS). W skład IKS wchodzą:
struktura fizyczna, zasilanie, chłodzenie, okablowanie strukturalne, monitorowanie
i zarządzanie, bezpieczeństwo fizyczne i ochrona przeciwpożarowa, a także dwa,
często niedoceniane, filary działu IT i całej organizacji: procedury i normy oraz
dokumentacja.
DCSerwis.pl
N
ie ma tu znaczenia, czy firma lub instytu-
cja wykorzystuje małą serwerownię z kil-
koma serwerami czy też wielkie Data Cen-
ter, schemat jest bardzo podobny. Podobne
są też wymagania, jakie musi spełnić serwerownia w ta-
kiej organizacji – przede wszystkim musi zapewniać bez-
pieczną przestrzeń fizyczną, dostarczyć energię elektrycz-
ną i moc chłodniczą dla aktualnie wykorzystywanych
technologii informatycznych oraz brać pod uwagę możli-
wy rozwój tych technologii na przestrzeni 4 – 5 lat.
Szybko rozwijające się technologie IT, m.in. takie
jak: serwery blade i macierze dyskowe, wymagają coraz
to większych mocy elektrycznych do ich zasilenia, a po-
tem mocy chłodniczych do odprowadzenia energii ciepl-
nej, co przy jednoczesnym coraz większym upakowaniu
urządzeń na metr kwadratowy serwerowni stawia wyso-
kie wymagania przed projektantami wszystkich elemen-
tów IKS eksploatowanych w serwerowni.
W tym artykule postaramy się opisać wszystkie ele-
menty IKS, ponieważ są one bardzo często niedoceniane
i pomijane. Dla wielu osób, nawet tych zajmujących się
zawodowo IT, elementy IKS są tak ukryte pod kolejnymi
warstwami organizacji, że zapominają lub nawet nie wie-
dzą o ich istnieniu. Poszczególne elementy IKS zostaną tu
opisane w formie specyfikacji wybranych wymagań, jakie
muszą zostać spełnione, aby serwerownia mogła być pra-
widłowo i bezpiecznie eksploatowana. Nie jest możliwe
opisanie wszystkich wymagań w jednym artykule, dlate-
go wybraliśmy tylko te, które wydają się tak oczywiste,
że często o nich zapominamy.
Obszar I. Struktura fizyczna
Ten obszar jest chyba najbardziej odległy od normal-
nych zadań IT i bardzo rzadko zdajemy sobie sprawę, jaki
wpływ na prawidłową eksploatację sprzętu IT mają decy-
zje podjęte w tym zakresie. Ze względu na złożoność za-
gadnienia, można wyróżnić tutaj kilka podobszarów tema-
tycznych.
Pomieszczenie serwerowni
Zazwyczaj nie mamy wpływu na lokalizację geograficzną
budynku, czasami możemy jednak wybrać w ramach bu-
dynku położenie pomieszczenia, które będzie pełniło rolę
serwerowni. Mając taki komfort, zwróćmy uwagę, że:
Rozwiązania
Data Center
37www.lpmagazine.org
• Ze względu na nasłonecznienie i przeni-
kanie ciepła przez ściany, pomieszczenie
nie powinno się znajdować od południo-
wej strony budynku; po stronie zacie-
nionej będzie można także umieścić wy-
mienniki ciepła do klimatyzatorów i tym
samym skrócić drogę prowadzenia rur
z czynnikiem chłodzącym od serwerowni
do zewnętrznych wymienników.
• Ze względu na ryzyko zalania serwerownia
nie powinna się znajdować w najniższym
miejscu budynku (raczej nie w piwnicy).
• Ze względu na konieczność zapewnienia
drogi transportowej dla wprowadzanego
sprzętu najlepiej, aby pomieszczenie znaj-
dowało się w okolicach parteru.
W pomieszczeniu nie powinno być żadnych
rur, prze które stale lub nawet tylko okreso-
wo płynie woda. Każda rura z wodą stanowi
potencjalne źródło wycieku, nawet jeśli w sa-
mej serwerowni nie ma żadnych połączeń ani
zaworów. Przeciek w dowolnym pomieszcze-
niu powyżej serwerowni spowoduje, że po ze-
wnętrznej warstwie tej rury do serwerowni do-
stanie się woda. Jeżeli nie ma możliwości usu-
nięcia rur z serwerowni, należy pod każdą z
nich zastosować okap lub rynnę, która odpro-
wadzi wodę poza obręb serwerowni, a we-
wnątrz rynny umieścić czujnik zalania.
W serwerowni powinno być jak najmniej
okien. Jeśli nie można zamurować lub zasło-
nić ścianką kartonowo – gipsową istniejących
okien, to przynajmniej należy je zasłonić ża-
luzjami odbijającymi ciepło. Pamiętajmy, że
jedno standardowe okno w letni dzień potra-
fi dostarczyć do wnętrza serwerowni tyle cie-
pła, ile jedna szafa rack (około 5kW) i o ty-
le też trzeba przewymiarować system chło-
dzenia. Wiąże się to z koniecznością zakupie-
nia na etapie inwestycji droższych i większych
urządzeń chłodniczych, co z kolei oznacza, że
w przyszłości koszty eksploatacji będą odpo-
wiednio większe.
Częstym błędem jest pozostawienie moż-
liwości otwarcia okien na wypadek awarii sys-
temów chłodzenia – już przy obecnych gęsto-
ściach mocy przypadających na jeden m2 po-
wierzchni serwerowni schłodzenie pomiesz-
czenia przez otwarcie okien nie jest możliwe,
a zgodnie z tendencjami gęstość mocy cały
czas rośnie, więc otwieranie okien nie schło-
dzi serwerowni.
Droga transportowa od wejścia do budyn-
ku aż do drzwi do serwerowni powinna mieć
szerokość 120cm, wysokość minimum 2,5m
i wytrzymałość na obciążenie do 1000kg/m2.
Na drodze transportowej nie może być żad-
nych progów ani stopni, cała musi być możliwa
do pokonania przez wózek do transportu palet.
Szczególną uwagę należy zwrócić na wszelkie
zakręty na drodze transportowej – czy sprzęt,
który planujemy wstawić, będzie mógł być
przeniesiony tą drogą? Dla uzyskania pewności
można wykonać model, który będzie miał pod-
stawę o takim samym obrysie, jak planowany
sprzęt i spróbować przenieść ten model drogą
transportową. Sprzęt typu duże macierze dys-
kowe jest często dostarczany w dedykowanych
szafach, które na czas transportu są umieszcza-
ne w opakowaniach transportowych o kilka
centymetrów większych od wymiarów samego
urządzenia i należy to uwzględnić planując dro-
gę transportową. Urządzenia, pod groźbą utraty
gwarancji, nie mogą być przechylane w czasie
transportu o więcej niż przewiduje to producent
(na czas transportu na opakowanie przyklejane
są elektroniczne wskaźniki przechyłu, które za-
pamiętują maksymalny kąt, pod jakim znala-
zło się opakowanie oraz czas zdarzenia), dlate-
go też wszelkie pochylnie na drodze transporto-
wej nie mogą być zbyt strome.
Podłoga techniczna
Stosowanie podłogi technicznej w serwerow-
ni ma swoich zwolenników i przeciwników.
Z jednej strony zastosowanie podłogi tech-
nicznej pozwala utworzyć kanał do dystrybu-
cji zimnego powietrza od maszyn chłodzących
oraz łatwo rozprowadzić okablowanie zasilają-
ce i logiczne, ale z drugiej strony podłoga pod-
niesiona zabiera sporo cennej wysokości po-
mieszczenia, a schowane tam kable maja ten-
dencję do tworzenia się bałaganu i po pewnym
czasie stanowią poważne przeszkody w prze-
pływie zimnego powietrza.
Alternatywnym rozwiązaniem jest zasto-
sowanie wylewki z masy samopoziomującej,
pokrytej niepylną farbą i poprowadzenie oka-
blowania ponad szafami. Każde z tych rozwią-
zań wymaga zastosowania innych rodzajów
maszyn klimatyzacyjnych.
Kształt pomieszczenia
Kształt pomieszczenia serwerowni powinien
być zbliżony do kwadratu. Aby w pomiesz-
czeniu można było umieścić jeden rząd szaf
rack, to jego minimalna szerokość może być
obliczona po zsumowaniu następujących wy-
miarów:
• miejsce na pełne otwarcie tylnych drzwi
szafy: 0,6 – 0,8m,
• głębokość szafy: 1,0 – 1,2m,
• miejsce na manipulowanie sprzętem przed
wsunięciem go do szafy (tyle samo, co
szerokość drogi transportowej): 1,2m.
Dla wstawienia jednego rzędu najmniejszych
szaf otrzymujemy minimalną szerokość po-
mieszczenia 2,8m, ale lepiej gdy pomieszcze-
nie ma min. 3m szerokości.
Wysokość pomieszczenia
Pomieszczenie serwerowni powinno być wyż-
sze niż 3m ze względu na konieczność zapew-
nienia miejsca na poprowadzenie okablowania
oraz na właściwy obieg powietrza. Jeżeli wy-
sokość pomieszczenia przeznaczonego na ser-
werownię będzie mniejsza niż 3m, to standar-
dowa szafa rack 42U, która bez dolnego coko-
łu ma 2m wysokości, pozostawi mniej niż metr
na poprowadzenie okablowania.
Rysunek 1. Proponowany model strukturalny organizacji opartej o usługi IT, inspirowany opracowaniem:
Zasadnicze wymagania dotyczące zarządzania infrastrukturą NCPI (W sieci [2])
38 wrzesień 2009
Rozwiązania
Data Center
Sufit i to, co jest powyżej
W pomieszczeniach znajdujących się ponad
pomieszczeniem serwerowni nie powinno być
żadnych instalacji z bieżąca wodą. Jest to wy-
maganie dość trudne do spełnienia w wielu wy-
padkach, dlatego też, jeśli zależy nam na zabez-
pieczeniu sprzętu w serwerowni przed zalaniem
(np. przeciekający przez kilka wolnych dni ka-
loryfer), to o ile pozwala na to wysokość po-
mieszczenia serwerowni, ochronę przed zala-
niem z góry można uzyskać stosując szczelny
okap z rynną wewnątrz serwerowni.
Ściany i sąsiedzi
Współczesny sprzęt IT stosowany w serwero-
wniach nie należy do najcichszych, dlatego też
ściany i drzwi serwerowni powinny mieć od-
powiednią dźwiękochłonność, zwłaszcza, je-
śli obok serwerowni znajdują się pomiesz-
czenia biurowe do pracy. Nie wolno bagate-
lizować tego wymagania, ponieważ najnow-
sze serwery czołowych producentów produku-
ją tak wysoki poziom hałasu, że zgodnie z in-
strukcją obsługi, praca przy nich jest możliwa
tylko w ochronnikach słuchu.
Sposób rozmieszczenia szaf
w pomieszczeniu
Rozmieszczenie szaf (ang. layout) jest kluczo-
wym elementem, który ma wpływ na obieg po-
wietrzawewnątrzserwerowni,atymsamymna
sprawność systemu chłodzenia. Aby uniknąć
mieszania się powietrza zimnego z wylotów
maszyn chłodzących z gorącym z wylotów
wentylatorów urządzeń (serwerów, macierzy
dyskowych, urządzeń łączności teleinforma-
tycznej itp.) wskazane jest zastosowanie tzw.
zimnych i gorących korytarzy. W skrócie po-
lega to na takim zaprojektowaniu ustawienia
szaf, aby wszystkie maszyny pobierały zimne
powietrze z jednej strony szafy i po schłodze-
niu wewnętrznych elementów serwera gorące
powietrze było wydmuchiwane jak najbliżej
wlotów klimatyzatorów (Rysunek 2). Szcze-
gółowe omówienie tego tematu wykracza po-
za ramy niniejszego artykułu.
Obszar II. Zasilanie
System zasilania jest kolejnym krytycznym sys-
temem serwerowni, w skład którego wchodzą:
• przyłącza elektroenergetyczne,
• agregat prądotwórczy,
• układ Samoczynnego Załączania Rezer-
wy (SZR),
• system zasilaczy UPS,
• dedykowane rozdzielnie elektryczne,
• system dystrybucji energii dla urządzeń IT.
Przyłącza elektroenergetyczne (jeśli jest wię-
cej niż jedno) wraz z agregatem prądotwór-
czym są podłączone do układu SZR, który
w przypadku zaniku zasilania z jednego ze
źródeł podstawowych, przełącza zasilanie na
źródła rezerwowe i stanowi pierwszy stopień
redundancji układu zasilania. Za układem SZR
są podłączone zasilacze UPS, które w zależno-
ści od potrzeb, także mogą pracować w syste-
mie redundantnym. Zadaniem UPS jest pod-
trzymanie na czas kilku minut napięcia zasila-
jącego urządzenia IT, tak aby mogły zadziałać
układy automatyki i uruchomić agregat. Sys-
tem zasilania musi być zaprojektowany przez
uprawnionego projektanta i musi uwzględ-
niać bilans mocy wynikający z mocy pobie-
ranej przez:
• zainstalowany i planowany do zainstalo-
wania sprzęt IT,
• klimatyzatory chłodzące serwerownię,
• zasilacze UPS wraz z mocą potrzebną na
doładowanie akumulatorów,
• oświetlenie i inne obwody ogólne,
• planowanego wzrostu obciążenie (rezerwa).
Ważne jest takie zaprojektowanie i dobranie
wszystkich elementów, aby w sytuacji awaryj-
nej mogły pracować jako jeden spójny system.
Dotyczy to zwłaszcza odpowiedniego dobra-
nia tandemu UPS – agregat, ponieważ w za-
leżności od rodzaju zastosowanych zasilaczy
Rysunek 3. Interfejs webowy analizatora jakości mocy Eaton Power Xpert METERS – w rzeczywistości
jest to wygodny w obsłudze i efektowny aplet Java
Rysunek 2. Sposób rozmieszczenia szaf w serwerowni i pozostałych elementów w pomieszczeniu o minimal-
nym, akceptowalnym rozmiarze. Widzimy, że ogrzane przez urządzenia IT powietrze trafia możliwie najkrótszą
drogą do wlotu klimatyzatora, z kolei schłodzone powietrze jest kierowane tak, aby urządzenia IT mogły po-
bierać je z jednej strony szafy. Nie powinno być także problemów z montażem urządzeń i dostępem do pozo-
stałych elementów. Na rysunku został też schematycznie zaznaczony okap z rynną, który zabezpiecza sprzęt
przed zalaniem
39www.lpmagazine.org
Rozwiązania
Data Center
UPS wymagane jest znaczne przewymiarowa-
nie mocy zastosowanego agregatu (w granicz-
nych przypadkach nawet ponad dwukrotne!).
Celem uniknięcia zakłóceń i ochrony pracu-
jących osób w całym obiekcie serwerowni na-
leży poprawnie zaplanować instalację połączeń
wyrównawczych, która musi być dołączona do
głównej szyny wyrównawczej budynku zwa-
nej, potocznie uziomem. Do instalacji wyrów-
nawczej powinny być podłączone wszystkie
przewodzące części konstrukcyjne i wyposaże-
niaserwerowni(np.:obudowymetalowychurzą-
dzeń elektrycznych, szaf serwerowych, konstruk-
cja wsporcza podłogi podniesionej, rury instala-
cji wentylacyjnej, CO, wody itp.).
Obszar III. Chłodzenie
Dostarczanie chłodu do serwerowni jest to tak-
że obszar odległy od normalnych zadań IT, cho-
ciaż, podobnie jak w przypadku struktury fi-
zycznej, decyzje podjęte w tym zakresie mają
olbrzymi wpływ na eksploatację sprzętu IT i, co
obecnie jest ważniejsze, na koszty tej eksploata-
cji. Urządzenia IT zainstalowane w serwerow-
ni wymagają ciągłego dostarczania odpowied-
niej ilości chłodu niezależnie od tego, czy za-
instalowany system chłodzenia może je zapew-
nić. Jeśli w pomieszczeniu nie będzie wystar-
czającej ilości chłodnego powietrza, zainstalo-
wane w szafach urządzenia będą pobierać wła-
sne gorące powietrze wylotowe (lub gorące po-
wietrze wylotowe sąsiednich urządzeń), aż do
momentu kiedy sprzęt IT ulegnie przegrzaniu.
Dostarczanie chłodu dla urządzeń IT często jest
nazywane klimatyzacją precyzyjną, ponieważ w
odróżnieniu od klimatyzacji komfortu (tzw. biu-
rowej lub domowej) ma na celu utrzymanie od-
powiedniego klimatu, tzn. oprócz odpowiedniej
temperatury w pomieszczeniu serwerowni musi
także zapewnić odpowiednią wilgotność.
Dla urządzeń IT i innych urządzeń elektro-
nicznych zbyt wysoka wilgotność to niebezpie-
czeństwo kondensacji pary wodnej na podze-
społach, a z kolei zbyt niska wilgotność to ry-
zyko pojawienia się wyładowań elektrostatycz-
nych stanowiących zagrożenie dla poprawnej
pracy elektroniki. Dodatkowo, wybierając urzą-
dzenia klimatyzacji precyzyjnej należy zwrócić
uwagę na następujące parametry:
• Zaawansowane systemy sterowania i au-
tomatyki:
Układy sterowania i automatyki dla kli-
matyzacji precyzyjnej muszą charaktery-
zować się następującymi cechami:
– Praca w układzie redundantnym z cy-
klicznym przełączaniem pracujących
urządzeń (praca w tzw. trybie turnu-
sowym).
– Brak pojedynczego punktu awarii (ang.
Single Point Of Failure, SPOF).
• Rozszerzone możliwości komunikacyjne
– możliwości podpięcia do systemów za-
rządzania budynkami (ang. Building Mana-
gement System, BMS) poprzez dedykowa-
ne protokoły komunikacyjne (np. Modbus,
canBus, LonTalk, itp.)
• Możliwość pracy całorocznej – klimaty-
zacja komfortu pracuje tylko kilka godzin
dziennie w okresach letnich, natomiast
urządzenia klimatyzacji precyzyjnej muszą
pracować w trybie 24/7/365. To powoduje,
oprócz wymagań na trwałość mechaniczną,
znaczne rozszerzenie wymagań co do odpor-
ności jednostek zewnętrznych na tempera-
tury w zakresie od –25C do ponad 35C.
• Brak podgrzewacza powietrza – w insta-
lacjach klimatyzacji precyzyjnej nie sto-
suje się urządzeń służących do podgrzewa-
nia powietrza, które są zwykle montowane
w instalacjach klimatyzacji bytowej.
Duże ilości powietrza przepływającego przez
maszyny – z powodu wysokiej gęstości mocy
cieplnej (mocy przypadającej na m2 pomiesz-
czenia) we współczesnych serwerowniach,
w instalacjach klimatyzacji precyzyjnej, prze-
pływa dużo więcej powietrza niż w klimaty-
zacji komfortu, co wymaga odpowiednio du-
żych wentylatorów w jednostkach wewnętrz-
nych i powoduje wysoki poziom hałasu w po-
mieszczeniu.
Warto podkreślić, że przeznaczenie i spo-
sób pracy urządzeń klimatyzacji precyzyjnej są
całkowicie odmienne od powszechnie znanej i
najczęściej widywanej klimatyzacji komfortu,
ale niestety inwestorzy, bardzo często, planując
serwerownie nie biorą pod uwagę tych różnic
lub wręcz pomijają ten ważny aspekt działania i
niezawodności nowoczesnych serwerowni.
Dodatkowym problemem jest wentylacja
serwerowni dla celów bytowych, tzn. zapew-
niająca minimalną wymianę powietrza w po-
mieszczeniu umożliwiającą czasowe przeby-
wanie w nim osób z obsługi IT.
Obszar IV. Okablowanie
strukturalne
Głównym problemem występującym w trak-
cie projektowania okablowania strukturalnego
serwerowni jest konieczność upchnięcia setek,
jeśli nie tysięcy, połączeń okablowania pozio-
mego, pionowego, połączeń systemowych na
zwykle dosyć ograniczonej powierzchni (a do-
kładnie to w ograniczonej przestrzeni) i dotyczy
to zarówno rozwiązań miedzianych jak i świa-
tłowodowych. Sumaryczna długość połączeń
nawet niewielkiej serwerowni często przekra-
cza kilka kilometrów, przekroje połączonych
wiązek osiągają kilkadziesiąt centymetrów,
a łączna waga okablowania musi być uwzględ-
niana w procesie obliczania całkowitego obcią-
żenia podłogi. Przy tak skomplikowanej struk-
turze szczególnego znaczenia nabiera sprawa
przyjęcia i konsekwentnego stosowania wła-
ściwego oznakowania okablowania, bo bez te-
go nie jest możliwe zapanowanie nad porząd-
kiem w okablowaniu.
Kolejną istotną sprawą jest wybór odpo-
wiedniego rodzaju okablowania, aby zapew-
nić bezawaryjną pracę przez założony, zwykle
dość długi, okres eksploatacji. W miarę rozwo-
ju rozwiązań technicznych znacznie łatwiej jest
wymienić urządzenia na te nowszej generacji
niż wymienić istniejące okablowanie, ponieważ
zwykle jest to powiązane z praktycznym wyłą-
czeniem z eksploatacji części serwerowni.
W przypadku okablowania miedzianego,
praktycznie do wyboru jest kategoria 5e lub
kategoria 6. Rozwiązania kategorii 7 nie są
w zasadzie obecnie stosowane, ponieważ aby
uzyskać pasmo przenoszenia tej kategorii bar-
dziej opłaca się zastosować okablowanie świa-
tłowodowe. Kolejne decyzje dotyczą wyboru:
typu okablowania (UTP lub FTP), typu powło-
ki zewnętrznej – niepalna, niepalna LSZH, oraz
dodatkowe parametry, takie jak np. odporność
Rysunek 4. Analizator Power Xpert METERS wykorzystuje własną wbudowaną wersję systemu operacyjne-
go, opartą na jądrze Linux 2.4.20 i oprogramowaniu BusyBox 0.60.3. Mamy możliwość dostępu poprzez SSH
40 wrzesień 2009
Rozwiązania
Data Center
na atak gryzoni. W przypadku wyboru rodza-
ju okablowania światłowodowego decyzje do-
tyczą: liczby włókien w kablu; wyboru rodza-
ju włókna: jednomodowe (9/125) lub wielomo-
dowe (62.5/125, 50/125 lub 50/125 OM3); oraz
podobnie jak dla kabli miedzianych typu po-
włoki zewnętrznej.
Obszar V. Monitorowanie
i zarządzanie
W przypadku IKS istotne jest ciągłe rejestrowa-
nie parametrów pracy urządzeń, takich jak: za-
silacze UPS; agregaty prądotwórcze; urządzenia
systemu klimatyzacji (ang. Humidity, Ventila-
tion and Conditioning, HVAC); czujki środowis-
kowe (ang. Environmental Monitoring Probes,
EMP), etc. Wykorzystywane są także analizatory
jakości energii elektrycznej (np. urządzenia Po-
wer XPERT Xpert METERS 4000/6000/8000
firmy Eaton Powerware – co ciekawe, oparte
zresztą o własną wersję systemu GNU/Linux
i zestaw narzędzi dla systemów wbudowanych
BusyBox – patrz Rysunek 3 i Rysunek 4).
Proces ten generuje ogromne ilości danych, któ-
re należy gromadzić w takim zakresie, aby moż-
liwe było późniejsze ich analizowanie i wycią-
ganie wniosków (co stanowi nie tylko składo-
wą prac związanych z diagnozowaniem i zapo-
bieganiem awariom, ale jest podstawą planowa-
nia działań i efektywnego zarządzania zasoba-
mi IKS).
Ponadto, monitorowanie IKS ma odmienną
specyfikę niż na wyższych warstwach propono-
wanego modelu strukturalnego organizacji.
Całkowicie nie ma tutaj sensu monitorowanie
urządzeń z użyciem protokołu ICMP (PING)
czy badanie dostępności usług (np. HTTPS,
HTTP, Oracle SQL*Net etc.), co ma miejsce
w wyższych warstwach (serwerów, urządzeń
transmisji danych i pamięci masowych, a tak-
że systemów operacyjnych, baz danych i apli-
kacji – Rysunek 1). Podstawą monitorowania
IKS jest protokół SNMP (ang. Simple Network
Management Protocol, SNMP).
Protokół SNMP
w systemach monitorowania IKS
Do monitorowania IKS, podobnie jak do mo-
nitorowania urządzeń transmisji danych czy
serwerów, wykorzystuje się protokół SNMP.
Powstał on w roku 1988 i miał dostarczyć na-
rzędzia pozwalającego zdalnie zarządzać za-
sobami infrastruktury sprzętowej sieci kompu-
terowych (początkowy okres popularyzacji In-
ternetu). Warto zauważyć, że protokół SNMP,
choć w istocie bardzo prosty (na tym polega
jego siła), bywa dość powszechnie niewła-
ściwie rozumiany – być może dlatego, że ma
dość specyficzne zasady działania i różni się
od większości powszechnie znanych, usługo-
wych protokołów sieciowych. Ponadto, zgod-
nie z pierwotnym przeznaczeniem, szczególne
miejsce zajął w dziedzinie zarządzania zaso-
bami sieci teleinformatycznych, co częstokroć
bywa ziarnem niezgody, jeśli chodzi o wza-
jemne zrozumienie potrzeb monitorowania za-
sobów w różnych obszarach i warstwach pro-
ponowanego modelu organizacji (Rysunek 1).
Rozróżniamy 3 wersje protokołu SNMP.
SNMPv1 – wersja najstarsza, znajdująca
się obecnie w powszechnym użyciu, jeśli cho-
dzi o urządzenia IKS. Niestety, słabą stroną tej
wersji są minimalne możliwości zabezpieczania
komunikacji między urządzeniami. Istnieje tu0
taj mechanizm haseł uwierzytelniających (zwy-
kle używane są hasła podatne na ataki siłowe
– ang. brute–force attack), ale cała komunikacja
odbywa się jawnym tekstem, standardowo po
protokole UDP/IP(istnieje zagrożenie podsłuchu
transmisji poprzez przechwytywanie pakietów
sieciowych – ang. packet sniffing). Jednak
producenci urządzeń IKS w dużym stopniu zda-
ją się nie przejmować tym problemem, a szkoda
(niestety, temat bezpieczeństwa SNMP wykra-
cza poza zakres niniejszego opracowania).
SNMPv2 (w tym podwersje SNMPv2p
– ang. party–based, SNMPv2c – ang. commu-
nity based i SNMPv2u ang. user–based) – w tej
wersji wprowadzono drobne rozszerzenia funk-
cjonalności protokołu oraz starano się podnieść
poziom zabezpieczeń. Stanowczo rzadziej spo-
tykamy urządzenia IKS wspierające SNMPv2.
Zmiany spowodowały też utratę kompatybilno-
ści z wersją 1 (jej zapewnienie wymaga stoso-
wania dedykowanych serwerów pośredniczą-
cych – ang. proxy server lub użycia systemów
monitorowania, które obsługują obydwa proto-
koły, co dziś raczej nie stanowi problemu).
SNMPv3 – ta wersja ma na celu wyłącznie
zniesienie problemu niskiego poziomu bezpie-
czeństwa poprzednich wersji. Nie wprowadza
żadnych rozszerzeń funkcjonalnych i jest tak-
że rzadziej wspierana przez urządzenia IKS.
Co warte podkreślenia, SNMP nie obciąża
sieci w znacząco dużym stopniu, co z pewno-
ścią stanowi zaletę protokołu.
Model komunikacji i zasada
działania SNMP
Protokół SNMP wymaga, aby w sieci funk-
cjonowały następujące elementy: menedże-
rowie SNMP (aplikacje monitorujące), agen-
ci SNMP (aplikacje działające po stronie mo-
nitorowanych urządzeń) i bazy informacji za-
rządzania (ang. Management Information Ba-
se, MIB), dostępne dla obydwu stron komuni-
kacji. Standardowo, komunikacja między me-
nedżerem a agentem SNMP odbywa się z uży-
ciem protokołu UDP/IP i portów:
• 161 – służy menedżerowi do odczytu pa-
rametrów z agenta,
• 162 – jest używany podczas przesyłania
notyfikacji z agenta do menedżera.
Menedżer SNMP to nic innego jak aplikacja
wykorzystywana przez administratora zarzą-
dzanego systemu. Zwykle jest to aplikacja ty-
pu NMS, ale może być to aplikacja EMS, BMS
lub SCADA, o ile wspiera protokół SNMP (Ry-
sunek 5).
Obydwie strony modelu komunikacyjne-
go SNMP wykorzystują bazy danych MIB (Li-
sting 1) i niewielką liczbę komend, pozwalają-
cych wymieniać informacje. Baza MIB jest bar-
dzo charakterystycznym dla SNMP elementem
– stanowi ona zorganizowany w postaci struk-
Rysunek 5. Schemat rozmieszczenia wymaganych elementów komunikacji dla protokołu SNMP. Widać, że
zarówno menedżer, jak i agenci muszą używać właściwych dla danych urządzeń baz MIB. Menedżer SNMP
pobiera parametry (tzw. pooling obiektów) oraz odbiera notyfikacje – dane są prezentowane operatorowi
41www.lpmagazine.org
Rozwiązania
Data Center
tury drzewiastej zestaw informacji na temat za-
rządzanego urządzenia. W rzeczywistości są to
pliki tekstowe, które zawierają opisy w notacji
ASN.1 (ang. Abstract Syntax Notation One).
Menedżer SNMP, aby ustawić wartość kon-
kretnego parametru urządzenia, odczytać ją lub
zrozumieć odebraną z urządzenia notyfikację,
musi się w rzeczywistości poruszać pomiędzy
liśćmi drzewa, przechodząc ścieżki wytyczone
po gałęziach od liścia do liścia. Te ścieżki nazy-
wane są identyfikatorami obiektów – OID (ang.
Object Identifier). Każdy OID wskazuje na uni-
kalny dla danego urządzenia obiekt (możemy
rozumieć go jako zmienną lub parametr) i składa
się z szeregu cyfr oddzielonych kropkami. Z te-
go względu, identyczna baza MIB musi być do-
stępna zarówno dla menedżera SNMP(działają-
cego na stacji monitorującej administratora), jak
i dla monitorowanego urządzenia (Rysunek 6).
Menedżer SNMP i agent wymieniają mię-
dzy sobą komunikaty, które dotyczą określonej
zmiennej wskazanej za pomocą OID. Oprócz
operacji odczytu i zapisu wartości parametrów,
istnieje możliwość takiego skonfigurowania
agenta, aby w przypadku zajścia określonego
zdarzenia (zdefiniowanego w MIB), automa-
tycznie poinformował o tym fakcie menedże-
ra SNMP. W tym celu wykorzystywane są tzw.
notyfikacje SNMP (ang. SNMP notification),
odpowiadające komunikatom typu Trap.
Oto kilka numerów OID opisujących róż-
ne obiekty (parametry) dla urządzeń IKS:
• Zasilacze UPS Eaton Powerware:
– 1.3.6.1.4.1.534.1.0.0.0.6 – na-
zwa w MIB: xupstbReturnFromLow-
Battery, przenosi komunikat z MIB:
The battery has recovered from a low
battery condition. Jest to definicja noty-
fikacji, która może zostać przesłana od
agentadomenedżeraSNMPpotym,jak
baterie zasilacza zostaną doładowane.
– 1.3.6.1.4.1.534.1.3.4.1.2 – na-
zwa w MIB: xupsInputVoltage, za-
wiera opis w MIB: The measured input
voltage from the UPS meters in volts.
Ten obiekt zawiera wartość napięcia
wejściowego w woltach, którą mene-
dżer może odczytać z agenta SNMP.
• Zasilacze UPS Delta–UPS:
– 1.3.6.1.4.1.2254.2.4.5.14.0
– nazwa w MIB: dupsOutputPower3,
zawiera opis w MIB: The Output line
3realpoweroftheUPSsysteminwatts.
Ten obiekt zawiera wartość mocy wyj-
ściowej na trzeciej fazie w watach,
którą menedżer może odczytać z agen-
ta SNMP.
• Zasilacze UPSAmerican Power Conversion:
– 1.3.6.1.4.1.318.0.2 – nazwa w MIB
upsOverload, przenosi komunikat
z MIB: SEVERE: The UPS has sensed
a load greater than 100 percent of its
ASN.1. Widzimy kolejno grupę obiektów odpowiadających parametrom
rejestrowanym na wejściu zasilacza UPS, odpowiednio: xupsInput-
Voltage (napięcie wejściowe w V), xupsInputCurrent (natężenie
wejściowe w A), xupsInputWatts (moc wejściowa w W) i grupę
parametrów wyjściowych: xupsOutputLoad (obciążenie w procentach
dopuszczalnej pojemności), xupsOutputVoltage (napięcie
wyjściowe w V), xupsOutputCurrent (natężenie wyjściowe w A),
xupsOutputWatts (moc wyjściowa w W).
[…]
––
–– xupsInput group:
––
xupsInputVoltage OBJECT–TYPE
SYNTAX INTEGER (0..2147483647) –– UNITS RMS Volts
ACCESS read–only
STATUS mandatory
DESCRIPTION
„The measured input voltage from the UPS meters
in volts.”
::= {xupsInputEntry 2}
xupsInputCurrent OBJECT–TYPE
SYNTAX INTEGER (0..2147483647) –– UNITS RMS Amp
ACCESS read–only
STATUS mandatory
DESCRIPTION
„The measured input current from the UPS
meters in amps.”
::= {xupsInputEntry 3}
xupsInputWatts OBJECT–TYPE
SYNTAX INTEGER (0..2147483647) –– UNITS Watts
ACCESS read–only
STATUS mandatory
DESCRIPTION
„The measured input real power in watts.”
::= {xupsInputEntry 4}
––
–– xupsOutput group:
––
xupsOutputLoad OBJECT–TYPE
SYNTAX INTEGER (0..200)
ACCESS read–only
STATUS mandatory
DESCRIPTION
„The UPS output load in percent of rated capacity."
::= {xupsOutput 1}
[…]
xupsOutputVoltage OBJECT–TYPE
SYNTAX INTEGER (0..2147483647) –– UNITS RMS Volts
ACCESS read–only
STATUS mandatory
DESCRIPTION
„The measured output voltage from the UPS
metering in volts.”
::= {xupsOutputEntry 2}
xupsOutputCurrent OBJECT–TYPE
SYNTAX INTEGER (0..2147483647) –– UNITS RMS Amp
ACCESS read–only
STATUS mandatory
DESCRIPTION
„The measured UPS output current in amps.”
::= {xupsOutputEntry 3}
xupsOutputWatts OBJECT–TYPE
SYNTAX INTEGER (0..2147483647) –– UNITS Watts
ACCESS read–only
STATUS mandatory
DESCRIPTION
„The measured real output power in watts."
::= {xupsOutputEntry 4}
[…]
Listing 1. Fragment pliku bazy danych MIB przedstawiający wybrane definicje obiektów w języku
42 wrzesień 2009
Rozwiązania
Data Center
rated capacity. Jest to definicja notyfi-
kacji, która może zostać przesłana od
agenta do menedżera SNMP po tym,
jak UPS wykryje, że został przecią-
żony.
• Czujka środowiskowa EMP, Eaton Power-
ware:
– 1.3.6.1.4.1.534.6.7.1.1.3.2.1.3 –
nazwa w MIB smDeviceTemperatu-
re, zawiera opis w MIB: Temperature
of sensor on device RackMonitor, the
unit is 0.1 degree. Ten obiekt zawiera
wartość temperatury mierzonej przez
czujkę w 1/10 stopnia C. Menedżer
może odczytać tą wartość z agenta.
– 1.3.6.1.4.1.534.6.7.1.2.0.20
– nazwa w MIB rmUmidityHigh-
Critical, przenosi komunikat: CRI-
TICAL: The humidity of sensor was hi-
gher than high critical set point. Jest to
definicja notyfikacji, która może zo-
stać wysłana od agenta do menedżera
SNMP po tym, jak czujka wykryje, że
wilgotność osiągnęła wartość większą
niż najwyższy dozwolony (krytyczny)
próg alarmowy.
Podane powyżej ścieżki OID odpowiadają kon-
kretnej lokalizacji w drzewie MIB. Parametry
wskazywane przez numery OID mogą być (w
zależności od uprawnień menedżera oraz od
ich przeznaczenia): czytane lub zapisywane.
Przykładem parametrów do odczytu mogą być
wcześniej przywołane xupsInputVoltage,
dupsOutputPower3, smDeviceTemperature,
z kolei parametrem, którego wartość moż-
na zmieniać może być np.: dla zasilacza UPS
EatonPowerware:1.3.6.1.4.1.534.1.8.1.0
– nazwa w MIB xupsTestBattery, zawiera
opis w MIB: Setting this variable to startTest
initiates the battery test. All other set values are
invalid. Jeśli w tym parametrze (obiekcie) zapi-
szemy wartość startTest, zdalnie wymusimy
rozpoczęcie testów baterii.
Jak wspomnieliśmy, protokół SNMP ofe-
ruje stosunkowo małą ilość poleceń. Dla wer-
sji 1 najważniejsze to (Rysunek 7):
Odczyt:
• Get – pobranie wartości obiektu wskaza-
nego przez OID,
• GetNext – pobranie wartości następnego
obiektu.
Zapisu:
• Set – ustawienie wartości obiektu wska-
zanego przez OID,
Odpowiedź:
• Get–Response – wysłanie odpowiedzi
na zapytanie Get lub GetNext menedże-
ra SNMP.
Notyfikacja:
• Trap – asynchroniczne wysłanie notyfi-
kacji o zaistniałym zdarzeniu.
Wersja 2 wprowadza dodatkowo polecenia:
GetBulk (pobranie grupy wartości obiektów
wskazanych OID) i Inform (pozwala na prze-
słanie przez NMS dalej do innych NMS ode-
branego komunikatu typu Trap).
Zanim jakiekolwiek polecenie zostanie
przesłane od menedżera do agenta SNMP, to – w
zależności od typu operacji – menedżer SNMP
łącząc się z agentem SNMP przekazuje mu jed-
no ze skonfigurowanych na agencie haseł:
• Public community, czy inaczej read com-
munity – czyli hasło publiczne, odczy-
tu parametrów. Dla większości urządzeń
jest ono domyślnie ustawione na public,
co oczywiście w pierwszej kolejności za-
leca się zmienić.
• Private community, czy inaczej write com-
munity – czyli hasło prywatne, zapisu para-
metrów. Domyślnie jest ono zwykle usta-
wione na private i bezwzględnie należy je
zmienić.
W rozległych IKS odbierane przez menedże-
rów SNMP notyfikacje mogą być przesyłane
dalej, np. do nadrzędnej aplikacji menedżera
SNMP lub z podstawowego systemu monitoro-
wania na system zapasowy. Zakres tej funkcjo-
nalności zależy od producenta aplikacji monito-
rującej – zwykle w połączeniu z mechanizmem
filtrów daje ona spore możliwości organizowa-
nia i separowania informacji. Słabą stroną noty-
fikacji SNMP jest fakt, że przesyłane z użyciem
protokołu UDP (na port 162) są narażone na to,
że nie dotrą do celu. Na szczęście, zwykle w sy-
tuacjach alarmowych, dostajemy większą licz-
bę komunikatów, a o anomaliach będzie moż-
na się zorientować także po bieżących wskaza-
niach monitorowanych parametrów (przekro-
czenie progów alarmowych).
Monitorowanie na różne sposoby
Po pierwsze, należy wyróżnić tzw. monitoro-
wanie aktywne (ang. active monitoring). – za-
chodzi ono wówczas, kiedy w systemie moni-
Rysunek 6. Drzewiasta struktura bazy MIB ze wskazaniem ścieżek prowadzących od głównego liścia (ISO
[1]) do liści zawierających wartości parametrów xupsInputFrequency.0 (częstotliwość wejściowa linii użyt-
kowej w 1/10Hz) i xupsInputVoltage.1 (napięcie w V dla pierwszej fazy zasilania). Widać, w jaki sposób
konstruowane są numery OID dla urządzeń UPS Eaton Powerware
43www.lpmagazine.org
Rozwiązania
Data Center
torującym (np. NMS), pełniącym rolę mene-
dżera SNMP, definiujemy tzw. pooling. Jest to
mechanizm odpytywania kolejnych urządzeń
w puli o wartości ich parametrów. W mene-
dżerze definiujemy także progi alarmowe – je-
żeli odpowiedź z danego urządzenia będzie za-
wierała wartość parametru, która przekracza
próg, generujemy zdarzenie alarmowe, np.:
• komunikat ekranowy,
• sygnał dźwiękowy,
• e-mail do administratorów,
• SMS na telefony komórkowe osób dyżu-
rujących,
• komunikat SNMP Trap,
• wyzwolenie dowolnej operacji, na któ-
rą zezwala nasza aplikacja monitorująca
– np. uruchomienie dodatkowej aplikacji,
skryptu etc.
Aktywne monitorowanie pozwala na bieżąco
badać parametry i generować zdarzenia alar-
mowe, ale jest także podstawą drugiego istot-
nego podejścia do monitorowania. Jest nim
monitorowanie wydajności (ang. performance
monitoring) lub inaczej (co bardziej odpowia-
da dziedzinie IKS) – kolekcjonowanie danych
na potrzeby generowania trendów.
Parametry, które są odczytywane dzięki
mechanizmowi poolingu z kolejnych urządzeń
mogą być zapisywane w bazie danych mene-
dżera SNMP (nie należy mylić bazy danych
aplikacji z bazą danych MIB – to dwie różne
rzeczy) i zbierane przez zdefiniowany okres
czasu. Dzięki temu administrator ma możli-
wość analizowania trendów przedstawiają-
cych zmienność wartości parametrów w cza-
sie. Taka funkcjonalność daje ogromne możli-
wości, jeśli chodzi o diagnozowanie przyczyn
i okoliczności awarii (np. narastająca temperatu-
ra oznaczała awarię klimatyzacji), ale także po-
zwala z wyprzedzeniem przewidywać ewentu-
alne incydenty, planować serwis urządzeń, pla-
nować zakupy nowych urządzeń, czy wymia-
nę elementów podlegających zużyciu (np. bate-
rii zasilacza UPS) – w tym sensie dane te mają
bezpośrednie przełożenie na szacowane koszta
operacyjne. Poza monitorowaniem aktywnym
i zbieraniem trendów – czym zajmuje się me-
nedżer SNMP – mamy do czynienia z bardzo
istotną odmianą monitorowania, która stanowi
w rzeczywistości podstawę efektywnego syste-
mu monitorowania rozległych IKS. Jest to mo-
nitorowanie pasywne, oparte na wymianie no-
tyfikacji SNMP. W tym przypadku menedżer
SNMP nasłuchuje w sposób ciągły (port 162
UDP), a agenci działający na urządzeniach po
zaistnieniu określonego zdarzenia wysyłają no-
tyfikację na skonfigurowany adres zaufanej sta-
cji monitorowania (na której działa aplikacja
menedżera). Notyfikacje mogą mieć różne zna-
czenie i występują na różnych poziomach waż-
ności. Niestety, nie obowiązuje tutaj żaden wy-
raźny standard, a więc należy umiejętnie skon-
figurować zarówno agentów SNMP na naszych
urządzeniach, jak i wprowadzić przemyślane re-
guły filtrowania oraz korelowania zdarzeń w
aplikacji menedżera SNMP. Notyfikacje SNMP
mają różną ważność, np.:
• Minor 01/07/2009 07:46:26 UPS0001GDY
upsTrapAlarmEntryRemoved [1]
upsAlarmId.0 (Integer): 20 [2]
upsAlarmDescr.0 (Object ID):
upsAlarmCommunicationsLost [3]
snmpTrapEnterprise.0 (Object ID):
upsTraps
– adapter SNMP utracił łączność z zasi-
laczem UPS. Nie jest to sytuacja bardzo
krytyczna i nie musi oznaczać faktu nie-
dostępności zasilacza UPS. Problem mo-
że leżeć po stronie adaptera SNMP lub
połączenia i może być chwilowy.
• Info 30/06/2009 23:29:23
UPS0086GDN upsOnBattery [1]
mtrapargsString.0
(DisplayString): UPS: On battery
power in response to an input
power problem. [2] snmpTrap-
Enterprise.0 (Object ID): apc :
– notyfikacja informuje, że zasilacz UPS
rozpoczął podtrzymywanie zasilania z ba-
terii w odpowiedzi na zarejestrowany za-
nik zasilania. Jeżeli sytuacja ta potrwa dłu-
żej, to możemy spodziewać się zadziała-
nia układu SZR, który załączy agregat. Je-
żeli w danej lokalizacji nie ma agregatu,
czas rozpocząć zatrzymywanie baz danych,
aplikacji i wyłączanie sprzętu.
• Info 30/06/2009 23:29:25 UPS0921W-
WA powerRestored [1] mtrapargs-
String.0 (DisplayString): UPS: No
longer on battery power. [2] snmp-
TrapEnterprise.0 (Object ID): apc
– wiemy, że zasilacz UPS przestał praco-
wać na bateriach. Oznacza to, że powróci-
ło zasilanie z miasta lub układ SZR załą-
czył agregat. Rozpocznie się teraz ładowa-
nie baterii.
• Warning 30/06/2009 22:10:05 EMP00-
32KRA Triggered Manual Threshold
For xupsEnvRemoteTemp.0: 26>25
– czujka środowiskowa zgłasza alarm prze-
kroczenia wartości progowej dla temperatu-
ry pomieszczenia (25 stopni C), ponieważ
bieżąca temperatura wynosi 26 stopni C. To
jeszcze nie jest wielki problem, ale warto
sprawdzić w jaki sposób narastała tempera-
tura i czego możemy się spodziewać w naj-
bliższym czasie. Może ktoś wyłączył klima-
tyzator podczas pracy w serwerowni?
Obszar VI. Bezpieczeństwo
fizyczne i ochrona
przeciwpożarowa
Ochronafizycznajestnajstarszym,alewciążnaj-
pewniejszym sposobem ochrony posiadanych
zasobów i stanowi pierwszą linię obrony insty-
tucji przed zagrożeniami. Jej zadaniem, zgod-
nie z normą ISO 17799, jest zapobieganie nie-
uprawnionemu dostępowi, uszkodzeniom i in-
gerencji w pomieszczenia instytucji i jej infor-
macje. Często organizacje kładą duży nacisk
na ochronę teleinformatyczną zasobów IT i nie
doceniają podstawowych mechanizmów i środ-
ków ochrony fizycznej, co faktycznie jest pod-
stawą jakiegokolwiek bezpieczeństwa. Nawet
najlepsze zainstalowane zapory ogniowe, syste-
my IDS, czy IPS na nic się nie zdadzą, jeśli moż-
na wynieść dyski z danymi przez niezabezpie-
czone okno lub spowodować przegrzanie serwe-
rów i przestój serwerowni poprzez uszkodzenie
zewnętrznych skraplaczy systemu klimatyzacji.
Podstawą do zaprojektowania systemu och-
rony fizycznej jest przeprowadzenie analizy
ryzyka i następnie dostosowanie poziomu
ochrony do wymagań biznesowych (pamięta-
Rysunek 7. Przeglądarka plików zawierających definicje baz MIB (iReasoning MIB Browser PE). Widać
dostępne z menu kontekstowego polecenia SNMP, a także odczytane, bieżące wartości dostępnych na
urządzeniu parametrów itp. Silną stroną takich narzędzi jest fakt, że dzięki nim w łatwy sposób korzystamy
z baz MIB – praca z notacją ASN.1 wymagałaby od człowieka ogromnego wysiłku
44 wrzesień 2009
Rozwiązania
Data Center
jąc oczywiście o wymogach prawa, zaleceniach,
normach i dobrych praktykach w tym zakresie).
Poprawnie zaprojektowany system ochrony
fizycznej z jednej strony ma uniemożliwić do-
stęp osobom nieuprawnionym, ale też nie mo-
że utrudniać lub uniemożliwiać dostępu oso-
bom uprawnionym. Nie zawsze też trzeba się
koncentrować na najnowszych rozwiązaniach
technicznych typu rozwiązania biometryczne, a
bardzo często funkcjonalności systemu ochrony
można uzyskać poprzez odpowiednie zaimple-
mentowanie prostych metod:
• zabezpieczenia budowlanego (odpowied-
nie ściany, drzwi, okna, kraty itp.),
• zabezpieczenia elektronicznego (systemy:
sygnalizacji włamania i napadu, kontroli
dostępu, telewizji dozorowej, itp.),
• ochrony fizycznej (recepcja, dozorca itp.),
• zabezpieczeń organizacyjnych typu proce-
duralne ograniczenie do minimum liczby
osób mających dostęp do kluczowych po-
mieszczeń (często lekceważone rozwiąza-
nie, chociaż skuteczne i najtańsze do wpro-
wadzenia).
Elementem powiązanym z system ochrony fi-
zycznej, chociaż zgodnie z przepisami nie
wchodzącym w jego skład, jest system ochrony
przeciwpożarowej. Kluczowe pomieszczenia w
obiekcie, a do nich należy serwerownia, powin-
ny być wyposażone w co najmniej czujki sys-
temu sygnalizacji pożarowej lub jeszcze lepiej
w stałą instalację systemu gaszenia gazem.
Niedocenianie filary organizacji
Procedury i normy
Procedury i normy powinny być jednym z fi-
larów działu IT w każdej organizacji, ale by-
wa z tym bardzo różnie. Wszelkie procedury są
uważane za przejaw biurokracji, chociaż mogą
znacznie usprawnić pracę działu IT. Przykładem
może być metodyka ITIL, która w zasadzie tyl-
ko opisuje, jakie procedury eksploatacyjne i kie-
dy warto stosować. Jedną z podstawowych pro-
cedur, jakie ITIL poleca zastosować, jest proce-
dura zgłaszania żądań od użytkowników. Nie
musi być to od razu wielki system typu Help-
Desk, na początek wystarczy wprowadzić zasa-
dę (żeby nie używać niepopularnego słowa: pro-
cedurę), że wszystkie zgłoszenia muszą być opi-
sane i wysłane na jeden określony adres pocz-
ty. Takie proste rozwiązanie organizacyjne daje
działowi IT wiele korzyści:
• powstaje ewidencja, na podstawie której
można pokazać aktualne obciążenie pracą,
• automatycznie powstaje dokumentacja i hi-
storia ewentualnych zmian,
• po jakimś czasie prowadzi do zmniejszenia
liczby telefonów.
Najważniejsze jest konsekwentne przestrzega-
nie tej zasady przez wszystkich pracowników
– jeśli ktoś dzwoni, to należy poprosić o prze-
słanie opisu zgłoszenia e-mailem, jako podsta-
wy do rozpoczęcia pracy.
Inną kategorią procedur są procedury awa-
ryjne, które w prosty sposób opisują ciąg czyn-
ności do wykonania w sytuacji krytycznej. Ze
swej natury procedury awaryjne są wykonywa-
ne rzadko (a najlepiej, żeby nie zaistniała po-
trzeba ich wykonywania) i w ich przypadku
ważna jest cykliczna weryfikacja. Infrastruktura
krytyczna podlega takim samym zmianom jak
pozostałe elementy i chyba nikt nie chciałby się
znaleźć w sytuacji, w której procedura awaryj-
na poleca użyć nieistniejącego narzędzia. Dobrą
praktyką jest testowanie procedury przez osobę,
która na co dzień nie zajmuje się danym obsza-
rem, np. osoba odpowiedzialna za systemy mo-
nitorowania testuje procedurę awaryjnego uru-
chomienia agregatu. Takie podejście pozwala
na szybkie zlokalizowanie nieścisłości i błędów
w procedurach.
IT jest chyba jedynym obszarem techniki,
w którym nie występują prawnie usankcjonowa-
ne normy, które muszą być przestrzegane i być
może dlatego tak trudno jest nam zrozumieć po-
trzebę ich stosowania. Najwięcej do czynienia
z normami mamy w trakcie procesu budowy
serwerowni, a osoba prowadząca taki projekt
musi się zapoznać z szeregiem norm i przepi-
sów, m.in. takich jak:
• prawo budowlane,
• normy elektryczne,
• przepisy przeciwpożarowe,
• przepisy BHP.
Ze względu na olbrzymi zakres zagadnień, ja-
kich dotyczą te normy, ważne jest, aby ich speł-
nienie było potwierdzone przez odpowiedniego
specjalistę.
Dokumentacja
Podobnie jak procedury, nie jest to obszar spe-
cjalnie lubiany przez pracowników IT. Mamy
w nim do czynienia z dwoma rodzajami do-
kumentacji:
• Dokumentacja obiektów i urządzeń:
– plany obiektów,
– projekty techniczne,
– dokumentacja konfiguracji,
– dokumentacja producentów urządzeń.
• Dokumentacja wykonanej pracy:
– raporty z wykonanych czynności (na-
praw, przeglądów),
– wykonane zmiany,
– obsłużone zgłoszenia.
Liczba dokumentów, z jaką mamy do czynie-
nia w codziennej pracy, jest tak ogromna, że
bez systemu porządkującego w krótkim czasie
przestaniemy nad nimi panować. Nad ogro-
mem dokumentacji można zapanować na kilka
sposobów – od sprawdzonych systemów opar-
tych na drukowanych kartkach umieszczanych
w segregatorach (rozwiązanie tanie, proste i sku-
teczne), poprzez systemy folderów i dokumen-
tów elektronicznych, aż do dedykowanych baz
danych i aplikacji. Wybór rozwiązania zależy
od liczby przetwarzanych dokumentów, ale naj-
ważniejsze jest, aby jakieś było wybrane i kon-
sekwentnie stosowane. Nie wolno też się łudzić,
że tego typu rozwiązanie uda się wdrożyć, a po-
tem o nim zapomnieć – dokumentacja musi żyć
i być aktualizowana, bez tego jest niepotrzebna,
a w niektórych przypadkach nawet szkodliwa.
Podsumowanie
Mamy nadzieję, że udało nam się choć trochę
przybliżyć Czytelnikom tematykę ciekawego
i chyba na co dzień niedocenianego obszaru, ja-
kim jest Infrastruktura Krytyczna Serwerow-
ni (IKS). Zachęcamy do przesyłania pytań oraz
brania udziału w dyskusjach i konkursach na na-
szym portalu.
• Data Center Serwis
– http://DCSerwis.pl
• Zasadnicze wymagania dotyczące
zarządzania infrastrukturą NCPI:
http://www.apcmedia.com/salestools/
VAVR-626VR8_R0_PL.pdf
• Witryna firmy iReasoning (MIB Brow-
ser): http://www.ireasoning.com
W Sieci DCSerwis.pl to grupa specjalistów zawo-
dowo zajmujących się problematyką bu-
dowy, utrzymania i zarządzania centrami
przetwarzania danych oraz IKS. Jednym
z celów działania grupy jest popularyzacja
wiedzy dotyczącej IKS, centrów danych i
ich znaczenia dla biznesu, także poprzez
najnowszą inicjatywę, jaką jest portal spo-
łecznościowy DCSerwis.pl.
Kontakt z autorem: kontakt@dcserwis.pl
O autorach:

More Related Content

Similar to Data Center i wszytko pod kontrolą

Kilka mniej oczywistych zagrożeń dla ciągłości operacyjnej centrum przetwarza...
Kilka mniej oczywistych zagrożeń dla ciągłości operacyjnej centrum przetwarza...Kilka mniej oczywistych zagrożeń dla ciągłości operacyjnej centrum przetwarza...
Kilka mniej oczywistych zagrożeń dla ciągłości operacyjnej centrum przetwarza...Pawel Wawrzyniak
 
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...PROIDEA
 
Impuls EVO rozgrzewa
Impuls EVO rozgrzewaImpuls EVO rozgrzewa
Impuls EVO rozgrzewaBPSC
 
Impuls EVO rozgrzewa
Impuls EVO rozgrzewaImpuls EVO rozgrzewa
Impuls EVO rozgrzewaBPSC
 
Najczęstsze błędy przy montażu pomp ciepła powietrze woda
Najczęstsze błędy przy montażu pomp ciepła powietrze wodaNajczęstsze błędy przy montażu pomp ciepła powietrze woda
Najczęstsze błędy przy montażu pomp ciepła powietrze wodaVaillant Saunier Duval Sp. z o.o.
 
Innowacyjne Rozwiązania Branży Stolarki i VIP Najlepsze Okna i Drzwi Bramy Os...
Innowacyjne Rozwiązania Branży Stolarki i VIP Najlepsze Okna i Drzwi Bramy Os...Innowacyjne Rozwiązania Branży Stolarki i VIP Najlepsze Okna i Drzwi Bramy Os...
Innowacyjne Rozwiązania Branży Stolarki i VIP Najlepsze Okna i Drzwi Bramy Os...Stolarka VIP
 
Laureaci Programu IRBS i VIP Okna Drzwi Bramy i Osłony 2020
Laureaci Programu IRBS i VIP Okna Drzwi Bramy i Osłony 2020Laureaci Programu IRBS i VIP Okna Drzwi Bramy i Osłony 2020
Laureaci Programu IRBS i VIP Okna Drzwi Bramy i Osłony 2020Stolarka VIP
 
Case study Tinby - K3 System
Case study Tinby - K3 SystemCase study Tinby - K3 System
Case study Tinby - K3 SystemK3 System
 

Similar to Data Center i wszytko pod kontrolą (20)

Systemy wentylacji i klimatyzacji - rozszerzenie
Systemy wentylacji i klimatyzacji - rozszerzenieSystemy wentylacji i klimatyzacji - rozszerzenie
Systemy wentylacji i klimatyzacji - rozszerzenie
 
1
11
1
 
4
44
4
 
Kilka mniej oczywistych zagrożeń dla ciągłości operacyjnej centrum przetwarza...
Kilka mniej oczywistych zagrożeń dla ciągłości operacyjnej centrum przetwarza...Kilka mniej oczywistych zagrożeń dla ciągłości operacyjnej centrum przetwarza...
Kilka mniej oczywistych zagrożeń dla ciągłości operacyjnej centrum przetwarza...
 
Jak wybrać projekt domu z pompą ciepła?
Jak wybrać projekt domu z pompą ciepła?Jak wybrać projekt domu z pompą ciepła?
Jak wybrać projekt domu z pompą ciepła?
 
Combi cooler 2009
Combi cooler 2009Combi cooler 2009
Combi cooler 2009
 
Projekt domu z instalacją solarną i fotowoltaiczną
Projekt domu z instalacją solarną i fotowoltaicznąProjekt domu z instalacją solarną i fotowoltaiczną
Projekt domu z instalacją solarną i fotowoltaiczną
 
3
33
3
 
3
33
3
 
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
 
Impuls EVO rozgrzewa
Impuls EVO rozgrzewaImpuls EVO rozgrzewa
Impuls EVO rozgrzewa
 
Impuls EVO rozgrzewa
Impuls EVO rozgrzewaImpuls EVO rozgrzewa
Impuls EVO rozgrzewa
 
Najczęstsze błędy przy montażu pomp ciepła powietrze woda
Najczęstsze błędy przy montażu pomp ciepła powietrze wodaNajczęstsze błędy przy montażu pomp ciepła powietrze woda
Najczęstsze błędy przy montażu pomp ciepła powietrze woda
 
4
44
4
 
4
44
4
 
Innowacyjne Rozwiązania Branży Stolarki i VIP Najlepsze Okna i Drzwi Bramy Os...
Innowacyjne Rozwiązania Branży Stolarki i VIP Najlepsze Okna i Drzwi Bramy Os...Innowacyjne Rozwiązania Branży Stolarki i VIP Najlepsze Okna i Drzwi Bramy Os...
Innowacyjne Rozwiązania Branży Stolarki i VIP Najlepsze Okna i Drzwi Bramy Os...
 
Laureaci Programu IRBS i VIP Okna Drzwi Bramy i Osłony 2020
Laureaci Programu IRBS i VIP Okna Drzwi Bramy i Osłony 2020Laureaci Programu IRBS i VIP Okna Drzwi Bramy i Osłony 2020
Laureaci Programu IRBS i VIP Okna Drzwi Bramy i Osłony 2020
 
Case study Tinby - K3 System
Case study Tinby - K3 SystemCase study Tinby - K3 System
Case study Tinby - K3 System
 
6
66
6
 
6
66
6
 

Data Center i wszytko pod kontrolą

  • 1. Rozwiązania Data Center 36 wrzesień 2009 linux@software.com.pl Data Center i wszytko pod kontrolą Każda współczesna organizacja, która swoje działanie opiera na usługach IT, może być schematycznie pokazana jako piramida zależności, której podstawę stanowią elementy Infrastruktury Krytycznej Serwerowni (IKS). W skład IKS wchodzą: struktura fizyczna, zasilanie, chłodzenie, okablowanie strukturalne, monitorowanie i zarządzanie, bezpieczeństwo fizyczne i ochrona przeciwpożarowa, a także dwa, często niedoceniane, filary działu IT i całej organizacji: procedury i normy oraz dokumentacja. DCSerwis.pl N ie ma tu znaczenia, czy firma lub instytu- cja wykorzystuje małą serwerownię z kil- koma serwerami czy też wielkie Data Cen- ter, schemat jest bardzo podobny. Podobne są też wymagania, jakie musi spełnić serwerownia w ta- kiej organizacji – przede wszystkim musi zapewniać bez- pieczną przestrzeń fizyczną, dostarczyć energię elektrycz- ną i moc chłodniczą dla aktualnie wykorzystywanych technologii informatycznych oraz brać pod uwagę możli- wy rozwój tych technologii na przestrzeni 4 – 5 lat. Szybko rozwijające się technologie IT, m.in. takie jak: serwery blade i macierze dyskowe, wymagają coraz to większych mocy elektrycznych do ich zasilenia, a po- tem mocy chłodniczych do odprowadzenia energii ciepl- nej, co przy jednoczesnym coraz większym upakowaniu urządzeń na metr kwadratowy serwerowni stawia wyso- kie wymagania przed projektantami wszystkich elemen- tów IKS eksploatowanych w serwerowni. W tym artykule postaramy się opisać wszystkie ele- menty IKS, ponieważ są one bardzo często niedoceniane i pomijane. Dla wielu osób, nawet tych zajmujących się zawodowo IT, elementy IKS są tak ukryte pod kolejnymi warstwami organizacji, że zapominają lub nawet nie wie- dzą o ich istnieniu. Poszczególne elementy IKS zostaną tu opisane w formie specyfikacji wybranych wymagań, jakie muszą zostać spełnione, aby serwerownia mogła być pra- widłowo i bezpiecznie eksploatowana. Nie jest możliwe opisanie wszystkich wymagań w jednym artykule, dlate- go wybraliśmy tylko te, które wydają się tak oczywiste, że często o nich zapominamy. Obszar I. Struktura fizyczna Ten obszar jest chyba najbardziej odległy od normal- nych zadań IT i bardzo rzadko zdajemy sobie sprawę, jaki wpływ na prawidłową eksploatację sprzętu IT mają decy- zje podjęte w tym zakresie. Ze względu na złożoność za- gadnienia, można wyróżnić tutaj kilka podobszarów tema- tycznych. Pomieszczenie serwerowni Zazwyczaj nie mamy wpływu na lokalizację geograficzną budynku, czasami możemy jednak wybrać w ramach bu- dynku położenie pomieszczenia, które będzie pełniło rolę serwerowni. Mając taki komfort, zwróćmy uwagę, że:
  • 2. Rozwiązania Data Center 37www.lpmagazine.org • Ze względu na nasłonecznienie i przeni- kanie ciepła przez ściany, pomieszczenie nie powinno się znajdować od południo- wej strony budynku; po stronie zacie- nionej będzie można także umieścić wy- mienniki ciepła do klimatyzatorów i tym samym skrócić drogę prowadzenia rur z czynnikiem chłodzącym od serwerowni do zewnętrznych wymienników. • Ze względu na ryzyko zalania serwerownia nie powinna się znajdować w najniższym miejscu budynku (raczej nie w piwnicy). • Ze względu na konieczność zapewnienia drogi transportowej dla wprowadzanego sprzętu najlepiej, aby pomieszczenie znaj- dowało się w okolicach parteru. W pomieszczeniu nie powinno być żadnych rur, prze które stale lub nawet tylko okreso- wo płynie woda. Każda rura z wodą stanowi potencjalne źródło wycieku, nawet jeśli w sa- mej serwerowni nie ma żadnych połączeń ani zaworów. Przeciek w dowolnym pomieszcze- niu powyżej serwerowni spowoduje, że po ze- wnętrznej warstwie tej rury do serwerowni do- stanie się woda. Jeżeli nie ma możliwości usu- nięcia rur z serwerowni, należy pod każdą z nich zastosować okap lub rynnę, która odpro- wadzi wodę poza obręb serwerowni, a we- wnątrz rynny umieścić czujnik zalania. W serwerowni powinno być jak najmniej okien. Jeśli nie można zamurować lub zasło- nić ścianką kartonowo – gipsową istniejących okien, to przynajmniej należy je zasłonić ża- luzjami odbijającymi ciepło. Pamiętajmy, że jedno standardowe okno w letni dzień potra- fi dostarczyć do wnętrza serwerowni tyle cie- pła, ile jedna szafa rack (około 5kW) i o ty- le też trzeba przewymiarować system chło- dzenia. Wiąże się to z koniecznością zakupie- nia na etapie inwestycji droższych i większych urządzeń chłodniczych, co z kolei oznacza, że w przyszłości koszty eksploatacji będą odpo- wiednio większe. Częstym błędem jest pozostawienie moż- liwości otwarcia okien na wypadek awarii sys- temów chłodzenia – już przy obecnych gęsto- ściach mocy przypadających na jeden m2 po- wierzchni serwerowni schłodzenie pomiesz- czenia przez otwarcie okien nie jest możliwe, a zgodnie z tendencjami gęstość mocy cały czas rośnie, więc otwieranie okien nie schło- dzi serwerowni. Droga transportowa od wejścia do budyn- ku aż do drzwi do serwerowni powinna mieć szerokość 120cm, wysokość minimum 2,5m i wytrzymałość na obciążenie do 1000kg/m2. Na drodze transportowej nie może być żad- nych progów ani stopni, cała musi być możliwa do pokonania przez wózek do transportu palet. Szczególną uwagę należy zwrócić na wszelkie zakręty na drodze transportowej – czy sprzęt, który planujemy wstawić, będzie mógł być przeniesiony tą drogą? Dla uzyskania pewności można wykonać model, który będzie miał pod- stawę o takim samym obrysie, jak planowany sprzęt i spróbować przenieść ten model drogą transportową. Sprzęt typu duże macierze dys- kowe jest często dostarczany w dedykowanych szafach, które na czas transportu są umieszcza- ne w opakowaniach transportowych o kilka centymetrów większych od wymiarów samego urządzenia i należy to uwzględnić planując dro- gę transportową. Urządzenia, pod groźbą utraty gwarancji, nie mogą być przechylane w czasie transportu o więcej niż przewiduje to producent (na czas transportu na opakowanie przyklejane są elektroniczne wskaźniki przechyłu, które za- pamiętują maksymalny kąt, pod jakim znala- zło się opakowanie oraz czas zdarzenia), dlate- go też wszelkie pochylnie na drodze transporto- wej nie mogą być zbyt strome. Podłoga techniczna Stosowanie podłogi technicznej w serwerow- ni ma swoich zwolenników i przeciwników. Z jednej strony zastosowanie podłogi tech- nicznej pozwala utworzyć kanał do dystrybu- cji zimnego powietrza od maszyn chłodzących oraz łatwo rozprowadzić okablowanie zasilają- ce i logiczne, ale z drugiej strony podłoga pod- niesiona zabiera sporo cennej wysokości po- mieszczenia, a schowane tam kable maja ten- dencję do tworzenia się bałaganu i po pewnym czasie stanowią poważne przeszkody w prze- pływie zimnego powietrza. Alternatywnym rozwiązaniem jest zasto- sowanie wylewki z masy samopoziomującej, pokrytej niepylną farbą i poprowadzenie oka- blowania ponad szafami. Każde z tych rozwią- zań wymaga zastosowania innych rodzajów maszyn klimatyzacyjnych. Kształt pomieszczenia Kształt pomieszczenia serwerowni powinien być zbliżony do kwadratu. Aby w pomiesz- czeniu można było umieścić jeden rząd szaf rack, to jego minimalna szerokość może być obliczona po zsumowaniu następujących wy- miarów: • miejsce na pełne otwarcie tylnych drzwi szafy: 0,6 – 0,8m, • głębokość szafy: 1,0 – 1,2m, • miejsce na manipulowanie sprzętem przed wsunięciem go do szafy (tyle samo, co szerokość drogi transportowej): 1,2m. Dla wstawienia jednego rzędu najmniejszych szaf otrzymujemy minimalną szerokość po- mieszczenia 2,8m, ale lepiej gdy pomieszcze- nie ma min. 3m szerokości. Wysokość pomieszczenia Pomieszczenie serwerowni powinno być wyż- sze niż 3m ze względu na konieczność zapew- nienia miejsca na poprowadzenie okablowania oraz na właściwy obieg powietrza. Jeżeli wy- sokość pomieszczenia przeznaczonego na ser- werownię będzie mniejsza niż 3m, to standar- dowa szafa rack 42U, która bez dolnego coko- łu ma 2m wysokości, pozostawi mniej niż metr na poprowadzenie okablowania. Rysunek 1. Proponowany model strukturalny organizacji opartej o usługi IT, inspirowany opracowaniem: Zasadnicze wymagania dotyczące zarządzania infrastrukturą NCPI (W sieci [2])
  • 3. 38 wrzesień 2009 Rozwiązania Data Center Sufit i to, co jest powyżej W pomieszczeniach znajdujących się ponad pomieszczeniem serwerowni nie powinno być żadnych instalacji z bieżąca wodą. Jest to wy- maganie dość trudne do spełnienia w wielu wy- padkach, dlatego też, jeśli zależy nam na zabez- pieczeniu sprzętu w serwerowni przed zalaniem (np. przeciekający przez kilka wolnych dni ka- loryfer), to o ile pozwala na to wysokość po- mieszczenia serwerowni, ochronę przed zala- niem z góry można uzyskać stosując szczelny okap z rynną wewnątrz serwerowni. Ściany i sąsiedzi Współczesny sprzęt IT stosowany w serwero- wniach nie należy do najcichszych, dlatego też ściany i drzwi serwerowni powinny mieć od- powiednią dźwiękochłonność, zwłaszcza, je- śli obok serwerowni znajdują się pomiesz- czenia biurowe do pracy. Nie wolno bagate- lizować tego wymagania, ponieważ najnow- sze serwery czołowych producentów produku- ją tak wysoki poziom hałasu, że zgodnie z in- strukcją obsługi, praca przy nich jest możliwa tylko w ochronnikach słuchu. Sposób rozmieszczenia szaf w pomieszczeniu Rozmieszczenie szaf (ang. layout) jest kluczo- wym elementem, który ma wpływ na obieg po- wietrzawewnątrzserwerowni,atymsamymna sprawność systemu chłodzenia. Aby uniknąć mieszania się powietrza zimnego z wylotów maszyn chłodzących z gorącym z wylotów wentylatorów urządzeń (serwerów, macierzy dyskowych, urządzeń łączności teleinforma- tycznej itp.) wskazane jest zastosowanie tzw. zimnych i gorących korytarzy. W skrócie po- lega to na takim zaprojektowaniu ustawienia szaf, aby wszystkie maszyny pobierały zimne powietrze z jednej strony szafy i po schłodze- niu wewnętrznych elementów serwera gorące powietrze było wydmuchiwane jak najbliżej wlotów klimatyzatorów (Rysunek 2). Szcze- gółowe omówienie tego tematu wykracza po- za ramy niniejszego artykułu. Obszar II. Zasilanie System zasilania jest kolejnym krytycznym sys- temem serwerowni, w skład którego wchodzą: • przyłącza elektroenergetyczne, • agregat prądotwórczy, • układ Samoczynnego Załączania Rezer- wy (SZR), • system zasilaczy UPS, • dedykowane rozdzielnie elektryczne, • system dystrybucji energii dla urządzeń IT. Przyłącza elektroenergetyczne (jeśli jest wię- cej niż jedno) wraz z agregatem prądotwór- czym są podłączone do układu SZR, który w przypadku zaniku zasilania z jednego ze źródeł podstawowych, przełącza zasilanie na źródła rezerwowe i stanowi pierwszy stopień redundancji układu zasilania. Za układem SZR są podłączone zasilacze UPS, które w zależno- ści od potrzeb, także mogą pracować w syste- mie redundantnym. Zadaniem UPS jest pod- trzymanie na czas kilku minut napięcia zasila- jącego urządzenia IT, tak aby mogły zadziałać układy automatyki i uruchomić agregat. Sys- tem zasilania musi być zaprojektowany przez uprawnionego projektanta i musi uwzględ- niać bilans mocy wynikający z mocy pobie- ranej przez: • zainstalowany i planowany do zainstalo- wania sprzęt IT, • klimatyzatory chłodzące serwerownię, • zasilacze UPS wraz z mocą potrzebną na doładowanie akumulatorów, • oświetlenie i inne obwody ogólne, • planowanego wzrostu obciążenie (rezerwa). Ważne jest takie zaprojektowanie i dobranie wszystkich elementów, aby w sytuacji awaryj- nej mogły pracować jako jeden spójny system. Dotyczy to zwłaszcza odpowiedniego dobra- nia tandemu UPS – agregat, ponieważ w za- leżności od rodzaju zastosowanych zasilaczy Rysunek 3. Interfejs webowy analizatora jakości mocy Eaton Power Xpert METERS – w rzeczywistości jest to wygodny w obsłudze i efektowny aplet Java Rysunek 2. Sposób rozmieszczenia szaf w serwerowni i pozostałych elementów w pomieszczeniu o minimal- nym, akceptowalnym rozmiarze. Widzimy, że ogrzane przez urządzenia IT powietrze trafia możliwie najkrótszą drogą do wlotu klimatyzatora, z kolei schłodzone powietrze jest kierowane tak, aby urządzenia IT mogły po- bierać je z jednej strony szafy. Nie powinno być także problemów z montażem urządzeń i dostępem do pozo- stałych elementów. Na rysunku został też schematycznie zaznaczony okap z rynną, który zabezpiecza sprzęt przed zalaniem
  • 4. 39www.lpmagazine.org Rozwiązania Data Center UPS wymagane jest znaczne przewymiarowa- nie mocy zastosowanego agregatu (w granicz- nych przypadkach nawet ponad dwukrotne!). Celem uniknięcia zakłóceń i ochrony pracu- jących osób w całym obiekcie serwerowni na- leży poprawnie zaplanować instalację połączeń wyrównawczych, która musi być dołączona do głównej szyny wyrównawczej budynku zwa- nej, potocznie uziomem. Do instalacji wyrów- nawczej powinny być podłączone wszystkie przewodzące części konstrukcyjne i wyposaże- niaserwerowni(np.:obudowymetalowychurzą- dzeń elektrycznych, szaf serwerowych, konstruk- cja wsporcza podłogi podniesionej, rury instala- cji wentylacyjnej, CO, wody itp.). Obszar III. Chłodzenie Dostarczanie chłodu do serwerowni jest to tak- że obszar odległy od normalnych zadań IT, cho- ciaż, podobnie jak w przypadku struktury fi- zycznej, decyzje podjęte w tym zakresie mają olbrzymi wpływ na eksploatację sprzętu IT i, co obecnie jest ważniejsze, na koszty tej eksploata- cji. Urządzenia IT zainstalowane w serwerow- ni wymagają ciągłego dostarczania odpowied- niej ilości chłodu niezależnie od tego, czy za- instalowany system chłodzenia może je zapew- nić. Jeśli w pomieszczeniu nie będzie wystar- czającej ilości chłodnego powietrza, zainstalo- wane w szafach urządzenia będą pobierać wła- sne gorące powietrze wylotowe (lub gorące po- wietrze wylotowe sąsiednich urządzeń), aż do momentu kiedy sprzęt IT ulegnie przegrzaniu. Dostarczanie chłodu dla urządzeń IT często jest nazywane klimatyzacją precyzyjną, ponieważ w odróżnieniu od klimatyzacji komfortu (tzw. biu- rowej lub domowej) ma na celu utrzymanie od- powiedniego klimatu, tzn. oprócz odpowiedniej temperatury w pomieszczeniu serwerowni musi także zapewnić odpowiednią wilgotność. Dla urządzeń IT i innych urządzeń elektro- nicznych zbyt wysoka wilgotność to niebezpie- czeństwo kondensacji pary wodnej na podze- społach, a z kolei zbyt niska wilgotność to ry- zyko pojawienia się wyładowań elektrostatycz- nych stanowiących zagrożenie dla poprawnej pracy elektroniki. Dodatkowo, wybierając urzą- dzenia klimatyzacji precyzyjnej należy zwrócić uwagę na następujące parametry: • Zaawansowane systemy sterowania i au- tomatyki: Układy sterowania i automatyki dla kli- matyzacji precyzyjnej muszą charaktery- zować się następującymi cechami: – Praca w układzie redundantnym z cy- klicznym przełączaniem pracujących urządzeń (praca w tzw. trybie turnu- sowym). – Brak pojedynczego punktu awarii (ang. Single Point Of Failure, SPOF). • Rozszerzone możliwości komunikacyjne – możliwości podpięcia do systemów za- rządzania budynkami (ang. Building Mana- gement System, BMS) poprzez dedykowa- ne protokoły komunikacyjne (np. Modbus, canBus, LonTalk, itp.) • Możliwość pracy całorocznej – klimaty- zacja komfortu pracuje tylko kilka godzin dziennie w okresach letnich, natomiast urządzenia klimatyzacji precyzyjnej muszą pracować w trybie 24/7/365. To powoduje, oprócz wymagań na trwałość mechaniczną, znaczne rozszerzenie wymagań co do odpor- ności jednostek zewnętrznych na tempera- tury w zakresie od –25C do ponad 35C. • Brak podgrzewacza powietrza – w insta- lacjach klimatyzacji precyzyjnej nie sto- suje się urządzeń służących do podgrzewa- nia powietrza, które są zwykle montowane w instalacjach klimatyzacji bytowej. Duże ilości powietrza przepływającego przez maszyny – z powodu wysokiej gęstości mocy cieplnej (mocy przypadającej na m2 pomiesz- czenia) we współczesnych serwerowniach, w instalacjach klimatyzacji precyzyjnej, prze- pływa dużo więcej powietrza niż w klimaty- zacji komfortu, co wymaga odpowiednio du- żych wentylatorów w jednostkach wewnętrz- nych i powoduje wysoki poziom hałasu w po- mieszczeniu. Warto podkreślić, że przeznaczenie i spo- sób pracy urządzeń klimatyzacji precyzyjnej są całkowicie odmienne od powszechnie znanej i najczęściej widywanej klimatyzacji komfortu, ale niestety inwestorzy, bardzo często, planując serwerownie nie biorą pod uwagę tych różnic lub wręcz pomijają ten ważny aspekt działania i niezawodności nowoczesnych serwerowni. Dodatkowym problemem jest wentylacja serwerowni dla celów bytowych, tzn. zapew- niająca minimalną wymianę powietrza w po- mieszczeniu umożliwiającą czasowe przeby- wanie w nim osób z obsługi IT. Obszar IV. Okablowanie strukturalne Głównym problemem występującym w trak- cie projektowania okablowania strukturalnego serwerowni jest konieczność upchnięcia setek, jeśli nie tysięcy, połączeń okablowania pozio- mego, pionowego, połączeń systemowych na zwykle dosyć ograniczonej powierzchni (a do- kładnie to w ograniczonej przestrzeni) i dotyczy to zarówno rozwiązań miedzianych jak i świa- tłowodowych. Sumaryczna długość połączeń nawet niewielkiej serwerowni często przekra- cza kilka kilometrów, przekroje połączonych wiązek osiągają kilkadziesiąt centymetrów, a łączna waga okablowania musi być uwzględ- niana w procesie obliczania całkowitego obcią- żenia podłogi. Przy tak skomplikowanej struk- turze szczególnego znaczenia nabiera sprawa przyjęcia i konsekwentnego stosowania wła- ściwego oznakowania okablowania, bo bez te- go nie jest możliwe zapanowanie nad porząd- kiem w okablowaniu. Kolejną istotną sprawą jest wybór odpo- wiedniego rodzaju okablowania, aby zapew- nić bezawaryjną pracę przez założony, zwykle dość długi, okres eksploatacji. W miarę rozwo- ju rozwiązań technicznych znacznie łatwiej jest wymienić urządzenia na te nowszej generacji niż wymienić istniejące okablowanie, ponieważ zwykle jest to powiązane z praktycznym wyłą- czeniem z eksploatacji części serwerowni. W przypadku okablowania miedzianego, praktycznie do wyboru jest kategoria 5e lub kategoria 6. Rozwiązania kategorii 7 nie są w zasadzie obecnie stosowane, ponieważ aby uzyskać pasmo przenoszenia tej kategorii bar- dziej opłaca się zastosować okablowanie świa- tłowodowe. Kolejne decyzje dotyczą wyboru: typu okablowania (UTP lub FTP), typu powło- ki zewnętrznej – niepalna, niepalna LSZH, oraz dodatkowe parametry, takie jak np. odporność Rysunek 4. Analizator Power Xpert METERS wykorzystuje własną wbudowaną wersję systemu operacyjne- go, opartą na jądrze Linux 2.4.20 i oprogramowaniu BusyBox 0.60.3. Mamy możliwość dostępu poprzez SSH
  • 5. 40 wrzesień 2009 Rozwiązania Data Center na atak gryzoni. W przypadku wyboru rodza- ju okablowania światłowodowego decyzje do- tyczą: liczby włókien w kablu; wyboru rodza- ju włókna: jednomodowe (9/125) lub wielomo- dowe (62.5/125, 50/125 lub 50/125 OM3); oraz podobnie jak dla kabli miedzianych typu po- włoki zewnętrznej. Obszar V. Monitorowanie i zarządzanie W przypadku IKS istotne jest ciągłe rejestrowa- nie parametrów pracy urządzeń, takich jak: za- silacze UPS; agregaty prądotwórcze; urządzenia systemu klimatyzacji (ang. Humidity, Ventila- tion and Conditioning, HVAC); czujki środowis- kowe (ang. Environmental Monitoring Probes, EMP), etc. Wykorzystywane są także analizatory jakości energii elektrycznej (np. urządzenia Po- wer XPERT Xpert METERS 4000/6000/8000 firmy Eaton Powerware – co ciekawe, oparte zresztą o własną wersję systemu GNU/Linux i zestaw narzędzi dla systemów wbudowanych BusyBox – patrz Rysunek 3 i Rysunek 4). Proces ten generuje ogromne ilości danych, któ- re należy gromadzić w takim zakresie, aby moż- liwe było późniejsze ich analizowanie i wycią- ganie wniosków (co stanowi nie tylko składo- wą prac związanych z diagnozowaniem i zapo- bieganiem awariom, ale jest podstawą planowa- nia działań i efektywnego zarządzania zasoba- mi IKS). Ponadto, monitorowanie IKS ma odmienną specyfikę niż na wyższych warstwach propono- wanego modelu strukturalnego organizacji. Całkowicie nie ma tutaj sensu monitorowanie urządzeń z użyciem protokołu ICMP (PING) czy badanie dostępności usług (np. HTTPS, HTTP, Oracle SQL*Net etc.), co ma miejsce w wyższych warstwach (serwerów, urządzeń transmisji danych i pamięci masowych, a tak- że systemów operacyjnych, baz danych i apli- kacji – Rysunek 1). Podstawą monitorowania IKS jest protokół SNMP (ang. Simple Network Management Protocol, SNMP). Protokół SNMP w systemach monitorowania IKS Do monitorowania IKS, podobnie jak do mo- nitorowania urządzeń transmisji danych czy serwerów, wykorzystuje się protokół SNMP. Powstał on w roku 1988 i miał dostarczyć na- rzędzia pozwalającego zdalnie zarządzać za- sobami infrastruktury sprzętowej sieci kompu- terowych (początkowy okres popularyzacji In- ternetu). Warto zauważyć, że protokół SNMP, choć w istocie bardzo prosty (na tym polega jego siła), bywa dość powszechnie niewła- ściwie rozumiany – być może dlatego, że ma dość specyficzne zasady działania i różni się od większości powszechnie znanych, usługo- wych protokołów sieciowych. Ponadto, zgod- nie z pierwotnym przeznaczeniem, szczególne miejsce zajął w dziedzinie zarządzania zaso- bami sieci teleinformatycznych, co częstokroć bywa ziarnem niezgody, jeśli chodzi o wza- jemne zrozumienie potrzeb monitorowania za- sobów w różnych obszarach i warstwach pro- ponowanego modelu organizacji (Rysunek 1). Rozróżniamy 3 wersje protokołu SNMP. SNMPv1 – wersja najstarsza, znajdująca się obecnie w powszechnym użyciu, jeśli cho- dzi o urządzenia IKS. Niestety, słabą stroną tej wersji są minimalne możliwości zabezpieczania komunikacji między urządzeniami. Istnieje tu0 taj mechanizm haseł uwierzytelniających (zwy- kle używane są hasła podatne na ataki siłowe – ang. brute–force attack), ale cała komunikacja odbywa się jawnym tekstem, standardowo po protokole UDP/IP(istnieje zagrożenie podsłuchu transmisji poprzez przechwytywanie pakietów sieciowych – ang. packet sniffing). Jednak producenci urządzeń IKS w dużym stopniu zda- ją się nie przejmować tym problemem, a szkoda (niestety, temat bezpieczeństwa SNMP wykra- cza poza zakres niniejszego opracowania). SNMPv2 (w tym podwersje SNMPv2p – ang. party–based, SNMPv2c – ang. commu- nity based i SNMPv2u ang. user–based) – w tej wersji wprowadzono drobne rozszerzenia funk- cjonalności protokołu oraz starano się podnieść poziom zabezpieczeń. Stanowczo rzadziej spo- tykamy urządzenia IKS wspierające SNMPv2. Zmiany spowodowały też utratę kompatybilno- ści z wersją 1 (jej zapewnienie wymaga stoso- wania dedykowanych serwerów pośredniczą- cych – ang. proxy server lub użycia systemów monitorowania, które obsługują obydwa proto- koły, co dziś raczej nie stanowi problemu). SNMPv3 – ta wersja ma na celu wyłącznie zniesienie problemu niskiego poziomu bezpie- czeństwa poprzednich wersji. Nie wprowadza żadnych rozszerzeń funkcjonalnych i jest tak- że rzadziej wspierana przez urządzenia IKS. Co warte podkreślenia, SNMP nie obciąża sieci w znacząco dużym stopniu, co z pewno- ścią stanowi zaletę protokołu. Model komunikacji i zasada działania SNMP Protokół SNMP wymaga, aby w sieci funk- cjonowały następujące elementy: menedże- rowie SNMP (aplikacje monitorujące), agen- ci SNMP (aplikacje działające po stronie mo- nitorowanych urządzeń) i bazy informacji za- rządzania (ang. Management Information Ba- se, MIB), dostępne dla obydwu stron komuni- kacji. Standardowo, komunikacja między me- nedżerem a agentem SNMP odbywa się z uży- ciem protokołu UDP/IP i portów: • 161 – służy menedżerowi do odczytu pa- rametrów z agenta, • 162 – jest używany podczas przesyłania notyfikacji z agenta do menedżera. Menedżer SNMP to nic innego jak aplikacja wykorzystywana przez administratora zarzą- dzanego systemu. Zwykle jest to aplikacja ty- pu NMS, ale może być to aplikacja EMS, BMS lub SCADA, o ile wspiera protokół SNMP (Ry- sunek 5). Obydwie strony modelu komunikacyjne- go SNMP wykorzystują bazy danych MIB (Li- sting 1) i niewielką liczbę komend, pozwalają- cych wymieniać informacje. Baza MIB jest bar- dzo charakterystycznym dla SNMP elementem – stanowi ona zorganizowany w postaci struk- Rysunek 5. Schemat rozmieszczenia wymaganych elementów komunikacji dla protokołu SNMP. Widać, że zarówno menedżer, jak i agenci muszą używać właściwych dla danych urządzeń baz MIB. Menedżer SNMP pobiera parametry (tzw. pooling obiektów) oraz odbiera notyfikacje – dane są prezentowane operatorowi
  • 6. 41www.lpmagazine.org Rozwiązania Data Center tury drzewiastej zestaw informacji na temat za- rządzanego urządzenia. W rzeczywistości są to pliki tekstowe, które zawierają opisy w notacji ASN.1 (ang. Abstract Syntax Notation One). Menedżer SNMP, aby ustawić wartość kon- kretnego parametru urządzenia, odczytać ją lub zrozumieć odebraną z urządzenia notyfikację, musi się w rzeczywistości poruszać pomiędzy liśćmi drzewa, przechodząc ścieżki wytyczone po gałęziach od liścia do liścia. Te ścieżki nazy- wane są identyfikatorami obiektów – OID (ang. Object Identifier). Każdy OID wskazuje na uni- kalny dla danego urządzenia obiekt (możemy rozumieć go jako zmienną lub parametr) i składa się z szeregu cyfr oddzielonych kropkami. Z te- go względu, identyczna baza MIB musi być do- stępna zarówno dla menedżera SNMP(działają- cego na stacji monitorującej administratora), jak i dla monitorowanego urządzenia (Rysunek 6). Menedżer SNMP i agent wymieniają mię- dzy sobą komunikaty, które dotyczą określonej zmiennej wskazanej za pomocą OID. Oprócz operacji odczytu i zapisu wartości parametrów, istnieje możliwość takiego skonfigurowania agenta, aby w przypadku zajścia określonego zdarzenia (zdefiniowanego w MIB), automa- tycznie poinformował o tym fakcie menedże- ra SNMP. W tym celu wykorzystywane są tzw. notyfikacje SNMP (ang. SNMP notification), odpowiadające komunikatom typu Trap. Oto kilka numerów OID opisujących róż- ne obiekty (parametry) dla urządzeń IKS: • Zasilacze UPS Eaton Powerware: – 1.3.6.1.4.1.534.1.0.0.0.6 – na- zwa w MIB: xupstbReturnFromLow- Battery, przenosi komunikat z MIB: The battery has recovered from a low battery condition. Jest to definicja noty- fikacji, która może zostać przesłana od agentadomenedżeraSNMPpotym,jak baterie zasilacza zostaną doładowane. – 1.3.6.1.4.1.534.1.3.4.1.2 – na- zwa w MIB: xupsInputVoltage, za- wiera opis w MIB: The measured input voltage from the UPS meters in volts. Ten obiekt zawiera wartość napięcia wejściowego w woltach, którą mene- dżer może odczytać z agenta SNMP. • Zasilacze UPS Delta–UPS: – 1.3.6.1.4.1.2254.2.4.5.14.0 – nazwa w MIB: dupsOutputPower3, zawiera opis w MIB: The Output line 3realpoweroftheUPSsysteminwatts. Ten obiekt zawiera wartość mocy wyj- ściowej na trzeciej fazie w watach, którą menedżer może odczytać z agen- ta SNMP. • Zasilacze UPSAmerican Power Conversion: – 1.3.6.1.4.1.318.0.2 – nazwa w MIB upsOverload, przenosi komunikat z MIB: SEVERE: The UPS has sensed a load greater than 100 percent of its ASN.1. Widzimy kolejno grupę obiektów odpowiadających parametrom rejestrowanym na wejściu zasilacza UPS, odpowiednio: xupsInput- Voltage (napięcie wejściowe w V), xupsInputCurrent (natężenie wejściowe w A), xupsInputWatts (moc wejściowa w W) i grupę parametrów wyjściowych: xupsOutputLoad (obciążenie w procentach dopuszczalnej pojemności), xupsOutputVoltage (napięcie wyjściowe w V), xupsOutputCurrent (natężenie wyjściowe w A), xupsOutputWatts (moc wyjściowa w W). […] –– –– xupsInput group: –– xupsInputVoltage OBJECT–TYPE SYNTAX INTEGER (0..2147483647) –– UNITS RMS Volts ACCESS read–only STATUS mandatory DESCRIPTION „The measured input voltage from the UPS meters in volts.” ::= {xupsInputEntry 2} xupsInputCurrent OBJECT–TYPE SYNTAX INTEGER (0..2147483647) –– UNITS RMS Amp ACCESS read–only STATUS mandatory DESCRIPTION „The measured input current from the UPS meters in amps.” ::= {xupsInputEntry 3} xupsInputWatts OBJECT–TYPE SYNTAX INTEGER (0..2147483647) –– UNITS Watts ACCESS read–only STATUS mandatory DESCRIPTION „The measured input real power in watts.” ::= {xupsInputEntry 4} –– –– xupsOutput group: –– xupsOutputLoad OBJECT–TYPE SYNTAX INTEGER (0..200) ACCESS read–only STATUS mandatory DESCRIPTION „The UPS output load in percent of rated capacity." ::= {xupsOutput 1} […] xupsOutputVoltage OBJECT–TYPE SYNTAX INTEGER (0..2147483647) –– UNITS RMS Volts ACCESS read–only STATUS mandatory DESCRIPTION „The measured output voltage from the UPS metering in volts.” ::= {xupsOutputEntry 2} xupsOutputCurrent OBJECT–TYPE SYNTAX INTEGER (0..2147483647) –– UNITS RMS Amp ACCESS read–only STATUS mandatory DESCRIPTION „The measured UPS output current in amps.” ::= {xupsOutputEntry 3} xupsOutputWatts OBJECT–TYPE SYNTAX INTEGER (0..2147483647) –– UNITS Watts ACCESS read–only STATUS mandatory DESCRIPTION „The measured real output power in watts." ::= {xupsOutputEntry 4} […] Listing 1. Fragment pliku bazy danych MIB przedstawiający wybrane definicje obiektów w języku
  • 7. 42 wrzesień 2009 Rozwiązania Data Center rated capacity. Jest to definicja notyfi- kacji, która może zostać przesłana od agenta do menedżera SNMP po tym, jak UPS wykryje, że został przecią- żony. • Czujka środowiskowa EMP, Eaton Power- ware: – 1.3.6.1.4.1.534.6.7.1.1.3.2.1.3 – nazwa w MIB smDeviceTemperatu- re, zawiera opis w MIB: Temperature of sensor on device RackMonitor, the unit is 0.1 degree. Ten obiekt zawiera wartość temperatury mierzonej przez czujkę w 1/10 stopnia C. Menedżer może odczytać tą wartość z agenta. – 1.3.6.1.4.1.534.6.7.1.2.0.20 – nazwa w MIB rmUmidityHigh- Critical, przenosi komunikat: CRI- TICAL: The humidity of sensor was hi- gher than high critical set point. Jest to definicja notyfikacji, która może zo- stać wysłana od agenta do menedżera SNMP po tym, jak czujka wykryje, że wilgotność osiągnęła wartość większą niż najwyższy dozwolony (krytyczny) próg alarmowy. Podane powyżej ścieżki OID odpowiadają kon- kretnej lokalizacji w drzewie MIB. Parametry wskazywane przez numery OID mogą być (w zależności od uprawnień menedżera oraz od ich przeznaczenia): czytane lub zapisywane. Przykładem parametrów do odczytu mogą być wcześniej przywołane xupsInputVoltage, dupsOutputPower3, smDeviceTemperature, z kolei parametrem, którego wartość moż- na zmieniać może być np.: dla zasilacza UPS EatonPowerware:1.3.6.1.4.1.534.1.8.1.0 – nazwa w MIB xupsTestBattery, zawiera opis w MIB: Setting this variable to startTest initiates the battery test. All other set values are invalid. Jeśli w tym parametrze (obiekcie) zapi- szemy wartość startTest, zdalnie wymusimy rozpoczęcie testów baterii. Jak wspomnieliśmy, protokół SNMP ofe- ruje stosunkowo małą ilość poleceń. Dla wer- sji 1 najważniejsze to (Rysunek 7): Odczyt: • Get – pobranie wartości obiektu wskaza- nego przez OID, • GetNext – pobranie wartości następnego obiektu. Zapisu: • Set – ustawienie wartości obiektu wska- zanego przez OID, Odpowiedź: • Get–Response – wysłanie odpowiedzi na zapytanie Get lub GetNext menedże- ra SNMP. Notyfikacja: • Trap – asynchroniczne wysłanie notyfi- kacji o zaistniałym zdarzeniu. Wersja 2 wprowadza dodatkowo polecenia: GetBulk (pobranie grupy wartości obiektów wskazanych OID) i Inform (pozwala na prze- słanie przez NMS dalej do innych NMS ode- branego komunikatu typu Trap). Zanim jakiekolwiek polecenie zostanie przesłane od menedżera do agenta SNMP, to – w zależności od typu operacji – menedżer SNMP łącząc się z agentem SNMP przekazuje mu jed- no ze skonfigurowanych na agencie haseł: • Public community, czy inaczej read com- munity – czyli hasło publiczne, odczy- tu parametrów. Dla większości urządzeń jest ono domyślnie ustawione na public, co oczywiście w pierwszej kolejności za- leca się zmienić. • Private community, czy inaczej write com- munity – czyli hasło prywatne, zapisu para- metrów. Domyślnie jest ono zwykle usta- wione na private i bezwzględnie należy je zmienić. W rozległych IKS odbierane przez menedże- rów SNMP notyfikacje mogą być przesyłane dalej, np. do nadrzędnej aplikacji menedżera SNMP lub z podstawowego systemu monitoro- wania na system zapasowy. Zakres tej funkcjo- nalności zależy od producenta aplikacji monito- rującej – zwykle w połączeniu z mechanizmem filtrów daje ona spore możliwości organizowa- nia i separowania informacji. Słabą stroną noty- fikacji SNMP jest fakt, że przesyłane z użyciem protokołu UDP (na port 162) są narażone na to, że nie dotrą do celu. Na szczęście, zwykle w sy- tuacjach alarmowych, dostajemy większą licz- bę komunikatów, a o anomaliach będzie moż- na się zorientować także po bieżących wskaza- niach monitorowanych parametrów (przekro- czenie progów alarmowych). Monitorowanie na różne sposoby Po pierwsze, należy wyróżnić tzw. monitoro- wanie aktywne (ang. active monitoring). – za- chodzi ono wówczas, kiedy w systemie moni- Rysunek 6. Drzewiasta struktura bazy MIB ze wskazaniem ścieżek prowadzących od głównego liścia (ISO [1]) do liści zawierających wartości parametrów xupsInputFrequency.0 (częstotliwość wejściowa linii użyt- kowej w 1/10Hz) i xupsInputVoltage.1 (napięcie w V dla pierwszej fazy zasilania). Widać, w jaki sposób konstruowane są numery OID dla urządzeń UPS Eaton Powerware
  • 8. 43www.lpmagazine.org Rozwiązania Data Center torującym (np. NMS), pełniącym rolę mene- dżera SNMP, definiujemy tzw. pooling. Jest to mechanizm odpytywania kolejnych urządzeń w puli o wartości ich parametrów. W mene- dżerze definiujemy także progi alarmowe – je- żeli odpowiedź z danego urządzenia będzie za- wierała wartość parametru, która przekracza próg, generujemy zdarzenie alarmowe, np.: • komunikat ekranowy, • sygnał dźwiękowy, • e-mail do administratorów, • SMS na telefony komórkowe osób dyżu- rujących, • komunikat SNMP Trap, • wyzwolenie dowolnej operacji, na któ- rą zezwala nasza aplikacja monitorująca – np. uruchomienie dodatkowej aplikacji, skryptu etc. Aktywne monitorowanie pozwala na bieżąco badać parametry i generować zdarzenia alar- mowe, ale jest także podstawą drugiego istot- nego podejścia do monitorowania. Jest nim monitorowanie wydajności (ang. performance monitoring) lub inaczej (co bardziej odpowia- da dziedzinie IKS) – kolekcjonowanie danych na potrzeby generowania trendów. Parametry, które są odczytywane dzięki mechanizmowi poolingu z kolejnych urządzeń mogą być zapisywane w bazie danych mene- dżera SNMP (nie należy mylić bazy danych aplikacji z bazą danych MIB – to dwie różne rzeczy) i zbierane przez zdefiniowany okres czasu. Dzięki temu administrator ma możli- wość analizowania trendów przedstawiają- cych zmienność wartości parametrów w cza- sie. Taka funkcjonalność daje ogromne możli- wości, jeśli chodzi o diagnozowanie przyczyn i okoliczności awarii (np. narastająca temperatu- ra oznaczała awarię klimatyzacji), ale także po- zwala z wyprzedzeniem przewidywać ewentu- alne incydenty, planować serwis urządzeń, pla- nować zakupy nowych urządzeń, czy wymia- nę elementów podlegających zużyciu (np. bate- rii zasilacza UPS) – w tym sensie dane te mają bezpośrednie przełożenie na szacowane koszta operacyjne. Poza monitorowaniem aktywnym i zbieraniem trendów – czym zajmuje się me- nedżer SNMP – mamy do czynienia z bardzo istotną odmianą monitorowania, która stanowi w rzeczywistości podstawę efektywnego syste- mu monitorowania rozległych IKS. Jest to mo- nitorowanie pasywne, oparte na wymianie no- tyfikacji SNMP. W tym przypadku menedżer SNMP nasłuchuje w sposób ciągły (port 162 UDP), a agenci działający na urządzeniach po zaistnieniu określonego zdarzenia wysyłają no- tyfikację na skonfigurowany adres zaufanej sta- cji monitorowania (na której działa aplikacja menedżera). Notyfikacje mogą mieć różne zna- czenie i występują na różnych poziomach waż- ności. Niestety, nie obowiązuje tutaj żaden wy- raźny standard, a więc należy umiejętnie skon- figurować zarówno agentów SNMP na naszych urządzeniach, jak i wprowadzić przemyślane re- guły filtrowania oraz korelowania zdarzeń w aplikacji menedżera SNMP. Notyfikacje SNMP mają różną ważność, np.: • Minor 01/07/2009 07:46:26 UPS0001GDY upsTrapAlarmEntryRemoved [1] upsAlarmId.0 (Integer): 20 [2] upsAlarmDescr.0 (Object ID): upsAlarmCommunicationsLost [3] snmpTrapEnterprise.0 (Object ID): upsTraps – adapter SNMP utracił łączność z zasi- laczem UPS. Nie jest to sytuacja bardzo krytyczna i nie musi oznaczać faktu nie- dostępności zasilacza UPS. Problem mo- że leżeć po stronie adaptera SNMP lub połączenia i może być chwilowy. • Info 30/06/2009 23:29:23 UPS0086GDN upsOnBattery [1] mtrapargsString.0 (DisplayString): UPS: On battery power in response to an input power problem. [2] snmpTrap- Enterprise.0 (Object ID): apc : – notyfikacja informuje, że zasilacz UPS rozpoczął podtrzymywanie zasilania z ba- terii w odpowiedzi na zarejestrowany za- nik zasilania. Jeżeli sytuacja ta potrwa dłu- żej, to możemy spodziewać się zadziała- nia układu SZR, który załączy agregat. Je- żeli w danej lokalizacji nie ma agregatu, czas rozpocząć zatrzymywanie baz danych, aplikacji i wyłączanie sprzętu. • Info 30/06/2009 23:29:25 UPS0921W- WA powerRestored [1] mtrapargs- String.0 (DisplayString): UPS: No longer on battery power. [2] snmp- TrapEnterprise.0 (Object ID): apc – wiemy, że zasilacz UPS przestał praco- wać na bateriach. Oznacza to, że powróci- ło zasilanie z miasta lub układ SZR załą- czył agregat. Rozpocznie się teraz ładowa- nie baterii. • Warning 30/06/2009 22:10:05 EMP00- 32KRA Triggered Manual Threshold For xupsEnvRemoteTemp.0: 26>25 – czujka środowiskowa zgłasza alarm prze- kroczenia wartości progowej dla temperatu- ry pomieszczenia (25 stopni C), ponieważ bieżąca temperatura wynosi 26 stopni C. To jeszcze nie jest wielki problem, ale warto sprawdzić w jaki sposób narastała tempera- tura i czego możemy się spodziewać w naj- bliższym czasie. Może ktoś wyłączył klima- tyzator podczas pracy w serwerowni? Obszar VI. Bezpieczeństwo fizyczne i ochrona przeciwpożarowa Ochronafizycznajestnajstarszym,alewciążnaj- pewniejszym sposobem ochrony posiadanych zasobów i stanowi pierwszą linię obrony insty- tucji przed zagrożeniami. Jej zadaniem, zgod- nie z normą ISO 17799, jest zapobieganie nie- uprawnionemu dostępowi, uszkodzeniom i in- gerencji w pomieszczenia instytucji i jej infor- macje. Często organizacje kładą duży nacisk na ochronę teleinformatyczną zasobów IT i nie doceniają podstawowych mechanizmów i środ- ków ochrony fizycznej, co faktycznie jest pod- stawą jakiegokolwiek bezpieczeństwa. Nawet najlepsze zainstalowane zapory ogniowe, syste- my IDS, czy IPS na nic się nie zdadzą, jeśli moż- na wynieść dyski z danymi przez niezabezpie- czone okno lub spowodować przegrzanie serwe- rów i przestój serwerowni poprzez uszkodzenie zewnętrznych skraplaczy systemu klimatyzacji. Podstawą do zaprojektowania systemu och- rony fizycznej jest przeprowadzenie analizy ryzyka i następnie dostosowanie poziomu ochrony do wymagań biznesowych (pamięta- Rysunek 7. Przeglądarka plików zawierających definicje baz MIB (iReasoning MIB Browser PE). Widać dostępne z menu kontekstowego polecenia SNMP, a także odczytane, bieżące wartości dostępnych na urządzeniu parametrów itp. Silną stroną takich narzędzi jest fakt, że dzięki nim w łatwy sposób korzystamy z baz MIB – praca z notacją ASN.1 wymagałaby od człowieka ogromnego wysiłku
  • 9. 44 wrzesień 2009 Rozwiązania Data Center jąc oczywiście o wymogach prawa, zaleceniach, normach i dobrych praktykach w tym zakresie). Poprawnie zaprojektowany system ochrony fizycznej z jednej strony ma uniemożliwić do- stęp osobom nieuprawnionym, ale też nie mo- że utrudniać lub uniemożliwiać dostępu oso- bom uprawnionym. Nie zawsze też trzeba się koncentrować na najnowszych rozwiązaniach technicznych typu rozwiązania biometryczne, a bardzo często funkcjonalności systemu ochrony można uzyskać poprzez odpowiednie zaimple- mentowanie prostych metod: • zabezpieczenia budowlanego (odpowied- nie ściany, drzwi, okna, kraty itp.), • zabezpieczenia elektronicznego (systemy: sygnalizacji włamania i napadu, kontroli dostępu, telewizji dozorowej, itp.), • ochrony fizycznej (recepcja, dozorca itp.), • zabezpieczeń organizacyjnych typu proce- duralne ograniczenie do minimum liczby osób mających dostęp do kluczowych po- mieszczeń (często lekceważone rozwiąza- nie, chociaż skuteczne i najtańsze do wpro- wadzenia). Elementem powiązanym z system ochrony fi- zycznej, chociaż zgodnie z przepisami nie wchodzącym w jego skład, jest system ochrony przeciwpożarowej. Kluczowe pomieszczenia w obiekcie, a do nich należy serwerownia, powin- ny być wyposażone w co najmniej czujki sys- temu sygnalizacji pożarowej lub jeszcze lepiej w stałą instalację systemu gaszenia gazem. Niedocenianie filary organizacji Procedury i normy Procedury i normy powinny być jednym z fi- larów działu IT w każdej organizacji, ale by- wa z tym bardzo różnie. Wszelkie procedury są uważane za przejaw biurokracji, chociaż mogą znacznie usprawnić pracę działu IT. Przykładem może być metodyka ITIL, która w zasadzie tyl- ko opisuje, jakie procedury eksploatacyjne i kie- dy warto stosować. Jedną z podstawowych pro- cedur, jakie ITIL poleca zastosować, jest proce- dura zgłaszania żądań od użytkowników. Nie musi być to od razu wielki system typu Help- Desk, na początek wystarczy wprowadzić zasa- dę (żeby nie używać niepopularnego słowa: pro- cedurę), że wszystkie zgłoszenia muszą być opi- sane i wysłane na jeden określony adres pocz- ty. Takie proste rozwiązanie organizacyjne daje działowi IT wiele korzyści: • powstaje ewidencja, na podstawie której można pokazać aktualne obciążenie pracą, • automatycznie powstaje dokumentacja i hi- storia ewentualnych zmian, • po jakimś czasie prowadzi do zmniejszenia liczby telefonów. Najważniejsze jest konsekwentne przestrzega- nie tej zasady przez wszystkich pracowników – jeśli ktoś dzwoni, to należy poprosić o prze- słanie opisu zgłoszenia e-mailem, jako podsta- wy do rozpoczęcia pracy. Inną kategorią procedur są procedury awa- ryjne, które w prosty sposób opisują ciąg czyn- ności do wykonania w sytuacji krytycznej. Ze swej natury procedury awaryjne są wykonywa- ne rzadko (a najlepiej, żeby nie zaistniała po- trzeba ich wykonywania) i w ich przypadku ważna jest cykliczna weryfikacja. Infrastruktura krytyczna podlega takim samym zmianom jak pozostałe elementy i chyba nikt nie chciałby się znaleźć w sytuacji, w której procedura awaryj- na poleca użyć nieistniejącego narzędzia. Dobrą praktyką jest testowanie procedury przez osobę, która na co dzień nie zajmuje się danym obsza- rem, np. osoba odpowiedzialna za systemy mo- nitorowania testuje procedurę awaryjnego uru- chomienia agregatu. Takie podejście pozwala na szybkie zlokalizowanie nieścisłości i błędów w procedurach. IT jest chyba jedynym obszarem techniki, w którym nie występują prawnie usankcjonowa- ne normy, które muszą być przestrzegane i być może dlatego tak trudno jest nam zrozumieć po- trzebę ich stosowania. Najwięcej do czynienia z normami mamy w trakcie procesu budowy serwerowni, a osoba prowadząca taki projekt musi się zapoznać z szeregiem norm i przepi- sów, m.in. takich jak: • prawo budowlane, • normy elektryczne, • przepisy przeciwpożarowe, • przepisy BHP. Ze względu na olbrzymi zakres zagadnień, ja- kich dotyczą te normy, ważne jest, aby ich speł- nienie było potwierdzone przez odpowiedniego specjalistę. Dokumentacja Podobnie jak procedury, nie jest to obszar spe- cjalnie lubiany przez pracowników IT. Mamy w nim do czynienia z dwoma rodzajami do- kumentacji: • Dokumentacja obiektów i urządzeń: – plany obiektów, – projekty techniczne, – dokumentacja konfiguracji, – dokumentacja producentów urządzeń. • Dokumentacja wykonanej pracy: – raporty z wykonanych czynności (na- praw, przeglądów), – wykonane zmiany, – obsłużone zgłoszenia. Liczba dokumentów, z jaką mamy do czynie- nia w codziennej pracy, jest tak ogromna, że bez systemu porządkującego w krótkim czasie przestaniemy nad nimi panować. Nad ogro- mem dokumentacji można zapanować na kilka sposobów – od sprawdzonych systemów opar- tych na drukowanych kartkach umieszczanych w segregatorach (rozwiązanie tanie, proste i sku- teczne), poprzez systemy folderów i dokumen- tów elektronicznych, aż do dedykowanych baz danych i aplikacji. Wybór rozwiązania zależy od liczby przetwarzanych dokumentów, ale naj- ważniejsze jest, aby jakieś było wybrane i kon- sekwentnie stosowane. Nie wolno też się łudzić, że tego typu rozwiązanie uda się wdrożyć, a po- tem o nim zapomnieć – dokumentacja musi żyć i być aktualizowana, bez tego jest niepotrzebna, a w niektórych przypadkach nawet szkodliwa. Podsumowanie Mamy nadzieję, że udało nam się choć trochę przybliżyć Czytelnikom tematykę ciekawego i chyba na co dzień niedocenianego obszaru, ja- kim jest Infrastruktura Krytyczna Serwerow- ni (IKS). Zachęcamy do przesyłania pytań oraz brania udziału w dyskusjach i konkursach na na- szym portalu. • Data Center Serwis – http://DCSerwis.pl • Zasadnicze wymagania dotyczące zarządzania infrastrukturą NCPI: http://www.apcmedia.com/salestools/ VAVR-626VR8_R0_PL.pdf • Witryna firmy iReasoning (MIB Brow- ser): http://www.ireasoning.com W Sieci DCSerwis.pl to grupa specjalistów zawo- dowo zajmujących się problematyką bu- dowy, utrzymania i zarządzania centrami przetwarzania danych oraz IKS. Jednym z celów działania grupy jest popularyzacja wiedzy dotyczącej IKS, centrów danych i ich znaczenia dla biznesu, także poprzez najnowszą inicjatywę, jaką jest portal spo- łecznościowy DCSerwis.pl. Kontakt z autorem: kontakt@dcserwis.pl O autorach: