2. Co monitorujemy?
• Stany
sesji
BGP
• Wielkość
ruchu
IP
• Dostępność
BGP
neighbors
• Stan
portów
na
switchach
(up/down)
3. Popularne narzędzia
do monitoringu sieci
Narzędzie Wady
Nagios - monitorowanie poprzez odpytywanie,
- brak możliwości grupowania zdarzeń
Cacti - problemy podczas przepinania klientów,
- brak integracji z CRM,
- brak sumowania ruchu z wybranych portów,
- niewygodne zarządzanie,
- brak redundancji i odporności na awarie
Smokeping - słaba notyfikacja, dużo maili
Trap browser - ogromna ilość zdarzeń do przejrzenia,
- brak możliwości grupowania zdarzeń
- brak możliwości filtrowania/wyszukiwania
4. Typowe problemy systemów
monitoringu sieci
• Wiele
narzędzi
to:
• wiele
różnych
API,
• wiele
różnych
interfejsów
użytkownika,
• wiele
różnych
plików
konfiguracyjnych,
• wiele
różnych
typów
notyfikacji
(maile,
www,
sms),
• ...
oraz
brak
możliwości
personalizacji
(np.
przypisanie
klienta
do
portu),
liczenie
SLA
(umowa
z
klientem),
precyzyjne
definiowanie
czasu
awarii
• To
wszystko
powoduje,
że
mamy
dobry
monitoring,
ale
bardzo
nieczytelny.
5. Typowe problemy systemów
monitoringu sieci
• Brak
redundancji
• Podatność
na
awarie
• Trudność
w
utrzymaniu
i
aktualizacji
• Skomplikowane
zależności
pomiędzy
elementami
systemu
• Długi
czas
„disaster
recovery”,
• Niska
wydajność,
duplikowanie
procesów
6. PLIX
LAB
-‐
cel
• Stworzenie
wydajnej
i
redundantnej
infrastruktury
NOC,
• Stworzenie
jednolitego
systemu
alertowania
anomalii
występujących
w
sieciach
plix,
• Inteligentny
monitoring
–
diagnozowanie,
grupowanie
oraz
filtrowanie
zdarzeń,
• Centralizacja
(webservice)
–
jednolite
API
dla
wszystkich
narzędzi,
• Personalizacja
systemów
w
kierunku
SLA
i
warunków
umowy
z
klientem,
• Szybsze
informowanie
klientów
o
anomaliach
pojawiających
się
w
ich
sieciach,
7. PLIX
LAB
-‐
realizacja
• Nowa
infrastrukutra
• My.plix
• Admin.plix
• Webservice
-‐
API
• Trap
Monitor
• Live
Network
Map
• Live
Network
Traffic
Graph
8. Realizacja
-‐
infrastruktura
• Redundancja
usług,
• Wirtualizacja
maszyn,
• Uproszczenie
procesu
deployowania
i
utrzymania,
• Optymalizacja
procesów
(brak
duplikacji
zadań)
11. Realizacja
–
admin.plix
• Pełne
informacje
o
kliencie
(porty,
sesje,
statystyki)
• Zarządzanie
infrastrukturą
• Konfiguracja
narzędzi,
z
których
jeszcze
korzystamy
(np.
nagios,
smokeping),
• System
bcketowy
–
12. Realizacja
–
narzędzia
Trap
Monitor
• Wizualizacja
zdarzeń
(na
żywo),
• Centralizacja,
• Grupowanie
zdarzeń
na
podstawie
posiadanych
w
systemie
informacji
o
kliencie
(sesja,
port,
ip),
• Jednolita
notyfikacja
i
ackowanie,
• Trap
browser,
• Precyzyjne
liczenie
czasu
awarii
16. Realizacja
–
narzędzia
Live
Network
Traffic
Graph
• Rysowanie
wykresów
z
ruchu
na
wybranych
portach,
(np.
uplinki)
w
czasie
rzeczywistym,
• Próbkowanie
co
30-‐60
sekund
(do
wyboru)
17. PLIX
LAB
–
bieżące
projekty
Trap
Monitor
• Tworzenie
bcketów
na
podstawie
zgrupowanych
zdarzeń,
• Grupowanie
i
filtrowanie
zdarzeń
po
zadanych
wartościach
np.
oprogramowanie
BGP,
dostawca
transmisji,
lokalizacja,
• Inteligentne
diagnozowanie
–
umiejętność
wykrycia
braku
zasilania
na
LIM,
awarii
u
dostawcy
transmisji,
błędy
w
oprogramowaniu.
18. PLIX
LAB
–
bieżące
projekty
Live
Network
Traffic
Graph
• analiza
ruchu
(ruch
mulbcastowy,
broadcastowy),
• anomalie
(spadki
oraz
piki)