Overview sui reali benefici del monitoraggio di rete (network monitoring) e sulle criticità dei monitoraggi più comuni, in particolare Nagios.
Presentazione di un'alternativa che permette maggiore flessibilità e efficienza, grazie a template, deploy automatico, grafici e notifiche sui dispositivi mobili
2. Alessio Ligabue 2
Processo per l’intervento
sui disservizi
Per migliorare l’efficienza è necessario analizzare i
passaggi che portano agli interventi sui disservizi.
In particolare il confronto fra:
●
Processo standard (senza monitoraggio)
●
Monitoraggio con notifica
7. Alessio Ligabue 7
Limiti comuni nei software
di monitoring
Buona parte dei sistemi di monitoraggio soffre di problemi
come:
●
Difficile implementazione: configurazioni complesse da linea
di comando
●
Bassa flessibilità sui servizi supportati e sulle metriche
●
Poca o nessuna possibilità di estenderne le funzioni e i
software supportati e scarsa disponibilità di plugin
●
Impossibilità di applicare regole ricorsive e template
●
Costo elevato del software o della configurazione
8. Alessio Ligabue 8
Qual’è l’impatto per la
nostra azienda?
●
Immagine (difficilmente calcolabile)
●
Inefficienza (tempo speso per la diagnostica)
●
Perdita di lavoro
9. Alessio Ligabue 9
Quanto ci costa un
blocco?
Il costo è calcolato moltiplicando, il numero di utenti, il
costo orario e le ore di fermo.
Esempio:
50 utenti * 28,3 €/ora * 2 ore = 2.830 €
*Costo orario medio Italiano 2015 fonte Eurostat
10.
11.
12. Alessio Ligabue 12
Core vs XI
Cosa offre la versione a pagamento?
Features Nagios Core Nagios XI
Standard monitoring X X
Grafici avanzati X
Wizard di configurazione X
Modifica host da web X
Modifica multipla oggetti X
13.
14.
15. Alessio Ligabue 15
Nagios
A 17 anni dal rilascio di Nagios, è stato uno dei migliori
Network monitoring della storia, ma…
16. Alessio Ligabue 16
●
È ancora adatto ai nostri tempi?
●
È pronto per le sfide di domani?
●
È possibile che da allora non sia cambiato nulla?
Nagios
17. Alessio Ligabue 17
Moltiplicarsi del valore dei dati
e dei sistemi
Cloud: Private/Public/Hibrid
Infrastrutture sempre più complesse
18. Alessio Ligabue 18
Aumento della criticità dei
servizi
●
Utilizzo h24
●
Alta affidabilità
●
Distribuzione geografica
20. Alessio Ligabue 20
In sostanza:
●
Più servizi
●
Maggiore affidabilità
●
Maggiore complessità
●
Meno tempo per gestirli
21. Alessio Ligabue 21
Scarsa percezione della
criticità e complessità
...abbiamo sempre fatto così!
…ha sempre funzionato, ora non va più!
…come fate a non saperlo?
...nessuno mi ha avvisato che dovevo cambiare la
cassetta!
…per quello che dobbiamo farci noi è già anche
troppo!
22. Alessio Ligabue 22
Come sopravvivere?
●
Monitoraggio granulare delle applicazioni e dei
sistemi
●
Notifiche e collaborazione in tempo reale fra i
team interessati
●
Integrazione nel processo di sviluppo e testing
●
Reportistica dettagliata e visuale
●
Flessibilità e affidabilità del software di
monitoraggio
29. Alessio Ligabue 29
Infrastruttura
●
Basata su container Docker
●
Multi Master su cloud server internazionali ad alta affidabilità
●
Software Open disegnato per l’alta affidabilità in cluster
●
Comunicazioni cifrate fra nodi, zone e cluster
●
Velocità: 10x Nagios + Gearman (benchmark su 1.000.000 di check su
servizi)
●
Ad oggi disponibili 200 check (sulla nostra infrastruttura), compatibilità
con i nagios plugins, oltre 3000 disponibili
●
Store dei risultati in Mysql o Postresql
●
Deploy tramite Ansible e API degli host e dei servizi