10. SRE – Site Reliability Engineering
Class SRE implements DevOps (Google)
Site Reliability Engineering is an engineering discipline
devoted to helping an organization achieve
the appropriate level of reliability in their
systems, services, and products. (Microsoft)
11. DevOps diviso in aree
Riducete l’isolamento
dei compartimenti
aziendali
Accettare il
fallimento come
parte del processo
Implementate i
cambiamenti in
maniera graduale
Sfruttate gli
strumenti e le
automazioni
Misurate Tutto
12. DevOps diviso in aree
Misurate Tutto
Misurazioni relative al lavoro
Misurazioni relative alla
affidabilità ed allo stato di salute
del sistema
13. SLI – Service Level Indicators
• «Service Level Indicator (SLI) is a measure of the service
level provided by a service provider to a customer»
(Wikipedia)
• # di chiamate HTTP andate a buon fine / # totale di
chiamate
• # di chiamate gestate in < 200ms / # totale di chiamate
• # di record processati / # totale di record
14. SLI – Service Level Indicator - Esempio
Ricevo 2000 chiamate HTTP
1780 vanno a buon fine
Il rapporto è 1780/2000 = 0,89
0,89 * 100 = 89% di disponibilità
15. SLO – Service Level Objectives
•Ripetete con me OBJECTIVES
•Si esprimono in PERCENTILI
•NB: L’obiettivo guida il livello di impegno
necessario per poterlo raggiungere
SLO – Service Level Objectives
•Ripetete con me OBJECTIVES
•Si esprimono in PERCENTILI
•NB: L’obiettivo guida il livello di impegno
necessario per poterlo raggiungere
16. SLO – Service Level Objectives
Si sceglie «cosa» misurare
Richieste HTTP
Operazioni
Si sceglie il SLI (misurato nel posto opportuno)
il 99% delle richieste evase in 200ms
il 95% delle richieste va a buon fine …
Si sceglie un lasso di tempo di riferimento
un minuto / un mese / un anno / …
Il 95% delle richieste HTTP
(dato raccolto dal LB) deve
andare a buon fine
nell’arco di un mese
17. SLA – Service Level Agreement
È un accordo DI NATURA COMMERCIALE
tra chi vende il SERVIZIO e chi lo ACQUISTA
Tenetelo sempre in linea con gli SLO
Spoiler: Una volta definito un SLA, esso guida il vostro Error Budget