SlideShare a Scribd company logo
1 of 24
Download to read offline
PREDIZIONE DI MALFUNZIONAMENTI IN
RETI DI TELECOMUNICAZIONI CON
TECNICHE DI MACHINE LEARNING
Relatore: prof. Alberto Bartoli Correlatore: prof. Eric Medvet Laureando: Francesco Occhioni
Anno accademico: 2015-2016
Tesi di Laurea Magistrale in Ing. Informatica
Introduzione
Collaborazione con:
● Emaze S.p.A
● Operatore Telefonico Nazionale
1/23
Obbiettivi
Migliorare:
● Il servizio del CRM
● La soddisfazione del cliente
Sviluppo e realizzazione di un Proof of Concept per:
● Strumento di supporto alla proactive assurance
● Valutare applicazione di tecniche di Machine Learning
2/23
Obbiettivi
Cosa effettivamente “prevedere?”
Come poter definire un guasto?
Necessario uno studio e un reverse engineering
dei sistemi informativi preesistenti
3/23
Stato attuale - CPE
Customer Premise Equipment
● Dispositivo assegnato all’utente
● Connessione alla WAN
Identificabile da Link Reference
Differenziati per tipo di linea
e tipo di servizi offerti
WAN
CPE
Link Reference
4/23
Stato attuale - Monitoring
3 Sistemi per il monitoraggio dei CPE in tempo reale:
● SeQuMo
● CDSeQuMo
● HaWMo
Coprono il 95% della
customer base
Rilevazione dei Key Performance Indicator (KPI) da ogni CPE
#SeQuMo = 65% sul totale
#CDSeQuMo = 30% sul totale
#HaWMo = 15% sul totale
5/23
Stato attuale - SeQuMo
Rilevazione dei KPI ogni 15 minuti
KPI:
● Mos - Mean Opinion Score
● Latenza HTTP
● Latenza DNS
● Reboot
● Stato Linea Primaria
6/23
Stato attuale - CDSeQuMo
Rilevazione dei KPI ogni 15 minuti
KPI:
● Packet Loss
● Download Rate
● Upload Rate
● Mos
● Latenza HTTP
● Latenza DNS
● Reboot
● Stato linea Primaria
7/23
Stato Attuale - Ticketing
Ticket: lamentela o un reclamo da parte della clientela in relazione
ad un disservizio sull’infrastruttura di rete
Data di Apertura - Data di Chiusura - Close Code
Previsione Ticket ≈ Previsione Guasti
8/23
Classificatore - Costruzione DataSet
Riferimenti temporali:
Istanza Positiva:
● “Tra t+G e t+G+H si aprirà un Ticket su questo CPE”
Istanza Negativa:
● “Tra t+G e t+G+H non si aprirà un Ticket su questo CPE”
9/23
Classificatore - N/A e Sbilanciamento
Approcci comuni in letteratura:
Trattamento dei Missing Values ( N/A ):
● Sostituiamo ogni N/A con il valore medio della feature
● “Non c’è” ≣ “C’è ed ha il valore medio”
Trattamento dei dati sbilanciati:
● #istanze negative ≅ 1000 #istanze positive
● Training Cost Sensitive
10/23
Classificatore - Valutazione Prestazioni
Confusion Matrix:
True Positive Rate:
● % Ticket predetti che si sono verificati
False Positive Rate:
● % Ticket predetti che non si sono verificati
11/23
Classificatore - Valutazione Prestazioni
Reciever Operating Characteristics:
Valuto TPR per FPR=0.25
Quanti ticket riesco a prevedere
con un 25% di falsi allarmi ?
12/23
Classificatore
Random Forest
● Basato su alberi decisionali
● Molto efficiente
● Resistente all’overfitting
Alberi Decisionali
● Facilità di interpretazione
● Buona accuratezza generale
● Robustezza al rumore
13/23
Risultati
14/23
Per ogni sistema di monitoraggio:
● TPR
● FPR
● TPR con FPR = 0,15%
Risultati - CDSeQuMo (TPR)
Con granularità di 15 minuti
prevedo il 65% dei Ticket
Con granularità di un’ora
prevedo il 90% dei ticket
Con granularità H>1h
prevedo il 95% dei ticket
15/23
Risultati - CDSeQuMo (FPR)
All’aumentare della granularità
H aumentano i falsi allarmi
Worst Case:
● Falsi Allarmi ≅ 3%
16/23
Risultati - CDSeQuMo (TPR@0,15%)
Con granularità di 15 minuti
prevedo solo il 25% dei Ticket
Con granularità H>1h prevedo
il 75% dei ticket
17/23
Risultati - SeQuMo (TPR)
Con granularità di 15 minuti
prevedo il 65% dei Ticket
Con granularità di un’ora
prevedo il 85% dei ticket
Con granularità H>1h prevedo
il 90% dei ticket
18/23
Risultati - SeQuMo (FPR)
All’aumentare della granularità
H aumentano i falsi allarmi
Worst Case:
● Falsi Allarmi ≅ 15%
19/23
Risultati - SeQuMo (TPR@0,15%)
Previsione dei ticket del 60%
Con G > 5h le prestazioni
peggiorano sensibilmente
20/23
Conclusione
I classificatori funzionano:
● Previsione dei Ticket in percentuale alta
● Bassa percentuale di falsi allarmi
● Buone le previsioni con falsi allarmi dello 0,15%
Prestazioni migliori su CDSeQuMo rispetto a SeQuMo
● KPI di raggiungibilità e Upload/Download rate migliorano il
classificatore
21/23
Sviluppi Futuri
● Presentazione delle prestazioni al committente
● Rilascio in produzione
● Valutazione in ambiente reale e taratura del classificatore
● Valutare le prestazioni in base a diverse tipologie linea
● Predizione di guasti
22/23
Fine
Grazie per l’attenzione!

More Related Content

Featured

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by HubspotMarius Sescu
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 

Featured (20)

2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot2024 State of Marketing Report – by Hubspot
2024 State of Marketing Report – by Hubspot
 
Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 

Predizione di malfunzionamenti in reti di telecomunicazioni con tecniche di machine learning

  • 1. PREDIZIONE DI MALFUNZIONAMENTI IN RETI DI TELECOMUNICAZIONI CON TECNICHE DI MACHINE LEARNING Relatore: prof. Alberto Bartoli Correlatore: prof. Eric Medvet Laureando: Francesco Occhioni Anno accademico: 2015-2016 Tesi di Laurea Magistrale in Ing. Informatica
  • 2. Introduzione Collaborazione con: ● Emaze S.p.A ● Operatore Telefonico Nazionale 1/23
  • 3. Obbiettivi Migliorare: ● Il servizio del CRM ● La soddisfazione del cliente Sviluppo e realizzazione di un Proof of Concept per: ● Strumento di supporto alla proactive assurance ● Valutare applicazione di tecniche di Machine Learning 2/23
  • 4. Obbiettivi Cosa effettivamente “prevedere?” Come poter definire un guasto? Necessario uno studio e un reverse engineering dei sistemi informativi preesistenti 3/23
  • 5. Stato attuale - CPE Customer Premise Equipment ● Dispositivo assegnato all’utente ● Connessione alla WAN Identificabile da Link Reference Differenziati per tipo di linea e tipo di servizi offerti WAN CPE Link Reference 4/23
  • 6. Stato attuale - Monitoring 3 Sistemi per il monitoraggio dei CPE in tempo reale: ● SeQuMo ● CDSeQuMo ● HaWMo Coprono il 95% della customer base Rilevazione dei Key Performance Indicator (KPI) da ogni CPE #SeQuMo = 65% sul totale #CDSeQuMo = 30% sul totale #HaWMo = 15% sul totale 5/23
  • 7. Stato attuale - SeQuMo Rilevazione dei KPI ogni 15 minuti KPI: ● Mos - Mean Opinion Score ● Latenza HTTP ● Latenza DNS ● Reboot ● Stato Linea Primaria 6/23
  • 8. Stato attuale - CDSeQuMo Rilevazione dei KPI ogni 15 minuti KPI: ● Packet Loss ● Download Rate ● Upload Rate ● Mos ● Latenza HTTP ● Latenza DNS ● Reboot ● Stato linea Primaria 7/23
  • 9. Stato Attuale - Ticketing Ticket: lamentela o un reclamo da parte della clientela in relazione ad un disservizio sull’infrastruttura di rete Data di Apertura - Data di Chiusura - Close Code Previsione Ticket ≈ Previsione Guasti 8/23
  • 10. Classificatore - Costruzione DataSet Riferimenti temporali: Istanza Positiva: ● “Tra t+G e t+G+H si aprirà un Ticket su questo CPE” Istanza Negativa: ● “Tra t+G e t+G+H non si aprirà un Ticket su questo CPE” 9/23
  • 11. Classificatore - N/A e Sbilanciamento Approcci comuni in letteratura: Trattamento dei Missing Values ( N/A ): ● Sostituiamo ogni N/A con il valore medio della feature ● “Non c’è” ≣ “C’è ed ha il valore medio” Trattamento dei dati sbilanciati: ● #istanze negative ≅ 1000 #istanze positive ● Training Cost Sensitive 10/23
  • 12. Classificatore - Valutazione Prestazioni Confusion Matrix: True Positive Rate: ● % Ticket predetti che si sono verificati False Positive Rate: ● % Ticket predetti che non si sono verificati 11/23
  • 13. Classificatore - Valutazione Prestazioni Reciever Operating Characteristics: Valuto TPR per FPR=0.25 Quanti ticket riesco a prevedere con un 25% di falsi allarmi ? 12/23
  • 14. Classificatore Random Forest ● Basato su alberi decisionali ● Molto efficiente ● Resistente all’overfitting Alberi Decisionali ● Facilità di interpretazione ● Buona accuratezza generale ● Robustezza al rumore 13/23
  • 15. Risultati 14/23 Per ogni sistema di monitoraggio: ● TPR ● FPR ● TPR con FPR = 0,15%
  • 16. Risultati - CDSeQuMo (TPR) Con granularità di 15 minuti prevedo il 65% dei Ticket Con granularità di un’ora prevedo il 90% dei ticket Con granularità H>1h prevedo il 95% dei ticket 15/23
  • 17. Risultati - CDSeQuMo (FPR) All’aumentare della granularità H aumentano i falsi allarmi Worst Case: ● Falsi Allarmi ≅ 3% 16/23
  • 18. Risultati - CDSeQuMo (TPR@0,15%) Con granularità di 15 minuti prevedo solo il 25% dei Ticket Con granularità H>1h prevedo il 75% dei ticket 17/23
  • 19. Risultati - SeQuMo (TPR) Con granularità di 15 minuti prevedo il 65% dei Ticket Con granularità di un’ora prevedo il 85% dei ticket Con granularità H>1h prevedo il 90% dei ticket 18/23
  • 20. Risultati - SeQuMo (FPR) All’aumentare della granularità H aumentano i falsi allarmi Worst Case: ● Falsi Allarmi ≅ 15% 19/23
  • 21. Risultati - SeQuMo (TPR@0,15%) Previsione dei ticket del 60% Con G > 5h le prestazioni peggiorano sensibilmente 20/23
  • 22. Conclusione I classificatori funzionano: ● Previsione dei Ticket in percentuale alta ● Bassa percentuale di falsi allarmi ● Buone le previsioni con falsi allarmi dello 0,15% Prestazioni migliori su CDSeQuMo rispetto a SeQuMo ● KPI di raggiungibilità e Upload/Download rate migliorano il classificatore 21/23
  • 23. Sviluppi Futuri ● Presentazione delle prestazioni al committente ● Rilascio in produzione ● Valutazione in ambiente reale e taratura del classificatore ● Valutare le prestazioni in base a diverse tipologie linea ● Predizione di guasti 22/23