SlideShare a Scribd company logo
1 of 11
Download to read offline
Studio, implementazione e
sperimentazione di un algoritmo di
classificazione delle domande
basato sull’algoritmo di Winnow
Marco Giannone & Marco Bontempi
AA 2009/2010
Sistemi Intelligenti per Internet
giovedì 15 luglio 2010
Algoritmo di Winnow
Algoritmo on-line di comitato.
In questo studio viene applicato alla Q.A.
Un insieme di “esperti” (classificatori), ai quali è associato un
peso, vengono interpellati all’arrivo dell’oggetto da classificare.
Ogni “esperto” classifica l’oggetto (ovvero assume valore 1 o
0). La somma dei pareri degli esperti (moltiplicati per il peso
dell’esperto stesso) viene confrontata con una soglia (in genere
N = numero degli esperti). Se questa somma supera la soglia si
ha un parere positivo, altrimenti negativo.
In caso di predizione corretta non viene modificato il peso degli
esperti. In caso di predizione errata si modifica il peso degli
esperti che hanno dato parere positivo: se il parere positivo è
corretto allora viene raddoppiato il peso, mentre se il parere
avrebbe dovuto essere negativo viene dimezzato.
giovedì 15 luglio 2010
Vengono costruiti tanti comitati quante sono le categorie di
domande.
Ciascun termine di ogni domanda diventa un “esperto” della
propria categoria.
Quando si deve classificare una nuova domanda, questa viene
sottoposta a tutti i comitati. I risultati che possiamo ottenere
sono i seguenti:
Nessun comitato ha dato parere positivo: la domanda non
viene classificata.
Più di un comitato fornisce parere positivo: la domanda non
viene classificata.
Un solo comitato fornisce parere positivo: la domanda viene
ritenuta appartenente alla categoria del comitato.
Winnow per la Q.A.
giovedì 15 luglio 2010
È stato usato un training set composto da 5452 domande e 6
categorie: ENTITY, DESCRIPTION, NUMBER, ABBREVIATION,
LOCATION, HUMAN.
Se non è stato ancora costituito alcun comitato si prendono tutti i
termini della domanda e si costruisce il primo.
Se esistono già dei comitati, la domanda viene sottoposta a tutti i
comitati esistenti, aggiornando (se necessario) i pesi degli
esperti. Se il comitato della categoria esiste allora tutti i termini
della nuova domanda si aggiungono agli esperti di quel comitato;
in caso contrario si costruisce un nuovo comitato.
Fase di Training
giovedì 15 luglio 2010
È stato usato un test set composto da 500 domande,
appartenenti, ovviamente, alle medesime categorie della fase di
training.
Ogni domanda viene sottoposta a tutti i comitati: il responso
dell’algoritmo per ogni domanda può essere:
Domanda classificata in una delle sei categorie.
Domanda non classificata.
Fase di Test
giovedì 15 luglio 2010
Veri positivi, falsi positivi, falsi negativi, veri negativi.
Error rate: (FP + FN) / n
Accuracy: 1 - Error Rate
Precision: VP / ( VP + FP )
Recall: VP / ( VP + FN )
Break-Even: (Precision + Recall) / 2
F1-Measure: 2 (Precision * Recall) / (Precision + Recall)
Nella fase di training: per ogni domanda, per ogni categoria.
Nella fase di test: globalmente.
Misure raccolte
giovedì 15 luglio 2010
È stato notato che l’algoritmo da risposte migliori moltiplicando
la soglia per un coefficiente pari a 0.01. Probabilmente la
soglia potrebbe essere ulteriormente raffinata, ma c’è il rischio
concreto di cadere in overfitting.
Winnow semplice: 244 istanze classificate correttamente, 65
classificate non correttamente, 191 non classificate.
Stemmer: sia il Porter Stemmer che lo stemmer di Wordnet
sono stati inseriti nei diversi esperimenti, ma non hanno
contribuito in maniera significativa.
Bi-words: oltre ai termini singoli sono state raccolte anche le
coppie di termini. Le istanze classificate correttamente salgono
a 274 (179 non classificate).
Tri-words: triple di termini. Risultati scarsi (208 istanze
classificate correttamente).
Bi-words e Tri-words: sia coppie che triple di termini. Risultati
analoghi al solo uso di tri-words.
Esperimenti 1/2
giovedì 15 luglio 2010
Uso del Tf-Idf per gli esperti: più un esperto ha un peso alto
per molte categorie e meno è rilevante. L’algoritmo di Winnow
non ne trae giovamento in quanto, dopo la fase di training, ha
già attribuito dei pesi corretti per gli esperti.
Wordnet Sense (più bi-words): grazie a Wordnet è stato
provato a sostituire ogni termine con il nome del suo Synset
(“Noun”, “Verb”, “Adjective”, “Adverb”). I risultati sono
migliorati(280 classificazioni corrette), ma è difficile scegliere
correttamente il Synset giusto, poiché un termine potrebbe
averne molteplici. Ad esempio: “Mouse” è “noun.animal” o
“noun.artifact”?
Wordnet iperonimi (più bi-words): in questo esperimento ogni
termine è stato sostituito con una sua iperonimia. Ad esempio il
termine “Rome” viene sostituito con “City”. I risultati sono
analoghi all’esperimento dei Synset (281 istanze classificate
correttamente). Anche qui c’è il problema di saper distinguere
correttamente iperonimi multipli.
Esperimenti 2/2
giovedì 15 luglio 2010
Osservando i risultati della fase di Test si evince che la
difficoltà più grande è quella di classificare correttamente la
classe DESCRIPTION. In particolare:
Molte domande appartenenti a questa categoria non
riescono ad essere classificate, in quanto il proprio comitato
non le riconosce (non fornisce parere positivo).
M olte altre do man de (sempre appartenenti a
DESCRIPTION) vengono scambiate per appartenenti alla
classe ENTITY.
Considerazioni
giovedì 15 luglio 2010
Misurazioni
Notare come le difficoltà più grandi si riscontrano nella classe
DESCRIPTION e, in misura minore, nella classe ENTITY.
La matrice di confusione riporta dei risultati positivi, perché
ovviamente fa riferimento alle sole istanze classificate: questo ci da la
conferma che molte istanze di DESCRIPTION non vengono riconosciute
dal proprio comitato.
giovedì 15 luglio 2010
L’incremento maggiore di istanze classificate correttamente è
stato ottenuto grazie all’introduzione delle Bi-words.
Alcune categorie in particolare ne hanno beneficiato:
ABBREVIATION: grazie alla Bi-word “stands-for”
NUMBER: grazie alle Bi-word “how-much” e “how-many”
L’introduzione di Wordnet non ha portato invece ad un
incremento significativo di istanze classificate correttamente, a
causa dell’impossibilità (allo stato attuale dello studio) di
disambiguare i termini in maniera efficiente.
Riuscire a distinguere la classe DESCRIPTION da quella
ENTITY è spesso difficile anche per un essere umano!!
Ogni esperimento è riuscito a migliorare solamente il
riconoscimento di categorie che già venivano riconosciute
sufficientemente bene.
Conclusioni
giovedì 15 luglio 2010

More Related Content

Recently uploaded

Presentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticaPresentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticanico07fusco
 
Tosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxTosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxlorenzodemidio01
 
TeccarelliLorenzo-i4stilidellapitturaromana.docx
TeccarelliLorenzo-i4stilidellapitturaromana.docxTeccarelliLorenzo-i4stilidellapitturaromana.docx
TeccarelliLorenzo-i4stilidellapitturaromana.docxteccarellilorenzo
 
Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.camillaorlando17
 
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptxProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptxlorenzodemidio01
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxlorenzodemidio01
 
Storia-CarloMagno-TeccarelliLorenzo.pptx
Storia-CarloMagno-TeccarelliLorenzo.pptxStoria-CarloMagno-TeccarelliLorenzo.pptx
Storia-CarloMagno-TeccarelliLorenzo.pptxteccarellilorenzo
 
TeccarelliLorenzo-PrimadiSteveJobselasuaconcorrenza.pptx
TeccarelliLorenzo-PrimadiSteveJobselasuaconcorrenza.pptxTeccarelliLorenzo-PrimadiSteveJobselasuaconcorrenza.pptx
TeccarelliLorenzo-PrimadiSteveJobselasuaconcorrenza.pptxteccarellilorenzo
 
Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................giorgiadeascaniis59
 
Una breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opereUna breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opereMarco Chizzali
 
TeccarelliLorenzo-Mitodella.cavernaa.pdf
TeccarelliLorenzo-Mitodella.cavernaa.pdfTeccarelliLorenzo-Mitodella.cavernaa.pdf
TeccarelliLorenzo-Mitodella.cavernaa.pdfteccarellilorenzo
 
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024IISGiovanniVallePado
 
LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................giorgiadeascaniis59
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....giorgiadeascaniis59
 
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...Nguyen Thanh Tu Collection
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxlorenzodemidio01
 
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxAdducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxsasaselvatico
 

Recently uploaded (17)

Presentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informaticaPresentazione tre geni della tecnologia informatica
Presentazione tre geni della tecnologia informatica
 
Tosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptxTosone Christian_Steve Jobsaaaaaaaa.pptx
Tosone Christian_Steve Jobsaaaaaaaa.pptx
 
TeccarelliLorenzo-i4stilidellapitturaromana.docx
TeccarelliLorenzo-i4stilidellapitturaromana.docxTeccarelliLorenzo-i4stilidellapitturaromana.docx
TeccarelliLorenzo-i4stilidellapitturaromana.docx
 
Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.Vuoi girare il mondo? educazione civica.
Vuoi girare il mondo? educazione civica.
 
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptxProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
ProgettoDiEducazioneCivicaDefinitivo_Christian Tosone.pptx
 
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptxNicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
Nicola pisano aaaaaaaaaaaaaaaaaa(1).pptx
 
Storia-CarloMagno-TeccarelliLorenzo.pptx
Storia-CarloMagno-TeccarelliLorenzo.pptxStoria-CarloMagno-TeccarelliLorenzo.pptx
Storia-CarloMagno-TeccarelliLorenzo.pptx
 
TeccarelliLorenzo-PrimadiSteveJobselasuaconcorrenza.pptx
TeccarelliLorenzo-PrimadiSteveJobselasuaconcorrenza.pptxTeccarelliLorenzo-PrimadiSteveJobselasuaconcorrenza.pptx
TeccarelliLorenzo-PrimadiSteveJobselasuaconcorrenza.pptx
 
Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................Oppressi_oppressori.pptx................
Oppressi_oppressori.pptx................
 
Una breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opereUna breve introduzione ad Elsa Morante, vita e opere
Una breve introduzione ad Elsa Morante, vita e opere
 
TeccarelliLorenzo-Mitodella.cavernaa.pdf
TeccarelliLorenzo-Mitodella.cavernaa.pdfTeccarelliLorenzo-Mitodella.cavernaa.pdf
TeccarelliLorenzo-Mitodella.cavernaa.pdf
 
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
Esame di Stato 2024 - Materiale conferenza online 09 aprile 2024
 
LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................LE ALGHE.pptx ..........................
LE ALGHE.pptx ..........................
 
case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....case passive_GiorgiaDeAscaniis.pptx.....
case passive_GiorgiaDeAscaniis.pptx.....
 
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
CHIẾN THẮNG KÌ THI TUYỂN SINH VÀO LỚP 10 THPT MÔN NGỮ VĂN - PHAN THẾ HOÀI (36...
 
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptxScienza Potere Puntoaaaaaaaaaaaaaaa.pptx
Scienza Potere Puntoaaaaaaaaaaaaaaa.pptx
 
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptxAdducchio.Samuel-Steve_Jobs.ppppppppppptx
Adducchio.Samuel-Steve_Jobs.ppppppppppptx
 

Featured

Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTExpeed Software
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsPixeldarts
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 

Featured (20)

Everything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPTEverything You Need To Know About ChatGPT
Everything You Need To Know About ChatGPT
 
Product Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage EngineeringsProduct Design Trends in 2024 | Teenage Engineerings
Product Design Trends in 2024 | Teenage Engineerings
 
How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 

Sistemi intelligenti per internet

  • 1. Studio, implementazione e sperimentazione di un algoritmo di classificazione delle domande basato sull’algoritmo di Winnow Marco Giannone & Marco Bontempi AA 2009/2010 Sistemi Intelligenti per Internet giovedì 15 luglio 2010
  • 2. Algoritmo di Winnow Algoritmo on-line di comitato. In questo studio viene applicato alla Q.A. Un insieme di “esperti” (classificatori), ai quali è associato un peso, vengono interpellati all’arrivo dell’oggetto da classificare. Ogni “esperto” classifica l’oggetto (ovvero assume valore 1 o 0). La somma dei pareri degli esperti (moltiplicati per il peso dell’esperto stesso) viene confrontata con una soglia (in genere N = numero degli esperti). Se questa somma supera la soglia si ha un parere positivo, altrimenti negativo. In caso di predizione corretta non viene modificato il peso degli esperti. In caso di predizione errata si modifica il peso degli esperti che hanno dato parere positivo: se il parere positivo è corretto allora viene raddoppiato il peso, mentre se il parere avrebbe dovuto essere negativo viene dimezzato. giovedì 15 luglio 2010
  • 3. Vengono costruiti tanti comitati quante sono le categorie di domande. Ciascun termine di ogni domanda diventa un “esperto” della propria categoria. Quando si deve classificare una nuova domanda, questa viene sottoposta a tutti i comitati. I risultati che possiamo ottenere sono i seguenti: Nessun comitato ha dato parere positivo: la domanda non viene classificata. Più di un comitato fornisce parere positivo: la domanda non viene classificata. Un solo comitato fornisce parere positivo: la domanda viene ritenuta appartenente alla categoria del comitato. Winnow per la Q.A. giovedì 15 luglio 2010
  • 4. È stato usato un training set composto da 5452 domande e 6 categorie: ENTITY, DESCRIPTION, NUMBER, ABBREVIATION, LOCATION, HUMAN. Se non è stato ancora costituito alcun comitato si prendono tutti i termini della domanda e si costruisce il primo. Se esistono già dei comitati, la domanda viene sottoposta a tutti i comitati esistenti, aggiornando (se necessario) i pesi degli esperti. Se il comitato della categoria esiste allora tutti i termini della nuova domanda si aggiungono agli esperti di quel comitato; in caso contrario si costruisce un nuovo comitato. Fase di Training giovedì 15 luglio 2010
  • 5. È stato usato un test set composto da 500 domande, appartenenti, ovviamente, alle medesime categorie della fase di training. Ogni domanda viene sottoposta a tutti i comitati: il responso dell’algoritmo per ogni domanda può essere: Domanda classificata in una delle sei categorie. Domanda non classificata. Fase di Test giovedì 15 luglio 2010
  • 6. Veri positivi, falsi positivi, falsi negativi, veri negativi. Error rate: (FP + FN) / n Accuracy: 1 - Error Rate Precision: VP / ( VP + FP ) Recall: VP / ( VP + FN ) Break-Even: (Precision + Recall) / 2 F1-Measure: 2 (Precision * Recall) / (Precision + Recall) Nella fase di training: per ogni domanda, per ogni categoria. Nella fase di test: globalmente. Misure raccolte giovedì 15 luglio 2010
  • 7. È stato notato che l’algoritmo da risposte migliori moltiplicando la soglia per un coefficiente pari a 0.01. Probabilmente la soglia potrebbe essere ulteriormente raffinata, ma c’è il rischio concreto di cadere in overfitting. Winnow semplice: 244 istanze classificate correttamente, 65 classificate non correttamente, 191 non classificate. Stemmer: sia il Porter Stemmer che lo stemmer di Wordnet sono stati inseriti nei diversi esperimenti, ma non hanno contribuito in maniera significativa. Bi-words: oltre ai termini singoli sono state raccolte anche le coppie di termini. Le istanze classificate correttamente salgono a 274 (179 non classificate). Tri-words: triple di termini. Risultati scarsi (208 istanze classificate correttamente). Bi-words e Tri-words: sia coppie che triple di termini. Risultati analoghi al solo uso di tri-words. Esperimenti 1/2 giovedì 15 luglio 2010
  • 8. Uso del Tf-Idf per gli esperti: più un esperto ha un peso alto per molte categorie e meno è rilevante. L’algoritmo di Winnow non ne trae giovamento in quanto, dopo la fase di training, ha già attribuito dei pesi corretti per gli esperti. Wordnet Sense (più bi-words): grazie a Wordnet è stato provato a sostituire ogni termine con il nome del suo Synset (“Noun”, “Verb”, “Adjective”, “Adverb”). I risultati sono migliorati(280 classificazioni corrette), ma è difficile scegliere correttamente il Synset giusto, poiché un termine potrebbe averne molteplici. Ad esempio: “Mouse” è “noun.animal” o “noun.artifact”? Wordnet iperonimi (più bi-words): in questo esperimento ogni termine è stato sostituito con una sua iperonimia. Ad esempio il termine “Rome” viene sostituito con “City”. I risultati sono analoghi all’esperimento dei Synset (281 istanze classificate correttamente). Anche qui c’è il problema di saper distinguere correttamente iperonimi multipli. Esperimenti 2/2 giovedì 15 luglio 2010
  • 9. Osservando i risultati della fase di Test si evince che la difficoltà più grande è quella di classificare correttamente la classe DESCRIPTION. In particolare: Molte domande appartenenti a questa categoria non riescono ad essere classificate, in quanto il proprio comitato non le riconosce (non fornisce parere positivo). M olte altre do man de (sempre appartenenti a DESCRIPTION) vengono scambiate per appartenenti alla classe ENTITY. Considerazioni giovedì 15 luglio 2010
  • 10. Misurazioni Notare come le difficoltà più grandi si riscontrano nella classe DESCRIPTION e, in misura minore, nella classe ENTITY. La matrice di confusione riporta dei risultati positivi, perché ovviamente fa riferimento alle sole istanze classificate: questo ci da la conferma che molte istanze di DESCRIPTION non vengono riconosciute dal proprio comitato. giovedì 15 luglio 2010
  • 11. L’incremento maggiore di istanze classificate correttamente è stato ottenuto grazie all’introduzione delle Bi-words. Alcune categorie in particolare ne hanno beneficiato: ABBREVIATION: grazie alla Bi-word “stands-for” NUMBER: grazie alle Bi-word “how-much” e “how-many” L’introduzione di Wordnet non ha portato invece ad un incremento significativo di istanze classificate correttamente, a causa dell’impossibilità (allo stato attuale dello studio) di disambiguare i termini in maniera efficiente. Riuscire a distinguere la classe DESCRIPTION da quella ENTITY è spesso difficile anche per un essere umano!! Ogni esperimento è riuscito a migliorare solamente il riconoscimento di categorie che già venivano riconosciute sufficientemente bene. Conclusioni giovedì 15 luglio 2010