SlideShare a Scribd company logo
1 of 28
Dall’Intelligenza Artificiale al Natural Language Processing Matteo Conci Clara Craffonara Martina Delladio “ Colorless green ideas sleep furiously.” www.pinobruno.it
Talk to ELIZA   I'm unhappy. Do you believe it is normal to be   unhappy? Yes, sometimes, but not always. I am always unhappy. Did you come to me because you are always unhappy? Yes. I want to be happy again. What would it mean to you if you got to be happy again? It would be great. I would live my life with a new motivation. Can you elaborate on that? I would go out with my friends and I maybe find a boyfriend. You don't seem quite certain. My father doesn't believe that I find a boyfriend. I'm not sure I understand you fully.
ELIZA è una macchina o  una persona?
[object Object],[object Object],[object Object],http://www.planet-source-code.com
Test di Turing ,[object Object],[object Object],[object Object],http://en.wikipedia.org/
Natural Language Processing (NLP) ,[object Object],[object Object],[object Object]
Natural Language Understanding  (NLU) ,[object Object],[object Object],[object Object]
Un po’ di Linguistica ,[object Object],[object Object],[object Object],[object Object]
Trasformazione dell’input scritto e orale in una  rappresentazione  macchina interna
Analisi lessicale ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Analisi grammaticale ,[object Object],[object Object],[object Object]
Analisi grammaticale ,[object Object],[object Object],[object Object]
Analisi sintattica ,[object Object],[object Object],“ Colorless green ideas sleep furiously.” ,[object Object],[object Object],[object Object]
Rappresentazioni di strutture sintattiche ,[object Object],[object Object],(S: (NP: (ADJ: Colorless) (ADJ: green) (N: ideas)) (VP: (V: sleep) (ADV: furiously))
SHRDLU ,[object Object],[object Object],[object Object],http://www.uv.es  ,[object Object]
Il correttore ortografico L ’utente inserisce una parola Vindiamo Il software verifica se essa è presente nel  dizionario Il software non segnala errori Il software esegue lo  stemming  ( Vind ) Il software cerca nel dizionario le parole con distanza di Levenshtein minore e le suggerisce all ’ utente Il software verifica se il tema è presente nel  dizionario Si No Si No
Il correttore ortografico La  distanza di Levenshtein  misura il numero di caratteri che devo modificare per trasformare una stringa in un ’altra. Dist. Levenshtein (CANE, PANE) = 1 Dist. Levenshtein (CANE, GATTO) = 4
Limiti e problematiche  dei correttori ortografici ,[object Object],[object Object],[object Object]
La semantica È la branca della linguistica che si occupa di studiare il significato delle frasi. Ad esempio Mangio una  pesca  e una pera  La  pesca  del tonno è in crisi Si riferiscono a due  ambiti semantici  differenti.  Come facciamo a far capire automaticamente il campo semantico ad un PC?
La classificazione semantica delle parole  Ad ogni parola viene associato un certo numero di  etichette  che ne identificano la semantica.  Es: Espresso {Colazione, Treno, Caffè, Pasto, ... } Il software analizza le parole contenute in un documento e cerca l ’area semantica d’appartenenza per intersezione. Colazione Trasporti Treno Ritardo Cappuccino Espresso Brioches
Problemi legati a questo tipo di trattazione È sufficiente un approccio meramente statistico, che non tenga in considerazione la grammatica?  (Es: Dopo una sana ed abbondante colazione ho preso l ’espresso delle 8. Semantica dell’espresso: colazione) È possibile catalogare tutte le parole? Come possiamo trovare una classificazione universale? Ogni termine usato come  “etichetta” è a sua volta classificabile?
L ’utente chiede una pagina al server (www.repubblica.it) Il proxy la carica al suo interno DansGuardian la legge Se al suo interno ci sono troppe parole vietate, la pagina non viene mostrata Se non trova troppe parole sospette, la pagina viene trasmessa all ’utente Il filtro web: DansGuardian
Dimmi chi? e ti rispondo Servizio della Provincia Autonoma di Trento.  Esegue l ’analisi delle domande allo stesso modo di un  chatterbots  e fornisce informazioni sull’anagrafe della pubblica amministrazione trentina (indirizzi, numeri di telefono, orari).  Basta inviare un sms al 338 8888 188 con la domanda e il sistema invia la risposta. Es:  DOMANDA:  “A che ora parte un Bus da Trento per Arco domani?” RISPOSTA: PART Trento (autostaz.)Ore 6.23 ARR Arco (autostaz.) ore: 7.25 Tipo: Bus Extraurbano – INFO TEL 0461 821000
Il web semantico Attraverso dei  formati standard  l ’utente etichetta tutte le informazioni contenute nel suo sito manualmente e crea un’ ONTOLOGIA , ovvero una  serie di regole che leggano queste etichette e le possano tradurre in testo completo , secondo una gramamtica semplice e strutturata. E ’  in questo modo possibile che da frasi come: Giorgio Napolitano, Presidente della Repubblica, vive a Roma Si estraggano informazioni in linguaggio naturale: Giorgio Napolitano  è il  Presidente della Repubblica Il presidente della repubblica  vive a  Roma
Talk to ELIZA asdjas maybe djskal djsakd Can't you be more positive?   no. thfd dfladf dark and negative You are being a bit negative.   dnaskd you djaksdj djaskfjhvd You're not really talking about me, are you? the color of dkas is green That is quite interesting.   I want to be fdskafa again What if you never got to be fdskafa again? all the adhfakdf are dkfsfe What does that suggest to you?
Conclusioni ,[object Object],[object Object],[object Object],[object Object]
Conclusioni ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]
Riferimenti bibliografici ,[object Object],[object Object],[object Object],[object Object],[object Object]

More Related Content

Similar to "Colorless green ideas sleep furiously."

Matdid87687
Matdid87687Matdid87687
Matdid87687imartini
 
Interagire online tra lessico e grammatica
Interagire online tra lessico e grammaticaInteragire online tra lessico e grammatica
Interagire online tra lessico e grammaticaMaruzells zells
 
Strumenti per la riflessione e l’analisi sulla lingua
Strumenti per la riflessione e l’analisi sulla linguaStrumenti per la riflessione e l’analisi sulla lingua
Strumenti per la riflessione e l’analisi sulla linguaMaruzells zells
 
Imparare una lingua straniera
Imparare una lingua stranieraImparare una lingua straniera
Imparare una lingua stranieramariedda
 
Un automa linguistico
Un automa linguisticoUn automa linguistico
Un automa linguisticoStefano Penge
 
Tropi della traduzione traduzione come tropo
Tropi della traduzione traduzione come tropoTropi della traduzione traduzione come tropo
Tropi della traduzione traduzione come tropoRenza Cambini
 
Breve grammatica tedesco 2, Annette Neises
Breve grammatica tedesco  2,  Annette NeisesBreve grammatica tedesco  2,  Annette Neises
Breve grammatica tedesco 2, Annette NeisesCaterina Colombaroni
 
[IT] Leggibilità / Comprensibilità del testo e Motori di Ricerca
[IT] Leggibilità / Comprensibilità del testo e Motori di Ricerca[IT] Leggibilità / Comprensibilità del testo e Motori di Ricerca
[IT] Leggibilità / Comprensibilità del testo e Motori di RicercaFederico Sasso
 
congiuntivo che passione!.pdf
congiuntivo che passione!.pdfcongiuntivo che passione!.pdf
congiuntivo che passione!.pdfMariaLuisaDiBiase
 
La lingua e il contesto extralinguistico
La lingua e il contesto extralinguisticoLa lingua e il contesto extralinguistico
La lingua e il contesto extralinguisticoB.Samu
 
Matdid709463 dislessia
Matdid709463 dislessiaMatdid709463 dislessia
Matdid709463 dislessiaimartini
 
Apprendimento lettoscrittura v
Apprendimento lettoscrittura vApprendimento lettoscrittura v
Apprendimento lettoscrittura vimartini
 
Apprendimento lettoscrittura c
Apprendimento lettoscrittura cApprendimento lettoscrittura c
Apprendimento lettoscrittura cimartini
 
Presentación1 (4)
Presentación1 (4)Presentación1 (4)
Presentación1 (4)Fabio Bravo
 
Informaticaumanistica 2016-5
Informaticaumanistica 2016-5Informaticaumanistica 2016-5
Informaticaumanistica 2016-5Stefano Lariccia
 

Similar to "Colorless green ideas sleep furiously." (20)

8 linguaggio
8 linguaggio8 linguaggio
8 linguaggio
 
Matdid87687
Matdid87687Matdid87687
Matdid87687
 
Interagire online tra lessico e grammatica
Interagire online tra lessico e grammaticaInteragire online tra lessico e grammatica
Interagire online tra lessico e grammatica
 
Strumenti per la riflessione e l’analisi sulla lingua
Strumenti per la riflessione e l’analisi sulla linguaStrumenti per la riflessione e l’analisi sulla lingua
Strumenti per la riflessione e l’analisi sulla lingua
 
Introduzione NLP
Introduzione NLPIntroduzione NLP
Introduzione NLP
 
Imparare una lingua straniera
Imparare una lingua stranieraImparare una lingua straniera
Imparare una lingua straniera
 
Un automa linguistico
Un automa linguisticoUn automa linguistico
Un automa linguistico
 
Tropi della traduzione traduzione come tropo
Tropi della traduzione traduzione come tropoTropi della traduzione traduzione come tropo
Tropi della traduzione traduzione come tropo
 
Breve grammatica tedesco 2, Annette Neises
Breve grammatica tedesco  2,  Annette NeisesBreve grammatica tedesco  2,  Annette Neises
Breve grammatica tedesco 2, Annette Neises
 
[IT] Leggibilità / Comprensibilità del testo e Motori di Ricerca
[IT] Leggibilità / Comprensibilità del testo e Motori di Ricerca[IT] Leggibilità / Comprensibilità del testo e Motori di Ricerca
[IT] Leggibilità / Comprensibilità del testo e Motori di Ricerca
 
congiuntivo che passione!.pdf
congiuntivo che passione!.pdfcongiuntivo che passione!.pdf
congiuntivo che passione!.pdf
 
Comunicazione Verbale e Paraverbale
Comunicazione Verbale e ParaverbaleComunicazione Verbale e Paraverbale
Comunicazione Verbale e Paraverbale
 
La lingua e il contesto extralinguistico
La lingua e il contesto extralinguisticoLa lingua e il contesto extralinguistico
La lingua e il contesto extralinguistico
 
Matdid709463 dislessia
Matdid709463 dislessiaMatdid709463 dislessia
Matdid709463 dislessia
 
Apprendimento lettoscrittura v
Apprendimento lettoscrittura vApprendimento lettoscrittura v
Apprendimento lettoscrittura v
 
Apprendimento lettoscrittura c
Apprendimento lettoscrittura cApprendimento lettoscrittura c
Apprendimento lettoscrittura c
 
Gnosly: leggi => impara
Gnosly: leggi => imparaGnosly: leggi => impara
Gnosly: leggi => impara
 
Comunicazione
ComunicazioneComunicazione
Comunicazione
 
Presentación1 (4)
Presentación1 (4)Presentación1 (4)
Presentación1 (4)
 
Informaticaumanistica 2016-5
Informaticaumanistica 2016-5Informaticaumanistica 2016-5
Informaticaumanistica 2016-5
 

"Colorless green ideas sleep furiously."

  • 1. Dall’Intelligenza Artificiale al Natural Language Processing Matteo Conci Clara Craffonara Martina Delladio “ Colorless green ideas sleep furiously.” www.pinobruno.it
  • 2. Talk to ELIZA I'm unhappy. Do you believe it is normal to be unhappy? Yes, sometimes, but not always. I am always unhappy. Did you come to me because you are always unhappy? Yes. I want to be happy again. What would it mean to you if you got to be happy again? It would be great. I would live my life with a new motivation. Can you elaborate on that? I would go out with my friends and I maybe find a boyfriend. You don't seem quite certain. My father doesn't believe that I find a boyfriend. I'm not sure I understand you fully.
  • 3. ELIZA è una macchina o una persona?
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9. Trasformazione dell’input scritto e orale in una rappresentazione macchina interna
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • 16. Il correttore ortografico L ’utente inserisce una parola Vindiamo Il software verifica se essa è presente nel dizionario Il software non segnala errori Il software esegue lo stemming ( Vind ) Il software cerca nel dizionario le parole con distanza di Levenshtein minore e le suggerisce all ’ utente Il software verifica se il tema è presente nel dizionario Si No Si No
  • 17. Il correttore ortografico La distanza di Levenshtein misura il numero di caratteri che devo modificare per trasformare una stringa in un ’altra. Dist. Levenshtein (CANE, PANE) = 1 Dist. Levenshtein (CANE, GATTO) = 4
  • 18.
  • 19. La semantica È la branca della linguistica che si occupa di studiare il significato delle frasi. Ad esempio Mangio una pesca e una pera La pesca del tonno è in crisi Si riferiscono a due ambiti semantici differenti. Come facciamo a far capire automaticamente il campo semantico ad un PC?
  • 20. La classificazione semantica delle parole Ad ogni parola viene associato un certo numero di etichette che ne identificano la semantica. Es: Espresso {Colazione, Treno, Caffè, Pasto, ... } Il software analizza le parole contenute in un documento e cerca l ’area semantica d’appartenenza per intersezione. Colazione Trasporti Treno Ritardo Cappuccino Espresso Brioches
  • 21. Problemi legati a questo tipo di trattazione È sufficiente un approccio meramente statistico, che non tenga in considerazione la grammatica? (Es: Dopo una sana ed abbondante colazione ho preso l ’espresso delle 8. Semantica dell’espresso: colazione) È possibile catalogare tutte le parole? Come possiamo trovare una classificazione universale? Ogni termine usato come “etichetta” è a sua volta classificabile?
  • 22. L ’utente chiede una pagina al server (www.repubblica.it) Il proxy la carica al suo interno DansGuardian la legge Se al suo interno ci sono troppe parole vietate, la pagina non viene mostrata Se non trova troppe parole sospette, la pagina viene trasmessa all ’utente Il filtro web: DansGuardian
  • 23. Dimmi chi? e ti rispondo Servizio della Provincia Autonoma di Trento. Esegue l ’analisi delle domande allo stesso modo di un chatterbots e fornisce informazioni sull’anagrafe della pubblica amministrazione trentina (indirizzi, numeri di telefono, orari). Basta inviare un sms al 338 8888 188 con la domanda e il sistema invia la risposta. Es: DOMANDA: “A che ora parte un Bus da Trento per Arco domani?” RISPOSTA: PART Trento (autostaz.)Ore 6.23 ARR Arco (autostaz.) ore: 7.25 Tipo: Bus Extraurbano – INFO TEL 0461 821000
  • 24. Il web semantico Attraverso dei formati standard l ’utente etichetta tutte le informazioni contenute nel suo sito manualmente e crea un’ ONTOLOGIA , ovvero una serie di regole che leggano queste etichette e le possano tradurre in testo completo , secondo una gramamtica semplice e strutturata. E ’ in questo modo possibile che da frasi come: Giorgio Napolitano, Presidente della Repubblica, vive a Roma Si estraggano informazioni in linguaggio naturale: Giorgio Napolitano è il Presidente della Repubblica Il presidente della repubblica vive a Roma
  • 25. Talk to ELIZA asdjas maybe djskal djsakd Can't you be more positive? no. thfd dfladf dark and negative You are being a bit negative. dnaskd you djaksdj djaskfjhvd You're not really talking about me, are you? the color of dkas is green That is quite interesting. I want to be fdskafa again What if you never got to be fdskafa again? all the adhfakdf are dkfsfe What does that suggest to you?
  • 26.
  • 27.
  • 28.