A cognitive approach for Modelling and Reasoning on Commonsense Knowledge in...
Intelligenza Artificiale e Chatbot: Limiti Attuali e Sviluppi Futuri
1. Antonio Lieto
University of Turin, Dipartimento di Informatica, Italy
ICAR - CNR, Palermo, Italy
http://www.di.unito.it/~lieto/
Tavola rotonda su Intelligenza Artificiale e Chatbot, Torino, 29 maggio 2017
https://www.llc.unito.it/eventi/tavola-rotonda-su-intelligenza-artificiale-e-chatbot
2. Fiducia e Chatbot
D: In base a cosa gli utenti ripongono o
meno fiducia nei (chat)bot?
R: Per aumentare la fiducia degli utenti nei i chatbot deve
migliorare la capacità di interazione di questi ultimi (su
modelli articolati del mondo e non su problemi giocattolo).
2
3. - Cosa non possono (ancora) fare i chatbot
- Come potrebbero essere progettati per
fare ciò che non sono in grado di fare
3
Il mio intervento:
4. Di cosa c’è bisogno per far comprendere ad un
sistema artificiale una frase?
Cosa succede quando gli esseri umani sentono una
frase del tipo:
“Giovanni ha colpito Ada”
4
5. Di cosa c’è bisogno per far comprendere ad un
sistema artificiale una frase?
Cosa succede quando gli esseri umani sentono una
frase del tipo:
“Giovanni ha colpito Ada”
5
abuso coniugale
6. Di cosa c’è bisogno per far comprendere ad un
sistema artificiale una frase?
Cosa succede quando gli esseri umani sentono una
frase del tipo:
“Giovanni ha colpito Ada”
6
abuso coniugale
punizione paterna
7. Di cosa c’è bisogno per far comprendere ad un
sistema artificiale una frase?
Cosa succede quando gli esseri umani sentono una
frase del tipo:
“Giovanni ha colpito Ada”
7
abuso coniugale
punizione paterna
atto ingiustificato
8. Di cosa c’è bisogno per far comprendere ad un
sistema artificiale una frase?
Cosa succede quando gli esseri umani sentono una
frase del tipo:
“Giovanni ha colpito Ada”
8
abuso coniugale
punizione paterna
atto ingiustificato
…
9. Contesti e Modelli
Le frasi non significano granché al di fuori di un contesto.
Tuttavia, due cose sono vere:
1. Noi non abbiamo mai un contesto completo (gli esseri
umani fanno inferenze e utilizzo una serie di euristiche per
cercare di fare il meglio che possono con le poche
informazioni disponibili).
2. i sistemi artificiali, per poter fare la stessa cosa
dovrebbero avere ciò che gli esseri umani hanno: un modello
del mondo.
9
10. Contesti e Modelli
Le frasi non significano granché al di fuori di un contesto.
Tuttavia, due cose sono vere:
1. Noi (esseri umani) non abbiamo mai un contesto completo
(i “comprensori” umani fanno inferenze e utilizzo una serie di
euristiche per cercare di fare il meglio che possono con le
poche informazioni disponibili.
2. i sistemi artificiali, per poter fare la stessa cosa dovrebbero
avere ciò che gli esseri umani hanno: un modello del mondo.
• Tutti i programmi di IA utilizzati oggi non hanno un
modello generale e complesso del mondo (esistono
modellizzazioni ad hoc e domain specific). 10
11. Contesti e Modelli
Uno dei principali metodi utilizzati al momento per rispondere a domande
(o sostenere una conversazione) è basato sul keyword matching.
Ad esempio, potrei sostenere una conversazione con una persona
chiedendo:
Cosa pensi che accadrà se continuiamo ad avere elezioni dove alla
maggior parte degli elettori non piace nessuno dei candidati?
Nessun sistema attuale di AI saprebbe rispondere/intrattenere una
conversazione (una persona, di norma, si. Le persone sanno fare
predizioni sugli outcome di azioni).
Se si prova a fare questa conversazione su un chatbot o con un personal
assistant (Siri), quello che otteniamo è una lista di articoli di giornali
dove abbiamo un keyword matching con alcune delle nostre parole. 11
12. Mancanza di Senso Comune
Ancora…se dicessi ad un chatbot:
“Un mio amico ha appena ordinato una pizza”
Un chatbot che non ha un modello complesso/uno
script di quella situazione non sarà in grado di
“capire” (e quindi di tenere delle conversazioni
sensate) che a breve si mangerà (mangiare non è
menzionato nell’ input), non saprà se si
utilizzeranno le posate ecc.
12
14. (Alcuni) Approcci di IA
Modello
Ontologie
Modelli simbolici/basati su logica
Modello esplicito del mondo
Costruzione manuale del modello
IA ClassicaNuova IA
15. Alcuni Approcci di IA
Modello
Ontologie
Modelli simbolici/basati su logica
Modello esplicito del mondo
Costruzione manuale del modello
Deep Learning
Reti Neurali
Modello distribuito
Opacità della modello prodotto
IA ClassicaNuova IA
16. Alcuni Approcci di IA
Modello
Ontologie
Modelli simbolici/basati su logica
Modello esplicito del mondo
Costruzione manuale del modello
Deep Learning
Reti Neurali
Modello distribuito
Opacità della modello prodotto
IA ClassicaNuova IA
Metodi statistici
Es. usati da IBM Watson
17. Modelli e Approcci
Le persone costruiscono dei modelli articolati relativi al mondo con cui
interagiscono. E sono in grado di esplorare tali modelli per spiegare il proprio
comportamento/ragionamento ecc.
le IA attuali non costruiscono modelli articolati del mondo, quindi non sono in grado
di rispondere a domande arbitrarie (del tipo “quello che sto dicendo ha un
senso?” o di fornire suggerimenti in situazioni del tipo; “Sto pensando di cambiare
casa. Ma mi domando cosa accadrà alle relazioni con gli amici di sempre…”)
una IA in grado di conversare richiede una modellazione del mondo che ci permetta
di comprendere le azioni delle persone, i loro intenti, le loro credenze e molto di
più. Fare keyword matching non è IA!
• Le tecniche di deep learning possono fornire un modello “ispezionabile”?
• Come si possono collegare approcci “nuovi” e “vecchi” ?
• Questo tipo di situazione ricorda il vecchio dibattito tra “cognitivisti” ed
“emergentisti” nell’ambito dei cosiddetto approccio cognitivo all’AI
17
19. Type 1/Type 2 features
19
Cognitivism Nouvelle AI
Focus on high level cognitive functions Main focus only on perception
Assuming structured representations
(physical symbol system, Simon and
Newell, 1976)
Assuming unstructured representation
(e.g. such as neural networks etc.) and
also integration with symbolic
approaches.
Architectural Perspective (integration
and interaction of all cognitive functions
System perspective (not necessary to
consider a whole architectural
perspective).
Inspiration from human cognition
(heuristic-driven approach)
Bio-inspired computing, bottom-up
approach (for learning etc.).
20. Modelli della cognizione
Entrambi gli approcci possono permettere, in linea di
principio, la realizzazione di sistemi cognitivi artificiali.
20
Cognitive Function
(NL Understanding)
Cognitive Processes Neural Structures
Sintax
Morphology
Lexical
Processing…
Bio-Physical Plausibility
of the Processes
Cognitive Plausibility
of the Processes
Cognitivism Emergent AI
21. Nel caso dei chatbot
Potrebbe essere utile provare a realizzare sistemi che si focalizzano su
modelli cognitivi di alto livello legati al:
• dialogo
• argomentazione (es. tecnologie persuasive)
• aspetti inferenziali di senso comune che entrano in gioco
nell’interpretazione del linguaggio naturale
Il focus su aspetti neurali per problemi legati alla conoscenza e al suo
utilizzo è in qualche modo irrilevante.
• L’approccio cognitivo ha il vantaggio di fare riferimento a modelli
teorici/sperimentali espliciti che possono fungere da riferimento per la
progettazione i sistemi artificiali (non è l’unica strada percorribile).
• E’ necessario trovare un ponte tra componente neurale/di basso livello e
componente modellistica di alto livello
21