Progettazione e sviluppo di interfaccia in Natural Language Generation per la descrizione di ambienti

PROGETTAZIONE E SVILUPPO DI INTERFACCIA
IN NLG PER LA DESCRIZIONE DI AMBIENTI
ANNO ACCADEMICO2018/2019
Relatori:
Prof. Andrea Maurino
Dott. Marco Cremaschi
Candidato:
GiovanniMoglia

Obiettivo
Brevità
Facilità di memorizzazione
Facilità di comprensione
2
Università degli Studi di Milano-Bicocca
Sviluppare un’esperienza interattiva che sfrutti gli studi sulla Natural
Language Generation (NLG) per descrivere in maniera automatica
ambienti simulati
Datala natura audio-vocale dell’esperimento, la descrizione
dell’ambiente deve rispondere ai requisiti di

3
Tematiche trattate
01
02
03
04
Agente conversazionale
Natural Language Generation
Text-based game
Descrizione ambientale

4
Tematiche trattate - 1
01 Agente conversazionale
Gli agenti conversazionalisono software in grado di effettuare
una conversazione(scritta e/o vocale) con un utente,
utilizzandoil linguaggio naturalecon lo scopo di simulare una
comunicazioneil più simile possibile a quellaumana
Questi agenti rappresentanol'implementazionepraticadella
linguisticacomputazionale,generalmenteimpiegatacome
chatbot per la Customer Care o come assistente virtuale su
dispositiviportatili

5
02
03
Fasi della NaturalLanguage Generation
• Aggregazione
• Lessico
• Generazione di espressioni di riferimento
• Sintesi
Natural Language Generation
Natural
Language
Processing
(NLP)
Natural
Language
Understanding
(NLU)
Natural
Language
Generation
(NLG)

6
03
03
Text-based game
I text-based games sono videogiochibasatisul testo, senza
l’ausiliodi grafica vettoriale,poligonaleo di altro tipo.
Esistono numerosi generi videoludiciderivatidai text-based
games, ma il principaleè quellodelle Interactive Fiction, o
Avventure Testuali
Si trattadi programmi informatici che simulanoun ambiente
nel qualei giocatori, usando comandi testualicome «vai nord»
o «raccogli secchio», possono interagire con la storia e
l’ambientestesso del gioco. In seguito si sono evoluti
sfruttando tecnologie di intelligenzaartificiale
Schermatadi giocodi Zork, titoloche haresocelebri le
Avventure testuali.

7
Tematiche trattate – 4a
04 Descrizione ambientale
Suddivisionedegli spazi cognitividi Tversky
1. Spazio del corpo
2. Spazio dell’esperienza
3. Spazio distante
4. Spazio all’orizzonte
Studi sulle fotografie, di Le Yaouane, Saux e Claramunt
• Dal generale al particolare
• Ordine di descrizione da sinistra a destra
• Preminenza di relazionidirezionali come “a destra/sinistra
di” rispetto ad aggettivi di prossimitàcome “vicino/lontano
a” o costrutti topologicicome “sopra/sotto”
Quadri di riferimento di Levinson
• Intrinseco
• Assoluto
• Relativo
Studi sul Blind e Sighted Approach
(rispettivamenteDescrizione Route e Survey),
di Noordzij,Zuidhoek e Postma
1 2
3 4
1 2
4
3

8
Tematiche trattate – 4b
04
03
04
Descrizione ambientale

9
Esempio di descrizione
“Guardando di fronte a te, da sinistra a destra, ci sono il tavolino con due poltrone ai lati e il divano.
Il tavolino con due poltrone ai lati è vicino. Il divano è lontano.
Guardando alla tua destra, da sinistra a destra, ci sono la piccola pianta e la pianticella.
La piccola pianta e la pianticella sono lontani.
Guardando alle tue spalle c’è la TV sopra ad un mobiletto.
La TV sopra ad un mobiletto è a portata di mano.
Guardando alla tua sinistra c’è la libreria doppia.
La libreria doppia è lontano.
Se vai a nord c’è il corridoio tra la sala da pranzo, il giardino e il soggiorno,
a est c’è la zona del giardino con lo stagno, mentre a sud c’è il corridoio del garage”.

10
Studi sulla memoria
Secondo uno studio dell’Università dell’Iowa,il nostro cervello
utilizza percorsi separati per elaborare le informazioni.
In particolare,la nostra memoria uditivaè sensibilmente
peggiore rispetto a quellavisiva e tattile
Secondo Atkinson e Shiffrin, tra gli aspetti chiave della memoria
a breve termine ci sono
• Capacitàlimitata(max 7 elementi memorizzabilialla volta)
• Duratalimitata(circa 15-30 secondi )
Lo stesso Miller sostiene che la maggior parte degli adultipuò
conservare da 5 a 9 elementi nellamemoria a breve termine,
avendoessa soltantoun certo numero di “slot” in cui gli oggetti
possono essere memorizzati: questa idea fu chiamata“numero
magico 7”. Ogni slot però può immagazzinarepiù informazioni
alla volta
5
6
7

Fasi dell’esperimento
01
STEP
02
STEP
03
STEP
04
STEP
11
Progettazione
della mappa
Programmazione Esperienza Analisi

Fasi dell’esperimento - 1
01
STEP
03 04
STEP
12
Progettazione
della mappa
Benchmark

02
STEP
03 04
STEP
13
Programmazione
Benchmark
Sviluppodel programma di generazione delle descrizioni, con linguaggiodi
programmazione Javascriptin Node.js, seguendo le fasi di
NaturalLanguage Generation elencatein precedenza
Realizzazionedell’interfaccia difruizione (user mode), che simula il modelloa intenti
Sviluppodel programma di rilevazionedelle metriche (evaluation mode): i dati
vengono inviati in formato JSON a un Apache HyperText Transfer Protocol (HTTP) server.
In seguito, sviluppo di un programma che converte il JSON in CSV, per poter essere letto
con facilità da programmi come Microsoft Excel

03
STEP
04
STEP
14
Esperienza
Benchmark
TUTORIAL
TEST A + Questionario A: Partendo dall’entrata, il giocatore
deve trovare l’uscita, orientandosi
tra le varie stanze
TEST B + Questionario B: Alla mappa sono state aggiunte 5 chiavi
e le porte dell’entrata e dell’uscita sono
state chiuse. Il giocatore, partendo da una
stanza della mappa, in base alla chiave
trovata, prende l’uscita corrispondente

Fasi dell’esperimento – 4
04
STEP
15
Analisi
Benchmark
Partendo da un campione di 20 tester, sono stati ricavati
Dati empirici, riguardantiil comportamentodurantei test (es. percorsi effettuati, stanze
visitate,errori commessi, tempo impiegato,numero di mosse, ripetizionidelle descrizioni)
Dati di performance, riguardantiacquisizionepassiva di informazioni e
capacitàdi orientamento
Dati qualitativichiedendodirettamenteai tester, riguardo chiarezza, lunghezza,
memorizzazione, difficoltàdi comprensione del testo ed efficacia delle
tecniche di descrizione utilizzate

04
STEP
16
Esempio:
percorso
TEST A

04
STEP
17
Esempio:
percorso
TEST B
(chiave entrata)
ZONA NOTTE
ZONA GIORNO
Esempio:
percorso
TEST B
(chiave uscita)

Conclusioni
18
Benchmark
Buon compromesso: ricchezza di info, memorizzazione, brevità, comprensione
Incrociandoi dati empirici, di performance e qualitativi,non sono state rilevateparticolaridiscordanze
tra dati dei test e opinioniqualitativedei tester
In particolare…
Il testo delle descrizioni è stato giudicato
• Facile da memorizzare,dal 55%
• Breve, dal 62%
• Molto o moltissimochiaro, dal 77%
Le tecniche utilizzateper costruirela descrizione si sono rivelate efficaci, sia empiricamente che in accordo
con le opinionidei tester
• Elencazionedegli oggetti da sinistra a destra e in senso orario
• Introduzionedi tre livellidi profondità (spazi cognitivi di Tversky)
• Utilizzo di un sistema misto di descrizione e approccio blinde sighted
Unica eccezione: elencazionedegli oggetti da sinistra a destra, ALLE SPALLE del tester

19
Gaming
Assistenza per
ipovedenti
Integrazione
Comandi
Vocali
Sviluppi futuri
• Integrazione con sistemi
di Indoor Positioning
• Modificastruttura delle
descrizioni
• Integrazione con assistenti vocali
• Aggiunta di elementi di game design,
come quest, indizi, ostacoli(porte
da aprire, oggetti con cui interagire)…

20
Riferimenti
1. Tversky, B. and Lee, P. U. (1998). How space structures language. In Spatial cognition, pages 157–
175. Springer.
2. Le Yaouanc, J.-M., Saux, É., and Claramunt, C. (2010). A semantic and language-based
representation of an environmental scene. Geoinformatica, 14(3):333–352
3. Levinson, S. C. (1996). Frames of reference and molyneux’s question: Crosslinguistic evidence.
Language and space, 109:169.
4. Noordzij, M. L., Zuidhoek, S., and Postma, A. (2006). The influence of visual experience on the
ability to form spatial mental models based on route and survey descriptions. Cognition,
100(2):321–342.
5. Bigelow, J. and Poremba, A. (2014). Achilles’ ear? inferior human short-term and recognition
memory in the auditory modality. PLOS ONE, 9(2):1–8.
6. Atkinson, R. C. and Shiffrin, R. M. (1971). The control of short-term memory. Scientific American,
225(2):82–91.
7. Miller, G. A. (1994). The magical number seven, plus or minus two: Some limits on our capacity for
processing information. Psychological review, 101(2):343.

Grazie per
l’attenzione!
21

Progettazione e sviluppo di interfaccia in Natural Language Generation per la descrizione di ambienti

Recommended

Recommended

More Related Content

Similar to Progettazione e sviluppo di interfaccia in Natural Language Generation per la descrizione di ambienti

Similar to Progettazione e sviluppo di interfaccia in Natural Language Generation per la descrizione di ambienti (20)

More from Giovanni Moglia

More from Giovanni Moglia (6)

Progettazione e sviluppo di interfaccia in Natural Language Generation per la descrizione di ambienti