Tecniche fuzzy per l'elaborazione del linguaggio naturale

Michele Filannino
Università degli Studi di Bari “A.Moro”
Dipartimento di Informatica
Research: http://www.di.uniba.it/~swap/ Working Capital - BarCamp
Twitter: @bronko85
Bari, 13 luglio 2010

Chi sono
Informazioni

• Età: 24 anni;
• Laureato in Informatica e tecnologie per la
produzione del software in meno di 3 anni, cum
laude;
• Laureando magistrale in Informatica;
• Membro del SWAP Research Group (Semantic
Web Access & Personalization);
• Blogger per melablog.it.

2 /15

Motivazioni
Quantità di dati in Internet

155 milioni di siti web
5 milioni di Tb* di dati
Un uomo impiegherebbe 57000 anni per leggerli.
1,8 miliardi di utenti (crescita esponenziale)

* Google ne ha indicizzato solo lo 0,004% ;)
Dati forniti da Eric Shmidt, CEO di Google, durante una conferenza del 2005 | Fonte: SoftPedia 3 /15

“It’s not information overload.
It’s ﬁlter failure”
Clay Shirky (al Web2.0 Expo del 2008)

Information ﬁltering
Motori di ricerca

• non differenziano i risultati in base agli utenti;
• richiedono all’utente una parziale
conoscenza dei documenti cercati;
• offrono risultati errati o banali* poiché non

comprendono il linguaggio naturale.
* L. Iaquinta, M. de Gemmis, P. Lops, G. Semeraro, M. Filannino, and P. Molino. Introducing Serendipity in a Content-based Recommender System. In
F. Xhafa, F. Herrera, A. Abraham, M. Koppen, and J. M. Benitez, editors, Proceedings of the Eighth International Conference on Hybrid Intelligent
Systems HIS-2008 , pages 168-173. IEEE Computer Society Press, Los Alamitos, California, 2008. ISBN 978-0-7695-3326-1. 5 /15

Il presente
Semantica, Web3.0, etc...

• Ontologie -> Logiche descrittive;
• Realizzazione from scratch molto onerosa;

• Utilizzo limitato a domini molto
speciﬁci;
• bassa precisione, risultati poco
pertinenti, complessità computazionale
elevata.

6 /15

“Nella misura in cui le leggi della matematica si riferiscono alla realtà non sono certe.
E nella misura in cui sono certe, non si riferiscono alla realtà.”

Albert Einstein

Idea
!

• Utilizzare logica fuzzy per restituire
risultati più intelligenti.
• Ridimensionare l’uso di algoritmi basati su
logica classica;
• Riﬁutare di formalizzare i meccanismi sottesi al
linguaggio naturale umano;

8 /15

Logica fuzzy
Lotﬁ Zadeh, 1965*

• Logica del ragionamento
approssimato;

• Esprime incertezza;

• Estende la classica teoria
degli insiemi;
• Consente di proﬁlare le
interpretazioni degli utenti.
• Fuzzy-relazioni tra concetti
ontologici
L. A. Zadeh. Fuzzy sets. Information and Control, 8(3):338–353, June 1965
9 /15

Il sistema software
Capacità

• Interpreterà il linguaggio
naturale (italiano ed inglese);

• Eliciterà i concetti

ontologici presenti nel
testo;

• Sarà facilmente integrabile in
sistemi terzi.

10 /15

Funzionamento
Input, output

INPUT OUTPUT

Concetti ontologici
Testo semplice pertinenti (anche nascosti)

Concetti ontologici
Pagina social network signiﬁcativi per il proﬁlo

Concetti ontologici correlati
Pagina web (anche nascosti)

11 /15

Scenario applicativo
Integrazione in un motore di ricerca classico

Query
arricchita

Query Query
Motore di
Utente ricerca

<<
Documenti pertinenti Documenti restituiti
restituiti da un sistema classico
12 /15

Scenario applicativo
Integrazione in un sistema di raccomandazioni

Concetti
pertinenti

Proﬁlo,
Sistema di Posizione
Utente raccomandazioni geograﬁca,
Data

Prodotti/servizi pertinenti
restituiti
13 /15

Progetti
In corso...

• Studio sui concetti di gradualità e vaghezza
nella ingegneria della conoscenza;

• Membro del progetto SWOP (Semantic
Web-service Opened Platform);

• Realizzazione di un algoritmo per il calcolo
della similarità semantica tra frasi (SAWA);

• Sogno di diventare un ricercatore.

14 /15

Grazie per l’attenzione
15 /15

Tecniche fuzzy per l'elaborazione del linguaggio naturale

Recommended

Recommended

More Related Content

Similar to Tecniche fuzzy per l'elaborazione del linguaggio naturale

Similar to Tecniche fuzzy per l'elaborazione del linguaggio naturale (20)

More from Michele Filannino

More from Michele Filannino (11)

Tecniche fuzzy per l'elaborazione del linguaggio naturale

Editor's Notes