SlideShare a Scribd company logo
Michele Filannino
Università degli Studi di Bari “A.Moro”
Dipartimento di Informatica
Research: http://www.di.uniba.it/~swap/   Working Capital - BarCamp
Twitter: @bronko85
                                                 Bari, 13 luglio 2010
Chi sono
Informazioni

    • Età: 24 anni;
    • Laureato in Informatica e tecnologie per la
      produzione del software in meno di 3 anni, cum
      laude;
    • Laureando magistrale in Informatica;
    • Membro del SWAP Research Group (Semantic
      Web Access & Personalization);
    • Blogger per melablog.it.

                                                       2 /15
Motivazioni
Quantità di dati in Internet


      155 milioni di siti web
      5 milioni di Tb* di dati
      Un uomo impiegherebbe 57000                                                 anni per leggerli.
      1,8 miliardi di utenti (crescita esponenziale)

      * Google ne ha indicizzato solo lo 0,004% ;)
Dati forniti da Eric Shmidt, CEO di Google, durante una conferenza del   2005 | Fonte: SoftPedia       3 /15
“It’s not information overload.
                It’s filter failure”
    Clay Shirky (al Web2.0 Expo del 2008)
Information filtering
Motori di ricerca



        • non differenziano i risultati in base agli                                                    utenti;
        • richiedono all’utente una parziale
              conoscenza dei documenti cercati;
        • offrono risultati errati o banali* poiché non

              comprendono il linguaggio                                                  naturale.
* L. Iaquinta, M. de Gemmis, P. Lops, G. Semeraro, M. Filannino, and P. Molino. Introducing Serendipity in a Content-based Recommender System. In
F. Xhafa, F. Herrera, A. Abraham, M. Koppen, and J. M. Benitez, editors, Proceedings of the Eighth International Conference on Hybrid Intelligent
Systems HIS-2008 , pages 168-173. IEEE Computer Society Press, Los Alamitos, California, 2008. ISBN 978-0-7695-3326-1.                            5 /15
Il presente
Semantica, Web3.0, etc...


    • Ontologie -> Logiche descrittive;
    • Realizzazione from scratch molto onerosa;

    • Utilizzo limitato a domini   molto
        specifici;
    •   bassa precisione, risultati poco
        pertinenti, complessità computazionale
        elevata.

                                                  6 /15
“Nella misura in cui le leggi della matematica si riferiscono alla realtà non sono certe.
                         E nella misura in cui sono certe, non si riferiscono alla realtà.”

                                                                         Albert Einstein
Idea
!



    • Utilizzare   logica fuzzy per restituire
      risultati più intelligenti.
    • Ridimensionare l’uso di algoritmi basati su
      logica classica;
    • Rifiutare di formalizzare i meccanismi sottesi al
      linguaggio naturale umano;


                                                         8 /15
Logica fuzzy
Lotfi Zadeh, 1965*

   • Logica del ragionamento
     approssimato;

   • Esprime incertezza;

   • Estende la classica teoria
     degli insiemi;
   • Consente di profilare le
     interpretazioni degli utenti.
   • Fuzzy-relazioni tra concetti
     ontologici
L. A. Zadeh. Fuzzy sets. Information and Control, 8(3):338–353, June 1965
                                                                            9 /15
Il sistema software
Capacità


              •   Interpreterà il linguaggio
                  naturale (italiano ed inglese);

              • Eliciterà i concetti

                  ontologici presenti nel
                  testo;

              • Sarà facilmente integrabile in
                sistemi terzi.

                                                    10 /15
Funzionamento
Input, output



  INPUT                                             OUTPUT


                                    Concetti ontologici
    Testo semplice           pertinenti (anche nascosti)

                                    Concetti ontologici
    Pagina social network       significativi per il profilo

                            Concetti ontologici correlati
    Pagina web                         (anche nascosti)




                                                             11 /15
Scenario applicativo
Integrazione in un motore di ricerca classico




                                                                                Query
                                                                              arricchita

              Query                          Query
                           Motore di
     Utente                 ricerca




                                                <<
                      Documenti pertinenti            Documenti restituiti
                           restituiti                da un sistema classico
                                                                                           12 /15
Scenario applicativo
Integrazione in un sistema di raccomandazioni




                                                           Concetti
                                                           pertinenti

                                                Profilo,
                      Sistema di               Posizione
    Utente         raccomandazioni            geografica,
                                                 Data




                Prodotti/servizi pertinenti
                         restituiti
                                                                        13 /15
Progetti
In corso...



              •   Studio sui concetti di gradualità e vaghezza
                  nella ingegneria della conoscenza;

              •   Membro del progetto SWOP (Semantic
                  Web-service Opened Platform);

              •   Realizzazione di un algoritmo per il calcolo
                  della similarità semantica tra frasi (SAWA);

              •   Sogno di diventare un ricercatore.




                                                                 14 /15
Grazie per l’attenzione
                          15 /15

More Related Content

Similar to Tecniche fuzzy per l'elaborazione del linguaggio naturale

Smart api
Smart apiSmart api
Smart api
Simone Romano
 
Tecnologie semantiche per il knowledge Management
Tecnologie semantiche per il knowledge Management Tecnologie semantiche per il knowledge Management
Tecnologie semantiche per il knowledge Management
Nicola Cerami
 
OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italiana
Giorgia Lodi
 
Curriculum Vitae Morello Orfeo
Curriculum Vitae   Morello OrfeoCurriculum Vitae   Morello Orfeo
Curriculum Vitae Morello Orfeo
Orfeo Morello
 
Silverlight in Action
Silverlight in ActionSilverlight in Action
Silverlight in Action
DotNetMarche
 
OpenAccessGPT
OpenAccessGPTOpenAccessGPT
OpenAccessGPT
Filippo Zanella
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
Istituto nazionale di statistica
 
Semantic Search Engine
Semantic Search EngineSemantic Search Engine
Semantic Search Engine
Valentina Primiceri
 
Presentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_AtroPresentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_Atro
BernadetteCama
 
Presentazione Unibo
Presentazione UniboPresentazione Unibo
Presentazione Unibo
Balint Maschio
 
Open data per inail presentazione Forum PA - maggio 2012
Open data per inail    presentazione Forum PA - maggio 2012Open data per inail    presentazione Forum PA - maggio 2012
Open data per inail presentazione Forum PA - maggio 2012Pietro Monti
 
Focus Group Open Source 22.11.2011 Sebastiano Lomuscio
Focus Group Open Source 22.11.2011 Sebastiano LomuscioFocus Group Open Source 22.11.2011 Sebastiano Lomuscio
Focus Group Open Source 22.11.2011 Sebastiano LomuscioRoberto Galoppini
 
DS4Biz - Data Science for Business
DS4Biz - Data Science for BusinessDS4Biz - Data Science for Business
DS4Biz - Data Science for Business
MeetupDataScienceRoma
 
Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Matteo Busanelli
 
Sistemi per l'elaborazione delle informazioni
Sistemi per l'elaborazione delle informazioniSistemi per l'elaborazione delle informazioni
Sistemi per l'elaborazione delle informazioni
Marco Liverani
 
The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)
Imola Informatica
 
workshop lab cross tec_r2b1
workshop lab cross tec_r2b1workshop lab cross tec_r2b1
workshop lab cross tec_r2b1r2b2011
 
FE@R2B - Workshop Public eProcurement: nuovi scenari e sviluppi
FE@R2B - Workshop Public eProcurement: nuovi scenari e sviluppiFE@R2B - Workshop Public eProcurement: nuovi scenari e sviluppi
FE@R2B - Workshop Public eProcurement: nuovi scenari e sviluppi
EPOCA
 
Ds Tech Business Analytics
Ds Tech Business AnalyticsDs Tech Business Analytics
Ds Tech Business Analytics
recruite
 
Competenze per lo sviluppo software nellera del web
Competenze per lo sviluppo software nellera del webCompetenze per lo sviluppo software nellera del web
Competenze per lo sviluppo software nellera del web
Diego La Monica
 

Similar to Tecniche fuzzy per l'elaborazione del linguaggio naturale (20)

Smart api
Smart apiSmart api
Smart api
 
Tecnologie semantiche per il knowledge Management
Tecnologie semantiche per il knowledge Management Tecnologie semantiche per il knowledge Management
Tecnologie semantiche per il knowledge Management
 
OntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italianaOntoPiA e il knowledge graph della pubblica amministrazione italiana
OntoPiA e il knowledge graph della pubblica amministrazione italiana
 
Curriculum Vitae Morello Orfeo
Curriculum Vitae   Morello OrfeoCurriculum Vitae   Morello Orfeo
Curriculum Vitae Morello Orfeo
 
Silverlight in Action
Silverlight in ActionSilverlight in Action
Silverlight in Action
 
OpenAccessGPT
OpenAccessGPTOpenAccessGPT
OpenAccessGPT
 
14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica14a Conferenza Nazionale di Statistica
14a Conferenza Nazionale di Statistica
 
Semantic Search Engine
Semantic Search EngineSemantic Search Engine
Semantic Search Engine
 
Presentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_AtroPresentazione Cama_Primiceri_Atro
Presentazione Cama_Primiceri_Atro
 
Presentazione Unibo
Presentazione UniboPresentazione Unibo
Presentazione Unibo
 
Open data per inail presentazione Forum PA - maggio 2012
Open data per inail    presentazione Forum PA - maggio 2012Open data per inail    presentazione Forum PA - maggio 2012
Open data per inail presentazione Forum PA - maggio 2012
 
Focus Group Open Source 22.11.2011 Sebastiano Lomuscio
Focus Group Open Source 22.11.2011 Sebastiano LomuscioFocus Group Open Source 22.11.2011 Sebastiano Lomuscio
Focus Group Open Source 22.11.2011 Sebastiano Lomuscio
 
DS4Biz - Data Science for Business
DS4Biz - Data Science for BusinessDS4Biz - Data Science for Business
DS4Biz - Data Science for Business
 
Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)Presentazione piattaforma semantica per gestione della conoscenza (scuole)
Presentazione piattaforma semantica per gestione della conoscenza (scuole)
 
Sistemi per l'elaborazione delle informazioni
Sistemi per l'elaborazione delle informazioniSistemi per l'elaborazione delle informazioni
Sistemi per l'elaborazione delle informazioni
 
The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)The Knowledge Gap (Busanelli - Proscia)
The Knowledge Gap (Busanelli - Proscia)
 
workshop lab cross tec_r2b1
workshop lab cross tec_r2b1workshop lab cross tec_r2b1
workshop lab cross tec_r2b1
 
FE@R2B - Workshop Public eProcurement: nuovi scenari e sviluppi
FE@R2B - Workshop Public eProcurement: nuovi scenari e sviluppiFE@R2B - Workshop Public eProcurement: nuovi scenari e sviluppi
FE@R2B - Workshop Public eProcurement: nuovi scenari e sviluppi
 
Ds Tech Business Analytics
Ds Tech Business AnalyticsDs Tech Business Analytics
Ds Tech Business Analytics
 
Competenze per lo sviluppo software nellera del web
Competenze per lo sviluppo software nellera del webCompetenze per lo sviluppo software nellera del web
Competenze per lo sviluppo software nellera del web
 

More from Michele Filannino

Temporal information extraction in the general and clinical domain
Temporal information extraction in the general and clinical domainTemporal information extraction in the general and clinical domain
Temporal information extraction in the general and clinical domain
Michele Filannino
 
Mining temporal footprints from Wikipedia
Mining temporal footprints from WikipediaMining temporal footprints from Wikipedia
Mining temporal footprints from Wikipedia
Michele Filannino
 
Can computers understand time?
Can computers understand time?Can computers understand time?
Can computers understand time?
Michele Filannino
 
Detecting novel associations in large data sets
Detecting novel associations in large data setsDetecting novel associations in large data sets
Detecting novel associations in large data sets
Michele Filannino
 
Temporal expressions identification in biomedical texts
Temporal expressions identification in biomedical textsTemporal expressions identification in biomedical texts
Temporal expressions identification in biomedical texts
Michele Filannino
 
Sviluppo di un algoritmo di similarità a supporto dell'annotazione semantica ...
Sviluppo di un algoritmo di similarità a supporto dell'annotazione semantica ...Sviluppo di un algoritmo di similarità a supporto dell'annotazione semantica ...
Sviluppo di un algoritmo di similarità a supporto dell'annotazione semantica ...
Michele Filannino
 
Algoritmo di text-similarity per l'annotazione semantica di Web Service
Algoritmo di text-similarity per l'annotazione semantica di Web ServiceAlgoritmo di text-similarity per l'annotazione semantica di Web Service
Algoritmo di text-similarity per l'annotazione semantica di Web Service
Michele Filannino
 
Semantic Web Service Annotation
Semantic Web Service AnnotationSemantic Web Service Annotation
Semantic Web Service AnnotationMichele Filannino
 
Modulo di serendipità in un Item Recommender System
Modulo di serendipità in un Item Recommender SystemModulo di serendipità in un Item Recommender System
Modulo di serendipità in un Item Recommender SystemMichele Filannino
 
Serendipity module in Item Recommender System
Serendipity module in Item Recommender SystemSerendipity module in Item Recommender System
Serendipity module in Item Recommender System
Michele Filannino
 

More from Michele Filannino (11)

me_t3_october
me_t3_octoberme_t3_october
me_t3_october
 
Temporal information extraction in the general and clinical domain
Temporal information extraction in the general and clinical domainTemporal information extraction in the general and clinical domain
Temporal information extraction in the general and clinical domain
 
Mining temporal footprints from Wikipedia
Mining temporal footprints from WikipediaMining temporal footprints from Wikipedia
Mining temporal footprints from Wikipedia
 
Can computers understand time?
Can computers understand time?Can computers understand time?
Can computers understand time?
 
Detecting novel associations in large data sets
Detecting novel associations in large data setsDetecting novel associations in large data sets
Detecting novel associations in large data sets
 
Temporal expressions identification in biomedical texts
Temporal expressions identification in biomedical textsTemporal expressions identification in biomedical texts
Temporal expressions identification in biomedical texts
 
Sviluppo di un algoritmo di similarità a supporto dell'annotazione semantica ...
Sviluppo di un algoritmo di similarità a supporto dell'annotazione semantica ...Sviluppo di un algoritmo di similarità a supporto dell'annotazione semantica ...
Sviluppo di un algoritmo di similarità a supporto dell'annotazione semantica ...
 
Algoritmo di text-similarity per l'annotazione semantica di Web Service
Algoritmo di text-similarity per l'annotazione semantica di Web ServiceAlgoritmo di text-similarity per l'annotazione semantica di Web Service
Algoritmo di text-similarity per l'annotazione semantica di Web Service
 
Semantic Web Service Annotation
Semantic Web Service AnnotationSemantic Web Service Annotation
Semantic Web Service Annotation
 
Modulo di serendipità in un Item Recommender System
Modulo di serendipità in un Item Recommender SystemModulo di serendipità in un Item Recommender System
Modulo di serendipità in un Item Recommender System
 
Serendipity module in Item Recommender System
Serendipity module in Item Recommender SystemSerendipity module in Item Recommender System
Serendipity module in Item Recommender System
 

Tecniche fuzzy per l'elaborazione del linguaggio naturale

  • 1. Michele Filannino Università degli Studi di Bari “A.Moro” Dipartimento di Informatica Research: http://www.di.uniba.it/~swap/ Working Capital - BarCamp Twitter: @bronko85 Bari, 13 luglio 2010
  • 2. Chi sono Informazioni • Età: 24 anni; • Laureato in Informatica e tecnologie per la produzione del software in meno di 3 anni, cum laude; • Laureando magistrale in Informatica; • Membro del SWAP Research Group (Semantic Web Access & Personalization); • Blogger per melablog.it. 2 /15
  • 3. Motivazioni Quantità di dati in Internet 155 milioni di siti web 5 milioni di Tb* di dati Un uomo impiegherebbe 57000 anni per leggerli. 1,8 miliardi di utenti (crescita esponenziale) * Google ne ha indicizzato solo lo 0,004% ;) Dati forniti da Eric Shmidt, CEO di Google, durante una conferenza del 2005 | Fonte: SoftPedia 3 /15
  • 4. “It’s not information overload. It’s filter failure” Clay Shirky (al Web2.0 Expo del 2008)
  • 5. Information filtering Motori di ricerca • non differenziano i risultati in base agli utenti; • richiedono all’utente una parziale conoscenza dei documenti cercati; • offrono risultati errati o banali* poiché non comprendono il linguaggio naturale. * L. Iaquinta, M. de Gemmis, P. Lops, G. Semeraro, M. Filannino, and P. Molino. Introducing Serendipity in a Content-based Recommender System. In F. Xhafa, F. Herrera, A. Abraham, M. Koppen, and J. M. Benitez, editors, Proceedings of the Eighth International Conference on Hybrid Intelligent Systems HIS-2008 , pages 168-173. IEEE Computer Society Press, Los Alamitos, California, 2008. ISBN 978-0-7695-3326-1. 5 /15
  • 6. Il presente Semantica, Web3.0, etc... • Ontologie -> Logiche descrittive; • Realizzazione from scratch molto onerosa; • Utilizzo limitato a domini molto specifici; • bassa precisione, risultati poco pertinenti, complessità computazionale elevata. 6 /15
  • 7. “Nella misura in cui le leggi della matematica si riferiscono alla realtà non sono certe. E nella misura in cui sono certe, non si riferiscono alla realtà.” Albert Einstein
  • 8. Idea ! • Utilizzare logica fuzzy per restituire risultati più intelligenti. • Ridimensionare l’uso di algoritmi basati su logica classica; • Rifiutare di formalizzare i meccanismi sottesi al linguaggio naturale umano; 8 /15
  • 9. Logica fuzzy Lotfi Zadeh, 1965* • Logica del ragionamento approssimato; • Esprime incertezza; • Estende la classica teoria degli insiemi; • Consente di profilare le interpretazioni degli utenti. • Fuzzy-relazioni tra concetti ontologici L. A. Zadeh. Fuzzy sets. Information and Control, 8(3):338–353, June 1965 9 /15
  • 10. Il sistema software Capacità • Interpreterà il linguaggio naturale (italiano ed inglese); • Eliciterà i concetti ontologici presenti nel testo; • Sarà facilmente integrabile in sistemi terzi. 10 /15
  • 11. Funzionamento Input, output INPUT OUTPUT Concetti ontologici Testo semplice pertinenti (anche nascosti) Concetti ontologici Pagina social network significativi per il profilo Concetti ontologici correlati Pagina web (anche nascosti) 11 /15
  • 12. Scenario applicativo Integrazione in un motore di ricerca classico Query arricchita Query Query Motore di Utente ricerca << Documenti pertinenti Documenti restituiti restituiti da un sistema classico 12 /15
  • 13. Scenario applicativo Integrazione in un sistema di raccomandazioni Concetti pertinenti Profilo, Sistema di Posizione Utente raccomandazioni geografica, Data Prodotti/servizi pertinenti restituiti 13 /15
  • 14. Progetti In corso... • Studio sui concetti di gradualità e vaghezza nella ingegneria della conoscenza; • Membro del progetto SWOP (Semantic Web-service Opened Platform); • Realizzazione di un algoritmo per il calcolo della similarità semantica tra frasi (SAWA); • Sogno di diventare un ricercatore. 14 /15

Editor's Notes

  1. Conosco la definizione di un concetto ma non come si chiama. In tal caso Google non mi serve a niente.
  2. Il problema &amp;#xE8; nella teoria degli insiemi classica. La volont&amp;#xE0; tacita di assiomatizzare realt&amp;#xE0; delle quali ancora non conosciamo tutta la complessit&amp;#xE0;.
  3. GEOLOCALIZZAZIONE