Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Presentazione Laurea - Cataldo

2,997 views

Published on

Augmenting Content-Based Recommender Systems with Tags

Published in: Technology, Business

Presentazione Laurea - Cataldo

  1. 1. Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Relatore: Chiar.mo Prof. Giovanni Semeraro Laureando: dott. Marco de Gemmis Cataldo Musto dott. Pasquale Lops Università degli Studi di Bari – Facoltà di Scienze MM.FF.NN. Corso di Laurea Specialistica in Informatica – a.a 2006/2007
  2. 2. Sommario <ul><li>Estensione di un sistema di raccomandazione </li></ul><ul><ul><li>Motivazioni </li></ul></ul><ul><li>Web 2.0 </li></ul><ul><ul><li>Folksonomie </li></ul></ul><ul><li>Implementazione del modello </li></ul><ul><ul><li>Estensione del modello di training </li></ul></ul><ul><ul><li>Integrazione delle folksonomie nei profili utente </li></ul></ul><ul><li>Sperimentazione </li></ul><ul><ul><li>Commenti e sviluppi futuri </li></ul></ul>2/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  3. 3. Sistemi di raccomandazione <ul><li>Obiettivo </li></ul><ul><ul><li>Apprendere i gusti dell’utente in uno specifico dominio e suggerirgli altri “oggetti” cui potrebbe essere interessato </li></ul></ul><ul><li>ITR – Item Recommender </li></ul><ul><ul><li>Realizzato dall’Università di Bari </li></ul></ul><ul><ul><li>Approccio Content-Based </li></ul></ul><ul><ul><ul><li>Accuratezza predittiva soddisfacente </li></ul></ul></ul><ul><ul><ul><li>Eredita alcuni limiti dei modelli content-based </li></ul></ul></ul>3/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  4. 4. Motivazioni <ul><li>Limiti </li></ul><ul><ul><li>In assenza di contenuto testuale, il sistema non può fornire raccomandazioni </li></ul></ul><ul><ul><li>Contenuto testuale di cattiva qualità può portare a un peggioramento dell’accuratezza predittiva </li></ul></ul><ul><ul><li>Raccomandazioni simili a contenuti precedentemente graditi dall’utente </li></ul></ul><ul><ul><ul><li>Bassa probabilità di ottenere raccomandazioni “sorprendenti” </li></ul></ul></ul><ul><li>Necessità di migliorare il modello originario del sistema di raccomandazione </li></ul><ul><ul><li>Eliminazione dei limiti del modello content-based </li></ul></ul><ul><ul><li>Integrazione di elementi di innovatività </li></ul></ul><ul><ul><ul><li>Ricerca di sovrapposizioni con l’area del Web 2.0 </li></ul></ul></ul>4/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  5. 5. Annotazione dei contenuti della Rete <ul><li>Web 2.0 </li></ul><ul><ul><li>Sistemi di Tagging Collaborativo </li></ul></ul><ul><li>Concetto chiave: Tagging </li></ul><ul><ul><li>L’utente fruisce contenuti (foto, video, audio, testi, ecc.) </li></ul></ul><ul><ul><li>Associa a queste risorse delle parole chiave, dette tag </li></ul></ul><ul><ul><li>Tag </li></ul></ul><ul><ul><ul><li>Vocabolario libero </li></ul></ul></ul><ul><ul><ul><li>Informazione sul contenuto, sul contesto o percezione soggettiva </li></ul></ul></ul><ul><ul><li>La stessa risorsa può essere annotata da vari utenti </li></ul></ul><ul><ul><ul><li>Al crescere degli utenti, cresce anche il numero dei tag associati ad una risorsa </li></ul></ul></ul>5/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  6. 6. Folksonomie (1) <ul><li>L’insieme dei tag associati ad una risorsa prende il nome di folksonomia </li></ul><ul><ul><li>La folksonomia è una struttura lessicale </li></ul></ul><ul><ul><li>Emerge dalle annotazioni collaborative degli utenti </li></ul></ul><ul><li>es) Immaginiamo come risorsa un brano musicale </li></ul>6/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  7. 7. Folksonomie (2) <ul><li>Punti di forza </li></ul><ul><ul><li>Ci fornisce informazioni sul modello mentale degli utenti </li></ul></ul><ul><ul><ul><li>Cosa gli utenti “vedono” in ciò che fruiscono </li></ul></ul></ul><ul><ul><li>Associa una semantica ai contenuti della Rete </li></ul></ul><ul><ul><ul><li>Semantica collaborativa, non espressa formalmente </li></ul></ul></ul><ul><li>Una folksonomia ci permette di acquisire delle informazioni sul contenuto associato ad una risorsa </li></ul><ul><li>Riflessione </li></ul><ul><ul><li>La correlazione tra tag e contenuto associato ad una risorsa ci riporta alle motivazioni che avevano giustificato la necessità di estendere il modello </li></ul></ul>7/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  8. 8. Estensione del modello di ITR <ul><li>Assunzione </li></ul><ul><ul><li>I tag non sono dei semplici metadati, forniscono informazioni sul contenuto </li></ul></ul><ul><li>Intuizione </li></ul><ul><ul><li>Quando il contenuto non è disponibile o non è affidabile, si può sfruttare l’informazione lessicale fornita dai tag </li></ul></ul><ul><li>Vantaggi </li></ul><ul><ul><ul><li>Ci permette di ovviare al problema dell’assenza di contenuti testuali </li></ul></ul></ul><ul><ul><ul><ul><li>Si utilizzano i tag forniti dalla comunità come “contenuto” che descriva gli oggetti raccomandabili </li></ul></ul></ul></ul><ul><ul><ul><li>Riduce il “peso” di contenuti testuali di cattiva qualità </li></ul></ul></ul><ul><ul><ul><ul><li>Probabile miglioramento dell’accuratezza predittiva </li></ul></ul></ul></ul><ul><ul><ul><li>Diversifica potenzialmente le raccomandazioni </li></ul></ul></ul><ul><ul><ul><ul><li>Il set di termini che descrivono l’oggetto è dinamico, si evolve assieme alle annotazioni fornite dagli utenti </li></ul></ul></ul></ul>8/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  9. 9. Scenario <ul><li>Raccomandazione di beni museali </li></ul><ul><ul><li>Pinacoteca Vaticana </li></ul></ul><ul><ul><li>Oggetti descritti da contenuto testuale </li></ul></ul><ul><ul><ul><li>Titolo, Autore, Descrizione </li></ul></ul></ul><ul><ul><ul><li>Necessità di raccogliere un set di tag che modelli le opere </li></ul></ul></ul><ul><li>Come raccogliere una massa sufficiente di tag? </li></ul><ul><ul><li>Integrando dei meccanismi di collaboratività nel modello di raccomandazione </li></ul></ul><ul><ul><ul><li>Coinvolgendo gli utenti nell’annotazione degli oggetti </li></ul></ul></ul><ul><ul><ul><li>Estensione del modello di addestramento </li></ul></ul></ul>9/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  10. 10. Modello di addestramento Si è previsto che l’utente, assieme al voto, potesse assegnare dei tag descrittivi 10/16 Assegnazione del rating – Classico modello di addestramento Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto Contenuti testuali
  11. 11. Disambiguazione dei contenuti <ul><li>Terminata la procedura di addestramento, abbiamo a disposizione l’insieme dei tag con cui l’utente ha annotato le opere gradite </li></ul><ul><li>Per eliminare problemi di sinonimia, polisemia, ecc. il set dei tag è stato sottoposto ad una procedura di disambiguazione </li></ul><ul><ul><li>Passaggio dal Tag al concetto espresso da quel tag </li></ul></ul><ul><ul><li>Passaggio da Folksonomie a Folksonomie Semantiche </li></ul></ul>11/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  12. 12. Integrazione delle folksonomie <ul><li>Come integrare nei profili l’informazione aggiuntiva ? </li></ul><ul><ul><li>Individuazione di due modelli di profilazione </li></ul></ul><ul><ul><ul><li>Personal Tags </li></ul></ul></ul><ul><ul><ul><ul><li>Confluiscono nel profilo dell’utente 1 i tag virgin, crowning, christ </li></ul></ul></ul></ul><ul><ul><ul><li>Social Tags </li></ul></ul></ul><ul><ul><ul><ul><li>Il profilo viene arricchito dai tag utilizzati dalla comunità , al profilo vengono aggiunti i tag madonna, panel, cross, deposition </li></ul></ul></ul></ul>12/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  13. 13. Integrazione delle folksonomie <ul><li>Intuizione </li></ul><ul><ul><li>Se a due utenti piacciono gli stessi oggetti, per certi versi condividono lo stesso modello mentale </li></ul></ul><ul><ul><li>L’informazione lessicale fornita da utenti con lo stesso modello mentale può essere condivisa collaborativamente </li></ul></ul><ul><ul><li>Si sfrutta il lessico fornito da utenti con gusti simili per arricchire la terminologia contenuta nel proprio profilo </li></ul></ul>13/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  14. 14. Sperimentazione <ul><li>Campione di trenta utenti </li></ul><ul><li>Valutazione del nuovo modello di ITR </li></ul><ul><li>Confronto tra tre classi di profili </li></ul><ul><ul><li>Content-based </li></ul></ul><ul><ul><ul><li>Titolo, Autore, Descrizione dell’opera </li></ul></ul></ul><ul><ul><li>Content + Personal Tags , </li></ul></ul><ul><ul><li>Content + Social Tags </li></ul></ul><ul><li>Metriche adottate : Precision e Recall </li></ul><ul><li>Quesito </li></ul><ul><ul><li>Un modello di raccomandazione content-based può trarre vantaggio dall’integrazione di elementi di collaboratività ? </li></ul></ul>14/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  15. 15. Risultati emersi <ul><li>L’informazione lessicale proveniente dai tag migliora la precision di ITR del 2.5% </li></ul><ul><li>L’approccio basato sui Social Tag, su training set piccoli, migliora la recall di ITR del 13% </li></ul>15/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto +2,5% +13%
  16. 16. Conclusioni <ul><li>L’integrazione in un modello di raccomandazione dell’informazione proveniente da annotazioni collaborative è un fattore in grado di migliorare l’accuratezza predittiva del sistema </li></ul><ul><ul><li>Modello innovativo, mai sperimentato finora </li></ul></ul><ul><ul><li>I primi riscontri hanno sottolineato la bontà dell’approccio presentato </li></ul></ul><ul><ul><li>Modello proposto nell’ambito delle attività del progetto CHAT </li></ul></ul><ul><ul><ul><li>Sviluppo di una piattaforma per la fruizione personalizzata di beni museali </li></ul></ul></ul>16/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

×