Presentazione Laurea - Cataldo

  • 2,507 views
Uploaded on

Augmenting Content-Based Recommender Systems with Tags

Augmenting Content-Based Recommender Systems with Tags

More in: Technology , Business
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
No Downloads

Views

Total Views
2,507
On Slideshare
0
From Embeds
0
Number of Embeds
7

Actions

Shares
Downloads
11
Comments
2
Likes
1

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Relatore: Chiar.mo Prof. Giovanni Semeraro Laureando: dott. Marco de Gemmis Cataldo Musto dott. Pasquale Lops Università degli Studi di Bari – Facoltà di Scienze MM.FF.NN. Corso di Laurea Specialistica in Informatica – a.a 2006/2007
  • 2. Sommario
    • Estensione di un sistema di raccomandazione
      • Motivazioni
    • Web 2.0
      • Folksonomie
    • Implementazione del modello
      • Estensione del modello di training
      • Integrazione delle folksonomie nei profili utente
    • Sperimentazione
      • Commenti e sviluppi futuri
    2/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 3. Sistemi di raccomandazione
    • Obiettivo
      • Apprendere i gusti dell’utente in uno specifico dominio e suggerirgli altri “oggetti” cui potrebbe essere interessato
    • ITR – Item Recommender
      • Realizzato dall’Università di Bari
      • Approccio Content-Based
        • Accuratezza predittiva soddisfacente
        • Eredita alcuni limiti dei modelli content-based
    3/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 4. Motivazioni
    • Limiti
      • In assenza di contenuto testuale, il sistema non può fornire raccomandazioni
      • Contenuto testuale di cattiva qualità può portare a un peggioramento dell’accuratezza predittiva
      • Raccomandazioni simili a contenuti precedentemente graditi dall’utente
        • Bassa probabilità di ottenere raccomandazioni “sorprendenti”
    • Necessità di migliorare il modello originario del sistema di raccomandazione
      • Eliminazione dei limiti del modello content-based
      • Integrazione di elementi di innovatività
        • Ricerca di sovrapposizioni con l’area del Web 2.0
    4/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 5. Annotazione dei contenuti della Rete
    • Web 2.0
      • Sistemi di Tagging Collaborativo
    • Concetto chiave: Tagging
      • L’utente fruisce contenuti (foto, video, audio, testi, ecc.)
      • Associa a queste risorse delle parole chiave, dette tag
      • Tag
        • Vocabolario libero
        • Informazione sul contenuto, sul contesto o percezione soggettiva
      • La stessa risorsa può essere annotata da vari utenti
        • Al crescere degli utenti, cresce anche il numero dei tag associati ad una risorsa
    5/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 6. Folksonomie (1)
    • L’insieme dei tag associati ad una risorsa prende il nome di folksonomia
      • La folksonomia è una struttura lessicale
      • Emerge dalle annotazioni collaborative degli utenti
    • es) Immaginiamo come risorsa un brano musicale
    6/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 7. Folksonomie (2)
    • Punti di forza
      • Ci fornisce informazioni sul modello mentale degli utenti
        • Cosa gli utenti “vedono” in ciò che fruiscono
      • Associa una semantica ai contenuti della Rete
        • Semantica collaborativa, non espressa formalmente
    • Una folksonomia ci permette di acquisire delle informazioni sul contenuto associato ad una risorsa
    • Riflessione
      • La correlazione tra tag e contenuto associato ad una risorsa ci riporta alle motivazioni che avevano giustificato la necessità di estendere il modello
    7/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 8. Estensione del modello di ITR
    • Assunzione
      • I tag non sono dei semplici metadati, forniscono informazioni sul contenuto
    • Intuizione
      • Quando il contenuto non è disponibile o non è affidabile, si può sfruttare l’informazione lessicale fornita dai tag
    • Vantaggi
        • Ci permette di ovviare al problema dell’assenza di contenuti testuali
          • Si utilizzano i tag forniti dalla comunità come “contenuto” che descriva gli oggetti raccomandabili
        • Riduce il “peso” di contenuti testuali di cattiva qualità
          • Probabile miglioramento dell’accuratezza predittiva
        • Diversifica potenzialmente le raccomandazioni
          • Il set di termini che descrivono l’oggetto è dinamico, si evolve assieme alle annotazioni fornite dagli utenti
    8/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 9. Scenario
    • Raccomandazione di beni museali
      • Pinacoteca Vaticana
      • Oggetti descritti da contenuto testuale
        • Titolo, Autore, Descrizione
        • Necessità di raccogliere un set di tag che modelli le opere
    • Come raccogliere una massa sufficiente di tag?
      • Integrando dei meccanismi di collaboratività nel modello di raccomandazione
        • Coinvolgendo gli utenti nell’annotazione degli oggetti
        • Estensione del modello di addestramento
    9/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 10. Modello di addestramento Si è previsto che l’utente, assieme al voto, potesse assegnare dei tag descrittivi 10/16 Assegnazione del rating – Classico modello di addestramento Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto Contenuti testuali
  • 11. Disambiguazione dei contenuti
    • Terminata la procedura di addestramento, abbiamo a disposizione l’insieme dei tag con cui l’utente ha annotato le opere gradite
    • Per eliminare problemi di sinonimia, polisemia, ecc. il set dei tag è stato sottoposto ad una procedura di disambiguazione
      • Passaggio dal Tag al concetto espresso da quel tag
      • Passaggio da Folksonomie a Folksonomie Semantiche
    11/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 12. Integrazione delle folksonomie
    • Come integrare nei profili l’informazione aggiuntiva ?
      • Individuazione di due modelli di profilazione
        • Personal Tags
          • Confluiscono nel profilo dell’utente 1 i tag virgin, crowning, christ
        • Social Tags
          • Il profilo viene arricchito dai tag utilizzati dalla comunità , al profilo vengono aggiunti i tag madonna, panel, cross, deposition
    12/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 13. Integrazione delle folksonomie
    • Intuizione
      • Se a due utenti piacciono gli stessi oggetti, per certi versi condividono lo stesso modello mentale
      • L’informazione lessicale fornita da utenti con lo stesso modello mentale può essere condivisa collaborativamente
      • Si sfrutta il lessico fornito da utenti con gusti simili per arricchire la terminologia contenuta nel proprio profilo
    13/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 14. Sperimentazione
    • Campione di trenta utenti
    • Valutazione del nuovo modello di ITR
    • Confronto tra tre classi di profili
      • Content-based
        • Titolo, Autore, Descrizione dell’opera
      • Content + Personal Tags ,
      • Content + Social Tags
    • Metriche adottate : Precision e Recall
    • Quesito
      • Un modello di raccomandazione content-based può trarre vantaggio dall’integrazione di elementi di collaboratività ?
    14/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
  • 15. Risultati emersi
    • L’informazione lessicale proveniente dai tag migliora la precision di ITR del 2.5%
    • L’approccio basato sui Social Tag, su training set piccoli, migliora la recall di ITR del 13%
    15/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto +2,5% +13%
  • 16. Conclusioni
    • L’integrazione in un modello di raccomandazione dell’informazione proveniente da annotazioni collaborative è un fattore in grado di migliorare l’accuratezza predittiva del sistema
      • Modello innovativo, mai sperimentato finora
      • I primi riscontri hanno sottolineato la bontà dell’approccio presentato
      • Modello proposto nell’ambito delle attività del progetto CHAT
        • Sviluppo di una piattaforma per la fruizione personalizzata di beni museali
    16/16 Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto