Slideshare.net (beta)

 
Post: 
Myspace Hi5 Friendster Xanga LiveJournal Facebook Blogger Tagged Typepad Freewebs BlackPlanet gigya icons



All comments

Add a comment on Slide 1

If you have a SlideShare account, login to comment; else you can comment as a guest


Showing 1-50 of 0 (more)

Presentazione Laurea - Cataldo

From Cataldo, 3 months ago

Augmenting Content-Based Recommender Systems with Tags

303 views  |  0 comments  |  0 favorites  |  0 downloads  |  2 embeds (Stats)
 

Groups/Events

Not added to any group/event

 
 

Privacy InfoNew!

This slideshow is Public

 
Embed in your blog
Embed (wordpress.com)
custom

Slideshow Statistics
Total Views: 303
on Slideshare: 266
from embeds: 37* * Views from embeds since 21 Aug, 07

Slideshow transcript

Slide 1: Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Relatore: Chiar.mo Prof. Giovanni Semeraro Laureando: dott. Marco de Gemmis Cataldo Musto dott. Pasquale Lops Università degli Studi di Bari – Facoltà di Scienze MM.FF.NN. Corso di Laurea Specialistica in Informatica – a.a 2006/2007

Slide 2: Sommario 2/16 Estensione di un sistema di raccomandazione   Motivazioni Web 2.0   Folksonomie Implementazione del modello   Estensione del modello di training  Integrazione delle folksonomie nei profili utente Sperimentazione   Commenti e sviluppi futuri Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 3: Sistemi di raccomandazione 3/16 Obiettivo  Apprendere i gusti dell’utente in uno specifico dominio e  suggerirgli altri “oggetti” cui potrebbe essere interessato ITR – Item Recommender  Realizzato dall’Università di Bari  Approccio Content-Based  Accuratezza predittiva soddisfacente  Eredita alcuni limiti dei modelli content-based  Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 4: Motivazioni 4/16 Limiti  In assenza di contenuto testuale, il sistema non può fornire  raccomandazioni Contenuto testuale di cattiva qualità può portare a un  peggioramento dell’accuratezza predittiva Raccomandazioni simili a contenuti precedentemente graditi  dall’utente Bassa probabilità di ottenere raccomandazioni “sorprendenti”  Necessità di migliorare il modello originario del  sistema di raccomandazione  Eliminazione dei limiti del modello content-based  Integrazione di elementi di innovatività Ricerca di sovrapposizioni con l’area del Web 2.0  Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 5: Annotazione dei contenuti della Rete 5/16 Web 2.0  Sistemi di Tagging Collaborativo  Concetto chiave: Tagging  L’utente fruisce contenuti (foto, video, audio, testi, ecc.)  Associa a queste risorse delle parole chiave, dette tag  Tag  Vocabolario libero  Informazione sul contenuto, sul contesto o percezione soggettiva  La stessa risorsa può essere annotata da vari utenti  Al crescere degli utenti, cresce anche il numero dei tag associati  ad una risorsa Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 6: Folksonomie (1) 6/16 L’insieme dei tag associati ad una risorsa prende il  nome di folksonomia  La folksonomia è una struttura lessicale Emerge dalle annotazioni collaborative degli utenti  es) Immaginiamo come risorsa un brano musicale  Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 7: Folksonomie (2) 7/16 Punti di forza   Ci fornisce informazioni sul modello mentale degli utenti Cosa gli utenti “vedono” in ciò che fruiscono  Associa una semantica ai contenuti della Rete  Semantica collaborativa, non espressa formalmente  Una folksonomia ci permette di acquisire delle informazioni  sul contenuto associato ad una risorsa Riflessione  La correlazione tra tag e contenuto associato ad una  risorsa ci riporta alle motivazioni che avevano giustificato la necessità di estendere il modello Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 8: Estensione del modello di ITR 8/16 Assunzione  I tag non sono dei semplici metadati, forniscono  informazioni sul contenuto Intuizione  Quando il contenuto non è disponibile o non è affidabile, si può  sfruttare l’informazione lessicale fornita dai tag Vantaggi  Ci permette di ovviare al problema dell’assenza di contenuti  testuali Si utilizzano i tag forniti dalla comunità come “contenuto” che descriva gli oggetti  raccomandabili Riduce il “peso” di contenuti testuali di cattiva qualità  Probabile miglioramento dell’accuratezza predittiva  Diversifica potenzialmente le raccomandazioni  Il set di termini che descrivono l’oggetto è dinamico, si evolve assieme alle  annotazioni fornite dagli utenti Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 9: Scenario 9/16 Raccomandazione di beni museali   Pinacoteca Vaticana Oggetti descritti da contenuto testuale   Titolo, Autore, Descrizione  Necessità di raccogliere un set di tag che modelli le opere Come raccogliere una massa sufficiente di tag?   Integrando dei meccanismi di collaboratività nel modello di raccomandazione Coinvolgendo gli utenti nell’annotazione degli oggetti  Estensione del modello di addestramento  Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 10: Modello di addestramento 10/16 Contenuti testuali Assegnazione del rating – Classico modello di addestramento Si è previsto che l’utente, assieme al voto, potesse assegnare dei tag descrittivi Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 11: Disambiguazione dei contenuti 11/16 Terminata la procedura di addestramento,  abbiamo a disposizione l’insieme dei tag con cui l’utente ha annotato le opere gradite Per eliminare problemi di sinonimia,  polisemia, ecc. il set dei tag è stato sottoposto ad una procedura di disambiguazione  Passaggio dal Tag al concetto espresso da quel tag  Passaggio da Folksonomie a Folksonomie Semantiche Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 12: Integrazione delle folksonomie 12/16 Come integrare nei profili l’informazione aggiuntiva ?  Individuazione di due modelli di profilazione  Personal Tags  Confluiscono nel profilo dell’utente 1 i tag virgin, crowning, christ  Social Tags  Il profilo viene arricchito dai tag utilizzati dalla comunità, al  profilo vengono aggiunti i tag madonna, panel, cross, deposition Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 13: Integrazione delle folksonomie 13/16 Intuizione   Se a due utenti piacciono gli stessi oggetti, per certi versi condividono lo stesso modello mentale  L’informazione lessicale fornita da utenti con lo stesso modello mentale può essere condivisa collaborativamente  Si sfrutta il lessico fornito da utenti con gusti simili per arricchire la terminologia contenuta nel proprio profilo Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 14: Sperimentazione 14/16 Campione di trenta utenti  Valutazione del nuovo modello di ITR  Confronto tra tre classi di profili  Content-based  Titolo, Autore, Descrizione dell’opera  Content + Personal Tags,  Content + Social Tags  Metriche adottate: Precision e Recall  Quesito  Un modello di raccomandazione content-based può  trarre vantaggio dall’integrazione di elementi di collaboratività ? Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 15: Risultati emersi 15/16 L’informazione lessicale proveniente dai tag migliora  la precision di ITR del 2.5% L’approccio basato sui Social Tag, su training set  piccoli, migliora la recall di ITR del 13% +13% +2,5% Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto

Slide 16: Conclusioni 16/16 L’integrazione in un modello di  raccomandazione dell’informazione proveniente da annotazioni collaborative è un fattore in grado di migliorare l’accuratezza predittiva del sistema Modello innovativo, mai sperimentato finora  I primi riscontri hanno sottolineato la bontà dell’approccio  presentato Modello proposto nell’ambito delle attività del progetto  CHAT Sviluppo di una piattaforma per la fruizione personalizzata di  beni museali Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche Corso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto