• Save
Presentazione Tesi - Cusini Andrea
Upcoming SlideShare
Loading in...5
×
 

Presentazione Tesi - Cusini Andrea

on

  • 1,979 views

TECNICHE PER LA PREVISIONE DELLE VISIONI DI NUOVI CONTENUTI NELLA TELEVISIONE INTERATTIVA

TECNICHE PER LA PREVISIONE DELLE VISIONI DI NUOVI CONTENUTI NELLA TELEVISIONE INTERATTIVA

Statistics

Views

Total Views
1,979
Views on SlideShare
1,974
Embed Views
5

Actions

Likes
0
Downloads
0
Comments
0

2 Embeds 5

http://www.linkedin.com 4
http://www.slideshare.net 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Presentazione Tesi - Cusini Andrea Presentazione Tesi - Cusini Andrea Presentation Transcript

    • Politecnico di Milano
      Polo regionale di Como
      TECNICHE PER LA PREVISIONE DELLE VISIONI DI NUOVI CONTENUTI NELLA TELEVISIONE INTERATTIVA
      Relatore
      Prof. Francesco Fabio Violante
      Candidato:
      Andrea Cusini
      Correlatore
      Ing. Stefano Visconti
      Como, 22 Luglio 2008
    • Sommario
      Contesto
      Obiettivo
      Soluzione proposta
      Applicazione a un caso di studio
      Principali risultati ottenuti
      Conclusioni e Sviluppi futuri
      2
      22/07/2008
    • Contesto
      TV BROADCAST
      TV INTERATTIVA
      Palinsesto
      Triple play
      Unidirezionale
      VOD (Video On Demand)
      PVR (Personal Video Recorder)
      Servizi Avanzati
      L’operatore può conoscere in ogni istante
      cosa fanno e cosa guardano gli utenti.
      L’operatore ha come unico feedback
      l’ auditel.
      3
      22/07/2008
    • Obiettivo
      Fornire agli operatori di TV interattiva uno strumento per prevedere la popolarità di un nuovo contenuto a partire dai suoi metadati.
      Metadati
      Film
      4
      22/07/2008
    • 22/07/2008
      Soluzione Proposta
      5
    • Soluzione proposta
      22/07/2008
      Catalogo Film
      • “Un’estate al mare”
      • Greggio, Proietti, Banfi..
      • Vanzina
      • Commedia
      Metadati
      • Titolo
      • Attore/i
      • Regista/i
      • Genere/i
      Problema 1: Come determinare le classi di visioni?
      Problema 2: Come trattare i metadati in input?
      Rete Neurale
      Input Preprocessing
      6
    • Determinare le classi di visioni
      22/07/2008
      Input Preprocessing
      L’output del sistema consiste di N classi di visione con ampiezza definita mantenendo una quantità di film (item) costante in ogni classe.
      Classi di visioni
      Rete Neurale
      # Item
      Distribuzione cumulativa Film/Visioni
      250
      125
      43
      1000
      75
      5000
      10000
      Views
      Esempio: suddivisione in 5 classi di visioni.
      1
      2
      3
      4
      5
      7
    • Input Preprocessing: Riduzione complessità
      22/07/2008
      Input Preprocessing
      Classi di visioni
      Rete Neurale
      Splitting: Brando#Al pacino#Caan#Castellano#Duvall
      Eliminazione MD non necessari
      8
    • Input preprocessing: Categorizzazione
      22/07/2008
      Input Preprocessing
      Classi di visioni
      Rete Neurale
      Necessità della rete neurale:
      Ricevere in input valori numerici
      Numero di input limitato
      1
      2
      Metadato Testuale
      Valore numerico
      Categoria
      Rete Neurale
      9
    • Input preprocessing: Categorizzazione
      22/07/2008
      Input Preprocessing
      Esempio: Metadato “Attore”
      Classi di visioni
      Rete Neurale
      Tom Cruise
      Determinazione peso
      13709
      10
    • Topologia della rete neurale
      22/07/2008
      Input Preprocessing
      Feed-forward Multi Layer Perceptron.
      Classi di visioni
      Input Layer
      Rete Neurale
      • Categoria Attore
      • Categoria Regista
      • Genere
      • Mpaa
      • ReleaseMonth
      • Categoria Production company
      HL
      HL
      • 2 Hidden Layer, con rispettivamente 4 e 3 percettroni.
      • Funzione d’attivazione: Tangente Iperbolica.
      11
    • Applicazione a un caso di studio
      Dataset Netflix
      • Titolo
      • Attore/i
      • Regista/i
      • Genere/i
      • 47.798 Utenti
      • 17.770 Contenuti
      • 10.000.450 Visioni
      • Mpaa Rating
      • Mese di rilascio
      • Casa di produzione
      IMDB
      (Internet Movie Database)
      12
      22/07/2008
    • Principali risultati ottenuti
      Training della rete: 2000 campioni (Film). 400 x 5 classi.
      Testing della rete: 50 campioni.
      Confronto Visioni reali – Visioni predette
      Reale
      Predetto
      Entro l’intervallo di una classe, la predizione può dirsi corretta.
      13
      22/07/2008
    • Risultati per ogni classe di visione
      22/07/2008
      Valutazione performance:
      %Bingo Rate: Percentuale di correttezza di una previsione. Si considera corretta la previsione se corrisponde alla classe reale.
      %W1C (Within 1 Class) Rate: Si considera corretta anche la previsione che cade in una classe adiacente (precedente o successiva) alla classe reale.
      La previsione entro una classe di correttezza è superiore al 70% in tutte le classi di visione.
      14
    • Conclusioni e Sviluppi futuri
      • Primo tentativo di ideazione di un modello per la predizione di Visioni dei film su
      televisione interattiva
      • Il preprocessing si è rivelato cruciale
      • Risultati migliori di quelli proposti in letteratura su domini affini
      CONCLUSIONI
      • Estendere l’analisi ad ulteriori metadati.
      • Arricchire il preprocessing (ad esempio utilizzo di Association Rules).
      • Raffinamento dell’implementazione prototipale.
      SVILUPPI FUTURI
      15
      22/07/2008
    • Grazie per l’attenzione!
      16
      22/07/2008
    • 22/07/2008
      17
    • Media digitali e TV interattiva
      Film (Contenuto)
      Televisione interattiva
      Difficile determinare se raccomandare agli utenti un nuovo contenuto
      Problema!
      Informazioni Utenti
      • Quale utente ha visto
      quale film
      • Visioni di un film
      (fruizioni)
      18
      22/07/2008
    • Problema Metadati
      22/07/2008
      Metadati
      19
    • Determinazione Classi di Output
      22/07/2008
      20
      Algoritmo Lloyd-Max per la suddivisione di una pdf.
      Procedura iterativa per disegnare un generico quantizzatore ottimo per una pdf data.
      Views
      Utilizzo di uno script Matlab.
      Input: Numero di classi desiderate e pdf.
      Output: Intervalli ottimi.
    • Classificazione: Visione logaritmica
      22/07/2008
      Log10(Views)
      1
      2
      3
      4
      5
      Classi Output
      21
    • Parametri per i metadati
      22/07/2008
      Modello
      Classi di visioni
      Input Preprocessing
      Rete Neurale
      Parametri per i metadati
      Modalità di utilizzo dei metadati
      Metadati da utilizzare
      Esempio: Utilizzare solo Attore, Genere e Regista
      Numero di categorie per ogni metedato testuale
      Esempio: Attore, 3 categorie (Star, Medio, Flop)
      22
    • Determinare Peso Metadato
      22/07/2008
      Input Preprocessing
      Metadato Testuale
      Es. “Tom Cruise”
      Classi di visioni
      Valore numerico
      Es. “13709”
      Categoria
      Es. “1”
      Rete Neurale
      Rete Neurale
      Peso di un Metadato testuale
      75-percentile delle visioni dei film in cui è presente
      Con P=75, N=num. Film
      23
    • Rete Neurale - Procedimento
      22/07/2008
      Input Preprocessing
      Classi di visioni
      Rete Neurale
      Procedimento Sperimentale
      Test della rete variando il numero di input per un metadato multiplo
      Risultati
      Migliori dei precedenti?
      No
      Configurazione ottimale

      24
    • Training e Testing della rete
      22/07/2008
      25
      Training
      Rete Neurale
      Testing
    • Esempio Algoritmo FPM
      Funzionamento dell’algoritmo Relim (RecursiveElimination).
      Definire un oridine per gli item (Ad esempio la frequenza nelle transazioni)
      Riordinare gli item nelle transazioni in base alla loro frequenza
      Ricorsivamente si creano delle liste dette “Prefix” a partire dall’Item con frequenza più elevata.
    • Input preprocessing: Validazione
      22/07/2008
      Input Preprocessing
      Classi di visioni
      Algoritmi di Frequent Pattern Mining per la determinazione di Regole di Associazione.
      Rete Neurale
      Esempio regola:
      Permettono di validare i risultati della categorizzazione dei metadati testuali.
      27
    • FPM anziché Rete Neurale
      Pattern Frequenti
      Algoritmi Frequent Pattern Mining
      Input Preprocessing
      Nuovo Contenuto
      Esempio Pattern
      “Actor:Tom Cruise”, “Actor:Brad Pitt”, “Genere: Drama”
      RULE: “ViewClass=5”
      “Actor:Tom Cruise”, “Actor:Brad Pitt”, “Genere: Drama”
      P=f(MD1;MD2;MD3)
      P=ViewClass=5