SlideShare a Scribd company logo
Usare le recensioni degli utenti
per creare un modello di
similarità tra videogiochi
Paolo Verdini
sicofanzia@gmail.com
showeet.com
2
Obiettivi del Progetto
1) Ottenere un sistema di similarità tra videogiochi a partire
da dati non strutturati, come le recensioni.
2) Mettere a punto un sistema di recommendation che
provveda a suggerire titoli di interesse per l'utente...
...senza supervisione umana.
3
Motivazione
Rimuovere, nel contesto di un'operazione di Sentiment
Analysis e di Machine Learning, il costo del labeling
necessario per mettere a punto un training set, e costruire
un modello di apprendimento efficace.
4
5
Perché i videogiochi?
6
7
8
9
Domain Exploration
10
Caratteristiche dei Dati

Quasi 60 milioni di utenti registrati.

Database di videogiochi più ampio in assoluto (più di 2000 giochi,
recensioni utenti).

Dati consistenti.

Solo qualche perdita dovuta alle esclusive su console.
11
12
13
Word embeddings e il problema del significato
In una rappresentazione discreta o tassonomica di due termini come “hotel” e “motel” in un
documento D potrebbe essere la seguente:
h = [0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0]
m = [0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0], dove |Vh,m
| = |D|.
Dunque Vh
V˄ m
= 0.
14
Si può conoscere il significato di una parola conoscendone il
contesto di utilizzo (Harris, 1954)
Intuizione alla base del moderno
approccio
Distributional Semantic Representation
15
16
17
18
Visualizzazione

Abbiamo operato sulla distanza tra i document embeddings per indicare una soglia
minima di similarità, e successivamente procedere alla visualizzazione (tramite un
codice JavaScript e D3) di un grafo di connessioni pesato.

Abbiamo infine completato l'operazione di ristrutturazione dell'informazione attraverso
la costruzione di un grafo a raggera, uno per ogni videogioco processato, la cui soglia
di similarità con documenti a lui più vicini fosse risultata superabile e in grado di
presentare degli esempi di connessione.
19
20
21
22
E il recommendation system?
23
24
25
26
È possibile fare altro?
27
28
Conclusione

Il modello di similarità tra videogiochi è cost-effective: considerando la prospettiva
dell'offerta di un servizio, il costo ipotetico del labeling è assorbito dalla possiblità di
procedere senza supervisione alcuna.

Costruire un'informazione basata sulle opinioni degli utenti e non pilotata da qualche
strategia pubblicitaria apre allora prospettive più moderne di indagine di mercato e di
sondaggio, e senz'altro rispecchia più fedelmente il comportamento medio del
consumatore odierno.

More Related Content

Similar to Game2Vec - DataBeers Tuscany

Game2vec
Game2vecGame2vec
Game2vec
Paolo Verdini
 
Tesi LT (bachelor final dissertation)
Tesi LT (bachelor final dissertation)Tesi LT (bachelor final dissertation)
Tesi LT (bachelor final dissertation)
Giacomo Bartoli
 
Le novita di MongoDB 3.6
Le novita di MongoDB 3.6Le novita di MongoDB 3.6
Le novita di MongoDB 3.6
MongoDB
 
Configuratore nautica 3D per il web
Configuratore nautica 3D per il webConfiguratore nautica 3D per il web
Configuratore nautica 3D per il web
Shin Software
 
Responsive Web Design
Responsive Web DesignResponsive Web Design
Responsive Web Design
Simone Viani
 
WPF 4 fun
WPF 4 funWPF 4 fun
WPF 4 fun
DotNetMarche
 
Twitter Bootstrap: an Introduction
Twitter Bootstrap: an IntroductionTwitter Bootstrap: an Introduction
Twitter Bootstrap: an Introduction
Andrea Signorile
 
Augmented Reality For Fun & profit
Augmented Reality For Fun & profitAugmented Reality For Fun & profit
Augmented Reality For Fun & profit
Luca Milan
 
Collaborate and learn in 3 d virtual worlds 2011 ita
Collaborate and learn in 3 d virtual worlds 2011 itaCollaborate and learn in 3 d virtual worlds 2011 ita
Collaborate and learn in 3 d virtual worlds 2011 itaISN Virtual Worlds
 
Visualizzazione dei network
Visualizzazione dei networkVisualizzazione dei network
Visualizzazione dei network
mttdlllbr
 
SBMT Presentation
SBMT PresentationSBMT Presentation
SBMT Presentation
Alberico Giardi
 
Custom Vision e Win.ml per le nostre app intelligenti offline
Custom Vision e Win.ml per le nostre app intelligenti offlineCustom Vision e Win.ml per le nostre app intelligenti offline
Custom Vision e Win.ml per le nostre app intelligenti offline
Alessio Iafrate
 
Drupal Day 2011 - MobileD!
Drupal Day 2011 - MobileD!Drupal Day 2011 - MobileD!
Drupal Day 2011 - MobileD!
DrupalDay
 
B Human Progetti di Stage 2009
B Human Progetti di Stage 2009B Human Progetti di Stage 2009
B Human Progetti di Stage 2009
B Human Srl
 
Cloud computing nel mondo del gaming
Cloud computing nel mondo del gamingCloud computing nel mondo del gaming
Cloud computing nel mondo del gamingAlexandru Dumitriu
 
Gamemate - Design and Prototypical Implementation of an Architecture for shar...
Gamemate - Design and Prototypical Implementation of an Architecture for shar...Gamemate - Design and Prototypical Implementation of an Architecture for shar...
Gamemate - Design and Prototypical Implementation of an Architecture for shar...
Alessandro Sanino
 
IBM Bluemix
IBM BluemixIBM Bluemix
Web X Aziende Scettiche Prova
Web X Aziende Scettiche ProvaWeb X Aziende Scettiche Prova
Web X Aziende Scettiche Prova
Gabriella
 
Impaginazione automatica e impaginazione assistita in Adobe InDesign
Impaginazione automatica e impaginazione assistita in Adobe InDesignImpaginazione automatica e impaginazione assistita in Adobe InDesign
Impaginazione automatica e impaginazione assistita in Adobe InDesign
KEA s.r.l.
 
B com 2014 | Real time bidding, la soluzione migliore per una campagna di ADV...
B com 2014 | Real time bidding, la soluzione migliore per una campagna di ADV...B com 2014 | Real time bidding, la soluzione migliore per una campagna di ADV...
B com 2014 | Real time bidding, la soluzione migliore per una campagna di ADV...
B com Expo | GL events Italia
 

Similar to Game2Vec - DataBeers Tuscany (20)

Game2vec
Game2vecGame2vec
Game2vec
 
Tesi LT (bachelor final dissertation)
Tesi LT (bachelor final dissertation)Tesi LT (bachelor final dissertation)
Tesi LT (bachelor final dissertation)
 
Le novita di MongoDB 3.6
Le novita di MongoDB 3.6Le novita di MongoDB 3.6
Le novita di MongoDB 3.6
 
Configuratore nautica 3D per il web
Configuratore nautica 3D per il webConfiguratore nautica 3D per il web
Configuratore nautica 3D per il web
 
Responsive Web Design
Responsive Web DesignResponsive Web Design
Responsive Web Design
 
WPF 4 fun
WPF 4 funWPF 4 fun
WPF 4 fun
 
Twitter Bootstrap: an Introduction
Twitter Bootstrap: an IntroductionTwitter Bootstrap: an Introduction
Twitter Bootstrap: an Introduction
 
Augmented Reality For Fun & profit
Augmented Reality For Fun & profitAugmented Reality For Fun & profit
Augmented Reality For Fun & profit
 
Collaborate and learn in 3 d virtual worlds 2011 ita
Collaborate and learn in 3 d virtual worlds 2011 itaCollaborate and learn in 3 d virtual worlds 2011 ita
Collaborate and learn in 3 d virtual worlds 2011 ita
 
Visualizzazione dei network
Visualizzazione dei networkVisualizzazione dei network
Visualizzazione dei network
 
SBMT Presentation
SBMT PresentationSBMT Presentation
SBMT Presentation
 
Custom Vision e Win.ml per le nostre app intelligenti offline
Custom Vision e Win.ml per le nostre app intelligenti offlineCustom Vision e Win.ml per le nostre app intelligenti offline
Custom Vision e Win.ml per le nostre app intelligenti offline
 
Drupal Day 2011 - MobileD!
Drupal Day 2011 - MobileD!Drupal Day 2011 - MobileD!
Drupal Day 2011 - MobileD!
 
B Human Progetti di Stage 2009
B Human Progetti di Stage 2009B Human Progetti di Stage 2009
B Human Progetti di Stage 2009
 
Cloud computing nel mondo del gaming
Cloud computing nel mondo del gamingCloud computing nel mondo del gaming
Cloud computing nel mondo del gaming
 
Gamemate - Design and Prototypical Implementation of an Architecture for shar...
Gamemate - Design and Prototypical Implementation of an Architecture for shar...Gamemate - Design and Prototypical Implementation of an Architecture for shar...
Gamemate - Design and Prototypical Implementation of an Architecture for shar...
 
IBM Bluemix
IBM BluemixIBM Bluemix
IBM Bluemix
 
Web X Aziende Scettiche Prova
Web X Aziende Scettiche ProvaWeb X Aziende Scettiche Prova
Web X Aziende Scettiche Prova
 
Impaginazione automatica e impaginazione assistita in Adobe InDesign
Impaginazione automatica e impaginazione assistita in Adobe InDesignImpaginazione automatica e impaginazione assistita in Adobe InDesign
Impaginazione automatica e impaginazione assistita in Adobe InDesign
 
B com 2014 | Real time bidding, la soluzione migliore per una campagna di ADV...
B com 2014 | Real time bidding, la soluzione migliore per una campagna di ADV...B com 2014 | Real time bidding, la soluzione migliore per una campagna di ADV...
B com 2014 | Real time bidding, la soluzione migliore per una campagna di ADV...
 

Game2Vec - DataBeers Tuscany

  • 1. Usare le recensioni degli utenti per creare un modello di similarità tra videogiochi Paolo Verdini sicofanzia@gmail.com showeet.com
  • 2. 2 Obiettivi del Progetto 1) Ottenere un sistema di similarità tra videogiochi a partire da dati non strutturati, come le recensioni. 2) Mettere a punto un sistema di recommendation che provveda a suggerire titoli di interesse per l'utente... ...senza supervisione umana.
  • 3. 3 Motivazione Rimuovere, nel contesto di un'operazione di Sentiment Analysis e di Machine Learning, il costo del labeling necessario per mettere a punto un training set, e costruire un modello di apprendimento efficace.
  • 4. 4
  • 6. 6
  • 7. 7
  • 8. 8
  • 10. 10 Caratteristiche dei Dati  Quasi 60 milioni di utenti registrati.  Database di videogiochi più ampio in assoluto (più di 2000 giochi, recensioni utenti).  Dati consistenti.  Solo qualche perdita dovuta alle esclusive su console.
  • 11. 11
  • 12. 12
  • 13. 13 Word embeddings e il problema del significato In una rappresentazione discreta o tassonomica di due termini come “hotel” e “motel” in un documento D potrebbe essere la seguente: h = [0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0] m = [0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0], dove |Vh,m | = |D|. Dunque Vh V˄ m = 0.
  • 14. 14 Si può conoscere il significato di una parola conoscendone il contesto di utilizzo (Harris, 1954) Intuizione alla base del moderno approccio Distributional Semantic Representation
  • 15. 15
  • 16. 16
  • 17. 17
  • 18. 18 Visualizzazione  Abbiamo operato sulla distanza tra i document embeddings per indicare una soglia minima di similarità, e successivamente procedere alla visualizzazione (tramite un codice JavaScript e D3) di un grafo di connessioni pesato.  Abbiamo infine completato l'operazione di ristrutturazione dell'informazione attraverso la costruzione di un grafo a raggera, uno per ogni videogioco processato, la cui soglia di similarità con documenti a lui più vicini fosse risultata superabile e in grado di presentare degli esempi di connessione.
  • 19. 19
  • 20. 20
  • 21. 21
  • 23. 23
  • 24. 24
  • 25. 25
  • 27. 27
  • 28. 28 Conclusione  Il modello di similarità tra videogiochi è cost-effective: considerando la prospettiva dell'offerta di un servizio, il costo ipotetico del labeling è assorbito dalla possiblità di procedere senza supervisione alcuna.  Costruire un'informazione basata sulle opinioni degli utenti e non pilotata da qualche strategia pubblicitaria apre allora prospettive più moderne di indagine di mercato e di sondaggio, e senz'altro rispecchia più fedelmente il comportamento medio del consumatore odierno.