SlideShare a Scribd company logo
A cool way to fund your project
FrancescadeRoseMarcoLacaria
$
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
“Miglior invenzione del 2010, miglior sito web del 2011”
Cosa è Kickstarter
Kickstarter è la piattaforma più conosciuta di crowdfunding, ideale per aiutare artisti, musicisti, registi,
artigiani e in generale chiunque abbia un’idea creativa che voglia trasformare in realtà. I creatori pubblicano la
loro idea con video e descrizione dettagliati e fissano l’obiettivo da raggiungere, cioè la somma necessaria ad
avviare il progetto, entro una determinata data. I sostenitori (backers) che decidono di investire nell’idea,
possono offrire la quantità di denaro che vogliono e non sono tenuti al versamento della somma promessa
(pledged) fino a quando il progetto non raggiunge l’obiettivo entro la data prefissata. Se l’obiettivo non viene
raggiunto, il progetto viene dichiarato fallito e nessuno è tenuto ad investirci.
Obiettivo del project work
Il presente project work si propone di analizzare un dataset online (dataset) sui dati relativi ai progetti
pubblicati sulla piattaforma dal 2009 a gennaio 2018. L’analisi si concentra sullo studio dei trend dei progetti
negli anni, focalizzando l’attenzione sui dati economici a disposizione e sulle caratteristiche delle categorie
che richiamano più investitori e più creatori, al fine di individuare quale potrebbe essere, nel secondo
semestre del 2018, il tipo di progetto vincente.
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Composizione del dataset e processi di ETL
Attributi del dataset
Il dataset iniziale presentava una lista di 39 attributi, molti dei quali
incompleti e/o non utili ai fini dell’analisi. I principali presi in esame sono
stati:
• Nome progetto
• Paese di provenienza del progetto
• Anno di pubblicazione
• Somma da raccogliere (request)
• Somma promessa dai sostenitori (pledged)
• Numero dei sostenitori (backers)
• Esito del progetto
• Categoria
• Data di creazione
• Data di modifica
• Termine
Integrazione, pulizia e normalizzazione dei dati
Il dataset è stato integrato effettuando lo scraping dei tweet - suddivisi
tra italiano e inglese – poi analizzati per avere una misura del
coinvolgimento delle persone sia all’estero che nella realtà italiana sul
fenomeno del crowdfunding (limitatamente al contesto di Kickstarter),
ormai così in espansione da poter osservare in questi anni la crescita di
realtà imprenditoriali grazie ai finanziamenti partiti “dal basso”.
La pulizia e la normalizzazione dei dati è stata effettuata in un primo
momento tramite la creazione di flussi con il software Talend open
Studio for Big Data. In seguito sono stati realizzati alcuni script ad hoc
con Python, il quale ha permesso di velocizzare i processi di
elaborazione di grandi quantità di dati.
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Kickstarter overall: numero progetti e % di successo
Nato nel 2009 negli USA, Kickstarter ha suscitato
sempre più interesse da parte di persone in cerca di
fondi per realizzare le proprie idee: dal 2009 al 2015
il numero di progetti presenti sulla piattaforma è
aumentato di almeno 50 volte con massimo picco
di sostenitori negli anni 2012-2013 e valori
tendenzialmente in calo dal 2016. L’anno 2013 è uno
dei più proficui anche dal punto di vista della
somma totale investita nei progetti pari a oltre 360
milioni. In linea generale, più del 50% dei progetti
hanno avuto successo raccogliendo la somma
richiesta nel tempo stabilito, mentre il 40% non ha
raggiunto l’obiettivo.
Backers and total pledged by year
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Negli anni di riferimento, la presenza sulla piattaforma di un numero sempre più elevato di proposte su cui investire è sicuramente legata all’apertura di Kickstarter
verso altri Paesi quali Regno Unito (2012), Australia, Nuova Zelanda e Canada (2013), che si confermano, infatti, i Paesi di origine della maggior parte dei progetti. È
possibile pubblicare progetti sulla piattaforma dall’Italia da giugno 2015. Nonostante la storia di Kickstarter abbia origine negli Stati Uniti, a sorpresa la Cina e la Russia
risultano i Paesi in cui sono stati investiti in media, per un progetto, più soldi rispetto al resto del mondo.
Kickstarter nel mondo: distribuzione geografica
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Crescita vertiginosa delle somme richieste
Mettendo a confronto il totale delle somme richieste ogni
anno per finanziare i progetti (request) e il totale investito dai
sostenitori (pledged), è interessante osservare il gap dei valori
negli anni dal 2014 al 2017. A primo impatto il discostamento
così netto rispetto agli anni precedenti, soprattutto nel 2015,
ha sollevato il dubbio riguardo a probabili valori errati nel
dataset. In realtà, i valori «request» elevati sono legati
effettivamente a progetti il cui obiettivo era superiore ai
100mila dollari e che, evidentemente, non hanno riscosso
abbastanza successo così da bilanciare i due valori. Inoltre,
l’affermazione di Kickstarter come piattaforma di
crowdfunding ha incentivato più persone a pubblicare
progetti, incrementando così il valore «request».
Il totale «pledged», che è proprio unicamente dei progetti con
esito vincente, cresce negli anni di apertura della piattaforma
in altri Paesi per poi avere un trend in decrescita.
Finanziare un progetto: molti ci provano, non tutti ci riescono
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Top categorie per numero sostenitori
Le categorie che raccolgono più sostenitori
sono evidenziate dal primo grafico: video
games, Tabletop Games, Product Design,
Hardware sono le più apprezzate.
Categorie che hanno raccolto più fondi
I progetti che hanno raccolto più fondi
(secondo grafico), riguardano però, oltre ai
video games e ai prodotti di design, accessori
e produzioni artistiche: si pensi al successo di
Veronica Mars: il film - lungometraggio basato
sull’omonima serie tv e che al botteghino ha
incassato più di 3 milioni di dollari - o allo
smartwatch lanciato dalla start-up Pebble
Distribuzione categorie: top per sostenitore vs top per incassi
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Somme richieste vs raccolte
Il grafico rappresenta le 25 categorie che
raccolgono più progetti ed è diviso da
due intercette in quattro quadranti: la
media delle somme raccolte da ogni
categoria (asse x: pledged) e la media
delle somme richieste da ogni
categoria (asse y: request).
Le categorie «video games», «tabletop
games» e «product design» si trovano
nel 4^ quadrante, dove la somma
investita dai sostenitori è maggiore di
quella richiesta dai creatori. Diverso è il
caso per categorie come «animation»,
«software» e «restaurants», dove, a
livello generale, la somma richiesta dai
progetti non sempre viene raggiunta,
quindi il valore totale di pledged è
minore del valore totale request.
Top 25 categorie: chi ha raccolto più progetti e chi ha incassato di più
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Per durata di un progetto si intende la differenza tra la data di
termine di raccolta fondi e la data di pubblicazione. In media, la durata
minima è di 62 giorni circa.
Il grafico mostra le categorie con più sostenitori in ordine
decrescente sull’asse delle x, mentre sull’asse delle y mostra la
durata media dei progetti di una determinata categoria.
Non abbiamo rilevato una effettiva correlazione tra la durata media
dei progetti di una determinata categoria e il successo degli stessi: le
categorie che hanno attirato più progetti e più sostenitori, hanno
una durata media diversa, probabilmente è importante pubblicizzare
e creare entusiasmo per il progetto nei primi giorni di lancio.
Infatti, molti progetti di grande successo hanno raccolto fin dalle
prime ore somme importanti, come lo smartwatch Pebble, che ha
raccolto un milione di dollari nei primi 49 minuti dall’inizio della
raccolta fondi e nei giorni successivi ha superato l’equivalente di 15
milioni di euro, o il progetto Veronica Mars: il film che in sole 4 ore ha
raccolto un milione e mezzo di dollari (fonte: ilpost.it).
Durata di un progetto: quanto influsce sul successo dell’idea
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
INDICE A
È stato calcolato un semplice indice per valutare meglio l’andamento negli anni del
successo generale dei progetti
indice A=pledged/request
Se l’indice è maggiore o uguale a 1, in linea generale i progetti riferiti a quel determinato
anno hanno avuto un’ottima prestazione, in quanto la somma investita dai sostenitori è
maggiore della somma richiesta. Al contrario, se l’indice è minore di 1, l’anno non ha
avuto buone performance.
Nel primo grafico, la clusterizzazione suddivide in tre gruppi gli anni di analisi:
• Cluster 1 – anni 2014, 2015, 2016, 2017 con indice A al di sotto del valore medio (linea
average) e minore di 1 (linea over);
• Cluster 2 - anni 2009, 2010, 2011, 2013, al di sopra della media ma con indice A
minore di 1;
• Cluster 3 - anno 2012, il migliore da un punto di vista della perfomance dei progetti,
con indice A maggiore di 1.
Nel secondo grafico, viene visualizzato l’indice A per anno considerando solo i progetti
di successo, quindi, ovviamente, tutti gli anni sono al di sopra della linea over. I progetti
di successo degli anni 2012, 2013, 2014 hanno avuto performance migliori rispetto ai
progetti di successo degli altri anni, perciò, in media, hanno raccolto somme più del
doppio dei fondi richiesti.
Indice A: andamento del successo generale dei progetti
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Progetti falliti: dove si concentrano in europa
La mappa a sinistra mostra la distribuzione in Europa dei progetti con esito «failed». Il Regno Unito è il Paese di origine della maggior parte dei progetti europei che non hanno avuto successo, ma
probabilmente questo dato è condizionato anche dal fatto che è stato il primo Paese in UE in cui cittadini hanno potuto pubblicare progetti su Kickstarter, quindi a un numero maggiore di progetti corrisponde
un numero maggiore di fallimenti a parità di probabilità di successo.
A destra la mappa mostra la distribuzione in Europa del numero medio di donatori per progetto. A un colore più intenso corrisponde in media un numero maggiore di donatori per progetto.
$
Trend ed engagement esterni al sito
Quali sono le tematiche legate al mondo Kickstarter più discusse dagli utenti sui social?
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Perché collezionare dati dal social
Dopo aver analizzato i trend al livello mondiale del fenomeno Kickstarter, basandosi sui dati provenienti dal Dataset del sito, è stato deciso di analizzare i
dati provenienti da un social network ed avviare un processo di scraping dei contenuti pubblici, italiani ed inglesi, per capire quali fossero le tematiche più
discusse dagli utenti - e che creassero coinvolgimento maggiore - esternamente al sito madre. Come social è stato scelto Twitter (ricco di dati pubblici).
Il processo di data ingestion ed ETL è stato effettuato mediante la creazione di script custom con Python che permettessero di collezionare in modo
automatico i Tweet degli utenti inerenti all’argomento Kickstarter, senza dover utilizzare le API ufficiali. Per l'Italia sono stati raccolti tutti i Tweet compresi
nel periodo 2009~2018, mentre per quanto riguarda i Tweet in lingua inglese sono stati raccolti i dati del 2017 e quelli disponibili per il 2018. *
Flussi operativi
Web Scraping: Kickstarter sui social
* La mole di dati per la lingua inglese è tale che senza le API Enterprise ufficiali non è possibile collezionare in tempi brevi tutto lo storico degli anni passati.
Analysis &
Visualization
Analisi sorgente
Twitter
ETLWeb
Scraping
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Trend su Twitter e interesse nelle ricerche Google
Nel giugno del 2015 Kickstarter apre anche all’Italia la possibilità di
creare e pubblicare progetti. evento che porta ad un’importante crescita
nel coinvolgimento degli utenti che, da semplici spettatori, diventano
protagonisti interessati a promuovere le proprie idee creative e
raccogliere fondi per realizzarle.
Utenti italiani: engagement su Twitter per il tema Kickstarter
Giugno 2015
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Latent Dirichlet Allocation
I modelli statistici Topic Modelling
offrono un metodo per organizzare,
capire e raggruppare grandi collezioni di
documenti testuali. Questi modelli
possono essere descritti come metodi
per identificare gruppi di parole
(topic/argomenti), presenti in una
collezione di documenti, che meglio
rappresentano l’informazione di tale
collezione.
Esistono varie tecniche utilizzate per
ottenere i Topic Model, come ad
esempio l’LDA (modello di tipo bag-of-
words), un algoritmo in grado di
identificare ed estrarre frasi chiave
rilevanti all'interno di un set di documenti.
Nel modello LDA ciascun documento è
visto come un un mix di argomenti
presenti nel corpus totale. Il modello
ipotizza che ogni parola del documento
sia attribuibile a uno degli argomenti del
documento.
LDA su circa 170.ooo Tweet in lingua inglese (Gennaio – Marzo 2018)
Topic #0: link life check sure backer friends 3d travel someone gonna [3d shared experience]
Topic #1: one goal got thank people rt look good another stretch
Topic #2: things final yet needs went believe innovation important least details
Topic #3: project new last 2018 launches week tech first take dice [lancio progetti]
Topic #4: backed comic art work edition create projects campaign part adventure [art, comic work]
Topic #5: gaming novel horror seen graphic entrepreneur graphic novel stories products experience [ghaphic
novel]
Topic #6: forcefieldcloak comics ending rpg 100 find light lose dnd thing [product design]
Topic #7: video anthology liked music liked video started crap action production video crap [video music]
Topic #8: thanks great hours gamedev page ref series might backing 20 [video games]
Topic #9: game check games see buy boardgames board card tabletop design [board games/tabletop]
Topic #10: launch need soon way awesome help launching happy successful right [lancio progetti]
Topic #11: back via want amazing best set ever little come funded
Topic #12: new campaign now days support help live book get ve [lancio progetti]
Topic #13: us popular backers re win cool looking march follow run
Topic #14: know really think launched also looks super book fun can [book]
Topic #15: crowdfunding indiegogo going funding go order story startup pre read [crowdfunding]
LDA: un modello statistico per identificare topic
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
LDA su circa 1000 Tweet in lingua italiana (Gennaio – Marzo 2018)
Il numero di Tweet italiani sull’argomento Kickstarter per la lingua italiana, periodo Gen – Mar 2018 – è più ridotto a quelli disponibili per la lingua inglese.
Topic #1: wireless finanziati usb content ricarica hub piccolo tratta 000 hyperdrive [accessori wireless]
Topic #2: gamedev indiedev switch indiedev gamedev nintendo indiegame switch nintendo nintendoswitch horror [video game]
Topic #3: video piaciuto video piaciuto gioco miniature 2018 potter harry harry potter sar [graphic novel]
Topic #4: crowdfunding the campagna graphicnovel projects graphicnovel fralelabbra fralelabbra campagna crowdfunding iot bennybolla [board games]
Topic #5: giochidatavolo boardgames boardgames giochidatavolo gioconauta gsnt nemesis para anteprima vedettaks giochidatavolo gsnt vedettaks [board
games]
Topic #6: 2018 it giochi news boardgames 03 2018 03 notizie it 2018 01 [tech/mobile]
Topic #7: informatica telefonia telefonia informatica pi realizzato smart speaker acqua arduino iwinuxfeed [tech/mobile]
Topic #8: by pu on serie new the auricolari voglio brand new new on [lancio progetto]
Topic #9: febbraio lancio gaming perch campagna ces lifestyle arriva eh problemi [board games]
Topic #10: projects the of gi games gioco play giochidatavolo progetto indie [lancio progetto]
Topic #11: campagna fondi gioco it the pc good good life life finanziare [book]
Topic #12: indiegamedev indies nintendo gamedev nintendoswitch campaign indiegame lancia arrivo arriva [tech/mobile]
Topic #13: libro instagram oddworld origini wearable origini oddworld raccontate libro raccontate oddworld raccontate luglio [book]
Topic #14: videogiochi lolistraw cannucce mazzo salvare bloodstained 2017 record crescono biodegrabile funding [eco sostenibilità]
Topic #15: smartphone kite settimana podcast kit 3d kite kit 2018 kite smartphone arriva [tech/mobile]
LDA: identificazione dei topic per I Tweet italiani
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Italia vs Mondo
I Topic, che raggruppano i documenti (testi dei tweet)
in argomenti riconducibili a categorie di Kickstarter,
hanno evidenziato caratteristiche comuni tra la realtà
internazionale e la realtà italiana, quali l’utilizzo di
Twitter per il lancio e la pubblicizzazione di progetti e
la discussione su determinate categorie come «video
games», «tabletop games», «book», «graphic novel».
È interessante notare come solo un topic della realtà
italiana sia riconducibile all’eco-sostenibilità, mentre
a livello mondiale si confermano come categorie più
discusse su Twitter le stesse che rientrano nelle
top27 con percentuale di successo maggiore negli
anni 2009-2017.
Nel grafico sono riportate le top27 categorie del
dataset di Kickstarter con numero di progetti di
successo maggiore di 1000 negli anni di riferimento.
LDA: topic estratti e top categorie per progetti di successo
$
Implementazioni tecniche
Quali strumenti sono stati utilizzati
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
ETL: unione e pulizia dataset Kickstarter
Talend Open Studio for Big Data & MySql
Il dataset di partenza è il risultato di un’operazione
di scraping Kickstarter, e raccoglie i dati della
property a partire dal 2009, fino al Gennaio 2018 si
presentava frammentato in circa 50 file, ed i dati
contenuti erano «sporchi» e di vario formato.
Per questa fase di merging ed ETL è stato utilizzato
il software Talend Open Studio for Big Data. Di
seguito le operazioni necessarie, in tre separati
flussi:
1. Merging dei file in un unico dataset
2. Primo passaggio di pulizia e normalizzazione
dati (Java + Regex).
3. Rimozione degli attributi non necessari e/o
incompleti.
4. Store dei dati su DB e output file .csv
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Scraping & ETL dei Tweet: Python vs Octoparse
Gli script Python sono stati realizzati mediante la creazione di codice
custom + utilizzo di librerie.
Web scraping, pulizia , normalizzazione dati e LDA: moduli
• Time, Datetime, strptime, timedelta : per la gestione degli oggetti di tipo data.
• requests, selenium, webdriver, Keys, BeautifulSoup, Tweepy: per la gestione del
DOM e le operazioni di browsing.
• Json, csv, os, glob: per la gestione di file e pathnames
• re: per la gestione di espressioni regolari
• LatentDirichletAllocation, CountVectorizer: per identificare i topic presenti
nel corpus di dati (Tweets)
Web scraping e pulizia dei dati
Inizialmente la fase di scraping è stata effettuata utilizzando il software
Octoparse, il quale si è dimostrato lento e inadatto davanti a criticità quali:
• Gestione di una grande mole di dati e processo di data ingestion.
• Gestione delle risorse hardware a disposizione della macchina.
• Gestione di stringhe con caratteri speciali.
• Archiviazione ordinata e progressiva dei dataset parziali scaricati.
• Gestione interruzione da parte di Twitter dei flussi di scraping.
• Processo di ETL.
Abbandonato Octoparse, è stato deciso di procedere con Python (2.7.x)
per le creazione di script custom che permettessero di automatizzare tutto
il processo di data ingestion da Twitter e di gestire tutte le casistiche sopra
elencate. I flussi si suddividono in due fasi
1. Web Scraping e storaging dati
2. Merging e pulizia dei dati.
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
Data Visualizzation: rappresentazione dei dati
Tableau
• Creazione di indici sintetici
• Editing di alias di posizioni geografiche
• Join con file dati esterni al dataset contenenti
coordinate geografiche
• Estrazione di parte di dati tramite formule
• Creazione di set
• Utilizzo di table calculation e mappe
• Utilizzo di strumenti di analytics (trend line,
regression, quantiles, reference lines)
• Realizzazione di dashboard e story telling
$
Conclusioni
Prof. Mirko Cesarini
.…a cool way to fund your project
Francesca de Rose® – Marco Lacaria©2017 - 2018
$
È possibile prevedere il successo di un progetto?
Dall’analisi effettuata sui dati, non emerge alcun trend che definisca una linearità di crescita/decrescita o stagionalità che possa garantire il successo o meno di una categoria di progetti, il
quale sembra dipendere esclusivamente dall’originalità dell’idea e dalla passione dell’autore che coinvolge l’utenza, a prescindere dal momento e in cui il progetto nasce.
Un elemento che può aumentare la probabilità di successo di un progetto è l’obiettivo fissato per realizzarlo: dalla tabella si evidenzia come la percentuale di successo diminuisca
all’aumentare dell’intervallo della somma richiesta. Si può supporre che somme troppo elevate scoraggino i donatori, i quali potrebbero vedere l’obiettivo come irraggiungibile.
Sulla base di queste considerazioni, abbiamo concluso che impostare, come next step, un processo di Machine Learning potrebbe essere pressoché pari a indovinare i numeri al lotto, vista
la natura dei progetti, il cui successo è legato più al sentiment e alle passioni del pubblico che a valori economici che permettono una previsione tramite modelli statistici.
$
$
Le idee originali non sono prevedibili
fine

More Related Content

Similar to PW Master BI&BDA - KickStarter: a cool way to fund your project

Slides per convegno saf crowdfunding [modalità compatibilità]
Slides per convegno saf   crowdfunding [modalità compatibilità]Slides per convegno saf   crowdfunding [modalità compatibilità]
Slides per convegno saf crowdfunding [modalità compatibilità]
Deborah Setola
 
Crowdfunding - Non c'è funding senza crowd. Roma, novembre 2013
Crowdfunding - Non c'è funding senza crowd. Roma, novembre 2013Crowdfunding - Non c'è funding senza crowd. Roma, novembre 2013
Crowdfunding - Non c'è funding senza crowd. Roma, novembre 2013Chiara Spinelli
 
L'acceleratore d'impresa come modello di investimento ed il ruolo del crowdfu...
L'acceleratore d'impresa come modello di investimento ed il ruolo del crowdfu...L'acceleratore d'impresa come modello di investimento ed il ruolo del crowdfu...
L'acceleratore d'impresa come modello di investimento ed il ruolo del crowdfu...
Guanxi
 
HTF - Firenze. Che cos'è e come si fa una campagna di crowdfunfding. Chiara S...
HTF - Firenze. Che cos'è e come si fa una campagna di crowdfunfding. Chiara S...HTF - Firenze. Che cos'è e come si fa una campagna di crowdfunfding. Chiara S...
HTF - Firenze. Che cos'è e come si fa una campagna di crowdfunfding. Chiara S...
Multiverso
 
Fablab Firenze 10/03/2013
Fablab Firenze 10/03/2013Fablab Firenze 10/03/2013
Fablab Firenze 10/03/2013Chiara Spinelli
 
Crowdfunding: un nuovo modo per finanziare idee e progetti
Crowdfunding: un nuovo modo per finanziare idee e progettiCrowdfunding: un nuovo modo per finanziare idee e progetti
Crowdfunding: un nuovo modo per finanziare idee e progetti
Simone Moriconi
 
Crowdfunding Lab Padova - 15.07.2016
Crowdfunding Lab Padova - 15.07.2016Crowdfunding Lab Padova - 15.07.2016
Crowdfunding Lab Padova - 15.07.2016
Diana Severati
 
Presentazione Placevent (Università Bologna): La comunicazione e il comunicat...
Presentazione Placevent (Università Bologna): La comunicazione e il comunicat...Presentazione Placevent (Università Bologna): La comunicazione e il comunicat...
Presentazione Placevent (Università Bologna): La comunicazione e il comunicat...
Francesco Pirri
 
Crowfunding e Reti di Impresa: un binomio possibile
Crowfunding e Reti di Impresa: un binomio possibileCrowfunding e Reti di Impresa: un binomio possibile
Crowfunding e Reti di Impresa: un binomio possibile
Fabio Allegreni
 
Il crowdfunding su Eticarim.it
Il crowdfunding su Eticarim.itIl crowdfunding su Eticarim.it
Il crowdfunding su Eticarim.it
Banca Carim
 
Crowdfunding Lab Roma
Crowdfunding Lab RomaCrowdfunding Lab Roma
Crowdfunding Lab Roma
Diana Severati
 
Video B2BTrade: scopri come trovare all'estero nuovi sbocchi commerciali
Video B2BTrade: scopri come trovare all'estero nuovi sbocchi commercialiVideo B2BTrade: scopri come trovare all'estero nuovi sbocchi commerciali
Video B2BTrade: scopri come trovare all'estero nuovi sbocchi commerciali
B2BSocialnet
 
Festival del Fundraising 2009 - Slide Quistelli
Festival del Fundraising 2009 - Slide QuistelliFestival del Fundraising 2009 - Slide Quistelli
Festival del Fundraising 2009 - Slide Quistelli
quistelli
 
Crowd Advisors - Crowdfunding per marketing e fund raising
Crowd Advisors - Crowdfunding per marketing e fund raisingCrowd Advisors - Crowdfunding per marketing e fund raising
Crowd Advisors - Crowdfunding per marketing e fund raising
Fabio Allegreni
 
Daniele Ferrari - Il crowdfunding come modalità di finanziamento per startup
Daniele Ferrari - Il crowdfunding come modalità di finanziamento per startupDaniele Ferrari - Il crowdfunding come modalità di finanziamento per startup
Daniele Ferrari - Il crowdfunding come modalità di finanziamento per startup
EmiliaRomagnaStartUp
 
Donazioni 2.0: il crowdfunding per il non profit
Donazioni 2.0: il crowdfunding per il non profitDonazioni 2.0: il crowdfunding per il non profit
Donazioni 2.0: il crowdfunding per il non profit
ShinyNote
 
Ginger workshop - perAspera Festival
Ginger workshop - perAspera FestivalGinger workshop - perAspera Festival
Ginger workshop - perAspera Festival
ideaginger
 
I segreti del successo del crowdfunding per l'impresa sociale
I segreti del successo del crowdfunding per l'impresa socialeI segreti del successo del crowdfunding per l'impresa sociale
I segreti del successo del crowdfunding per l'impresa sociale
Ivana Pais
 
Il crowdfunding in Italia e nel mondo
Il crowdfunding in Italia e nel mondoIl crowdfunding in Italia e nel mondo
Il crowdfunding in Italia e nel mondo
Ivana Pais
 

Similar to PW Master BI&BDA - KickStarter: a cool way to fund your project (20)

Slides per convegno saf crowdfunding [modalità compatibilità]
Slides per convegno saf   crowdfunding [modalità compatibilità]Slides per convegno saf   crowdfunding [modalità compatibilità]
Slides per convegno saf crowdfunding [modalità compatibilità]
 
Crowdfunding - Non c'è funding senza crowd. Roma, novembre 2013
Crowdfunding - Non c'è funding senza crowd. Roma, novembre 2013Crowdfunding - Non c'è funding senza crowd. Roma, novembre 2013
Crowdfunding - Non c'è funding senza crowd. Roma, novembre 2013
 
L'acceleratore d'impresa come modello di investimento ed il ruolo del crowdfu...
L'acceleratore d'impresa come modello di investimento ed il ruolo del crowdfu...L'acceleratore d'impresa come modello di investimento ed il ruolo del crowdfu...
L'acceleratore d'impresa come modello di investimento ed il ruolo del crowdfu...
 
HTF - Firenze. Che cos'è e come si fa una campagna di crowdfunfding. Chiara S...
HTF - Firenze. Che cos'è e come si fa una campagna di crowdfunfding. Chiara S...HTF - Firenze. Che cos'è e come si fa una campagna di crowdfunfding. Chiara S...
HTF - Firenze. Che cos'è e come si fa una campagna di crowdfunfding. Chiara S...
 
Kickstarter
KickstarterKickstarter
Kickstarter
 
Fablab Firenze 10/03/2013
Fablab Firenze 10/03/2013Fablab Firenze 10/03/2013
Fablab Firenze 10/03/2013
 
Crowdfunding: un nuovo modo per finanziare idee e progetti
Crowdfunding: un nuovo modo per finanziare idee e progettiCrowdfunding: un nuovo modo per finanziare idee e progetti
Crowdfunding: un nuovo modo per finanziare idee e progetti
 
Crowdfunding Lab Padova - 15.07.2016
Crowdfunding Lab Padova - 15.07.2016Crowdfunding Lab Padova - 15.07.2016
Crowdfunding Lab Padova - 15.07.2016
 
Presentazione Placevent (Università Bologna): La comunicazione e il comunicat...
Presentazione Placevent (Università Bologna): La comunicazione e il comunicat...Presentazione Placevent (Università Bologna): La comunicazione e il comunicat...
Presentazione Placevent (Università Bologna): La comunicazione e il comunicat...
 
Crowfunding e Reti di Impresa: un binomio possibile
Crowfunding e Reti di Impresa: un binomio possibileCrowfunding e Reti di Impresa: un binomio possibile
Crowfunding e Reti di Impresa: un binomio possibile
 
Il crowdfunding su Eticarim.it
Il crowdfunding su Eticarim.itIl crowdfunding su Eticarim.it
Il crowdfunding su Eticarim.it
 
Crowdfunding Lab Roma
Crowdfunding Lab RomaCrowdfunding Lab Roma
Crowdfunding Lab Roma
 
Video B2BTrade: scopri come trovare all'estero nuovi sbocchi commerciali
Video B2BTrade: scopri come trovare all'estero nuovi sbocchi commercialiVideo B2BTrade: scopri come trovare all'estero nuovi sbocchi commerciali
Video B2BTrade: scopri come trovare all'estero nuovi sbocchi commerciali
 
Festival del Fundraising 2009 - Slide Quistelli
Festival del Fundraising 2009 - Slide QuistelliFestival del Fundraising 2009 - Slide Quistelli
Festival del Fundraising 2009 - Slide Quistelli
 
Crowd Advisors - Crowdfunding per marketing e fund raising
Crowd Advisors - Crowdfunding per marketing e fund raisingCrowd Advisors - Crowdfunding per marketing e fund raising
Crowd Advisors - Crowdfunding per marketing e fund raising
 
Daniele Ferrari - Il crowdfunding come modalità di finanziamento per startup
Daniele Ferrari - Il crowdfunding come modalità di finanziamento per startupDaniele Ferrari - Il crowdfunding come modalità di finanziamento per startup
Daniele Ferrari - Il crowdfunding come modalità di finanziamento per startup
 
Donazioni 2.0: il crowdfunding per il non profit
Donazioni 2.0: il crowdfunding per il non profitDonazioni 2.0: il crowdfunding per il non profit
Donazioni 2.0: il crowdfunding per il non profit
 
Ginger workshop - perAspera Festival
Ginger workshop - perAspera FestivalGinger workshop - perAspera Festival
Ginger workshop - perAspera Festival
 
I segreti del successo del crowdfunding per l'impresa sociale
I segreti del successo del crowdfunding per l'impresa socialeI segreti del successo del crowdfunding per l'impresa sociale
I segreti del successo del crowdfunding per l'impresa sociale
 
Il crowdfunding in Italia e nel mondo
Il crowdfunding in Italia e nel mondoIl crowdfunding in Italia e nel mondo
Il crowdfunding in Italia e nel mondo
 

More from Carla Marini

Tox Framework
Tox FrameworkTox Framework
Tox Framework
Carla Marini
 
Segmentazione della clientela e Customer Churn Analysis nel retail
Segmentazione della clientela e Customer Churn Analysis nel retailSegmentazione della clientela e Customer Churn Analysis nel retail
Segmentazione della clientela e Customer Churn Analysis nel retail
Carla Marini
 
Alidata Experience - Alitalia Customer Satisfaction
Alidata Experience -  Alitalia Customer SatisfactionAlidata Experience -  Alitalia Customer Satisfaction
Alidata Experience - Alitalia Customer Satisfaction
Carla Marini
 
Company Clustering Based on skills they seek in the job market
Company Clustering Based on skills they seek in the job marketCompany Clustering Based on skills they seek in the job market
Company Clustering Based on skills they seek in the job market
Carla Marini
 
Laboratorio Master BI&BDA (Modulo Web Data Analytics) : Reddit fashion insights
Laboratorio Master BI&BDA (Modulo Web Data Analytics) : Reddit fashion insightsLaboratorio Master BI&BDA (Modulo Web Data Analytics) : Reddit fashion insights
Laboratorio Master BI&BDA (Modulo Web Data Analytics) : Reddit fashion insights
Carla Marini
 
Presentazione Master BI&BDA Edizione 8
Presentazione Master BI&BDA Edizione 8Presentazione Master BI&BDA Edizione 8
Presentazione Master BI&BDA Edizione 8
Carla Marini
 
ProjectWork Master BIBDA - Tracciamento all'indietro del percorso delle parti...
ProjectWork Master BIBDA - Tracciamento all'indietro del percorso delle parti...ProjectWork Master BIBDA - Tracciamento all'indietro del percorso delle parti...
ProjectWork Master BIBDA - Tracciamento all'indietro del percorso delle parti...
Carla Marini
 
JOBME - Project Work Master in Business Intelligence & BigData Analytics
JOBME - Project Work Master in Business Intelligence & BigData AnalyticsJOBME - Project Work Master in Business Intelligence & BigData Analytics
JOBME - Project Work Master in Business Intelligence & BigData Analytics
Carla Marini
 

More from Carla Marini (8)

Tox Framework
Tox FrameworkTox Framework
Tox Framework
 
Segmentazione della clientela e Customer Churn Analysis nel retail
Segmentazione della clientela e Customer Churn Analysis nel retailSegmentazione della clientela e Customer Churn Analysis nel retail
Segmentazione della clientela e Customer Churn Analysis nel retail
 
Alidata Experience - Alitalia Customer Satisfaction
Alidata Experience -  Alitalia Customer SatisfactionAlidata Experience -  Alitalia Customer Satisfaction
Alidata Experience - Alitalia Customer Satisfaction
 
Company Clustering Based on skills they seek in the job market
Company Clustering Based on skills they seek in the job marketCompany Clustering Based on skills they seek in the job market
Company Clustering Based on skills they seek in the job market
 
Laboratorio Master BI&BDA (Modulo Web Data Analytics) : Reddit fashion insights
Laboratorio Master BI&BDA (Modulo Web Data Analytics) : Reddit fashion insightsLaboratorio Master BI&BDA (Modulo Web Data Analytics) : Reddit fashion insights
Laboratorio Master BI&BDA (Modulo Web Data Analytics) : Reddit fashion insights
 
Presentazione Master BI&BDA Edizione 8
Presentazione Master BI&BDA Edizione 8Presentazione Master BI&BDA Edizione 8
Presentazione Master BI&BDA Edizione 8
 
ProjectWork Master BIBDA - Tracciamento all'indietro del percorso delle parti...
ProjectWork Master BIBDA - Tracciamento all'indietro del percorso delle parti...ProjectWork Master BIBDA - Tracciamento all'indietro del percorso delle parti...
ProjectWork Master BIBDA - Tracciamento all'indietro del percorso delle parti...
 
JOBME - Project Work Master in Business Intelligence & BigData Analytics
JOBME - Project Work Master in Business Intelligence & BigData AnalyticsJOBME - Project Work Master in Business Intelligence & BigData Analytics
JOBME - Project Work Master in Business Intelligence & BigData Analytics
 

PW Master BI&BDA - KickStarter: a cool way to fund your project

  • 1. A cool way to fund your project FrancescadeRoseMarcoLacaria $
  • 2. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ “Miglior invenzione del 2010, miglior sito web del 2011” Cosa è Kickstarter Kickstarter è la piattaforma più conosciuta di crowdfunding, ideale per aiutare artisti, musicisti, registi, artigiani e in generale chiunque abbia un’idea creativa che voglia trasformare in realtà. I creatori pubblicano la loro idea con video e descrizione dettagliati e fissano l’obiettivo da raggiungere, cioè la somma necessaria ad avviare il progetto, entro una determinata data. I sostenitori (backers) che decidono di investire nell’idea, possono offrire la quantità di denaro che vogliono e non sono tenuti al versamento della somma promessa (pledged) fino a quando il progetto non raggiunge l’obiettivo entro la data prefissata. Se l’obiettivo non viene raggiunto, il progetto viene dichiarato fallito e nessuno è tenuto ad investirci. Obiettivo del project work Il presente project work si propone di analizzare un dataset online (dataset) sui dati relativi ai progetti pubblicati sulla piattaforma dal 2009 a gennaio 2018. L’analisi si concentra sullo studio dei trend dei progetti negli anni, focalizzando l’attenzione sui dati economici a disposizione e sulle caratteristiche delle categorie che richiamano più investitori e più creatori, al fine di individuare quale potrebbe essere, nel secondo semestre del 2018, il tipo di progetto vincente.
  • 3. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Composizione del dataset e processi di ETL Attributi del dataset Il dataset iniziale presentava una lista di 39 attributi, molti dei quali incompleti e/o non utili ai fini dell’analisi. I principali presi in esame sono stati: • Nome progetto • Paese di provenienza del progetto • Anno di pubblicazione • Somma da raccogliere (request) • Somma promessa dai sostenitori (pledged) • Numero dei sostenitori (backers) • Esito del progetto • Categoria • Data di creazione • Data di modifica • Termine Integrazione, pulizia e normalizzazione dei dati Il dataset è stato integrato effettuando lo scraping dei tweet - suddivisi tra italiano e inglese – poi analizzati per avere una misura del coinvolgimento delle persone sia all’estero che nella realtà italiana sul fenomeno del crowdfunding (limitatamente al contesto di Kickstarter), ormai così in espansione da poter osservare in questi anni la crescita di realtà imprenditoriali grazie ai finanziamenti partiti “dal basso”. La pulizia e la normalizzazione dei dati è stata effettuata in un primo momento tramite la creazione di flussi con il software Talend open Studio for Big Data. In seguito sono stati realizzati alcuni script ad hoc con Python, il quale ha permesso di velocizzare i processi di elaborazione di grandi quantità di dati.
  • 4. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Kickstarter overall: numero progetti e % di successo Nato nel 2009 negli USA, Kickstarter ha suscitato sempre più interesse da parte di persone in cerca di fondi per realizzare le proprie idee: dal 2009 al 2015 il numero di progetti presenti sulla piattaforma è aumentato di almeno 50 volte con massimo picco di sostenitori negli anni 2012-2013 e valori tendenzialmente in calo dal 2016. L’anno 2013 è uno dei più proficui anche dal punto di vista della somma totale investita nei progetti pari a oltre 360 milioni. In linea generale, più del 50% dei progetti hanno avuto successo raccogliendo la somma richiesta nel tempo stabilito, mentre il 40% non ha raggiunto l’obiettivo. Backers and total pledged by year
  • 5. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Negli anni di riferimento, la presenza sulla piattaforma di un numero sempre più elevato di proposte su cui investire è sicuramente legata all’apertura di Kickstarter verso altri Paesi quali Regno Unito (2012), Australia, Nuova Zelanda e Canada (2013), che si confermano, infatti, i Paesi di origine della maggior parte dei progetti. È possibile pubblicare progetti sulla piattaforma dall’Italia da giugno 2015. Nonostante la storia di Kickstarter abbia origine negli Stati Uniti, a sorpresa la Cina e la Russia risultano i Paesi in cui sono stati investiti in media, per un progetto, più soldi rispetto al resto del mondo. Kickstarter nel mondo: distribuzione geografica
  • 6. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Crescita vertiginosa delle somme richieste Mettendo a confronto il totale delle somme richieste ogni anno per finanziare i progetti (request) e il totale investito dai sostenitori (pledged), è interessante osservare il gap dei valori negli anni dal 2014 al 2017. A primo impatto il discostamento così netto rispetto agli anni precedenti, soprattutto nel 2015, ha sollevato il dubbio riguardo a probabili valori errati nel dataset. In realtà, i valori «request» elevati sono legati effettivamente a progetti il cui obiettivo era superiore ai 100mila dollari e che, evidentemente, non hanno riscosso abbastanza successo così da bilanciare i due valori. Inoltre, l’affermazione di Kickstarter come piattaforma di crowdfunding ha incentivato più persone a pubblicare progetti, incrementando così il valore «request». Il totale «pledged», che è proprio unicamente dei progetti con esito vincente, cresce negli anni di apertura della piattaforma in altri Paesi per poi avere un trend in decrescita. Finanziare un progetto: molti ci provano, non tutti ci riescono
  • 7. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Top categorie per numero sostenitori Le categorie che raccolgono più sostenitori sono evidenziate dal primo grafico: video games, Tabletop Games, Product Design, Hardware sono le più apprezzate. Categorie che hanno raccolto più fondi I progetti che hanno raccolto più fondi (secondo grafico), riguardano però, oltre ai video games e ai prodotti di design, accessori e produzioni artistiche: si pensi al successo di Veronica Mars: il film - lungometraggio basato sull’omonima serie tv e che al botteghino ha incassato più di 3 milioni di dollari - o allo smartwatch lanciato dalla start-up Pebble Distribuzione categorie: top per sostenitore vs top per incassi
  • 8. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Somme richieste vs raccolte Il grafico rappresenta le 25 categorie che raccolgono più progetti ed è diviso da due intercette in quattro quadranti: la media delle somme raccolte da ogni categoria (asse x: pledged) e la media delle somme richieste da ogni categoria (asse y: request). Le categorie «video games», «tabletop games» e «product design» si trovano nel 4^ quadrante, dove la somma investita dai sostenitori è maggiore di quella richiesta dai creatori. Diverso è il caso per categorie come «animation», «software» e «restaurants», dove, a livello generale, la somma richiesta dai progetti non sempre viene raggiunta, quindi il valore totale di pledged è minore del valore totale request. Top 25 categorie: chi ha raccolto più progetti e chi ha incassato di più
  • 9. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Per durata di un progetto si intende la differenza tra la data di termine di raccolta fondi e la data di pubblicazione. In media, la durata minima è di 62 giorni circa. Il grafico mostra le categorie con più sostenitori in ordine decrescente sull’asse delle x, mentre sull’asse delle y mostra la durata media dei progetti di una determinata categoria. Non abbiamo rilevato una effettiva correlazione tra la durata media dei progetti di una determinata categoria e il successo degli stessi: le categorie che hanno attirato più progetti e più sostenitori, hanno una durata media diversa, probabilmente è importante pubblicizzare e creare entusiasmo per il progetto nei primi giorni di lancio. Infatti, molti progetti di grande successo hanno raccolto fin dalle prime ore somme importanti, come lo smartwatch Pebble, che ha raccolto un milione di dollari nei primi 49 minuti dall’inizio della raccolta fondi e nei giorni successivi ha superato l’equivalente di 15 milioni di euro, o il progetto Veronica Mars: il film che in sole 4 ore ha raccolto un milione e mezzo di dollari (fonte: ilpost.it). Durata di un progetto: quanto influsce sul successo dell’idea
  • 10. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ INDICE A È stato calcolato un semplice indice per valutare meglio l’andamento negli anni del successo generale dei progetti indice A=pledged/request Se l’indice è maggiore o uguale a 1, in linea generale i progetti riferiti a quel determinato anno hanno avuto un’ottima prestazione, in quanto la somma investita dai sostenitori è maggiore della somma richiesta. Al contrario, se l’indice è minore di 1, l’anno non ha avuto buone performance. Nel primo grafico, la clusterizzazione suddivide in tre gruppi gli anni di analisi: • Cluster 1 – anni 2014, 2015, 2016, 2017 con indice A al di sotto del valore medio (linea average) e minore di 1 (linea over); • Cluster 2 - anni 2009, 2010, 2011, 2013, al di sopra della media ma con indice A minore di 1; • Cluster 3 - anno 2012, il migliore da un punto di vista della perfomance dei progetti, con indice A maggiore di 1. Nel secondo grafico, viene visualizzato l’indice A per anno considerando solo i progetti di successo, quindi, ovviamente, tutti gli anni sono al di sopra della linea over. I progetti di successo degli anni 2012, 2013, 2014 hanno avuto performance migliori rispetto ai progetti di successo degli altri anni, perciò, in media, hanno raccolto somme più del doppio dei fondi richiesti. Indice A: andamento del successo generale dei progetti
  • 11. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Progetti falliti: dove si concentrano in europa La mappa a sinistra mostra la distribuzione in Europa dei progetti con esito «failed». Il Regno Unito è il Paese di origine della maggior parte dei progetti europei che non hanno avuto successo, ma probabilmente questo dato è condizionato anche dal fatto che è stato il primo Paese in UE in cui cittadini hanno potuto pubblicare progetti su Kickstarter, quindi a un numero maggiore di progetti corrisponde un numero maggiore di fallimenti a parità di probabilità di successo. A destra la mappa mostra la distribuzione in Europa del numero medio di donatori per progetto. A un colore più intenso corrisponde in media un numero maggiore di donatori per progetto.
  • 12. $ Trend ed engagement esterni al sito Quali sono le tematiche legate al mondo Kickstarter più discusse dagli utenti sui social?
  • 13. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Perché collezionare dati dal social Dopo aver analizzato i trend al livello mondiale del fenomeno Kickstarter, basandosi sui dati provenienti dal Dataset del sito, è stato deciso di analizzare i dati provenienti da un social network ed avviare un processo di scraping dei contenuti pubblici, italiani ed inglesi, per capire quali fossero le tematiche più discusse dagli utenti - e che creassero coinvolgimento maggiore - esternamente al sito madre. Come social è stato scelto Twitter (ricco di dati pubblici). Il processo di data ingestion ed ETL è stato effettuato mediante la creazione di script custom con Python che permettessero di collezionare in modo automatico i Tweet degli utenti inerenti all’argomento Kickstarter, senza dover utilizzare le API ufficiali. Per l'Italia sono stati raccolti tutti i Tweet compresi nel periodo 2009~2018, mentre per quanto riguarda i Tweet in lingua inglese sono stati raccolti i dati del 2017 e quelli disponibili per il 2018. * Flussi operativi Web Scraping: Kickstarter sui social * La mole di dati per la lingua inglese è tale che senza le API Enterprise ufficiali non è possibile collezionare in tempi brevi tutto lo storico degli anni passati. Analysis & Visualization Analisi sorgente Twitter ETLWeb Scraping
  • 14. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Trend su Twitter e interesse nelle ricerche Google Nel giugno del 2015 Kickstarter apre anche all’Italia la possibilità di creare e pubblicare progetti. evento che porta ad un’importante crescita nel coinvolgimento degli utenti che, da semplici spettatori, diventano protagonisti interessati a promuovere le proprie idee creative e raccogliere fondi per realizzarle. Utenti italiani: engagement su Twitter per il tema Kickstarter Giugno 2015
  • 15. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Latent Dirichlet Allocation I modelli statistici Topic Modelling offrono un metodo per organizzare, capire e raggruppare grandi collezioni di documenti testuali. Questi modelli possono essere descritti come metodi per identificare gruppi di parole (topic/argomenti), presenti in una collezione di documenti, che meglio rappresentano l’informazione di tale collezione. Esistono varie tecniche utilizzate per ottenere i Topic Model, come ad esempio l’LDA (modello di tipo bag-of- words), un algoritmo in grado di identificare ed estrarre frasi chiave rilevanti all'interno di un set di documenti. Nel modello LDA ciascun documento è visto come un un mix di argomenti presenti nel corpus totale. Il modello ipotizza che ogni parola del documento sia attribuibile a uno degli argomenti del documento. LDA su circa 170.ooo Tweet in lingua inglese (Gennaio – Marzo 2018) Topic #0: link life check sure backer friends 3d travel someone gonna [3d shared experience] Topic #1: one goal got thank people rt look good another stretch Topic #2: things final yet needs went believe innovation important least details Topic #3: project new last 2018 launches week tech first take dice [lancio progetti] Topic #4: backed comic art work edition create projects campaign part adventure [art, comic work] Topic #5: gaming novel horror seen graphic entrepreneur graphic novel stories products experience [ghaphic novel] Topic #6: forcefieldcloak comics ending rpg 100 find light lose dnd thing [product design] Topic #7: video anthology liked music liked video started crap action production video crap [video music] Topic #8: thanks great hours gamedev page ref series might backing 20 [video games] Topic #9: game check games see buy boardgames board card tabletop design [board games/tabletop] Topic #10: launch need soon way awesome help launching happy successful right [lancio progetti] Topic #11: back via want amazing best set ever little come funded Topic #12: new campaign now days support help live book get ve [lancio progetti] Topic #13: us popular backers re win cool looking march follow run Topic #14: know really think launched also looks super book fun can [book] Topic #15: crowdfunding indiegogo going funding go order story startup pre read [crowdfunding] LDA: un modello statistico per identificare topic
  • 16. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ LDA su circa 1000 Tweet in lingua italiana (Gennaio – Marzo 2018) Il numero di Tweet italiani sull’argomento Kickstarter per la lingua italiana, periodo Gen – Mar 2018 – è più ridotto a quelli disponibili per la lingua inglese. Topic #1: wireless finanziati usb content ricarica hub piccolo tratta 000 hyperdrive [accessori wireless] Topic #2: gamedev indiedev switch indiedev gamedev nintendo indiegame switch nintendo nintendoswitch horror [video game] Topic #3: video piaciuto video piaciuto gioco miniature 2018 potter harry harry potter sar [graphic novel] Topic #4: crowdfunding the campagna graphicnovel projects graphicnovel fralelabbra fralelabbra campagna crowdfunding iot bennybolla [board games] Topic #5: giochidatavolo boardgames boardgames giochidatavolo gioconauta gsnt nemesis para anteprima vedettaks giochidatavolo gsnt vedettaks [board games] Topic #6: 2018 it giochi news boardgames 03 2018 03 notizie it 2018 01 [tech/mobile] Topic #7: informatica telefonia telefonia informatica pi realizzato smart speaker acqua arduino iwinuxfeed [tech/mobile] Topic #8: by pu on serie new the auricolari voglio brand new new on [lancio progetto] Topic #9: febbraio lancio gaming perch campagna ces lifestyle arriva eh problemi [board games] Topic #10: projects the of gi games gioco play giochidatavolo progetto indie [lancio progetto] Topic #11: campagna fondi gioco it the pc good good life life finanziare [book] Topic #12: indiegamedev indies nintendo gamedev nintendoswitch campaign indiegame lancia arrivo arriva [tech/mobile] Topic #13: libro instagram oddworld origini wearable origini oddworld raccontate libro raccontate oddworld raccontate luglio [book] Topic #14: videogiochi lolistraw cannucce mazzo salvare bloodstained 2017 record crescono biodegrabile funding [eco sostenibilità] Topic #15: smartphone kite settimana podcast kit 3d kite kit 2018 kite smartphone arriva [tech/mobile] LDA: identificazione dei topic per I Tweet italiani
  • 17. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Italia vs Mondo I Topic, che raggruppano i documenti (testi dei tweet) in argomenti riconducibili a categorie di Kickstarter, hanno evidenziato caratteristiche comuni tra la realtà internazionale e la realtà italiana, quali l’utilizzo di Twitter per il lancio e la pubblicizzazione di progetti e la discussione su determinate categorie come «video games», «tabletop games», «book», «graphic novel». È interessante notare come solo un topic della realtà italiana sia riconducibile all’eco-sostenibilità, mentre a livello mondiale si confermano come categorie più discusse su Twitter le stesse che rientrano nelle top27 con percentuale di successo maggiore negli anni 2009-2017. Nel grafico sono riportate le top27 categorie del dataset di Kickstarter con numero di progetti di successo maggiore di 1000 negli anni di riferimento. LDA: topic estratti e top categorie per progetti di successo
  • 19. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ ETL: unione e pulizia dataset Kickstarter Talend Open Studio for Big Data & MySql Il dataset di partenza è il risultato di un’operazione di scraping Kickstarter, e raccoglie i dati della property a partire dal 2009, fino al Gennaio 2018 si presentava frammentato in circa 50 file, ed i dati contenuti erano «sporchi» e di vario formato. Per questa fase di merging ed ETL è stato utilizzato il software Talend Open Studio for Big Data. Di seguito le operazioni necessarie, in tre separati flussi: 1. Merging dei file in un unico dataset 2. Primo passaggio di pulizia e normalizzazione dati (Java + Regex). 3. Rimozione degli attributi non necessari e/o incompleti. 4. Store dei dati su DB e output file .csv
  • 20. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Scraping & ETL dei Tweet: Python vs Octoparse Gli script Python sono stati realizzati mediante la creazione di codice custom + utilizzo di librerie. Web scraping, pulizia , normalizzazione dati e LDA: moduli • Time, Datetime, strptime, timedelta : per la gestione degli oggetti di tipo data. • requests, selenium, webdriver, Keys, BeautifulSoup, Tweepy: per la gestione del DOM e le operazioni di browsing. • Json, csv, os, glob: per la gestione di file e pathnames • re: per la gestione di espressioni regolari • LatentDirichletAllocation, CountVectorizer: per identificare i topic presenti nel corpus di dati (Tweets) Web scraping e pulizia dei dati Inizialmente la fase di scraping è stata effettuata utilizzando il software Octoparse, il quale si è dimostrato lento e inadatto davanti a criticità quali: • Gestione di una grande mole di dati e processo di data ingestion. • Gestione delle risorse hardware a disposizione della macchina. • Gestione di stringhe con caratteri speciali. • Archiviazione ordinata e progressiva dei dataset parziali scaricati. • Gestione interruzione da parte di Twitter dei flussi di scraping. • Processo di ETL. Abbandonato Octoparse, è stato deciso di procedere con Python (2.7.x) per le creazione di script custom che permettessero di automatizzare tutto il processo di data ingestion da Twitter e di gestire tutte le casistiche sopra elencate. I flussi si suddividono in due fasi 1. Web Scraping e storaging dati 2. Merging e pulizia dei dati.
  • 21. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ Data Visualizzation: rappresentazione dei dati Tableau • Creazione di indici sintetici • Editing di alias di posizioni geografiche • Join con file dati esterni al dataset contenenti coordinate geografiche • Estrazione di parte di dati tramite formule • Creazione di set • Utilizzo di table calculation e mappe • Utilizzo di strumenti di analytics (trend line, regression, quantiles, reference lines) • Realizzazione di dashboard e story telling
  • 23. Prof. Mirko Cesarini .…a cool way to fund your project Francesca de Rose® – Marco Lacaria©2017 - 2018 $ È possibile prevedere il successo di un progetto? Dall’analisi effettuata sui dati, non emerge alcun trend che definisca una linearità di crescita/decrescita o stagionalità che possa garantire il successo o meno di una categoria di progetti, il quale sembra dipendere esclusivamente dall’originalità dell’idea e dalla passione dell’autore che coinvolge l’utenza, a prescindere dal momento e in cui il progetto nasce. Un elemento che può aumentare la probabilità di successo di un progetto è l’obiettivo fissato per realizzarlo: dalla tabella si evidenzia come la percentuale di successo diminuisca all’aumentare dell’intervallo della somma richiesta. Si può supporre che somme troppo elevate scoraggino i donatori, i quali potrebbero vedere l’obiettivo come irraggiungibile. Sulla base di queste considerazioni, abbiamo concluso che impostare, come next step, un processo di Machine Learning potrebbe essere pressoché pari a indovinare i numeri al lotto, vista la natura dei progetti, il cui successo è legato più al sentiment e alle passioni del pubblico che a valori economici che permettono una previsione tramite modelli statistici. $
  • 24. $ Le idee originali non sono prevedibili fine