SlideShare a Scribd company logo
INTERNAL USE ONLY
BIG DATA, INTELLIGENZA ARTIFICIALE E
FINANZA
MILANO, 18 MARZO 2019 – UNIVERSITÀ MILANO-BICOCCA
Alessandro Greppi, PhD
CSTA - Certified SIAT Technical Analyst
INTERNAL USE ONLY
Disclaimer
Il presente per informare autori, associati e non, fruitori, che nessuna
responsabilità viene assunta da SIAT Associazione in relazione all’uso e/o
utilizzo dei contenuti intellettuali divulgati da, o attraverso, essa qualsiasi mezzo
divulgativo venga utilizzato:
partecipazione fisica ad eventi organizzati sia in propria sede o altrove;
partecipazione elettronica attraverso file di ogni genere, utilizzati per qualsiasi
finalità o prelevabili dal sito www.siat.org;
partecipazione mediatica attraverso videoregistrazioni od altro.
Tutti i contenuti divulgati (non costituiscono in nessun modo sollecitazione al
pubblico risparmio) internamente tra associati e/o esternamente anche a terze
parti, sono soggetti alla normativa vigente in materia di diritto d’autore e di
proprietà intellettuale, pertanto qualsiasi uso e/o utilizzo possa essere realizzato
deve essere preventivamente concordato direttamente tra l'autore ed il fruitore in
totale autonomia e responsabilità.
SIAT Associazione si dichiara a favore dell'esclusivo e totale rispetto delle norme
vigenti pertanto non sarà in alcun caso responsabile a qualunque titolo per
qualsiasi tipo di danno, diretto o indiretto, derivante da qualsiasi uso e/o utilizzo
dei contenuti divulgati.
INTERNAL USE ONLY
Benvenuti in una Nuova Era
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
6 Maggio
2017
Link all’articolo dell’Economist
I dati sono il nuovo
petrolio. Per monetizzare
è comunque necessario:
•Creare un database
•«Preparare» i dati (pre-
processing)
INTERNAL USE ONLY
Big Data: cosa sono e come devono essere?
Definizione: «Un sistema di Big Data si riferisce a dataset la cui taglia/volume è
talmente grande che eccede la capacità dei sistemi di database relazionali di
catturare, immagazzinare, gestire ed analizzare»(fonte: McKinsey Institute)
Qualità e Quantità del dato contano piùdi qualsiasi algoritmo
Se i dati input elaborati da un modello sono di bassa qualità, non si può
pretendere che l’output ne abbia:
«Garbage In, Garbage Out»
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Big Data: le 3V *
* Doug Laney
(2001)Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
«V» di Volume
Volume: si riferisce alla quantità di dati generati ogni secondo da fonti eterogenee
quali: sensori, log, eventi, email, social media e database tradizionali.
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
«V» di Varietà
Dati Strutturati Dati NON-StrutturatiDati SEMI-Strutturati
Database XML / JSON
Email
Pagine web
Audio
Video
Immagini
Natural Language
Documenti
Caratterizzati da una forte
organizzazione.
Esempio: file Excel / CSV
Non sono inseriti all’interno di
nessun «contenitore».
Necessitano di essere elaborati
per essere utilizzabili.
Includono dati o metadati che
permettono una analisi piùfacile
rispetto ai dati non-strutturati.
Varietà: si riferisce alla differente tipologia dei dati che vengono generati,
collezionati ed utilizzati.
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
«V» di Velocità
Velocità: si riferisce alla velocità con cui i nuovi dati vengono generati ma anche
alla necessità che queste informazioni arrivino real-time al fine di effettuare
analisi su di esse.
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Big Data e Mercati Finanziari
Quantifying Trading Behavior in Financial Markets Using Google
Trends (Preis, Moat and Stanley – 2013)
•https://www.nature.com/articles/srep01684
Abstract: Le nuove fonti di dati generati dall’interazione tra l’uomo e internet
possono offrire una nuova prospettiva riguardo al comportamento degli investitori.
Analizzando i cambiamenti dei volumi di ricerca di parole legate al mondo
finanziario su Google Trends, è possibile individuare dei segnali che anticipano
l’imminente movimento dei prezzi.
TedX Conference: Can Google Trend predict the stock market?
•https://www.youtube.com/watch?v=nwk0mfpOi_s
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Strategia di Trading basata su Google Trends
Fonte:
https://www.nature.com/articles/srep01684
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Strategia di Trading Usando la Parola «Culture»
Fonte:
https://www.nature.com/articles/srep01684
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Strategia di Trading Usando la Parola «Debt»
Fonte:
https://www.nature.com/articles/srep01684
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Cosa Rende una «Parola Chiave» di Successo?
(1/2)
Fonte:
https://www.nature.com/articles/srep016
84
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Cosa Rende una «Parola Chiave» di Successo?
(2/2)
Fonte:
https://www.nature.com/articles/srep016
84
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Dal dato «grezzo» al «segnale»
Necessità: trasformare una grande quantità di dati grezzi in conoscenza
In risposta a questo bisogno, nasce la data science che consiste in un approccio
multidisciplinare il cui obiettivo è quello di estrarre valore da diverse tipologie di
dato.
Competenze
Specifiche
Data
Visualization
Statistica
Data
Science
Data
Engineering
Calcolo
Avanzato
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Gli step della Data Science
Costruzione
del
database
Trasformazion
e dei dati
Pulizia dei dati
Preparazione
dei dati
Applicazione a
nuovi dati
Visualizzazion
e degli output
Validazione
del modello
Fase di
apprendimento
Ingegneria del dato
Machine Learning
Fase Operativa
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Le diverse tipologie di «apprendimento»
Apprendimento Supervisionato Apprendimento «rinforzato»
Apprendimento Non-
Supervisionato
L’algoritmo impara da un
database di esempio le risposte
corrette. Di fronte a dati nuovi,
cerca di applicare la conoscenza
cumulata per prevedere la
risposta giusta.
E’ l’algoritmo ad individuare i
pattern all’interno del database.
Non ha bisogno di suggerimenti
(dati «taggati») per dare la
risposta giusta.
Simile ad apprendimento non-
supervisionato.
I risultati vengono accompagnati
da feedback positivi o negativi.
Prescrittivo (algo deve
prendere decisione) e non solo
descrittivo.
Approcci di Machine Learning
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Focus sul «reinforcement learning»
Reinforcement learning: è una metodologia di apprendimento in cui il modello
ha come obiettivo di individuare il modo per massimizzare la ricompensa
ricevuta durante lo svolgimento di un compito preciso.
DeepMind (startup acquisita da
Google con focus su
applicazioni AI)
AlphaGo (Link al Trailer del
documentario)
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Machine Learning: questione di hardware
La fase di «apprendimento» richiede potenza di calcolo che un computer deve
essere in grado di offrire. Quali sono gli hardware su cui si può contare?
•CPU (central processor unit) – molto comuni (tutti i computer ne hanno una),
anche se non ottimali
•GPU (graphic processor unit – schede grafiche) – più adatte e più veloci nello
svolgere operazioni di calcolo complesse
•FPGA (field programmable gate array) – processori disegnati per svolgere calcoli
specifici (sono programmabili)
Big Data, Intelligenza Artificiale e Finanza – Alessandro
Greppi
INTERNAL USE ONLY
Sentiment Analysis con
Twitter
INTERNAL USE ONLY
Sentiment Analysis - Alessandro Greppi
Social Networks: una miniera di informazioni
Negli ultimi 10 anni, l’attività su internet è cresciuta esponenzialmente a livello
globale. Come diretta conseguenza, sulle piattaforme social vengono generati ogni
secondo svariati milioni di informazioni e contenuti
(www.internetlivestats.com).
I social network sono un mezzo per:
•Condividere i propri interessi
•Condividere le proprie idee
•Commentare servizi/prodotti
•Mettersi in contatto diretto con
aziende/servizi
•…
INTERNAL USE ONLY
Social Network Sentiment Analysis
La sentiment analysis consiste nell’analisi di un testo attraverso l’utilizzo di
natural language processing (NLP) e linguistica computazionale per identificare ed
estrapolare informazioni soggettive, come ad esempio opinioni o emozioni.
Questo approccio è ampiamente adottato sui testi in lingua inglese. Invece, l’analisi
dei contenuti in italiano è poco diffusa poiché incontra i seguenti ostacoli:
•il significato di alcune parole può risultare ambiguo
•il vocabolario italiano rispetto a quello inglese è molto piùvario e sfaccettato
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Perché l’analisi del sentiment? (focus su ambito
finanziario)
Dalla prospettiva dell’investitore, l’analisi del sentiment ci permette di capire
se ci sono aspettative positive/negative o un clima di
positività/negatività attorno a un titolo.
Qualora il sentiment del web fosse positivo su un titolo in particolare (una sorta di
«wisdom of the crowd»), quest’ultimo dovrebbe attirare un’ondata di acquisti e
conseguentemente il suo prezzo dovrebbe accelerare al rialzo. E viceversa.
Attenzione ai «troll» e alle fake news!
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Sentiment Analysis dei tweet: un duro lavoro (1/2)
1) Utente Interroga API
attraverso un client
(browser, app mobile…)
Invio richiesta
API
Risposta inviata
2) Il server viene interrogato
in base alla richiesta ricevuta
attraverso API
3) Il sistema una volta
elaborata la risposta, la inoltra
attraverso API all’utente che
ha condotto l’interrogazione
A differenza di altri social network (come Facebook o Linkedin), Twitter permette agli
utenti di scaricare contenuti dalla piattaforma attraverso delle API (Application
Programming Interface).
Come funziona una API
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Sentiment Analysis dei tweet: un duro lavoro (1/2)
Gli aspetti principali da monitorare durante l’analisi dei tweet sono:
•la qualità del dato
•decifrare il linguaggio gergale
•identificare il sarcasmo all’interno dei contenuti condivisi
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Definizione del processo
1) Creazione
di Twitter APP
4) Sentiment
Attribution
3) Pulizia dei
tweet
2) Estrazione
dei tweet
6) Data
Visualization
5) Sentiment
Score
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Case Study
«Quale società mineraria è responsabile del disastro nel video?»
Partiamo dall’ ipotesi per
assurdo di non avere
accesso a news o giornali
ma solo a Twitter.
L’obiettivo dell’analisi è
verificare se attraverso la
sola sentiment analysis
dei tweet postati dagli
account ufficiali di alcune
società minerarie
possiamo farci un’idea
sulla società responsabile
del disastro.
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Data Visualization: grafico Rio Tinto sentiment
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Data Visualization: grafico Rio Tinto sentiment
score
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Data Visualization: grafico Bhp sentiment
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Data Visualization: grafico Bhp sentiment score
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Data Visualization: grafico Vale sentiment
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Data Visualization: grafico Vale sentiment score
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
25 gennaio 2019 – Il disastro della diga di Vale in
Brasile
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Data visualization: grafico a torta score positivi
Le percentuali mostrate
rappresentano il peso dei tweet
positivi sul totale dei tweet
scaricati per ogni singola società.
Invece, il grafico a torta mostra
(senza numeri, solo visivamente)
l’incidenza dei tweet positivi sul
totale dei tweet scaricati per tutte
le società (Vale+RioTinto+Bhp)
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Data Visualization: grafico a torta score negativi
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Sentiment Analysis - Alessandro Greppi
Data Visualization: grafico a torta score neutrali
INTERNAL USE ONLY
Screenshot dell’account di Vale al momento
dell’analisi
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Screenshot dell’account di Rio Tinto al momento
dell’analisi
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
Screenshot dell’account di Bhp al momento
dell’analisi
Sentiment Analysis - Alessandro Greppi
INTERNAL USE ONLY
#SIAT4.0
Ringraziamenti
@SIAT_Italia SIAT Associazione
Corso Magenta 56 - 20123
MILANO
info@siat.org
+39 02 72094033
SIAT – Società Italiana Analisi TecnicaSIAT – Società Italiana Analisi Tecnica

More Related Content

Similar to Big Data, Intelligenza Artificiale e Finanza

Smau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSmau Bologna 2015 - AISM
Smau Bologna 2015 - AISM
SMAU
 
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Free Your Talent
 
Dai Big Data ai Relevant Data
Dai Big Data ai Relevant DataDai Big Data ai Relevant Data
Dai Big Data ai Relevant Data
Federico Capeci
 
KPI6.com
KPI6.comKPI6.com
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Keen Consulting
 
Big Data e AI nel Fintech
Big Data e AI nel FintechBig Data e AI nel Fintech
Big Data e AI nel Fintech
LucaBonamigo
 
Enterprise Web 2.0: tecnologie Web 2.0 nelle aziende
Enterprise Web 2.0: tecnologie Web 2.0 nelle aziendeEnterprise Web 2.0: tecnologie Web 2.0 nelle aziende
Enterprise Web 2.0: tecnologie Web 2.0 nelle aziende
oriefeiro
 
Smau big datawebreputation_2013
Smau big datawebreputation_2013Smau big datawebreputation_2013
Smau big datawebreputation_2013gigulle
 
Biz miz o1 m1_u1.1_r2_k (vl-sdl)_it
Biz miz o1 m1_u1.1_r2_k (vl-sdl)_itBiz miz o1 m1_u1.1_r2_k (vl-sdl)_it
Biz miz o1 m1_u1.1_r2_k (vl-sdl)_it
EmanuelePristera
 
Web1 A. Rossi Cercare Navigando Rev.2 02.12.2008
Web1  A. Rossi Cercare Navigando Rev.2 02.12.2008Web1  A. Rossi Cercare Navigando Rev.2 02.12.2008
Web1 A. Rossi Cercare Navigando Rev.2 02.12.2008
Andrea Rossi
 
NextCode 31 marzo 2021
NextCode 31 marzo 2021NextCode 31 marzo 2021
NextCode 31 marzo 2021
Mauro Bennici
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
Valerio Torriero
 
Ricerca immaginaria su un nuovo social
Ricerca immaginaria su un nuovo socialRicerca immaginaria su un nuovo social
Ricerca immaginaria su un nuovo socialDonato Nicolò Daniele
 
Remo Ponti - Do or do not, there is no try: How to set up a Social Enterprise...
Remo Ponti - Do or do not, there is no try: How to set up a Social Enterprise...Remo Ponti - Do or do not, there is no try: How to set up a Social Enterprise...
Remo Ponti - Do or do not, there is no try: How to set up a Social Enterprise...
OpenKnowledge srl
 
Data mining, business intelligence e dintorni
Data mining, business intelligence e dintorniData mining, business intelligence e dintorni
Data mining, business intelligence e dintorniMaurizio Girometti
 
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Dataninja
 
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Cultura Digitale
 
Multidisciplinarità nell'analisi delle conversazioni on line
Multidisciplinarità nell'analisi delle conversazioni on lineMultidisciplinarità nell'analisi delle conversazioni on line
Multidisciplinarità nell'analisi delle conversazioni on line
Rosario Dep Di Girolamo
 
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Data Driven Innovation
 

Similar to Big Data, Intelligenza Artificiale e Finanza (20)

Smau Bologna 2015 - AISM
Smau Bologna 2015 - AISMSmau Bologna 2015 - AISM
Smau Bologna 2015 - AISM
 
FANTIN BIG DATA (1)
FANTIN BIG DATA (1)FANTIN BIG DATA (1)
FANTIN BIG DATA (1)
 
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
Digital Transformation: Big Data, User Targeting ed Etica - Project Work Mast...
 
Dai Big Data ai Relevant Data
Dai Big Data ai Relevant DataDai Big Data ai Relevant Data
Dai Big Data ai Relevant Data
 
KPI6.com
KPI6.comKPI6.com
KPI6.com
 
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
Big Data e Terza Piattaforma (Eataly Smeraldo, 29 ottobre 2015)
 
Big Data e AI nel Fintech
Big Data e AI nel FintechBig Data e AI nel Fintech
Big Data e AI nel Fintech
 
Enterprise Web 2.0: tecnologie Web 2.0 nelle aziende
Enterprise Web 2.0: tecnologie Web 2.0 nelle aziendeEnterprise Web 2.0: tecnologie Web 2.0 nelle aziende
Enterprise Web 2.0: tecnologie Web 2.0 nelle aziende
 
Smau big datawebreputation_2013
Smau big datawebreputation_2013Smau big datawebreputation_2013
Smau big datawebreputation_2013
 
Biz miz o1 m1_u1.1_r2_k (vl-sdl)_it
Biz miz o1 m1_u1.1_r2_k (vl-sdl)_itBiz miz o1 m1_u1.1_r2_k (vl-sdl)_it
Biz miz o1 m1_u1.1_r2_k (vl-sdl)_it
 
Web1 A. Rossi Cercare Navigando Rev.2 02.12.2008
Web1  A. Rossi Cercare Navigando Rev.2 02.12.2008Web1  A. Rossi Cercare Navigando Rev.2 02.12.2008
Web1 A. Rossi Cercare Navigando Rev.2 02.12.2008
 
NextCode 31 marzo 2021
NextCode 31 marzo 2021NextCode 31 marzo 2021
NextCode 31 marzo 2021
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
Ricerca immaginaria su un nuovo social
Ricerca immaginaria su un nuovo socialRicerca immaginaria su un nuovo social
Ricerca immaginaria su un nuovo social
 
Remo Ponti - Do or do not, there is no try: How to set up a Social Enterprise...
Remo Ponti - Do or do not, there is no try: How to set up a Social Enterprise...Remo Ponti - Do or do not, there is no try: How to set up a Social Enterprise...
Remo Ponti - Do or do not, there is no try: How to set up a Social Enterprise...
 
Data mining, business intelligence e dintorni
Data mining, business intelligence e dintorniData mining, business intelligence e dintorni
Data mining, business intelligence e dintorni
 
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
Data Journalism: strumenti operativi | Bologna, 9 giugno 2014
 
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
Massimo Rosso - Social Media e Prodotti TV: esperienze di "Extended Audience"...
 
Multidisciplinarità nell'analisi delle conversazioni on line
Multidisciplinarità nell'analisi delle conversazioni on lineMultidisciplinarità nell'analisi delle conversazioni on line
Multidisciplinarità nell'analisi delle conversazioni on line
 
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
Il paradigma dei Big Data e Predictive Analysis, un valido supporto al contra...
 

More from Alessandro Greppi

Dall'Intelligent Investor all'Augmented Investor
Dall'Intelligent Investor all'Augmented InvestorDall'Intelligent Investor all'Augmented Investor
Dall'Intelligent Investor all'Augmented Investor
Alessandro Greppi
 
A.I. & Stock Selection: Quali sono i titoli caldi?
A.I. & Stock Selection: Quali sono i titoli caldi?A.I. & Stock Selection: Quali sono i titoli caldi?
A.I. & Stock Selection: Quali sono i titoli caldi?
Alessandro Greppi
 
Blockchain e AI: verso una nuova finanza
Blockchain e AI: verso una nuova finanzaBlockchain e AI: verso una nuova finanza
Blockchain e AI: verso una nuova finanza
Alessandro Greppi
 
Passato, presente e futuro del sistema bancario - progetto adotta un dottor...
Passato, presente e futuro del sistema bancario   - progetto adotta un dottor...Passato, presente e futuro del sistema bancario   - progetto adotta un dottor...
Passato, presente e futuro del sistema bancario - progetto adotta un dottor...
Alessandro Greppi
 
Cladag 2015 - Bayesian Networks for Financial Markets Volatility
Cladag 2015 -  Bayesian Networks for Financial Markets VolatilityCladag 2015 -  Bayesian Networks for Financial Markets Volatility
Cladag 2015 - Bayesian Networks for Financial Markets Volatility
Alessandro Greppi
 
CFA Research Challenge - Autogrill SpA - UniPV Team
CFA Research Challenge -   Autogrill SpA - UniPV TeamCFA Research Challenge -   Autogrill SpA - UniPV Team
CFA Research Challenge - Autogrill SpA - UniPV Team
Alessandro Greppi
 
Introduzioni ai mercati finanziari - progetto "adotta un dottorando"
Introduzioni ai mercati finanziari  - progetto "adotta un dottorando"Introduzioni ai mercati finanziari  - progetto "adotta un dottorando"
Introduzioni ai mercati finanziari - progetto "adotta un dottorando"
Alessandro Greppi
 
Financial Markets Signal Detection with Bayesian Networks - Phd DREAMT - Work...
Financial Markets Signal Detection with Bayesian Networks - Phd DREAMT - Work...Financial Markets Signal Detection with Bayesian Networks - Phd DREAMT - Work...
Financial Markets Signal Detection with Bayesian Networks - Phd DREAMT - Work...
Alessandro Greppi
 

More from Alessandro Greppi (8)

Dall'Intelligent Investor all'Augmented Investor
Dall'Intelligent Investor all'Augmented InvestorDall'Intelligent Investor all'Augmented Investor
Dall'Intelligent Investor all'Augmented Investor
 
A.I. & Stock Selection: Quali sono i titoli caldi?
A.I. & Stock Selection: Quali sono i titoli caldi?A.I. & Stock Selection: Quali sono i titoli caldi?
A.I. & Stock Selection: Quali sono i titoli caldi?
 
Blockchain e AI: verso una nuova finanza
Blockchain e AI: verso una nuova finanzaBlockchain e AI: verso una nuova finanza
Blockchain e AI: verso una nuova finanza
 
Passato, presente e futuro del sistema bancario - progetto adotta un dottor...
Passato, presente e futuro del sistema bancario   - progetto adotta un dottor...Passato, presente e futuro del sistema bancario   - progetto adotta un dottor...
Passato, presente e futuro del sistema bancario - progetto adotta un dottor...
 
Cladag 2015 - Bayesian Networks for Financial Markets Volatility
Cladag 2015 -  Bayesian Networks for Financial Markets VolatilityCladag 2015 -  Bayesian Networks for Financial Markets Volatility
Cladag 2015 - Bayesian Networks for Financial Markets Volatility
 
CFA Research Challenge - Autogrill SpA - UniPV Team
CFA Research Challenge -   Autogrill SpA - UniPV TeamCFA Research Challenge -   Autogrill SpA - UniPV Team
CFA Research Challenge - Autogrill SpA - UniPV Team
 
Introduzioni ai mercati finanziari - progetto "adotta un dottorando"
Introduzioni ai mercati finanziari  - progetto "adotta un dottorando"Introduzioni ai mercati finanziari  - progetto "adotta un dottorando"
Introduzioni ai mercati finanziari - progetto "adotta un dottorando"
 
Financial Markets Signal Detection with Bayesian Networks - Phd DREAMT - Work...
Financial Markets Signal Detection with Bayesian Networks - Phd DREAMT - Work...Financial Markets Signal Detection with Bayesian Networks - Phd DREAMT - Work...
Financial Markets Signal Detection with Bayesian Networks - Phd DREAMT - Work...
 

Big Data, Intelligenza Artificiale e Finanza

  • 1. INTERNAL USE ONLY BIG DATA, INTELLIGENZA ARTIFICIALE E FINANZA MILANO, 18 MARZO 2019 – UNIVERSITÀ MILANO-BICOCCA Alessandro Greppi, PhD CSTA - Certified SIAT Technical Analyst
  • 2. INTERNAL USE ONLY Disclaimer Il presente per informare autori, associati e non, fruitori, che nessuna responsabilità viene assunta da SIAT Associazione in relazione all’uso e/o utilizzo dei contenuti intellettuali divulgati da, o attraverso, essa qualsiasi mezzo divulgativo venga utilizzato: partecipazione fisica ad eventi organizzati sia in propria sede o altrove; partecipazione elettronica attraverso file di ogni genere, utilizzati per qualsiasi finalità o prelevabili dal sito www.siat.org; partecipazione mediatica attraverso videoregistrazioni od altro. Tutti i contenuti divulgati (non costituiscono in nessun modo sollecitazione al pubblico risparmio) internamente tra associati e/o esternamente anche a terze parti, sono soggetti alla normativa vigente in materia di diritto d’autore e di proprietà intellettuale, pertanto qualsiasi uso e/o utilizzo possa essere realizzato deve essere preventivamente concordato direttamente tra l'autore ed il fruitore in totale autonomia e responsabilità. SIAT Associazione si dichiara a favore dell'esclusivo e totale rispetto delle norme vigenti pertanto non sarà in alcun caso responsabile a qualunque titolo per qualsiasi tipo di danno, diretto o indiretto, derivante da qualsiasi uso e/o utilizzo dei contenuti divulgati.
  • 3. INTERNAL USE ONLY Benvenuti in una Nuova Era Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi 6 Maggio 2017 Link all’articolo dell’Economist I dati sono il nuovo petrolio. Per monetizzare è comunque necessario: •Creare un database •«Preparare» i dati (pre- processing)
  • 4. INTERNAL USE ONLY Big Data: cosa sono e come devono essere? Definizione: «Un sistema di Big Data si riferisce a dataset la cui taglia/volume è talmente grande che eccede la capacità dei sistemi di database relazionali di catturare, immagazzinare, gestire ed analizzare»(fonte: McKinsey Institute) Qualità e Quantità del dato contano piùdi qualsiasi algoritmo Se i dati input elaborati da un modello sono di bassa qualità, non si può pretendere che l’output ne abbia: «Garbage In, Garbage Out» Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 5. INTERNAL USE ONLY Big Data: le 3V * * Doug Laney (2001)Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 6. INTERNAL USE ONLY «V» di Volume Volume: si riferisce alla quantità di dati generati ogni secondo da fonti eterogenee quali: sensori, log, eventi, email, social media e database tradizionali. Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 7. INTERNAL USE ONLY «V» di Varietà Dati Strutturati Dati NON-StrutturatiDati SEMI-Strutturati Database XML / JSON Email Pagine web Audio Video Immagini Natural Language Documenti Caratterizzati da una forte organizzazione. Esempio: file Excel / CSV Non sono inseriti all’interno di nessun «contenitore». Necessitano di essere elaborati per essere utilizzabili. Includono dati o metadati che permettono una analisi piùfacile rispetto ai dati non-strutturati. Varietà: si riferisce alla differente tipologia dei dati che vengono generati, collezionati ed utilizzati. Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 8. INTERNAL USE ONLY «V» di Velocità Velocità: si riferisce alla velocità con cui i nuovi dati vengono generati ma anche alla necessità che queste informazioni arrivino real-time al fine di effettuare analisi su di esse. Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 9. INTERNAL USE ONLY Big Data e Mercati Finanziari Quantifying Trading Behavior in Financial Markets Using Google Trends (Preis, Moat and Stanley – 2013) •https://www.nature.com/articles/srep01684 Abstract: Le nuove fonti di dati generati dall’interazione tra l’uomo e internet possono offrire una nuova prospettiva riguardo al comportamento degli investitori. Analizzando i cambiamenti dei volumi di ricerca di parole legate al mondo finanziario su Google Trends, è possibile individuare dei segnali che anticipano l’imminente movimento dei prezzi. TedX Conference: Can Google Trend predict the stock market? •https://www.youtube.com/watch?v=nwk0mfpOi_s Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 10. INTERNAL USE ONLY Strategia di Trading basata su Google Trends Fonte: https://www.nature.com/articles/srep01684 Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 11. INTERNAL USE ONLY Strategia di Trading Usando la Parola «Culture» Fonte: https://www.nature.com/articles/srep01684 Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 12. INTERNAL USE ONLY Strategia di Trading Usando la Parola «Debt» Fonte: https://www.nature.com/articles/srep01684 Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 13. INTERNAL USE ONLY Cosa Rende una «Parola Chiave» di Successo? (1/2) Fonte: https://www.nature.com/articles/srep016 84 Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 14. INTERNAL USE ONLY Cosa Rende una «Parola Chiave» di Successo? (2/2) Fonte: https://www.nature.com/articles/srep016 84 Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 15. INTERNAL USE ONLY Dal dato «grezzo» al «segnale» Necessità: trasformare una grande quantità di dati grezzi in conoscenza In risposta a questo bisogno, nasce la data science che consiste in un approccio multidisciplinare il cui obiettivo è quello di estrarre valore da diverse tipologie di dato. Competenze Specifiche Data Visualization Statistica Data Science Data Engineering Calcolo Avanzato Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 16. INTERNAL USE ONLY Gli step della Data Science Costruzione del database Trasformazion e dei dati Pulizia dei dati Preparazione dei dati Applicazione a nuovi dati Visualizzazion e degli output Validazione del modello Fase di apprendimento Ingegneria del dato Machine Learning Fase Operativa Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 17. INTERNAL USE ONLY Le diverse tipologie di «apprendimento» Apprendimento Supervisionato Apprendimento «rinforzato» Apprendimento Non- Supervisionato L’algoritmo impara da un database di esempio le risposte corrette. Di fronte a dati nuovi, cerca di applicare la conoscenza cumulata per prevedere la risposta giusta. E’ l’algoritmo ad individuare i pattern all’interno del database. Non ha bisogno di suggerimenti (dati «taggati») per dare la risposta giusta. Simile ad apprendimento non- supervisionato. I risultati vengono accompagnati da feedback positivi o negativi. Prescrittivo (algo deve prendere decisione) e non solo descrittivo. Approcci di Machine Learning Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 18. INTERNAL USE ONLY Focus sul «reinforcement learning» Reinforcement learning: è una metodologia di apprendimento in cui il modello ha come obiettivo di individuare il modo per massimizzare la ricompensa ricevuta durante lo svolgimento di un compito preciso. DeepMind (startup acquisita da Google con focus su applicazioni AI) AlphaGo (Link al Trailer del documentario) Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 19. INTERNAL USE ONLY Machine Learning: questione di hardware La fase di «apprendimento» richiede potenza di calcolo che un computer deve essere in grado di offrire. Quali sono gli hardware su cui si può contare? •CPU (central processor unit) – molto comuni (tutti i computer ne hanno una), anche se non ottimali •GPU (graphic processor unit – schede grafiche) – più adatte e più veloci nello svolgere operazioni di calcolo complesse •FPGA (field programmable gate array) – processori disegnati per svolgere calcoli specifici (sono programmabili) Big Data, Intelligenza Artificiale e Finanza – Alessandro Greppi
  • 20. INTERNAL USE ONLY Sentiment Analysis con Twitter
  • 21. INTERNAL USE ONLY Sentiment Analysis - Alessandro Greppi Social Networks: una miniera di informazioni Negli ultimi 10 anni, l’attività su internet è cresciuta esponenzialmente a livello globale. Come diretta conseguenza, sulle piattaforme social vengono generati ogni secondo svariati milioni di informazioni e contenuti (www.internetlivestats.com). I social network sono un mezzo per: •Condividere i propri interessi •Condividere le proprie idee •Commentare servizi/prodotti •Mettersi in contatto diretto con aziende/servizi •…
  • 22. INTERNAL USE ONLY Social Network Sentiment Analysis La sentiment analysis consiste nell’analisi di un testo attraverso l’utilizzo di natural language processing (NLP) e linguistica computazionale per identificare ed estrapolare informazioni soggettive, come ad esempio opinioni o emozioni. Questo approccio è ampiamente adottato sui testi in lingua inglese. Invece, l’analisi dei contenuti in italiano è poco diffusa poiché incontra i seguenti ostacoli: •il significato di alcune parole può risultare ambiguo •il vocabolario italiano rispetto a quello inglese è molto piùvario e sfaccettato Sentiment Analysis - Alessandro Greppi
  • 23. INTERNAL USE ONLY Perché l’analisi del sentiment? (focus su ambito finanziario) Dalla prospettiva dell’investitore, l’analisi del sentiment ci permette di capire se ci sono aspettative positive/negative o un clima di positività/negatività attorno a un titolo. Qualora il sentiment del web fosse positivo su un titolo in particolare (una sorta di «wisdom of the crowd»), quest’ultimo dovrebbe attirare un’ondata di acquisti e conseguentemente il suo prezzo dovrebbe accelerare al rialzo. E viceversa. Attenzione ai «troll» e alle fake news! Sentiment Analysis - Alessandro Greppi
  • 24. INTERNAL USE ONLY Sentiment Analysis dei tweet: un duro lavoro (1/2) 1) Utente Interroga API attraverso un client (browser, app mobile…) Invio richiesta API Risposta inviata 2) Il server viene interrogato in base alla richiesta ricevuta attraverso API 3) Il sistema una volta elaborata la risposta, la inoltra attraverso API all’utente che ha condotto l’interrogazione A differenza di altri social network (come Facebook o Linkedin), Twitter permette agli utenti di scaricare contenuti dalla piattaforma attraverso delle API (Application Programming Interface). Come funziona una API Sentiment Analysis - Alessandro Greppi
  • 25. INTERNAL USE ONLY Sentiment Analysis dei tweet: un duro lavoro (1/2) Gli aspetti principali da monitorare durante l’analisi dei tweet sono: •la qualità del dato •decifrare il linguaggio gergale •identificare il sarcasmo all’interno dei contenuti condivisi Sentiment Analysis - Alessandro Greppi
  • 26. INTERNAL USE ONLY Definizione del processo 1) Creazione di Twitter APP 4) Sentiment Attribution 3) Pulizia dei tweet 2) Estrazione dei tweet 6) Data Visualization 5) Sentiment Score Sentiment Analysis - Alessandro Greppi
  • 27. INTERNAL USE ONLY Case Study «Quale società mineraria è responsabile del disastro nel video?» Partiamo dall’ ipotesi per assurdo di non avere accesso a news o giornali ma solo a Twitter. L’obiettivo dell’analisi è verificare se attraverso la sola sentiment analysis dei tweet postati dagli account ufficiali di alcune società minerarie possiamo farci un’idea sulla società responsabile del disastro. Sentiment Analysis - Alessandro Greppi
  • 28. INTERNAL USE ONLY Data Visualization: grafico Rio Tinto sentiment Sentiment Analysis - Alessandro Greppi
  • 29. INTERNAL USE ONLY Data Visualization: grafico Rio Tinto sentiment score Sentiment Analysis - Alessandro Greppi
  • 30. INTERNAL USE ONLY Data Visualization: grafico Bhp sentiment Sentiment Analysis - Alessandro Greppi
  • 31. INTERNAL USE ONLY Data Visualization: grafico Bhp sentiment score Sentiment Analysis - Alessandro Greppi
  • 32. INTERNAL USE ONLY Data Visualization: grafico Vale sentiment Sentiment Analysis - Alessandro Greppi
  • 33. INTERNAL USE ONLY Data Visualization: grafico Vale sentiment score Sentiment Analysis - Alessandro Greppi
  • 34. INTERNAL USE ONLY 25 gennaio 2019 – Il disastro della diga di Vale in Brasile Sentiment Analysis - Alessandro Greppi
  • 35. INTERNAL USE ONLY Data visualization: grafico a torta score positivi Le percentuali mostrate rappresentano il peso dei tweet positivi sul totale dei tweet scaricati per ogni singola società. Invece, il grafico a torta mostra (senza numeri, solo visivamente) l’incidenza dei tweet positivi sul totale dei tweet scaricati per tutte le società (Vale+RioTinto+Bhp) Sentiment Analysis - Alessandro Greppi
  • 36. INTERNAL USE ONLY Data Visualization: grafico a torta score negativi Sentiment Analysis - Alessandro Greppi
  • 37. INTERNAL USE ONLY Sentiment Analysis - Alessandro Greppi Data Visualization: grafico a torta score neutrali
  • 38. INTERNAL USE ONLY Screenshot dell’account di Vale al momento dell’analisi Sentiment Analysis - Alessandro Greppi
  • 39. INTERNAL USE ONLY Screenshot dell’account di Rio Tinto al momento dell’analisi Sentiment Analysis - Alessandro Greppi
  • 40. INTERNAL USE ONLY Screenshot dell’account di Bhp al momento dell’analisi Sentiment Analysis - Alessandro Greppi
  • 41. INTERNAL USE ONLY #SIAT4.0 Ringraziamenti @SIAT_Italia SIAT Associazione Corso Magenta 56 - 20123 MILANO info@siat.org +39 02 72094033 SIAT – Società Italiana Analisi TecnicaSIAT – Società Italiana Analisi Tecnica