2. Data management
Sintesi di quanto visto sino ad ora
I dati sono un asset strategico La gestione dei dati è complessa
3. Modello operativo
Il modello centrato sulle applicazioni
Problema
di business
Brainstorming
buy
build
rent
Applicazione Nuovo silos dati
Aumento
della
complessità
4. Cambio di paradigma
Poiché i dati sopravvivono alle applicazione che li generano la loro integrazione deve
essere gestita in modo strategico per mezzo di una piattaforma che ne permetta la
condivisione in modalità FAIR...
Findable
I dati devono essere facili da trovare potendo filtrare le ricerche secondo diversi
criteri (es. significato, qualità, freschezza, finalità del trattamento, …)
Accessible
I dati devono essere auto descrittivi e non devono necessitare di specifiche
applicazioni per essere interpretati. L’accesso sicuro ai dati è una responsabilità della
piattaforma di integrazione e non delle singole applicazioni
Interoperable
I dati devono essere espressi in un formato aperto e non proprietario
Reusable
I dati devono essere modellati al fine di garantire il riuso e non al fine di soddisfare le
esigenze di utilizzo di una specifica applicazione
Il modello centrato sui dati
Hybrid Integration Platform
Data Products
Federated Data Governance
5. Il modello data centrico
Opportunità
NOW: Application-Centric FUTURE: Data-Centric
I dati sono legati alle applicazioni.
I dati sono un asset aziendale che sopravvive alle applicazioni che li
hanno creati
Ogni nuovo progetto deve pagare una tassa di integrazione molto
costosa.
Ogni nuovo progetto si integra direttamente con la piattaforma di
integrazione per ottenere i dati di cui ha bisogno.
I dati sono frammentati in silos diversi per modalità di
rappresentazione, formato, terminologia e significato
I dati salvati nella piattaforma di integrazione al fine di essere condivisi
sono uniformi, non ambigui e di qualità certificata
I costi di integrazione consumano il 35%-65% del budget IT I costi di integrazione sono ridotti di un ordine di grandezza
6. Il modello data centrico
L’evoluzione dell’architettura verso una modalità operativa
più data centrica è un processo incrementale che può essere
realizzato attraverso una corretta impostazione dei progetti
IT già pianificati.
Non è tuttavia privo di rischi in quanto ha impatti non solo
tecnologici ma anche organizzativi e culturali che vanno
considera e opportunamente gestiti.
Come la migrazione verso il cloud o il riposizionamento del
ruolo del digital come abilitatore del business anche questo
cambio di paradigma che pone i dati al centro è innanzitutto
un processo di trasformazione.
Rischi
8. Modello data centrico
In questo contesto generale di migrazione verso il cloud
alcuni progetti “caldi” nel mondo del data management
possono essere usati , se opportunamente gestiti, per
cominciare il processo di trasformazione dell’architettura in
chiave maggiormente data centrica:
1. Modernizzazione dei sistemi legacy
2. Semplificazione del layer di storage
3. Definizione di un layer semantico
4. Self service analytics
5. Nuovi servizi basati su AI
Alcuni progetti abilitanti
9. Anti Fraud
La modernizzazione dei sistemi legacy è resa necessaria
dalle molteplici iniziative digital che spingono verso Loyalty
eCommerce
Recommendation
Engine
Advertising
Demand
Planning
Website
● una costante crescita dei touchpoint in una logica
omnicanale (System of Engagement)
non volendo però imbarcarsi in lunghi e rischiosi progetti
di dismissione di sistemi core su cui si sono concentrati
grossi investimenti negli anni passati.
● la necessità di sfruttare la convenienza, scalabilità e
innovazione del Cloud (Cloud Migration)
● lo sviluppo di moderne applicazioni basate sull’ AI
(System of Insight)
Marketing
Automation
Targeting
Smart
Payments
Legacy modernization
Business drivers
11. Real-time integration
L’integrazione dei dati in real-time è sempre più necessaria al fine di:
● Migliorare l’esperienza omnicanale garantendo un'integrazione
continua tra sistemi di backend (es. CRM e sistemi di cassa, ecc...) e
touchpoint digital (e-commerce, app, ecc..)
● Fornire un miglior servizio ai clienti garantendo una visione
unificata e costantemente aggiornata di entità o processi core
(single view del cliente per il marketing o il customer support,
real-time stock per i canali di vendita o per il replenishment)
● Rendere più veloce il passaggio dall’analisi all’azione garantendo lo
scambio di informazioni tra sistemi operazionali analitici e viceversa
con latenze inferiori al secondo
● Ridurre costi e rischi nel trasferimento dei dati garantendo
scalabilità, affidabilità e durabilità nello scambio di dati
Business drivers
By 2022, more than half of major new business
systems will incorporate continuous intelligence
that uses real-time context data to improve
decisions.
Source: Top 10 Data and Analytics Trends for 2019, Gartner (2019)
12. Real time integration
Data centricity
OLAP
OLTP OLTP
App. 1 App. 2
OLTP
App. 1 App. 3
Batch
API
Batch
OLTP
App. 1
Streaming
Share (Sink connectors)
Store (Data Bus)
Collect (Source connectors)
OLAP
App. 3
OLTP
App. 2
Domain
Events
ELT
ELT
13. Semplificazione dello storage layer
La piattaforme di gestione del dato analitico si stanno
spostando progressivamente in Cloud per ragioni di:
● scalabilità
● riduzione dei costi operativi
Allo stesso tempo le piattaforme di gestione del dato stanno
evolvendo in termini di convergenza e multimodalità.
La spinta verso una razionalizzazione del proprio stack
tecnologico per la gestione del dato è sempre più necessaria
per garantire:
● riduzione del TCO
● aumento del time to market
● evolvibilità dell’architettura
Business drivers
14. Semplificazione dello storage layer
Data centricity
SQL
Opportunità per ripensare la gestione delle data pipelines in chiave DataOps
e embeddare i processi di Data Governance
Convergenza tra DWH e Data Lake Convergenza tra OLTP e OLAP Convergenza tra DBMS e Streaming
15. Semantic layer
La centralizzazione degli accessi ai dati per mezzo di un layer
semantico unificato e coerente è sempre più necessaria la fine di
garantire:
1. autonomia nell’organizzazione dello storage e service layer (IT)
2. agilità nello sviluppo di nuovi data product (business)
3. sicurezza nell’uso corretto dei dati, in particolare di quelli
sensibili (compliance)
Business Drivers
● Less than half of an organization’s structured
data is actively used in making decisions—and
less than 1% of its unstructured data is analyzed
or used at all
● 92% of analysts’ time is spent simply discovering
and preparing data
Source: What’s Your Data Strategy? , Harvard Business Review (2017)
● More than 70% of employees have access to
data they should not
Source: Data Integration and Integrity End User Survey, IDC (2019)
IT BUSINESS COMPLIANCE
Autonomia Agilità Sicurezza
16. Centralizzazione degli accessi
Data centricity
Sistemi sorgente
Sistemi per l’integrazione dei dati
Applicazioni analitiche
ETL Data Bus
Sistemi Operazionali
Dati
semistrutturati Dati esterni
DWH
ODS Data Lake
Reporting Self Service BI Data Science
Altre
App.
Sistemi di storage
Data Virtualization
Sistemi sorgente
Sistemi per l’integrazione dei dati
Applicazioni analitiche
Data Bus
Sistemi Operazionali
Dati
semistrutturati Dati esterni
App.
Sistemi di storage
Service Layer
App. App.
Piano Operazionale
Digital Integration Hub
Piano Analitico
Logical Data Warehouse
17. Self-service analytics
Col crescere del numero di consumatori del dato è sempre
più necessario fornire modalità di accesso e analisi in
modalità self-service al fine di:
1. ridurre tempi di rilascio di nuove analisi
2. monitorare gli utilizzi dei dati
3. favorire il riutilizzo delle analisi oltre che dei dati
4. creare una cultura condivisa del dato
Business Drivers
18. Self-service analytics
Data centricity
Sistemi sorgente
Sistemi per l’integrazione dei dati
Applicazioni analitiche
ETL Data Bus
Sistemi Operazionali
Dati
semistrutturati Dati esterni
DWH
ODS Data Lake
Reporting Self Service BI Data Science
Altre
App.
Sistemi di storage
Data Virtualization
Sistemi sorgente
Sistemi per l’integrazione dei dati
Applicazioni analitiche
ETL Data Bus
Sistemi Operazionali
Dati
semistrutturat
i
Dati esterni
DWH
ODS Data Lake
Reportin
g
Self Service BI Data Science
Altre
App.
Sistemi di storage
Data Governance Data Marketplace
19. Artificial intelligence
L’industrializzazione dei processi di data science è sempre più
necessaria al fine di garantire:
1. Velocità del passaggio dalla sperimentazione alla
produzione
2. Riduzione dei costi tramite una razionalizzazione del
lavoro
3. Condivisione delle conoscenze e best practices tra i
vari data scientist
4. Aumentare l’affidabilità nel serving dei modelli
Business drivers
https://designingforanalytics.com/resources/failure-rates-for-analytics-bi-i
ot-and-big-data-projects-85-yikes/
20. Architettura di riferimento
Data centricity
“Only a small fraction of real-world ML systems is composed of the ML code,
as shown by the small black box in the middle. The required surrounding
infrastructure is vast and complex”
Hidden Technical Debt in Machine Learning Systems - Sculley et al. (2015)
Data
Engineer Data
Scientist
Operations
ML Platform
21. Hybrid Integration Platform
Architettura di riferimento
Hybrid Integration Platform
Data Products
Federated Data Governance
Logical
DWH
Digital
Integratio
n Hub
Streaming
Platform
22. Oltre l’architettura
Due modelli principali:
● Data fabric: ownership sui dati centralizzata sul team di data engineering.
I team di prodotto non sono direttamente coinvolti (basso impatto sul
modello attuale)
● Data mesh: ownership sui dati decentralizzata sui team di prodotto. Il
team di data engineering lavora sull’automazione della piattaforma di
integrazione in logica DataOps (alto impatto sul modello attuale)
E possibile avere un approccio ibrido per ridurre i rischi in un percorso di
transizione dal modello centralizzato a quello decentralizzato di gestione delle
ownership.
In ogni caso il modello di organizzazione della governance è sempre più
orientato ad una federazione delle responsabilità per garantire la sostenibilità
nel tempo
Modelli organizzativi
Hybrid Integration Platform
Data Products
Federated Data Governance
23. Percorso di trasformazione
I nostri servizi di advisory
INCEPTION ASSESSMENT FOUNDATION MOBILITIZATION EXECUTION
1 Giorno 3 Settimane 3 Settimane 3 Mesi Iterativo
Time frame
Identificazione drivers
Mappatura stakeholders
Definizione scope
Identificare impatti
Definizione criteri di successo
Mappatura architettura
Mappatura organizzazione
Individuazione pain point
Mappatura progetti
Mappatura use cases
Definizione principi
Definizione roadmap
Definizione governance
Definizione SLA e KPI
Proposta tecnologie
Integrazione con data
governance
Selezione use case
Implementazione use case
Review della strategy
Iterazione su portfolio
progetti
Misurazione risultati
review strategia
Program charter Risultati assessment
Proposta di action plan
Business case for data
strategy
Aggiornamento business
case for data strategy
24. TRAINING
EMBEDDED
ARCHITECTS
SOFTWARE
SELECTION
DATAOPS
Formazione frontale
e on the job
Workshop tematici
Inserimento di uno o
più senior data
architect nel team di
architetture o sui
progetti in area dati e
EA
Supporto alla
selezione del
software
Test di applicativi
Realizzazione
prototipi
Assessment su
specifiche parti
dell’architettura dati
Supporto
all’automazione ed
industrializzazione
dei processi di data
integration e
machine learning
Percorso di trasformazione
I nostri servizi di advisory
25. In conclusione...
1. Il dato è un asset strategico
2. Le modalità operative tradizionali di evoluzione della
architetture It genera inefficienze nella gestione del dato
3. Un modello operativo maggiormente centrato sui dati si sta
affermando
4. La trasformazione verso questo modello è un processo
incrementale che impatta tecnologie persone e processi
5. La migrazione verso il cloud è un’opportunità per accelerare
questa trasformazione
Takeaways