SlideShare a Scribd company logo
1 of 25
Download to read offline
Modello data centrico
I Software passano, i Dati restano
Data management
Sintesi di quanto visto sino ad ora
I dati sono un asset strategico La gestione dei dati è complessa
Modello operativo
Il modello centrato sulle applicazioni
Problema
di business
Brainstorming
buy
build
rent
Applicazione Nuovo silos dati
Aumento
della
complessità
Cambio di paradigma
Poiché i dati sopravvivono alle applicazione che li generano la loro integrazione deve
essere gestita in modo strategico per mezzo di una piattaforma che ne permetta la
condivisione in modalità FAIR...
Findable
I dati devono essere facili da trovare potendo filtrare le ricerche secondo diversi
criteri (es. significato, qualità, freschezza, finalità del trattamento, …)
Accessible
I dati devono essere auto descrittivi e non devono necessitare di specifiche
applicazioni per essere interpretati. L’accesso sicuro ai dati è una responsabilità della
piattaforma di integrazione e non delle singole applicazioni
Interoperable
I dati devono essere espressi in un formato aperto e non proprietario
Reusable
I dati devono essere modellati al fine di garantire il riuso e non al fine di soddisfare le
esigenze di utilizzo di una specifica applicazione
Il modello centrato sui dati
Hybrid Integration Platform
Data Products
Federated Data Governance
Il modello data centrico
Opportunità
NOW: Application-Centric FUTURE: Data-Centric
I dati sono legati alle applicazioni.
I dati sono un asset aziendale che sopravvive alle applicazioni che li
hanno creati
Ogni nuovo progetto deve pagare una tassa di integrazione molto
costosa.
Ogni nuovo progetto si integra direttamente con la piattaforma di
integrazione per ottenere i dati di cui ha bisogno.
I dati sono frammentati in silos diversi per modalità di
rappresentazione, formato, terminologia e significato
I dati salvati nella piattaforma di integrazione al fine di essere condivisi
sono uniformi, non ambigui e di qualità certificata
I costi di integrazione consumano il 35%-65% del budget IT I costi di integrazione sono ridotti di un ordine di grandezza
Il modello data centrico
L’evoluzione dell’architettura verso una modalità operativa
più data centrica è un processo incrementale che può essere
realizzato attraverso una corretta impostazione dei progetti
IT già pianificati.
Non è tuttavia privo di rischi in quanto ha impatti non solo
tecnologici ma anche organizzativi e culturali che vanno
considera e opportunamente gestiti.
Come la migrazione verso il cloud o il riposizionamento del
ruolo del digital come abilitatore del business anche questo
cambio di paradigma che pone i dati al centro è innanzitutto
un processo di trasformazione.
Rischi
L’opportunità del Cloud
Se non ora quando?
3.345 M
+21% YoY
Modello data centrico
In questo contesto generale di migrazione verso il cloud
alcuni progetti “caldi” nel mondo del data management
possono essere usati , se opportunamente gestiti, per
cominciare il processo di trasformazione dell’architettura in
chiave maggiormente data centrica:
1. Modernizzazione dei sistemi legacy
2. Semplificazione del layer di storage
3. Definizione di un layer semantico
4. Self service analytics
5. Nuovi servizi basati su AI
Alcuni progetti abilitanti
Anti Fraud
La modernizzazione dei sistemi legacy è resa necessaria
dalle molteplici iniziative digital che spingono verso Loyalty
eCommerce
Recommendation
Engine
Advertising
Demand
Planning
Website
● una costante crescita dei touchpoint in una logica
omnicanale (System of Engagement)
non volendo però imbarcarsi in lunghi e rischiosi progetti
di dismissione di sistemi core su cui si sono concentrati
grossi investimenti negli anni passati.
● la necessità di sfruttare la convenienza, scalabilità e
innovazione del Cloud (Cloud Migration)
● lo sviluppo di moderne applicazioni basate sull’ AI
(System of Insight)
Marketing
Automation
Targeting
Smart
Payments
Legacy modernization
Business drivers
Share
Store
Collect
Anti Fraud
Cross Canalità
Loyalty
eCommerce
Recommendation
Engine
Advertisin
g
Demand
Planning
Website
Marketing
Automatio
n
Targeting
Smart
Payments
Anti Fraud
Omni Canalità
Loyalty
eCommerce
Recommendation
Engine
Advertisin
g
Demand
Planning
Website
Marketing
Automatio
n
Targeting
Smart
Payments
DATA
PLATFORM
Legacy modernization
Data centricity
Real-time integration
L’integrazione dei dati in real-time è sempre più necessaria al fine di:
● Migliorare l’esperienza omnicanale garantendo un'integrazione
continua tra sistemi di backend (es. CRM e sistemi di cassa, ecc...) e
touchpoint digital (e-commerce, app, ecc..)
● Fornire un miglior servizio ai clienti garantendo una visione
unificata e costantemente aggiornata di entità o processi core
(single view del cliente per il marketing o il customer support,
real-time stock per i canali di vendita o per il replenishment)
● Rendere più veloce il passaggio dall’analisi all’azione garantendo lo
scambio di informazioni tra sistemi operazionali analitici e viceversa
con latenze inferiori al secondo
● Ridurre costi e rischi nel trasferimento dei dati garantendo
scalabilità, affidabilità e durabilità nello scambio di dati
Business drivers
By 2022, more than half of major new business
systems will incorporate continuous intelligence
that uses real-time context data to improve
decisions.
Source: Top 10 Data and Analytics Trends for 2019, Gartner (2019)
Real time integration
Data centricity
OLAP
OLTP OLTP
App. 1 App. 2
OLTP
App. 1 App. 3
Batch
API
Batch
OLTP
App. 1
Streaming
Share (Sink connectors)
Store (Data Bus)
Collect (Source connectors)
OLAP
App. 3
OLTP
App. 2
Domain
Events
ELT
ELT
Semplificazione dello storage layer
La piattaforme di gestione del dato analitico si stanno
spostando progressivamente in Cloud per ragioni di:
● scalabilità
● riduzione dei costi operativi
Allo stesso tempo le piattaforme di gestione del dato stanno
evolvendo in termini di convergenza e multimodalità.
La spinta verso una razionalizzazione del proprio stack
tecnologico per la gestione del dato è sempre più necessaria
per garantire:
● riduzione del TCO
● aumento del time to market
● evolvibilità dell’architettura
Business drivers
Semplificazione dello storage layer
Data centricity
SQL
Opportunità per ripensare la gestione delle data pipelines in chiave DataOps
e embeddare i processi di Data Governance
Convergenza tra DWH e Data Lake Convergenza tra OLTP e OLAP Convergenza tra DBMS e Streaming
Semantic layer
La centralizzazione degli accessi ai dati per mezzo di un layer
semantico unificato e coerente è sempre più necessaria la fine di
garantire:
1. autonomia nell’organizzazione dello storage e service layer (IT)
2. agilità nello sviluppo di nuovi data product (business)
3. sicurezza nell’uso corretto dei dati, in particolare di quelli
sensibili (compliance)
Business Drivers
● Less than half of an organization’s structured
data is actively used in making decisions—and
less than 1% of its unstructured data is analyzed
or used at all
● 92% of analysts’ time is spent simply discovering
and preparing data
Source: What’s Your Data Strategy? , Harvard Business Review (2017)
● More than 70% of employees have access to
data they should not
Source: Data Integration and Integrity End User Survey, IDC (2019)
IT BUSINESS COMPLIANCE
Autonomia Agilità Sicurezza
Centralizzazione degli accessi
Data centricity
Sistemi sorgente
Sistemi per l’integrazione dei dati
Applicazioni analitiche
ETL Data Bus
Sistemi Operazionali
Dati
semistrutturati Dati esterni
DWH
ODS Data Lake
Reporting Self Service BI Data Science
Altre
App.
Sistemi di storage
Data Virtualization
Sistemi sorgente
Sistemi per l’integrazione dei dati
Applicazioni analitiche
Data Bus
Sistemi Operazionali
Dati
semistrutturati Dati esterni
App.
Sistemi di storage
Service Layer
App. App.
Piano Operazionale
Digital Integration Hub
Piano Analitico
Logical Data Warehouse
Self-service analytics
Col crescere del numero di consumatori del dato è sempre
più necessario fornire modalità di accesso e analisi in
modalità self-service al fine di:
1. ridurre tempi di rilascio di nuove analisi
2. monitorare gli utilizzi dei dati
3. favorire il riutilizzo delle analisi oltre che dei dati
4. creare una cultura condivisa del dato
Business Drivers
Self-service analytics
Data centricity
Sistemi sorgente
Sistemi per l’integrazione dei dati
Applicazioni analitiche
ETL Data Bus
Sistemi Operazionali
Dati
semistrutturati Dati esterni
DWH
ODS Data Lake
Reporting Self Service BI Data Science
Altre
App.
Sistemi di storage
Data Virtualization
Sistemi sorgente
Sistemi per l’integrazione dei dati
Applicazioni analitiche
ETL Data Bus
Sistemi Operazionali
Dati
semistrutturat
i
Dati esterni
DWH
ODS Data Lake
Reportin
g
Self Service BI Data Science
Altre
App.
Sistemi di storage
Data Governance Data Marketplace
Artificial intelligence
L’industrializzazione dei processi di data science è sempre più
necessaria al fine di garantire:
1. Velocità del passaggio dalla sperimentazione alla
produzione
2. Riduzione dei costi tramite una razionalizzazione del
lavoro
3. Condivisione delle conoscenze e best practices tra i
vari data scientist
4. Aumentare l’affidabilità nel serving dei modelli
Business drivers
https://designingforanalytics.com/resources/failure-rates-for-analytics-bi-i
ot-and-big-data-projects-85-yikes/
Architettura di riferimento
Data centricity
“Only a small fraction of real-world ML systems is composed of the ML code,
as shown by the small black box in the middle. The required surrounding
infrastructure is vast and complex”
Hidden Technical Debt in Machine Learning Systems - Sculley et al. (2015)
Data
Engineer Data
Scientist
Operations
ML Platform
Hybrid Integration Platform
Architettura di riferimento
Hybrid Integration Platform
Data Products
Federated Data Governance
Logical
DWH
Digital
Integratio
n Hub
Streaming
Platform
Oltre l’architettura
Due modelli principali:
● Data fabric: ownership sui dati centralizzata sul team di data engineering.
I team di prodotto non sono direttamente coinvolti (basso impatto sul
modello attuale)
● Data mesh: ownership sui dati decentralizzata sui team di prodotto. Il
team di data engineering lavora sull’automazione della piattaforma di
integrazione in logica DataOps (alto impatto sul modello attuale)
E possibile avere un approccio ibrido per ridurre i rischi in un percorso di
transizione dal modello centralizzato a quello decentralizzato di gestione delle
ownership.
In ogni caso il modello di organizzazione della governance è sempre più
orientato ad una federazione delle responsabilità per garantire la sostenibilità
nel tempo
Modelli organizzativi
Hybrid Integration Platform
Data Products
Federated Data Governance
Percorso di trasformazione
I nostri servizi di advisory
INCEPTION ASSESSMENT FOUNDATION MOBILITIZATION EXECUTION
1 Giorno 3 Settimane 3 Settimane 3 Mesi Iterativo
Time frame
Identificazione drivers
Mappatura stakeholders
Definizione scope
Identificare impatti
Definizione criteri di successo
Mappatura architettura
Mappatura organizzazione
Individuazione pain point
Mappatura progetti
Mappatura use cases
Definizione principi
Definizione roadmap
Definizione governance
Definizione SLA e KPI
Proposta tecnologie
Integrazione con data
governance
Selezione use case
Implementazione use case
Review della strategy
Iterazione su portfolio
progetti
Misurazione risultati
review strategia
Program charter Risultati assessment
Proposta di action plan
Business case for data
strategy
Aggiornamento business
case for data strategy
TRAINING
EMBEDDED
ARCHITECTS
SOFTWARE
SELECTION
DATAOPS
Formazione frontale
e on the job
Workshop tematici
Inserimento di uno o
più senior data
architect nel team di
architetture o sui
progetti in area dati e
EA
Supporto alla
selezione del
software
Test di applicativi
Realizzazione
prototipi
Assessment su
specifiche parti
dell’architettura dati
Supporto
all’automazione ed
industrializzazione
dei processi di data
integration e
machine learning
Percorso di trasformazione
I nostri servizi di advisory
In conclusione...
1. Il dato è un asset strategico
2. Le modalità operative tradizionali di evoluzione della
architetture It genera inefficienze nella gestione del dato
3. Un modello operativo maggiormente centrato sui dati si sta
affermando
4. La trasformazione verso questo modello è un processo
incrementale che impatta tecnologie persone e processi
5. La migrazione verso il cloud è un’opportunità per accelerare
questa trasformazione
Takeaways

More Related Content

Similar to I Software passano, i Dati restano.pdf

Digital 4 e guide - Hybrid Cloud come scegliere il meglio tra virtuale e fisi...
Digital 4 e guide - Hybrid Cloud come scegliere il meglio tra virtuale e fisi...Digital 4 e guide - Hybrid Cloud come scegliere il meglio tra virtuale e fisi...
Digital 4 e guide - Hybrid Cloud come scegliere il meglio tra virtuale e fisi...Alberto Ferretti
 
Digital Integration Hub per il monitoraggio in near-real time della logistica...
Digital Integration Hub per il monitoraggio in near-real time della logistica...Digital Integration Hub per il monitoraggio in near-real time della logistica...
Digital Integration Hub per il monitoraggio in near-real time della logistica...confluent
 
La nuova generazione dei gestionali cloud
La nuova generazione dei gestionali cloudLa nuova generazione dei gestionali cloud
La nuova generazione dei gestionali cloudRoberta Fiorucci
 
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdfRipartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdfAndrea Gioia
 
7tips trasformazione-digitale-electra-nadalini
7tips trasformazione-digitale-electra-nadalini7tips trasformazione-digitale-electra-nadalini
7tips trasformazione-digitale-electra-nadaliniElectra Nadalini
 
SMAU MILANO 2022 | Digital transformation.pptx
SMAU MILANO 2022 | Digital transformation.pptxSMAU MILANO 2022 | Digital transformation.pptx
SMAU MILANO 2022 | Digital transformation.pptxSMAU
 
Business intelligence v0.3
Business intelligence v0.3Business intelligence v0.3
Business intelligence v0.3Luca Mauri
 
Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Denodo
 
Data Strategy per trasformare i dati in asset strategici aziendali
Data Strategy per trasformare i dati in asset strategici aziendaliData Strategy per trasformare i dati in asset strategici aziendali
Data Strategy per trasformare i dati in asset strategici aziendaliDenodo
 
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...Denodo
 
M. Fedeli, Prospettive nella cooperazione tra piattaforme informatiche pubbli...
M. Fedeli, Prospettive nella cooperazione tra piattaforme informatiche pubbli...M. Fedeli, Prospettive nella cooperazione tra piattaforme informatiche pubbli...
M. Fedeli, Prospettive nella cooperazione tra piattaforme informatiche pubbli...Istituto nazionale di statistica
 
Global System Srl - Presentazione BI Division
Global System Srl - Presentazione BI DivisionGlobal System Srl - Presentazione BI Division
Global System Srl - Presentazione BI DivisionGlobal System SRL
 
Vmware Innovazione e crescita nella Mobile-Cloud Era
Vmware Innovazione e crescita nella Mobile-Cloud EraVmware Innovazione e crescita nella Mobile-Cloud Era
Vmware Innovazione e crescita nella Mobile-Cloud EraS.info Srl
 
Fly Together the TIM DIgital Transformation
Fly Together the TIM DIgital TransformationFly Together the TIM DIgital Transformation
Fly Together the TIM DIgital TransformationMarco Daccò
 
Introduzione alla Virtualizzazione dei Dati
Introduzione alla Virtualizzazione dei DatiIntroduzione alla Virtualizzazione dei Dati
Introduzione alla Virtualizzazione dei DatiDenodo
 
I dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazioneI dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazioneClaudio Lattanzi
 
La Trasformazione Digitale con MongoDB
La Trasformazione Digitale con MongoDB La Trasformazione Digitale con MongoDB
La Trasformazione Digitale con MongoDB MongoDB
 

Similar to I Software passano, i Dati restano.pdf (20)

Digital 4 e guide - Hybrid Cloud come scegliere il meglio tra virtuale e fisi...
Digital 4 e guide - Hybrid Cloud come scegliere il meglio tra virtuale e fisi...Digital 4 e guide - Hybrid Cloud come scegliere il meglio tra virtuale e fisi...
Digital 4 e guide - Hybrid Cloud come scegliere il meglio tra virtuale e fisi...
 
Digital Integration Hub per il monitoraggio in near-real time della logistica...
Digital Integration Hub per il monitoraggio in near-real time della logistica...Digital Integration Hub per il monitoraggio in near-real time della logistica...
Digital Integration Hub per il monitoraggio in near-real time della logistica...
 
La nuova generazione dei gestionali cloud
La nuova generazione dei gestionali cloudLa nuova generazione dei gestionali cloud
La nuova generazione dei gestionali cloud
 
depl_emerald-rtc
depl_emerald-rtcdepl_emerald-rtc
depl_emerald-rtc
 
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdfRipartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
Ripartire dai dati ponendo le integrazioni al centro della propria strategia.pdf
 
7tips trasformazione-digitale-electra-nadalini
7tips trasformazione-digitale-electra-nadalini7tips trasformazione-digitale-electra-nadalini
7tips trasformazione-digitale-electra-nadalini
 
CFO Analytics
CFO AnalyticsCFO Analytics
CFO Analytics
 
SMAU MILANO 2022 | Digital transformation.pptx
SMAU MILANO 2022 | Digital transformation.pptxSMAU MILANO 2022 | Digital transformation.pptx
SMAU MILANO 2022 | Digital transformation.pptx
 
Business intelligence v0.3
Business intelligence v0.3Business intelligence v0.3
Business intelligence v0.3
 
Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?
 
Data Strategy per trasformare i dati in asset strategici aziendali
Data Strategy per trasformare i dati in asset strategici aziendaliData Strategy per trasformare i dati in asset strategici aziendali
Data Strategy per trasformare i dati in asset strategici aziendali
 
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
Dati distribuiti e rappresentazione centralizzata, ovvero come valorizzare il...
 
M. Fedeli, Prospettive nella cooperazione tra piattaforme informatiche pubbli...
M. Fedeli, Prospettive nella cooperazione tra piattaforme informatiche pubbli...M. Fedeli, Prospettive nella cooperazione tra piattaforme informatiche pubbli...
M. Fedeli, Prospettive nella cooperazione tra piattaforme informatiche pubbli...
 
Global System Srl - Presentazione BI Division
Global System Srl - Presentazione BI DivisionGlobal System Srl - Presentazione BI Division
Global System Srl - Presentazione BI Division
 
Vmware Innovazione e crescita nella Mobile-Cloud Era
Vmware Innovazione e crescita nella Mobile-Cloud EraVmware Innovazione e crescita nella Mobile-Cloud Era
Vmware Innovazione e crescita nella Mobile-Cloud Era
 
Fly Together the TIM DIgital Transformation
Fly Together the TIM DIgital TransformationFly Together the TIM DIgital Transformation
Fly Together the TIM DIgital Transformation
 
Introduzione alla Virtualizzazione dei Dati
Introduzione alla Virtualizzazione dei DatiIntroduzione alla Virtualizzazione dei Dati
Introduzione alla Virtualizzazione dei Dati
 
I dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazioneI dati transazionali ed aggregati in un unico progetto di modellazione
I dati transazionali ed aggregati in un unico progetto di modellazione
 
La Trasformazione Digitale con MongoDB
La Trasformazione Digitale con MongoDB La Trasformazione Digitale con MongoDB
La Trasformazione Digitale con MongoDB
 
Bi perchè 2010
Bi perchè 2010Bi perchè 2010
Bi perchè 2010
 

More from Andrea Gioia

Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdfKafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdfAndrea Gioia
 
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdfKAFKA Summit 2021: From legacy systems to microservices and back.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdfAndrea Gioia
 
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdfTHE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdfAndrea Gioia
 
How to integrate legacy systems within a modern polyglot and event driven arc...
How to integrate legacy systems within a modern polyglot and event driven arc...How to integrate legacy systems within a modern polyglot and event driven arc...
How to integrate legacy systems within a modern polyglot and event driven arc...Andrea Gioia
 
IT matters once again
IT matters once againIT matters once again
IT matters once againAndrea Gioia
 
Framework tecnologici per i Big Data: Data Lake & Data River
Framework tecnologici per i Big Data: Data Lake & Data RiverFramework tecnologici per i Big Data: Data Lake & Data River
Framework tecnologici per i Big Data: Data Lake & Data RiverAndrea Gioia
 
Fast data platforms - Hadoop User Group (Italy)
Fast data platforms  - Hadoop User Group (Italy)Fast data platforms  - Hadoop User Group (Italy)
Fast data platforms - Hadoop User Group (Italy)Andrea Gioia
 
Open Source Location Intelligence with SpagoBI
Open Source Location Intelligence with SpagoBIOpen Source Location Intelligence with SpagoBI
Open Source Location Intelligence with SpagoBIAndrea Gioia
 
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)Andrea Gioia
 

More from Andrea Gioia (9)

Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdfKafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
Kafka Summit 2022: Handling Eventual Consistency in a Transactional World.pdf
 
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdfKAFKA Summit 2021: From legacy systems to microservices and back.pdf
KAFKA Summit 2021: From legacy systems to microservices and back.pdf
 
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdfTHE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
THE DATA JOURNEY: FROM CHAOS TO STRATEGY .pdf
 
How to integrate legacy systems within a modern polyglot and event driven arc...
How to integrate legacy systems within a modern polyglot and event driven arc...How to integrate legacy systems within a modern polyglot and event driven arc...
How to integrate legacy systems within a modern polyglot and event driven arc...
 
IT matters once again
IT matters once againIT matters once again
IT matters once again
 
Framework tecnologici per i Big Data: Data Lake & Data River
Framework tecnologici per i Big Data: Data Lake & Data RiverFramework tecnologici per i Big Data: Data Lake & Data River
Framework tecnologici per i Big Data: Data Lake & Data River
 
Fast data platforms - Hadoop User Group (Italy)
Fast data platforms  - Hadoop User Group (Italy)Fast data platforms  - Hadoop User Group (Italy)
Fast data platforms - Hadoop User Group (Italy)
 
Open Source Location Intelligence with SpagoBI
Open Source Location Intelligence with SpagoBIOpen Source Location Intelligence with SpagoBI
Open Source Location Intelligence with SpagoBI
 
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
Corso sistemi aperti - Laboratorio - Case Study (SpagoBI)
 

I Software passano, i Dati restano.pdf

  • 1. Modello data centrico I Software passano, i Dati restano
  • 2. Data management Sintesi di quanto visto sino ad ora I dati sono un asset strategico La gestione dei dati è complessa
  • 3. Modello operativo Il modello centrato sulle applicazioni Problema di business Brainstorming buy build rent Applicazione Nuovo silos dati Aumento della complessità
  • 4. Cambio di paradigma Poiché i dati sopravvivono alle applicazione che li generano la loro integrazione deve essere gestita in modo strategico per mezzo di una piattaforma che ne permetta la condivisione in modalità FAIR... Findable I dati devono essere facili da trovare potendo filtrare le ricerche secondo diversi criteri (es. significato, qualità, freschezza, finalità del trattamento, …) Accessible I dati devono essere auto descrittivi e non devono necessitare di specifiche applicazioni per essere interpretati. L’accesso sicuro ai dati è una responsabilità della piattaforma di integrazione e non delle singole applicazioni Interoperable I dati devono essere espressi in un formato aperto e non proprietario Reusable I dati devono essere modellati al fine di garantire il riuso e non al fine di soddisfare le esigenze di utilizzo di una specifica applicazione Il modello centrato sui dati Hybrid Integration Platform Data Products Federated Data Governance
  • 5. Il modello data centrico Opportunità NOW: Application-Centric FUTURE: Data-Centric I dati sono legati alle applicazioni. I dati sono un asset aziendale che sopravvive alle applicazioni che li hanno creati Ogni nuovo progetto deve pagare una tassa di integrazione molto costosa. Ogni nuovo progetto si integra direttamente con la piattaforma di integrazione per ottenere i dati di cui ha bisogno. I dati sono frammentati in silos diversi per modalità di rappresentazione, formato, terminologia e significato I dati salvati nella piattaforma di integrazione al fine di essere condivisi sono uniformi, non ambigui e di qualità certificata I costi di integrazione consumano il 35%-65% del budget IT I costi di integrazione sono ridotti di un ordine di grandezza
  • 6. Il modello data centrico L’evoluzione dell’architettura verso una modalità operativa più data centrica è un processo incrementale che può essere realizzato attraverso una corretta impostazione dei progetti IT già pianificati. Non è tuttavia privo di rischi in quanto ha impatti non solo tecnologici ma anche organizzativi e culturali che vanno considera e opportunamente gestiti. Come la migrazione verso il cloud o il riposizionamento del ruolo del digital come abilitatore del business anche questo cambio di paradigma che pone i dati al centro è innanzitutto un processo di trasformazione. Rischi
  • 7. L’opportunità del Cloud Se non ora quando? 3.345 M +21% YoY
  • 8. Modello data centrico In questo contesto generale di migrazione verso il cloud alcuni progetti “caldi” nel mondo del data management possono essere usati , se opportunamente gestiti, per cominciare il processo di trasformazione dell’architettura in chiave maggiormente data centrica: 1. Modernizzazione dei sistemi legacy 2. Semplificazione del layer di storage 3. Definizione di un layer semantico 4. Self service analytics 5. Nuovi servizi basati su AI Alcuni progetti abilitanti
  • 9. Anti Fraud La modernizzazione dei sistemi legacy è resa necessaria dalle molteplici iniziative digital che spingono verso Loyalty eCommerce Recommendation Engine Advertising Demand Planning Website ● una costante crescita dei touchpoint in una logica omnicanale (System of Engagement) non volendo però imbarcarsi in lunghi e rischiosi progetti di dismissione di sistemi core su cui si sono concentrati grossi investimenti negli anni passati. ● la necessità di sfruttare la convenienza, scalabilità e innovazione del Cloud (Cloud Migration) ● lo sviluppo di moderne applicazioni basate sull’ AI (System of Insight) Marketing Automation Targeting Smart Payments Legacy modernization Business drivers
  • 10. Share Store Collect Anti Fraud Cross Canalità Loyalty eCommerce Recommendation Engine Advertisin g Demand Planning Website Marketing Automatio n Targeting Smart Payments Anti Fraud Omni Canalità Loyalty eCommerce Recommendation Engine Advertisin g Demand Planning Website Marketing Automatio n Targeting Smart Payments DATA PLATFORM Legacy modernization Data centricity
  • 11. Real-time integration L’integrazione dei dati in real-time è sempre più necessaria al fine di: ● Migliorare l’esperienza omnicanale garantendo un'integrazione continua tra sistemi di backend (es. CRM e sistemi di cassa, ecc...) e touchpoint digital (e-commerce, app, ecc..) ● Fornire un miglior servizio ai clienti garantendo una visione unificata e costantemente aggiornata di entità o processi core (single view del cliente per il marketing o il customer support, real-time stock per i canali di vendita o per il replenishment) ● Rendere più veloce il passaggio dall’analisi all’azione garantendo lo scambio di informazioni tra sistemi operazionali analitici e viceversa con latenze inferiori al secondo ● Ridurre costi e rischi nel trasferimento dei dati garantendo scalabilità, affidabilità e durabilità nello scambio di dati Business drivers By 2022, more than half of major new business systems will incorporate continuous intelligence that uses real-time context data to improve decisions. Source: Top 10 Data and Analytics Trends for 2019, Gartner (2019)
  • 12. Real time integration Data centricity OLAP OLTP OLTP App. 1 App. 2 OLTP App. 1 App. 3 Batch API Batch OLTP App. 1 Streaming Share (Sink connectors) Store (Data Bus) Collect (Source connectors) OLAP App. 3 OLTP App. 2 Domain Events ELT ELT
  • 13. Semplificazione dello storage layer La piattaforme di gestione del dato analitico si stanno spostando progressivamente in Cloud per ragioni di: ● scalabilità ● riduzione dei costi operativi Allo stesso tempo le piattaforme di gestione del dato stanno evolvendo in termini di convergenza e multimodalità. La spinta verso una razionalizzazione del proprio stack tecnologico per la gestione del dato è sempre più necessaria per garantire: ● riduzione del TCO ● aumento del time to market ● evolvibilità dell’architettura Business drivers
  • 14. Semplificazione dello storage layer Data centricity SQL Opportunità per ripensare la gestione delle data pipelines in chiave DataOps e embeddare i processi di Data Governance Convergenza tra DWH e Data Lake Convergenza tra OLTP e OLAP Convergenza tra DBMS e Streaming
  • 15. Semantic layer La centralizzazione degli accessi ai dati per mezzo di un layer semantico unificato e coerente è sempre più necessaria la fine di garantire: 1. autonomia nell’organizzazione dello storage e service layer (IT) 2. agilità nello sviluppo di nuovi data product (business) 3. sicurezza nell’uso corretto dei dati, in particolare di quelli sensibili (compliance) Business Drivers ● Less than half of an organization’s structured data is actively used in making decisions—and less than 1% of its unstructured data is analyzed or used at all ● 92% of analysts’ time is spent simply discovering and preparing data Source: What’s Your Data Strategy? , Harvard Business Review (2017) ● More than 70% of employees have access to data they should not Source: Data Integration and Integrity End User Survey, IDC (2019) IT BUSINESS COMPLIANCE Autonomia Agilità Sicurezza
  • 16. Centralizzazione degli accessi Data centricity Sistemi sorgente Sistemi per l’integrazione dei dati Applicazioni analitiche ETL Data Bus Sistemi Operazionali Dati semistrutturati Dati esterni DWH ODS Data Lake Reporting Self Service BI Data Science Altre App. Sistemi di storage Data Virtualization Sistemi sorgente Sistemi per l’integrazione dei dati Applicazioni analitiche Data Bus Sistemi Operazionali Dati semistrutturati Dati esterni App. Sistemi di storage Service Layer App. App. Piano Operazionale Digital Integration Hub Piano Analitico Logical Data Warehouse
  • 17. Self-service analytics Col crescere del numero di consumatori del dato è sempre più necessario fornire modalità di accesso e analisi in modalità self-service al fine di: 1. ridurre tempi di rilascio di nuove analisi 2. monitorare gli utilizzi dei dati 3. favorire il riutilizzo delle analisi oltre che dei dati 4. creare una cultura condivisa del dato Business Drivers
  • 18. Self-service analytics Data centricity Sistemi sorgente Sistemi per l’integrazione dei dati Applicazioni analitiche ETL Data Bus Sistemi Operazionali Dati semistrutturati Dati esterni DWH ODS Data Lake Reporting Self Service BI Data Science Altre App. Sistemi di storage Data Virtualization Sistemi sorgente Sistemi per l’integrazione dei dati Applicazioni analitiche ETL Data Bus Sistemi Operazionali Dati semistrutturat i Dati esterni DWH ODS Data Lake Reportin g Self Service BI Data Science Altre App. Sistemi di storage Data Governance Data Marketplace
  • 19. Artificial intelligence L’industrializzazione dei processi di data science è sempre più necessaria al fine di garantire: 1. Velocità del passaggio dalla sperimentazione alla produzione 2. Riduzione dei costi tramite una razionalizzazione del lavoro 3. Condivisione delle conoscenze e best practices tra i vari data scientist 4. Aumentare l’affidabilità nel serving dei modelli Business drivers https://designingforanalytics.com/resources/failure-rates-for-analytics-bi-i ot-and-big-data-projects-85-yikes/
  • 20. Architettura di riferimento Data centricity “Only a small fraction of real-world ML systems is composed of the ML code, as shown by the small black box in the middle. The required surrounding infrastructure is vast and complex” Hidden Technical Debt in Machine Learning Systems - Sculley et al. (2015) Data Engineer Data Scientist Operations ML Platform
  • 21. Hybrid Integration Platform Architettura di riferimento Hybrid Integration Platform Data Products Federated Data Governance Logical DWH Digital Integratio n Hub Streaming Platform
  • 22. Oltre l’architettura Due modelli principali: ● Data fabric: ownership sui dati centralizzata sul team di data engineering. I team di prodotto non sono direttamente coinvolti (basso impatto sul modello attuale) ● Data mesh: ownership sui dati decentralizzata sui team di prodotto. Il team di data engineering lavora sull’automazione della piattaforma di integrazione in logica DataOps (alto impatto sul modello attuale) E possibile avere un approccio ibrido per ridurre i rischi in un percorso di transizione dal modello centralizzato a quello decentralizzato di gestione delle ownership. In ogni caso il modello di organizzazione della governance è sempre più orientato ad una federazione delle responsabilità per garantire la sostenibilità nel tempo Modelli organizzativi Hybrid Integration Platform Data Products Federated Data Governance
  • 23. Percorso di trasformazione I nostri servizi di advisory INCEPTION ASSESSMENT FOUNDATION MOBILITIZATION EXECUTION 1 Giorno 3 Settimane 3 Settimane 3 Mesi Iterativo Time frame Identificazione drivers Mappatura stakeholders Definizione scope Identificare impatti Definizione criteri di successo Mappatura architettura Mappatura organizzazione Individuazione pain point Mappatura progetti Mappatura use cases Definizione principi Definizione roadmap Definizione governance Definizione SLA e KPI Proposta tecnologie Integrazione con data governance Selezione use case Implementazione use case Review della strategy Iterazione su portfolio progetti Misurazione risultati review strategia Program charter Risultati assessment Proposta di action plan Business case for data strategy Aggiornamento business case for data strategy
  • 24. TRAINING EMBEDDED ARCHITECTS SOFTWARE SELECTION DATAOPS Formazione frontale e on the job Workshop tematici Inserimento di uno o più senior data architect nel team di architetture o sui progetti in area dati e EA Supporto alla selezione del software Test di applicativi Realizzazione prototipi Assessment su specifiche parti dell’architettura dati Supporto all’automazione ed industrializzazione dei processi di data integration e machine learning Percorso di trasformazione I nostri servizi di advisory
  • 25. In conclusione... 1. Il dato è un asset strategico 2. Le modalità operative tradizionali di evoluzione della architetture It genera inefficienze nella gestione del dato 3. Un modello operativo maggiormente centrato sui dati si sta affermando 4. La trasformazione verso questo modello è un processo incrementale che impatta tecnologie persone e processi 5. La migrazione verso il cloud è un’opportunità per accelerare questa trasformazione Takeaways