SlideShare a Scribd company logo
1 of 31
Download to read offline
Dati più veloci, analisi più profonde
La gestione logica dei dati come chiave del
successo per Data Scientist e Business Analyst
WEBINAR
Andrea Zinno
Data Evangelist | Denodo
Paolo Crivelli
Technical Sales Director | Denodo
AGENDA
• I progetti di Data Science
• Le architetture logiche per la gestione dei dati
• La Data Virtualization
• Demo della Denodo Data Platform
• Domande e risposte
I progetti di Data Science
Presto e bene, raro avviene…
4
Data Science Lifecycle – I dati contano…
5
Come in un viaggio, si perde tempo a fare i bagagli…
La necessità di avere un
campione significativo di dati si
contrappone al costo e al tempo
necessari per averlo, sempre
ammesso che sia possibile farlo
Tuttavia è proprio l’oculata
scelta dei dati e la loro
preparazione che consentono
controllare elementi quali, ad
esempio, la rappresentatività, i
bias, la rilevanza statistica
6
E’ sempre una questione di
aspettative…
Ruoli diversi, aspettative diverse, competenze diverse
8
Data Steward e Data Engineer
• Creare un modello semantico «vivo» che descriva i
dati disponibili.
• Integrare rapidamente nuove fonti dati
• Astrarre dalla diversa struttura tecnica dei dati
• Integrare, modellare, arricchire, descrivere i dati con
un approccio low-code / no-code
• Definire le regole di visibilità e accesso in modo
centralizzato e indipendente dalla natura fisica dei
dati
• Arricchire i dati con elementi caratterizzanti che ne
agevolino la ricerca
Data Scientist e Business Analyst
• Consapevolezza dei dati disponibili
• Facilità nel comprendere cosa i dati
rappresentano, da dove provengono e quali sono
le relazioni con altri dati
• Poter esplorare i dati, sia nella loro componente
logica (intensionale) che fisica (estensionale)
• Ricevere suggerimenti su dati di potenziale
interesse
• Condividere e valutare i dati
• Creare nuovi dati «privati» sulla base di quelli
disponibili
Essere al servizio del guidatore, del meccanico e del progettista
Due ambiti di intervento
9
Due modi diversi di lavorare con e sui dati – Data Steward e Data Engineer
Semplificare la modellazione e l’integrazione dei dati
10
Due modi diversi di lavorare con e sui dati – Data Scientist e Business Analyst
Semplificare la ricerca, la comprensione e l’uso dei dati
Le architetture logiche per
la gestione dei dati
Come ridurre quel 16% + 60% = 79%...
12
Due approcci diversi alla gestione dei dati
APPROCCIO «TRADIZIONALE» - ELT/ETL
DATA
SOURCES
Apps Streaming SaaS
Files
OLAP
Hadoop
& NoSQL
Cloud
Stores
Traditional
DB & DW
DATA
USES
Enterprise
Applications
Business
Intelligence
Reporting Portals
Enterprise
Service Bus Web
Mobile
IoT /
Streaming
Data
DATA REPLICATION
Data Warehouse
ETL / ELT
Data Warehouse Data Warehouse
TRANSFORM
APPROCCIO «LOGICO» - DENODO
VIRTUAL
LAYER
DATA
SOURCES
Apps Streaming SaaS
Files
OLAP
Hadoop
& NoSQL
Cloud
Stores
Traditional
DB & DW
DATA
USES
Enterprise
Applications
Business
Intelligence
Reporting Portals
Enterprise
Service Bus Web
Mobile
IoT /
Streaming
Data
No data replication
Real-time data
access
Enterprise-wide
accessibility
13
L’essenza delle architetture logiche
“With the logical centralization of data access,
logical centralization of data governance, audit
trails, security and monitoring is possible.”
– Gartner: Assessing the Relevance of Data Virtualization in Modern Data
Architectures, June 2021
Le architetture logiche
• I Data Consumer accedono ai dati attraverso modelli
semantici, disaccoppiati dalla posizione fisica dei dati e
dalla loro rappresentazione tecnica
Benefici
• Business friendly: i dati sono rappresentati nel
linguaggio di business e non in quello tecnico
• Semplice: semantica, sicurezza e governance
unificate
• Future Proof: in grado di gestire l'evoluzione della
tecnologia e i cambiamenti dell'infrastruttura
annullandone gli impatti sui Data Consumer
Stop collecting, start connecting.
14
Gartner Magic Quadrant for Data Integration Tools, August 2022
When data is constantly produced in massive
quantities and is always in motion and constantly
changing (e.g., IoT platforms and data lakes),
attempts to collect all this data are neither practical
nor viable. This is driving an increase in demand for
connection to data, not just the collection of it.”
15
L’essenza della Data Virtualization
1. Definire un unico punto di accesso per esplorare e interrogare
tutti i dati
• Minimizzare il tempo di ricerca nelle varie fonti di dati
• Arricchire la rappresentazione dei dati con elementi che ne facilitino la comprensione
e l’utilizzo
2. Diffondere una cultura «self-service» per i consumatori dei dati
• Accesso ai dati semplificato, senza necessità di skill di programmazione né di
eccessive interazioni con l’IT
• I Data Consumer possono utilizzare gli strumenti che preferiscono
3. Garantire sicurezza e governance dei dati, rispetto a molteplici
sistemi
• Ridurre le copie di dati, con riduzione del rischio di una loro violazione o di non
conformità
• Evitare rappresentazioni molteplici e incongruenti della realtà
L'IT si focalizza sulla raccolta, l'archiviazione,
la qualità e la sicurezza dei dati
Il Data Consumer si concentra sul consumo dei dati,
sulla loro analisi e sulle decisioni strategiche
Tempi
di
risposta
Volume
dei
dati
16
Denodo per la Data Science - Il concetto di Multi-Purpose Data Lake
“Amulti-purpose data lake can become an organization’s universal data delivery system”
Architecting the Multi-Purpose Data Lake with Data Virtualization , Rick Van der Lans, April 2018
Demo: Denodo in azione
Una Demo vale più di mille parole…
18
https://flic.kr/p/x8HgrF
Bike Sharing: possiamo prevedere l'utilizzo
delle biciclette in base ai dati degli anni
precedenti?
19
Dati
20
https://flic.kr/p/CYT7SS
Fattori esterni che possono influenzare l’utilizzo
• Meteo
• Temperatura
• Pioggia
• Neve
• Momento (Tempo)
• Momento nell’anno, stagione
• Giorno della settimana
• Weekend, vananze
• Altro…
21
Metodo e Strumenti
Identify useful
data
Modify data into
a useful format Analyze data
Execute Data
science algorithms
(ML, AI, etc.)
Use / Share with
business users
Prepare for
ML algorithm
Data Catalog:
Content and
Metadata Search,
Data Preview
Design Tool:
Data Modeling,
Cleansing and
Transformations
Zeppelin notebooks:
Preview charts
Design Tool:
Transformation to tailor
data for
ML algorithm
Zeppelin notebooks:
Execute data
science algorithms
(Python)
Data Catalog & API
API calls & Share with
business users results
Il Flusso di Lavoro di un Data Scientist … e il supporto di Denodo nelle varie fasi
22
Identificazione dei dati utili
23
Il modello logico
Denodo verrà utilizzato per modellare i dati,
senza renderne obbligatoria la replica
Utilizzo delle biciclette: Amazon S3
Informazioni Meteo: API pubblica
Informazioni sulle Date: EDW, dimensione
delle date
Sources
Combine,
Transform
&
Integrate
Consume
Base View
Source
Abstraction
join
transform
join
Bike rides Weather Date
24
Modificare i dati in un formato utile
25
Analizzare i dati
26
Preparare i dati per l’algoritmo di Machine Learning
Q&A
28
Accedi alla piattaforma Denodo Platform in Cloud!
Provala con i nostri Test Drive!
INIZIA OGGI STESSO
AWS
www.denodo.com/TestDrive
29
https://www.denodo.com/en/datapops
DENODO DATAFEST EMEA 2023
The Agile Data Management
and Analytics Conference
OCTOBER 25-26 2023 | BARCELONA, SPAIN
REGISTER NOW
www.denododatafest.com/EMEA
Grazie!
www.denodo.com info@denodo.com
© Copyright Denodo Technologies. All rights reserved
Se non diversamente specificato, nessuna parte di questo file PDF può essere riprodotta o utilizzata in qualsiasi forma o con qualsiasi mezzo, elettronico o
meccanico, incluse fotocopie e microfilm, senza la preventiva autorizzazione scritta di Denodo Technologies.

More Related Content

Similar to La gestione logica dei dati come chiave del successo per Data Scientist e Business Analyst

Big data e business intelligence
Big data e business intelligenceBig data e business intelligence
Big data e business intelligenceMarco Pozzan
 
Data Strategy per trasformare i dati in asset strategici aziendali
Data Strategy per trasformare i dati in asset strategici aziendaliData Strategy per trasformare i dati in asset strategici aziendali
Data Strategy per trasformare i dati in asset strategici aziendaliDenodo
 
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...Denodo
 
4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionaliMau-Messenger
 
Analytics 3.0 - Breve storia della Data Analysis ad oggi
Analytics 3.0 - Breve storia della Data Analysis ad oggiAnalytics 3.0 - Breve storia della Data Analysis ad oggi
Analytics 3.0 - Breve storia della Data Analysis ad oggiFilippo Ragazzo
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaValerio Torriero
 
Big Data e la forza degli eventi - Intervento di Lieto
Big Data e la forza degli eventi - Intervento di LietoBig Data e la forza degli eventi - Intervento di Lieto
Big Data e la forza degli eventi - Intervento di Lietocomunicareonline
 
Power B: Cleaning data
Power B: Cleaning dataPower B: Cleaning data
Power B: Cleaning dataMarco Pozzan
 
Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Denodo
 
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Data Driven Innovation
 
Its allaboudatadiversity2019rev1.2
Its allaboudatadiversity2019rev1.2Its allaboudatadiversity2019rev1.2
Its allaboudatadiversity2019rev1.2Stefano Gatti
 
Power bi Clean and Modelling (SQL Saturday #675)
Power bi Clean and Modelling  (SQL Saturday #675)Power bi Clean and Modelling  (SQL Saturday #675)
Power bi Clean and Modelling (SQL Saturday #675)Marco Pozzan
 
Logical Data Lake: polifunzionale e decentralizzato per l'analisi dei dati
Logical Data Lake: polifunzionale e decentralizzato per l'analisi dei datiLogical Data Lake: polifunzionale e decentralizzato per l'analisi dei dati
Logical Data Lake: polifunzionale e decentralizzato per l'analisi dei datiDenodo
 
AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3Fabio Lazzarini
 

Similar to La gestione logica dei dati come chiave del successo per Data Scientist e Business Analyst (20)

Big data e business intelligence
Big data e business intelligenceBig data e business intelligence
Big data e business intelligence
 
Data Strategy per trasformare i dati in asset strategici aziendali
Data Strategy per trasformare i dati in asset strategici aziendaliData Strategy per trasformare i dati in asset strategici aziendali
Data Strategy per trasformare i dati in asset strategici aziendali
 
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
Accelerare la migrazione al cloud e la modernizzazione dell'architettura con ...
 
Data Governance at work
Data Governance at workData Governance at work
Data Governance at work
 
Il mondo dei Big Data
Il mondo dei Big DataIl mondo dei Big Data
Il mondo dei Big Data
 
4a Data Mining e motori computazionali
4a Data Mining e motori computazionali4a Data Mining e motori computazionali
4a Data Mining e motori computazionali
 
Analytics 3.0 - Breve storia della Data Analysis ad oggi
Analytics 3.0 - Breve storia della Data Analysis ad oggiAnalytics 3.0 - Breve storia della Data Analysis ad oggi
Analytics 3.0 - Breve storia della Data Analysis ad oggi
 
Next future bi
Next future biNext future bi
Next future bi
 
Big Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social MediaBig Data 2014: Marketing & Social Media
Big Data 2014: Marketing & Social Media
 
_ABIlab-BigData-Finale
_ABIlab-BigData-Finale_ABIlab-BigData-Finale
_ABIlab-BigData-Finale
 
Big Data e la forza degli eventi - Intervento di Lieto
Big Data e la forza degli eventi - Intervento di LietoBig Data e la forza degli eventi - Intervento di Lieto
Big Data e la forza degli eventi - Intervento di Lieto
 
Power B: Cleaning data
Power B: Cleaning dataPower B: Cleaning data
Power B: Cleaning data
 
Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?Cos’è la Virtualizzazione dei dati?
Cos’è la Virtualizzazione dei dati?
 
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
Polyglot Persistence e Big Data: tra innovazione e difficoltà su casi reali -...
 
2470620 data-warehouse
2470620 data-warehouse2470620 data-warehouse
2470620 data-warehouse
 
Its allaboudatadiversity2019rev1.2
Its allaboudatadiversity2019rev1.2Its allaboudatadiversity2019rev1.2
Its allaboudatadiversity2019rev1.2
 
Power bi Clean and Modelling (SQL Saturday #675)
Power bi Clean and Modelling  (SQL Saturday #675)Power bi Clean and Modelling  (SQL Saturday #675)
Power bi Clean and Modelling (SQL Saturday #675)
 
Logical Data Lake: polifunzionale e decentralizzato per l'analisi dei dati
Logical Data Lake: polifunzionale e decentralizzato per l'analisi dei datiLogical Data Lake: polifunzionale e decentralizzato per l'analisi dei dati
Logical Data Lake: polifunzionale e decentralizzato per l'analisi dei dati
 
Cloud e big data
Cloud e big dataCloud e big data
Cloud e big data
 
AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3AISM_Lazzarini_Bologna_2015_v3
AISM_Lazzarini_Bologna_2015_v3
 

More from Denodo

Enterprise Monitoring and Auditing in Denodo
Enterprise Monitoring and Auditing in DenodoEnterprise Monitoring and Auditing in Denodo
Enterprise Monitoring and Auditing in DenodoDenodo
 
Lunch and Learn ANZ: Mastering Cloud Data Cost Control: A FinOps Approach
Lunch and Learn ANZ: Mastering Cloud Data Cost Control: A FinOps ApproachLunch and Learn ANZ: Mastering Cloud Data Cost Control: A FinOps Approach
Lunch and Learn ANZ: Mastering Cloud Data Cost Control: A FinOps ApproachDenodo
 
Achieving Self-Service Analytics with a Governed Data Services Layer
Achieving Self-Service Analytics with a Governed Data Services LayerAchieving Self-Service Analytics with a Governed Data Services Layer
Achieving Self-Service Analytics with a Governed Data Services LayerDenodo
 
What you need to know about Generative AI and Data Management?
What you need to know about Generative AI and Data Management?What you need to know about Generative AI and Data Management?
What you need to know about Generative AI and Data Management?Denodo
 
Mastering Data Compliance in a Dynamic Business Landscape
Mastering Data Compliance in a Dynamic Business LandscapeMastering Data Compliance in a Dynamic Business Landscape
Mastering Data Compliance in a Dynamic Business LandscapeDenodo
 
Denodo Partner Connect: Business Value Demo with Denodo Demo Lite
Denodo Partner Connect: Business Value Demo with Denodo Demo LiteDenodo Partner Connect: Business Value Demo with Denodo Demo Lite
Denodo Partner Connect: Business Value Demo with Denodo Demo LiteDenodo
 
Expert Panel: Overcoming Challenges with Distributed Data to Maximize Busines...
Expert Panel: Overcoming Challenges with Distributed Data to Maximize Busines...Expert Panel: Overcoming Challenges with Distributed Data to Maximize Busines...
Expert Panel: Overcoming Challenges with Distributed Data to Maximize Busines...Denodo
 
Drive Data Privacy Regulatory Compliance
Drive Data Privacy Regulatory ComplianceDrive Data Privacy Regulatory Compliance
Drive Data Privacy Regulatory ComplianceDenodo
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхDenodo
 
Data Democratization: A Secret Sauce to Say Goodbye to Data Fragmentation
Data Democratization: A Secret Sauce to Say Goodbye to Data FragmentationData Democratization: A Secret Sauce to Say Goodbye to Data Fragmentation
Data Democratization: A Secret Sauce to Say Goodbye to Data FragmentationDenodo
 
Denodo Partner Connect - Technical Webinar - Ask Me Anything
Denodo Partner Connect - Technical Webinar - Ask Me AnythingDenodo Partner Connect - Technical Webinar - Ask Me Anything
Denodo Partner Connect - Technical Webinar - Ask Me AnythingDenodo
 
Lunch and Learn ANZ: Key Takeaways for 2023!
Lunch and Learn ANZ: Key Takeaways for 2023!Lunch and Learn ANZ: Key Takeaways for 2023!
Lunch and Learn ANZ: Key Takeaways for 2023!Denodo
 
It’s a Wrap! 2023 – A Groundbreaking Year for AI and The Way Forward
It’s a Wrap! 2023 – A Groundbreaking Year for AI and The Way ForwardIt’s a Wrap! 2023 – A Groundbreaking Year for AI and The Way Forward
It’s a Wrap! 2023 – A Groundbreaking Year for AI and The Way ForwardDenodo
 
Quels sont les facteurs-clés de succès pour appliquer au mieux le RGPD à votr...
Quels sont les facteurs-clés de succès pour appliquer au mieux le RGPD à votr...Quels sont les facteurs-clés de succès pour appliquer au mieux le RGPD à votr...
Quels sont les facteurs-clés de succès pour appliquer au mieux le RGPD à votr...Denodo
 
Lunch and Learn ANZ: Achieving Self-Service Analytics with a Governed Data Se...
Lunch and Learn ANZ: Achieving Self-Service Analytics with a Governed Data Se...Lunch and Learn ANZ: Achieving Self-Service Analytics with a Governed Data Se...
Lunch and Learn ANZ: Achieving Self-Service Analytics with a Governed Data Se...Denodo
 
How to Build Your Data Marketplace with Data Virtualization?
How to Build Your Data Marketplace with Data Virtualization?How to Build Your Data Marketplace with Data Virtualization?
How to Build Your Data Marketplace with Data Virtualization?Denodo
 
Webinar #2 - Transforming Challenges into Opportunities for Credit Unions
Webinar #2 - Transforming Challenges into Opportunities for Credit UnionsWebinar #2 - Transforming Challenges into Opportunities for Credit Unions
Webinar #2 - Transforming Challenges into Opportunities for Credit UnionsDenodo
 
Enabling Data Catalog users with advanced usability
Enabling Data Catalog users with advanced usabilityEnabling Data Catalog users with advanced usability
Enabling Data Catalog users with advanced usabilityDenodo
 
Denodo Partner Connect: Technical Webinar - Architect Associate Certification...
Denodo Partner Connect: Technical Webinar - Architect Associate Certification...Denodo Partner Connect: Technical Webinar - Architect Associate Certification...
Denodo Partner Connect: Technical Webinar - Architect Associate Certification...Denodo
 
GenAI y el futuro de la gestión de datos: mitos y realidades
GenAI y el futuro de la gestión de datos: mitos y realidadesGenAI y el futuro de la gestión de datos: mitos y realidades
GenAI y el futuro de la gestión de datos: mitos y realidadesDenodo
 

More from Denodo (20)

Enterprise Monitoring and Auditing in Denodo
Enterprise Monitoring and Auditing in DenodoEnterprise Monitoring and Auditing in Denodo
Enterprise Monitoring and Auditing in Denodo
 
Lunch and Learn ANZ: Mastering Cloud Data Cost Control: A FinOps Approach
Lunch and Learn ANZ: Mastering Cloud Data Cost Control: A FinOps ApproachLunch and Learn ANZ: Mastering Cloud Data Cost Control: A FinOps Approach
Lunch and Learn ANZ: Mastering Cloud Data Cost Control: A FinOps Approach
 
Achieving Self-Service Analytics with a Governed Data Services Layer
Achieving Self-Service Analytics with a Governed Data Services LayerAchieving Self-Service Analytics with a Governed Data Services Layer
Achieving Self-Service Analytics with a Governed Data Services Layer
 
What you need to know about Generative AI and Data Management?
What you need to know about Generative AI and Data Management?What you need to know about Generative AI and Data Management?
What you need to know about Generative AI and Data Management?
 
Mastering Data Compliance in a Dynamic Business Landscape
Mastering Data Compliance in a Dynamic Business LandscapeMastering Data Compliance in a Dynamic Business Landscape
Mastering Data Compliance in a Dynamic Business Landscape
 
Denodo Partner Connect: Business Value Demo with Denodo Demo Lite
Denodo Partner Connect: Business Value Demo with Denodo Demo LiteDenodo Partner Connect: Business Value Demo with Denodo Demo Lite
Denodo Partner Connect: Business Value Demo with Denodo Demo Lite
 
Expert Panel: Overcoming Challenges with Distributed Data to Maximize Busines...
Expert Panel: Overcoming Challenges with Distributed Data to Maximize Busines...Expert Panel: Overcoming Challenges with Distributed Data to Maximize Busines...
Expert Panel: Overcoming Challenges with Distributed Data to Maximize Busines...
 
Drive Data Privacy Regulatory Compliance
Drive Data Privacy Regulatory ComplianceDrive Data Privacy Regulatory Compliance
Drive Data Privacy Regulatory Compliance
 
Знакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данныхЗнакомство с виртуализацией данных для профессионалов в области данных
Знакомство с виртуализацией данных для профессионалов в области данных
 
Data Democratization: A Secret Sauce to Say Goodbye to Data Fragmentation
Data Democratization: A Secret Sauce to Say Goodbye to Data FragmentationData Democratization: A Secret Sauce to Say Goodbye to Data Fragmentation
Data Democratization: A Secret Sauce to Say Goodbye to Data Fragmentation
 
Denodo Partner Connect - Technical Webinar - Ask Me Anything
Denodo Partner Connect - Technical Webinar - Ask Me AnythingDenodo Partner Connect - Technical Webinar - Ask Me Anything
Denodo Partner Connect - Technical Webinar - Ask Me Anything
 
Lunch and Learn ANZ: Key Takeaways for 2023!
Lunch and Learn ANZ: Key Takeaways for 2023!Lunch and Learn ANZ: Key Takeaways for 2023!
Lunch and Learn ANZ: Key Takeaways for 2023!
 
It’s a Wrap! 2023 – A Groundbreaking Year for AI and The Way Forward
It’s a Wrap! 2023 – A Groundbreaking Year for AI and The Way ForwardIt’s a Wrap! 2023 – A Groundbreaking Year for AI and The Way Forward
It’s a Wrap! 2023 – A Groundbreaking Year for AI and The Way Forward
 
Quels sont les facteurs-clés de succès pour appliquer au mieux le RGPD à votr...
Quels sont les facteurs-clés de succès pour appliquer au mieux le RGPD à votr...Quels sont les facteurs-clés de succès pour appliquer au mieux le RGPD à votr...
Quels sont les facteurs-clés de succès pour appliquer au mieux le RGPD à votr...
 
Lunch and Learn ANZ: Achieving Self-Service Analytics with a Governed Data Se...
Lunch and Learn ANZ: Achieving Self-Service Analytics with a Governed Data Se...Lunch and Learn ANZ: Achieving Self-Service Analytics with a Governed Data Se...
Lunch and Learn ANZ: Achieving Self-Service Analytics with a Governed Data Se...
 
How to Build Your Data Marketplace with Data Virtualization?
How to Build Your Data Marketplace with Data Virtualization?How to Build Your Data Marketplace with Data Virtualization?
How to Build Your Data Marketplace with Data Virtualization?
 
Webinar #2 - Transforming Challenges into Opportunities for Credit Unions
Webinar #2 - Transforming Challenges into Opportunities for Credit UnionsWebinar #2 - Transforming Challenges into Opportunities for Credit Unions
Webinar #2 - Transforming Challenges into Opportunities for Credit Unions
 
Enabling Data Catalog users with advanced usability
Enabling Data Catalog users with advanced usabilityEnabling Data Catalog users with advanced usability
Enabling Data Catalog users with advanced usability
 
Denodo Partner Connect: Technical Webinar - Architect Associate Certification...
Denodo Partner Connect: Technical Webinar - Architect Associate Certification...Denodo Partner Connect: Technical Webinar - Architect Associate Certification...
Denodo Partner Connect: Technical Webinar - Architect Associate Certification...
 
GenAI y el futuro de la gestión de datos: mitos y realidades
GenAI y el futuro de la gestión de datos: mitos y realidadesGenAI y el futuro de la gestión de datos: mitos y realidades
GenAI y el futuro de la gestión de datos: mitos y realidades
 

La gestione logica dei dati come chiave del successo per Data Scientist e Business Analyst

  • 1. Dati più veloci, analisi più profonde La gestione logica dei dati come chiave del successo per Data Scientist e Business Analyst WEBINAR Andrea Zinno Data Evangelist | Denodo Paolo Crivelli Technical Sales Director | Denodo
  • 2. AGENDA • I progetti di Data Science • Le architetture logiche per la gestione dei dati • La Data Virtualization • Demo della Denodo Data Platform • Domande e risposte
  • 3. I progetti di Data Science Presto e bene, raro avviene…
  • 4. 4 Data Science Lifecycle – I dati contano…
  • 5. 5 Come in un viaggio, si perde tempo a fare i bagagli… La necessità di avere un campione significativo di dati si contrappone al costo e al tempo necessari per averlo, sempre ammesso che sia possibile farlo Tuttavia è proprio l’oculata scelta dei dati e la loro preparazione che consentono controllare elementi quali, ad esempio, la rappresentatività, i bias, la rilevanza statistica
  • 6. 6
  • 7. E’ sempre una questione di aspettative… Ruoli diversi, aspettative diverse, competenze diverse
  • 8. 8 Data Steward e Data Engineer • Creare un modello semantico «vivo» che descriva i dati disponibili. • Integrare rapidamente nuove fonti dati • Astrarre dalla diversa struttura tecnica dei dati • Integrare, modellare, arricchire, descrivere i dati con un approccio low-code / no-code • Definire le regole di visibilità e accesso in modo centralizzato e indipendente dalla natura fisica dei dati • Arricchire i dati con elementi caratterizzanti che ne agevolino la ricerca Data Scientist e Business Analyst • Consapevolezza dei dati disponibili • Facilità nel comprendere cosa i dati rappresentano, da dove provengono e quali sono le relazioni con altri dati • Poter esplorare i dati, sia nella loro componente logica (intensionale) che fisica (estensionale) • Ricevere suggerimenti su dati di potenziale interesse • Condividere e valutare i dati • Creare nuovi dati «privati» sulla base di quelli disponibili Essere al servizio del guidatore, del meccanico e del progettista Due ambiti di intervento
  • 9. 9 Due modi diversi di lavorare con e sui dati – Data Steward e Data Engineer Semplificare la modellazione e l’integrazione dei dati
  • 10. 10 Due modi diversi di lavorare con e sui dati – Data Scientist e Business Analyst Semplificare la ricerca, la comprensione e l’uso dei dati
  • 11. Le architetture logiche per la gestione dei dati Come ridurre quel 16% + 60% = 79%...
  • 12. 12 Due approcci diversi alla gestione dei dati APPROCCIO «TRADIZIONALE» - ELT/ETL DATA SOURCES Apps Streaming SaaS Files OLAP Hadoop & NoSQL Cloud Stores Traditional DB & DW DATA USES Enterprise Applications Business Intelligence Reporting Portals Enterprise Service Bus Web Mobile IoT / Streaming Data DATA REPLICATION Data Warehouse ETL / ELT Data Warehouse Data Warehouse TRANSFORM APPROCCIO «LOGICO» - DENODO VIRTUAL LAYER DATA SOURCES Apps Streaming SaaS Files OLAP Hadoop & NoSQL Cloud Stores Traditional DB & DW DATA USES Enterprise Applications Business Intelligence Reporting Portals Enterprise Service Bus Web Mobile IoT / Streaming Data No data replication Real-time data access Enterprise-wide accessibility
  • 13. 13 L’essenza delle architetture logiche “With the logical centralization of data access, logical centralization of data governance, audit trails, security and monitoring is possible.” – Gartner: Assessing the Relevance of Data Virtualization in Modern Data Architectures, June 2021 Le architetture logiche • I Data Consumer accedono ai dati attraverso modelli semantici, disaccoppiati dalla posizione fisica dei dati e dalla loro rappresentazione tecnica Benefici • Business friendly: i dati sono rappresentati nel linguaggio di business e non in quello tecnico • Semplice: semantica, sicurezza e governance unificate • Future Proof: in grado di gestire l'evoluzione della tecnologia e i cambiamenti dell'infrastruttura annullandone gli impatti sui Data Consumer Stop collecting, start connecting.
  • 14. 14 Gartner Magic Quadrant for Data Integration Tools, August 2022 When data is constantly produced in massive quantities and is always in motion and constantly changing (e.g., IoT platforms and data lakes), attempts to collect all this data are neither practical nor viable. This is driving an increase in demand for connection to data, not just the collection of it.”
  • 15. 15 L’essenza della Data Virtualization 1. Definire un unico punto di accesso per esplorare e interrogare tutti i dati • Minimizzare il tempo di ricerca nelle varie fonti di dati • Arricchire la rappresentazione dei dati con elementi che ne facilitino la comprensione e l’utilizzo 2. Diffondere una cultura «self-service» per i consumatori dei dati • Accesso ai dati semplificato, senza necessità di skill di programmazione né di eccessive interazioni con l’IT • I Data Consumer possono utilizzare gli strumenti che preferiscono 3. Garantire sicurezza e governance dei dati, rispetto a molteplici sistemi • Ridurre le copie di dati, con riduzione del rischio di una loro violazione o di non conformità • Evitare rappresentazioni molteplici e incongruenti della realtà L'IT si focalizza sulla raccolta, l'archiviazione, la qualità e la sicurezza dei dati Il Data Consumer si concentra sul consumo dei dati, sulla loro analisi e sulle decisioni strategiche Tempi di risposta Volume dei dati
  • 16. 16 Denodo per la Data Science - Il concetto di Multi-Purpose Data Lake “Amulti-purpose data lake can become an organization’s universal data delivery system” Architecting the Multi-Purpose Data Lake with Data Virtualization , Rick Van der Lans, April 2018
  • 17. Demo: Denodo in azione Una Demo vale più di mille parole…
  • 18. 18 https://flic.kr/p/x8HgrF Bike Sharing: possiamo prevedere l'utilizzo delle biciclette in base ai dati degli anni precedenti?
  • 20. 20 https://flic.kr/p/CYT7SS Fattori esterni che possono influenzare l’utilizzo • Meteo • Temperatura • Pioggia • Neve • Momento (Tempo) • Momento nell’anno, stagione • Giorno della settimana • Weekend, vananze • Altro…
  • 21. 21 Metodo e Strumenti Identify useful data Modify data into a useful format Analyze data Execute Data science algorithms (ML, AI, etc.) Use / Share with business users Prepare for ML algorithm Data Catalog: Content and Metadata Search, Data Preview Design Tool: Data Modeling, Cleansing and Transformations Zeppelin notebooks: Preview charts Design Tool: Transformation to tailor data for ML algorithm Zeppelin notebooks: Execute data science algorithms (Python) Data Catalog & API API calls & Share with business users results Il Flusso di Lavoro di un Data Scientist … e il supporto di Denodo nelle varie fasi
  • 23. 23 Il modello logico Denodo verrà utilizzato per modellare i dati, senza renderne obbligatoria la replica Utilizzo delle biciclette: Amazon S3 Informazioni Meteo: API pubblica Informazioni sulle Date: EDW, dimensione delle date Sources Combine, Transform & Integrate Consume Base View Source Abstraction join transform join Bike rides Weather Date
  • 24. 24 Modificare i dati in un formato utile
  • 26. 26 Preparare i dati per l’algoritmo di Machine Learning
  • 27. Q&A
  • 28. 28 Accedi alla piattaforma Denodo Platform in Cloud! Provala con i nostri Test Drive! INIZIA OGGI STESSO AWS www.denodo.com/TestDrive
  • 30. DENODO DATAFEST EMEA 2023 The Agile Data Management and Analytics Conference OCTOBER 25-26 2023 | BARCELONA, SPAIN REGISTER NOW www.denododatafest.com/EMEA
  • 31. Grazie! www.denodo.com info@denodo.com © Copyright Denodo Technologies. All rights reserved Se non diversamente specificato, nessuna parte di questo file PDF può essere riprodotta o utilizzata in qualsiasi forma o con qualsiasi mezzo, elettronico o meccanico, incluse fotocopie e microfilm, senza la preventiva autorizzazione scritta di Denodo Technologies.