2. Il prezzo
dei dati sporchi
140 aziende sono state monitorate
valutandone la perdita economica
causata da dati sbagliati
$
8,200,000.00
Perdita media stimata
$
20,000,000.00
Perdita stimata in 30 aziende
$
100,000,000.00
Le 6 più alte perdite stimate
il 25%dei Dati Critici nelle più
Importanti Compagnie del Mondo
è CORROTTO
Quasiil40%deidaticomplessividitutteleaziende
risutaessereinaccurato
Delle 100 aziende coinvolte in una iniziativa di data quality, la prima in classifica risulta
utilizzare il 23% di dati inaccurati nelle proprie decisioni di business.
L’ultima in classifica il 43%. Di queste il:
92%
AMMETTE CHE I PROPRI
CONTATTI NON SONO ACCURATI
66%
CREDE DI ESSERE INFLUENZATA
NEGATIVAMENTE DA DATI INACCURATI
Source:Melissadata-GartnerResearch-TheDataWarehousingInstitute
3. Lacrescitadell’informazione
L’implementazione di un’iniziativa di
Data Quality può portare a:
Le migliori compagnie dichiarano di poter accedere al solo 35% dei nuovi dati aggiunti.
Le peggiori solo al 10%
Il Data Cleansing
aiuta il Business
DATA
QUALITY
RIDUZIONICosti,budget e spese generali
10-20%
Corporate
Budget
40-50%
IT
Budget
40%
Costi
operativi
INCREMENTITutto ciò di cui ne vuoi di più
15-20%
Fatturato
20-40%
Vendite
0
5
10
15
20
2009 2010 2015 2020
Dati gestiti dall’impresa
Dati creati dall’impresa
zetabytes
Entro il 2020, si stima che l’azienda
media dovrà gestire oltre 30
Zetabyte di dati. Questo significa
che, nei prossimi 7 anni, la mole di
dati nelle imprese crescerà del
4400%
Source:Melissadata-GartnerResearch-TheDataWarehousingInstitute
4. DATA
QUALITY
Il Data Quality (DQ)
è un servizio integrato, costituito
da metodi e strumenti,orientato al
miglioramento della qualità dei
dati delle imprese richiedenti
rispetto alle caratteristiche
previste dalla ISO/IEC 25012 che
aiutano a valutare la qualità con
cui una realtà viene modellata.
La ISO/IEC 25012 "Data quality
model" valuta le caratteristiche di:
• accuratezza, intesa come
perfetta rispondenza con il
mondo reale che rappresenta;
• attualità, cioè del giusto tempo
in cui il dato è utilizzato;
• coerenza, quindi un dato non
contraddittorio con altri dati;
• completezza, presente per tutti
gli attributi necessari;
• credibilità, proveniente da fonte
certa.
Database a cui si connette:
AS400, DB2, FIREBIRD, INFORMIX,
INTERBASE, MARIADB, MSSQL,
ORACLE, POSTGRES, SAPDB,
SYBASE, ecc.
Descrizione
Gestire la qualità dei dati è
importante per varie ragioni,
ad esempio:
favorire il governo della
crescente disponibilità di dati;
acquisire dati la cui qualità è
sconosciuta;
gestire informazioni spesso
insoddisfacenti;
contenere la dispersione di dati nei
sistemi e tra sistemi;
incrementare i dati riusabili;
far convivere i legacy system con
sistemi aperti;
ridurre duplicazioni di dati e
impegno risorse;
diminuire i costi della non qualità;
eliminare progressivamente modelli
cartacei e processi manuali;
rimuovere le cause che determinano
dati errati;
contribuire allo sviluppo di servizi web
innovativi;
disponibilità di Open data che
possano soddisfare i principi di
credibilità e accuratezza.
5. DATA
QUALITY
Comelavora DataQuality
Funzionalità
Gestire la qualità dei dati è
importante per varie ragioni,
ad esempio:
Accuracy
Syntactic Data Accurancy
Data Range Accurancy
Completeness
Record Completeness Control
File Completeness Control
Data Value Completeness Control
False Completeness of File Control
Consistency
Referential Integrity Control
Data Format Consistency Control
Risk of Inconsistency Control
Risk of Data Inconsistency Control
Semantic Consistency Control
Currentness
Update Frequency Control
Timeliness of Update Control
connessione ai database
progetto per la
valutazione della qualità
Esecuzione dell’analisi
“Certificazione”della
qualità dei dati
6. Pacchetto in-house
Licenza Software
Installazione, configurazione
e attività dimostrative
Training on the job
V.Orabona,4 c/o Dip.di informatica - 70125 Bari
T +39.080.5442048 - F +39.080.5442536
P.I.06526430720 REA: 49268
www.serandp.com
info@serandp.com
DATA
QUALITY