SlideShare a Scribd company logo
1 of 36
Klára Janovská, Ondřej Zýka, Petr Hájek 17. října 2017
Datová architektura
je, když…
2
Klára Janovská, Ondřej Zýka, Petr Hájek 17. října 2017
Datová architektura
je, když…
4
Proč datová architektura?
Data jsou v čím dál větší míře základními
stavebními prvky každé moderní
organizace – od malého e-shopu až po
velké globální obchodní společnosti.
Stejně jako se všechny stavby budují podle
plánů vytvořených architektem, tak pro
datově orientované organizace je nezbytná
dobře rozmyšlená a řízená datová
architektura.
5
Bez architekta?
Chtěli byste bydlet nebo pracovat v budově,
která byla postavena bez plánů, postupně
a spontánně?
6
Těžký život datového architekta
7
Co nás dnes čeká
› Nejprve budeme diskutovat roli datové architektury a její začlenění
v organizační struktuře společnosti
› Zmíníme přínosy datové architektury a to s využitím případových studií
a projektových zkušeností z bankovnictví, telekomunikací a pojišťovnictví
› Představíme některé prvky datové architektury: logický datový model
organizace, master data management a řízení datové kvality
› Představíme metodu Data Landscape Mapping a nabídneme postupy
jak vytvořit a udržovat Logický datový model, metadata a další komponenty
datové architektury
8
Co je naším cílem?
› Data-driven company
– Business řízený daty / Business provozovaný
prostřednictvím dat / Business založený na
datech
– Všechna rozhodnutí v rámci všech úrovní
managementu jsou prováděna na základě dat
a výsledky těchto rozhodnutí jsou opět zpětně
pomocí dat vyhodnocovány a měřeny
› Metadata-driven data governance
– Data řízená metadaty
– Všechna data v rámci organizace jsou popsána
daty (=metadaty)
– Celá (nejen datová) architektura organizace je
též (meta)datově popsána a řízena
9
Kontext podnikové architektury
ENTERPRISE
ARCHITECTURE
BUSINESS
ARCHITECTURE
APPLICATION
ARCHITECTURE
DATA
ARCHITECTURE
TECHNOLOGY
INFRASTRUCTURE
10
Schéma datové
architektury
Logický datový
model organizace – aneb:
dejme datům jména
12
5 otázek
› Proč bychom měli investovat do vzniku Logického datového
modelu organizace?
› Co obsahuje Logický datový model organizace?
› Jaký je vztah mezi Logickým modelem organizace a modelem
jádra datového skladu?
› Jak vznikne Logický datový model organizace?
› Jak měřit a hodnotit model?
13
Proč bychom měli investovat do vzniku Logického
datového modelu organizace?
› Abychom se domluvili navzájem
– Obchodní oddělení, právní oddělení, controlling, legacy, bezpečnost
› Abychom se domluvili s ostatními
– Požadavky externích institucí versus interní systémy
› Abychom popsali, co chceme
– Přenos byznys požadavků do IT
› Abychom našli, co potřebujeme
– Identifikace entit
– Vazba mezi byznys termíny a technickým řešením
14
Co obsahuje Logický datový model organizace?
› Byznys definice entit
› Identifikace entit
› Popis struktury entit (atributy, vazby)
› Požadavky na spravované data
› Vrstvy modelu
– Byznys slovník, informační model, logický datový model, fyzické modely
› Model nejsou obrázky, model je komunikace
15
Jaký je vztah mezi Logickým modelem organizace
a modelem jádra datového skladu?
› Často vznikají společně - DWH vyžaduje nějaký datový model
› Často se zaměňují
› Shody
– Model musí být srozumitelný pro co největší počet pracovníků
› Rozdíly
– S modely pracují různé skupiny pracovníků
– DWH modely používají složité modelovacích techniky, umožňující uložit
skoro jakákoliv data, Logický model musí být jednoduchý a přímočarý
– Pro DWH modely existují hotové industriální modely, Logický model
organizace je vždy unikátní a daný byznys architekturou
Obecný pattern není srozumitelný pattern
17
Jak vznikne Logický datový model organizace?
› From Scratch
› Source Systems Oriented Models
› Industrial Logical Data Models
› Kimbal, Inmon
› DataVault methodology
18
FSLDM – Definice základních oblastí a vazeb
PARTY
(People / Org.
of interest & their
relationships)
http://mike2.openmethodology.org/wiki/Guidelines_for_Using_the_FSLDM
LOCATION
CAMPAIGN
ARRANGEMENT
(Accounts, etc)
EVENT
(Contact/TXN, etc)
FEATURES
PRODUCTORGANIZATION
CHANNEL
(ATM, Kiosk, etc)
19
Data Vault – identifikace entit
LINKHUB SATHUB
SAT HUB LINK SAT
SATSAT SAT HUB SAT
20
Metriky modelů. Jak měřit a hodnotit model?
› Kolik oddělení (pracovníků) modelu rozumí
› Kolik pracovníků model používá? V kolika rozvojových projektech
a iniciativách je využit?
› Kolik obsahuje entit? (čtverečků při zobrazení)
› Kolik jednotlivé entity mají instancí?
Master Data
Management – aneb:
dejme datům „IDčka“
22
Čím z oboru MDM začít?
› Správa číselníků (Reference Data
Management)
› Jednotná identita u hlavních entit
23
Reference Data Management
› Správa všech kategorických oborů hodnot
› Zásadní je napojení na organizační dimenzi (vlastnictví, garantství)
› Hlavní a sjednocené dimenze datového modelu
– Klíčové např. pro entitu Product, Service (návaznost na produktový katalog,
katalog služeb apod.)
› V rámci organizace se může jednat o stovky číselníků
24
Identita záznamů hlavních datových entit
› Ideální je zavedení interních identifikátorů
– Přednost před přirozenými klíči z vnějšího světa – např. rodné číslo, číslo pasu atd.
– Klíčové entity: Party, Contract, Transaction, ve finančnictví např. Security
› Rozhodnutí, zda a jak budeme fyzicky udržovat tzv. master záznamy
– Fyzické vs. logické master záznamy?
– Přiřazování jen master IDs nebo sestavování tzv. zlatých záznamů?
– Zpětná propagace master IDs a vyčištěných dat do původních systémů?
Original (duplicated) recordsOriginal (duplicated) recordsOriginal (duplicated) records
Master IDs
Original (duplicated) recordsOriginal (duplicated) records
Golden RecordsGolden
records
Master
Ids
Datová kvalita
– aneb ať se na data
můžeme spolehnout
26
Datová kvalita?
U Stud&nky 13
Address line 1
Datový
steward
U Studánky 13
Address line 1
Pravda,
ale…
Proč čistit data?
Perspektiva
dat
Perspektiva
uživatele
Perspektiva
společnosti
Chyba v pravopisu Informace není dostupná Rozhodnutí učiněná na základě
špatných informací
Duplicitní záznam Informace je těžko
agregovatelná
Drahé a neúčinné marketingové
kampaně
Nesprávná hodnota Informace je nesprávná Odliv zákazníků díky špatné kvalitě
služeb
Zastaralá informace Na data se nelze spolehnout Vysoká náročnost nalezení
požadovaných informací
Nesprávný formát Data zachycují jen část celku Zpoždění projektů implementace
nových systémů
Chybějící záznam Data obsahují logické
nekonzistence
Problémy s compliance
Kdy data čistit?
› Pokud se objeví problém s datovou kvalitou, je třeba porovnávat přínosy
a náklady na čištění
Fin. ztráty způsobené
nekvalitou dat
Náklady na zlepšení
datové kvality
– Náklady na dodatečnou
verifikaci dat
– Náklady na data re-entry
– Kompenzace
– Pokuty
– Náklady způsobené
zhoršenou reputací
– Náklady způsobené
špatným rozhodnutím
– Náklady na školení
– Náklady na pravidelný
monitoring
– Náklady na deployment
DQ
– Náklady na analýzu
– Náklady na plánování
a implementaci opravy
Kdy jsou data kvalitní? – Dimenze datové kvality
Dimenze Popis
Dostupnost Data jsou k dispozici nebo snadno získatelné
Odpovídající granularita Granularita dat odpovídá zadané úloze
Věrohodnost Data jsou pravdivá a pochází z důvěryhodného zdroje
Úplnost Žádná data nechybí
Interpretovatelnost Data lze interpretovat bez složitých transformací – jsou ve správném
jazyce, jednotkách, apod.
Relevantnost Data jsou použitelná a užitečná pro vykonávané úlohy
Konzistence Data jsou ve správné logické provázanosti
Včasnost Data jsou k dispozici včas
Srozumitelnost Data jsou snadno pochopitelná a srozumitelná
Přidaná hodnota Data jsou přínosná
Unikátnost Data jsou unikátní
Jak zvýšit kvalitu dat? – DQ proces
Identify &
Assess
Improve &
Cleanse
Maintain
& Monitor
32
Důvody nekvality dat
› Chyby uživatelů
› Zastarávání dat
› Změna zvnějšku, kterou
nereflektujeme ve svých
systémech
› Nesprávně provedená migrace dat
› Špatně nastavená datová
integrace
› Úprava IT systémů (přehledné
uživatelské prostředí, nápovědy,
číselníky)
› Manuální / automatická úprava dat
› Zavedení governance
› Školení uživatelů
Náprava
Datová kvalita – Nikdy nekončící proces
› Je třeba monitorovat výsledky čištění
› Dělat pravidelný profiling, abych včasně odhalila negativní trend
› Dělat pravidelné review všech DQ dokumentů, zejména Datových standardů
a Datových slovníků
› Datovou kvalitu řešit v primárních systémech, nikoli až v DWH!
› Vždy je možné zlepšit kvalitu dat, nikdy nedosáhnu 100% kvality ve všech
systémech, mohu se jen tomuto stavu přibližovat
Data Landscape
Mapping
35
Jak začít? Data Landscape Mapping
BUSINESS PROCESSESITAPPLICATIONS
Business Processes
Owners
ITApplications
Owners
Data
Stewards
Profinit EU, s.r.o.
Tychonova 2, 160 00 Praha 6 | Telefon + 420 224 316 016
Web
www.profinit.eu
LinkedIn
linkedin.com/company/profinit
Twitter
twitter.com/Profinit_EU
Facebook
facebook.com/Profinit.EU
Youtube
Profinit EU
Děkujeme
za pozornost

More Related Content

Similar to Profinit snídaně datová_architektura_20171017_public

Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016Profinit
 
BI Forum 2011 - Jak zrychlit analytické BI
BI Forum 2011 - Jak zrychlit analytické BIBI Forum 2011 - Jak zrychlit analytické BI
BI Forum 2011 - Jak zrychlit analytické BIOKsystem
 
Alice_IT_Startegy_CZE_v2
Alice_IT_Startegy_CZE_v2Alice_IT_Startegy_CZE_v2
Alice_IT_Startegy_CZE_v2Jiri Novacek
 
Analytika v B2B světě
Analytika v B2B světěAnalytika v B2B světě
Analytika v B2B světěTaste Medio
 
Národní architektura ČR - Czech National Architecture
Národní architektura ČR - Czech National ArchitectureNárodní architektura ČR - Czech National Architecture
Národní architektura ČR - Czech National ArchitecturePavel Hrabe
 
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016   produktivita a efektivita v digitálním světě - v1.0125. 2. 2016   produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01Jan Janca
 
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...ÚISK FF UK
 
Digitalní strategie v souvislostech
Digitalní strategie v souvislostechDigitalní strategie v souvislostech
Digitalní strategie v souvislostechLibor Friedel
 
Social media monitoring
Social media monitoringSocial media monitoring
Social media monitoringJosef Šlerka
 
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...Taste
 
Agilní architektura
Agilní architekturaAgilní architektura
Agilní architekturaMilan Rubeš
 
20180201 1 big data jako nastroj pro hluboka transakcní mining
20180201 1 big data jako nastroj pro hluboka transakcní mining20180201 1 big data jako nastroj pro hluboka transakcní mining
20180201 1 big data jako nastroj pro hluboka transakcní miningProfinit
 
Kelly Services
Kelly ServicesKelly Services
Kelly Serviceskedlubinek
 
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...OKsystem
 
OKbase - Efektivní využití moderních IT nástrojů při řízení HR
OKbase - Efektivní využití moderních IT nástrojů při řízení HROKbase - Efektivní využití moderních IT nástrojů při řízení HR
OKbase - Efektivní využití moderních IT nástrojů při řízení HROKsystem
 
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Martin Bém
 
05 online distribuce_30_10_12_customer_intelligence_tomas_kratky
05 online distribuce_30_10_12_customer_intelligence_tomas_kratky05 online distribuce_30_10_12_customer_intelligence_tomas_kratky
05 online distribuce_30_10_12_customer_intelligence_tomas_kratkyProfinit
 
Datarestart - Big Data v praxi
Datarestart - Big Data v praxiDatarestart - Big Data v praxi
Datarestart - Big Data v praxiProfinit
 

Similar to Profinit snídaně datová_architektura_20171017_public (20)

Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
Big Data: reálné aplikace pro business - Odborna snidane 30. 11. 2016
 
BI Forum 2011 - Jak zrychlit analytické BI
BI Forum 2011 - Jak zrychlit analytické BIBI Forum 2011 - Jak zrychlit analytické BI
BI Forum 2011 - Jak zrychlit analytické BI
 
Alice_IT_Startegy_CZE_v2
Alice_IT_Startegy_CZE_v2Alice_IT_Startegy_CZE_v2
Alice_IT_Startegy_CZE_v2
 
Analytika v B2B světě
Analytika v B2B světěAnalytika v B2B světě
Analytika v B2B světě
 
Národní architektura ČR - Czech National Architecture
Národní architektura ČR - Czech National ArchitectureNárodní architektura ČR - Czech National Architecture
Národní architektura ČR - Czech National Architecture
 
Business It
Business ItBusiness It
Business It
 
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016   produktivita a efektivita v digitálním světě - v1.0125. 2. 2016   produktivita a efektivita v digitálním světě - v1.01
25. 2. 2016 produktivita a efektivita v digitálním světě - v1.01
 
Mpi ds p_02 (1)
Mpi ds p_02 (1)Mpi ds p_02 (1)
Mpi ds p_02 (1)
 
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
Denisa Parkosová: Knowledge management a jeho vazba na rozhodovací a plánovac...
 
Digitalní strategie v souvislostech
Digitalní strategie v souvislostechDigitalní strategie v souvislostech
Digitalní strategie v souvislostech
 
Social media monitoring
Social media monitoringSocial media monitoring
Social media monitoring
 
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
Data Date #3: Přemysl Horáček - Jak daleko jste s datovou analytikou? Maturit...
 
Agilní architektura
Agilní architekturaAgilní architektura
Agilní architektura
 
20180201 1 big data jako nastroj pro hluboka transakcní mining
20180201 1 big data jako nastroj pro hluboka transakcní mining20180201 1 big data jako nastroj pro hluboka transakcní mining
20180201 1 big data jako nastroj pro hluboka transakcní mining
 
Kelly Services
Kelly ServicesKelly Services
Kelly Services
 
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
 
OKbase - Efektivní využití moderních IT nástrojů při řízení HR
OKbase - Efektivní využití moderních IT nástrojů při řízení HROKbase - Efektivní využití moderních IT nástrojů při řízení HR
OKbase - Efektivní využití moderních IT nástrojů při řízení HR
 
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22
 
05 online distribuce_30_10_12_customer_intelligence_tomas_kratky
05 online distribuce_30_10_12_customer_intelligence_tomas_kratky05 online distribuce_30_10_12_customer_intelligence_tomas_kratky
05 online distribuce_30_10_12_customer_intelligence_tomas_kratky
 
Datarestart - Big Data v praxi
Datarestart - Big Data v praxiDatarestart - Big Data v praxi
Datarestart - Big Data v praxi
 

More from Profinit

Reference Data Management
Reference Data ManagementReference Data Management
Reference Data ManagementProfinit
 
Cloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudCloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudProfinit
 
Building big data pipelines—lessons learned
Building big data pipelines—lessons learnedBuilding big data pipelines—lessons learned
Building big data pipelines—lessons learnedProfinit
 
Understand your data dependencies – Key enabler to efficient modernisation
 Understand your data dependencies – Key enabler to efficient modernisation  Understand your data dependencies – Key enabler to efficient modernisation
Understand your data dependencies – Key enabler to efficient modernisation Profinit
 
Propensity Modelling for Banks
Propensity Modelling for BanksPropensity Modelling for Banks
Propensity Modelling for BanksProfinit
 
Legacy systems modernisation
Legacy systems modernisationLegacy systems modernisation
Legacy systems modernisationProfinit
 
Automating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresAutomating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresProfinit
 
4 Steps Towards Data Transparency
4 Steps Towards Data Transparency4 Steps Towards Data Transparency
4 Steps Towards Data TransparencyProfinit
 
Software systems modernisation
Software systems modernisationSoftware systems modernisation
Software systems modernisationProfinit
 
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileOdborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileProfinit
 
Data Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduData Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduProfinit
 
Detekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléDetekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléProfinit
 
Výsledky backtestu propensitního modelu
Výsledky backtestu propensitního modeluVýsledky backtestu propensitního modelu
Výsledky backtestu propensitního modeluProfinit
 
Propensitní modelování
Propensitní modelováníPropensitní modelování
Propensitní modelováníProfinit
 
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit
 
Profinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit
 
Profinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit
 
2019 09-23-snidane qa-public
2019 09-23-snidane qa-public2019 09-23-snidane qa-public
2019 09-23-snidane qa-publicProfinit
 
2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-fullProfinit
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyneProfinit
 

More from Profinit (20)

Reference Data Management
Reference Data ManagementReference Data Management
Reference Data Management
 
Cloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloudCloud in examples—(how to) benefit from modern technologies in the cloud
Cloud in examples—(how to) benefit from modern technologies in the cloud
 
Building big data pipelines—lessons learned
Building big data pipelines—lessons learnedBuilding big data pipelines—lessons learned
Building big data pipelines—lessons learned
 
Understand your data dependencies – Key enabler to efficient modernisation
 Understand your data dependencies – Key enabler to efficient modernisation  Understand your data dependencies – Key enabler to efficient modernisation
Understand your data dependencies – Key enabler to efficient modernisation
 
Propensity Modelling for Banks
Propensity Modelling for BanksPropensity Modelling for Banks
Propensity Modelling for Banks
 
Legacy systems modernisation
Legacy systems modernisationLegacy systems modernisation
Legacy systems modernisation
 
Automating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data StoresAutomating Data Lakes, Data Warehouses and Data Stores
Automating Data Lakes, Data Warehouses and Data Stores
 
4 Steps Towards Data Transparency
4 Steps Towards Data Transparency4 Steps Towards Data Transparency
4 Steps Towards Data Transparency
 
Software systems modernisation
Software systems modernisationSoftware systems modernisation
Software systems modernisation
 
Odborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum MobileOdborná snídaně: Datový sklad jako Perpetuum Mobile
Odborná snídaně: Datový sklad jako Perpetuum Mobile
 
Data Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí clouduData Science a MLOps v prostředí cloudu
Data Science a MLOps v prostředí cloudu
 
Detekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přáteléDetekce sociálních vazeb: domácnosti a přátelé
Detekce sociálních vazeb: domácnosti a přátelé
 
Výsledky backtestu propensitního modelu
Výsledky backtestu propensitního modeluVýsledky backtestu propensitního modelu
Výsledky backtestu propensitního modelu
 
Propensitní modelování
Propensitní modelováníPropensitní modelování
Propensitní modelování
 
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
Profinit Webinar: Benefits of Software Systems Modernization over their Repla...
 
Profinit webinar: Instalment Detector
Profinit webinar: Instalment DetectorProfinit webinar: Instalment Detector
Profinit webinar: Instalment Detector
 
Profinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publishProfinit_snidane_DWH_22_10_2019_publish
Profinit_snidane_DWH_22_10_2019_publish
 
2019 09-23-snidane qa-public
2019 09-23-snidane qa-public2019 09-23-snidane qa-public
2019 09-23-snidane qa-public
 
2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full2019 03-20 snidane-serie-kuchyne-full
2019 03-20 snidane-serie-kuchyne-full
 
2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne2018 11-28 snidane-serie-kuchyne
2018 11-28 snidane-serie-kuchyne
 

Profinit snídaně datová_architektura_20171017_public

  • 1. Klára Janovská, Ondřej Zýka, Petr Hájek 17. října 2017 Datová architektura je, když…
  • 2. 2
  • 3. Klára Janovská, Ondřej Zýka, Petr Hájek 17. října 2017 Datová architektura je, když…
  • 4. 4 Proč datová architektura? Data jsou v čím dál větší míře základními stavebními prvky každé moderní organizace – od malého e-shopu až po velké globální obchodní společnosti. Stejně jako se všechny stavby budují podle plánů vytvořených architektem, tak pro datově orientované organizace je nezbytná dobře rozmyšlená a řízená datová architektura.
  • 5. 5 Bez architekta? Chtěli byste bydlet nebo pracovat v budově, která byla postavena bez plánů, postupně a spontánně?
  • 7. 7 Co nás dnes čeká › Nejprve budeme diskutovat roli datové architektury a její začlenění v organizační struktuře společnosti › Zmíníme přínosy datové architektury a to s využitím případových studií a projektových zkušeností z bankovnictví, telekomunikací a pojišťovnictví › Představíme některé prvky datové architektury: logický datový model organizace, master data management a řízení datové kvality › Představíme metodu Data Landscape Mapping a nabídneme postupy jak vytvořit a udržovat Logický datový model, metadata a další komponenty datové architektury
  • 8. 8 Co je naším cílem? › Data-driven company – Business řízený daty / Business provozovaný prostřednictvím dat / Business založený na datech – Všechna rozhodnutí v rámci všech úrovní managementu jsou prováděna na základě dat a výsledky těchto rozhodnutí jsou opět zpětně pomocí dat vyhodnocovány a měřeny › Metadata-driven data governance – Data řízená metadaty – Všechna data v rámci organizace jsou popsána daty (=metadaty) – Celá (nejen datová) architektura organizace je též (meta)datově popsána a řízena
  • 11. Logický datový model organizace – aneb: dejme datům jména
  • 12. 12 5 otázek › Proč bychom měli investovat do vzniku Logického datového modelu organizace? › Co obsahuje Logický datový model organizace? › Jaký je vztah mezi Logickým modelem organizace a modelem jádra datového skladu? › Jak vznikne Logický datový model organizace? › Jak měřit a hodnotit model?
  • 13. 13 Proč bychom měli investovat do vzniku Logického datového modelu organizace? › Abychom se domluvili navzájem – Obchodní oddělení, právní oddělení, controlling, legacy, bezpečnost › Abychom se domluvili s ostatními – Požadavky externích institucí versus interní systémy › Abychom popsali, co chceme – Přenos byznys požadavků do IT › Abychom našli, co potřebujeme – Identifikace entit – Vazba mezi byznys termíny a technickým řešením
  • 14. 14 Co obsahuje Logický datový model organizace? › Byznys definice entit › Identifikace entit › Popis struktury entit (atributy, vazby) › Požadavky na spravované data › Vrstvy modelu – Byznys slovník, informační model, logický datový model, fyzické modely › Model nejsou obrázky, model je komunikace
  • 15. 15 Jaký je vztah mezi Logickým modelem organizace a modelem jádra datového skladu? › Často vznikají společně - DWH vyžaduje nějaký datový model › Často se zaměňují › Shody – Model musí být srozumitelný pro co největší počet pracovníků › Rozdíly – S modely pracují různé skupiny pracovníků – DWH modely používají složité modelovacích techniky, umožňující uložit skoro jakákoliv data, Logický model musí být jednoduchý a přímočarý – Pro DWH modely existují hotové industriální modely, Logický model organizace je vždy unikátní a daný byznys architekturou
  • 16. Obecný pattern není srozumitelný pattern
  • 17. 17 Jak vznikne Logický datový model organizace? › From Scratch › Source Systems Oriented Models › Industrial Logical Data Models › Kimbal, Inmon › DataVault methodology
  • 18. 18 FSLDM – Definice základních oblastí a vazeb PARTY (People / Org. of interest & their relationships) http://mike2.openmethodology.org/wiki/Guidelines_for_Using_the_FSLDM LOCATION CAMPAIGN ARRANGEMENT (Accounts, etc) EVENT (Contact/TXN, etc) FEATURES PRODUCTORGANIZATION CHANNEL (ATM, Kiosk, etc)
  • 19. 19 Data Vault – identifikace entit LINKHUB SATHUB SAT HUB LINK SAT SATSAT SAT HUB SAT
  • 20. 20 Metriky modelů. Jak měřit a hodnotit model? › Kolik oddělení (pracovníků) modelu rozumí › Kolik pracovníků model používá? V kolika rozvojových projektech a iniciativách je využit? › Kolik obsahuje entit? (čtverečků při zobrazení) › Kolik jednotlivé entity mají instancí?
  • 21. Master Data Management – aneb: dejme datům „IDčka“
  • 22. 22 Čím z oboru MDM začít? › Správa číselníků (Reference Data Management) › Jednotná identita u hlavních entit
  • 23. 23 Reference Data Management › Správa všech kategorických oborů hodnot › Zásadní je napojení na organizační dimenzi (vlastnictví, garantství) › Hlavní a sjednocené dimenze datového modelu – Klíčové např. pro entitu Product, Service (návaznost na produktový katalog, katalog služeb apod.) › V rámci organizace se může jednat o stovky číselníků
  • 24. 24 Identita záznamů hlavních datových entit › Ideální je zavedení interních identifikátorů – Přednost před přirozenými klíči z vnějšího světa – např. rodné číslo, číslo pasu atd. – Klíčové entity: Party, Contract, Transaction, ve finančnictví např. Security › Rozhodnutí, zda a jak budeme fyzicky udržovat tzv. master záznamy – Fyzické vs. logické master záznamy? – Přiřazování jen master IDs nebo sestavování tzv. zlatých záznamů? – Zpětná propagace master IDs a vyčištěných dat do původních systémů? Original (duplicated) recordsOriginal (duplicated) recordsOriginal (duplicated) records Master IDs Original (duplicated) recordsOriginal (duplicated) records Golden RecordsGolden records Master Ids
  • 25. Datová kvalita – aneb ať se na data můžeme spolehnout
  • 26. 26 Datová kvalita? U Stud&nky 13 Address line 1 Datový steward U Studánky 13 Address line 1
  • 28. Proč čistit data? Perspektiva dat Perspektiva uživatele Perspektiva společnosti Chyba v pravopisu Informace není dostupná Rozhodnutí učiněná na základě špatných informací Duplicitní záznam Informace je těžko agregovatelná Drahé a neúčinné marketingové kampaně Nesprávná hodnota Informace je nesprávná Odliv zákazníků díky špatné kvalitě služeb Zastaralá informace Na data se nelze spolehnout Vysoká náročnost nalezení požadovaných informací Nesprávný formát Data zachycují jen část celku Zpoždění projektů implementace nových systémů Chybějící záznam Data obsahují logické nekonzistence Problémy s compliance
  • 29. Kdy data čistit? › Pokud se objeví problém s datovou kvalitou, je třeba porovnávat přínosy a náklady na čištění Fin. ztráty způsobené nekvalitou dat Náklady na zlepšení datové kvality – Náklady na dodatečnou verifikaci dat – Náklady na data re-entry – Kompenzace – Pokuty – Náklady způsobené zhoršenou reputací – Náklady způsobené špatným rozhodnutím – Náklady na školení – Náklady na pravidelný monitoring – Náklady na deployment DQ – Náklady na analýzu – Náklady na plánování a implementaci opravy
  • 30. Kdy jsou data kvalitní? – Dimenze datové kvality Dimenze Popis Dostupnost Data jsou k dispozici nebo snadno získatelné Odpovídající granularita Granularita dat odpovídá zadané úloze Věrohodnost Data jsou pravdivá a pochází z důvěryhodného zdroje Úplnost Žádná data nechybí Interpretovatelnost Data lze interpretovat bez složitých transformací – jsou ve správném jazyce, jednotkách, apod. Relevantnost Data jsou použitelná a užitečná pro vykonávané úlohy Konzistence Data jsou ve správné logické provázanosti Včasnost Data jsou k dispozici včas Srozumitelnost Data jsou snadno pochopitelná a srozumitelná Přidaná hodnota Data jsou přínosná Unikátnost Data jsou unikátní
  • 31. Jak zvýšit kvalitu dat? – DQ proces Identify & Assess Improve & Cleanse Maintain & Monitor
  • 32. 32 Důvody nekvality dat › Chyby uživatelů › Zastarávání dat › Změna zvnějšku, kterou nereflektujeme ve svých systémech › Nesprávně provedená migrace dat › Špatně nastavená datová integrace › Úprava IT systémů (přehledné uživatelské prostředí, nápovědy, číselníky) › Manuální / automatická úprava dat › Zavedení governance › Školení uživatelů Náprava
  • 33. Datová kvalita – Nikdy nekončící proces › Je třeba monitorovat výsledky čištění › Dělat pravidelný profiling, abych včasně odhalila negativní trend › Dělat pravidelné review všech DQ dokumentů, zejména Datových standardů a Datových slovníků › Datovou kvalitu řešit v primárních systémech, nikoli až v DWH! › Vždy je možné zlepšit kvalitu dat, nikdy nedosáhnu 100% kvality ve všech systémech, mohu se jen tomuto stavu přibližovat
  • 35. 35 Jak začít? Data Landscape Mapping BUSINESS PROCESSESITAPPLICATIONS Business Processes Owners ITApplications Owners Data Stewards
  • 36. Profinit EU, s.r.o. Tychonova 2, 160 00 Praha 6 | Telefon + 420 224 316 016 Web www.profinit.eu LinkedIn linkedin.com/company/profinit Twitter twitter.com/Profinit_EU Facebook facebook.com/Profinit.EU Youtube Profinit EU Děkujeme za pozornost