More Related Content
Similar to BIInfrastructure
Similar to BIInfrastructure (20)
BIInfrastructure
- 1. IT podpora
pro business inteligenci
a podporu rozhodování
Semináře business inteligence a podpora
rozhodování
Přednáší Lukáš Časar
- 2. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 2
Základní architektura pro BI
Mine
Analyse
MANAGE ACCESS
Query
Marts
Design and Administration
Report
Data
Integration
Information
Delivery
SOURCE
Operational
Data
Warehouse
orERP
Data
External
Data
Business Solutions
Metadata
- 3. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 3
Cílem je přinést managementu odpovědi na otázky, na které
dříve nebylo možné odpovědět. To vše pomocí relativně
jednoduchých metod zpřístupňujících informace a znalosti
ukryté v (existujících) firemních datech.
Bohatství ukryté v datech…
- 4. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 4
Základní technické předpoklady
HW: Server s dostatečným výkonem a kapacitou
Ideálně jeden server pro skladiště konsolidovaných dat
(vyčištěná a propojená data z jednotlivých zdrojů) a jeden pro
OLAP a reporting. Pokud je k dispozici server jen jeden, je
vhodné hlavní činnosti oddělit časově (např. load, čištění a
předzpracování dat během noci, během dne výkon vyhrazen
pro práci uživatelů s analytickou a reportovací částí).
SW: Databázový stroj
S podporou ETL, OLAP a BI funkcí
Síťová infrastruktura
Dostatečná síťová konektivita pro load dat i pro přístup k nim
- 5. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 5
Nároky na zdrojová data
1. Strukturovanost
2. Čistota dat
3. Relevance dat
4. Integrovatelnost
5. Akceptace standardů
- 6. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 6
1. Strukturovanost
Zdrojová data musí být vhodně strukturovaná
Podmínkou je kvalitně navržený datový model zdrojových IS
Částečně lze úroveň strukturovanosti zlepšit vhodnými
nástroji a metodami (parsování, analýza nestrukturovaných
dat, …)
- 7. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 7
2. Čistota dat
Řízení kvality dat (purity)
Data získávaná z nekvalitních vnějších zdrojů či pořizovaná
ručně (často různými uživateli) je potřeba verifikovat a čistit
Automatické metody čištění (cleanising - nástroje na verifikaci
a parsování poštovních adres, atd…)
Manuální metody čištění
- 8. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 8
4. Integrovatelnost
Správnou IT strategií předcházíme budoucím problémům
Jednotlivé firemní IS musejí splňovat firemní standardy,
používat identické kódování/označování entit (produkt,
zákazník, zaměstnanec, pobočka, …) a unifikované formáty
pro výměnu dat/dokumentů
U každé entity by mělo být zřejmé, ve kterém systému vzniká,
každá entita by měla mít jen jeden „master“ zdroj. Pokud to
není technicky možné, mělo by toto pravidlo platit alespoň pro
atributy entit.
- 9. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 9
5. Standardy
Tam, kde to je možné, je vhodné používat zavedené číselníky
entit (číselník adres dle státní správy, číselník PSČ dle České
pošty, číselníky OKEČ, oborové číselníky, atd…)
Výhoda: snazší integrace jednotlivých firemních IS, ale i
jednodušší integrace s vnějšími datovými zdroji (ČSŮ,
výzkumné agentury, EU, …) a porovnatelnost hodnot
(oborové benchmarky, statistiky, …)
Podstatnou výhodou je i používání standardizovaných formátů
pro přenos daných dat (idoc, …).
- 10. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 10
Datový sklad
Obsahuje konsolidovaná integrovaná data z firemních IS,
případně i z vnějších zdrojů.
Propojuje do jednoho celku data z různých zdrojů, která dříve
nebylo možné dát do souvislostí
Umožňuje nové pohledy, kombinované pohledy a pohledy
z více úhlů
- 12. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 12
1. Reporty
Nejvyšší stupeň předdefinovanosti (nejnižší stupeň pružnosti)
Pokrývají určité standardní uživatelské potřeby, variabilita
spočívá pouze ve volbě filtru (např. období, pobočka, skupina
produktů, zákaznický segment), volbě agregačních podmínek
(groupování).
Interaktivita se pak většinou omezuje na drill-downy
(„rozklikávání“ agregovaných pohledů na detailnější, typicky
v hierarchiích typu rok-měsíc-týden, stát-kraj-obec, kategorie-
značka-výrobek, řetězec-člen, atd…)
- 13. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 13
2. On-line analýzy
Vyšší míra variability a interaktivity (a také vyšší nároky na
schopnosti obsluhy)
Technologie OLAP (resp. předdefinované a předagregované
vícedimenzionální pohledy na data – „kostky“) na straně
serveru.
Uživatelské rozhraní realizováno pomocí klientského nástroje
(počínaje MS Excelem a konče BusinessObjects).
Větší volnost pro uživatele a vyšší výkon, resp. menší zátěž
serverové infrastruktury (uživatelé využívají
předzpracovaných dat).
- 14. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 14
3. Dolování znalostí
Doposud představené metody předpokládají explicitní stanovení
toho, jaké výsledky chceme, resp. jak k nim chceme dojít.
V případě reportů jsou metody výpočtů přímo součástí definice
reportu (případně součástí definice OLAP SELECTu, uložené
procedury a podobně).
Reporty nám dávají pohled na historická data, říkají, co se stalo.
V případě OLAP analýz do určité míry ovlivňuje způsoby výpočtů
uživatel. Analýza historických dat nám odpoví na otázku, proč se tak
stalo.
V případě umělointeligenčního dolování znalostí však zákonitosti a
vazby v datech nehledá uživatel, ale sofistikovaný
umělointelogenční nástroj. Na uživateli pak již je „pouze“
z obchodního hlediska vysvětlit a vyhodnotit objevené zákonitosti a
vazby (například skupiny/segmenty zákazníků s určitým vzorcem
chování). Metodami strojového učení je možné predikovat budoucí
vývoj.
- 15. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 15
Možné přínosy
Určení zákaznických segmentů, možnost cílené a
strukturované marketingové komunikace
Určení profitability zákaznických segmentů
Předpověď vývoje chování spotřebitelů či odhad reakce na
marketingovou kampaň
atd..
- 16. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 16
Integrované úložiště dat Mindec
Mindec umožňuje do jednoho univerzálního datového úložiště
ukládat data vzešlá ze všech implementovaných metodik (od
řízení změny, přes procesní management až po finanční
řízení).
Do téhož univerzálního úložiště se ukládají data z
marketingových výzkumů, průzkumu znalostí pracovníků či
výzkumu spokojenosti zákazníků.
Data je tak možné komplexně vytěžovat, je možné nad nimi
provádět komplexní analýzy.
- 17. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 17
Vazba na externí systémy
Datový model Mindec umožňuje definovat vazbu mezi
vlastními daty a entitami v externích informačních systémech
(subjects).
Mindec tak přináší jednotící prvek, propojuje stávající
podnikové IS.
Například: může popisovat vztah mezi zákazníky (odkazuje
na podrobnosti zákazníka v CRM systému), pracovníky firmy
(odkazuje na detail pracovníka v HR systému) a produkty
(odkazuje na atributy produktu v IS pro řízení výroby).
- 18. 26.11.2016 Mindec semináře, © Mindec, sro, 2008 18
BI infrastruktura Mindec
Uzavřené vzdělávání organizace
Mindec umožňuje do jednoho univerzálního datového úložiště
ukládat data vzešlá
Z vestavěných metodik – procesně založený business audit
Z marketingových výzkumů,
Z průzkumu znalostí pracovníků
Data jsou zpracována v reálném čase
Přehledně prezentovány výsledky
Srovnání s přednastavenými parametry
Srovnání s historickými výsledky a výsledky organizačních jednotek
Upozornění (alert) na oblasti s nižším výkonem
Podpora rozhodování o prioritách
Poskytování cílených znalostí a kompetencí
Následné vytěžování dat – data miningové postupy