SlideShare a Scribd company logo
1 of 42
Download to read offline
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
INTEGRACE DAT
DAVID VANÍK
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
INTEGRACE DAT O ČEM TO BUDE
• Proč se zabývat integrací dat
• Koncepce datové integrace z pohledu SASu
• SAS Data Integration Studio
• Virtuální integrace
• Metadata
• Workflow integračních procesů
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
INTEGRACE DAT PROČ
• Různorodá data
• Odlišná struktura
• Rozdílná kvalita
• Uložena na více místech
• Integrace a konsolidace dat
• Data uložená na jednom místě
• Stejná kvalita a struktura dat
• Aktuálnost dat
• Dostupná pro business uživatele
Správná data ve správný čas = Správná rozhodnutí
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
INTEGRACE DAT VYUŽITÍ
• Analýzy
• Reporting
• Data mining
• Prediktivní modely
• Marketingové kampaně
• Retenční aktivity
• Fraud system
Zvýšení ziskovosti firmy
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
DATOVÝ SKLAD
MS SQL
ORACLE
CRM
SAP
Excel
DATAMART
DATAMART
SOURCE DATA
Access
DATAMART
DATAMART
EDW
DATA WAREHOUSE REPORTING
MOBILE
HTML
EXCEL
VYSOKÉ NÁKLADY
POMALÁ IMPLEMENTACE
MALÁ FLEXIBILITA
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
DATAMARTY
MS SQL
ORACLE
CRM
SAP
Excel
DATAMART
DATAMART
SOURCE DATA
Access
DATAMART
DATAMART
DATA WAREHOUSE REPORTING
MOBILE
HTML
EXCEL
NÍZKÉ NÁKLADY
RYCHLÁ IMPLEMENTACE
VELKÁ FLEXIBILITA
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
INTEGRACE
MS SQL
ORACLE
CRM
SAP
Excel
DATAMART
DATAMART
SOURCE DATA
Access
DATAMART
DATAMART
DATA WAREHOUSE REPORTING
MOBILE
HTML
EXCEL
DQ
ETL
DATA INTEGRATION
METADATA
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
INTEGRACE VIRTUÁLNÍ
• Ne všechna data je třeba fyzicky integrovat
• Některé systémy lze efektivněji integrovat virtuálně
• Bez nutnosti fyzické konsolidace a uložení
• Využívá se pro spojení dat z DWH i mimo DWH
• Výhodné při potřebě zachovat stále aktuální data
ÚSPORA ČASU A PENĚZ
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
INTEGRACE VIRTUÁLNÍ
MS SQL
ORACLE
CRM
SAP
Excel
SOURCE DATA
Access
VIRTUAL DWH REPORTING
MOBILE
HTML
EXCEL
DATAMART
DATAMART
DATAMART
DATA WAREHOUSE
VIRTUAL DATA
INTEGRATION
METADATA
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
INTEGRACE
• Zajištění přehlednosti a budoucí udržitelnosti procesů datové integrace
• Kontrola datové kvality a čištění dat v rámci integrace dat
• Jednotná metadata
• Efektivní přístup
• Orientace na potřeby uživatelů
• Inkrementální přístup
CO BY MĚLA SPLŇOVAT
ETL NÁSTROJ = SAS DI STUDIO
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DATA INTEGRATION STUDIO
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO
Nástroj pro
tvorbu, implementaci a
řízení datových integračních
procesů
nezávislý
na datových zdrojích,
aplikacích
nebo platformách.
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO
• Široké spektrum vstupních a výstupních formátů
• DB (Oracle, Teradata, SQL Server)
• Textové soubory (txt, csv)
• MS Excel
• MS Access
• ERP systémy (SAP, BW, Siebel)
• ODBC, OLEDB zdroje
• Hadoop, Postgre
• Napojení pomocí modulů SAS ACCESS
• DB nativní
• ODBC
• Registrace vstupů a výstupů v metadatech
VSTUPY A VÝSTUPY
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO RŮZNÉ ZDROJE DAT
Oracle
Txt
Access
Excel
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO
• Standardní integrační transformace
• Sort, join, merge, filter, create, update, insert, delete
• Využití SQL jazyka
• Speciální transformace
• Integrace datové kvality
• Inkrementální přístup
• Historizace dat
• Aktuální trendy
• Možnost využití Hadoop, Postgre
• Virtuální integrace
TRANSFORMACE
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO VYUŽITÍ DATABÁZE
Automatické efektivní
využití DB systémů
pomocí SAS
pass-through, které
umožňuje přenos
zpracování na stranu
databáze.
DB
SERVER
ETL
SERVER
DB
SERVER
ETL
SERVER
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO IDENTIFIKACE INKREMENTU
SAS DI studio umožňuje identifikaci inkrementu pomocí
speciální komponenty.
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO CHANGE DATA CAPTURE
• Umožňuje efektivní realizaci inkrementálního
načítání
• Využívá změnových tabulek nebo značek na
straně databáze
• Výhodou je zrychlené načítání ETL procesů
• Přímo lze navázat historizaci SCD2
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO HISTORIZACE - SCD2 LOADER
SAS DI studio umožňuje řešit
historizaci dimenzionálních
tabulek pomocí SCD2 loaderu.
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO INTEGRACE DATOVÉ KVALITY
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO INTEGRACE DATOVÉ KVALITY
Využití datové
kvality v rámci
datové integrace
pomocí DataFlux
Jobu nebo
Service.
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO IMPACT ANALÝZA
SAS DI Studio
umožňuje
efektivně
realizovat
impact
analýzu ke
zjištění
závislostí v
ETL
procesech.
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO MONITORING
Ukázka sledování stavu zpracování, doby běhu a dalších parametrů na úrovni
jednotlivých komponent v rámci workflow příslušné úlohy v SAS DI Studiu.
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO DOKUMENTACE
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS DI STUDIO VÝHODY
• Přehlednost – jsou lehce zjistitelná použitá data i transformace, vše je obsahem
komponent zapojených do workflow a registrováno v metadatech
• Maintenance – řešení není závislé jen na autorovi kódu, ale je lehce spravovatelné
širším okruhem osob
• Impact analýza – lze lehce dohledat, co všechno se musí upravit při změně určité
tabulky nebo transformace
• Repository – možnost práce více uživatelů
• Dávkové zpracování – výsledné joby jsou dávkově spustitelné s možností
schedulingu, což eliminuje manuální práci
• Zabudovaná podpora pro kvalitu dat
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
VIRTUÁLNÍ INTEGRACE
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
DB2 Greenplum Oracle SAS
Data Sets
SAP Teradata Other
(via ODBC)
SAS®
FEDERATION SERVER
SOURCE
SYSTEMS
ADVANCED FEATURES
SMART CACHE
MANAGED ACCESS
QUERY ENGINEDATA ACCESSSECURITY
Business
Views
Monitor Data Services
Federated
DSNs
Federation
Engine
Optimizer
Native & ODBC
DriversAuthorization
Authentication
FEDERATION CLIENT
JDBC ODBC
USERS &
CONSUMING
APPLICATIONS
Row & Column
Multi-cache
Support
HIGH THROUGHPUT
READ/WRITE DATA ACCESS
FEDERATION SERVER
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
FEDERATION SERVER
• Ne všechna data musí být nutně v DWH
• Některé systémy lze efektivněji integrovat virtuálně
• Velká data s malým počtem přístupů
• Vysoká frekvence změn v datech
• Informace v DWH nemusí být zpožděné
• Virtuální integrace dat zajistí aktuální data
• Efektivní virtuální integrace
• Není třeba ETL procesů a kopií dat
• Úspora zdrojů a času
• Pružná reakce na změny
VIRTUÁLNÍ INTEGRACE
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
FEDERATION SERVER SECURITY MANAGEMENT
• Centrální security management
• Jednotné webové rozhraní
• Definice přístupových práv pro uživatele
a skupiny
• Přístupová práva na úrovni serveru,
schématu, tabulky, sloupce i řádku
• Umožňuje nastavení security i pro ne
DB systémy
• Excel, Access
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
FEDERATION SERVER MONITORING
• Aktivity uživatele
• Kdo, co, kdy dělá
• Připojení
• Dotazy
• Statistiky dotazů
• Identifikace často využívaných
dotazů
• Frekvence využití
• Průměrná délka trvání
• Tipy pro optimalizace dotazů
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
FEDERATION SERVER PŘÍNOSY
• Business
• Snadný přístup ke všem datům
• Integrace dat mimo DWH
• Stále aktuální data
• Častá, nejlépe real-time aktualizace
• Využití business vrstvy
• Bezpečnost
• Kdo přistupuje k datovým zdrojům
• Jaká data se používají
• Monitoring provozu
• Security i pro non DB systémy
• Security na úroveň řádků a sloupců
Too Big
Too Recent
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
FEDERATION SERVER PŘÍNOSY
• DWH
• Levná alternativa k tvorbě složitých DWH
• Datová samoobsluha, méně IT zdrojů
• Pružná reakce na změny
• Analýza a optimalizace dotazů
• Výhodné pro oblasti s obtížně řešitelnou
nebo neefektivní integrací dat
• Příliš velká data s malým počtem přístupů
• Vysoká frekvence změn v datech
Too Diverse
Too Ad-hoc
Too Inaccessible
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS METADATA
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS METADATA
• Centrálně sdílená
• Definice uživatelů, skupin a rolí
• Definice architektury – servery a jejich konfigurace
• Data warehouse metadata – databáze, tabulky, indexy, sloupce
• Business metadata – reporty, informační mapy
• Procesy - joby, flow
• Metadata bridges
• Propojení SAS metadat např. s modelovacím nástrojem Power Designer
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS METADATA MANAGEMENT CONSOLE
Správa metadat se realizuje v
grafickém prostředí SAS
Management Console
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS WORKFLOW
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
WORKFLOW NASTAVENÍ ZÁVISLOSTÍ
Logické závislosti
Závislost na souboru
Závislost na úloze
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
WORKFLOW KALENDÁŘ
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
CO JE DŮLEŽITÉ
• Zajištění přehlednosti a budoucí udržitelnosti procesů datové integrace
• Kontrola datové kvality a čištění dat v rámci integrace dat
• Efektivní přístup k tvorbě DWH
• Orientace na potřeby uživatelů
• Inkrementální přístup
• Možnost využití moderních přístupů
• Virtuální integrace
• Napojení na Hadoop, Postgre, …
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS ADD-IN MS EXCEL
Copyr ight © 2012, SAS Institute Inc. All rights reser ved.
SAS REPORTING SAS ADD-IN
• SAS je dostupný z MS Excel
• Zobrazení dat
• Ad-hoc analýzy
• Grafické výstupy
• Dynamické napojení Excelu na SAS
• Možnost využití výpočetního výkonu
SAS serveru
Copyr ight © 2012, SAS Institute Inc. All rights reser ved. www.SAS.com

More Related Content

What's hot

EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaciEXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaciTECHNODAT, CAE - systémy, s.r.o.
 
Prague data management meetup 2018-04-17
Prague data management meetup 2018-04-17Prague data management meetup 2018-04-17
Prague data management meetup 2018-04-17Martin Bém
 
Bezpečnost pro vaše data s minimem úsilí
Bezpečnost pro vaše data s minimem úsilíBezpečnost pro vaše data s minimem úsilí
Bezpečnost pro vaše data s minimem úsilíMarketingArrowECS_CZ
 
Microsoft Azure – Směr, jak změnit pohled na IT
Microsoft Azure – Směr, jak změnit pohled na ITMicrosoft Azure – Směr, jak změnit pohled na IT
Microsoft Azure – Směr, jak změnit pohled na ITMarketingArrowECS_CZ
 
Oracle business intelligence
Oracle business intelligenceOracle business intelligence
Oracle business intelligenceOracleSK
 

What's hot (8)

EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaciEXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
EXALEAD OnePart pro rychlé vyhledávání v CAD datech a technické dokumentaci
 
Prague data management meetup 2018-04-17
Prague data management meetup 2018-04-17Prague data management meetup 2018-04-17
Prague data management meetup 2018-04-17
 
SPARC T7 webinář
SPARC T7 webinářSPARC T7 webinář
SPARC T7 webinář
 
Mějme mraky v záloze!
Mějme mraky v záloze!Mějme mraky v záloze!
Mějme mraky v záloze!
 
Bezpečnost pro vaše data s minimem úsilí
Bezpečnost pro vaše data s minimem úsilíBezpečnost pro vaše data s minimem úsilí
Bezpečnost pro vaše data s minimem úsilí
 
Microsoft Azure – Směr, jak změnit pohled na IT
Microsoft Azure – Směr, jak změnit pohled na ITMicrosoft Azure – Směr, jak změnit pohled na IT
Microsoft Azure – Směr, jak změnit pohled na IT
 
Oracle business intelligence
Oracle business intelligenceOracle business intelligence
Oracle business intelligence
 
Možnosti databázové komprese
Možnosti databázové kompreseMožnosti databázové komprese
Možnosti databázové komprese
 

Similar to SAS - Integrace dat

Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2MarketingArrowECS_CZ
 
Open source technology stack
Open source technology stackOpen source technology stack
Open source technology stackMiloslav Hašek
 
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Martin Bém
 
(cesky) MDS ap a Sybase jak pokracujeme a co nabizime?
(cesky) MDS ap a Sybase jak pokracujeme a co nabizime?(cesky) MDS ap a Sybase jak pokracujeme a co nabizime?
(cesky) MDS ap a Sybase jak pokracujeme a co nabizime?MDS ap
 
Profinit: Prezentace snídaně integrace aplikací 2016
Profinit: Prezentace snídaně integrace aplikací 2016Profinit: Prezentace snídaně integrace aplikací 2016
Profinit: Prezentace snídaně integrace aplikací 2016Profinit
 
Pracovní snídaně: Zavádíme integrační platformu v 75 minutách
Pracovní snídaně: Zavádíme integrační platformu v 75 minutáchPracovní snídaně: Zavádíme integrační platformu v 75 minutách
Pracovní snídaně: Zavádíme integrační platformu v 75 minutáchProfinit
 
Customer Intelligence na webu - Lucie Staňková
Customer Intelligence na webu - Lucie StaňkováCustomer Intelligence na webu - Lucie Staňková
Customer Intelligence na webu - Lucie StaňkováAkce Dobrého webu
 
Závěrečný úkol KPI
Závěrečný  úkol KPIZávěrečný  úkol KPI
Závěrečný úkol KPIJan Lysý
 
BI Forum 2011 - Jak zrychlit analytické BI
BI Forum 2011 - Jak zrychlit analytické BIBI Forum 2011 - Jak zrychlit analytické BI
BI Forum 2011 - Jak zrychlit analytické BIOKsystem
 
Domain-Driven Design Sraz 6.6.2018
Domain-Driven Design Sraz 6.6.2018Domain-Driven Design Sraz 6.6.2018
Domain-Driven Design Sraz 6.6.2018Svatopluk Šimara
 
NoSQL databáze, MongoDB
NoSQL databáze, MongoDBNoSQL databáze, MongoDB
NoSQL databáze, MongoDBLukas Korous
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový skladProfinit
 
GIS ve skupině ČEZ
GIS ve skupině ČEZGIS ve skupině ČEZ
GIS ve skupině ČEZGeokomunita
 
Semináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních datSemináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních datJaroslav Prodelal
 
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...OKsystem
 

Similar to SAS - Integrace dat (20)

Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2Co přináší Oracle Database 12c Release 2
Co přináší Oracle Database 12c Release 2
 
Open source technology stack
Open source technology stackOpen source technology stack
Open source technology stack
 
Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22Prague data management meetup 2016-09-22
Prague data management meetup 2016-09-22
 
SAS® Visual Analytics
SAS® Visual AnalyticsSAS® Visual Analytics
SAS® Visual Analytics
 
(cesky) MDS ap a Sybase jak pokracujeme a co nabizime?
(cesky) MDS ap a Sybase jak pokracujeme a co nabizime?(cesky) MDS ap a Sybase jak pokracujeme a co nabizime?
(cesky) MDS ap a Sybase jak pokracujeme a co nabizime?
 
Profinit: Prezentace snídaně integrace aplikací 2016
Profinit: Prezentace snídaně integrace aplikací 2016Profinit: Prezentace snídaně integrace aplikací 2016
Profinit: Prezentace snídaně integrace aplikací 2016
 
Pracovní snídaně: Zavádíme integrační platformu v 75 minutách
Pracovní snídaně: Zavádíme integrační platformu v 75 minutáchPracovní snídaně: Zavádíme integrační platformu v 75 minutách
Pracovní snídaně: Zavádíme integrační platformu v 75 minutách
 
CSAS_v06
CSAS_v06CSAS_v06
CSAS_v06
 
2009 JEE Overview
2009 JEE Overview2009 JEE Overview
2009 JEE Overview
 
Customer Intelligence na webu - Lucie Staňková
Customer Intelligence na webu - Lucie StaňkováCustomer Intelligence na webu - Lucie Staňková
Customer Intelligence na webu - Lucie Staňková
 
Závěrečný úkol KPI
Závěrečný  úkol KPIZávěrečný  úkol KPI
Závěrečný úkol KPI
 
BI Forum 2011 - Jak zrychlit analytické BI
BI Forum 2011 - Jak zrychlit analytické BIBI Forum 2011 - Jak zrychlit analytické BI
BI Forum 2011 - Jak zrychlit analytické BI
 
Cloud Computing
Cloud ComputingCloud Computing
Cloud Computing
 
Domain-Driven Design Sraz 6.6.2018
Domain-Driven Design Sraz 6.6.2018Domain-Driven Design Sraz 6.6.2018
Domain-Driven Design Sraz 6.6.2018
 
NoSQL databáze, MongoDB
NoSQL databáze, MongoDBNoSQL databáze, MongoDB
NoSQL databáze, MongoDB
 
Matedatový sklad
Matedatový skladMatedatový sklad
Matedatový sklad
 
GIS ve skupině ČEZ
GIS ve skupině ČEZGIS ve skupině ČEZ
GIS ve skupině ČEZ
 
Semináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních datSemináře M-Files: Konec hledání řešení pro správu firemních dat
Semináře M-Files: Konec hledání řešení pro správu firemních dat
 
Apex day 1.0 speedy case study_kamil schvarcz
Apex day 1.0 speedy case study_kamil schvarczApex day 1.0 speedy case study_kamil schvarcz
Apex day 1.0 speedy case study_kamil schvarcz
 
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
BI Forum 2012 - Analýza nestrukturovaných dat pomocí Oracle Endeca Informatio...
 

More from MarketingArrowECS_CZ

INFINIDAT InfiniGuard - 20220330.pdf
INFINIDAT InfiniGuard - 20220330.pdfINFINIDAT InfiniGuard - 20220330.pdf
INFINIDAT InfiniGuard - 20220330.pdfMarketingArrowECS_CZ
 
Využijte svou Oracle databázi na maximum!
Využijte svou Oracle databázi na maximum!Využijte svou Oracle databázi na maximum!
Využijte svou Oracle databázi na maximum!MarketingArrowECS_CZ
 
Jak konsolidovat Vaše databáze s využitím Cloud služeb?
Jak konsolidovat Vaše databáze s využitím Cloud služeb?Jak konsolidovat Vaše databáze s využitím Cloud služeb?
Jak konsolidovat Vaše databáze s využitím Cloud služeb?MarketingArrowECS_CZ
 
Oracle databáze – Konsolidovaná Data Management Platforma
Oracle databáze – Konsolidovaná Data Management PlatformaOracle databáze – Konsolidovaná Data Management Platforma
Oracle databáze – Konsolidovaná Data Management PlatformaMarketingArrowECS_CZ
 
Nové vlastnosti Oracle Database Appliance
Nové vlastnosti Oracle Database ApplianceNové vlastnosti Oracle Database Appliance
Nové vlastnosti Oracle Database ApplianceMarketingArrowECS_CZ
 
Novinky ve světě Oracle DB a koncept konvergované databáze
Novinky ve světě Oracle DB a koncept konvergované databázeNovinky ve světě Oracle DB a koncept konvergované databáze
Novinky ve světě Oracle DB a koncept konvergované databázeMarketingArrowECS_CZ
 
Garance 100% dostupnosti dat! Kdo z vás to má?
Garance 100% dostupnosti dat! Kdo z vás to má?Garance 100% dostupnosti dat! Kdo z vás to má?
Garance 100% dostupnosti dat! Kdo z vás to má?MarketingArrowECS_CZ
 
Využijte svou Oracle databázi naplno
Využijte svou Oracle databázi naplnoVyužijte svou Oracle databázi naplno
Využijte svou Oracle databázi naplnoMarketingArrowECS_CZ
 
Oracle Data Protection - 2. část
Oracle Data Protection - 2. částOracle Data Protection - 2. část
Oracle Data Protection - 2. částMarketingArrowECS_CZ
 
Oracle Data Protection - 1. část
Oracle Data Protection - 1. částOracle Data Protection - 1. část
Oracle Data Protection - 1. částMarketingArrowECS_CZ
 
Benefity Oracle Cloudu (4/4): Storage
Benefity Oracle Cloudu (4/4): StorageBenefity Oracle Cloudu (4/4): Storage
Benefity Oracle Cloudu (4/4): StorageMarketingArrowECS_CZ
 
Benefity Oracle Cloudu (3/4): Compute
Benefity Oracle Cloudu (3/4): ComputeBenefity Oracle Cloudu (3/4): Compute
Benefity Oracle Cloudu (3/4): ComputeMarketingArrowECS_CZ
 
Exadata z pohledu zákazníka a novinky generace X8M - 1. část
Exadata z pohledu zákazníka a novinky generace X8M - 1. částExadata z pohledu zákazníka a novinky generace X8M - 1. část
Exadata z pohledu zákazníka a novinky generace X8M - 1. částMarketingArrowECS_CZ
 
Úvod do Oracle Cloud infrastruktury
Úvod do Oracle Cloud infrastrukturyÚvod do Oracle Cloud infrastruktury
Úvod do Oracle Cloud infrastrukturyMarketingArrowECS_CZ
 
Check Point automatizace a orchestrace
Check Point automatizace a orchestraceCheck Point automatizace a orchestrace
Check Point automatizace a orchestraceMarketingArrowECS_CZ
 
Oracle databáze - zkonsolidovat, ochránit a ještě ušetřit! (1. část)
Oracle databáze - zkonsolidovat, ochránit a ještě ušetřit! (1. část)Oracle databáze - zkonsolidovat, ochránit a ještě ušetřit! (1. část)
Oracle databáze - zkonsolidovat, ochránit a ještě ušetřit! (1. část)MarketingArrowECS_CZ
 

More from MarketingArrowECS_CZ (20)

INFINIDAT InfiniGuard - 20220330.pdf
INFINIDAT InfiniGuard - 20220330.pdfINFINIDAT InfiniGuard - 20220330.pdf
INFINIDAT InfiniGuard - 20220330.pdf
 
Využijte svou Oracle databázi na maximum!
Využijte svou Oracle databázi na maximum!Využijte svou Oracle databázi na maximum!
Využijte svou Oracle databázi na maximum!
 
Jak konsolidovat Vaše databáze s využitím Cloud služeb?
Jak konsolidovat Vaše databáze s využitím Cloud služeb?Jak konsolidovat Vaše databáze s využitím Cloud služeb?
Jak konsolidovat Vaše databáze s využitím Cloud služeb?
 
Oracle databáze – Konsolidovaná Data Management Platforma
Oracle databáze – Konsolidovaná Data Management PlatformaOracle databáze – Konsolidovaná Data Management Platforma
Oracle databáze – Konsolidovaná Data Management Platforma
 
Nové vlastnosti Oracle Database Appliance
Nové vlastnosti Oracle Database ApplianceNové vlastnosti Oracle Database Appliance
Nové vlastnosti Oracle Database Appliance
 
Infinidat InfiniGuard
Infinidat InfiniGuardInfinidat InfiniGuard
Infinidat InfiniGuard
 
Infinidat InfiniBox
Infinidat InfiniBoxInfinidat InfiniBox
Infinidat InfiniBox
 
Novinky ve světě Oracle DB a koncept konvergované databáze
Novinky ve světě Oracle DB a koncept konvergované databázeNovinky ve světě Oracle DB a koncept konvergované databáze
Novinky ve světě Oracle DB a koncept konvergované databáze
 
Garance 100% dostupnosti dat! Kdo z vás to má?
Garance 100% dostupnosti dat! Kdo z vás to má?Garance 100% dostupnosti dat! Kdo z vás to má?
Garance 100% dostupnosti dat! Kdo z vás to má?
 
Využijte svou Oracle databázi naplno
Využijte svou Oracle databázi naplnoVyužijte svou Oracle databázi naplno
Využijte svou Oracle databázi naplno
 
Oracle Data Protection - 2. část
Oracle Data Protection - 2. částOracle Data Protection - 2. část
Oracle Data Protection - 2. část
 
Oracle Data Protection - 1. část
Oracle Data Protection - 1. částOracle Data Protection - 1. část
Oracle Data Protection - 1. část
 
Benefity Oracle Cloudu (4/4): Storage
Benefity Oracle Cloudu (4/4): StorageBenefity Oracle Cloudu (4/4): Storage
Benefity Oracle Cloudu (4/4): Storage
 
Benefity Oracle Cloudu (3/4): Compute
Benefity Oracle Cloudu (3/4): ComputeBenefity Oracle Cloudu (3/4): Compute
Benefity Oracle Cloudu (3/4): Compute
 
InfiniBox z pohledu zákazníka
InfiniBox z pohledu zákazníkaInfiniBox z pohledu zákazníka
InfiniBox z pohledu zákazníka
 
Exadata z pohledu zákazníka a novinky generace X8M - 1. část
Exadata z pohledu zákazníka a novinky generace X8M - 1. částExadata z pohledu zákazníka a novinky generace X8M - 1. část
Exadata z pohledu zákazníka a novinky generace X8M - 1. část
 
Úvod do Oracle Cloud infrastruktury
Úvod do Oracle Cloud infrastrukturyÚvod do Oracle Cloud infrastruktury
Úvod do Oracle Cloud infrastruktury
 
Check Point automatizace a orchestrace
Check Point automatizace a orchestraceCheck Point automatizace a orchestrace
Check Point automatizace a orchestrace
 
vSAN a FileServices
vSAN a FileServicesvSAN a FileServices
vSAN a FileServices
 
Oracle databáze - zkonsolidovat, ochránit a ještě ušetřit! (1. část)
Oracle databáze - zkonsolidovat, ochránit a ještě ušetřit! (1. část)Oracle databáze - zkonsolidovat, ochránit a ještě ušetřit! (1. část)
Oracle databáze - zkonsolidovat, ochránit a ještě ušetřit! (1. část)
 

SAS - Integrace dat

  • 1. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. INTEGRACE DAT DAVID VANÍK
  • 2. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. INTEGRACE DAT O ČEM TO BUDE • Proč se zabývat integrací dat • Koncepce datové integrace z pohledu SASu • SAS Data Integration Studio • Virtuální integrace • Metadata • Workflow integračních procesů
  • 3. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. INTEGRACE DAT PROČ • Různorodá data • Odlišná struktura • Rozdílná kvalita • Uložena na více místech • Integrace a konsolidace dat • Data uložená na jednom místě • Stejná kvalita a struktura dat • Aktuálnost dat • Dostupná pro business uživatele Správná data ve správný čas = Správná rozhodnutí
  • 4. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. INTEGRACE DAT VYUŽITÍ • Analýzy • Reporting • Data mining • Prediktivní modely • Marketingové kampaně • Retenční aktivity • Fraud system Zvýšení ziskovosti firmy
  • 5. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. DATOVÝ SKLAD MS SQL ORACLE CRM SAP Excel DATAMART DATAMART SOURCE DATA Access DATAMART DATAMART EDW DATA WAREHOUSE REPORTING MOBILE HTML EXCEL VYSOKÉ NÁKLADY POMALÁ IMPLEMENTACE MALÁ FLEXIBILITA
  • 6. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. DATAMARTY MS SQL ORACLE CRM SAP Excel DATAMART DATAMART SOURCE DATA Access DATAMART DATAMART DATA WAREHOUSE REPORTING MOBILE HTML EXCEL NÍZKÉ NÁKLADY RYCHLÁ IMPLEMENTACE VELKÁ FLEXIBILITA
  • 7. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. INTEGRACE MS SQL ORACLE CRM SAP Excel DATAMART DATAMART SOURCE DATA Access DATAMART DATAMART DATA WAREHOUSE REPORTING MOBILE HTML EXCEL DQ ETL DATA INTEGRATION METADATA
  • 8. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. INTEGRACE VIRTUÁLNÍ • Ne všechna data je třeba fyzicky integrovat • Některé systémy lze efektivněji integrovat virtuálně • Bez nutnosti fyzické konsolidace a uložení • Využívá se pro spojení dat z DWH i mimo DWH • Výhodné při potřebě zachovat stále aktuální data ÚSPORA ČASU A PENĚZ
  • 9. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. INTEGRACE VIRTUÁLNÍ MS SQL ORACLE CRM SAP Excel SOURCE DATA Access VIRTUAL DWH REPORTING MOBILE HTML EXCEL DATAMART DATAMART DATAMART DATA WAREHOUSE VIRTUAL DATA INTEGRATION METADATA
  • 10. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. INTEGRACE • Zajištění přehlednosti a budoucí udržitelnosti procesů datové integrace • Kontrola datové kvality a čištění dat v rámci integrace dat • Jednotná metadata • Efektivní přístup • Orientace na potřeby uživatelů • Inkrementální přístup CO BY MĚLA SPLŇOVAT ETL NÁSTROJ = SAS DI STUDIO
  • 11. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DATA INTEGRATION STUDIO
  • 12. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO Nástroj pro tvorbu, implementaci a řízení datových integračních procesů nezávislý na datových zdrojích, aplikacích nebo platformách.
  • 13. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO • Široké spektrum vstupních a výstupních formátů • DB (Oracle, Teradata, SQL Server) • Textové soubory (txt, csv) • MS Excel • MS Access • ERP systémy (SAP, BW, Siebel) • ODBC, OLEDB zdroje • Hadoop, Postgre • Napojení pomocí modulů SAS ACCESS • DB nativní • ODBC • Registrace vstupů a výstupů v metadatech VSTUPY A VÝSTUPY
  • 14. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO RŮZNÉ ZDROJE DAT Oracle Txt Access Excel
  • 15. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO • Standardní integrační transformace • Sort, join, merge, filter, create, update, insert, delete • Využití SQL jazyka • Speciální transformace • Integrace datové kvality • Inkrementální přístup • Historizace dat • Aktuální trendy • Možnost využití Hadoop, Postgre • Virtuální integrace TRANSFORMACE
  • 16. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO VYUŽITÍ DATABÁZE Automatické efektivní využití DB systémů pomocí SAS pass-through, které umožňuje přenos zpracování na stranu databáze. DB SERVER ETL SERVER DB SERVER ETL SERVER
  • 17. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO IDENTIFIKACE INKREMENTU SAS DI studio umožňuje identifikaci inkrementu pomocí speciální komponenty.
  • 18. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO CHANGE DATA CAPTURE • Umožňuje efektivní realizaci inkrementálního načítání • Využívá změnových tabulek nebo značek na straně databáze • Výhodou je zrychlené načítání ETL procesů • Přímo lze navázat historizaci SCD2
  • 19. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO HISTORIZACE - SCD2 LOADER SAS DI studio umožňuje řešit historizaci dimenzionálních tabulek pomocí SCD2 loaderu.
  • 20. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO INTEGRACE DATOVÉ KVALITY
  • 21. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO INTEGRACE DATOVÉ KVALITY Využití datové kvality v rámci datové integrace pomocí DataFlux Jobu nebo Service.
  • 22. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO IMPACT ANALÝZA SAS DI Studio umožňuje efektivně realizovat impact analýzu ke zjištění závislostí v ETL procesech.
  • 23. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO MONITORING Ukázka sledování stavu zpracování, doby běhu a dalších parametrů na úrovni jednotlivých komponent v rámci workflow příslušné úlohy v SAS DI Studiu.
  • 24. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO DOKUMENTACE
  • 25. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS DI STUDIO VÝHODY • Přehlednost – jsou lehce zjistitelná použitá data i transformace, vše je obsahem komponent zapojených do workflow a registrováno v metadatech • Maintenance – řešení není závislé jen na autorovi kódu, ale je lehce spravovatelné širším okruhem osob • Impact analýza – lze lehce dohledat, co všechno se musí upravit při změně určité tabulky nebo transformace • Repository – možnost práce více uživatelů • Dávkové zpracování – výsledné joby jsou dávkově spustitelné s možností schedulingu, což eliminuje manuální práci • Zabudovaná podpora pro kvalitu dat
  • 26. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. VIRTUÁLNÍ INTEGRACE
  • 27. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. DB2 Greenplum Oracle SAS Data Sets SAP Teradata Other (via ODBC) SAS® FEDERATION SERVER SOURCE SYSTEMS ADVANCED FEATURES SMART CACHE MANAGED ACCESS QUERY ENGINEDATA ACCESSSECURITY Business Views Monitor Data Services Federated DSNs Federation Engine Optimizer Native & ODBC DriversAuthorization Authentication FEDERATION CLIENT JDBC ODBC USERS & CONSUMING APPLICATIONS Row & Column Multi-cache Support HIGH THROUGHPUT READ/WRITE DATA ACCESS FEDERATION SERVER
  • 28. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. FEDERATION SERVER • Ne všechna data musí být nutně v DWH • Některé systémy lze efektivněji integrovat virtuálně • Velká data s malým počtem přístupů • Vysoká frekvence změn v datech • Informace v DWH nemusí být zpožděné • Virtuální integrace dat zajistí aktuální data • Efektivní virtuální integrace • Není třeba ETL procesů a kopií dat • Úspora zdrojů a času • Pružná reakce na změny VIRTUÁLNÍ INTEGRACE
  • 29. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. FEDERATION SERVER SECURITY MANAGEMENT • Centrální security management • Jednotné webové rozhraní • Definice přístupových práv pro uživatele a skupiny • Přístupová práva na úrovni serveru, schématu, tabulky, sloupce i řádku • Umožňuje nastavení security i pro ne DB systémy • Excel, Access
  • 30. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. FEDERATION SERVER MONITORING • Aktivity uživatele • Kdo, co, kdy dělá • Připojení • Dotazy • Statistiky dotazů • Identifikace často využívaných dotazů • Frekvence využití • Průměrná délka trvání • Tipy pro optimalizace dotazů
  • 31. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. FEDERATION SERVER PŘÍNOSY • Business • Snadný přístup ke všem datům • Integrace dat mimo DWH • Stále aktuální data • Častá, nejlépe real-time aktualizace • Využití business vrstvy • Bezpečnost • Kdo přistupuje k datovým zdrojům • Jaká data se používají • Monitoring provozu • Security i pro non DB systémy • Security na úroveň řádků a sloupců Too Big Too Recent
  • 32. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. FEDERATION SERVER PŘÍNOSY • DWH • Levná alternativa k tvorbě složitých DWH • Datová samoobsluha, méně IT zdrojů • Pružná reakce na změny • Analýza a optimalizace dotazů • Výhodné pro oblasti s obtížně řešitelnou nebo neefektivní integrací dat • Příliš velká data s malým počtem přístupů • Vysoká frekvence změn v datech Too Diverse Too Ad-hoc Too Inaccessible
  • 33. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS METADATA
  • 34. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS METADATA • Centrálně sdílená • Definice uživatelů, skupin a rolí • Definice architektury – servery a jejich konfigurace • Data warehouse metadata – databáze, tabulky, indexy, sloupce • Business metadata – reporty, informační mapy • Procesy - joby, flow • Metadata bridges • Propojení SAS metadat např. s modelovacím nástrojem Power Designer
  • 35. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS METADATA MANAGEMENT CONSOLE Správa metadat se realizuje v grafickém prostředí SAS Management Console
  • 36. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS WORKFLOW
  • 37. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. WORKFLOW NASTAVENÍ ZÁVISLOSTÍ Logické závislosti Závislost na souboru Závislost na úloze
  • 38. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. WORKFLOW KALENDÁŘ
  • 39. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. CO JE DŮLEŽITÉ • Zajištění přehlednosti a budoucí udržitelnosti procesů datové integrace • Kontrola datové kvality a čištění dat v rámci integrace dat • Efektivní přístup k tvorbě DWH • Orientace na potřeby uživatelů • Inkrementální přístup • Možnost využití moderních přístupů • Virtuální integrace • Napojení na Hadoop, Postgre, …
  • 40. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS ADD-IN MS EXCEL
  • 41. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. SAS REPORTING SAS ADD-IN • SAS je dostupný z MS Excel • Zobrazení dat • Ad-hoc analýzy • Grafické výstupy • Dynamické napojení Excelu na SAS • Možnost využití výpočetního výkonu SAS serveru
  • 42. Copyr ight © 2012, SAS Institute Inc. All rights reser ved. www.SAS.com