SlideShare a Scribd company logo
Beslutsstöd
Internutbildning
Stockholm
2008-04-11
Denna rapport är konfidentiell och avsedd enbart för den klient till vilken den är adresserad
Beslutsstöd – Centrala begrepp
Syftet med presentationen är att ge en grundläggande förståelse kring centrala
begrepp inom området beslutsstöd
 Beslutsstöd (business intelligence) - sammanfattande benämning på programvaror och
lösningar som används för att samla in, konsolidera, analysera och rapportera en
verksamhets data.
 Data kan vara lagrat på olika ställen och i olika system eller komma från externa källor.
Beslutsstöd – Mål med datalager
Information är en av verksamhetens viktigaste tillgångar/resurser, den lagras i
de operationella system där data kommer in och i datalagret där data kommer
ut. Målen med ett datalager är att:
 Göra verksamhetens information tillgängligt – innehållet i datalagret skall vara förståeligt,
navigerbart och snabbt tillgängligt.
 Göra verksamhetens information konsekvent – om flera mätvärden har samma namn skall
de betyda samma sak.
 Vara en anpassningsbar och flexibel källa till information – datalagret skall vara byggt för
förändringar.
 Vara en säker plats som skyddar verksamhetens informationstillgångar.
 Vara grunden för belutsfattande i verksamheten.
Beslutsstöd - Källsystem
Källsystem är de operationella system innehållande rader som fångar
transaktionerna i verksamheten
 I de operationella systemen är upptid och tillgänglighet viktigt, dessa system innehåller
endast lite historisk data.
Beslutsstöd – Data Staging Area
Data Staging Arean är en lagringsplats och ett antal processer som tvättar,
omvandlar, kombinerar, tar bort dubbletter, städar och förbereder data för
användning datalagret
 Data Staging Arean ligger mellan källsystem och presentationslagret, den är ej till för frågor
och presentation och kan bestå av både filer och relationsdatabaser.
Beslutsstöd – ETL
Data Staging (ETL) är den viktigaste processen i ett datalager och består av
subprocesserna Extrahera, Transformera och Ladda
 Extrahera (Extract) – första steget är att få in data i datalagret ifrån källsystemen. Det handlar
om att läsa, förstå och kopiera de delar som skall till data staging arean.
 Transformera (Transform) – andra steget är att på den data som laddats till staging arean
utföra ett antal omvandlingar av data:
– Tvätta: rätta felstavningar, lösa ev. konflikter (t ex postnr och ort), hantera data som
saknas, omvandla data till standardformat.
– Ta bort fält, överförda från källsystemet, som inte skall användas.
– Kombinera datakällor genom matchning eller uppslagning av koder.
– Skapa surrogatnycklar, man får inte återvända källsystemsnycklar.
 Ladda (Load) – tredje steget är att ladda fakta och dimensionstabeller. Tabellerna indexeras
därefter för att förbättra frågeprestandan.
 För att bygga/koda ETL används oftast speciella ETL-verktyg, några vanliga är MS
Integration Services (SSIS), Informatica, Data Stage, Oracle Warehouse Builder och BO
Integrator.
Beslutsstöd – Presentationsserver
I Presentationsservern är data i datalagret (Data Warehouse) organiserat och
lagrat för frågor från slutanvändaren, rapporter och andra applikationer
 Slutanvändarverktyg - en uppsättning verktyg som frågar, analyserar och presenterar
information.
 Analysverktyg - datalagerklienter för SQL-frågor, rapporter, grafer, ad-hoc frågor (användaren
skapar egna frågor) eller datamining.
 De vanligaste verktygen inom beslutsstöd kommer från Business Objects, Cognos, SAS och
Microsoft.
Dimensionsmodellering är en alternativ teknik till E/R-modellering för att
modellera data i ett datalager, dimensionsmodell kallas ofta stjärna
 Dimensionsmodellen innehåller samma information som E/R-modellen men är designad för
användbarhet, frågeprestanda och flexibilitet för förändringar.
 Huvudkomponenter i modellen är fakta- och dimensionstabeller.
 När fakta- och dimensionstabeller i en dimensionsmodell binds ihop kallar man det en stjärna
(star schema)
Beslutsstöd – Stjärna
Beslutsstöd - Snowflake
Stjärnor är denormaliserade och om man normaliserar dessa kallas de
snowflake (snöflinga), en totalt normaliserad snowflake hamnar i 3:NF
 Normalisering av ett datalager kommer innebära försämrad frågeprestanda, p.g.a fler joins,
och en mer komplex informationsstruktur för användarna och skall alltid undvikas.
Beslutsstöd - Faktatabell
Faktatabellen är huvudtabell i varje dimensionsmodell och innehåller
mätvärden från verksamheten
 En rad i en faktatabell motsvarar ett mätvärde, ett mätvärde är en rad i en faktatabell. Alla
mätvärden i en faktatabell måste vara av samma detaljeringsgrad.
 De mest användbara fakta i en faktatabell är numeriska och adderbara.
 Faktatabeller har ett många-till-många förhållande till dimensionstabeller.
 Fakta eller numerisk data har två eller flera främmande nycklar till respektive
dimensionstabell.
 Faktatabeller innehåller få kolumner och många rader.
Datum Nyckel Produkt Nyckel Butik Nyckel Sålt Antal Försäljningsbelopp
20080315 1034 78 7 714
20080315 1035 78 35 1335
Beslutsstöd - Dimensionstabell
Dimensionstabellerna innehåller textuella beskrivningar av verksamheten och
är den primära källan för filtrering och gruppering av data
 Dimensionstabellerna innehåller förutom en primärnyckel ett antal textattribut som används
för filtrering och gruppering av frågor.
 Dimensionstabeller är ingångspunkten till faktatabellen och gränssnittet mot datalagret.
 Dimensionsattributen ger möjlighet att bryta ner data och se på det ur olika perspektiv (”slice
and dice”).
 Det som anges efter per i frågor och rapporter är dimensionsattribut.
 Dimensionstabeller har många kolumner (attribut) och få rader.
Produkt Nyckel
Produktnam
n
Produktbeskrivnin
g EAN kod
Produktgrup
p
Produktkategor
i
1034 Citronglass SIA citronglass 1 l
4834533
5 Gräddglass Glass
1035 Vanilglass SIA vaniljglass 1 l
4683242
5 Gräddglass Glass
Beslutsstöd – Slowly Changing Dimensions
Slowly Changing Dimensions (SCD) - dimensioner innehållande data som långsamt
förändras, vilken typ av SCD man väljer beror på hur mycket historik man vill spara.
 Typ 1 – Den nya raden ersätter orginalraden, inga spår kommer att finns av den gamla raden
d v s ingen historik sparas.
 Typ 2 – En ny rad läggs till i dimensionstabellen, butiken hanteras som två olika butiker, detta
medför att det finns oändlig historik om butiken.
 Typ 3 – Orginalraden modifieras för att spegla förändringarna, man har t ex en kolumn för
orginalnamnet och en kolumn för det nuvarande namnet och en kolumn som talar om från
när det nuvarande namnet gäller.
ButikNyckel ButikNamn ButikOrt
101 Nisses livs Kista
ButikNyckel ButikNamn ButikOrt Version
101 Nisses livs Kista 0
102 Nisses livs Södertälje 1
ButikNyckel ButikNamn ButikOrt StartDatum SlutDatum
101 Nisses livs Kista 2000-01-01 2008-03-31
102 Nisses livs Södertälje 2008-04-01
ButikNyckel ButikNamn OrginalButikOrt StartDatum NuvarandeButikOrt
101 Nisses livs Kista 2008-04-01 Södertälje
ButikNyckel ButikNamn ButikOrt
101 Nisses livs Södertälje
För att öka frågeprestandan ytterligare kan man ladda så kallade kuber med
data ifrån dimensionstabellerna, i kuberna lagras föraggregerad data
 Kuber är flerdimensionella och kan jämföras med pivottabeller.
 Microsoft Analysis Services (SSAS) använder en typ av kub som kallas OLAP (On-Line-
Analytic-Processing).
 I OLAP-kuber används MDX (MultiDimensional Expression) istället för SQL för
frågor/manipulation av data:
SELECT { [Measures].[Store Sales] } ON COLUMNS,
{ [Date].[2002], [Date].[2003] } ON ROWS
FROM Sales
WHERE ( [Store].[USA].[CA] )
Beslutsstöd – Kub
Ladda
“The Data Warehouse Lifecycle” är en utvecklingsprocess för beslutsstöd som
har tagits fram av Kimball Group
Teknisk
Arkitektur
Design
Teknisk
Arkitektur
Design
Produktval
&
Installation
Produktval
&
Installation
BI
Applikations
Specifikation
BI
Applikations
Specifikation
BI
Applikations
Utveckling
BI
Applikations
Utveckling
Projekt
Planering
Projekt
Planering
KravfångstKravfångst Produktions-
sättning
Produktions-
sättning
Drift
och
Förvaltning
Drift
och
Förvaltning
Projekt LedningProjekt Ledning
Dimensions-
modellering
Dimensions-
modellering
Fysisk
Design
Fysisk
Design
Data Staging
Design &
Utveckling
Data Staging
Design &
Utveckling
Under en dimensionsmodellering går man igenom följande arbetssteg
1. Bestäm vilken affärsprocess, den serie verksamhetsaktiviteter, som skall modelleras genom
en kombinerad förståelse av krav och tillgänglig data.
2. Avgör detaljeringsgrad för faktatabellen, välj lägsta tillgängliga nivå.
3. Bestäm vilka dimensionstabeller och dess kolumner som skall finnas till varje faktatabell.
4. Bestäm vilka mätvärden som skall finnas i faktatabellen.
5. Bestäm hur förändringar i dimensionerna skall hanteras – Slowly Changing Dimensions.
Beslutsstöd – Arbetssteg
I en datalagermatris (Data Warehouse Bus Matrix) mappar man dimensioner
och affärsprocesser
 Varje affärsprocess blir ett datamart, en logisk datamängd, och tillsammans kommer dessa
datamart utgöra ett datalager (Data Warehouse)
Beslutsstöd – Datalagermatris
Gemensamma dimensioner
Affärsprocesser Datum Produkt Butik Kampanj Leverantör
Försäljning X X X X
Inventering X X X
Order X X X
Under den fysiska designen använder man sig av datamappning för att
fastställa källa till mål i dimensionstabellen
Beslutsstöd – Datamappning
Target Source
Column Name Display Name Description Data-type Size Precisi
on
Key? FK
To
NULL? Default
Value
Unknown
Member
Example
Values
SCD
Type
Source
System
Source
Schema
Source Table Source Field Name Source
Datatype
ETL Rules Comments
ProductKey ProductKey Surrogate primary
key
int PK ID N -1 1, 2, 3… Derived
BKProductID BKProductID ProductID,
Natural key from
source system
int N -1 AW Production Product ProductID int
ProductSKU ProductSKU SKU, also known
as Product
Number
varchar 25 Unknown 1 AW Production Product ProductNumber nvarchar(25)
ProductName ProductName Product name varchar 50 Unknown 1 AW Production Product Name nvarchar(50)
ProductDescr ProductDescr Product English
description
varchar 50 Unknown 1 AW Production Product Name nvarchar(50) Populate
with the
product
name for
now
We need a source
for description.
ProductModelID ProductModelID Product model ID
from source
system
int 1 AW Production Product ProductModelID int NULL to -1
Model Model Model name varchar 50 Unknown 1 AW Production ProductModel Name nvarchar(50) Join on
Product.Pro
ductModelID
ProductSubcategoryID ProductSubcategoryID Product
subcategory ID
from the source
system
int 1 AW Production Product ProductSubcategoryID int NULL to -1
Exempel på hur ETL design på hög nivå kan se ut
Beslutsstöd – ETL-design

More Related Content

Viewers also liked

Grundlaggande redovisning, sm (1)
Grundlaggande redovisning, sm (1)Grundlaggande redovisning, sm (1)
Grundlaggande redovisning, sm (1)
Malin Johansson
 
Example of a SlideShare presentation
Example of a SlideShare presentationExample of a SlideShare presentation
Example of a SlideShare presentation
Fondation Montréal inc.
 
BBVA Results Presentation 2Q16
BBVA Results Presentation 2Q16BBVA Results Presentation 2Q16
BBVA Results Presentation 2Q16
BBVA
 
Presentación Institucional 3T16
Presentación Institucional 3T16Presentación Institucional 3T16
Presentación Institucional 3T16
BBVA
 

Viewers also liked (7)

100385
100385100385
100385
 
100365
100365100365
100365
 
100250
100250100250
100250
 
Grundlaggande redovisning, sm (1)
Grundlaggande redovisning, sm (1)Grundlaggande redovisning, sm (1)
Grundlaggande redovisning, sm (1)
 
Example of a SlideShare presentation
Example of a SlideShare presentationExample of a SlideShare presentation
Example of a SlideShare presentation
 
BBVA Results Presentation 2Q16
BBVA Results Presentation 2Q16BBVA Results Presentation 2Q16
BBVA Results Presentation 2Q16
 
Presentación Institucional 3T16
Presentación Institucional 3T16Presentación Institucional 3T16
Presentación Institucional 3T16
 

Similar to Gate 1 beslutsstöd

Rough guide to data vault modelling
Rough guide to data vault modellingRough guide to data vault modelling
Rough guide to data vault modellingDmitri Apassov
 
Sympathy for data
Sympathy for dataSympathy for data
Sympathy for data
Stefan Larsson
 
Kundpresentation Förnyelsen och integrationsförnyelsen
Kundpresentation Förnyelsen och integrationsförnyelsenKundpresentation Förnyelsen och integrationsförnyelsen
Kundpresentation Förnyelsen och integrationsförnyelsen
SDCslides
 
BO universe
BO universeBO universe
BO universe
Malin Johansson
 
Masterdata produktbeskrivning
Masterdata produktbeskrivningMasterdata produktbeskrivning
Masterdata produktbeskrivning
IRISslideshare
 
Workshop valideringstjänsten
Workshop valideringstjänstenWorkshop valideringstjänsten
Workshop valideringstjänsten
Geological Survey of Sweden
 
Affärssystem: Eget vs. standard
Affärssystem: Eget vs. standard Affärssystem: Eget vs. standard
Affärssystem: Eget vs. standard
Alex Eriksson
 
170223 Acando seminar Masterdata
170223 Acando seminar Masterdata170223 Acando seminar Masterdata
170223 Acando seminar Masterdata
Acando Sweden
 
Ferrologic Presentation Linkedin
Ferrologic Presentation LinkedinFerrologic Presentation Linkedin
Ferrologic Presentation Linkedinmattias_wuori
 
Vintergatan & Nya insikter - Creative morning 9 dec 2016
Vintergatan & Nya insikter - Creative morning 9 dec 2016Vintergatan & Nya insikter - Creative morning 9 dec 2016
Vintergatan & Nya insikter - Creative morning 9 dec 2016
Annika Klyver
 
High way to hell v1.0
High way to hell v1.0High way to hell v1.0
High way to hell v1.0
Kristoffer Lundegren
 
Bra verktyg för produktägare som vidareutvecklar scrum - André Ekespong
Bra verktyg för produktägare som vidareutvecklar scrum - André EkespongBra verktyg för produktägare som vidareutvecklar scrum - André Ekespong
Bra verktyg för produktägare som vidareutvecklar scrum - André Ekespongmanssandstrom
 
Metadata (Vad är metadata?)
Metadata (Vad är metadata?)Metadata (Vad är metadata?)
Metadata (Vad är metadata?)
Stina Degerstedt
 
BigData med logganalys
BigData med logganalysBigData med logganalys
BigData med logganalys
Findwise
 
IT-styrning i Sundsvalls kommunkoncern -- IT-planering & systemförvaltning
IT-styrning i Sundsvalls kommunkoncern -- IT-planering & systemförvaltningIT-styrning i Sundsvalls kommunkoncern -- IT-planering & systemförvaltning
IT-styrning i Sundsvalls kommunkoncern -- IT-planering & systemförvaltning
Thomas Norlin
 
Oppgavegiveren: Mixed mode inom insamlingen av data
Oppgavegiveren: Mixed mode inom insamlingen av dataOppgavegiveren: Mixed mode inom insamlingen av data
Oppgavegiveren: Mixed mode inom insamlingen av data
Nordisk statistikermøte 2013
 
Kraftsamling ai referensgruppsmöte 2 driftoptimering inom energi i befintligt...
Kraftsamling ai referensgruppsmöte 2 driftoptimering inom energi i befintligt...Kraftsamling ai referensgruppsmöte 2 driftoptimering inom energi i befintligt...
Kraftsamling ai referensgruppsmöte 2 driftoptimering inom energi i befintligt...
MariellJuhlin1
 

Similar to Gate 1 beslutsstöd (20)

Rough guide to data vault modelling
Rough guide to data vault modellingRough guide to data vault modelling
Rough guide to data vault modelling
 
Sympathy for data
Sympathy for dataSympathy for data
Sympathy for data
 
Kundpresentation Förnyelsen och integrationsförnyelsen
Kundpresentation Förnyelsen och integrationsförnyelsenKundpresentation Förnyelsen och integrationsförnyelsen
Kundpresentation Förnyelsen och integrationsförnyelsen
 
BO universe
BO universeBO universe
BO universe
 
Masterdata produktbeskrivning
Masterdata produktbeskrivningMasterdata produktbeskrivning
Masterdata produktbeskrivning
 
Workshop valideringstjänsten
Workshop valideringstjänstenWorkshop valideringstjänsten
Workshop valideringstjänsten
 
gupea_2077_10443_1
gupea_2077_10443_1gupea_2077_10443_1
gupea_2077_10443_1
 
Affärssystem: Eget vs. standard
Affärssystem: Eget vs. standard Affärssystem: Eget vs. standard
Affärssystem: Eget vs. standard
 
170223 Acando seminar Masterdata
170223 Acando seminar Masterdata170223 Acando seminar Masterdata
170223 Acando seminar Masterdata
 
Ferrologic Presentation Linkedin
Ferrologic Presentation LinkedinFerrologic Presentation Linkedin
Ferrologic Presentation Linkedin
 
Vintergatan & Nya insikter - Creative morning 9 dec 2016
Vintergatan & Nya insikter - Creative morning 9 dec 2016Vintergatan & Nya insikter - Creative morning 9 dec 2016
Vintergatan & Nya insikter - Creative morning 9 dec 2016
 
Inuit_Forum_1-2015_web
Inuit_Forum_1-2015_webInuit_Forum_1-2015_web
Inuit_Forum_1-2015_web
 
High way to hell v1.0
High way to hell v1.0High way to hell v1.0
High way to hell v1.0
 
Bra verktyg för produktägare som vidareutvecklar scrum - André Ekespong
Bra verktyg för produktägare som vidareutvecklar scrum - André EkespongBra verktyg för produktägare som vidareutvecklar scrum - André Ekespong
Bra verktyg för produktägare som vidareutvecklar scrum - André Ekespong
 
Metadata (Vad är metadata?)
Metadata (Vad är metadata?)Metadata (Vad är metadata?)
Metadata (Vad är metadata?)
 
Medytekk AB
Medytekk ABMedytekk AB
Medytekk AB
 
BigData med logganalys
BigData med logganalysBigData med logganalys
BigData med logganalys
 
IT-styrning i Sundsvalls kommunkoncern -- IT-planering & systemförvaltning
IT-styrning i Sundsvalls kommunkoncern -- IT-planering & systemförvaltningIT-styrning i Sundsvalls kommunkoncern -- IT-planering & systemförvaltning
IT-styrning i Sundsvalls kommunkoncern -- IT-planering & systemförvaltning
 
Oppgavegiveren: Mixed mode inom insamlingen av data
Oppgavegiveren: Mixed mode inom insamlingen av dataOppgavegiveren: Mixed mode inom insamlingen av data
Oppgavegiveren: Mixed mode inom insamlingen av data
 
Kraftsamling ai referensgruppsmöte 2 driftoptimering inom energi i befintligt...
Kraftsamling ai referensgruppsmöte 2 driftoptimering inom energi i befintligt...Kraftsamling ai referensgruppsmöte 2 driftoptimering inom energi i befintligt...
Kraftsamling ai referensgruppsmöte 2 driftoptimering inom energi i befintligt...
 

More from Malin Johansson

BO Universe best practices
BO Universe best practicesBO Universe best practices
BO Universe best practices
Malin Johansson
 
Ledningsutveckling 20101207
Ledningsutveckling 20101207Ledningsutveckling 20101207
Ledningsutveckling 20101207
Malin Johansson
 
SQL Facit
SQL FacitSQL Facit
SQL Facit
Malin Johansson
 
SQL övningar
SQL övningarSQL övningar
SQL övningar
Malin Johansson
 
Sql utbldning
Sql utbldningSql utbldning
Sql utbldning
Malin Johansson
 
Bi bibel
Bi bibelBi bibel
Bi bibel
Malin Johansson
 
My back on track
My back on trackMy back on track
My back on track
Malin Johansson
 
Lararhandledning barnens livräddningssällskap 2014
Lararhandledning barnens livräddningssällskap 2014Lararhandledning barnens livräddningssällskap 2014
Lararhandledning barnens livräddningssällskap 2014
Malin Johansson
 
Objektbeskrivning släntstigen 6
Objektbeskrivning släntstigen 6Objektbeskrivning släntstigen 6
Objektbeskrivning släntstigen 6
Malin Johansson
 
Stadgar vintergatan 4
Stadgar vintergatan 4Stadgar vintergatan 4
Stadgar vintergatan 4
Malin Johansson
 
Objektbeskrivning Stagneliusvägen 31
Objektbeskrivning Stagneliusvägen 31Objektbeskrivning Stagneliusvägen 31
Objektbeskrivning Stagneliusvägen 31
Malin Johansson
 
Tillväxtverket
TillväxtverketTillväxtverket
Tillväxtverket
Malin Johansson
 
CV Malin Johansson MODUL1
CV Malin Johansson MODUL1CV Malin Johansson MODUL1
CV Malin Johansson MODUL1
Malin Johansson
 
EQT Avstämning Deal Database
EQT Avstämning Deal DatabaseEQT Avstämning Deal Database
EQT Avstämning Deal Database
Malin Johansson
 
2008 09-26 demonstration monthly reporting in deal database
2008 09-26 demonstration monthly reporting in deal database2008 09-26 demonstration monthly reporting in deal database
2008 09-26 demonstration monthly reporting in deal database
Malin Johansson
 
Avtal dn b nor
Avtal dn b norAvtal dn b nor
Avtal dn b nor
Malin Johansson
 
Länsförsäkringar halland årsredovisning 2014
Länsförsäkringar halland årsredovisning 2014Länsförsäkringar halland årsredovisning 2014
Länsförsäkringar halland årsredovisning 2014
Malin Johansson
 

More from Malin Johansson (17)

BO Universe best practices
BO Universe best practicesBO Universe best practices
BO Universe best practices
 
Ledningsutveckling 20101207
Ledningsutveckling 20101207Ledningsutveckling 20101207
Ledningsutveckling 20101207
 
SQL Facit
SQL FacitSQL Facit
SQL Facit
 
SQL övningar
SQL övningarSQL övningar
SQL övningar
 
Sql utbldning
Sql utbldningSql utbldning
Sql utbldning
 
Bi bibel
Bi bibelBi bibel
Bi bibel
 
My back on track
My back on trackMy back on track
My back on track
 
Lararhandledning barnens livräddningssällskap 2014
Lararhandledning barnens livräddningssällskap 2014Lararhandledning barnens livräddningssällskap 2014
Lararhandledning barnens livräddningssällskap 2014
 
Objektbeskrivning släntstigen 6
Objektbeskrivning släntstigen 6Objektbeskrivning släntstigen 6
Objektbeskrivning släntstigen 6
 
Stadgar vintergatan 4
Stadgar vintergatan 4Stadgar vintergatan 4
Stadgar vintergatan 4
 
Objektbeskrivning Stagneliusvägen 31
Objektbeskrivning Stagneliusvägen 31Objektbeskrivning Stagneliusvägen 31
Objektbeskrivning Stagneliusvägen 31
 
Tillväxtverket
TillväxtverketTillväxtverket
Tillväxtverket
 
CV Malin Johansson MODUL1
CV Malin Johansson MODUL1CV Malin Johansson MODUL1
CV Malin Johansson MODUL1
 
EQT Avstämning Deal Database
EQT Avstämning Deal DatabaseEQT Avstämning Deal Database
EQT Avstämning Deal Database
 
2008 09-26 demonstration monthly reporting in deal database
2008 09-26 demonstration monthly reporting in deal database2008 09-26 demonstration monthly reporting in deal database
2008 09-26 demonstration monthly reporting in deal database
 
Avtal dn b nor
Avtal dn b norAvtal dn b nor
Avtal dn b nor
 
Länsförsäkringar halland årsredovisning 2014
Länsförsäkringar halland årsredovisning 2014Länsförsäkringar halland årsredovisning 2014
Länsförsäkringar halland årsredovisning 2014
 

Gate 1 beslutsstöd

  • 1. Beslutsstöd Internutbildning Stockholm 2008-04-11 Denna rapport är konfidentiell och avsedd enbart för den klient till vilken den är adresserad
  • 2. Beslutsstöd – Centrala begrepp Syftet med presentationen är att ge en grundläggande förståelse kring centrala begrepp inom området beslutsstöd  Beslutsstöd (business intelligence) - sammanfattande benämning på programvaror och lösningar som används för att samla in, konsolidera, analysera och rapportera en verksamhets data.  Data kan vara lagrat på olika ställen och i olika system eller komma från externa källor.
  • 3. Beslutsstöd – Mål med datalager Information är en av verksamhetens viktigaste tillgångar/resurser, den lagras i de operationella system där data kommer in och i datalagret där data kommer ut. Målen med ett datalager är att:  Göra verksamhetens information tillgängligt – innehållet i datalagret skall vara förståeligt, navigerbart och snabbt tillgängligt.  Göra verksamhetens information konsekvent – om flera mätvärden har samma namn skall de betyda samma sak.  Vara en anpassningsbar och flexibel källa till information – datalagret skall vara byggt för förändringar.  Vara en säker plats som skyddar verksamhetens informationstillgångar.  Vara grunden för belutsfattande i verksamheten.
  • 4. Beslutsstöd - Källsystem Källsystem är de operationella system innehållande rader som fångar transaktionerna i verksamheten  I de operationella systemen är upptid och tillgänglighet viktigt, dessa system innehåller endast lite historisk data.
  • 5. Beslutsstöd – Data Staging Area Data Staging Arean är en lagringsplats och ett antal processer som tvättar, omvandlar, kombinerar, tar bort dubbletter, städar och förbereder data för användning datalagret  Data Staging Arean ligger mellan källsystem och presentationslagret, den är ej till för frågor och presentation och kan bestå av både filer och relationsdatabaser.
  • 6. Beslutsstöd – ETL Data Staging (ETL) är den viktigaste processen i ett datalager och består av subprocesserna Extrahera, Transformera och Ladda  Extrahera (Extract) – första steget är att få in data i datalagret ifrån källsystemen. Det handlar om att läsa, förstå och kopiera de delar som skall till data staging arean.  Transformera (Transform) – andra steget är att på den data som laddats till staging arean utföra ett antal omvandlingar av data: – Tvätta: rätta felstavningar, lösa ev. konflikter (t ex postnr och ort), hantera data som saknas, omvandla data till standardformat. – Ta bort fält, överförda från källsystemet, som inte skall användas. – Kombinera datakällor genom matchning eller uppslagning av koder. – Skapa surrogatnycklar, man får inte återvända källsystemsnycklar.  Ladda (Load) – tredje steget är att ladda fakta och dimensionstabeller. Tabellerna indexeras därefter för att förbättra frågeprestandan.  För att bygga/koda ETL används oftast speciella ETL-verktyg, några vanliga är MS Integration Services (SSIS), Informatica, Data Stage, Oracle Warehouse Builder och BO Integrator.
  • 7. Beslutsstöd – Presentationsserver I Presentationsservern är data i datalagret (Data Warehouse) organiserat och lagrat för frågor från slutanvändaren, rapporter och andra applikationer  Slutanvändarverktyg - en uppsättning verktyg som frågar, analyserar och presenterar information.  Analysverktyg - datalagerklienter för SQL-frågor, rapporter, grafer, ad-hoc frågor (användaren skapar egna frågor) eller datamining.  De vanligaste verktygen inom beslutsstöd kommer från Business Objects, Cognos, SAS och Microsoft.
  • 8. Dimensionsmodellering är en alternativ teknik till E/R-modellering för att modellera data i ett datalager, dimensionsmodell kallas ofta stjärna  Dimensionsmodellen innehåller samma information som E/R-modellen men är designad för användbarhet, frågeprestanda och flexibilitet för förändringar.  Huvudkomponenter i modellen är fakta- och dimensionstabeller.  När fakta- och dimensionstabeller i en dimensionsmodell binds ihop kallar man det en stjärna (star schema) Beslutsstöd – Stjärna
  • 9. Beslutsstöd - Snowflake Stjärnor är denormaliserade och om man normaliserar dessa kallas de snowflake (snöflinga), en totalt normaliserad snowflake hamnar i 3:NF  Normalisering av ett datalager kommer innebära försämrad frågeprestanda, p.g.a fler joins, och en mer komplex informationsstruktur för användarna och skall alltid undvikas.
  • 10. Beslutsstöd - Faktatabell Faktatabellen är huvudtabell i varje dimensionsmodell och innehåller mätvärden från verksamheten  En rad i en faktatabell motsvarar ett mätvärde, ett mätvärde är en rad i en faktatabell. Alla mätvärden i en faktatabell måste vara av samma detaljeringsgrad.  De mest användbara fakta i en faktatabell är numeriska och adderbara.  Faktatabeller har ett många-till-många förhållande till dimensionstabeller.  Fakta eller numerisk data har två eller flera främmande nycklar till respektive dimensionstabell.  Faktatabeller innehåller få kolumner och många rader. Datum Nyckel Produkt Nyckel Butik Nyckel Sålt Antal Försäljningsbelopp 20080315 1034 78 7 714 20080315 1035 78 35 1335
  • 11. Beslutsstöd - Dimensionstabell Dimensionstabellerna innehåller textuella beskrivningar av verksamheten och är den primära källan för filtrering och gruppering av data  Dimensionstabellerna innehåller förutom en primärnyckel ett antal textattribut som används för filtrering och gruppering av frågor.  Dimensionstabeller är ingångspunkten till faktatabellen och gränssnittet mot datalagret.  Dimensionsattributen ger möjlighet att bryta ner data och se på det ur olika perspektiv (”slice and dice”).  Det som anges efter per i frågor och rapporter är dimensionsattribut.  Dimensionstabeller har många kolumner (attribut) och få rader. Produkt Nyckel Produktnam n Produktbeskrivnin g EAN kod Produktgrup p Produktkategor i 1034 Citronglass SIA citronglass 1 l 4834533 5 Gräddglass Glass 1035 Vanilglass SIA vaniljglass 1 l 4683242 5 Gräddglass Glass
  • 12. Beslutsstöd – Slowly Changing Dimensions Slowly Changing Dimensions (SCD) - dimensioner innehållande data som långsamt förändras, vilken typ av SCD man väljer beror på hur mycket historik man vill spara.  Typ 1 – Den nya raden ersätter orginalraden, inga spår kommer att finns av den gamla raden d v s ingen historik sparas.  Typ 2 – En ny rad läggs till i dimensionstabellen, butiken hanteras som två olika butiker, detta medför att det finns oändlig historik om butiken.  Typ 3 – Orginalraden modifieras för att spegla förändringarna, man har t ex en kolumn för orginalnamnet och en kolumn för det nuvarande namnet och en kolumn som talar om från när det nuvarande namnet gäller. ButikNyckel ButikNamn ButikOrt 101 Nisses livs Kista ButikNyckel ButikNamn ButikOrt Version 101 Nisses livs Kista 0 102 Nisses livs Södertälje 1 ButikNyckel ButikNamn ButikOrt StartDatum SlutDatum 101 Nisses livs Kista 2000-01-01 2008-03-31 102 Nisses livs Södertälje 2008-04-01 ButikNyckel ButikNamn OrginalButikOrt StartDatum NuvarandeButikOrt 101 Nisses livs Kista 2008-04-01 Södertälje ButikNyckel ButikNamn ButikOrt 101 Nisses livs Södertälje
  • 13. För att öka frågeprestandan ytterligare kan man ladda så kallade kuber med data ifrån dimensionstabellerna, i kuberna lagras föraggregerad data  Kuber är flerdimensionella och kan jämföras med pivottabeller.  Microsoft Analysis Services (SSAS) använder en typ av kub som kallas OLAP (On-Line- Analytic-Processing).  I OLAP-kuber används MDX (MultiDimensional Expression) istället för SQL för frågor/manipulation av data: SELECT { [Measures].[Store Sales] } ON COLUMNS, { [Date].[2002], [Date].[2003] } ON ROWS FROM Sales WHERE ( [Store].[USA].[CA] ) Beslutsstöd – Kub Ladda
  • 14. “The Data Warehouse Lifecycle” är en utvecklingsprocess för beslutsstöd som har tagits fram av Kimball Group Teknisk Arkitektur Design Teknisk Arkitektur Design Produktval & Installation Produktval & Installation BI Applikations Specifikation BI Applikations Specifikation BI Applikations Utveckling BI Applikations Utveckling Projekt Planering Projekt Planering KravfångstKravfångst Produktions- sättning Produktions- sättning Drift och Förvaltning Drift och Förvaltning Projekt LedningProjekt Ledning Dimensions- modellering Dimensions- modellering Fysisk Design Fysisk Design Data Staging Design & Utveckling Data Staging Design & Utveckling
  • 15. Under en dimensionsmodellering går man igenom följande arbetssteg 1. Bestäm vilken affärsprocess, den serie verksamhetsaktiviteter, som skall modelleras genom en kombinerad förståelse av krav och tillgänglig data. 2. Avgör detaljeringsgrad för faktatabellen, välj lägsta tillgängliga nivå. 3. Bestäm vilka dimensionstabeller och dess kolumner som skall finnas till varje faktatabell. 4. Bestäm vilka mätvärden som skall finnas i faktatabellen. 5. Bestäm hur förändringar i dimensionerna skall hanteras – Slowly Changing Dimensions. Beslutsstöd – Arbetssteg
  • 16. I en datalagermatris (Data Warehouse Bus Matrix) mappar man dimensioner och affärsprocesser  Varje affärsprocess blir ett datamart, en logisk datamängd, och tillsammans kommer dessa datamart utgöra ett datalager (Data Warehouse) Beslutsstöd – Datalagermatris Gemensamma dimensioner Affärsprocesser Datum Produkt Butik Kampanj Leverantör Försäljning X X X X Inventering X X X Order X X X
  • 17. Under den fysiska designen använder man sig av datamappning för att fastställa källa till mål i dimensionstabellen Beslutsstöd – Datamappning Target Source Column Name Display Name Description Data-type Size Precisi on Key? FK To NULL? Default Value Unknown Member Example Values SCD Type Source System Source Schema Source Table Source Field Name Source Datatype ETL Rules Comments ProductKey ProductKey Surrogate primary key int PK ID N -1 1, 2, 3… Derived BKProductID BKProductID ProductID, Natural key from source system int N -1 AW Production Product ProductID int ProductSKU ProductSKU SKU, also known as Product Number varchar 25 Unknown 1 AW Production Product ProductNumber nvarchar(25) ProductName ProductName Product name varchar 50 Unknown 1 AW Production Product Name nvarchar(50) ProductDescr ProductDescr Product English description varchar 50 Unknown 1 AW Production Product Name nvarchar(50) Populate with the product name for now We need a source for description. ProductModelID ProductModelID Product model ID from source system int 1 AW Production Product ProductModelID int NULL to -1 Model Model Model name varchar 50 Unknown 1 AW Production ProductModel Name nvarchar(50) Join on Product.Pro ductModelID ProductSubcategoryID ProductSubcategoryID Product subcategory ID from the source system int 1 AW Production Product ProductSubcategoryID int NULL to -1
  • 18. Exempel på hur ETL design på hög nivå kan se ut Beslutsstöd – ETL-design