BI in de cloud: Batch processen van dagen naar uren
In deze presentatie wordt de architecture Microsoft Azure Batch en R beschreven waarmee doorlooptijden van financiële calculaties in R significant teruggebracht kunnen worden van dagen naar slechts enkele uren.
BI in de cloud: Batch processen van dagen naar uren
1.
BI in decloud
Batch processen van dagen naar uren
Arie Twigt
2.
|
Deze sessie
• BIin de cloud
• Big Data
• Microsoft Azure Batch
• Business case.
2
3.
|
BI in decloud
Business Intelligence resources die zijn geinstalleerd en runnen op een
externe server (de cloud).
(Marston et al., 2011, Benlain & Hess, 2011, Seruga & Hwang, 2012).
Voorbeelden:
Database Dashboard Clusters/VM’s
3
4.
|
Efficientie
BusinessAgility
Kostenvoordelen
Universele toegang tot middelen
Schaalbaarheid
4
Kansen BI in de cloud
5.
|
Uitdagingen BI inde cloud
Privacy en data controle issues
Security en betrouwbaarheid
5
6.
|
Big data?
Big datais high-volume, high-velocity and/or high-variety information assets that
demand cost-effective, innovative forms of information processing that enable
enhanced insight, decision making, and process automation.
Gartner
http://www.gartner.com/it-glossary/big-data/
In dit geval:
“Data hoeveelheden te groot om te verwerken op een enkele machine.”
6
7.
|
Financiele modellen enlange wachttijden
Verwerken van financiele modellen:
• Redelijk handelbare input data (bijv. 100 MB) met data over bijv.:
• Klantportefuille beleggingen
• Hypotheken
• Toepassing (wiskundige) calculaties:
• Interpolatie
• Kasstroom projecties
• Solver/goalseek
• Tal van andere calculaties
• Veel output data:
• Bijvoorbeeld data met kasstromen
7
8.
|
Is data BigData
Big data is high-volume, high-velocity and/or high-variety information assets that
demand cost-effective, innovative forms of information processing that enable
enhanced insight, decision making, and process automation.
• De output is high-volume;
• Het gehele proces te zwaar om op een enkele computer uit te voeren;
• Verdeel de calculaties over meerdere computers
• Verzamel de uitkomsten van de computers en stel het resultaat
samen.
8
|
Waarom Azure Batch?
10
•Verdeel een grote taak in kleinere taken
• Laat kleinere taken parallel uitgevoerd
worden
• Aantal benodigde computers beschikbaar
voor taken
|
4 scenario’s
Per rate
Perkasstroom
Per hypotheek
Case: Hypotheekwaarderingen
13
360
kasstromen
per
hypotheek
2 rates
per hypotheek
per kasstroom
100.000 hypotheken
|
Business case
23
• Runtijdensignificant teruggebracht;
• Databestanden altijd beschikbaar in de
cloud;
• Key informatie aan je vingertoppen met
Power BI op de iPad.
24.
|
Cloud BI, eenBig Data case
24
Efficientie: Snel en makkelijk een groot aantal computers gebruiken en weer
afsluiten
Business Agility: Door snelle doorlooptijden snel kunnen inspelen op
veranderingen in de map door snelle inzichten in resultaten
Kostenvoordelen: Betaal alleen wat je gebruikt en nodig hebt
Universele toegang tot middelen: Mogelijkheid om overal met de Microsoft
Azure credentials toegang te krijgen tot data
Schaalbaarheid: Eenvoudig capaciteit schalen voor wat nodig is