Small Big Data
#9
17. 10. 2016
Prague Data Management Meetup
Agenda
• Prague Data Management Meetup
• Small Big Data s Kubou Augustínem
Prague Data Management Meetup
Data Management
Získávaní dat
Ukládání dat
Zpracování dat
Interpretace dat
Použití dat
• Otevřená profesionální zájmová
skupina
• Každý je vítán (ať už v pasivní
nebo aktivní roli)
• Témat není nikdy dost
• Snaha o pravidelné měsíční
setkávání
• Setkávání od září 2015
Data Management
Historie
Datum Téma
10. 9. 2015 Data Management
14. 10. 2015 Data Lake
23. 11. 2015 Dark Data (without Dark Energy and Dark Force)
12. 1. 2016 Data Lake (znova)
7. 3. 2016 Sad Stories About DW Modeling (sad stories only)
23. 3. 2016 Self-service BI Street Battle
27. 4. 2016 Let's explore the new Microsoft PowerBI!
22. 9. 2016 Data Management pro začátečníky
17. 10. 2016 Small Big Data
22. 11. 2016 Základy modelování DW
Celosvětový datový boom
6
1 exabyte = 1018 bytů
Za jednu minutu této prezentace vznikne:
350 000 tweetů na Twitteru
4 000 000 liků na Facebooku
100 000 hovorů přes Skype
300 hodin videa na YouTube
Spousta dalších dat
90% všech dat vzniklo v poslední dvou letech
Mezi lety 2010-2020 vzroste objem dat lidstva 50x
2010:
800 exabytů
2020:
40 000 exabytů
VOLUME VELOCITY VARIETY Veracity
SOCIAL
BLOG
SMART
METER
1011001010010
0100110101010
1011100101010
100100101
Big Data 3V, 4V, 5V…
Big Data Patterns
• Analytics: DW
• Transformation: DW
• Core Data: DW
• Data Stage: DW
• Data Archive: BDP
Enterprise Data Warehouse Augmentation
• Analytics: BDP
• Transformation: BDP
• Core Data: BDP
• Data Stage: BDP
• Data Archive: BDP
All-in-one
• Analytics: DW
• Transformation: BDP
• Core Data: DW
• Data Stage: BDP
• Data Archive: DW
Data Refinery plus Data Warehouse
• Analytics: DW / BDP
• Transformation: DW / BDP
• Core Data: DW / BDP
• Data Stage: DW / BDP
• Data Archive: BDP
Hub-and-spoke & Hub-and-spoke plus in-memory
• Analytics: BDP
• Transformation: BDP
• Core Data: none
• Data Stage: BDP
• Data Archive: none
Standalone Package
• Analytics: BDP
• Transformation: BDP
• Core Data: none
• Data Stage: none
• Data Archive: none
Streaming Analytics
Source: Forrester
Legend
DW = Data Warehouse
BDP = Big Data Platform
Small Big Data
…s Kubou Augustínem

Prague data management meetup 2016-10-17

  • 1.
    Small Big Data #9 17.10. 2016 Prague Data Management Meetup
  • 2.
    Agenda • Prague DataManagement Meetup • Small Big Data s Kubou Augustínem
  • 3.
    Prague Data ManagementMeetup Data Management Získávaní dat Ukládání dat Zpracování dat Interpretace dat Použití dat • Otevřená profesionální zájmová skupina • Každý je vítán (ať už v pasivní nebo aktivní roli) • Témat není nikdy dost • Snaha o pravidelné měsíční setkávání • Setkávání od září 2015
  • 4.
  • 5.
    Historie Datum Téma 10. 9.2015 Data Management 14. 10. 2015 Data Lake 23. 11. 2015 Dark Data (without Dark Energy and Dark Force) 12. 1. 2016 Data Lake (znova) 7. 3. 2016 Sad Stories About DW Modeling (sad stories only) 23. 3. 2016 Self-service BI Street Battle 27. 4. 2016 Let's explore the new Microsoft PowerBI! 22. 9. 2016 Data Management pro začátečníky 17. 10. 2016 Small Big Data 22. 11. 2016 Základy modelování DW
  • 6.
    Celosvětový datový boom 6 1exabyte = 1018 bytů Za jednu minutu této prezentace vznikne: 350 000 tweetů na Twitteru 4 000 000 liků na Facebooku 100 000 hovorů přes Skype 300 hodin videa na YouTube Spousta dalších dat 90% všech dat vzniklo v poslední dvou letech Mezi lety 2010-2020 vzroste objem dat lidstva 50x 2010: 800 exabytů 2020: 40 000 exabytů
  • 7.
    VOLUME VELOCITY VARIETYVeracity SOCIAL BLOG SMART METER 1011001010010 0100110101010 1011100101010 100100101 Big Data 3V, 4V, 5V…
  • 9.
    Big Data Patterns •Analytics: DW • Transformation: DW • Core Data: DW • Data Stage: DW • Data Archive: BDP Enterprise Data Warehouse Augmentation • Analytics: BDP • Transformation: BDP • Core Data: BDP • Data Stage: BDP • Data Archive: BDP All-in-one • Analytics: DW • Transformation: BDP • Core Data: DW • Data Stage: BDP • Data Archive: DW Data Refinery plus Data Warehouse • Analytics: DW / BDP • Transformation: DW / BDP • Core Data: DW / BDP • Data Stage: DW / BDP • Data Archive: BDP Hub-and-spoke & Hub-and-spoke plus in-memory • Analytics: BDP • Transformation: BDP • Core Data: none • Data Stage: BDP • Data Archive: none Standalone Package • Analytics: BDP • Transformation: BDP • Core Data: none • Data Stage: none • Data Archive: none Streaming Analytics Source: Forrester Legend DW = Data Warehouse BDP = Big Data Platform
  • 10.
    Small Big Data …sKubou Augustínem