SlideShare a Scribd company logo
1 of 14
Download to read offline
Galaktyka bitów
jak przeżyć powódź danych przy pomocy Microsoft i Open Source
Ryszard Dałkowski
Open Source Strategy Lead
Microsoft
http://www.chronozoomproject.org/#/t55
Zamiast agendy
O tym porozmawiamy…
Galaktyka bitów…
Dużo
danych?
Skąd? Charakter
Open
source z
MS?
W
chmurze
Sami spróbujcie
Sources: The Economist, Feb ‘10; IDC
2000
• Projekt Sloan Digital Sky Survey w 7 dni zgromadził więcej
danych niż wcześniej w całej historii astronomii
Do
2016
• Chilijski New Large Synoptic Survey Telescope będzie gromadził
około 140 terabajtów co 5 dni – więcej niż Sloan w ciągu 10 lat
2013
• Wielki Zderzacz Hadronów w CERN generuje 40 terabajtów
danych w ciągu sekundy eksperymentu
XXI w
• Więcej informacji w jeden dzień niż człowiek XV w w ciągu
całego życia
Sources: The Economist, Feb ‘10; DBMS2; Microsoft Corp
Bing „pożera” ponad 7 petabajtów
danych miesięcznie
Użytkownicy Twittera generują
ponad 1 terabajt wpisów każdego
dnia
Cisco przewiduje że ruch w
internecie osiągnie w 2013 poziom
667 exabajtów (czyli 108)
1,800,000,000,000,
000,000,000 bytes1,8 ZB
Rozmiary cyfrowego wszechświata 2011
0
2
4
6
8
10
2010 2011 2012 2015
W ciągu 24 miesięcy ilość
mobilnych urządzeń >
tradycyjnych komputerów
Sources: IDC Digital Universe Study 2011, Worldwide Big Data Technology and Services 2012–2015 Forecast
W 2015 ponad 20% informacji
będzie przetwarzanych w
chmurze
VS
Baza relacyjna Baza MapReduce
Pojemności Gigabajty (Terabajty) Petabajty (Hexabajty)
Dostęp Interaktywny i wsadowy Wsadowy
Uaktualnianie Wielokrotny zapis/odczyt Pojedynczy zapis,
wielokrotny odczyt
Struktura Statyczna Dynamiczna
Integralność Wysoka (ACID) Niska
Skalowanie Nieliniowe Liniowe
DBA Ratio 1:40 1:3000
Własna dystrybucja
Microsoft
• Wszystkie zmiany oddane do
Apache Foundation
• Otwarta i wolna
• 100% kompatybilna
Optymalizowany dla
Windows & Azure
• Integracja z AD & Systems
Center
• Hadoop-as-a-service-on-Azure
Dostosowany dla
programistów .NET
• Integracja z Visual Studio
• Wsparcie dla C#
• Wydajności i skalowalność
• Wysoka dostępność
• Łatwość użycia
Współpraca
MS + OSS
Klienci
MS + OSS
Otwarta
chmura
+ Apache Hadoop
@Hortonworks
http://spr.ly/6017nTdb #microsoft #bigdata
http://aka.ms/HadoopWindows
+ Open Source
+ OSS i transfer wiedzy
• MSDN
• WindowsAzure.com
• Channel 9
• php.net
• TechNet Wiki
• Blogi
• interoperability
• brian_swan
• Silverlining
• Specyfikacje i
dokumentacja
PHP at Scale on the Microsoft Platform
Azure Real World: Migrating a Drupal Site from LAMP to Windows Azure
http://www.chronozoomproject.org/
http://www.worldwidetelescope.org/webclient/
http://research.microsoft.com/en-us/um/redmond/groups/cue/sketchinsight/
http://www.microsoft.com/en-
us/news/Press/2013/Feb13/02-
11BigDataRoundupPR.aspx
http://www.microsoft.com/bizspark
Big data szczecin
Big data szczecin

More Related Content

Similar to Big data szczecin

Prognoza rozwoju technologii informacyjno-komunikacyjnych
Prognoza rozwoju technologii informacyjno-komunikacyjnychPrognoza rozwoju technologii informacyjno-komunikacyjnych
Prognoza rozwoju technologii informacyjno-komunikacyjnychUniwersytet Otwarty AGH
 
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...Squiz Poland
 
20160405 Cloud Community Poznań - Cloud Analytics on Azure
20160405  Cloud Community Poznań - Cloud Analytics on Azure20160405  Cloud Community Poznań - Cloud Analytics on Azure
20160405 Cloud Community Poznań - Cloud Analytics on AzureŁukasz Grala
 
Zarzadzanie danymi (nam mozliwosciami) - HAVAS Innovation Lab vol.2 - 09062015
Zarzadzanie danymi (nam mozliwosciami) - HAVAS Innovation Lab vol.2 - 09062015Zarzadzanie danymi (nam mozliwosciami) - HAVAS Innovation Lab vol.2 - 09062015
Zarzadzanie danymi (nam mozliwosciami) - HAVAS Innovation Lab vol.2 - 09062015Marta Zakrzewska-Kisiel
 
Four Slupsk Lectures. II. Semantic Web
Four Slupsk Lectures. II. Semantic WebFour Slupsk Lectures. II. Semantic Web
Four Slupsk Lectures. II. Semantic Websopekmir
 
[#4] spark - IBM Integrated Analytics System
[#4] spark - IBM Integrated Analytics System[#4] spark - IBM Integrated Analytics System
[#4] spark - IBM Integrated Analytics SystemArtur Wronski
 
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019Deloitte Polska
 
Open Source i nowe technologie, czyli trochę o systemach o dużej niezawodności
Open Source i nowe technologie, czyli trochę o systemach  o dużej niezawodnościOpen Source i nowe technologie, czyli trochę o systemach  o dużej niezawodności
Open Source i nowe technologie, czyli trochę o systemach o dużej niezawodnościAdam Przybyła
 
[PL] Internet Rzeczy nową rewolucją przemysłową dla biznesu
[PL] Internet Rzeczy nową rewolucją przemysłową dla biznesu  [PL] Internet Rzeczy nową rewolucją przemysłową dla biznesu
[PL] Internet Rzeczy nową rewolucją przemysłową dla biznesu Piotr Pietrzak
 
Michał Żyliński: Cortana dla niewtajemniczonych
Michał Żyliński: Cortana dla niewtajemniczonychMichał Żyliński: Cortana dla niewtajemniczonych
Michał Żyliński: Cortana dla niewtajemniczonychAnalyticsConf
 
Otwarte dane - prezentacja na webinarium (2015)
Otwarte dane - prezentacja na webinarium (2015)Otwarte dane - prezentacja na webinarium (2015)
Otwarte dane - prezentacja na webinarium (2015)Lukasz Jachowicz
 
Co z czym i do czego w Microsoft Azure - poznajemy usługi
Co z czym i do czego w Microsoft Azure - poznajemy usługiCo z czym i do czego w Microsoft Azure - poznajemy usługi
Co z czym i do czego w Microsoft Azure - poznajemy usługiEmil Wasilewski
 
RIA - przyszłość aplikacji internetowych
RIA - przyszłość aplikacji internetowychRIA - przyszłość aplikacji internetowych
RIA - przyszłość aplikacji internetowychcree8tive
 
KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie k...
KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie k...KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie k...
KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie k...Filip Dębowski
 

Similar to Big data szczecin (20)

Prognoza rozwoju technologii informacyjno-komunikacyjnych
Prognoza rozwoju technologii informacyjno-komunikacyjnychPrognoza rozwoju technologii informacyjno-komunikacyjnych
Prognoza rozwoju technologii informacyjno-komunikacyjnych
 
Akademia IT
Akademia ITAkademia IT
Akademia IT
 
Big Data - historia i przyszłość
Big Data - historia i przyszłośćBig Data - historia i przyszłość
Big Data - historia i przyszłość
 
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
Za dużo informacji, i co dalej? Funnelback - Michał Rachowski Squiz 12.09.12 ...
 
20160405 Cloud Community Poznań - Cloud Analytics on Azure
20160405  Cloud Community Poznań - Cloud Analytics on Azure20160405  Cloud Community Poznań - Cloud Analytics on Azure
20160405 Cloud Community Poznań - Cloud Analytics on Azure
 
Zarzadzanie danymi (nam mozliwosciami) - HAVAS Innovation Lab vol.2 - 09062015
Zarzadzanie danymi (nam mozliwosciami) - HAVAS Innovation Lab vol.2 - 09062015Zarzadzanie danymi (nam mozliwosciami) - HAVAS Innovation Lab vol.2 - 09062015
Zarzadzanie danymi (nam mozliwosciami) - HAVAS Innovation Lab vol.2 - 09062015
 
Four Slupsk Lectures. II. Semantic Web
Four Slupsk Lectures. II. Semantic WebFour Slupsk Lectures. II. Semantic Web
Four Slupsk Lectures. II. Semantic Web
 
[#4] spark - IBM Integrated Analytics System
[#4] spark - IBM Integrated Analytics System[#4] spark - IBM Integrated Analytics System
[#4] spark - IBM Integrated Analytics System
 
Azure - Duże zbiory w chmurze
Azure - Duże zbiory w chmurzeAzure - Duże zbiory w chmurze
Azure - Duże zbiory w chmurze
 
8 jaromir dzialo
8 jaromir dzialo8 jaromir dzialo
8 jaromir dzialo
 
Wprowadzenie do Microsoft Azure
Wprowadzenie do Microsoft AzureWprowadzenie do Microsoft Azure
Wprowadzenie do Microsoft Azure
 
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
Trendy technologiczne 2019 - Deloitte, prezentacja 26.02.2019
 
Open Source i nowe technologie, czyli trochę o systemach o dużej niezawodności
Open Source i nowe technologie, czyli trochę o systemach  o dużej niezawodnościOpen Source i nowe technologie, czyli trochę o systemach  o dużej niezawodności
Open Source i nowe technologie, czyli trochę o systemach o dużej niezawodności
 
[PL] Internet Rzeczy nową rewolucją przemysłową dla biznesu
[PL] Internet Rzeczy nową rewolucją przemysłową dla biznesu  [PL] Internet Rzeczy nową rewolucją przemysłową dla biznesu
[PL] Internet Rzeczy nową rewolucją przemysłową dla biznesu
 
Michał Żyliński: Cortana dla niewtajemniczonych
Michał Żyliński: Cortana dla niewtajemniczonychMichał Żyliński: Cortana dla niewtajemniczonych
Michał Żyliński: Cortana dla niewtajemniczonych
 
Otwarta chmura Microsoft
Otwarta chmura MicrosoftOtwarta chmura Microsoft
Otwarta chmura Microsoft
 
Otwarte dane - prezentacja na webinarium (2015)
Otwarte dane - prezentacja na webinarium (2015)Otwarte dane - prezentacja na webinarium (2015)
Otwarte dane - prezentacja na webinarium (2015)
 
Co z czym i do czego w Microsoft Azure - poznajemy usługi
Co z czym i do czego w Microsoft Azure - poznajemy usługiCo z czym i do czego w Microsoft Azure - poznajemy usługi
Co z czym i do czego w Microsoft Azure - poznajemy usługi
 
RIA - przyszłość aplikacji internetowych
RIA - przyszłość aplikacji internetowychRIA - przyszłość aplikacji internetowych
RIA - przyszłość aplikacji internetowych
 
KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie k...
KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie k...KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie k...
KrakSpot #13 Jaromir Działo - Działaj globalnie, czyli Topicmarks w dolinie k...
 

More from Ryszard Dałkowski

Bezpłatna chmura obliczeniowa dla organizacji pozarządowych
Bezpłatna chmura obliczeniowa dla organizacji pozarządowychBezpłatna chmura obliczeniowa dla organizacji pozarządowych
Bezpłatna chmura obliczeniowa dla organizacji pozarządowychRyszard Dałkowski
 
Infomeet - pieniadze na technologie
Infomeet - pieniadze na technologieInfomeet - pieniadze na technologie
Infomeet - pieniadze na technologieRyszard Dałkowski
 
Azure day - skarby open source na Microsoft Azure
Azure day  - skarby open source na Microsoft AzureAzure day  - skarby open source na Microsoft Azure
Azure day - skarby open source na Microsoft AzureRyszard Dałkowski
 
Od technologicznego trzęsienia ziemi do zwinnego biznesu
Od technologicznego trzęsienia ziemi do zwinnego biznesuOd technologicznego trzęsienia ziemi do zwinnego biznesu
Od technologicznego trzęsienia ziemi do zwinnego biznesuRyszard Dałkowski
 
Praktyczne użycie chmury 3 kroki
Praktyczne użycie chmury 3 krokiPraktyczne użycie chmury 3 kroki
Praktyczne użycie chmury 3 krokiRyszard Dałkowski
 
Zarzadzanie portfelem projektow
Zarzadzanie portfelem projektowZarzadzanie portfelem projektow
Zarzadzanie portfelem projektowRyszard Dałkowski
 
Superkoszyk - Magento on Azure cloud
Superkoszyk - Magento on Azure cloudSuperkoszyk - Magento on Azure cloud
Superkoszyk - Magento on Azure cloudRyszard Dałkowski
 
Windows Azure na WordUp Szczecin
Windows Azure na WordUp SzczecinWindows Azure na WordUp Szczecin
Windows Azure na WordUp SzczecinRyszard Dałkowski
 
Microsoft @ Drupal Camp Wrocław 2013
Microsoft @ Drupal Camp Wrocław 2013Microsoft @ Drupal Camp Wrocław 2013
Microsoft @ Drupal Camp Wrocław 2013Ryszard Dałkowski
 
Wykorzystaj potencjał chmury w pisaniu aplikacji
Wykorzystaj potencjał chmury w pisaniu aplikacjiWykorzystaj potencjał chmury w pisaniu aplikacji
Wykorzystaj potencjał chmury w pisaniu aplikacjiRyszard Dałkowski
 
Microsoft session at Drupal Camp Baltics 2012
Microsoft session at Drupal Camp Baltics 2012Microsoft session at Drupal Camp Baltics 2012
Microsoft session at Drupal Camp Baltics 2012Ryszard Dałkowski
 
Twoja firma. Twoja szansa na sukces
Twoja firma. Twoja szansa na sukcesTwoja firma. Twoja szansa na sukces
Twoja firma. Twoja szansa na sukcesRyszard Dałkowski
 

More from Ryszard Dałkowski (20)

Wystartuj startup
Wystartuj startupWystartuj startup
Wystartuj startup
 
Bezpłatna chmura obliczeniowa dla organizacji pozarządowych
Bezpłatna chmura obliczeniowa dla organizacji pozarządowychBezpłatna chmura obliczeniowa dla organizacji pozarządowych
Bezpłatna chmura obliczeniowa dla organizacji pozarządowych
 
Chmura dla ecommerce
Chmura dla ecommerceChmura dla ecommerce
Chmura dla ecommerce
 
Infomeet - pieniadze na technologie
Infomeet - pieniadze na technologieInfomeet - pieniadze na technologie
Infomeet - pieniadze na technologie
 
Azure day - skarby open source na Microsoft Azure
Azure day  - skarby open source na Microsoft AzureAzure day  - skarby open source na Microsoft Azure
Azure day - skarby open source na Microsoft Azure
 
Od technologicznego trzęsienia ziemi do zwinnego biznesu
Od technologicznego trzęsienia ziemi do zwinnego biznesuOd technologicznego trzęsienia ziemi do zwinnego biznesu
Od technologicznego trzęsienia ziemi do zwinnego biznesu
 
Drupal on azure dcb2015
Drupal on azure   dcb2015Drupal on azure   dcb2015
Drupal on azure dcb2015
 
Praktyczne użycie chmury 3 kroki
Praktyczne użycie chmury 3 krokiPraktyczne użycie chmury 3 kroki
Praktyczne użycie chmury 3 kroki
 
Jeden commit
Jeden commitJeden commit
Jeden commit
 
Zarzadzanie portfelem projektow
Zarzadzanie portfelem projektowZarzadzanie portfelem projektow
Zarzadzanie portfelem projektow
 
Word camp sztuka_wyboru
Word camp sztuka_wyboruWord camp sztuka_wyboru
Word camp sztuka_wyboru
 
Superkoszyk - Magento on Azure cloud
Superkoszyk - Magento on Azure cloudSuperkoszyk - Magento on Azure cloud
Superkoszyk - Magento on Azure cloud
 
Azure na Joomla Day2014
Azure na Joomla Day2014Azure na Joomla Day2014
Azure na Joomla Day2014
 
Azure 101 warsztat v 1.1
Azure 101 warsztat v 1.1Azure 101 warsztat v 1.1
Azure 101 warsztat v 1.1
 
Windows Azure na WordUp Szczecin
Windows Azure na WordUp SzczecinWindows Azure na WordUp Szczecin
Windows Azure na WordUp Szczecin
 
Oss w software house
Oss w software houseOss w software house
Oss w software house
 
Microsoft @ Drupal Camp Wrocław 2013
Microsoft @ Drupal Camp Wrocław 2013Microsoft @ Drupal Camp Wrocław 2013
Microsoft @ Drupal Camp Wrocław 2013
 
Wykorzystaj potencjał chmury w pisaniu aplikacji
Wykorzystaj potencjał chmury w pisaniu aplikacjiWykorzystaj potencjał chmury w pisaniu aplikacji
Wykorzystaj potencjał chmury w pisaniu aplikacji
 
Microsoft session at Drupal Camp Baltics 2012
Microsoft session at Drupal Camp Baltics 2012Microsoft session at Drupal Camp Baltics 2012
Microsoft session at Drupal Camp Baltics 2012
 
Twoja firma. Twoja szansa na sukces
Twoja firma. Twoja szansa na sukcesTwoja firma. Twoja szansa na sukces
Twoja firma. Twoja szansa na sukces
 

Big data szczecin

  • 1. Galaktyka bitów jak przeżyć powódź danych przy pomocy Microsoft i Open Source Ryszard Dałkowski Open Source Strategy Lead Microsoft http://www.chronozoomproject.org/#/t55 Zamiast agendy O tym porozmawiamy… Galaktyka bitów… Dużo danych? Skąd? Charakter Open source z MS? W chmurze Sami spróbujcie
  • 2. Sources: The Economist, Feb ‘10; IDC 2000 • Projekt Sloan Digital Sky Survey w 7 dni zgromadził więcej danych niż wcześniej w całej historii astronomii Do 2016 • Chilijski New Large Synoptic Survey Telescope będzie gromadził około 140 terabajtów co 5 dni – więcej niż Sloan w ciągu 10 lat 2013 • Wielki Zderzacz Hadronów w CERN generuje 40 terabajtów danych w ciągu sekundy eksperymentu XXI w • Więcej informacji w jeden dzień niż człowiek XV w w ciągu całego życia Sources: The Economist, Feb ‘10; DBMS2; Microsoft Corp Bing „pożera” ponad 7 petabajtów danych miesięcznie Użytkownicy Twittera generują ponad 1 terabajt wpisów każdego dnia Cisco przewiduje że ruch w internecie osiągnie w 2013 poziom 667 exabajtów (czyli 108)
  • 3. 1,800,000,000,000, 000,000,000 bytes1,8 ZB Rozmiary cyfrowego wszechświata 2011 0 2 4 6 8 10 2010 2011 2012 2015 W ciągu 24 miesięcy ilość mobilnych urządzeń > tradycyjnych komputerów Sources: IDC Digital Universe Study 2011, Worldwide Big Data Technology and Services 2012–2015 Forecast W 2015 ponad 20% informacji będzie przetwarzanych w chmurze
  • 4.
  • 5. VS Baza relacyjna Baza MapReduce Pojemności Gigabajty (Terabajty) Petabajty (Hexabajty) Dostęp Interaktywny i wsadowy Wsadowy Uaktualnianie Wielokrotny zapis/odczyt Pojedynczy zapis, wielokrotny odczyt Struktura Statyczna Dynamiczna Integralność Wysoka (ACID) Niska Skalowanie Nieliniowe Liniowe DBA Ratio 1:40 1:3000
  • 6. Własna dystrybucja Microsoft • Wszystkie zmiany oddane do Apache Foundation • Otwarta i wolna • 100% kompatybilna Optymalizowany dla Windows & Azure • Integracja z AD & Systems Center • Hadoop-as-a-service-on-Azure Dostosowany dla programistów .NET • Integracja z Visual Studio • Wsparcie dla C# • Wydajności i skalowalność • Wysoka dostępność • Łatwość użycia
  • 7. Współpraca MS + OSS Klienci MS + OSS Otwarta chmura + Apache Hadoop
  • 9. + OSS i transfer wiedzy • MSDN • WindowsAzure.com • Channel 9 • php.net • TechNet Wiki • Blogi • interoperability • brian_swan • Silverlining • Specyfikacje i dokumentacja PHP at Scale on the Microsoft Platform Azure Real World: Migrating a Drupal Site from LAMP to Windows Azure http://www.chronozoomproject.org/ http://www.worldwidetelescope.org/webclient/
  • 10.