SlideShare a Scribd company logo
Petabajty z kosmosu (serio)
powered by
Alek Cesarz, Piotr Misiak
Co robimy
Rozwiązania chmurowe
Chmury publiczne – bezpieczne, skalowalne, łatwo zarządzalne (API)
Chmury prywatne – bezpieczne, na dedykowanych zasobach, instalowane u użytkownika,
integrowane z lokalnymi systemami i zasobami
Chmury hybrydowe – wykorzystanie chmur publicznych do rozszerzenia możliwości własnej
infrastruktury
Wykorzystywane najlepsze otwarte projekty
OpenStack
Ceph
Unikalne możliwości
Integracja infrastruktury wirtualnej i fizycznej
Dedykowane zwirtualizowane serwery (lokalne dyski, GPU)
Szeroki zestaw usług dodanych
Kluczowe projekty
EO Cloud (EO Innovation Platform Testbed) dla ESA
CDS Hybrid Cloud dla ECMWF
CREODIAS dla ESA/EC
Projekt COPERNICUS
Sentinel-1 A/B – od 2014
C-SAR – Synthetic Aperture Radar
obrazowanie ukształtowania powierzchni ziemi
Sentinel-2 A/B – od 2015
MSI – Multi-Spectral Instrument
pomiary w 12 zakresach od 442,3nm do 2202,4nm
Sentinel-3 – od 2016
SLSTR (Sea and Land Surface Temperature Radiometer) SRAL (SAR Altimeter)
OLCI (Ocean and Land Colour Instrument) MWR (Microwave Radiometer)
obserwacja powierzchni wód morskich, śródlądowych i lodowców
Sentinel-5 Precursor – od 2017
TROPOspheric Monitoring Instrument
wielozakresowa (UV, VIS, NIR, SWIR) obserwacja atmosfery
I nie tylko COPERNICUS
4
Obserwacja zmian
5
Algi w Dnieprze
Most na Wiśle
Co z tego wynika
6
• Ogromne ilości danych - dziesiątki, a wkrótce setki TB dziennie
• Rozproszenie źródeł
• Przetwarzanie maszynowe
• Dostęp publiczny do danych programu Copernicus
• Rozpędzenie pomysłów na wykorzystanie danych
11,259,604 produktów
9,173 TB danych
3,118,277,982 obiektów 0
10
20
30
EO data (in PB)
7.5
13
19
25
2018 2019 2020 2021
CREODIAS
7
Polska
Francja
Słowenia
Creotech
Instrume
nts
WIZIPISI
CloudFer
ro
Eversis
Sinergis
e
Geomatys
CREODIAS
9
10
Storage – dobre złego, a może złe dobrego początki
11
Żródło: Giacinto Donvito et al 2014 J. Phys.: Conf. Ser. 513 042014
„Write once – read many” – czy na pewno?
Ceph – wolny i nie do końca stabilny
HDFS – wolny i zasobożerny
GlusterFS – idealne rozwiązanie?
ZFS, kompresja, replikacja, rebalancing, RedHat…
Storage – pierwsze problemy
12
20TB dziennie w normalnej pracy, 50TB przy uzupełnianiu danych
1 węzeł storage na 3 dni!
Storage – pierwsze problemy
13
200 MBps
Storage – pierwsze problemy
14
Storage – pierwsze problemy
15
200 MBps
N x 200 MBps! + nadmiarowość + metadane
Storage
16
Lessons learned:
- „write once – read many” nie jest do końca prawdą
- „odporność” systemu na rozbudowy jest krytyczna
- ograniczenia HW pokazują się nie tam gdzie się ich spodziewamy
- zabezpieczenie danych niekoniecznie musi być realizowane na poziomie FS
Na szczęście Ceph „dojrzał” ((-:
Jak to robimy teraz?
17
Komponenty Open Source
18
Linux
nasz podstawowy, ukochany, jedyny system operacyjny
OpenStack
serwery, sieci, storage na wzór AWS
Ceph
storage blokowy dla OpenStacka oraz obiektowy dla danych satelitarnych
Midonet
sieć dla OpenStacka, plugin do Neutrona
Ansible
narzędzie do zarządzania całą infrastrukturą
Cumulus Linux
system operacyjny na switchach, nie do końca taki open ;)
 Ubuntu LTS, aktualnie 16.04
 Automatyczna instalacja i konfiguracja systemu przy użyciu Cobblera i
Ansible
 Monitoring za pomocą Zabbixa
 Centralne składowisko logów
 Centralne zarządzanie dostępami
Linux w CloudFerro
 Jeden z największych projektów Open Source na świecie, projekt wspierają wszystkie
liczące się firmy w branży, bardzo duże community
 Umożliwia zbudowanie chmury prywatnej albo publicznej na wzór AWS
 Wirtualne serwery, kontenery, wirtualne sieci, wirtualny storage
 Bardzo szybki rozwój - wydania wersji co pół roku
 Składa się z wielu oddzielnych modułów/projektów, każdy z nich odpowiada za
konkretny obszar, komunikacja między modułami i z użytkownikiem via REST API
 Nieskończona ilość konfiguracji, sposobów deploymentu, integracji
OpenStack
 Vaniliowa wersja Mitaka i Pike z kilkoma drobnymi patchami
 Instalacja i konfiguracja za pomocą projektu OpenStack Kolla
 Każdy serwis OpenStacka jest w dedykowanym kontenerze Dockera
 Używane moduły: Keystone, Nova, Glance, Neutron, Cinder, Horizon, Ceilometer
 Midonet jako plugin do Neutrona
 Instalacje z 50+ compute nodów
 Billing klientów oraz jego integracja z OpenStack jest naszym autorskim
rozwiązaniem
OpenStack w CloudFerro
 Tylko fernet tokens w Keystonie
 Wszystkie serwisy OpenStacka są bardzo wrażliwe na komunikację z
RabbitMQ
 Multitenacy jest problematyczne – domeny, projekty
 Uwaga na aktualizacje – potrafią wprowadzić nowe bugi
 Najlepiej być jeden albo dwa wydania w tyle
OpenStack tips & tricks
 Osobna instalacja na potrzeby OpenStacka:
 storage blokowy i obiektowy
 kilkanaście serwerów per OpenStack
 dwa typy dysków SSD i HDD
 Osobna instalacja dla danych satelitarnych:
 w tej chwili 9PB danych netto
 erasure coding
 dostęp obiektowy
 2200+ dysków
 mamy swojego forka kodu z własnymi modyfikacjami
Ceph w CloudFerro
 Zalecana najnowsza i spójna wersja
 Uwaga na operacje snaptrim i scrub
 Trzeba mieć backfilling pod kontrolą
 Uwaga na ilość miejsca na dysku na serwerach z ceph-mon :)
 Microbursts
 Stan WARNING I ERROR to nie koniec świata, jeżeli się
dokładnie rozumie co się dzieje w klastrze
Ceph tips & tricks
 instalacja/konfiguracja systemu operacyjnego - nasze playbooki
 instalacja/konfiguracja OpenStack - Openstack Kolla
 instalacja/konfiguracja Ceph – ceph-ansible
 instalacja/konfiguracja switchy/sieci - nasze playbooki,
korzystamy z modułu nclu
 brakuje modułów do fizycznej instalacji urządzeń w szafach :/
Ansible everything!
 Projekt Neutron odpowiada za konfigurację sieci wirtualnych w projektach
 Modułowa architektura, praktycznie do każdej funkcji da się podpiąć plugin, których jest cała
masa pluginów Open Source oraz od różnych vendorów – Cisco, Juniper, etc.
 Zapewnia komunikację dla VMek i kontenerów: zwykłe sieci L2, routing L3, VPNaaS, FwaaS,
LBaaS, peering BPG, etc.
 SDN: OpenContrail, OpenDaylight, Midonet, Calico, etc.
 Pełna separacja sieci użytkowników
 Użytkownicy mają pełną kontrolę nad wirtualnymi sieciami, routerami, etc.
OpenStack networking
Vanilla OpenStack networking
 problemy z programowaniem OpenVswitch – np. nie działają konkretne ścieżki, VMka nie
może pobrać IP z DHCP
 problemy z masowym deploymentem Vmek – przy provisioningu 100 VMek na raz kilka
czasami nie dostaje adresu IP
 L3-HA - proces keepalived per Virtual Router – setki, tysiące procesów, powodował m.in.
bałagan w sieci w połączeniu z bugami Cumulus Linux
 mimo DVR ruch z VMek bez FloatingIP nadal przechodzi przez Network Node – oczywisty
bottleneck
Vanilla OpenStack networking
Midonet w OpenStack
Midonet w OpenStack
Sieć w CloudFerro
Sieć w CloudFerro
Broadcom Trident II Mellanox Spectrum
Mellanox
SN2410
Mellanox
SN2700
Sprzęt sieciowy
Cumulus Linux (2.5 → 3.7)
Cumulus Linux
w praktyce
General issues/bugs/f**ckups:
 kernel panic na jednym switchu (bo był uszkodzony) - 30 sek network downtime
 VxLAN VTEP - integracja z Midonet - SPOF, cieknąca pamięć - konieczne restarty raz na dobę
 jak jest skonfigurany CLAG/MLAG to nie można podnieść sieci na jednym switchu
 jeden serwer zabił nam sieć bo uszkodzona karta wysyłała non stop ramki pauzujące
 po reloadzie konfiguracji niepoprawne MTU na interfejsach
 podczas aplikowania konfiguracji zrestartował się jeden switch i za chwilę drugi :)
 nazwa interfejsu dłuższa niż 15 znaków - stan nieustalony, trzeba restartować proces CLAGd albo switcha
Cumulus Linux w praktyce
EVPN issues/bugs/f**ckups:
HyperLoops: problemy z przenoszeniem serwerów między parami switchy - switche albo zaczynają floodować pakiety
unicast, albo wysyłają je nie tam gdzie powinny - live session z Cumulusem - reboot switcha położył nam sieć :)
HyperLoops: duplikaty pakietów - brakuje wpisów MAC switcha peera, więc switch flooduje na wszystkie interfejsy, ale tylko
czasami :)
HyperLoops: flapowanie wpisów w tablicy MAC – wg. Cumulusa to jest OK :D
HyperLoops: co innego w control plane, co innego w data plane – pętla w sieci
adresy VIP i ich mobilność w sieci - IP rozgłaszane jednocześnie z dwóch par switchy
ARP suppression - switch odpowiada na ARPy także w innych VLANach
brakowało wpisów ARP na switchach - brak albo niepoprawna instalacja MACa switcha peera - only Mellanox related
Cumulus Linux w praktyce
Nadal lubimy Cumulus Linuxa :D
Dziękuję za uwagę
sadd
Dziękuję za uwagę. Zapraszamy do kontaktu:
www.creodias.eu
https://twitter.com/CREODIAS
https://twitter.com/CloudFerro
https://www.linkedin.com/company/clfr/

More Related Content

What's hot

PLNOG 7: Michał Jura - Linux Contextualization
PLNOG 7: Michał Jura - Linux ContextualizationPLNOG 7: Michał Jura - Linux Contextualization
PLNOG 7: Michał Jura - Linux Contextualization
PROIDEA
 
Debian za kulisami
Debian za kulisamiDebian za kulisami
Debian za kulisami
Adam Byrtek
 
Devbox - wirtualne środowisko pracy
Devbox - wirtualne środowisko pracyDevbox - wirtualne środowisko pracy
Devbox - wirtualne środowisko pracy
Marek Bleschke
 
Docker praktyczne podstawy
Docker  praktyczne podstawyDocker  praktyczne podstawy
Docker praktyczne podstawy
Sages
 
3camp - Lucene pod presją?
3camp - Lucene pod presją?  3camp - Lucene pod presją?
3camp - Lucene pod presją?
Wirtualna Polska
 
Noc informatyka
Noc informatykaNoc informatyka
Noc informatykaOnetIT
 
100 sposobów na BSD
100 sposobów na BSD100 sposobów na BSD
100 sposobów na BSD
Wydawnictwo Helion
 
XSLT. Receptury. Wydanie II
XSLT. Receptury. Wydanie IIXSLT. Receptury. Wydanie II
XSLT. Receptury. Wydanie II
Wydawnictwo Helion
 
PLNOG 4: Paweł Andrejas - Onet Moduły
PLNOG 4: Paweł Andrejas - Onet ModułyPLNOG 4: Paweł Andrejas - Onet Moduły
PLNOG 4: Paweł Andrejas - Onet Moduły
PROIDEA
 
Usługi sieci internet cz ii 2012
Usługi sieci internet cz ii   2012Usługi sieci internet cz ii   2012
Usługi sieci internet cz ii 2012
Tańczący Z Kojotami
 
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PROIDEA
 
Red Hat Linux 8. Biblia
Red Hat Linux 8. BibliaRed Hat Linux 8. Biblia
Red Hat Linux 8. Biblia
Wydawnictwo Helion
 
JDBC. Leksykon kieszonkowy
JDBC. Leksykon kieszonkowyJDBC. Leksykon kieszonkowy
JDBC. Leksykon kieszonkowy
Wydawnictwo Helion
 
DWO 2010 - ArchLinux
DWO 2010 - ArchLinuxDWO 2010 - ArchLinux
DWO 2010 - ArchLinux
Mikołaj Pastuszko
 
SUSE Linux 10. Księga eksperta
SUSE Linux 10. Księga ekspertaSUSE Linux 10. Księga eksperta
SUSE Linux 10. Księga eksperta
Wydawnictwo Helion
 

What's hot (20)

Be12short
Be12shortBe12short
Be12short
 
PLNOG 7: Michał Jura - Linux Contextualization
PLNOG 7: Michał Jura - Linux ContextualizationPLNOG 7: Michał Jura - Linux Contextualization
PLNOG 7: Michał Jura - Linux Contextualization
 
Debian za kulisami
Debian za kulisamiDebian za kulisami
Debian za kulisami
 
Devbox - wirtualne środowisko pracy
Devbox - wirtualne środowisko pracyDevbox - wirtualne środowisko pracy
Devbox - wirtualne środowisko pracy
 
Docker praktyczne podstawy
Docker  praktyczne podstawyDocker  praktyczne podstawy
Docker praktyczne podstawy
 
3camp - Lucene pod presją?
3camp - Lucene pod presją?  3camp - Lucene pod presją?
3camp - Lucene pod presją?
 
Noc informatyka
Noc informatykaNoc informatyka
Noc informatyka
 
100 sposobów na BSD
100 sposobów na BSD100 sposobów na BSD
100 sposobów na BSD
 
XSLT. Receptury. Wydanie II
XSLT. Receptury. Wydanie IIXSLT. Receptury. Wydanie II
XSLT. Receptury. Wydanie II
 
PLNOG 4: Paweł Andrejas - Onet Moduły
PLNOG 4: Paweł Andrejas - Onet ModułyPLNOG 4: Paweł Andrejas - Onet Moduły
PLNOG 4: Paweł Andrejas - Onet Moduły
 
Awk
AwkAwk
Awk
 
OpenEmbedded
OpenEmbeddedOpenEmbedded
OpenEmbedded
 
Usługi sieci internet cz ii 2012
Usługi sieci internet cz ii   2012Usługi sieci internet cz ii   2012
Usługi sieci internet cz ii 2012
 
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
PLNOG 3: Tadeusz Knapik - E = (DC)2 czyli jak można pracować w oparciu o dwa ...
 
Wprowadzenie do OpenEmbedded
Wprowadzenie do OpenEmbeddedWprowadzenie do OpenEmbedded
Wprowadzenie do OpenEmbedded
 
Red Hat Linux 8. Biblia
Red Hat Linux 8. BibliaRed Hat Linux 8. Biblia
Red Hat Linux 8. Biblia
 
JDBC. Leksykon kieszonkowy
JDBC. Leksykon kieszonkowyJDBC. Leksykon kieszonkowy
JDBC. Leksykon kieszonkowy
 
DWO 2010 - ArchLinux
DWO 2010 - ArchLinuxDWO 2010 - ArchLinux
DWO 2010 - ArchLinux
 
Jest Git!
Jest Git!Jest Git!
Jest Git!
 
SUSE Linux 10. Księga eksperta
SUSE Linux 10. Księga ekspertaSUSE Linux 10. Księga eksperta
SUSE Linux 10. Księga eksperta
 

Similar to PLNOG 21: Alek Cesarz, Piotr Misiak - Petabajty_z_kosmosu_(serio)

Wprowadzenie do Kubernetesa. K8S jako nowy Linux.
Wprowadzenie do Kubernetesa. K8S jako nowy Linux.Wprowadzenie do Kubernetesa. K8S jako nowy Linux.
Wprowadzenie do Kubernetesa. K8S jako nowy Linux.
Wojciech Barczyński
 
Kubernetes i Docker Swarm - Tomasz Woszczynski
Kubernetes i Docker Swarm - Tomasz WoszczynskiKubernetes i Docker Swarm - Tomasz Woszczynski
Kubernetes i Docker Swarm - Tomasz Woszczynski
duchowe50k
 
PLNOG19 - Emil Gągała - Przewodnik nowoczesnego sieciowca po pasjonującym, No...
PLNOG19 - Emil Gągała - Przewodnik nowoczesnego sieciowca po pasjonującym, No...PLNOG19 - Emil Gągała - Przewodnik nowoczesnego sieciowca po pasjonującym, No...
PLNOG19 - Emil Gągała - Przewodnik nowoczesnego sieciowca po pasjonującym, No...
PROIDEA
 
Marcin Motylski - Globalna Chmura Obliczeniowa
Marcin Motylski - Globalna Chmura ObliczeniowaMarcin Motylski - Globalna Chmura Obliczeniowa
Marcin Motylski - Globalna Chmura Obliczeniowa
PROIDEA
 
PLNOG 18 - Marcin Motylski - Budowa wirtualnego Data Center
PLNOG 18 - Marcin Motylski - Budowa wirtualnego Data CenterPLNOG 18 - Marcin Motylski - Budowa wirtualnego Data Center
PLNOG 18 - Marcin Motylski - Budowa wirtualnego Data Center
PROIDEA
 
PLNOG 21: Marcin Motylski - Bezpieczeństwo_i_Firewalle_w_Multi_Cloud / Data _...
PLNOG 21: Marcin Motylski - Bezpieczeństwo_i_Firewalle_w_Multi_Cloud / Data _...PLNOG 21: Marcin Motylski - Bezpieczeństwo_i_Firewalle_w_Multi_Cloud / Data _...
PLNOG 21: Marcin Motylski - Bezpieczeństwo_i_Firewalle_w_Multi_Cloud / Data _...
PROIDEA
 
Webinar - Podstawy Node.js
Webinar - Podstawy Node.jsWebinar - Podstawy Node.js
Webinar - Podstawy Node.js
Wojciech Kaniuka
 
Jak zbudować aplikacje z wykorzystaniem funkcjonalności windows server 2016...
Jak zbudować aplikacje z wykorzystaniem funkcjonalności windows server 2016...Jak zbudować aplikacje z wykorzystaniem funkcjonalności windows server 2016...
Jak zbudować aplikacje z wykorzystaniem funkcjonalności windows server 2016...
Lukasz Kaluzny
 
Tomasz Kopacz MTS 2012 Azure - Co i kiedy użyć (IaaS vs paas vshybrid cloud v...
Tomasz Kopacz MTS 2012 Azure - Co i kiedy użyć (IaaS vs paas vshybrid cloud v...Tomasz Kopacz MTS 2012 Azure - Co i kiedy użyć (IaaS vs paas vshybrid cloud v...
Tomasz Kopacz MTS 2012 Azure - Co i kiedy użyć (IaaS vs paas vshybrid cloud v...Tomasz Kopacz
 
PLNOG 13: Robert Ślaski: NFV, Virtualise networks or die – the voice of the r...
PLNOG 13: Robert Ślaski: NFV, Virtualise networks or die – the voice of the r...PLNOG 13: Robert Ślaski: NFV, Virtualise networks or die – the voice of the r...
PLNOG 13: Robert Ślaski: NFV, Virtualise networks or die – the voice of the r...
PROIDEA
 
PLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_Hiperkonwergentnym
PLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_HiperkonwergentnymPLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_Hiperkonwergentnym
PLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_Hiperkonwergentnym
PROIDEA
 
Halokwadrat PLNOG - Freeswitch a big boys Softswitch
Halokwadrat PLNOG - Freeswitch a big boys SoftswitchHalokwadrat PLNOG - Freeswitch a big boys Softswitch
Halokwadrat PLNOG - Freeswitch a big boys Softswitchmichalpodoski
 
[#2] architektura - IBM Integrated Analytics System
[#2] architektura - IBM Integrated Analytics System[#2] architektura - IBM Integrated Analytics System
[#2] architektura - IBM Integrated Analytics System
Artur Wronski
 
Pocałunek śmierci
Pocałunek śmierciPocałunek śmierci
Pocałunek śmierciDivante
 
PLNOG 9: Maciej Nabożny, Miłosz Zdybał - Jak powstaje chmura?
PLNOG 9: Maciej Nabożny, Miłosz Zdybał - Jak powstaje chmura? PLNOG 9: Maciej Nabożny, Miłosz Zdybał - Jak powstaje chmura?
PLNOG 9: Maciej Nabożny, Miłosz Zdybał - Jak powstaje chmura?
PROIDEA
 
Kubernetes: from zero to be hero
Kubernetes: from zero to be heroKubernetes: from zero to be hero
Kubernetes: from zero to be hero
The Software House
 
Skalowalność Magento - MMPL13
Skalowalność Magento - MMPL13Skalowalność Magento - MMPL13
Skalowalność Magento - MMPL13Divante
 
PLNOG16: Integracja Ceph w OpenStack - status i przyszłość, Paweł Stefański
PLNOG16: Integracja Ceph w OpenStack - status i przyszłość, Paweł StefańskiPLNOG16: Integracja Ceph w OpenStack - status i przyszłość, Paweł Stefański
PLNOG16: Integracja Ceph w OpenStack - status i przyszłość, Paweł Stefański
PROIDEA
 
Ansible w praktyce
Ansible w praktyceAnsible w praktyce
Ansible w praktyce
Kamil Grabowski
 
Technologie Firmy Novell A Web 2.0 - Piotr Szewczuk
Technologie Firmy Novell A Web 2.0 - Piotr SzewczukTechnologie Firmy Novell A Web 2.0 - Piotr Szewczuk
Technologie Firmy Novell A Web 2.0 - Piotr Szewczukaulapolska
 

Similar to PLNOG 21: Alek Cesarz, Piotr Misiak - Petabajty_z_kosmosu_(serio) (20)

Wprowadzenie do Kubernetesa. K8S jako nowy Linux.
Wprowadzenie do Kubernetesa. K8S jako nowy Linux.Wprowadzenie do Kubernetesa. K8S jako nowy Linux.
Wprowadzenie do Kubernetesa. K8S jako nowy Linux.
 
Kubernetes i Docker Swarm - Tomasz Woszczynski
Kubernetes i Docker Swarm - Tomasz WoszczynskiKubernetes i Docker Swarm - Tomasz Woszczynski
Kubernetes i Docker Swarm - Tomasz Woszczynski
 
PLNOG19 - Emil Gągała - Przewodnik nowoczesnego sieciowca po pasjonującym, No...
PLNOG19 - Emil Gągała - Przewodnik nowoczesnego sieciowca po pasjonującym, No...PLNOG19 - Emil Gągała - Przewodnik nowoczesnego sieciowca po pasjonującym, No...
PLNOG19 - Emil Gągała - Przewodnik nowoczesnego sieciowca po pasjonującym, No...
 
Marcin Motylski - Globalna Chmura Obliczeniowa
Marcin Motylski - Globalna Chmura ObliczeniowaMarcin Motylski - Globalna Chmura Obliczeniowa
Marcin Motylski - Globalna Chmura Obliczeniowa
 
PLNOG 18 - Marcin Motylski - Budowa wirtualnego Data Center
PLNOG 18 - Marcin Motylski - Budowa wirtualnego Data CenterPLNOG 18 - Marcin Motylski - Budowa wirtualnego Data Center
PLNOG 18 - Marcin Motylski - Budowa wirtualnego Data Center
 
PLNOG 21: Marcin Motylski - Bezpieczeństwo_i_Firewalle_w_Multi_Cloud / Data _...
PLNOG 21: Marcin Motylski - Bezpieczeństwo_i_Firewalle_w_Multi_Cloud / Data _...PLNOG 21: Marcin Motylski - Bezpieczeństwo_i_Firewalle_w_Multi_Cloud / Data _...
PLNOG 21: Marcin Motylski - Bezpieczeństwo_i_Firewalle_w_Multi_Cloud / Data _...
 
Webinar - Podstawy Node.js
Webinar - Podstawy Node.jsWebinar - Podstawy Node.js
Webinar - Podstawy Node.js
 
Jak zbudować aplikacje z wykorzystaniem funkcjonalności windows server 2016...
Jak zbudować aplikacje z wykorzystaniem funkcjonalności windows server 2016...Jak zbudować aplikacje z wykorzystaniem funkcjonalności windows server 2016...
Jak zbudować aplikacje z wykorzystaniem funkcjonalności windows server 2016...
 
Tomasz Kopacz MTS 2012 Azure - Co i kiedy użyć (IaaS vs paas vshybrid cloud v...
Tomasz Kopacz MTS 2012 Azure - Co i kiedy użyć (IaaS vs paas vshybrid cloud v...Tomasz Kopacz MTS 2012 Azure - Co i kiedy użyć (IaaS vs paas vshybrid cloud v...
Tomasz Kopacz MTS 2012 Azure - Co i kiedy użyć (IaaS vs paas vshybrid cloud v...
 
PLNOG 13: Robert Ślaski: NFV, Virtualise networks or die – the voice of the r...
PLNOG 13: Robert Ślaski: NFV, Virtualise networks or die – the voice of the r...PLNOG 13: Robert Ślaski: NFV, Virtualise networks or die – the voice of the r...
PLNOG 13: Robert Ślaski: NFV, Virtualise networks or die – the voice of the r...
 
PLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_Hiperkonwergentnym
PLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_HiperkonwergentnymPLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_Hiperkonwergentnym
PLONG 21: Marcel Guzenda - Chmura_prywatna_w_wydaniu_Hiperkonwergentnym
 
Halokwadrat PLNOG - Freeswitch a big boys Softswitch
Halokwadrat PLNOG - Freeswitch a big boys SoftswitchHalokwadrat PLNOG - Freeswitch a big boys Softswitch
Halokwadrat PLNOG - Freeswitch a big boys Softswitch
 
[#2] architektura - IBM Integrated Analytics System
[#2] architektura - IBM Integrated Analytics System[#2] architektura - IBM Integrated Analytics System
[#2] architektura - IBM Integrated Analytics System
 
Pocałunek śmierci
Pocałunek śmierciPocałunek śmierci
Pocałunek śmierci
 
PLNOG 9: Maciej Nabożny, Miłosz Zdybał - Jak powstaje chmura?
PLNOG 9: Maciej Nabożny, Miłosz Zdybał - Jak powstaje chmura? PLNOG 9: Maciej Nabożny, Miłosz Zdybał - Jak powstaje chmura?
PLNOG 9: Maciej Nabożny, Miłosz Zdybał - Jak powstaje chmura?
 
Kubernetes: from zero to be hero
Kubernetes: from zero to be heroKubernetes: from zero to be hero
Kubernetes: from zero to be hero
 
Skalowalność Magento - MMPL13
Skalowalność Magento - MMPL13Skalowalność Magento - MMPL13
Skalowalność Magento - MMPL13
 
PLNOG16: Integracja Ceph w OpenStack - status i przyszłość, Paweł Stefański
PLNOG16: Integracja Ceph w OpenStack - status i przyszłość, Paweł StefańskiPLNOG16: Integracja Ceph w OpenStack - status i przyszłość, Paweł Stefański
PLNOG16: Integracja Ceph w OpenStack - status i przyszłość, Paweł Stefański
 
Ansible w praktyce
Ansible w praktyceAnsible w praktyce
Ansible w praktyce
 
Technologie Firmy Novell A Web 2.0 - Piotr Szewczuk
Technologie Firmy Novell A Web 2.0 - Piotr SzewczukTechnologie Firmy Novell A Web 2.0 - Piotr Szewczuk
Technologie Firmy Novell A Web 2.0 - Piotr Szewczuk
 

PLNOG 21: Alek Cesarz, Piotr Misiak - Petabajty_z_kosmosu_(serio)

  • 1. Petabajty z kosmosu (serio) powered by Alek Cesarz, Piotr Misiak
  • 2. Co robimy Rozwiązania chmurowe Chmury publiczne – bezpieczne, skalowalne, łatwo zarządzalne (API) Chmury prywatne – bezpieczne, na dedykowanych zasobach, instalowane u użytkownika, integrowane z lokalnymi systemami i zasobami Chmury hybrydowe – wykorzystanie chmur publicznych do rozszerzenia możliwości własnej infrastruktury Wykorzystywane najlepsze otwarte projekty OpenStack Ceph Unikalne możliwości Integracja infrastruktury wirtualnej i fizycznej Dedykowane zwirtualizowane serwery (lokalne dyski, GPU) Szeroki zestaw usług dodanych Kluczowe projekty EO Cloud (EO Innovation Platform Testbed) dla ESA CDS Hybrid Cloud dla ECMWF CREODIAS dla ESA/EC
  • 3. Projekt COPERNICUS Sentinel-1 A/B – od 2014 C-SAR – Synthetic Aperture Radar obrazowanie ukształtowania powierzchni ziemi Sentinel-2 A/B – od 2015 MSI – Multi-Spectral Instrument pomiary w 12 zakresach od 442,3nm do 2202,4nm Sentinel-3 – od 2016 SLSTR (Sea and Land Surface Temperature Radiometer) SRAL (SAR Altimeter) OLCI (Ocean and Land Colour Instrument) MWR (Microwave Radiometer) obserwacja powierzchni wód morskich, śródlądowych i lodowców Sentinel-5 Precursor – od 2017 TROPOspheric Monitoring Instrument wielozakresowa (UV, VIS, NIR, SWIR) obserwacja atmosfery
  • 4. I nie tylko COPERNICUS 4
  • 5. Obserwacja zmian 5 Algi w Dnieprze Most na Wiśle
  • 6. Co z tego wynika 6 • Ogromne ilości danych - dziesiątki, a wkrótce setki TB dziennie • Rozproszenie źródeł • Przetwarzanie maszynowe • Dostęp publiczny do danych programu Copernicus • Rozpędzenie pomysłów na wykorzystanie danych 11,259,604 produktów 9,173 TB danych 3,118,277,982 obiektów 0 10 20 30 EO data (in PB) 7.5 13 19 25 2018 2019 2020 2021
  • 9. 9
  • 10. 10
  • 11. Storage – dobre złego, a może złe dobrego początki 11 Żródło: Giacinto Donvito et al 2014 J. Phys.: Conf. Ser. 513 042014 „Write once – read many” – czy na pewno? Ceph – wolny i nie do końca stabilny HDFS – wolny i zasobożerny GlusterFS – idealne rozwiązanie? ZFS, kompresja, replikacja, rebalancing, RedHat…
  • 12. Storage – pierwsze problemy 12 20TB dziennie w normalnej pracy, 50TB przy uzupełnianiu danych 1 węzeł storage na 3 dni!
  • 13. Storage – pierwsze problemy 13 200 MBps
  • 14. Storage – pierwsze problemy 14
  • 15. Storage – pierwsze problemy 15 200 MBps N x 200 MBps! + nadmiarowość + metadane
  • 16. Storage 16 Lessons learned: - „write once – read many” nie jest do końca prawdą - „odporność” systemu na rozbudowy jest krytyczna - ograniczenia HW pokazują się nie tam gdzie się ich spodziewamy - zabezpieczenie danych niekoniecznie musi być realizowane na poziomie FS Na szczęście Ceph „dojrzał” ((-:
  • 17. Jak to robimy teraz? 17
  • 18. Komponenty Open Source 18 Linux nasz podstawowy, ukochany, jedyny system operacyjny OpenStack serwery, sieci, storage na wzór AWS Ceph storage blokowy dla OpenStacka oraz obiektowy dla danych satelitarnych Midonet sieć dla OpenStacka, plugin do Neutrona Ansible narzędzie do zarządzania całą infrastrukturą Cumulus Linux system operacyjny na switchach, nie do końca taki open ;)
  • 19.  Ubuntu LTS, aktualnie 16.04  Automatyczna instalacja i konfiguracja systemu przy użyciu Cobblera i Ansible  Monitoring za pomocą Zabbixa  Centralne składowisko logów  Centralne zarządzanie dostępami Linux w CloudFerro
  • 20.  Jeden z największych projektów Open Source na świecie, projekt wspierają wszystkie liczące się firmy w branży, bardzo duże community  Umożliwia zbudowanie chmury prywatnej albo publicznej na wzór AWS  Wirtualne serwery, kontenery, wirtualne sieci, wirtualny storage  Bardzo szybki rozwój - wydania wersji co pół roku  Składa się z wielu oddzielnych modułów/projektów, każdy z nich odpowiada za konkretny obszar, komunikacja między modułami i z użytkownikiem via REST API  Nieskończona ilość konfiguracji, sposobów deploymentu, integracji OpenStack
  • 21.  Vaniliowa wersja Mitaka i Pike z kilkoma drobnymi patchami  Instalacja i konfiguracja za pomocą projektu OpenStack Kolla  Każdy serwis OpenStacka jest w dedykowanym kontenerze Dockera  Używane moduły: Keystone, Nova, Glance, Neutron, Cinder, Horizon, Ceilometer  Midonet jako plugin do Neutrona  Instalacje z 50+ compute nodów  Billing klientów oraz jego integracja z OpenStack jest naszym autorskim rozwiązaniem OpenStack w CloudFerro
  • 22.  Tylko fernet tokens w Keystonie  Wszystkie serwisy OpenStacka są bardzo wrażliwe na komunikację z RabbitMQ  Multitenacy jest problematyczne – domeny, projekty  Uwaga na aktualizacje – potrafią wprowadzić nowe bugi  Najlepiej być jeden albo dwa wydania w tyle OpenStack tips & tricks
  • 23.  Osobna instalacja na potrzeby OpenStacka:  storage blokowy i obiektowy  kilkanaście serwerów per OpenStack  dwa typy dysków SSD i HDD  Osobna instalacja dla danych satelitarnych:  w tej chwili 9PB danych netto  erasure coding  dostęp obiektowy  2200+ dysków  mamy swojego forka kodu z własnymi modyfikacjami Ceph w CloudFerro
  • 24.  Zalecana najnowsza i spójna wersja  Uwaga na operacje snaptrim i scrub  Trzeba mieć backfilling pod kontrolą  Uwaga na ilość miejsca na dysku na serwerach z ceph-mon :)  Microbursts  Stan WARNING I ERROR to nie koniec świata, jeżeli się dokładnie rozumie co się dzieje w klastrze Ceph tips & tricks
  • 25.  instalacja/konfiguracja systemu operacyjnego - nasze playbooki  instalacja/konfiguracja OpenStack - Openstack Kolla  instalacja/konfiguracja Ceph – ceph-ansible  instalacja/konfiguracja switchy/sieci - nasze playbooki, korzystamy z modułu nclu  brakuje modułów do fizycznej instalacji urządzeń w szafach :/ Ansible everything!
  • 26.  Projekt Neutron odpowiada za konfigurację sieci wirtualnych w projektach  Modułowa architektura, praktycznie do każdej funkcji da się podpiąć plugin, których jest cała masa pluginów Open Source oraz od różnych vendorów – Cisco, Juniper, etc.  Zapewnia komunikację dla VMek i kontenerów: zwykłe sieci L2, routing L3, VPNaaS, FwaaS, LBaaS, peering BPG, etc.  SDN: OpenContrail, OpenDaylight, Midonet, Calico, etc.  Pełna separacja sieci użytkowników  Użytkownicy mają pełną kontrolę nad wirtualnymi sieciami, routerami, etc. OpenStack networking
  • 28.  problemy z programowaniem OpenVswitch – np. nie działają konkretne ścieżki, VMka nie może pobrać IP z DHCP  problemy z masowym deploymentem Vmek – przy provisioningu 100 VMek na raz kilka czasami nie dostaje adresu IP  L3-HA - proces keepalived per Virtual Router – setki, tysiące procesów, powodował m.in. bałagan w sieci w połączeniu z bugami Cumulus Linux  mimo DVR ruch z VMek bez FloatingIP nadal przechodzi przez Network Node – oczywisty bottleneck Vanilla OpenStack networking
  • 33. Broadcom Trident II Mellanox Spectrum Mellanox SN2410 Mellanox SN2700 Sprzęt sieciowy
  • 34. Cumulus Linux (2.5 → 3.7)
  • 36. General issues/bugs/f**ckups:  kernel panic na jednym switchu (bo był uszkodzony) - 30 sek network downtime  VxLAN VTEP - integracja z Midonet - SPOF, cieknąca pamięć - konieczne restarty raz na dobę  jak jest skonfigurany CLAG/MLAG to nie można podnieść sieci na jednym switchu  jeden serwer zabił nam sieć bo uszkodzona karta wysyłała non stop ramki pauzujące  po reloadzie konfiguracji niepoprawne MTU na interfejsach  podczas aplikowania konfiguracji zrestartował się jeden switch i za chwilę drugi :)  nazwa interfejsu dłuższa niż 15 znaków - stan nieustalony, trzeba restartować proces CLAGd albo switcha Cumulus Linux w praktyce
  • 37. EVPN issues/bugs/f**ckups: HyperLoops: problemy z przenoszeniem serwerów między parami switchy - switche albo zaczynają floodować pakiety unicast, albo wysyłają je nie tam gdzie powinny - live session z Cumulusem - reboot switcha położył nam sieć :) HyperLoops: duplikaty pakietów - brakuje wpisów MAC switcha peera, więc switch flooduje na wszystkie interfejsy, ale tylko czasami :) HyperLoops: flapowanie wpisów w tablicy MAC – wg. Cumulusa to jest OK :D HyperLoops: co innego w control plane, co innego w data plane – pętla w sieci adresy VIP i ich mobilność w sieci - IP rozgłaszane jednocześnie z dwóch par switchy ARP suppression - switch odpowiada na ARPy także w innych VLANach brakowało wpisów ARP na switchach - brak albo niepoprawna instalacja MACa switcha peera - only Mellanox related Cumulus Linux w praktyce
  • 38. Nadal lubimy Cumulus Linuxa :D
  • 39. Dziękuję za uwagę sadd Dziękuję za uwagę. Zapraszamy do kontaktu: www.creodias.eu https://twitter.com/CREODIAS https://twitter.com/CloudFerro https://www.linkedin.com/company/clfr/