Prezentacja projektów komercyjnych oraz prac naukowych realizowanych w 9LivesData. Zaprezentowana w ramach 9LivesData Day na wydziale MIM UW 17 października 2016.
2. 9LivesData
R&D na światowym poziomie
Artykuły na konferencjach, kilkadziesiąt patentów
Tylko ciekawe projekty: backendowe, chmurowe,
storage'owe, big data…
Możliwość pisania pracy magisterskiej i doktoratu
Zaawansowany proces tworzenia oprogramowania –
nacisk na wysoką jakość architektury i kodu,
niezawodność, dobre praktyki programistyczne
3. 9LivesData
50+ programistów (>90% po MIMUW)
Biuro: Mokotów, Niedźwiedzia 8B
(kilka minut na piechotę od Metra Służew)
Elastyczne godziny pracy, możliwość
łączenia pracy ze studiami
Siłownia, piłkarzyki, stół do ping-ponga,
bulderownia w biurze
Świeże owoce, sokowirówka
Dobra atmosfera!
4. NEC HYDRAstor
Rozproszony system do przechowywania
danych backupowych i archiwalnych
Najbardziej skalowalny i najszybszy na świecie!
Kod pisany w C++, narzędzia w Pythonie
Krytyczne wydajnościowo komponenty
pisane w Warszawie, dla NEC Japan
Mamy własny system plików, alokator,
algorytm rozproszonego odśmiecania bloków,
algorytm rozproszonego konsensusu...
Tysiące klientów na całym świecie
(również w Polsce)
5. Starfish
Rozwiązanie dla klientów posiadających duże
zbiory plików (powyżej 100 milionów)
Umożliwia zbieranie informacji na temat zawartości
zbiorów oraz wykonywanie operacji na grupach plików
Napisany w Pythonie, główne komponenty są
tworzone w Warszawie dla Starfish Storage Corp.
8. Bizerba
System urządzeń połączonych w logiczne klastry
Dla niemieckiej firmy istniejącej od 150 lat
W Warszawie jest tworzona i implementowana nowa,
mikroserwisowa architektura systemu dla nowej
generacji urządzeń
Problemy związane z systemami rozproszonymi,
bezpieczeństwem i odpornością na awarie,
Różne architektury – X86 i ARM
Różne systemy operacyjne – Windows, Linux,
Windows CE
Języki – C/C++/GO/Java/Python w zależności od
potrzeb
9.
10. Tematy z projektów 9LivesData
bywają podstawą publikacji naukowych:
● prac magisterskich i doktoratów,
● publikacji na konferencjach naukowych,
● prezentacji na konferencjach branżowych.
11. Wspomnienia hydrowych magistrów
“Produkcyjny system, prawdziwe problemy,
praktyczne porady od ekspertów w swojej
dziedzinie”
"Po przyjściu do 9livesdata znalazłem trudny,
praktyczny problem, z którym mogę się
zmierzyć i jeszcze mi za to płacą!"
“Dostajesz ciekawy temat, piszesz kod w
pracy, a nie w wolnym czasie”
"Pisałem pracę w otoczeniu osób, które na co
dzień zajmują się tematem oraz mają
doświadczenie w pisaniu artykułów naukowych"
Krzysztof Rusek, Sebastian Jodłowski, Piotr Skowron, Przemysław Strzelczak,
Kamil Nowosad, Maciej Kowalczyk. Piotr Cyrankiewicz, Kornel Jakubczyk,
Dominik Borowiec
12. Nasi Magistranci od 2008 do 2016
2016 – mgr Piotr Cyrankiewicz: Design and implementation of a new scheduling algorithm for
automated tests system in 9LivesData
2015 – mgr Sebastian Jodłowski: Metadata access speedup in HydraFS
2014 – mgr Krzysztof Rusek: Optimizing client-side data deduplication in distributed storage
system
2013 - mgr Dominik Borowiec: Correlation-based compression of the statistics generated by
the distributed, secondary storage system
2011 – mgr Kamil Nowosad: HydraTFS: A transacional, scalable file system over a CAS block
storage
2010 – mgr Kornel Jakubczyk: Maruder disk detection
2009 - mgr Maciej Kowalczyk: Upgrading distributed systems
2009 - mgr Piotr Skowron: Resource management unit
Publikacje: SYSTOR 2013, Israel
13. Doktoraty z 9LivesData
2015 – dr Michał Kaczmarczyk: Fragmentation in storage systems with
duplicate elimination
Publikacje: SYSTOR 2012, Israel
2012 - dr Leszek Gryz: Impact of data organization on distributed
storage systems
Publikacje: FAST 2009, California, USA;
US Patent 8019728
14. Optymalizacje
Zastąpienie Samby w produkcie filesystemem z
wykorzystaniem Dokana
Optymalizacje w rozproszonym systemie plików HFS
Implementacja doktoratu Michała – poprawa fragmentacji
Offline defragmentacja
Usprawnienia w replikacji
…
15. Nowe pomysły
Fulltext-Search w archiwum na Hydrze
System plików zorientowany na szybki backup i ego
odtworzenie
Open SDK dla Hydry
…
16. Pomysły na prace teoretyczne
Przekrojowa praca o systemach storage’owych
O systemach logowania wraz z dostarczeniem ogólnego
systemu logowania do wieloplatformowego OST w
oparciu o log4cxx
17. Machine Learning
Staż w NEC w Japonii lub Kalifornii
Praca nad prototypami rozwiązań
Kontynuacja pracy nad danych tematem w 9LivesData