SlideShare a Scribd company logo
1 of 22
Od Big Data do Analityki 3.0
Od chaosu danych do odkrycia potencjału informacji
Magdalena Hoffman
ZETO Katowice Sp. z o.o.
Kraków, 15 maja 2015
Opowiemy
Kim jesteśmy
Skąd się wzięliśmy
O projekcie słów kilka:
Klient
Problem
Wyzwanie
Efekty
…i potencjał
ZETO Katowice
ZETO INNOVATIONS
• Skupiamy się na zaawansowanej analityce
• Wykorzystujemy Internet Rzeczy
• Stosujemy podejście big data’owe w pracy z danymi
• Produkty rozwijamy w modelu Customer Development
• Dostarczamy Klientom wiedzy
niezbędnej do podejmowania decyzji biznesowych
w czasie rzeczywistym
Start
• Spedytor krajowy
• Koszty paliwa to znacząca część kosztów operacyjnych
Cel – obniżyć zużycie paliwa – Eco Driving
Czy to w ogóle jest możliwe?
Choć dysponujemy danymi
i częściowo informacjami,
to wciąż brakuje nam...
…wiedzy
Praca z danymi
Model CRISP-DM
Język R
Źródła danych
“Wygrywa nie ten, kto ma najlepszy algorytm,
a ten, który ma najwięcej danych.”*
Źródło: Andrew Ng,
Ekspert Machine Learning, prof. Stanford University
Źródła danych
Źródła danych, cd.
• Strumienie danych (online)
• Listy przewozowe
• Rozkłady jazdy
• Baza infrastruktury
transportowej
• Bazy systemów dziedzinowych
• Zbiory ograniczeń w ruchu
• Dane z systemów ERP / CMMS
• Dane meteorologiczne
• historyczne
• bieżące
• Uzgodnione struktury pośrednie
• Słowniki
Najważniejsze procesy ETL
“Eksploracja danych polega na
torturowaniu danych tak długo,
aż zaczną zeznawać”*
Źródło: Mieczysław Muraszkiewicz,
Instytut Informatyki Teoretycznej i Stosowanej PAN
Najważniejsze procesy ETL
• Infrastruktura
• Przejazdy
• Tabor
• Ludzie
• Warunki zewnętrzne
Czyszczenie i przetwarzanie
Przykład duplikowania się identyfikatora pojazdu
Czyszczenie i przetwarzanie
Przykład błędnego profilu trasy
--- Kształt linii przed naprawą
--- Kształt linii po naprawie
Czyszczenie i przetwarzanie
Niedokładność wskaźnika zużycia paliwa
Efekty
• Zdefiniowana i zasilona Hurtownia danych
• Moduł analityczny
• Zintegrowana informacja o przejazdach
• Prezentacja wizualna przejazdów
• Możliwość wyznaczenia spalania chwilowego
• Baza infrastruktury transportowej
tworzymy
Adaptacyjny algorytm optymalizacji przejazdów uwzględniający bieżące
ograniczenia
Wchodzi Analityka 3.0
Wbudowujemy algorytm w aplikacje
Potencjał
Podsumowanie
Pytania
Dziękuję za uwagę
Magdalena Hoffman
magdalena.hoffman@zetoinnovations.pl
+48 604 187 852

More Related Content

Similar to Od Big Data do Analityki 3.0

Customer first - obsługa klienta w kanałach cyfrowych
Customer first - obsługa klienta w kanałach cyfrowychCustomer first - obsługa klienta w kanałach cyfrowych
Customer first - obsługa klienta w kanałach cyfrowychSquiz Poland
 
Analityka w optymalizacji procesów -TechMine_10.12.2015r.MP
Analityka w optymalizacji procesów -TechMine_10.12.2015r.MPAnalityka w optymalizacji procesów -TechMine_10.12.2015r.MP
Analityka w optymalizacji procesów -TechMine_10.12.2015r.MPMagdalena Hoffman-Cicho?
 
Integracja danych i raportowanie w chmurze obliczeniowej Windows Azure - tran...
Integracja danych i raportowanie w chmurze obliczeniowej Windows Azure - tran...Integracja danych i raportowanie w chmurze obliczeniowej Windows Azure - tran...
Integracja danych i raportowanie w chmurze obliczeniowej Windows Azure - tran...Jarek Sokolnicki
 
Cyfrowa transformacja. Fakty i Mity
Cyfrowa transformacja. Fakty i MityCyfrowa transformacja. Fakty i Mity
Cyfrowa transformacja. Fakty i MityMichal Kreczmar
 
Big data w strategii marketingowej
Big data w strategii marketingowejBig data w strategii marketingowej
Big data w strategii marketingowejgrey tree sp z o.o.
 
Kupuj wartosc a nie transakcje
Kupuj wartosc a nie transakcjeKupuj wartosc a nie transakcje
Kupuj wartosc a nie transakcjeŁukasz Dziekan
 
Clv Kogo pozyskujesz klienta czy jego transakcje
Clv Kogo pozyskujesz klienta czy jego transakcjeClv Kogo pozyskujesz klienta czy jego transakcje
Clv Kogo pozyskujesz klienta czy jego transakcjeMichal Kreczmar
 
Praca Codibly - Demand Response Management
Praca Codibly - Demand Response ManagementPraca Codibly - Demand Response Management
Praca Codibly - Demand Response ManagementCodibly - Software House
 
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...TUATARA
 
Candidate i employee experience - zacznij je mierzyc
Candidate i employee experience - zacznij je mierzycCandidate i employee experience - zacznij je mierzyc
Candidate i employee experience - zacznij je mierzycMarta Pawlak-Dobrzanska
 
Od Czarnoksiężnik z krainy Oz do modeli na produkcji
Od Czarnoksiężnik z krainy Oz do modeli na produkcjiOd Czarnoksiężnik z krainy Oz do modeli na produkcji
Od Czarnoksiężnik z krainy Oz do modeli na produkcjiArtur Skowroński
 
Analityka biznesowa - Valery Rastyazhenko I More Bananas
Analityka biznesowa - Valery Rastyazhenko I  More BananasAnalityka biznesowa - Valery Rastyazhenko I  More Bananas
Analityka biznesowa - Valery Rastyazhenko I More BananasMore Bananas
 
Strategia Data First
Strategia Data FirstStrategia Data First
Strategia Data FirstPiotr Smialek
 
Mity, które blokują Twoją karierę
Mity, które blokują Twoją karieręMity, które blokują Twoją karierę
Mity, które blokują Twoją karieręPiotr Horzycki
 
Transformacja cyfrowa Historia osobista
Transformacja cyfrowa Historia osobistaTransformacja cyfrowa Historia osobista
Transformacja cyfrowa Historia osobistaMichal Kreczmar
 
Big data i analityka w HR Marta Dobrzanska
Big data i analityka w HR Marta DobrzanskaBig data i analityka w HR Marta Dobrzanska
Big data i analityka w HR Marta DobrzanskaMarta Pawlak-Dobrzanska
 

Similar to Od Big Data do Analityki 3.0 (20)

Big Data +
Big Data +Big Data +
Big Data +
 
Customer first - obsługa klienta w kanałach cyfrowych
Customer first - obsługa klienta w kanałach cyfrowychCustomer first - obsługa klienta w kanałach cyfrowych
Customer first - obsługa klienta w kanałach cyfrowych
 
Analityka w optymalizacji procesów -TechMine_10.12.2015r.MP
Analityka w optymalizacji procesów -TechMine_10.12.2015r.MPAnalityka w optymalizacji procesów -TechMine_10.12.2015r.MP
Analityka w optymalizacji procesów -TechMine_10.12.2015r.MP
 
Integracja danych i raportowanie w chmurze obliczeniowej Windows Azure - tran...
Integracja danych i raportowanie w chmurze obliczeniowej Windows Azure - tran...Integracja danych i raportowanie w chmurze obliczeniowej Windows Azure - tran...
Integracja danych i raportowanie w chmurze obliczeniowej Windows Azure - tran...
 
Cyfrowa transformacja. Fakty i Mity
Cyfrowa transformacja. Fakty i MityCyfrowa transformacja. Fakty i Mity
Cyfrowa transformacja. Fakty i Mity
 
REVE UP
REVE UPREVE UP
REVE UP
 
Big data w strategii marketingowej
Big data w strategii marketingowejBig data w strategii marketingowej
Big data w strategii marketingowej
 
Kupuj wartosc a nie transakcje
Kupuj wartosc a nie transakcjeKupuj wartosc a nie transakcje
Kupuj wartosc a nie transakcje
 
Clv Kogo pozyskujesz klienta czy jego transakcje
Clv Kogo pozyskujesz klienta czy jego transakcjeClv Kogo pozyskujesz klienta czy jego transakcje
Clv Kogo pozyskujesz klienta czy jego transakcje
 
Praca Codibly - Demand Response Management
Praca Codibly - Demand Response ManagementPraca Codibly - Demand Response Management
Praca Codibly - Demand Response Management
 
Talent Analytics
Talent AnalyticsTalent Analytics
Talent Analytics
 
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
 
Candidate i employee experience - zacznij je mierzyc
Candidate i employee experience - zacznij je mierzycCandidate i employee experience - zacznij je mierzyc
Candidate i employee experience - zacznij je mierzyc
 
Od Czarnoksiężnik z krainy Oz do modeli na produkcji
Od Czarnoksiężnik z krainy Oz do modeli na produkcjiOd Czarnoksiężnik z krainy Oz do modeli na produkcji
Od Czarnoksiężnik z krainy Oz do modeli na produkcji
 
Analityka biznesowa - Valery Rastyazhenko I More Bananas
Analityka biznesowa - Valery Rastyazhenko I  More BananasAnalityka biznesowa - Valery Rastyazhenko I  More Bananas
Analityka biznesowa - Valery Rastyazhenko I More Bananas
 
Strategia Data First
Strategia Data FirstStrategia Data First
Strategia Data First
 
Mity, które blokują Twoją karierę
Mity, które blokują Twoją karieręMity, które blokują Twoją karierę
Mity, które blokują Twoją karierę
 
CIO Espresso
CIO EspressoCIO Espresso
CIO Espresso
 
Transformacja cyfrowa Historia osobista
Transformacja cyfrowa Historia osobistaTransformacja cyfrowa Historia osobista
Transformacja cyfrowa Historia osobista
 
Big data i analityka w HR Marta Dobrzanska
Big data i analityka w HR Marta DobrzanskaBig data i analityka w HR Marta Dobrzanska
Big data i analityka w HR Marta Dobrzanska
 

Od Big Data do Analityki 3.0

Editor's Notes

  1. 50 lat doświadczenia w przetwarzaniu, analizowaniu i zabezpieczaniu danych Rozwiązania informatyczne dla sektora publicznego i prywatnego Usługi IT w modelu SaaS Centrum Bezpieczeństwa Danych ZETO Katowice. Doświadczenie i rozwiązania pracujące w oparciu o architekturę systemów x86, RISC i Mainframe.
  2. Nowa strategia rozwoju Wyodrębnienie działalności związanej z zaawansowaną analityką i Big Data Wykorzystanie Internetu Rzeczy Inny model tworzenia i wdrażania produktów Rozwiązania wspomagające podejmowanie decyzji biznesowych działające w czasie rzeczywistym
  3. Dużo danych z wielu źródeł, ale: Brak usystematyzowania Brak pomysłu Potencjał? Nieznany… Uzasadnienie potrzeby Eco Drivingu przez jednego z przewoźników brytyjskich. „Wyobraźmy sobie sytuację, że prawa do emisji CO2 wykupują od Państwa poszczególni przewoźnicy ………….”
  4. Skąd tyle danych, tyle systemów analitycznych a zero użytecznej wiedzy. Dwie tezy zasłyszane w rozmowach z FPL. Sprzedaż coraz to nowych urządzeń z rejestratorami być może napędza rynek ale przyczynia się także do powstawania ogromnej ilości danych, których nikt nie potrafi przekształcić w wiedzę. W czasach gdy lawinowo rośnie ilość danych i urządzeń rejestrujących, wszyscy wmawiają nam, że wraz z nowymi urządzeniami otrzymamy gratis oprogramowanie, które pozwoli nam przekształcić całość gromadzone dane w użyteczną biznesowo wiedzę Rośnie popyt na podmioty, które potrafią zamienić dane w użyteczną biznesowo informację/wiedzę.
  5. Od potrzeb klienta …… po potencjał zbudowanego rozwiązania, możliwość jego zastosowania w całości lub w częściach dla wielu branży/podmiotów. Najważniejszy element „Wspólnie z klientem” i „Wielokrotna weryfikacja”  nowe spojrzenie na formułę PoC. Projekt prowadzony jest wspólnie z Klientem w formule PoC (ang. Proof of Concept). Formuła projektu zakłada skrajną elastyczność i wielokrotne powtarzanie cyklu, na który składają się: proponowanie rozwiązań, zbieranie informacji zwrotnych, wyciąganie wniosków, wdrażanie zmian i ponowny kontakt z Klientem.
  6. Wielokrotnie poważany cykl. No i koniecznie, że z udziałem klienta. Zasadniczym warunkiem powodzenia procesu przekształcania danych w użyteczną wiedzę jest udział zlecających w fazach: - definiowania zadania, - eksperymentów, - ewaluacji wyników. Cross Industry Standard Process for Data Mining (CRISP-DM) Zgodnie ze standardem proces zgłębiania danych podzielony jest na 6 faz: 1 Zrozumienie uwarunkowań biznesowych Jest to pierwszy i zarazem kluczowy etap metodologii. Najważniejszym jest tu jasne sformułowanie celów i wymagań projektu. 2 Zrozumienie danych Etap ten składa się z dwóch podetapów: zebranie danych, ocena przydatności danych. 3 Przygotowanie danych Na przygotowanie danych składają się kolejno: wykonanie przekształceń, czyszczenie danych, usuniecie wartości skrajnych. 4 Modelowanie Kluczowe w tej fazie są: wybór i zastosowanie odpowiedniej techniki modelującej, skalowanie parametrów modelu. 5 Ewaluacja W ramach ewaluacji wykonywana jest: ocena modeli pod względem jakości i efektywności, ustalenie czy model spełnia wszystkie wymagania. 6 Wdrożenie Ostatni etap, którego celem jest wykorzystanie stworzonego modelu.
  7. Parafrazując: “Wygrywa ten, kto ma autorski, najlepszy algorytm, dopracowany model fizyczny i najwięcej danych.” by Mirosław Nowak
  8. Jedno za źródeł danych w Projekcie. Przykład.
  9. Potencjał, różnorodność źródeł danych to właśnie BigData. Strumienie Dane klienta Dane zewnętrzne Dane operatorów infrastruktury/taboru Słowniki Bazy infrastruktury Bazy systemów dziedzinowych
  10. Extract, Translate, Load ETL czyli to co ZETO Katowice robi od 50 lat. Są dane są analitycy – wynik to tylko kwestia czasu.
  11. KLUCZOWE, podstawa dobrze zasilonej warstwy analitycznej będącej podstawą wszelakich analiz i procesów dostarczania oczekiwanych wartości w oczekiwanym czasie . Narzędzie Microsoft Integration Services Power Shell
  12. Ciekawe przypadki. Potwierdzenie reguły G.. In G.. Out Garbage In, Garbage Out – tłumaczone na polski jako śmieci na wejściu — śmieci na wyjściu; maksyma przypominająca, że wyniki przetwarzania błędnych danych będą błędne nawet wtedy, gdy procedura przetwarzania była poprawna
  13. Ciekawe przypadki. Potwierdzenie reguły G.. In G.. Out Garbage In, Garbage Out – tłumaczone na polski jako śmieci na wejściu — śmieci na wyjściu; maksyma przypominająca, że wyniki przetwarzania błędnych danych będą błędne nawet wtedy, gdy procedura przetwarzania była poprawna
  14. Garbage In, Garbage Out cd.
  15. Model analityczny w oparciu o algorytm Model fizyczny do weryfikacji Asystent maszynisty Potencjał – wsłuchujemy się w klienta, jesteśmy ekspertami sami możemy proponować rozwiązania
  16. Rodzaje analityk: Analityka 1.0 – Informatyk przynosi mi raporty, na których zawartość nie mam wpływu. Wszystkie próby wpływania na ich zawartość i rodzaj prezentacji kończą się fiaskiem. Analityka 2.0 – Dostaję narzędzie typu Raport Studio. Pulpit Managera mieni się wszystkimi kolorami tęczy. Pełnia szczęścia – ale do czasu. Pojawiają się ograniczenia. „Tego nie ma w danych” – twierdzi informatyk. Analityka 3.0 – Informatyk przynosi mi raporty – tak z sentymentu o tym, że systemy wspomagania decyzji, wirtualni asystenci i inne wynalazki BigDatowe przekładają się na wymierne korzyści dla mojego biznesu.
  17. Analityka pozwala wizualizować przejazdy i je oceniać. Identyfikacja najlepszych i najgorszych przejazdów ->Platforma szkoleniowa Porównanie z optymalnym przejazdem wyznaczonym przez algorytm -> weryfikacja w modelu fizycznym -> Podpowiadanie optymalnych parametrów Wiedza o kosztach – planowanie spedycji i wyceny Monitoring przejazdów w Centrum dowodzenia Utrzymanie – predykcja awarii pojazdów i planowanie magazynu części zamiennych
  18. Dostęp do danych i zaufanie Kompetencje analityczne Ścisła współpraca z Klientem – zaangażowanie! Niestandardowe podejście – uciekamy od schematów