1. Niniejszy program został sfinansowany
przy wsparciu Komisji Europejskiej
Moduł 1:
Wprowadzenie
do tematyki Big
Data
2. Moduł 1:
Wprowadzenie do
tematyki Big Data
PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
Celem niniejszego modułu jest przedstawienie
podstawowych informacji na temat dużych zbiorów
danych - big data.
Po realizacji niniejszego modułu:
- Zrozumiesz coraz istotniejszą rolę big data
- Poznasz kluczowe terminy dotyczące big data oraz
smart data
- Dowiesz się, w jaki sposób big data można
przekształcić w smart data
- Będziesz w stanie stosować kluczowe terminy
dotyczące big data
Czas trwania modułu: około 1 - 2 godzin
3. Coraz istotniejsza rola danych
w VET i przedsiębiorczości1
– Krótka historia danych
– Czym jest Big Data?
– Źródła danych
– Znaczenie Big Data
V danych
– Przekształcanie big data w
wartość
– Aplikacje smart data
– Jak zacząć być Smart?
– Wyzwania związane z big data
W jaki sposób big data stają
się smart data?
– W jaki sposób Target wykorzystał moc big
data
Studium przypadku
2
3
4
Niniejszy program został sfinansowany przy wsparciu Komisji Europejskiej Autor ponosi
wyłączną odpowiedzialność za niniejszą publikację, a Komisja nie ponosi odpowiedzialności
za jakiekolwiek wykorzystanie informacji w niej zawartych.
4. CORAZ WIĘKSZA ROLA
DANYCH W VET I
PRZEDSIĘBIORSTWIE
PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
1. Czym jest Big Data?
2. Klasyfikacja danych
3. Źródła danych
4. Znaczenie Big Data
5. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
Big Data stanowi
podstawę wszystkich
megatrendów, które
dzieją się dzisiaj, od
społecznościowych po
mobilne i chmurowe,
aż po gry.
Chris Lynch
6. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
„Dane o bardzo dużych
rozmiarach, zazwyczaj
do tego stopnia, że
manipulowanie jak i
zarządzanie nimi
stanowi poważne
wyzwanie logistyczne.”
Oxford English Dictionary, 2013
CZYM JEST BIG DATA?
Są pewne rzeczy, które są tak duże, że ich
następstwa dotyczą każdego, czy tego chcemy, czy
nie.
Big data to jedna z tych rzeczy, która całkowicie
zmienia sposób prowadzenia biznesu, jak i wpływa
na większość pozostałych obszarów naszego życia.
Podstawową ideą wyrażenia „Big Data” jest to, że
wszystko, co robimy, coraz częściej pozostawia ślad
cyfrowy, który możemy wykorzystać i
przeanalizować.
Big Data odnosi się zatem do naszej możliwości
korzystania z coraz większej ilości danych.
7. KLASYFIKACJA DANYCH
„Dane” definiuje się jako „liczby, znaki lub symbole, na których operacje są wykonywane przez komputer, które mogą być
przechowywane i przesyłane w postaci sygnałów elektrycznych i rejestrowane na magnetycznym, optycznym lub mechanicznym
nośniku zapisu”, jak pokazałoby szybkie wyszukiwanie google.
„Big data” odnosi się do obfitych ilości danych, które są:
- zbyt duże do przetworzenia
- zbyt obfite do analizy za pomocą tradycyjnych narzędzi
- nie są przechowywane lub zarządzane w sposób wydajny.
W analizie big data istnieje jednak ogromny potencjał.
Właściwe zarządzanie i analiza danych może pomóc firmom w podejmowaniu lepszych decyzji na podstawie statystyki oraz
zainteresowań użytkowników, tym samym przyczyniając się do ich rozwoju. Niektóre firmy opracowały nawet nowe produkty i usługi
w oparciu o opinie otrzymane dzięki możliwościom analitycznym Big Data.
Klasyfikacja jest niezbędna do badania każdego zagadnienia. Tak więc Big Data dzieli się na trzy główne typy, którymi są:
DANE
STRUKTURALNE
DANE
NIEUSTRUKTURYZOWANE
DANE
PÓŁ-
STRUKTURALNE
1 2 3
8. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
DANE
STRUKTURALNE
1
Dane strukturalne [ustrukturyzowane] to termin stosowany w odniesieniu do danych, które są już
przechowywane w bazach danych w uporządkowany sposób. Stanowią około 20% wszystkich istniejących
danych.
Istnieją dwa źródła danych strukturalnych - maszyny oraz ludzie.
Wszystkie dane otrzymane z czujników, dzienników internetowych i systemów finansowych są klasyfikowane w
postaci danych generowanych przez maszynę. Obejmują one, przykładowo, urządzenia medyczne, dane GPS,
dane dotyczące statystyk użytkowania przechwycone przez serwery i aplikacje oraz ogromną ilość danych z
platform transakcyjnych.
Ustrukturyzowane dane generowane przez człowieka obejmują głównie wszystkie dane, które człowiek
wprowadza do komputera, takie jak jego imię i inne dane osobowe. W momencie, gdy ktoś kliknie łącze w
Internecie lub nawet wykona jakiś ruch w grze, tworzone są dane.
Przykład danych strukturalnych
Tabela „Pracownik” w bazie
danych jest przykładem
danych strukturalnych.
Nr id.
pracownika
Imię_i_nazwisko
_pracownika
Płeć Dział Wynagrodzenie_
w_Euro
2365 Rajesh Kulkarni Mężczyzna Finanse 65000
3398 Pratibha Joshi Kobieta Administrator 65000
7465 Shushil Roy Mężczyzna Administrator 50000
7500 Shubhojit Das Mężczyzna Finanse 50000
7699 Priya Sane Kobieta Finanse 55000
9. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
DANE
NIEUSTRUKTURYZOWANE
2 Dane nieustrukturyzowane są przeciwieństwem danych strukturalnych (ustrukturyzowanych) - nie są
przechowywane w formie jakiegokolwiek wyraźnego formatu.
Około 80% wszystkich danych stanowią duże dane nieustrukturyzowane.
Większość danych, jakie napotykamy należy właśnie do tej kategorii - i do niedawna niewiele można było
w tej sprawie zrobić - co najwyżej mogły być przechowywane lub analizowane ręcznie.
Dane nieustrukturyzowane są również klasyfikowane na podstawie ich źródła, jako generowane przez
maszynę lub generowane przez człowieka. Dane generowane maszynowo obejmują wszystkie obrazy
satelitarne, dane naukowe z różnych eksperymentów i dane radarowe przechwycone przez różne rodzaje
technologii.
Przykład danych nieustrukturyzowanych
Dane wyjściowe z wyszukiwania
„Google Search”.
Dane nieustrukturyzowane generowane przez
człowieka znajdują się w ogromnych ilościach w
Internecie w postaci danych pochodzących z mediów
społecznościowych, telefonów komórkowych oraz
treści stron internetowych. Oznacza to, że zdjęcia,
które umieszczamy na Facebooku czy Instagramie,
filmy, które oglądamy na YouTube, a nawet wysyłane
przez nas wiadomości tekstowe, tworzą gigantyczną
stertę, którą stanowią dane nieustrukturyzowane.
10. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
DANE
PÓŁ-
STRUKTURALNE
3 Dane półstrukturalne na pierwszy rzut oka wydają się być nieustrukturyzowane więc mogą być trudne do
analizowania.
Dane półstrukturalne to dane, które nie mają tradycyjnego formatu bazy danych, jak dane
strukturalne, ale posiadają pewne właściwości organizacyjne, które ułatwiają ich przetwarzanie.
Przykładowo, dokumenty NoSQL są uważane za częściowo ustrukturyzowane, ponieważ zawierają słowa
kluczowe, które można łatwo wykorzystać do przetwarzania dokumentu.
Wiadomość e-mail jest jednym z przykładów danych częściowo ustrukturyzowanych. Zawiera jasno
zdefiniowane pola danych w postaci nagłówka, takie jak nadawca itp., podczas
gdy sama treść wiadomości jest nieustrukturyzowana.
Chcąc dowiedzieć się kto wysyła e-mail do kogo i kiedy (informacje zawarte w nagłówku), dobrym
wyborem może okazać się relacyjna baza danych. Ale jeśli jesteś bardziej zainteresowany treścią
wiadomości, narzędzia do big data, takie jak przetwarzanie języka naturalnego, będą lepszym
rozwiązaniem.
Przykład danych
półstrukturalnych
Dane osobowe przechowywane w pliku
XML.
11. ŹRÓDŁA DANYCH
Dane maszynowe składają się z informacji generowanych z urządzeń przemysłowych,
danych w czasie rzeczywistym z czujników, które śledzą części i monitorują maszyny (często
nazywane także jako Internet rzeczy), a nawet dzienników internetowych, które śledzą
zachowania użytkowników w Internecie. W arcplan client CERN, największym centrum badań
fizyki cząstek na świecie, Wielki Zderzacz Hadronów (LHC) podczas eksperymentów generuje 40
terabajtów danych na sekundę.
Pod względem danych transakcyjnych, sieci sklepów, a nawet firmy B2B
mogą regularnie generować mnóstwo danych, biorąc pod uwagę, że ich transakcje składają się
z jednego lub wielu produktów, identyfikatorów produktów, cen, informacji o płatnościach,
danych producenta i dystrybutora, jak i wielu innych.
Dane z mediów społecznościowych dostarczają firmom niezwykłych
informacji na temat zachowań konsumentów oraz ich preferencji, które można zintegrować z
danymi CRM do potrzeb analizy, w postaci 230 milionów tweetów publikowanych na Twitterze
dziennie, 2,7 miliardów „lajków” i komentarzy dodawanych codziennie na Facebooku oraz 60
godzin wideo ładowanych do YouTube co minutę (to właśnie mieliśmy na myśli mówiąc o
prędkości danych).
PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
12. Użytkownicy
WhatsApp
udostępniają
347 222
zdjęć.
PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
CO MINUTĘ,
KAŻDEGO
DNIA
Użytkownicy
poczty e-mail
wysyłają
204 000 000
wiadomości
Użytkownicy
YouTube
przesyłają
4 320
minut nowych
filmów.
Google otrzymuje
ponad
4 000 000
zapytań.
Użytkownicy
Facebooka
udostępniają
2 460 000
postów.
Użytkownicy
Twittera tweetują
277 000
razy.
Amazon posiada
obrót w
wysokości
83 000$
w sprzedaży
online.
Posty
użytkowników
portalu
Instagram
216 000
nowych zdjęć.
Przykłady danych mediów
społecznościowych
13. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
Dane maszynowe
Dane maszynowe są wszędzie. Składa się na nie po prostu wszystko, od samolotów i wind, po sygnalizatory
świetlne i urządzenia monitorujące do ćwiczeń fitness.
Obecnie dane maszynowe zyskały na znaczeniu, ponieważ wzrosło wykorzystanie Internetu rzeczy, Hadoop oraz
innych technologii zarządzania big data.
Dzienniki aplikacji, serwerów i procesów biznesowych, zapisy szczegółów połączeń telefonicznych oraz dane z
czujników są głównymi przykładami danych maszynowych. Dane internetowe dotyczące strumienia kliknięć i
dzienniki aktywności na stronie są również istotnym czynnikiem w kwestii danych maszynowych.
Wykorzystanie do analizy zarówno danych maszynowych jak i innych typów danych biznesowych przedsiębiorstwa
ma szansę zapewnić zupełnie nową perspektywę i wgląd w działania i operacje biznesowe. Dane generowane
maszynowo stanowią także podstawę istnienia Internetu przedmiotów (IoT).
Internet przedmiotów (IoT)
Mówiąc najprościej, IoT to koncepcja połączenia dowolnego urządzenia z włącznikiem i wyłącznikiem do Internetu
(i/lub do siebie nawzajem). Koncepcja ta obejmuje szereg urządzeń, od telefonów komórkowych, ekspresów do kawy,
pralek, słuchawek, lamp, urządzeń do noszenia na ciele, i prawie wszystkiego, co tylko można wymyślić. Dotyczy to
również komponentów maszyn, na przykład silnika odrzutowego samolotu lub wiertnicy platformy wiertniczej.
14. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
Dane transakcyjne
Dane transakcyjne to informacje uzyskane bezpośrednio w wyniku transakcji. W przeciwieństwie
do pozostałych rodzajów danych, dane transakcyjne posiadają wymiar czasu, co oznacza, że są one
aktualne i z czasem stają się mniej istotne.
Nie są one przedmiotem transakcji, jak zakupiony produkt lub tożsamość klienta, są to raczej dane
referencyjne opisujące czas, miejsce, ceny, metody płatności, wartości rabatów i ilości związane z tą
konkretną transakcją, zwykle w punkcie sprzedaży.
Zakupy Zwroty Faktury Płatności Kredyty
Darowizny Transakcje Dywidendy Kontrakty Odsetki
Lista płac Pożyczki Rezerwacje Zapisy Subskrypcje
Przykłady danych transakcyjnych
15. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
ZNACZENIE BIG DATA
Znaczenie big data nie zależy od tego, ile danych ma firma, ale jak firma wykorzystuje zebrane dane. Każda firma
wykorzystuje dane na swój własny sposób; im bardziej efektywnie dana firma wykorzystuje swoje dane, tym większy jest jej
potencjał rozwojowy. Przedsiębiorstwo może pobierać dane z dowolnego źródła i analizować je, w poszukiwaniu
odpowiedzi, które umożliwią jej:
Redukcję kosztów
Niektóre narzędzia Big Data mogą przynieść przedsiębiorstwom wymierne korzyści w
zakresie kosztów, w sytuacji gdy mają być przechowywane duże ilości danych. Narzędzia te
pomagają również w identyfikacji bardziej efektywnych sposobów prowadzenia
działalności.
Redukcja czasu
Duża szybkość narzędzi i analityka w pamięci pozwala łatwo zidentyfikować nowe źródła
danych, co pomaga firmom analizować dane natychmiast i podejmować szybkie decyzje w
oparciu o pozyskane informacje.
Rozwój nowych
produktów
Dzięki rozpoznaniu trendów w zakresie potrzeb oraz satysfakcji klientów dzięki narzędziom
z obszaru Analytics można tworzyć produkty zgodne z analizą potrzeb klientów.
Zrozumienie
warunków
rynkowych
Analizując big data, można lepiej zrozumieć aktualne warunki rynkowe. Przykładowo,
analizując zachowania nabywcze klientów, dana firma może dowiedzieć się, które produkty
są sprzedawane najczęściej i wytwarzać produkty zgodnie z tym trendem.
Kontrola reputacji
online
Narzędzia big data mogą analizować nastroje. Dzięki nim istnieje możliwość uzyskania
informacji zwrotnej klientów dotyczącej Twojej firmy. Jeśli chcesz monitorować i umacniać
obecność swojej firmy w Internecie, narzędzia big data mogą w tym znacznie pomóc.
17. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
5 V DANYCH
Wielkość
Prędkość
Różnorodność
Prawdziwość
Wartość
90% danych na świecie zostało
stworzonych w ciągu ostatnich 2 lat.
To dosłownie prędkość światła! Ilość
danych podwaja się co 40 miesięcy.
Dane strukturalne, półstrukturalne i
nieustrukturyzowane.
Ze względu na anonimowość Internetu lub
potencjalnie fałszywe tożsamości,
wiarygodność danych jest często
kwestionowana.
Samo posiadanie dostępu do dużych
danych nie stanowi zalety, chyba że
możemy przekształcić je w wartość.
Wielkość
generowanych
danych.Szybkość, z jaką
dane są
generowane i
agregowane.
Różne typy danych.
Wiarygodność
danych pod
względem
dokładności i ich
jakości.Wartość
ekonomiczna
danych.
Big Data działa bardzo sprawnie, pokazując nam, co się stało, ale nie dlaczego tak się stało lub co z tym
zrobić. 5 V reprezentuje specyficzne cechy i właściwości, które mogą pomóc nam zrozumieć zarówno
wyzwania, jak i zalety inicjatyw dotyczących big data.
18. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
WIELKOŚĆ
Wielkość odnosi się do ogromnych ilości danych,
generowanych co sekundę.
Wystarczy pomyśleć tylko o wszystkich wiadomościach
e-mail, twittach, zdjęciach, klipach wideo, danych z
czujników itp., które produkujemy i udostępniamy co
sekundę.
Na samym Facebooku wysyłamy 10 miliardów
wiadomości dziennie, klikamy przycisk „Lubię to” 4,5
miliarda razy i udostępniamy 350 milionów nowych
zdjęć każdego dnia.
To sprawia, że zestawy danych są zbyt duże, aby je
przechowywać i analizować przy użyciu tradycyjnej
technologii baz danych. Dzięki technologii Big Data
możemy teraz przechowywać i wykorzystywać te
zestawy danych za pomocą systemów rozproszonych,
gdzie części danych są przechowywane w różnych
miejscach i łączone przez oprogramowanie.
19. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
PRĘDKOŚĆ
Prędkość odnosi się do prędkości, z jaką
generowane są nowe dane oraz
szybkości, z jaką te dane się poruszają.
Wystarczy pomyśleć, że wiadomości w
mediach społecznościowych stają się
„treściami wirusowymi” w ciągu kilku sekund,
o szybkości, z jaką transakcje kartą kredytową
są sprawdzane pod kątem nieuczciwych
działań, lub milisekund, jakich potrzebuje
system handlowy, aby analizować sieci
społecznościowe, aby odbierać sygnały, które
powodują decyzje o kupnie lub sprzedaży akcji.
Technologia Big Data pozwala nam obecnie
analizować dane podczas ich generowania, bez
konieczności umieszczania ich w bazach
danych.
20. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
RÓŻNORODNOŚĆ
Różnorodność odnosi się do różnych
typów danych, które możemy teraz
wykorzystać. W przeszłości
koncentrowaliśmy się na danych
strukturalnych, które pasowały do tabel lub
relacyjnych baz danych.
Pomyślmy o zdjęciach, sekwencjach wideo lub
aktualizacjach mediów społecznościowych.
Dzięki technologii Big Data możemy teraz
wykorzystywać różne typy danych, w tym
wiadomości, rozmowy w mediach
społecznościowych, zdjęcia, dane z czujników,
nagrania wideo lub nagrania głosowe, a także
połączyć je w bardziej tradycyjne,
ustrukturyzowane dane.
21. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
PRAWDZIWOŚĆ
Prawdziwość odnosi się do wiarygodności
danych.
Przez wzgląd na wiele form big data, jakość i
dokładność stały się trudniejsze w obsłudze.
Wystarczy pomyśleć o postach na Twitterze
z hashami, skrótami, literami i mową
potoczną, a także o wiarygodności i
dokładności treści.
Big data oraz technologia analytics pozwala
nam teraz pracować z tego typu danymi.
Wielkość często nadrabia brak jakości lub
dokładności.
22. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
WARTOŚĆ
Wartość: Dobrze jest posiadać dostęp do
big data, jednakże jeśli nie mamy możliwości
przekształcenia go w wartość, jest on
bezużyteczny. Można więc spokojnie
stwierdzić, że „wartość” jest
najważniejszym V dla Big Data. Ważne jest,
aby firmy dokonywały analizy przydatności
biznesowej w przypadku wszelkich prób
gromadzenia i wykorzystywania danych typu
big data. Łatwo jest wpaść w pułapkę i
rozpocząć inicjatywy na polu big data bez
jasnego zrozumienia kosztów i korzyści.
Dane big data mogą stanowić wartość w niemal każdej dziedzinie
biznesu lub funkcjonowania społeczeństwa:
Pomagają przedsiębiorstwom lepiej zrozumieć i obsługiwać klientów:
Przykłady obejmują rekomendacje na portalach Amazon lub Netflix.
Umożliwiają firmom optymalizację ich procesów: Uber jest w stanie
przewidzieć popyt, dynamicznie wyceniać przejazdy i wysłać do klienta
najbliższego mu kierowcę.
Poprawiają funkcjonowanie naszej opieki zdrowotnej: Agencje rządowe
mogą obecnie przewidywać epidemie grypy i śledzić je w czasie rzeczywistym,
a firmy farmaceutyczne są w stanie wykorzystywać analizy dużych zbiorów
danych do szybkiego opracowywania leków.
Pomagają nam w poprawie bezpieczeństwa: Organy rządowe, jak i organy
ścigania wykorzystują big data do udaremniania ataków terrorystycznych i
wykrywania cyber przestępczości.
Umożliwiają gwiazdom sportu na zwiększenie ich wydajności: Czujniki w
piłkach, kamery na boisku i lokalizatory GPS na ubraniach pozwalają
sportowcom analizować i ulepszać swoje osiągnięcia.
23. W JAKI SPOSÓB BIG DATA
STAJĄ SIĘ SMART DATA?
PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
1. Przekształcanie big data w wartość
2. Aplikacje smart data
3. Jak zacząć być Smart?
4. Wyzwania związane z big data
24. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
APLIKACJE SMART DATA
• Wykrywanie
nadużyć/Zapobieganie
• Analiza nastrojów klientów
• Wycena w czasie
rzeczywistym
• Lokowanie produktu
• Reklama targetowana
precyzyjnie
(mikrotargeting)
• Monitorowanie wizyt
pacjentów
• Opieka nad pacjentem i
bezpieczeństwo
• Zmniejszenie ilości pacjentów
powracających do leczenia
• Inteligentna analiza strumienia
licznika
• Proaktywna naprawa sprzętu
• Dopasowanie mocy i zużycia
• Diagnostyka
komórkowych stacji
bazowych
• Przydział
przepustowości
• Konserwacja proaktywna
• Skrócenie czasu
wprowadzania na rynek
• Planowanie dostaw
• Zwiększenie jakości
produktu
• Wykrywanie i
zapobieganie
włamaniom do sieci
• Wykrywanie epidemii
chorób
• Wykrywanie i
monitorowanie
niebezpiecznej jazdy
• Planowanie tras i czasu
przejazdu transportu
publicznego
USŁUGI FINANSOWE
HANDEL
DETALICZNY
USŁUGI
TELEKOMUNIKACYJNE PRODUKCJA
OPIEKA ZDROWOTNA MEDIA, OLEJ I GAZ SEKTOR PUBLICZNY TRANSPORT
Każda firma na świecie potrzebuje danych do rozwoju.
Dzięki danym wiemy kim są nasi klienci i jak działają, co może pomóc w
uzyskaniu nowych informacji oraz stworzenia innowacji, ale najpierw
konieczne jest ustalenie odpowiedniego obszaru zainteresowania.
25. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
JAK ZACZĄĆ BYĆ SMART?
Mimo faktu, iż narzędzia do analizy i wizualizacji danych przeszły długą drogę w ciągu ostatniej
dekady, analiza dużych zbiorów danych - big data - nadal jest zależna od interwencji człowieka i ich
koordynacji. Musimy wiedzieć jak zadawać właściwe pytania, jak wyeliminować własne
uprzedzenia i jak tworzyć praktyczne spostrzeżenia, a nie podstawowe wnioski.
1. Sprawdź
swoje dane.
•Jakie dane
posiadasz?
•Jak to jest
używane?
•Czy masz
doświadczenie w
zarządzaniu
danymi?
2. Zadaj
właściwe
pytania.
• Jakie dane
posiadasz i jak
są one
wykorzystywan
e?
• Czy jesteś
wystarczająco
konkretny?
3. Wyciągnij
wnioski.
•Czy ekspert mógłby
pomóc ci w
sprawdzeniu
wyników?
•Czy możesz
potwierdzić swoje
hipotezy?
•Jakich
dodatkowych
danych
potrzebujesz?
26. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
WYZWANIA ZWIĄZANE Z BIG DATA
BRAK
ODPOWIEDNIEJ
KADRY
Aby pomyślnie wdrożyć
projekt w obszarze Big Data,
niezbędny jest
wykwalifikowany zespół
programistów, naukowców
zajmujących się danymi i
analityków, którzy posiadają
również wystarczającą wiedzę
na temat domen, aby
zidentyfikować cenne
informacje.
Łatwo jest wpaść w pułapkę szumu medialnego i możliwości big data. Jednakże jednym z powodów z powodu którego
big data są tak niedostatecznie wykorzystywane, jest fakt, że Big Data i ich technologia stanowią nadal wiele wyzwań.
Jedna z ankiet wykazała, że 55% projektów big data nigdy nie zostało ukończonych. Jakie problemy występują w
przypadku big data?
SKALOWALNOŚĆ
Wiele organizacji nie bierze
pod uwagę tego, jak szybko
projekt Big Data może się
rozwijać i ewoluować.
Obciążenia związane z
dużymi ilościami danych są
również częste, co utrudnia
przydzielanie odpowiednich
zasobów.
UŻYTECZNE
WNIOSKI
Kluczowym wyzwaniem dla
zespołów zajmujących się
technologią danych jest
określenie jasnego celu
biznesowego i odpowiednich
źródeł danych do
gromadzenia i analizowania
dążąc do osiągnięcia tegoż
właśnie celu.
JAKOŚĆ
DANYCH
Najczęstsze przyczyny
brudnych danych
(dirty data) to: błędy
wpisów użytkownika,
zduplikowane dane i
nieprawidłowe
połączenie danych.
BEZPIECZEŃSTWO
Konkretne wyzwania obejmują:
- Uwierzytelnianie użytkownika dla
każdego zespołu i członka zespołu
uzyskujących dostęp do danych
- Ograniczanie dostępu w zależności
od potrzeb użytkownika
- Rejestrowanie historii dostępu do
danych i spełnianie innych
przepisów dotyczących zgodności
- właściwe wykorzystanie
szyfrowania danych w trakcie
transportu i odpoczynku
ZARZĄDZANIE
KOSZTAMI
Firmy realizujące
projekty Big Data muszą
pamiętać o kosztach
szkoleń, utrzymania i
rozbudowy
27. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
STUDIUM PRZYPADKU:
W jaki sposób AG wykorzystało moc Big Data
SYTUACJA
Za każdym razem, gdy robisz
zakupy, udostępniasz sieciom
sprzedaży szczegółowe informacje
na temat swoich wzorców
konsumpcji. Wiele z tych sklepów
bada te szczegóły, aby dowiedzieć
się, co lubisz, czego potrzebujesz, a
które kupony najprawdopodobniej
cię uszczęśliwią. AG - największy na
świecie sprzedawca branży
golfowej w Europie, zorientował
się, jak dzięki danym, utorować
sobie drogę do portfeli przyszłych
emerytów, zanim faktycznie przejdą
na emeryturę.
ŹRÓDŁO BIG DATA AG
AG przypisuje każdemu klientowi
numer identyfikacyjny gościa,
powiązany z jego kartą kredytową,
imieniem lub adresem e-mail, który
staje się wiadrem, które przechowuje
historię wszystkiego, co kupili klienci,
jak i wszelkie informacje
demograficzne, które AG od nich
zebrało lub kupiło z innych źródeł.
Korzystając z tych danych, ich analityk
spojrzał na historyczne dane
dotyczące zakupów wszystkich
mężczyzn, którzy zarejestrowali swoje
dane w przeszłości.
WIELKIE WNIOSKI Z WIELKICH
DANYCH
Analityk przeprowadził test po teście,
analizując dane, i wkrótce pojawiły się
przydatne wzory. Na przykład rękawiczki.
Wielu mężczyzn kupuje rękawice golfowe,
ale jeden ze współpracowników zauważył,
że mężczyźni w rejestrze golfowym
kupowali mniejsze artykuły golfowe,
zwłaszcza rękawice golfowe, w ciągu
sześciu miesięcy poprzedzających ich
przejście na emeryturę. Inny analityk
zauważył, że w tym 6-miesięcznym oknie
częstotliwość wizyt w sklepach wzrosła.
28. PRZYJAZNA GOSPODARKA BEZ WZGLĘDU NA WIEK | MOŻLIWOŚCI DLA MŚP
STUDIUM PRZYPADKU:
W jaki sposób AG wykorzystało moc Big
Data
REAKCJA
Tak więc AG zaczęło wysyłać kupony
na zestawy do gry w golfa, zwłaszcza
droższe zestawy i komplety. Duhigg
dzieli się anegdotą - tak dobrą, że
brzmi na zmyśloną - która pokazuje,
jak niesamowicie trafne może być
targetowanie. Zirytowany
mężczyzna udał się do sklepu pod
Milton Keynes, domagając się
rozmowy z kierownikiem.
WYZWANIE
Co dość szybko odkryło AG, to
przekonanie ludzi, że firma wie o
ich wcześniejszym przejściu na
emeryturę.
ROZWIĄZANIE
AG musiało bardziej podstępnie podchodzić do
wysyłania kuponów. Firma może tworzyć
spersonalizowane broszury; zamiast wysyłać
mężczyznom w wieku emerytalnym kupony
wyłącznie na drogie zestawy golfowe,
rozpowszechniają je bardziej subtelnie:
Dowiedzieli się, że dopóki ktoś nie odkryje, że
był szpiegowany, użyje kuponów. Po prostu
zakłada, że wszyscy inni na jego ulicy otrzymali
tę samą ofertę.