SlideShare a Scribd company logo
SIECI NEURONOWE
WPROWADZENIE: TEORIA I PRAKTYKA
AGENDA SPOTKANIA
2
01 PERCEPTRON I SIEĆ PERCEPTRONOWA
02 DZIAŁANIE I UCZENIE SIECI NEURONOWEJ
03 SIECI W PRAKTYCE
04 PROBLEM DANYCH WEJŚCIOWYCH
05 ZASTOSOWANIE
06 WYDAJNOŚĆ I SKALOWALNOŚĆ
07 PROJEKTY REALIZOWANE W TUATARA
PERCEPTRON01
3
y =
0 𝑑𝑙𝑎
𝑖=1
𝑛
𝑤𝑖 𝑥𝑖 ≤ 𝑏
1 𝑑𝑙𝑎
𝑖=1
𝑛
𝑤𝑖 𝑥𝑖 > 𝑏
y
W2
b
xn
x2
x1
…
W1
Wn
KLASYFIKACJA ZBIORU01
4
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
0 0.1 0.2 0.3 0.4 0.5 0.6
y
W2
b
x2
x1
W1
SIEĆ PERCEPTRONOWA01
5
𝑤11
1
𝑤22
1
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8
𝑏1
1
𝑥1
𝑥2
𝑦
𝑏2
1
𝑏1
2
UCZENIE SIECI NEURONOWEJ02
6
1. Przygotowanie danych uczących w postaci zbioru wektorów cech wraz z ich klasyfikacją.
2. Znalezienie takich parametrów w i t dla każdego neuronu w sieci, aby uzyskać
jak najlepszą klasyfikację (jak to zrobić?).
• Jeden ze sposobów to metoda gradientu prostego.
1. Wybieramy losowe parametry początkowe w i t.
2. Klasyfikujemy przy ich pomocy zbiór wejściowy.
3. Wprowadzamy poprawki do w i t w zależności od popełnionych błędów.
4. Powtarzamy aż do uzyskania zadowalających wyników.
SPOSOBY UCZENIA02
7
Znany zbiór uczący
wraz z klasyfikacją
Proponowanie klasyfikacji
na bazie zbioru cech
Uczenie nadzorowane
Klasyfikacja danych wejściowych
z jednoczesnym „douczaniem” sieci
Uczenie przez wzmacnianie
Autoenkodery
Poprawianie jakości obrazu
Sieć Kohonena
Klasteryzjacja
Uczenie bez nadzoru
TENSORFLOW03
8
1. Otwarto-źródłowa biblioteka dla języka Python do obliczeń
numerycznych przy wykorzystaniu grafów przepływu
2. Elastyczna na tyle aby umożliwić zastosowanie
w wielu dziedzinach badań
3. W szczególności, wspiera budowanie sieci neuronowych.
4. Wsparcie GPU przy użyciu CUDA
KERAS03
9
1. Wysokopoziomowa biblioteka dla języka Python
służąca do budowania sieci neuronowych.
2. Wykorzystuje jeden z popularnych niskopoziomowych
API – TensorFlow, CNTK, Theano.
3. Szybkie prototypowanie rozwiązań.
4. Ograniczenia pod względem możliwości
(w porównaniu do TensorFlow).
BAZA MNIST04
10
1. Baza MNIST to zbiór odręcznie pisanych cyfr.
2. Zbiór 60 tysięcy obrazów o wymiarach 28 na 28 pikseli.
BAZA MNIST04
11
0,00
0,45
0,98
0,87
0,86
0,82
0,76
0,00
0,00
…
…
xn
x2
x1
NORMALIZACJA
PRZYGOTOWANIE DANYCH WEJŚCIOWYCH04
12
0,5121
0,6422
0,7231
0,2351
-0,1842
-0,4612
www.g***le.pl
www.ins***ram.com
www.ny***es.com
www.i**b.com
www.re***rs.com
0,96
0,00
0,62
0,21
0,74
0,00
…
xn
x2
x1
…
xn
x2
x1
PRZYGOTOWANIE DANYCH WEJŚCIOWYCH04
13
1. Aby rozwiązać pewien problem klasyfikacji przy pomocy sieci neuronowej
potrzeba zastanowić się nad reprezentacją danych wejściowych.
2. Dane wejściowe do sieci neuronowej muszą być reprezentowalne za pomocą wektora liczb (cech).
3. W przypadku obrazu możemy to osiągnąć przez zamianę obrazu na odcienie czerni i bieli.
4. Wykorzystanie jednego piksela jako wejścia do jednego neuronu bardzo szybko okazuje się zawodne
(rozdzielczość 420x320 to już 134400 pikseli!).
5. Dźwięk może być reprezentowany jako szereg czasowy.
6. Dla danej osoby można przyporządkować wektor określający częstość wchodzenia na daną stronę.
7. Cechy podawane do sieci neuronowej powinny być znormalizowane.
Nie powinno być sytuacji, że na jednej pozycji w wektorze wartości odbiegają od pozostałych.
8. Odpowiednia liczba danych wejściowych (dziesiątki tysięcy lub więcej).
9. Odpowiednia równowaga pomiędzy reprezentantami poszczególnych klas.
PROBLEMY KLASYFIKACJI05
14
1. Analiza dźwięku:
a) Rozpoznawanie osób.
b) Identyfikowanie sentymentu.
2. Analiza obrazu:
a) Identyfikowanie nie pożądanych zdjęć – filtr NSFW Yahoo.
b) Wykrywanie i unikanie zagrożeń podczas lotu dronem – DJI.
c) Wspomaganie kierowcy samochodu – Autopilot Tesli.
3. Analiza szeregów czasowych:
a) Identyfikacja anomalii na podstawie danych sensorycznych.
b) Wykrywanie oszustw na podstawie wzorców zachowania.
c) Rekomendacje utworów muzycznych czy wideo – eksperyment Spotify, rekomendacje Netflix, YouTube.
4. Analiza danych:
a) Diagnostyka medyczna.
b) Wykrywanie złośliwego oprogramowania – Deep Instinct.
c) Predykcja następnych instrukcji lub potrzebnych danych – Neural Net Prediction i Smart Pre-Fetch AMD.
d) Gra w go/szachy/starcrafta – Deep Mind Google.
PLATFORMA PRZYKŁADÓW/SEK WYDAJNOŚĆ/$
2x GTX 1080 TI 12486.5 7.80
GTX 1080 1780.0 2.19
GTX 1070 1733.1 3.85
2x Geforce TitanX 796.7 0.38
1x Geforce TitanX 550.1 0.53
I7-3770K & GTX 970 641.4 1.01
Xeon E5-2670 + 1 GPU 325.2 0.12
Xeon E5-2670 + 4 GPU 337.9 0.06
Tesla K40 350.0 0.16
SZYBKOŚĆ UCZENIA06
15
UCZENIE ROZPROSZONE06
16
1. Serwery klastra współdzielą parametry modelu,
wspólnie wypracowując poprawni bazując
na różnych danych.
2. Serwery klastra mają własne parametry modelu
i niezależną pętlę uczącą. Parametry modelu
są jedynie synchronizowane do PS.
PARAMETER SERVER
MODEL REPLICAS
DATA SHARDS
TENSORFLOW ON SPARK06
17
SPARK DRIVER
Spark Executor
TensorFlow Alg
TensorFlow Core
gRPC RDMA
Spark Executor
TensorFlow Alg
TensorFlow Core
gRPC RDMA
Spark Executor
TensorFlow Alg
TensorFlow Core
gRPC RDMA
Spark Executor
Parameter Server
TrensorFlow Core
gRPC RDMA
Data Set on HDFS ect.
DISTRIBUTED SERVING06
18
DATA LEARNER MODEL 2
CONTINUOUS TRANING PIPELINE SERVING
MODEL 1 MODEL 2 MODEL 1 TENSORFLOW SERVING
CLIENTS
Response
Request
SIECI NEURONOWE06
19
1. Zagadnienia przerabiane w tej prezentacji to
tylko wstęp do szerokiej dziedziny sieci
neuronowych.
Źródło: http://www.asimovinstitute.org/neural-network-zoo/
07
20
PROJEKTY REALIZOWANE W TUATARA
SYSTEM ANTI-PIRACY
SYSTEM ANTI-PIRACY
Crawlery Analiza treści oraz video Prowadzenie sprawy
Przeszukiwanie
internetu oraz sieci
społecznościowych
Automatyczna kategoryzacja treści
ze wsparciem algorytmów
uczenia maszynowego
Automatyzacja procesu blokowania
nielegalnych treści
oraz prowadzenia spraw
02 0301
PIŁKA NOŻNA SIATKÓWKA INNE – POPRAWNIE ODRZUCONE
07
21
PREZENTACJA WYNIKÓW
PREZENTACJA WYNIKÓW
22
ODRZUCONE OGÓLNA KLASYFIKACJAJAKO SPORT
07
22
PREZENTACJA WYNIKÓW
PREZENTACJA WYNIKÓW
22
Enhanced
Customer
Profile Store
on Hadoop
Real-Time
Sentiment
Analysis using
custom trained
model
Real-Time
Sentiment
Analysis using
custom trained
model
Custom Sentiment
Analysis model
training using
Tensorflow library
Custom Emotion
Analysis model
training using
Tensorflow library
Custom Named
Entity Recognition
model training using
Tensorflow library
Real-Time
Sentiment
Analysis using
custom trained
model
Reporting, BI
and Campaign
Management
Systems
* **
Hadoop – HDP & HDF based services* Service detail description on slide 5,6,7 Services outside Big Data platform
UNDERSTANDING CUSTOMERS BETTER BY ADDING ADDITIONAL INSIGHT FROM CALL
CENTER RECORDING, EMAILS, SOCIAL MEDIA
07
MULTICHANNEL ANALYTICS OFFER
Media Data
Call Center data
(Audio etc.)
Social Media Data
Twitter
LinkedIn
Facebook
Instagram
YouTube
Blogs
Documents Data
Emails
CSV
Plain Text
(Weblogs,Clickstrea
ms, Agents notes,
Online Chat)
BIU Data
Call Profiles and
Transactions
Speech-to-Text
Social Data
Adapter based
on Apache NiFi
Unstructure
data retrleval
service using
Apache Tika
Structure data
retrleval
service using
Apache NiFi
Hadoop
Data
Lake
TRAINING PHASE
EXECUTION PHASE
WYKRYWANIE DANYCH WRAŻLIWYCH
07 GDPR – SENSID
LEKSYKON
TECHNOLOGIA
Aktualny leksykon przygotowaliśmy pod wymagania RODO, może zostać jednak rozszerzony.
Wykorzystuje zaawansowane technologie. Dzięki temu uzyskaliśmy
unikalną skuteczność i wydajność.
07
25
GDPR – SENSID
PRZYKŁAD WYKRYWANIA ML/NLP
Od: xyz@domain.com,
Do: reklamacje@bank.com,
Temat: Rezygnacja z karty kredytowej
Dzień dobry, nazywam się Jan Kowalski. Jestem Państwa klientem. Do końca lipca będę się leczył
w szpitalu na nerki, a chciałbym jak najszybciej zrezygnować z rachunku bankowego 94 8792 0008
7674 2834 4363 1795 oraz związanej z nim karty kredytowej 4191 1870 2261 1608, dla
potwierdzenia podaję mój nr PESEL: 7505078934 i adres Nowa Wieś 34, 98-275 Brzeźnio.
….
PRZYKŁAD
Osoba: Jan Kowalski
Numer rachunku : 94 8792 0008 7674 2834 4363 1795
Numer karty: 4191 1870 2261 1608
Dane o zdrowiu: do końca lipca będę się leczył w szpitalu na nerki
Adres/Miejsce: Nowa Wieś 34
Adres/Miejsce: 98-275 Brzeźnio
email: xyz@domain.com
PESEL: 7505078934
BIBLIOGRAFIA
26
1. Michael A. Nielsen, Neural Networks and Deep Learning, Determination Press, 2015.
2. Tensorflow Playground, http://playground.tensorflow.org.
3. Tensorflow Benchmarks, https://github.com/tobigithub/tensorflow-deep-learning/wiki/tf-benchmarks.
TUATARA SP. Z O.O.
Aleje Jerozolimskie 132
02-305 Warszawa
Polska
+48 726 648 000
MARKETING@TUATARA.PL
TUATARA BUSINESS SOLUTIONS LLC
Knowledge Oasis Muscat
Rusayl Industrial Estate
Muscat P.O. Box 63-135 KOM 4
Sultanate of Oman
@TUATARA_PL
TUATARAPOLAND
@TUATARA.PL
E
M
S TWITTER
WWW. TUATARA.PL
S FACEBOOK
S INSTAGRAM
DZIĘKUJEMY

More Related Content

Similar to TUATARA SHARES: Sieci neuronowe: wprowadzenie, teoria, praktyka

Optymalizacja hostingu
Optymalizacja hostinguOptymalizacja hostingu
Optymalizacja hostinguDivante
 
Cisco. Receptury
Cisco. RecepturyCisco. Receptury
Cisco. Receptury
Wydawnictwo Helion
 
Confitura 2018 - Sekretne życie jobów Sparkowych
Confitura 2018 - Sekretne życie jobów SparkowychConfitura 2018 - Sekretne życie jobów Sparkowych
Confitura 2018 - Sekretne życie jobów Sparkowych
Marcin Jasiński
 
Sieci komputerowe. Księga eksperta. Wydanie II poprawione i uzupełnione
Sieci komputerowe. Księga eksperta. Wydanie II poprawione i  uzupełnioneSieci komputerowe. Księga eksperta. Wydanie II poprawione i  uzupełnione
Sieci komputerowe. Księga eksperta. Wydanie II poprawione i uzupełnione
Wydawnictwo Helion
 
Visual Basic .NET. Bazy danych. Księga eksperta
Visual Basic .NET. Bazy danych. Księga ekspertaVisual Basic .NET. Bazy danych. Księga eksperta
Visual Basic .NET. Bazy danych. Księga eksperta
Wydawnictwo Helion
 
PLNOG 8: Tomasz Sawiak - Log management i analizy > to czego nie widać
PLNOG 8: Tomasz Sawiak - Log management i analizy > to czego nie widać PLNOG 8: Tomasz Sawiak - Log management i analizy > to czego nie widać
PLNOG 8: Tomasz Sawiak - Log management i analizy > to czego nie widać
PROIDEA
 
Wyklad inauguracyjny
Wyklad inauguracyjnyWyklad inauguracyjny
Wyklad inauguracyjny
Radoslaw Kita
 
Visual Basic .NET. Ćwiczenia
Visual Basic .NET. ĆwiczeniaVisual Basic .NET. Ćwiczenia
Visual Basic .NET. Ćwiczenia
Wydawnictwo Helion
 
Bazy danych i MySQL. Od podstaw
Bazy danych i MySQL. Od podstawBazy danych i MySQL. Od podstaw
Bazy danych i MySQL. Od podstaw
Wydawnictwo Helion
 
Using Red Gate SQL Doc for database documentation
Using Red Gate SQL Doc for database documentationUsing Red Gate SQL Doc for database documentation
Using Red Gate SQL Doc for database documentation
Mariusz Koprowski
 
PHP, Microsoft IIS i SQL Server. Projektowanie i programowanie baz danych
PHP, Microsoft IIS i SQL Server. Projektowanie i programowanie baz danychPHP, Microsoft IIS i SQL Server. Projektowanie i programowanie baz danych
PHP, Microsoft IIS i SQL Server. Projektowanie i programowanie baz danych
Wydawnictwo Helion
 
PLNOG 17 - Robert Ślaski - Jak nie zostać bezrobotnym sieciowcem?
PLNOG 17 - Robert Ślaski - Jak nie zostać bezrobotnym sieciowcem?PLNOG 17 - Robert Ślaski - Jak nie zostać bezrobotnym sieciowcem?
PLNOG 17 - Robert Ślaski - Jak nie zostać bezrobotnym sieciowcem?
PROIDEA
 
GET.NET - Osiołkowi w żłobie dano, czyli o tym jak hostować aplikacje na Mic...
GET.NET -  Osiołkowi w żłobie dano, czyli o tym jak hostować aplikacje na Mic...GET.NET -  Osiołkowi w żłobie dano, czyli o tym jak hostować aplikacje na Mic...
GET.NET - Osiołkowi w żłobie dano, czyli o tym jak hostować aplikacje na Mic...
Michal Furmankiewicz
 
Struktura organizacyjna i architektura systemów komputerowych
Struktura organizacyjna i architektura systemów komputerowychStruktura organizacyjna i architektura systemów komputerowych
Struktura organizacyjna i architektura systemów komputerowych
Wydawnictwo Helion
 
ActionScript. Receptury
ActionScript. RecepturyActionScript. Receptury
ActionScript. Receptury
Wydawnictwo Helion
 
semKRK #13 - Aneta i Dawid Krystosik
semKRK #13 - Aneta i Dawid KrystosiksemKRK #13 - Aneta i Dawid Krystosik
semKRK #13 - Aneta i Dawid Krystosik
semKRK
 
Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze do...
Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze do...Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze do...
Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze do...
Elitmind
 
ASP.NET 2.0. Gotowe rozwiązania
ASP.NET 2.0. Gotowe rozwiązaniaASP.NET 2.0. Gotowe rozwiązania
ASP.NET 2.0. Gotowe rozwiązania
Wydawnictwo Helion
 
SQL Server 2005. Wyciśnij wszystko
SQL Server 2005. Wyciśnij wszystkoSQL Server 2005. Wyciśnij wszystko
SQL Server 2005. Wyciśnij wszystko
Wydawnictwo Helion
 

Similar to TUATARA SHARES: Sieci neuronowe: wprowadzenie, teoria, praktyka (20)

Optymalizacja hostingu
Optymalizacja hostinguOptymalizacja hostingu
Optymalizacja hostingu
 
Cisco. Receptury
Cisco. RecepturyCisco. Receptury
Cisco. Receptury
 
Confitura 2018 - Sekretne życie jobów Sparkowych
Confitura 2018 - Sekretne życie jobów SparkowychConfitura 2018 - Sekretne życie jobów Sparkowych
Confitura 2018 - Sekretne życie jobów Sparkowych
 
Sieci komputerowe. Księga eksperta. Wydanie II poprawione i uzupełnione
Sieci komputerowe. Księga eksperta. Wydanie II poprawione i  uzupełnioneSieci komputerowe. Księga eksperta. Wydanie II poprawione i  uzupełnione
Sieci komputerowe. Księga eksperta. Wydanie II poprawione i uzupełnione
 
Visual Basic .NET. Bazy danych. Księga eksperta
Visual Basic .NET. Bazy danych. Księga ekspertaVisual Basic .NET. Bazy danych. Księga eksperta
Visual Basic .NET. Bazy danych. Księga eksperta
 
PLNOG 8: Tomasz Sawiak - Log management i analizy > to czego nie widać
PLNOG 8: Tomasz Sawiak - Log management i analizy > to czego nie widać PLNOG 8: Tomasz Sawiak - Log management i analizy > to czego nie widać
PLNOG 8: Tomasz Sawiak - Log management i analizy > to czego nie widać
 
Wyklad inauguracyjny
Wyklad inauguracyjnyWyklad inauguracyjny
Wyklad inauguracyjny
 
Visual Basic .NET. Ćwiczenia
Visual Basic .NET. ĆwiczeniaVisual Basic .NET. Ćwiczenia
Visual Basic .NET. Ćwiczenia
 
Bazy danych i MySQL. Od podstaw
Bazy danych i MySQL. Od podstawBazy danych i MySQL. Od podstaw
Bazy danych i MySQL. Od podstaw
 
Using Red Gate SQL Doc for database documentation
Using Red Gate SQL Doc for database documentationUsing Red Gate SQL Doc for database documentation
Using Red Gate SQL Doc for database documentation
 
PHP, Microsoft IIS i SQL Server. Projektowanie i programowanie baz danych
PHP, Microsoft IIS i SQL Server. Projektowanie i programowanie baz danychPHP, Microsoft IIS i SQL Server. Projektowanie i programowanie baz danych
PHP, Microsoft IIS i SQL Server. Projektowanie i programowanie baz danych
 
PLNOG 17 - Robert Ślaski - Jak nie zostać bezrobotnym sieciowcem?
PLNOG 17 - Robert Ślaski - Jak nie zostać bezrobotnym sieciowcem?PLNOG 17 - Robert Ślaski - Jak nie zostać bezrobotnym sieciowcem?
PLNOG 17 - Robert Ślaski - Jak nie zostać bezrobotnym sieciowcem?
 
GET.NET - Osiołkowi w żłobie dano, czyli o tym jak hostować aplikacje na Mic...
GET.NET -  Osiołkowi w żłobie dano, czyli o tym jak hostować aplikacje na Mic...GET.NET -  Osiołkowi w żłobie dano, czyli o tym jak hostować aplikacje na Mic...
GET.NET - Osiołkowi w żłobie dano, czyli o tym jak hostować aplikacje na Mic...
 
Struktura organizacyjna i architektura systemów komputerowych
Struktura organizacyjna i architektura systemów komputerowychStruktura organizacyjna i architektura systemów komputerowych
Struktura organizacyjna i architektura systemów komputerowych
 
ActionScript. Receptury
ActionScript. RecepturyActionScript. Receptury
ActionScript. Receptury
 
semKRK #13 - Aneta i Dawid Krystosik
semKRK #13 - Aneta i Dawid KrystosiksemKRK #13 - Aneta i Dawid Krystosik
semKRK #13 - Aneta i Dawid Krystosik
 
Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze do...
Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze do...Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze do...
Elitmind @ SQLDay2018: Stream Analytics i Machine Learning – czy to dobrze do...
 
ASP.NET 2.0. Gotowe rozwiązania
ASP.NET 2.0. Gotowe rozwiązaniaASP.NET 2.0. Gotowe rozwiązania
ASP.NET 2.0. Gotowe rozwiązania
 
SQL Server 2005. Wyciśnij wszystko
SQL Server 2005. Wyciśnij wszystkoSQL Server 2005. Wyciśnij wszystko
SQL Server 2005. Wyciśnij wszystko
 
Desing&Realizing an ICI
Desing&Realizing an ICIDesing&Realizing an ICI
Desing&Realizing an ICI
 

More from TUATARA

TUATARA portfolio i doświadczenie
TUATARA portfolio i doświadczenieTUATARA portfolio i doświadczenie
TUATARA portfolio i doświadczenie
TUATARA
 
TUATARA portfolio and experience
TUATARA portfolio and experienceTUATARA portfolio and experience
TUATARA portfolio and experience
TUATARA
 
Transformacja cyfrowa na przykładzie Digi Car
Transformacja cyfrowa na przykładzie Digi CarTransformacja cyfrowa na przykładzie Digi Car
Transformacja cyfrowa na przykładzie Digi Car
TUATARA
 
Telecom vendor partnership of the future
Telecom vendor partnership of the futureTelecom vendor partnership of the future
Telecom vendor partnership of the future
TUATARA
 
RETIXA - prime real-time marketing platform
RETIXA - prime real-time marketing platformRETIXA - prime real-time marketing platform
RETIXA - prime real-time marketing platform
TUATARA
 
EFFECTIVE REAL-TIME MARKETING AND DATA MONETISATION BASED ON COMBINED DATA FR...
EFFECTIVE REAL-TIME MARKETING AND DATA MONETISATION BASED ON COMBINED DATA FR...EFFECTIVE REAL-TIME MARKETING AND DATA MONETISATION BASED ON COMBINED DATA FR...
EFFECTIVE REAL-TIME MARKETING AND DATA MONETISATION BASED ON COMBINED DATA FR...
TUATARA
 
WYKORZYSTANIE AI WARUNKIEM PRZESTRZEGANIA PRAWA W SPOŁECZEŃSTWIE CYFROWYM
WYKORZYSTANIE AI WARUNKIEM PRZESTRZEGANIA PRAWA W SPOŁECZEŃSTWIE CYFROWYMWYKORZYSTANIE AI WARUNKIEM PRZESTRZEGANIA PRAWA W SPOŁECZEŃSTWIE CYFROWYM
WYKORZYSTANIE AI WARUNKIEM PRZESTRZEGANIA PRAWA W SPOŁECZEŃSTWIE CYFROWYM
TUATARA
 
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
TUATARA
 
Wzbogacanie tradycyjnych łańcuchów wartości o nowe modele monetyzacji oparte ...
Wzbogacanie tradycyjnych łańcuchów wartości o nowe modele monetyzacji oparte ...Wzbogacanie tradycyjnych łańcuchów wartości o nowe modele monetyzacji oparte ...
Wzbogacanie tradycyjnych łańcuchów wartości o nowe modele monetyzacji oparte ...
TUATARA
 
TUATARA SHARES: sensID dla RODO
TUATARA SHARES: sensID dla RODOTUATARA SHARES: sensID dla RODO
TUATARA SHARES: sensID dla RODO
TUATARA
 
TUATARA SHARES: Digital Front Office
TUATARA SHARES: Digital Front OfficeTUATARA SHARES: Digital Front Office
TUATARA SHARES: Digital Front Office
TUATARA
 

More from TUATARA (11)

TUATARA portfolio i doświadczenie
TUATARA portfolio i doświadczenieTUATARA portfolio i doświadczenie
TUATARA portfolio i doświadczenie
 
TUATARA portfolio and experience
TUATARA portfolio and experienceTUATARA portfolio and experience
TUATARA portfolio and experience
 
Transformacja cyfrowa na przykładzie Digi Car
Transformacja cyfrowa na przykładzie Digi CarTransformacja cyfrowa na przykładzie Digi Car
Transformacja cyfrowa na przykładzie Digi Car
 
Telecom vendor partnership of the future
Telecom vendor partnership of the futureTelecom vendor partnership of the future
Telecom vendor partnership of the future
 
RETIXA - prime real-time marketing platform
RETIXA - prime real-time marketing platformRETIXA - prime real-time marketing platform
RETIXA - prime real-time marketing platform
 
EFFECTIVE REAL-TIME MARKETING AND DATA MONETISATION BASED ON COMBINED DATA FR...
EFFECTIVE REAL-TIME MARKETING AND DATA MONETISATION BASED ON COMBINED DATA FR...EFFECTIVE REAL-TIME MARKETING AND DATA MONETISATION BASED ON COMBINED DATA FR...
EFFECTIVE REAL-TIME MARKETING AND DATA MONETISATION BASED ON COMBINED DATA FR...
 
WYKORZYSTANIE AI WARUNKIEM PRZESTRZEGANIA PRAWA W SPOŁECZEŃSTWIE CYFROWYM
WYKORZYSTANIE AI WARUNKIEM PRZESTRZEGANIA PRAWA W SPOŁECZEŃSTWIE CYFROWYMWYKORZYSTANIE AI WARUNKIEM PRZESTRZEGANIA PRAWA W SPOŁECZEŃSTWIE CYFROWYM
WYKORZYSTANIE AI WARUNKIEM PRZESTRZEGANIA PRAWA W SPOŁECZEŃSTWIE CYFROWYM
 
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
REAL-TIME MARKETING I MONETYZACJA DANYCH OPARTE NA ŁĄCZENIU DANYCH BANKU I OP...
 
Wzbogacanie tradycyjnych łańcuchów wartości o nowe modele monetyzacji oparte ...
Wzbogacanie tradycyjnych łańcuchów wartości o nowe modele monetyzacji oparte ...Wzbogacanie tradycyjnych łańcuchów wartości o nowe modele monetyzacji oparte ...
Wzbogacanie tradycyjnych łańcuchów wartości o nowe modele monetyzacji oparte ...
 
TUATARA SHARES: sensID dla RODO
TUATARA SHARES: sensID dla RODOTUATARA SHARES: sensID dla RODO
TUATARA SHARES: sensID dla RODO
 
TUATARA SHARES: Digital Front Office
TUATARA SHARES: Digital Front OfficeTUATARA SHARES: Digital Front Office
TUATARA SHARES: Digital Front Office
 

TUATARA SHARES: Sieci neuronowe: wprowadzenie, teoria, praktyka

  • 2. AGENDA SPOTKANIA 2 01 PERCEPTRON I SIEĆ PERCEPTRONOWA 02 DZIAŁANIE I UCZENIE SIECI NEURONOWEJ 03 SIECI W PRAKTYCE 04 PROBLEM DANYCH WEJŚCIOWYCH 05 ZASTOSOWANIE 06 WYDAJNOŚĆ I SKALOWALNOŚĆ 07 PROJEKTY REALIZOWANE W TUATARA
  • 3. PERCEPTRON01 3 y = 0 𝑑𝑙𝑎 𝑖=1 𝑛 𝑤𝑖 𝑥𝑖 ≤ 𝑏 1 𝑑𝑙𝑎 𝑖=1 𝑛 𝑤𝑖 𝑥𝑖 > 𝑏 y W2 b xn x2 x1 … W1 Wn
  • 5. SIEĆ PERCEPTRONOWA01 5 𝑤11 1 𝑤22 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 𝑏1 1 𝑥1 𝑥2 𝑦 𝑏2 1 𝑏1 2
  • 6. UCZENIE SIECI NEURONOWEJ02 6 1. Przygotowanie danych uczących w postaci zbioru wektorów cech wraz z ich klasyfikacją. 2. Znalezienie takich parametrów w i t dla każdego neuronu w sieci, aby uzyskać jak najlepszą klasyfikację (jak to zrobić?). • Jeden ze sposobów to metoda gradientu prostego. 1. Wybieramy losowe parametry początkowe w i t. 2. Klasyfikujemy przy ich pomocy zbiór wejściowy. 3. Wprowadzamy poprawki do w i t w zależności od popełnionych błędów. 4. Powtarzamy aż do uzyskania zadowalających wyników.
  • 7. SPOSOBY UCZENIA02 7 Znany zbiór uczący wraz z klasyfikacją Proponowanie klasyfikacji na bazie zbioru cech Uczenie nadzorowane Klasyfikacja danych wejściowych z jednoczesnym „douczaniem” sieci Uczenie przez wzmacnianie Autoenkodery Poprawianie jakości obrazu Sieć Kohonena Klasteryzjacja Uczenie bez nadzoru
  • 8. TENSORFLOW03 8 1. Otwarto-źródłowa biblioteka dla języka Python do obliczeń numerycznych przy wykorzystaniu grafów przepływu 2. Elastyczna na tyle aby umożliwić zastosowanie w wielu dziedzinach badań 3. W szczególności, wspiera budowanie sieci neuronowych. 4. Wsparcie GPU przy użyciu CUDA
  • 9. KERAS03 9 1. Wysokopoziomowa biblioteka dla języka Python służąca do budowania sieci neuronowych. 2. Wykorzystuje jeden z popularnych niskopoziomowych API – TensorFlow, CNTK, Theano. 3. Szybkie prototypowanie rozwiązań. 4. Ograniczenia pod względem możliwości (w porównaniu do TensorFlow).
  • 10. BAZA MNIST04 10 1. Baza MNIST to zbiór odręcznie pisanych cyfr. 2. Zbiór 60 tysięcy obrazów o wymiarach 28 na 28 pikseli.
  • 13. PRZYGOTOWANIE DANYCH WEJŚCIOWYCH04 13 1. Aby rozwiązać pewien problem klasyfikacji przy pomocy sieci neuronowej potrzeba zastanowić się nad reprezentacją danych wejściowych. 2. Dane wejściowe do sieci neuronowej muszą być reprezentowalne za pomocą wektora liczb (cech). 3. W przypadku obrazu możemy to osiągnąć przez zamianę obrazu na odcienie czerni i bieli. 4. Wykorzystanie jednego piksela jako wejścia do jednego neuronu bardzo szybko okazuje się zawodne (rozdzielczość 420x320 to już 134400 pikseli!). 5. Dźwięk może być reprezentowany jako szereg czasowy. 6. Dla danej osoby można przyporządkować wektor określający częstość wchodzenia na daną stronę. 7. Cechy podawane do sieci neuronowej powinny być znormalizowane. Nie powinno być sytuacji, że na jednej pozycji w wektorze wartości odbiegają od pozostałych. 8. Odpowiednia liczba danych wejściowych (dziesiątki tysięcy lub więcej). 9. Odpowiednia równowaga pomiędzy reprezentantami poszczególnych klas.
  • 14. PROBLEMY KLASYFIKACJI05 14 1. Analiza dźwięku: a) Rozpoznawanie osób. b) Identyfikowanie sentymentu. 2. Analiza obrazu: a) Identyfikowanie nie pożądanych zdjęć – filtr NSFW Yahoo. b) Wykrywanie i unikanie zagrożeń podczas lotu dronem – DJI. c) Wspomaganie kierowcy samochodu – Autopilot Tesli. 3. Analiza szeregów czasowych: a) Identyfikacja anomalii na podstawie danych sensorycznych. b) Wykrywanie oszustw na podstawie wzorców zachowania. c) Rekomendacje utworów muzycznych czy wideo – eksperyment Spotify, rekomendacje Netflix, YouTube. 4. Analiza danych: a) Diagnostyka medyczna. b) Wykrywanie złośliwego oprogramowania – Deep Instinct. c) Predykcja następnych instrukcji lub potrzebnych danych – Neural Net Prediction i Smart Pre-Fetch AMD. d) Gra w go/szachy/starcrafta – Deep Mind Google.
  • 15. PLATFORMA PRZYKŁADÓW/SEK WYDAJNOŚĆ/$ 2x GTX 1080 TI 12486.5 7.80 GTX 1080 1780.0 2.19 GTX 1070 1733.1 3.85 2x Geforce TitanX 796.7 0.38 1x Geforce TitanX 550.1 0.53 I7-3770K & GTX 970 641.4 1.01 Xeon E5-2670 + 1 GPU 325.2 0.12 Xeon E5-2670 + 4 GPU 337.9 0.06 Tesla K40 350.0 0.16 SZYBKOŚĆ UCZENIA06 15
  • 16. UCZENIE ROZPROSZONE06 16 1. Serwery klastra współdzielą parametry modelu, wspólnie wypracowując poprawni bazując na różnych danych. 2. Serwery klastra mają własne parametry modelu i niezależną pętlę uczącą. Parametry modelu są jedynie synchronizowane do PS. PARAMETER SERVER MODEL REPLICAS DATA SHARDS
  • 17. TENSORFLOW ON SPARK06 17 SPARK DRIVER Spark Executor TensorFlow Alg TensorFlow Core gRPC RDMA Spark Executor TensorFlow Alg TensorFlow Core gRPC RDMA Spark Executor TensorFlow Alg TensorFlow Core gRPC RDMA Spark Executor Parameter Server TrensorFlow Core gRPC RDMA Data Set on HDFS ect.
  • 18. DISTRIBUTED SERVING06 18 DATA LEARNER MODEL 2 CONTINUOUS TRANING PIPELINE SERVING MODEL 1 MODEL 2 MODEL 1 TENSORFLOW SERVING CLIENTS Response Request
  • 19. SIECI NEURONOWE06 19 1. Zagadnienia przerabiane w tej prezentacji to tylko wstęp do szerokiej dziedziny sieci neuronowych. Źródło: http://www.asimovinstitute.org/neural-network-zoo/
  • 20. 07 20 PROJEKTY REALIZOWANE W TUATARA SYSTEM ANTI-PIRACY SYSTEM ANTI-PIRACY Crawlery Analiza treści oraz video Prowadzenie sprawy Przeszukiwanie internetu oraz sieci społecznościowych Automatyczna kategoryzacja treści ze wsparciem algorytmów uczenia maszynowego Automatyzacja procesu blokowania nielegalnych treści oraz prowadzenia spraw 02 0301
  • 21. PIŁKA NOŻNA SIATKÓWKA INNE – POPRAWNIE ODRZUCONE 07 21 PREZENTACJA WYNIKÓW PREZENTACJA WYNIKÓW 22
  • 22. ODRZUCONE OGÓLNA KLASYFIKACJAJAKO SPORT 07 22 PREZENTACJA WYNIKÓW PREZENTACJA WYNIKÓW 22
  • 23. Enhanced Customer Profile Store on Hadoop Real-Time Sentiment Analysis using custom trained model Real-Time Sentiment Analysis using custom trained model Custom Sentiment Analysis model training using Tensorflow library Custom Emotion Analysis model training using Tensorflow library Custom Named Entity Recognition model training using Tensorflow library Real-Time Sentiment Analysis using custom trained model Reporting, BI and Campaign Management Systems * ** Hadoop – HDP & HDF based services* Service detail description on slide 5,6,7 Services outside Big Data platform UNDERSTANDING CUSTOMERS BETTER BY ADDING ADDITIONAL INSIGHT FROM CALL CENTER RECORDING, EMAILS, SOCIAL MEDIA 07 MULTICHANNEL ANALYTICS OFFER Media Data Call Center data (Audio etc.) Social Media Data Twitter LinkedIn Facebook Instagram YouTube Blogs Documents Data Emails CSV Plain Text (Weblogs,Clickstrea ms, Agents notes, Online Chat) BIU Data Call Profiles and Transactions Speech-to-Text Social Data Adapter based on Apache NiFi Unstructure data retrleval service using Apache Tika Structure data retrleval service using Apache NiFi Hadoop Data Lake TRAINING PHASE EXECUTION PHASE
  • 24. WYKRYWANIE DANYCH WRAŻLIWYCH 07 GDPR – SENSID LEKSYKON TECHNOLOGIA Aktualny leksykon przygotowaliśmy pod wymagania RODO, może zostać jednak rozszerzony. Wykorzystuje zaawansowane technologie. Dzięki temu uzyskaliśmy unikalną skuteczność i wydajność.
  • 25. 07 25 GDPR – SENSID PRZYKŁAD WYKRYWANIA ML/NLP Od: xyz@domain.com, Do: reklamacje@bank.com, Temat: Rezygnacja z karty kredytowej Dzień dobry, nazywam się Jan Kowalski. Jestem Państwa klientem. Do końca lipca będę się leczył w szpitalu na nerki, a chciałbym jak najszybciej zrezygnować z rachunku bankowego 94 8792 0008 7674 2834 4363 1795 oraz związanej z nim karty kredytowej 4191 1870 2261 1608, dla potwierdzenia podaję mój nr PESEL: 7505078934 i adres Nowa Wieś 34, 98-275 Brzeźnio. …. PRZYKŁAD Osoba: Jan Kowalski Numer rachunku : 94 8792 0008 7674 2834 4363 1795 Numer karty: 4191 1870 2261 1608 Dane o zdrowiu: do końca lipca będę się leczył w szpitalu na nerki Adres/Miejsce: Nowa Wieś 34 Adres/Miejsce: 98-275 Brzeźnio email: xyz@domain.com PESEL: 7505078934
  • 26. BIBLIOGRAFIA 26 1. Michael A. Nielsen, Neural Networks and Deep Learning, Determination Press, 2015. 2. Tensorflow Playground, http://playground.tensorflow.org. 3. Tensorflow Benchmarks, https://github.com/tobigithub/tensorflow-deep-learning/wiki/tf-benchmarks.
  • 27. TUATARA SP. Z O.O. Aleje Jerozolimskie 132 02-305 Warszawa Polska +48 726 648 000 MARKETING@TUATARA.PL TUATARA BUSINESS SOLUTIONS LLC Knowledge Oasis Muscat Rusayl Industrial Estate Muscat P.O. Box 63-135 KOM 4 Sultanate of Oman @TUATARA_PL TUATARAPOLAND @TUATARA.PL E M S TWITTER WWW. TUATARA.PL S FACEBOOK S INSTAGRAM DZIĘKUJEMY