Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Hluboké učení pro každého (Jan Matoušek)

352 views

Published on

Hluboké učení je v kurzu a ovládlo svět. Máte i vy začít s neuronovými sítěmi? Jsou již nyní pro každého a za jak dlouho se je naučíte? Praktická kuchařka pro začátečníky.

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

Hluboké učení pro každého (Jan Matoušek)

  1. 1. …we do target precisely Hluboké učení pro každého? Neuronové sítě a spol. Pro Data Restart 2018
  2. 2. Jan Matoušek / Data Mind s.r.o. ■Data mining/ data science (od 2003) ■Šéf Data Mind s.r.o. (od 2009) ■Co dělám: Předpovědní a segmentační modely pro marketing (TELCO, RETAIL, AUTOMOTIVE) ■Připravujeme průmyslové modely a automatizaci do Kebooly (letos) strana 2
  3. 3. Neuronové sítě na ráně Co dělají neuronové sítě v běžném životě: ■Obírají vás na akciové, měnové burze (jo, platí i pro Kryptoměny a i pro HODL strategie) ■Zjišťují váš věk, pohlaví a náladu ■Kontrolují zda jste terorista ■Hrají hry ■Diagnostikují lidi ■Diagnostikují přístroje ■Rozpoznávají běžnou řeč ■Detekují složitý malware ■Detekují sofistikované podvody ■Řídí auta ■Poznávají dopravní a poznávací značky strana 3
  4. 4. Dělat hluboké neuronové sítě nebo ne? strana 4 ANO, jako veš NE ANO NE, vobyč.marketingový data ANO NE, jsem v pohodě Kde nasadit hlubokou neuronovou síť: ■ Komplexní signál  Video  Audio  Senzory  Složité jazykové problémy  State of art aplikace  Ožebračit 10.000 obchodníků na burze  Diagnostikovat rakovinu lépe než ostatní  Překonat 50 agentur v předpovědi výpovědí (Churn prediction)  Frajeření na ostatní analytiky  Celoživotní vzdělávání
  5. 5. Proč je děláme my ? Poptávka na počítání a rozpoznání konzerv na pásu: ■Bez počítadla ■Z obrazových dat ■Včetně rozpoznání druhu konzervy Další poptávka na Predictive Maintenance: ■Údržbu strojů na základě predikce strana 5
  6. 6. Učící se křivka strana 6 ■Populární články nepomáhají ■Začínáme výběrem softwaru ■Šprtáme ■ Napojujeme ■ Ladíme ■ Provozujeme ■ Měníme
  7. 7. 1. Čumíme do Facebooku /Youtube strana 7 Zdroj: Tom Brown Publikováno 22. 1. 2018 Na Youtube
  8. 8. 2.Vybíráme softwarový balíček ■Dilema mezi nejpopulárnějším TensorFlow a nejjednodušším open source Kerasem se vyřeší snadno ■Použijte obojí ■Keras aTensoflow vytvoří prostředí, které je  Jednoduché  Silné když bude potřeba ■Jednodušší jsou jen komerční balíčky napříkladWolfram strana 8 Obrázek: Popularita jednotlivých balíčku pro Deep learning. Zdroj dat: The Data Incubator, měřítko je ve standardních odchylkách (!, pozn.: geekové pro geeky)
  9. 9. 3 Šprtací zdroje Zdrojů jsou stovky, já vyzkoušel: ■ Stanfordská univerzita a její videa Jsou na youtube , Např: Introduction to Convolutional Neural Networks forVisual Recognition ■ Datacamp ■ Coursera Jak to dostat do provozu (zkratky): ■ Keras je zadarmo v Pythonu + R ■ Nečekejte na nákupGPU (grafiky) ■ Nekoukejte naTED ani na bajky o geniálních topinkovačích ■ Pozor na akademické knihy  Grantoví běžci mají nekonečně mnoho času  Ladění parametru fň pro počítače roku 2025 na 680 stránkách není to, co byste měli číst na počátku strana 9
  10. 10. 4The Keras BLOG ■https://blog.keras.io/building- powerful-image-classification- models-using-very-little-data.html ■Neuronovou sít postavíte za 80 řádek kódu, které jsou tam uvedeny  Těžkých 80 řádek strana 10
  11. 11. 5. Porno, psi a kočky – Jak zvolíme první úlohu ■State of art úlohy:  Porno na Seznam.cz (tlačítko skrýt hanbaté obrázky)  Google obrázky  Desítky akademických i komerčních autorů  Architektury modelů jsou často publikované  Kaggle – soutěž datových geeků ■Obyčejné úlohy  Rozpoznání psů a koček – doporučeno autory Kerasu  Rozpoznání Slonů a Aut ■Příliš triviální úlohy (nebrat)  Rozpoznání barev, světla  Nepotřebujete model, vystačíte si s klasifikací RGB strana 11
  12. 12. Příklad – Krok 1 Ukázkový model v Data Mind: ■ Obrázky s označením aut a slonů ■ Obrázky jsou různorodé (netříděný zdroj: seznam.cz) strana 12
  13. 13. Příklad – Krok 2 Zpracování obrázků: ■Obrázky jsou převedeny na stejnou velikost ■Pro účely učení jsou použity náhodné rotace, posuny a oříznutí strana 13 Standardizace velikosti Náhodné úpravy
  14. 14. Model ? ■Model obsahuje neurony: Jednoduché funkce které se učí dle vstupních signálů ■Výstupní vrstva má charakter: Klasifikace: Typ obrázku strana 14
  15. 15. Příklad – Krok 3 – Architektura modelu Vrstvy zpracování obrázků ■ První vrstva zachycuje nejmenší podobrázky například o 4*4 pixelech, které se snažíme pochopit pomocí „filtrů“ ■ Obrázky se skládají do větších a větších čtverců zachycujících komplexnější tvary Ze 190 malých výseků obrázků získáme 99, pak 48,pak 23 větších skládáním obrázků ■ Ve výsledku odhadujeme typ objektu ■ Chyby a úspěšné predikce upravují zpětně váhy jednotlivých „neuronů“ strana 15 Odhalení čáry Odhalení chobotu Odhalení slona Klasifikace slona a měření vlivů na správnou klasifikaci Zpětná propagace vah dle úspěchu a chyb Význam tvaru slona Význam chobotu Význam čáry
  16. 16. Příklad – Krok 4 – Skoring strana 16strana 16 Skoring čáry Skoring chobotu Skoring slona Klasifikace slona Vliv jednotlivých prvků na správnou klasifikaci je znám ■ Neuronová síť uvidí nový obrázek, nelekne se ho, ale naopak ho správně zařadí do kategorie ■ Při klasifikaci objektů použijeme již naučené váhy:  Malých obrázků a v nich rozpoznaných tvarů  Součtu těchto malých obrázků do větších celků  Celkový skoring objektu
  17. 17. Úspěšnost Ve vzorovém projektu bylo úspěšně klasifikováno 95% objektů, na kterých se model neučil a „viděl je“ až následně, když byl již hotov: ■Kdy nastane chybná klasifikace: ■S autem níže má naše neuronová síť velký problém. Auto nemá kola, ale zato má hlavu a chobot, takže je klasifikováno jako slon strana 17
  18. 18. Jednorožec Ksenie Sorokina ■ DigitálníAkademie Czechitas ■ Mentoring s Honzou ■ Úkol:  Porozumět principům Hlubokého učení  Nastavit model  Natrénovat model  Otestovat  Optimalizovat ■ Výsledek:  Model funguje s přesností 96%  Optimalizace: zkráceni doby tréninku  Technický článek: ttps://bit.ly/2pNkHSH ■ Ocenění:  Jednorožec (nejvyšší metál v Czechitas)  Keboola ■ Dělat hluboké neuronové sítě se vyplatí a dá se to strana 18 Jednorožec ….
  19. 19. www.datamind.cz Data Mind s.r.o., Pobřežní 18/16, 170 00 Praha 7 Loga a registrované značky uvedené v této prezentaci jsou majetkem jejich právoplatných majitelů. Jan.Matousek @datamind.cz Ksenia Sorokina @keboola.com www.keboola.com

×