Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski

154 views

Published on

Większość software developerów ma zakorzenione przekonanie, że algorytmy Machine Learning zarezerwowane są dla naukowców, statystyków, matematyków i firm z Doliny Krzemowej, a próg wejścia jest przeraźliwie wysoki. Podczas prezentacji ten mit zostanie obalony. Przedstawione zostaną podstawowe pojęcia i zasady niezbędne do rozpoczęcia swojej przygody z Machine Learning

Published in: Engineering
  • Be the first to comment

  • Be the first to like this

RST CodeMeeting: Machine Learning dla developera - Krzysztof Kędzierski

  1. 1. Machine Learning dla developerów Krzysztof Kędzierski, 23.08.2017
  2. 2. Windykacja – maksymalizacja zysku • 10 000 spraw • Cena - 15% wartości nominalnej • Kwoty od 15 groszy do 300 000zł • Pełne dane o historii zadłużenia • Pełne dane o dłużniku
  3. 3. Problem? Dla danego dłużnika przydziel kategorię z grupy: Windykacja telefoniczna Windykacja terenowa Windykacja komornicza Rezygnacja
  4. 4. Podejście standardowe
  5. 5. • Młody dłużnik spłaca lepiej niż stary • Dłużnik z miasta spłaca lepiej • Emeryci spłacają jak komornik siada na emeryturę • Większy dług to większy potencjalny zarobek • Poniżej 200zł nie opłaca się windykować • Jak telefon jest nieaktualny to nie ma sensu dzwonić • Jak się przedawni to nie ściągniemy nic • Itd.. I 200 innych mądrych reguł…
  6. 6. powstanie silnik reguł oparty o współczynniki wyliczone za pomocą estymacji metodą LWPzD…
  7. 7. GAME CHANGER… WARTOŚCIOWE DANE HISTORYCZNE
  8. 8. Machine Learning = wyszukiwanie wzorów w danych
  9. 9. Podejście machine learning
  10. 10. dług wiek typ długu zawód zysk forma 300000 40 hipoteka kierowca 100000 komornik 400 70 telefon emeryt 300 telefon 7000 28 gotówkowy bezrobotny -1500 terenowy 30000 60 rachunki przedsiębiorca -9000 komornik … dług wiek hipoteka gotówkowy rachunek emerytpracadługi klasa 300000 40 1 0 0 0 1 1 komornik (3) 400 70 0 0 1 1 0 2 telefon (1) 7000 28 0 1 0 0 0 1 strata (0) 50000 30 0 0 1 0 1 4 strata (0) … Dane historyczne
  11. 11. Podejście machine learning
  12. 12. Podejście machine learning
  13. 13. Machine Learning pipeline
  14. 14. Garbage IN => Garbage OUT
  15. 15. „More data beats clever algorithms, but better data beats more data” Peter Norvig, Google
  16. 16. Feature engineering
  17. 17. dług wiek typ długu zawód zysk forma 300000 40 hipoteka kierowca 100000 komornik 400 70 telefon emeryt 300 telefon 7000 28 gotówkowy bezrobotny -1500 terenowy 30000 60 rachunki przedsiębiorca -9000 komornik … dług wiek hip. got. rachunek emeryt praca długi żyje klasa 300000 40 1 0 0 0 1 1 1 komornik (3) 400 70 0 0 1 1 0 2 1 telefon (1) 7000 28 0 1 0 0 0 1 1 strata (0) 50000 60 0 0 1 0 1 4 0 strata (0) … Dane historyczne
  18. 18. Naucz się podstaw Zrozum swoje dane Zadaj odpowiednie pytanie
  19. 19. prosta heurystyka > ML ML > algorytm ekspercki
  20. 20. Skieruj pacjenta do lekarza, gdy minimum jeden z parametrów nie jest w normie…
  21. 21. Andrew Ng + Coursera Jak szybko zacząć?

×