Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Árvores de decisão no FreeBSD com R - PagSeguro

Árvores de decisão no FreeBSD com R - Meetup AI Brasil - PagSeguro

  • Be the first to comment

  • Be the first to like this

Árvores de decisão no FreeBSD com R - PagSeguro

  1. 1. Árvores de Decisão no FreeBSD com R/RStudio Mauro Risonho de Paula Assumpção 2º Meetup do SW Artificial Intelligence com AI Brasil
  2. 2. WHOIS ● Sou profissional PCD (Tenho Autísmo/Asperger descoberto em 2016) e trabalho com equipe VOLTRON-ENGSEC do PagSeguro. ● Tento levar meu sobrenome a sério! ● Atuo na área de Cybersecurity. ● Estudo DS/AI/Machine Learning como formas de agregar, mais conhecimento e automatização à Cybersecurity. 1) Não sou Cientista, Engenheiro de dados. 2) Não sou Machine Learning Eng e/ou similares Não atuo na área de forma dedicada neste segmento nestas 2 citações acima. https://www.linkedin.com/in/firebitsbr/
  3. 3. Minha tragetória com AI/Machine Learning Vulcanoio.org https://www.kaggle.com/kerneler/ starter-open-source-cluster-iots-for- d40bc73c-c
  4. 4. Origens dos projetos http://www.freebsd.org/ https://www.r-project.org/ https://www.rstudio.com/
  5. 5. Porque usar FreeBSD? Cases de Sucesso: https://www.freebsd.org/doc/handbook/nutshell.html
  6. 6. Diferenças Deep Learning, Machine Learning e AI Lead Magnet 1 - Difference between ML, DL and AI, pag 2
  7. 7. Machine Learning  STATISTICS FOR MACHINE LEARNING, Manuel Amunategui, pag. 9
  8. 8. Machine Learning
  9. 9. Deep Learning, Machine Learning ● SUPERVISED LEARNING Algoritmos de treinamento usando dados rotulados de entrada /saída. ● UNSUPERVISED LEARNING Algoritmos de treinamento sem dados rotulados. Ele tenta descobrir padrões ocultos por conta própria. ● REINFORCEMENT LEARNING Algoritmos tomam ações para maximizar a recompensa cumulativa. ● Machine learning Process: Processo de aprendizado de máquina: (1) seleção do modelo para treinamento, (2) execução manual da extração de características. ● Deep Learning Process: Processo de Aprendizagem Profunda: (1) Selecione a arquitetura da rede, (2) os recursos são extraídos automaticamente alimentando os dados de treinamento (como imagens) junto com a classe alvo (rótulo).
  10. 10. Processo de Aprendizado Inferências Abstração Generalização AvaliaçãoData Storage Data Conceitos
  11. 11. Data Storage Todo aprendizado deve começar com dados. PROCESSOR STORAGESTORAGE MEMORY NETWORK
  12. 12. Abstração
  13. 13. Generalização Gatos Machine Learning Gato Não é Gato
  14. 14. Avaliação https://hackernoon.com/a-brief-overview-of-automatic-machine-learning-solutions- automl-2826c7807a2a Área de avaliação (evaluation)
  15. 15. Quando avaliar
  16. 16. Por que a avaliação é importante? ● Para saber quando você conseguiu ● Para saber o quanto você conseguiu ● Para saber decidir quando parar ● Para saber decidir quando atualizar o modelo
  17. 17. Perguntas básicas para avaliação ● Quando avaliar? ● Qual métrica usar? ● Em quais dados?
  18. 18. Anaconda (1/2) Não há versão para *BSD e nem pretendem desenvolver… mas temos packages equivalentes no portsnap pkg install
  19. 19. Anaconda (2/2) Não há versão para *BSD e nem pretendem desenvolver… mas temos packages equivalentes no portsnap pkg install
  20. 20. Execução do Rstudio (1/2) https://www.freshports.org/devel/RStudio/ pkg-message: ====================================================================== You installed RStudio: Integrated development environment (IDE) for R. Please note that RStudio requires /proc to be mounted. The usual way to do this is to add this line to /etc/fstab: proc /proc procfs rw 0 0 and then run this command as root: # mount /proc
  21. 21. Execução do Rstudio (2/2)
  22. 22. Update Packages do Rstudio (1/2)
  23. 23. Update Packages do Rstudio (2/2) 1 2 3
  24. 24. Correspondência de dados de entrada em algoritmos(1/2)  São muitos algoritmos a serem explicados.  A palestra irá focar apenas no algoritmo “Decision Trees” por questões de tempo. Modelo Tarefa de aprendizagem Supervised Learning Algorithms Nearest Neighbor Classification Naive Bayes Classification Decision Trees Classification Classification Rule Learners Classification Linear Regression Numeric prediction Regression Trees Numeric prediction Model Trees Numeric prediction Neural Networks Dual use Support Vector Machines Dual use
  25. 25. Correspondência de dados de entrada em algoritmos(2/2) Model Tarefa de aprendizagem Unsupervised Learning Algorithms Association Rules Pattern detection k-means clustering Clustering Meta-Learning Algorithms Bagging Dual use Boosting Dual use Random Forests Dual use
  26. 26. Árvores de Decisão(Decision Trees 1/2) Root Decision Node 2 Decision Node 1 Decision Node 3 NoYes NoYesNoYes
  27. 27. Árvores de Decisão(Decision Trees 2/2)
  28. 28. Alguns usos de Árvores de Decisão(Decision Trees)  Com isso em mente, alguns usos potenciais incluem:  Modelos de pontuação de crédito nos quais os critérios que fazem com que um candidato seja rejeitado precisam ser claramente documentados e livres de viés  Estudos de marketing do comportamento do cliente, como satisfação ou rotatividade, que serão compartilhados com agências de gestão ou de publicidade  Diagnóstico de condições médicas com base em medições laboratoriais, sintomas ou taxa de progressão da doença
  29. 29. Implementação Decision Tree C5.0  Algoritmo de Decision Tree - C5.0 usa entropia  A entropia (S) é uma grandeza termodinâmica que mede a desordem de um sistema e a espontaneidade dos processos físicos.  A queda d’água em uma cachoeira é um processo natural e espontâneo, no qual a entropia aumenta  A grandeza termodinâmica denominada entropia, simbolizada pela letra S, está relacionada ao grau de organização de um sistema.  Quanto maior a desordem do sistema, maior a entropia.
  30. 30. Tensorflow on FreeBSD
  31. 31. Tensorflow on FreeBSD  https://github.com/amutu/tf-freebsd-pkg  https://www.freebsdnews.com/2016/06/09/tensorflow-on-freebsd/  http://qml.610t.org/FreeBSD/tensorflow.html  https://news.ycombinator.com/item?id=11827940  http://freebsd.1045724.x6.nabble.com/Re-Tensorflow-port-td6226536.html ● https://www.reddit.com/r/freebsd/comments/bdxlbo/ tensorflow_on_freebsd_tearing_my_hair_out/https://www.freshports.org/ science/py-tensorflow/ ● https://github.com/higepon/tensorflow_seq2seq_chatbot/wiki/Install- tensorflow-FreeBSD  https://forums.freebsd.org/threads/howto-install-tensorflow-on- freebsd.59479/ Tensorflow no FreeBSD, só funciona ainda via CPU e não GPU, devido os drivers da NVIDIA não serem nativos. Questão de tempo. :)
  32. 32. Referências ● PRACTICAL MACHINE LEARNING COOKBOOK https://www.amazon.com/Practical- Machine-Learning-Cookbook-Tripathi- ebook/dp/B01JLBMC9K ● FreeBSD https://www.freebsd.org/ ● Rstudio https://www.rstudio.com/
  33. 33. Decision Trees - DEMO Prevendo a direção do Stock Movement
  34. 34. Prevendo a direção do Stock Movement PAGSEGURO Decision Trees https://finance.yahoo.com/quote/pags/?p=pags
  35. 35. Decision Trees – IPO PagSeguro https://economia.uol.com.br/noticias/bloomberg/2018/01/24/ pagseguro-do-uol-levanta-us-23-bi-em-ipo-em-nova-york.htm IPO Março/2017

    Be the first to comment

    Login to see the comments

Árvores de decisão no FreeBSD com R - Meetup AI Brasil - PagSeguro

Views

Total views

213

On Slideshare

0

From embeds

0

Number of embeds

20

Actions

Downloads

0

Shares

0

Comments

0

Likes

0

×