Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

TDC 2018 - Florianópolis - Case sobre Text Mining

19 views

Published on

Case sobre Mineração de Textos apresentado no TDC 2018 em Florianópolis

Published in: Data & Analytics
  • Be the first to comment

  • Be the first to like this

TDC 2018 - Florianópolis - Case sobre Text Mining

  1. 1. Globalcode – Open4education TEXT MINING UMA ABORDAGEM SIMPLIFICADA PARA DESCOBERTA DE PADRÕES EM UM SERVICE DESK João G. Gutheil Abril/2018
  2. 2. • 11 unidades • 3.695 empregados AGCO América do Sul Santa Rosa - RSIbirubá - RS Marau - RS Mogi das Cruzes - SPPasso Fundo - RS Jundiaí - SP Campinas - SPRibeirão Preto - SP Gen. Rodriguez - ARG • Colheitadeiras • 510 empregados • Implementos • 200 empregados • Proteína Animal • 409 empregados • Tratores, Cabines e Motores • 795 empregados • Armazenagem de grãos • 50 empregados • Peças • 104 empregados • Centro de Treinamento • 8 empregados • Soluções Canavieiras • 186 empregados • Tratores e Motores • 191 empregados Canoas - RS • Tratores e Pulverizadores • 1.208 empregados Ernestina - RS • Peças • 34 empregados AGCO AMÉRICA DO SUL
  3. 3. 4 Gerentes de Projeto ~40 funcionários ~20 projetos no Portfolio/Ano AGCO AMÉRICA DO SUL - TI
  4. 4. 5 Sales NPI/PMO MKT Sales Ciência da Computação - Feevale Especialização em Gestão do Conhecimento e Int. Estratégica - UCS AGCO – Data Tower Team Vice-Coordenador do GUBI (Grupo de Usuários de BI) – Sucesu RS MKT Sales Joao.gutheil@agcocorp.com www.linkedin.com/in/joaogutheil JOÃO G. GUTHEIL
  5. 5. EFICIÊNCIA OPERACIONAL
  6. 6. ~3200 chamados/mês ~2000 usuários SERVICE-DESK :: AGCO SERVICE-NOW
  7. 7. • Quais as causas dos chamados ? • Qual a natureza de problema reportado pelas áreas de negócio ? • Quais aplicações são responsáveis pelo maior número de chamados ? “O caos” • Gerar indicadores para todas as plantas • Classificação de chamados SERVICE-DESK Canoas Santa Rosa
  8. 8. • Quais as causas dos chamados ? • Qual a natureza de problema reportado pelas áreas de negócio ? • Quais aplicações são responsáveis pelo maior número de chamados ? “O caos” • Gerar indicadores para todas as plantas • Classificação de chamados SERVICE-DESK Categorização? JD? JDE? Email? Contabilidade? RH? Volume?
  9. 9. EUREKA - Autonomia - Baixo custo - Simplicidade - Escalabilidade Premissas - Análise visual - Interatividade Requisitos Incident Manager
  10. 10. - Sistemas de recomendação - Reconhecimento de SPAM - Análise de sentimentos (ex. Redes Sociais) - Descoberta de padrões de comportamento (Ex: Anamnese nutricional e a correlação entre doenças e hábitos alimentar) - .... INCIDENTE MANAGER Text Mining “Text mining is a … new field that attempts to glean meaningful information from natural language text. It may be loosely characterized as the process of analyzing text to extract information that is useful for particular purposes.” Ian H. Witten Computer Science, University of Waikato, Hamilton, New Zealand
  11. 11. 12 NPI/PMO INCIDENT MANAGER – VERSÃO I Pacotes utilizados - TM Mineração de textos - Wordcloud Criação de nuvem de termos - vizNetwork Interface R para library vis.js - Sqldf Manipulação de dataframes usando SQL - Shiny Criação de aplicações WEB - Shinydashboard Criação de dashboards ₋ Amostra com ~3600 observações ₋ Correlação entre os termos ₋ RStudio ₋ Shiny Questionamentos - Escala? - Interatividade para o usuário (Ex.filtros, self-service)? - Volume de dados (performance)?
  12. 12. 13 NPI/PMO INCIDENT MANAGER – VERSÃO II ₋ Python ₋ Pentaho ₋ Tableau ₋ Interatividade ₋ Análise visual
  13. 13. 14 NPI/PMO INCIDENT MANAGER – VERSÃO II ₋ Word Cloud ₋ Frequência dos termos
  14. 14. 15 NPI/PMO INCIDENT MANAGER – VERSÃO II
  15. 15. 16 NPI/PMO INCIDENT MANAGER - PROCESSO JDE= jde Jd Edwards = jde JDE1 = jde
  16. 16. 17 NPI/PMO INCIDENT MANAGER - PRÓXIMOS PASSOS TF-IDF Análise de Bi-Gramas Classificação de chamados (Redes Bayesianas) Acesso à base de dados do Service Now Processo de deploy corporativo (Global) Banco de dados de alta performance – Cassandra + Presto
  17. 17. 18 NPI/PMO INCIDENT MANAGER - PRÓXIMOS PASSOS Sejamos a mudança que esperamos no mundo

×