O documento discute como a 99Taxis usa o Splunk para agregar logs de sistemas, permitindo buscas entre sistemas, monitoramento em tempo real de métricas chave e análises que melhoram a agilidade e tomada de decisões. Isso superou desafios de visibilidade e troubleshooting em um ambiente complexo com dezenas de sistemas e 100GB de logs diários.
2. 2
Agenda
• Sobre a 99Taxis
• Desafios que levaram ao Splunk
• Troubleshooting: análise de errors / performance
• Monitoramento de métricas de sistema
• Monitoramento de métricas de negócio
3. 3
Agenda
• Sobre a 99Taxis
• Desafios que levaram ao Splunk
• Troubleshooting: análise de errors / performance
• Monitoramento de métricas de sistema
• Monitoramento de métricas de negócio
4. Drag image to add client logo
4
Aplicativo líder nacional para chamar táxi
Aplicativo melhor avaliado na categoria transporte –
mundo!
Disponível para iOS, Android e WP
Presente em mais de 300 cidades
100k+ taxistas cadastrados
20M+ corridas realizadas
2M+ corridas/mês
400k+ requisições por minuto
5. 5
Ricardo Lazaro
• Formado em ciências da computação – turma 2002 USP
• Programador Scala, Java, Ruby
• Adepto ao “Keep it simple”
• Atende ao nome de Ricardo, Lazaro e Jack!
6. 6
Troubleshooting
• Empresa ~= 1 máquina rodando
• O que aconteceu com essa chamada de táxi? “hum...Let's grep it”
Pouco mais de um ano atrás
7. 7
Troubleshooting
10+ sistemas interconectados
Impossível entrar em todos os sistemas/todas as máquina/todos os arquivos
Cada aplicação contendo de 3 a n máquinas
~100GB de logs por dia
O que aconteceu com essa chamada de táxi? X...
hoje
8. 8
Troubleshooting
10+ sistemas interconectados
Impossível entrar em todos os sistemas/todas as máquina/todos os arquivos
Cada aplicação contendo de 3 a n máquinas
~100GB de logs por dia
O que aconteceu com essa chamada de táxi? X...
hoje
9. 9
Splunk
• Centralizando logs: Todas as máquinas da 99Taxis conectadas ao splunk
Benefícios:
• Busca cross-system: Possibilidade de acompanhar o ciclo de cada requisição,
passando por diferentes sistemas, independente da máquina
• Unificação de busca: Splunk search language para qualquer sistema
• Busca temporal: o que aconteceu em HH:mm:ss.SSS?...easy!
• Monitoramento/Alarmes unificados
10. 10
Splunk Enterprise na 99Taxis
Forwarder- Linux Forwarder- Linux Forwarder- Linux Forwarder- Linux
13. 13
Monitoramento/Inteligência/ABC...Test
Como testar que algoritmo é melhor? (por dia/hora/estado/cidade/....)
( ) Contratar engenheiros da Nasa e juntar n bases de dados
(V) Splunk, com instruções tão simples quanto … | stats count by city version ...
14. 15
Benefícios
• Visibilidade sobre comportamento de ambos, sistemas e processos
• Não trabalhamos com suposições - olhamos gráficos
• Agilidade no entendimento e solução de problemas
Agilidade em tomadas de decisão – testes ABC...
Foco 100% no negócio, com bootstrap simplificado e de baixa
manutenção
15. 16
Próximos passos
• Deixar o Splunk ainda mais próximo do time de BI, usando apps como
db connector para relacionar dados de banco com dados de log
• Usar API para exportar principalmente métricas realtime para taxistas e
passageiros
• Segunrança
• Outros...