Fraudes em Sistemas Publicitários Online: Estudo, Forense e Auditoria
1. FRAUDES EM SISTEMAS
PUBLICITÁRIOS ONLINE:
ESTUDO, FORENSE E AUDITORIA
POC I e II
Bernardo Maia Rodrigues
Virgílio A. F. Almeida
18/06/2010
2. Contextualização
• Crescimento da comunicação digital
• Internet: Mídia que mais cresceu no Brasil em
2009 – 23,27% em relação a 2008
• Faturamento mercado publicitário brasileiro:
– 2008: R$759 Milhões
– 2009: Mais de R$1000 Milhões (estimativa)
• Fonte: IAB (Interactive Media Bureau)
3. Contextualização
• Indústria de mídia publicitária mundial:
– Déficit de 12% entre 2008 e 2009
– Publicidade Online: Crescimento de 7%
• Fonte: Business Insider
• Mercado publicitário: direcionado para os
meios eletrônicos
5. Metodologia e Escopo
• POC I:
– Estudo bibliográfico
– Funcionamento da plataforma de publicidade
Online
– Pesquisa:
• Estudo de caso: Investigar um fenômeno dentro de
um contexto local e real
• Tipos de Fraudes
• Formas de ataque
• Modus Operandi
6. Metodologia e Escopo
• POC II:
– Consolidação dos estudos sobre Click Frauds
– Amostragem de Logs
– Testes, visualização
– Modelagem: Redes complexas
– Auditoria e Forense
7. Histórico
• Início 90: Internet Comercial
• Vendas impulsionadas pelo mercado
Online
• Divulgação de produtos e serviços
• Sistemas interativos, simples: contato,
e-mail, telefone, formulários online
8. Histórico
• Boom da Internet
• Domínio .com (comercial)
• Diretórios, Banners
• Mecanismos de busca (keywords)
• Comportamento de navegação
• Empresas pagavam para serem
listadas (diretórios, resultados de
buscas)
11. Modelos de Receita
CPM • Cost per Mille
CPC • Cost per Click
CPA • Cost per Action
12. CPM: Cost per Mille
• Preço fixo por exibições
• Impressões (termo herdado da publicidade
tradicional)
• Contabilização: simples
• Spam de impressão: coletores, visitantes não
legítimos
13. CPM: Google AdWords
• Complexidade: infra-estrutura para vender
banners e anúncios
• Redes de anúncios
• Anúncios textuais direcionados (palavras
chave)
• Exibição de propagandas no topo dos
resultados e na lateral
• Migração mercado: número de cliques e
não impressões
15. CPC: Cost per Click
• Overture/Yahoo: 1998
• AdWords: Remodelado em 2002 para PPC
• Espaços mais destacados:
– Quanto anunciante estava disposto a pagar
– Qualidade/Taxa de click-through
• Cliques: “votos” para aumentar a relevância do
anúncio
• Fraudes: Click Frauds
16. CPC: Google AdSense
• 2003: Google AdSense
• Publicadores podiam ganhar dinheiro
• Espaços reservados nas páginas
• Google lucrava e pagava percentual das
receitas aos publicadores
• Incentivo à fraude
18. CPC: Google AdSense
• Diretrizes: “Cliques nas propagandas do
Google devem resultar de um interesse
genuíno do usuário”.
– Foi iniciado por um usuário real no seu Web site
– O clique atual foi realizado por uma pessoa real
– O clique é resultado de um interesse genuíno de
uma pessoa real no conteúdo da propaganda
19. CPC: Google AdSense
• Não “encorajar” cliques nos anúncios
• Anúncios em locais bem definidos
• Gráficos, blocos e layouts nas
proximidades do anúncio: devem
seguir regras específicas.
• “Landing page quality guidelines”
20. CPA: Cost per Action
• Pagamento por cliques que resultam em
uma venda efetiva
• Anunciante paga à rede somente depois
de receber o pagamento do
produto/serviço
• Atuação limitada
• Melhor ROI para o anunciante
32. Auditoria e Forense
• Dados:
– ID Visitante: IP, User Agent, Cookies
– Informações da origem: URL de origem
– Identificação do clique: ID clique, Data, Horário
– Destino do clique: URL propaganda, identificador,
palavra chave relacionada
– Palavra chave que resultou na propaganda
– Taxa de conversão
38. GeoIP Database, Whois
IP Cidade Estado País
139.82.64.* Rio De Janeiro Rio de Janeiro Brazil
143.106.109.* Campinas Sao Paulo Brazil
143.106.38.* Campinas Sao Paulo Brazil
143.107.151.* São Paulo Sao Paulo Brazil
143.54.1.* Porto Alegre Rio Grande do Sul Brazil
143.54.208.* Porto Alegre Rio Grande do Sul Brazil
146.164.114.* Rio De Janeiro Rio de Janeiro Brazil
157.86.255.* Rio De Janeiro Rio de Janeiro Brazil
187.0.120.* Londrina Parana Brazil
187.10.100.* Carapicuíba Sao Paulo Brazil
187.10.167.* São Paulo Sao Paulo Brazil
187.1.254.* Sete Lagoas Minas Gerais Brazil
200.138.250. * Florianópolis Santa Catarina Brazil
200.138.254.* Florianópolis Santa Catarina Brazil
200.138.33.* Curitiba Parana Brazil
200.139.141.* Uberaba Minas Gerais Brazil
200.175.79.* Curitiba Parana Brazil
200.181.10.* Brasília Distrito Federal Brazil
200.181.120.* Campo Grande Mato Grosso do Sul Brazil
200.251.234.* Belo Horizonte Minas Gerais Brazil
46. Forense: Redes Complexas
• Formação de
“comunidades”
– Vértices densamente
conectados
– Padrões de interação
– Características comuns
– Mineração de dados
47. Conclusão e Resultados
• Click Frauds: Realidade
• Identificar cliques fraudulentos: melhora ROI
do anunciante
• Interesses conflitantes: “Is Google Evil?”
• Plataformas x Fraudes
49. Conclusão e Resultados
• Brasil
– Menor complexidade, Coerção, Clickjacking, PTC
– Fraude envolvendo empresas de publicidade
brasileiras
• Mundo:
– Esquemas complexos
– “Rings”, Malwares, Crime organizado
– Lucros consideráveis
50. Conclusão e Resultados
• Log e auditoria: complexidade
• Falta de informações, falsos positivos
• Requer grande volume de dados
• Correlacionamento de eventos
• Visualização
• Redes Complexas: relações, comportamentos
semelhantes, “comunidades”