Leonardo
Upcoming SlideShare
Loading in...5
×
 

Like this? Share it with your network

Share

Leonardo

on

  • 1,251 views

 

Statistics

Views

Total Views
1,251
Views on SlideShare
1,248
Embed Views
3

Actions

Likes
0
Downloads
13
Comments
0

1 Embed 3

http://www.slideshare.net 3

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Leonardo Presentation Transcript

  • 1. Aplicando técnicas de mineração de dados em ambientes corporativos I Semana Ciência da Informação da FURG 13/03/2009 Prof. Dr. Leonardo Emmendorfer Centro de Ciências Computacionais - FURG leonardo.emmendorfer@gmail.com
  • 2. Objetivos • Contextualizar os ambientes organizacionais • Motivar a relevância das ferramentas automatizadas para obtenção de informação e conhecimento • Apresentar técnicas de mineração de dados como ferramentas para apoio à decisão em organizações
  • 3. Organizações • Entidades sinergéticas • Sistemas dinâmicos • Sutil equilíbrio entre uma estrutura rígida (organograma) e a auto-organização. • Abordagem holística para o estudo das organizações
  • 4. Valores Organizacionais bens intangíveis dados TOMADA DE informação DECISÃO conhecimento
  • 5. DADO Elementos brutos, sem significado, desvinculado da realidade. “Observações sobre o estado do mundo” Davenport, 1998 São símbolos e imagens que não reduzem nossas incertezas.
  • 6. seleção identificação coleta aquisição registro classificação armazenamento processamento recuperação análise apresentação difusão
  • 7. seleção identificação coleta aquisição registro classificação armazenamento processamento recuperação análise apresentação difusão
  • 8. INFORMAÇÃO “Dados com significado, relevância e propósito.” ( Drucker apud Davenport, 1998)) “Conjunto de dados contextualizados que visam fornecer uma solução para determinada situação de decisão.” (MacDonough apud Lussato, 1991) “Matéria-prima para o conhecimento.” ( Malhorta,1993)
  • 9. Dado x Informação • Informação: medida da redução da incerteza após observar um dado • Relacionado à freqüência da ocorrência de um evento
  • 10. Exemplo Dado: • “O professor foi à farmácia no dia 13/03 às 9:27 e comprou uma pílula branca.”  pouco informativo...
  • 11. Exemplo Dado: • “O professor foi à farmácia no dia 13/03 às 9:27 e comprou uma pílula AZUL.”  BEM MAIS INFORMATIVO!!
  • 12. CONHECIMENTO “Conhecer é o processo de compreender e internalizar as informações recebidas, possivelmente combinando-as de forma a gerar mais conhecimento. “ (Merton apud Gonçalvez, 1995)
  • 13. Aprendizagem organizacional Capacidade de uma organização identificar e armazenar conhecimento resultante de experiências individuais e organizacionais e de modificar seu comportamento de acordo com os estímulos percebidos no ambiente.
  • 14. Tecnologia e Informação • As tecnologias potencializam o processo aprendizado organizacional. • Aumentam a capacidade de aquisição de dados. • Mas e quanto à informação e ao conhecimento?
  • 15. Conhecimento Organizacional •Formal •Informal, ou tácito A mineração de dados potencializa a aquisição de: •Conhecimento empírico
  • 16. Mineração de Dados •Grande disponibilidade de dados armazenados eletronicamente •A quantidade de dados duplica a cada 3 anos •Existem informações e conhecimentos úteis, escondidos, nesses grandes volumes de dados •É possível prever um comportamento futuro (ir além do armazenamento explícito de dados).
  • 17. • O que é mineração de dados: – “é o processo de extração de conhecimento de grandes bases de dados, convencionais ou não”. – Utiliza técnicas computacionais que procuram relações de similaridade ou discordância entre dados. – Seu objetivo é encontrar, automaticamente, padrões, anomalias e regras com o propósito de transformar dados, aparentemente ocultos, em informações úteis para a tomada de decisão e/ou avaliação de resultados. Fernando S. Goulart Júnior & Robson do Nascimento Fidalgo (1998)
  • 18. • Exemplo: Fabricante Estado Cidade Cor do Produto Lucro Smith CA Los Angeles Azul Alto Smith AZ Flagstaff Verde Baixo Adams NY NYC Azul Alto Adams AZ Flagstaff Vermelho Baixo Johnson NY NYC Verde Médio Johnson CA Los Angeles Vermelho Médio •Conclusões: •Produtos azuis são de alto lucro ou •Arizona é um lucro baixo
  • 19. •Uma empresa utilizando data mining é capaz de: – Criar parâmetros para entender o comportamento do consumidor; – Identificar afinidades entre as escolhas de produtos e serviços; – Prever hábitos de compras; – Analisar comportamentos habituais;
  • 20. •Principais áreas de aplicação da Mineração de Dados: – Marketing – Detecção de fraudes – Análise de risco – Descobertas científicas
  • 21. •Principais áreas de aplicação da Mineração de Dados: – Marketing – Detecção de fraudes – Análise de risco – Descobertas científicas
  • 22. Exemplo: •Marketing: Customer relationship management – Quais são os clientes que mais respondem a ofertas? •Identificar consumidores “leais”, ou “em atrito”
  • 23. Exemplo: •Detecção de fraudes – Operações financeiras que fogem do padrão: altamente informativas
  • 24. Exemplo: • Análise de risco – Identificar perfis de clientes com maior risco de (crédito)
  • 25. • Bank of America (Info 03/98) – Selecionou entre seus 36 milhões de clientes • Aqueles com menor risco de dar calotes • Tinham filhos com idades entre 18 e 21 anos • Resultado em três anos o banco lucrou 30 milhões de dólares com a carteira de empréstimos.
  • 26. Exemplo: • Descobertas científicas – Expressividade de genes (redes regulatórias)
  • 27. • Como funciona? – Classificação – Agrupamento – Associação
  • 28. • Classificação – Separar grupos de clientes por risco – Novos clientes (com comportamento desconhecidos a priori) são pré-rotulados de acordo com o grupo em que se encaixam
  • 29. • Árvores de decisão: (ID3) Classificação de um indivíduo de acordo com o risco de crédito Renda > R$ 4.000,00 SIM NÃO Idade > 23 anos Sexo=M SIM NÃO NÃO SIM Recebe crédito Não recebe Recebe crédito Não recebe regras são induzidas a partir padrões dos dados e cria-se uma hierarquia de indicações “se-então”.
  • 30. • Agrupamento – Permite identificar segmentações de mercado adequadas – Revela padrões antes desconhecidos
  • 31. • Regras de associação – Quais produtos costumam ser comprados em associação – Exemplo: fraldas+cervejas – Homens casados, entre 25 e 30 anos, compravam fraldas e/ou cervejas às sextas- feiras.
  • 32. Conclusão • Existem ferramentas disponíveis, as quais são úteis no tratamento de informação e na aquisição automática de conhecimento • Profissional de Ciência da Informação: importante usuário potencial destas técnicas
  • 33. • Espaço para interação e diálogo entre as áreas.... vamos começar pela FURG? • Multigrupo FURG: um primeiro passo
  • 34. • OBRIGADO!!! leonardo.emmendorfer@gmail.com