1. Minería de datos
Dr. Francisco J. Mata
1
Introducción a la
minería de datos
Tema 1
2. 2
Temario
¿Qué es minería de datos?
¿Quién usa minería de datos?
¿Por qué de la minería de datos?
Ciclo virtuoso de la minería de datos
Resumen de principales técnicas de
minería de datos
Minería de datos
Dr. Francisco J. Mata
3. 3
Definición de minería de
datos
Minería de datos es la exploración y
análisis de grandes cantidades de datos
con el objeto de encontrar patrones y
reglas significativas (conocimiento)
Minería de datos
Dr. Francisco J. Mata
4. 4
Metas de la minería de datos
Permitir a una organización MEJORAR
_____ a través de un mejor
CONOCIMIENTO de _______
Mejorar la ventaja competitiva
Minería de datos
Dr. Francisco J. Mata
5. La minería de datos es un campo
5
multidisciplinario
Minería de datos
Minería de datos
Dr. Francisco J. Mata
Inteligencia
Artificial
(“Machine
Learning”)
Estadística
Bases de
Datos
(VLDB)
Graficación y
visualización
Ciencias de
la información
Otras
disciplinas
6. 6
La minería de datos es un
subconjunto de la inteligencia de
negocios
Minería de datos
Dr. Francisco J. Mata
7. No existe un solo enfoque para minería de datos
7
Minería de datos
Proceso de utilizar datos “crudos” para inferir
importantes relaciones entre ellos
Colección de técnicas poderosas para analizar
grandes volúmenes de datos
sino un conjunto de técnicas que se pueden
utilizar de manera independiente o en
combinación
Existe una relación con la estadística, aunque
frecuentemente se separan las técnicas que no
están basadas en métodos estadísticos
Minería de datos
Dr. Francisco J. Mata
8. 8
Tipos de aplicaciones de la
minería de datos
Aplicaciones o problemas de minería de
datos pueden clasificarse en las
siguientes categorías
Minería de datos
Dr. Francisco J. Mata
Clasificación
Estimación
Pronóstico
Asociación
Agrupación o segmentación
9. 9
Clasificación
Examinar las características de un nuevo
objeto y asignarle una clase o categoría
de acuerdo a un conjunto de tales objetos
previamente definido
Minería de datos
Dr. Francisco J. Mata
Ejemplos:
Clasificar aplicaciones a crédito como bajo,
medio y alto riesgo
Detectar reclamos fraudulentos de seguros
10. 10
Estimación
Relacionado con clasificación
Mientras clasificación asigna un valor
discreto, estimación produce un valor
continuo
Minería de datos
Dr. Francisco J. Mata
Ejemplos:
Estimar el precio de una vivienda
Estimar el ingreso total de una familia
11. 11
Pronóstico
Predecir un valor futuro con base a
valores pasados
Minería de datos
Dr. Francisco J. Mata
Ejemplos:
Predecir cuánto efectivo requerirá un cajero
automático en un fin de semana
12. Determinar cosas u objetos que van juntos
12
Asociación
Minería de datos
Dr. Francisco J. Mata
Ejemplo:
Determinar que productos se adquieren
conjuntamente en un supermercado
13. 13
Agrupación o segmentación
Dividir una población en un número de
grupos más homogéneos
No depende de clases pre-definidas a
diferencia de clasificación
Minería de datos
Dr. Francisco J. Mata
Ejemplo:
Dividir la base de clientes de acuerdo con los
hábitos de consumo
14. 14
Usos de la minería de datos
Administración de la relación con los
clientes:
Identificar nuevos clientes potenciales para
aumentar ventas
Ampliar la base de cliente con la mínima
inversión por parte de la empresa
Retener clientes existentes evitando que se
vayan a la competencia (“attrition”)
Vender más a clientes existentes (“ventas
cruzadas”)
Minería de datos
Dr. Francisco J. Mata
15. Detección de fraudes en el uso de tarjetas
de crédito
15
Usos de la minería de datos
Determinar patrones que puedan estar
relacionados con lavado de dinero
Determinar el precio de una casa con
base en sus características y el precio de
otras casas vendidas
Minería de datos
Dr. Francisco J. Mata
16. 16
Ejercicio en grupos
Equipos: 3 personas máximo
Minería de datos
Dr. Francisco J. Mata
Objetivos:
Identificar situaciones concretas para utilizar
la minería de datos (10 minutos)
Reportar a la clase verbalmente (3 minutos)
Las situaciones identificadas
Tipo de aplicación o problema de minería de datos
relacionado
Los beneficios esperados de aplicar la minería de
datos
17. 17
Usos de la minería de datos
Usos de la minería de datos se han
ampliado con el comercio electrónico
Minería de datos
Dr. Francisco J. Mata
19. 19
Disponibilidad de datos de
transacciones
Minería de datos
Dr. Francisco J. Mata
20. 20
¿Por qué de la minería de
datos?
Datos se encuentran disponibles
Poder computacional es cada vez menos
costoso
Las presiones competitivas son enormes
Software para minería de datos se
encuentra disponible
Minería de datos
Dr. Francisco J. Mata
21. 21
Ciclo virtuoso de la minería de
datos
Minería de datos
Dr. Francisco J. Mata
22. 22
Principales técnicas de minería
de datos
Análisis de canasta de supermercado
K vecinos más cercanos
Detección de grupos
Análisis de encadenamiento
Árboles de decisión
Redes neuronales artificiales
Algoritmos genéticos
Minería de datos
Dr. Francisco J. Mata
23. Resumen técnicas de minería de
23
datos
Análisis de canasta de supermercado
Agrupar objetos que aparecen juntos
Minería de datos
Dr. Francisco J. Mata
Ejemplos:
Pañales y cervezas
24. Resumen técnicas de minería de
24
datos
K vecinos más cercanos
Determinar los K vecinos más cercanos en
instancias conocidos con el objeto de
clasificar o hacer una predicción sobre una
instancia desconocida
Ejemplo: Dado un reclamo para un seguro
determinar basado en reclamos similares
(vecinos) si se debe pagar o investigar
Minería de datos
Dr. Francisco J. Mata
25. Resumen técnicas de minería de
25
datos
Detección de grupos
Encontrar objetos similares entre sí
Ejemplos: tipificar clases de clientes
Minería de datos
Dr. Francisco J. Mata
26. Resumen técnicas de minería de
26
datos
Análisis de encadenamiento
Encuentra relaciones entre objetos de
acuerdo con patrones
Relacionado con la teoría de grafos
Minería de datos
Dr. Francisco J. Mata
Ejemplos:
Relaciones entre individuos basados en llamadas
telefónicas
Relaciones entre casos criminales de acuerdo con
sus características
27. Resumen técnicas de minería de
Ejemplos: determinar el sexo o grupo de edad
de una persona en función a una serie de
preguntas contestadas
27
datos
Árboles de decisión
Dividir objetos en grupos asociando reglas
para la asignación de los objetos en su
correspondiente grupo
Minería de datos
Dr. Francisco J. Mata
28. Resumen técnicas de minería de
Modelos simples de interconexiones
neuronales en el cerebro que aprenden de un
conjunto de adiestramiento y generalizan
patrones dentro de él con el objeto de
clasificar, estimar o predecir
28
datos
Redes neuronales artificiales
Más común de las técnicas y para algunos
sinónimo de minería de datos
Ejemplo: estimar el valor de una casa
tomando en cuenta el precio pagado por
Minería de datos
casas similares
Dr. Francisco J. Mata
29. Resumen técnicas de minería de
29
datos
Algoritmos genéticos
Aplican la mecánica de la genética y la
selección natural para encontrar un conjunto
de parámetros óptimos para una función
predictiva
Utilizados para entrenar redes neuronales
artificiales
Minería de datos
Dr. Francisco J. Mata
30. Resumen técnicas de minería de
30
datos
Técnicas mencionadas pueden utilizarse en
varias aplicaciones o problemas de minería de
datos
Ejemplo: árboles de decisión sirven para detectar
grupos, clasificar y predecir
Varias técnicas pueden ser utilizadas en una
misma aplicación o problema de minería de
datos
Ejemplo: K vecinos más próximos, árboles de
decisión y redes neuronales artificiales pueden
utilizarse para clasificación
Minería de datos
Dr. Francisco J. Mata