Presentación Minería de Datos

3,076 views

Published on

Published in: Business
  • Be the first to comment

Presentación Minería de Datos

  1. 1. “Torturando a los datos para que nos digan la verdad” Mini Curso: Introducción a la Minería de Datos
  2. 2. www.dataminingperu.com Agenda Introducción Que es Minería de Datos Metodología CRISP Casos Aplicativos Preguntas
  3. 3. www.dataminingperu.com Introducción  Día a día se almacenan gigantescas cantidades de datos.  La información que se almacena no representa mayores costos y se almacenan con la esperanza de analizarlos mas adelante. “Se estima que la cantidad de información en el mundo se duplica cada 20 meses.”
  4. 4. www.dataminingperu.com Niveles de conocimiento
  5. 5. www.dataminingperu.com Que es la Minería de Datos Extracción no trivial de información implícita, previamente desconocida y potencialmente útil, a partir de los datos. La Minería de Datos es un conjunto de técnicas de análisis de datos que permiten: - Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. - Extraer patrones y tendencias para predecir comportamientos futuros.
  6. 6. www.dataminingperu.com Que es la Minería de Datos
  7. 7. www.dataminingperu.com Evolución 60’s: Informes batch: • la información es difícil de encontrar y analizar, poco flexible, se necesita reprogramar cada petición. 70’s: Primeros DSS (Decision Support Systems) y EIS (Executive Information Systems): •basados en terminal, no integrados con el resto de herramientas. 80’s: Acceso a datos y herramientas de análisis integradas (conocidas como intelligent business tools): •Herramientas de consultas e informes, hojas de cálculo, interfaces gráficos e integrados, fáciles de usar. •Acceden a las bases de datos operacionales (“killer queries”). 90’s: Almacenes de Datos y herramientas OLAP. 00’s: Herramientas de Minería de Datos y Simulación.
  8. 8. www.dataminingperu.com Herramientas para la toma de Decisiones Herramientas de Toma de Decisiones Base de Datos Transaccional Fuentes Internas Fuentes Externas Fuente de Datos Fuente de Datos 3 HTML Fuente de Datos 1 texto Almacén de Datos ETL Interfazy Operadores Herramientas de consultas e informes Herramientas EIS Herramientas OLAP Herramientas de Minería de Datos
  9. 9. www.dataminingperu.com Clasificación de Algoritmos de Minería de Datos
  10. 10. www.dataminingperu.com Aplicaciones de la Minería de Datos Banca • Determinación de Fraude con el uso de Tarjetas de Crédito • Generación de Score de Riesgos para clientes morosos. Retail • Analisis de Canasta • Propensión a la compra de Productos Estrella Marketing • Targeting de acciones de Marketing • Fidelización de Clientes Web • Web Mining • Optimización de Portales Web
  11. 11. www.dataminingperu.com Ejemplos de Minería de Datos Objetivo. Identificar a todos los posibles clientes que están haciendo uso indebido del servicio de telefonía móvil revendiendo ilegalmente la misma. Telefonía Móvil: Propensión para la detección de Chalequeros Arboles de Decisión
  12. 12. www.dataminingperu.com Aplicación en Web Mining Google Wikipedia El Comercio
  13. 13. www.dataminingperu.com Herramientas Comerciales Open Source
  14. 14. www.dataminingperu.com Fases del Modelo Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Desarrollo Fases del Proyecto de Minería de datos
  15. 15. www.dataminingperu.com Comprensión del Negocio Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Desarrollo Determinar los Objetivos del Negocio Evaluar la situación Determinación de los Objetivos de Minería de Datos Elaborar el Plan del Proyecto
  16. 16. www.dataminingperu.com Comprensión del Negocio Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Desarrollo Recolectar Datos Iniciales Describir los Datos Explorar los Datos Calidad de los Datos
  17. 17. www.dataminingperu.com Comprensión del Negocio Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Desarrollo Seleccionar Conjunto de Datos Data Cleaning Integrar los Datos
  18. 18. www.dataminingperu.com Data Cleaning • Generación de datos de calidad. • Datos primarios pueden llevar a conclusiones erroneas en el análisis. • Mejora Considerable en el proceso de Análisis de Datos. Data Collecting Data Cleaning Data Transformation Data Reduction •Se obtiene datos de diferentes fuentes. •Resuelve conflictos entre datos. •Elimina Outliers •Transformación y consolidación de los datos •Selección de caracteristicas. •Muestra del total. Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Desarrollo Data Cleaning
  19. 19. www.dataminingperu.com Comprensión del Negocio Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Desarrollo Escoger la Técnica de Modelado Generar la prueba de control Construir el modelo Evaluación de Modelos
  20. 20. www.dataminingperu.com Comprensión del Negocio Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Desarrollo Evaluar los Resultados Revisar el Proceso Determinar los Próximos pasos
  21. 21. www.dataminingperu.com Comprensión del Negocio Comprensión del Negocio Comprensión de los Datos Preparación de los Datos Modelado Evaluación Desarrollo Desarrollo del Plan Supervisión y Mantenimiento Informe Final Revisar el Proyecto
  22. 22. www.dataminingperu.com Consultas Consultas

×