Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Minería de datos y kdd

Minería de Datos y KDD

  • Login to see the comments

Minería de datos y kdd

  1. 1. MINERÍA DE DATOS Y KDD ASIGNATURA: MINERÍA DE DATOS AUTORA: YAZMIN CUAPIO
  2. 2. KDD KDD (Descubrimiento del Conocimiento en Bases de Datos) es un proceso que consta de un conjunto de fases, una de las cuales es la minería de datos, este segundo término se refiere a la aplicación de un algoritmo para extraer patrones de datos y KDD se refiere al proceso completo que incluye el procesamiento de datos.
  3. 3. En forma detallada y clara que el KDD es la extracción de conocimiento interesante, previamente desconocidos, útiles y predictivos de la información de BD.
  4. 4. Este proceso consta de fases o técnicas, que a continuación se dará una descripción de cada una de ellas. Figura 1. Etapas del proceso KDD.
  5. 5. FASES 1. Selección de datos: En esta primera etapa se determinan las fuentes de datos, el tipo de información a utilizar, aquí los datos relevantes para el análisis son extraídos desde una fuente de datos.
  6. 6. 2. Preprocesamiento: Consiste en la preparación y limpieza de los datos extraídos desde las distintas fuentes de datos en una forma manejable, necesaria para realizar las fases posteriores; en dicha etapa se utilizan algunas estrategias para manejar datos.
  7. 7. 3. Transformación: Consiste en el tratamiento preliminar de los datos, transformación y generación de nuevas variables a partir de las ya existentes con una estructura apropiada; además se realizan operaciones de agregación o normalización consolidando los datos para la siguiente fase.
  8. 8. 4. Data Mining (Minería de Datos): Es la fase de modelamiento en donde métodos son aplicados con el objetivo de extraer patrones desconocidos, válidos, nuevos, útiles, comprensibles y que pueden estar contenidos u ocultos en los datos. Existen dos técnicas de minería de datos para extraer el tipo de conocimiento que se desea: • Directed data mining. • Undirected data mining.
  9. 9. 5. Interpretación y evaluación: Se identifican los patrones obtenidos realmente interesantes, basándose en algunas medidas y se realiza una evaluación de los resultados obtenidos.
  10. 10. Como se pudo ver KDD se compone de cinco etapas que permiten procesar grandes cantidades de datos, identificar los patrones más significativos y relevantes para presentarlos como conocimiento apropiado para satisfacer las metas de un usuario. Al igual que a partir de un conjunto de datos voluminoso e ininteligible puede convertirlo en otro más abstracto y útil.

×