Descubrimiento de Conocimiento en Bases de Datos <ul><li>“ Proceso  no trivial de identificación de patrones  válidos ,  n...
Descubrimiento de Conocimiento en Bases de datos <ul><li>Implícitamente existe una medida (definida por el usuario), que d...
Metas <ul><li>Procesar automáticamente grandes cantidades de datos crudos, </li></ul><ul><li>Identificar los patrones más ...
Areas Relacionadas <ul><li>KDD es un nuevo campo multidisciplinario </li></ul>Recono. de patrones Soft computing Aprend. C...
Areas Relacionadas <ul><li>Tecno. BD y Bodegas de Datos: maneras eficientes de almacenar, accesar y manipular datos </li><...
Componentes: Interface Evaluación Extracc. Patrones BD Conocimiento Del dominio Interface BD Control Foco de Atención
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos => KDD involucra interacciones ...
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Tradicional mente   una...
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>S elec ción  de conjunt...
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Limpieza de datos y pre...
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Transforma c i ó n  al ...
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Búsqueda de patrones de...
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>El modelo: </li></ul><u...
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos Proceso de  KDD <ul><li>Crucial...
Proceso de  KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Realizar acciones </li>...
Upcoming SlideShare
Loading in …5
×

Parte1

554 views

Published on

Published in: Technology, Business
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
554
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
7
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Parte1

  1. 1. Descubrimiento de Conocimiento en Bases de Datos <ul><li>“ Proceso no trivial de identificación de patrones válidos , novedosos , potencialmente útiles y deseablemente entendibles a partir de datos” </li></ul><ul><ul><li>proces o : KDD es iterativo, al encontrar información útil en los datos, se realizan mejores preguntas </li></ul></ul><ul><ul><li>v á lid o : generalizable para el futuro </li></ul></ul><ul><ul><li>nov edoso : desconocido con anterioridad </li></ul></ul><ul><ul><li>útil : aplicable, útil para nuestra meta </li></ul></ul><ul><ul><li>entendible : nos lleva a comprensión </li></ul></ul>
  2. 2. Descubrimiento de Conocimiento en Bases de datos <ul><li>Implícitamente existe una medida (definida por el usuario), que determina qué tan interesantes pueden ser los patrones. </li></ul><ul><li>Existe un pre- y post-procesamiento significativo de datos </li></ul><ul><li>La extracción de patrones (minería) de los datos ocupa solo el 15%-20% del esfuerzo total del proceso de KDD </li></ul>
  3. 3. Metas <ul><li>Procesar automáticamente grandes cantidades de datos crudos, </li></ul><ul><li>Identificar los patrones más significativos y relevantes, y </li></ul><ul><li>Presentarlos como conocimiento apropiado para satisfacer las metas del usuario. </li></ul>
  4. 4. Areas Relacionadas <ul><li>KDD es un nuevo campo multidisciplinario </li></ul>Recono. de patrones Soft computing Aprend. Computa. Estadística Base de datos Cómputo de alto desempeño Visualización KDD
  5. 5. Areas Relacionadas <ul><li>Tecno. BD y Bodegas de Datos: maneras eficientes de almacenar, accesar y manipular datos </li></ul><ul><li>Aprend., estadística, soft computing* : desarrollo de técnicas para extraer conocimiento de datos </li></ul><ul><li>Reconocimiento de patrones: desarrollo de herramientas de clasificación </li></ul><ul><li>Visualización: interfaz entre humanos y datos/patrones </li></ul><ul><li>Cómputo de alto desempeño: mejora de desempeño de algoritmos debido a su complejidad y cantidad de datos </li></ul><ul><li>(*) redes neuronales, lógica difusa, algoritmos genéticos, razonamiento probabilístico </li></ul>
  6. 6. Componentes: Interface Evaluación Extracc. Patrones BD Conocimiento Del dominio Interface BD Control Foco de Atención
  7. 7. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos => KDD involucra interacciones complejas con herramientas heterogéneas.
  8. 8. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Tradicional mente una simple tabla en ASCII </li></ul><ul><li>Tendencia a Bodegas de Datos que están optimizadas para proceso analítico </li></ul><ul><li>Herramientas de KDD pueden incluir mecanismos para almacenar y accesar datos </li></ul>
  9. 9. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>S elec ción de conjunto o subconjunto de bases de datos </li></ul><ul><li>S elec ción de subconjunto de variables a usar en DM </li></ul><ul><li>S elec cción de muestras de datos (instanc ia s) </li></ul>
  10. 10. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Limpieza de datos y preprocesamiento </li></ul><ul><li>Eliminación de ruido y casos extremos ( si apropia do y neces ario ) </li></ul><ul><li>Manejo de datos faltantes y desconocidos </li></ul>
  11. 11. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Transforma c i ó n al formato requerido por el algoritmo específico de minería de datos </li></ul>
  12. 12. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Búsqueda de patrones de interés en una forma particular de representación </li></ul><ul><ul><li>Pueden expresarse como un modelo, o </li></ul></ul><ul><ul><li>Como un patrón que expresa cierta dependencia entre datos </li></ul></ul><ul><li>Incluye clasifica c i ó n, regresi ó n, clustering, r. neuronales... </li></ul>
  13. 13. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>El modelo: </li></ul><ul><ul><li>Su función (clasifica c i ó n, regresi ó n, clustering, …) </li></ul></ul><ul><ul><li>Forma de representa rlo ( función linea l , conjunto de reglas , …) </li></ul></ul><ul><li>Criterio de preferencia </li></ul><ul><ul><li>Qué modelo dentro de un conjunto de modelos es el mejor ? </li></ul></ul><ul><ul><li>Qué conjunto de parámetros del modelo? </li></ul></ul><ul><li>Estrategia de búsqueda </li></ul>
  14. 14. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos Proceso de KDD <ul><li>Crucial! </li></ul><ul><li>Interpreta c i ó n de los patrones descubiertos , puede beneficiarse grandemente usando visualización </li></ul><ul><li>Puede borrar patrones redundantes o irrelevantes </li></ul><ul><li>Los patrones pueden compararse con conocimiento previamente almacenado (o extraido) </li></ul>
  15. 15. Proceso de KDD P roces o general de descubrimiento de conocimiento útil a partir de datos <ul><li>Realizar acciones </li></ul><ul><li>Incorpora r el conocimiento descubierto en un sistema de desempeño </li></ul><ul><li>Document ar el conocimiento y reportarlo a personas interesadas </li></ul>

×