Your SlideShare is downloading. ×
  • Like
5 t218162dw t_mineriadatos
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Now you can save presentations on your phone or tablet

Available for both IPhone and Android

Text the download link to your phone

Standard text messaging rates apply

5 t218162dw t_mineriadatos

  • 501 views
Published

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
501
On SlideShare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
35
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. DATAWAREHOUSE Datawarehouse Minería de Datos FundamentosCARRERA DEINGENIERÍADE SISTEMAS
  • 2. DATAWAREHOUSE Agenda ● Introducción. ● Data Mining. ● Fases de un Proyecto Data Mining. ● Arquitectura de un Data Mining. ● Funcionamiento del Data Mining. ● Tipos de problemas. ● Técnicas de Minería de Datos. ● Almacenes de datos. ● Ventajas de Almacenes de Datos.CARRERA DEINGENIERÍADE SISTEMAS
  • 3. DATAWAREHOUSE Introducción ● El desarrollo de varias tecnologías enfocadas a aprovechar los datos que se encuentran escondidos en estos grandes volúmenes de información.CARRERA DEINGENIERÍADE SISTEMAS
  • 4. DATAWAREHOUSE Introducción ● Las BDR, DW, Data Mart (DM), OLAP y OLTP obtienen conclusiones en base a consultas deductivas, en tiempos cortos y enormes volúmenes de información, imposibles en un proceso manual.CARRERA DEINGENIERÍADE SISTEMAS
  • 5. DATAWAREHOUSE Introducción ● Debido al gran volumen de datos el análisis de los datos ya no puede ser manual (ni incluso facilitado por herramientas de almacenes de datos y OLAP) sino que ha de ser (semi-)automático.CARRERA DEINGENIERÍADE SISTEMAS
  • 6. DATAWAREHOUSE Introducción ● Se define el data mining partiendo de la distinción entre datos, información y conocimiento.CARRERA DEINGENIERÍADE SISTEMAS
  • 7. DATAWAREHOUSE Introducción ● La minería de datos se diferencia en que no solo transforma y facilita el acceso a la información para que el usuario la analice más fácilmente. ● La minería de datos analiza los datos.CARRERA DEINGENIERÍADE SISTEMAS
  • 8. DATAWAREHOUSE Data Mining ● La Minería de Datos es un conjunto de técnicas de análisis de datos que permiten: – Extraer patrones, tendencias y regularidades para describir y comprender mejor los datos. – Extraer patrones y tendencias para predecir comportamientos futuros.CARRERA DEINGENIERÍADE SISTEMAS
  • 9. DATAWAREHOUSE Data Mining ● Los patrones válidos son un conjunto de datos, deben ser útiles para el proceso de prospección de datos y comprensibles para el usuario (KDD).CARRERA DEINGENIERÍADE SISTEMAS
  • 10. DATAWAREHOUSE Data Mining ● La prospección de datos ( data mining ) se inscribe en un proceso más amplio como es el del descubrimiento de conocimiento dentro de grandes bases de datos (KDD o knowledge discovery in databases ).CARRERA DEINGENIERÍADE SISTEMAS
  • 11. DATAWAREHOUSE Data Mining ● La minería de datos es sólo una etapa del proceso de extracción de conocimiento a partir de datos.CARRERA DEINGENIERÍADE SISTEMAS
  • 12. DATAWAREHOUSE Data Mining ● Este proceso consta de varias fases: – Preparación de Datos (selección, limpieza, y transformación), Minería de Datos, Evaluación, Difusión y Uso de Modelos.CARRERA DEINGENIERÍADE SISTEMAS
  • 13. DATAWAREHOUSE Fases de un proyecto de Data Mining ● Los pasos a seguir son: – Filtrado de datos: ● El formato de las fuentes de datos no es el idóneo. No es posible aplicar minería de datos en datos en bruto. Actividad de Preprocesamietno – Selección de Variables: ● La selección de características reduce el tamaño de los datos eligiendo las variables mas influyentes en el modelo de conocimiento.CARRERA DEINGENIERÍADE SISTEMAS
  • 14. DATAWAREHOUSE Fases de un proyecto de Data Mining ● Los pasos a seguir son: – Extracción del conocimiento: ● Mediante técnicas se obtiene un modelo de conocimiento, que representa patrones de comportamiento observados. – Interpretación y evaluación: ● Se valida el resultado, comprobando las conclusiones sean satisfactorias. Comprobar los modelos obtenidos. Modificar los pasos para los modelos si ninguno es satisfactorio.CARRERA DEINGENIERÍADE SISTEMAS
  • 15. DATAWAREHOUSE Arquitectura de Minería de DatosCARRERA DEINGENIERÍADE SISTEMAS
  • 16. DATAWAREHOUSE Funcionamiento del Data Mining ● El data mining trabaja en un nivel superior buscando: – patrones de conducta, – agrupaciones, – secuencias, – tendencias o – asociaciones de datos ● que puedan generar algún modelo que permita entender mejor el dominio con el objetivo de facilitar la toma de decisiones.CARRERA DEINGENIERÍADE SISTEMAS
  • 17. DATAWAREHOUSE Funcionamiento del Data Mining ● El data mining es reunir las ventajas de varias áreas como: ● principalmente usando como materia prima las bases de datos.CARRERA DEINGENIERÍADE SISTEMAS
  • 18. DATAWAREHOUSE Tipos de problemas ● Existe una variada tipología de problemas: – Clasificación, – Categorización, – Estimación / regresión, – Agrupamiento, – Etc.CARRERA DEINGENIERÍADE SISTEMAS
  • 19. DATAWAREHOUSE Técnicas de Minería de Datos ● Entre las técnicas tenemos: – Arboles de decisión. – Regresión lineal. – Redes neuronales artificiales. – Técnicas bayesianas. – Maquina de soporte vectorial. – Reglas de asociación. – Reglas de clasificación.CARRERA DEINGENIERÍADE SISTEMAS
  • 20. DATAWAREHOUSE Técnicas de Minería de Datos ● Modelo de agregación ( clustering ), si nos proponemos encontrar similitudes y agrupar modelos semejantes . Un ejemplo sería localizar grupos de datos similares.CARRERA DEINGENIERÍADE SISTEMAS
  • 21. DATAWAREHOUSE Técnicas de Minería de Datos ● Árboles de decisión, tanto si nuestro objetivo es clasificar objetos como si nos interesa obtener conocimiento para poder hacer predicciones.CARRERA DEINGENIERÍADE SISTEMAS
  • 22. DATAWAREHOUSE Técnicas de Minería de Datos ● Redes neuronales y las reglas de clasificación, si nuestro objetivo es clasificar objetos, estudiar las diferencias entre grupos, sus características particulares.CARRERA DEINGENIERÍADE SISTEMAS
  • 23. DATAWAREHOUSE Técnicas de Minería de Datos ● Modelos predictivos clásicos de la estadística, en el caso de que nuestro interés sea obtener conocimiento a partir de los datos que nos permita predecir acciones, comportamientos, etc.CARRERA DEINGENIERÍADE SISTEMAS
  • 24. DATAWAREHOUSE Técnicas de Minería de Datos ● Modelos descriptivos como, las redes bayesianas y, en menor grado, las reglas de asociación, si nos proponemos encontrar y expresar asociaciones significativas o causales entre diversas variables, hacer descripciones.CARRERA DEINGENIERÍADE SISTEMAS
  • 25. DATAWAREHOUSE Almacenes de datos ● ¿Es necesario tener almacenes de datos para realizar minería de datos? – Los almacenes de datos no son imprescindibles para hacer extracción de conocimiento a partir de datos. ● Se puede hacer minería de datos sobre un simple fichero de datos.CARRERA DEINGENIERÍADE SISTEMAS
  • 26. DATAWAREHOUSE Ventajas de Almacenes de datos ● Las ventajas de almacén de datos se amortizan sobradamente a medio y largo plazo cuando: – tenemos grandes volúmenes de datos, o – éstos aumentan con el tiempo, o – provienen de fuentes heterogéneas o – se van a combinar de maneras arbitrarias y no predefinidas.CARRERA DEINGENIERÍADE SISTEMAS
  • 27. DATAWAREHOUSE Otras Minerías de Datos ● Existen otros …minings, como: – TextMining – WebMining.CARRERA DEINGENIERÍADE SISTEMAS