Almacenes, mineria y análisis de datos

1,316 views

Published on

OLAP
ALMACÉN DE DATOS
DATAWAREHOUSE
MINERÍA DE DATOS
ANÁLISIS DE DATOS

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,316
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
46
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Almacenes, mineria y análisis de datos

  1. 1. Almacenes, minería y análisis de datos Unidad 3. Tecnologías de la información Equipo 3 Calderón Juárez Edgar Jareth, Camacho Castro Carina, Fuentes Cruz Laura Josefina González Arredondo Rosa Giovanna Mancilla Ríos Omar
  2. 2. ¿Qué es?  por temas, integrada, variable en el tiempo y no volátil Tecnología de gestión y análisis de los datos.  Puede definirse como: BD Transaccionales INSERT UPDATE DELETE Colección de datos clasificados READ READ Se utiliza como ayuda al proceso de toma de decisiones por parte de quienes dirigen una organización.
  3. 3. Carácteristicas  Integrado Organizado por temas Temático Variable en el tiempo Mismos tipos de datos en todos los Depto. de la empresa Los datos no se eliminan Diferentes fuentes Metadatos No volátil Datos actualizados para fines de consulta
  4. 4. Funciones  Integración Separación Separación de datos según su uso con propósitos de análisis y toma de decisiones Integración de datos recolectados de diferentes sistemas operacionales de la organización y o fuentes externas
  5. 5. Ventajas Mejorías notables al trabajar dentro de un proyecto:  Alto retorno de inversión  Ventajas competitivas derivadas de su utilización  Mayor productividad de los responsables de la toma de decisiones
  6. 6. Problemas Problemas de los almacenes de datos  Subestimación de los recursos necesarios para la carga de datos.  Privacidad de los datos.  Altos costes de mantenimiento.  Proyectos de larga duración.  Complejidad de la integración.
  7. 7. Componentes BD *Estaciones de trabajo*Internet 1. Fuentes de Datos operacionales 2. Repositorio de datos operacionales (ODS) 3. Gestor de carga (ó componente de interfaz) 4. Gestor del almacén de datos: 5. Gestor de consultas (ó componente de servicio) 6. Datos detallados 7. Datos poco resumidos y muy resumidos 8. Datos de archivo / copia de seguridad 9. Metadatos 10. Herramientas de acceso para usuarios finales Datos actuales e integrados que se utilizan para el análisis. Operaciones asociadas con la extracción y carga de los datos en el almacén. Análisis de los datos para garantizar su coherencia, transformación y combinación de datos de origen, creación de índices y vistas. Dirigir consultas hacia tablas apropiadas y planificar su ejecución. Consulta y generación de informes Desarrollo de aplicaciones Procesamiento analítico en línea (OLAP) Minería de Datos
  8. 8. Arquitectura almacen de datos
  9. 9. Herramientas y tecnologías de 1. Herramientas de extracción, limpieza y transformación 2. Sistemas de Gestión de Bases de Datos para almacenes de datos 3. Metadatos de un almacén de datos 4. Herramientas de administración y gestión
  10. 10. Almacenes de datos  Un subconjunto de un almacén de datos que soporta los requisitos de un departamento ó área de negocios concreto.  Las principales características que diferencian a los mercados de datos de los almacenes de datos son:  un mercado de datos se centra únicamente en los requisitos de los usuarios asociados con un departamento ó área de negocio concreto;  los mercados de datos no contienen normalmente datos operacionales detallados, a diferencia de lo que sucede con los almacenes de datos;  como los mercados de datos contienen menos información que un almacén de datos, son más fáciles de comprender y de utilizar.
  11. 11. Almacenes de datos
  12. 12. Almacenes de datos
  13. 13. ¿Qué es? Minería de datos  La Minería de Datos es la extracción automática de información predictiva escondida desde bases de datos.  La Minería de Datos estudia métodos y algoritmos que permiten la extracción automática de información sintetizada que permite caracterizar las relaciones escondidas.
  14. 14.  La Minería de Datos y las Bases de Datos comerciales están disponibles para resolver problemas de decisión de negocios.  La Minería de Datos es una tecnología que ayuda a enfocarse en la información más importante en los almacenes de datos.
  15. 15. 1. Modelado predictivo 2. Segmentación de la Base de Datos 3. Análisis de enlaces 4. Detección de desviaciones
  16. 16.  Comprensión del negocio: Se centra en comprender los requisitos y objetivos del proyecto desde la perspectiva del negocio.  Comprensión de los datos: Incluye la recopilación inicial de datos y se preocupa por establecer sus principales características.  Preparación de los datos: Actividades para construir el conjunto final de datos al que pueden aplicársele las herramientas de modelado.  Modelado: Propiamente Minería. Implica seleccionar las técnicas de modelado, los parámetros y evaluar el modelo.  Evaluación: Valida el modelo desde el punto de vista del análisis de datos.  Implantación: El conocimiento obtenido y reflejado en el modelo tiene que organizarse y presentarse de una manera comprensible por parte de los usuarios.
  17. 17. BD Selección Datos Preprocesado Selección de características Extracción de conocimiento Conocimiento Evaluación Modelo clasificador
  18. 18. 1. Preparación de los datos: 2. Selección de las operaciones (algoritmos) de minería de datos: 3. Escalabilidad y prestaciones del producto: 4. Funcionalidades para comprender los resultados, proporcionadas mediante medidas que describan la precisión y lo significativo de los datos
  19. 19. ¿Qué es?  Análisis de datos
  20. 20. Ejemplos  APLICACIÓN:VISUAL DATA MINING O MINERÍA DE DATOS VISUAL Oracle o Microsoft (con SQLServer) tienen herramientas para hacer minería de datos. También hay herramientas para la minería de datos en el ámbito del software libre.

×