1. INSTITUTO TECNOLOGICO SUPERIOR DE LERDO LICENCIATURA EN INFORMATICA TOPICOS AVANZADOS DE BASES DE DATOS DISEÑO FISICO ALUMNAS: GUADALUPE ELIZABETH HERRERA CISNEROS 07230473 MARIA DE JESUS ALFARO CARRERA 07230459 PROFESOR: ING. RICARDO DE JESUS BUSTAMANTE FECHA: 25 DE FEBRERO DEL 2011
2.
3.
4.
5.
6. MOLAP vs. ROLAP MOLAP necesita menos espacio de almacenamiento debido a las compresiones. Existen diversas herramientas de carga (ETL) para ROLAP. Esto automatiza el proceso de carga, y lo hace más rápido. ROLAP se considera mejor para grandes volúmenes de datos Los SGBD relacionales han creado funciones especializadas para realizar consultas OLAP .
7.
8.
9. CONTEXTOS EN TALEND son grupos de variables contextuales que luego podemos reutilizar en los diferentes jobs de nuestras transformaciones. Utilizadas para definir variables con los valores de paths de ficheros, valores para conexión a bases de datos (servidor, usuario, contraseña, puerto, base de datos por defecto, etc), valores a pasar a los procesos (constantes o definidos por el usuario en tiempo de ejecución). Los valores de los contextos se inicializan con un valor que puede ser cambiado por el usuario mediante un prompt (petición de valor). Un mismo contexto puede tener diferentes “grupos de valores”. Es decir, en el contexto “conexion a base de datos”, podemos tener un grupo de valores llamado “test”, que incluira los valores para conectarnos al sistema de pruebas y un grupo llamado “productivo”, que incluira los valores para la conexión a la base de datos real.
10.
11. Definición de Contextos en Talend Dentro del contexto, definiremos que grupo de valores es el que se utilizara por defecto. Esto nos va a permitir trabajar con los jobs y sus componentes olvidandonos de contra que sistema estamos trabajando. Tendremos, por ejemplo, el contexto de test activo, y es el que utilizaremos para las pruebas. Y podremos cambiar en cualquier momento, al ejecutar un job, para decirle que utilice el contexto “productivo”. Igualmente, podremos preparar un fichero o una tabla de base de datos con los valores de las variables de contexto, que serán pasadas al job para su utilización en la ejecución de un proceso (utilizando el componente tContextLoad).
12. Definición del proceso de carga El diseño físico definitivo de la tabla de hechos será el siguiente :
13. Una vez hechas todas las consideraciones, veamos el esquema de como quedaría nuestro proceso de transformación.
14. Carga del contexto de ejecución : para que el proceso sepa que tipo de carga ha de realizar y para que periodo de fechas, es necesario proporcionarle la información.
15. Borrado previo a la recarga de los datos del periodo en la tabla de hechos
16. TRANSFORMACIÓN DE LOS CAMPOS, NORMALIZACIÓN, OPERACIONES. En este proceso realizamos conversión de tipos, llenado de campos vacios, cálculos, operaciones. Todo con el objetivo de dejar los datos preparados para la carga en la tabla de Hechos de la base de datos.
17.
18. INSERCIÓN EN LA TABLA DE HECHOS Como paso final, vamos realizando el insertado de los registros en la tabla DWH_VENTAS utilizando el componente tMysqlOutput