Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

OpenAnalytics - Taller de Talend 13/02/2014

3,519 views

Published on

Son muchas las herramientas de ETLs existentes en el mercado, pero pocas que estén al nivel de Talend. En esta charla se mostrará la herramienta Talend y un proceso ETL a Facebook. Por Eduardo Fernández. Experto en creación y desarollo de procesos ETL de Stratebi.

Published in: Technology
  • Be the first to comment

  • Be the first to like this

OpenAnalytics - Taller de Talend 13/02/2014

  1. 1. HERRAMIENTAS ETL TALEND OPEN STUDIO Data Integration
  2. 2. Índice Introducción Herramientas ETL Las dos grandes Conociendo Talend Trabajando con Talend Ejemplo Práctico
  3. 3. Introducción Complejidad de los sistemas actuales Nuevas necesidades de negocio La realidad empresarial Necesidades de integración
  4. 4. Herramientas ETL Wikipedia “ETL son las siglas en inglés de Extraer, Transformar y Cargar (Extract, Transform and Load). Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos,data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio.”
  5. 5. Herramientas ETL Etapas del proceso Extracción Obtener datos desde sistemas origen Homogeneización de estructuras Preparar los datos para el procesamiento
  6. 6. Herramientas ETL Etapas del proceso Transformación Aplicar reglas de negocio Acciones comunes: - Filtro de columnas - Normalización / Desnormalización - Mapeo de valores - Cálculos de KPIs
  7. 7. Herramientas ETL Etapas del proceso Carga Volcado de datos en sistema de destino Diferentes estrategias de escritura
  8. 8. Conociendo Talend Entorno gráfico Open-Source IDE basado en Eclipse Más de 600 componentes disponibles Generador código Java Basado en Jobs o Trabajos
  9. 9. Conociendo Talend Ecosistema TOS: data integration, mdm, esb, bigdata, etc Distribuciones Communiy y Enterprise Resultado final : sh y war
  10. 10. Conociendo Talend Casos de Uso comunes Migración de Datos Intercambio de Ficheros entre sistemas Sincronización de Datos
  11. 11. Conociendo Talend Community vs Enterprise distribution Entorno de trabajo colaborativo Análisis del flujo de datos Ayudas en la depuración Exportación avanzada de documentación Usos de Joblets Soporte profesional
  12. 12. Las dos Grandes
  13. 13. Kettle Pentaho Data Integration Entorno de desarrollo escritorio (Spoon) Basado en Java Desarrollo ágil e intuitivo Resultado final en ficheros XML (.kjb .ktr) Basado en los conceptos de trabajos y transformaciones
  14. 14. Kettle
  15. 15. Talend vs Kettle CARACTERÍSTICA Talend Kettle Funcionamiento Generador de código Java Interprete Java Facilidad de uso Curva de aprendizaje más empinada Muy sencillo Más restrictivo Más libertad Definición de esquemas Documentación de apoyo Componentes Abundante Más componentes Menos Componentes
  16. 16. Talend vs Kettle CARACTERÍSTICA Velocidad de proceso Plataformas Talend Kettle Talend puede ser más rápido dependiendo de los componentes utilizados. SpagoBI JasperServer Pentaho
  17. 17. Trabajando con Talend Jobs Contextos Metadata Componentes
  18. 18. Ejemplo Práctico

×