SlideShare a Scribd company logo
1 of 23
Download to read offline
Pentaho Kettle Step

    `     `
    Angel Alvarez Serra



             18 Abril 2009




`     `
Angel Alvarez Serra   Pentaho Kettle Step
Introducci´n a ETL.
          o

Introducci´n a Kettle.
          o
    Transformaciones.
    Trabajos.


OpenErp Kettle Step
    Instalaci´n.
             o
    Como Utilizarlo.




                       `     `
                       Angel Alvarez Serra   Pentaho Kettle Step
Introducci´n a ETL
          o



  Herramienta para la obtenci´n, transformaci´n y volcado de datos de
                               o             o
  origenes y destinos diferentes


  Extraer datos de varias fuentes Diversos tipos de base de datos, oracles,
                access... ficheros de texto ( csv, longitud fija, xml ),
                origenes rss, ficheros remotos...
  Transformar Datos Hacer c´lculos, unir tablas, descartar datos, cambiar
                             a
               tipos, lanzar procesos de la base de datos ...
   Volcar datos Volcar a ficheros, base de datos, ficheros remotos...




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Utilidades



      Hacer traspasos de datos completos ante la implantaci´n de un
                                                           o
      nuevo sistema.

      Hacer volcados de informaci´n automatizados hacia el
                                 o
      DataWareHouse.

      Importar datos de ficheros externos, ( ficheros batch de sistemas
      m´biles, noticias econ´micas de ficheros rss...
        o                   o

      Limpieza de datos del sistema actual aplicando complejas
      condiciones de borrado.




                        `     `
                        Angel Alvarez Serra   Pentaho Kettle Step
Otros ETL



  En el mercado existen varios sistemas ETL, tanto comerciales como
  opensource. Requisitos a valorar a la hora de escoger un ETL.


      Facilidad de uso.
      Actividad del proyecto.
      N´mero de transformaciones disponibles y opciones de configuraci´n
       u                                                             o
      de estas.
      Facilidad a la hora de implementar una nueva Transforamci´n.
                                                               o
      Integraci´n con un sistema de Bussiness Intelligent completo.
               o




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Costes del Trabajo con datos


  El manejo de datos es costoso, en la implantaci´n, importaci´n i
                                                 o            o
  exportaci´n, en tiempo, recursos y dinero.
           o

  La Finalidad de los ETL es el augmento de productividad para el trato
  con todo tipo de informaci´n.
                            o



                                                         Atacar cada caso en
                                                         particular.
                                                         Desarrollar un ETL propio.
                                                         ETL comercial.
                                                         ETL opensource.




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Introuducci´n a Kettle
           o


  Transformaciones Entidad b´sica de trabajo, define la obtenci´n, la
                             a                                o
                transfomaci´n, el volcado o qualquier combinaci´n de
                           o                                   o
                estas.




      Trabajos Conjunto de transformaciones, permite el control de
               estados, marca el inicio , final , comunica si el proceso a
               tenido ´xito o no...
                      e




                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Pasos (Step) Entidad b´sica de la transformaci´n. Acci´n a realizar.
                      a                       o       o

Saltos (Hops) Define el paso entre diferentes pasos, posibilidad de
              paralelizar la acci´n, copiar datos a diferentes pasos...
                                 o




                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Introuducci´n a Kettle
           o


     Interf´ Gr´fica
           ıcie a
        Repositorio Almac´n y organizaci´n de todas las
                           e               o
                     transformaciones.
               Vista Control de todas los ’pasos’ de la transformaci´n
                                                                    o
             Dise˜o A˜adir y editar nuevos pasos a la transformaci´n
                  n    n                                            o
     Panel de ejcuci´n Controla tiempo, n´mero de filas escritas y leidas
                     o                       u
                     por paso, an´lisis de impacto en la base de datos,
                                 a
                     herramientas de depuraci´n...
                                               o
     Linea de comandos
     Pemite la ejecuci´n batch de los trabajos y transformaciones , ya
                      o
     est´n en fichero como el repositorio. Permite la automatizaci´n de
        e                                                        o
     procesos.




                        `     `
                        Angel Alvarez Serra   Pentaho Kettle Step
Transformaciones


      Entradas Obtenci´n de datos,desde ficheros, base de datos,
                       o
               sistema...

        Salidas A˜adir, actualizar o eliminar datos de la base de datos,
                 n
                ficheros, hojas de c´lculo...
                                    a

     B´squeda Buscar valores en tablas, ficheros, llamadas a
      u
              procedimientos, webservices...

  Tranformaciones Aplicar funciones al estilo sql (Sort,Group By
               ),xml,c´lculos...
                      a

       Uniones Unir registros de diferentes transformaciones, producto
               cartesiano, inner, left , right join...




                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Transformaciones (continuaci´n)
                            o


      Scripting Facilidades de scripting en lenguajes Sql, Javascript y
                expresiones regulares.

  Data WareHouse Buscar o actualizar datos a nivel de dimensiones.

      Trabajos Acciones para la comunicaci´n con estos, obtener y asignar
                                             o
               variables, devolver el resultado de la transformaci´n...
                                                                  o

         Inline Lectura y escritura de registros a nivel socket.

  Datos Masivos Optimizaci´nes para trabajar con grandes cantidades de
                           o
               datos, por ahora solo oracle.

  Experimental Transformaciones no del todo probadas, Datos Masivos
               para diferentes origenes.



                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Trabajos

       General Controla el flujo del trabajo, llamadas a mas trabajos o
               transformaciones, generar log, finalizar la ejecuci´n...
                                                                 o

           Mail Obtener Mails de cuentas pop para procesar-los, y enviar
                emails.

  Gestor/Gestor Remoto de Ficheros Diferentes acciones de sistema,
                crear, comparar, mover,zip, unzip, ftp, scp..

   Condiciones Comprobar si existen ficheros y datos en la base de datos,
               esperar a una cierta condici´n.
                                           o

      Scripting Shell, Sql, Javascript

           Xml Validador XML, XSL, XSD, transformaci´n XSL
                                                    o

  Volcados Masivos Importar y Exportar grandes cantidades de datos de
               diferentes base de datos.

                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
L´
 ınea de comandos


              Ofrece la posibilidad de ejecutar las diferentes transforamciones y
              trabajos por lineas de comandos.

              Posibilidad de integrar con scripts.

              Automatizaci´n.
                          o

              Posibilidad de ejecutar elementos guardados en el Repositorio.

Ejecutar un trabajo                                              Ejecutar una Transformaci´n
                                                                                          o
kitchen.bat /rep:’Production Repository’                         pan.bat /rep:”Production Repository”
             /job:’Update dimensions’                                  /trans:”update Customer Dimension”
             /dir:/Dimensions                                          /dir:/Dimensions/
             /user:NaN                                                 /user:NaN
             /pass:somepassword                                        /pass:somepassword
             /level:Basic                                              /level:Basic




                                           `     `
                                           Angel Alvarez Serra    Pentaho Kettle Step
Clustering


  Paralelizaci´n de procesos para un gran volumen de datos de forma
              o
  senzilla y r´pida.
              a


         Figura: Master
                                                   Figura: 4 Esclavos en 4 pcs diferentes




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Ejecuci´n y Log
       o




                  `     `
                  Angel Alvarez Serra   Pentaho Kettle Step
Depuraci´n
        o




             `     `
             Angel Alvarez Serra   Pentaho Kettle Step
Introducci´n
          o


  Es un plugin para Kettle para volcar datos a OpenErp, facilitando el
  mapeo de datos.


   Necesidad de
   introducir datos de
   forma consistente en
   OpenErp.
   Marca los campos
   obligatorios
   Facil introducci´n de
                   o
   los campos
   relaciones.




                           `     `
                           Angel Alvarez Serra   Pentaho Kettle Step
Instalaci´n
         o

  Para la instalaci´n del plugin es necesario:
                   o
       Descargar la versi´n de kettle de http://kettle.pentaho.org/
                         o
       Decargar el Plugin
       textbrbzr branch lp:openerp-kettle

  En la estructura de directorios del plugin:
         distrib copiar a KETTLEDIR/plugins/steps
          libext copiar las librerias a KETTLEDIR/libext



  Finalmente ejecutamos KETTLEDIR/spoon.sh y
  buscamos el plugin en transformaciones/output.




                           `     `
                           Angel Alvarez Serra   Pentaho Kettle Step
Como utilizarlo


     Introducir la IP del servidor.
     Introducir el usuario y la contrasenya.




     Obtener y Seleccionar la Base de datos.




                         `     `
                         Angel Alvarez Serra   Pentaho Kettle Step
Obterner y Seleccionar los modelos.




                   `     `
                   Angel Alvarez Serra   Pentaho Kettle Step
Obterner los campos y assignar los valores.




                   `     `
                   Angel Alvarez Serra   Pentaho Kettle Step
Estado de OpenErp Kettle Step



  Plugin en estado de desarrollo, con cosas pendientes pero totalmente
  funcional. Se ha utilizado con ´xito en la migraci´n de aplicaciones a
                                 e                  o
  OpenErp.

  Cosas Pendientes:

      traducci´n de los campos.
              o

      Campos selecci´n de openerp.
                    o

      Lavado de cara al di´logo.
                          a




                          `     `
                          Angel Alvarez Serra   Pentaho Kettle Step
Preguntas




            `     `
            Angel Alvarez Serra   Pentaho Kettle Step

More Related Content

Viewers also liked

Load Balancing Apps in Docker Swarm with NGINX
Load Balancing Apps in Docker Swarm with NGINXLoad Balancing Apps in Docker Swarm with NGINX
Load Balancing Apps in Docker Swarm with NGINX
NGINX, Inc.
 
Continuous Integration (Jenkins/Hudson)
Continuous Integration (Jenkins/Hudson)Continuous Integration (Jenkins/Hudson)
Continuous Integration (Jenkins/Hudson)
Dennys Hsieh
 

Viewers also liked (17)

Introduction to GPU Programming
Introduction to GPU ProgrammingIntroduction to GPU Programming
Introduction to GPU Programming
 
Business Intelligence and Big Data Analytics with Pentaho
Business Intelligence and Big Data Analytics with Pentaho Business Intelligence and Big Data Analytics with Pentaho
Business Intelligence and Big Data Analytics with Pentaho
 
Docker Ecosystem: Engine, Compose, Machine, Swarm, Registry
Docker Ecosystem: Engine, Compose, Machine, Swarm, RegistryDocker Ecosystem: Engine, Compose, Machine, Swarm, Registry
Docker Ecosystem: Engine, Compose, Machine, Swarm, Registry
 
Pentaho | Data Integration & Report designer
Pentaho | Data Integration & Report designerPentaho | Data Integration & Report designer
Pentaho | Data Integration & Report designer
 
Jenkins Peru Meetup Docker Ecosystem
Jenkins Peru Meetup Docker EcosystemJenkins Peru Meetup Docker Ecosystem
Jenkins Peru Meetup Docker Ecosystem
 
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?
Scaling Jenkins with Docker: Swarm, Kubernetes or Mesos?
 
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12
Continuous Development with Jenkins - Stephen Connolly at PuppetCamp Dublin '12
 
Indic threads pune12-accelerating computation in html 5
Indic threads pune12-accelerating computation in html 5Indic threads pune12-accelerating computation in html 5
Indic threads pune12-accelerating computation in html 5
 
Introduction to docker swarm
Introduction to docker swarmIntroduction to docker swarm
Introduction to docker swarm
 
Docker swarm introduction
Docker swarm introductionDocker swarm introduction
Docker swarm introduction
 
Load Balancing Apps in Docker Swarm with NGINX
Load Balancing Apps in Docker Swarm with NGINXLoad Balancing Apps in Docker Swarm with NGINX
Load Balancing Apps in Docker Swarm with NGINX
 
Building a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and DockerBuilding a data warehouse with Pentaho and Docker
Building a data warehouse with Pentaho and Docker
 
Continuous Integration (Jenkins/Hudson)
Continuous Integration (Jenkins/Hudson)Continuous Integration (Jenkins/Hudson)
Continuous Integration (Jenkins/Hudson)
 
Continuous ETL Testing for Pentaho Data Integration (kettle)
Continuous ETL Testing for Pentaho Data Integration (kettle)Continuous ETL Testing for Pentaho Data Integration (kettle)
Continuous ETL Testing for Pentaho Data Integration (kettle)
 
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)
Moving and Transforming Data with Pentaho Data Integration 5.0 CE (aka Kettle)
 
Seven Habits of Highly Effective Jenkins Users (2014 edition!)
Seven Habits of Highly Effective Jenkins Users (2014 edition!)Seven Habits of Highly Effective Jenkins Users (2014 edition!)
Seven Habits of Highly Effective Jenkins Users (2014 edition!)
 
Docker Swarm 0.2.0
Docker Swarm 0.2.0Docker Swarm 0.2.0
Docker Swarm 0.2.0
 

Similar to Migración de datos con OpenERP-Kettle

Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
CarlosTenelema1
 
Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014
JOSE AHIAS LOPEZ PORTILLO
 
IdRetail – Migración Mobile a Smart Device con PXTools
IdRetail – Migración Mobile a Smart Device con PXToolsIdRetail – Migración Mobile a Smart Device con PXTools
IdRetail – Migración Mobile a Smart Device con PXTools
GeneXus
 

Similar to Migración de datos con OpenERP-Kettle (20)

Kafkadb
KafkadbKafkadb
Kafkadb
 
Principios de diseño para procesos de ETL
Principios de diseño para procesos de ETLPrincipios de diseño para procesos de ETL
Principios de diseño para procesos de ETL
 
OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014 OpenAnalytics - Taller de Talend 13/02/2014
OpenAnalytics - Taller de Talend 13/02/2014
 
Periodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open SourcePeriodismo de Datos y Visualización con herramientas Open Source
Periodismo de Datos y Visualización con herramientas Open Source
 
Estructuras repetitivas herramienta case jean
Estructuras repetitivas herramienta case jeanEstructuras repetitivas herramienta case jean
Estructuras repetitivas herramienta case jean
 
Proceso lineal e intermitente
Proceso lineal e intermitenteProceso lineal e intermitente
Proceso lineal e intermitente
 
Etl
EtlEtl
Etl
 
mineria de datos
mineria de datosmineria de datos
mineria de datos
 
Etl extracción transformación y carga de datos
Etl extracción transformación y carga de datosEtl extracción transformación y carga de datos
Etl extracción transformación y carga de datos
 
Capítulo 04 objetos fijos
Capítulo 04 objetos fijosCapítulo 04 objetos fijos
Capítulo 04 objetos fijos
 
Arquitectura de datos empresariales ta. informe
Arquitectura de datos empresariales   ta. informeArquitectura de datos empresariales   ta. informe
Arquitectura de datos empresariales ta. informe
 
Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014Técnicas avanzadas de consultas con sql server 2014
Técnicas avanzadas de consultas con sql server 2014
 
IdRetail – Migración Mobile a Smart Device con PXTools
IdRetail – Migración Mobile a Smart Device con PXToolsIdRetail – Migración Mobile a Smart Device con PXTools
IdRetail – Migración Mobile a Smart Device con PXTools
 
Proceso ETL 1.pptx
Proceso ETL 1.pptxProceso ETL 1.pptx
Proceso ETL 1.pptx
 
ETL
ETLETL
ETL
 
ETL
ETLETL
ETL
 
Etl
EtlEtl
Etl
 
120675 180112011233
120675 180112011233120675 180112011233
120675 180112011233
 
Tipos de Sistemas Transaccionales
Tipos de Sistemas TransaccionalesTipos de Sistemas Transaccionales
Tipos de Sistemas Transaccionales
 
Devops meetup 21 de Junio 2017
Devops meetup 21 de Junio 2017Devops meetup 21 de Junio 2017
Devops meetup 21 de Junio 2017
 

More from raimonesteve

More from raimonesteve (15)

Tryton Point of Sale - POS
Tryton Point of Sale - POSTryton Point of Sale - POS
Tryton Point of Sale - POS
 
Training. Módolos para centros educativos
Training. Módolos para centros educativosTraining. Módolos para centros educativos
Training. Módolos para centros educativos
 
Zzsaas - OpenERP SaaS
Zzsaas - OpenERP SaaSZzsaas - OpenERP SaaS
Zzsaas - OpenERP SaaS
 
Zoook - Comercio electrónico de OpenERP
Zoook - Comercio electrónico de OpenERPZoook - Comercio electrónico de OpenERP
Zoook - Comercio electrónico de OpenERP
 
Connecting your Python App to OpenERP through OOOP
Connecting your Python App to OpenERP through OOOPConnecting your Python App to OpenERP through OOOP
Connecting your Python App to OpenERP through OOOP
 
OpenERP. L'ERP lliure
OpenERP. L'ERP lliureOpenERP. L'ERP lliure
OpenERP. L'ERP lliure
 
Fernando Estructuras. OpenERP
Fernando Estructuras. OpenERPFernando Estructuras. OpenERP
Fernando Estructuras. OpenERP
 
JasperReports, informes con diseño
JasperReports, informes con diseñoJasperReports, informes con diseño
JasperReports, informes con diseño
 
Poweremail, el gestor de correo de OpenERP
Poweremail, el gestor de correo de OpenERPPoweremail, el gestor de correo de OpenERP
Poweremail, el gestor de correo de OpenERP
 
Magento - Magquè?
Magento - Magquè?Magento - Magquè?
Magento - Magquè?
 
OpenErp 5 Novedades para el usuario
OpenErp 5 Novedades para el usuarioOpenErp 5 Novedades para el usuario
OpenErp 5 Novedades para el usuario
 
Generación de informes usando Jasper Reports
Generación de informes usando Jasper ReportsGeneración de informes usando Jasper Reports
Generación de informes usando Jasper Reports
 
¿Que es Openerp?
¿Que es Openerp?¿Que es Openerp?
¿Que es Openerp?
 
OpenErp - osCommerce y Magento (integración)
OpenErp - osCommerce y Magento (integración)OpenErp - osCommerce y Magento (integración)
OpenErp - osCommerce y Magento (integración)
 
¿Openerp y CMS? RadioTV
¿Openerp y CMS? RadioTV¿Openerp y CMS? RadioTV
¿Openerp y CMS? RadioTV
 

Recently uploaded

EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
silviayucra2
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
241521559
 

Recently uploaded (10)

EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 

Migración de datos con OpenERP-Kettle

  • 1. Pentaho Kettle Step ` ` Angel Alvarez Serra 18 Abril 2009 ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 2. Introducci´n a ETL. o Introducci´n a Kettle. o Transformaciones. Trabajos. OpenErp Kettle Step Instalaci´n. o Como Utilizarlo. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 3. Introducci´n a ETL o Herramienta para la obtenci´n, transformaci´n y volcado de datos de o o origenes y destinos diferentes Extraer datos de varias fuentes Diversos tipos de base de datos, oracles, access... ficheros de texto ( csv, longitud fija, xml ), origenes rss, ficheros remotos... Transformar Datos Hacer c´lculos, unir tablas, descartar datos, cambiar a tipos, lanzar procesos de la base de datos ... Volcar datos Volcar a ficheros, base de datos, ficheros remotos... ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 4. Utilidades Hacer traspasos de datos completos ante la implantaci´n de un o nuevo sistema. Hacer volcados de informaci´n automatizados hacia el o DataWareHouse. Importar datos de ficheros externos, ( ficheros batch de sistemas m´biles, noticias econ´micas de ficheros rss... o o Limpieza de datos del sistema actual aplicando complejas condiciones de borrado. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 5. Otros ETL En el mercado existen varios sistemas ETL, tanto comerciales como opensource. Requisitos a valorar a la hora de escoger un ETL. Facilidad de uso. Actividad del proyecto. N´mero de transformaciones disponibles y opciones de configuraci´n u o de estas. Facilidad a la hora de implementar una nueva Transforamci´n. o Integraci´n con un sistema de Bussiness Intelligent completo. o ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 6. Costes del Trabajo con datos El manejo de datos es costoso, en la implantaci´n, importaci´n i o o exportaci´n, en tiempo, recursos y dinero. o La Finalidad de los ETL es el augmento de productividad para el trato con todo tipo de informaci´n. o Atacar cada caso en particular. Desarrollar un ETL propio. ETL comercial. ETL opensource. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 7. Introuducci´n a Kettle o Transformaciones Entidad b´sica de trabajo, define la obtenci´n, la a o transfomaci´n, el volcado o qualquier combinaci´n de o o estas. Trabajos Conjunto de transformaciones, permite el control de estados, marca el inicio , final , comunica si el proceso a tenido ´xito o no... e ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 8. Pasos (Step) Entidad b´sica de la transformaci´n. Acci´n a realizar. a o o Saltos (Hops) Define el paso entre diferentes pasos, posibilidad de paralelizar la acci´n, copiar datos a diferentes pasos... o ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 9. Introuducci´n a Kettle o Interf´ Gr´fica ıcie a Repositorio Almac´n y organizaci´n de todas las e o transformaciones. Vista Control de todas los ’pasos’ de la transformaci´n o Dise˜o A˜adir y editar nuevos pasos a la transformaci´n n n o Panel de ejcuci´n Controla tiempo, n´mero de filas escritas y leidas o u por paso, an´lisis de impacto en la base de datos, a herramientas de depuraci´n... o Linea de comandos Pemite la ejecuci´n batch de los trabajos y transformaciones , ya o est´n en fichero como el repositorio. Permite la automatizaci´n de e o procesos. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 10. Transformaciones Entradas Obtenci´n de datos,desde ficheros, base de datos, o sistema... Salidas A˜adir, actualizar o eliminar datos de la base de datos, n ficheros, hojas de c´lculo... a B´squeda Buscar valores en tablas, ficheros, llamadas a u procedimientos, webservices... Tranformaciones Aplicar funciones al estilo sql (Sort,Group By ),xml,c´lculos... a Uniones Unir registros de diferentes transformaciones, producto cartesiano, inner, left , right join... ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 11. Transformaciones (continuaci´n) o Scripting Facilidades de scripting en lenguajes Sql, Javascript y expresiones regulares. Data WareHouse Buscar o actualizar datos a nivel de dimensiones. Trabajos Acciones para la comunicaci´n con estos, obtener y asignar o variables, devolver el resultado de la transformaci´n... o Inline Lectura y escritura de registros a nivel socket. Datos Masivos Optimizaci´nes para trabajar con grandes cantidades de o datos, por ahora solo oracle. Experimental Transformaciones no del todo probadas, Datos Masivos para diferentes origenes. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 12. Trabajos General Controla el flujo del trabajo, llamadas a mas trabajos o transformaciones, generar log, finalizar la ejecuci´n... o Mail Obtener Mails de cuentas pop para procesar-los, y enviar emails. Gestor/Gestor Remoto de Ficheros Diferentes acciones de sistema, crear, comparar, mover,zip, unzip, ftp, scp.. Condiciones Comprobar si existen ficheros y datos en la base de datos, esperar a una cierta condici´n. o Scripting Shell, Sql, Javascript Xml Validador XML, XSL, XSD, transformaci´n XSL o Volcados Masivos Importar y Exportar grandes cantidades de datos de diferentes base de datos. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 13. L´ ınea de comandos Ofrece la posibilidad de ejecutar las diferentes transforamciones y trabajos por lineas de comandos. Posibilidad de integrar con scripts. Automatizaci´n. o Posibilidad de ejecutar elementos guardados en el Repositorio. Ejecutar un trabajo Ejecutar una Transformaci´n o kitchen.bat /rep:’Production Repository’ pan.bat /rep:”Production Repository” /job:’Update dimensions’ /trans:”update Customer Dimension” /dir:/Dimensions /dir:/Dimensions/ /user:NaN /user:NaN /pass:somepassword /pass:somepassword /level:Basic /level:Basic ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 14. Clustering Paralelizaci´n de procesos para un gran volumen de datos de forma o senzilla y r´pida. a Figura: Master Figura: 4 Esclavos en 4 pcs diferentes ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 15. Ejecuci´n y Log o ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 16. Depuraci´n o ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 17. Introducci´n o Es un plugin para Kettle para volcar datos a OpenErp, facilitando el mapeo de datos. Necesidad de introducir datos de forma consistente en OpenErp. Marca los campos obligatorios Facil introducci´n de o los campos relaciones. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 18. Instalaci´n o Para la instalaci´n del plugin es necesario: o Descargar la versi´n de kettle de http://kettle.pentaho.org/ o Decargar el Plugin textbrbzr branch lp:openerp-kettle En la estructura de directorios del plugin: distrib copiar a KETTLEDIR/plugins/steps libext copiar las librerias a KETTLEDIR/libext Finalmente ejecutamos KETTLEDIR/spoon.sh y buscamos el plugin en transformaciones/output. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 19. Como utilizarlo Introducir la IP del servidor. Introducir el usuario y la contrasenya. Obtener y Seleccionar la Base de datos. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 20. Obterner y Seleccionar los modelos. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 21. Obterner los campos y assignar los valores. ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 22. Estado de OpenErp Kettle Step Plugin en estado de desarrollo, con cosas pendientes pero totalmente funcional. Se ha utilizado con ´xito en la migraci´n de aplicaciones a e o OpenErp. Cosas Pendientes: traducci´n de los campos. o Campos selecci´n de openerp. o Lavado de cara al di´logo. a ` ` Angel Alvarez Serra Pentaho Kettle Step
  • 23. Preguntas ` ` Angel Alvarez Serra Pentaho Kettle Step