SlideShare a Scribd company logo
1 of 44
Servicios de Calidad de Datos
Empresariales con Data Quality Services
               "Denali"
 José Redondo
 Chapter Leader – SQL PASS Venezuela
 www.sqlpass.org.ve
 Correo: redondoj@gmail.com
 Twitter: @redondoj
AGENDA
• Introducción
• Características
• Arquitectura
• Instalación y Configuración
• Base de conocimiento ‘Knowledge Base’
• Proyecto de Calidad de Datos ‘Data Quality
  Project’
• Demos
• Preguntas
INTRODUCCIÓN

• ¿Qué es Calidad de Datos?
  – El grado en que los datos de una entidad están aptos para usos
    comerciales.
  – Se pueden definir, medir y administrar a través de varias
    Dimensiones y Métricas.
     •   Precisión
     •   Consistencia
     •   Integridad
     •   Duplicados
     •   Puntualidad
  – Personas + Tecnología + Procesos.
INTRODUCCIÓN
• ¿Porqué es importante la Calidad de Datos?
  – Es el fundamento de todo negocio.
  – La deficiencia tiene un impacto negativo y significativo
    en las iniciativas empresariales mas estratégicas del
    negocio.
  – Mala información = (Tiempo extra * (Perdida de
    credibilidad + Insatisfacción de los clientes)) /
    Problemas de incumplimiento + Malos ingresos.
INTRODUCCIÓN
¿Problemas comunes de Calidad de Datos?
   Calidad de
                                Problemática                                            Ejemplo
     Datos
 Estandarización   Son elementos de datos coherentemente        Tipo Sexo:
                   definidos y entendidos?                             • M, F, I en un sistema.
                                                                       • 0, 1, 2 en otro sistema.
 Formateo          Qué normativa estándar llevan los            Número de teléfono pueden aparecer como:
                   siguientes datos?                            • 02129999999
                                                                • (212)-9999999
                                                                • +58 212 9999999
 Consistentes      Los valores representan el mismo             Los montos se presentan en Bolívares Fuertes así como
                   significado?                                 en Euros o en Dólares?
 Afinamiento       Es necesario mostrar todos los datos?        •   20% de los apellidos de los clientes están en blanco.
                                                                •   50% de los códigos postales son 999999.

 Exactitud         Los datos se muestran con exactitud real o   Un proveedor esta en el sistema como “Activo” pero dejo
                   proviene de una fuente verificable?          de estar operativo desde hacen 6 años.

 Validación        Qué significan los valores que se            Los montos salariales deben rondar entre BsF. 26,000 a
                   encuentran dentro de rangos aceptables?      BsF. 35,000.

 Unicidad          Los datos son repetidos?                     Tanto Alba Rivero como Alma Rivero aparecen en el
                                                                sistema. ¿Son la misma persona?
INTRODUCCIÓN
Requerimientos de una solución de Calidad de Datos.
Monitoreo                                  Limpieza
Seguimiento y monitoreo del                Modificar, eliminar y
estados de las actividades de              enriquecer los datos
Calidad de Datos.                          incorrectos o incompletos.
                                           Esto incluye la corrección, la
                                           estandarización y
                                           enriquecimiento de los datos.




Perfilamiento                              Coincidencia
Análisis de la fuente de datos             Identificando, enlazando y
para dar una idea del estado               combinando las entradas
de los datos y ayudar a                    relacionadas dentro o a
identificar problemas de                   través de los conjuntos de
Calidad de Datos..                         datos..
INTRODUCCIÓN

• ¿Qué es Data Quality Services “DQS”?
  – Es una solución enfocada:
    • Conocimiento.
    • Data Quality Knowledge Base - "DQKB“.
       – Limpieza de datos.
       – Coincidentes.

  – El concepto principal:
    • Rápido.
    • Fácil de implementar.
    • Fácil de usar.
INTRODUCCIÓN
• ¿Qué es Data Quality Knowledge Base “DQKB”?
  – Es el núcleo de DQS.
  – Almacena todos los conocimientos.
     • Tipo específico de orígenes.
     • Fuentes de datos.
  – Componentes:
     • Orígenes de datos.
     • Dominios de datos.
  – Almacena:
     •   Términos identificados.
     •   Errores de ortografía.
     •   Reglas de validación y de negocios.
     •   Datos de referencia.
CARACTERÍSTICAS

• Gestión del conocimiento.
• Proyectos.
• Administración.
CARACTERÍSTICAS

• Gestión del conocimiento.
  – Descubrir el conocimiento.
  – Administración de dominios.
  – Políticas de combinación.
  – Servicios de referencias.
CARACTERÍSTICAS

• Proyectos de calidad de datos.
  – Limpieza y depuración.
  – Coincidencias y deduplicación.
  – Perfiles y notificaciones.
CARACTERÍSTICAS

• Administración de la calidad de los
  datos.
  – Administración.
  – Seguridad.
CARACTERÍSTICAS
Hacer accesible datos de calidad para todos.
– Mejorar la calidad de los datos con DQS.
  • Limpiar los datos y mantenerlos limpios.
  • Fomentar la confianza en los datos de la empresa.
  • Compartir la responsabilidad de la calidad de los
    datos.
– Eliminar las barreras para la calidad de los datos.
  • Diseñado para su facilidad de uso.
  • Capacitar a los usuarios de negocio.
  • Ver los resultados en minutos en lugar de meses.
CARACTERÍSTICAS
                                                                      Administración del conocimiento
Creación




                          Datos de
                         referencia     Descubrir / Explorar datos / Conectar

                           Datos
                        empresariales
       Perfilamiento




                                                                                  Base de
                                                   Notificaciones               Conocimiento
Use




                       Procesos de DQS                                   Proyecto de Calidad de Datos
ARQUITECTURA
DQS se conforma por los siguientes componentes:
  – Servidor DQS.
  – Cliente DQS.


Servicios externos:
  – Servicios de la nube de DQS.
  – Servicios de terceros.
ARQUITECTURA




COMPONENTES
ARQUITECTURA
Servidor DQS
                            API de Servicios RD             API de Referencia de Datos
  Servidor DQ            (Browse, Set, Validate…)            (Browse, Get, Update…)


                Motor DQ

                                Perfilamiento de             Limpieza
     Descubriendo el
                                                                                        Datos
                                     Datos &                                        Referenciados
      Conocimiento                Exploración
                                                           Coincidencias


     Almacén de Proyectos DQ             Almacén Común de Conocimiento          Almacén de Base de
                                                                                  Conocimiento


                                                                                      Base de
                                        Dominios de        Dominio de              Conocimiento
    Proyectos Activos DQ                 Datos MS         Datos Locales              Publicada
ARQUITECTURA
Cliente DQS
                                 Cliente DQ

       Interfaz gráfica DQS

           Descubriendo y
          Administrando el
            Conocimiento
                                                   Clientes futuros:
                                     Componente    MS Office Excel,
                                       DQ SSIS    MS SharePoint, etc.
       Proyecto DQ Interactivo



        Exploración de Datos
ARQUITECTURA




SERVICIOS EXTERNOS
ARQUITECTURA
Servicios de la nube de DQS



                     MS Windows Azure Marketplace DataMarket
   Servicio de Referencias de      Referencias de Datos   Almacén de Dominios de
      Datos Categorizados             Categorizados              MS DQ
ARQUITECTURA
Servicios de terceros

                          3rd Party


                          Reference
                         Data Services




                          Reference
                          Data Sets
INSTALACIÓN Y CONFIGURACIÓN

• Prerrequisitos.
• Instalación.
• Tareas Post Instalación.
INSTALACIÓN Y CONFIGURACIÓN

• Prerrequisitos
  – Servidor DQS.
  – Cliente DQS.
  – Componente DQS para SSIS.
INSTALACIÓN Y CONFIGURACIÓN

• Prerrequisitos
INSTALACIÓN Y CONFIGURACIÓN

• Instalación
  – .NET 4.0
  – IE 6.0 SP1 o superior.
INSTALACIÓN Y CONFIGURACIÓN

• Instalación
INSTALACIÓN Y CONFIGURACIÓN

• Instalación
INSTALACIÓN Y CONFIGURACIÓN

• Instalación
INSTALACIÓN Y CONFIGURACIÓN

• Tareas Post Instalación
  – Habilitar el rol de usuario DQS.
  – Habilitar permisos en la base de datos
   Origen / Destino.
  – Habilitar el protocolo TCP-IP para acceso
   remoto.
INSTALACIÓN Y CONFIGURACIÓN

• Habilitar el rol de usuario DQS.
INSTALACIÓN Y CONFIGURACIÓN
• Habilitar el rol de usuario DQS.
INSTALACIÓN Y CONFIGURACIÓN
• Habilitar permisos en la base de datos Origen /
  Destino.
INSTALACIÓN Y CONFIGURACIÓN
• Habilitar permisos en la
  base de datos Origen /
  Destino.
INSTALACIÓN Y CONFIGURACIÓN

• Habilitar el protocolo TCP-IP para acceso
  remoto.
INSTALACIÓN Y CONFIGURACIÓN
INSTALACIÓN Y CONFIGURACIÓN
INSTALACIÓN Y CONFIGURACIÓN
BASE DE CONOCIMIENTO

              Valores


                                                     Composición
                                                     de Dominios
          Representación
          de Dominios de
            los tipos de
               datos
 Datos de                                         Base de
Referencias               Reglas
  de 3ras                   &
                                     Dominios   Conocimiento
  partes                Relaciones


                                                       Políticas de
                                                      Coincidencias
PROYECTO DE CALIDAD DE DATOS
• Limpieza de datos.
• Componente SSIS.
• Coincidencia de datos.
RESUMEN

    Basado en el               Facil de usar                      Abierto &
    Conocimiento                                                  Extensible
•   Base de Conocimiento   •   Enfocado a la productividad   •   Enfocado a la
    enriquecida.               y experiencia del usuario.        referencialidad de los datos
•   Continua mejoras y     •   Diseñado para usuarios            basados en la nube.
    adquisición de             empresariales.                •   Creado por usuarios de
    conocimiento.          •   Externo a un criterio de          conocimiento.
•   Una vez creada, se         conocimiento.                 •   Integración con SSIS
    incrementa su uso.
http://www.sqlpass.org.ve




  http://www.sqlpass.org                                   http://www.sqlpass-latam.org




http://microsoft.com/technet                                http://microsoft.com/msdn
José Redondo
http://redondoj.wordpress.com/
redondoj@gmail.com
Twitter: @redondoj

More Related Content

Viewers also liked

Viewers also liked (8)

Aplicando Azure Search en Sistemas Hibridos
Aplicando Azure Search en Sistemas HibridosAplicando Azure Search en Sistemas Hibridos
Aplicando Azure Search en Sistemas Hibridos
 
Performance Tuning en Azure SQL Database
Performance Tuning en Azure SQL DatabasePerformance Tuning en Azure SQL Database
Performance Tuning en Azure SQL Database
 
Conociendo los cambios de SQL Server a partir de 2012 a 2016
Conociendo los cambios de SQL Server a partir de 2012 a 2016Conociendo los cambios de SQL Server a partir de 2012 a 2016
Conociendo los cambios de SQL Server a partir de 2012 a 2016
 
Tablas temporales en SQL Server 2016 y Azure SQL Database v12
Tablas temporales en SQL Server 2016 y Azure SQL Database v12Tablas temporales en SQL Server 2016 y Azure SQL Database v12
Tablas temporales en SQL Server 2016 y Azure SQL Database v12
 
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...
Conociendo Dynamic Data Masking en entornos de producción con SQL Server 2016...
 
Aplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual MachineAplicando SQL Server 2016 en Microsoft Azure Virtual Machine
Aplicando SQL Server 2016 en Microsoft Azure Virtual Machine
 
Sistemas basados en conocimiento
Sistemas basados en conocimientoSistemas basados en conocimiento
Sistemas basados en conocimiento
 
Inferencia LóGica
Inferencia LóGicaInferencia LóGica
Inferencia LóGica
 

Similar to Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"

Obtenga una visión unificada de los datos de su organización (MDM)
Obtenga una visión unificada de los datos de su organización (MDM)Obtenga una visión unificada de los datos de su organización (MDM)
Obtenga una visión unificada de los datos de su organización (MDM)
PowerData
 
Power data mdm
Power data  mdmPower data  mdm
Power data mdm
PowerData
 
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
SpanishPASSVC
 

Similar to Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali" (20)

Introducción a Data Quality Services en MS SQL Server 2012
Introducción a Data Quality Services en MS SQL Server 2012Introducción a Data Quality Services en MS SQL Server 2012
Introducción a Data Quality Services en MS SQL Server 2012
 
Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8Diplomado Técnico SQL Server 2012 - Sesión 4/8
Diplomado Técnico SQL Server 2012 - Sesión 4/8
 
Inteligencia de Negocios en MS Sql Server
Inteligencia de Negocios en MS Sql ServerInteligencia de Negocios en MS Sql Server
Inteligencia de Negocios en MS Sql Server
 
Obtenga una visión unificada de los datos de su organización (MDM)
Obtenga una visión unificada de los datos de su organización (MDM)Obtenga una visión unificada de los datos de su organización (MDM)
Obtenga una visión unificada de los datos de su organización (MDM)
 
Asegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligenceAsegurando la calidad del dato en mi entorno de business intelligence
Asegurando la calidad del dato en mi entorno de business intelligence
 
MDS - Aplicando y gestionando centralizadamente los datos maestros en escenar...
MDS - Aplicando y gestionando centralizadamente los datos maestros en escenar...MDS - Aplicando y gestionando centralizadamente los datos maestros en escenar...
MDS - Aplicando y gestionando centralizadamente los datos maestros en escenar...
 
Power data mdm
Power data  mdmPower data  mdm
Power data mdm
 
Evento D Data Quality Y Call Center Jmh V2
Evento D Data Quality Y Call Center Jmh V2Evento D Data Quality Y Call Center Jmh V2
Evento D Data Quality Y Call Center Jmh V2
 
Ruei niveles servicio
Ruei niveles servicioRuei niveles servicio
Ruei niveles servicio
 
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
24 HOP edición Español - Asegurando la calidad del dato en mi proyecto de bi ...
 
Presentación SQL Server 2008
Presentación SQL Server 2008Presentación SQL Server 2008
Presentación SQL Server 2008
 
Data pipeline
Data pipelineData pipeline
Data pipeline
 
Introduccion Oracle 11G
Introduccion Oracle 11GIntroduccion Oracle 11G
Introduccion Oracle 11G
 
Presentación BI - Azure_VFinal_RevOleon.pptx
Presentación BI - Azure_VFinal_RevOleon.pptxPresentación BI - Azure_VFinal_RevOleon.pptx
Presentación BI - Azure_VFinal_RevOleon.pptx
 
Analítica ágil con Power BI
Analítica ágil con Power BIAnalítica ágil con Power BI
Analítica ágil con Power BI
 
Inteligencia De Negocios - Rojas Figueroa Erick
Inteligencia De Negocios - Rojas Figueroa ErickInteligencia De Negocios - Rojas Figueroa Erick
Inteligencia De Negocios - Rojas Figueroa Erick
 
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
Webinar Vault IT: Analítica avanzada y Machine Learning con virtualización de...
 
Webinar Inteligencia de Negocios
Webinar Inteligencia de NegociosWebinar Inteligencia de Negocios
Webinar Inteligencia de Negocios
 
Oracle bI(inteligencia de negocios)
Oracle bI(inteligencia de negocios)Oracle bI(inteligencia de negocios)
Oracle bI(inteligencia de negocios)
 
Webinar Dic 2016 BOC Cloud_v1
Webinar Dic 2016 BOC Cloud_v1Webinar Dic 2016 BOC Cloud_v1
Webinar Dic 2016 BOC Cloud_v1
 

More from Joseph Lopez

More from Joseph Lopez (20)

Entorno de datos Microsoft Cloud
Entorno de datos Microsoft CloudEntorno de datos Microsoft Cloud
Entorno de datos Microsoft Cloud
 
Microsoft Azure Data Environment
Microsoft Azure Data EnvironmentMicrosoft Azure Data Environment
Microsoft Azure Data Environment
 
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
Perspectiva de Microsoft Business Intelligence a partir de la integracion con...
 
Recuperación ante desastres y continuidad del negocio con Azure SQL Database
Recuperación ante desastres y continuidad del negocio con Azure SQL DatabaseRecuperación ante desastres y continuidad del negocio con Azure SQL Database
Recuperación ante desastres y continuidad del negocio con Azure SQL Database
 
DBA para SharePoint
DBA para SharePointDBA para SharePoint
DBA para SharePoint
 
Introducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data WarehouseIntroducción a Microsoft Azure SQL Data Warehouse
Introducción a Microsoft Azure SQL Data Warehouse
 
In-Memory OLTP en SQL Server 2016
In-Memory OLTP en SQL Server 2016In-Memory OLTP en SQL Server 2016
In-Memory OLTP en SQL Server 2016
 
Introducción a Azure DocumentDB
Introducción a Azure DocumentDBIntroducción a Azure DocumentDB
Introducción a Azure DocumentDB
 
Big Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivasBig Data - Desarrollando soluciones efectivas
Big Data - Desarrollando soluciones efectivas
 
Introduccion a Power BI
Introduccion a Power BIIntroduccion a Power BI
Introduccion a Power BI
 
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
Introducción a Power BI bajo escenarios empresariales híbridos con SQL Server...
 
Inteligencia de Negocio - Que Planeta es eso?
Inteligencia de Negocio - Que Planeta es eso?Inteligencia de Negocio - Que Planeta es eso?
Inteligencia de Negocio - Que Planeta es eso?
 
Introduccion a las Bodegas de Datos
Introduccion a las Bodegas de DatosIntroduccion a las Bodegas de Datos
Introduccion a las Bodegas de Datos
 
Microsoft Azure SQL Database
Microsoft Azure SQL DatabaseMicrosoft Azure SQL Database
Microsoft Azure SQL Database
 
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...Configuring SharePoint Server 2013 environment for Business Intelligence Plat...
Configuring SharePoint Server 2013 environment for Business Intelligence Plat...
 
Configurar su entorno SharePoint para Business Intelligence
Configurar su entorno SharePoint para Business IntelligenceConfigurar su entorno SharePoint para Business Intelligence
Configurar su entorno SharePoint para Business Intelligence
 
Generando Toma de Decisiones Inteligente con Microsoft Big Data
Generando Toma de Decisiones Inteligente con Microsoft Big DataGenerando Toma de Decisiones Inteligente con Microsoft Big Data
Generando Toma de Decisiones Inteligente con Microsoft Big Data
 
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
Building The Modern Architecture of Hybrid Data for Big Data with Microsoft D...
 
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014
Instalando y configurando PowerPivot para SharePoint 2013 y SQL Server 2014
 
MS SQL Server 2014 - In-Memory OLTP
MS SQL Server 2014 - In-Memory OLTPMS SQL Server 2014 - In-Memory OLTP
MS SQL Server 2014 - In-Memory OLTP
 

Recently uploaded

EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
FagnerLisboa3
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
AnnimoUno1
 

Recently uploaded (15)

Avances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvanaAvances tecnológicos del siglo XXI 10-07 eyvana
Avances tecnológicos del siglo XXI 10-07 eyvana
 
Avances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estosAvances tecnológicos del siglo XXI y ejemplos de estos
Avances tecnológicos del siglo XXI y ejemplos de estos
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptxPROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
PROYECTO FINAL. Tutorial para publicar en SlideShare.pptx
 
presentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptxpresentacion de PowerPoint de la fuente de poder.pptx
presentacion de PowerPoint de la fuente de poder.pptx
 
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptxEL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
EL CICLO PRÁCTICO DE UN MOTOR DE CUATRO TIEMPOS.pptx
 
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdfRefrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
Refrigerador_Inverter_Samsung_Curso_y_Manual_de_Servicio_Español.pdf
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
Modulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdfModulo-Mini Cargador.................pdf
Modulo-Mini Cargador.................pdf
 
Presentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptxPresentación guía sencilla en Microsoft Excel.pptx
Presentación guía sencilla en Microsoft Excel.pptx
 
Desarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdfDesarrollo Web Moderno con Svelte 2024.pdf
Desarrollo Web Moderno con Svelte 2024.pdf
 
Presentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmerilPresentación de elementos de afilado con esmeril
Presentación de elementos de afilado con esmeril
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
pruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNITpruebas unitarias unitarias en java con JUNIT
pruebas unitarias unitarias en java con JUNIT
 

Servicios de Calidad de Datos Empresariales con Data Quality Service "Denali"

  • 1. Servicios de Calidad de Datos Empresariales con Data Quality Services "Denali" José Redondo Chapter Leader – SQL PASS Venezuela www.sqlpass.org.ve Correo: redondoj@gmail.com Twitter: @redondoj
  • 2. AGENDA • Introducción • Características • Arquitectura • Instalación y Configuración • Base de conocimiento ‘Knowledge Base’ • Proyecto de Calidad de Datos ‘Data Quality Project’ • Demos • Preguntas
  • 3. INTRODUCCIÓN • ¿Qué es Calidad de Datos? – El grado en que los datos de una entidad están aptos para usos comerciales. – Se pueden definir, medir y administrar a través de varias Dimensiones y Métricas. • Precisión • Consistencia • Integridad • Duplicados • Puntualidad – Personas + Tecnología + Procesos.
  • 4. INTRODUCCIÓN • ¿Porqué es importante la Calidad de Datos? – Es el fundamento de todo negocio. – La deficiencia tiene un impacto negativo y significativo en las iniciativas empresariales mas estratégicas del negocio. – Mala información = (Tiempo extra * (Perdida de credibilidad + Insatisfacción de los clientes)) / Problemas de incumplimiento + Malos ingresos.
  • 5. INTRODUCCIÓN ¿Problemas comunes de Calidad de Datos? Calidad de Problemática Ejemplo Datos Estandarización Son elementos de datos coherentemente Tipo Sexo: definidos y entendidos? • M, F, I en un sistema. • 0, 1, 2 en otro sistema. Formateo Qué normativa estándar llevan los Número de teléfono pueden aparecer como: siguientes datos? • 02129999999 • (212)-9999999 • +58 212 9999999 Consistentes Los valores representan el mismo Los montos se presentan en Bolívares Fuertes así como significado? en Euros o en Dólares? Afinamiento Es necesario mostrar todos los datos? • 20% de los apellidos de los clientes están en blanco. • 50% de los códigos postales son 999999. Exactitud Los datos se muestran con exactitud real o Un proveedor esta en el sistema como “Activo” pero dejo proviene de una fuente verificable? de estar operativo desde hacen 6 años. Validación Qué significan los valores que se Los montos salariales deben rondar entre BsF. 26,000 a encuentran dentro de rangos aceptables? BsF. 35,000. Unicidad Los datos son repetidos? Tanto Alba Rivero como Alma Rivero aparecen en el sistema. ¿Son la misma persona?
  • 6. INTRODUCCIÓN Requerimientos de una solución de Calidad de Datos. Monitoreo Limpieza Seguimiento y monitoreo del Modificar, eliminar y estados de las actividades de enriquecer los datos Calidad de Datos. incorrectos o incompletos. Esto incluye la corrección, la estandarización y enriquecimiento de los datos. Perfilamiento Coincidencia Análisis de la fuente de datos Identificando, enlazando y para dar una idea del estado combinando las entradas de los datos y ayudar a relacionadas dentro o a identificar problemas de través de los conjuntos de Calidad de Datos.. datos..
  • 7. INTRODUCCIÓN • ¿Qué es Data Quality Services “DQS”? – Es una solución enfocada: • Conocimiento. • Data Quality Knowledge Base - "DQKB“. – Limpieza de datos. – Coincidentes. – El concepto principal: • Rápido. • Fácil de implementar. • Fácil de usar.
  • 8. INTRODUCCIÓN • ¿Qué es Data Quality Knowledge Base “DQKB”? – Es el núcleo de DQS. – Almacena todos los conocimientos. • Tipo específico de orígenes. • Fuentes de datos. – Componentes: • Orígenes de datos. • Dominios de datos. – Almacena: • Términos identificados. • Errores de ortografía. • Reglas de validación y de negocios. • Datos de referencia.
  • 9. CARACTERÍSTICAS • Gestión del conocimiento. • Proyectos. • Administración.
  • 10. CARACTERÍSTICAS • Gestión del conocimiento. – Descubrir el conocimiento. – Administración de dominios. – Políticas de combinación. – Servicios de referencias.
  • 11. CARACTERÍSTICAS • Proyectos de calidad de datos. – Limpieza y depuración. – Coincidencias y deduplicación. – Perfiles y notificaciones.
  • 12. CARACTERÍSTICAS • Administración de la calidad de los datos. – Administración. – Seguridad.
  • 13. CARACTERÍSTICAS Hacer accesible datos de calidad para todos. – Mejorar la calidad de los datos con DQS. • Limpiar los datos y mantenerlos limpios. • Fomentar la confianza en los datos de la empresa. • Compartir la responsabilidad de la calidad de los datos. – Eliminar las barreras para la calidad de los datos. • Diseñado para su facilidad de uso. • Capacitar a los usuarios de negocio. • Ver los resultados en minutos en lugar de meses.
  • 14. CARACTERÍSTICAS Administración del conocimiento Creación Datos de referencia Descubrir / Explorar datos / Conectar Datos empresariales Perfilamiento Base de Notificaciones Conocimiento Use Procesos de DQS Proyecto de Calidad de Datos
  • 15. ARQUITECTURA DQS se conforma por los siguientes componentes: – Servidor DQS. – Cliente DQS. Servicios externos: – Servicios de la nube de DQS. – Servicios de terceros.
  • 17. ARQUITECTURA Servidor DQS API de Servicios RD API de Referencia de Datos Servidor DQ (Browse, Set, Validate…) (Browse, Get, Update…) Motor DQ Perfilamiento de Limpieza Descubriendo el Datos Datos & Referenciados Conocimiento Exploración Coincidencias Almacén de Proyectos DQ Almacén Común de Conocimiento Almacén de Base de Conocimiento Base de Dominios de Dominio de Conocimiento Proyectos Activos DQ Datos MS Datos Locales Publicada
  • 18. ARQUITECTURA Cliente DQS Cliente DQ Interfaz gráfica DQS Descubriendo y Administrando el Conocimiento Clientes futuros: Componente MS Office Excel, DQ SSIS MS SharePoint, etc. Proyecto DQ Interactivo Exploración de Datos
  • 20. ARQUITECTURA Servicios de la nube de DQS MS Windows Azure Marketplace DataMarket Servicio de Referencias de Referencias de Datos Almacén de Dominios de Datos Categorizados Categorizados MS DQ
  • 21. ARQUITECTURA Servicios de terceros 3rd Party Reference Data Services Reference Data Sets
  • 22. INSTALACIÓN Y CONFIGURACIÓN • Prerrequisitos. • Instalación. • Tareas Post Instalación.
  • 23. INSTALACIÓN Y CONFIGURACIÓN • Prerrequisitos – Servidor DQS. – Cliente DQS. – Componente DQS para SSIS.
  • 25. INSTALACIÓN Y CONFIGURACIÓN • Instalación – .NET 4.0 – IE 6.0 SP1 o superior.
  • 29. INSTALACIÓN Y CONFIGURACIÓN • Tareas Post Instalación – Habilitar el rol de usuario DQS. – Habilitar permisos en la base de datos Origen / Destino. – Habilitar el protocolo TCP-IP para acceso remoto.
  • 30. INSTALACIÓN Y CONFIGURACIÓN • Habilitar el rol de usuario DQS.
  • 31. INSTALACIÓN Y CONFIGURACIÓN • Habilitar el rol de usuario DQS.
  • 32. INSTALACIÓN Y CONFIGURACIÓN • Habilitar permisos en la base de datos Origen / Destino.
  • 33. INSTALACIÓN Y CONFIGURACIÓN • Habilitar permisos en la base de datos Origen / Destino.
  • 34. INSTALACIÓN Y CONFIGURACIÓN • Habilitar el protocolo TCP-IP para acceso remoto.
  • 38. BASE DE CONOCIMIENTO Valores Composición de Dominios Representación de Dominios de los tipos de datos Datos de Base de Referencias Reglas de 3ras & Dominios Conocimiento partes Relaciones Políticas de Coincidencias
  • 39. PROYECTO DE CALIDAD DE DATOS • Limpieza de datos. • Componente SSIS. • Coincidencia de datos.
  • 40.
  • 41. RESUMEN Basado en el Facil de usar Abierto & Conocimiento Extensible • Base de Conocimiento • Enfocado a la productividad • Enfocado a la enriquecida. y experiencia del usuario. referencialidad de los datos • Continua mejoras y • Diseñado para usuarios basados en la nube. adquisición de empresariales. • Creado por usuarios de conocimiento. • Externo a un criterio de conocimiento. • Una vez creada, se conocimiento. • Integración con SSIS incrementa su uso.
  • 42.
  • 43. http://www.sqlpass.org.ve http://www.sqlpass.org http://www.sqlpass-latam.org http://microsoft.com/technet http://microsoft.com/msdn