Introducción a Data Quality Services en MS SQL Server 2012
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share

Introducción a Data Quality Services en MS SQL Server 2012

  • 3,968 views
Uploaded on

Una vista rápida del poder eficiente sobre como obtener fácilmente datos con calidad en cualquier entorno empresarial de producción en la realidad de las empresas de hoy.

Una vista rápida del poder eficiente sobre como obtener fácilmente datos con calidad en cualquier entorno empresarial de producción en la realidad de las empresas de hoy.

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
3,968
On Slideshare
2,088
From Embeds
1,880
Number of Embeds
6

Actions

Shares
Downloads
32
Comments
0
Likes
1

Embeds 1,880

http://redondoj.wordpress.com 1,852
https://redondoj.wordpress.com 24
http://webcache.googleusercontent.com 1
http://www.yatedo.fr 1
http://redondoj.wordpress.com&_=1354834714244 HTTP 1
http://www.linkedin.com 1

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. SQL PASS Venezuela – Caracas Chapter http://venezuela.sqlpass.org/ SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 2. Introducción a los Servicios de Calidad de Datos - “DQS” con MS SQL Server 2012José RedondoMCP, MCST - MS SQL Server 2K5MTA - Database Administration FundamentalsChapter Leader Caracas Chapter redondoj@gmail.com redondoj.wordpress.com www.facebook.com/redondoj @redondoj
  • 3. AGENDA• Conceptos• Arquitectura• Administración del Conocimiento & Limpieza de Datos DEMO “Base de Conocimiento & Limpieza”• Correspondencia & Coincidencias de Datos DEMO “Correspondencia & Coincidencia”• Integración de DQS con SSIS DEMO “Limpieza de Datos”• Preguntas y Respuestas SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 4. CONCEPTOSRepresenta el grado enque los datos son Datos Malosadecuados y/o apropiados =para su uso comercial en Empresas Deficientescualquier ámbitoempresarial. Se construyen y desarrollan a través de la siguiente ecuación: ‘Personas + Tecnología + Procesos’ SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 5. CONCEPTOS Basada en el conocimiento Basado en la Base de Conocimiento de la Calidad de Datos (DQKB) Semántica Dominios de Datos capturan la semántica de los datos Adquieres conocimiento adicional Descubrir el conocimiento cuanto mas lo uses Abierta y Extensible Añada conocimiento generado por el usuario & Proveedores de 3ros Facil de usar y/o aplicar Diseñado para que el usuario incremente su productividad SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 6. CONCEPTOSModificar, Eliminar o Enriquecer La identificación, Lala información que es incorrecta vinculación o La fusión de laso incompleta; incluyendo la entradas relacionadas dentrocorrección, el enriquecimiento y o a través del o de losla estandarización del dato. conjunto(s) de dato(s). Limpieza Coincidencia Perfilado MonitoreoEl análisis del escenario del Seguimiento y monitoreo delorigen de datos nos brinda una estado de las actividades delidea de la calidad de los datos, proceso de la Calidad deayudándonos a identificar Datos.problemas de calidad de datos. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 7. ARQUITECTURADQ Clients Azure Market Place DQS UI Servicios de Datos de Datos de Referencias Almacén de Referencias Categorizados Categorizados Dominios MS DQ Administrar & Adquirir conocimiento Servidor DQ 3ras Partes / API de los Datos de Servicios de la API RD Referencias (Browse, Proveedores Proyectos (Browse, Set, Validate) Get, Update) Externos Interactivos DQ Exploración de Motor DQ Servicios de Datos Limpieza Referencias Perfilado de Referencias de Descubriendo de Datos Datos & Datos Conocimiento Correspondencia Componente Exploración de DQS SSIS Conjunto de Almacén de Almacén de Conocimiento Almacén de la Base de MDS Excel Referencias Proyectos DQ Común Conocimiento Add in de Datos Clientes Dominios Dominios KBs futuros – Excel Proyectos activos DQ de Datos de Datos Publicados & Dynamics MS Locales SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 8. ARQUITECTURA Administrar ConocimientoConstruir Perfilamiento Integrado Base de Conocimiento Proyecto DQ Usar SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 9. PUNTO CLAVELos Servicios de Calidad de Datos (DQS) es unasolución impulsada por el conocimiento de lacalidad de datos que permite a los administradoresde datos mejorar fácilmente la calidad de losmismos. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 10. DATA QUALITY SERVICES (DQS)• Base de Conocimiento.• Correspondencia.• MS SQL Server Integration Services 2012. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 11. ADMINISTRACIÓN DEL CONOCIMIENTO &LIMPIEZA DE DATOS• Como construimos y desarrollamos una Base de Conocimiento? • Iniciamos desde nuestros datos definiendo las necesidades de calidad que requerimos. • Descubriendo el Conocimiento. • Administramos el Conocimiento. • Creamos los dominios y/o los dominios compuestos y Servicios de Datos Referenciados. • Procesos de Limpieza. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 12. ADMINISTRACIÓN DEL CONOCIMIENTO &LIMPIEZA DE DATOS• Como construimos y desarrollamos una Base de Conocimiento? • Descubrimos e importamos dicho conocimiento. • Perfilamiento de los datos. • Definimos reglas & políticas de validación de datos, limpiando y generando coincidencias. • Puesta en escena del Conocimiento. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 13. DEMO“Base de Conocimiento & Limpieza” SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 14. CORRESPONDENCIA &COINCIDENCIA DE DATOS• Que es un registro coincidente? • Es la tarea de identificar los registros que coinciden con la misma entidad del mundo real. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 15. CORRESPONDENCIA &COINCIDENCIA DE DATOS• Que costo nos generan los datos duplicados? • Tiempo invertido en el negocio innecesariamente. • Comunicación inapropiada con los clientes. • Información no fiable en la toma de decisiones. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 16. CORRESPONDENCIA &COINCIDENCIA DE DATOS• De donde vienen los registros duplicados? • Mal diseño del software. • Validación de datos. • Fusiones y adquisiciones de empresas. • Factores de formateo y abreviaciones. • Cambios de atributos. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 17. CORRESPONDENCIA &COINCIDENCIA DE DATOS 1. Preparar las 2. Proyecto de políticas de Coincidencias coincidencias Aprovechar un KB Mapear el con el conocimiento conocimiento relevante con los existente orígenes de datos Diseñar Ejecutar las reglamentos de coincidencias coincidencia Revisar los Cada regla se resultados y aplica en un o desechar los no varios dominios apropiados Sintonizar las Exportar los datos políticas con los validos y orígenes de datos aplicarlos SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 18. CORRESPONDENCIA &COINCIDENCIA DE DATOS Una política de coincidencia esta preparada en la Base de Conocimiento. Una política de coincidencia consiste en reglas de coincidencia que evalúa que tan bien un registro es coincidente con otro. Especifica si los valores de los registro tienen que tener coincidencia exacta, de forma similar o con requisito previo. Accionar las políticas mediante la ejecución y puesta a punto cada regla separadamente. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 19. DEMO“Correspondencia & Coincidencia de Datos” SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 20. INTEGRACIÓN DE DQS CON SSISEscenario Empresarial• La Calidad de los Datos es requerido como parte de un objetivo puntual del proceso.• Los Componentes de DQS en SSIS 2012 aprovecha el Conocimiento dentro de todo el procesos de Extracción, Transformación y Carga de datos. SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 21. INTEGRACIÓN DE DQS CON SSIS SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 22. DEMO“Limpieza de datos con SSIS” SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 23. PREGUNTAS Y RESPUESTAS SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 24. REFERENCIAS• MSDN Blogs – Data Quality Services • http://blogs.msdn.com/b/dqs/• TechNet – Data Quality Services • http://technet.microsoft.com/en- us/library/ff877925(v=sql.110).aspx• Introducción a DQS • http://msdn.microsoft.com/en- us/library/ff877917(v=SQL.110).aspx• SQL Server 2012 Data Quality Services (DQS) for Testing Teams • http://social.technet.microsoft.com/wiki/contents/articles/7701.sql -server-2012-data-quality-services-dqs-for-testing-teams.aspx• El Blog de José Redondo • http://redondoj.wordpress.com/ SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 25. SQL PASS Venezuela – Caracas ChapterAgradecimientos SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 26. José G. Redondo L. MCP, MCST - MS SQL Server 2K5 MTA - Database Administration Fundamentals Chapter Leader SQL PASS Venezuelaredondoj@gmail.com redondoj.wordpress.comwww.facebook.com/redondoj @redondoj
  • 27. SQL PASS Venezuela – Caracas Chapter Muchas gracias a tod@s por su atención SQL Pass Venezuela - Caracas Chapter @sqlpassve
  • 28. SQL PASS Venezuela – Caracas Chapter http://venezuela.sqlpass.org/ SQL Pass Venezuela - Caracas Chapter @sqlpassve