Calidad de datos

1,642 views

Published on

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
1,642
On SlideShare
0
From Embeds
0
Number of Embeds
38
Actions
Shares
0
Downloads
0
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Calidad de datos

  1. 1. Limpieza de datoshttp://es.wikipedia.org/wiki/Informatica JOSÉ CUARTAS INFORMÁTICA
  2. 2. Limpieza datos¿Podemos interpretar los datos?¿Qué significan los campos?¿Cuál es la clave? Las medidas?Como manejar los datos censurados?¿Los datos se refieren a los mismos períodos de tiempo?No olvide hay fallos como: Errores tipográficos,múltiples formatos, los valores perdidos, no seentiende la especificación, entre otros. JOSÉ CUARTAS INFORMÁTICA 2
  3. 3. Limpieza datosEn general, se tiene un problema si los datos no significa lo que usted cree. Problemas de calidad de datos son costosas en tiempo y dinero. JOSÉ CUARTAS INFORMÁTICA 3
  4. 4. Los malos datos y datos malos.El mal diseño de información .Si compras una medicina que norequiere de receta médica, y no indica cuanto y cuando hay que consumirla,(Busco una solución, voy donde el medico, chaman o alguien que resuelva). "La cultura de la duda“ “La peor decisión es la indecisión” Benjamin FrankilnLa mala información. Se tienes la certeza de estar consumiendo lamedicina de manera correcta, aunque no sea cierto.Nunca olvide“las decisiones de hoy son las consecuencias de mañana” JOSÉ CUARTAS INFORMÁTICA 4
  5. 5. Datos http://es.wikipedia.org/wiki/DatoCuando los DATOS son VALIDOS hay MAYOR confianzapara la TOMA DE DECISIONES. JOSÉ CUARTAS INFORMÁTICA 5
  6. 6. Preprocesar y Preparar Datos• Son todas aquellas técnicas de análisis de datos que permite mejorar la calidad de un conjunto de datos. – Esto permite que las técnicas de extracción de conocimiento puedan obtener mayor y mejor información. • mejor porcentaje de clasificación, reglas con más completitud, entre otras. JOSÉ CUARTAS INFORMÁTICA 6
  7. 7. Ventajas en la Limpieza de datos• Unas ventajas: – Permite aplicar modelos de Aprendizaje/Minería de Datos de forma más rápida y sencilla. – Patrones de más calidad, precisión e interoperabilidad. JOSÉ CUARTAS INFORMÁTICA 7
  8. 8. Inconvenientoes en la Limpieza datos• Unos inconvenientes: – No es un área totalmente estructurada con una metodología concreta para todos los problemas. – Cada problema puede requerir una manera diferente de solución. JOSÉ CUARTAS INFORMÁTICA 8
  9. 9. Limpieza datos• Recolección de datos e integración: Se Obtienen los datos de diferentes fuentes de información, en este paso se resuelven los problemas de representación y codificación, integrando los datos desde diferentes fuentes con el fin de crear información homogénea, ...• Transformación de datos: Los datos son transformados o consolidados para luego poder extraer información realizar operaciones de resúmenes de datos y operaciones de agregación, entre otras. JOSÉ CUARTAS INFORMÁTICA 9
  10. 10. No olvideEs un procedimiento donde se recurre a métodosde muchas disciplinas como estadísticas, análisisexploratorio de datos minería (EDM), bases dedatos, gestión, y los metadatos.Busque siempre la calidad en los datos, estomejora notablemente la obtención deconocimiento. JOSÉ CUARTAS INFORMÁTICA 10

×