Validez y confiabilidad

4,894 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
4,894
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
253
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Validez y confiabilidad

  1. 1. Integrantes: Javier Martínez Sonia Martínez El Tigre, Marzo de 2014 VALIDEZ Y CONFIABILIDAD UNIVERSIDAD YACAMBÚ VICERECTORADO DE INVESTIGACIÓN Y POSTGRADO INSTITUTO DE INVESTIGACIÓN Y POSTGRADO Prof. Leonardo Castillo
  2. 2. ¿QUÉ SIGNIFICA MEDIR? • Medir es parte de nuestras vidas según Bostwick y Kyte (2005). De acuerdo a definiciones clásicas como: • Stevens (1951), significa “asignar números o valores a objetos y eventos de acuerdo a reglas”. • Carmines y Zeller (1979), señalan que esta definición es más apropiada para las ciencias físicas que para las ciencias sociales, las cuales trabajan con una serie de conceptos más abstractos que no pueden verse directamente o tratarse como productos o resultados.
  3. 3. MEDICIÓN • Según el razonamiento hecho por Carmines y Zeller nos hace sugerir que es más adecuado definir medición como el “proceso de vincular conceptos abstractos con indicadores empíricos”, proceso que se realiza mediante un plan explícito y organizado para clasificar y frecuentemente cuantificar los datos que puedan suministrar conductas observables relacionadas con las variables en estudio LA RESPUESTA OBSERVABLE • El centro de atención es por lo tanto la respuesta observable (bien sea una respuesta marcada en un cuestionario, una conducta grabada o una respuesta dada en una entrevista). Un instrumento de medición adecuado va a ser aquél que registra datos observables que verdaderamente representan los conceptos o variables (más abstractas) que el investigador tiene en mente.
  4. 4. ¿QUÉ REQUISITOS DEBE CUBRIR UN INSTRUMENTO DE MEDICIÓN? ValidezConfiabilidad Toda medición o instrumento de recolección de datos debe reunir dos requisitos esenciales
  5. 5. CONFIABILIDAD La confiabilidad de un instrumento de medición se refiere al grado de precisión o exactitud de la medida, en el sentido de que si aplicamos repetidamente el instrumento al mismo sujeto u objeto produce iguales resultados. Es el caso de una balanza o de un termómetro, los cuales serán confiables si al pesarnos o medirnos la temperatura en dos ocasiones seguidas, obtenemos los mismos datos. Balanza Termómetro
  6. 6. VALIDEZ La validez se refiere al grado en que un instrumento mide la variable que pretende medir. Por ejemplo, un test de inteligencia no será válido, si lo que mide es realmente memoria y no inteligencia. Ciertas variables como el sexo, la nacionalidad, son muy fáciles de observar o de preguntar y obtener una respuesta válida. Pero cuando se trata de diversas variables que se trabajan en ciencias sociales como motivaciones, actitudes, sentimientos, emociones, entre otras, la validez de un instrumento que pretenda medirlas se torna más compleja, y por lo tanto, cabe preguntarse si ¿realmente el instrumento estará midiendo lo que pretende medir?
  7. 7. LA VALIDEZ ES UN CONCEPTO DEL CUAL PUEDEN TENERSE DIFERENTES TIPOS DE EVIDENCIA: Evidencia relacionada con el contenido: La validez de contenido. Evidencia relacionada con el criterio: La validez de criterio. Evidencia relacionada con el constructo. La validez de constructo.
  8. 8. VALIDEZ DE CONTENIDO Se refiere al grado en que un instrumento refleja un dominio específico de contenido de lo que se mide. Por ejemplo, una prueba de operaciones aritméticas no tendrá validez de contenido si explora suma y división y excluye problemas de resta y multiplicación. Un instrumento de medición debe contener representados a todos los ítems del dominio de contenido de las variables a medir. Se determina antes de la aplicación del instrumento, mediante el Juicio de Expertos
  9. 9. VALIDEZ DE CONTENIDO A pesar de que no se utiliza un índice de correlación para expresar la validez de contenido, existen procedimientos para cuantificarlo. Algunos de estos procedimientos son: a)Cálculo de descriptivos: Consiste en calcular la media y la desviación típica de todos los ítems. b)Índice de validez de contenido (IVC): Lawshe (1975) propuso un índice de validez basado en la valoración de un grupo de expertos de cada uno de los ítems del test como innecesario, útil y esencial. El índice se calcula a través de la siguiente fórmula: ne- N/2 IVC= ----------------- N/2 Donde ne es el número de expertos que han valorado el ítem como esencial y N es el número total de expertos que han evaluado el ítem. El IVC oscila entre +1 y -1, siendo las puntuaciones positivas las que indican una mejor validez de contenido. Un índice IVC = 0 indica que la mitad de los expertos han evaluado el ítems como esencial.
  10. 10. VALIDEZ DE CRITERIO Establece la validez de un instrumento de medición comparándola con algún criterio externo. Entre más se relacionen los resultados del instrumento con el criterio, mayor será su validez. Si el criterio se ajusta al futuro se habla de validez predictiva. Por ejemplo una prueba de admisión en las universidades puede comparar sus resultados con el rendimiento futuro de los estudiantes en la carrera. Si el criterio se fija en el presente se habla de validez concurrente; es cuando los resultados del instrumento correlacionan con el criterio en el mismo momento o punto de tiempo. Por ejemplo una encuesta administrada un día antes de las votaciones para detectar preferencias del electorado, correlaciona con los resultados finales de la elección.
  11. 11. VALIDEZ DE CONSTRUCTO Es una variable medida que tiene lugar dentro de una teoría o esquema teórico Ruiz Bolívar (2001). Es probablemente la más importante, sobre todo desde la perspectiva científica, ya que se refiere al grado en que una medición aportada por un instrumento se relaciona consistentemente con otras mediciones que han surgido de hipótesis y construcción de teorías antecedentes.
  12. 12. 1 • Relación teórica entre los conceptos. 2 • Correlación de conceptos y análisis. 3 • Interpretación de la evidencia empírica de acuerdo con el nivel en que clarifica la validez de un constructo de una medición en particular. LA VALIDEZ DE UN CONSTRUCTO INCLUYE TRES ETAPAS: VALIDEZ TOTAL = Validez de Contenido + Validez de Criterio + Validez de Constructo
  13. 13. RELACIÓN ENTRE LA CONFIABILIDAD Y LA VALIDEZ Un instrumento de medición puede ser confiable pero no válido, puede medir consistentemente un aspecto más no medir lo que pretende medir el investigador. Por ello es requisito que un instrumento de medición demuestre ser confiable y válido. La validez y la confiabilidad no se asumen, se prueban.
  14. 14. FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ *La improvisación *El no estar validados en el contexto donde se aplican *El instrumento es inadecuado o no es empático *Las condiciones en que se aplica el instrumento *El quinto factor se refiere a los aspectos mecánicos
  15. 15. ¿CÓMO SE SABE SI UN INSTRUMENTO ES CONFIABLE Y VALIDO? En la práctica es casi imposible que una medición sea perfecta, generalmente se tiene un grado de error. Desde luego, se trata que este error sea el mínimo posible y para ello hay formas de calcular la confiabilidad y la validez. Para la confiabilidad, generalmente todos los procedimientos utilizan fórmulas que producen “coeficientes de confiabilidad”, los cuales pueden oscilar entre 0 y 1, donde 0 significa confiabilidad nula y 1 representa el máximo de confiabilidad. Entre más se acerque el coeficiente a 0 habrá mayor error en la medición.
  16. 16. TÉCNICAS PARA EL CÁLCULO DE LA CONFIABILIDAD 1.- Test - retest o Medida de Estabilidad. 2.- Test Paralelos o Método de Formas Alternativas. 3.- División por Mitades, Mitades Partidas (Split-halves). 4.- Coeficiente Alfa de Cronbach. 5.- Kuder – Richardson o Coeficiente KR-20.
  17. 17. MEDIDA DE ESTABILIDAD (CONFIABILIDAD POR TEST-RETEST). Un mismo instrumento es aplicado dos o más veces a un mismo grupo de personas. Si la correlación entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable. Desde luego, el período de tiempo entre las mediciones es un factor a considerar. Si es muy largo, otros factores como maduración o cambio de condiciones pueden afectar la segunda medida. Si es muy corto, las personas pueden recordar cómo contestaron la primera vez y aparecer como más consistentes la segunda vez.
  18. 18. Calcular la correlación entre ambas aplicaciones usando el coeficiente de Pearson.         n yy n xx n yx yx rxy        2222 * ..              2222 * .. yynxxn yxyxn rxy CÁLCULO DE LA MEDIDA DE ESTABILIDAD (CONFIABILIDAD POR TEST-RETEST).
  19. 19. LIMITACIONES DE LA TÉCNICA DE TEST RE-TEST O MEDIDA DE ESTABILIDAD El período de tiempo (corto o largo), entre las mediciones puede confundir la interpretación del Coeficiente de Confiabilidad obtenido mediante esta técnica.
  20. 20. MEDIDAS PARALELAS O FORMAS EQUIVALENTES DE MEDIR. En este procedimiento no se aplica el mismo instrumento de medición sino dos o más versiones equivalentes de éste. Las versiones deben ser similares en contenido, instrucciones, duración, entre otros. Por ejemplo cuando un profesor administra 2 ó más modalidades de examen en su grupo de alumnos. El instrumento es confiable si la correlación entre los resultados de las dos o más pruebas administradas es significativamente positiva.
  21. 21. LIMITACIONES DE LA TÉCNICA DE LOS TEST PARALELOS O MÉTODO DE FORMAS ALTERNATIVAS. 1.- Dificultad para obtener dos pruebas realmente paralelas. 2.- Efecto que el primer instrumento tiene sobre los puntajes del segundo. 3.- Implica un doble trabajo de construcción de instrumentos. 4.- Confiable sólo si correlación entre los resultados de ambas aplicaciones es positiva.
  22. 22. MÉTODO DE MITADES DIVIDIDAS (SPLIT- HALVES) Aquí se administra un solo instrumento, una sola vez, pero se dividen las preguntas o los ítems (Por ejemplo los ítems pares con respecto a los impares, o la primera mitad con respecto a la segunda mitad). Si correlacionan los resultados de las dos partes, se considera el instrumento confiable. Ahora bien, la confiabilidad varía de acuerdo al número de ítems de la prueba. Cuantos más ítems mayor es la confiabilidad.
  23. 23. 1° Se calcula el Índice de Correlación (Pearson) 2° Corrección de r con la ecuación de Spearman – Brown                2222      nn ABn r r r R   1 2 CÁLCULO DEL MÉTODO DE MITADES DIVIDIDAS (SPLIT-HALVES)
  24. 24. LIMITACIONES DE LA TÉCNICA DE DIVISIÓN POR MITADES O MITADES PARTIDAS 1.- Confiabilidad varía de acuerdo con el número de ítems que incluya el instrumento de medición. 2.- Demasiados ítems provocarán cansancio en el respondiente. 3.- Riesgo que el contenido de las mitades sea diferente.
  25. 25. COEFICIENTE ALFA DE CRONBACH Requiere sólo una aplicación del instrumento de medición. Produce valores que oscilan entre cero (0) y uno (1). No es necesario dividir en mitades los ítems del instrumento. Se aplica la medición y se calcula el coeficiente.
  26. 26. CÁLCULO DEL COEFICIENTE ALFA DE CRONBACH Su fórmula estadística es la siguiente:             2 2 1 1 T i S S K K  K: El número de ítems Si2 : Sumatoria de Varianzas de los Items ST2 : Varianza de la suma de los Items α: Coeficiente de Alfa de Cronbach
  27. 27. TÉCNICA KUDER – RICHARDSON O COEFICIENTE KR-20. Permite calcular la confiabilidad con una sola aplicación del instrumento. No requiere el diseño de pruebas paralelas. Es aplicable sólo en instrumentos con ítems dicotómicos, que puedan ser codificados con 1 – 0 (correcto – incorrecto, presente – ausente, a favor – en contra, entre otros) .
  28. 28. La fórmula para calcular la confiabilidad de un instrumento de n ítems o KR20 será: K=número de ítems del instrumento. p=personas que responden afirmativamente a cada ítem. q=personas que responden negativamente a caca ítem. St2= varianza total del instrumento xi=Puntaje total de cada encuestado. 2 2 . * 1 st qpst k k rtt    n xx st i         2__ 2 CÁLCULO DE LA TÉCNICA KUDER – RICHARDSON O COEFICIENTE KR-20.
  29. 29. REFERENCIAS BIBLIOGRÁFICAS. Hernández, R.; Fernández, R. y Batista, P. (2006). Metodología de la Investigación. Cuarta Edición. Editorial McGraw Hill Interamericana.  Hurtado, J. (1998). Metodología de la Investigación Holística. 2ª Ed., Caracas, Venezuela. Kerlinger, F. (1979). Enfoque Conceptual de la Investigación del Comportamiento. México, D.F. Nueva Editorial Interamericana.
  30. 30. “La Verdad es relativa y sólo tiene validez para aquel que la juzga”

×