Compara medias

1,070 views

Published on

  • Be the first to comment

Compara medias

  1. 1. Inferencia Estadística
  2. 2. Inferencia Estadística
  3. 3. Inferencia Estadística
  4. 4. Según su Naturaleza
  5. 5. Según la Posición en la Investigación .
  6. 6. Parámetro Es un número que resume la cantidad de datos que pueden derivarse del estudio de una variable estadística. El cálculo de este número está bien definido, usualmente mediante una fórmula aritmética obtenida a partir de datos de la población
  7. 7. Inferencia Estadística Se llaman así porque su cálculo implica una estimación de los parámetros de la población con base en muestras estadísticas. Mientras más grande sea la muestra más exacta será la estimación, mientras más pequeña, más distorsionada será la media de las muestras por los valores raros extremos. •Más poder de eficiencia. •Menos posibilidad de errores. • Muestras obtenidas aleatoriamente • Distribución normal de las observaciones • Existe un parámetro de interés que buscamos estimar
  8. 8. 1. Independencia de las observaciones excepto datos apareados. 2. Las observaciones para la variable dependiente se han obtenido de manera aleatoria de una población con distribución normal. 3. La variable dependiente es medida al menos en una escala de intervalo. 4. Se recomienda un tamaño por muestra mínimo de 30. 5. Los datos son obtenidos de poblaciones que tienen varianzas iguales (una varianza no debe ser el doble o mayor que la otra). 6. Habitualmente las hipótesis se hacen sobre valores numéricos, especialmente el promedio de una población (μ), como ejemplo: Ho: μ1 = μ2 H1: μ1 ≠ μ2
  9. 9. Inferencia Estadística Son procedimientos estadísticos para prueba de hipótesis que no requieren de la suposición de la normalidad de la población de la cual fue extraída la muestra y se pueden aplicar a datos de tipo cuantitativo y cualitativo. 1. Determinación sencilla. Mediante fórmulas simples de combinación. 2. Fáciles de aplicar. 3. Rápidas de aplicar. Cuando las muestras son pequeñas. 4. Tipo de medición requerida. Se pueden utilizar con datos ordinales o nominales. 5. Tamaño de la muestra. Cuando la muestra es < 10 son sencillas, rápidas y sólo un poco menos eficaces. Conforme aumenta el tamaño de la muestra se hacen más laboriosas y tardadas, y menos efectivas.
  10. 10. DECISIONES AL SELECCIONAR LA MUESTRA Se quiere saber cómo se comporta una cierta característica en un Universo particular Hacer un Censo Sí El Universo está bien definido ? NO Definir El Universo Sí Es posible observar todo el Universo ? NO Tomar una Muestra No representativa NO Observar una Muestra Se quiere inferir la medición al Universo Las observaciones pueden atribuirse a los miembros del Universo Las observaciones solo pueden atribuirse a la muestra, NO a los miembros del Universo ? Sí Tomar una Muestra Representativa Las observaciones pueden atribuirse a los miembros del Universo
  11. 11. Inferencia Estadística INDEPENDIENTE Una muestra es independiente cuando los datos de la misma no se pueden relacionar con los de otra. Se trata entonces de dos conjuntos de datos independientes entre sí y cuyos tamaños de muestra pueden ser diferentes. DEPENDIENTE Una muestra es dependiente cuando existen dos conjuntos de datos relacionados por la misma muestra, es decir, existe un antes y un después. Las observaciones se realizan sobre las mismas unidades muestrales. Tips – Datos de dos poblaciones distintas. DI/DnA – Datos de la misma persona en dos momentos diferentes. DD/DA
  12. 12. Inferencia Estadística
  13. 13. Inferencia Estadística Se aplica la distribución normal, utilizando el estadístico Z o lo que es comúnmente llamado como Prueba Z. Significación de la Media  Se establece la diferencia entre una media muestral y una media poblacional hipotética conocida.  Se supone conocida la varianza. Estadístico de prueba   0 Z  n
  14. 14. Inferencia Estadística Rechace la hipótesis nula Rechace la hipótesis nula α α  Z   z 0 0 Hipótesis alternativa µ < µ0 z Z   Hipótesis alternativa µ > µ0 Rechace la hipótesis nula Rechace la hipótesis nula α/2 α/2 Z   2 0 z Z  2 Hipótesis alternativa µ ≠ µ0
  15. 15. • Un investigador en el campo de la educación conoce que la cantidad de estudiantes que aprueban un determinado curso es de 260 con una desviación típica de 10. Para comprobar la validez de esta hipótesis, se tomo una muestra al azar de 36 observaciones obteniendo que el promedio de aprobados fuera de 267. ¿Está este valor muestral obtenido, de acuerdo con la hipótesis al 5% de significancia?
  16. 16. Paso 1: plantear las hipótesis H0: µ = µ0 H1: µ ≠ µ0 Paso 2: Se establece el nivel de significancia α = 0,05 Paso 3: Estadístico de prueba Z 7   0 267  260 = = = 4,19  10 1,67 n 36
  17. 17. Paso 4: Se establece la región de aceptación y la de rechazo o región crítica para una prueba de dos extremos. (Como se plantearon las hipótesis H0: µ = µ0 H1: µ ≠ µ0 se establece 2 colas) Región de aceptación Región Crítica: Z  Z   2 se rechaza H0 Z  Z 0,025   1   2 0,025 0,95 Se buscan los valores de Z   2 Z   1   2 Z   y 2 Z   1   2 En la tabla Z para el nivel de significancia dado α = 0,05 Por lo tanto la región crítica es: Z  1,96 Z  1,96
  18. 18. Paso 5: Decisión y conclusiones. Como Z = 4,19 > 1,96. Se rechaza la hipótesis H0 (no existen diferencias significativas entre la media muestral y la poblacional) Por lo tanto se toma la H1 (existe diferencia significativa) Se recomienda no considerar en estudios futuros el promedio de aprobados anualmente en el curso, como de 260 estudiantes.
  19. 19. Pruebas Estadísticas para la comparación de Medias TEST T PARA DIFERENCIA PAR TEST T PARA MUESTRAS INDEPENDIENTES
  20. 20. Las pruebas t desapareadas o de muestras independientes, se utilizan cuando se obtienen dos grupos de muestras aleatorias, independientes e idénticamente distribuidas a partir de las dos poblaciones a ser comparadas.
  21. 21. Supóngase que estamos evaluando el efecto de un tratamiento médico, y reclutamos a 100 sujetos para el estudio. Luego elegimos aleatoriamente 50 sujetos para el grupo en tratamiento y 50 sujetos para el grupo de control. En este caso, obtenemos dos muestras independientes y podríamos utilizar la forma desapareada de la prueba t. La elección aleatoria no es esencial en este caso, si contactamos a 100 personas por teléfono y obtenemos la edad y género de cada una, y luego se utiliza una prueba t bimuestral para ver en que forma la media de edades difiere por género, esto también sería una prueba t de muestras independientes, a pesar de que los datos son observacionales.
  22. 22. Las pruebas t de muestras dependientes o apareadas, consisten típicamente en una muestra de pares de valores con similares unidades estadísticas, o un grupo de unidades que han sido evaluadas en dos ocasiones diferentes (una prueba t de mediciones repetitivas). Cuando los sujetos sean evaluados antes y después de un tratamiento. Ejemplo: Prueba Diagnóstica aplicada al inicio de la clase.
  23. 23. Pruebas Estadísticas para la comparación de Medias No paramétricas Para datos apareados Equivalente a T de STUDENT Muestra pequeñas, Mayor a 6 Menores a 25
  24. 24. Pruebas Estadísticas para la comparación de Medias Trabaja con datos ordinales Establece diferencias de magnitudes (+ y -) Dos muestras apareadas Establece Diferencias Muestras, grandes Mayores a 25 , se intenta lograr distribución Normal
  25. 25. Pruebas Estadísticas para la comparación de Medias
  26. 26. Pruebas Estadísticas para la comparación de Medias
  27. 27. Pruebas Estadísticas para la comparación de Medias
  28. 28. Pruebas Estadísticas para la comparación de Medias
  29. 29. Pruebas Estadísticas para la comparación de Medias
  30. 30. Pruebas Estadísticas para la comparación de Medias
  31. 31. Pruebas Estadísticas para la comparación de Medias
  32. 32. Pruebas Estadísticas para la comparación de Medias
  33. 33. Pruebas Estadísticas para la comparación de Medias
  34. 34. Pruebas Estadísticas para la comparación de Medias
  35. 35. Pruebas Estadísticas para la comparación de Medias
  36. 36. Pruebas Estadísticas para la comparación de Medias
  37. 37. Pruebas Estadísticas para la comparación de Medias
  38. 38. Pruebas Estadísticas para la comparación de Medias
  39. 39. Pruebas Estadísticas para la comparación de Medias
  40. 40. Pruebas Estadísticas para la comparación de Medias
  41. 41. Pruebas Estadísticas para la comparación de Medias
  42. 42. Pruebas Estadísticas para la comparación de Medias
  43. 43. Pruebas Estadísticas para la comparación de Medias
  44. 44. Prueba de U de Mann Whitney Pruebas No Paramétricas Permiten analizar datos en escala nominal u ordinal a pesar de que no se conozcan los parámetros de una población. Utiliza el criterio de que no plantea hipótesis sobre parámetros o el de que analiza datos obtenidos con una escala de medida débil (datos que aun cuando están cuantificados se aprovechan sus características nominales u ordinales). Se habla de distribucion libre al aplicar estas pruebas porque no establece supuestos exigentes sobre las poblaciones originales sobre donde se muestrea.
  45. 45. Prueba de Mann Whitney Se usa cuando Es, de hecho, la Cuyos datos han se quiere versión no sido medidos al comparar dos paramétrica de menos en una poblaciones la usando muestras escala de nivel habitual prueba ordinal. t de Student. independientes
  46. 46. Prueba de U de Mann Whitney • Con ella se calcula el llamado estadístico U, cuya distribución para muestras con más de 20 observaciones se aproxima bastante bien a la distribución normal
  47. 47. Pasos para Efectuar la Prueba • Para efectuar la prueba, se combinan dos muestras en un arreglo ordenado, identificando los valores muestrales, de acuerdo con el grupo muestral al que pertenecen.
  48. 48. Pasos para Efectuar la Prueba • Luego se determinar el tamaño de las muestras (n1 y n2). Si n1 y n2 son menores que 20, se consideran muestras pequeñas, pero si son mayores que 20, se consideran muestras grandes.
  49. 49. Pasos para Efectuar la Prueba • En caso de muestras grandes, calcular el valor Z, pues en estas condiciones se distribuye normalmente.
  50. 50. Pasos para Efectuar la Prueba • Despues se ordenan los valores de menor a mayor, asignando el rango uno al valor mas pequeño. • Cuando se encuentran valores iguales(ligas o empates ), se le asigna el promedio de sus rangos
  51. 51. Pasos para Efectuar la Prueba • Se calculan los valores de U1 y U2, de modo que se elija el más pequeño para comparar con los críticos de U MannWhitney de la tabla de probabilidades asociadas con valores pequeños como los de U en la prueba de Mann-Whitney
  52. 52. Pasos para Efectuar la Prueba • Luego se designa mediante U a la estadística que se calcula para realizar esta prueba y el cual se basa en el numero de veces que un puntaje de un grupo antecede aun puntaje de otro grupo, si hay dos grupos.
  53. 53. Pasos para Efectuar la Prueba • Y por ultimo decidir si se acepta o se rechaza la Ho
  54. 54. No obstante es mas fácil basarse en la suma de rangos de cualquiera de las dos muestras aleatorias mediante las siguientes formulas: U1 y U2 = valores estadísticos de U MannWhitney. n1 = tamaño de la muestra del grupo 1. n2 = tamaño de la muestra del grupo 2. R1 = sumatoria de los rangos del grupo 1. R2 = sumatoria de los rangos del grupo 2.
  55. 55. Ejemplos Muestras Pequeñas • Un experimentador utiliza dos métodos para enseñar a leer a un grupo de 10 niños de 6 años, quienes ingresan por primera vez a la escuela. El experimentador quiere demostrar que el procedimiento ideado por él es más efectivo que el tradicional; para ello, mide el desempeño en la lectura en función de la fluidez, comprensión, análisis y síntesis. El plan experimental preliminar consiste en elegir al azar tanto una muestra de 10 niños como el método por utilizar.
  56. 56. Hipótesis de Trabajo • Hipótesis alterna (Ha). Las calificaciones de ejecución de lectura, según el método de enseñanza del experimentador son más altas y diferentes que las observadas en el método tradicional. • Hipótesis nula (Ho). Las diferencias observadas entre las calificaciones de ejecución de lectura mediante los dos métodos se deben al azar.
  57. 57. • Nivel de significación. Para todo valor de probabilidad igual o menor que p = 0.05, se acepta Ha y se rechaza Ho. • Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
  58. 58. Dos métodos diferentes aplicados en dos grupos de niños.
  59. 59. • Aplicación de la prueba estadística. De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor al mayor. • Rangos de lectura de la tabla anterior.
  60. 60. • De los dos valores de U calculados, se elige el más pequeño (4) y se comparan con los valores críticos de U Mann-Whitney • En caso de que el valor de U calculado no se localice en las tablas correspondientes, se transformará en la fórmula siguiente U = n1n2 - U' • En esta fórmula, U' corresponde al valor más alto.
  61. 61. SPSS
  62. 62. Decisión. A la probabilidad del valor U de MannWhitney, calculado anteriormente, corresponde 0.048, el cual es más pequeño que el nivel de significancia; por lo tanto, se acepta Ha y se rechaza Ho.
  63. 63. Interpretación • Entre las calificaciones de la ejecución de lectura mediante los dos métodos de enseñanza existe una diferencia significativa a un nivel de probabilidad de error menor que 0.05; es decir, aun cuando las muestras son pequeñas, las calificaciones más altas mediante el método diseñado por el experimentador señalan más efectividad, con la probabilidad de equivocarse de 0.048 para aceptarlo.
  64. 64. Inferencia Estadística Es lo que se conoce como análisis de a Varianza, este procedimiento es para mas de dos (2) pruebas es decir realiza una comparación de medias en Variable cuantitativas; se usa para contrastar la Hipótesis de que varias medias son iguales. •Analizar una respuesta cuantitativa •Condiciones experimentales identificadas •Posibilidad de crear subconjuntos
  65. 65. Pruebas Estadísticas para la comparación de Medias Es un método no paramétrico para probar si un grupo de datos proviene de la misma población, intuitivamente idéntico al anova. Es el método mas adecuado para comparar poblaciones cuyas distribuciones no son normales, permitiendo comparar mas de dos muestras. Esta prueba se emplea como sustituta del análisis de varianza ya que no supone ni la normalidad de la población ni la homogeneidad de la varianza como la ANOVA
  66. 66. Pruebas Estadísticas para la comparación de Medias No hace predicción alguna sobre las medias de la población, sólo afirma que cuando menos una de las distribuciones poblaciones es diferente de algunas de las otras distribuciones poblacionales Por lo que la hipótesis nula afirma que las muestras son aleatorias, extraídas de las mismas o idénticas distribuciones poblaciones
  67. 67. Pruebas Estadísticas para la comparación de Medias Esta prueba utiliza rango muestrales de tres o más poblaciones independientes Cada muestra tiene al menos cinco observaciones Si los rangos se distribuyen de una manera equitativa entre los grupos muestrales, entonces H debe ser un número relativamente pequeño por lo que no se rechazará la hipótesis nula
  68. 68. Pruebas Estadísticas para la comparación de Medias

×