Este documento describe los conceptos básicos de las pruebas de hipótesis estadísticas. Explica que una hipótesis estadística es una proposición sobre un parámetro poblacional que se analiza con base en evidencia de una muestra. Luego detalla diferentes tipos de pruebas paramétricas y no paramétricas. Finalmente, presenta los pasos para realizar una prueba de hipótesis, incluyendo establecer hipótesis nula y alternativa, determinar una estadística de prueba y tomar una decis
1. 12/05/2015
PRUEBAS DE HIPÓTESIS
¿QUÉ ES UNA HIPÓTESIS ESTADÍSTICA?
Una proposición o afirmación acerca del valor de un
parámetro, relación entre parámetros, la forma de una
distribución, la cual se desea analizar con base en la
evidencia de la muestra o del experimento para tomar
una decisión sobre su validez.
2. PRUEBAS DE
HIPÓTESIS
Pruebas paramétricas
Pruebas de medias y proporciones.
Correlación y regresión lineal.
Análisis de varianza.
Análisis de covarianza.
Pruebas no paramétricas
Prueba chi-cuadrado
Coeficiente de correlación e independencia (Tablas)
3. HIPÓTESIS NULA E HIPÓTESIS ALTERNATIVA
La suposición que deseamos probar se conoce
como hipótesis nula (𝑯 𝟎 ).
Una hipótesis nula referente a un parámetro
poblacional siempre estará establecida en forma
tal que especifique un valor exacto del
parámetro.
𝑯 𝟎: 𝝁 = 𝝁 𝟎 𝑯 𝟎: 𝝁 ≥ 𝝁 𝟎 𝑯 𝟎: 𝝁 ≤ 𝝁 𝟎
4. HIPÓTESIS NULA E HIPÓTESIS ALTERNATIVA
La hipótesis alternativa representa la
proposición hipotética que se espera aceptar, por
tanto, su planteamiento debe recoger lo que
parece ser más verosímil (𝑯 𝟏 = 𝑯 𝒂).
Las dos hipótesis deben ser excluyentes y no
necesariamente complementarias.
𝑯 𝟏: 𝝁 ≠ 𝝁 𝟎 𝑯 𝟏: 𝝁 < 𝝁 𝟎 𝑯 𝟏: 𝝁 > 𝝁 𝟎
5. EJEMPLO:
El administrador de un centro de salud desea saber si el tiempo
medio invertido por los pacientes en la sala de espera es mayor de 20
minutos. Un muestra de 100 pacientes permanecieron, en promedio,
23 minutos en la sala de espera entre el registro y la atención por
algún médico del centro de salud. La desviación estándar de la
muestra fue de 10. use un nivel de significancia del 5%.
𝑯 𝟎: 𝑬𝒍 𝒕𝒊𝒆𝒎𝒑𝒐 𝒎𝒆𝒅𝒊𝒐 𝒊𝒏𝒗𝒆𝒓𝒕𝒊𝒅𝒐 𝒑𝒐𝒓 𝒍𝒐𝒔 𝒑𝒂𝒄𝒊𝒆𝒏𝒕𝒆𝒔 𝒆𝒏 𝒍𝒂 𝒔𝒂𝒍𝒂 𝒅𝒆 𝒆𝒔𝒑𝒆𝒓𝒂 𝒆𝒔 𝒅𝒆 𝟐𝟎 𝒎𝒊𝒏𝒖𝒕𝒐𝒔
𝑯 𝟏: 𝑬𝒍 𝒕𝒊𝒆𝒎𝒑𝒐 𝒎𝒆𝒅𝒊𝒐 𝒊𝒏𝒗𝒆𝒓𝒕𝒊𝒅𝒐 𝒑𝒐𝒓 𝒍𝒐𝒔 𝒑𝒂𝒄𝒊𝒆𝒏𝒕𝒆𝒔 𝒆𝒏 𝒍𝒂 𝒔𝒂𝒍𝒂 𝒅𝒆 𝒆𝒔𝒑𝒆𝒓𝒂 𝒆𝒔 𝒎𝒂𝒚𝒐𝒓 𝒅𝒆 𝟐𝟎 𝒎𝒊𝒏𝒖𝒕𝒐𝒔
𝑯 𝟎: 𝝁 = 𝟐𝟎 𝒎𝒊𝒏𝒖𝒕𝒐𝒔 𝒗𝒔 𝑯 𝟏: 𝝁 > 𝟐𝟎 𝒎𝒊𝒏𝒖𝒕𝒐𝒔
𝑯 𝟎: 𝝁 ≤ 𝟐𝟎 𝒎𝒊𝒏𝒖𝒕𝒐𝒔 𝒗𝒔 𝑯 𝟏: 𝝁 > 𝟐𝟎 𝒎𝒊𝒏𝒖𝒕𝒐𝒔
6. La decisión de rechazar o no la hipótesis nula, se basa en la
información contenida en una muestra de tamaño n, tomada de una
población.
Con los valores de la muestra se calcula el valor de la estadística de
prueba.
Se divide el conjunto de valores que puede tomar una estadística de
prueba en dos regiones: REGIÓN DE RECHAZO y REGIÓN DE
ACEPTACIÓN.
Si la estadística de prueba cae en la región de aceptación, se acepta la
hipótesis nula.
7. Las regiones de rechazo están localizadas bien en un solo extremo o en
ambos extremos de la curva de distribución de la estadística de
prueba.
Qué es un estadístico de prueba?
Es un estadístico (función que depende de la muestra) que se
utiliza para determinar el rechazo o no de la hipótesis nula.
Región crítica
Es el conjunto de todos los valores del estadístico de prueba para los
cuales la hipótesis nula se rechaza.
8. PASOS EN UNA PRUEBA DE HIPÓTESIS
Establecer las hipótesis nula y alternativa.
Establecer el tamaño de la muestra y el nivel de significancia.
Determinar una estadística de prueba o una regla que sea lógica en el contexto
del problema formulado por la hipótesis.
Formular una regla de decisión. Esta debe especificar qué valores de la
estadística de prueba se toman para aceptar 𝐻0 y cuáles para rechazarla.
Aplicar la regla de decisión. Si el valor de la estadística de prueba cae en la
región de rechazo, entonces rechazamos 𝐻0 ; si el valor cae en la región de
aceptación, entonces aceptamos 𝐻0.
9. ERROR TIPO I Y ERROR TIPO II
Cuando se toma decisiones respecto de una población basados en la
evidencia que proporciona una muestra representativa de dicha
población, se puede cometer dos tipos de error.
Error tipo I: Se comete un error tipo I cuando rechazamos una
hipótesis nula que es verdadera. La probabilidad de cometer este tipo
de error se simboliza con la letra griega alfa (α) y se llama nivel de
significancia.
Error tipo II: Se comete un error tipo II cuando aceptamos una
hipótesis nula que es falsa. La probabilidad de cometer este tipo de
error se simboliza con la letra griega beta, 𝜷.
10. ERROR TIPO I Y ERROR TIPO II
Decisiones respecto a la
hipótesis nula
(𝐻0 )
Hipótesis nula (𝐻0)
Decisión
𝑯 𝟎 𝒆𝒔 𝒗𝒆𝒓𝒅𝒂𝒅𝒆𝒓𝒂 𝑯 𝟎 𝒆𝒔 𝒇𝒂𝒍𝒔𝒂
𝑹𝒆𝒄𝒉𝒂𝒛𝒂𝒓 𝑯 𝟎
𝑨𝒄𝒆𝒑𝒕𝒂𝒓 𝑯 𝟎
Error tipo I
Error tipo IIDecisión correcta
Decisión correcta
𝑷(𝑪𝒐𝒎𝒆𝒕𝒆𝒓 𝒆𝒓𝒓𝒐𝒓 𝒕𝒊𝒑𝒐 𝑰) = 𝜶 (nivel de significancia)
𝑷(𝑪𝒐𝒎𝒆𝒕𝒆𝒓 𝒆𝒓𝒓𝒐𝒓 𝒕𝒊𝒑𝒐 𝑰𝑰) = 𝜷
1 − 𝛼 = 𝑁𝑖𝑣𝑒𝑙(𝑔𝑟𝑎𝑑𝑜) 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎
1 − 𝛽 = 𝑃𝑜𝑡𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎
11. PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
Supongamos que 𝑥1, 𝑥2, 𝑥3, … , 𝑥 𝑛 𝑒𝑠 𝑢𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛, de una población
que tiene media 𝜇 y varianza 𝜎2
.
Para los casos relacionados se debe usar la distribución normal como distribución de
muestreo, es decir, la estadística de prueba es:
𝑍 𝑐 =
𝑥 − 𝜇 𝐻0
𝜎
𝑛
Si la distribución de la población muestreada es normal y la varianza poblacional (𝜎2
) es
conocida. No importa si el tamaño de muestra es grande o pequeño.
Si la distribución de la población muestreada es normal, la varianza poblacional (𝜎2
) es
desconocida y el tamaño de muestra es grande (𝑛 ≥ 30)
Si la distribución de la población es desconocida o no es normal y el tamaño de muestra es
grande (𝑛 ≥ 30). No importa si la varianza es conocida o desconocida.
12. PRUEBA DE HIPÓTESIS PARA UNA MEDIA POBLACIONAL
Supongamos que 𝑥1, 𝑥2, 𝑥3, … , 𝑥 𝑛 𝑒𝑠 𝑢𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛 < 30, de una
población normal con media 𝜇 y varianza 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎, 𝜎2
.
En este caso se debe usar la distribución t-Student con (𝑛 − 1) grados de libertad como
distribución de muestreo, es decir, la estadística de prueba es:
𝒕 𝒄 =
𝒙 − 𝝁 𝑯 𝟎
𝒔
𝒏
Cuando la población es finita de tamaño N, se debe tener en cuenta el factor de
corrección para población finita. Así, el error estándar de la media estará dado por:
𝝆
𝒏
×
𝑵−𝒏
𝑵−𝟏
o
𝒔
𝒏
×
𝑵−𝒏
𝑵−𝟏
Si la distribución de la población NO es normal, 𝝈 𝟐
desconocida y 𝒏 < 𝟑𝟎, entonces no podemos
obtener una regla de decisión.
13. Ejemplo:
El administrador de un centro de salud desea saber si el tiempo medio invertido por los
pacientes en la sala de espera es mayor de 20 minutos. Un muestra de 100 pacientes
permanecieron, en promedio, 23 minutos en la sala de espera entre el registro y la
atención por algún médico del centro de salud. La desviación estándar de la muestra fue
de 10. use un nivel de significancia del 5%.
Establecer las hipótesis nula y alternativa
𝐻0: 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑚𝑒𝑑𝑖𝑜 𝑖𝑛𝑣𝑒𝑟𝑡𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑒𝑛 𝑙𝑎 𝑠𝑎𝑙𝑎 𝑑𝑒 𝑒𝑠𝑝𝑒𝑟𝑎 𝑒𝑠 𝑑𝑒 20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝐻1: 𝐸𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑚𝑒𝑑𝑖𝑜 𝑖𝑛𝑣𝑒𝑟𝑡𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑒𝑛 𝑙𝑎 𝑠𝑎𝑙𝑎 𝑑𝑒 𝑒𝑠𝑝𝑒𝑟𝑎 𝑒𝑠 𝑚𝑎𝑦𝑜𝑟 𝑑𝑒 20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝐻0: 𝜇 = 20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝐻0: 𝜇 ≤ 20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝜇, 𝑒𝑠 𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑖𝑛𝑣𝑒𝑟𝑡𝑖𝑑𝑜 𝑝𝑜𝑟 𝑙𝑜𝑠 𝑝𝑎𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑒𝑛 𝑙𝑎 𝑠𝑎𝑙𝑎 𝑑𝑒 𝑒𝑠𝑝𝑒𝑟𝑎
𝐻1: 𝜇 > 20 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
14. Establecer el tamaño de muestra y nivel de significancia
𝑛 = 100
𝛼 = 5%
𝑥 = 23 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑠 = 10 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
Estadística de prueba
La estadística de prueba es 𝑍 =
𝑥−𝜇 𝐻0
𝜎
𝑛
𝜇 𝐻0
, 𝑒𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜 𝑞𝑢𝑒 𝑝𝑟𝑜𝑝𝑜𝑛𝑒 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.
15. Formular regla de decisión
Región de
rechazo
Región de
aceptación
𝒁 𝒄 =
𝟐𝟑 − 𝟐𝟎
𝟏𝟎
𝟏𝟎𝟎
= 𝟑
𝒁 𝜶 = 𝟏. 𝟔𝟒𝟓
La regla de decisión es rechazar 𝐻0 𝑠𝑖 𝑍 𝑐 > 𝑍 𝛼
No rechazar 𝐻0 𝑠𝑖 𝑍 𝑐 < 𝑍 𝛼
Como 3 > 1.65 , rechazamos la
hipótesis nula.
16. Problema:
Una muestra de 25 estudiantes de enfermería de primer año tuvo una calificación media de 77
en una prueba para medir su actitud hacia el paciente moribundo. La desviación estándar de
la muestra fue de 10. ¿Proporcionan estos datos evidencia suficiente como para indicar, a un
nivel de significancia de 0,05, que la media de la población es menor que 80? ¿Qué supuestos
se deben cumplir?
1. Establecimiento de hipótesis
𝑯 𝟎: 𝝁 = 𝟖𝟎
𝑯 𝟏: 𝝁 < 𝟖𝟎
µ, es la calificación media de la actitud hacia el paciente moribundo
2. Tamaño de muestra y nivel de significancia
𝒏 = 𝟐𝟓
𝜶 = 𝟓% 𝟎, 𝟎𝟓
𝑿 = 𝟕𝟕
𝒔 = 𝟏𝟎
17. 3. Estadística de prueba
El tamaño de muestra es pequeño (< 30), además la varianza poblacional es desconocida y
no tenemos información acerca de la distribución de la población (o no es normal).
Al no cumplirse el supuesto de normalidad hay problemas para usar la distribución t de
Student.
Supongamos entonces que la población muestreada tiene distribución normal. Así podemos
usar la distribución t de Student como distribución de muestreo.
𝐭 𝐜 =
𝐗 − 𝛍 𝐇 𝟎
𝐬
𝐧
𝛍 𝐇 𝟎
, es el valor hipotético del parámetro, el que propone la hipótesis nula.
𝐭 𝐜 =
𝟕𝟕 − 𝟖𝟎
𝟏𝟎
𝟐𝟓
= −𝟏, 𝟓
𝑋 𝜇 𝐻0
𝑆
𝑛
18. 4. Formular regla de decisión
Región de
rechazo
Región de
aceptación
-1,711
La regla de decisión es:
Rechazar 𝐇 𝟎 𝐬𝐢 𝐭 𝐜 < 𝐭 𝛂
No rechazar 𝐇 𝟎 𝐬𝐢 𝐭 𝐜 > 𝐭 𝛂
Como 𝑡 𝑐 = −1,5 > 𝑡 𝛼 = −1,711; NO
podemos rechaza la hipótesis nula.
Es decir, los datos no proporcionan suficiente evidencia como
para indicar, a un nivel de significancia de 5%, que la calificación
media de la actitud hacia el paciente moribundo sea menor que
80 puntos.
Valor crítico = 𝒕 𝜶
19. Ejemplo
Una muestra aleatoria de 20 profesores universitarios aparentemente sanos proporcionó los
siguientes valores de capacidad respiratoria máxima. ¿Es posible concluir que la media
máxima de respiración es de 110 litros por minuto?
132 33 91 108 67 169 54 203 190 133
96 30 187 21 63 166 84 110 157 138
Establecer las hipótesis
𝐻0: 𝐿𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚á𝑥𝑖𝑚𝑎 𝑑𝑒 𝑐𝑎𝑝𝑎𝑐𝑖𝑑𝑎𝑑 𝑟𝑒𝑠𝑝𝑖𝑟𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑑𝑒 110 𝑙𝑖𝑡𝑟𝑜𝑠 𝑝𝑜𝑟 𝑚𝑖𝑛𝑢𝑡𝑜.
𝐻1: 𝐿𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚á𝑥𝑖𝑚𝑎 𝑑𝑒 𝑐𝑎𝑝𝑎𝑐𝑖𝑑𝑎𝑑 𝑟𝑒𝑠𝑝𝑖𝑟𝑎𝑡𝑜𝑟𝑖𝑎 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑑𝑒 110 𝑙𝑖𝑡𝑟𝑜𝑠 𝑝𝑜𝑟 𝑚𝑖𝑛𝑢𝑡𝑜.
Nivel de significancia: Si el problema no lo menciona asumimos un 5%.
Estadística de prueba
La muestra es pequeña, 𝑛 = 20
No sabemos nada de la distribución de la población, o no es normal.
La desviación estándar poblacional es desconocida.
En estas condiciones no es posible usar la distribución normal y tampoco la distribución t de
Student.
20. Ejemplo
Una muestra aleatoria de 20 profesores universitarios aparentemente sanos proporcionó los
siguientes valores de capacidad respiratoria máxima. ¿Es posible concluir que la media
máxima de respiración es de 110 litros por minuto?
132 33 91 108 67 169 54 203 190 133
96 30 187 21 63 166 84 110 157 138
Estadística de prueba
Si suponemos que la distribución de la población muestreada es normal, podemos usar la
distribución t-Student como distribución de muestreo. En ese caso, la estadística de prueba es:
𝐭 𝐜 =
𝐗 − 𝛍 𝟎
𝐬
𝐧
Regla de decisión
Como es una prueba de dos colas, la regla es:
Rechazar 𝐻0 𝑠𝑖 𝑡 𝑐 < −𝑡 𝛼
2
𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑠𝑖 𝑡 𝑐 > 𝑡 𝛼
2
No rechazar 𝐻0 si −𝑡 𝛼
2
< 𝑡 𝑐 < 𝑡 𝛼
2
21. Ejemplo
Decisión
Para poder obtener el valor de la estadística de prueba necesitamos el valor de la media
aritmética y la desviación estándar de la muestra. Para lo cual utilizamos la información
muestral.
𝑋 = 111,6 𝑠 = 56,3 𝑡19;5% = 2,093 (𝑉𝑎𝑙𝑜𝑟 𝑐𝑟í𝑡𝑖𝑐𝑜)
𝐭 𝐜 =
𝟏𝟏𝟏, 𝟔 − 𝟏𝟏𝟎
𝟓𝟔, 𝟑
𝟐𝟎
≅ 𝟎, 𝟏𝟐𝟕𝟏
−2,093 𝟐, 𝟎𝟗𝟑
𝟎, 𝟏𝟐𝟕𝟏
Zona de
aceptación
Zona de
rechazoZona de
rechazo
𝐶𝑜𝑚𝑜 − 2,093 < 0,1271 < 2,093 𝑛𝑜 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝑙𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.
¿Cómo es la interpretación?
22. ¿CÓMO ES EL PROCESO EN SPSS?
Los resultados en SPSS se muestran en la siguiente tabla:
Estadísticos para una muestra
20 111,60 56,303 12,590
Capacidad máxima
de respiración
N Media
Desviación
típ.
Error típ. de
la media
Prueba para una muestra
,127 19 ,900 1,600 -24,75 27,95
Capacidad máxima
de respiración
t gl Sig. (bilateral)
Dif erencia
de medias Inf erior Superior
95% Intervalo de
confianza para la
diferencia
Valor de prueba = 110
Para decidir se debe tener en cuenta el valor P (Sig.(bilateral))
La regla es rechazar 𝐻0 𝑠𝑖 𝑝 − 𝑣𝑎𝑙𝑜𝑟 < 𝛼 (nivel de significancia)
Como el p − valor = 0,900 > 𝛼 = 0,05 𝑛𝑜 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0
Es decir, la media máxima de capacidad respiratoria es
diferente de 110 litros por minuto.
P-valor
23. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS (𝝁 𝟏 − 𝝁 𝟐)
(Muestras independientes)
Supongamos que tenemos dos medias, 𝒙 𝟏 𝑦 𝒙 𝟐 de muestras aleatorias
independientes, de tamaños 𝒏 𝟏 𝑦 𝒏 𝟐 , seleccionadas de poblaciones con medias
𝝁 𝟏 , 𝝁 𝟐 𝑦 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠 𝝈 𝟏
𝟐
𝑦 𝝈 𝟐
𝟐
, 𝑟𝑒𝑠𝑝𝑒𝑐𝑡𝑖𝑣𝑎𝑚𝑒𝑛𝑡𝑒.
La hipótesis nula para la diferencia de medias de dos muestras aleatorias independientes
plantea que las dos poblaciones muestreadas tienen medias iguales. Es decir:
𝐻0 ∶ 𝜇1 = 𝜇2
𝐻0 ∶ 𝜇1 − 𝜇2 = 0
𝐻0 ∶ 𝜇1 − 𝜇2 = 𝐷0 (𝐷0 𝑒𝑠 𝑎𝑙𝑔𝑢𝑛𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑝𝑒𝑐í𝑓𝑖𝑐𝑎 𝑞𝑢𝑒 𝑠𝑒 𝑞𝑢𝑖𝑒𝑟𝑒 𝑝𝑟𝑜𝑏𝑎𝑟)
Así, las hipótesis que podemos probar son las siguientes:
𝐻0: 𝜇1 = 𝜇2 𝑉𝑆 𝐻1: 𝜇1 ≠ 𝜇2
𝐻0: 𝜇1 = 𝜇2 𝑉𝑆 𝐻1: 𝜇1 < 𝜇2
𝐻0: 𝜇1 = 𝜇2 𝑉𝑆 𝐻1: 𝜇1 > 𝜇2
La región crítica y por tanto la regla de decisión
dependerá de la hipótesis a probar.
24. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS (𝝁 𝟏 − 𝝁 𝟐)
(Muestras independientes)
La estadística de prueba es 𝐙 𝐜=
( 𝐱 𝟏− 𝐱 𝟐)−(𝛍 𝟏−𝛍 𝟐)
𝛔 𝟏
𝟐
𝐧 𝟏
+
𝛔 𝟐
𝟐
𝐧 𝟐
Siempre y cuando se cumpla una de las condiciones siguientes:
Ambas poblaciones muestreadas tienen distribución normal y sus respectivas varianzas
poblacionales, 𝝈 𝟏
𝟐
𝒚 𝝈 𝟐
𝟐
, 𝑠𝑜𝑛 𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠 𝑜 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠.
Si las poblaciones muestreadas no son normales o, no conocemos su distribución, sus
respectivas varianza𝑠, 𝜎1
2
𝑦 𝜎2
2
, 𝑠𝑜𝑛 𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠 𝑦 𝑙𝑜𝑠 𝑡𝑎𝑚𝑎ñ𝑜𝑠 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑠𝑜𝑛 𝑔𝑟𝑎𝑛𝑑𝑒𝑠,
𝑛1 ≥ 30 ; 𝑛2 ≥ 30
En caso de no conocer las varianzas poblacionales, éstas se pueden reemplazar con las
respectivas estimaciones, 𝒔 𝟏
𝟐
𝒚 𝒔 𝟐
𝟐
.
25. PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE MEDIAS (𝝁 𝟏 − 𝝁 𝟐)
(Muestras independientes)
En tal caso, la estadística de prueba es 𝐭 𝐜=
( 𝐱 𝟏− 𝐱 𝟐)−(𝛍 𝟏−𝛍 𝟐)
𝒔 𝟐
𝐧 𝟏
+
𝒔 𝟐
𝐧 𝟐
que tiene una
distribución t de Student con 𝑛1 + 𝑛2 − 2 grados de libertad.
¿Qué pasa si se presenta la siguiente situación?
Las poblaciones muestreadas, ambas, tienen distribución normal.
Las varianzas poblacionales, 𝜎1
2
𝑦 𝜎2
2
, 𝑠𝑜𝑛 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠 𝑒 𝑖𝑔𝑢𝑎𝑙𝑒𝑠.
Los tamaños de muestra son pequeños, 𝑛1 < 30 ; 𝑛2 < 30
𝑠2
, 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑞𝑢𝑒 𝑎𝑝𝑎𝑟𝑒𝑐𝑒 𝑒𝑛 𝑙𝑎 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑎 𝑑𝑒 𝑝𝑟𝑢𝑒𝑏𝑎 , 𝑒𝑠 𝑢𝑛 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑖𝑛𝑠𝑒𝑠𝑔𝑎𝑑𝑜
𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑐𝑜𝑚ú𝑛 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎 𝑦 𝑒𝑠𝑡á 𝑑𝑎𝑑𝑜 𝑝𝑜𝑟:
𝒔 𝟐 =
𝒏 𝟏 − 𝟏 𝒔 𝟏
𝟐
+ 𝒏 𝟐 − 𝟏 𝒔 𝟐
𝟐
𝒏 𝟏 + 𝒏 𝟐 − 𝟐
26. SUPOSICIONES SOBRE LOS DATOS PARA LA PRUEBA t DE STUDENT
PARA DOS MUESTRAS INDEPENDIENTES
Hay tres consideraciones o características básicas con las que deben cumplir los datos de la
muestra (variable dependiente) para poder usar la distribución t como distribución de
muestreo.
Los datos de la muestra deben ser seleccionados de una población con distribución
normal (se debe verificar el cumplimiento de este supuesto).
Los tamaños de muestra son pequeños, 𝑛1 < 30 ; 𝑛2 < 30
Las varianzas en las poblaciones deben ser iguales (homogeneidad de varianzas), este
supuesto se debe verificar siempre que las muestras sean independientes y los tamaños
de muestra sean muy diferentes.
La prueba t es una prueba paramétrica para variables cuantitativas medidas, al menos, en el
nivel de intervalo.
SPSS realiza una prueba de homogeneidad de varianzas al momento de hacer la prueba t para
muestras independientes (prueba de Levene). Las varianzas son homogéneas si el p-valor es
mayor a 0,05.
27. EJEMPLO
El administrador de un hospital quiere saber si la población que concurre a un hospital A
tiene un ingreso medio familiar mayor al de la población que concurre a un hospital B. Los
datos consisten en los ingresos familiares de 75 pacientes internados en el hospital A y 80
pacientes internados en el hospital B. Las medias de las muestras son, para el hospital A
$6800 con una desviación estándar de $600 y para el hospital B, una media de $5460 con
una desviación estándar de $500. Haga la prueba para un nivel de significancia del 1%.
Hipótesis
Sea 𝝁 𝑨 Ingreso promedio familiar de la población que concurre al hospital A.
𝝁 𝑩 Ingreso medio familiar de la población que concurre l hospital B
𝑯 𝟎: 𝝁 𝑨 = 𝝁 𝑩 (𝑽𝑺) 𝑯 𝟏: 𝝁 𝑨 > 𝝁 𝑩
Establecer tamaño de muestra
𝑛 𝐴 = 75 ; 𝑛 𝐵 = 80 𝑥 𝐴 = $6.800 ; 𝑥 𝐵 = $5.460 𝑠 𝐴 = $600 ; 𝑠 𝐵 = $500
28. EJEMPLO
Estadística de prueba
La estadística de prueba es 𝒁 𝒄 =
𝒙 𝑨− 𝒙 𝑩 − 𝝁 𝑨−𝝁 𝑩
𝒔 𝑨
𝟐
𝒏 𝑨
+
𝒔 𝑩
𝟐
𝒏 𝑩
Los tamaños de muestra son los
suficientemente grandes.
𝑍 𝑐 =
6.800 − 5.460 − 0
6002
75
+
5002
80
=
1340
89,02246907
= 15,052
Regla de decisión
Rechazar 𝐻0 𝑠𝑖 𝑍 𝑐 > 𝑍 𝛼 𝛼 = 5% y no rechazar 𝐻0 𝑠𝑖 𝑍 𝑐 ≤ 𝑍 𝛼
Como 15,05 >1,645 rechazamos la hipótesis nula de igualdad de medias. Es decir, la
diferencia promedio de ingresos entre los pacientes que asisten al hospital A y los pacientes
que ingresan al B es distinta de cero.