2. INTERVALOS DE CONFIANZA.
I- Concepto de Intervalo de Confianza. En el contexto de estimar un
parámetro poblacional, un intervalo de confianza es un rango de
valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se
encuentre en el intervalo construido se denomina nivel de
confianza, y se denota 1- . La probabilidad de equivocarnos se
llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia
=5%). Menos frecuentes son los intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede comprobar que la
distribución Normal Estándar cumple 1:
P(−1.96 < z < 1.96) = 0.95
3. Luego, si una variable X tiene distribución N(,), entonces el 95%
de las veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces.
Es decir, es un intervalo de confianza al 95% para la
media cuando la variable X es normal y es conocido.
II- Intervalo de confianza para un promedio:
Generalmente, cuando se quiere construir un intervalo de
confianza para la media poblacional , la varianza
poblacional es desconocida, por lo que el intervalo
para construido al final de II es muy poco práctico.
Si en el intervalo se reemplaza la desviación estándar
poblacional por la desviación estándar muestral s, el intervalo
de confianza toma la forma:
4. La cual es una buena aproximación para el intervalo de confianza de 95%
para con desconocido. Esta aproximación es mejor en la medida que el tamaño
muestral sea grande.
Cuando el tamaño muestral es pequeño, el intervalo de confianza requiere utilizar la
distribución t de Student (con n-1 grados de libertad, siendo n el tamaño de la
muestra), en vez de la distribución normal (por ejemplo, para un intervalo de 95%
de confianza, los límites del intervalo ya no serán construidos usando el valor
1,96).
Ejemplo:
Los siguientes datos son los puntajes obtenidos para 45 personas de una escala
de depresión (mayor puntaje significa mayor depresión)
2 5 6 8 8 9 9 10 11
11 11 13 13 14 14 14 14 14
14 15 15 16 16 16 16 16 16
16 16 17 17 17 18 18 18 19
19 19 19 19 19 19 19 20 20
5. Para construir un intervalo de confianza para el puntaje promedio
poblacional, asumamos que los datos tienen distribución normal, con
varianza poblacional desconocida. Como es desconocido, lo
estimamos por s=18,7. Luego, un intervalo de confianza aproximado es:
Luego, el intervalo de confianza para es (13,2 , 15,8). Es decir, el puntaje
promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza
95%.
6. III. INTERVALO DE CONFIANZA PARA UNA
PROPORCIÓN.
En este caso, interesa construir un intervalo de confianza para una proporción o
un porcentaje poblacional (por ejemplo, el porcentaje de personas con
hipertensión, fumadoras, etc.)
Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura
que:
O BIEN:
7. Luego, procediendo en forma análoga al caso
de la media, podemos construir un intervalo
de 95% de confianza para la proporción
poblacional p.
8. EJEMPLO:
En un estudio de prevalencia de factores de riesgo en
una cohorte de 412 mujeres mayores de 15 años
en la Región Metropolitana, se encontró que el
17.6% eran hipertensas. Un intervalo de 95% de
confianza para la proporción de mujeres
hipertensas en la Región Metropolitana está dado
por:
Luego, la proporción de
hipertensas varía entre (0,139 ,
0,212) con una confianza de 95%.
9. IV. USO DE INTERVALOS DE CONFIANZA PARA
VERIFICAR HIPÓTESIS.
Los intervalos de confianza permiten verificar hipótesis
planteadas respecto a parámetros poblacionales.
Por ejemplo, supongamos que se plantea la hipótesis de que el
promedio de peso de nacimiento de cierta población es igual a
la media nacional de 3250 gramos.
Al tomar una muestra de 30 recién nacidos de la población en
estudio, se obtuvo:
x= 2930
s= 450
n= 30
Al construir un intervalo de 95% de confianza para la media
poblacional, se obtiene:
10. Luego, el peso de nacimiento varía entre 2769 y 3091
gramos, con una confianza de 95%.
Como el intervalo no incluye el valor =3250 gramos planteado
en la hipótesis, entonces esta es rechazada con confianza
95% (o un valor p menor a 0,5).
La distribución Normal estándar es una distribución normal
con media =0 y varianza,=1. Una variable distribuida
N(0,1) generalmente se denota con la letra “z”.
En particular, si X~N (, ), entonces z = (X-)/ tiene distribución
normal estándar.
11. CONCEPTOS CLAVES DE INTERVALOS DE
CONFIANZA.
1. Un intervalo de confianza aporta más información que un
estimador puntual cuando se quiere hacer inferencias sobre
parámetros poblacionales.
2. Existen intervalos de confianza bilaterales y unilaterales.
3. La amplitud de un intervalo de confianza está determinado por:
el nivel de confianza establecido ;la variabilidad de los datos; el
tamaño de la muestra.
4. En un estudio Caso-Control o uno de Cohorte, es posible (y
frecuentemente deseable) construir intervalos de confianza para
Odds Ratios y Riesgos Relativos.
5. Un intervalo de confianza permite verificar hipótesis planteadas
acerca de parámetros poblacionales.
12.
13. EJERCICIOS
1.- El índice de resistencia a la rotura, expresado en kg, de un determinado tipo de cuerda sigue una
distribución Normal con desviación típica 15.6 kg. Con una muestra de 5 de estas cuerdas,
seleccionadas al azar, se obtuvieron los siguientes índices: 280, 240, 270, 285, 270.
a) Obtenga un intervalo de confianza para la media del índice de resistencia a la rotura de este tipo
de cuerdas, utilizando un nivel de confianza del 95%.
b) Si, con el mismo nivel de confianza, se desea obtener un error máximo en la estimación de la
media de 5 kg, ¿será suficiente con elegir una muestra de 30 cuerdas? (Propuesto para
selectividad Andalucía 2005)
Respuesta.
X = Índice de resistencia a la rotura ; X → N(µ ; 15,6) ; es decir σ = 15,6 ;
n = tamaño muestral = 5
La media muestral es x = 280 + 240 + 270 + 285 + 270 = 269
5
a) Nivel de confianza = 1 – α = 0,95 ; α = 0,05; Intervalo de confianza I = ( x - E , x +E) , siendo
E= Za/z x σ
√n
Sabemos que φ(z ) = p(Z < zzzz ) = 1-- --
2
α
=1
14. ESTIMACIÓN POR INTERVALOS DE CONFIANZA
X Vamos a dar un intervalo para el parámetro
³ Escogemos α próximo a 0; p.ej., α = 0’05
³ 1 –α es el coeficiente de confianza; p.ej., 0’95
³ El nivel de confianza es [(1 –α)×100]%; p.ej., 95%
X Buscamos un intervalo cuya probabilidad de contener el
verdadero valor del parámetro sea 1 –α
X Cuanto mayor es 1 –α, mayor ha de ser el intervalo
³ Si α = 0, es decir, 1 –α = 1, entonces el intervalo debe contener
todos los valores posibles del parámetro
• Para la tasa de supervivencia, IC100% = [0,1]
• Para la concentración de X en sangre, IC100% = [0, concentración-máxima]
X Hay que buscar un compromiso entre certeza y precisión
15. INTERVALOS DE CONFIANZA
X Estudio sobre la relación entre la vitamina X y el síndrome Y
X Concentración de X para personas sanas:
128 μg/cm3
(desviación estándar 20 μg/cm3 )
X Objetivo: ¿cuál es μ (concentración de X en enfermos)?
X Datos: análisis de sangre en 25 pacientes con síndrome Y
Promedio de concentración de X: 117 μg/cm3
³Es de esperar que el intervalo de confianza para μ esté en
torno a 117
X Vamos a fijar el nivel de confianza en el 95%
16. CONSTRUCCIÓN DEL INTERVALO DE CONFIANZA
Distribución poblacional: normal, N(μ,σ =20), con μ desconocido
X Tamaño de la muestra: n = 25
Distribución muestral para el estadístico X: X ~ N(μ′,σ′)
μ′ = μ (desconocido) σ = σ = 20
=4
√n √25
Z= X – μ’ = x- μ’
σ 4
Z se denomina pivote.
X Su distribución no depende de los parámetros del modelo.
Distribución normal: Z ~ N(0,1) (independientemente de cuál sea μ)
Cada investigador obtiene un x: el promedio de X en su muestra
(No puede conocer z porque no conoce μ)
17. CÁLCULO DEL INTERVALO DE CONFIANZA
Distribución
Elección
poblacional
del pivote,
Z
Tamaño de
la muestra
Distribució
n de Z
Nivel de
confianza Intervalo
para z
Resultado Intervalo
experiment de
al confianza
18. INTERPRETACIÓN DE LOS INTERVALOS DE
CONFIANZA
X Supongamos que el intervalo de confianza al 95% es [μ1 , μ2]
X Afirmación: “Hay un 95% de probabilidad de que el verdadero
valor de μ esté entre μ1y μ2.” ¿Cómo debe entenderse?
X En una probabilidad siempre hay algo aleatorio
X Lo aleatorio, en este caso, es el intervalo que cada investigador
obtiene
X El parámetro μ no varía
X Por eso hay quien prefiere decir: “La probabilidad de que el
intervalo [μ1, μ2] contenga el verdadero valor de μ es el 95%”
³ Puede entenderse como equivalente a la afirmación anterior,
pero no se presta tan fácilmente a una interpretación errónea