Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Distribuciones muestrales
1. Estadística 2 A Ing. Edwin Bracamonte
Teoría del muestreo
En todo análisis estadístico se recurre a la extracción de muestras de una
población con el objeto de poder inferir el comportamiento de la población, por
ejemplo, la opinión que se tiene respecto a una opción electoral, el promedio de
ingresos de una comunidad, el número promedio de kilómetros por galón como
medida del rendimiento de un vehículo.
Las poblaciones pueden ser consideradas finitas o infinitas, finitas cuando el
número de elementos de la población es conocido, e infinitas cuando se
considera que el número de elementos o miembros de la población es muy
grande considerándola infinita contable.
Estas muestras pueden ser extraídas con o sin reemplazo y Los indicadores que
se calculan tomando en cuenta todos los elementos de la población se denomina
“parámetros poblacionales” o simplemente “parámetros”, mientras que los
indicadores que se calculan con los datos de la muestra se denomina
“estadísticos muestrales” o simplemente “estadísticos”.
Distribuciones Muestrales
Una distribución muestral está relacionada con la distribución que se obtiene al
calcular un estadístico θ a cada una de todas la muestras posibles de tamaño n
extraídas de una población de tamaño N (donde n< N). Dicho estadístico puede
diferir o no de una muestra a otra. Con valor esperado E(θ)= µθ y varianza
V(θ)=σ2
θ. donde θ puede ser la media aritmética 𝑋, la proporción de éxitos p, la
varianza 𝑠!
. Y en el caso de dos poblaciones la diferencia de medias, la
diferencia de proporciones o la razón de varianzas.
Distribución muestral de medias de una población con varianza
conocida
Si el estadístico θ es la media aritmética 𝑋 para muestras extraídas de una
población con varianza σ2
conocida, se obtiene la distribución muestral de medias
cuyo valor esperado y error estándar esta dado por:
• Población infinita (muestreo con reemplazamiento)
µµ =__
X nX
σ
σ =__
• Población finita (muestreo sin reemplazamiento)
µµ =__
X 1
__
−
−
=
N
nN
nX
σ
σ
Si n > 30 o se conoce σ2
de la población la distribución muestral de medias se
aproxima a la distribución normal con variable tipificada:
__
X
__
X
z
σ
µ−
=
2. 2
Distribución muestral de medias de una población con varianza
desconocida
Si n < 30 la distribución muestral de medias se aproxima a la distribución t de
student con n-1 grados de libertad y variable:
n
s
X
t
ˆ
__
µ−
=
Donde:
( )
( )11
22
2__
2
ˆ −
−
=
−
⎟
⎠
⎞
⎜
⎝
⎛
−
= ∑ ∑∑
nn
xxn
n
Xx
ii
i
s
Distribución muestral de proporciones de una población
Cuando el interés se centra en la proporción de éxitos observados en la muestra
el estadístico θ se convierte en 𝑝 =
!
!
, el cual se supone se distribuye binomial
con parámetros E(X)=np y varianza V(X)=np(1-p). De acuerdo al Teorema de
límite central, la distribución muestral de proporciones se aproxima a la
distribución normal con variable tipificada:
)1(
2/1
pnp
npx
z
−
−±
=
Otra forma:
pp =ˆ
µ
n
pq
p =ˆ
σ
n
pp
p
n
p
z
)1(
2
1
ˆ
−
−±
=
Distribución muestral de varianza de una población
Si el estadístico θ es la varianza 𝑠!
se obtiene la distribución muestral de
varianzas la cual se aproxima a la distribución χ2
(ji cuadrado o chi cuadrado) con
n-1 grados de libertad y variable:
( )
σ
χ 2
2
2 ˆ1 sn −
=
3. 3
Distribución muestral de diferencia de medias de poblaciones
con varianza conocida
Si el estadístico θ es la media aritmética para muestras extraídas de dos
poblaciones independientes con varianza σ1
2
y σ2
2
, se obtiene la distribución
muestral de diferencia de medias cuyo valor esperado y error estándar esta dado
por:
• Poblaciones infinita (muestreo con reemplazamiento)
21
2XX
__
1
__ µµµ −=
−
2
2
2
1
2
1
XX nn21
__
σσ
σ +=
−
• Poblaciones finitas (muestreo sin reemplazamiento)
21
2XX
__
1
__ µµµ −=
−
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−
−
+⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
−
−
=
− 1N
nN
n1N
nN
n 2
22
2
2
2
1
11
1
2
1
XX 21
__
σσ
σ
Si se conocen la σ2
1 y σ2
2 de las poblaciones la distribución muestral de
diferencia de medias se aproxima a la distribución normal con variable tipificada:
( )
__
21 XX
212
__
1
__
XX
z
−
−−⎟
⎠
⎞
⎜
⎝
⎛
−
=
σ
µµ
Distribución muestral de diferencia de medias de dos
poblaciones con varianzas desconocidas e iguales
En este caso la distribución muestral de diferencia de medias se aproxima a la
distribución t de “student” con n1 + n2 -2 grados de libertad y variable:
( )
nn
s
xx
21
p
212
_
1
_
11
t
+
−−⎟
⎠
⎞
⎜
⎝
⎛
−
=
µµ
( ) ( )
2
11
21
2
22
2
11 ˆˆ
−+
−−−
=
nn
snsnsp
Distribución muestral de diferencia de medias de dos
poblaciones con varianzas desconocidas y diferentes
En este caso la distribución muestral de diferencia de medias se aproxima a la
distribución t de “student”:
4. 4
( )
nn
xx
2
2
2
1
2
1
212
_
1
_
ss
t
+
−−⎟
⎠
⎞
⎜
⎝
⎛
−
=
µµ
y, grados de libertad
( ) ( )11 2
2
2
2
2
1
2
1
2
1
2
2
2
2
1
2
1
ˆˆ
ˆˆ
−
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+
−
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
+
=
n
n
s
n
n
s
n
s
n
s
Distribución muestral de diferencia de proporciones de dos
poblaciones
Cuando el interés se cetra en la proporción de éxitos observados en muestras
extraídas de dos poblaciones independientes los cuales se supone se distribuyen
binomial. De acuerdo al Teorema de límite central, la distribución muestral de
proporciones se aproxima a la distribución normal con variable tipificada
( )
2
22
1
11
2121
)ˆ1(ˆ)ˆ1(ˆ
)(ˆˆ
n
pp
n
pp
pppp
z
−
+
−
−−−
=
Distribución muestral de razón de varianzas de dos poblaciones
Para el caso de la razón de varianzas esta se aproxima a la distribución F de
Fisher:
2
2
2
2
2
2
2
1
2
2
2
2
2
1
2
1
ˆ
ˆ
/ˆ
/ˆ
σ
σ
σ
σ
s
s
s
s
F ==
Con grados de libertad v1= n1-1 en el numerado y v2= n2-1 grados de libertad en
el denominador.
1. Problemas resueltos
1. De una población infinita con media µ = 75 y variancia σ2
=256, se toma
una muestra al azar de tamaño n = 100. ¿Con qué probabilidad podemos,
afirmar que el valor de la media de la muestra estará entre 67 y 83?
Solución:
5. 5
Datos:
µ = 75
σ2
=256
σ=16
n=100
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
−
Φ−
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
−
Φ=≤≤
100
16
7567
100
16
7583
)83X67(P
__
= ( ) )00.5z(00.5z −=Φ−=Φ
=1.00-0= 1
2. La proporción real de familias de cierta ciudad, que son dueñas, no
arrendatarias, de su casa es 0.70. Si al azar se entrevistan a 84 familias de
esta ciudad y sus respuestas a la pregunta ¿son dueñas a no de su casa?
se consideran valores de una variable binomial con parámetro p = 0.70,
¿con qué probabilidad podemos afirmar que el valor que se obtenga de la
proporción de la muestra estará entre 0.64 y 0.76?
Solución:
Datos:
p = 0.70
n = 84
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎝
⎛
−−
Φ−
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎝
⎛
−+
Φ=≤≤
84
30.0*70.0
70.0
84*2
1
64.0
84
30.0*70.0
70.0
84*2
1
76.0
)76.064.0( pP
= ( ) )32.1(32.1 −=Φ−=Φ zz =0.9066-0.0.0934=0.8132
Otra forma:
⎟
⎠
⎞
⎜
⎝
⎛ −−
Φ−⎟
⎠
⎞
⎜
⎝
⎛ −+
Φ=≤≤
64.17
595.054
64.17
585.064
)6454( pP
3. La afirmación de que la variancia de una población normal es σ2
= 25 se
rechazará si la variancia de una muestra aleatoria de tamaño 16 excede
54.668 o es menor de 12.012. ¿Cuál es la probabilidad de que se rechace
esta afirmación?
Solución:
Datos:
σ2
= 25
n = 16
gl = 15
6. 6
⎟
⎠
⎞
⎜
⎝
⎛ −
=Φ−=>
25
668.54*)116(
1)668.54( 22
χsP
= 1 - ( )8.322
=Φ χ = 1 - 0.9950 = 0.005
⎟
⎠
⎞
⎜
⎝
⎛ −
=Φ−=<
25
012.12*)116(
1)012.12( 22
χsP
= ( )2072.72
=Φ χ = 0.0484
0534.0005.00484.0)668.54()0112.12( 22
=+=>+< sPsp
4. De dos poblaciones normales con medias µ1 = 78 y µ2 = 75, y las
variancias σ1
2
=150 y σ2
2
= 200, se toman muestras aleatorias de tamaño
n1 = 30 y n2 = 50. ¿Cuál es la probabilidad de que la media de la primera
muestra extraída excederá la de la segunda muestra cuando menos en
4.8?
Solución:
Datos:
µ1 = 78 µ2 = 75
σ1
2
=150 σ2
2
= 200
n1 = 30 n2 = 50
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎝
⎛
+
−−
Φ−=≥−
50
200
30
150
8.4)7578(
1)8.4XX(P 2
__
1
__
=
( )60.0z1 −=Φ−
=1-0.2743=0.7257
5. La proporción real de hombres partidarios de cierta propuesta de
impuestos es 0.40 y la proporción correspondiente de mujeres es 0.25;
n1=500 hombres y n2=400 mujeres son entrevistadas al azar y sus
respuestas individuales se consideran como los valores de variables
aleatorias independientes que tienen distribuciones binomiales con
parámetros p1 = 0.40 y p2 = 0.25. ¿Cuál será el valor de la diferencia entre
las proporciones muestrales P1 y P2 de respuesta favorables para que la
probabilidad sea de al menos 0.9975?
Solución:
Datos:
p1 = 0.40 p2 = 0.25
n1 = 500 n2 = 400
9975.0)cPP(P 21 ≥=−
7. 7
z =2.81
400
)25.01(25.0
500
)40.01(40.0
)25.040.0()PP(
81.2 21
−
+
−
−−−
=
2366.0
400
75.0*25.0
500
60.0*40.0
81.2)25.040.0()PP( 21 =++−=−
7. Hoja de trabajo
1. El número promedio diario de víctimas de accidentes de tránsito en una ciudad
es de 120 personas y desviación típica de 32 personas. Cuando se seleccionan
62 días al azar, ¿cuál es la probabilidad de que el número promedio de víctimas
sea igual o menor a 111 víctimas?
2. Si s2
1 y s2
2 son las varianzas de variables aleatoria independientes de
tamaño n1=61 y n2=31 de poblaciones normales con σ2
1 = 12 σ2
2 = 18,
determine P(s2
1/s2
2>1.16)
8. Practica
En una clase de matemática el profesor aplicó cuatro exámenes. Las
puntuaciones que recibió una persona fueron 90,86, 70 y 80. supóngase que le
profesor le ofreció la opción de seleccionar aleatoriamente dos calificaciones para
basar su calificación final en la media de esos dos exámenes.
• ¿Cuántas muestras diferentes son posibles a) si los elige con reemplazo;
b) si los elige sin reemplazo?
• Determine la media de la población y compárela con la media de la
distribución muestral de medias en cada caso de elección de la muestras.
• Determine la desviación estándar de las distribución muestral de las
muestras extraídas y verifique el cumplimiento de las fórmulas
correspondiente.
Utilice una hoja electrónica para resolverlo.
9. Tarea preparatoria de examen parcial
1. Por datos que se han obtenido se sabe que el 50% de las personas que tienen
teléfono no se encuentran entre la 1 PM y las 3 PM. Se toma una muestra de la
guía telefónica y se les llama. ¿Cuál es la probabilidad de que el 20% o más
estén ausentes?
2. Una muestra aleatoria de tamaño 25, tomada de una población normal,
8. 8
tiene la media igual a 47 y la desviación estándar igual a 7.¿podemos
decir que la información dada soporta la conjetura de que la media de la
población es 42?
3. Se toma una muestra aleatoria de tamaño 25 de una población que tiene
una media de 80 y una desviación estándar de 5. Una segunda muestra
aleatoria de tamaño 36 se toma de una población normal que tiene una
media de 75 y una desviación estándar de 3. encuentre la probabilidad de
que la media muestral calculada de las 25 mediciones exceda la media
calculada de las 36 mediciones por al menos 3.4 pero en menos de 5.9.
suponga que las medias se miden al décimo más cercano.
4. Una encuesta de 1000 estudiantes concluye que 274 eligen al equipo
profesional de béisbol A como su equipo favorito. En 1991, se realizo la
misma encuesta con 760 estudiantes. Concluyó que 240 de ellos también
eligieron al equipo A como su favorito. ¿entre que valores estaría el 95%
central de la diferencia entre las proporciones a favor del equipo
observadas en las dos encuestas?
5. La afirmación de que la variancia de una población normal es σ2
= 4 se
rechazará si la variancia de una muestra aleatoria de tamaño 9 excede
7.7535. ¿Cuál es la probabilidad de que se rechace esta afirmación
aunque σ2
= 4?
10. Ítems de evaluación conceptual
• ¿Cuál es la diferencia entre población y muestra?
• ¿En que difieren las distribuciones muestrales con varianza
conocida con los de varianza desconocida?
• ¿Cuál es el valor asumido por “p” cuando se desconoce el valor
verdadero de la población?
• ¿Explique por que se pueden sumar las varianzas y no así las
desviaciones estándar al comparar dos poblaciones?
11. Referencias de consulta bibliográfica
• Walpole, Ronald E., Myers, Raymond H., Myers, Sharon. L. Probabilidad y estadística para
Ingenieros. Sexta edición. Prentice Hall Hispanoamérica, S.A. México. 1999.
• Wackerly, Denis D., Mendenhall III, William, Scheaffer, Richard L. Estadística Matemática
con aplicaciones. Thomson Editores, S.A. de C.V. Sexta edición revisada México. 2002.
• San Roman, Pulido A. Estadística y técnicas de investigación social. Ediciones Pirámide,
S.A. España. 1981.
• Spiegel, Murray R. Estadística. Teoría y problemas. Libros Mc Graw Hill. Serie Schaum.
• Mendenhall, William, Scheaffer, Richard L., Ott Lyman.elementos de muestreo. Grupo
Editorial Iberoamericano S. A. De C. V. Versión al español de tercera edición. México. 1987.