SlideShare a Scribd company logo
1 of 21
ESTIMACIÓN DE PARÁMETROS
El estudio de poblaciones estadísticas supone en general el conocimiento de la
función de probabilidad que gobierna el comportamiento aleatorio de la variable de
interés. En muchos casos sabemos o presumimos conocer la familia distribucional
de una población. Sabemos por ejemplo que la población es aproximadamente
normal; pero desconocemos la media y la varianza poblacionales. Sabemos que
la variable de interés es binomial pero desconocemos la probabilidad de éxito
poblacional o el número de pruebas de Bernoulli. Sabemos que se trata de un
proceso de Poisson pero desconocemos el número de eventos raros por
intervalos. Presumimos que la variable es exponencial pero desconocemos el
parámetro que precisa la distribución exponencial poblacional.
Lógicamente en todas estas situaciones la función de probabilidad de la variable
en

estudio

se

concreta

determinando

los

parámetros

poblacionales

correspondientes y para lograrlo se utilizan los denominados métodos de
estimación de parámetros.
La estimación de uno o varios parámetros poblacionales desconocidos es posible
construyendo funciones de probabilidad de variables aleatorias muestrales, mas
conocidos como estimadores muestrales.
Dichos estimadores garantizaran un cálculo o una aproximación satisfactoria del
parámetro poblacional desconocido siempre que cumplan propiedades de:
insesgamiento o máxima simetría, varianza mínima o máxima concentración de
los datos alrededor del parámetro estimado y máxima probabilidad.
Estimación puntual
Cuando en una población con familia distribucional conocida f(x, θ) queremos
estimar el verdadero valor del parámetro poblacional θ utilizando como lente
ˆ
para determinarlo al estimador muestral θ ; procedemos a seleccionar una

muestra de tamaño n de dicha población, calculamos a partir de ella un valor θ y
afirmamos entonces que

θ = ±
θ
k

es una estimación puntual de θ con un error,

por exceso o defecto, de valor k.
ˆ
K depende en general de la variable aleatoria muestral θ y de su desviación σ θ
ˆ

. En los casos de muestras grandes, cuando

los valores de la muestra

corresponden a variables aleatorias estadísticamente independientes (iid) y por lo
tanto se dan las condiciones del TLC, se tiene que:
ˆ
Maxk = α/2 σ θ = α/2σ/
θ
Z
ˆ

n,

n≥
30

ˆ
¿Pero como escoger el estimador θ que mejor precisa el parámetro θ ?

Hay dos métodos generales: el método de momentos y el método de máxima
verosimilitud.
Método de máxima verosimilitud
El método de estimación de máxima verosimilitud permite, en el caso de un
parámetro o n vector de parámetros poblacionales desconocidos, determinar el
estimador o vector de estimadores que maximizan la función de probabilidad
conjunta de una muestra de n v.a. seleccionadas de la población en estudio.
Sea f(x, θ) la fdp de una población en la cual queremos determinar θ .
Sea x1,x2,….,xn una muestra de v.a. iid seleccionadas de dicha población, a la
función de probabilidad conjunta L( θ ) de las n v.a. de la muestra la llamaremos
funcion de verosimilitud muestral, es decir:
L ( θ )=L(x1,x2,….,xn; θ )
Pero como las v.a. son independientes tenemos: L( θ ) = f(x1, θ ) f(x2, θ )….f (xn, θ
). Es decir:
L ( θ )=
n

∏f(x , θ)
i

i=
1
Estimador de máxima verosimilitud -EMVˆ
ˆ
El EMV del parámetro θ es θ siempre que L( θ ) sea el valor de máxima

probabilidad de la función de verosimilitud L es decir:
ˆ
ˆ
θ es el EMV de θ si y solo si L( θ ) es máximo
n

f(x
En la expresión L( θ )= ∏ i , θ) la función de verosimilitud varia con el
i=
1

parámetro θ y para el proceso de optimización se considera que las x i son
constantes luego de haber determinado la muestra aleatoria.
Observe que como la función logaritmo natural es siempre creciente el EMV de
L( θ ) también optimiza a Ln (L( θ )) y podemos definir:
n

n

i=
1

i =1

f(x
l( θ )=Ln (L( θ ))= Ln ( ∏ i , θ) )= ∑ln f(x i , θ)
n

y optimizar así: l′( θ ) = ∑
i =1

ˆ
l′(θ) =0

f ′( xi , θ)
ˆ
= 0 . Si θ = θ maximiza a l( θ ) es claro que
f( xi , θ)

′ˆ
y l′(θ) <0.

Ejemplo: Considere una población Bernoulli, calcule el EMV para la probabilidad
de éxito poblacional p.
Sabemos que f(x,p)=px(1-p)1-x, x=0,1. De esta manera
n

n

i =1

i=1

x
1−x
L (p)= ∏f(x i , p) =∏p i (1−p) i
1
L (p)= p ∑x (1−p)∑ −x
i

i

Y empleando la funcion logaritmo natural se tiene que:
l(p) =ln[L(p)] =( ∑ i )ln(p) +(n −∑ i )ln(1−p)
x
x

ˆ
Observe que l′(p) = 0 → p =

1
ˆ
∑x i y l′′(p) < 0 .
n
n

ˆ
Y ademas que 0 ≤ ∑ xi ≤ n ↔ 0 ≤ p ≤ 1 .
i =1

Así si

∑xi =0

entonces

Y si ∑xi =n

entonces

Por lo tanto p =
ˆ

∑xi
n

L(p)=(1-p)n

que es máximo en p = 0

L(p)=pn que es máximo en p = 1

es el EMV para p Bernoulli

Ejemplo: Considere una población Poisson y calcule el EMV para la tasa
poblacional de sucesos raros λ
Sabemos que

f(x, λ) =

e −λ λ x
x!

para x = 0,1,2,…

n
f(x
L( λ )= ∏ i, h)
1
∑xi
n
x
e−nλ ⋅ λ
L( λ ) = ∏e− λ λ i /x ! =
i
∏xi!
1

x
como ∏ i ! es constante

l( λ ) = ln[L ( λ ) ] = −nλ + ( ∑ x )lnλ − lnc
i
∑ xi
∑ xi
l′( λ ) = −n +
=0
entonces ˆ =
λ
es el EMV para λ Poisson
λ
n

λ
Observe que l′′( ˆ ) = −

∑ xi
< 0 , ya que ∑xi >0 y λ > 0 .
λ2

Ejemplo: Considere una función Pareto y calcule EMV para β si la fda es
β
α 
F( x, α, β ) =1− 
x 

con 0 < α < x

y 0 <β

con α conocido y β desconocido.
Primero

f(x,β)=

∂
F
∂
x

ya que F, la fda, es la función integral de f, la fdp.
f(x,β) = αβ β x-(β+1)

La función de verosimilitud es
(

)

n
n β
−(β +
1)
L( β ) = ∏f x , β = ∏α ⋅ β ⋅x
i
i
1
1
− ( β +1)

nβ n  n
L( β ) = α
⋅ β ⋅ ∏ x 

i
1


Aplicando logaritmo natural,

n
l( β) = n ⋅ β ⋅ lnα + n ⋅ lnβ − (β + 1) ⋅ ∑ lnx
i
1
n
l′( β ) = n ⋅ ln( α ) + − ∑ lnx = 0 entonces
i
β
n x
ˆ
β = n∑ln i
1  α



−1





es el EMV

para β de Pareto

Si α fuese desconocido se podría estimar como el mínimo muestral

α =min (x1,x2,…,xn)
ˆ
2
′ˆ
observe que l′(β ) =− ⋅(β )− <0 .
n ˆ

Ejercicios
Hallar el EMV para
a)

λ si f(x,λ)=λ e-λx, x>0.

b)

α si f(x,α)=(α+1)xα, 0<x<1

calcule α si
(x1=0.3, x2=0.5, x3=0.7, x4=0.62, x5=0.7,x6=0.3, x7=0.4, x8=0.55, x9=0.60,x10=0.65)
c)

Si una población es lognormal, halle EMV para μ si conoce σ 2.

d)

σ2 si conoce μ.

e)

μ y σ2 son desconocidos.

Estimación Por Intervalos
Estamos en una población conocida y desconocemos

()

ˆ
E θ =θ pero

queremos

hallar un intervalo de valores que contenga a θ, además conocemos σ θ o
ˆ
podemos estimarla con un error pequeño. Para ello seleccionaremos una muestra
ˆ ˆ ˆ
ˆ
aleatoria (θ1,θ2 ,θ3 ,...θn ) . El Teorema Del Límite Central permite afirmar que
Z=

ˆ
ˆ
θ − E(θ )
σˆ

→ n( z,0,1)

θ

y podemos afirmar con un nivel α que P(-z α/2 <Z< z α/2 )=1-α
Equivalentemente,

( ) < z  =1-α

α/2 


ˆ
ˆ
θ −E θ
P  - z α/2 <

σˆ
θ


ˆ
P ( E(θ ) −θ



<z

α/2

σˆ

θ

)=1-α

ˆ
Pθ −θ <z
σ ˆ  =1 −α

α 2 θ



ˆ
Sustituyendo E ( θ )= θ ,

ˆ
Al efectuar la estimación puntual θ = θ afirmamos con confianza al 1−α , que la

diferencia absoluta entre el parámetro θ y el valor muestral
z

α 2

está
θ

acotada por

σˆ

θ
θ− <
θ
z

σˆ

α 2

θ

Denominado intervalo Z para θ, es decir,

(

)

ˆ
P θ − θ < z α 2 σ θ = 1 − α ⇒θ
ˆ


Є θ ±z α


σ ˆ con
θ


2

confianza 1-α.

Intervalo para la proporción p en una población Binomial
Seleccionamos una muestra aleatoria conformada por (p 1, p2, p3,…,pn) donde las
ˆ
pi son v.a iid que cumplen E(pi)=p. Es claro que si p =

x
ˆ
, E( p ) = p y
n

σ p = np(1−p ) , según el resultado previo de una población binomial se tendrá:
ˆ

Z=

ˆ
ˆ
p − E( p )
σp
ˆ

→ n( z,0,1)

y que con un nivel de significación

siempre que np y n(1-p) ≥ 10

α

P(-z α 2 < Z < z α 2 ) = 1− α

P(-z α 2 <

ˆ
p − E(p)
σp
ˆ

< z α 2 ) = 1− α

P( p - E(p) < z α 2σ P ) = 1 − α

ˆ
Como E(p ) = p afirmamos con probabilidad 1-α que

(

)

ˆ p
P p − <z α 2σ p = −
1 α
ˆ
K = α 2σ p
z
ˆ

σp =
ˆ

es el error de estimación

p(1− p )
es la desviación estándar de la distribución binomial
n

ˆ
Al hacer la estimación puntual p =π afirmamos con confianza 1- α que.

p − π < zα 2

O sea

π (1 − π )
n

π(1 − π) 
 con confianza 1- α
ˆ
P ( p − p < z α 2 σ p ) = 1 − α ⇒p ∈  π ± z α 2
ˆ


n



Intervalo para la media μ en una población normal

Intervalos Z para la media μ
Sea (x1, x2, x3,…,xn) una muestra
aleatoria, o sea que las xi son i.i.d.,
esto es la fdp conjunta de la muestra
es
n

(

2
f(x1,x2,…,xn;μ)= ∏ n xi , μ, σ
1

)

Así el EMV de μ es X y también
2
E( X )=μ y σ 2 = σ
x
n

Si en una muestra con n ≥ 30 preestablecemos un nivel de significación α
podemos afirmar con probabilidad 1-α que:
σ 

P μ − X < z α 2
 = 1− α
n


Es decir que con probabilidad 1-α la diferencia absoluta máxima entre μ y x es,
zα 2

σ
o sea , si estimamos X = x afirmamos que
n

σ 
σ 


P μ − X < z α 2
 = 1 − α ⇒ μ ∈  x ± z α/2
 con confianza 1- α .
n
n



Si σ2 es desconocida se debe estimar mediante s2 calculado en la muestra
particular así afirmamos que:
s 
s 


P µ − X < z α 2
 = 1− α ⇒ μ ∈  x ± z α/2
 con confianza al 1− α
n
n


X −μ
se introduce variabilidad en el numerador con X y en el
n

Aunque en Z= S

denominador con S este efecto se contrarresta con n grande.
¿Que pasa si σ2 es desconocida y n<30?, que ahora si aumenta la variabilidad y
necesitamos una distribución acampanada con colas robustas que permitan
mayor variabilidad, o sea, una distribución T.

P(T>t

α

,v

)=

α

E(T)=0

V(T)=

n
n −2

n>2

X −μ
se distribuye según Gosset como
n

Si la población es normal entonces T= S

una t-student con n-1 grados de libertad. Observe que S se basa en el cálculo de
x1 − x, x 2 − x,..., x n − x de forma que en el cálculo de

∑x

i

−x =0 sólo hay n-1

variables libremente determinadas. La n-ésima depende de ellas, a este número
se le denomina grados de libertad v =n-1.
Si de una población normal seleccionamos una muestra pequeña n<30 y
calculamos X = x y S=s preestableciendo un nivel de significación α podemos
construir un intervalo T bilateral de confianza 1-α con v=n-1 grados de libertad
para μ así:


s
P X − μ < tα 2  = 1− α
n− 1 n 


⇒

μ ∈ x ±t α 2,n −1 s
(

n)

con confianza 1-α
PROBLEMAS SELECCIONADOS
1. Ingenieros químicos de la Universidad de Murcia (España) realizaron una
serie de experimentos para determinar cuál es la membrana más efectiva
para usarse en un muestreador pasivo (Environmental science &
Technology, Vol.27, 1993). La efectividad de un muestreador pasivo se
midió en términos de la tasa de muestreo, registrada en centímetros
cúbicos por minuto. En un experimento se colocaron seis muestreadotes
pasivos con sus caras paralelas al flujo del aire, el cual tuvo una velocidad
de 90 centímetros por segundo. Después de seis horas se determinó la
tasa de muestreo de cada muetreador. Con base en los resultados, se
calculó un intervalo de confianza al 95% de (49.66, 51.48) para la tasa de
muestreo media.
a. ¿Cuál es el coeficiente de confianza para este intervalo?
b. Haga una interpretación teórica del coeficiente de confianza del inciso a.
c. Haga una interpretación práctica del intervalo de confianza.
d. ¿Qué supuestos son necesarios para que el intervalo produzca inferencias
válidas?
2. La relación teórica entre flujo de calor y gradiente de temperatura para
materiales homogéneos es bien conocida y se describe mediante una
ecuación de Fourier. Sin embargo la relación no se cumple para materiales
no homogéneos como cuerpos porosos o con capilares, sistemas celulares,
suspensiones y pastas. Se efectuó un experimento para estimar el tiempo
de relajación térmica medio (definido como el tiempo necesario para
acumular la energía térmica que se requiera para una transferencia
propagadora de calor) de varios materiales no homogéneos (Journal of
Heat Transfer, agosto de 1990). Se determinó un intervalo de confianza al
95% de 20.0 ± 6.4 segundos para el tiempo de relajación térmica medio
de la arena.
a. Haga una interpretación práctica del intervalo de confianza de 95 por
ciento.
b. Haga una interpretación teórica del intervalo de confianza de 95 por ciento.
3. Rocas inusuales en “Las Siete Islas” situadas en la parte baja del Río San
Lorenzo en Canadá han estado atrayendo a los geólogos a ésta área
durante más de un siglo. Hace poco se completó un importante
reconocimiento geológico de “Las Siete Islas” con el propósito de crear un
modelo tridimensional de gravedad del área (Canadian Journal of Earth
Sciences, Vol. 27, 1990). Una de las claves para elaborar un modelo
objetivo es obtener una estimación exacta de la densidad de las rocas. Con
base en muestras de diversas variedades de rocas, se obtuvo la siguiente
información sobre densidad de las rocas (en gramos por centímetro
cúbico):
Tipo de roca
Gabbro tardío
Gabbro
masivo
Cumberlandit
a

Tamaño de muestra
36

Densidad media
3.04

Desviación estándar
0.13

148

2.83

0.11

135

3.05

0.31

a. Para cada tipo de roca, estime la densidad media con un intervalo de
confianza de 90 por ciento.
b. Interprete los intervalos del inciso a.
4. En Environmental science & Technology (diciembre de 1985) se informó
una evaluación de la química y el reciclaje de metales traza en un lago
ácido de los Adirondack. Se tomaron 24 muestras de agua del Lago Darts,
Nueva Cork, y se analizaron para determinar la concentración de
particulados tanto de plomo como de aluminio.
a. Las mediciones de concentración de plomo tuvieron una media de
9.9nmol/l. Calcule un intervalo de confianza al 99% para la
verdadera concentración media de plomo en las muestras de agua
tomadas del Lago Darts.
b. Las mediciones de concentración de aluminio tuvieron una media de
6.7nmol/l y una desviación estándar de 10.8nmol/l. Calcule un
intervalo de confianza al 99% para la verdadera concentración media
de aluminio en las muestras de agua tomadas del Lago Darts.
c. ¿Qué supuestos son necesarios para que los intervalos de los
incisos a y b sean válidos?
5. Según un estudio, “la mayoría de las personas que mueren a causa del
fuego y el humo en edificios divididos en compartimentos resistentes a los
incendios –el tipo que se utiliza para hoteles, moteles, apartamentos e
instalaciones

de

salubridad-

mueren

al

intentar

evacuar”

(Risk

Management, febrero de 1986). Los datos que siguen representan los
números de víctimas que intentaron evacuar, para una muestra de 14
incendios recientes en edificios resistentes al fuego, divididos en
compartimentos, informados en el estudio.
Incendio
Las Vegas Hilton (Las Vegas)
Inn on the Park (Toronto)
Westchase Hilton (Houston)
Holiday Inn (Cambridge, Ohio)
Conrad Hilton (Chicago)
Providence College (Providence)
Baptist Towers (Atlanta)
Howard Johnson (New Orleans)
Cornell University (Ithaca, New York)
Wesport Central Apartments (Kansa City, Missouri)
Orrington Hotel (Evanston, Illinois)
Hartford Hospital (Hartford, Connecticut)
Milford Plaza (New York)

Murieron en intento de
evacuación
5
5
8
10
4
8
7
5
9
4
0
16
0
MGM Grand (Las Vegas)
36
a. Exprese el supuesto, en términos del problema, que se requiere para
que una técnica de intervalo de confianza de muestra pequeña sea
válido.
b. Utilice la información de listado MINITAB que e representa aquí para
construir un intervalo de confianza de 98% para ekl verdadero
número medio de víctimas por incendio que mueren al tratar de
evacuar edificios resistentes al fuego divididos en compartimentos.
c. Interprete el intervalo construido en el inciso b.
numdied

N
14

MEAN
8.36

STDEV
8.94

SE MEAN
2.39

98.0 PERCENT C.I.
(2.02, 14.69

6. El Journal of the American Association (21 de abril de 1993) informó de los
resultados de una encuesta de entrevistas sobre salud a nivel nacional en
EE.UU. diseñada para determinar la frecuencia del hábito de fumar entre
adultos de este país. Mas de 40.000 adultos respondieron a preguntas
como: “¿Ha fimado por lo menos 100 cigarrillos en su vida?” y “¿Fuma
cigarrillos ahora?” A los fumadores actuales (mas de 11.000 adultos en la
encuesta) también se les preguntó:”En PROMEDIO, ¿Cuántos cigarrillos
fuma al día?”, Los resultados arrojan una media de 20.0 cigarrillos por día
con un intervalo de confianza de 95% de (19.7, 20.3).
a. Interprete el intervalo de confianza de 95%.
b. Exprese cualquier supuesto sobre la población objetivo de
fumadores actuales de cigarrillos que deben satisfacerse para que
las inferencias derivadas del intervalo sean válidas.
c. Un investigador de la industria tabacalera asegura que el número
medio de cigarrillos fumados al día por fumadores consuetudinarios
de cigarrillos es menor de 15. Comente esta aseveración.
7. Las avispas tropicales fundadoras de enjambres dependen, al igual que las
hormigas y las abejas, de obreras para la cría de su prole. Resulta
interesante que las obreras de esta especie de avispas son en su mayor
parte hembras, capaces de tener sus propios descendientes. En vez de
hacerlo, crían la prole de otros miembros de la nidada. Una posible
explicación de éste extraño comportamiento es la endogamia, lo que
incrementa el grado de parentesco entre las avispas y permite a las obreras
distinguir y ayudar a sus parientes más cercanas. A fin de probar esta
teoría, se capturaron 197 avispas fundadoras de enjambres en Venezuela,
se congelaron a -70ºC y luego se sometieron a una serie de pruebas
genéticas (Science, noviembre de 1988). Los datos sirvieron para generar
un coeficiente de endogamia, x para cada espécimen de avispa, con los
siguientes resultados: x = 0.044 y s = 0.884
a. Construya un intervalo de confianza de 90% para el coeficiente de
endogamia medio de esta especie de avispa.
b. Un coeficiente de cero implica que la avispa no tiene tendencia a la
endogamia. Utilice el intervalo de confianza del inciso a para hacer
una inferencia acerca de la tendencia de esta especie de avispa a la
endogamia.
8. Los números de la tabla representan tiempo de CPU (en segundos) para la
resolución de 52 problemas matemáticos polinómicos 0-1 aleatorios
resueltos empleando un algoritmo híbrido. El listado SAS que se representa
más adelante proporciona un diagrama de ramas y hojas y estadísticas
descriptivas del conjunto de datos. Utilice esta información para estimar,
con 95% de confianza, el tiempo de resolución medio del algoritmo híbrido.
0.045
0.136
0.088
0.361
0.182
0.179
0.182

0.136
0.130
0.194
0.049
1.055
0.336
0.242

8.788
0.036
0.118
0.070
0.091
0.145
0.209

0.079
0.136
0.258
1.639
0.579
0.394
0.333

3.985
0.600
4.170
0.258
1.894
1.070
0.912

1.267
0.209
0.554
0.670
0.291
0.227
3.046

0.379
0.506
0.412
0.567
0.445
0.258
0.888

0.327
0.064
0.045
Stem
8
8
7
7
6
6
5
5
4
4
3
3
2
2
1
1
0
0

Leaf
8

1

0 2
9
0

2
1
1

6
1
5
0

9
1 3
6 6 6 6 7 9
0 0 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4

9. Un fabricante produce anillos para los pistones de un motor de automóvil.
Se sabe que el diámetro del anillo está distribuido aproximadamente de
manera normal, y que tiene una desviación estándar σ = 0.001mm. Una
muestra aleatoria de 15 anillos tiene un diámetro promedio de
x = 74..036mm

a. Construya un intervalo de confianza bilateral del 99% para el
diámetro promedio del anillo
b. Construya un límite inferior de confianza del 95% para el diámetro
promedio del anillo
c. Supóngase que se desea una confianza del 95% en que el error en
la estimación de la duración promedio sea menor que 5 horas. ¿Qué
tamaño de muestra debe utilizarse?
d. Supóngase que se desea que el ancho total del intervalo de
confianza bilateral sea de seis horas, con una confianza del 95%.
¿Qué tamaño de muestra debe emplearse para este fin?

2
3
7
35
10. Se sabe que la duración, en horas de un foco de 75 watts tiene una
distribución aproximadamente normal, con una desviación estándar de
σ=25 horas. Se toma una muestra aleatoria de 20 focos, la cual resulta
tener una duración promedio de x = 1014 horas.
11. Un ingeniero civil analiza la resistencia a la compresión del concreto. La
resistencia está distribuida aproximadamente normal, con una varianza
σ2=1000(psi)2. Al tomar una muestra aleatoria de 12 especimenes, se tiene
que x = 3250 psi.
a. Construya un intervalo de confianza bilateral del 95% para la
resistencia a la compresión promedio.
b. Construya un intervalo de confianza bilateral del 99% para la
resistencia a la compresión promedio. Compare el ancho de este
intervalo de confianza con el ancho encontrado en el inciso a.
c. Suponga que se desea estimar la resistencia a la compresión con un
error menor que 15 psi para un nivel de confianza del 99%. ¿Qué
tamaño de muestra debe emplearse para este fin?
12. Se utilizan dos máquinas para llenar botellas de plástico con detergente
para máquinas lavaplatos. Se sabe que las desviaciones estándar del
volumen de llenado son σ 1=0.10 onzas de líquido y σ 2=0.15 onzas de
líquido para las dos máquinas, respectivamente. Se toman dos muestras
aleatorias, n1=12 botellas de la máquina 1 y n 2=10 botellas de la máquina 2.
Los

volúmenes

promedio

de

llenado

son

x1 = 30.87 onzas de líquido y x 2 = 30.68 onzas de líquido.

a. Construya un intervalo de confianza bilateral del 90% para la
diferencia entre las medias del volumen de llenado
b. Construya un intervalo de confianza bilateral del 95% para la
diferencia entre las medias del volumen de llenado. Compare el
ancho de este intervalo el ancho encontrado en el inciso a.
c. Construya un intervalo de confianza superior del 95% para la
diferencia entre las medias del volumen de llenado.
13. Se estudia la tasa de combustión de dos propelentes sólidos utilizados en
los sistemas de escape de emergencia de los aeroplanos. Se sabe que la
tasa de combustión de los dos propelentes tiene aproximadamente la
misma desviación estándar; esto es, σ1 = σ 2 = 3cm/s. Se prueban dos
muestras aleatorias de n1=20 y n2=20 especimenes; las medias muestrales
de la tasa de combustión son x1 = 18cm/s y x 2 = 24cm/s .
a. Construya un intervalo de confianza bilateral del 99% para la
diferencia entre medias de la tasa de combustión.
b. ¿Qué tamaño de muestra debe utilizarse en cada población si se
desea que el error en la estimación de la diferencia entre las medias
de las tasas de combustión sea menor que 4cm/s con una confianza
del 99%?
14. Se prueban dos fórmulas diferentes de un combustible oxigenado para
motor en cuanto al octanaje. La varianza del octanaje para la fórmula 1 es
2
σ1 = 1.5 . Mientras que para la formula 2 es σ 2 = 1.2 . Se prueban dos
2

muestras aleatorias de tamaño n1=15 y n2=20. Los octanajes promedio
observados son x1 = 89.6 y x 2 = 92.5 .
a. Construya un intervalo de confianza bilateral del 95% para la
diferencia en el octanaje promedio.
b. ¿Qué tamaño de muestra debe utilizarse en cada población si se
desea tener una confianza del 95% de que el error al estimar la
diferencia entre las medias de octanaje sea menor que uno?
15. Considere el intervalo de confianza para μ con desviación estándar σ
conocida:
x − zα1 σ / n ≤ µ ≤ x + zα1 σ / n
donde

α1 + α 2 = α .

Sea

α=0.05.

Encuentre

el

intervalo

para

α1 = α2 = α 2 = 0.025 . Ahora encuentre el intervalo para el caso donde
α1 = 0.01 y α2 = 0.04 . ¿Qué intervalo es mas pequeño? ¿Existe alguna

ventaja con respecto al intervalo de confianza “simétrico”?
16. En un proceso químico se fabrica cierto polímero. Normalmente, se hacen
mediciones de viscosidad después de cada corrida, y la experiencia
acumulada indica que la variabilidad en el proceso es muy estable, con
σ=20. Las siguientes son 15 mediciones de viscosidad por corrida: 724,
718, 776, 760, 745, 759, 795, 756, 742, 740, 761, 749, 739, 747, 742.
Encuentre un intervalo de confianza bilateral del 90% para la viscosidad
promedio del polímero.
17. Se piensa que la concentración del ingrediente activo de un detergente
líquido para ropa, es afectada por el tipo de catalizador utilizado en el
proceso de fabricación. Se sabe que la desviación estándar de la
concentración activa es de 3g/l, sin importar el tipo de catalizador utilizado.
Se realizan 10 observaciones con cada catalizador, y se obtienen los datos
siguientes:
Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0
Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 65.3
a. Encuentre un intervalo de confianza del 95% para la diferencia entre las
medias de las concentraciones activas para los dos catalizadores.
b. ¿Existe alguna que indique que las concentraciones activas medias
dependen del catalizador utilizado?
VALORES CRÍTICOS DE LA DISTRIBUCIÓN t

α
٧

0.1

0.05

0.025

0.01

0.005

1
2
3
4
5

3.078
1.886
1.638
1.533
1.476

6.314
2.920
2.353
2.132
2.015

12.706
4.303
3.182
2.776
2.571

31.821
6.965
4.541
3.747
3.365

63.657
9.925
5.841
4.604
4.032

6
7
8
9
10

1.440
1.415
1.397
1.383
1.372

1.943
1.895
1.860
1.833
1.812

2.447
2.365
2.306
2.262
2.228

3.143
2.998
2.896
2.821
2.764

3.707
3.499
3.355
3.250
3.169

11
12
13
14
15

1.363
1.356
1.350
1.345
1.341

1.796
1.782
1.771
1.761
1.753

2.201
2.179
2.160
2.145
2.131

2.718
2.681
2.650
2.624
2.602

3.106
3.055
3.012
2.977
2.947
16
17
18
19
20

1.337
1.333
1.330
1.328
1.325

1.746
1.740
1.734
1.729
1.725

2.120
2.110
2.101
2.093
2.086

2.583
2.567
2.552
2.539
2.528

2.921
2.898
2.878
2.861
2.845

21
22
23
24
25

1.323
1.321
1.319
1.318
1.316

1.721
1.717
1.714
1.711
1.708

2.080
2.074
2.069
2.064
2.060

2.518
2.508
2.500
2.492
2.485

2.831
2.819
2.807
2.797
2.787

26
27
28
29
inf.

1.315
1.314
1.313
1.311
1.282

1.706
1.703
1.701
1.699
1.645

2.056
2.052
2.048
2.045
1.960

2.479
2.473
2.467
2.462
2.326

2.779
2.771
2.763
2.756
2.576
Estimacion de parametros

More Related Content

What's hot

Veter. 11ava estimadores de medias y proporciones
Veter. 11ava estimadores de medias y proporcionesVeter. 11ava estimadores de medias y proporciones
Veter. 11ava estimadores de medias y proporcionesUniv Peruana Los Andes
 
5. probabilidad conjunta ejercicios resueltos
5. probabilidad conjunta   ejercicios resueltos5. probabilidad conjunta   ejercicios resueltos
5. probabilidad conjunta ejercicios resueltosfabebust
 
Dual y simplex dual
Dual y simplex dualDual y simplex dual
Dual y simplex dualpuracastillo
 
Solucionario estadistica
Solucionario estadisticaSolucionario estadistica
Solucionario estadisticaDiego Arias
 
Distribuciones continuas de probabilidad
Distribuciones continuas de probabilidadDistribuciones continuas de probabilidad
Distribuciones continuas de probabilidadangiegutierrez11
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguezthomas669
 
Probabilidad y estadística descriptiva
Probabilidad y estadística descriptivaProbabilidad y estadística descriptiva
Probabilidad y estadística descriptivaBlanca Parra Campos
 
Distribución Binomial
Distribución BinomialDistribución Binomial
Distribución Binomialsamantharisa
 
Principio de minimos cuadrados
Principio de minimos cuadradosPrincipio de minimos cuadrados
Principio de minimos cuadradosEstef_ML4
 
Estimación.intervalos de confianza para la media y para las proporciones
Estimación.intervalos de confianza para la media y para las proporcionesEstimación.intervalos de confianza para la media y para las proporciones
Estimación.intervalos de confianza para la media y para las proporcionesHugo Caceres
 

What's hot (20)

Veter. 11ava estimadores de medias y proporciones
Veter. 11ava estimadores de medias y proporcionesVeter. 11ava estimadores de medias y proporciones
Veter. 11ava estimadores de medias y proporciones
 
3 variables aleatorias
3 variables aleatorias3 variables aleatorias
3 variables aleatorias
 
5. probabilidad conjunta ejercicios resueltos
5. probabilidad conjunta   ejercicios resueltos5. probabilidad conjunta   ejercicios resueltos
5. probabilidad conjunta ejercicios resueltos
 
Dual y simplex dual
Dual y simplex dualDual y simplex dual
Dual y simplex dual
 
Distribucion Normal
Distribucion NormalDistribucion Normal
Distribucion Normal
 
Solucionario estadistica
Solucionario estadisticaSolucionario estadistica
Solucionario estadistica
 
Distribuciones continuas de probabilidad
Distribuciones continuas de probabilidadDistribuciones continuas de probabilidad
Distribuciones continuas de probabilidad
 
Regresión lineal multiple autores grillet montaño rodríguez
Regresión lineal multiple  autores grillet montaño rodríguezRegresión lineal multiple  autores grillet montaño rodríguez
Regresión lineal multiple autores grillet montaño rodríguez
 
Probabilidad y estadística descriptiva
Probabilidad y estadística descriptivaProbabilidad y estadística descriptiva
Probabilidad y estadística descriptiva
 
Pruebas de hipotesis - Introducción
Pruebas de hipotesis - IntroducciónPruebas de hipotesis - Introducción
Pruebas de hipotesis - Introducción
 
Series de taylor
Series de taylorSeries de taylor
Series de taylor
 
Semana 2 1_
Semana 2 1_Semana 2 1_
Semana 2 1_
 
Distribución Binomial
Distribución BinomialDistribución Binomial
Distribución Binomial
 
Induccion
InduccionInduccion
Induccion
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Ejercicios física iii
Ejercicios  física iiiEjercicios  física iii
Ejercicios física iii
 
Principio de minimos cuadrados
Principio de minimos cuadradosPrincipio de minimos cuadrados
Principio de minimos cuadrados
 
Derivadas parciales
Derivadas parcialesDerivadas parciales
Derivadas parciales
 
Estimación.intervalos de confianza para la media y para las proporciones
Estimación.intervalos de confianza para la media y para las proporcionesEstimación.intervalos de confianza para la media y para las proporciones
Estimación.intervalos de confianza para la media y para las proporciones
 
Semana9 ic
Semana9 icSemana9 ic
Semana9 ic
 

Viewers also liked

Ejercicio estadística estimación de parámetros
Ejercicio estadística estimación de parámetrosEjercicio estadística estimación de parámetros
Ejercicio estadística estimación de parámetrosOscar de la Torre
 
Estimación de parámetros
Estimación de parámetrosEstimación de parámetros
Estimación de parámetrosGudalupe Valdez
 
Estimación de parametro su31
Estimación de parametro su31Estimación de parametro su31
Estimación de parametro su31Instruccional
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianzaRoza Meza
 
LIBRO DIARIO
LIBRO DIARIOLIBRO DIARIO
LIBRO DIARIOluchinl
 
Diseño y analisis de experimentos montgomery
Diseño y analisis de experimentos montgomeryDiseño y analisis de experimentos montgomery
Diseño y analisis de experimentos montgomeryMARTIN R. V.
 
Applied statistics and probability for engineers solution montgomery && runger
Applied statistics and probability for engineers solution   montgomery && rungerApplied statistics and probability for engineers solution   montgomery && runger
Applied statistics and probability for engineers solution montgomery && rungerAnkit Katiyar
 
Solutions. Design and Analysis of Experiments. Montgomery
Solutions. Design and Analysis of Experiments. MontgomerySolutions. Design and Analysis of Experiments. Montgomery
Solutions. Design and Analysis of Experiments. MontgomeryByron CZ
 
Estimación e intervalos de confianza
Estimación e intervalos de confianzaEstimación e intervalos de confianza
Estimación e intervalos de confianzaAlejandro Ruiz
 
Solucionario Montgomery Probabilidad y Estadistica Seguna Edicion 2da
Solucionario Montgomery Probabilidad y Estadistica Seguna Edicion 2daSolucionario Montgomery Probabilidad y Estadistica Seguna Edicion 2da
Solucionario Montgomery Probabilidad y Estadistica Seguna Edicion 2daCésar Alejandro
 
Libro Diario y Libro Mayor
Libro Diario y Libro MayorLibro Diario y Libro Mayor
Libro Diario y Libro Mayormauricio michea
 
Operaciones con logaritmos
Operaciones con logaritmosOperaciones con logaritmos
Operaciones con logaritmosjcremiro
 
Contabilidad basica
Contabilidad basicaContabilidad basica
Contabilidad basicaveac
 
Materiales eléctricos y electrónicos
Materiales eléctricos y electrónicosMateriales eléctricos y electrónicos
Materiales eléctricos y electrónicosjaison2772
 

Viewers also liked (20)

Ejercicio estadística estimación de parámetros
Ejercicio estadística estimación de parámetrosEjercicio estadística estimación de parámetros
Ejercicio estadística estimación de parámetros
 
Estimación de parámetros
Estimación de parámetrosEstimación de parámetros
Estimación de parámetros
 
Estimacion de-parametros
Estimacion de-parametrosEstimacion de-parametros
Estimacion de-parametros
 
Estimación de parametro su31
Estimación de parametro su31Estimación de parametro su31
Estimación de parametro su31
 
Estimacion de parametros
Estimacion de parametrosEstimacion de parametros
Estimacion de parametros
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
Ejemplo libro diaro
Ejemplo libro diaroEjemplo libro diaro
Ejemplo libro diaro
 
LIBRO DIARIO
LIBRO DIARIOLIBRO DIARIO
LIBRO DIARIO
 
Diseño y analisis de experimentos montgomery
Diseño y analisis de experimentos montgomeryDiseño y analisis de experimentos montgomery
Diseño y analisis de experimentos montgomery
 
El Libro Diario
El Libro DiarioEl Libro Diario
El Libro Diario
 
Applied statistics and probability for engineers solution montgomery && runger
Applied statistics and probability for engineers solution   montgomery && rungerApplied statistics and probability for engineers solution   montgomery && runger
Applied statistics and probability for engineers solution montgomery && runger
 
Solutions. Design and Analysis of Experiments. Montgomery
Solutions. Design and Analysis of Experiments. MontgomerySolutions. Design and Analysis of Experiments. Montgomery
Solutions. Design and Analysis of Experiments. Montgomery
 
Estimación e intervalos de confianza
Estimación e intervalos de confianzaEstimación e intervalos de confianza
Estimación e intervalos de confianza
 
Solucionario Montgomery Probabilidad y Estadistica Seguna Edicion 2da
Solucionario Montgomery Probabilidad y Estadistica Seguna Edicion 2daSolucionario Montgomery Probabilidad y Estadistica Seguna Edicion 2da
Solucionario Montgomery Probabilidad y Estadistica Seguna Edicion 2da
 
Libro Diario y Libro Mayor
Libro Diario y Libro MayorLibro Diario y Libro Mayor
Libro Diario y Libro Mayor
 
El libro diario
El libro diarioEl libro diario
El libro diario
 
Operaciones con logaritmos
Operaciones con logaritmosOperaciones con logaritmos
Operaciones con logaritmos
 
Contabilidad basica
Contabilidad basicaContabilidad basica
Contabilidad basica
 
Estimación de Parámetros
Estimación de ParámetrosEstimación de Parámetros
Estimación de Parámetros
 
Materiales eléctricos y electrónicos
Materiales eléctricos y electrónicosMateriales eléctricos y electrónicos
Materiales eléctricos y electrónicos
 

Similar to Estimacion de parametros

Similar to Estimacion de parametros (20)

Estimacionpuntual1
Estimacionpuntual1Estimacionpuntual1
Estimacionpuntual1
 
Inferencia
InferenciaInferencia
Inferencia
 
7 distribucion normal
7 distribucion normal7 distribucion normal
7 distribucion normal
 
Que es probabilidad
Que es probabilidadQue es probabilidad
Que es probabilidad
 
distribucion_normal (1).pdf
distribucion_normal (1).pdfdistribucion_normal (1).pdf
distribucion_normal (1).pdf
 
Guia 3.estimadores estimación de una media
Guia 3.estimadores estimación de una mediaGuia 3.estimadores estimación de una media
Guia 3.estimadores estimación de una media
 
Sol. 3ra PC 19-1.pdf
Sol. 3ra PC 19-1.pdfSol. 3ra PC 19-1.pdf
Sol. 3ra PC 19-1.pdf
 
La normal
La normalLa normal
La normal
 
7 distribucion normal_total
7 distribucion normal_total7 distribucion normal_total
7 distribucion normal_total
 
Clase02 distribuciones de probabilidad
Clase02   distribuciones de probabilidadClase02   distribuciones de probabilidad
Clase02 distribuciones de probabilidad
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Estimadores
EstimadoresEstimadores
Estimadores
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporciones
 
5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx5)Estimación de parámetros.pptx
5)Estimación de parámetros.pptx
 
Distribucion normal completo
Distribucion normal completoDistribucion normal completo
Distribucion normal completo
 
Estimadores
EstimadoresEstimadores
Estimadores
 
Seminario 8
Seminario 8Seminario 8
Seminario 8
 
Estadistica y probabilidades cap vii
Estadistica y probabilidades cap viiEstadistica y probabilidades cap vii
Estadistica y probabilidades cap vii
 
Estad quimestimacionintconfianza
Estad quimestimacionintconfianzaEstad quimestimacionintconfianza
Estad quimestimacionintconfianza
 
ESTADISTICAS MAURICIO AQUIETA
ESTADISTICAS MAURICIO AQUIETAESTADISTICAS MAURICIO AQUIETA
ESTADISTICAS MAURICIO AQUIETA
 

Estimacion de parametros

  • 1. ESTIMACIÓN DE PARÁMETROS El estudio de poblaciones estadísticas supone en general el conocimiento de la función de probabilidad que gobierna el comportamiento aleatorio de la variable de interés. En muchos casos sabemos o presumimos conocer la familia distribucional de una población. Sabemos por ejemplo que la población es aproximadamente normal; pero desconocemos la media y la varianza poblacionales. Sabemos que la variable de interés es binomial pero desconocemos la probabilidad de éxito poblacional o el número de pruebas de Bernoulli. Sabemos que se trata de un proceso de Poisson pero desconocemos el número de eventos raros por intervalos. Presumimos que la variable es exponencial pero desconocemos el parámetro que precisa la distribución exponencial poblacional. Lógicamente en todas estas situaciones la función de probabilidad de la variable en estudio se concreta determinando los parámetros poblacionales correspondientes y para lograrlo se utilizan los denominados métodos de estimación de parámetros. La estimación de uno o varios parámetros poblacionales desconocidos es posible construyendo funciones de probabilidad de variables aleatorias muestrales, mas conocidos como estimadores muestrales. Dichos estimadores garantizaran un cálculo o una aproximación satisfactoria del parámetro poblacional desconocido siempre que cumplan propiedades de: insesgamiento o máxima simetría, varianza mínima o máxima concentración de los datos alrededor del parámetro estimado y máxima probabilidad. Estimación puntual Cuando en una población con familia distribucional conocida f(x, θ) queremos estimar el verdadero valor del parámetro poblacional θ utilizando como lente ˆ para determinarlo al estimador muestral θ ; procedemos a seleccionar una muestra de tamaño n de dicha población, calculamos a partir de ella un valor θ y
  • 2. afirmamos entonces que θ = ± θ k es una estimación puntual de θ con un error, por exceso o defecto, de valor k. ˆ K depende en general de la variable aleatoria muestral θ y de su desviación σ θ ˆ . En los casos de muestras grandes, cuando los valores de la muestra corresponden a variables aleatorias estadísticamente independientes (iid) y por lo tanto se dan las condiciones del TLC, se tiene que: ˆ Maxk = α/2 σ θ = α/2σ/ θ Z ˆ n, n≥ 30 ˆ ¿Pero como escoger el estimador θ que mejor precisa el parámetro θ ? Hay dos métodos generales: el método de momentos y el método de máxima verosimilitud. Método de máxima verosimilitud El método de estimación de máxima verosimilitud permite, en el caso de un parámetro o n vector de parámetros poblacionales desconocidos, determinar el estimador o vector de estimadores que maximizan la función de probabilidad conjunta de una muestra de n v.a. seleccionadas de la población en estudio. Sea f(x, θ) la fdp de una población en la cual queremos determinar θ . Sea x1,x2,….,xn una muestra de v.a. iid seleccionadas de dicha población, a la función de probabilidad conjunta L( θ ) de las n v.a. de la muestra la llamaremos funcion de verosimilitud muestral, es decir: L ( θ )=L(x1,x2,….,xn; θ ) Pero como las v.a. son independientes tenemos: L( θ ) = f(x1, θ ) f(x2, θ )….f (xn, θ ). Es decir: L ( θ )= n ∏f(x , θ) i i= 1
  • 3. Estimador de máxima verosimilitud -EMVˆ ˆ El EMV del parámetro θ es θ siempre que L( θ ) sea el valor de máxima probabilidad de la función de verosimilitud L es decir: ˆ ˆ θ es el EMV de θ si y solo si L( θ ) es máximo n f(x En la expresión L( θ )= ∏ i , θ) la función de verosimilitud varia con el i= 1 parámetro θ y para el proceso de optimización se considera que las x i son constantes luego de haber determinado la muestra aleatoria. Observe que como la función logaritmo natural es siempre creciente el EMV de L( θ ) también optimiza a Ln (L( θ )) y podemos definir: n n i= 1 i =1 f(x l( θ )=Ln (L( θ ))= Ln ( ∏ i , θ) )= ∑ln f(x i , θ) n y optimizar así: l′( θ ) = ∑ i =1 ˆ l′(θ) =0 f ′( xi , θ) ˆ = 0 . Si θ = θ maximiza a l( θ ) es claro que f( xi , θ) ′ˆ y l′(θ) <0. Ejemplo: Considere una población Bernoulli, calcule el EMV para la probabilidad de éxito poblacional p. Sabemos que f(x,p)=px(1-p)1-x, x=0,1. De esta manera n n i =1 i=1 x 1−x L (p)= ∏f(x i , p) =∏p i (1−p) i 1 L (p)= p ∑x (1−p)∑ −x i i Y empleando la funcion logaritmo natural se tiene que: l(p) =ln[L(p)] =( ∑ i )ln(p) +(n −∑ i )ln(1−p) x x ˆ Observe que l′(p) = 0 → p = 1 ˆ ∑x i y l′′(p) < 0 . n
  • 4. n ˆ Y ademas que 0 ≤ ∑ xi ≤ n ↔ 0 ≤ p ≤ 1 . i =1 Así si ∑xi =0 entonces Y si ∑xi =n entonces Por lo tanto p = ˆ ∑xi n L(p)=(1-p)n que es máximo en p = 0 L(p)=pn que es máximo en p = 1 es el EMV para p Bernoulli Ejemplo: Considere una población Poisson y calcule el EMV para la tasa poblacional de sucesos raros λ Sabemos que f(x, λ) = e −λ λ x x! para x = 0,1,2,… n f(x L( λ )= ∏ i, h) 1 ∑xi n x e−nλ ⋅ λ L( λ ) = ∏e− λ λ i /x ! = i ∏xi! 1 x como ∏ i ! es constante l( λ ) = ln[L ( λ ) ] = −nλ + ( ∑ x )lnλ − lnc i ∑ xi ∑ xi l′( λ ) = −n + =0 entonces ˆ = λ es el EMV para λ Poisson λ n λ Observe que l′′( ˆ ) = − ∑ xi < 0 , ya que ∑xi >0 y λ > 0 . λ2 Ejemplo: Considere una función Pareto y calcule EMV para β si la fda es β α  F( x, α, β ) =1−  x  con 0 < α < x y 0 <β con α conocido y β desconocido. Primero f(x,β)= ∂ F ∂ x ya que F, la fda, es la función integral de f, la fdp. f(x,β) = αβ β x-(β+1) La función de verosimilitud es
  • 5. ( ) n n β −(β + 1) L( β ) = ∏f x , β = ∏α ⋅ β ⋅x i i 1 1 − ( β +1)  nβ n  n L( β ) = α ⋅ β ⋅ ∏ x   i 1  Aplicando logaritmo natural, n l( β) = n ⋅ β ⋅ lnα + n ⋅ lnβ − (β + 1) ⋅ ∑ lnx i 1 n l′( β ) = n ⋅ ln( α ) + − ∑ lnx = 0 entonces i β n x ˆ β = n∑ln i 1  α   −1     es el EMV para β de Pareto Si α fuese desconocido se podría estimar como el mínimo muestral α =min (x1,x2,…,xn) ˆ 2 ′ˆ observe que l′(β ) =− ⋅(β )− <0 . n ˆ Ejercicios Hallar el EMV para a) λ si f(x,λ)=λ e-λx, x>0. b) α si f(x,α)=(α+1)xα, 0<x<1 calcule α si (x1=0.3, x2=0.5, x3=0.7, x4=0.62, x5=0.7,x6=0.3, x7=0.4, x8=0.55, x9=0.60,x10=0.65) c) Si una población es lognormal, halle EMV para μ si conoce σ 2. d) σ2 si conoce μ. e) μ y σ2 son desconocidos. Estimación Por Intervalos Estamos en una población conocida y desconocemos () ˆ E θ =θ pero queremos hallar un intervalo de valores que contenga a θ, además conocemos σ θ o ˆ
  • 6. podemos estimarla con un error pequeño. Para ello seleccionaremos una muestra ˆ ˆ ˆ ˆ aleatoria (θ1,θ2 ,θ3 ,...θn ) . El Teorema Del Límite Central permite afirmar que Z= ˆ ˆ θ − E(θ ) σˆ → n( z,0,1) θ y podemos afirmar con un nivel α que P(-z α/2 <Z< z α/2 )=1-α Equivalentemente, ( ) < z  =1-α  α/2   ˆ ˆ θ −E θ P  - z α/2 <  σˆ θ  ˆ P ( E(θ ) −θ  <z α/2 σˆ θ )=1-α ˆ Pθ −θ <z σ ˆ  =1 −α  α 2 θ   ˆ Sustituyendo E ( θ )= θ , ˆ Al efectuar la estimación puntual θ = θ afirmamos con confianza al 1−α , que la diferencia absoluta entre el parámetro θ y el valor muestral z α 2 está θ acotada por σˆ θ θ− < θ z σˆ α 2 θ Denominado intervalo Z para θ, es decir, ( ) ˆ P θ − θ < z α 2 σ θ = 1 − α ⇒θ ˆ  Є θ ±z α  σ ˆ con θ  2 confianza 1-α. Intervalo para la proporción p en una población Binomial
  • 7. Seleccionamos una muestra aleatoria conformada por (p 1, p2, p3,…,pn) donde las ˆ pi son v.a iid que cumplen E(pi)=p. Es claro que si p = x ˆ , E( p ) = p y n σ p = np(1−p ) , según el resultado previo de una población binomial se tendrá: ˆ Z= ˆ ˆ p − E( p ) σp ˆ → n( z,0,1) y que con un nivel de significación siempre que np y n(1-p) ≥ 10 α P(-z α 2 < Z < z α 2 ) = 1− α P(-z α 2 < ˆ p − E(p) σp ˆ < z α 2 ) = 1− α P( p - E(p) < z α 2σ P ) = 1 − α ˆ Como E(p ) = p afirmamos con probabilidad 1-α que ( ) ˆ p P p − <z α 2σ p = − 1 α ˆ K = α 2σ p z ˆ σp = ˆ es el error de estimación p(1− p ) es la desviación estándar de la distribución binomial n ˆ Al hacer la estimación puntual p =π afirmamos con confianza 1- α que. p − π < zα 2 O sea π (1 − π ) n
  • 8.  π(1 − π)   con confianza 1- α ˆ P ( p − p < z α 2 σ p ) = 1 − α ⇒p ∈  π ± z α 2 ˆ   n   Intervalo para la media μ en una población normal Intervalos Z para la media μ Sea (x1, x2, x3,…,xn) una muestra aleatoria, o sea que las xi son i.i.d., esto es la fdp conjunta de la muestra es n ( 2 f(x1,x2,…,xn;μ)= ∏ n xi , μ, σ 1 ) Así el EMV de μ es X y también 2 E( X )=μ y σ 2 = σ x n Si en una muestra con n ≥ 30 preestablecemos un nivel de significación α podemos afirmar con probabilidad 1-α que: σ   P μ − X < z α 2  = 1− α n  Es decir que con probabilidad 1-α la diferencia absoluta máxima entre μ y x es, zα 2 σ o sea , si estimamos X = x afirmamos que n σ  σ    P μ − X < z α 2  = 1 − α ⇒ μ ∈  x ± z α/2  con confianza 1- α . n n   Si σ2 es desconocida se debe estimar mediante s2 calculado en la muestra particular así afirmamos que: s  s    P µ − X < z α 2  = 1− α ⇒ μ ∈  x ± z α/2  con confianza al 1− α n n  
  • 9. X −μ se introduce variabilidad en el numerador con X y en el n Aunque en Z= S denominador con S este efecto se contrarresta con n grande. ¿Que pasa si σ2 es desconocida y n<30?, que ahora si aumenta la variabilidad y necesitamos una distribución acampanada con colas robustas que permitan mayor variabilidad, o sea, una distribución T. P(T>t α ,v )= α E(T)=0 V(T)= n n −2 n>2 X −μ se distribuye según Gosset como n Si la población es normal entonces T= S una t-student con n-1 grados de libertad. Observe que S se basa en el cálculo de x1 − x, x 2 − x,..., x n − x de forma que en el cálculo de ∑x i −x =0 sólo hay n-1 variables libremente determinadas. La n-ésima depende de ellas, a este número se le denomina grados de libertad v =n-1. Si de una población normal seleccionamos una muestra pequeña n<30 y calculamos X = x y S=s preestableciendo un nivel de significación α podemos construir un intervalo T bilateral de confianza 1-α con v=n-1 grados de libertad para μ así:  s P X − μ < tα 2  = 1− α n− 1 n   ⇒ μ ∈ x ±t α 2,n −1 s ( n) con confianza 1-α
  • 10. PROBLEMAS SELECCIONADOS 1. Ingenieros químicos de la Universidad de Murcia (España) realizaron una serie de experimentos para determinar cuál es la membrana más efectiva para usarse en un muestreador pasivo (Environmental science & Technology, Vol.27, 1993). La efectividad de un muestreador pasivo se midió en términos de la tasa de muestreo, registrada en centímetros cúbicos por minuto. En un experimento se colocaron seis muestreadotes pasivos con sus caras paralelas al flujo del aire, el cual tuvo una velocidad de 90 centímetros por segundo. Después de seis horas se determinó la tasa de muestreo de cada muetreador. Con base en los resultados, se calculó un intervalo de confianza al 95% de (49.66, 51.48) para la tasa de muestreo media. a. ¿Cuál es el coeficiente de confianza para este intervalo? b. Haga una interpretación teórica del coeficiente de confianza del inciso a. c. Haga una interpretación práctica del intervalo de confianza. d. ¿Qué supuestos son necesarios para que el intervalo produzca inferencias válidas? 2. La relación teórica entre flujo de calor y gradiente de temperatura para materiales homogéneos es bien conocida y se describe mediante una ecuación de Fourier. Sin embargo la relación no se cumple para materiales no homogéneos como cuerpos porosos o con capilares, sistemas celulares, suspensiones y pastas. Se efectuó un experimento para estimar el tiempo de relajación térmica medio (definido como el tiempo necesario para acumular la energía térmica que se requiera para una transferencia propagadora de calor) de varios materiales no homogéneos (Journal of Heat Transfer, agosto de 1990). Se determinó un intervalo de confianza al
  • 11. 95% de 20.0 ± 6.4 segundos para el tiempo de relajación térmica medio de la arena. a. Haga una interpretación práctica del intervalo de confianza de 95 por ciento. b. Haga una interpretación teórica del intervalo de confianza de 95 por ciento. 3. Rocas inusuales en “Las Siete Islas” situadas en la parte baja del Río San Lorenzo en Canadá han estado atrayendo a los geólogos a ésta área durante más de un siglo. Hace poco se completó un importante reconocimiento geológico de “Las Siete Islas” con el propósito de crear un modelo tridimensional de gravedad del área (Canadian Journal of Earth Sciences, Vol. 27, 1990). Una de las claves para elaborar un modelo objetivo es obtener una estimación exacta de la densidad de las rocas. Con base en muestras de diversas variedades de rocas, se obtuvo la siguiente información sobre densidad de las rocas (en gramos por centímetro cúbico): Tipo de roca Gabbro tardío Gabbro masivo Cumberlandit a Tamaño de muestra 36 Densidad media 3.04 Desviación estándar 0.13 148 2.83 0.11 135 3.05 0.31 a. Para cada tipo de roca, estime la densidad media con un intervalo de confianza de 90 por ciento. b. Interprete los intervalos del inciso a. 4. En Environmental science & Technology (diciembre de 1985) se informó una evaluación de la química y el reciclaje de metales traza en un lago ácido de los Adirondack. Se tomaron 24 muestras de agua del Lago Darts, Nueva Cork, y se analizaron para determinar la concentración de particulados tanto de plomo como de aluminio.
  • 12. a. Las mediciones de concentración de plomo tuvieron una media de 9.9nmol/l. Calcule un intervalo de confianza al 99% para la verdadera concentración media de plomo en las muestras de agua tomadas del Lago Darts. b. Las mediciones de concentración de aluminio tuvieron una media de 6.7nmol/l y una desviación estándar de 10.8nmol/l. Calcule un intervalo de confianza al 99% para la verdadera concentración media de aluminio en las muestras de agua tomadas del Lago Darts. c. ¿Qué supuestos son necesarios para que los intervalos de los incisos a y b sean válidos? 5. Según un estudio, “la mayoría de las personas que mueren a causa del fuego y el humo en edificios divididos en compartimentos resistentes a los incendios –el tipo que se utiliza para hoteles, moteles, apartamentos e instalaciones de salubridad- mueren al intentar evacuar” (Risk Management, febrero de 1986). Los datos que siguen representan los números de víctimas que intentaron evacuar, para una muestra de 14 incendios recientes en edificios resistentes al fuego, divididos en compartimentos, informados en el estudio. Incendio Las Vegas Hilton (Las Vegas) Inn on the Park (Toronto) Westchase Hilton (Houston) Holiday Inn (Cambridge, Ohio) Conrad Hilton (Chicago) Providence College (Providence) Baptist Towers (Atlanta) Howard Johnson (New Orleans) Cornell University (Ithaca, New York) Wesport Central Apartments (Kansa City, Missouri) Orrington Hotel (Evanston, Illinois) Hartford Hospital (Hartford, Connecticut) Milford Plaza (New York) Murieron en intento de evacuación 5 5 8 10 4 8 7 5 9 4 0 16 0
  • 13. MGM Grand (Las Vegas) 36 a. Exprese el supuesto, en términos del problema, que se requiere para que una técnica de intervalo de confianza de muestra pequeña sea válido. b. Utilice la información de listado MINITAB que e representa aquí para construir un intervalo de confianza de 98% para ekl verdadero número medio de víctimas por incendio que mueren al tratar de evacuar edificios resistentes al fuego divididos en compartimentos. c. Interprete el intervalo construido en el inciso b. numdied N 14 MEAN 8.36 STDEV 8.94 SE MEAN 2.39 98.0 PERCENT C.I. (2.02, 14.69 6. El Journal of the American Association (21 de abril de 1993) informó de los resultados de una encuesta de entrevistas sobre salud a nivel nacional en EE.UU. diseñada para determinar la frecuencia del hábito de fumar entre adultos de este país. Mas de 40.000 adultos respondieron a preguntas como: “¿Ha fimado por lo menos 100 cigarrillos en su vida?” y “¿Fuma cigarrillos ahora?” A los fumadores actuales (mas de 11.000 adultos en la encuesta) también se les preguntó:”En PROMEDIO, ¿Cuántos cigarrillos fuma al día?”, Los resultados arrojan una media de 20.0 cigarrillos por día con un intervalo de confianza de 95% de (19.7, 20.3). a. Interprete el intervalo de confianza de 95%. b. Exprese cualquier supuesto sobre la población objetivo de fumadores actuales de cigarrillos que deben satisfacerse para que las inferencias derivadas del intervalo sean válidas. c. Un investigador de la industria tabacalera asegura que el número medio de cigarrillos fumados al día por fumadores consuetudinarios de cigarrillos es menor de 15. Comente esta aseveración. 7. Las avispas tropicales fundadoras de enjambres dependen, al igual que las hormigas y las abejas, de obreras para la cría de su prole. Resulta
  • 14. interesante que las obreras de esta especie de avispas son en su mayor parte hembras, capaces de tener sus propios descendientes. En vez de hacerlo, crían la prole de otros miembros de la nidada. Una posible explicación de éste extraño comportamiento es la endogamia, lo que incrementa el grado de parentesco entre las avispas y permite a las obreras distinguir y ayudar a sus parientes más cercanas. A fin de probar esta teoría, se capturaron 197 avispas fundadoras de enjambres en Venezuela, se congelaron a -70ºC y luego se sometieron a una serie de pruebas genéticas (Science, noviembre de 1988). Los datos sirvieron para generar un coeficiente de endogamia, x para cada espécimen de avispa, con los siguientes resultados: x = 0.044 y s = 0.884 a. Construya un intervalo de confianza de 90% para el coeficiente de endogamia medio de esta especie de avispa. b. Un coeficiente de cero implica que la avispa no tiene tendencia a la endogamia. Utilice el intervalo de confianza del inciso a para hacer una inferencia acerca de la tendencia de esta especie de avispa a la endogamia. 8. Los números de la tabla representan tiempo de CPU (en segundos) para la resolución de 52 problemas matemáticos polinómicos 0-1 aleatorios resueltos empleando un algoritmo híbrido. El listado SAS que se representa más adelante proporciona un diagrama de ramas y hojas y estadísticas descriptivas del conjunto de datos. Utilice esta información para estimar, con 95% de confianza, el tiempo de resolución medio del algoritmo híbrido. 0.045 0.136 0.088 0.361 0.182 0.179 0.182 0.136 0.130 0.194 0.049 1.055 0.336 0.242 8.788 0.036 0.118 0.070 0.091 0.145 0.209 0.079 0.136 0.258 1.639 0.579 0.394 0.333 3.985 0.600 4.170 0.258 1.894 1.070 0.912 1.267 0.209 0.554 0.670 0.291 0.227 3.046 0.379 0.506 0.412 0.567 0.445 0.258 0.888 0.327 0.064 0.045
  • 15. Stem 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0 0 Leaf 8 1 0 2 9 0 2 1 1 6 1 5 0 9 1 3 6 6 6 6 7 9 0 0 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 9. Un fabricante produce anillos para los pistones de un motor de automóvil. Se sabe que el diámetro del anillo está distribuido aproximadamente de manera normal, y que tiene una desviación estándar σ = 0.001mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de x = 74..036mm a. Construya un intervalo de confianza bilateral del 99% para el diámetro promedio del anillo b. Construya un límite inferior de confianza del 95% para el diámetro promedio del anillo c. Supóngase que se desea una confianza del 95% en que el error en la estimación de la duración promedio sea menor que 5 horas. ¿Qué tamaño de muestra debe utilizarse? d. Supóngase que se desea que el ancho total del intervalo de confianza bilateral sea de seis horas, con una confianza del 95%. ¿Qué tamaño de muestra debe emplearse para este fin? 2 3 7 35
  • 16. 10. Se sabe que la duración, en horas de un foco de 75 watts tiene una distribución aproximadamente normal, con una desviación estándar de σ=25 horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de x = 1014 horas. 11. Un ingeniero civil analiza la resistencia a la compresión del concreto. La resistencia está distribuida aproximadamente normal, con una varianza σ2=1000(psi)2. Al tomar una muestra aleatoria de 12 especimenes, se tiene que x = 3250 psi. a. Construya un intervalo de confianza bilateral del 95% para la resistencia a la compresión promedio. b. Construya un intervalo de confianza bilateral del 99% para la resistencia a la compresión promedio. Compare el ancho de este intervalo de confianza con el ancho encontrado en el inciso a. c. Suponga que se desea estimar la resistencia a la compresión con un error menor que 15 psi para un nivel de confianza del 99%. ¿Qué tamaño de muestra debe emplearse para este fin? 12. Se utilizan dos máquinas para llenar botellas de plástico con detergente para máquinas lavaplatos. Se sabe que las desviaciones estándar del volumen de llenado son σ 1=0.10 onzas de líquido y σ 2=0.15 onzas de líquido para las dos máquinas, respectivamente. Se toman dos muestras aleatorias, n1=12 botellas de la máquina 1 y n 2=10 botellas de la máquina 2. Los volúmenes promedio de llenado son x1 = 30.87 onzas de líquido y x 2 = 30.68 onzas de líquido. a. Construya un intervalo de confianza bilateral del 90% para la diferencia entre las medias del volumen de llenado b. Construya un intervalo de confianza bilateral del 95% para la diferencia entre las medias del volumen de llenado. Compare el ancho de este intervalo el ancho encontrado en el inciso a.
  • 17. c. Construya un intervalo de confianza superior del 95% para la diferencia entre las medias del volumen de llenado. 13. Se estudia la tasa de combustión de dos propelentes sólidos utilizados en los sistemas de escape de emergencia de los aeroplanos. Se sabe que la tasa de combustión de los dos propelentes tiene aproximadamente la misma desviación estándar; esto es, σ1 = σ 2 = 3cm/s. Se prueban dos muestras aleatorias de n1=20 y n2=20 especimenes; las medias muestrales de la tasa de combustión son x1 = 18cm/s y x 2 = 24cm/s . a. Construya un intervalo de confianza bilateral del 99% para la diferencia entre medias de la tasa de combustión. b. ¿Qué tamaño de muestra debe utilizarse en cada población si se desea que el error en la estimación de la diferencia entre las medias de las tasas de combustión sea menor que 4cm/s con una confianza del 99%? 14. Se prueban dos fórmulas diferentes de un combustible oxigenado para motor en cuanto al octanaje. La varianza del octanaje para la fórmula 1 es 2 σ1 = 1.5 . Mientras que para la formula 2 es σ 2 = 1.2 . Se prueban dos 2 muestras aleatorias de tamaño n1=15 y n2=20. Los octanajes promedio observados son x1 = 89.6 y x 2 = 92.5 . a. Construya un intervalo de confianza bilateral del 95% para la diferencia en el octanaje promedio. b. ¿Qué tamaño de muestra debe utilizarse en cada población si se desea tener una confianza del 95% de que el error al estimar la diferencia entre las medias de octanaje sea menor que uno? 15. Considere el intervalo de confianza para μ con desviación estándar σ conocida: x − zα1 σ / n ≤ µ ≤ x + zα1 σ / n
  • 18. donde α1 + α 2 = α . Sea α=0.05. Encuentre el intervalo para α1 = α2 = α 2 = 0.025 . Ahora encuentre el intervalo para el caso donde α1 = 0.01 y α2 = 0.04 . ¿Qué intervalo es mas pequeño? ¿Existe alguna ventaja con respecto al intervalo de confianza “simétrico”? 16. En un proceso químico se fabrica cierto polímero. Normalmente, se hacen mediciones de viscosidad después de cada corrida, y la experiencia acumulada indica que la variabilidad en el proceso es muy estable, con σ=20. Las siguientes son 15 mediciones de viscosidad por corrida: 724, 718, 776, 760, 745, 759, 795, 756, 742, 740, 761, 749, 739, 747, 742. Encuentre un intervalo de confianza bilateral del 90% para la viscosidad promedio del polímero. 17. Se piensa que la concentración del ingrediente activo de un detergente líquido para ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricación. Se sabe que la desviación estándar de la concentración activa es de 3g/l, sin importar el tipo de catalizador utilizado. Se realizan 10 observaciones con cada catalizador, y se obtienen los datos siguientes: Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0 Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 65.3 a. Encuentre un intervalo de confianza del 95% para la diferencia entre las medias de las concentraciones activas para los dos catalizadores. b. ¿Existe alguna que indique que las concentraciones activas medias dependen del catalizador utilizado?
  • 19. VALORES CRÍTICOS DE LA DISTRIBUCIÓN t α ٧ 0.1 0.05 0.025 0.01 0.005 1 2 3 4 5 3.078 1.886 1.638 1.533 1.476 6.314 2.920 2.353 2.132 2.015 12.706 4.303 3.182 2.776 2.571 31.821 6.965 4.541 3.747 3.365 63.657 9.925 5.841 4.604 4.032 6 7 8 9 10 1.440 1.415 1.397 1.383 1.372 1.943 1.895 1.860 1.833 1.812 2.447 2.365 2.306 2.262 2.228 3.143 2.998 2.896 2.821 2.764 3.707 3.499 3.355 3.250 3.169 11 12 13 14 15 1.363 1.356 1.350 1.345 1.341 1.796 1.782 1.771 1.761 1.753 2.201 2.179 2.160 2.145 2.131 2.718 2.681 2.650 2.624 2.602 3.106 3.055 3.012 2.977 2.947