Estimacion de parametros

2,195 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
2,195
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
20
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Estimacion de parametros

  1. 1. ESTIMACIÓN DE PARÁMETROS El estudio de poblaciones estadísticas supone en general el conocimiento de la función de probabilidad que gobierna el comportamiento aleatorio de la variable de interés. En muchos casos sabemos o presumimos conocer la familia distribucional de una población. Sabemos por ejemplo que la población es aproximadamente normal; pero desconocemos la media y la varianza poblacionales. Sabemos que la variable de interés es binomial pero desconocemos la probabilidad de éxito poblacional o el número de pruebas de Bernoulli. Sabemos que se trata de un proceso de Poisson pero desconocemos el número de eventos raros por intervalos. Presumimos que la variable es exponencial pero desconocemos el parámetro que precisa la distribución exponencial poblacional. Lógicamente en todas estas situaciones la función de probabilidad de la variable en estudio se concreta determinando los parámetros poblacionales correspondientes y para lograrlo se utilizan los denominados métodos de estimación de parámetros. La estimación de uno o varios parámetros poblacionales desconocidos es posible construyendo funciones de probabilidad de variables aleatorias muestrales, mas conocidos como estimadores muestrales. Dichos estimadores garantizaran un cálculo o una aproximación satisfactoria del parámetro poblacional desconocido siempre que cumplan propiedades de: insesgamiento o máxima simetría, varianza mínima o máxima concentración de los datos alrededor del parámetro estimado y máxima probabilidad. Estimación puntual Cuando en una población con familia distribucional conocida f(x, θ) queremos estimar el verdadero valor del parámetro poblacional θ utilizando como lente ˆ para determinarlo al estimador muestral θ ; procedemos a seleccionar una muestra de tamaño n de dicha población, calculamos a partir de ella un valor θ y
  2. 2. afirmamos entonces que θ = ± θ k es una estimación puntual de θ con un error, por exceso o defecto, de valor k. ˆ K depende en general de la variable aleatoria muestral θ y de su desviación σ θ ˆ . En los casos de muestras grandes, cuando los valores de la muestra corresponden a variables aleatorias estadísticamente independientes (iid) y por lo tanto se dan las condiciones del TLC, se tiene que: ˆ Maxk = α/2 σ θ = α/2σ/ θ Z ˆ n, n≥ 30 ˆ ¿Pero como escoger el estimador θ que mejor precisa el parámetro θ ? Hay dos métodos generales: el método de momentos y el método de máxima verosimilitud. Método de máxima verosimilitud El método de estimación de máxima verosimilitud permite, en el caso de un parámetro o n vector de parámetros poblacionales desconocidos, determinar el estimador o vector de estimadores que maximizan la función de probabilidad conjunta de una muestra de n v.a. seleccionadas de la población en estudio. Sea f(x, θ) la fdp de una población en la cual queremos determinar θ . Sea x1,x2,….,xn una muestra de v.a. iid seleccionadas de dicha población, a la función de probabilidad conjunta L( θ ) de las n v.a. de la muestra la llamaremos funcion de verosimilitud muestral, es decir: L ( θ )=L(x1,x2,….,xn; θ ) Pero como las v.a. son independientes tenemos: L( θ ) = f(x1, θ ) f(x2, θ )….f (xn, θ ). Es decir: L ( θ )= n ∏f(x , θ) i i= 1
  3. 3. Estimador de máxima verosimilitud -EMVˆ ˆ El EMV del parámetro θ es θ siempre que L( θ ) sea el valor de máxima probabilidad de la función de verosimilitud L es decir: ˆ ˆ θ es el EMV de θ si y solo si L( θ ) es máximo n f(x En la expresión L( θ )= ∏ i , θ) la función de verosimilitud varia con el i= 1 parámetro θ y para el proceso de optimización se considera que las x i son constantes luego de haber determinado la muestra aleatoria. Observe que como la función logaritmo natural es siempre creciente el EMV de L( θ ) también optimiza a Ln (L( θ )) y podemos definir: n n i= 1 i =1 f(x l( θ )=Ln (L( θ ))= Ln ( ∏ i , θ) )= ∑ln f(x i , θ) n y optimizar así: l′( θ ) = ∑ i =1 ˆ l′(θ) =0 f ′( xi , θ) ˆ = 0 . Si θ = θ maximiza a l( θ ) es claro que f( xi , θ) ′ˆ y l′(θ) <0. Ejemplo: Considere una población Bernoulli, calcule el EMV para la probabilidad de éxito poblacional p. Sabemos que f(x,p)=px(1-p)1-x, x=0,1. De esta manera n n i =1 i=1 x 1−x L (p)= ∏f(x i , p) =∏p i (1−p) i 1 L (p)= p ∑x (1−p)∑ −x i i Y empleando la funcion logaritmo natural se tiene que: l(p) =ln[L(p)] =( ∑ i )ln(p) +(n −∑ i )ln(1−p) x x ˆ Observe que l′(p) = 0 → p = 1 ˆ ∑x i y l′′(p) < 0 . n
  4. 4. n ˆ Y ademas que 0 ≤ ∑ xi ≤ n ↔ 0 ≤ p ≤ 1 . i =1 Así si ∑xi =0 entonces Y si ∑xi =n entonces Por lo tanto p = ˆ ∑xi n L(p)=(1-p)n que es máximo en p = 0 L(p)=pn que es máximo en p = 1 es el EMV para p Bernoulli Ejemplo: Considere una población Poisson y calcule el EMV para la tasa poblacional de sucesos raros λ Sabemos que f(x, λ) = e −λ λ x x! para x = 0,1,2,… n f(x L( λ )= ∏ i, h) 1 ∑xi n x e−nλ ⋅ λ L( λ ) = ∏e− λ λ i /x ! = i ∏xi! 1 x como ∏ i ! es constante l( λ ) = ln[L ( λ ) ] = −nλ + ( ∑ x )lnλ − lnc i ∑ xi ∑ xi l′( λ ) = −n + =0 entonces ˆ = λ es el EMV para λ Poisson λ n λ Observe que l′′( ˆ ) = − ∑ xi < 0 , ya que ∑xi >0 y λ > 0 . λ2 Ejemplo: Considere una función Pareto y calcule EMV para β si la fda es β α  F( x, α, β ) =1−  x  con 0 < α < x y 0 <β con α conocido y β desconocido. Primero f(x,β)= ∂ F ∂ x ya que F, la fda, es la función integral de f, la fdp. f(x,β) = αβ β x-(β+1) La función de verosimilitud es
  5. 5. ( ) n n β −(β + 1) L( β ) = ∏f x , β = ∏α ⋅ β ⋅x i i 1 1 − ( β +1)  nβ n  n L( β ) = α ⋅ β ⋅ ∏ x   i 1  Aplicando logaritmo natural, n l( β) = n ⋅ β ⋅ lnα + n ⋅ lnβ − (β + 1) ⋅ ∑ lnx i 1 n l′( β ) = n ⋅ ln( α ) + − ∑ lnx = 0 entonces i β n x ˆ β = n∑ln i 1  α   −1     es el EMV para β de Pareto Si α fuese desconocido se podría estimar como el mínimo muestral α =min (x1,x2,…,xn) ˆ 2 ′ˆ observe que l′(β ) =− ⋅(β )− <0 . n ˆ Ejercicios Hallar el EMV para a) λ si f(x,λ)=λ e-λx, x>0. b) α si f(x,α)=(α+1)xα, 0<x<1 calcule α si (x1=0.3, x2=0.5, x3=0.7, x4=0.62, x5=0.7,x6=0.3, x7=0.4, x8=0.55, x9=0.60,x10=0.65) c) Si una población es lognormal, halle EMV para μ si conoce σ 2. d) σ2 si conoce μ. e) μ y σ2 son desconocidos. Estimación Por Intervalos Estamos en una población conocida y desconocemos () ˆ E θ =θ pero queremos hallar un intervalo de valores que contenga a θ, además conocemos σ θ o ˆ
  6. 6. podemos estimarla con un error pequeño. Para ello seleccionaremos una muestra ˆ ˆ ˆ ˆ aleatoria (θ1,θ2 ,θ3 ,...θn ) . El Teorema Del Límite Central permite afirmar que Z= ˆ ˆ θ − E(θ ) σˆ → n( z,0,1) θ y podemos afirmar con un nivel α que P(-z α/2 <Z< z α/2 )=1-α Equivalentemente, ( ) < z  =1-α  α/2   ˆ ˆ θ −E θ P  - z α/2 <  σˆ θ  ˆ P ( E(θ ) −θ  <z α/2 σˆ θ )=1-α ˆ Pθ −θ <z σ ˆ  =1 −α  α 2 θ   ˆ Sustituyendo E ( θ )= θ , ˆ Al efectuar la estimación puntual θ = θ afirmamos con confianza al 1−α , que la diferencia absoluta entre el parámetro θ y el valor muestral z α 2 está θ acotada por σˆ θ θ− < θ z σˆ α 2 θ Denominado intervalo Z para θ, es decir, ( ) ˆ P θ − θ < z α 2 σ θ = 1 − α ⇒θ ˆ  Є θ ±z α  σ ˆ con θ  2 confianza 1-α. Intervalo para la proporción p en una población Binomial
  7. 7. Seleccionamos una muestra aleatoria conformada por (p 1, p2, p3,…,pn) donde las ˆ pi son v.a iid que cumplen E(pi)=p. Es claro que si p = x ˆ , E( p ) = p y n σ p = np(1−p ) , según el resultado previo de una población binomial se tendrá: ˆ Z= ˆ ˆ p − E( p ) σp ˆ → n( z,0,1) y que con un nivel de significación siempre que np y n(1-p) ≥ 10 α P(-z α 2 < Z < z α 2 ) = 1− α P(-z α 2 < ˆ p − E(p) σp ˆ < z α 2 ) = 1− α P( p - E(p) < z α 2σ P ) = 1 − α ˆ Como E(p ) = p afirmamos con probabilidad 1-α que ( ) ˆ p P p − <z α 2σ p = − 1 α ˆ K = α 2σ p z ˆ σp = ˆ es el error de estimación p(1− p ) es la desviación estándar de la distribución binomial n ˆ Al hacer la estimación puntual p =π afirmamos con confianza 1- α que. p − π < zα 2 O sea π (1 − π ) n
  8. 8.  π(1 − π)   con confianza 1- α ˆ P ( p − p < z α 2 σ p ) = 1 − α ⇒p ∈  π ± z α 2 ˆ   n   Intervalo para la media μ en una población normal Intervalos Z para la media μ Sea (x1, x2, x3,…,xn) una muestra aleatoria, o sea que las xi son i.i.d., esto es la fdp conjunta de la muestra es n ( 2 f(x1,x2,…,xn;μ)= ∏ n xi , μ, σ 1 ) Así el EMV de μ es X y también 2 E( X )=μ y σ 2 = σ x n Si en una muestra con n ≥ 30 preestablecemos un nivel de significación α podemos afirmar con probabilidad 1-α que: σ   P μ − X < z α 2  = 1− α n  Es decir que con probabilidad 1-α la diferencia absoluta máxima entre μ y x es, zα 2 σ o sea , si estimamos X = x afirmamos que n σ  σ    P μ − X < z α 2  = 1 − α ⇒ μ ∈  x ± z α/2  con confianza 1- α . n n   Si σ2 es desconocida se debe estimar mediante s2 calculado en la muestra particular así afirmamos que: s  s    P µ − X < z α 2  = 1− α ⇒ μ ∈  x ± z α/2  con confianza al 1− α n n  
  9. 9. X −μ se introduce variabilidad en el numerador con X y en el n Aunque en Z= S denominador con S este efecto se contrarresta con n grande. ¿Que pasa si σ2 es desconocida y n<30?, que ahora si aumenta la variabilidad y necesitamos una distribución acampanada con colas robustas que permitan mayor variabilidad, o sea, una distribución T. P(T>t α ,v )= α E(T)=0 V(T)= n n −2 n>2 X −μ se distribuye según Gosset como n Si la población es normal entonces T= S una t-student con n-1 grados de libertad. Observe que S se basa en el cálculo de x1 − x, x 2 − x,..., x n − x de forma que en el cálculo de ∑x i −x =0 sólo hay n-1 variables libremente determinadas. La n-ésima depende de ellas, a este número se le denomina grados de libertad v =n-1. Si de una población normal seleccionamos una muestra pequeña n<30 y calculamos X = x y S=s preestableciendo un nivel de significación α podemos construir un intervalo T bilateral de confianza 1-α con v=n-1 grados de libertad para μ así:  s P X − μ < tα 2  = 1− α n− 1 n   ⇒ μ ∈ x ±t α 2,n −1 s ( n) con confianza 1-α
  10. 10. PROBLEMAS SELECCIONADOS 1. Ingenieros químicos de la Universidad de Murcia (España) realizaron una serie de experimentos para determinar cuál es la membrana más efectiva para usarse en un muestreador pasivo (Environmental science & Technology, Vol.27, 1993). La efectividad de un muestreador pasivo se midió en términos de la tasa de muestreo, registrada en centímetros cúbicos por minuto. En un experimento se colocaron seis muestreadotes pasivos con sus caras paralelas al flujo del aire, el cual tuvo una velocidad de 90 centímetros por segundo. Después de seis horas se determinó la tasa de muestreo de cada muetreador. Con base en los resultados, se calculó un intervalo de confianza al 95% de (49.66, 51.48) para la tasa de muestreo media. a. ¿Cuál es el coeficiente de confianza para este intervalo? b. Haga una interpretación teórica del coeficiente de confianza del inciso a. c. Haga una interpretación práctica del intervalo de confianza. d. ¿Qué supuestos son necesarios para que el intervalo produzca inferencias válidas? 2. La relación teórica entre flujo de calor y gradiente de temperatura para materiales homogéneos es bien conocida y se describe mediante una ecuación de Fourier. Sin embargo la relación no se cumple para materiales no homogéneos como cuerpos porosos o con capilares, sistemas celulares, suspensiones y pastas. Se efectuó un experimento para estimar el tiempo de relajación térmica medio (definido como el tiempo necesario para acumular la energía térmica que se requiera para una transferencia propagadora de calor) de varios materiales no homogéneos (Journal of Heat Transfer, agosto de 1990). Se determinó un intervalo de confianza al
  11. 11. 95% de 20.0 ± 6.4 segundos para el tiempo de relajación térmica medio de la arena. a. Haga una interpretación práctica del intervalo de confianza de 95 por ciento. b. Haga una interpretación teórica del intervalo de confianza de 95 por ciento. 3. Rocas inusuales en “Las Siete Islas” situadas en la parte baja del Río San Lorenzo en Canadá han estado atrayendo a los geólogos a ésta área durante más de un siglo. Hace poco se completó un importante reconocimiento geológico de “Las Siete Islas” con el propósito de crear un modelo tridimensional de gravedad del área (Canadian Journal of Earth Sciences, Vol. 27, 1990). Una de las claves para elaborar un modelo objetivo es obtener una estimación exacta de la densidad de las rocas. Con base en muestras de diversas variedades de rocas, se obtuvo la siguiente información sobre densidad de las rocas (en gramos por centímetro cúbico): Tipo de roca Gabbro tardío Gabbro masivo Cumberlandit a Tamaño de muestra 36 Densidad media 3.04 Desviación estándar 0.13 148 2.83 0.11 135 3.05 0.31 a. Para cada tipo de roca, estime la densidad media con un intervalo de confianza de 90 por ciento. b. Interprete los intervalos del inciso a. 4. En Environmental science & Technology (diciembre de 1985) se informó una evaluación de la química y el reciclaje de metales traza en un lago ácido de los Adirondack. Se tomaron 24 muestras de agua del Lago Darts, Nueva Cork, y se analizaron para determinar la concentración de particulados tanto de plomo como de aluminio.
  12. 12. a. Las mediciones de concentración de plomo tuvieron una media de 9.9nmol/l. Calcule un intervalo de confianza al 99% para la verdadera concentración media de plomo en las muestras de agua tomadas del Lago Darts. b. Las mediciones de concentración de aluminio tuvieron una media de 6.7nmol/l y una desviación estándar de 10.8nmol/l. Calcule un intervalo de confianza al 99% para la verdadera concentración media de aluminio en las muestras de agua tomadas del Lago Darts. c. ¿Qué supuestos son necesarios para que los intervalos de los incisos a y b sean válidos? 5. Según un estudio, “la mayoría de las personas que mueren a causa del fuego y el humo en edificios divididos en compartimentos resistentes a los incendios –el tipo que se utiliza para hoteles, moteles, apartamentos e instalaciones de salubridad- mueren al intentar evacuar” (Risk Management, febrero de 1986). Los datos que siguen representan los números de víctimas que intentaron evacuar, para una muestra de 14 incendios recientes en edificios resistentes al fuego, divididos en compartimentos, informados en el estudio. Incendio Las Vegas Hilton (Las Vegas) Inn on the Park (Toronto) Westchase Hilton (Houston) Holiday Inn (Cambridge, Ohio) Conrad Hilton (Chicago) Providence College (Providence) Baptist Towers (Atlanta) Howard Johnson (New Orleans) Cornell University (Ithaca, New York) Wesport Central Apartments (Kansa City, Missouri) Orrington Hotel (Evanston, Illinois) Hartford Hospital (Hartford, Connecticut) Milford Plaza (New York) Murieron en intento de evacuación 5 5 8 10 4 8 7 5 9 4 0 16 0
  13. 13. MGM Grand (Las Vegas) 36 a. Exprese el supuesto, en términos del problema, que se requiere para que una técnica de intervalo de confianza de muestra pequeña sea válido. b. Utilice la información de listado MINITAB que e representa aquí para construir un intervalo de confianza de 98% para ekl verdadero número medio de víctimas por incendio que mueren al tratar de evacuar edificios resistentes al fuego divididos en compartimentos. c. Interprete el intervalo construido en el inciso b. numdied N 14 MEAN 8.36 STDEV 8.94 SE MEAN 2.39 98.0 PERCENT C.I. (2.02, 14.69 6. El Journal of the American Association (21 de abril de 1993) informó de los resultados de una encuesta de entrevistas sobre salud a nivel nacional en EE.UU. diseñada para determinar la frecuencia del hábito de fumar entre adultos de este país. Mas de 40.000 adultos respondieron a preguntas como: “¿Ha fimado por lo menos 100 cigarrillos en su vida?” y “¿Fuma cigarrillos ahora?” A los fumadores actuales (mas de 11.000 adultos en la encuesta) también se les preguntó:”En PROMEDIO, ¿Cuántos cigarrillos fuma al día?”, Los resultados arrojan una media de 20.0 cigarrillos por día con un intervalo de confianza de 95% de (19.7, 20.3). a. Interprete el intervalo de confianza de 95%. b. Exprese cualquier supuesto sobre la población objetivo de fumadores actuales de cigarrillos que deben satisfacerse para que las inferencias derivadas del intervalo sean válidas. c. Un investigador de la industria tabacalera asegura que el número medio de cigarrillos fumados al día por fumadores consuetudinarios de cigarrillos es menor de 15. Comente esta aseveración. 7. Las avispas tropicales fundadoras de enjambres dependen, al igual que las hormigas y las abejas, de obreras para la cría de su prole. Resulta
  14. 14. interesante que las obreras de esta especie de avispas son en su mayor parte hembras, capaces de tener sus propios descendientes. En vez de hacerlo, crían la prole de otros miembros de la nidada. Una posible explicación de éste extraño comportamiento es la endogamia, lo que incrementa el grado de parentesco entre las avispas y permite a las obreras distinguir y ayudar a sus parientes más cercanas. A fin de probar esta teoría, se capturaron 197 avispas fundadoras de enjambres en Venezuela, se congelaron a -70ºC y luego se sometieron a una serie de pruebas genéticas (Science, noviembre de 1988). Los datos sirvieron para generar un coeficiente de endogamia, x para cada espécimen de avispa, con los siguientes resultados: x = 0.044 y s = 0.884 a. Construya un intervalo de confianza de 90% para el coeficiente de endogamia medio de esta especie de avispa. b. Un coeficiente de cero implica que la avispa no tiene tendencia a la endogamia. Utilice el intervalo de confianza del inciso a para hacer una inferencia acerca de la tendencia de esta especie de avispa a la endogamia. 8. Los números de la tabla representan tiempo de CPU (en segundos) para la resolución de 52 problemas matemáticos polinómicos 0-1 aleatorios resueltos empleando un algoritmo híbrido. El listado SAS que se representa más adelante proporciona un diagrama de ramas y hojas y estadísticas descriptivas del conjunto de datos. Utilice esta información para estimar, con 95% de confianza, el tiempo de resolución medio del algoritmo híbrido. 0.045 0.136 0.088 0.361 0.182 0.179 0.182 0.136 0.130 0.194 0.049 1.055 0.336 0.242 8.788 0.036 0.118 0.070 0.091 0.145 0.209 0.079 0.136 0.258 1.639 0.579 0.394 0.333 3.985 0.600 4.170 0.258 1.894 1.070 0.912 1.267 0.209 0.554 0.670 0.291 0.227 3.046 0.379 0.506 0.412 0.567 0.445 0.258 0.888 0.327 0.064 0.045
  15. 15. Stem 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0 0 Leaf 8 1 0 2 9 0 2 1 1 6 1 5 0 9 1 3 6 6 6 6 7 9 0 0 0 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 4 4 4 4 4 9. Un fabricante produce anillos para los pistones de un motor de automóvil. Se sabe que el diámetro del anillo está distribuido aproximadamente de manera normal, y que tiene una desviación estándar σ = 0.001mm. Una muestra aleatoria de 15 anillos tiene un diámetro promedio de x = 74..036mm a. Construya un intervalo de confianza bilateral del 99% para el diámetro promedio del anillo b. Construya un límite inferior de confianza del 95% para el diámetro promedio del anillo c. Supóngase que se desea una confianza del 95% en que el error en la estimación de la duración promedio sea menor que 5 horas. ¿Qué tamaño de muestra debe utilizarse? d. Supóngase que se desea que el ancho total del intervalo de confianza bilateral sea de seis horas, con una confianza del 95%. ¿Qué tamaño de muestra debe emplearse para este fin? 2 3 7 35
  16. 16. 10. Se sabe que la duración, en horas de un foco de 75 watts tiene una distribución aproximadamente normal, con una desviación estándar de σ=25 horas. Se toma una muestra aleatoria de 20 focos, la cual resulta tener una duración promedio de x = 1014 horas. 11. Un ingeniero civil analiza la resistencia a la compresión del concreto. La resistencia está distribuida aproximadamente normal, con una varianza σ2=1000(psi)2. Al tomar una muestra aleatoria de 12 especimenes, se tiene que x = 3250 psi. a. Construya un intervalo de confianza bilateral del 95% para la resistencia a la compresión promedio. b. Construya un intervalo de confianza bilateral del 99% para la resistencia a la compresión promedio. Compare el ancho de este intervalo de confianza con el ancho encontrado en el inciso a. c. Suponga que se desea estimar la resistencia a la compresión con un error menor que 15 psi para un nivel de confianza del 99%. ¿Qué tamaño de muestra debe emplearse para este fin? 12. Se utilizan dos máquinas para llenar botellas de plástico con detergente para máquinas lavaplatos. Se sabe que las desviaciones estándar del volumen de llenado son σ 1=0.10 onzas de líquido y σ 2=0.15 onzas de líquido para las dos máquinas, respectivamente. Se toman dos muestras aleatorias, n1=12 botellas de la máquina 1 y n 2=10 botellas de la máquina 2. Los volúmenes promedio de llenado son x1 = 30.87 onzas de líquido y x 2 = 30.68 onzas de líquido. a. Construya un intervalo de confianza bilateral del 90% para la diferencia entre las medias del volumen de llenado b. Construya un intervalo de confianza bilateral del 95% para la diferencia entre las medias del volumen de llenado. Compare el ancho de este intervalo el ancho encontrado en el inciso a.
  17. 17. c. Construya un intervalo de confianza superior del 95% para la diferencia entre las medias del volumen de llenado. 13. Se estudia la tasa de combustión de dos propelentes sólidos utilizados en los sistemas de escape de emergencia de los aeroplanos. Se sabe que la tasa de combustión de los dos propelentes tiene aproximadamente la misma desviación estándar; esto es, σ1 = σ 2 = 3cm/s. Se prueban dos muestras aleatorias de n1=20 y n2=20 especimenes; las medias muestrales de la tasa de combustión son x1 = 18cm/s y x 2 = 24cm/s . a. Construya un intervalo de confianza bilateral del 99% para la diferencia entre medias de la tasa de combustión. b. ¿Qué tamaño de muestra debe utilizarse en cada población si se desea que el error en la estimación de la diferencia entre las medias de las tasas de combustión sea menor que 4cm/s con una confianza del 99%? 14. Se prueban dos fórmulas diferentes de un combustible oxigenado para motor en cuanto al octanaje. La varianza del octanaje para la fórmula 1 es 2 σ1 = 1.5 . Mientras que para la formula 2 es σ 2 = 1.2 . Se prueban dos 2 muestras aleatorias de tamaño n1=15 y n2=20. Los octanajes promedio observados son x1 = 89.6 y x 2 = 92.5 . a. Construya un intervalo de confianza bilateral del 95% para la diferencia en el octanaje promedio. b. ¿Qué tamaño de muestra debe utilizarse en cada población si se desea tener una confianza del 95% de que el error al estimar la diferencia entre las medias de octanaje sea menor que uno? 15. Considere el intervalo de confianza para μ con desviación estándar σ conocida: x − zα1 σ / n ≤ µ ≤ x + zα1 σ / n
  18. 18. donde α1 + α 2 = α . Sea α=0.05. Encuentre el intervalo para α1 = α2 = α 2 = 0.025 . Ahora encuentre el intervalo para el caso donde α1 = 0.01 y α2 = 0.04 . ¿Qué intervalo es mas pequeño? ¿Existe alguna ventaja con respecto al intervalo de confianza “simétrico”? 16. En un proceso químico se fabrica cierto polímero. Normalmente, se hacen mediciones de viscosidad después de cada corrida, y la experiencia acumulada indica que la variabilidad en el proceso es muy estable, con σ=20. Las siguientes son 15 mediciones de viscosidad por corrida: 724, 718, 776, 760, 745, 759, 795, 756, 742, 740, 761, 749, 739, 747, 742. Encuentre un intervalo de confianza bilateral del 90% para la viscosidad promedio del polímero. 17. Se piensa que la concentración del ingrediente activo de un detergente líquido para ropa, es afectada por el tipo de catalizador utilizado en el proceso de fabricación. Se sabe que la desviación estándar de la concentración activa es de 3g/l, sin importar el tipo de catalizador utilizado. Se realizan 10 observaciones con cada catalizador, y se obtienen los datos siguientes: Catalizador 1: 57.9, 66.2, 65.4, 65.4, 65.2, 62.6, 67.6, 63.7, 67.2, 71.0 Catalizador 2: 66.4, 71.7, 70.3, 69.3, 64.8, 69.6, 68.6, 69.4, 65.3, 65.3 a. Encuentre un intervalo de confianza del 95% para la diferencia entre las medias de las concentraciones activas para los dos catalizadores. b. ¿Existe alguna que indique que las concentraciones activas medias dependen del catalizador utilizado?
  19. 19. VALORES CRÍTICOS DE LA DISTRIBUCIÓN t α ٧ 0.1 0.05 0.025 0.01 0.005 1 2 3 4 5 3.078 1.886 1.638 1.533 1.476 6.314 2.920 2.353 2.132 2.015 12.706 4.303 3.182 2.776 2.571 31.821 6.965 4.541 3.747 3.365 63.657 9.925 5.841 4.604 4.032 6 7 8 9 10 1.440 1.415 1.397 1.383 1.372 1.943 1.895 1.860 1.833 1.812 2.447 2.365 2.306 2.262 2.228 3.143 2.998 2.896 2.821 2.764 3.707 3.499 3.355 3.250 3.169 11 12 13 14 15 1.363 1.356 1.350 1.345 1.341 1.796 1.782 1.771 1.761 1.753 2.201 2.179 2.160 2.145 2.131 2.718 2.681 2.650 2.624 2.602 3.106 3.055 3.012 2.977 2.947
  20. 20. 16 17 18 19 20 1.337 1.333 1.330 1.328 1.325 1.746 1.740 1.734 1.729 1.725 2.120 2.110 2.101 2.093 2.086 2.583 2.567 2.552 2.539 2.528 2.921 2.898 2.878 2.861 2.845 21 22 23 24 25 1.323 1.321 1.319 1.318 1.316 1.721 1.717 1.714 1.711 1.708 2.080 2.074 2.069 2.064 2.060 2.518 2.508 2.500 2.492 2.485 2.831 2.819 2.807 2.797 2.787 26 27 28 29 inf. 1.315 1.314 1.313 1.311 1.282 1.706 1.703 1.701 1.699 1.645 2.056 2.052 2.048 2.045 1.960 2.479 2.473 2.467 2.462 2.326 2.779 2.771 2.763 2.756 2.576

×