Planteamiento de hipotesis -f fisher

  • 12,728 views
Uploaded on

 

More in: Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
12,728
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
171
Comments
0
Likes
2

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 243840-728345<br />UNIVERSIDAD VERACRUZANA<br />FACULTAD DE ADMINISTRACIÓN<br />Estadística Inferencial<br />TEMA<br />Planteamiento de Hipótesis en más de dos Poblaciones<br />EQUIPO: Restaurantes 2<br />Aguilar Hernández Leticia<br />Avila Ortega Gabriela<br />Barcelata Beltrán Ana María<br />Domínguez Rivera Laura María<br />Durán Fabián Luis Selin<br />García Velázquez Anahí<br />González Cabañas Lizeth<br />Pacheco Betancourt Adriana Nohemi<br />PROGRAMA EDUCATIVO: Lic. Admón. Turística<br />Veracruz, Ver., a 10 de mayo del 2010<br />PLANTEAMIENTO DE HIPÓTESIS EN MÁS DE DOS POBLACIONES<br />Algunas veces se consideran problemas en que debemos decidir si las diferencias observadas entre más de dos medias se pueden atribuir al azar o si existen diferencias reales entre las medias de las poblaciones de las que se obtuvieron las muestras.<br />Y esto se estudia cuando por ejemplo lo que queremos conocer sobre la base de datos muestrales, si en realidad existe alguna diferencia:<br />en la efectividad de 3 métodos de enseñanza de una lengua extranjera, o quizás<br />queremos comparar la producción promedio por caballería de distintas variedades de arroz.<br />Un investigador agrícola pudiera estar interesado en saber que tipo de fertilizante da mejores rendimientos,<br />ó sí en determinado laboratorio médico se desea evaluar el efecto de diferentes medicamentos en la presión sanguínea.<br />El método que utilizamos para este propósito es un instrumento estadístico poderoso conocido como ANALISIS DE VARIANZA.<br />GLOSARIO<br />CONCEPTODEFINICIONTRADUCCIONANOVAanálisis de varianza (instrumento estadístico)ANALYSIS OF VARIANCE (statistical toolHIPOTESIS ESTADISTICAes una asunción relativa a una o varias poblaciones, que puede ser cierta o noIs an assumption on one or more populations that may be true or not.IDENTIDAD FUNDAMENTALdescomposición de la varianza totaltotal variance decompositionGAUSSIANAEn estadística y probabilidad se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos realesIn statistics and probability is called the normal distribution, Gaussian distribution or Gaussian distribution, one of the probability distributions of continuous variable that most often appears in real phenomenaINSESGADO.Se denomina sesgo de un estimador a la diferencia entre la esperanza (o valor esperado) del estimador y el verdadero valor del parámetro a estimar. Es deseable que un estimador sea insesgado o centrado, es decir, que su sesgo sea nulo por ser su esperanza igual al parámetro que se desea estimar.It's called bias of an estimator to the difference between the expectation (or expected value) of the estimator and the true value of the parameter to be estimated. It is desirable that an estimator is unbiased and focused, ie, its bias is zero hope for being equal to the parameter to be estimated.GRADOS DE LIBERTADes un estimador del número de categorías independientes en una prueba particular o experimento estadístico.Is an estimate of the number of independent categories in a particular test or experiment statistics.<br />FORMULARIO<br />PRUEBA DE HIPÓTESIS PARA MAS DE DOS POBLACIONES F DE FISHERC a s oE s t a d í s t it c oanálisis de varianza Calculo de hipótesisestimador insesgado de 2(varianza dentro del grupo)Varianza entre grupos.estimadores de las varianzas poblacionales conceptualesSCT =SCE = SCD = SCT - SCEVariabilidad entre las varianzas muestrales Medias de cada grupoCalculo de las varianzas Calculo del estadístico de prueba M/CM = 1 + <br /> fUENTE DE vARIACIÓNsUMA DE cUADRADOSgRADOS DE lIBERTADcUADRADO mEDIO eSTADÍSTICOeNTRE gRUPO k – 1 F0 = n – k dENTRO DE gRUPOtOTAL N - 1<br />INTRODUCCION<br />Una hipótesis estadística es una asunción relativa a una o varias poblaciones, que puede ser cierta o no. Las hipótesis estadísticas se pueden contrastar con la información extraída de las muestras y tanto si se aceptan como si se rechazan se puede cometer un error. <br />La hipótesis formulada con intención de rechazarla se llama hipótesis nula y se representa por H0. Rechazar H0 implica aceptar una hipótesis alternativa (H1). Fisher realizó muchos avances en la estadística, siendo una de sus más importantes contribuciones, la inferencia estadística creada por él en 1920.<br />Student y Ronald Fisher iniciaron una nueva era en el estudio de las distribuciones muestrales. Ronald Aylmer Fisher encontró en muestras procedentes de una población normal, la distribución del coeficiente de correlación, los coeficientes de regresión, los coeficientes de correlación múltiple y de proporción de variables conocida por el nombre de F.<br />Esta distribución de probabilidad se usa como estadística prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos.<br />Características de la distribución F<br /> <br />Existe una " familia" de distribuciones F. Un miembro específico de la familia se determina por dos parámetros: los grados de libertad en el numerador y en el denominador . Existe una distribución F para la combinación de 29 grados de libertad en el numerador y 28 grados en el denominador. Existe otra distribución F para 19 grados en el numerador y 6 en el denominador.<br /> La distribución F es una distribución continua.<br /> F no puede ser negativa<br />La distribución F tiene un sesgo positivo<br />A medida que aumentan los valores, la curva se aproxima al eje x, pero nunca lo toca<br /> En este trabajo se abordara el tema de F Fisher esperando así cumplir con las expectativas requeridas.asi también se presentaran de manera simultánea las formulas utilizadas, las tablas a utilizar, con el fin de hacer más fácil el entendimiento del tema planteado.<br />ANÁLISIS DE VARIANZA<br />El análisis de varianza, como técnica de lo que trata es: si se está estudiando la característica cuyos valores dependen de varias clases de efectos que operan simultáneamente, poder decidir si tales efectos son debido al azar o si realmente son diferentes.<br />Esta técnica de lo que trata es de expresar una medida de la variación total de un conjunto de datos como una suma de términos, que se pueden atribuir a fuentes o causas específicas de variación; pues bien esta descomposición de la varianza total se denomina: Identidad fundamental. Ella junto a la formación del estadístico de prueba, se refleja en una tabla llamada “Tabla de Análisis de Varianza”, que resume los principales aspectos teóricos prácticos de la técnica.<br />Hay un corolario que plantea que:<br />Si “k” poblaciones se unen y las varianzas de las “k” poblaciones son iguales a 2 se tiene que:<br />Por lo tanto si todas las medias son iguales entonces:<br />, mientras que si alguna es diferente, se puede concluir que <br />De modo que una comparación de varianza puede conducir a una conclusión sobre la igualdad de medias poblacionales.<br />El método que se utiliza es a través de los estimadores de 2.<br />Hay un Teorema que plantea que:<br />Si dos o más muestras proceden de una misma población o de diferentes poblaciones, pero con igual varianza, entonces un estimador insesgado de 2 podrá obtenerse a través de la siguiente expresión:<br /> <br />A esta varianza se le da el nombre de Varianza dentro del grupo.<br />Sería bueno comentar que esta varianza como es insesgada proporciona una estimación válida de la varianza desconocida de la población sin importarle si se acepta o rechaza H0.<br />Hay otro Teorema, bajo las mismas condiciones que el anterior que plantea que otro estimador de 2 es:<br />Este estimador es conocido como varianza entre grupos.<br />Esta situación que expresan estos estimadores se pudiera representar gráficamente de la siguiente forma:<br />Para H0 cierta: Para H0 falsa:<br /> 1 ________ 1 <br /> <br /> <br /> <br /> <br /> <br /> <br /> <br /> 3 2 3 <br /> 2<br /> 1 2 3 1 2 3<br />En este caso las i no son iguales pero los elementos de las 3 poblaciones si casi iguales sus valores están cercanos son muy diferentes y originan medias muestrales muy diferentes. <br />Si estamos en caso de H0 falsa, y se nos presenta esta situación se diferencia en la suma de cuadrado entre grupo esta diferencia, mientras que si estamos en el caso de H0 cierta la diferencia entre los grupos es mínima.<br />En el caso de la SC, dentro de los grupos lo que hace es comparar cada elemento de la muestra con la media de su propio grupo, para una u otra conclusión de la hipótesis nula, su cálculo no se refleja, el valor es el mismo.<br />Como ya dijimos, el análisis de varianza consiste en dividir la suma de cuadrado total en dos fuentes de variación y proceder al análisis de las mismas, estas son la variación dentro del grupo y la variación entre grupos. Como son variaciones la vamos a expresar como sumas de cuadrados, es decir:<br />SCT = SCD + SCE <br /> __ __ __ __<br />(Yij - Y) = (Yij - Yi) + (Yi – Y) <br />Representando estas la variación total que es igual a la variación dentro del grupo más la variación entre grupos, gráficamente se representa de la siguiente forma:<br /> <br /> _ .<br /> yij - yi .<br /> . _<br /> _ . yij -y<br /> y1 .<br /> _ _ .<br /> yi - y . _<br /> Y<br /> .<br /> _ .<br /> y2 .<br />Si elevamos al cuadrado ambos miembros, y sumamos por “j” e “i”, llegamos a la Identidad Fundamental, planteada anteriormente.<br /> donde se considera:<br />Suma de Suma de Suma de<br />Cuadrado Cuadrado Cuadrado<br /> Total Dentro del Grupo Entre Grupo<br />De la misma forma resulta de gran importancia en el Análisis de varianza, la relación entre los grados de libertad (que ya se habló de ellos en el Tema anterior).<br />Si se aplica el valor esperado en ambos miembros se obtienen, bajo el supuesto de H0 cierto de que, los grados de libertad asociados a estas sumas de cuadrados serán:<br /> (n – 1) = (n – k) + (k – 1) Esto es, <br />Para la SCT, = para la SCD y para la SCE<br />Si dividimos las Sumas de Cuadrados entre los grados de libertad, se obtendrán los estimadores de 2 planteados, es decir la varianza total la varianza dentro del grupo, y la varianza entre grupo . También estos cocientes se denominan Cuadrados Medios.<br />Debido a que el cálculo de varianzas entre y dentro de grupos hay varios pasos, se acostumbra a dar al grupo completo de resultados en una tabla conocida como tabla de análisis de varianza (ANOVA). Esta tabla incluye las fuentes de variación, las sumas de los cuadrados(es decir las variaciones), los grados de libertad, las varianzas(es decir los cuadrados medios) y el valor del estadístico de prueba que veremos más adelante.<br />ANOVA<br /> fUENTE DE vARIACIÓNsUMA DE cUADRADOSgRADOS DE lIBERTADcUADRADO mEDIO eSTADÍSTICOeNTRE gRUPO k – 1 F0 = n – k dENTRO DE gRUPOtOTAL N - 1<br />Aquí en este caso se utiliza como estadístico de prueba F0, ¿Por qué la Distribución F? . La distribución a utilizar es la F de Fisher, que se basa en la razón de 2 varianzas.<br />Con el fin de determinar si las medias de los diversos grupos son todas iguales, se pueden examinar dos estimadores diferentes de la varianza de la población. Uno de los estimadores se basa en la suma de los cuadrados dentro de los grupos (SCD); el otro se basa en la suma de los cuadrados entre los grupos (SCE). Si la hipótesis nula es cierta, estos estimadores deben ser aproximadamente iguales; si es falsa el estimador basado en la suma de los cuadrados entre grupos debe ser mayor.<br />El estimado de la varianza entre los grupos no solo toma en cuenta las fluctuaciones aleatorias de una observación a otra, sino también mide las diferencias de un grupo con otro. Si no hay diferencia de un grupo a otro, cualquier diferencia en la media muestral se explicará por la variación aleatoria, y la varianza entre grupos, debe estar cerca de la varianza dentro de los grupos. Sin embargo si en realidad hay una diferencia entre los grupos, la varianza entre grupos será significativamente mayor que la varianza dentro de los grupos.<br />Por todo lo anterior, la prueba estadística se basa en la razón de estas dos varianzas: CME/CMD. Si la hipótesis nula es cierta, esta razón debe estar cercana a uno; si la hipótesis nula es falsa entonces el numerador debe ser mayor que el denominador y la razón debe ser mayor que uno<br />Como se aprecia el problema se reduce a buscar un valor a partir del cuál el estadístico de prueba resulte significativamente mayor que 1, y así se rechazará la hipótesis de que no hay diferencias entre las medias de los grupos cuando la razón entre las varianzas CME/CMD F k – 1;n – k)<br />De aquí se infiere que las hipótesis nula y alternativa que se plantearán serán las siguientes:<br />H0: 1 = 2 = . . . = k<br />H1: alguna i diferente<br />Es bueno señalar que estas hipótesis son equivalentes a decir:<br /> <br />Ya que como se vio anteriormente es un estimador sesgado de la VARIANZA y sólo será insesgado si se cumple que H0 es cierta, mientras que es un estimador insesgado.<br />Además es la razón por la cuál la distribución a utilizar es la F de Fisher, que no es más que la relación entre 2 varianzas y siempre considerando, la región crítica hacia la derecha, ya que nuestro problema se reduce a buscar un valor a partir del cuál es estadístico de prueba resulte significativamente mayor que 1 y así Rechazaremos H0 a un nivel de significación, si <br />Antes de continuar queremos plantear que las fórmulas de cálculo de los estimadores de las varianzas poblacionales conceptuales o por definición son muy tediosas, sin embargo hay para estos estimadores unas fórmulas de cálculos abreviadas que son más fáciles.<br />SCT =<br />SCE = <br />SCD = <br />Aunque se debe señalar que dado el carácter aditivo de estas varianzas, se acostumbra a obtener la SCD por diferencia, es decir como:<br />SCT = SCE + SCD se obtendría despejando: SCD = SCT - SCE<br />Para aplicar esta técnica es necesario que se cumplan ciertas suposiciones sobre los datos investigados.<br />1.- Las características medibles se distribuyen normalmente en cada población. Esto es <br />2.- Las varianzas de las k poblaciones son iguales: <br />3.- Las características medibles son estadísticamente independientes, de una población a otra: Y1, Y2, ... , Yk.<br />4.- Las muestras n1, n2, ... ,nk de los k grupos poblacionales deben seleccionarse a través del M.A.S.<br />Vamos a ver un Ejemplo:<br />Los datos siguientes corresponden al Costo de Producción de un producto fabricado bajo tecnologías diferentes. Realice una prueba estadística a un = 0.05 para decidir si existen diferencias entre las tecnologías, que puedan afectar los Costos.<br />Tecnología Yi jniTiTi2Ti2/ni Y2i j A7 4 6 4 9 5 30 900 18049 16 36 16 81 198 B2 4 5 6 3 5 20 400 80 4 16 25 36 9 90 C7 8 7 11 7 5 401600 32049 64 49 121 49 33215 90 580 620<br />Hay que tener en cuenta que el subíndice i, representa las filas, y el j las columnas.<br /> Se prepara la tabla atendiendo a lo que se necesita a partir de las formulas abreviadas planteadas, únicamente hay que tener en cuenta que los niveles se deben planteara en el sentido de fila.<br />Resumiendo: n = 15; T = 90; k = 3; n1 = n2 = n3 = 5<br />Luego:<br /> = 620 – 902/15 = 620 – 8100/15 = 620 – 540 = 80<br />SCE = = 580 – 540 = 40<br />SCD = = 620 – 580 = 40 o también utilizando la identidad fundamental y en ella se despeja SCD, esto es:<br />SCT = SCD + SCE SCD = SCT – SCE = 80 – 40 = 40<br />Y ya estamos en condiciones de plantear la tabla de análisis de varianza, para el cálculo del estadístico de Prueba.<br /> ANOVA<br />Fuente de VariaciónSuma de CuadradoGrados de LibertadCuadrado medioEstadístico de PruebaEntre grupoDentro grupo 40 40 2 12 20 3.33Total 80 14<br />H0: <br />H1: alguna i diferente<br />= 0.05<br /> = 6.06<br />W: F1-(k – 1; n – k) = Fo.95(2, 12) = 3.89 <br /> RR<br /> 3.89<br />R:D:/ Rechazo H0 F0 3.89<br /> No Rechazo H0 F0 3.89<br />D/ F0 = 6.06 3.89 Rechazo H0 que aceptamos H1 lo que nos indica que existen diferencias significativas entre los costos de producción para por lo menos una tecnología a un = 0.05<br />Si quisiéramos saber cual o cuales tecnologías son diferentes se pudiera completar el análisis con una prueba T’Student de diferencia de media, probando dos a dos dichas tecnologías. <br />Esta prueba de la homogeneidad de las varianzas fue desarrollada por Barttlet, y se basa en el cálculo de un cociente, el cuál se denota por M/C.<br />se utiliza para comprobar uno de los supuestos del análisis de varianza, si se quiere, el más importante, que es el de varianza constante(conocido por Homocedasticidad)<br />Así las hipótesis a plantear serían:<br />H0: <br />H1: alguna diferente<br />Y el estadístico de prueba será el cociente M/C que es un estadístico que mide la variabilidad entre las varianzas muestrales ya que:<br /> Donde<br /> y <br />Se puede observar que si las difieren poco entre sí el valor de M, será pequeño y si suponemos que la son iguales, entonces M tomará el valor cero.<br />Demostración:<br /> si son iguales, entonces se trata como una constante y se saca fuera de la sumatoria.<br />Como <br />M=(n – k) <br />M= (n- k) ln - (ln ) n- k<br />M = 0<br />Veamos el cálculo del estadístico de Prueba: M/C<br />M = 1 + <br />Barttlet demostró que el estadístico M sigue aproximadamente una distribución 2, con k-1 grados de libertad para (ni – 1) 4, y se divide entre una cantidad C, como la planteada anteriormente; el cociente mejora la aproximación, y es más preciso que si utilizáramos solamente M.<br />La expresión de M, puede transformarse para trabajar con logaritmos comunes.<br />M = 2.3026 se debe aclarar que se puede aplicar tanto logaritmo comunes como naturales.<br />La región crítica estará dada por:<br /> que gráficamente quedará representada de la siguiente forma:<br /> <br /> <br /> R no R. RR<br /> <br />A continuación vamos a comprobar este supuesto de varianza constantes o iguales en el ejemplo que se desarrollo en la conferencia anterior.<br />Comencemos calculando las varianzas: , para ello es necesario primeramente hallar las medias de cada grupo:<br />Ya que <br />Ya estamos en condiciones de plantear los elementos que hacen falta para determinar M<br />Población ni ln (ni – 1) ln 1 5 4.5 1.50408 6.01632 2 5 2.5 0.91629 3.66516 3 5 3 1.09861 4.39444 14.07592<br />ln = ln 3.33 = 1.20297<br />M = (n – k) ln -<br />M = 12(1.20297) – 14.07592<br /> = 14.43564 – 14.07592<br /> = 0.35972<br /> C=<br />M/C = 0.35972/1.11 = 0.323<br />Ya estamos en condiciones de plantear la prueba, ya que calculamos el estadístico de prueba.<br />H0: <br />H1: alguna diferente<br /> = 0.05<br />M/C 2(1-)k-1<br />W: M/C 2(1-)k-1 = M/C 5.99 <br />R:D:/ Rechazo H0 M/C 5.99<br /> No Rechazo H0 M/C 5.99<br />D/ . M/C = 0.323 5.99 No Rechazo H0 : a un = 0.05<br />UTILIDAD<br />Esta distribución de probabilidad se usa en estadística como prueba en varias situaciones. Se emplea para probar si dos muestras provienen de poblaciones que poseen varianzas iguales. Esta prueba es útil para determinar si una población normal tiene una mayor variación que la otra y también se aplica cuando se trata de comparar simultáneamente varias medias poblacionales. La comparación simultánea de varias medias poblacionales se conoce como análisis de varianza (ANOVA). En ambas situaciones, las poblaciones deben ser normales y los datos tener al menos la escala de intervalos.<br />TABLA DE DISTRIBUCIÓN F DE FISHER CON PROBABILIDAD DE 0.05<br /> 12345678910121520243040501161.45199.50215.71224.58230.16233.99236.77238.88240.54241.88243.90245.95248.02249.05250.10251.14251.77218.51319.00019.16419.24719.29619.32919.35319.37119.38519.39619.41219.42919.44619.45419.46319.47119.476310.1289.5529.2779.1179.0138.9418.8878.8458.8128.7858.7458.7038.6608.6388.6178.5948.58147.7096.9446.5916.3886.2566.1636.0946.0415.9995.9645.9125.8585.8035.7745.7465.7175.69956.6085.7865.4095.1925.0504.9504.8764.8184.7724.7354.6784.6194.5584.5274.4964.4644.44465.9875.1434.7574.5344.3874.2844.2074.1474.0994.0604.0003.9383.8743.8413.8083.7743.75475.5914.7374.3474.1203.9723.8663.7873.7263.6773.6373.5753.5113.4453.4103.3763.3403.31985.3184.4594.0663.8383.6883.5813.5003.4383.3883.3473.2843.2183.1503.1153.0793.0433.02095.1174.2563.8633.6333.4823.3743.2933.2303.1793.1373.0733.0062.9362.9002.8642.8262.803104.9654.1033.7083.4783.3263.2173.1353.0723.0202.9782.9132.8452.7742.7372.7002.6612.637114.8443.9823.5873.3573.2043.0953.0122.9482.8962.8542.7882.7192.6462.6092.5702.5312.507124.7473.8853.4903.2593.1062.9962.9132.8492.7962.7532.6872.6172.5442.5052.4662.4262.401134.6673.8063.4113.1793.0252.9152.8322.7672.7142.6712.6042.5332.4592.4202.3802.3392.314144.6003.7393.3443.1122.9582.8482.7642.6992.6462.6022.5342.4632.3882.3492.3082.2662.241154.5433.6823.2873.0562.9012.7902.7072.6412.5882.5442.4752.4032.3282.2882.2472.2042.178164.4943.6343.2393.0072.8522.7412.6572.5912.5382.4942.4252.3522.2762.2352.1942.1512.124174.4513.5923.1972.9652.8102.6992.6142.5482.4942.4502.3812.3082.2302.1902.1482.1042.077184.4143.5553.1602.9282.7732.6612.5772.5102.4562.4122.3422.2692.1912.1502.1072.0632.035194.3813.5223.1272.8952.7402.6282.5442.4772.4232.3782.3082.2342.1552.1142.0712.0261.999204.3513.4933.0982.8662.7112.5992.5142.4472.3932.3482.2782.2032.1242.0822.0391.9941.966214.3253.4673.0722.8402.6852.5732.4882.4202.3662.3212.2502.1762.0962.0542.0101.9651.936224.3013.4433.0492.8172.6612.5492.4642.3972.3422.2972.2262.1512.0712.0281.9841.9381.909234.2793.4223.0282.7962.6402.5282.4422.3752.3202.2752.2042.1282.0482.0051.9611.9141.885244.2603.4033.0092.7762.6212.5082.4232.3552.3002.2552.1832.1082.0271.9841.9391.8921.863254.2423.3852.9912.7592.6032.4902.4052.3372.2822.2362.1652.0892.0071.9641.9191.8721.842264.2253.3692.9752.7432.5872.4742.3882.3212.2652.2202.1482.0721.9901.9461.9011.8531.823274.2103.3542.9602.7282.5722.4592.3732.3052.2502.2042.1322.0561.9741.9301.8841.8361.806284.1963.3402.9472.7142.5582.4452.3592.2912.2362.1902.1182.0411.9591.9151.8691.8201.790294.1833.3282.9342.7012.5452.4322.3462.2782.2232.1772.1042.0271.9451.9011.8541.8061.775304.1713.3162.9222.6902.5342.4212.3342.2662.2112.1652.0922.0151.9321.8871.8411.7921.761354.1213.2672.8742.6412.4852.3722.2852.2172.1612.1142.0411.9631.8781.8331.7861.7351.703404.0853.2322.8392.6062.4492.3362.2492.1802.1242.0772.0031.9241.8391.7931.7441.6931.660454.0573.2042.8122.5792.4222.3082.2212.1522.0962.0491.9741.8951.8081.7621.7131.6601.626504.0343.1832.7902.5572.4002.2862.1992.1302.0732.0261.9521.8711.7841.7371.6871.6341.599604.0013.1502.7582.5252.3682.2542.1672.0972.0401.9931.9171.8361.7481.7001.6491.5941.559703.9783.1282.7362.5032.3462.2312.1432.0742.0171.9691.8931.8121.7221.6741.6221.5661.530803.9603.1112.7192.4862.3292.2142.1262.0561.9991.9511.8751.7931.7031.6541.6021.5451.508903.9473.0982.7062.4732.3162.2012.1132.0431.9861.9381.8611.7791.6881.6391.5861.5281.4911003.9363.0872.6962.4632.3052.1912.1032.0321.9751.9271.8501.7681.6761.6271.5731.5151.4771203.9203.0722.6802.4472.2902.1752.0872.0161.9591.9101.8341.7501.6591.6081.5541.4951.457<br />Ejemplos :<br />Encontrar el valor de F, en cada uno de los siguientes casos: <br />El área a la derecha de F, es de 0.25 con =4 y =9. <br />El área a la izquierda de F, es de 0.95 con =15 y =10. <br />El área a la derecha de F es de 0.95 con con =6 y =8. <br />El área a la izquierda de F, es de 0.10 con con =24 y <br />=24 <br />Solución:<br />Como el área que da la tabla es de cero a Fisher, se tiene que localizar primero los grados de libertad dos que son 9, luego un área de 0.75 con 4 grados de libertad uno. <br />En este caso se puede buscar el área de 0.95 directamente en la tabla con sus respectivos grados de libertad. <br />Se tiene que buscar en la tabla un área de 0.05, puesto que nos piden un área a la derecha de F de 0.95. <br />Se busca directamente el área de 0.10, con sus respectivos grados de libertad. <br />Si s12 y s22 son las varianzas muestrales de muestras aleatorias independientes de tamaños n1=10 y n2 =20, tomadas de poblaciones normales que tienen las mismas varianzas, encuentre P(s12/s22 2.42). <br />Solución:<br />Primero se establecen los grados de libertad. Como en el numerador está la población uno y en el denominador la población dos, entonces los grados de libertad uno equivalen a 10-1=9 y los grados de libertad dos a 20-1=19.<br />Se procede a ir a la tabla a buscar los grados de libertad dos que son 19 y se observa que no están, por lo tanto se tiene que interpolar entre 15 y 20 grados de libertad, buscando el valor de fisher que quedaría:<br />Este valor de 2.42 se busca en la columna de 9 grados de libertad uno, con 15 grados de libertad dos, y se encuentra los siguiente:<br />Area0.902.090.952.59<br />Al interpolar entre estos dos valores nos queda un área de 0.933.<br />Se procede a hacer lo mismo pero con 20 grados de libertad dos:<br />Area0.952.390.9752.84<br />Al interpolar entre estos dos valores nos queda un área de 0.9516.<br />Ahora ya se tienen las dos áreas referentes a los grados de libertad dos, por lo que se interpolará para ver cuánto le corresponde a los grados libertad dos con un valor de 19.<br />Area150.933200.9516<br />Al interpolar nos queda que para 9 grados de libertad uno y 19 grados de libertad dos con un valor de Fisher de 2.42 el área a la izquierda es de 0.9478.<br />Si s12 y s22 representan las varianzas de las muestras aleatorias independientes de tamaño n1= 25 y n2 = 31, tomadas de poblaciones normales con varianzas 12 =10 y <br />22 = 15, respectivamente, encuentre P(s12/s22 > 1.26). <br />Solución:<br />Calcular el valor de Fisher:<br />Luego se va a la tabla de Fisher a buscar 30 grados de libertad 2 con 24 grados de libertad uno. Cuando se este en esta posición se busca adentro de la tabla el valor de Fisher de 1.89. Al localizarlo y ver a la izquierda de este valor se obtiene un área de 0.95, pero esta área correspondería a la probabilidad de que las relaciones de varianzas muestrales fueran menor a 1.26, por lo que se calcula su complemento que sería 0.05, siendo esta la probabilidad de que s12/s22 > 1.26.<br />Intervalo de Confianza para el Cociente de Varianzas de Dos Distribuciones Normales <br />Supóngase que se tienen dos poblaciones normales e independientes con varianzas desconocidas 2 y 22, respectivamente. De este par de poblaciones, se tienen disponibles dos muestras aleatorias de tamaños n1 y n2, respectivamente, sean s12 y s22 las dos varianzas muestrales. Se desea conocer un intervalo de confianza del 100() por ciento para el cociente de las dos varianzas, 12/22.<br />Para construir el intervalo de confianza para el cociente de dos varianzas poblacionales, se coloca la varianza muestral mayor en el numerador del estadístico F.<br />Ejemplos:<br />Un fabricante de automóviles pone a prueba dos nuevos métodos de ensamblaje de motores respecto al tiempo en minutos. Los resultados se muestran en la tabla: <br />Método 1Método 2n1 = 31n2 = 25s12 = 50s22 = 24<br />Construya un intervalo de confianza del 90% para 12/22.<br />Solución:<br />Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la siguiente fórmula:<br />al despejar:.<br />F toma dos valores dependiendo del nivel de confianza y de los grados de libertad. En este caso los grados de libertad uno valen 30 y los grados de libertad dos 24. <br />y <br />Estos resultados los podemos interpretar de la siguiente manera:<br />Con un nivel de confianza del 90% se sabe que la relación de varianzas 12/22 esta entre 1.07 y 3.93. Esto supondría que la varianza de la población 1 es mayor a la varianza de la población 2 entre 1.07 y 3.93.<br />Una compañía fabrica propulsores para uso en motores de turbina. Al ingeniero de manufactura le gustaría seleccionar el proceso que tenga la menor variabilidad en la rugosidad de la superficie. Para ello toma una muestra de n1=16 partes del primer proceso, la cual tiene una desviación estándar s1 = 4.7 micropulgadas, y una muestra aleatoria de n2=12 partes del segundo proceso, la cual tiene una desviación estándar s2 = 5.1 micropulgadas. Se desea encontrar un intervalo de confianza del 90% para el cociente de las dos varianzas 12/22. Suponga que los dos procesos son independientes y que la rugosidad de la superficie está distribuida de manera normal. <br />Solución:<br />Por la recomendación de que la varianza muestral mayor va en el numerador se tiene la siguiente fórmula:<br />al despejar:.<br />En este caso los grados de libertad uno valen 11 y los grados de libertad dos 15. <br />y <br />Estos resultados los podemos interpretar de la siguiente manera:<br />Puesto que este intervalo de confianza incluye a la unidad, no es posible afirmar que las<br /> desviaciones estándar de la rugosidad de la superficie de los dos procesos sean diferentes con un nivel de confianza del 90%.<br />PROBLEMAS PROPUESTOS DE LA DISTRIBUCIÓN F<br /> <br /> <br />Si tomamos dos muestras independientes de tamaño n1=6 y n2= 10 de dos poblaciones normales con la misma varianza poblacional, encuentre un número b tal que: <br />P ( <br /> <br />  Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 61 y n2=31 de poblaciones normales con 21 = 12 y 22 = 18, determine la probabilidad<br />P ( )<br /> <br />  Obtenga o calcule las siguientes cantidades.<br />a) F.05, 5,8 b) F.05, 8, 5 c) F.95, 8, 5<br /> <br />    P (F 6.16) para 1 = 6, 2 = 4<br /> <br />    P ( 1.77 F 4.74 ) para 1 = 10, 2 = 5<br /> <br />     Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 25 y n2=25 de poblaciones normales con 21 = 22 , determine la probabilidad<br />P ( )<br />      Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 8 y n2=12 de poblaciones normales con 21 = 22 , determine la probabilidad<br />P ( )<br />  Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 25 y n2=31 de poblaciones normales con 21 = 10 y 22 = 31 , determine la probabilidad<br />P ( )<br />   Si S²1 y S²2 son las varianzas de muestras aleatorias independientes de tamaño n1= 8 y n2=5 de poblaciones normales con 21 = 22 , determine la probabilidad<br />P ( )<br /> <br /> <br /> <br /> <br /> <br />  En una prueba sobre efectividad de dos tipos distintos de píldoras para dormir, A y B, se utilizarán dos grupos independientes de personas con insomnio. A un grupo de tamaño 40 se le administrará la píldora A y al otro grupo, de tamaño 60, se le administrará la B, registrándose el número de horas de sueño de cada individuo participante en el estudio. Si se supone que el número de horas de sueño de quienes usan cada tipo de píldora se distribuye normalmente con 21 = 22. Determine la probabilidad <br /> <br />P ( )<br />Lisa Monnin es directora de presupuesto en la empresa New Process Company, desea comparar los gastos diarios de transporte del equipo de ventas y del personal de cobranza. Recopiló la siguiente información muestral ( importe en dólares).<br />   Ventas ($)        131       135       146       165       136       142    Cobranza ($)    130       102       129       143       149       120       139 <br />Al nivel de significancia de 0,10, puede concluirse que los gastos medios diarios del equipo de ventas son mayores? cuál es el valor p?<br />De una población se toma una muestra de 40 observaciones. La media muestral es de 102 y la desviación estándar 5. De otra población se toma una muestra de 50 observaciones. La media mustral es ahora 99 y la desviación estándar es 6. Realice la siguiente prueba de hipótesis usando como nivel de significancia 0,04.<br />Ho: u1 = u2Ho: u1 ≠ u2<br />a) Es esta una prueba de una o de dos colas?<br />b ) Establezca la regla de decisión <br />c) Calcule el valor del estadístico de prueba  <br /> d) Cuál es su decisión respecto a la hipótesis nula?<br />e) Cuál es el valor p? <br />Una empresa que se dedica a hacer en cuestas se queja de que un agente realiza en promedio 53 encuestas por semana. Se ha introducido una forma más moderna de realizar las encuetas y la empresa quiere evaluar su efectividad. Los números de encuestas realizadas en una semana por una muestra aleatoria de agentes son:<br /> 53       57       50       55       58       54       60       52       59       62       60       60          51       59       56<br />En el nivel de significancia 0,05, puede concluirse que la cantidad media de entrevistas realizadas  por los agentes es superior a 53 por semana? Evalúe el valor p.<br /> <br />FUENTE<br />http://www.itch.edu.mx/academic/industrial/estadistica1/cap03c.html<br />http://es.wikipedia.org/wiki/Prueba_F_de_Fisher<br />http://www.itchihuahuaii.edu.mx/academico/CB/MEG/documentos/1.9.htm<br />http://dcb.fi-c.unam.mx/profesores/irene/Notas/tablas/Fisher.pdf<br />http://www.fec.uh.cu/estadisticam2/guia/Tema%20II%20PlanCEMII.doc<br />