Your SlideShare is downloading. ×
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Anova
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Anova

2,312

Published on

0 Comments
4 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
2,312
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
110
Comments
0
Likes
4
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Análisis de varianza 12 12-1 Panorama general 12-2 ANOVA de un factor 12-3 ANOVA de dos factores
  • 2. O PROBLEMA DEL CAPÍTULO UL DEL 12 A PR OBLEM C A PÍT ¿Tratamientos diferentes afectan los pesos de álamos? El conjunto de datos 7 del apéndice B incluye los pesos (en kilogramos) de álamos que recibieron distintos tratamientos en terrenos diferentes. Sólo consideraremos los pesos del año 1 en el terreno 1, el cual tiene un suelo fértil y húmedo, y se localiza cerca de un arroyo. Los pesos que consideraremos se resumen en la tabla 12-1. Con la intención de explorar los datos para investigar el centro, la variación, la distribución, los valores extremos y los patrones de cambio a través del tiempo (CVDVT), comenzamos calculando los estadísticos muestrales que aparecen en la parte inferior de la tabla 12-1. Al examinar las medias muestrales, vemos que parecen variar mucho, desde 0.164 kg hasta 1.334 kg. Además, las desviaciones estándar de las muestras varían considerablemente, desde 0.126 kg hasta 0.859 kg. Es difícil analizar las distribuciones porque cada muestra consiste únicamente en 5 valores, pero las gráficas cuantilares normales sugieren que tres de las muestras provienen de poblaciones con distribuciones aproximadamente normales. Sin embargo, el análisis de los pesos de los álamos que recibieron tratamiento con fertilizantes sugiere que el peso de 1.34 kg es un valor extremo cuando se compara con los otros pesos de los árboles fertilizados. Con la presencia de un solo valor extremo, procederemos bajo el supuesto de que las muestras provienen de poblaciones con distribuciones aproximadamente normales. Podríamos realizar análisis adicionales posteriormente para determinar si el peso de 1.34 kg tiene un fuerte efecto en los resultados. (Véase el ejercicio 5 en la sección 12-2). Parece que las diferencias entre las medias muestrales indican que las muestras provienen de poblaciones con medias diferentes, pero en vez de considerar únicamente las medias muestrales, también debemos considerar las cantidades de variación, los tamaños muestrales y la naturaleza de la distribución de las medias muestrales. Una forma de tomar en cuenta todos estos factores importantes consiste en realizar una prueba formal de hipótesis que los incluya de manera automática. En el presente capítulo se estudiará una prueba de este tipo, y la usaremos para determinar si existe evidencia suficiente para concluir que las medias no son iguales. Entonces sabremos si los distintos tratamientos tienen algún efecto. Pesos (en kg) de álamos Tabla 12-1 Tratamiento Ninguno Riego Fertilizante y riego 0.15 0.02 0.16 0.37 0.22 n x s Fertilizante 1.34 0.14 0.02 0.08 0.08 0.23 0.04 0.34 0.16 0.05 2.03 0.27 0.92 1.07 2.38 5 0.184 0.127 5 0.332 0.565 5 0.164 0.126 5 1.334 0.859
  • 3. 636 Capítulo 12 Análisis de varianza 12-1 Panorama general En la sección 12-2 explicamos un método importante para probar la igualdad de tres o más medias poblacionales. En la sección 9-3 estudiamos procedimientos para probar la hipótesis de que dos medias poblacionales son iguales, pero los métodos de esa sección no pueden aplicarse cuando se incluyen tres o más medias. En vez de referirnos al objetivo principal de probar medias iguales, el término análisis de varianza se refiere al método que empleamos, el cual está basado en un análisis de varianzas muestrales. Definición El análisis de varianza (ANOVA) es un método de prueba de igualdad de tres o más medias poblacionales, por medio del análisis de las varianzas muestrales. ¿Por qué no probar sencillamente dos muestras al mismo tiempo? ¿Por qué necesitamos un nuevo procedimiento, cuando podemos probar la igualdad de dos medias utilizando los métodos presentados en el capítulo 9? Por ejemplo, si deseamos utilizar los datos muestrales de la tabla 12-1 para probar la aseveración de que las tres poblaciones tienen la misma media, ¿por qué no simplemente tomamos dos a la vez y probamos H0: m1 ϭ m2, luego H0: m2 ϭ m3, y así sucesivamente? Para los datos de la tabla 12-1, el método de probar la igualdad de dos medias a la vez requiere de seis pruebas diferentes de hipótesis, de manera que el grado de confianza podría ser tan bajo como 0.956 (o 0.735). En general, conforme incrementamos el número de pruebas de significancia individuales, aumentamos el riesgo de obtener una diferencia únicamente por el azar (en vez de una diferencia real en las medias). El riesgo de un error tipo I (encontrar una diferencia en uno de los pares cuando en realidad no existe tal diferencia) es demasiado alto. El método del análisis de varianza nos ayuda a evitar este problema en particular (rechazar una hipótesis nula verdadera) utilizando una prueba de igualdad de varias medias. Distribución F Los métodos del ANOVA de este capítulo requieren de la distribución F que se presentó por primera vez en la sección 9-5, en la cual señalamos que la distribución F tiene las siguientes propiedades importantes (véase la figura 12-1): 1. La distribución F no es simétrica; está sesgada hacia la derecha. 2. Los valores de F pueden ser 0 o positivos, pero no pueden ser negativos. 3. Existe una distribución F diferente para cada par de grados de libertad para el numerador y el denominador. Los valores críticos de F se localizan en la tabla A-5. El análisis de varianza (ANOVA) está basado en una comparación de dos estimados diferentes de la varianza común de las distintas poblaciones. Estos estimados (la varianza entre muestras y la varianza dentro de las muestras) se describirán en la sección 12-2. El término un factor se utiliza porque los datos muestrales están separados en grupos según una característica o factor. En la sección 12-3 estudiaremos el análisis de varianza de dos factores, el cual nos permite comparar poblaciones separadas en categorías por medio de dos características (o factores). Por ejemplo, podríamos separar la estatura de las personas utilizando los siguientes dos factores: 1. género (hombre o mujer) y 2. mano dominante derecha o izquierda.
  • 4. 12-2 ANOVA de un factor No simétrica (sesgada hacia la derecha) 637 Figura 12-1 Distribución F Existe una distribución F distinta para cada par de grados de libertad diferente para el numerador y el denominador. a 0 1. 0 F Únicamente valores no negativos Estrategia de estudio sugerida: Puesto que los procedimientos empleados en este capítulo requieren de cálculos complicados, enfatizaremos el uso y la interpretación de programas de cómputo, tales como STATDISK, Minitab y Excel, o de una calculadora TI-83>84 Plus. Sugerimos que inicie la sección 12-2 enfocándose en el siguiente concepto clave: estamos utilizando un procedimiento para probar la aseveración de que tres o más medias son iguales. A pesar de que los detalles de los cálculos son complicados, nuestro procedimiento será fácil debido a que está basado en un valor P. Si el valor P es pequeño, como 0.05 o menor, se rechaza la igualdad de las medias. De otra manera no se rechaza la igualdad de las medias. Después de comprender este procedimiento básico y sencillo, proceda a la comprensión de los fundamentos subyacentes. 12-2 ANOVA de un factor Concepto clave En esta sección se presenta el método del análisis de varianza de un factor, que se utiliza para probar las hipótesis de que tres o más medias poblacionales son iguales, como en H0: m1 ϭ m2 ϭ m3. Como los cálculos son muy complicados, recomendamos interpretar los resultados obtenidos por medio de un programa de cómputo o de una calculadora TI-83>84 Plus. Sugerimos la siguiente estrategia de estudio: 1. Comprenda que un valor P pequeño (como 0.05 o menos) conduce al rechazo de la hipótesis nula de igualdad de medias. Con un valor P grande (como uno mayor que 0.05), no rechace la hipótesis nula de igualdad de medias. 2. Trate de comprender el fundamento subyacente al estudiar los ejemplos de esta sección. 3. Familiarícese con la naturaleza de los valores de la SC (suma de cuadrados) y de los CM (cuadrados medios), así como con el papel que desempeñan en la determinación del estadístico de prueba F, pero utilice programas estadísticos de cómputo o una calculadora para obtener esos valores. El método que empleamos se denomina análisis de varianza de un factor (o análisis de varianza de una entrada) porque empleamos una sola propiedad o característica para categorizar las poblaciones. En ocasiones a esta característica se le llama tratamiento o factor.
  • 5. 638 Capítulo 12 Análisis de varianza Definición Un tratamiento (o factor) es una propiedad o característica que nos permite distinguir entre sí a las distintas poblaciones. Por ejemplo, los pesos de los álamos en la tabla 12-1 se distinguen de acuerdo con el tratamiento (ninguno, fertilizante, riego, fertilizante y riego). Se utiliza el término tratamiento porque las primeras aplicaciones del análisis de varianza implicaron experimentos de agricultura en los que distintas porciones de tierra se trataban con diferentes fertilizantes, tipos de semillas, insecticidas, etcétera. El siguiente recuadro incluye los requisitos y procedimientos que utilizaremos. Requisitos 1. Las poblaciones tienen distribuciones que son aproximadamente normales. (Este requisito no es demasiado estricto, ya que el método funciona bien, a menos que la población tenga una distribución muy diferente de la normal. Si una población tiene una distribución muy diferente a la normal, utilice la prueba de Kruskal-Wallis, descrita en la sección 13-5). 2. Las poblaciones tienen la misma varianza s2 (o desviación estándar s). (Este requisito no es demasiado estricto, ya que el método funciona bien a menos que las varianzas poblacionales difieran en grandes cantidades. El especialista en estadística de la Universidad de Wisconsin, George E. P. Box demostró que, siempre y cuando los tamaños muestrales sean iguales (o casi iguales), las varianzas pueden diferir de tal forma que la más grande sea hasta nueve veces el tamaño de la más pequeña, y los resultados del ANOVA continúan siendo esencialmente confiables). 3. Las muestras son aleatorias simples (es decir, muestras del mismo tamaño que tienen la misma probabilidad de ser elegidas). 4. Las muestras son independientes entre sí (es decir, no están aparejadas o asociadas de ninguna forma). 5. Las diferentes muestras provienen de poblaciones que están categorizadas de una sola forma. (Ésta es la base del nombre del método: análisis de varianza de un factor). Procedimiento de prueba de H0: m1 ‫ ؍‬m2 ‫ ؍‬m3 ‫. . . ؍‬ > 1. Utilice STATDISK, Minitab, Excel o una calculadora TI-83>84 Plus para obtener los resultados. 2. Identifique el valor P en los resultados. 3. Plantee una conclusión con base en estos criterios: q ISi el valor P Յ A, rechace la hipótesis nula de medias iguales y concluya que al menos una de las medias poblacionales es diferente de las otras. q Si el valor P Ͼ A, no rechace la hipótesis nula de medias iguales. Tenga cuidado al interpretar los resultados: Cuando concluimos que existe suficiente evidencia para rechazar la aseveración de medias poblacionales iguales, no podemos concluir a partir del ANOVA que cualquier media en particular es distinta de las demás. (Existen otras pruebas que pueden utilizarse para identificar las medias específicas que son diferentes, las cuales se conocen como procedimientos de comparación múltiple y que estudiaremos más adelante en esta sección.
  • 6. 12-2 ANOVA de un factor UL DEL O A PR EJEMPLO Pesos de álamos Dados los pesos de álamos listados en la tabla 12-1, y un nivel de significancia de a ϭ 0.05, utilice STAT12 C A PÍT DISK, Minitab, Excel o una calculadora TI-83>84 Plus para probar la aseveración de que las cuatro muestras provienen de poblaciones con medias diferentes. Vea a las siguientes pantallas de resultados. OBLEM SOLUCIÓN REQUISITO Cuando se investiga el requisito de normalidad de las cuatro poblaciones diferentes, la única muestra cuestionable es la segunda del grupo de tratamiento con fertilizante. Sólo para esa muestra, la gráfica cuantilar normal y el histograma sugieren que tal vez no se trate de una distribución normal, y el problema es el valor de 1.34 kg, que al parecer es un valor extremo; por lo tanto, debemos ser cuidadosos. Lo más adecuado sería realizar el análisis con y sin la inclusión de ese valor. Consulte el ejercicio 5, en donde vemos que en este caso el valor extremo de 1.34 kg no tiene un efecto drástico en los resultados. continúa 639
  • 7. 640 Capítulo 12 Análisis de varianza Las varianzas son muy diferentes, pero la más grande no es más de nueve veces el tamaño de la más pequeña, de manera que se satisface el requisito de varianzas iguales. Suponemos que tenemos muestras aleatorias simples. Sabemos que las muestras son independientes, y cada valor pertenece exactamente a un grupo. Por lo tanto, los requisitos se satisfacen y podemos proceder con la prueba de hipótesis. La hipótesis nula es H0: m1 ϭ m2 ϭ m3 y la hipótesis alternativa es la aseveración de que al menos una de las medias es diferente de las otras. Paso 1: Utilice algún recurso tecnológico para obtener los resultados del ANOVA, como alguno de los que se muestran en este ejemplo. Paso 2: Todas las pantallas de resultados indican que el valor P es 0.007, redondeado. Paso 3: Puesto que el valor P es menor que el nivel de significancia de a ϭ 0.05, rechazamos la hipótesis nula de igualdad de medias. INTERPRETACIÓN Existe evidencia suficiente para sustentar la aseveración de que las cuatro medias poblacionales no son iguales. Con base en la muestra de pesos de la tabla 12-1. Con base en la muestra de pesos de la tabla 12-1, concluimos que esos pesos provienen de poblaciones con medias diferentes. Con base en esta prueba de ANOVA, no podemos concluir que cualquier media en particular sea diferente de las demás. Fundamentos Suponiendo que las poblaciones tienen la misma varianza s2, el estadístico de prueba F es la razón o el cociente de los siguientes dos estimados de s2: 1. la variación entre muestras (con base en la variación entre medias muestrales), y 2. variación dentro de muestras (con base en las varianzas muestrales). Un estadístico de prueba F significativamente grande (ubicado a la extrema derecha de la gráfica de distribución F) constituye evidencia en contra de medias poblacionales iguales, de manera que la prueba es de cola derecha. La figura 12-2 indica la relación entre el estadístico de prueba F y el valor P. Estadístico de prueba del ANOVA de un factor F5 varianza entre las muestras varianza dentro de las muestras El numerador del estadístico de prueba F mide la variación entre medias muestrales. El estimado de la varianza en el denominador depende únicamente de las varianzas muestrales y no se ve afectado por las diferencias entre las medias muestrales. Como consecuencia, las medias muestrales que tienen valores cercanos dan como resultado un estadístico de prueba F pequeño y concluimos que no existen diferencias significativas entre las medias muestrales. Pero si el valor de F es excesivamente grande, entonces rechazamos la aseveración de igualdad de medias. (Los ambiguos términos “pequeño” y “excesivamente grande” se vuelven objetivos por medio del valor P correspondiente, el cual nos indica si el estadístico de prueba F está o no en la región crítica). Puesto que valores excesivamente grandes de F reflejan medias desiguales, la prueba es de cola derecha.
  • 8. 12-2 ANOVA de un factor Figura 12-2 Compare las medias muestrales. Al menos una media muestral es muy diferente. Todas las medias muestrales tienen valores cercanos. Estadístico de prueba F pequeño, valor P grande Estadístico de prueba F grande, valor P pequeño F aquí F aquí Rechace la igualdad de medias poblacionales No rechace la igualdad de medias poblacionales Cálculos con tamaños muestrales n iguales Para comprender realmente los efectos del análisis de varianza de un factor, vea la tabla 12-2. Compare el conjunto de datos A con el conjunto de datos B y observe que la única diferencia es que añadimos 10 a cada valor de la muestra 1 en el conjunto de datos A para obtener los valores de la muestra 1 en el conjunto de datos B. Si todos los conjuntos de datos tienen el mismo tamaño muestral (como en n ϭ 4 para la tabla 12-2), los cálculos requeridos no son demasiado difíciles. Primero, calcule la varianza entre muestras al evaluar ns2, donde s2 es la varianza de las x x # # medias muestrales y n es el tamaño de cada una de las muestras. Es decir, considere las medias muestrales como un conjunto ordinario de valores y calcule la variann za. (Del teorema del límite central, s– ϭ s>͙ළ se puede despejar s para obtener x s ϭ ͙ළ ? s–, de manera que podemos estimar s2 con ns2). Por ejemplo, las men x # x dias muestrales del conjunto de datos A en la tabla 12-2 son 5.5, 6.0 y 6.0. Estos tres valores tienen una varianza de s2 ϭ 0.0833, de manera que la x # varianza entre las muestras ϭ ns2 ϭ 4(0.0833) ϭ 0.3332 x # A continuación, estime la varianza dentro de las muestras, calculando s 2, que p es la varianza agrupada que se obtiene al calcular la media de las varianzas muestrales. Las varianzas muestrales en la tabla 12-2 son 3.0, 2.0 y 2.0, de forma que la varianza dentro de muestras ϭ s 2 p 5 3.0 1 2.0 1 2.0 5 2.3333 3 Finalmente, evalúe el estadístico de prueba F de la siguiente manera: F5 641 varianza entre muestras 0.3332 ns2 # 5 2x 5 5 0.1428 varianza dentro de muestras sp 2.3333 Relación entre el estadístico de prueba F y el valor P
  • 9. 642 Capítulo 12 Análisis de varianza Efecto de una media sobre el estadístico de prueba F Tabla 12-2 A B añadir 10 Muestra 1 Muestra 2 Muestra 3 Muestra 1 Muestra 2 Muestra 3 7 3 6 6 Resistencia a las encuestas Las encuestas basadas en muestras relativamente pequeñas pueden ser bastante precisas, siempre y cuando la muestra sea aleatoria o representativa de la población. Sin embargo, el incremento en las tasas de rechazo a las encuestas está haciendo que sea más difícil obtener muestras aleatorias. El Council of American Survey Research Organizations reportó que, en un año reciente, el 38% de los consumidores se rehusaron a responder encuestas. El director de una compañía de investigación de mercados dijo que “las personas tienen temor de ser seleccionadas y les preocupa que las generalizaciones se realicen con base únicamente en aquellos que cooperan”. Los resultados de la industria de investigación de mercados, multimillonaria en dólares, afectan los productos que compramos, los programas de televisión que vemos y muchas otras facetas de nuestras vidas. 6 5 5 8 4 7 6 7 17 13 16 16 6 5 5 8 4 7 6 7 n1 = 4 x1 = 5.5 s 2 = 3.0 1 n2 = 4 x2 = 6.0 s 2 = 2.0 2 n3 = 4 x3 = 6.0 s 2 = 2.0 3 n1 = 4 x1 = 15.5 s 2 = 3.0 1 n2 = 4 x2 = 6.0 s 2 = 2.0 2 n3 = 4 x3 = 6.0 s 2 = 2.0 3 Varianza entre muestras ns 2 = 4 (0.0833) = 0.3332 x Varianza dentro de s 2 = 3.0 + 2.0 + 2.0 = 2.3333 p 3 muestras ns 2 0.3332 x = = 0.1428 s 2 2.3333 p Estadístico de prueba F F= Valor P (obtenido con Excel) Valor P = 0.8688 ns 2 = 4 (30.0833) = 120.3332 x s 2 = 3.0 + 2.0 + 2.0 = 2.3333 p 3 F= ns 2 120.3332 x = = 51.5721 2.3333 s2 p Valor P = 0.0000118 El valor crítico de F se calcula suponiendo una prueba de cola derecha, ya que los valores grandes de F corresponden a diferencias significativas entre medias. Con k muestras, cada una con n valores, el número de grados de libertad se obtiene como sigue. Grados de libertad: (k ‫ ؍‬número de muestras y n ‫ ؍‬tamaño muestral) grados de libertad del numerador ϭ k 2 1 grados de libertad del denominador 5 k (n 2 1) Para el conjunto de datos A de la tabla 12-2, k ϭ 3 y n ϭ 4, de manera que los grados de libertad son 2 para el numerador y 3(4 Ϫ 1) ϭ 9 para el denominador. Con a ϭ 0.05, 2 grados de libertad para el numerador y 9 grados de libertad para el denominador, el valor crítico F de la tabla A-5 es 4.2565. Si utilizáramos el método tradicional de prueba de hipótesis con el conjunto de datos A de la tabla 12-2, veríamos que esta prueba de cola derecha tiene un estadístico de prueba F ϭ 0.1428 y un valor crítico de F ϭ 4.2565, de manera que el estadístico de prueba no se encuentra en la región crítica y, por lo tanto, no rechazamos la hipótesis nula de igualdad de medias.
  • 10. 12-2 ANOVA de un factor Para ver realmente cómo funciona el estadístico de prueba F, considere ambos conjuntos de datos muestrales en la tabla 12-2. Observe que las tres muestras de la parte A son idénticas a las tres muestras de la parte B, excepto que en la parte B añadimos 10 a cada valor de la muestra 1 de la parte A. Las tres medias muestrales de la parte A son muy cercanas, pero existen diferencias sustanciales en la parte B. Las tres varianzas muestrales de la parte A son idénticas a las de la parte B. La suma de 10 a cada dato de la primera muestra de la tabla 12-2 tiene un efecto drástico en el estadístico de prueba, ya que F cambia de 0.1428 a 51.5721. La suma de 10 a cada dato de la primera muestra también tiene un efecto drástico en el valor P, el cual cambia de 0.8688 (no significativo) a 0.0000118 (significativo). Observe que la varianza entre muestras en la parte A es 0.3332, pero en la parte B es 120.3332 (lo que indica que las medias muestrales en la parte B están más separadas). Observe también que las varianzas dentro de las muestras son de 2.3333 en ambas partes, ya que la varianza dentro de una muestra no se ve afectada cuando sumamos una constante a cada valor muestral. El cambio en el estadístico F y el valor P es atribuible únicamente a los cambios en –1. Esto ilustra que el estadístix co de prueba F es muy sensible a las medias muestrales, aun cuando se obtiene a través de dos estimados distintos de la varianza poblacional común. He aquí el punto clave de la tabla 12-2: los conjuntos de datos A y B son idénticos, excepto que en el conjunto de datos B se añadió 10 a cada valor de la primera muestra. La suma de 10 a cada valor de la primera muestra causa que las tres medias muestrales se aparten más, con el resultado de que el estadístico de prueba F se incrementa y el valor P disminuye. Cálculos con tamaños muestrales desiguales Mientras que los cálculos requeridos para los casos con tamaños muestrales iguales son razonables, las cosas se complican bastante cuando los tamaños muestrales no son iguales. Se aplica el mismo razonamiento básico, porque calculamos un estadístico de prueba F que es el cociente de dos estimados diferentes de la varianza poblacional común s2, pero esos estimados implican medidas ponderadas que toman en cuenta los tamaños muestrales, tal como se indica a continuación. F5 donde varianza entre muestras 5 varianza dentro de muestras c Sni sxi 2 x d2 d k21 c Ssni 2 1ds2 i d Ssni 2 1d x 5 media de todos los valores muestrales combinados k 5 número de medias poblacionales que se están comparando ni 5 número de valores en la i-ésima muestra – ϭ media de los valores en la i-ésima muestra xi s 2 ϭ varianza de los valores en la i-ésima muestra i El factor de ni está incluido de manera que las muestras más grandes llevan más peso. El denominador del estadístico de prueba es sencillamente la media de las varianzas muestrales, pero se trata de una media ponderada cuyos pesos se basan en los tamaños muestrales. Como el cálculo de este estadístico de prueba puede conducir a grandes errores de redondeo, los diferentes programas estadísticos de cómputo suelen emplear una expresión distinta (pero equivalente) que implica la notación de la SC (suma de 643 La ética en los reportes de encuestas La American Association for Public Opinion Research creó un código de ética para aplicarse en los reportes de noticias de resultados de encuesta. Este código requiere que se incluya lo siguiente: 1. identificación del patrocinador, 2. fecha de la realización de la encuesta, 3. tamaño de la muestra, 4. naturaleza de la población muestreada, 5. tipo de encuesta utilizada y 6. redacción exacta de las preguntas de la encuesta. Las encuestas financiadas por el gobierno de Estados Unidos se someten a una verificación que evalúa el riesgo para los sujetos encuestados, el mérito científico de la encuesta y la garantía del consentimiento de los sujetos para participar.
  • 11. 644 Capítulo 12 Análisis de varianza cuadrados) y los CM (cuadrados medios). A pesar de que la siguiente notación y sus componentes son complicados y tediosos, la idea básica es la misma: el estadístico de prueba F es una razón con un numerador que refleja la variación entre las medias de las muestras y un denominador que refleja la variación dentro de las muestras. Si las poblaciones tienen medias iguales, el cociente F tiende a ser pequeño, pero si las medias poblacionales no son iguales, el cociente F tiende a ser significativamente grande. A continuación se describen los componentes más importantes del método ANOVA. La SC (total) o suma total de cuadrados es una medida de la variación total x en todos los datos muestrales combinados. Fórmula 12-1 SCstotald 5 Ssx 2 x d 2 La SC(total) se puede separar en los componentes de la SC(del tratamiento) y la SC(del error), descritas como sigue. La SC(del tratamiento), también llamada SC(del factor), SC(entre grupos) o SC(entre muestras), es una medida de la variación entre las medias muestrales. Fórmula 12-2 SC(del tratamiento) ϭ n1(x1 2 x)2 1 n2(x2 2 x)2 1 . . . 1 nk(xk 2 x)2 5 Sni(xi 2 x)2 Si las medias poblacionales (m1, m2, . . . , mk) son iguales, entonces las medias x muestrales –1, –2, . . . , –k tenderán a acercarse entre sí y también a acercarse a x. x x El resultado será un valor de SC(del tratamiento) relativamente pequeño. Sin embargo, si las medias poblacionales no son todas iguales, entonces al menos una de – , – , . . . , – tenderá a estar lejos de las demás y también de x. El resultado será xk x1 x2 un valor relativamente grande de SC(del tratamiento). La SC(del error), también conocida como SC(dentro de grupos) o SC(dentro de muestras), es una suma de cuadrados que representa la variación que se supone común a todas las poblaciones consideradas. Fórmula 12-3 2 2 2 SC(del error) ϭ (n1 Ϫ 1)s1 ϩ (n2 Ϫ 1)s2 ϩ и и и ϩ (nk Ϫ 1)sk 2 ϭ S(ni Ϫ 1)s i Dadas las expresiones anteriores para SC(total), SC(del tratamiento) y SC(del error), siempre deben mantenerse las siguientes relaciones. Fórmula 12-4 SC(total) ϭ SC(del tratamiento) ϩ SC(del error)
  • 12. 12-2 ANOVA de un factor SC(del tratamiento) y SC(del error) son ambas sumas de cuadrados, y si dividimos cada una de ellas entre su número correspondiente de grados de libertad, obtenemos los cuadrados medios. Algunas de las siguientes expresiones para los cuadrados medios incluyen la notación N: N ‫ ؍‬número total de valores en todas las muestras combinadas CM(del tratamiento) es un cuadrado medio de tratamiento, que se obtiene como sigue: SCsdel tratamientod Fórmula 12-5 CMsdel tratamientod 5 k21 CM(del error) es un cuadrado medio del error, que se obtiene como sigue: SCsdel errord N2k CM(total) es un cuadrado medio de la variación total, que se obtiene como sigue: Fórmula 12-6 CMsdel errord 5 Fórmula 12-7 CMstotald 5 SCstotald N21 Estadístico de prueba para ANOVA con tamaños muestrales desiguales Al contrastar la hipótesis nula H0: m1 5 m2 5 . . . 5 mk con la hipótesis alternativa de que no todas estas medias son iguales, el estadístico de prueba Fórmula 12-8 F5 CMsdel tratamientod CMsdel errord tiene una distribución F (cuando la hipótesis nula H0 es verdadera) con grados de libertad dados por grados de libertad del numerador 5 k 2 1 grados de libertad del denominador 5 N 2 k Este estadístico de prueba es esencialmente el mismo que se utilizó antes, y su interpretación también es igual a la descrita con anterioridad. El denominador depende únicamente de las varianzas muestrales que miden la variación dentro de los tratamientos y no se ve afectado por las diferencias entre las medias muestrales. En contraste, el numerador se ve afectado por las diferencias entre las medias muestrales. Si las diferencias entre las medias muestrales son extremas, causarán que el numerador sea excesivamente grande, por lo que F también será excesivamente grande. Como consecuencia, los valores muy grandes de F sugieren medias desiguales y, por lo tanto, la prueba ANOVA es de cola derecha. Las tablas constituyen un formato adecuado para resumir los resultados más importantes en los cálculos del ANOVA, y la tabla 12-3 tiene un formato que suele utilizarse en el despliegue de resultados de las computadoras. (Véase las pantallas anteriores de STATDISK, Minitab y Excel). Las cifras de la tabla 12-3 resultan de los datos de la tabla 12-1. Diseño del experimento En el análisis de varianza de un factor (o de una entrada) utilizamos un factor como base para separar los datos en diferentes categorías. 645
  • 13. 646 Capítulo 12 Análisis de varianza Tabla 12-3 Fuente de variación Tratamientos Tabla de ANOVA para los datos de la tabla 12-1 Suma de cuadrados (SC) Grados de libertad Cuadrado medio (CM) Estadístico de prueba F Valor P 4.6824 3 1.5608 5.7314 0.0073 0.2723 Error 4.3572 16 Total 9.0397 19 Si concluimos que las diferencias entre las medias son significativas, no podemos estar completamente seguros de que las diferencias se puedan explicar por el factor utilizado. Es posible que la variación de algún otro factor desconocido sea el responsable. Una forma de reducir el efecto de factores extraños es planear el experimento de manera que tenga un diseño completamente aleatorizado, en el que se da a cada elemento la misma posibilidad de pertenecer a las diferentes categorías o tratamientos. Por ejemplo, usted podría asignar sujetos a dos diferentes grupos de tratamiento y a un grupo placebo por medio de un proceso de selección aleatoria equivalente a sacar papeles de un tazón. Otra forma de reducir el efecto de factores extraños es el uso de un diseño rigurosamente controlado, en el cual los elementos se eligen cuidadosamente de manera que el resto de los factores no tengan variabilidad. En general, los buenos resultados requieren que el experimento se diseñe y ejecute de forma cuidadosa. Identificación de medias diferentes Después de hacer una prueba con el análisis de varianza, podemos concluir que existe evidencia suficiente para rechazar una aseveración de igualdad de medias poblacionales, pero no podemos concluir a partir de un ANOVA que alguna media en particular sea diferente de las demás. Existen varios procedimientos formales e informales para identificar las medias específicas que son diferentes. Un método informal consiste en usar la misma escala para construir gráficas de cuadro con los conjuntos de datos, para ver si uno o más de ellos es muy diferente de los otros. Otro método consiste en construir estimados de intervalos de confianza de las medias a partir de los conjuntos de datos, y luego comparar esos intervalos de confianza para ver si uno o más de ellos no se traslapan con los demás. Anteriormente señalamos que no es adecuado aparear las muestras y realizar pruebas de hipótesis individuales con los procedimientos descritos en la sección 9-3. Con cuatro poblaciones, este método (hacer dos a la vez) requiere de seis pruebas de hipótesis diferentes, de manera que si cada prueba se realiza con un nivel de significancia de 0.05, el nivel general de confianza para las seis pruebas sería demasiado bajo, como 0.956 (o 0.735), de manera que el nivel de significancia sería tan alto como 1 Ϫ 0.735 ϭ 0.265. Este nivel de significancia indica que el riesgo de cometer un error tipo I (encontrar una diferencia en uno de los pares cuando en realidad no existe tal diferencia), es demasiado alto. Existen varios procedimientos para identificar cuáles medias difieren de las demás. Algunas de las pruebas, llamadas pruebas de rango, nos permiten localizar subconjuntos de medias que no son significativamente diferentes de las demás.
  • 14. 12-2 ANOVA de un factor Otras pruebas, denominadas pruebas de comparación múltiple, utilizan pares de medias, pero hacen ajustes para superar el problema de tener un nivel de significancia que aumenta conforme se incrementa el número de pruebas individuales. No existe consenso sobre cuál es la mejor prueba, pero algunas de las más comunes son la prueba de Duncan, la prueba de Student-Newman-Keuls (o prueba SNK), la prueba de Tukey (o prueba de diferencia significativa honesta de Tukey), la prueba de Scheffé, la prueba de Dunnett, la prueba de la diferencia mínima significativa y la prueba de Bonferroni. Ahora aplicaremos esta última con el fin de ver un ejemplo de uno de los métodos para identificar cuáles medias difieren de las demás. El procedimiento es el siguiente: Prueba de comparación múltiple de Bonferroni Paso 1. Realice una prueba t separada para cada par de muestras, pero haga los ajustes que se describen en los siguientes pasos. Paso 2. Para obtener un estimado de la varianza s2 que es común a todas las poblaciones implicadas, utilice el valor del CM(del error), que utiliza todos los datos muestrales disponibles. El valor del CM(del error) generalmente se obtiene al realizar la prueba del análisis de varianza. Utilice el valor del CM(del error) para calcular el valor del estadístico de prueba t, como se indica abajo. Este estadístico de prueba en particular se basa en la opción de la muestra 1 y la muestra 4; cambie los subíndices y utilice otro par de muestras hasta haber probado todos los pares de muestras posibles. x1 2 x4 t5 Å Paso 3. CMserrord ? a 1 1 1 b n1 n4 Después de calcular el valor del estadístico de prueba t para un par específico de muestras, calcule el valor t crítico o el valor P, pero haga el siguiente ajuste para que el nivel de significancia general no se salga de control. Valor P: Utilice el estadístico de prueba t con gl ϭ N Ϫ k, donde N es el número total de valores muestrales y k es el número de muestras, y calcule el valor P de la manera acostumbrada, pero ajústelo multiplicándolo por el número de pares de muestras diferentes posibles. (Por ejemplo, con cuatro muestras, existen seis pares posibles diferentes, de manera que el valor P se ajusta multiplicándolo por 6). Valor crítico: Cuando calcule el valor crítico, ajuste el nivel de significancia a dividiéndolo entre el número de pares de muestras posibles. (Por ejemplo, con cuatro muestras, existen seis pares posibles diferentes, de manera que el nivel de significancia se ajusta dividiéndolo entre 6). Observe que en el paso 3 del procedimiento de Bonferroni se realiza una prueba individual con un nivel de significancia mucho más bajo, o bien, el valor P aumenta de manera importante. Por ejemplo, si tenemos cuatro muestras, existen seis pares diferentes de muestras posibles. Si utilizamos un nivel de significancia de 0.05, cada una de las seis comparaciones apareadas utiliza un nivel de significancia de 0.05>6 ϭ 0.00833. Por lo tanto, el rechazo de la igualdad de medias requiere de diferencias que estén muy separadas. El grado de confianza para las 647
  • 15. 648 Capítulo 12 Análisis de varianza seis pruebas puede ser tan bajo como (1 Ϫ 0.00833)6 ϭ 0.95, de manera que la posibilidad de cometer un error tipo I en una de las seis pruebas es de alrededor de 0.05. Este ajuste en el paso 3 compensa el hecho de que estamos realizando varias pruebas en vez de una sola. EJEMPLO Uso de la prueba de Bonferroni En un ejemplo previo de esta sección se utilizó el análisis de varianza con los datos muestrales de la tabla 12-1. Concluimos que existe evidencia suficiente para justificar el rechazo de la aseveración de igualdad de medias. Utilice la prueba de Bonferroni, con un nivel de significancia de 0.05, para identificar cuál de las medias difiere de las demás. La prueba de Bonferroni requiere de una prueba t separada para cada diferente par de muestras posible. Las hipótesis nulas que deben probarse son las siguientes: SOLUCIÓN H0: m1 ϭ m2 H0: m2 ϭ m3 H0: m1 ϭ m3 H0: m2 ϭ m4 H0: m1 ϭ m4 H0: m3 ϭ m4 Comenzamos con H0: m1 ϭ m4. En la tabla 12-1 observamos que –1 ϭ 0.184, x x n1 ϭ 5, –4 ϭ 1.334 y n4 ϭ 5. A partir de los resultados anteriores del análisis de varianza, también sabemos que para los datos de la tabla 12-3, CM(del error) ϭ 0.2723275. Ahora podemos evaluar el estadístico de prueba: t5 x1 2 x4 1 1 CMsdel errord ? a 1 b Å n1 n4 5 0.184 2 1.334 5 23.484 1 1 0.2723275 ? a 1 b Å 5 5 El número de grados de libertad es gl ϭ N Ϫ k ϭ 20 Ϫ 4 ϭ 16. Con un estadístico de prueba t ϭ Ϫ3.484 y con gl ϭ 16, el valor P de dos colas es 0.003065, pero ajustamos este valor P al multiplicarlo por 6 (el número de diferentes pares de muestras posibles) para obtener un valor P final de 0.01839. Como este valor P es pequeño (menor que 0.05), rechazamos la hipótesis nula. Parece que las muestras 1 y 4 tienen medias significativamente diferentes. [Si queremos obtener el valor crítico, usamos gl ϭ 16 y un nivel de significancia ajustado de 0.05>6 ϭ 0.00833. (Este nivel de significancia ajustado no se aleja mucho del área de 0.01, que se incluye en la tabla A-3. Por lo tanto, los valores t críticos para la prueba de dos colas están cerca de Ϫ2.921 y 2.921). Los valores críticos reales son Ϫ3.008 y 3.008. El estadístico de prueba de Ϫ3.484 se encuentra en la región crítica, de manera que nuevamente rechazamos la hipótesis nula de que m1 ϭ m4)]. En vez de continuar haciendo las pruebas de hipótesis separadas para los cinco pares restantes, observe la pantalla de SPSS, que incluye todos los resultados de la prueba de Bonferroni. (El tercer renglón de los resultados numéricos corresponde a los resultados obtenidos aquí). La pantalla indica que la media de la muestra 4 difiere significativamente de las otras tres medias muestrales. Con base en la prueba de Bonferroni, parece que los pesos de los álamos tratados con fertilizante y riego tienen una media diferente de las tres categorías de tratamiento restantes.
  • 16. 12-2 ANOVA de un factor 649 SPSS Bonferroni Results Uso de la tecnología STATDISK Anote los datos en las columnas de la ventana de datos. Seleccione Analysis de la barra del menú principal, luego seleccione One-Way Analysis of Variance y proceda a elegir las columnas de los datos muestrales. Haga clic en Evaluate al finalizar. MINITAB Primero ingrese los datos muestrales en las columnas C1, C2, C3, . . . Después seleccione Stat, ANOVA, ONEWAY(UNSTACKED) e introduzca C1 C2 C3 . . . en el recuadro identificado como “Responses” (en columnas separadas). EXCEL Primero anote los datos en las columnas A, B, C, . . . Después seleccione Tools de la barra del menú principal, luego Data Analysis, seguido por Anova: Single Factor. En el cuadro de diálogo, introduzca el rango que contiene los datos muestrales. (Por ejemplo, ingrese A1:C12 si el primer valor está en el renglón 1 de la columna A y el último dato está en el renglón 12 de la columna C). TI-83>84 PLUS Primero registre los datos como listas en L1, L2, L3, . . . , después presione STAT, seleccione TESTS y elija la opción ANOVA. Ingrese los rótulos de las columnas. Por ejemplo, si los datos están en las columnas L1, L2 y L3, ingrese esas columnas para obtener ANOVA (L1, L2, L3) y presione la tecla ENTER. 12-2 DESTREZAS Y CONCEPTOS BÁSICOS Conocimientos estadísticos y pensamiento crítico 1. ANOVA. ¿Qué es el análisis de varianza de un factor y para qué se utiliza? 2. Tratamiento. En el contexto del análisis de varianza, ¿qué es un tratamiento? En este contexto, ¿la palabra “tratamiento” tiene el mismo significado que en el lenguaje cotidiano?
  • 17. 650 Capítulo 12 Análisis de varianza > 3. Entre>dentro. ¿Qué es la varianza entre muestras y qué es la varianza dentro de muestras? 4. Comparación de áreas de estudio. Un estudiante del College of Newport aplica una prueba de razonamiento abstracto a estudiantes de inglés, matemáticas y ciencias de su universidad, elegidos al azar. Luego, utiliza el análisis de varianza con los datos muestrales y concluye que no todas las medias son iguales. ¿El estudiante puede concluir que, en Estados Unidos, los estudiantes de inglés, matemáticas y ciencias tienen puntuaciones medias de razonamiento abstracto que no son iguales? ¿Por qué? Los ejercicios 5 y 6 se basan en el conjunto de datos 7 del apéndice B. 5. Pesos de álamos. En el problema del capítulo señalamos que el peso de 1.34 kg parece ser un valor extremo. Si eliminamos ese valor, los resultados de STATDISK son los que se presentan abajo. a. ¿Cuál es la hipótesis nula? b. ¿Cuál es la hipótesis alternativa? c. Identifique el valor del estadístico de prueba. d. Identifique el valor crítico para un nivel de significancia de 0.05. e. Identifique el valor P. f. Con base en los resultados anteriores, ¿qué concluye acerca de la igualdad de las medias poblacionales? g. Compare estos resultados con los que se obtuvieron al incluir el peso de 1.34 kg. ¿El aparente valor extremo de 1.34 kg tiene un gran efecto en los resultados? ¿Altera la conclusión? STATDISK 6. Pesos de álamos. El problema del capítulo utiliza los pesos de álamos para el año 1 y el terreno 1. (Véase el conjunto de datos 7 del apéndice B). Si utilizamos los pesos del año 2 y del terreno 1 con la calculadora TI-83>84 Plus, obtenemos los resultados del análisis de varianza que se presentan al margen. Suponga que deseamos utilizar un nivel de significancia de 0.05 para probar la hipótesis nula de que los cuatro tratamientos dan por resultado pesos con la misma media poblacional. a. ¿Cuál es la hipótesis nula? b. ¿Cuál es la hipótesis alternativa? c. Identifique el valor del estadístico de prueba. d. Identifique el valor crítico para un nivel de significancia de 0.05. e. Identifique el valor P. f. Con base en los resultados anteriores, ¿qué concluye acerca de la igualdad de las medias poblacionales? 7. Pérdida de peso con diferentes dietas. En una prueba de los programas Atkins, Zone, Weight Watchers y Ornish para perder peso, 160 sujetos siguieron los programas, de tal manera que cada dieta fue adoptada por 40 sujetos. Se pesó a los individuos un año después de seguir la dieta, y abajo se presentan los resultados del ANOVA, realizado con Excel (según datos de “Comparison of the Atkins, Ornish, Weight Watchers and Zone Diets for Weight Loss and Heart Disease Risk Reduction”, de Dansinger et al., Journal of the American Medical Association, vol. 293, núm. 1). Utilice un nivel de significancia de 0.05 para probar la aseveración de que la pérdida media de peso es igual en todas las dietas. Dado que las cantidades medias de pérdida de peso después de un año son Ϫ2.1 lb, Ϫ3.2 lb, Ϫ3.0 lb y Ϫ3.3 lb para las cuatro dietas, ¿parece que las dietas son efectivas?
  • 18. 12-2 ANOVA de un factor Excel 8. Pruebas de inflamabilidad de tela en diferentes laboratorios. Se realizaron pruebas de inflamabilidad en ropa infantil para dormir. Se utilizó la prueba Vertical Semirestrained, en la que en se quemaron pedazos de tela en condiciones controladas. Una vez apagado el fuego, se midió y registró la longitud de la porción quemada. Las mismas muestras de tela se probaron en cinco laboratorios diferentes. A continuación se presentan los resultados del análisis de varianza realizado con Minitab. Utilice un nivel de significancia de 0.05 para probar la aseveración de que los cinco laboratorios producen las mismas puntuaciones medias de prueba. Minitab 9. Pesos medios de dulces M&M. El conjunto de datos 13 del apéndice B incluye los pesos (en gramos) de dulces M&M sencillos, clasificados de acuerdo con su color (rojo, anaranjado, amarillo, café, azul y verde). Se utilizó STATDISK para hacer un análisis de varianza con esos datos; los resultados se presentan abajo. Utilice un nivel de significancia de 0.05 para probar la aseveración de que el peso medio de los dulces M&M es igual en las seis poblaciones de diferente color. Si Mars Inc. tiene la intención de que las poblaciones de diferentes colores tengan el mismo peso medio, ¿estos resultados sugieren que la empresa tiene un problema que requiere una acción correctiva? STATDISK 10. Energía solar en diferentes climas. Un alumno del autor vive en una casa que tiene un sistema eléctrico solar. A la misma hora, cada día, reunió las lecturas de voltaje de un medidor conectado al sistema y realizó un análisis de varianza con las lecturas obtenidas en tres tipos de días diferentes: soleados, nublados y lluviosos. Los resultados de la calculadora TI-83>84 Plus aparecen al margen. Utilice un nivel de significancia de 0.05 para probar la aseveración de que la lectura media de voltaje es la misma en los tres tipos distintos de días. ¿Existe evidencia suficiente para sustentar una aseveración de medias poblacionales diferentes? Podríamos esperar que un sistema solar proporcione más energía eléctrica los días soleados que los días nublados o lluviosos. ¿Podemos concluir que los días soleados dan como resultado mayores cantidades de energía eléctrica? TI-83/84 Plus 651
  • 19. 652 Capítulo 12 Análisis de varianza En los ejercicios 11 y 12, utilice los datos muestrales listados acerca de experimentos de choques de automóviles realizados por la National Transportation Safety Administration. Se adquirieron autos nuevos y se hicieron chocar contra una barrera fija a 35 mi>h; las mediciones se registraron con respecto al maniquí en el asiento del conductor. Los automóviles subcompactos son el Ford Escort, Honda Civic, Hyundai Accent, Nissan Sentra y Saturn SL4. Los automóviles compactos son Chevrolet Cavalier, Dodge Neon, Mazda 626 DX, Pontiac Sunfire y Subaru Legacy. Los automóviles medianos son Chevrolet Camaro, Dodge Intrepid, Ford Mustang, Honda Accord y Volvo S70. Los automóviles grandes son Audi A8, Cadillac Deville, Ford Crown Victoria, Oldsmobile Aurora y Pontiac Bonneville. 11. Traumatismo craneal en un choque de automóvil. A continuación se presentan los datos de traumatismo craneal (de acuerdo con el Head Injury Criterion, HIC). Utilice un nivel de significancia de 0.05 para probar la hipótesis nula de que las diferentes categorías de peso tienen la misma media. ¿Sugieren los datos que los automóviles grandes son más seguros? Subcompacto: Compacto: Mediano: Grande: 681 643 469 384 428 655 727 656 917 442 525 602 898 514 454 687 420 525 259 360 12. Desaceleración del pecho en un choque de automóvil. A continuación se presentan datos de desaceleración del pecho (g). Utilice un nivel de significancia de 0.05 para probar la hipótesis nula de que las distintas categorías de peso tienen la misma media. ¿Sugieren los datos que los automóviles más grandes son más seguros? Subcompacto: Compacto: Mediano: Grande: 55 57 45 44 47 57 53 45 59 46 49 39 49 54 51 58 42 51 46 44 13. Ejercicio y estrés. Se realizó un estudio para investigar los efectos del ejercicio sobre el estrés. En la siguiente tabla se listan las lecturas de la presión sanguínea sistólica (en mmHg) de sujetos, antes de iniciar 25 minutos de ejercicio aeróbico en bicicleta y antes de generarles estrés por medio de una prueba de aritmética y otra de expresión verbal (según datos de “Sympathoadrenergic Mechanisms in Reduced Hemodynamic Stress Responses after Exercise”, de Kim Brownley et al., Medicine and Science in Sports and Exercise, vol. 35, núm. 6). Utilice un nivel de significancia de 0.05 para probar la aseveración de que los diferentes grupos de sujetos tienen la misma presión sanguínea media. Con base en los resultados, ¿se puede considerar que los grupos provienen de la misma población? Mujer>afroam. Hombre>afroam. Mujer>caucásica Hombre>caucásico 117.00 130.67 102.67 93.67 96.33 92.00 115.67 120.67 133.00 120.33 124.67 118.33 119.67 106.00 108.33 107.33 117.00 113.33 124.33 111.00 99.67 128.33 102.00 127.33 14. Arqueología: Anchura de cráneos de distintas épocas. Se obtuvieron muestras de anchuras de cráneos de hombres egipcios de distintas épocas, y abajo se presentan las mediciones (según datos de Ancient Races of the Thebaid, de Thomson y RandallMaciver). Los cambios en la forma de la cabeza a lo largo del tiempo sugieren que hubo mestizaje con poblaciones inmigrantes. Utilice un nivel de significancia de 0.05 para probar la aseveración de que las distintas épocas no tienen la misma media. ¿Qué concluye?
  • 20. 12-2 4000 a. C. 1850 a. C. 150 d. C. 131 138 125 129 132 135 132 134 138 129 134 136 137 137 129 136 138 134 ANOVA de un factor 128 138 136 139 141 142 137 145 137 En los ejercicios 15 y 16, utilice el conjunto de datos del apéndice B. 15. Conjunto de datos del apéndice B: Pesos de monedas de un centavo. Remítase al conjunto de datos 14 del apéndice B y utilice los pesos de los peniques o centavos “con cabeza de indio”, de los peniques “de trigo”, de los peniques anteriores a 1983 y de los posteriores a 1983. Utilice un nivel de significancia de 0.05 para probar la aseveración de que el peso medio de los peniques es el mismo en las cuatro categorías diferentes. Con base en los resultados, ¿parecería que una máquina contadora de monedas puede manejar los pesos de los peniques de la misma forma? 16. Conjunto de datos del apéndice B: Distancias de home runs. Remítase al conjunto de datos 17 del apéndice B. Utilice un nivel de significancia de 0.05 para probar la aseveración de que los home runs anotados por Barry Bonds, Mark McGwire y Sammy Sosa tienen distancias medias que no son iguales. ¿Explican las distancias de los home runs el hecho de que hasta hoy, Barry Bonds tiene el mayor número de home runs en una temporada, mientras que Mark McGwire posee el segundo número más grande de home runs? (En años recientes se ha afirmado que los jugadores de béisbol usaban esteroides para aumentar su fuerza, lo que los ayudó a batear las pelotas más lejos). 12-2 MÁS ALLÁ DE LO BÁSICO 17. Pruebas equivalentes. En este ejercicio usted comprobará que cuando tiene dos conjuntos de datos muestrales, la prueba t agrupada para muestras independientes y el método ANOVA de esta sección son equivalentes. Remítase a los pesos de los álamos en la tabla 12-1, pero utilice únicamente los datos de los árboles que no recibieron tratamiento y de los que sólo recibieron fertilizante. a. Utilice un nivel de significancia de 0.05 y el método de la sección 9-3 para probar la aseveración de que las dos muestras provienen de poblaciones con la misma media. (Suponga que ambas poblaciones tienen la misma varianza). b. Utilice un nivel de significancia de 0.05 y el método ANOVA de esta sección para probar la aseveración planteada en el inciso a). c. Verifique que los cuadrados del estadístico de prueba t y el valor crítico del inciso a) son iguales al estadístico de prueba F y al valor crítico del inciso b). 18. Cálculo de componentes del ANOVA. El ejercicio 9 se basa en los pesos de los 100 dulces M&M incluidos en el conjunto de datos 13 del apéndice B. Si se utilizan los pesos de todos los dulces M&M de la bolsa llena, SC(del tratamiento) ϭ 0.00644, gl(del tratamiento) ϭ 5, SC(del error) ϭ 1.47320 y gl(del error) ϭ 459. a. ¿Cuántos dulces M&M hay en la bolsa llena? b. Calcule los valores del CM(del tratamiento) y del CM(del error). c. Calcule el valor del estadístico de prueba F y del valor P. d. Compare los resultados con los obtenidos en el ejercicio 9. 653
  • 21. 654 Capítulo 12 Análisis de varianza 19. Uso de la prueba de Tukey. En esta sección se incluyó una pantalla de resultados de la prueba de Bonferroni con los datos de la tabla 12-1. A continuación se muestran los resultados generados por SPSS de la prueba de Tukey. Compare los resultados de la prueba de Tukey con los de la prueba de Bonferroni. SPSS 20. Uso de la prueba de Bonferroni. A continuación se presentan los resultados parciales de la prueba de Bonferroni con los datos muestrales utilizados en el ejercicio 14. Suponga que se utiliza un nivel de significancia de 0.05. a. ¿Qué nos indica la pantalla de resultados? b. Utilice el procedimiento de la prueba de Bonferroni para calcular el valor de significancia para la prueba de una diferencia significativa entre la anchura media de los cráneos de 1850 a. C. y de 150 d. C. Identifique el estadístico de prueba y el valor P o los valores críticos. ¿Qué indican los resultados?
  • 22. 12-3 ANOVA de dos factores 12-3 ANOVA de dos factores Concepto clave El procedimiento de análisis de varianza que estudiamos en la sección 12-2 se conoce como análisis de varianza de un factor (o análisis de varianza de una entrada), porque los datos están categorizados en grupos de acuerdo con un solo factor (o tratamiento). En esta sección estudiaremos el método del análisis de varianza de dos factores, que se utiliza con datos separados en categorías formadas de acuerdo con dos factores. El método de esta sección requiere que primero hagamos una prueba de interacción entre los dos factores. Después, hacemos una prueba para determinar si el factor de renglón tiene algún efecto, y también para determinar si el factor de columna tiene algún efecto. La tabla 12-4 es un ejemplo de datos clasificados de acuerdo con dos factores. Un factor es la variable de renglón del terreno (terreno 1 y terreno 2), en tanto que el segundo factor es la variable de columna de tratamiento (ninguno, fertilizante, riego, fertilizante y riego). A las subcategorías de la tabla 12-4 se les conoce como celdas, de manera que la tabla 12-4 tiene ocho celdas, con cinco valores cada una. Cuando analizamos los datos muestrales de la tabla 12-4 estudiamos el análisis de varianza de un solo factor, por lo que parecería razonable hacer simplemente un ANOVA de una entrada para el factor del terreno y otro ANOVA de una entrada para el factor de tratamiento. Por desgracia, si realizamos dos ANOVA de un factor por separado, perdemos información e ignoramos totalmente una característica muy importante: el efecto de la interacción entre los dos factores. Definición Existe una interacción entre dos factores si el efecto de uno de los factores cambia en las diferentes categorías del otro factor. Como ejemplo de una interacción entre dos factores, considere el apareamiento de alimentos. La crema de maní y la mermelada interactúan bien, pero la salsa de tomate y el helado interactúan de tal forma que el resultado es un sabor desagradable. Los médicos deben tener cuidado de evitar la prescripción de fármacos que tienen interacciones que producen efectos adversos. Se descubrió que el fármaco Tabla 12-4 Pesos de álamos (en kg) Sin tratamiento Fertilizante Riego Fertilizante y riego Terreno 1 (fértil, húmedo) 0.15 0.02 0.16 0.37 0.22 1.34 0.14 0.02 0.08 0.08 0.23 0.04 0.34 0.16 0.05 2.03 0.27 0.92 1.07 2.38 Terreno 2 (arenoso, seco) 0.60 1.11 0.07 0.07 0.44 1.16 0.93 0.30 0.59 0.17 0.65 0.08 0.62 0.01 0.03 0.22 2.13 2.33 1.74 0.12 655
  • 23. 656 Capítulo 12 Análisis de varianza antimicótico Nizoral (ketoconazole) interactuaba con el fármaco antihistamínico Seldane (terfenadine) de tal manera que el Seldane no se metabolizaba de manera adecuada, provocando arritmias cardiacas en algunos pacientes. Posteriormente el Seldane fue retirado del mercado. Los resultados de las encuestas se pueden ver muy afectados por la redacción de las preguntas. Las personas interpretan de forma diferente una frase como “durante los últimos años”. Durante los últimos años (en realidad desde 1980), los investigadores de encuestas y los psicólogos han trabajado en conjunto para mejorar las encuestas disminuyendo el sesgo e incrementando la exactitud. En un caso, los psicólogos estudiaron el hallazgo de que del 10 al 15 por ciento de los encuestados afirmaron haber votado en la última elección, cuando en realidad no lo hicieron. Experimentaron con teorías de problemas de memoria, el deseo de ser considerado responsable y la tendencia que manifiestan quienes generalmente votan de decir que votaron en la elección más reciente, aun cuando no lo hayan hecho. Se encontró que sólo esta última explicación formaba parte del problema. Tabla 12-5 Medias (en kg) de las celdas de la tabla 12-4 Tratamiento Ninguno Fertilizante Riego Fertilizante y riego Terreno 1 (fértil, húmedo) 0.184 0.332 0.164 1.334 Terreno 2 (arenoso, seco) 0.458 0.630 0.278 1.308 1.5 Peso (en kg) Encuestas y psicólogos Exploración de los datos Exploremos los datos de la tabla 12-4 calculando la media de cada celda y construyendo una gráfica. En la tabla 12-5 se listan las medias de las celdas individuales. Esas medias van de 0.164 kg hasta 1.334 kg, de manera que parecen variar considerablemente. La figura 12-3 ilustra gráficas de esas medias e indica que las medias del terreno 2 son mayores que las medias del terreno 1 para tres de las cuatro categorías de tratamiento. Puesto que los segmentos lineales del terreno 2 parecen ser aproximadamente paralelos a los segmentos lineales correspondientes del terreno 1, aparentemente los pesos por terreno se comportan de la misma forma para las distintas categorías del tratamiento, de manera que no hay un efecto de interacción. En general, si una gráfica como la de la figura 12-3 da por resultado segmentos lineales que son aproximadamente paralelos, entonces tenemos evidencia de que no hay una interacción entre las variables de renglón y de columna. Si los segmentos lineales del terreno 2 no fueran paralelos a los segmentos lineales del terreno 1, tendríamos evidencia de una interacción entre el terreno y el tratamiento. Estas observaciones basadas en la tabla 12-5 y en la figura 12-3 son muy subjetivas, por lo que procederemos con el método más objetivo del análisis de varianza de dos factores. 1.0 Terreno 2 0.5 0 Terreno 1 Ninguno Fertilizante Riego Fertilizante y riego Tratamiento Figura 12-3 Gráfica de interacción de medias (en kg) de las celdas de la tabla 12-4
  • 24. 12-3 ANOVA de dos factores Cuando aplicamos el ANOVA de dos factores para los datos de la tabla 12-4, consideramos tres posibles efectos sobre el peso de los álamos: 1. los efectos de una interacción entre el terreno y el tratamiento; 2. los efectos del terreno; 3. los efectos del tratamiento. Los cálculos son bastante complicados, de manera que supondremos que se utilizó un programa de cómputo o una calculadora TI-83>84 Plus. (Al final de esta sección se describen los procedimientos para el uso de herramientas tecnológicas). A continuación se presentan los resultados de Minitab para los datos de la tabla 12-4. Minitab Ahora presentaremos los requisitos y el procedimiento básico para el análisis de varianza (ANOVA) de dos factores. El procedimiento también se resume en la figura 12-3. Requisitos 1. Para cada celda, los valores muestrales provienen de una población con una 2. 3. 4. 5. 6. distribución que es aproximadamente normal. Las poblaciones tienen la misma varianza s2 (o desviación estándar s). Las muestras son aleatorias simples. (Es decir, las muestras del mismo tamaño tienen la misma probabilidad de ser seleccionadas). Las muestras son independientes entre sí. (Las muestras no están apareadas o asociadas de ninguna manera). Los valores muestrales se categorizan en dos factores. (Ésta es la base del nombre del método: análisis de varianza de dos factores). Todas las celdas tienen el mismo número de valores muestrales. (Este diseño se conoce como diseño balanceado). Procedimiento del ANOVA de dos factores (véase la figura 12-4) Paso 1: Efecto de interacción: En el análisis de varianza de dos factores, inicie probando la hipótesis nula de que no existe interacción entre los dos factores. Si utilizamos Minitab para los datos de la tabla 12-4, obtenemos el siguiente estadístico de prueba: F5 0.05721 CMsde la interacciónd 5 5 0.17 CMsdel errord 0.33521 Interpretación: El valor P correspondiente aparece en los resultados de Minitab como 0.915, por lo que no rechazamos la hipótesis nula de ninguna interacción entre los dos factores. No parece que los pesos de los álamos estén afectados por una interacción entre el terreno y el tratamiento. Paso 2: Efectos renglón>columna: Si rechazamos la hipótesis nula de ninguna interacción entre factores, entonces tenemos que detenernos aquí; no debemos proceder con las dos pruebas adicionales. (Si existe una interacción 657
  • 25. 658 Capítulo 12 Análisis de varianza Figura 12-4 Inicio Procedimiento del ANOVA de dos factores Pruebe una interacción entre los dos factores. Utilice Fϭ CM(de la interacción) CM(del error) ¿Existe un efecto debido a la interacción entre los dos factores? Sí (Rechace H0 de ningún efecto de interacción) Deténgase. No considere los efectos de algún factor sin considerar los efectos del otro. No (No rechace H0 de ningún efecto de interacción) Pruebe el efecto del factor de renglón utilizando CM(del factor de renglón) Fϭ CM(del error) Pruebe el efecto del factor de columna utilizando CM(del factor de columna) Fϭ CM(del error) entre los factores, no debemos considerar los efectos de alguno de los factores sin considerar los del otro). Si no rechazamos la hipótesis nula de ninguna interacción entre los factores, entonces debemos proceder a probar las siguientes dos hipótesis: H0: No existen efectos del factor de renglón (es decir, las medias de renglón son iguales). H0: No existen efectos del factor de columna (es decir, las medias de columna son iguales). En el paso 1 no rechazamos la hipótesis nula de ninguna interacción entre los factores, por lo que procedemos con las siguientes dos pruebas de hipótesis identificadas en el paso 2. Para el factor de renglón del terreno obtenemos F5 0.27225 CMsdel terrenod 5 5 0.81 CMsdel errord 0.33521
  • 26. ANOVA de dos factores 12-3 Interpretación: Este valor no es significativo, ya que el valor P correspondiente aparece en los resultados de Minitab como 0.374. No rechazamos la hipótesis nula de que no existen efectos por el terreno. Es decir, el terreno no parece tener un efecto sobre el peso de los álamos. Para el factor de columna del tratamiento obtenemos F5 2.51567 CMsdel tratamientod 5 5 7.50 CMsdel errord 0.33521 Interpretación: Este valor es significativo, ya que el valor P correspondiente se indica como 0.001. Por lo tanto, rechazamos la hipótesis nula de ningún efecto del tratamiento. Parece que el tratamiento tiene un efecto sobre el peso de los álamos. Con base en los datos muestrales de la tabla 12-4, concluimos que los diferentes tratamientos parecen tener pesos medios diferentes, aunque al parecer los pesos tienen medias iguales en ambos terrenos. (Vea la figura 12-3 y observe que los segmentos lineales cambian drásticamente en las diferentes categorías de tratamiento, pero los segmentos lineales del terreno 1 y del terreno 2 no son muy diferentes entre sí). Caso especial: Una observación por celda y ninguna interacción La tabla 12-4 contiene 5 observaciones por celda. Si nuestros datos muestrales consisten únicamente en una observación por celda, perdemos CM(de la interacción), SC(de la interacción) y gl(de la interacción), ya que estos valores están basados en varianzas muestrales calculadas para cada celda individual. Si existe sólo una observación por celda, no hay variación dentro de las celdas individuales y esas varianzas muestrales no pueden ser calculadas. Cuando tenemos una observación por celda procedemos de la siguiente manera: si parece razonable suponer (con base en el conocimiento de las circunstancias) que no existe interacción entre los dos factores, haga dicha suposición y después proceda como antes a probar las siguientes dos hipótesis por separado: H0: No existen efectos del factor de renglón. H0: No existen efectos del factor de columna. Como ejemplo, suponga que tenemos únicamente el primer valor de cada celda de la tabla 12-4, lo que produce los datos de la tabla 12-6. En la tabla 12-6, las dos medias por renglón son 0.9375 y 0.6575. ¿Es esta diferencia significativa, lo que sugiere que existe un efecto debido al terreno? En la tabla 12-6, las cuatro medias de columna son 0.3750, 1.2500, 0.4400 y 1.1250. ¿Son significativas estas diferencias, lo que sugiere que existe un efecto debido al tratamiento? Suponiendo que los pesos no se ven afectados por alguna interacción entre el terreno y el tratamiento, Tabla 12-6 Pesos (en kg) de álamos en el año 1 Tratamiento Ninguno Fertilizante Riego Fertilizante y riego Terreno 1 (fértil, húmedo) 0.15 1.34 0.23 2.03 Terreno 2 (arenoso, seco) 0.60 1.16 0.65 0.22 659
  • 27. 660 Capítulo 12 Análisis de varianza a continuación se presentan los resultados de Minitab. (Si creemos que existe una interacción, el método descrito aquí no se aplica). Minitab Factor de renglón: Primero empleamos los resultados de la pantalla de Minitab para probar la hipótesis nula de ningún efecto del factor de renglón del terreno. F5 0.156800 CMsdel terrenod 5 5 0.28 CMsdel errord 0.562300 Este estadístico de prueba no es significativo, debido a que el valor P correspondiente en la pantalla de Minitab es 0.634. No rechazamos la hipótesis nula; parece que los pesos de los álamos no se ven afectados por el terreno. Factor de columna: Ahora utilizamos la pantalla de Minitab para probar la hipótesis nula de ningún efecto del factor de columna de la categoría de tratamiento. El estadístico de prueba es F5 CMsde la edadd 0.412217 5 5 0.73 CMsdel errord 0.562300 Este estadístico de prueba no es significativo, ya que el valor P correspondiente en la pantalla de Minitab es 0.598. No rechazamos la hipótesis nula, de manera que parece que el peso del álamo no se ve afectado por el tratamiento. Utilizando los datos de la tabla 12-6, concluimos que los pesos de los álamos no parecen verse afectados por el terreno ni por el tratamiento, pero cuando utilizamos 5 valores en cada celda (tabla 12-4), concluimos que los pesos parecen verse afectados por el tratamiento. Éste es el poder de las muestras grandes. En esta sección explicamos brevemente una rama importante de la estadística. Pusimos énfasis en la interpretación de resultados de computadora y omitimos los cálculos y fórmulas manuales, que son bastante engorrosos. 12-3 DESTREZAS Y CONCEPTOS BÁSICOS Conocimientos estadísticos y pensamiento crítico 1. ANOVA de dos factores. ¿Qué es el análisis de varianza de dos factores y para qué se utiliza? 2. Interacción. ¿Qué es una interacción y qué papel desempeña en el análisis de varianza de dos factores? 3. Interacción. Cuando se realiza un análisis de varianza de dos factores, si hay una interacción entre los dos factores, ¿por qué no debemos continuar con pruebas separadas para los efectos de los factores de renglón y de columna?
  • 28. ANOVA de dos factores 12-3 Uso de la tecnología STATDISK Haga clic en Analysis y seleccione Two-Way Analysis of Variance. Complete lo que se le pide en la ventana y luego haga clic en Continue. Proceda a ingresar o copiar los datos en la columna “Values” y luego haga clic en Evaluate. Primero ingrese todos los valores muestrales en la columna C1. Registre los números por renglón correspondientes en la columna C2. Ingrese los números de columna correspondientes en la columna C3. Seleccione Stat de la barra del menú principal, después ANOVA y luego Two-Way. En el cuadro de diálogo ingrese C1 para Response, C2 para Row Factor y C3 Para Column Factor. Haga clic en OK. Sugerencia: Evite confusiones y ponga rótulos a las columnas C1, C2 y C3 con nombres que tengan algún significado. MINITAB EXCEL Para tablas de dos factores con más de un dato por celda: los datos de la misma celda deben listarse en una columna, no en un renglón. Ingrese los rótulos correspondientes al conjunto de datos en la columna A y el renglón 1, como en este ejemplo, que corresponde a la tabla 12-4: A 1 B C D E Ninguno Fert Riego Ferty Riego 2 Terreno 1 0.15 1.34 0.23 2.03 3 Terreno 1 0.02 0.14 0.04 0.27 A A A A A Después de ingresar los datos muestrales y los rótulos, seleccione Tools de la barra del menú principal, luego Data Analysis y después Anova: Two-Factor With Replication. En el cuadro de diálogo ingrese el rango de entrada. Para los datos de la tabla 12-4, ingrese A1:E11. Para “rows per sample”, introduzca el número de valores en cada celda; ingrese 5 para los datos de la tabla 12-4. Haga clic en OK. Para tablas de dos factores con exactamente un dato por celda, no se requieren los rótulos. Ingrese los datos muestrales como aparecen en la tabla. Seleccione Tools, luego Data Analysis, después Anova: Two-Factor Without Replication. En el cuadro de diálogo, introduzca el rango de entrada únicamente de los valores muestrales; no incluya rótulos en el rango de entrada. Haga clic en OK. TI-83>84 PLUS El programa A1ANOVA de la calculadora TI-83>84 Plus puede descargarse del CD-ROM incluido con este libro. Seleccione el archivo del software. El programa debe descargarse a la calculadora; luego, los datos muestrales deben ingresarse como una matriz D con tres columnas. Presione 2nd y la tecla x؊1. Muévase a la derecha hasta EDIT, muévase hacia abajo hasta [D], luego presione ENTER y proceda a ingresar el número total de valores de datos, seguido por 3 (para las tres columnas). La primera columna de D lista todos los datos muestrales, la segunda columna lista el número de renglón correspondiente y la tercera columna lista el número de columna correspondiente. Después de ingresar todos los datos, los números de renglón y los números de columna en la matriz D, presione PRGM, seleccione A1ANOVA y presione ENTER dos veces; luego elija RAN BLOCK DESI (para diseño de bloque aleatorio) y presione ENTER dos veces. Seleccione CONTINUE y presione ENTER. En un momento aparecen los resultados. F(A) es el estadístico de prueba F para el factor de renglón, el cual será seguido por el valor P correspondiente. F(B) es el estadístico de prueba F para el factor de columna, el cual será seguido por el valor P correspondiente. (Es necesario presionar ENTER para poder ver el resto de los resultados). F(AB) es el estadístico de prueba F para el efecto de interacción, y va seguido por el valor P correspondiente. 4. Interacción. A continuación aparece una gráfica de interacción generada con Minitab, similar en naturaleza a la figura 12-3. [Como en la figura 12-3, esta gráfica de interacción se basa en pesos de árboles, y los factores son el terreno (terreno 1 y terreno 2) y los tratamientos (ninguno, fertilizante, riego, fertilizante y riego)]. ¿Qué sugiere esta gráfica acerca de la interacción entre los dos factores? Minitab 661
  • 29. 662 Capítulo 12 Análisis de varianza Interpretación de la pantalla de resultados de una computadora: pesos de álamos. Los ejercicios 5 a 7 requieren de la siguiente pantalla de Minitab, que resulta de los pesos de álamos del segundo año que están listados en el conjunto de datos 7 del apéndice B. (La tabla 12-4 de esta sección incluye los pesos del primer año, pero la siguiente pantalla de Minitab se basa en los pesos del segundo año. El factor de renglón es el terreno (terreno 1 y terreno 2) y el factor de columna es el tratamiento (ninguno, fertilizante, riego, fertilizante y riego). Minitab 5. Efecto de interacción. Remítase a la pantalla de Minitab y ponga a prueba la hipótesis nula de que los pesos de los álamos no se ven afectados por una interacción entre el terreno y el tratamiento. ¿Qué concluye? 6. Efecto del terreno. Remítase a la pantalla de Minitab y suponga que los pesos de los álamos no se ven afectados por una interacción entre el terreno y el tratamiento. ¿Existe evidencia suficiente para sustentar la aseveración de que el terreno tiene un efecto sobre el peso? 7. Efecto del tratamiento. Remítase a la pantalla de Minitab y suponga que los pesos de los álamos no se ven afectados por una interacción entre el terreno y el tratamiento. ¿Existe evidencia suficiente para sustentar la aseveración de que el tratamiento tiene un efecto sobre el peso? Interpretación de una pantalla de resultados de computadora. En los ejercicios 8 a 10, utilice los resultados de Minitab obtenidos a partir de las puntuaciones listadas en la siguiente tabla. Los datos muestrales son calificaciones de la prueba SAT de las secciones verbal y de matemáticas (SAT-I) basadas en estadísticos reportados por el Consejo Universitario. Verbal Mujer Hombre 646 562 539 525 348 512 623 576 478 570 429 480 298 571 782 555 626 519 533 596 484 547 489 678 436 464 396 651 545 645 504 673 574 624 352 624 365 328 350 548 Matemáticas Mujer Hombre Minitab 8. Efecto de interacción. Pruebe la hipótesis nula de que las calificaciones de la prueba SAT no se ven afectadas por una interacción entre el género y la prueba (verbal>de matemáticas). ¿Qué concluye?
  • 30. 12-3 ANOVA de dos factores 9. Efecto del género. Suponga que las calificaciones de la prueba SAT no se ven afectadas por una interacción entre el género y el tipo de prueba (verbal>de matemáticas). ¿Existe suficiente evidencia para sustentar la aseveración de que el género tiene un efecto sobre las calificaciones de la prueba SAT? 10. Efecto del tipo de prueba del SAT. Suponga que las calificaciones de la prueba SAT no se ven afectadas por una interacción entre el género y el tipo de prueba (verbal>de matemáticas). ¿Existe evidencia suficiente para sustentar la aseveración de que el tipo de prueba (verbal>de matemáticas) tiene un efecto sobre las calificaciones del SAT? Interpretación de una pantalla de resultados de computadora: una observación por celda. En los ejercicios 11 y 12, remítase a la pantalla de resultados de Minitab. Esta pantalla resulta de un estudio en el que se aplicó una prueba de audición a 24 sujetos, empleando cuatro listas diferentes de palabras. Los 24 sujetos tenían una audición normal y las pruebas se llevaron a cabo sin sonido de fondo. El principal objetivo fue determinar si las cuatro listas eran igualmente difíciles de comprender. En la tabla original de las puntuaciones de la prueba de audición, cada celda tiene un dato. Los datos originales provienen del informe “A Study of the Interlist Equivalency of the CID W-22 Word List Presented in Quiet and in Noise”, de Faith Loven, Universidad de Iowa. Los datos originales están disponibles en DASL (Data and Story Library) de Internet. Minitab 11. Pruebas de audición: efecto de sujetos. Suponiendo que no existe un efecto sobre las puntuaciones de las pruebas de audición como resultado de una interacción entre el sujeto y las listas, ¿existe evidencia suficiente para sustentar la aseveración de que la selección del sujeto tiene un efecto en la puntuación de las pruebas de audición? Interprete el resultado explicando por qué tiene un sentido práctico. 12. Pruebas de audición: efecto de la lista de palabras. Suponiendo que no existe un efecto sobre las puntuaciones de las pruebas de audición como resultado de una interacción entre el sujeto y las listas, ¿existe evidencia suficiente para sustentar la aseveración de que la selección de la lista de palabras tiene un efecto en la puntuación de las pruebas de audición? En los ejercicios 13 y 14 utilice un programa de cómputo o una calculadora TI-83>84 Plus para obtener los resultados del análisis de varianza de dos factores. 13. Pulsos. La siguiente tabla lista pulsos del conjunto de datos 1 del apéndice B. ¿Se ven afectados los pulsos por una interacción entre el género y la edad? ¿Se ven afectados los pulsos por el género? ¿Se ven afectados los pulsos por la edad? Edad Menor de 20 Hombre Mujer 96 64 68 60 76 64 76 68 20–40 64 88 72 64 72 88 72 68 Mayor de 40 68 72 60 88 60 68 72 64 14. Tiempos de maratón. A continuación se presentan los tiempos (en segundos) de recorrido de la maratón de Nueva York, para corredores elegidos al azar que completaron la prueba. ¿Los tiempos de recorrido se ven afectados por una interacción entre el 663
  • 31. 664 Capítulo 12 Análisis de varianza género y el grupo de edad? ¿Los tiempos de recorrido se ven afectados por el género? ¿Los tiempos de recorrido se ven afectados por el grupo de edad? Tiempos (en segundos) de corredores de la maratón de Nueva York Edad 21–29 Hombres Mujeres 30–39 40 y mayores 13,615 18,784 14,256 10,905 12,077 16,401 14,216 15,402 15,326 12,047 14,677 16,090 14,086 16,461 20,808 15,357 16,771 15,036 16,297 17,636 14,528 17,034 14,935 14,996 22,146 17,260 25,399 18,647 15,077 25,898 12-3 MÁS ALLÁ DE LO BÁSICO 15. Transformaciones de datos. Suponga que se utiliza un ANOVA de dos factores para analizar datos muestrales consistentes en más de un dato por celda. ¿De qué manera se ven afectados los resultados del ANOVA en cada uno de los siguientes casos? a. Se añade la misma constante a cada valor muestral. b. Cada valor muestral se multiplica por la misma constante distinta de cero. c. Se traspone el formato de la tabla, de manera que se intercambien los factores de renglón y de columna. d. Se cambia el primer valor muestral de la primera celda, de manera que se convierte en un valor extremo. Repaso En la sección 9-3 presentamos un procedimiento para probar la igualdad entre dos medias poblacionales, pero en la sección 12-2 utilizamos el análisis de varianza de un factor para probar la igualdad de tres o más medias poblacionales. Este método requiere: 1. poblaciones distribuidas normalmente, 2. poblaciones con la misma desviación estándar (o varianza), y 3. muestras aleatorias simples que sean independientes entre sí. Los métodos del análisis de varianza de un factor se utilizan cuando tenemos tres o más muestras obtenidas de poblaciones que están caracterizadas de acuerdo con un solo factor. Las siguientes son características clave del análisis de varianza de un factor: q El estadístico de prueba F está basado en la razón de dos estimados diferentes de la varianza poblacional común s2, como se indica a continuación: F5 q varianza entre muestras CMsdel tratamientod 5 varianza dentro de muestras CMsdel errord Los valores críticos de F se pueden encontrar en la tabla A-5, pero nos enfocamos en la interpretación de los valores P que están incluidos como parte de un resultado por computadora. En la sección 12-3 consideramos el análisis de varianza de dos factores, con los datos categorizados de acuerdo con dos factores diferentes. Un factor se utiliza para ordenar los datos muestrales en renglones diferentes, mientras que el otro factor se emplea para columnas distintas. El procedimiento del análisis de varianza de dos factores está resumido la figura 12-4 y requiere que primero probemos si existe una interacción entre los dos factores. Si no
  • 32. Ejercicios de repaso existe una interacción significativa, entonces procedemos a elaborar pruebas individuales de los efectos de cada uno de los dos factores. También consideramos el análisis de varianza de dos factores para el caso especial en el que sólo existe una observación por celda. Dada la naturaleza compleja de los cálculos requeridos a lo largo de este capítulo, enfatizamos la interpretación de resultados por computadora. Conocimientos estadísticos y pensamiento crítico 1. Análisis de varianza. ¿Por qué se le llama análisis de “varianza” al método empleado para probar la igualdad de tres o más medias poblacionales, cuando las medias son los parámetros de interés? 2. ¿Cuál prueba? Un investigador médico realiza una prueba clínica de un fármaco creado para reducir el colesterol LDL. Se administraron 10 mg del fármaco a 50 sujetos, a otros 50 sujetos se les administraron 20 mg y a otros 50 se les administró un placebo. ¿Cuál método se debe utilizar para probar la igualdad de las tres cantidades medias de disminución del colesterol? 3. ¿Cuál prueba? Suponga que la prueba clínica del ejercicio 2 se modifica para excluir el tratamiento con 20 mg del fármaco. ¿Qué método debe usarse para probar la igualdad de las cantidades medias de disminución del colesterol en el grupo placebo y en el grupo de tratamiento con 10 mg? 4. ANOVA de dos factores. Un genetista reúne datos que consisten en el color de ojos; los colores se categorizan de acuerdo con el género (hombre, mujer) y el grupo de edad (menor de 30, 30 y mayor). ¿Se pueden emplear los métodos de este capítulo para probar los efectos del género y del grupo de edad sobre el color de ojos? ¿Por qué? Ejercicios de repaso 1. Interpretación de una pantalla de resultados de computadora: beber y conducir. El Associated Insurance Institute financia estudios sobre los efectos de la bebida al conducir. En uno de estos estudios, se seleccionaron al azar tres grupos de hombres adultos para un experimento que pretendía medir los niveles de alcohol en la sangre, después de haber consumido cinco bebidas. Los miembros del grupo A se probaron después de una hora, los miembros del grupo B se probaron después de dos horas, y los miembros del grupo C se probaron después de cuatro horas. Los resultados se presentan en la tabla adjunta; también se incluyen los resultados de Minitab para estos datos. Con un nivel de significancia de 0.05, pruebe la aseveración de que los tres grupos tienen el mismo nivel medio. A C 0.11 0.10 0.09 0.09 0.10 Minitab B 0.08 0.09 0.07 0.07 0.06 0.04 0.04 0.05 0.05 0.06 0.04 0.05 665
  • 33. 666 Capítulo 12 Análisis de varianza 2. Puntuaciones de facilidad de lectura. A continuación se muestran puntuaciones en la escala de Flesch sobre la facilidad de lectura de 12 páginas seleccionadas al azar de: El oso y el dragón, de Tom Clancy; Harry Potter y la piedra filosofal, de J. K. Rowling; y La guerra y la paz, de León Tolstoi. Utilice un nivel de significancia de 0.05 para probar la aseveración de que los tres libros tienen la misma puntuación media de facilidad de lectura de Flesch. Con base en los resultados, ¿parece que los tres libros tienen el mismo nivel de lectura? Clancy: 58.2 73.4 73.1 64.4 72.7 89.2 43.9 76.3 76.4 78.9 69.4 72.9 Rowling: 85.3 84.3 79.5 82.5 80.2 84.6 79.2 70.9 78.6 86.2 74.0 83.7 Tolstoi: 69.4 64.2 71.4 71.6 68.5 51.9 72.2 74.4 52.8 58.4 65.4 73.6 Interpretación de una pantalla de resultados de computadora. En los ejercicios 3 a 5, utilice la pantalla de resultados de Minitab que proviene de los valores listados en la tabla adjunta. Los datos muestrales son estimados de los estudiantes (en pies) de la longitud de su salón de clases. La longitud real del salón de clases es de 24 pies, 7.5 pulgadas. Área de estudios Matemáticas Mujer Hombre Negocios Artes liberales 28 25 30 25 30 20 35 25 20 30 24 25 40 21 30 25 20 32 Minitab 3. Efecto de interacción. Pruebe la hipótesis nula de que las longitudes estimadas no se ven afectadas por una interacción entre el género y el área de estudios. 4. Efecto del género. Suponga que las longitudes estimadas no se ven afectadas por una interacción entre el género y el área de estudios. ¿Existe evidencia suficiente para sustentar la aseveración de que la longitud estimada se ve afectada por el género? 5. Efecto del área de estudios. Suponga que las longitudes estimadas no se ven afectadas por una interacción entre el género y el área de estudios. ¿Existe evidencia suficiente para sustentar la aseveración de que la longitud estimada se ve afectada por el área de estudios? 6. Tabaquismo, temperatura corporal y género. La tabla adjunta lista temperaturas obtenidas de sujetos elegidos al azar (según el conjunto de datos 2 del apéndice B). Las temperaturas están clasificadas de acuerdo con el género y el hábito del tabaquismo. Utilice un nivel de significancia de 0.05 para probar una interacción entre el género y el hábito del tabaquismo, para probar un efecto del género y para probar un efecto del hábito del tabaquismo. ¿Qué concluye? Fuma Hombre Mujer 98.4 98.8 98.4 98.0 99.4 98.7 No fuma 98.6 98.4 98.0 97.7 98.0 98.0 98.8 98.2 97.0 99.1 7. Contaminación de automóviles. La tabla adjunta lista las cantidades de gases de invernadero emitidos por diferentes automóviles en un año.
  • 34. Ejercicios de repaso a. Suponiendo que no existe un efecto de interacción, ¿existe evidencia suficiente para sustentar la aseveración de que las cantidades de gases de invernadero emitidas se ven afectadas por el tipo de transmisión (automática>manual)? b. Suponiendo que no existe un efecto de interacción, ¿existe evidencia suficiente para sustentar la aseveración de que las cantidades de gases de invernadero emitidas se ven afectadas por el número de cilindros? c. Con base en los resultados de los incisos a) y b), ¿podemos concluir que la emisión de gases de invernadero no se ve afectada por el tipo de transmisión o el número de cilindros? ¿Por qué? > Emisión de gases de invernadero (toneladas>año) 4 cilindros Automática Manual 6 cilindros 8 cilindros 10 10 12 12 14 12 8. Longevidad. Consulte la siguiente tabla que lista el número de años (desde 1690) que los presidentes estadounidenses, los papas y los monarcas británicos vivieron después de que asumieron su respectivo cargo. Determine si los tiempos de supervivencia de los tres grupos difieren. (Tabla basada en datos de Computer-Interactive Data Analysis, de Lunn y McNeil, John Wiley & Sons). Presidentes Washington J. Adams Jefferson Madison Monroe J. Q. Adams Jackson Van Buren Harrison Tyler Polk Taylor Fillmore Pierce Buchanan Lincoln A. Johnson Grant Hayes Garfield Arthur Papas 10 29 26 28 15 23 17 25 0 20 4 1 24 16 12 4 10 17 16 0 7 Alejandro VIII Inocencio XII Clemente XI Inocencio XIII Benedicto XIII Clemente XII Benedicto XIV Clemente XIII Clemente XIV Pío VI Pío VII León XII Pío VIII Gregorio XVI Pío IX León XIII Pío X Benedicto XV Pío XI Pío XII Juan XXIII Reyes y reinas 2 9 21 3 6 10 18 11 6 25 23 6 2 15 32 25 11 8 17 19 5 Jaime II María II Guillermo III Ana Jorge I Jorge II Jorge III Jorge IV Guillermo IV Victoria Eduardo VII Jorge V Eduardo VIII Jorge VI 17 6 13 12 13 33 59 10 7 63 9 25 36 15 continúa 667
  • 35. 668 Capítulo 12 Análisis de varianza Presidentes Cleveland Harrison McKinley T. Roosevelt Taft Wilson Harding Coolidge Hoover F. Roosevelt Truman Kennedy Eisenhower L. Johnson Nixon Reagan Papas 24 12 4 18 21 11 2 9 36 12 28 3 16 9 25 23 Paulo VI Juan Pablo I Juan Pablo II Reyes y reinas 15 0 26 Ejercicios de repaso acumulativo 1. Longevidad. Remítase al número de años que los presidentes estadounidenses, los papas y los monarcas británicos vivieron después de asumir el cargo. Los datos se presentan en la tabla del ejercicio de repaso 8. a. Calcule la media para cada uno de los tres grupos. b. Calcule la desviación estándar para cada uno de los tres grupos. c. Pruebe la aseveración de que existe una diferencia entre la media de los presidentes y la media de los monarcas británicos. d. Considere la longevidad de los presidentes y determine si los datos parecen provenir de una población con una distribución normal. Explique por qué la distribución parece o no ser normal. e. Considere la longevidad de los presidentes y construya un estimado de un intervalo de confianza del 95% para la media poblacional. 2. Tratamiento M&M. La tabla que se presenta a continuación incluye 60 calificaciones del SAT, separadas en categorías de acuerdo con el color de los dulces M&M utilizados como tratamiento. Las calificaciones del SAT están basadas en datos del Consejo Universitario, y el elemento del color de los dulces M&M está basado en un capricho del autor. a. Calcule la media de las 20 calificaciones del SAT en cada una de las tres categorías. Al parecer, ¿las tres medias son aproximadamente iguales? b. Calcule la mediana de las 20 calificaciones del SAT en cada una de las tres categorías. Al parecer, ¿las tres medianas son aproximadamente iguales? c. Calcule la desviación estándar de las 20 calificaciones del SAT en cada una de las tres categorías. Al parecer, ¿las tres desviaciones estándar son aproximadamente iguales? d. Pruebe la hipótesis nula de que no existe una diferencia entre la calificación media del SAT de los sujetos tratados con dulces M&M rojos y la calificación media del SAT de sujetos tratados con dulces M&M verdes.
  • 36. Actividades de cooperación en equipo 669 e. Construya un estimado del intervalo de confianza del 95% para la puntuación media del SAT de la población de sujetos que recibieron el tratamiento de dulces M&M rojos. f. Pruebe la hipótesis nula de que las tres poblaciones (tratamientos con dulces M&M rojos, verdes y azules) tienen la misma calificación media en el SAT. Rojo 813 996 1030 1257 898 743 921 1179 855 896 858 1095 1133 896 1190 908 699 996 630 583 828 1121 993 1025 907 1111 1147 780 916 793 1188 499 1180 1229 1450 1071 1153 706 1068 1013 892 1370 1590 939 1004 821 915 866 Azul 621 1092 Verde 1130 848 1408 793 1097 1244 996 1131 1039 1159 3. Genes azules. Algunas parejas tienen características genéticas que causan que una cuarta parte de sus descendientes tengan ojos azules. Se realiza un estudio con 100 parejas que se cree tienen esas características, y los resultados revelan que 19 de sus 100 descendientes tienen ojos azules. Suponiendo que una cuarta parte de todos los descendientes tienen ojos azules, estime la probabilidad de que, de 100 descendientes, 19 o menos tengan ojos azules. Con base en esa probabilidad, ¿parece que la proporción de una cuarta parte es incorrecta? ¿Por qué? 4. Pesos de bebés: cálculo de probabilidades. En Estados Unidos los pesos de los recién nacidos se distribuyen de manera normal, con una media de 7.54 lb y una desviación estándar de 1.09 lb (según datos de “Birth Weight and Prenatal Mortality”, de Wilcox, Skjaerven, Buekens y Kiely, Journal of the American Medical Association, vol. 273, núm. 9). a. Si se selecciona al azar a un bebé recién nacido, ¿cuál es la probabilidad de que pese más de 8.0 lb? b. Si se seleccionan al azar 16 bebés recién nacidos, ¿cuál es la probabilidad de que su peso medio sea mayor de 8.0 lb? c. ¿Cuál es la probabilidad de que cada uno de los siguientes tres bebés nazca con un peso mayor de 7.54 lb? Actividades de cooperación en equipo 1. Actividad fuera de clase El World Almanac and Book of Facts incluye una sección llamada “Personalidades notables”, con apartados correspondientes a arquitectos, artistas, líderes de negocios, caricaturistas, científicos sociales, líderes militares, filósofos, líderes políticos, científicos, escritores, compositores y animadores, entre otros. Diseñe y realice un estudio observacional que inicie con la selección de muestras de grupos selectos, seguida por una comparación de los tiempos de vida de personas de distintas categorías. ¿Algunos grupos en particular parecen tener tiempos de vida diferentes en comparación con los otros grupos? ¿Puede usted explicar estas diferencias? 2. Actividad en clase Comience pidiendo a cada estudiante en la clase que estime la longitud del salón de clases. Especifique que la longitud es la distancia entre el pizarrón y la pared opuesta. (Véase la sección de ejercicios de repaso 3-5). En el mismo papel, cada estudiante debe anotar también su género (hombre>mujer) y área de estudios. Después formen grupos de tres o cuatro miembros y utilicen los datos de toda la clase para plantear estas preguntas: q ¿Existe una diferencia significativa entre el estimado medio de los hombres y el estimado medio de las mujeres? q ¿Existe evidencia suficiente para rechazar la igualdad de los estimados medios en las diferentes áreas de estudio? Describa cómo se clasificaron las áreas de estudio.
  • 37. 670 Capítulo 12 q q q Análisis de varianza ¿La interacción entre el género y el área de estudios tiene algún efecto sobre la longitud estimada? ¿Parece que el género tiene un efecto sobre la longitud estimada? ¿Parece que el área de estudios tiene un efecto sobre la longitud estimada? 3. Actividad fuera de clase Formen grupos de tres o cuatro estudiantes. Cada grupo debe encuestar a otros estudiantes de la misma universidad y pedirles que identifiquen su área de estudios y género. También podría incluir otros factores, tales como el empleo (ninguno, de medio tiempo, de tiempo completo) y la edad (menos de 21, 21-30, más de 30). Para cada sujeto encuestado, determine la exactitud de la hora de su reloj de pulso. Primero ponga su reloj a la hora correcta por medio de una fuente exacta y confiable del tipo “Cuando escuche el tono, la hora es . . .”. Registre una hora positiva para los relojes que están adelantados. Registre una hora negativa para los relojes que están atrasados. Utilice los datos muestrales para plantear preguntas como éstas: q ¿Parece que el género tiene algún efecto sobre la exactitud de los relojes de pulso? q ¿El área de estudios tiene algún efecto sobre la exactitud de los relojes de pulso? q ¿La interacción entre el género y el área de estudios tiene algún efecto sobre la exactitud de los relojes de pulso? Proyecto tecnológico Remítase a los datos muestrales de la tabla 12-4 (página 655). Los resultados en la sección 12-3 mostraron que los datos llevaron a la conclusión de que no hay interacción entre el terreno y el tratamiento, que no hay un efecto del terreno, pero que sí existe un efecto del tratamiento. (Sugerencia: Gráficas de interacción similares a las de la figura 12-3 le serán útiles para lo siguiente). a. Modifique los valores del terreno 1 y del cuarto tratamiento (fertilizante y riego), de manera que haya una interacción entre el terreno y el tratamiento. b. Modifique los valores del terreno 1 y del cuarto tratamiento (fertilizante y riego), de manera que no haya una interacción entre el terreno y el tratamiento, que no haya un efecto del terreno y que no haya un efecto del tratamiento. c. Trate de modificar los valores del terreno 1 y del cuarto tratamiento (fertilizante y riego), de manera que no haya interacción, pero que sí haya un efecto del terreno y no haya un efecto del tratamiento. Si no se puede modificar esa celda para lograr los resultados deseados, modifique otras celdas según sea necesario.
  • 38. De los datos a la decisión De los datos a la decisión Pensamiento crítico: ¿Debe usted aprobar este fármaco? Los fármacos deben ser sometidos a pruebas exhaustivas antes de ser aprobados para su uso general. Además de probar sus reacciones adversas, también debe probarse su eficacia, y el análisis de este tipo de resultados de pruebas suelen incluir métodos estadísticos. Considere la creación del Xynamine, un nuevo fármaco diseñado para disminuir la frecuencia cardiaca. Para obtener resultados más consistentes, que no incluyan una variable confusa del género, el fármaco se prueba únicamente en hombres. Abajo se incluyen los pulsos de un grupo placebo, de un grupo de hombres tratados con Xynamine en dosis de 10 mg y de un grupo de hombres tratados con Xynamine en dosis de 20 mg. El director del proyecto del fármaco realiza la investigación y encuentra que en hombres adultos el pulso se distribuye normalmente, con una media de alrededor de 70 latidos por minuto y una desviación estándar de aproximadamente 11 latidos por minuto. El resumen de su informe afirma que el fármaco es eficaz, con base en esta evidencia: el grupo placebo tiene un pulso medio de 68.9, que se acerca al valor de 70 latidos por minuto de los hombres adultos en general, pero el grupo tratado con dosis de 10 mg de Xynamine tiene una media más baja de 66.2, y el grupo tratado con dosis de 20 mg de Xynamine tiene la media más baja de 65.2. Análisis de los resultados Analice los datos utilizando los métodos de este capítulo. Con base en los resultados, ¿parece que existe evidencia suficiente para sustentar la aseveración de que el fármaco reduce la frecuencia cardiaca? ¿Existen algunos problemas graves en el diseño de este experimento? Dado que únicamente se incluyeron hombres en el experimento, ¿los resultados también son aplicables a las mujeres? El director del proyecto comparó los pulsos postratamiento con el pulso medio de hombres adultos. ¿Existe alguna forma mejor de medir la eficacia del fármaco para disminuir el pulso? ¿Cómo calificaría la validez general del experimento? Con base en los resultados disponibles, ¿debe aprobarse el fármaco? Escriba un breve reporte que resuma sus hallazgos. 671 Grupo placebo Grupo de tratamiento con 10 mg Grupo de tratamiento con 20 mg 77 61 66 63 81 75 66 79 66 75 48 70 67 48 79 67 57 71 66 85 75 77 57 45 72 94 57 63 69 59 64 82 34 76 59 53
  • 39. 672 Capítulo 12 Análisis de varianza Análisis de varianza Visite el sitio de Internet de este libro en http://www.pearsoneducacion.net/triola Proyecto de Internet Siga el vínculo del Proyecto de Internet de este capítulo. El proyecto incluye antecedentes para experimentos en áreas tan variadas como el de- sempeño atlético, la etiquetación de productos de consumo y la biología del cuerpo humano. En cada caso, los datos asociados se podrán agrupar de forma ideal para la aplicación de las técnicas este capítulo. Usted Fórmulará las hipótesis apropiadas, después realizará y resumirá pruebas ANOVA.
  • 40. La estadística en el trabajo 673 La estadística en el trabajo “Si no tuviera conocimientos ¿Qué hace usted en su trabajo? de estadística, no sería Mis responsabilidades incluyen la organización y evaluación de estudios toxicológicos, elaborar hojas de cálculo sobre la seguridad de los materiales y ayudar a nuestros grupos de investigación y desarrollo a producir materiales que sean seguros tanto para las personas como para el ambiente y a comprender qué daños potenciales pueden producir esos materiales. capaz de comprender plenamente los datos que genera mi empresa . . . ni de ayudar a proteger a nuestros empleados y clientes”. ¿Qué conceptos de estadística utiliza? El principal concepto que utilizo es la prueba de hipótesis (pruebas de probabilidad). ¿Cómo utiliza la estadística en el trabajo? Jeffrey Foy Jeffrey Foy es toxicólogo y trabaja para la Cabot Corportion, una empresa de productos químicos. Jeffrey Foy también es responsable de evaluar los peligros de las sustancias químicas que produce la Cabot Corporation. Su trabajo consiste en entender de qué manera los productos de la empresa pueden afectar a los seres humanos o al ambiente, y en tomar decisiones sobre las mejores formas de proteger ambos. Utilizo la estadística todos los días. Los métodos estadísticos se han utilizado y se siguen utilizando de dos formas en mi trabajo. En primer lugar, la estadística se utiliza para determinar la forma en que diseño mis experimentos. En segundo lugar, la estadística se usa para determinar si los datos generados son significativos o para saber si son lo suficientemente buenos para utilizarlos. Los estudios en que participo pueden costar desde $1000 hasta $500,000 o más, y si no determino de manera apropiada la forma en que voy a evaluar los datos, esto podría costar a la empresa una gran cantidad de tiempo y dinero. Si el experimento se realiza adecuadamente, entonces procedemos a analizar los datos. Los datos de los estudios que realizamos se utilizan para evaluar cual- quier efecto potencial que muchos productos pueden tener en la salud de nuestros empleados, clientes o en el ambiente. Los resultados se utilizan para determinar la manera en que se pueden vender o manejar los productos químicos. Cuando se realizan experimentos en un laboratorio de pruebas o en una compañía farmacéutica, se busca determinar si los materiales tienen algún efecto, ya sea deseable (como un fármaco que cura una enfermedad) o indeseable (por ejemplo, si un fármaco es tóxico). La estadística tiene un papel muy importante en nuestra evaluación de la importancia de los efectos. Por favor, describa un ejemplo específico que ilustre cómo el uso de la estadística tuvo éxito en mejorar un producto o servicio. Hace poco tiempo realizamos un estudio toxicológico que costó alrededor de $300,000. Los datos del estudio se utilizarían para determinar si cierto producto químico causaba algún efecto en los sujetos estudiados. Después de que se llevó a cabo el estudio, se descubrieron fallas en los datos y en los estadísticos utilizados. Se requirieron dos años más para revisar los datos adecuadamente y finalizar la evaluación de salud. Si se hubieran elegido los métodos y los términos apropiados, tal vez no se hubiera requerido de tiempo y dinero adicionales. La comprensión de los datos y la evaluación estadística correcta ayudó a prevenir un fracaso y una posible repetición del estudio.

×