Estadistica aplicada a la educación superior
Upcoming SlideShare
Loading in...5
×
 

Estadistica aplicada a la educación superior

on

  • 1,454 views

Curso donde se incluye regresión lineal simple y los principales diseños experimentales

Curso donde se incluye regresión lineal simple y los principales diseños experimentales

Statistics

Views

Total Views
1,454
Views on SlideShare
1,454
Embed Views
0

Actions

Likes
1
Downloads
61
Comments
1

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Estadistica aplicada a la educación superior Estadistica aplicada a la educación superior Document Transcript

  • ESCUELA MILITAR DE INGENIERIAUNIDAD ACADÉMICA SANTA CRUZUNIDAD DE POSTGRADOESTADÍSTICA APLICADA A LA EDUCACIÓNSUPERIORPor: Ing. M.Sc. Francisco Martínez SolarisMgs. En Educación SuperiorSanta Cruz, Mayo del 2013
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorINTRODUCCIONLa investigación sobre el aprendizaje y la enseñanza ha avanzada tremendamente, y losinvestigadores buscan contribuir a la mejora de la educación. Sin embargo, continúan las quejassobre la brecha entre la teoría/investigación por un lado, y las prácticas educativas, por el otro.Una manera potencial para remediar la brecha entre teoría y práctica es llevar a caboexperimentos de diseño que:- Buscan desarrollar una ciencia de diseño de la educación.- Puedan guiar el desarrollo de ambientes de aprendizaje eficaces novedososLa experimentación es instrumento de vital importancia para la investigación ya que por mediode ella, el investigador es capaz de simular un fenómeno de interés, lo que conduce a unainvestigación más rápida, efectiva, de menor riesgo y con un rigor científico, siempre y cuandoexista una previa planificación de la investigación.Existen diferentes tipos de investigaciones que pueden generar conocimientos ya sean básicos obien aplicables. Independientemente del tipo de conocimiento que genere una investigación, éstetiene que someterse a una valoración científica. Para esto la estadística ofrece herramientascomo los DISEÑOS EXPERIMENTALES de los cuales el investigador se vale para demostrarsus conjeturas, aceptar o no una hipótesis, comparar resultados, emitir conclusiones, etc. acercadel problema o fenómeno en estudio."Las teorías basadas en ideologías carecen de experimentación, y por ello, no son ciencia, loque no se demuestra con experimento es política. Lo que se demuestra con experimentación, esciencia (Robert Laughlin, Premio Nobel de Física 1998).Ing. M.Sc. Francisco Martínez Solaris
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior1. REGRESION Y CORRELACION LINEAL SIMPLE1.1 Regresión Lineal SimpleEn muchas áreas de la investigación científica, la variación en las mediciones de unavariable en estudio es causada preponderantemente por otras variables relacionadas cuyasmagnitudes cambian en el curso del experimento. La incorporación explícita de los datos deestas variables que influyen en el análisis estadístico, permite conocer la naturaleza de lasrelaciones y utilizar esta información para mejorar la descripción y las inferencias de lasvariables de interés primario.Al probar las relaciones entre variables es importante que el valor de la variable pueda serpredicha de las observaciones de otra variable o aún controladas y optimizadasmanipulando los factores de influencia.El análisis de regresión es un conjunto de métodos estadísticos, que tratan con laformulación de modelos matemáticos que describen las relaciones entre variables y el usode estas relaciones modeladas con el propósito de predecir e inferir.Supuestos del modelo de Regresión Lineal SimpleAl igual que en otros tipos de análisis estadísticos, el modelo de Regresión Lineal Simplese basa en ciertos supuestos que a continuación se detallan.Supuesto 1. "Y" es una variable aleatoria cuya distribución probabilística depende de"X"Este supuesto quiere decir que para cualquier valor de "X", "Y" es una variable aleatoriacon cierta distribución probabilística con media μy/x y σ²y/x. Note que esta suposiciónsolamente implica que "Y" es una variable aleatoria que depende de "X", y no toma encuenta la forma lineal. Por otra parte, significa que la variable X se mide sin error y fijadapor el investigador.Supuesto 2. Modelo de la línea rectaEsta suposición requiere que la ecuación para μy/x sea una línea recta, es decir que μy/x = ß0+ ß1Xi y, por lo tanto, que la ecuación de dependencia sea Y = ß0 + ß1Xi + ε. Con esta
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorrestricción, la línea que une a μy/x debe de ser una recta, por lo tanto se puede tener una delas siguientes situaciones:Puede ser que se tenga una relación positiva entre las variables X y Y, esto quiere decir quea medida que aumenta X, Y también aumenta.Otra situación que se puede dar es una relación inversa, es decir, que a medida que aumentaX, Y disminuye.En el último caso se recurre al hecho de que regresión también se entiende como latangente inversa del ángulo de inclinación de una recta. En los dos primeros casos las rectastienen pendiente y en el tercer caso, no hay pendiente lo cual indica que no existe regresiónlineal entre ambas variables.Supuesto 3. Homogeneidad de varianzaEsta suposición es muy importante en el análisis de regresión. La varianza de ladistribuciones de "Y" son idénticas para todos los valores de "X". En otras palabras, sesupone que σ²y/x1 = σ²y/x2 = σ²y/xn = σ², donde σ² es la varianza común (desconocida) paratodas las distribuciones de "Y", independientemente del valor de "X". Esto quiere decir,que la media de "Y" se modifica con el valor de "X", pero la varianza se mantieneconstante.Supuesto 4. IndependenciaLos valores de "Y" deberán ser estadísticamente independiente. Un ejemplo donde se violaeste supuesto es cuando se realizan mediciones de peso a un mismo individuo en un lapsomenor a una hora.Supuesto 5. NormalidadLa distribución de "Y" para cualquier valor de "X" es normal. Esto equivale a suponer quela variable aleatoria no observable ε es normal y su media es cero ya que "X" se tomacomo variable no aleatoria susceptible a ser manipulada por el investigador.YX
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorTodos los supuestos anteriores se pueden resumir en los siguientes:1. "Y" es una variable aleatoria cuya distribución probabilística depende del valor de "X".2. La ecuación de regresión es una línea recta.3. Homogeneidad de varianza.4. Independencia de las observaciones lo que implica que los errores son independientes.5. Normalidad.En la Figura 1 se muestran los supuestos de normalidad y homogeneidad de varianza.1.2. Diagrama de DispersiónEste diagrama tiene por objetivo dar una idea de la posible relación existente entre lavariable dependiente Y y la independiente X.Para realizar un diagrama de dispersión se coloca en el eje de las abscisas los valorescorrespondiente a la variable independiente X y en el eje de las ordenadas los valores de lavariable dependiente Y. Luego se colocan puntos en la intersección de los valores de ambasvariables. Un ejemplo de lo anterior se muestra en seguida.Los datos que se muestran a continuación corresponden a la producción en miles demillones de dólares de 10 empresas y sus costos de producción de las mismas en miles demillones de dólares.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorPara construir un diagrama de dispersión lo primero que se tiene que hacer es determinarquién es la variable dependiente y quién es la variable independiente, es decir, establecer larelación entre dichas variables. Esta relación debe ser lo más natural posible.En el caso del problema, es de suponerse que a medida que aumenta la producción tambiénse incrementarán los costos de producción por todo lo concerniente a ello (materia prima,horas hombres, gastos de energía, etc.). Entonces definimos a X, variable independiente, ala Producción y a Y, variable dependiente, a los costos de producción. De acuerdo a esto setiene lo siguiente:Producción (X)(miles de millones de $us)Costo (Y)(miles de millones $u)10 318 512 416 522 836 1230 1032 1426 1212 3El diagrama de dispersión quedaría de la siguiente forma:De acuerdo a la información que proporciona el diagrama de dispersión se puede observarque a medida que aumenta la producción de las industrias, aumentan los costos de02468101214160 5 10 15 20 25 30 35 40Costo(Milesdemillones$us)Producción (Miles de Millones $us)
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorproducción de las mismas, es decir, se concluir que existe una relación positiva entre estasvariables y además se puede ver que esta relación tiende a ser lineal.1.3. Método de Mínimos CuadradoComo lo plantea el supuesto 2 del modelo de regresión lineal simple, "Modelo de la LíneaRecta", que de existir una relación entre X y Y, ésta debe ser una línea recta. Entonces apartir de muestra (x1, y1), (x2, y2),..., (xn, yn), de las variables "X" y "Y", se trata deobtener una ecuación que represente la relación entre dichas variables. El modelo del cualse habla es de una ecuación punto pendiente como sigue:El problema de esta modelo es que sus componentes son parámetros y por lo tanto, sonestados desconocidos de la naturaleza generalmente. Es por ello que es necesario obtenerestimadores de ß0 y ß1 para estimar adecuadamente la recta de regresión μy/xi. Elestimador de μy/xi se denota por: ̂ ̂ ̂Para llegar a obtener estos estimadores se hace uso de la técnica propuesta por Carl Gauss(1777-1855). Este método se basa en la idea de obtener estimadores para los componentesdel modelo que minimicen la suma de cuadrados de las distancias entre los valoresobservados (Yi) y los estimados (̂ ). Esto significa que se tiene que minimizar la suma decuadrados de las longitudes de los segmentos de las líneas verticales que unen los datosobservados con la recta estimada como se muestra en la Figura 3.A la técnica antes mencionada se le denomina "Técnica de Mínimos Cuadrados". Usandonotación matemática, el método de mínimo cuadrados consiste en encontrar los estimadoresde ß0 y ß1.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorAl aplicar la técnica de mínimos cuadrados se llegan a obtener las ecuaciones de trabajo dê y ̂1^ (en este caso se ha omitido los procesos de derivación mediante el cual se llega aobtener las fórmulas de trabajo). Estas ecuaciones son las siguientes:̂∑∑ ∑∑(∑ );̂ ̂ ̅. Donde:̂ Coeficiente de Regresión̂ Intercepto de la recta de estimaciónEjemplo:Retomando los datos que se utilizaron para construir el diagrama de dispersión y aclarandoque “X” es Producción (miles de millones de $us) y “Y” Costos (miles de millones de $us)y haciendo uso de las ecuaciones derivadas a través de la técnica de mínimos cuadrados setiene lo siguiente:X Y XY X2Y210 3 30 100 918 5 90 324 2512 4 48 144 1616 5 80 256 2522 8 176 484 6436 12 432 1296 14430 10 300 900 10032 14 448 1024 19626 12 312 676 14412 3 36 144 9Totales 214 76 1952 5348 732Promedio 21.4 7.6̂∑∑ ∑∑(∑ ); ̂( )= 0.423738, Coeficiente de regresión
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior̂ ̂ ̅; ( ) ; Intercepto, por lo tanto laecuación de estimación quedaría de la siguiente manera:̂ ; o bien se puede decir que:Costos = 0.423738 (Producción) – 1.46798Un aspecto que no se debe olvidar es que el propósito de la Regresión Lineal Simple es elde predecir el comportamiento de una variable dependiente a través del conocimiento deuna variable independiente, es por ello que se debe estar seguro que la ecuación deestimación sirve para este propósito (que existe regresión lineal simple). Por esta razón esque la ecuación de estimada debe ser sometida a un proceso de validación.1.4. Validación de la Ecuación de EstimaciónEste proceso se puede realizar de dos maneras a saber: A través del Cálculo del Coeficiente de Determinación (R2) Por medio del Análisis de Varianza de la Regresión (ANARE)Coeficiente de Determinación (R2) o Variabilidad (varianza explicada)El Coeficiente de Determinación, R2, indica el porcentaje de la variabilidad de “Y” quepuede ser explicada o debida a “X”, es por ello que mientras más cerca esté del 100% esmucho mejor. Esto es debido a que se trata de predecir el comportamiento de “Y” a travésdel conocimiento de “X”, es por ello que es deseable que el mayor porcentaje de lavariabilidad de la variable dependiente sea debida a “X”, a tal punto que hay autores queconsideran que la ecuación es buena o sirve para predecir si R2≥ 70%.El coeficiente de Determinación se calcula a través de la siguiente ecuación:⌈⌈⌈⌈⌈ ∑(∑ ∑ )√(∑(∑ )) (∑(∑ ))⌉⌉⌉⌉⌉Para el caso del ejemplo anterior el R2es el siguiente:
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior⌈⌈⌈⌈⌈ ( )√(( )) (( ))⌉⌉⌉⌉⌉Este dato indica que del 100% de la variabilidad de Y (Costos), el 89.36% es debido a X(Producción), por lo tanto también se puede concluir que existe un 10.64% de variabilidadde Y (Costos) que no es debida a X (Producción), a esto se le conoce como variabilidad noexplicada. En este caso se puede concluir también que la ecuación estimada sirve parapredecir (existe regresión lineal simple.Análisis de Varianza de la Regresión Lineal Simple (ANARE)De forma general se entienden por análisis de varianza a la partición de la variabilidad totalen fuentes de variación conocidas que en el caso de regresión lineal son las siguientes: debida a la regresión debida a otras causas (error)Para tratar de ser un poco más explícito, estas dos fuentes de variación se derivan delmodelo aditivo lineal de la regresión línea simple el cual es:Esto tiene correspondencia con una tabla de varianza o salida devarianza que para regresión lineal simple es la siguiente:FV gl SC CM Fc FtRegresión1SCRegresión (α, glreg, glerr)Errorn-2SCErrorTotal n-1 SCTotalesLa primera columna encabezada por FV (Fuentes de variación) es donde se declara lasfuentes de variación en las que se está partiendo la variabilidad total. Nótese que en estatabla no se incluye el efecto de , ya que éste es una constante por lo tanto no es unafuente de variación.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorLa segunda columna encabeza por “gl” (Grados de Libertad). De forma general grados delibertad es “n-1”, para el caso de la fuente de variación debida a regresión siempre es 1 yaque son dos los parámetros que se estiman, β0 y β1, por lo tanto, 2-1 = 1. Es por ello quepara el ANARE de regresión lineal simple, esta fuente de variación siempre tiene 1 gradode libertad y los grados de libertad del error, siempre en este caso, son n-2. Por “n” seentiendo al conjunto de pares de datos “X” “Y”.La tercera columna es la de Suma de Cuadrados (SC) que vienen a ser los componentes delas varianza a estimar cuyas ecuaciones de trabajo son las siguientes:∑(∑ )̂ (∑∑ ∑)La cuarta columna es para los Cuadrados Medios (CM) que viene a ser las estimacionespropiamente dichas de las varianza de cada una de las fuentes de variación. Estas resultande dividir las sumas de cuadrados de éstas entre sus grados de libertad.La quinta columna denominada como “Fc” se refiere a los “F” calculados que resultan dedividir el cuadrado medio de regresión entre el cuadrado medio del error, es decir, de lavariabilidad no debida a la regresión. Es por ello que el error se considera como un términode comparación entre la variabilidad debida a regresión y el mismo. Si el cuadrado mediodel error es mayor que el cuadrado medio de regresión, el resultado que se obtendrá serápequeño y posiblemente menor que el valor de la siguiente columna “Ft” o “F” de tabla,valor que se extrae de una tabla de “F” con un nivel de significancia, grados de libertad deregresión y los grados de libertad del error.Para entender mejor lo anterior se debe de partir del juego de hipótesis que se prueba en unANARE. Este es:Ho: β1 = 0Ha: β1  0La hipótesis nula (Ho) asume el efecto de igual o nulidad de efecto y es la hipótesis que sesomete a prueba. Partiendo del hecho de que asume el efecto de nulidad, en este caso indica
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorque no existe regresión lineal simple, y asume que la relación entre X y Y es una línea rectasin pendiente, es por ello que es igual a cero.Por hipótesis alternativa se entiende aquella que contradice a la hipótesis nula y que esaceptada una vez que se rechaza la hipótesis nula. Es por ello que está como β1  0 ya queuna igualdad se contradice con una desigualdad. Esto significa que la recta tiene pendiente,es decir, que existe regresión lineal simple.Ahora bien, todo el ANARE se hace para realizar la prueba de hipótesis de que si existe ono regresión lineal simple.Se entiende como prueba de hipótesis al proceso a través del cual se prueba la plausibilidadde una hipótesis.Al realizar la prueba de hipótesis se debe llegar una decisión de aceptar o rechazar Ho.¿Cuándo no se rechaza Ho?, cuando el Fc  Ft y se rechaza cuando el Fc  Ft. A lo anteriorse le llama Regla de Decisión la cual es la siguiente:No Rechazo de Ho si Fc  FtRechazo de Ho si Fc  FtSi la hipótesis nula no se rechaza significa que no existe regresión lineal simple, por lotanto la ecuación estimada no sirve para predecir, si se rechaza Ho, inmediatamente seacepta la hipótesis alternativa la que indica que sí existe regresión lineal simple.Un aspecto que todavía no se ha aclarado es “Nivel de Significancia, α, ” entendido comola probabilidad de tomar una decisión equivocada (conocido también como Error Tipo I) espor ello que los valores del α son pequeños  0.1.Haciendo el ANARE a un α = 0.01 se tiene lo siguiente:( )= 154.4( )Vaciando esta información en la tabla de ANARE se tiene lo siguiente y obteniendo elvalor de F de la tabla correspondiente a: 0.01, 1 y 8 se tiene que este es: 11.26
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorFV gl SC CM Fc FtRegresión 1 137.6897 137.6897 67.0389 11.26Error 8 16.4310 2.053875Total 9 154.4De los resultados de la tabla se puede observar que el “Fc” es mayor que el “Ft” lo cualindica que existe suficiente evidencia para rechazar la hipótesis nula, es decir, que existeregresión lineal simple y por lo tanto se dice que la ecuación estimada sirve para predecir elcomportamiento de Costos (Y) a través del conocimiento de Producción (X).Cuando se realiza un análisis de varianza de la regresión se debe emitir una conclusión quepodría ser la siguiente:“De acuerdo al análisis de varianza realizado se concluye con un 99% de confiabilidad, (1 –0.01)*100, que existe regresión lineal simple.”Una vez que se ha comprobado que la ecuación estimada es buena (hay regresión lineal) elsiguiente paso sería interpretar los componentes de la recta de estimación.1.5. Interpretación de los Componentes de la Ecuación de EstimaciónCuando se hacer una interpretación, ésta debe ser aplicada al problema en cuestión. En elcaso del ejemplo que se ha venido desarrollando sería el siguiente:̂1: Este es el coeficiente de regresión que indica la cantidad de cambios que experimenta“Y” por un cambio en “X”. En este caso indica que por Un mil millones de dólares quese incremente la producción, los costos se incrementarán en 0.423738 miles demillones de dólares. Esto porque la pendiente encontrada fue positiva, si hubiera sidonegativa, se diría que disminuiría esa cantidad.̂0: No siempre tienen interpretación aplicada al problema, es decir, una interpretaciónlógica, es por ello que comúnmente se le interpreta desde el punto de vista matemáticocomo el punto donde la recta de estimación corta al eje de las ordenadas cuando “X”toma el valor de cero. En el caso del ejemplo, ̂0 =-1.46798, esto estaría indicando quecuando la producción es cero, los costos son de -1.46798 miles de millones de dólares.Como se ve esta interpretación carece de lógica lo cual hace que se interprete como seha mencionado anteriormente.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorExisten casos donde si existe interpretación lógica como lo muestra el trabajo deinvestigación realizado por Martínez (1995) donde ajustó pesos de becerros al nacimiento.1.6. Dibujo de la Recta de EstimaciónCualquier recta se define por dos puntos y en el caso de la recta de regresión lineal simple,ésta pasa por dos puntos obligados cuyas coordenadas son: ( ) y ( ̂0). La recta deestimación debe dibujarse dentro del área de exploración, es decir, el área determinada porel diagrama de dispersión que donde se tiene información de ambas variables.Para el caso del ejemplo que se ha venido tratando la gráfica de la recta de estimación seríacomo se muestra a continuación.1.7. Regresión no LinealEste tipo de regresión no es objeto de desarrollo del presente documento ya que seconsideran para cursos superiores de estadística lo que se trata es dejar plasmado que unarelación entre dos variables no siempre es una línea recta, ésta puede ser logarítmica,exponencial o bien cuadrática o cúbica. Uno de los criterios para definir el ajuste de modeloes el R² y además el Cuadrado Medio del Error del análisis de varianza. En estos casos eldiagrama de dispersión es importante para determinar esas posibles relaciones.y = 0.4237x - 1.468R² = 0.893602468101214160 5 10 15 20 25 30 35 40Costo(milesdemillonesde$us)Producción (miles de millones de $us)
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorRegresión MúltipleNo siempre la dependencia en caso de existir se pueda deber a una sola variable, puede serque “Y” como variable dependiente se vea afectada por más de una variable independiente,en este caso se habla de regresión lineal múltiple, aspecto que no se desarrolla en estedocumento.1.8. Correlación Lineal SimpleAsí como existen técnicas que cuantifican los cambios de una variable dependiente por unúnico cambio de la variable independiente, existen técnicas que cuantifican la asociaciónlineal entre dos variables, esta técnica es llamada Correlación Lineal Simple que se expresecomo el coeficiente de correlación (r). Este coeficiente indica el sentido de la asociacióncomo también la magnitud de ésta, partiendo del hecho que el coeficiente de correlaciónlineal simple toma valores en el rango de: r es 0≤ r ≤ 1. Entre más se acerca a 1 el valor de rmayor es la asociación entre dichas variables.De acuerdo a lo anterior algunos autores han determinado lo siguiente rangos:-1 ≤ r < -0.8 Asociación fuerte ynegativa0 ≤ r < 0.4 No hay asociación-0.8 ≤ r < -0.4Asociación débil ynegativa0.4 ≤ r <0.8Asociación débil y positiva-0.4 ≤ r ≤ 0 No hay asociación 0.8 ≤ r ≤ 1 Asociación fuerte ypositivaEl coeficiente de Correlación Lineal Simple se determina a través de la siguiente ecuación:⌈∑(∑ ∑ )√(∑(∑ ))(∑(∑ ))⌉, que para el caso del ejemplo sería el siguiente:⌈√(( ))(( ))⌉= 0.9452
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorEste valor indica que existe una asociación fuerte y positiva entre estas variables, es decir,entre la producción y los costos de esas empresas.Diferencias entre Regresión Lineal Simple y Correlación Lineal SimpleSe pueden llegar a establecer las siguientes diferencias:Regresión Lineal Simple Correlación Lineal SimpleMide la cantidad de cambios en “Y” por unúnico cambio en “X”.Mide asociación lineal entre dosvariablesExiste una variable dependiente y otraindependienteEs indistinto x, y ó y, xβ1 puede tomar cualquier valor en la rectanuméricaEl coeficiente de correlacióntoma valores en el intervalo -1 ≤r ≤ 1
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior2. ASPECTOS GENERALES DE LA EXPERIMENTACIÓNAntes de ingresar al análisis de los principales diseños experimentales, es necesarioestablecer el acervo correspondiente en este campo de la Estadística llamado DiseñosExperimentales que facilite el proceso de aprendizaje que aunado a las bases estadísticasanteriores conlleven al usuario a un mejor uso el presente material. Es por ello que acontinuación se detalla lo siguiente:Experimento:Es todo proceso que consiste en la ejecución de un acto o prueba una o más veces, cuyoresultado en cada prueba depende del azar y que genera información tanto cualitativa comocuantitativa según sea el caso. En sí viene a ser aquel proceso intencionado provocado porel investigador con el fin de estudiar su origen, esencia e interrelación con otros procesos ofenómenos.Tratamiento:Es todo elemento o sujeto sometido a estudio o ensayo de comparación. Viene a ser elconjunto de condiciones experimentales que el investigador impone a las unidadesexperimentales. Ejemplo: diferentes métodos de enseñanza de la matemática, etc.Unidad Experimental:Tamaño de la Unidad Experimental. Es el material o lugar sobre el cual se aplican lostratamientos. Este término se utiliza para representar al conjunto de material experimentalal cual se le aplica un tratamiento. El tamaño de la unidad experimental depende muchodel tipo de material experimental que se utilice y muchas veces de la esperanza de vida enel caso de usar seres vivos. Cuando se experimenta con aves, la unidad experimental puedeestar constituida por un grupo de ellas; sin embargo, cuando se puede experimentar conanimales cuya esperanza de vida sea mayor, puede ser que uno solo de ellos pueda serconsiderado como una unidad experimental.Factor:Es un tratamiento que genera más tratamientoError Experimental:Es la variación aleatoria (no explicada) ajena al control razonable del investigador. Estetérmino no es sinónimo de error, si no que forma parte de las características propias einnatas de la unidad experimental. Este error no se puede evitar pero si se puede reducir
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorusando las repeticiones necesarias, usando unidades experimentales los máshomogéneamente posible y manejándolas de manera uniforme.TestigoEl testigo es el tratamiento de comparación adicional, que no debe faltar en unexperimento; la elección del tratamiento testigo es de gran importancia en cualquierinvestigación, éste se constituye como referencial del experimento y sirve para lacomparación de los tratamientos en prueba.Diseños Experimentales:Es un método científico de investigación que consiste en hacer operaciones prácticasdestinadas a demostrar, comprobar o descubrir fenómenos o principios básicos. Tiene comopropósito proporcionar la máxima cantidad de información a un costo mínimo.Diseñar un experimento es planificarlo, qué es lo que se pretende experimentar, esplanearlo de modo que se tenga la secuencia completa de pasos tomados de antemano paraasegurar que la información que se obtendrá permita un análisis objetivo que conduzca adeducciones (demostración de hipótesis) válidas con respecto al problema de investigaciónpreviamente establecido.Principios Básicos de la Experimentación:Los principios básicos de la experimentación son tres: Repetición, Azarización y ControlLocal.Repetición. Es la reproducción del experimento básico llamado también réplica ysolamente a través de ella se pueden obtener conclusiones de un fenómeno. Tiene dosfunciones: Proporcionar una estimación del error experimental y brindar una medición másprecisa de los efectos de los tratamientos, es decir, que hace posible la prueba designificancia.Azarización. Es la asignación de los tratamientos a las unidades experimentales de modoque todas tengan la misma posibilidad de recibir un tratamiento. Tiene la como funciónhacer válida la prueba de significancia.Control Local. Es la cantidad de balanceo, bloqueo o agrupamiento de las unidadesexperimentales que se emplean en el diseño adoptado. Tiene la función de hacer máseficiente el diseño experimental, es decir, hacer más sensitiva la prueba de significancia
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorreduciendo con ello la magnitud del error. Los criterios de agrupamiento van a depender deltipo de ciencia donde se esté experimentando.Exigencias de la Experimentación:Las exigencias de la experimentación son: Tipicidad, Uniformidad, Grado de Precisión,Control efectivo de las medidas y observaciones.Tipicidad. Llamado también representatividad, hace mención que no se pueden extrapolarresultados a condiciones diferentes a las que se originaron.Uniformidad. Indica que todas las unidades experimentales deben ser tratadasuniformemente y que la única diferencia entre ellos sea los tratamientos que se estánevaluando en ellas. Esto evita tener resultados enmascarados en los experimentos.Grado de Precisión. Un experimento bien planeado debe permitir al investigador medirdiferencias en los tratamientos con el grado de precisión esperado evitando para ellocomete errores al montar el ensayo y en su misma ejecución. Esto debe ser una tarea deprimer orden por parte del investigador. Es por ello que se debe tener especial cuidado en laconducción y manejo del experimento.Control efectivo de las medidas y observaciones. Es necesario hacer anotaciones de lasmanifestaciones de las unidades experimentales que permitan explicar ciertos aspectos delexperimento.Los diseños experimentales como tal se dividen en dos grupos: diseños experimentalessimples y diseños experimentales complejos.Entre los diseños experimentales simples se tiene al Diseño Completamente al Azar,Diseño en Bloques Completamente al Azar, Diseño Cuadrado Latino principalmente.3. DISEÑO COMPLETAMENTE AL AZAR (DCA) O DISEÑO CON UN SOLOCRITERIO DE CLASIFICACIÓNEste diseño es el más simple de todos; en él se asigna al azar los tratamientos a grupos deunidades experimentales previamente determinadas. Asimismo, todas las variables, exceptolas que están en estudio se mantienen constantes.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior3.1. ¿Cuándo utilizar este Diseño?Este diseño se utiliza cuando las unidades experimentales son homogéneas, o sea, que laúnica diferencia que existe son los tratamientos que se aplican a las unidadesexperimentales. Este diseño se usa cuando se estudia dos o más tratamientos bajo lassiguientes condiciones:a.- Lugar y unidades experimentales muy uniformes (suelo homogéneo, en laboratorios,invernaderos, galpones, aulas, etc.), donde no hay heterogeneidad necesaria de absorber.b.- Cuando sea probable que una parte del experimento se pierda.c.- Cuando se tiene un experimento pequeño y donde la mayor precisión de otrasdistribuciones no compensan la pérdida de grados de libertad en el error.Este tipo de diseño proporciona el máximo número de grados de libertad para la estimacióndel error experimental; además, no requiere estimar datos faltantes, es decir, puedeanalizarse con diferente número de repeticiones por tratamiento (diseño desbalanceado).3.2. Modelo Aditivo LinealEl concepto de modelo lineal es una réplica de algo; así como un edificio puede serrepresentado en una maqueta. Debe evitarse el error de creer que el modelo lineal es elmundo real; ya que sólo es una abstracción de una realidad que existe en la mente delhombre con el objetivo de ayudarse en el análisis de los procesos naturales que afectan pordiversos factores a fuentes de variación y que dichos modelos son de naturaleza transitoriay son susceptibles a mejorarse.La consideración básica para un diseño Completamente al Azar es que las observacionespueden representarse por medio del modelo estadístico lineal que es el siguiente:Donde:Yij = Variable Respuestaμ = Efecto común a todas las observacionesTi = Efecto del i-ésimo tratamientoEij = Erro experimental o error del modelo
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior3.3. Supuesto del Análisis de VarianzaDe forma general, los supuestos en los que se basa el análisis de varianza son:Homogeneidad de Varianza, Normalidad, Aditividad y Linealidad del Modelo, eIndependencia.3.3.1. Homogeneidad de Varianza:Las varianzas de las diferentes medías deben ser homogéneas. Por lo general, en el análisisde varianza, se utiliza un promedio de n varianza (CME) para obtener la mejor estimaciónde la varianza común. Pero, si las varianzas dentro de los tratamientos fuesen de hechodistintas, no se tendría justificación para combinarlas, ya que el promediar varianzas detratamientos mayores y menores podría proporcionar resultados engañosos. La diferenciaentre dos tratamientos con varianzas grandes puede ser considerada significativa cuando enrealidad ésta puede haber ocurrido por casualidad. Por otra parte, la diferencia entre dostratamientos con varianzas pequeñas puede ser declarada no significativa cuando en verdadlo es.Existen muchas técnicas para probar homogeneidad de varianza, como la prueba deBartlett, Prueba de F, propuesta por R.A. Fischer. Por la rapidez de esta última prueba sepropone la misma para efecto del curso, lo cual no desmerece en ninguna otra prueba.La prueba de F propuesta por Fischer se basa en lo siguiente:( )( )La prueba de hipótesis que se emplea es la siguiente:Ho:Ha: La regla de decisión es la siguiente:No Rechazo de Ho si Fc  F (m-1, n-1)gl. Esto quiere decir que las varianzas sonhomogéneas.RHo si Fc > F (m-1, n-1)gl, lo cual indica que las varianza son homogéneas.Box (S/F; citado por Calzada Benza, 1970) mencionó que si la razón entre la varianzamayor y la varianza menor es menor de cuatro, se puede considerar que hay suficientehomogeneidad de varianza, siendo éste posiblemente un criterio más rápido para probarhomogeneidad de varianza.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior3.3.2. Normalidad:Los términos del error son aleatorios, independientes y normalmente distribuidos. Estesupuesto es de gran importancia ya que cuando los datos no se distribuyen normalmente loscoeficientes de variación son muy elevados. Cuando los datos de una variable no presentannormalidad, existen algunas tipos de transformaciones en dependencia de la característicade los datos de la variable en cuestión que la hacen normal.Para probar normalidad también existen varias técnicas entre las que se pueden mencionarla prueba de Shapiro-Wilk y la de Lilliefors. Si el lector está interesado en profundizarsobre estas pruebas se le sugiere consultar a Ramírez y López (1993). (MétodosEstadísticos no Paramétricos)3.3.3. Aditividad y Linealidad del Modelo:Lo anterior se cumple en el modelo aditivo lineal ya que todos los efectos se suman y sonlineales porque cada uno de sus elementos del modelo lineal, están a la potencia "1".3.3.4. Independencia:Este supuesto implica que los términos del error son aleatorios, nocorrelacionados (independientes) normalmente distribuidos; además, de las varianzas y lasmedias de las distintas muestras.3.4. Análisis de varianza para este DiseñoEl análisis de varianza consiste en la partición de la variación total en fuentes de variaciónconocidas y la que no es conocida se atribuye al error. El análisis de varianza separa parte dela varianza causada por efectos accidentales, no sistemáticos (error experimental osimplemente error) de los causados por efectos sistemáticos conocidos (tratamientos).Antes de mostrar la tabla de análisis de varianza para este diseño se muestra acontinuación un cuadro de concentración de información (Cuadro 1) yposteriormente las ecuaciones trabajo para el mismo.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 1. Concentración de los datos para un Diseño Completamente al Azar con “i”tratamiento y “j” repeticiones.TRATAMIENTOSREPETICIONESΣYi.1 2 3 … j1 Y11 Y12 Y13 Y1j Y1.2 Y21 Y22 Y23 Y2j Y2.3 Y31 Y32 Y33 Y3j Y3.…i Yi1 Yi2 Yi3 Yij Yi.ΣY.j Y.1 Y.2 Y.3 Y.j Y..El modelo lineal para este diseño tiene solo dos fuentes de variación y es el siguiente:El modelo aditivo de un Diseño Completamente al Azar se corresponde con lassalidas de varianza que se muestran en los Cuadro 2 y 3.Cuadro 2. Salida de varianza para un Diseño Completamente al Azar con igualnúmero de repeticiones (diseño balanceado).F.V gl SC CM Fc FtTratamiento t-1 SCTRAT. ( )Error t(r-1) SCError( )Total tr-1 SCTotalesDonde:F.V = Fuente de variacióngl = Grados de libertadSC = Suma de CuadradosCM = Cuadrado MedioFc = “F” calculadoFt = “F” tabulado que se encuentra en la tabla de “F” a un nivel de significancia “”(probabilidad de error tipo I), grados de libertad de los tratamientos y grados de libertad delerrorEn caso de que los tratamientos tengan diferentes número de repeticiones (diseñodesbalanceado) la salida de varianza es la siguiente:
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 3. Salida de varianza para un Diseño Completamente al Azar con desigualnúmero de repeticiones (diseño desbalanceado).FV gl SC CM Fc FtTratamiento t-1 SCTRAT. ( )Error n-t SCErrorTotal n-1 SCTotales3.4.1. Ecuaciones de trabajo; Factor de corrección si el experimento es balanceado; Factor de corrección si el experimento es desbalanceado∑ ; Suma de cuadrados totales∑ ; Suma de cuadrado de tratamiento si el experimento es balanceado∑ ; Suma de cuadrados si el experimento es desbalanceado; Suma de cuadrados del error3.4.2. Prueba de Hipótesis en el Análisis de Varianza de un Diseño Completamente alAzarEn el análisis de varianza de este diseño se prueba el siguiente juego de hipótesisestadísticas:Ho: µ1 = µ2 = µ3 =… µi (T1 = T2 = T3 = …Ti). Esto es lo mismo que:Ho: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0).Ha: µ1 - µ2 - µ3 -… µi  0 (T1  T2 T3  …Ti).La hipótesis nula asume el efecto de igual, es decir, que los tratamiento ejercen el mismoefecto sobre la variable respuesta. Esta es la hipótesis que se somete a prueba y, la hipótesisalternativa, en su esencia, es la que contradice a la hipótesis nula.Dado que la hipótesis nula es la que se somete a prueba, entonces puede ser aceptada órechazada, si no es rechazada significa que no existe la suficiente evidencia experimental para
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorhacerlo, en caso de rechazarse, de inmediato se acepta la hipótesis alternativa. Para sabercuándo aceptar o rechazar la hipótesis nula se toma en cuenta la siguiente regla de decisión.No Rechazo de Ho (NRHo) si Fc  Ft (F de tablas)Rechazo de Ho (Rho) si Fc > Ft (F de tablas)3.5. Interpretación de ResultadosPara una mejor ilustración de la interpretación de los resultados de un análisis en estediseño, se muestra a continuación el siguiente ejemplo:En un estudio del efecto de la glucosa sobre la liberación de insulina, se trataronespecímenes de tejido pancreático de animales experimentales con cinco concentracionesdiferentes de glucosa. Posteriormente se hizo la determinación de la cantidad de insulinaliberada. Se pide realizar el análisis de varianza correspondiente usando una probabilidadde error Tipo I de (0.01), es decir,  = 0.01. Los datos obtenidos se muestran en el Cuadro4.Cuadro 4. Insulina liberada a diferentes concentraciones de glucosa en las unidadesexperimentales.TratamientoRepeticiones1 2 3 4 5 6 7 81 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.592 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.443 3.89 4.80 3.69 5.70 5.62 5.79 4.75 5.334 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.105 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98Adaptado de Wyane (1970)En el mismo cuadro de información se pueden incluir los totales de tratamiento comotambién sus varianzas por cada uno de ellos como se muestra en el Cuadro 5.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 5. Insulina liberada a diferentes concentraciones de glucosa en las unidadesexperimentales, totales y varianza por tratamiento.TratamientoRepeticionesΣYi. S²1 2 3 4 5 6 7 81 1.53 1.61 3.75 2.89 3.26 2.83 2.86 2.59 21.32 0.57912 3.15 3.96 3.59 1.89 1.45 3.49 1.56 2.44 21.53 0.97023 3.89 4.8 3.69 5.7 5.62 5.79 4.75 5.33 39.57 0.66214 8.18 5.64 7.36 5.33 8.82 5.26 8.75 7.1 56.44 2.22125 5.86 5.46 5.69 6.49 7.81 9.03 7.49 8.98 56.81 2.0718ΣY.j 22.61 21.47 24.08 22.3 26.96 26.4 25.41 26.44 195.67 Y..Revisando el supuesto de homogeneidad de varianza y tomando en cuenta lo propuesto porBox (S/F; citado por Calzada Benza, 1970) se relacionará la varianza mayor con la varianzamenor, en este caso varianza del tratamiento 1 y la del tratamiento 4. Entonces:= 3.8356Como la relación entre la varianza mayor y la menor y tomando en cuenta lo propuesto porBox (S/F) se puede concluir que existe homogeneidad de varianza.Comenzando a realizar el análisis de varianza se tiene lo siguiente:( )( )Analizando los resultados obtenidos al aplicar las ecuaciones de trabajo para este diseño esimportante señalar que ninguna de estas sumas de cuadrados puede ser negativa ya que soncomponentes de varianza y la varianza nunca puede ser negativa. Por otra parte, se puedeobservar que la Suma de Cuadrados Totales es la mayor, en verdad ésta es la variacióntotal y ninguna de las demás puede ser mayor que ésta. Además se puede observar que laSuma de Cuadrados del Error se obtiene por diferencia entre la Suma de CuadradosTotales y la de Tratamiento. Esto es producto de la aplicación misma de lo que es análisisde varianza.Una vez obtenidas las sumas de cuadrados correspondientes, el siguiente paso es construir
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorla tabla de análisis de varianza (salida de varianza) la cual queda como se muestra en elCuadro 6 y además es recomendable que esta tabla vaya acompañada del Coeficiente deVariación (C.V) el cual se define como la relación entre la raíz cuadrada del CuadradoMedio del Error y el Promedio de la Variable respuesta o en estudio.(√)(√)Cuadro 6. Salida de varianza para los datos del Cuadro 4.F.V gl SC CM Fc F(0.01, 4, 35)Tratamiento 4 154.921015 38.7302538 29.7714584 3.908Error 35 45.5321625 1.30091893Total 39 200.453178C.V. = 23.32%Si se toma en cuenta el juego de hipótesis de este diseño y la regla de decisión se puedeconcluir que se rechaza la hipótesis ya que el “Fc” es mayor que el “Ft”. A manera deconclusión se puede decir lo siguiente:Con un 99% de confiabilidad se concluye que al menos unos de los tratamientos evaluadosejercen un efecto distinto (P ˂ 0.01) sobre la liberación de insulina.Ahora la pregunta es: ¿Cuál es ( o son) ese (esos) tratamiento (s) que hizo (hicieron)rechazar la hipótesis nula?. Esta interrogante no la responde el análisis de varianza ya queéste solo prueba si existe o no efecto de las variables dependientes sobre la dependiente. Espor ello que se deben hacer otros análisis para responder esta interrogante.Para responder a estas interrogantes existen dos técnicas principalmente que son laspruebas a priori o Contrastes Ortogonales y las pruebas obligadas por los datos llamadastambién Pruebas de Rangos Múltiples o Separación de Medias. Estas últimas por el gradode uso que tienen en las investigaciones de índole experimental son las que se desarrollan acontinuación.3.6. Pruebas obligadas por los Datos o de Rangos MúltiplesCuando el análisis de varianza de un experimento reporta diferencias significativas y son másde dos tratamiento, es necesario saber quién “metió el ruido en la prueba de hipótesis” que
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorprovocó que la hipótesis nula sea rechazada. Para este fin, existen las llamadas pruebas deRangos Múltiples. Entre estas pruebas están: Diferencia Mínima Significativa (DMS) (LSD) Método de Duncan Método de Student-Newman-Keuls (SNK) Método de Tukey (Diferencia Significativa Honesta) Método de Scheffé.Cada uno de estos procedimientos de comparación de medias está basado en unconjunto de suposiciones, y son usualmente efectivos para fines específicos.En cualquiera de los casos la hipótesis nula supone la igualdad de las medias y laalternativa lo contrario y se utilizan siempre y cuando en el análisis de varianza rechace lahipótesis nula. Lo anterior indica que la prueba de hipótesis que se hace es la siguiente:Ho: | |Ha: | |La hipótesis nula, que es la que se prueba, asume el efecto de igualdad de los promedios acomparar es por ello que la diferencia es igual a cero y por lo tanto, la hipótesis alternativacontradice la hipótesis nula con una desigualdad.La regla de decisión es la siguiente:NRHo = Valor crítico de la prueba está dentro de la diferencia:| |   | |RHo: Si Valor Crítico de la prueba es  | | o bienSi el Valor Crítico ˂ | |3.6.1. Diferencia Mínima Significativa (DMS)Esta prueba solo debe usarse para comparar medias adyacentes en un arreglo ordenado,medias por orden de magnitud. Cuando DMS se usa indiscriminadamente para probar todaslas diferencias posibles entre las diversas medias, ciertas diferencias serán significativas,pero no al nivel de significancia que se ha elegido.El número posible de comparaciones de medias tomadas de dos en dos a la vez es igual a( ). Los especialistas hacen mención que este método es adecuado para comparar untratamiento estándar (testigo) con otros tratamientos.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorEsta prueba utiliza un solo comparador y su fórmula es la siguiente:√ , donde:DMS = Es el valor crítico de la pruebat/2 = Valor tabular de “t” de student para los grados de libertad del error obtenido a un/2.r = número de repeticiones3.6.2. Método de DuncanEsta prueba es ampliamente utilizada entre las diversas pruebas de RangosMúltiples. Su método es de naturaleza secuencial, lo que quiere decir, que utiliza unnuevo valor “estudentizado”, para cada una de las comparaciones de medias adyacentesordenadas por magnitud en orden descendente.Esta prueba incluye el cálculo de las diferencias significativas mínima entre las medias detratamiento cuando éstas se encuentran dispuestas en orden de magnitud. La fórmulaes la siguiente:√Donde:Es el valor extraído de una tabla especial de rango “estudentizado”, con los grados delibertad del error y con la disposición relativa de las medias en el arreglo.CMError = Cuadrado Medio del Errorr = Número de repeticiones.3.6.3. Método de Student-Newman-Keuls (SNK)Es una prueba de carácter secuencial, es decir, que utiliza un nuevo valor “estudentizado”para cada comparación.Para el cálculo de esta prueba se requiere determinar la diferencia mínima significativaentre las medias del tratamiento cuando éstas se encuentran dispuestas en orden demagnitud. Su fórmula es la siguiente:
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior√ ;Donde:q = Valor obtenido de tablas especiales de rango “estudentizado”, para los grados delibertad del error y con la disposición relativa de las medias en el arregloCMError = Cuadrado medio del errorr = número de repeticiones3.6.4. Método de TukeyEste método es un procedimiento basado en el rango “estudentizado”, pero no es secuencial, yaque utiliza un sólo comparador de “q” ordinario. Sin embargo, el método de Tukey es útil ensituaciones en que se desea hacer un primer énfasis en el uso del experimento con un total paradeterminar la significancia de los pares de medias. Esta prueba sólo es exacta cuando losgrupos tienen igual número de elementos y para medias que no han sido ajustadas porcovarianza. Esta prueba se define de la siguiente manera:√Donde:q = Valor obtenido de tablas especiales de rango “estudentizados”, para los grados delibertad del error y con la disposición relativa de las medias en el arregloCMError = Cuadrado medio del errorr = número de repeticiones3.6.5. Método de SchefféSe considera un método bastante general que utiliza la distribución de “F” de Snedecor. Elmétodo de Scheffé puede aplicarse para probar hipótesis generales de que una funciónlineal de las medias poblacionales es igual a cero. En contraste con las comparacionesmúltiples basadas en rangos estudentizados, el método de Scheffé es un método exacto paramedias provenientes de medias de igual o desigual tamaño y para medias que han sidoajustadas por covarianza. Para el cálculo se requiere determinar la mínima diferenciasignificativa entre las medias de los tratamientos cuando éstos se encuentran ordenados en
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiororden de magnitud. Su valor crítico se determina a través de la siguiente expresión:√( ) ( )Donde:t = Número de tratamientosF = Valor que se obtiene de la distribución de “F” de Snedecor con t-1 y los grados delibertad del error.CError = Cuadrado medio del error, y ri, rj representan el número de observaciones usadaspara calcular cada media muestraEjemplo.A continuación se aplican todas las pruebas de rangos múltiples antes expuestas de maneraque se pueda realizar una comparación entre éstas. Los promedios por tratamiento son lossiguientes:Cuadro 7. Medias por tratamientos y Medias ordenadas por magnitud descendente.Tratamiento Promedio Tratamiento Promedios Ordenados1 2.665 5 7.101252 2.69125 4 7.0553 4.94625 3 4.946254 7.055 2 2.691255 7.10125 1 2.665Aplicando DMS a un nivel de significancia  = 0.01 que es el mismo nivel de significanciaque se utilizó para el análisis de varianza, además de la siguiente información:CMError = 1.30091893r = 8t/2(35) = 2.7238√Por lo tanto el valor crítico de la prueba es de 1.5534.A continuación se presentan en el Cuadro 7 las comparaciones a realizar, las diferenciasentre las medias y el resultado de comparar estas diferencias con el valor crítico de la
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorprueba de DMS.Cuadro 7. Resultado de la prueba de DMS para los tratamientos estudiados.Comparación Diferencia de MediasResultado de lacomparaciónT5 versus T4 0.04625 nsT5 versus T3 2.155 *T5 versus T2 4.41 *T5 versus T1 4.43625 *T4 versus T3 2.10875 *T4 versus T2 4.36375 *T4 versus T1 4.39 *T3 versus T2 2.255 *T3 versus T1 2.28125 *T2 versus T1 0.02625 nsns = No significativo * = significativoLas comparaciones se pueden resumir de acuerdo al siguiente rango de méritoTratamiento Comparación5 a4 a3 b2 c1 cPromedios con literales distintas son estadísticamente diferentes según el método de DMS (P ˂ 0.01).Interpretando los resultados de la separación o comparación de medias según DMS sepuede decir que las concentraciones de glucosa 5 y 4 producen la misma cantidad deinsulina liberada (P  0.01), pero diferente (P ˂ 0.01) a las demás concentraciones deglucosa experimentadas. Esto quiere decir que es indistinto utilizar la concentración 5 o 4.Al comparar el tratamiento 4 (concentración 4) con las demás, ésta tuvo un comportamientodiferente (P ˂ 0.01) a las demás concentraciones de glucosa, es decir, 3, 2 y 1. Igualmentemostró la concentración 3 respecto a la 2 y 1, no así la concentración 2 que tuvo el mismocomportamiento (P > 0.01) con la concentración 1.Al aplicar el método de Duncan se obtuvo lo siguiente:
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior√Para realizar la prueba de Duncan lo primero que se debe hacer es obtener los valoresestudentizados extraídos de la tabla de Duncan. En este caso se están utilizando valoresinterpolados ya que no existen en la tabla grado de libertad igual a 35 solo hay entre 30 y40 por lo tanto lo que se hizo fue promediar los dos valores. Estos son los siguientes:Cuadro 8. Valores estudentizado extraído de la tabla de Duncan y valores críticos dela prueba según el número de medias a comparar.Medias a comparar 2 3 4 5R(0.01, 35) 3.855 4.025 4.13 4.195RMS 1.554549 1.623103 1.665445 1.691656Aquí se puede ver el efecto secuencial de Duncan ya que utiliza un comparador distintosegún el número de medias a comparar.Los resultados de aplicar la prueba son los siguientes:Cuadro 9. Contrastación de las diferencias entre medias adyacentes con los valorescríticos de Duncan.PromediosPromedios 7.10125 7.055 4.94625 2.69125 2.665Tratamientos 5 4 3 2 17.10125 5 0 0.04625 ns 2.155 * 4.41* 4.43625 *7.055 4 0 2.10875* 4.36375* 4.39*4.94625 3 0 2.255* 2.28125*2.69125 2 0 0.02625 ns2.665 1 0RMS 1.69166 1.66544 1.62310 1.55455ns = No significativo * = significativo
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorLo anterior se resume en el siguiente rango de mérito:Tratamiento Comparación5 a4 a3 b2 c1 cPromedios con literales distintas son estadísticamente diferentes según el método de Duncan (P ˂ 0.01).Como se puede observar, en este caso los resultados obtenidos son los mismos que en laprueba de DMS, por lo tanto, la interpretación es la misma.Aplicando SNK:√Al igual que la prueba de Duncan, SNK es una prueba secuencial lo que indica que utilizaun valor diferente para cada comparación de acuerdo al número de medias a comparar. Losvalores q y valores críticos de SNK se muestran en el Cuadro 10.Cuadro 10. Valores estudentizados de la prueba de SNK de acuerdo al número demedias adyacentes a comparar y valores críticos de la misma.Medias a comparar 2 3 4 5q(0.01, 35) 3.855 4.41 4.75 4.99SNK 1.55454932 1.778356 1.9154628 2.0122441
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorLos resultados al aplicar la prueba de rangos múltiples de SNK se resumen en el Cuadro 11.Cuadro 11. Resultados de la comparación de medias según el método de SNK.PromediosPromedios 7.10125 7.055 4.94625 2.69125 2.665Tratamientos 5 4 3 2 17.10125 5 0 0.04625 ns 2.155 * 4.41* 4.43625 *7.055 4 0 2.10875* 4.36375* 4.39*4.94625 3 0 2.255* 2.28125*2.69125 2 0 0.02625 ns2.665 1 0SNK 2.0122441 1.9154628 1.778356 1.554549ns = No significativo * = significativoLo anterior se resume en el siguiente rango de mérito.Tratamiento Comparación5 a4 a3 b2 c1 cPromedios con literales distintas son estadísticamente diferentes según el método de SNK (P ˂ 0.01)En este caso, los resultados de aplicación del método de SNK coinciden con el anterior ypor ende, la interpretación es la misma.Aplicando ahora el método de Tukey o Diferencia Honesta Mínima se tiene lo siguiente:√Tukey no es un método secuencial, es decir, que utiliza un solo valor estudentizado paraobtener el valor crítico de prueba, utiliza la misma tabla que SNK pero con el númeromáximo de medias a comparar.q(0,01, 5, 35) = 4.99√Los resultados de contrastar la diferencia de medias ordenadas con el valor crítico de laprueba de Tukey se muestra en el Cuadro 12.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 12. Resultados de la aplicación de la prueba de Tukey a los promedios de lostratamientos estudiados.Comparación Diferencia de MediasResultado de lacomparaciónT5 versus T4 0.04625 nsT5 versus T3 2.155 *T5 versus T2 4.41 *T5 versus T1 4.43625 *T4 versus T3 2.10875 *T4 versus T2 4.36375 *T4 versus T1 4.39 *T3 versus T2 2.255 *T3 versus T1 2.28125 *T2 versus T1 0.02625 nsns = No significativo * = significativoResumiendo los resultados del Cuadro 12 en un rango de mérito se tiene lo siguiente:Tratamiento Comparación5 a4 a3 b2 c1 cPromedios con literales distintas son estadísticamente diferentes según el método de Tukey (P ˂ 0.01).Aplicando ahora la última prueba de separación de medias de las propuestas en estedocumento se tiene lo siguiente:Método de Scheffé√( ) ( )La prueba de Scheffé al igual que Tukey no es una prueba secuencial por lo tanto soloutiliza un valor de “F” de Snedecor que se extrae un nivel de significancia “”, para el casodel ejemplo  = 0.01, con los grado de libertad de tratamientos y los del error experimental.De acuerdo a esto se tiene lo siguiente:
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorF(0.01, 4, 35) = 3.908√( ) ( )Cuadro 13. Resultados de la aplicación de la prueba de Scheffé a los promedios de lostratamientos estudiados.Comparación Diferencia de MediasResultado de lacomparaciónT5 versus T4 0.04625 nsT5 versus T3 2.155 nsT5 versus T2 4.41 *T5 versus T1 4.43625 *T4 versus T3 2.10875 nsT4 versus T2 4.36375 *T4 versus T1 4.39 *T3 versus T2 2.255 *T3 versus T1 2.28125 *T2 versus T1 0.02625 nsns = No significativo * = significativoResumiendo los resultados del Cuadro 13 en un rango de mérito se tiene lo siguiente:Tratamiento Comparación5 a4 a3 a2 b1 bPromedios con literales distintas son estadísticamente diferentes según el método de Scheffé (P ˂ 0.01).3.7. ¿Cuándo, Porqué y Cuál Prueba de Rangos Múltiples Utilizar?Todas las pruebas de rangos múltiples o separación o comparación de medias se utilizansiempre y cuando en el análisis de varianza se rechace la hipótesis ya este análisis solodetecta si existe efecto o no de los tratamientos sometidos a consideración pero no indicacuál o cuáles son los tratamientos responsables de este rechazo.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorEn el Cuadro 14 se resumen los resultados obtenidos por cada una de las pruebas deseparación de medias aplicados.Cuadro 14. Resumen de los resultados obtenidos al aplicar las pruebas de rangosmúltiples de DMS, Duncan, SNK, Tukey y Scheffé a un nivel designificancia de  = 0.05.Tratamiento Promedio DMS Duncan SNK Tukey Scheffé5 7.10125 a a a a a4 7.055 a a a a a3 4.94625 b b b b a2 2.69125 c c c c b1 2.665 c c c c bPromedios con literales distintas son estadísticamente diferentes (P ˂ 0.01).Según Martínez Garza (1994) el método de Scheffé es más riguroso para detectardiferencias significativas y esto se demuestra con los resultados expuestos en el Cuadro 14,es por ello que se recomiendo usarlo a un  = 0.1. Por otra parte se ha podido observar quetanto SNK como Tukey tiende a no detectar diferencias estadística donde DMS y Duncanlo han hecho con diferencias mayores.Una discusión más fundamentada sobre las separaciones de medias puede encontrarse enSteel y Torrie (1992) en su obra “Bioestadística: Principios y Procedimientos pero sí sepuede deducir que para experimentos en fases exploratorias es recomendable usar pruebasque no sean tan rigurosas como es DMS, Duncan e inclusive SNK, sin embargo, si este noes el caso y los promedios no han sido corregidos por efecto de covariable, esrecomendable Tukey y si se requiere una prueba más rigurosa sin importar si elexperimento es balanceado o no, si los promedios ha sido corregido o no por covariable, esrecomendable usar Scheffé.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior4. DISEÑO EN BLOQUES COMPLETAMENTE AL AZAR (BCA) O CON DOSCRITERIOS DE CLASIFICACIÓNNo siempre el material experimental es homogéneo limitando en este caso el uso delDiseño Completamente al Azar (DCA). En estos casos es recomendable usar el Diseño enBloques Completamente al Azar.4.1.¿Cuándo utilizar este diseño?Este diseño se utiliza cuando el material experimental presenta un factor de “estorbo” queno es de interés estudiar pero que sí puede afectar los resultados conllevando a conclusioneserradas o bien los llamados efectos enmascarados. Tiene como principio maximizar lavariabilidad entre bloques y minimizar la variabilidad interbloque o variabilidad interna.Esto se logra ya que las unidades experimentales dentro de cada bloque son homogéneaspero son heterogéneas entre bloques.Si se habla de un diseño en Bloques Completamente al Azar, deben existir tantas unidadesexperimentales dentro de cada bloque como tratamientos se tenga, de manera que cadatratamiento tenga una repetición en cada bloque. Esto al mismo tiempo se vuelve unadesventaja para este diseño ya que si se pierde una unidad experimental o más, se rompe elprincipio de bloqueo ya que los tratamientos no tendrían el mismo número de repeticionesdentro de cada bloque. Es por ello que en este caso para analizar este diseño se debenestimar los datos perdidos conllevando a pérdidas de grados de libertad en el error y porende a un aumento del cuadrado medio del error.El tema de estimación de datos perdidos no se desarrolla en este documento, pero se puedenconsultar las fuentes que citan al final del mismo.4.2.Modelo Aditivo Lineal de un BCAEl modelo aditivo lineal para este diseño es el siguiente:Donde:Yij = Variable respuesta= Efecto común a todas las observacionesBj = Efecto de la j-ésima repetición; j = 1, 2, 3,...r repeticionesTi = Efecto del j-ésimo tratamiento; i = 1, 2, 3, …i, tratamientoEij = Error experimental
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior4.3. Análisis de Varianza para un BCAAntes de exponer la salida de varianza y las ecuaciones de trabajo, se presenta un cuadro deconcentración o vaciamiento de información.Cuadro 15. Concentración de los datos para un Diseño en Bloques Completamente alAzar (BCA).TRATAMIENTOSBLOQUESΣYi.1 2 3 … j1 Y11 Y12 Y13 Y1j Y1.2 Y21 Y22 Y23 Y2j Y2.3 Y31 Y32 Y33 Y3j Y3.…i Yi1 Yi2 Yi3 Yij Yi.ΣY.j Y.1 Y.2 Y.3 Y.j Y..La salida de varianza de este diseño y de acuerdo a su modelo aditivo lineal es el siguiente:Cuadro 15. Salida de varianza para un diseño en Bloques Completamente al Azar.F.V gl SC CM Fc FtBloque r-1 SCBloque CMBloque ( )Tratamiento t-1 SCTRAT. CMTRAT. ( )Error (t-1)(r-1) SCError CMErrorTotal tr-1 SCTotalesEn este diseño se prueban dos juegos de hipótesis uno para bloques y otros paratratamientos. Estas hipótesis son las siguientes:Para tratamientoHo: µ1 - µ2 - µ3 -… µi = 0 (T1 - T2 - T3 - …Ti = 0)Ha: µ1 - µ2 - µ3 -… µi  0(T1 - T2 - T3 - …Ti  0).Para BloquesHo: Bµ1 - Bµ2 - Bµ3 -… Bµj = 0 (B1 - B2 - B3 - …Bj = 0)Ha: Bµ1 - Bµ2 - Bµ3 -… Bµj  0 (B1 - B2 - B3  …Bj  0).Las ecuaciones de trabajo para realizar el análisis de varianza de este diseño son las
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorsiguientes:; Factor de Corrección∑∑∑( )Ejemplo:Un fisioterapeuta deseaba comparar tres métodos para enseñar a los pacientes el uso decierto aparato protético. Tenía la sensación de que la rapidez de aprendizaje sería diferentepara pacientes de diferentes edades y deseaba diseñar un experimento en el que pudieratomarse en consideración la influencia de la edad. Para ello selección tres pacientes en cadauno de los cuatros grupos de edades para participar en el experimento y, en cada grupo deedad se asignó un paciente aleatoriamente a cada uno de los métodos de enseñanza. Losmétodos de instrucción corresponden a los tratamientos y los cinco grupos de edadescorresponden a los bloques. La variable medida fue el tiempo (días) requerido paraaprender el uso de cierto aparato protético. Los datos son los siguientes:Cuadro 16. Tiempo requerido para el manejo de un aparato protético bajo tresmodalidades de enseñanza en grupos de diferentes edades.Método deEnseñanzaEdades (años)ΣYi.< a 20 20 a 29 30 a 39 40 a 49 50 y másA 7 8 9 10 11 45B 9 9 9 9 12 48C 10 10 12 12 14 58ΣY.j 26 27 30 31 37 151Adaptado de Wyane (1970)Realice el análisis de varianza correspondiente a un  = 0.01.Aplicando las ecuaciones de trabajo se tiene lo siguiente:( )
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior(7² + 8² +…14²)-1520.06667 = 46.93333( )( )( )Cuadro 17. Salida de varianza para el ejemplo de Diseños en Bloques Completamentea Azar.F.V gl SC CM Fc F(0.01)Bloques 4 6.2333 14.38465 7.006Tratamiento 2 9.26666 21.38458 8.649Error 8 0.43333Total 15 46.93333Interpretación de ResultadosEs necesario recalcar que en un diseño de bloques completamente al azar la variable que seestá bloqueando no es de interés estudiar, en este caso, el fisioterapeuta está interesado enel manejo del aparato protético sin embargo, el presume que la edad puede estar afectandoesta velocidad de aprendizaje en este tipo de pacientes y por ello que organiza elexperimento y agrupa las unidades experimentales de acuerdo a las edades de los paciente.Cuando se establece un diseño en bloques completamente al azar, es necesario estar seguroque en verdad el factor de estorbo existe, caso contrario se pierde grados de libertad en elerror, lo cual hace que las diferencias dentro de los tratamientos (error experimental) seanmayores con las consecuencias que corresponden.Para el caso del ejemplo, se puede verificar en la salida de varianza que existe diferenciassignificativas (P  0.01) en bloques lo cual indica, que el investigador tenía razón enrealizar el bloqueo por edades de los pacientes. Esto indica también que la velocidad deaprendizaje (vista como el manejo del aparato protético), se ve afectada por la edad.Por otra parte, este mismo análisis indica que los métodos de enseñanza afectan o ejercenefecto significativo en la velocidad de aprendizaje de los pacientes. Esto se puede concluira un 99% de confiabilidad.Dado que el análisis de varianza reportó diferencias significativas en el tiempo de
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superioraprendizaje, se debe aplicar una prueba de rangos múltiples para verificar cuál de lastécnicas de enseñanza.Para realizar lo antes expuesto lo primero que hay que hacer es ordenar las medias pormagnitud (descendente) como se muestra en el Cuadro 18.Cuadro 18. Promedios por método de enseñanza utilizado.Método de Enseñanza Promedios Método de Enseñanza Promedios OrdenadosA 9 C 11.6B 9.6 B 9.6C 11.6 A 9Aplicando la prueba de Tukey a un  = 0.01√√ 1.65742075Cuadro 19. Resultados de la aplicación de la prueba de Tukey a los promedios de losMétodos de Enseñanza estudiados.Comparaciones Diferencias de Medias Resultado de la ComparaciónA versus B 2.0 *A versus C 2.6 *B versus C 0.6 nsMedias con literales distintas son diferentes estadísticamente (P  0.01).Resumiendo los resultados de las comparaciones realizadas se puede resumir a través delsiguiente rango de méritoMétodo de Enseñanza ComparaciónC aB bA b
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorLo anterior indica que el método donde los pacientes tardan menos son el A y el B, ambosmétodos son estadísticamente iguales, es decir, que ejercen el mismo efecto sobre el tiempoque duran los pacientes para aprender el manejo de aparato protético y el método donde setarda más es el método C ya que aquí los pacientes tardan en promedio 11 días y que fuediferente (P 0.01) a los demás métodos.5. DISEÑO CUADRADO LATINO (DCL)Anteriormente se han analizado los casos de los diseños Completamente al Azardonde el material experimental tiene que ser homogéneo y Bloques al Azar, donde elmaterial experimental presenta un factor sistemático o de estorbo. Sin embargo, en lainvestigación se presentan casos donde el material experimental presenta dos tipos deefectos no sistemáticos o sea dos factores de estorbo, que no son de interés en lainvestigación pero pueden afectar los resultados del experimento. Además, imposibilita el usode los diseños antes mencionados.5.1. ¿Cuándo Utilizar este Diseño?El diseño Cuadrado Latino, es considerado como una variante del diseño Bloquesal Azar. Este diseño es de gran utilidad cuando el material experimental presenta dos efectosde estorbo. Permite controlar dos efectos sistemáticos que afectan al material experimental,además del efecto de tratamiento que es el de interés estudiar. Tiene la característica decontrolar los efectos de estorbo a través de hileras y columna, o sea un doble bloqueo.Para que los efectos de las hileras y las columnas no se confundan con el de lostratamientos, éstos se ubican de tal forma que un tratamiento no se repite en la mismacolumna y la misma hilera. Por esta razón, la cantidad de tratamiento coincide con elmismo número de filas y columnas.La principal restricción de este diseño es que el número de repeticiones es igual al númerode tratamiento, si este último es considerable el número de repeticiones requerido se vuelveimpracticable. Son pocos usados los Cuadros Latinos 12 x 12, mientras que el tamaño máscomún es desde 5 x 5 hasta 8 X 8. Este diseño presenta hasta cierto punto lamisma desventaja que los Bloques al Azar de que, el error experimental porunidad, se aumente con el tamaño del cuadro.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior5.2. Modelo Aditivo Lineal de para un DCLEl modelo aditivo lineal para este diseño es el siguiente:Yij(k) = µ + Hi + Cj + Tk(ij) + EijkDonde:Yij (k) = Variable respuestaµ = Efecto común a todas las observacionesHi = Efecto de la i - ésima hilera i = 1, 2, 3,... i hilerasCj = Efecto de la j-ésima columna j = 1, 2, 3,… j columnasTk (ij) = Efecto del k-ésimo tratamiento en la i-ésima hilera y j-ésima columna k = 1, 2, 3,…k tratamientos.Ejk = Error del modeloEn este diseño se prueban hipótesis para columnas, hileras y tratamiento de la misma formaque se ha hecho anteriormente, es decir, la hipótesis nula asume el efecto de igualdad encaso y la alternativa su contradicción.5.3. Análisis de Varianza para un diseño Cuadrado Latino DCLAl igual que los casos anteriores, antes de exponer la salida de varianza, se muestra uncuadro de concentración de información, que es de donde obtiene como tal al análisis devarianza que se debe corresponder con el modelo aditivo lineal.Cuadro 20. Cuadro de vaciamiento de información para un diseño Cuadrado Latino.HilerasColumnasΣYi.C1 C2 C3 … CjH1 Y11 Y12 Y13 Y1j Y1.H2 Y21 Y22 Y23 Y2j Y2.H3 Y31 Y32 Y33 Y3j Y3.… Hi Yi1 Yi2 Yi3 Yij Yi.ΣY.j Y.1 Y.2 Y.3 Y.j Y..Los tratamientos están entre las hileras y las columnas bajo las características que se hanmencionado anteriormente, es por ello que hay que hacer un resumen de los tratamientos enotro cuadrado como se muestra a continuación.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 21. Resumen de la información de los tratamientos extraído de un diseñoCuadrado Latino.TratamientoRepeticionesΣYi.R1 R2 R3 … RjT1 Y11 Y12 Y13 Y1j Y1.T2 Y21 Y22 Y23 Y2j Y2.T3 Y31 Y32 Y33 Y3j Y3.… Tk Yi1 Yi2 Yi3 Yij Y..kY..1 Y..2 Y..3 Y..j Y…La salida de varianza para un DCL es la siguiente:Cuadro 22. Salida de varianza para un diseño Cuadrado LatinoFV gl SC CM Fc FtHileras t-1 SCHileras CMHileras ( )Columnas t-1 SCColumn CMColumn ( )Tratamiento t-1 SCTRAT. CMTRAT. ( )Error (t-1)(t-2) SCError CMErrorTotal t²-1 SCTotalesLas ecuaciones de trabajo para el análisis de varianza de este diseño son las siguientes:(∑ )∑∑∑∑( )Ejemplo:
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorSe estudia la eficacia de cuatro fármacos diferentes (F1, F2, F3 y F4) en el tratamiento deuna enfermedad, para ello, se observa el número de días que tardan en curar los enfermostratados con estos fármacos. Se considera que el factor edad y el factor peso pueden influiren el experimento, por ello, se controlan estos factores y se consideran cuatro niveles deedad (E1, E2, E3 y E4) y cuatro de peso (P1, P2, P3 y P4). Los resultados del experimentodiseñado según la técnica del cuadrado latino se reportan en el Cuadro 23. ¿Quéconclusiones se deducen del experimento a un nivel de significancia del 5%?”Cuadro 23. Efecto de cuatro fármacos en los días para una curar una enfermedad enpacientes de cuatro grupos etáreos y cuatro tipos de peso.PesoGrupo EtáreoE1 E2 E3 E4P1 10.0 F1 9.5 F2 7.0 F4 11.5 F3P2 8.0 F2 10.0 F1 8.5 F3 9.0 F4P3 7.0 F3 6.5 F4 7.0 F1 8.0 F2P4 6.0 F4 5.0 F3 6.0 F2 9.0 F1Lo primero que se debe hacer es resumir la información para columnas e hileras. Esta es lasiguiente:PesoGrupo EtáreoΣYi..E1 E2 E3 E4P1 10.0 9.5 7.0 11.5 38.0P2 8.0 10.0 8.5 9.0 35.5P3 7.0 6.5 7.0 8.0 28.5P4 6.0 5.0 6.0 9.0 26.0ΣY.j. 31.0 31.0 28.5 37.5 128.0y la de tratamiento quedaría de la siguiente forma:Fármaco(Tratamiento)1 2 3 4 ΣY..kF1 10.0 10.0 7.0 9.0 36.0F2 8.0 9.5 6.0 8.0 31.5F3 7.0 5.0 8.5 11.5 32.0F4 6.0 6.5 7.0 9.0 28.5
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCon esta información se puede realizar el análisis de varianza(∑ )∑ ( )∑( )∑( )∑( )( )( )Resumiendo lo anterior en la salida de varianza correspondiente a este diseño se tiene losiguiente:Cuadro 24. Salida de varianza para el diseño Cuadrado Latino del ejemplo.F.V gl SC CM FC Ft (0.05)Peso (Hileras) 3 24.125 8.0416667 10.432432 4.757Grupo Etáreo (Columnas) 3 11.125 3.7083333 4.8108108 4.757Fármaco (Tratamiento) 3 7.125 2.375 3.0810811 4.757Error 6 4.625 0.7708333Total 15 47.0De acuerdo al análisis de varianza realizado se concluye al 95% de confiabilidad que existeefecto significativo del peso en los días que tardan los enfermos en curarse, de igual maneralo hicieron los grupos etáreos estudiados. Al revisar el efecto de los fármacos (tratamiento)se observó que éstos ejercieron el mismo efecto en los días para curarse por lo tanto esindistinto usar uno o el otro.En este caso, al igual que en los bloques, si existe efecto de hileras o columnas se concluyenada más que era necesario bloquear en ese sentido. Si se encuentra efecto de tratamiento,se debe aplicar alguna prueba de rangos múltiples.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior6. DISEÑOS FACTORIALESComo se mencionó en un principio, todos los diseños hasta ahora desarrollados son diseñossimples donde solo se ha analizado el efecto de tratamiento. Sin embargo, se presentansituaciones donde la interrogante a investigar se encuentra supeditada por varios factorescontrolables, por ejemplo: El efecto de diferentes dosis de un desparasitante en niños de diferentes condicionessociales. El efecto de diferentes productos para reducir triglicéridos en pacientes con distintascondiciones corporales, etc.En la parte introductoria de este documento se mencionó que un factor es un tratamientoque genera más tratamiento (niveles de un factor). Puede ser que la reducción de lostriglicéridos pueda estar relacionada con tipo de producto y una condición corporaldeterminada, es decir, puede ser que exista efecto de interacciones de los niveles de losfactores estudiados. Si bien es cierto que en algunos casos se pueden estudiar por separadostales efectos, el tiempo que se requiere para obtener la repuesta es mayor y además muchasveces se necesita aplicar ambos factores para ver el comportamiento de las interacciones delos niveles de éstos.Es por ello que una de las ventajas de este tipo de diseño es que además de estudiar losefectos principales, se pueden estudiar las interacciones de los niveles de los factoresreduciendo el tiempo de experimentación y además proporcionando conclusiones másconcretas en el estudio.Los diseños factoriales se dividen en diseños factoriales simples y diseños factorialescomplejo. Estos pueden ejecutarse en cualquiera de los diseños simples o clásicos hastaahora desarrollado, es decir, que se pueden tener diseños factoriales en un diseñocompletamente al azar, en bloques completamente al azar y en cuadrado latino. De igualforma se puede hacer en los diseños factoriales complejos, todo depende de lascaracterísticas del material experimental que se utilice en el experimento.A continuación se desarrollan diseños factoriales simples en arreglos completamente al azary en bloques completamente al azar.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior6.1. ¿Cuándo utilizar diseños factoriales simples en un arreglo completamente alazar?De cuando utilizar estos diseño se ha expuesto anteriormente por lo tanto solo se desarrollalo de completamente al azar. Los diseños factoriales simples en arreglo completamente alazar su utilizan cuando se está interesado estudiar al mismo tiempo el efecto de dos o másfactores al mismo tiempo y el material experimental a usar es homogéneo, es decir, nopresenta factor de estorbo alguna que pueda afectar los resultados del experimento.De forma general los diseños factoriales simples se puede clasificar de acuerdo al númerode factores que se estudien o bien de acuerdo a que si se estudian todos los niveles de losfactores (factoriales completos) o se estudian cierto niveles de éstos (factorialesincompletos).En función del número de factores que se estudien, los diseños factoriales pueden serbifactoriales, trifactoriales, etc. Generalmente es recomendable hasta tres por el efecto deinterpretación.Para el análisis de experimentos factoriales se analizan primero los efectos principales(factores individuales) y posteriormente las interacciones de los mismos. Hay autores quemencionan que en caso de existir efecto de las interacciones no tiene sentido estudiar losfactores por separados ya que para ver el efecto en la variable respuesta se requiere de lasinteracciones de los niveles de los factores en estudio.6.2. Arreglo combinatorioComo se ha mencionado anteriormente, un factor es una clase de tratamiento que generamás tratamiento llamados niveles. Un nivel se refiere a los diferentes tratamientos dentro deun factor y arreglo combinatorio se refiere a la combinación de los niveles de los factoresen estudio. Suponga que se tiene un factor A con tres niveles (a1, a2, a3) y un factor B concuatro niveles (b1, b2, b3, b4). En este caso se tiene un experimento bifactorial 3 x 4. Elarreglo combinatorio de estos dos factores sería el que se muestra en el Cuadro 25.Cuadro 25. Arreglo combinatorio bifactorial 3 x 4.Factor AFactor Bb1 b2 b3 b4a1 a1b1 a1b2 a1b3 a1b4a2 a2b1 a2b2 a2b3 a2b4a3 a3b1 a3b2 a3b3 a3b4
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior6.3.Modelo aditivo linealPara representar un experimento factorial se utiliza un modelo lineal que tome enconsideración la suma de una constante general común a todas las observaciones más losefectos principales de los factores a estudiar así como los efectos secundarios(interacciones) adicionándole finalmente un efecto aleatorio o error experimental. Ademásse tiene que considerar en el modelo la forma de asignación de los tratamientos definidos(interacciones) a las unidades experimentales. Esto quiere decir, que si el materialexperimental es homogéneo, se hará en un arreglo completamente al azar, si hay un factorde estorbo, entonces se hará en bloques completamente al azar, etc.Es importante mencionar que en este tipo de experimentos factoriales, todos los factores seestudian bajo un mismo rigor, cosa que no ocurres en los experimentos factorialescomplejos ya que en éstos se sacrifica precisión en uno para estudiar con mayor precisión elotro.Supóngase que en el ejemplo de arreglo combinatorio expuesto líneas arriba, se lleva acabo en un diseño o arreglo completamente al azar, entonces su modelo aditivo lineal seríael siguiente:( )Yijk = Variable respuestaµ = Efecto común a todas las observacionesAi = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor ABj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B(A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor BEijk = Error del modeloEn este diseño se prueban hipótesis tanto para el factor A, factor B y para las interacciones,bajo la misma tipología desarrollada en este documento (hipótesis nula e hipótesisalternativa). En caso de rechazo de la hipótesis nula, se debe hacer prueba de rangosmúltiples según sea el casoUn cuadro de vaciamiento de información para un diseño bifactorial un arreglocompletamente al azar se muestra a continuación.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 26. Cuadro de vaciamiento de información para un diseño bifactorial en unarreglo completamente al azar.Factor A Factor BRepeticionesΣYij.1 2 3 …ka1b1 Y111 Y112 Y113 Y11k Y11.b2 Y121 Y122 Y123 Y12k Y12.b3 Y131 Y132 Y133 Y13k Y13.bj Y1j1 Y1j2 Y1j3 Y1jk Y1j.a2b1 Y211 Y212 Y213 Y21k Y21.b2 Y221 Y222 Y223 Y22k Y22.b3 Y231 Y232 Y233 Y23k Y23.bj Y2j1 Y2j2 Y2j3 Y2jk Y2i.a3b1 Y311 Y312 Y313 Y31k Y31.b2 Y321 Y322 Y323 Y32k Y32.b3 Y331 Y332 Y333 Y33k Y33.bj Y3j1 Y3j2 Y3j3 Y3jk Y3j.aib1 Yi11 Yi12 Yi13 Yi1k Yi1.b2 Yi21 Yi22 Yi23 Yi2k Yi2.b3 Yi31 Yi32 Yi33 Yi3k Yi3.…bj Yij1 Yij2 Yij3 Yijk Yij.De este cuadro se extrae la información de los efectos principales y secundarios(interacciones) como se muestra en el Cuadro 27.Cuadro 27. Información de los efectos principales y de las interacciones entre losmismos.Factor AFactor BΣYi..b1 b2 b3 b4 …bja1 Y11. Y12. Y13. Y14. Y1j. Y1..a2 Y21. Y22. Y23. Y24. Y2j. Y2..a3 Y31. Y32. Y33. Y34. Y3j. Y3..…ai Yi1. Yi2. Yi3. Yi4. Yij. Yi..ΣY.j. Y.1. Y.2. Y.3. Y.4. Y.j. Y…Las ecuaciones de trabajo son las siguientes:(∑ )
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superior( )( )( )( )( )La salida de varianza de acuerdo al modelo aditivo lineal sería la que se muestra en elCuadro 28.Cuadro 28. Salida de varianza para un diseño bifactorial en un arreglocompletamente al azar.F.V gl SC CM Fc FtFactor A a-1 SCA F(,glA, gl Error)Factor B b-1 SCB F(,glB, gl Error)A*B (a-1)(b-1) SCAB( )( )F(,glAB, gl Error)Error ab(r-1) SCError( )Total abr-1 SCTotalesSi el diseño bifactorial se hubiera llevado a cabo en arreglo en bloques completamente alazar el modelo aditivo lineal es el siguiente:( )Yijk = Variable respuestaµ = Efecto común a todas las observacionesAi = Efecto del i-ésimo nivel del factor A: i = a1, a2, a3 niveles del factor ABj = Efecto del j-ésimo nivel del factor B: j = b1, b2, b3, b4 niveles del factor B(A*B)ij = Interacción del i-ésimo nivel del factor A con el j-ésimo nivel del factor Bαk = Efecto de k-ésimo bloque: k = 1, 2, 3,… bloquesEijk = Error del modeloY la salida de varianza sería la que se muestra en el Cuadro 29.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 29. Salida de varianza para un diseño bifactorial en un arreglo de bloquescompletamente al azar.F.V gl SC CM Fc FtBloque k-1 SCBloquesF(, glbloque, glErrorFactor A a-1 SCA F(,glA, gl Error)Factor B b-1 SCB F(,glB, gl Error)A*B (a-1)(b-1) SCAB( )( )F(,glAB, gl Error)Error (ab-1)(r-1) SCError( )Total abr-1 SCTotalesEn este caso se adicionaría una hipótesis más que sería la de bloque y si hubiera un rechazode Ho, la interpretación sería la misma que se ha mencionado anteriormente.EjemploUn médico está interesado en determinar si tanto el estado nutricional como la edad (grupoetáreo) de la madre tiene efecto sobre el peso del recién nacido. Los estados nutricionalesde su interés fueron: Normal, Sobrepeso y Obesa, y los grupos etáreos fueron: menores a 15años, 15 a 18 años, 19 a 30 años y mayores a 30 años. Seleccionó de forma aleatoria cuatromadres para cada combinación de los niveles de los dos factores, estado nutricional y grupoetáreo). Los pesos obtenidos en gramos fueron los que se reportan en el Cuadro 30.En este caso se tiene un experimento bifactorial, Estado Nutricional y Grupo Etáreo, cadauno con tres y cuatro niveles, respectivamente. Esto hace que se tenga un bifactorial 3 x 4(esto vendría a ser un factorial completo asimétrico, asimétrico por no tienen el mismonúmero de niveles y completo por se estudian todos los niveles que han sido propuestos porel investigador. Por otra parte se tiene cuatro repeticiones por tratamiento (combinación),entonces viene a ser un bifactorial 3 x 4 con 4 repeticiones, haciendo un total de 48unidades experimentales como se muestra en el Cuadro 30.Para los datos del Cuadro 30 realice lo siguiente:a. Proponga y describa un modelo aditivo lineal para el experimento.b. Proponga los juegos de hipótesis a probar.c. Realice el análisis de varianza correspondiente de acuerdo al modelo aditivo lineal
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorpropuesto en el inciso a., a una significancia del 1%. Realice conclusiones.d. Si existe rechazo de Ho en cualquiera de los factores como en las interacciones delos mismos, realice la prueba de rangos múltiples de Tukey al 99% de confiabilidad.Emita conclusionesCuadro 30. Pesos de los recién nacidos de acuerdo al estado nutricional de la madre yal grupo etáreo de las mismas.Estado Nutricional Grupo EtáreoRepeticiones1 2 3 4NormalMenor de 15 1800 1900 1700 200015 a 18 2000 2400 2900 300019 a 30 3000 2800 2900 3200Mayor a 30 3100 3300 2600 2800Con sobrepesoMenor de 15 2100 1800 1900 220015 a 18 2500 2900 3200 290019 a 30 2700 2900 3100 3500Mayor a 30 2900 2600 3200 2700ObesaMenor de 15 3000 2800 2400 250015 a 18 3100 3300 2900 340019 a 30 2800 2500 3200 3100Mayor a 30 2800 3100 3400 3500Dado que este experimento fue realizado en un arreglo completamente al azar no esnecesario totalizar las columnas por lo tanto se procede a continuación a obtener lainformación de las interacciones de los niveles de los factores estudiados. Para ello esnecesario totalizar en fila las interacciones como se muestra en el Cuadro 31 posteriormentehacer en cuadro de las interacciones que conllevaran a los totales de los efectos principalescomo se reporta en el Cuadro 32, estos totales se muestran tanto en la suma de las hilerascomo de las columnas de acuerdo a como se dispongan los factores (totales marginales) ylos valores de las interacciones están dentro del cuadro.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 31. Datos del experimento con las interacciones totalizadas.EstadoNutricionalGrupoEtáreoRepeticionesΣYij.1 2 3 4NormalMenor de 15 1800 1900 1700 2000 740015 a 18 2000 2400 2900 3000 1030019 a 30 3000 2800 2900 3200 11900Mayor a 30 3100 3300 2600 2800 11800Con sobrepesoMenor de 15 2100 1800 1900 2200 800015 a 18 2500 2900 3200 2900 1150019 a 30 2700 2900 3100 3500 12200Mayor a 30 2900 2600 3200 2700 11400ObesaMenor de 15 3000 2800 2400 2500 1070015 a 18 3100 3300 2900 3400 1270019 a 30 2800 2500 3200 3100 11600Mayor a 30 2800 3100 3400 3500 12800Cuadro 32. Efectos principales e interacciones de los factores Estado Nutricional yGrupo Etáreo.EstadoNutricionalGrupo Etáreo (años)ΣYi..Menor de 15 15 a 18 19 a 30 Mayor a 30Normal 7400 10300 11900 11800 41400Con sobrepeso 8000 11500 12200 11400 43100Obesa 10700 12700 11600 12800 47800ΣY.j. 26100 34500 35700 36000 132300Desarrollando las actividades solicitadas para el ejemplo se tiene lo siguiente:a. Modelo aditivo lineal( )Yijk = Variable respuesta (peso de los recién nacidos)µ = Efecto común a todas las observacionesNi = Efecto del i-ésimo estado nutricional; i = Normal, Con sobrepeso y ObesaGj = Efecto del j-ésimo grupo etáreo; menores de 15, 15 a 18, 19 a 30 y mayores a 30 años(N*E)ij = Efecto de la interacción del i-ésimo nivel del factor Estado Nutricional con el j-ésimo nivel del factor Grupo EtáreoEijk = Error del modelo
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación Superiorb. Juego de HipótesisComo existen dos factores y sus interacciones, las hipótesis son las siguientes:Para el factor Estado Nutricional:Ho: µNormal- µSobre peso- µObesa = 0Ha: µNormal- µSobre peso- µObesa  0Para el factor Grupo Etáreo:Ho: µmenores de 15 - µ15 a 18 - µ19 a 30 - µmayores 30 años = 0Ha: µmenores de 15 - µ15 a 18 - µ19 a 30 - µmayores 30 años  0Para las interacciones:Ho: µa1b1 - µa1b2 - µa1b3 - µa1b4 - … µa3b4 = 0Ha: µa1b1 - µa1b2 - µa1b3 - µa1b4 - … µa3b4  0c. Análisis de varianza(∑ )( )( ) ( )( )( )( )( )( )( )( )( )Con estos cálculos se construye la salida o tabla de varianza como se muestra en el Cuadro33.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorCuadro 33. Salida de varianza para el diseño bifactorial en un DCA del ejemplo.F.V gl SC CM Fc Ft (0.01)Estado Nutricional 2 1373750 686875 8.3609467 5.248Grupo Etáreo 3 5510625 1836875 22.359256 4.377Interacción 6 1196250 199375 2.4268808 3.351Error 36 2957500 82152.778Total 47 11038125De acuerdo a los resultados del análisis de varianza se puede concluir con 99% deconfiabilidad que el peso de los recién nacidos se ve afectado por el Estado Nutricional ypor el Grupo Etáreo de las madres, es decir, que ejercen efectos significativos (P < 0.01) enel peso de los recién nacidos, no así las interacciones de los niveles estudiados ya que éstaresultó ser no significativa. Esto indica que los factores estudiados ejercen efectos aditivoso bien que actúan de forma independiente en la variable respuesta.d. Separación de media de Tukey al 99% de confiabilidadCuando se dan este tipo de resultados hay que determinar el nivel o niveles de cada factorque provocaron el rechazo de la hipótesis nula en el análisis de varianza. Para ello hay quehacer los ajustes necesarios como se muestra en el Cuadro 34.Cuadro 34. Ajuste de los efectos principales y secundarios para la separación demedias.Efecto Total Promedio AjusteA ΣYi.. √B ΣY.j. √AB ΣYij. √Aplicando estos ajustes para los efectos principales se tiene lo siguiente:
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorEstado Nutricional Totales PromedioNormal 41400 2587.5Con sobrepeso 43100 2693.75Obesa 47800 2987.5Aplicando Tukey para el factor Estado Nutricional se tiene lo siguiente:√ √Ordenando los promedios de los niveles del factor Estado Nutricional y estableciendo lascomparaciones correspondiente se tiene lo siguiente:Estado Nutricional Promedio Comparaciones Diferencias ResultadoObesa 2987.5 Obesa-Sobrepeso 293.75 ns aCon sobrepeso 2693.75 Obesa- Normal 400 * abNormal 2587.5 Sobrepeso - Normal 106.25 ns bEn este caso se puede decir que de los niveles del factor Estado Nutricional, solo el nivelObesa ejerció un efecto distinto (P <0.01) en el peso de los recién nacidos.Los ajustes para los niveles del factor Grupo Etáreo se tiene lo siguiente:Grupo Etáreo Totales PromedioMenor de 15 26100 217515 a 18 34500 287519 a 30 35700 2975Mayor a 30 36000 3000Aplicando la Tukey para los niveles del factor Grupo Etáreo√ √Ordenando los promedios de los niveles del factor Grupo Etáreo y estableciendo lascomparaciones correspondiente se tiene lo siguiente:
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorComparaciones DiferenciasMayor a 30 - 19 a 30 25 nsMayor a 30 - 15 a 18 125 nsMayor a 30 - Menor a 15 825*19 a 30 - 15 a 18 100 ns19 a 30 - Menor a 15 800 *15 a 18 - Menor a 15 700 *Grupo Etáreo Promedio ResultadoMayor a 30 3000 a19 a 30 2975 a15 a 18 2875 aMenor de 15 2175 bDe acuerdo a los resultados de Tukey se puede concluir que de los niveles del factor GrupoEtáreo, solamente uno de éstos ejerció un efecto distinto el peso de los recién nacidos comolas madres menores de 15 años.
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorBIBLIOGRAFIA CONSULTADA PARA ESTRUCTURAR EL DOCUMENTOCOCHRAN, W. y G.M. COX. 1991. Diseños Experimentales. 2da. Edic. Edit. Trillas.México, D.F.FREUD, R.J. and R.C. LITTELL. 1991. SAS System for Regression. SAS Institute Inc,Cary. N.C. USA.HERRERA HARO, J.G y G. LORENZANA. 1994. Aplicaciones del SAS (StatisticalAnalysis System) a los Métodos Estadísticos. Instituto Tecnológico Agropecuariode Oaxaca. Oaxaca, México.HILDERBRAND, P.E. y F. POEY. 1989. Ensayos Agronómicos en Fincas según elEnfoque de Sistemas Agropecuarios. Edit. Agropecuaria Latinoamericana, Inc.Estados Unidos de Norteamérica.INFANTE GIL, S. y G. ZARATE DE LARA. 1990. Métodos Estadísticos. Un enfoqueinterdiciplinario. 2da. Edic. Edit. Trillas. México, D.F.LITTLE, T. y F.J. HILLS. 1989. Métodos Estadísticos para la Investigación Agropecuaria.2da. Edic. Edit. Trillas. México, D.F.LOPEZ, P.F. 1989. Uso del SAS para análisis estadísticos de datos experimentales. CentroAgronómico Tropical de Investigación y Enseñanza C.A.T.I.E. Turrialba, CostaRica.MARTINEZ-GARZA, A. 1988. Diseños Experimentales. Métodos y Elementos de Teoría.Edit. Trillas. México, D.F,MARTINEZ-GARZA, A. 1994. Experimentación Agrícola. Métodos Estadísticos.Universidad Autónoma Chapingo. Chapingo, México.MARTINEZ SOLARIS, F. 2111.http://cdn.slidesharecdn.com/ss_thumbnails/estadisticaydiseosexperimentales-110925201348-phpapp02-thumbnail.jpg?1316999785
  • Por Ing. M.Sc. Francisco Martínez Solaris. Mgs. En Educación SuperiorMONTGOMERY, D.C. 1991. Diseños y Análisis de Experimentos. Edit. Iberoaméria.México, D.F.STEEL, R.G.D. y J.H. TORRIE. 1992. Bioestadística. Principios y Procedimientos. 2da.Edic. Edit. McGraw-Hill. México, D.F.RAO, C.R. 1952. Advanced statistical methods in biometric reseach. John Wiley. NewYork, USA.RENDON, S.G. 1992. Métodos Estadísticos (Muestreo, Diseños Experimentales,Estadística No Paramétrica). Universidad Autónoma de Chapingo. Chapingo,México.REYES, C.P. 1992. Diseño de Experimentos Aplicados: Agronomía, Biología, Química,Industrias, Ciencias Sociales. 3era Edic. Edit. Trillas. México, D.F.RODRIGUEZ del ANGEL, J.M. 1991. Métodos de Investigación Pecuaria. Edit. Trillas.México, D.F.WAYNE W. D. 1977. Estadística con Aplicaciones a las Ciencias Sociales y a laEducación. Edit. McGraw-Hill. México.