Diseño experimentos varios factores

31,265 views

Published on

tema 3, diseño de experimentos con varios factores

Published in: Education
2 Comments
28 Likes
Statistics
Notes
No Downloads
Views
Total views
31,265
On SlideShare
0
From Embeds
0
Number of Embeds
84
Actions
Shares
0
Downloads
10
Comments
2
Likes
28
Embeds 0
No embeds

No notes for slide

Diseño experimentos varios factores

  1. 1. Enero – Junio 2012 6º Semestre Ingeniería Ambiental Desarrollado por: IBQ. Erick R. López Almanza
  2. 2.  En ocasiones hay dos (o más) fuentes de variación lo suficientemente importantes como para ser designadas factores de bloqueo. En tal caso, ambos factores bloque pueden ser cruzados o anidados.  Los factores bloque están cruzados cuando existen unidades experimentales en todas las combinaciones posibles de los niveles de los factores bloques.
  3. 3.  También denominado diseño fila-columna, se caracteriza porque existen unidades experimentales en todas las celdas (intersecciones de fila y columna).  El modelo matemático de este diseño es: Respuesta = Constante + Efecto Bloque Fila + Efecto Bloque Columna + Efecto Tratamiento + Error
  4. 4.  Los factores bloque están anidados si cada nivel particular de uno de los factores bloque ocurre en un único nivel del otro factor bloque.
  5. 5.  Dos factores bloque se dicen anidados cuando observaciones pertenecientes a dos niveles distintos de un factor bloque están automáticamente en dos niveles distintos del segundo factor bloque.
  6. 6.  En la siguiente tabla puede observarse la diferencia entre ambos tipos de bloqueo.
  7. 7.  En algunas ocasiones se está interesado en estudiar la influencia de dos (o más) factores tratamiento, para ello se hace un diseño de filas por columnas.  En este modelo es importante estudiar la posible interacción entre los dos factores. Si en cada casilla se tiene una única observación no es posible estudiar la interacción entre los dos factores, para hacerlo hay que replicar el modelo, esto es, obtener k observaciones en cada casilla, donde k es el número de réplicas.
  8. 8.  El modelo matemático de este diseño es: Respuesta = Constante + Efecto Factor Fila + Efecto Factor Columna + Efecto Interacción + Error
  9. 9.  Generalizar los diseños completos a más de dos factores es relativamente sencillo desde un punto de vista matemático, pero en su aspecto práctico tiene el inconveniente de que al aumentar el número de factores aumenta muy rápidamente el número de observaciones necesario para estimar el modelo.  En la práctica es muy raro utilizar diseños completos con más de factores.
  10. 10.  Un camino alternativo es utilizar fracciones factoriales que son diseños en los que se supone que muchas de las interacciones son nulas, esto permite estudiar el efecto de un número elevado de factores con un número relativamente pequeño de pruebas. Por ejemplo, el diseño en cuadrado latino, en el que se supone que todas las interacciones son nulas, permite estudiar tres factores de k niveles con solo k2 observaciones.  Si se utilizase el diseño equilibrado completo se necesitan k3 observaciones.
  11. 11.  El agrupamiento de las unidades experimentales en dos direcciones (filas y columnas) y la asignación de los tratamientos al azar en las unidades, de tal forma que en cada fila y en cada columna se encuentren todos los tratamientos constituye un diseño cuadrado latino.  El nombre de cuadrado Latino se debe a R.A. Fisher. Las primeras aplicaciones fueron en el campo agronómico, especialmente en los casos de suelos con tendencias en fertilidad en dos direcciones.
  12. 12. 1. Las unidades estadísticas se distribuyen en grupos, bajo dos criterios de homogeneidad dentro de la fila y dentro de la columna y heterogeneidad en otra forma. 2. En cada fila y en cada columna, el número de unidades es igual al número de tratamientos. 3. Los tratamientos son asignados al azar en las unidades experimentales dentro de cada fila y dentro de cada columna. 4. El número de filas = número de columnas = número de tratamientos.
  13. 13.  El diseño en cuadrado latino está especialmente indicado para estudiar un factor-tratamiento con K niveles y con dos factores-bloque de K bloques cada uno. Este diseño se basa en el concepto de cuadrado latino que es el siguiente.  “Un cuadrado latino K × K es una disposición de K letras en una matriz K × K de forma que todas las letras aparecen una vez en cada fila y una vez en cada columna.
  14. 14.  Por ejemplo, un cuadrado latino 3 × 3 es el siguiente A B C B C A C A B
  15. 15.  El cuadrado latino, tambien definido como ANOVA de dos factores, queda asi: FUENTE DE VARIACIÓN SUMA DE GRADOS DE CUADRADO VALOR F CUADRADOS LIBERTAD MEDIO Renglores SCRen a-1 CMRen CMRen/CME Columnas SCCol b-1 CMCol CMCol/CME Tratamiento SCTr a-1 CMTr CMTr/CME Dentro de muestras (error) SCE (a-2)(a-1) CME Variación total SCT n-1 CMT
  16. 16.  Como ven, este es el tema que vimos antes de salir de vacaciones, la explicacion ya la dimos en clase, asi que nos enfocaremos a la explicacion del calculo del mismo pero en Excel.
  17. 17.  Ejemplo:  Un investigador quiere evaluar la productividad de cuatro variedades de aguacate y decide realizar el ensayo en un terreno que posee un gradiente de pendiente de oriente a occidente y además, diferencias en la disponibilidad de Nitrógeno de norte a sur, para controlar los efectos de la pendiente y la disponibilidad de Nitrógeno, utilizó un diseño de cuadrado latino, las variedades son: A, B, C y D, los datos corresponden a la producción en kg/parcela
  18. 18. Disponibilidad de N Pendiente 1 Pendiente 2 Pendiente 3 Pendiente 4 1 785 730 700 595 2 855 775 760 710 3 950 885 795 780 4 945 950 880 835
  19. 19.  En Excel se procede de la siguiente forma, se selecciona la pestaña “Datos”, posteriormente se selecciona la opcion “Analisis de datos”, enseguida una vez que aparecio el cuadro de dialogo, seleccionamos la opcion que dice “Análisis de varianza de dos factores con una sola muestra por grupo”
  20. 20.  Damos click en “Aceptar”, enseguida aparece el siguiente cuadro de dialogo:
  21. 21.  En rango de entrada, seleccionamos con el puntero, de esquina a esquina de nuestros datos que colocamos en la hoja de excel, marcamos el cuadro de dice “Rotulos”, el valor de alfa debe estar en 0.05, seleccionamos en una hoja nueva y damos aceptar.
  22. 22.  Y obtenemos esto…
  23. 23.  Se realiza un experimento para determinar el efecto de cuatro sustancias químicas diferentes sobre la resistencia de una tela. Las sustancias se emplean como parte del proceso terminal de planchado permanente. Para ello, se escogen cinco muestras de tela y se aplica un diseño aleatorizado por bloques completos mediante la prueba de cada sustancia en un orden aleatorio sobre cada una de las muestras de tela. Se probará la diferencia en las medias utilizando para ello el análisis de la varianza con α = 0,01. Los datos aparecen a continuación:
  24. 24.  En los arreglos por bloques, se pueden analizar 4 factores, introduciendo un cuarto factor o bloque en un diseño cuadrado latino, siguiendo las mismas reglas utilizadas para introducir un tercer factor en un diseño cuadrado de dos factores.  A este cuarto factor o bloque se le denomina componente griego, ya que se utilizan letras griegas para identificar sus niveles, a la adición de un diseño cuadrado latino y un cuarto factor, se le llama Diseño Cuadrado Greco-Latino
  25. 25.  Es un diseño con cuatro factores a k niveles  Se asume que no hay interacciones  Requiere k2 observaciones  El diseño factorial completo requiere k4  Cada nivel de un factor aparece una vez con cada nivel de los otros factores  Es una superposición de dos cuadrados latinos
  26. 26. Cada letra griega aparece una vez en cada fila, en cada columna y una con cada letra latina
  27. 27. El modelo es donde αi es el efecto fila, βj efecto columna, γk efecto De la letra latina y δl efecto de letra griega La notación yij (kl) indica que k y l dependen de ij. Tabla ANOVA
  28. 28.  Un experimentador, desea probar en un arreglo cuadrado por bloques, que efecto tienen el factor lote de materia prima y el operador que prepara Dinamita, en la respuesta Explosividad de la misma. También desea bloquear el arreglo con la Formula que se utiliza para preparar la dinamita, para esto considera a el bloque Formula como su Factor o Bloque Latino. El arreglo queda como sigue (desea también probar 5 niveles):
  29. 29. O perador Lote 1 2 3 4 5 Totales Prom edio 1 24 20 19 24 24 111 22.2 2 17 24 30 27 36 134 26.8 3 18 38 26 27 21 130 26 4 26 31 26 23 22 128 25.6 5 22 30 20 29 31 132 26.4 Totales 107 143 121 130 134 635 G ran total Prom edio 21.4 28.6 24.2 26 26.8 A EDCB B C D E C C C D D ED E BAE A BA A B
  30. 30. Tenemos pues, que la suma de cuadrados totales es: SST = SSLote + SSOperador + SSFomula + SSerror Entonces: SSTotales = ijkj b i a k N c y y2 11 2 1 ... SSTotales = SSTotales = 242 +202 +192 +242 +242 + 172 +.............+ 292 +312 - 2 635 25 SSTotales = 676 ijkj b i a k N c y y2 11 2 1 ...
  31. 31. SSLote= 2 1 2 i b Y i a Y N .. ... 𝑺𝑺𝒍𝒐𝒕𝒆 = 1112+1342+1302+1282+1322 5 − 6352 25 =68 = 150SSOperador= 2 1 2 .. ...k a Y k b Y N Val Val 2 A 143 20449 B 101 10201 C 112 12544 D 149 22201 E 130 16900 82295 SSFórmula= 2 1 2 . . ...j c Y k c Y N 2 1 2 . . ...j c Y k c Y N SSFórmula= (82295/5) – (635²/25) = 330
  32. 32. Para calcular la suma de cuadrados del componente Griego, tendremos que obtener las sumas naturales totales por nivel: Nivel Griego Total Y..1. = Y..2. = Y..3. = Y..4. = Y..5. =
  33. 33. Nivel Griego total total² 135 18225 119 14161 122 14884 121 14641 138 19044 Total= 635 80,955 SSLinea= 330 2 1 2 .. . ....k b Y k b Y N SSLinea = (80955/5) - = 62 2 635 25 ( )
  34. 34. La suma de cuadrados del error, se calcula nuevamente por diferencia: SSerror = SSTotales - SSLote -SSOperador -SSFormula - SSLinea SSerror = 676 - 68 - 150 - 330 - 62 = 66 Una vez calculados todos los componentes de la variación por separado, se puede elaborar la tabla anova: Fuente de variacion Suma de cuadrados Grados de libertad Grados de Medios Fo Lote 68 4 17 2,06 Operador 150 4 37,5 4,55 Formula 330 4 82,5 10,00 Linea 62 4 15,5 1,88 Error 66 8 8,25 Totales 676 24 160,75 n-1 (n-3)(n-1) Se divide la suma de cuadrados y los gl Error/ grados medios
  35. 35. Como este es también un arreglo cuadrado (todos los factores tienen la misma cantidad de niveles), solo es necesario consultar un F de Fisher para compararse después con las calculadas por factor y evaluar nuestra hipótesis (que es la misma analizada en el ejemplo anterior), a un 95% de nivel de confianza Fo, 1, 2 -= F0.05, 4, 8 = 3.84, Entonces tenemos: Para el lote: Como la Fo(2.06) < F0.05, 4, 8 = 3.84, entonces se Acepta Ho, el lote de material no es fuente de variación para la respuesta. Este es el valor de la tabla de la distribución F. V1 = 4 y V2 = 8
  36. 36. Para el Operador Como la Fo(4.55) > F0.05, 4, 8 = 3.84, entonces se Rechaza Ho, el operador es fuente de variación para la respuesta. Para la Formula Como la Fo(10.0) > F0.05, 4, 8 = 3.84, entonces se Rechaza Ho, el tipo de formula es fuente de variación para la respuesta. Para La Línea de ensamble: Como la Fo(1.88) < F0.05, 4, 8 = 3.84, entonces se Acepta Ho, la línea de ensamble no es fuente de variación para la respuesta.
  37. 37.  El diseño en bloques aleatorios es apropiado y eficiente cuando se desea investigar las diferencias entre los promedios de k tratamientos en condiciones homogéneas, vale decir, eliminando las diferencias iniciales entre las unidades experimentales.  Estas condiciones homogéneas pueden ser: parcelas de terreno, lotes de producción, camadas de ratones, o una misma persona sometida a diferentes tratamientos. Se supone que la variabilidad de las unidades experimentales entre parcelas, lotes, camadas o personas, es mayor que dentro de esos “bloques”.
  38. 38.  Por tanto, al adjudicar los k tratamientos aleatoriamente a las unidades que constituyen un bloque, se obtiene un efecto de tratamiento limpio de esa variación entre bloques que podría llegar a encubrir la diferencia entre tratamientos
  39. 39.  Comparando con el diseño completamente aleatorio, se tiene por tanto una fuente de variación adicional a las “entre tratamientos” y “dentro de tratamientos”: la variación “entre bloques”. La suma de cuadrados correspondiente se simbolizará por SCB. Los grados de libertad para el cálculo de CMB serán: b −1, el número de bloques menos 1.
  40. 40.  La SCB se calcula usando los valores de las sumas de los yij pertenecientes a cada uno de los bloques:
  41. 41.  y la tabla de ANOVA será:
  42. 42.  Nota: la suma de cuadrados entre tratamientos es la misma (escrita de otra manera) para el ANOVA de una vía. Lo que cambia es lo que llamamos suma de cuadrados dentro de tratamientos que ahora se dividió entre las SC de Bloques y la SC Residual.
  43. 43.  Ejemplo: Se tienen tres especies de cítricos a los cuales se mide la razón entre el área de las hojas y el peso seco, bajo 3 condiciones de sombra (sol, semisombra y sombra).
  44. 44.  En este problema no interesa determinar si hay diferencias entre las condiciones de sombra (bloques), supuesto para haber decidido este diseño, sino que interesa analizar si las tres especies difieren en sus resultados.
  45. 45.  La tabla de análisis de varianza es entonces:
  46. 46.  En la prueba de significación, como se dijo más arriba, sólo interesa investigar la diferencia entre tratamientos.  Luego, las hipótesis son:
  47. 47.  Esto hace que la F de interés sea la F de los tratamientos, F observado de 19,536 con un valor p de 0,009. Por tanto se rechaza la hipótesis de nulidad y se acepta que hay al menos dos tratamientos (especies) que difieren significativamente en sus efectos (razón).
  48. 48.  El término “experimento factorial” o “arreglo factorial” se refiere a la constitución de los tratamientos que se quieren comparar.  Diseño de tratamientos es la selección de los factores a estudiar, sus niveles y la combinación de ellos.  El diseño de tratamientos es independiente del diseño experimental que indica la manera en que los tratamientos se aleatorizan a las diferentes u.e. y las formas de controlar la variabilidad natural de las mismas.
  49. 49.  Así, el diseño experimental puede ser completamente al azar, bloques al azar, bloques al azar generalizados, cuadro latino, etc. y para cada uno de estos diseños se puede tener arreglo factorial de los tratamientos, si estos se forman por la combinación de niveles de varios factores.  A ambos tipos de diseños, el de tratamientos y el experimental, les corresponde un modelo matemático
  50. 50.  Así, por ejemplo, si el diseño experimental es bloques al azar, el modelos es: yij = µ + τi + βj + εij respuesta = media general + efecto de tratamiento + efecto de bloque + error  Si se trata de un diseño factorial, los tratamientos se forman combinando los niveles de los factores en estudio, de manera que el efecto del tratamiento τi se considera a su vez compuesto de los efectos de los factores y sus interacciones.  Por ejemplo, si son dos factores en estudio se tiene: τi = τkl = αk + γl + ξkl tratamiento = factor A + factor B + interacción AB
  51. 51.  Haciendo una equivalencia entre los valores de i y los de k y l suponiendo que el factor A tiene K niveles y el factor B L:  Y el modelo resultante es: yklj = µ + αk + γl + ξkl + βj + εklj  Es poco usual tener diseños experimentales muy complicados en los experimentos factoriales, ya que se dificulta el análisis y la interpretación.
  52. 52.  La necesidad de estudiar conjuntamente varios factores obedece a la posibilidad de que el efecto de un factor cambie según los niveles de otros factores, esto es, que los factores interactúen, o exista interacción.  También se utilizan los arreglos factoriales cuando se quiere optimizar la respuesta o variable dependiente, esto es, se quiere encontrar la combinación de niveles de los factores que producen un valor óptimo de la variable dependiente. (superficie de respuesta)  Si se investiga un factor por separado, el resultado puede ser diferente al estudio conjunto y es mucho más difícil describir el comportamiento general del proceso o encontrar el óptimo.
  53. 53.  Las formulas son:
  54. 54.  La tabla de ANOVA es:
  55. 55.  Taguchi.  Los diseños experimentales de Taguchi estan basados en arreglos ortogonales y se hicieron populares por el Dr. Genichi Taguchi. Generalmente se identifican con el nombre de L8 que indica un arreglo con 8 corridas.
  56. 56.  El arreglo ortogonal es una herramienta ingenieril que simplifica y en algunos casos elimina gran parte de los esfuerzos de diseño estadístico. Es una forma de examinar simultáneamente muchos factores a bajo costo.  El Dr. Taguchi recomienda el uso de arreglos ortogonales para hacer matrices que contengan los controles y los factores de ruido en el diseño de experimentos.
  57. 57.  El método del Dr. Taguchi para el diseño de experimentos utiliza técnicas que implican bajos costos y que son aplicables a los problemas y requerimientos de la industria moderna.  El propósito que se tiene en el diseño del producto es encontrar aquella combinación de factores que nos proporcione el desempeño más estable y confiable al precio de manufactura más bajo.
  58. 58.  El trabajo de la filosofía del Dr. Taguchi comenzó a formarse en los inicios de la década de los 50's cuando fue reclutado para ayudar a mejorar el sistema telefónico japonés que había sido diseñado para la Segunda Guerra Mundial. Taguchi empleó experimentos de diseño usando especialmente una tabla conocida como "arreglos ortogonales" para tratar los procesos de diseño.
  59. 59.  Los arreglos ortogonales son un conjunto especial de cuadros en latín, construidos por Taguchi para planear los experimentos del diseño del producto.  El análisis del arreglo ortogonal de Taguchi es usado para producir los mejores parámetros para el diseño óptimo del proceso, con el mínimo número de experimentos (pruebas).
  60. 60.  Los resultados obtenidos para los arreglos ortogonales son analizados para obtener los siguientes objetivos: a) Estimar la contribución de los factores individuales que influyen en la calidad en la etapa del diseño del producto. b) Ganar la mejor condición para un proceso o un producto, así que las características en una buena calidad puedan ser sostenidas
  61. 61.  Los contrastes ortogonales se utilizan cuando se tienen un conjunto de tratamientos cualitativos con estructura, de tal forma que es conveniente comparar un tratamiento contra el promedio de otros tratamientos o un conjunto de tratamientos contra otro conjunto de tratamientos. Es decir, se prueban hipótesis de la forma: HO: 3T1 – T2 – T3 – T4 = 0 vs Hl : 3T1 – T2 – T3 – T4 ≠ 0
  62. 62.  Esta hipótesis compara el efecto del tratamiento 1 contra el promedio de los efectos de los tratamientos 2, 3, 4. HO: T1 + T2 – T3 – T4 = 0 vs Hl : T1 + T2 – T3 – T4 ≠ 0  Esta hipótesis compara el efecto conjunto del tratamiento 1 y 2 contra el efecto conjunto de los tratamientos 3 y 4.
  63. 63.  En general se prueban hipótesis de la forma:  A la combinación lineal de tratamientos se le llama contraste, en donde los λi son los coeficientes del contraste.
  64. 64.  Dos contrastes (C1 y C2) son ortogonales si  Por ejemplo si los contrastes son: C1 = T1 + T2 – T3 – T4 C2 = T1 – T2 C3 = T3 – T4  Entonces la tabla de coeficientes de los contrastes es:
  65. 65.  Los contrastes C1 y C2 son ortogonales porque:  Los contrastes C1 y C3 son ortogonales porque:  En un conjunto de tratamientos se pueden obtener conjunto de t-1 contrastes ortogonales.
  66. 66.  EJEMPLO:  Consideremos un experimento donde se compararon 4 variedades de maíz con un diseño de bloques al azar.  Variedad 1. Precoz resistente.  Variedad 2. Precoz susceptible.  Variedad 3. Tardía resistente.  Variedad 4. Tardía susceptible.  Los datos del rendimiento son:
  67. 67.  El análisis de varianza se calcula de acuerdo al análisis del diseño de bloques al azar:
  68. 68.  Las hipótesis que se desean probar son: H0: T1 + T2 – T3 – T4 = 0 vs Hl: T1 + T2 – T3 – T4 ≠ 0 H0: T1 - T2 = 0 vs Hl: T1 - T2 ≠ 0 H0: T3 – T4 = 0 vs Hl: T3 – T4 ≠ 0  La primera hipótesis compara las variedades precoces contra tardías la segunda hipótesis compara las dos variedades precoces y la tercera hipótesis compara las dos variedades tardías. Estas hipótesis se prueban en un análisis de varianza.
  69. 69.  La suma de cuadrados de tratamientos se particiona en tres partes, una para cada contraste. La tabla de los contraste es la que vimos anteriormente. La suma de cuadrados para contraste es:
  70. 70.  Donde:
  71. 71.  La suma de los cuadrados son:
  72. 72.  La tabla de análisis de varianza es: Fuentes de Variación Gl SC CM Fcal Ftab Bloques 4 12.30 3.0750 11.18 3.26 5.41 Tratamientos 3 12.95 4.3166 15.70 3.49 5.95 C1 1 11.25 11.2500 40.90 4.75 9.33 C2 1 0.10 0.1000 0.36 4.75 9.33 C3 1 1.60 1.6000 5.82 4.75 9.33 Error 12 3.30 0.2750 Total 19 28.55
  73. 73.  El análisis de varianza muestra que el efecto conjunto de los tratamientos 1 y 2 es diferente al efecto conjunto de los tratamientos 3 y 4.  Los tratamientos 1 y 2 no son diferentes. Los tratamientos 3 y 4 difieren significativamente.

×