Web

3,438 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
3,438
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
188
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Web

  1. 1. EL MÉTODO ESTADÍSTICO PARA EL DISEÑO DE EXPERIMENTOS
  2. 2. Contenido <ul><li>El análisis de varianza. </li></ul><ul><li>Modelos clásicos de diseño experimental. </li></ul><ul><li>La homogeneidad estadística de las comparaciones: diseños factoriales. </li></ul><ul><li>Diseños por bloques aleatorios. </li></ul>
  3. 3. El Análisis de Varianza <ul><li>Introducción: </li></ul><ul><ul><li>Cuando definimos el diseño de experimentos, diferenciamos dos aspectos: </li></ul></ul><ul><ul><ul><li>La planeación del experimento. </li></ul></ul></ul><ul><ul><ul><li>El método estadístico. </li></ul></ul></ul>
  4. 4. El Análisis de Varianza <ul><ul><li>El análisis de varianza fue creado por R.A. Fisher (1925). </li></ul></ul><ul><ul><li>Consideraremos el problema de definir si las diferencias observadas entre más de dos medias de una muestra pueden atribuirse al azar. </li></ul></ul>
  5. 5. La Metodología <ul><li>Representar gráficamente los datos: Diagramas de caja si se disponen de 10 datos o mas. </li></ul><ul><li>Formulación de las hipótesis. </li></ul><ul><li>Comprobación de requisitos </li></ul>
  6. 6. Análisis de Varianza en un Solo Sentido <ul><li>Ejemplo: </li></ul><ul><li>Supóngase que se desea comparar la acción de limpieza de tres detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de tela blanca manchada con una tinta común y después lavada con los detergentes respectivos en una máquina con agitador. </li></ul>Registros de Blancura Detergente A Detergente B Detergente C 77 72 76 81 58 85 71 74 82 76 66 80 80 70 77
  7. 7. Registro de blancura Detergente: niveles del factor fijos! Se analizar los existentes sin necesidad de tomar una muestra.
  8. 8. Análisis de Varianza en un Solo Sentido Tratamientos Medias <ul><li>Suposiciones sobre las variables y ij : </li></ul><ul><li>Son independientes. </li></ul><ul><li>Tienen distribuciones normales con las medias respectivas μ i </li></ul><ul><li>Tienen varianza común σ 2 </li></ul>
  9. 9. Análisis de Varianza en un Solo Sentido El modelo de las observaciones esta dado por: Y ij = μ + τ j + ε ij ; donde: μ es la media global τ j son los efectos del tratamiento ( τ j= μ j- μ ) ε ij : variables aleatorias independientes con con medias cero y varianza común σ 2 . ( ε ij : Y ij – μ j) Tratamientos Totales/columna Número Medias n 1 n 2 … n j … n k N Y .1 Y .2 … Y .j … Y .k Y..
  10. 10. Análisis de Varianza en un Solo Sentido Si la hipótesis nula es verdadera, toda la variabilidad se debe al azar.
  11. 11. Ecuación Fundamental del Análisis de Varianza (Niveles del Factor Fijo) Suma de cuadrados de las desviaciones de la gran media Suma de cuadrados de las desviaciones entre los tratamientos Suma de cuadrados de las desviaciones dentro de tratamientos
  12. 12. Tabla ANOVA (Niveles del Factor Fijo) Fuente df SS MS F Valor p Tratamiento k-1 SS tratamientos SS tratamientos/(k-1) P(F ( ν 1, ν 2) ≥f) Error N-k SS error SS error/(N-k) TOTAL N-1 SS total
  13. 13. Análisis de Varianza en un Solo Sentido <ul><li>Ejemplo: </li></ul><ul><li>Supóngase que se desea comparar la acción de limpieza de tres detergentes sobre la base de los siguientes registros de blancura tomados en 15 muestras de tela blanca manchada con una tinta común y después lavada con los detergentes respectivos en una máquina con agitador. </li></ul><ul><li>Pruebe en el nivel de significancia 0.01 si las diferencias entre las medias son significativas. </li></ul>Registros de Blancura Detergente A Detergente B Detergente C 77 72 76 81 58 85 71 74 82 76 66 80 80 70 77
  14. 14. Análisis de Varianza en un Solo Sentido Estadística Descriptiva Debe rechazarse la hipótesis nula, concluimos que los tres detergentes no son igualmente efectivos Anova: Single Factor SUMMARY Groups Count Sum Average Variance Detergente A 5 385 77 15,5 Detergente B 5 340 68 40 Detergente C 5 400 80 13,5 ANOVA Source of Variation SS df MS F P-value F crit Between Groups 390 2 195 8,48 0,01 6,93 Within Groups 276 12 23 Total 666 14        
  15. 15. Después de ANOVA… qué? <ul><li>Si el analista decide seleccionar las comparaciones para luego del resultado del ANOVA, las comparaciones se pueden realizar. </li></ul><ul><li>Sin embargo, el valor α se altera, debido a que la decisión de comparaciones no es aleatoria . </li></ul><ul><li>Métodos: </li></ul><ul><ul><li>Student - Newman – Keuls (SNK) </li></ul></ul><ul><ul><li>Scheffé test </li></ul></ul>
  16. 16. Pasos para la prueba: Student - Newman – Keuls (SNK)
  17. 17. Pasos para la prueba: Student - Newman – Keuls (SNK) <ul><li>Ordene las k medias muestrales de menor a mayor. </li></ul><ul><li>Tome la media cuadrada del error y los grados de libertad del error. </li></ul><ul><li>Obtenga el error estándar de la media para cada tratamiento, dicho valor será el denominador de la prueba F. </li></ul><ul><li>4. Tome los valores de la tabla: “Studentized Range”, con el valor de α deseado. Usando n 2 como los grados de libertad del error y p = 2,3,..k. </li></ul><ul><li>Multiplique los rangos por el error estándar de la media para cada tratamiento, para encontrar los LSR (least significant ranges) </li></ul><ul><li>Analice los rangos entre las medias por pares comenzando con el valor mas alto y mas bajo. </li></ul>
  18. 18. Método de Scheffé <ul><li>Usa el método de contrastes, sin embargo esos contrastes no necesitan ser ortogonales. </li></ul><ul><li>Pasos: </li></ul><ul><li>Establezca los contrastes de interés y calcule sus valores numéricos. </li></ul><ul><li>Determine el valor de f para el que </li></ul><ul><li>Calcule usando el valor de f del paso 2. </li></ul><ul><li>Calcule el error estándar de cada contraste. Para el contraste: , el error estándar esta dado por: </li></ul><ul><li>Sea c m el valor que denote a C m . Rechace la hipótesis de que el contraste de medias es cero si </li></ul>
  19. 19. Ejemplo <ul><li>La tabla adjunta muestra la vida de un tipo específico de bacteria (en minutos) expuesta a 4 temperaturas distintas. </li></ul><ul><li>Encuentre la tabla ANOVA y defina si la temperatura tiene efecto en la vida de la bacteria. </li></ul><ul><li>Establezca un contraste para comparar el promedio de vida de la bacteria entre la temperatura 1 y 2. </li></ul><ul><li>Establezca un contraste para comparar la vida de la bacteria bajo la temperatura 1 y las tres restantes. </li></ul>T1 T2 T3 T4 1,93 2,55 2,4 2,33 2,38 2,72 2,68 2,40 2,20 2,75 2,31 2,28 2,25 2,70 2,28 2,25
  20. 20. COMPONENTES DE VARIANZA
  21. 21. Componentes de la Varianza
  22. 22. Tabla ANOVA (Niveles del Factor Aleatorios) Fuente df SS MS EMS (Valor esperado) Tratamiento k-1 SS tratamientos SS tratamientos/(k-1) Error N-k SS error SS error/(N-k) TOTAL N-1 SS total
  23. 23. Tabla ANOVA (Niveles del Factor Aleatorios) <ul><li>Ejemplo: </li></ul><ul><li>Una empresa provee a un cliente con varios cientos de lotes de materia prima cada año. El cliente esta interesado en un mayor rendimiento del porcentaje de químico usable del producto. </li></ul><ul><li>Usualmente se toman tres muestras del rendimiento de cada lote para verificar la calidad de la materia prima. Ocurre variación dentro del lote, pero el cliente sospecha que existe variación significativa entre los lotes. </li></ul><ul><li>Para revisar esto, se han tomado cinco lotes aleatoriamente de varios lotes disponibles y tres rendimientos por lote. Los rendimientos se muestran en la tabla adjunta. </li></ul><ul><li>Cuánta varianza del experimento puede ser atribuida a las diferencias entre lotes? </li></ul><ul><li>Cuánta varianza del experimento puede ser atribuida al error aleatorio? </li></ul>
  24. 24. Tabla ANOVA (Niveles del Factor Aleatorios) Lotes Rendimiento del químico por lotes 1 2 3 4 5 74 68 75 72 79 76 71 77 74 81 75 72 77 73 79
  25. 25. Tabla ANOVA (Niveles del Factor Aleatorios) Factor Type Levels Values Lote random 5 1. 2. 3. 4. 5 Analysis of Variance for Yield Source DF SS MS F P Lote 4 147,733 36,933 20,52 0,000 Error 10 18,000 1,800 Total 14 165,733 Expected Mean Square for Each Term (using Variance Error unrestricted Source component term model) 1 Lote 11,711 2 (2) + 3 (1) 2 Error 1,800 (2) Diferencia significativa entre los lotes
  26. 26. REVISIÓN DEL MODELO
  27. 27. Revisión del Modelo <ul><li>Las técnicas que se presentaron en este capítulo están basadas en: </li></ul><ul><ul><li>Independencia </li></ul></ul><ul><ul><li>Muestras aleatorias </li></ul></ul><ul><ul><li>Distribuciones normales </li></ul></ul><ul><ul><li>Varianzas iguales </li></ul></ul><ul><li>En la práctica no se espera que las suposiciones del modelo sean satisfechas exactamente. </li></ul><ul><li>Sin embargo, para que el procedimiento de resultados confiables las suposiciones deben ser satisfechas de forma razonable. </li></ul>
  28. 28. Revisión del Modelo <ul><li>Los residuos deben ser normales. </li></ul><ul><ul><li>Los residuos de un experimento son los restos, luego de que los efectos estimados en el modelo se han sustraído de los valores de la variable de respuesta. </li></ul></ul><ul><ul><li>es el valor de que se predice utilizando el modelo. </li></ul></ul>
  29. 29. Revisión del Modelo <ul><li>Las varianzas deben ser homogéneas. </li></ul><ul><ul><li>Analizar el rango de las observaciones en cada tratamiento. </li></ul></ul><ul><ul><li>Utilizar criterio de control estadístico. </li></ul></ul>
  30. 30. Revisión del Modelo <ul><li>Los errores deben ser independientes. </li></ul><ul><ul><li>Los datos del experimento deben ser obtenidos de una forma completamente aleatoria. </li></ul></ul><ul><ul><li>La falta de independencia afecta seriamente las inferencias. </li></ul></ul><ul><ul><li>Se deben hacer esfuerzos para evitar errores correlacionados. </li></ul></ul>
  31. 31. Revisión del Modelo <ul><li>Procedimientos para revisar independencia: </li></ul><ul><ul><li>Cálculo de auto-correlaciones. </li></ul></ul><ul><ul><ul><li>La independencia de los errores se debe cuestionar si el valor absoluto de la auto-correlación es mayor a: </li></ul></ul></ul><ul><ul><li>Durbin-Watson (DW) </li></ul></ul><ul><ul><ul><li>Si el valores de DW mayores a 1.7 soportan la suposición de independencia. </li></ul></ul></ul>
  32. 32. Qué ocurre si el modelo no es adecuado? <ul><li>Qué ocurre si no se cumplen las suposiciones del modelo? </li></ul><ul><ul><li>Considere un modelo distinto. </li></ul></ul><ul><ul><li>Transforme los datos a fin de lograr normalidad. </li></ul></ul>
  33. 33. DISEÑO POR BLOQUES ALEATORIOS
  34. 34. Diseños por bloques aleatorios <ul><li>Son aquellos en los que se introduce una variable “bloque”. </li></ul><ul><li>Se denomina variable bloque a aquella variable o factor que se introduce en el experimento para obtener comparaciones homogéneas. La variable bloque es un factor que: </li></ul><ul><ul><li>Suponemos (a priori) que influye en la variable de respuesta. </li></ul></ul><ul><ul><li>No tiene interacción con el resto de factores incluidos en el experimento. </li></ul></ul>
  35. 35. Diseños por bloques aleatorios <ul><li>El diseño aleatorizado por bloques permiten remover el efecto del bloque y concentrarse en los efectos de la variable de interés. </li></ul><ul><ul><li>De ahí, que se reduce el estimado de la varianza del error. </li></ul></ul><ul><li>Ejemplos: </li></ul><ul><ul><li>Probar el efecto de métodos de enseñanza en diferentes estudiantes . </li></ul></ul><ul><ul><li>Probar el efecto de los de materiales en varias máquinas . </li></ul></ul><ul><ul><li>Probar el efecto de los fertilizantes en distintos tipos de suelos . </li></ul></ul><ul><ul><ul><li>Bloques: estudiantes, máquinas y suelos </li></ul></ul></ul>
  36. 36. Diseño por Bloques Aleatorios <ul><li>El modelo: </li></ul><ul><li>Donde representa el efecto del bloque. </li></ul>
  37. 37. Tabla ANOVA (Diseño por bloques aleatorios) Fuente df SS MS F Entre los bloques n-1 SS bloques SS bloques/(n-1) MS bloques/MS error Entre los tratamientos k-1 SS tratamientos SS tratamientos/(k-1) MS tratamientos/MS error Error (n-1)(k-1) SS error SS error/(n-1)(k-1) TOTAL nk-1 SS total
  38. 38. Ejemplo <ul><li>El jefe de transporte de una firma, desea determinar si el desgaste de 4 marcas de llantas es el mismo luego de haber utilizado las mismas por 20,000 Km. </li></ul><ul><li>Las marcas a considerar son A, B, C y D. El jefe de transporte desea probar el desempeño de las llantas en las condiciones actuales de las vías que utilizan los cuatro camiones de la empresa. </li></ul><ul><li>La tabla adjunta muestra la pérdida del labrado de las llantas por vehículo y por tipo de llanta. </li></ul><ul><ul><li>Se puede confirmar la variación entre los vehículos de la flota? </li></ul></ul><ul><ul><li>El desgaste de las llantas es el mismo para todas las marcas? </li></ul></ul>
  39. 39. Ejemplo Vehículo 1 Vehículo 2 Vehículo 3 Vehículo 4 Distribución de marcas y desgaste del labrado B(14) D(11) A(13) C(9) C(12) C(12) B(13) D(9) A(17) B(14) D(11) B(8) D(13) A(14) C(10) A(13)
  40. 40. Anova: Ejemplo de Desgaste de Neumáticos Analysis of Variance for Desgaste Source DF SS MS F P Vehículo 3 38,688 12,896 10,04 0,003 Marc 3 30,688 10,229 7,96 0,007 Error 9 11,563 1,285 Total 15 80,938 Se rechaza la hipótesis de igualdad entre las medias de desgaste por vehículo y por marca.
  41. 41. Ejemplo <ul><li>Se desea determinar la efectividad de un fertilizante orgánico en suelos de cultivo de un producto a lo largo del año. En la tabla adjunta se registra la efectividad del fertilizante en las cuatro estaciones del año: invierno, verano, otoño y primavera. </li></ul><ul><li>Formule un modelo para este diseño </li></ul><ul><li>Describa sus hipótesis. </li></ul><ul><li>Analice los datos utilizando un modelo aleatorizado por bloques y describa sus conclusiones. </li></ul><ul><li>Revise la validez del modelo. </li></ul>resp fert estación 4,0 1 1 4,8 1 2 5,0 1 3 4,6 1 4 4,8 2 1 5,0 2 2 5,2 2 3 4,6 2 4 4,0 3 1 4,8 3 2 5,6 3 3 5,0 3 4
  42. 42. Anexos
  43. 43. Cartas de Control para la Media y el Rango Sofía A. López MSc. Tabla 1. Factores para límites de control en gráficos de medias y rangos Gráfico de medias Gráfico de Rangos Tamaño de muestra n Factor A 2 Factor D 3 Factor D 4 2 1.88 0 3.27 3 1.02 0 2.57 4 0.73 0 2.28 5 0.58 0 2.11 6 0.48 0 2.00 7 0.42 0.08 1.92 8 0.37 0.14 1.86 9 0.34 0.18 1.82 10 0.31 0.22 1.78

×