• Share
  • Email
  • Embed
  • Like
  • Save
  • Private Content
Apuntes Clase Estadistica Ii(Itsz)
 

Apuntes Clase Estadistica Ii(Itsz)

on

  • 21,957 views

 

Statistics

Views

Total Views
21,957
Views on SlideShare
21,807
Embed Views
150

Actions

Likes
7
Downloads
578
Comments
4

5 Embeds 150

http://www.slideshare.net 122
http://infoestad.blogspot.com 20
http://infoestad.blogspot.com.ar 6
http://webcache.googleusercontent.com 1
http://infoestad.blogspot.com.es 1

Accessibility

Categories

Upload Details

Uploaded via as Microsoft PowerPoint

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel

14 of 4 previous next Post a comment

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Apuntes Clase Estadistica Ii(Itsz) Apuntes Clase Estadistica Ii(Itsz) Presentation Transcript

    • MII. ING. EDGAR JAVIER SILVA
    •  Examen escrito  65%  Practicas ,tareas, participación y evaluación continua  35%
    • Probabilidad y Estadística Douglas C. Montgomery Mc Graw Hill Probabilidad y Estadística para Ingeniería y Ciencias Mendenhall Prentice Hall Diseño de Experimentos, Douglas C. Montgomery http://mathworld.wolfram.com/classroom/classes/Probabilityand Statistics.html
    •  Regresión lineal simple.  Prueba de hipótesis en la regresión lineal simple.  Calidad del ajuste en regresión lineal simple.  Estimación y predicción por intervalo en regresión lineal simple.  Regresión lineal múltiple.  Pruebas de hipótesis en regresión lineal múltiple.  Intervalos de confianza y predicción en regresión múltiple.
    •  ¿Existe alguna relación entre el grado de oscuridad nocturna, la temperatura ambiente y el apetito de los ratones?  ¿Existe alguna relación entre el numero de homicidios y el grado de estudios alcanzados en los diferentes municipios?
    •  Para investigar la correlación entre dos variables, en estadística se han creado los coeficientes de correlación que permiten expresar cuantitativamente el grado de relación que existe entre las dos variables.
    • Operativos que se Numero de automóviles implentan en el mes. robados 2 10 3 15 4 20 5 25 6 30 7 34
    • 40 Nª automoviles robados 35 7; 35 30 6; 30 25 5; 25 20 4; 20 Serie1 15 3; 15 10 2; 10 5 0 0 2 4 6 8 Operativos Correlación Negativa -1 0 +1 Correlación Positiva No hay
    • 18 16 14 12 10 Serie1 8 6 4 2 r= 0 0 2 4 6 8 +0.8
    • 18 16 14 12 10 Serie1 8 6 4 2 r = -0.7 0 0 2 4 6 8
    • 40 35 30 25 20 Serie1 15 10 5 0 0 2 4 6 8 r=0
    • CORRELACIÓN VALOR O RANGO Perfecta |R| = 1 Excelente 0.9 <= |R| < 1 Buena 0.8 <= |R| < 0.9 Regular 0.5 <= |R| <0.8 Mala |R|< 0.5
    •  r= n(ΣXY) – (ΣX)(ΣY)  √ [n(ΣX2) – (ΣX)2][n(ΣY2) – (ΣY)2] n es el número de pares de observaciones. Σx es la suma de valores de la variable x Σy es la suma de valores de la variable y
    • X Y X2 XY Y2 2 10 3 15 4 20 5 25 6 30 7 34 27
    • Numero de Ventas X2 XY Y2 anuncios por semanales hora X Y 4 5 7 12 3 4 6 8 10 11 30 40 210 274 370
    •  Coeficiente de determinación: es la proporción de la variación total en la variable dependiente Y que se explica por, o se debe a, la variación en la variable independiente X  r2 = coeficiente de determinación
    •  Dibuja la siguiente ecuación.  Y =2X +3 x y 0 Damos valores X para 1 encontrar los correspondient es de Y 2 3
    •  Y = 3X + 5 x y 0 m= b= 1 2
    • Numero de Ventas X2 XY Y2 anuncios por semanales hora X Y 4 5 7 12 3 4 6 8 10 11 30 40 210 274 370
    • ¿Cuál es la diferencia entre un grafico de dispersión y la ecuación de regresión?
    •  m = pendiente de la recta n( XY ) ( X )( Y) m 2 2 n( X ) ( X) b= ordenada al origen b Y /n m( X / n)
    • Año Tasa de Tasa de  Se tiene interés en examinar la matrimonios divorcios tasa de matrimonios y de divorcios por millar de 1905 10.0 0.8 habitantes en Tijuana para años seleccionados. Las tasas para 8 años, según el encargado de los 1925 10.3 1.5 municipios son: 1. Trace un diagrama de dispersión 1935 10.4 1.7 localizando la tasa de matrimonios en el eje x , y la tasa de divorcios en el eje y. 1945 12.2 3.5 2. Si se desea predecir la tasa de divorcios con base en la tasa de 1955 9.3 2.3 matrimonios,¿Cuál es la variable independiente? 1965 9.3 2.5 3. Con base en el diagrama de dispersión ,¿parece existir alguna relación entre la tasa de 1975 10.1 4.9 matrimonios y la tasa de divorcios?. 1985 10.2 5.0 4. Determine la ecuación de regresión con la formula y después con el programa Excel.
    • x y x2 xy y2 Año Grado de Tasa de responsabilidad divorcios 1905 10.0 0.8 1925 10.3 1.5 1935 10.4 1.7 1945 12.2 3.5 1955 9.3 2.3 1965 9.3 2.5 1975 10.1 4.9 1985 10.2 5.0
    •  Resultados de las autoridades en el combate a la delincuencia. Se han presentado cifras oficiales y no oficiales que confirman el importante incremento de la actividad delictiva en nuestro país. Dado que el problema de inseguridad en México está adquiriendo una dimensión cada vez mayor, imponiéndole un importante costo a la sociedad, la inseguridad se ha convertido para muchos mexicanos en el principal reto del país. Por ello es necesario evaluar si los esfuerzos realizados en los últimos años por las autoridades responsables han tenido algún efecto en el control y combate de la delincuencia o se hace necesario un cambio en las estrategias hasta ahora utilizadas.
    • Recursos Índice de X2 Y2 XY invertidos en Criminalidad MMP = (presuntos X delincuentes por cada 100000 hab.) =Y 2000 159 4000 160 6000 158 8000 160 10000 160 20000 160
    • Encuentra la ecuación de regresión para los siguientes datos: Mes Temperatura promedio mes Numero de violaciones Enero 14° 6 Febrero 16° 15 Marzo 22° 21 Abril 25° 20 Mayo 32° 45 Junio 31° 42 Julio 26° 37 Agosto 28° 40 Septiembre 25° 31 Octubre 21° 18 Noviembre 15° 12 Diciembre 12° 5
    •  La recta de regresión representa nuestra mejor estimación de los datos Y a partir de los valores de X correspondientes. Sin embargo, a menos que la relación entre X y Y sea perfecta, la mayor parte de los reales de Y no estarán sobre la línea de regresión.  Así pues, cuando la relación es imperfecta, necesariamente habrá errores, en la predicción y será útil conocer la magnitud de éstos.
    •  La medición de los errores de predicción requiere el calculo del error estándar de la estimación. Este error es similar a la desviación estándar. Estadísticas de la regresión Coeficiente de correlación múltiple 0.85558115 Coeficiente de determinación R^2 0.7320191 R^2 ajustado 0.70522101 Error típico 0.43380824 Observaciones 12
    • Error estándar de la estimación al predecir Y dado X 2 Y b( Y) m( XY ) Sy / x n 2 m, es la pendiente de la recta de regresión b, es la ordenada al origen
    • Aplicación Para el siguiente ejercicio encontrar (tabla anexa en la siguiente diapositiva) 1. Coeficiente de correlación 2. Coeficiente de determinación 3. m= pendiente 4. b= ordenada al origen 5. Ecuación de regresión y=m x +b 6. Grafico de dispersión. 7. Error estándar de estimación 8. Si un alumno tiene un coeficiente intelectual de 141, cual será la calificación estimada de acuerdo a la formula de regresión. 9. Grafica la ecuación de regresión, toma los valores de x de la tabla y para los de “y” toma los que salen de aplicar la formula de regresión. 2 Y b( Y) m( XY ) Sy / x n 2
    • Estudiante Nº CI coeficiente Promedio Y de acuerdo a la intelectual calificaciones ecuación de regresión y=m x + b 1 110 1.0 2 112 1.6 3 118 1.2 4 119 2.1 5 122 2.6 6 125 1.8 7 127 2.6 8 130 2.0 9 132 3.2 10 134 2.6 11 136 3.0 12 138 3.6
    •  El error estándar de estimación es una medida válida para utilizarla al fijar intervalos de confianza cuando el tamaño de la muestra es grande, y en alguna forma la dispersión con respecto a la recta de regresión está distribuida de manera normal.  Cuando el tamaño muestral es muy pequeño, debe introducirse un factor de corrección para una muestra pequeña.  Un intervalo de confianza se determinará para: ◦ El valor medio de Y para un valor dado de X ◦ Un valor individual de Y para un valor dado de X  Para el primer caso: 2 1 (x ) Y ´ t ( Sy . x ) 2 n (x )
    •  En donde:  Y´ es el valor pronosticado para cualquier valor X seleccionado.  X es cualquier valor seleccionado de X  μ es la media de las x  n es el número de observaciones  Sy.x es el error estándar de la estimación (error típico)  t es el valor t tomado de la tabla t student, para n-2 grados de libertad.
    • Probabilidad de una sola cola. Valores t de Student y probabilidad P asociada en función de los grados de libertad gl. Si deseas, la probabilidad de dos colas, multiplica por dos esta fila
    • Para el siguiente problema, determinar el error estándar de estimación (error típico), pronosticar los valores de Y' en base a la ecuación de regresión y los limites de confianza para un valor de x=6 y una Y´ pronosticada de 8 con un 95% de confianza. vendedor Puntuación Real Y Pronosticada Limite Limite de prueba x Y´ inferior superior Arturo 4 5 Jorge 7 12 Saúl 3 4 Marco 6 8 8 Gonzalo 10 11 Total 30 40 Puedes usar Excel para determinar la ecuación de regresión y el error estándar de estimación
    • Respuesta: los limites de confianza de 95% para el valor de Y´ de 8 son 5.9 y 10.05 Interpretación: para una x=6, existe una probabilidad de 0.95 de que sus ventas promedio semanales estén en el intervalo entre $5.9 y $10.05
    • Ejercicios de repaso: 1 3 Dadas las siguientes matrices: A 4 5 a. Encuentra el orden de las matrices B 1 8 A, B, C y D b. ¿Cuál es el orden del producto AD? 1 C c. Multiplica A por D 2 d. Multiplica B por C e. ¿Cuál es el orden del producto BC? 3 2 f. Encuentra AT D g. Encuentra x, y, z, w 0 1 1 1 x y 1 0 2 4 z w 0 1
    • Operaciones con Matrices en Excel Dadas las siguientes matrices, contesta las preguntas y encuentra lo que se te pide: 1 1 1 1 1 2 Y 2 X 1 3 1.- ¿El orden de la matriz Y es? 2 1 4 2.- ¿El orden de la matriz X, es? 3.- ¿El orden de la matriz XT, es? 4 1 5 4.- ¿El orden de la matriz XT X ? 5.- Encuentra la inversa de la matriz X 6.- Encuentra XT 7.- Multiplica estas dos matrices XT X 8.- Multiplica la transpuesta de X por Y 9.- Encuentra la inversa XT X
    • Ejercicio 3 Realiza las siguientes operaciones 1. AB 2. AT 1 1 0 5 4 3. AAT 1 2 0 1 2 4. A-1 A 1 3 0 0 0 5. (AAT)-1 1 0 1 0 0 1 0 1 2 3 2 3 1 0 0 1 B 7 2 1 6 0 1 0 1 1
    •  El análisis de regresión múltiple estudia la relación de una variable dependiente con dos o más variables independientes.  El modelo de regresión múltiple toma la forma siguiente: y 0 1 x1 2 x2 ... p xp ECUACIÓN DE REGRESIÓN MÚLTIPLE ESTIMADA  y b0 b1 x1 b2 x 2 ... bp xp y gorrito, indica el valor estimado de y , variable dependiente.
    • Punto de Valor de y x1 x2 … xk Error datos aleatorio no observable 1 y1 X11 X12 … X1k ε1 2 y2 X21 X22 … X2k ε2 … … … … … … n yn xn1 xn2 … xnk εk El modelo lineal general se puede expresar en forma de matriz como: Y=Xβ + ε
    • y1 1 x11 x12 ... x1 k y2 1 x 21 x 22 ... x2k Y y3 X 1 x 31 x 32 ... x3k ... ... ... ... ... ... yn 1 xn 1 xn 2 ... xnk ˆ0 1 El modelo lineal ˆ1 2 general se puede expresar en forma ˆ ˆ2 3 de matriz como Y=Xβ +ε ... ... ˆk n
    • Ecuación de matrices de mínimos cuadrados (Ecuación de regresión) Ecuación de regresión aplicando matrices: X X T ˆ X Y T Solución de mínimos cuadrados: Esta solución te da los valores de la pendiente y la ordenada al origen en el caso mas sencillo, en los demás casos te da los valores de β 1 ˆ X X T T X Y
    • Aplicación 1 Encuentre la línea de mínimos cuadrados para los datos de compresión de aislante que se dan en la tabla. Muestra Presión Compresión x y 1 1 1 2 2 1 3 3 2 4 4 2 5 5 4
    • 1 1 1 1 1 2 Y 2 X 1 3 2 1 4 4 1 5 Y=0.7x -0.1
    • Aplicación 2 y 0 1 x 2 x 2 Una compañía de electricidad quiere predecir el consumo mensual de energía eléctrica de un hogar en función del tamaño x de la casa y con base en el modelo: Tamaño de la casa Consumo mensual X, Pies cuadrados Y , kilowatts hora 1,290 1,182 1,350 1,172 1,470 1,264 1,600 1,493 1,710 1,571 1,840 1,711 1,980 1,804 2,230 1,840 2,400 1,956 2,930 1,954
    • 1,182 2 1,172 1 1, 290 (1, 290 ) 1 1, 350 1822500 1, 264 1, 493 1, 591 Y X 1, 711 1,804 1,840 1, 956 1, 954 Y=-1216+2.39893x-0.00045x2
    • Aplicación: (Tarea) Utilice el método de mínimos cuadrados para ajustar el modelo E(y)=β0 + β1x , a los seis puntos de datos que se indican en la tabla. x 1 2 3 4 5 6 y 1 2 2 3 5 5 a. Construya la matriz Y y X b. Calcule XTX y XTY 13 7 c. Utilice el software para verificar que 1 X X T 15 35 7 2 35 35 d. Obtenga la matriz β (matriz solución del sistema. e. Determine la ecuación de predicción
    • Tarea: Crear un video, con alguno de los temas visto en clase, donde se explique el tema, este tema ira dirigido a los alumnos, para explicar el tema seleccionado, desde la parte básica, teoría, que utilidad tiene el tema, como lo aplico, con preguntas y respuestas, ejercicio de aplicación(2), conclusiones. Esta tarea se hará en equipos de máximo 5 personas y tendrá valor dentro del rubro de tareas. El video deberá subirse a la pagina de youtube, con el nombre del tema. Fecha limite para subirlo: 30 de Abril
    • Estimación de la varianza σ2 de ε(error) en un modelo de regresión múltiple. Puesto que la varianza casi nunca se conoce por adelantado, debemos utilizar los datos muestra para estimar su valor. s2 = (SSE)/(n – Número de parámetros β en el modelo) Donde: SSE T Y Y ˆT X TY Por ejemplo para la diapositiva anterior, n=6 y como vas ha calcular solamente β0 y β1 , entonces el número de parámetros de beta es 2
    • Recordando Encuentre la línea de mínimos cuadrados para los datos de compresión de aislante que se dan en la tabla. Después que ya la encontraste, encuentra el valor de la varianza s2 y de la desviación estándar. Muestra Presión Compresión x y 1 1 1 2 2 1 3 3 2 4 4 2 5 5 4 Y=0.7x -0.1 s2 = 0.367
    • ˆi t /2 ( error estimado estándar ˆi ) ˆi t /2 s c ii Donde tα/2 se basa en el número de grados de libertad asociados a s. Para nuestro ejemplo anterior n=5 y los grados de libertad son n-2. Cuando nos dicen 95% de confianza, buscamos un 5% en la tabla (t student) dividido entre dos 0.05/2=0.025
    • ¿Qué es cii ? Por ejemplo, de la matriz T 1 1 .1 3 X X 0 .3 0 .1 C00 =1.1 C11 =0.1 ¿Qué es “s” ? Es la desviación estándar
    • Aplicación En una instalación de producción, es muy importante para la gerencia estimar con exactitud las horas/hombre requeridas para llevar a cabo una tarea, a fin de tomar decisiones como el número correcto de obreros que debe contratar, la fecha de entrega que debe proponer al cliente, o decisiones de análisis de costos relativas a los presupuestos. Un fabricante de tambores para calderas quiere utilizar regresión para predecir el número de horas/hombre necesarias para erigir los tambores en proyectos futuros. Con este fin, recabo datos para 35 calderas. Además de las horas/hombre (y), las variables que se midieron fueron la capacidad de la caldera (X1, en lb/h), la presión diseñada la caldera (X2, en libras por pulgada cuadrada)
    • Tipo de caldera (X3=1 si es para la industria, 0 si es para servicios) y tipo de tambor (X4=1 si es vapor de agua, 0 si es de lodo). Los datos se proporcionan en la siguiente tabla (consulta el archivo de Excel) a. Encuentre la ecuación de regresión para este modelo con 4 variables b. En base a la ecuación anterior , predice , cuantas horas hombre le llevara producir una caldera de 130,000 lb/hr, presión de 375 libras por pulgada cuadrada, Industrial, para uso Vapor. c. Encuentra la desviación estándar para β0 d. Establece un intervalo de confianza de 95% para β0 Realiza lo anterior, en una hoja de Excel, grábalo y envíalo como tarea.
    • Probabilidad de una sola cola. Valores t de Student y probabilidad P asociada en función de los grados de libertad gl. Si deseas, la probabilidad de dos colas, multiplica por dos esta fila
    •  El error estándar de la estimación en el análisis de regresión múltiple mide el error para valores de Y con respecto al plano de regresión, si intervienen dos variables independientes. 2 (Y Y ´) ( Sy . 12 ) n k 1 n= número de datos k= número de parámetros de los cuales depende “y” O sea, de cuantos valores depende Y, puede ser que Y dependa solo de X1, pero también puede depender de X1, X2
    • n=5 Cálculos necesarios para obtener el error k=2 estándar múltiple de la estimación. Vendedor Puntuación Calificación Ventas Ventas Y-Y´ (Y-Y´)2 de prueba de semanales semanales X1 desempeño Y Pronosticad X2 as Y´ Arturo 4 2 5 5.35 Arnulfo 7 5 12 Saúl 3 1 4 Marco 6 4 8 Gonzalo 10 6 11 11 2.65 Completar la tabla y encontrar el error estándar de estimación. Sy.12= 1.151
    •  Familia de diseños para comparar tratamientos.  Diseño complementario al azar y ANOVA.  Comparaciones o pruebas de rangos múltiples.  Verificación de los supuestos del modelo.  Elección del tamaño de muestra.
    • ANOVA
    • Suponga que renuncio el gerente de la sucursal oeste de una empresa dedicada a comercializar artículos de limpieza y se considera que tres vendedores pueden ocupar ese puesto. Los tres tienen la misma antigüedad, educación, etc. Para tomar una decisión, se sugirió examinar los registros de ventas mensuales de cada uno, en la siguiente tabla se muestran sus registros.
    • Qué prueba la ANOVA La prueba se basa en la idea de que si las muestras provienen de la misma población, la varianza de la muestra combinada deberá ser igual a las varianzas de las muestras individuales, dado que el nivel y la dispersión serán homogéneos. En cambio, si las poblaciones de las que vienen la muestras son diferentes (y tienen niveles diferentes), la varianza de la combinación será mayor que las varianzas individuales. La prueba ANOVA usa las varianzas para evaluar la significación separando, por un lado, la varianza entre muestras y por otro lado, la varianza al interior de las muestras.
    • Sra. Sr. Sr. Lourdes Gabriel Manuel 15 15 19 10 10 12 9 12 16 5 11 16 16 12 17 Media 11 12 16 muestral
    • x1 x 12 x2 x 22 x3 x 32 15 … 15 … 19 10 … 10 … 12 9 … 12 … 16 5 … 11 … 16 16 … 12 … 17 Tc … … … … 195 nc … … 5 … ∑x2 … 734 1306 2727
    • x1 x 12 x2 x 22 x3 x 32 15 225 15 225 19 361 10 100 10 100 12 144 9 81 12 144 16 256 5 25 11 121 16 256 16 256 12 144 17 289 Tc 55 60 80 195 nc 5 5 5 15 ∑x2 687 734 1306 2727
    • SST = ∑ [ Tc2 / nc ] – (∑ x)2 / N
    • SST = ∑ [ Tc2 / nc ] – (∑ x)2 / N = [ (55)2 /5 + … ] – (195)2 /15 = 2605 – 2535 = 70
    • SSE = ∑ (x2) - ∑ [ Tc2 / nc ]
    • SSE = ∑ (x2) - ∑ [ Tc2 / nc ] = (15)2 + (10)2 +…+(17)2 - [ (55)2/5 + (60)2/5 + (80)2/5 ] = 2727 – 2605 = 122
    • SST = 70 SSE = 122 K = Numero de tratamientos (vendedores) = 3 N = Numero total de observaciones=15
    • Paso 1: Hipótesis nula: Ho expresa que no hay diferencia significativa entre las ventas medias de los tres vendedores. µ1 = µ 2 = µ3
    • Paso 2: Elegir el nivel de significación: para este ejemplo se eligió el nivel 0.05
    • Fuente de Suma de Grados Cuadrado variación cuadrados de medio libertad SST/ K-1 = MSTR Entre SST K-1 tratamientos SSE/ N-K = MSE En los SSE N-K tratamientos Total Total SS F = MSTR / MSE
    • La regla de decisión indica que si el valor calculado de F es menor que o igual al valor critico de 3.89, la hipótesis nula se acepta. Nota: el valor critico lo obtienes de la tabla F, consultar el archivo adjunto de la tabla de Fisher. Región de rechazo
    • ¿Cómo lo hago en el Statgraphics.? Primero captura tus datos en columnas, cada categoría en una columna. 1. Compare 2. Multiple Samples 3. Multiple-sample Comparison… 4. OK 5. Seleccionas tus tres variables a comparar 6. Luego le das clic en el : ► 7. OK
    •  En el desarrollo de un nuevo producto alimenticio se desea comparar el efecto del tipo de envase y proceso de envasado (asociado al tipo de envase) sobre la vida de anaquel del producto. Existen tres tipos de envases. Surgen algunas preguntas.
    • ¿Cuántos artículos envasados con cada tipo de envase comparar? ¿Cómo seleccionar los envases? ¿Existe diferencia estadística entre los días de duración, usando los diferentes tipos de envase? Nota: No es lo mismo decir que las medias de las muestras son diferentes a decir que existe evidencia estadística de que las medias de las muestras son diferentes.
    • Aplicación  A continuación se muestra un ejemplo, donde se muestrean tres tipos de envases y se determinan los días de duración.  Los datos obtenidos se muestran en la tabla siguiente Factor: Tipo de Respuesta: Díaz de duración Media envase y envasado A 23, 28, 21, 27, 35, 41, 37, 30, 32, 36 31 B 35, 36, 29, 40, 43, 49, 51, 28, 50, 52 41.3 C 50, 43, 36, 34, 45, 52, 52, 43, 44, 34 43.3
    • Plantea la hipótesis nula y la hipótesis alternativa. Ho: Ha: Realiza la ANOVA, utilizando el statgraphics. ( Pega aquí la ANOVA) ¿Estadísticamente hay diferencia entre los tipos de envase ? ¿Cuál es el valor de p-value? “Si estadísticamente hay diferencia entre las medias de los días de duración cuando se usan los diferentes tipos de envase, entonces ahora se utiliza otro tipo de prueba estadística para conocer cual de ellos es el mejor o si no hay diferencia entre ellos.” Esta prueba estadística se llama “Mínima diferencia significativa” LSD
    • Para usar el procedimiento de la LSD, simplemente se comparan las diferencias observadas entre cada par de promedios (medias) con el valor correspondiente de la LSD. Si / Xi - Xj / > LSD , se concluye que las medias poblacionales µi y µj son diferentes. ¿Qué es Xi , Xj ? Son las medias del tiempo de duración para cada uno de los tratamientos (Tipo de envase y envasado) LSD = tα/2, N-a √ SME (1/ ni + 1/ nj) ¿Qué son cada una de estas variables?
    • LSD = Esta es la constante que vas ha calcular y que se va ha servir como parámetro de comparación. tα/2 , N-a = Valor que se obtiene de la tabla de la “distribución t” α = Nivel de Significancia N = Total de datos a = Numero de Tratamientos. SME = Cuadrado Medio de error en los tratamientos ( esta información se obtiene con la ANOVA) ni , nj = Numero de datos en cada tratamiento
    •  PRIMERO: Calculas la media de cada uno de los tratamientos   ¿Cuál es la media para el tratamiento A? ________  ¿Cuál es la media para el tratamiento B? ________  ¿Cuál es la media para el tratamiento C? ________    SEGUNDO: Encuentras el valor absoluto de la diferencia de cada par de medias  Para este caso A-B, A-C, B-C    ¡Ya no te acuerdas que es el valor absoluto!  ¡A que bárbaro!   A - B = / 31 – 41.3 / = 10.3   B -C=   A- C=
    •  TERCERO: Encuentras la t de student para tα/2 alfa = 0.05 y N-a = 30- 3= 27 utiliza las tablas de la distribución t.    CUARTO: Encuentras SME que es el cuadrado medio de error en los tratamientos (esta información la tienes en tu ANOVA)    QUINTO: Encuentras el LSD.     CONCLUSIONES E INTERPRETACION   Para tus conclusiones apóyate en esto:  / Xi - Xj / > LSD , se concluye que las medias poblacionales µ i y µj son diferentes.  
    • AHORA UTILIZA EL STATGRAPHICS, PARA REALIZAR ESTE PROCEDIMIENTO: 1. COMPARE 2. MULTIPLE SAMPLES 3. MULTIPLE SAMPLE COMPARISON 4. TABULAR OPTION (BOTON AMARILLO LADO IZQUIERDO) 5. SELECCIONA LA ANOVA Y LA PRUEBA MULTIPLE RANGE TESTS Guarda tus resultados en una hoja de Word y envíala como tarea, correspondiente a este tema.
    • Una prueba es de una cola cuando la hipótesis alterna, H1, establece una dirección, como: H0 : el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres es mayor que el de los hombres. Distribución de muestreo para el valor estadístico z, prueba de una cola, nivel de significancia de .05
    • Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis alterna H1, como: H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres. Distribución de muestreo para el valor estadístico z, prueba de dos colas, nivel de significancia de 0.05 Dos regiones de 0.025
    •  Diseños en bloques completos al azar.  Diseño de cuadro latino.  Diseño de cuadro grecolatino
    •  En cualquier experimento, la variabilidad que surge de un factor perturbador puede afectar los resultados. En general, un factor perturbador puede definirse como un factor del diseño que probablemente tenga un efecto sobre la respuesta, pero en el que no existe un interés especifico. En ocasiones un factor perturbador es desconocido y no controlable; es decir se desconoce la existencia de ese factor e incluso puede tener niveles variables mientras se está realizando el experimento.
    •  La aleatorización es la técnica de diseño que se utiliza para protegerse contra estos factores perturbadores “que siempre están amenazando nuestros experimentos”. En otros casos, el factor perturbador es conocido pero no controlable. Cuando la fuente de variabilidad perturbadora es conocida y controlable, puede usarse una técnica de diseño llamada formación de bloques para eliminar de manera sistemática su efecto sobre las comparaciones estadísticas entre los tratamientos.
    •  La formación de bloques es una técnica de diseño en extremo importante que se utiliza ampliamente en la experimentación industrial.  En muchos experimentos además de que me interesa investigar la influencia de un factor controlado sobre la variable de respuesta, existe una fuente de variación adicional (bloque) que puede y debe ser sistematizada y controlada durante el experimento, con el propósito de disminuir el error experimental y obtener mejores conclusiones sobre el factor controlado.  De esta manera el error experimental se reducirá, y la precisión del diseño aumentará.
    • Análisis de Varianza de un diseño de bloques completos aleatorizado Fuente de Suma de Grados de Cuadrado medio F Variación Cuadrados libertad Tratamientos SSTratamientos a-1 MST =SSTratamientos/ a-1 MST/ MSE SSBloques b-1 SSBloques/ b-1 Bloques (factor perturbador) SSE (a-1)(b-1) MSE =SSE / (a -1)(b –1) Error SST N-1 Total
    • a = Numero de tratamientos b = Numero de bloques N = Total de datos muestreados = a b b a SCT = ∑ ∑ Yij2 - Y2../N j =1 i =1 SCTRAT = ∑ Yi2/b - Y2../N SCBLOQUE = ∑ Yj2/a - Y2../N SCERROR = SCT - SCTRAT - SCBLOQUE
    •  Conceptos básicos en diseños factoriales.  Diseños factoriales con dos factores.  Diseños factoriales con tres factores.  Diseño factorial general  Modelos de efectos aleatorios.
    •  En muchos experimentos interviene el estudio de los efectos de dos o más factores. En general, los diseños factoriales son los mas eficientes para este tipo de experimentos. Por diseño factorial se entiende que en cada ensayo o réplica completa del experimento se investigan todas las combinaciones posibles de los niveles de los factores.
    •  Por ejemplo, si el factor A tiene “a” niveles y el factor B tiene “b” niveles, cada replica contiene todas las ab combinaciones de los tratamientos. Cuando los factores estan incluidos en un diseño factorial, es común decir que están “cruzados”.
    •  Un ingeniero está diseñando una batería que se usará en un dispositivo que se someterá a variaciones de temperatura extremas. El único parámetro del diseño que puede seleccionar en este punto es el material de la placa o ánodo de la batería, y tiene tres elecciones posibles. Cuando el dispositivo esté fabricado y se envié al campo, el ingeniero no tendrá control sobre las temperaturas extremas en las que operará el dispositivo.
    •  El ingeniero decide probar tres materiales de la placa con tres niveles de temperatura que son consistentes con el medio ambiente donde se usará finalmente el producto. Se prueban cuatro baterías con cada combinación del material de la placa y la temperatura, y las 36 pruebas se corren de manera aleatoria.
    •  ¿Cuáles son los factores?  ¿Cada factor cuantos niveles maneja?  Menciona las diferentes combinaciones o tratamientos.  ¿Qué harías para correr este experimento en orden aleatorio?  ¿Cuántas replicas se hicieron?
    • NO PASES A LA SIGUIENTE LAMINA SI NO CONTESTASTES LAS PREGUNTAS ANTERIORES
    •  El efecto de un factor se define como el cambio en la respuesta producido por un cambio en el nivel del factor. Con frecuencia se le llama “efecto principal” porque se refiere a los factores de interés primario en el experimento.