-838200-1778005158740-156210escuela superior politécnica del litoralfacultad de ingeniería mecánica y ciencias de la produ...
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Analisis estadistico de datos
Upcoming SlideShare
Loading in...5
×

Analisis estadistico de datos

7,550

Published on

0 Comments
10 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
7,550
On Slideshare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
0
Comments
0
Likes
10
Embeds 0
No embeds

No notes for slide

Analisis estadistico de datos

  1. 1. -838200-1778005158740-156210escuela superior politécnica del litoralfacultad de ingeniería mecánica y ciencias de la produccióningeniería en alimentosPROYECTO DE CURSOTema:Análisis Estadístico de los Datos Obtenidos en la Producción de Rosquitas Empresa PUNCALSA-SUPANAgosto del 201045300902821940Ing. Marcos MendozaIntegrantes:Diana Coello MontoyaGabriela Guevara VelizAdriana Soriano HuayamaveDiego Valenzuela CobosCarolina Villavicencio PeraltaMétodos Estadísticos Para La Industria II<br />TABLA DE CONTENIDO<br />Presentación1<br />Tabla de Contenido2<br />Índice de Tablas4<br />Índice de Gráficos6<br />Introducción8<br />Resumen9<br />Objetivos<br /> General10<br /> Específicos10<br />Identificación de Variables10<br />Estadística Descriptiva<br /> Diámetro13<br />Tabla de Frecuencia<br />Histograma y Polígono de Frecuencias<br />Histograma de Frecuencias por Grupo<br />Distribución Empírica<br />Distribución Empírica por Grupo<br />Diagrama de Cajas<br />Diagrama de Cajas por Grupo<br />Medidas de Tendencia Central <br />Medidas de Dispersión<br /> Humedad21<br />Tabla de Frecuencia<br />Histograma y Polígono de Frecuencias<br />Histograma de Frecuencias por Grupo<br />Distribución Empírica<br />Distribución Empírica por Grupo<br />Diagrama de Cajas<br />Diagrama de Cajas por Grupo<br />Medidas de Tendencia Central <br />Medidas de Dispersión<br /> Peso29<br />Tabla de Frecuencia<br />Histograma y Polígono de Frecuencias<br />Histograma de Frecuencias por Grupo<br />Distribución Empírica<br />Distribución Empírica por Grupo<br />Diagrama de Cajas<br />Diagrama de Cajas por Grupo<br />Medidas de Tendencia Central <br />Medidas de Dispersión<br />Estadística Inferencial<br /> Diámetro38<br />Intervalo de confianza para la media<br />Intervalo de confianza para la media por grupos<br />Intervalo de confianza para la diferencia de medias entre L y T<br />Intervalo de confianza para la varianza<br />Prueba de Hipótesis para la media<br />Prueba de Hipótesis para la varianza<br />Prueba de Hipótesis para la diferencia de medias<br /> Humedad45<br />Intervalo de confianza para la media<br />Intervalo de confianza para la media por grupos<br />Intervalo de confianza para la diferencia de medias entre L y T<br />Intervalo de confianza para la varianza<br />Prueba de Hipótesis para la media<br />Prueba de Hipótesis para la varianza<br />Prueba de Hipótesis para la diferencia de medias<br /> Peso52<br />Intervalo de confianza para la media<br />Intervalo de confianza para la media por grupos<br />Intervalo de confianza para la diferencia de medias entre L y T<br />Intervalo de confianza para la varianza<br />Prueba de Hipótesis para la media<br />Prueba de Hipótesis para la varianza<br />Prueba de Hipótesis para la diferencia de medias<br />Bondad de Ajuste59<br />Diámetro<br />Humedad<br />Peso<br />Tablas de Contingencia64<br />Diámetro – Humedad<br />Diámetro – Peso<br />Humedad – Peso<br />Regresión Lineal67<br />Diámetro – Humedad<br />Conclusiones71<br />Recomendaciones72<br />Bibliografía72<br />INDICE DE TABLAS<br />Tablas de Frecuencia<br />Tabla I. Diámetro14<br />Tabla II. Humedad22<br />Tabla III. Peso30<br />Estadísticos de Orden<br />Tabla IV. Deciles Diámetro17<br />Tabla X. Deciles Humedad25<br />Tabla XVI. Deciles Peso33<br />Diagrama de Cajas<br />Tabla V. Diámetro18<br />Tabla VI. Diámetro por Grupos18<br />Tabla XI. Humedad 26<br />Tabla XII. Humedad por Grupos26<br />Tabla XVII. Peso34<br />Tabla XVIII. Peso por Grupos34<br />Medidas de Tendencia Central y Medidas de Dispersión<br />Tabla VII. Diámetro19<br />Tabla VIII. Diámetro L20<br />Tabla IX. Diámetro T20<br />Tabla XIII. Humedad27<br />Tabla XIV. Humedad L28<br />Tabla XV. Humedad T28<br />Tabla XIX. Peso35<br />Tabla XX. Peso L36<br />Tabla XXI. Peso T36<br />Bondad de Ajuste<br />Tabla XXII. Diámetro. Prueba de distribución exponencial60<br />Tabla XXIII. Diámetro. Prueba de distribución Ji-Cuadrado61<br />Tablas de Contingencia<br />Tabla XXIV. Diámetro – Humedad64<br />Tabla XXV. Diámetro – Peso65<br />Tabla XXVI. Humedad – Peso66<br />Regresión Lineal<br />Tabla XXVII. Tabla de Predictores67<br />Tabla XXVIII. Tabla ANOVA70<br />INDICE DE GRAFICOS<br />Diámetro<br />Gráfico I. Histograma de Frecuencias15<br />Gráfico II. Polígono de Frecuencias15<br />Gráfico III. Histograma de Frecuencia por Grupos16<br />Gráfico IV. Distribución Empírica16<br />Gráfico V. Distribución Empírica por Grupos17<br />Gráfico VI. Diagrama de Cajas18<br />Gráfico VII. Diagrama de Caja por Grupos19<br />Humedad<br />Gráfico VIII. Histograma de Frecuencias23<br />Gráfico IX. Polígono de Frecuencias23<br />Gráfico X. Histograma de Frecuencias por Grupo24<br />Gráfico XI. Distribución Empírica24<br />Gráfico XII. Distribución Empírica por Grupo25<br />Gráfico XIII. Diagrama de Cajas26<br />Gráfico XIV. Diagrama de Caja por Grupo27<br />Peso<br />Gráfico XV. Histograma de Frecuencias31<br />Gráfico XVI. Polígono de Frecuencias31<br />Gráfico XVII. Histograma de Frecuencia por Grupo32<br />Gráfico XVIII. Distribución Empírica32<br />Gráfico XIX. Distribución Empírica por Grupo33<br />Gráfico XX. Diagrama de Cajas34<br />Gráfico XXI. Diagrama de Caja por Grupo35<br />Intervalos de confianza<br />Diámetro<br />Gráfico XXII. Intervalo de confianza para la media38<br />Gráfico XXIII. Intervalo de confianza para media por grupos39<br />Humedad<br />Gráfico XXIV. Intervalo de confianza para la media45<br />Gráfico XXV. Intervalo de confianza para media por grupos46<br />Peso<br />Gráfico XXVI. Intervalo de confianza para la media52<br />Gráfico XXVII. Intervalo de confianza para media por grupos53<br />Bondad de Ajuste<br />Gráfica XXVIII. Gráfica de Prueba de Normalidad de Diámetro59<br />Gráfica XXIX. Gráfica de Prueba de Normalidad de Humedad62<br />Gráfica XXX. Gráfica de Prueba de Normalidad de Peso63<br />Regresión Lineal<br />Gráfico XXXI. Histograma de Probabilidad de Residuos67<br />Gráfico XXXII. Análisis de la Normalidad de Residuos68<br />Gráfico XXXIII. Gráfica de Prueba de Normalidad del Error68<br />Gráfico XXXIV. Relación entre los residuos y las observaciones69<br />Gráfico XXXV. Independencia de error69<br />INTRODUCCIÓN<br />En la Industria Alimentaria se considera que una de las áreas de mayor importancia es la de Control de Calidad, debido a que de esta etapa de control minucioso dependerá la liberación o no de un producto alimenticio al mercado, esto se da en el caso de que dicho alimento sea considerado inocuo para el consumidor, luego de haber pasado los correspondientes análisis físico-químicos y microbiológicos que reflejan el cumplimiento de los parámetros permitidos y exigidos por las normas legales pertinentes. <br />Para el presente proyecto de análisis estadístico la empresa PUNCALSA nos proporcionó datos provenientes de los controles físico-químicos que se dan en la línea de rosquitas. PUNCALSA es una empresa semi-industrial que pertenece al grupo SUPAN, tiene varias líneas de producción entre las que encontramos panadería, rosquitas y pastelería; los productos obtenidos a partir de dichas líneas son distribuidos en diferentes puntos de venta. Todos sus productos son desarrollados bajo los lineamientos de las normas técnicas INEN de panadería, sin embargo las especificaciones de la empresa son más exigentes al momento de la elaboración, de tal forma que se pueda ofrecer a los clientes productos de excelente calidad.<br />Creemos prudente mencionar que el sustento económico de la empresa es la línea de producción de rosquitas; motivo por el cual actualmente se encuentra en una etapa inicial la puesta en vigencia del área de control de calidad. Es por esta razón que decidimos enfocar nuestro estudio en la premisa ‘’el producto rosquitas cumple o no con los parámetros establecidos que aseguran su calidad ’’. Los datos analizados fueron obtenidos en estudios realizados durante la última semana del mes de marzo, ya que en este periodo se comenzó con la estandarización del proceso de elaboración, así como la calibración de los equipos empleados en los análisis.<br />Entre los datos tomados en cuenta por la empresa como parámetros claves para el cumplimiento de las exigencias del producto que saldrá al mercado encontramos pH, humedad, diámetro externo, peso y forma. Para el siguiente estudio estadístico manejaremos las tres de las variables consideradas principales, éstas son: diámetro, humedad, peso y adicionalmente la forma que presenta el producto.<br />RESUMEN<br />En el presente proyecto se analizaron tres variables cuantitativas y una variable cualitativa, para lo cual se tomó una muestra de tamaño 120 misma que fue recopilada a partir de la población definida como las rosquitas producidas en la empresa PUNCALSA.<br />Los criterios para la elección de las variables dependieron del asesoramiento de la empresa así como de la experiencia adquirida en el transcurso de los años de estudio en la carrera de Ingeniería en Alimentos, observando de esta manera que lo primordial para la aceptación de un producto por parte del consumidor es tanto la calidad como su presentación.<br />El análisis estadístico realizado a cada una de las variables definidas se basó en los conocimientos obtenidos previamente en el curso de Métodos Estadísticos para la Industria I y los conceptos recientemente estudiados en el presente curso de Métodos Estadísticos para la Industria II; de tal forma que logramos realizar el estudio descriptivo e inferencial de las variables, para posteriormente obtener conclusiones estadísticamente confiables en cuanto a los comportamientos de las variables en estudio. <br />Logramos inferir acerca del comportamiento de la población a partir del estudio de la muestra, para así poder verificar si se cumplen o no las especificaciones impuestas por la empresa PUNCALSA para su producto; con lo que conseguimos identificar que las variables diámetro y humedad cumplen con los parámetros especificados, mientras que la variable peso no cumple sin importar la forma, ya sea llana o trenzada, que presente el producto.<br />OBJETIVOS<br />Objetivo General<br />Aplicar los conocimientos adquiridos durante los cursos de Métodos Estadísticos para la Industria I y II, de manera que podamos determinar mediante los análisis estadísticos necesarios si la empresa PUNCALSA cumple o no con las especificaciones de diámetro, peso y humedad para su producto terminado.<br />Objetivos Específicos<br />Clasificar los datos obtenidos de cada variable cuantitativa de acuerdo a una variable cualitativa.<br />Realizar el análisis de la estadística descriptiva de cada variable cuantitativa en estudio.<br />Construir intervalos de confianza para cada una de las variables de modo que nos permitan inferir hacia la población correspondiente a través de las muestras obtenidas.<br />Realizar los contrastes de hipótesis necesarios para poder verificar los supuestos de cada variable con respecto a los parámetros de calidad que tiene la empresa.<br />Lograr una toma de decisiones correcta en base a los valores p obtenidos en cada uno de los contraste de hipótesis realizados en el estudio.<br />Tratar en lo posible identificar el tipo de distribución que tiene cada variable cuantitativa.<br />Determinar si existe o no dependencia entre cada una de las variables cuantitativas estudiadas, y de ser posible establecer el modelo de regresión lineal que explique dicha relación.<br />IDENTIFICACIÓN DE LAS VARIABLES<br />Las variables que serán estudiadas podemos clasificarlas de acuerdo a los datos con los cuales cuentan. Tenemos así:<br />Variables Cuantitativas<br />Diámetro (mm)<br />Humedad (%)<br />Peso (g)<br />Variable Cualitativa<br />Forma<br /> - Llana (L - 0)<br /> - Trenzada (T - 1)<br />ESTADISTICA DESCRIPTIVA<br />Media Aritmética<br />Denominada también promedio es la sumatoria de las muestras dividido para el número de muestras.<br /> Media Poblacional Media Muestral<br />nN <br /> i=1i=1μ = (1/n)∑ Xi X = (1/n)∑ Xi<br />Mediana<br />Es el valor que se encuentra en el centro de los datos ordenados, es decir es el valor central en el conjunto de datos.<br />Moda<br />Es el valor que se repite con mayor frecuencia en el conjunto de datos.<br />Varianza<br />Es el valor que mide cuanto se separan los datos de la media. <br />1091565188595Varianza poblacional Varianza Muestral<br />313944020955<br />Desviación estándar<br />La desviación estándar es la raíz cuadrada de la varianza. También nos expresa cuanto se separan los datos de la media<br />Tabla de frecuencias<br />Es una tabla que ayuda a ordenar datos estadísticos. Formado por clase, Marca de Clase, Frecuencia, frecuencia acumulada, frecuencia relativa, Frecuencia relativa acumulada.<br />Frecuencia<br />Es el número de veces que se repite cierto dato en la muestra.<br />Frecuencia Acumulada<br />Es la suma de todas las frecuencias obtenidas de los datos de la muestra.<br />Frecuencia Relativa<br />Esta dada por la frecuencia de un dato dividido para el número de datos en la muestra.<br />Frecuencia relativa acumulada<br />La frecuencia relativa acumulada es la sumatoria de las frecuencias relativas dividido para el número total de datos.<br />Histograma de frecuencias relativas<br />Es la representación gráfica en forma de barras de la distribución de las frecuencias. En el eje vertical se encuentran las frecuencias y en el eje horizontal los valores correspondiente a las variables.<br />Polígono<br />Es un gráfico lineal el cual se realiza con los puntos medios de la barras, en la parte superior, del histograma. <br />Ojiva<br />La ojiva es una gráfica donde en el eje vertical se encuentra la frecuencia relativa acumulada y en el eje horizontal los valores correspondientes a la variable. En esta gráfica podemos ver cuántas observaciones se encuentran por encima o debajo de ciertos valores.<br />Diagrama de cajas<br />Es un gráfico que nos permite observar la dispersión de los datos de la muestra. Se realiza mediante los valores de los cuartiles. Nos permite ver si hay un dato atípico.<br />Estadísticos de Orden <br />Son puntos que dividen al conjunto de observaciones en partes iguales. Tenemos a los cuartiles que dividen en cuatro partes a lamuestra, los deciles que son 9 valores que dividen a la muestra en 10 partes iguales y los percentiles que dividen la muestra en 100 partes iguales. Representan los valores de la variable que están por debajo de un porcentaje.<br />Coeficiente de asimetría<br />El coeficiente de asimetría mide el grado de asimetría de una distribución con respecto a la media. Un valor positivo de este coeficiente indica que la distribución se encuentra sesgada hacia la izquierda y un resultado negativo significa que la distribución se encuentra sesgada a la derecha.<br /> <br />Coeficiente de Curtosis<br />El Coeficiente de Curtosis es aquel que analiza el grado de concentración que presentan los valores alrededor de la media de la distribución.<br />Existe 3 tipos de distribuciones según el coeficiente de curtosis:<br />Distribución mesocúrtica.- presenta una concentración media alrededor de la media. α4=3<br />Distribución leptocúrtica.- presenta un elevada concentración de valores alrededor de la media. α4>3<br />Distribución platicúrtica.- presenta un reducido grado de concentración alrededor de la media. α4<3<br />1. Diámetro<br />130129130139130127128127140132134135130138132144127117130147130130131139128132135128125130130141132135140130138133145144135131135123133130139133130130131126131131129129137138139135120132141138117130144140136130130143130130130131139131127130132138133127130128129130129129124128130134134135130133130139131135133131136145128140131131123130133133140127130134133133<br />n = 120<br />Nótese que los datos no agrupados no nos brinda mayor información por lo que los agrupamos para estimar alrededor de que valores hay mayor concentración de datos, lo que nos conduce a una tabla de frecuencias.<br />Tabla I<br />Tabla de Frecuencias<br />Diámetro de las rosquitas producidas en la empresa PUNCALSA<br />OrdinalClaseMarca de claseFrecuenciaFrecuenciaAcumuladaFrecuenciaRelativaFrec. Relativa Acumulada1[115118)116,5220,0170,0172[118121)119,5130,00850,0263[121124)122,5250,0170,0434[124127)125,5380,0260,0685[127130)128,518260,150,226[130133)131,544700,380,67[133136)134,522920,190,798[136139)137,581000,0680,859[139142)140,5131130,110,9710[142145)143,541170,0340,97311[145148]146,531200,0261<br />Fecha: Junio 25 del 2010<br />Fuente: Empresa PUNCALSA<br />Autor: Adriana Soriano H.<br />Se presentan un conjunto de datos estadísticos agrupados mediante la tabla de frecuencias, esta nos permite observar la distribución de los datos cuando están ordenados.<br />Podemos ver que los datos se agrupan en mayor proporción en los intervalos centrales, lo que hace suponer que tanto la media como la moda de la muestra se hallan entre dichos valores.<br />Estos datos nos ayudarán para la posterior elaboración de los gráficos histograma, polígono y distribución empírica, mismos que nos darán una idea mucho más clara de la distribución de los datos.<br />1.1 Histograma y Polígono de Frecuencias Relativas<br />Gráfico I<br />Gráfico II<br />Coeficiente de asimetría: 0,24<br />Coeficiente de Kurtosis: 0,72<br />Descripción de las gráficas:<br />El histograma y el polígono nos proporcionan una vista clara de la posible distribución que puede tener la variable diámetro, en el caso de este gráfico podríamos decir que existe la posibilidad de que esta variable se comporte como una distribución normal, pero esto se comprobará mas adelante con la aplicación del test de normalidad. El pico de la gráfica nos dice que la mayoría de los datos están en dicho intervalo [130;133), es aquí donde se esperaría que se encuentre la mediana, promedio y la moda. El coeficiente de asimetría nos dice que la gráfica es ligeramente sesgada a la derecha y el coeficiente kurtosis nos dice cuan puntiaguda es nuestra distribución respecto de un estándar normal, en este caso su valor es positivo y menor a tres, lo que nos lleva a concluir que se trata de una distribución platicúrtica.<br />Histograma de Frecuencia por Grupos<br />Gráfico III<br />Conclusión de la gráfica comparativa:<br />El mayor pico de ambas variables se encuentra en los mismos intervalos, por lo que cabe suponer que las medias de ambas muestras van a ser parecidas, así como probablemente las demás medidas de tendencia central.<br />1.2 Distribución Empírica<br />Gráfica IV<br />Tabla IV<br />Deciles<br />1127212931304130513161337134,3813819140<br />Descripción de la gráfica:<br />La distribución empírica nos permite identificar los diferentes estadísticos de orden, los cuales nos indican cuántas observaciones se encuentran por encima o por debajo de cierto valor, pudiéndose identificar fácilmente los deciles y percentiles, y a través del percentil cincuenta o quinto decil se puede encontrar que la mediana de la muestra es 130. <br />Distribución empírica por grupos<br />Gráfica V<br />Conclusión de la gráfica por grupo:<br />Observamos que las distribuciones de los datos dependiendo de la variable cualitativa, a través de los diferentes estadísticos de orden no tienen mayor diferencia, lo que hace suponer que el diámetro no varía dependiendo de la forma de la rosquita.<br />1.3 Diagrama de Cajas<br />Tabla V<br />Q1130Q2131Q3135RI5Min123Max141<br />Gráfico VI<br />Descripción de la gráfica:<br />El gráfico nos permite identificar rápidamente los datos atípicos presentes en la muestra, observamos así que existen varios de estos datos que salen del rango, puntualmente los podemos aproximar en: tres datos menores al mínimo 123 mm y siete mayores al máximo que es 141 mm. <br />Diagrama de Cajas por grupos<br />Tabla VI<br />0 (L)1 (T)Q1130130Q2131131Q3136135RI65Min123123Max145141<br /> <br />Gráfica VII<br />Conclusión de la gráfica por grupo:<br />En ambos gráficos logramos ver que después del segundo cuartil la dispersión de los datos es mayor, sin embargo el máximo es diferente de un grupo a otro. La mediana de los grupos es igual, lo que cabe suponer que la cantidad de datos está distribuida aparentemente igual sin depender de la forma.<br />1.4 Medidas de tendencia central y medidas de dispersión<br />Tabla VII<br />Media132,46Mediana131Moda n=27130Varianza29,63Desviación estándar5,44<br />Las medidas de tendencia central muestran la concentración de los datos en torno a un valor, la media, que en este caso se encuentra en el intervalos [130;133), es aquí donde coincidentemente se encuentra el valor central de la muestra (mediana), así como la moda.<br />Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio de la varianza y desviación estándar, si los diferentes valores de una variable están muy alejadas de la media. Tenemos una varianza grande por lo que se puede decir que tratamos con una media no homogénea puesto que la varianza es muy alta.<br />Llanas (L) n=55<br />Tabla VIII<br />Media132,76Mediana131Moda n=10130Varianza32,92Desviación estándar5,74<br />Trenzadas (T) n=65<br />Tabla IX<br />Media132,2Mediana131Moda n=17130Varianza27,16Desviación estándar5,21<br />Las medidas de tendencia central de ambas muestras son muy similares, lo que apoya el supuesto mencionado en las gráficas anteriores acerca de que la media, mediana y moda de cada variable va a estar en un mismo intervalo.<br />Las medidas de dispersión varían de una muestra a otra, aunque no significativamente.<br />En comparación con la muestra en general, las medidas tanto de dispersión como de tendencia central no cambian tanto, incuso se mantiene la misma moda y mediana.<br />2. Humedad<br />2,683,134,934,033,582,73,623,213,894,313,862,963,734,183,553,464,034,613,253,673,92,993,793,343,851,693,54,454,054,333,13,584,474,454,795,014,274,014,124,244,534,414,753,153,513,34,0644,24,714,354,794,583,753,813,53,493,073,414,333,244,313,523,713,294,7444,164,644,683,843,663,723,653,83,773,753,453,53,883,963,854,563,984,193,833,743,594,333,573,734,393,973,653,833,913,443,663,293,734,214,093,583,644,154,745,084,954,763,483,233,373,643,913,213,093,153,523,053,57<br />n = 120<br />Nótese que los datos no agrupados no nos brinda mayor información por lo que los agrupamos para estimar alrededor de que valores hay mayor concentración de datos, lo que nos conduce a una tabla de frecuencias.<br />Tabla II<br />Tabla de Frecuencias<br />Humedad de las rosquitas producidas en la empresa PUNCALSA<br />OrdinalClaseMarca de claseFrecuenciaFrecuencia AcumuladaFrecuencia RelativaFrecuencia Relativa Acumulada1[1,651,97)1,81110,00830,00832[1,972,29)2,130100,00833[2,292,61)2,450100,00834[2,612,93)2,77230,0170,0255[2,933,25)3,0913160,110,136[3,253,57)3,4119350,160,297[3,573,89)3,7333680,280,578[3,894,21)4,0521890,180,749[4,214,53)4,37141030,120,8610[4,534,85)4,69131160,110,9711[4,855,17]5,0141200,0331<br />Fecha: Junio 25 del 2010<br />Fuente: Empresa PUNCALSA<br />Autor: Diana Coello<br />La tabla de frecuencias me presenta al conjunto de datos agrupados, lo que nos permite tener una idea de la distribución de los datos cuando están ordenados.<br />Notamos como los primeros intervalos no tienen muchos datos, y estos van aumentando conforme avanza el intervalo; es de esperar que el intervalo de mayor frecuencia contenga las medidas como la media, mediana y la moda.<br />Con la ayuda de esta tabla se construyen los gráficos del histograma, polígono y distribución empírica, que nos ayudarán a una mayor comprensión de la distribución de los datos.<br />2.1 Histograma y Polígono de Frecuencias Relativas<br />Gráfico VIII<br />Gráfica IX<br />Coeficiente de Asimetría = -0,21<br />Coeficiente de Kurtosis = 0,89<br />Descripción de la gráfica:<br />Observando la gráfica nos damos cuenta que esta variable tiene cierto comportamiento de una distribución normal, ya que tiene una distribución casi simétrica, pero esto se comprobará mas adelante con la bondad de ajuste. <br />La gráfica tiene un pequeño sesgo a la izquierda, y esto lo podemos comprobar con ayuda del coeficiente de asimetría, el cual da un valor negativo pero cercano a cero corroborando nuestra afirmación. El coeficiente kurtosis nos dice cuan puntiaguda es nuestra distribución respecto de un estándar normal, en este caso el valor es menor a tres, lo que nos lleva a concluir que se trata de una distribución platicúrtica.<br />Histograma de Frecuencia por Grupos<br />Gráfico X<br /> <br />Conclusión de la gráfica comparativa:<br />Observamos que existen intervalos en los cuales hay evidentemente una diferencia en cuanto a la distribución de los datos, pero se puede decir que se anulan entre sí los que sobresalen con los que son menores, quedando así una distribución de los datos más o menos igual. Notamos también que hay un dato fuera de lo usual que pertenece a la variable de llanas.<br />2.2 Distribución Empírica<br />Gráfica XI<br />Tabla X<br />Deciles<br />13,2023,4533,5743,6753,80563,9374,1384,3394,64<br />Descripción de la gráfica:<br />Con esta gráfica podemos identificar los estadísticos de orden, mismos que nos indican cuántas observaciones se encuentran por encima o por debajo de cierto valor, pudiéndose identificar fácilmente los deciles y percentiles, y a través del percentil cincuenta o quinto decil se puede encontrar que la mediana de la muestra es 3,805. <br />Distribución empírica por grupos<br />Gráfica XII<br />Conclusión de la gráfica por grupo:<br />Notamos que existe una clara similitud en cuanto a la distribución de los datos dentro de los porcentajes correspondientes a los diferentes estadísticos de orden, esto nos hace pensar que es posible que no haya mucha diferencia entre las medias de las muestras, así como de los otros valores de tendencia central.<br />2.3 Diagrama de Cajas<br />Tabla XI<br />Q13,5Q23,805Q34,23RI0,73Min2,68Max5,08<br /> <br />Gráfico XIII<br />Descripción de la gráfica:<br />Podemos ver que la dispersión de los datos antes de la mediana así como después de esta, es similar lo que nos lleva a pensar que los datos están distribuidos de una manera simétrica alrededor de la mediana y que el valor de la media se va a encontrar muy cercana a esta.<br />Nos permite además identificar rápidamente no solo que existe un dato atípico presente, sino también cual es este valor atípico, en este caso hay un dato atípico que es menor al mínimo 2,68%.<br />Diagrama de Cajas por grupos<br />Tabla XII<br />0 (L)1 (T)Q13,573,43Q23,833,75Q34,314,195RI0,740,765Min2,682,96Max5,015,08<br />Gráfica XIV<br />Conclusión de la gráfica por grupo:<br />En los gráficos podemos ver que no hay una gran diferencia entre los valores de los cuartiles, pero sí vemos diferencia en cuanto al valor mínimo y máximo. Logramos identificar que el dato atípico corresponde a la variable cualitativa llana, y corresponde al mismo valor encontrado en el diagrama anterior.<br />2.4 Medidas de tendencia central y medidas de dispersión<br />Tabla XIII<br />Media3,85Mediana3,805Moda n=33,53,583,734,33Varianza0,32Desviación estándar0,56<br />Las medidas de tendencia central muestran la concentración de los datos en torno a la media la cual se encuentra, como venimos suponiendo, en el intervalo de mayor frecuencia [3,57;3,89), aquí se encuentra también el valor de la mediana, no es así con 3 veces, lo que significa que hay varias modas.<br />La variabilidad de una distribución viene dada por las medidas de dispersión, las cuales indican por medio de la varianza y desviación estándar si los diferentes valores de una variable están muy alejadas de la media o no. Tenemos una varianza de 0,32 la cual no es muy grande por lo que se puede decir que tratamos con una media homogénea.<br />Llanas (L) n=55<br />Tabla XIV<br />Media3,89Mediana3,83Moda n=23,583,653,83Varianza0,39Desviación estándar0,63<br />Trenzadas (T) n=65<br />Tabla XV<br />Media3,82Mediana3,75Moda n=23,213,293,53,73Varianza0,25Desviación estándar0,503<br />Las medidas de tendencia central de ambas muestras son similares, lo que apoya el supuesto mencionado en las gráficas anteriores acerca de que la media, mediana y moda de cada variable va a estar en un mismo intervalo. En el caso de las variables por grupo, los valores de la moda cambian encontrando solo dos repeticiones por cada valor.<br />Las medidas de dispersión varían de una muestra a otra, lo que le da a una mayor variabilidad con respecto a la otra, pero no es tan significativo.<br />En comparación con la muestra en general, las medidas tanto de dispersión como de tendencia central no cambian tanto, aunque no se mantengan las mismas modas ni medianas.<br />3. Peso<br />5,35,895,996,075,65,895,996,075,75,8966,075,75,966,085,75,966,095,745,9166,15,85,9166,15,85,9166,15,85,9366,15,85,9366,15,85,966,016,15,815,966,016,125,845,966,016,125,845,966,016,125,845,966,016,125,845,966,016,125,855,976,036,125,855,976,036,125,855,976,036,125,865,986,046,135,875,986,046,145,875,986,046,155,875,986,046,155,875,986,056,155,875,996,056,185,875,996,056,185,885,996,056,195,895,996,056,195,895,996,076,25,895,996,076,23<br />n = 120<br />Nótese que los datos no agrupados no nos brinda mayor información por lo que los agrupamos para estimar alrededor de que valores hay mayor concentración de datos, lo que nos conduce a una tabla de frecuencias.<br />Tabla III<br />Tabla de Frecuencias<br />Peso de las rosquitas producidas en la empresa PUNCALSA<br />OrdinalClaseMarca de ClaseFrecuenciaFrecuencia AcumuladaFrecuencia RelativaFrecuencia Relativa Acumulada1[5,255,34)5,295110,00830,00832[5,345,43)5,3850100,00833[5,435,52)5,4750100,00834[5,525,61)5,565120,00830,01675[5,615,7)5,6550200,01676[5,75,79)5,745460,0330,057[5,795,88)5,83521270,1750,2258[5,885,97)5,92520470,1670,3929[5,976,06)6,01541880,3420,7310[6,066,15)6,105231110,1920,92511[6,156,24]6,19591200,0751<br />Fecha: Junio 25 del 2010<br />Fuente: Empresa PUNCALSA<br />Autor: Gabriela Guevara<br />La tabla de frecuencias nos permite presentar los datos agrupados y ordenados, para poder tener una idea de la distribución de los datos dentro de la muestra.<br />Podemos ver que la frecuencia de los primeros intervalos es muy baja y luego va aumentando, además el intervalo de mayor frecuencia no se encuentra entre los del medio como solía suceder con las anteriores variables, por lo que podemos ir suponiendo que esta variable va a tener un comportamiento distinto al de las anteriores.<br />La agrupación de los datos nos sirve para poder elaborar luego los gráficos del histograma, polígono y distribución empírica, que nos ayudarán a darnos cuenta de cuál es más o menos el comportamiento que tiene esta variables.<br />3.1 Histograma y Polígono de Frecuencias Relativas<br />Gráfico XV<br />Gráfica XVI<br />Coeficiente de Asimetría = -1,28<br />Coeficiente de Kurtosis = 4,42<br />Descripción de la gráfica:<br />Con ambos gráficos tenemos una visión más clara de la posible distribución que podría tener la variable peso, en este caso descartamos la posibilidad de que sea una distribución normal, porque la gráfica tiene un sesgo muy pronunciado hacia la izquierda y esto lo comprueba también el coeficiente de asimetría negativo de -1,28.<br />El pico de la gráfica se encuentra en los valores próximos a 6, por lo que es de esperar que las medidas de tendencia central como la media, moda y mediana se encuentren próximas a estos valores.<br />El coeficiente kurtosis nos dice cuan puntiaguda es nuestra distribución respecto de un estándar normal, aquí el coeficiente es mayor a 3, con lo que se puede decir que en comparación a una distribución normal estándar esta variables es más elevada, denominándose leptocútica.<br />Histograma de Frecuencia por Grupos<br />Gráfico XVII<br /> <br />Conclusión de la gráfica comparativa:<br />El mayor pico en ambas muestras es similar, lo que cabe suponer que las medidas de tendencia central para llanas y trenzadas es similar; podemos decir también que la distribución de los datos es parecida.<br />3.2 Distribución Empírica<br />Gráfica XVIII<br />Tabla XVI<br />Deciles<br />15,8425,8735,9145,9755,9966,0176,0586,196,12<br />Descripción de la gráfica:<br />Este gráfico nos permite identificar fácilmente los estadísticos de orden y determinar cuántos de los datos se encuentran debajo o sobre otro valor, así podemos decir que la mediana o quinto decil es 5,99 esto quiere decir que el 50% de los datos se encuentran debajo de este valor, así como decir que el 50% se encuentran sobre 5,99. Lo mismo podemos hacer con cualquier otro valor y expresar en porcentajes el ordenamiento de los datos.<br />Distribución empírica por grupos<br />Gráfica XIX<br />Conclusión de la gráfica por grupo:<br />Comparamos las distribuciones empíricas del peso de las rosquitas en función de la forma que tenga la misma. No vemos mayor variación en cuanto a la distribución de los datos si estos son de llanas o de trenzadas, en general la distribuciones son parecidas.<br />3.3 Diagrama de Cajas<br />Tabla XVII<br />Q15,89Q25,99Q36,07RI0,18Min5,7Max6,23<br /> <br />Gráfico XX<br />Descripción de la gráfica:<br />Encontramos en esta muestra dos datos atípicos que son menores al mínimo 5,7 g que son 5,6 g y 5,3 g. Notamos además que la dispersión de los datos alrededor de la mediana 5,99 es similar tanto arriba como abajo. Este diagrama al igual que la gráfica de la distribución empírica nos permite identificar fácilmente estadísticos de orden, en este caso los cuartiles que dividen a la muestra en 4.<br />Diagrama de Cajas por grupos<br />Tabla XVIII<br />0 (L)1 (T)Q15,915,885Q25,996Q36,076,075RI0,160,19Min5,745,7Max6,026,23<br />Gráfica XXI<br />Conclusión de la gráfica por grupo:<br />Nos damos cuenta que al dividir la muestra de acuerdo a la variable cualitativa, que los dos datos atípicos identificados anteriormente pertenecen uno a cada tipo de forma. Estos datos atípicos interfieren en los cálculos acerca de las medidas de tendencia central y de dispersión para la muestra, por eso es necesaria su identificación para poder decidir si se los toma en cuenta para los cálculos o no.<br />La dispersión de los datos alrededor de la mediana en la forma trenzada difieren más que en la forma llana, esto me da indicios para sospechar que que la varianza de las trenzadas es mayor a la de llanas.<br />2.4 Medidas de tendencia central y medidas de dispersión<br />Tabla XIX<br />Media5,976Mediana5,99Moda n=85,9966,12Varianza0,0183Desviación estándar0,135<br />La media del peso es 5,98 y este valor se encuentra efectivamente como suponíamos cercano al intervalo de 6 que era el pico más alto en el histograma. Al igual que la mediana y las modas que se encuentran en valores cercanos al intervalo de 6.<br />La varianza de la muestra es de 0,018 l cual es pequeña y se puede decir entonces que tenemos una media homogénea ya que la varianza no es grande.<br />Llanas (L) n=55<br />Tabla XX<br />Media5,979Mediana5,99Moda n=55,986,1Varianza0,0128Desviación estándar0,113<br />Trenzadas (T) n=65<br />Tabla XXI<br />Media5,974Mediana6Moda n=55,8966,12Varianza0,0232Desviación estándar0,152<br />Ambas muestras tienen sus medidas de tendencia central muy similares, esto significa que como se mencionó anteriormente no hay diferencia significativa en la distribución de los datos de las llanas en comparación con las trenzadas.<br />Así mismo vemos que existe una diferencia no muy grande entre las varianzas, siendo como se mencionó anteriormente la varianza de las trenzadas mayor a la de llanas.<br />ESTADISTICA INFERENCIAL<br />Intervalos de confianza<br />Se denomina intervalo de confianza a un rango de valores calculados, mediante una muestra, en los cuales se estima que se encuentre cierto valor con cierto grado de probabilidad.<br />Hipótesis estadísticas<br />La hipótesis estadística es un enunciado que se plantea acerca de una característica o parámetro de una distribución de probabilidad de una población.<br />Hipótesis Nula<br />Es una hipótesis estadística que postula lo contrario a lo que se sospecha que va a ocurrir. Si esta es rechazada favorece a la hipótesis alterna.<br /> <br />Hipótesis Alterna<br />La hipótesis alterna es una hipótesis estadística que generalmente indica la posibilidad que una observación sea verdadera. Difiere a la hipótesis nula.<br />Contraste de Hipótesis<br />Contraste de hipótesis es comparar la hipótesis nula con la alterna para juzgar si las características de una población se cumplen o no según con lo observado en la muestra que fue tomada de dicha población<br />Valor p<br />Es el mínimo valor de significancia α, a partir del cual se rechaza la hipótesis nula.<br />Bondad de Ajuste<br />La bondad de ajuste o prueba de hipótesis para las distribuciones es un contraste de hipótesis que se plantea para poder identificar el tipo de distribución de probabilidad o función de densidad que tiene la variable.<br />Tabla de contingencia<br />Es una tabla en donde en cada casilla irá el número de observaciones que poseen las características analizadas. Sirve para determinar si hay dependencia o no entre 2 variables. Esta tabla debe poseer por lo menos 2 filas y 2 columnas, en las cuales hay mínimo 5 observaciones.<br />1. Diámetro<br />1.1 Intervalo de confianza para la media<br />Deseamos estimar el diámetro promedio de las rosquitas de la marca SUPAN para ello se toma una muestra aleatoria de 120 rosquitas, registrando un diámetro promedio de 132,46 mm con desviación estándar 5,443.<br />Construiremos un intervalo con 95% de confianza para el diámetro promedio de las rosquitas. <br />Supuesto: El diámetro del producto tiene una distribución normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />x- sn tα2(n-1)≤μ≤x+ sn tα2(n-1)<br />N Media Desv.Est. IC de 95%<br />120 132,46 5,44 (131,47 – 133,44)<br />131,47≤μ≤133,44<br />Gráfico XXII<br />Conclusión del gráfico:<br />Con un 95% de confianza decimos que en promedio el diámetro de las rosquitas de la marca SUPAN va a ser de 131,47 mm a 133,44 mm. Según las especificaciones del producto, el diámetro debe ser en promedio 132mm, y de acuerdo al intervalo obtenido dicho valor se encuentra incluido dentro del mismo, lo que nos hace suponer que el producto llegaría a cumplir con la especificación, pero eso se comprueba más adelante con la prueba de hipótesis correspondiente.<br />Intervalo de confianza para la media por grupos<br />Deseamos estimar el diámetro promedio de los dos tipos de rosquitas de la maraca SUPAN, para ello se toma una muestra aleatoria de 55 rosquitas llanas dando un diámetro promedio de 132,76 mm con desviación estándar 5,74 mm.<br />De las trenzadas se toman 65 rosquitas, registrando un diámetro promedio de 132,2 mm con desviación estándar 5,21 mm.<br />Construiremos un intervalo con 95% de confianza para el diámetro promedio de ambos tipos.<br />Supuesto: El diámetro del producto tiene una distribución normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />x- sn tα2(n-1)≤μ≤x+ sn tα2(n-1)<br />Variable N Media Desv.Est. IC de 95%<br />Diametro llanas 55 132,764 5,738 (131,212. 134,315)<br />Variable N Media Desv.Est. IC de 95%<br />Diametro trenzadas 65 132,200 5,212 (130,909. 133,491)<br />131,2≤μ0≤134,3<br />130,9≤μ1≤133,5<br />Gráfico XXIII<br />Conclusión del gráfico:<br />Los intervalos de los diámetros promedios no difieren significativamente al tratarse por separado la variables; observamos que el intervalo de trenzadas es un poco menor al de llanas, pero al igual que en el intervalo conjunto ambos intervalos incluyen el valor promedio que deberían cumplir las rosquitas en cuanto a su diámetro, además este valor se encuentra muy próximo a los puntos medio de los intervalos lo que nos lleva a suponer que este producto cumple con su especificación en cuanto a diámetro.<br />Intervalo de confianza para la diferencia de medias entre L y T<br />Se desea comparar el diámetro de las dos clases de rosquitas que se producen en la empresa PUNCALSA, para ello se tomó una muestra aleatoria de 55 rosquitas llanas y se obtuvo un diámetro promedio de 132,76 mm con desviación estándar 5,74 mm. De las rosquitas trenzadas se tomó una muestra de 65, obteniendo un diámetro promedio de 132,2 mm con desviación estándar 5,21 mm.<br />Construiremos un intervalo con 95% de confianza para la diferencia de medias.<br />Supuesto: El diámetro del producto tiene una distribución normal.<br />Observación:<br />Antes de realizar el intervalo de confianza para la diferencia de medias, debemos establecer un contraste de hipótesis para ver si las varianzas de las poblaciones son iguales o diferentes.<br />H0 : La varianza del diámetro de las rosquitas llanas es igual a la varianza del diámetro de las rosquitas trenzadas<br />vs.<br />H1 : La varianza del diámetro de las rosquitas llanas no es igual a la varianza del diámetro de las rosquitas trenzadas<br />T= SM2Sm2<br />Valor p=2PF(nM-1,nm-1>T)<br />Variable N Varianza<br />Diámetro llanas 55 32,925<br />Diámetro trenzadas 65 27,163<br /> Estadística<br />Método GL1 GL2 de prueba Valor P<br />Prueba F (normal) 54 64 1,21 0,458<br />Conclusión:<br />El valor p obtenido es mayor a 0,1 por lo tanto no rechazo la hipótesis nula.<br />Concluimos así, que existe evidencia estadística que demuestra que las varianzas de las poblaciones son iguales.<br />Caso 2<br />Muestras tomadas de poblaciones independientes normales con σ1 y σ2 desconocidos e iguales.<br />X1- X2- Sp1n1+1n2 tα2(n1+n2-2)≤µ1-µ2≤X1- X2+ Sp1n1+1n2 tα2(n1+n2-2) <br />-1,42≤µ1-µ2≤2,54<br /> N Media Desv.Est. <br />Diametro llanas 55 132,76 5,74 <br />Diametro trenzadas 65 132,20 5,21 <br />IC de 95% para la diferencia: (-1,42. 2,54)<br />Conclusión:<br />Con un 95% de confianza decimos que la diferencia de los diámetros promedios entre las rosquitas trenzadas y las rosquitas llanas de la marca SUPAN va a estar entre -1,42mm y 2,54 mm. Entre ambos límites el positivo es mayor, por lo que podemos decir también que µ1 que representa la media poblacional de las rosquitas llanas, va a tener en promedio un diámetro un poco mayor en comparación con las trenzadas; esta afirmación es apoyada también por el gráfico anterior en el que se observan los intervalos de la variable en función de la forma y en el que decíamos que los valores de las llanas van a ser un poco más altos que las trenzadas.<br />Además podríamos empezar a sospechar que los diámetros de las rosquitas en promedio son iguales, esto debido a que en comparación con los valores que toman las variables las diferencias son pequeñas. <br />1.2 Intervalo de confianza para la varianza<br />Deseamos estimar la varianza del diámetro de las rosquitas de la marca SUPAN, para ello tomamos una muestra de 120 rosquitas, registrando un diámetro promedio de 132,46 mm con desviación estándar 5,443.<br />Construiremos intervalos con 95% de confianza para la varianza y para la desviación estándar del diámetro del producto.<br />Supuesto: El diámetro del producto tiene una distribución normal.<br />S2 n-1x2α2(n-1)≤σ2≤S2 n-1 x21 - α2 (n-1)<br />Variable N Desv.Est. Varianza <br />Humedad 120 5,443 29,6<br />23,3≤σ2≤38,9<br />4,83≤σ≤6,23<br />Conclusión:<br />Con 95% de confianza, decimos que la desviación estándar del diámetro de las rosquitas se encuentra entre 4,83mm y 6,23mm. Para la varianza del diámetro se va a encontrar en un intervalo de 23,3mm a 38,9mm. <br />1.3 Prueba de Hipótesis para la media<br />Las especificaciones para el diámetro de las rosquitas de la marca SUPAN indican que éstas deben tener un diámetro promedio de 132mm. Para verificar si se cumple la especificación se toma una muestra aleatoria de 120 rosquitas, lo que nos dio como resultado un diámetro promedio de 132,46mm con una desviación estándar de 5,443. <br />¿Existe evidencia estadística que demuestre que se están cumpliendo las especificaciones? <br />Supuesto: El diámetro del producto tiene una distribución normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />H0 : El diámetro promedio del producto es igual a 132 mm<br />vs.<br />H1 : El diámetro promedio del producto es diferente a 132 mm<br />T=X-μS/n<br />Valor p=2 P(t(n-1)>T)<br />N Media Desv.Est. T P<br />120 132,46 5,44 0,93 0,356<br />Conclusión:<br />De acuerdo al valor p obtenido, no rechazamos la hipótesis nula. Esto quiere decir que existe evidencia estadística que demuestra que el diámetro promedio del producto es 132 mm. Podemos concluir entonces que las rosquitas si cumplen con las especificaciones del diámetro.<br />1.4 Prueba de Hipótesis para la varianza<br />En la fábrica se afirma que la desviación estándar del diámetro de las rosquitas es de 5mm. Para comprobar si la afirmación es correcta tomamos una muestra de 120 rosquitas, lo que dio como resultado un diámetro promedio de 132,46mm con una desviación estándar de 5,443 mm. ¿Los datos apoyan la afirmación? <br />Supuesto: El diámetro del producto tiene una distribución normal.<br />H0 : La varianza del diámetro es igual a 25<br />vs.<br />H1 : La varianza del diámetro no es igual a 25<br />T=S2 n-1σ2<br />Valor p=2 P(X(n-1)2>T)<br /> Estadística<br />Método de prueba GL Valor P<br />Chi-cuadrada 141,03 119 0,164<br />Conclusión:<br />De acuerdo al valor p que se obtuvo no se rechaza la hipótesis nula, lo que significa que existe suficiente evidencia estadística que apoye la afirmación de que la varianza del diámetro es igual 25.<br />1.5 Prueba de Hipótesis para la diferencia de medias<br />Se desea comparar el diámetro de las rosquitas llanas y de las rosquitas trenzadas producidas por la empresa PUNCALSA. Se afirma que las dos rosquitas tienen en promedio el mismo diámetro, para verificar esto se toma una muestra de 55 rosquitas llanas y se obtuvo un diámetro promedio de 132,76mm y desviación estándar de 5,74mm. De las rosquitas trenzadas se tomó una muestra de 65, obteniendo un diámetro promedio de 132,2mm con desviación estándar 5,21mm. ¿Los datos apoyan la afirmación planteada? <br />Supuesto: El diámetro del producto tiene una distribución normal.<br />Caso 2<br />Muestras tomadas de poblaciones independientes normales con σ1 y σ2 desconocidos e iguales.<br />H0 : La diferencia de los diámetros promedios entre las rosquitas llanas y las rosquitas trenzadas es igual a cero<br />vs.<br />H1 : La diferencia de los diámetros promedios entre las rosquitas llanas y las rosquitas trenzadas no es igual a cero<br />T= X1-X2-δSp1n1+1n2<br />Valor p=2 P(t(n1+n2-2)>T)<br /> N Media Desv.Est. <br />Diámetro llanas 55 132,76 5,74 <br />Diámetro trenzadas 65 132,20 5,21 <br />Estimado de la diferencia: 0,56<br />Prueba T de diferencia = 0 (vs. no =): Valor T = 0,56 Valor P = 0,574 GL = 118<br />Ambos utilizan Desv.Est. agrupada = 5,4589<br />Conclusión:<br />De acuerdo al valor p obtenido de 0,574 no se rechaza la hipótesis nula, ya que es mayor a 0,1. Por lo tanto no hay evidencia estadística que demuestre que la diferencia de medias no sea igual a cero. Al concluir que la diferencia de los diámetros promedios es igual a cero, estamos diciendo también que se cumple con la condición de que el diámetro en promedio debe ser el mismo ya sea una rosquita llana o una trenzada. Quiere decir que ambos tipos de rosquita cumplen con la especificación de calidad en cuanto al diámetro promedio que deben tener.<br />2. Humedad<br />2.1 Intervalo de confianza para la media<br />Se desea estimar la humedad promedio de las rosquitas de la marca SUPAN para ello se toma una muestra aleatoria de 120 rosquitas, registrando una humedad promedio de 3,8495% con desviación estándar 0,562.<br />Construiremos un intervalo con 95% de confianza para la humedad promedio del producto, trabajaremos bajo el supuesto de que la humedad del producto tiene una distribución normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />x- sn tα2(n-1)≤μ≤x+ sn tα2(n-1)<br />N Media Desv.Est. IC de 95%<br />120 3,8495 0,5620 (3,7479. 3,9511)<br />3,7479≤μ≤3,9511<br />Gráfico XXIV<br />Conclusión del gráfico:<br />Con un 95% de confianza podemos decir que en promedio la humedad de las rosquitas de la marca SUPAN va a estar entre 3,75% y 3,95%. Según las especificaciones para el producto la humedad debe estar en promedio en 3,8%, y según nuestro intervalo nos encontramos en un rango en el cual se encuentra inmerso dicho valor, lo que nos llevaría a empezar a suponer que el producto cumple con la especificación requerida pero esto solo se puede afirmar o negar una vez realizado el contraste de hipótesis necesario.<br />Intervalo de confianza para la media por grupos<br />Se desea estimar la humedad promedio de las rosquitas llanas y de las trenzadas de la marca SUPAN para ello se toma una muestra aleatoria de 55 rosquitas llanas registrando una humedad promedio de 3,8878% con desviación estándar 0,6272.<br />De las trenzadas se toman 65 rosquitas, registrando una humedad promedio de 3,8878% con desviación estándar 0,6272.<br />Construiremos un intervalo con 95% de confianza para la humedad promedio de ambos tipos, trabajaremos bajo el supuesto de que la humedad tiene una distribución normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />x- sn tα2(n-1)≤μ≤x+ sn tα2(n-1)<br />Variable N Media Desv.Est. IC de 95%<br />Humedad llanas 55 3,8878 0,6272 (3,7183. 4,0574)<br />Variable N Media Desv.Est. IC de 95%<br />Humedad trenzadas 65 3,8171 0,503 (3,6924. 3,9417)<br />3,7183≤μ0≤4,0574<br />3,6924≤μ1≤3,9417<br />Gráfico XXV<br />Conclusión de la gráfica:<br />Con 0,05 de nivel de significancia, se observa que el intervalo para el promedio de humedades es menor en las trenzadas (1), teniendo un intervalo mucho más grande en las llanas. Sin embargo, ambos intervalos siguen incluyendo el valor estándar que deben cumplir las rosquitas, lo que nos haría suponer que ambos tipos de rosquitas cumplen las especificaciones. Podemos observar también el punto medio de estos intervalos, notando que el punto medio de las trenzadas es menor que el de llanas pero no difieren significativamente, además ambos puntos se encuentran cercanos al valor del parámetro de humedad promedio<br />Intervalo de confianza para la diferencia de medias entre L y T<br />Se desea comparar la humedad de las dos clases de rosquitas que se producen en la empresa PUNCALSA, para ello se tomó una muestra aleatoria de 55 rosquitas llanas y se obtuvo una humedad promedio de 3,89% y desviación estándar de 0,63. De las rosquitas trenzadas se tomó una muestra de 65, obteniendo una humedad promedio de 3,82% con desviación estándar 0,5.<br />Construiremos un intervalo con 95% de confianza para la diferencia de medias, trabajaremos bajo el supuesto de que las humedades tienen distribución normal.<br />Observación:<br />Antes de realizar el intervalo de confianza para la diferencia de medias, debemos establecer un contraste de hipótesis para ver si las varianzas de las poblaciones son iguales o diferentes.<br />H0 : La varianza de la humedad de las rosquitas llanas es igual a la varianza de la humedad de las rosquitas trenzadas<br />vs.<br />H1 : La varianza de la humedad de las rosquitas llanas es diferente a la varianza de la humedad de las rosquitas trenzadas<br />T= SM2Sm2<br />Valor p=2PF(nM-1,nm-1>T)<br />Variable N Varianza<br />Humedad llanas 55 0,393<br />Humedad trenzadas 65 0,253<br /> Estadística<br />Método GL1 GL2 de prueba Valor P<br />Prueba F (normal) 54 64 1,55 0,091<br />Conclusión:<br />El valor p obtenido es menor a 0,05 por lo tanto rechazo la hipótesis nula.<br />Concluimos así, que no existe evidencia estadística que pruebe que las varianzas sean iguales.<br />Caso 3<br />Muestras tomadas de poblaciones independientes normales con σ1 y σ2 desconocidos y diferentes.<br />X1- X2- s12n1+s22n2 tα2(U)≤µ1-µ2≤X1- X2+ s12n1+s22n2 tα2(U)<br />-0,138≤µ1-µ2≤0,279<br /> N Media Desv.Est. <br />Humedad llanas 55 3,888 0,627 <br />Humedad trenzadas 65 3,817 0,503 <br />IC de 95% para la diferencia: (-0,138. 0,279)<br />Conclusión:<br />Con un 95% de confianza podemos decir que la diferencia de los promedios de la humedad entre las rosquitas trenzadas y las rosquitas llanas de la marca SUPAN va a estar entre -0,138% y 0,279%, que es un intervalo cercano a cero. Como µ1 representa la media poblacional de las rosquitas llanas, quiere decir que en promedio la humedad de éstas va a ser un poco mayor a la humedad de las trenzadas, lo que se puede comprobar con el gráfico anterior en el que se comparan los intervalos y puntos medio de las variables y en el cual también podemos observar que las llanas tienen mayores valores en comparación con las trenzadas; aunque no son tan altos ya que el intervalo de diferencias está un poco cercano a cero. Además podríamos empezar a sospechar que las humedades de las rosquitas en promedio son iguales y esto lo verificaremos más adelante con la prueba de hipótesis correspondiente.<br />2.2 Intervalo de confianza para la varianza<br />Deseamos estimar la varianza de la humedad de las rosquitas de la marca SUPAN, para ello tomamos una muestra de 120 rosquitas, registrando una humedad promedio de 3,8495% con desviación estándar 0,562.<br />Construiremos intervalos con 95% de confianza para la varianza y para la desviación estándar de la humedad del producto, trabajaremos bajo el supuesto de que la humedad del producto tiene una distribución normal.<br />S2 n-1x2α2(n-1)≤σ2≤S2 n-1 x21 - α2 (n-1)<br />Variable N Desv.Est. Varianza <br />Humedad 120 0,562 0,316<br />0,249≤σ2≤0,414<br />0,499≤σ≤0,644<br />Conclusión:<br />Podemos decir, con un 95% de confianza, que la varianza de la humedad de las rosquitas de la marca SUPAN se encuentra entre 0,249 y 0,414. <br />2.3 Prueba de Hipótesis para la media<br />Las especificaciones para la humedad de las rosquitas de la marca SUPAN indican que éstas deben tener en promedio una humedad de 3,8%. Para verificar si se cumplen las especificaciones se toma una muestra aleatoria de 120 rosquitas, lo que dio como resultado una humedad promedio de 3,8495% con una desviación estándar de 0,562. ¿Existe evidencia estadística que demuestre que se están cumpliendo las especificaciones? Trabajaremos bajo el supuesto de que la humedad del producto tiene distribución normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />H0 : La humedad promedio del producto es igual a 3,8%<br />vs.<br />H1 : La humedad promedio del producto es diferente de 3,8%<br />T=X-μS/n<br />Valor p=2 P(t(n-1)>T)<br />Variable N Media Desv.Est. T P<br />Humedad 120 3,8495 0,5620 0,96 0,337<br />Conclusión:<br />De acuerdo al valor p obtenido, no rechazamos la hipótesis nula.<br />Es decir, que existe evidencia estadística que demuestra que la humedad promedio de las rosquitas de la marca SUPAN es igual a 3,8%, por lo que concluimos que se están cumpliendo las especificaciones del producto; hemos comprobado lo supuesto también con los intervalos de confianza para las medias en donde suponíamos que se cumplían las especificaciones porque en el intervalo estaba incluido el estándar de la humedad.<br />2.4 Prueba de Hipótesis para la varianza<br />De acuerdo a los parámetros establecidos para la humedad de las rosquitas SUPAN, se afirma que la varianza debe ser 0,3. Para comprobar si la afirmación es correcta tomamos una muestra de 120 rosquitas, lo que dio como resultado una humedad promedio de 3,8495% con una desviación estándar de 0,562. ¿Los datos apoyan la afirmación? Trabajaremos bajo el supuesto de que la humedad del producto tiene distribución normal.<br />H0 : La varianza de la humedad es igual a 0,3<br />vs.<br />H1 : La varianza de la humedad no es igual a 0,3<br />T=S2 n-1σ2<br />Valor p=2 P(X(n-1)2>T)<br /> Estadística<br />Método de prueba GL Valor P<br />Chi-cuadrada 125,28 119 0,658<br />Conclusión:<br />El valor p obtenido es mayor a 0,1 lo que significa que no se rechaza la hipótesis nula. Por lo tanto concluimos que existe evidencia que respalda la afirmación de que la varianza de la humedad de la población es 0,3.<br />2.5 Prueba de Hipótesis para la diferencia de medias<br />Se desea comparar la humedad de los dos tipos de rosquitas producidas por la empresa PUNCALSA. Se afirma que las dos rosquitas tienen en promedio la misma humedad, para verificar esto se toma una muestra de 55 rosquitas llanas y se obtuvo una humedad promedio de 3,89% y desviación estándar de 0,63. De las rosquitas trenzadas se tomó una muestra de 65, obteniendo una humedad promedio de 3,82% con desviación estándar 0,5. ¿Los datos apoyan la afirmación planteada? Trabajaremos bajo el supuesto de que las humedades tienen distribución normal.<br />Caso 3<br />Muestras tomadas de poblaciones independientes normales con σ1 y σ2 desconocidos y diferentes.<br />H0 : La diferencia de la humedad promedio entre las rosquitas llanas y las rosquitas <br /> trenzadas es igual a cero<br />vs.<br />H1 : La diferencia de la humedad promedio entre las rosquitas llanas y las rosquitas <br /> trenzadas es diferente de cero<br />T= X1-X2-δS12n1+S22n2<br />Valor p=2 P(t(U)>T)<br /> N Media Desv.Est. <br />Humedad llanas 55 3,888 0,627 <br />Humedad trenzadas 65 3,817 0,503 <br />Estimado de la diferencia: 0,071<br />Prueba T de diferencia = 0 (vs. no =): Valor T = 0,67 Valor P = 0,502 GL = 103<br />Conclusión:<br />No se rechaza la hipótesis nula ya que el valor p obtenido es mayor a 0,1. Por lo tanto no hay evidencia estadística que demuestre que la diferencia de medias sea diferente de cero. Concluimos así que la diferencia de medias es igual a cero, lo que quiere decir que en promedio la humedad de ambos tipos de rosquitas es la misma; esto significa que el producto, sin importar su forma, tiene una humedad promedio que cumple con el parámetro establecido.<br /> <br />3. Peso<br />3.1 Intervalo de confianza para la media<br />Se desea estimar el promedio de los pesos obtenidos de rosquitas marca SUPAN, para esto se eligieron al azar 120 rosquitas en las cuales se obtuvo desviación estándar 0,14 g y promedio de 5,98g. Con estos datos a continuación se construye un intervalo con 95% de confianza para el peso de dicho producto y se supone que la muestra es tomada de población normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />x- sn tα2(n-1)≤μ≤x+ sn tα2(n-1)<br />N Media Desv.Est. IC de 95%<br />120 5,97640 0,13520 (5,95196; 6,00084)<br />5,95196≤μ≤6,00084<br />Gráfico XXVI<br />Conclusión del gráfico:<br />Podemos darnos cuenta que con un 95% de confianza obtenemos que el promedio para el peso de las rosquitas de la marca SUPAN va a estar entre un intervalo de 5,95 g y 6 g. Según las especificaciones para el producto, el peso debe estar en promedio en 6 g por lo que según nuestro intervalo nos encontramos en un rango en el cual se cumple dicho parámetro, pero no de una manera tan clara como en el caso de las anteriores variables, por lo que habría que comprobar si cumple o no con la especificación mediante el uso necesario de pruebas de hipótesis.<br />Intervalo de confianza para la media por grupos<br />Se desea estimar el peso promedio de las rosquitas llanas y de las trenzadas de la marca SUPAN para ello se toma una muestra aleatoria de 55 rosquitas llanas registrando un peso promedio de 5,979 g con desviación estándar 0,113 g.<br />De las trenzadas se toman 65 rosquitas, registrando un peso promedio de 5,974 g con desviación estándar 0,152 g.<br />Construiremos un intervalo con 95% de confianza para la humedad promedio de ambos tipos, trabajaremos bajo el supuesto de que la humedad tiene una distribución normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />x- sn tα2n-1≤μ≤x+ sn tα2n-1<br />Variable N Media Desv.Est. IC de 95%<br />Peso llanas 55 5,9796 0,1129 (5,9491. 6,0102)<br />Variable N Media Desv.Est. IC de 95%<br />Peso trenzadas 65 5,9737 0,1523 (5,9360. 6,0114)<br />5,95≤μ0≤6,01<br />5,936≤μ1≤6,01<br />Gráfico XXVII<br />Conclusión de la gráfica:<br />Con 0,05 de nivel de significancia, se observa que el intervalo para el promedio de pesos es menor en las llanas (0), teniendo un intervalo con un límite inferior más pequeño para las trenzadas. Al igual que el intervalo general del peso, estos dos intervalos incluyen el valor de la especificación pero de una manera no tan contundente como en las variables anteriores. Observamos que los puntos medios de ambos intervalos son similares, lo que nos haría suponer que sus diferencias serían cercanas a cero pero eso lo verificaremos más adelante.<br />Intervalo de confianza para la diferencia de medias entre L y T<br />Se desea comparar el peso de las dos clases de rosquitas que se producen en la empresa PUNCALSA, para ello se tomó una muestra aleatoria de 65 rosquitas trenzadas y se obtuvo un peso promedio de 5,974 g y desviación estándar de 0,152 g. De las rosquitas llanas se tomó una muestra aleatoria de 55, obteniendo un peso promedio en gramos de 5,979 y una desviación estándar de 0,112 g. Construiremos un intervalo con 95% de confianza para la diferencia de medias, vamos a suponer que el peso tiene distribución normal.<br />Observación:<br />Antes de realizar el intervalo de confianza para la diferencia de medias, debemos establecer un contraste de hipótesis para ver si las varianzas de las poblaciones son iguales o diferentes.<br />H0 : La varianza del peso de las rosquitas llanas es igual a la varianza del peso de las rosquitas trenzadas<br />vs.<br />H1 : La varianza del peso de las rosquitas llanas es igual a la varianza del peso de las rosquitas trenzadas<br />T= SM2Sm2<br />Valor p=2PF(nM-1,nm-1>T)<br />Variable N Desv.Est. Varianza<br />Peso llanas 55 0,113 0,013<br />Peso trenzadas 65 0,152 0,023<br /> Estadística<br />Método GL1 GL2 de prueba Valor P<br />Prueba F (normal) 54 64 0,55 0,025<br />Conclusión:<br />El valor p obtenido es menor a 0,05 por lo tanto rechazo la hipótesis nula.<br />Concluimos así, que no existe evidencia estadística que pruebe que las varianzas sean iguales.<br />Caso 3<br />Muestras tomadas de poblaciones independientes normales con σ1 y σ2 desconocidos y diferentes.<br />X1- X2- s12n1+s22n2 tα2(U)≤µ1-µ2≤X1- X2+ s12n1+s22n2 tα2(U)<br />-0,0421≤µ1-µ2≤0,054<br /> N Media Desv.Est.<br />Peso llanas 55 5,980 0,113 <br />Peso trenzadas 65 5,974 0,152<br />IC de 95% para la diferencia: (-0,0421. 0,0540)<br />Conclusión:<br />Con un 95% de confianza podemos decir que la diferencia de los pesos promedios entre las rosquitas trenzadas y las rosquitas llanas de la marca SUPAN está entre -0,0421 g y 0,054 g, el cual es un intervalo muy cercano a cero y además la magnitud del valor negativo y positivo son muy parecidos, por lo que podemos sospechar que los pesos de las rosquitas en promedio son iguales y esto lo verificaremos más adelante con la prueba de hipótesis correspondiente.<br />3.2 Intervalo de confianza para la varianza<br />Se desea estimar la varianza de los pesos de las rosquitas marca SUPAN, para esto se eligieron al azar 120 rosquitas en donde se obtuvo desviación estándar 0,14 g. Con estos datos a continuación se construye un intervalo con 95% de confianza para el peso de dicho producto y se supone que la muestra es tomada de población normal.<br />S2 n-1x2α2(n-1)≤σ2≤S2 n-1 x21 - α2 (n-1)<br />N Desv.Est. Varianza <br />120 0,14 0,0183<br />0,110≤σ2≤0,184<br />0,332≤σ≤0,429<br />Conclusión:<br />Con 95% de confianza, decimos que la varianza del peso de las rosquitas se encuentra entre 0,11 y 0,184. Para la desviación estándar el peso se va a encontrar en un intervalo de 0,332 g a 0,429 g.<br />3.3 Prueba de Hipótesis para la media<br />De acuerdo a los parámetros establecidos para el peso de las rosquitas SUPAN, se afirma que el peso promedio de las rosquitas debe ser 6 gramos. Para verificar si se cumple esta afirmación se toma una muestra aleatoria de 120 rosquitas, lo que dio como resultado un peso promedio de 5,98 g con una desviación estándar de 0,14 g. ¿Existe evidencia estadística que demuestre que se están cumpliendo las especificaciones? Trabajaremos bajo el supuesto de que el peso del producto tiene distribución normal.<br />Caso 2<br />Muestra tomada de población normal con σ2 desconocida<br />H0 : El peso promedio del producto es igual a 6 g<br />vs.<br />H1 : El peso promedio del producto no es igual a 6 g<br />T=X-μS/n<br />Valor p=2 P(t(n-1)>T)<br />N Media Desv.Est. TP<br />120 5,97640 0,13520 -1,91 0,058<br />Conclusión:<br />Podemos darnos cuenta que el valor p cae en un rango de duda, que es entre 0,05 y 0,09, por lo que lo más recomendable sería volver a tomar una muestra para luego volver a realizar el contraste de hipótesis.<br />Pero nosotros podemos concluir que con este valor p rechazamos la hipótesis nula a favor de la hipótesis alterna, quedando entonces que el producto no cumple con el peso promedio según las especificaciones de la empresa.<br />3.4 Prueba de Hipótesis para la varianza<br />De acuerdo a los parámetros establecidos para el peso de las rosquitas SUPAN, se afirma que la desviación estándar del peso de las rosquitas es 0,15 gramo. Para verificar si se cumple esta afirmación se toma una muestra aleatoria de 120 rosquitas, lo que dio como resultado un peso promedio de 5,98 g con una desviación estándar de 0,14 g. ¿Existe evidencia estadística que demuestre que se la afirmación es correcta? Trabajaremos bajo el supuesto de que el peso del producto tiene distribución normal.<br />H0 : La varianza del peso es igual a 0,0225<br />vs.<br />H1 : La varianza del peso no es igual a 0,0225<br />T=S2 n-1σ2<br />Valor p=2 P(X(n-1)2>T)<br /> Estadística<br />Método de prueba GL Valor P<br />Chi-cuadrada 96,64 119 0,132<br />Conclusión:<br />El valor p obtenido es mayor a 0,1 lo que significa que no se rechaza la hipótesis nula. Por lo tanto concluimos que no hay evidencia que indique que la varianza no sea 0,0225, por lo tanto existe también evidencia que demuestre que la afirmación de que la desviación estándar es 0,15g es correcta.<br />3.5 Prueba de Hipótesis para la diferencia de medias<br />Se desea comparar el peso de los dos tipos de rosquitas producidas por la empresa PUNCALSA. Se afirma que las dos rosquitas tienen en promedio el mismo peso, para verificar esto se toma una muestra de 65 rosquitas trenzadas y se obtuvo un peso promedio de 5,974 g y desviación estándar de 0,152 g. De las rosquitas llanas se tomó una muestra aleatoria de 55, obteniendo un peso promedio en gramos de 5,979 y una desviación estándar de 0,112 g. Trabajaremos bajo el supuesto de que el peso del producto tiene distribución normal.<br />Caso 3<br />Muestras tomadas de poblaciones independientes normales con σ1 y σ2 desconocidos y diferentes.<br />H0 : La diferencia del peso promedio entre las rosquitas llanas y las rosquitas trenzadas es igual a cero<br />vs.<br />H1 : La diferencia del peso promedio entre las rosquitas llanas y las rosquitas trenzadas es igual a cero<br />T= X1-X2-δS12n1+S22n2<br />Valor p=2 P(t(U)>T)<br /> N Media Desv.Est. <br />Peso llanas 55 5,980 0,113 <br />Peso trenzadas 65 5,974 0,152<br />Estimado de la diferencia: 0,0059<br />Prueba T de diferencia = 0 (vs. no =): Valor T = 0,24 Valor P = 0,807 GL = 116<br />Conclusión:<br />El valor p calculado cae en el rango de no rechazar la hipótesis nula ya que es mayor a 0,1. Por lo tanto no hay evidencia estadística que indique que la diferencia de pesos promedios sea diferente de cero. Concluimos así que la diferencia de medias es igual a cero, lo que quiere decir que no importa la forma de la rosquita, sea llana o trenzada igual van a tener en promedio el mismo peso.<br />BONDAD DE AJUSTE<br />1. Diámetro<br />Prueba de hipótesis para la distribución del diámetro de las rosquitas de la marca SUPAN (Bondad de Ajuste)<br />H0 : El diámetro de las rosquitas tiene distribución normal con μ 132mm y σ2 29,51<br />vs.<br />H1 : El diámetro de las rosquitas no tiene distribución normal con μ 132mm ni σ2 29,51<br />Gráfico XXVIII<br />Conclusión:<br />Como el valor p es menor a 0,05 rechazo la hipótesis nula.<br />Por lo tanto no hay evidencia estadística que demuestre que el diámetro tiene distribución normal con μ 132mm y σ2 29,51.<br />Bondad de Ajusta para distribución Exponencial<br />H0 : El diámetro tiene una distribución exponencial con β = 132mm<br />Vs<br />H1 : El diámetro no tiene una distribución exponencial con β = 132mm<br />Método de Kolmogorov- Simirnov (K-S)<br />Tabla XXII<br />xEmpíricaAcumuladaAbs (emp. - acum.)1170,016666670,5878482350,5711815691200,0250,5971096780,5721096781230,041666670,6061630080,5644963421240,050,6091353490,5591353491250,058333330,6120852570,5537519231260,066666670,6150129010,5483462341270,116666670,617918450,5012517841280,166666670,6208020710,4541354041290,216666670,6236639280,4069972621300,441666670,6265041870,184837521310,533333330,629323010,0959896771320,583333330,6321205590,0487872251330,666666670,6348969940,0317696721340,691666670,6376524750,0540141911350,766666670,6403871610,1262795061360,783333330,6431012070,1402321261370,791666670,645794770,1458718971380,833333330,6484680040,1848653291390,883333330,6511210630,232212271400,9250,6537540990,2712459011410,941666670,6563672630,2852994031430,950,6615345750,2884654251440,9750,6640890190,3109109811450,991666670,6666241840,32504248314710,6716372590,328362741<br />D*= 0.572<br />D0.05(120)=0.148<br />D*> D0.05(120)<br />Conclusión:<br />Con un nivel de significancia del 0,05 rechazamos Ho a favor de H1, por lo que se puede concluir que no hay evidencia estadística que demuestre que la variable diámetro tiene una distribución exponencial con β = 132mm<br />Bondad de Ajusta para distribución Ji-cuadrado<br />H0: El diámetro tiene una distribución Ji-cuadrado con α = 60 y β = 2<br />Vs<br />H1: El diámetro no tiene una distribución Ji-cuadrado con α = 60 y β = 2<br />Método de Kolmogorov- Simirnov (K-S)<br />Tabla XXIII<br />XEmpíricaAcumuladaEmp - Acum(2) 1170.0170.0123454820.004654521200.0250.0125766490.01242335(2) 1230.0420.0123251370.029674861240.050.0121416570.037858341250.0580.0119129790.046087021260.0670.0116425560.05535744(6) 1270.1170.0113341870.10566581(6) 1280.1670.0109919410.15600806(6) 1290.2170.0106200710.20637993(27) 1300.4420.0102229440.43177706(11) 1310.5330.009804960.52319504(6) 1320.5830.0093704850.57362952(10) 1330.6670.0089237880.65807621(4) 1340.6920.0084689830.68353102(8) 1350.7670.0080099820.75899002(2) 1360.7830.007550450.775449551370.7920.0070937740.78490623(5) 1380.8330.0066430410.82635696(6) 1390.8830.0062010150.87679899(5) 1400.9250.005770130.91922987(2) 1410.9420.0053524880.936647511430.950.0045636960.9454363(3) 1440.9750.0041951350.97080487(2) 1450.9920.0038450240.9881549814710.0032022070.99679779<br />D*= 0.997<br />D0.05(120)=0.148<br />D*> D0.05(120)<br />Conclusión:<br />Con un nivel de significancia del 0,05 rechazamos Ho a favor de H1, por lo que se puede concluir que no hay evidencia estadística que demuestre que la variable diámetro tiene una distribución Ji-cuadrado con con α = 60 y β = 2.<br />2. Humedad<br />Prueba de hipótesis para la distribución del diámetro de las rosquitas de la marca SUPAN (Bondad de Ajuste)<br />H0 : La humedad tiene distribución normal con μ 3,849% y σ2 0,3158<br />vs.<br />H1 : La humedad no tiene distribución normal con μ 3,849% ni σ2 0,3158<br />Gráfico XXIX<br />Conclusión:<br />Como el valor p es mayor a 0,150 no rechazo la hipótesis nula. <br />Por lo tanto se puede concluir que no existe evidencia de que la humedad de las rosquitas de la marca SUPAN no tienen distribución normal con μ 3,849 y σ20,3158<br />3. Peso<br />Prueba de hipótesis para la distribución del diámetro de las rosquitas de la marca SUPAN (Bondad de Ajuste)<br />H0 : El peso tiene distribución normal con μ 5,976g y σ2 0,018<br />vs.<br />H1 : El peso no tiene distribución normal con μ 5,976g ni σ2 0,018<br />Gráfico XXX<br />Conclusión:<br />Como el valor p es menor a 0,01 rechazo la hipótesis nula.<br />Por lo tanto se puede concluir que no existe evidencia estadística que demuestre que el peso de las rosquitas de la marca SUPAN tiene distribución normal con μ 5,976g ni σ2 0,018.<br />TABLAS DE CONTINGENCIA<br />1. Diámetro - Humedad<br />H0 : El diámetro de las rosquitas es independiente de la humedad que esta contenga.<br />vs.<br />H1 : ¬ Ho<br />Tabla XXIV<br />HUMEDAD<br />[1.65-3.57)[3.57-5.17) [117-135)29558424.559.5[135-150)6303610.525.5 3585 <br />DIAMETRO<br />Eij= Xi * Xj<br /> n<br />O11= 29 E11= 24.5 <br />O12= 55 E12= 59.5 <br />O21= 6 E21=10.5 <br />O22= 30 E22=25.5 <br />rC<br />j =1i =1X2= ∑ ∑ (Oij – Eij)2<br /> Eij<br />X2= 3.85 <br />Valor p = P(X 2 (1) > 3.85)<br />Valor p < 0.05<br />Conclusión:<br />Rechazo Ho a favor de H1, lo que significa que existe evidencia que demuestra que el diámetro de las rosquitas va a depender de la humedad de la misma.<br />2. Diámetro - Peso<br />H0 : El diámetro de las rosquitas es independiente del peso de las mismas.<br />vs.<br />H1 : ¬ Ho<br />Tabla XXV<br />PESO<br />DIAMETRO<br />(5,7 – 5,87)(5,88 – 6,05)(6,06 – 6,23)(117-131)1535146413,0234,7116,27(132-147)929165410,9829.2913,73246430<br />Eij= Xi * Xj<br /> n<br />O11= 15 E11= 24.5 <br />O12= 35 E12= 14 <br />O13= 14 E13=16,27<br />O21= 9 E21=10,98 <br />O22= 29 E22=29,9<br />O23= 16 E23=13,73<br />rC<br />j =1i =1X2= ∑ ∑ (Oij – Eij)2<br /> Eij<br />X2= 1,36 <br />Valor p = P(X 2 (2) > 1.36)<br />0,1<Valor p < 0,9<br />Conclusión:<br />Con el valor p obtenido no rechazo Ho. Lo que significa que existe evidencia estadística para pode concluir que el diámetro es independiente del peso del producto.<br />3. Humedad - Peso<br />H0 : El peso de las rosquitas no depende de la humedad de ellas.<br />vs.<br />H1 : ¬ Ho<br />Tabla XXVI<br />HUMEDADHUMEDAD<br />(1.60 - 3.40)(3.40 - 5.20) (5.3 - 5.90)924336.0526.95(5.90 - 6.50)13748715.9571.052298 <br />PESO<br />Eij= Xi * Xj<br /> n<br />O11= 9 E11= 6.05 <br />O12= 24 E12= 26.95<br />O21= 13 E21=15.95<br />O22= 74 E22=71.05<br />rC<br />j =1i =1X2= ∑ ∑ (Oij – Eij)2<br /> Eij<br />X2= 2.41 <br />Valor p = P(X 2(1) > 2.41)<br />0.1 < Valor p < 0.9<br />Conclusión:<br />Con el valor p calculado no rechazo Ho. Por lo que concluimos que existe evidencia estadística para poder concluir que el peso no es dependiente de la humedad del producto.<br />REGRESION LINEAL<br />Diámetro vs. Humedad<br />Modelo de Regresión de Lineal Simple<br />yi= β0+ β1xi + e<br />Supuestos: e ~ N0, σ2<br /> σ2 es constante<br /> Cov (ei, ej) = 0 i ≠ j<br />Para este caso nuestro modelo de regresión sería:<br />Diámetro = 129 + 1,02 Humedad<br />Tabla XXVII<br />PredictorCoefSE CoefTPConstante128,5273,44937,260,000Humedad1.02110,88671,150,252<br />S = 5,43576 R-cuad. = 1,1% R-cuad.(ajustado) = 0,3%<br />Observación:<br />Como podemos observar el poder de explicación del modelo lineal es muy bajo ya que solo se reduce en un 1,1% la variabilidad de las respuestas.<br />Comprobación de los supuestos<br />Histograma de Probabilidad de Residuos<br />Gráfico XXXI<br />Análisis de la Normalidad de Residuos<br />Gráfico XXXII<br />Prueba de hipótesis para la distribución del error<br />H0 : El error tiene distribución normal con μ 0 y σ2 29,55<br />vs.<br />H1 : El error no tiene distribución normal con μ 0 ni σ2 29,55<br />Gráfico XXXIII<br />Conclusión:<br />Debido a que el valor p es menor a 0,01 rechazamos la hipótesis nula, por lo que concluimos que el error no tiene distribución normal con μ 0 ni σ2 29,5.<br />Relación entre los residuos y las observaciones<br />Gráfico XXXIV<br />Conclusión:<br />No existe homogeneidad en cuanto a los valores de la varianza, dado que según lo observado en la gráfica la dispersión de los datos es amplia.<br />Independencia de error<br />Gráfico XXXV<br />Conclusión:<br />No se encuentra evidencia de que exista un patrón que se repita a través del tiempo, por lo que se puede decir que los errores son independientes.<br />Explicación de la variabilidad del modelo<br />H0 : β1 = 0<br />vs.<br />H1 : β1 ≠0<br />Estadístico de prueba<br />F = 1,33<br />Valor p = P(F1,118>1,33) > 0,15<br />Conclusión:<br />De acuerdo al valor p obtenido la hipótesis nula no se rechaza, por lo tanto existe evidencia de que β1 = 0.<br />Tabla XXVIII<br />Tabla ANOVA<br />FuenteGLSCCMFPRegresión139,1939,191,330,252Error residual1183486,6029,55Total1193525,79<br />Conclusión de la regresión:<br />Como podemos observar una vez realizado el análisis del modelo de regresión lineal entre diámetro y humedad, no existen las condiciones necesarias para aprobar dicho modelo, ya que los supuestos con los cuales partimos no son verdaderos como es el caso del error que no tiene distribución normal, y la varianza que no es constante. Además, el poder explicativo del modelo es apenas del 1,1% lo cual no disminuye significativamente la variabilidad de la respuesta.<br />De igual manera no se cumple la condición de que β1 sea diferente de cero, por lo que concluimos que el modelo de regresión lineal simple obtenido para explicar diámetro en función de humedad no es válido.<br />CONCLUSIONES<br />Después de realizar el análisis estadístico de cada una de las variables cuantitativas escogidas, logramos establecer que el producto rosquitas cumple con las especificaciones en cuanto a diámetro y humedad, situación que no ocurre con la variable peso.<br />Podemos concluir que la forma de las rosquitas no tiene efecto sobre ninguna de las variables estudiadas, ya que sin importar la forma el producto debe cumplir con las mismas especificaciones, y de hecho el producto cumple también con esta condición.<br />Logramos inferir acerca de la población mediante el estudio realizado en una muestra de dicha población, legando así a establecer con 95% de confianza los intervalos en los cuales se halla en promedio cada variable analizada.<br />Identificamos la distribución de una de las variables cuantitativas en estudio, humedad, la cual tiene una distribución normal con μ 3,85% y σ2 0,32.<br />Hallamos dependencia entre las variables diámetro y humedad, y de ellas podemos concluir que su dependencia no es lineal ya que el modelo de regresión lineal simple no se aplica a la dependencia de estas variables.<br />RECOMENDACIONES<br />Es importante que la muestra que se toma de la población sea representativa, ya que de esto depende que todos los análisis realizados sean confiables y por ende las conclusiones a las que se llegue sean las que mejor describen el verdadero comportamiento de la población<br />Los datos atípicos de las muestras pueden ser descartados al momento de realizar los cálculos, de tal manera que no afecten los valores obtenidos y se pueda tener una muestra más homogénea.<br />El empleo del software estadístico facilita los cálculos que se deben realizar, pero éste no brinda todas las opciones que se necesitan para el análisis, por lo que es necesario saber cómo se usan las tablas de distribuciones de variables aleatorias como la de Kolmogorov-Smirnov, las cuales se encuentran en los libros de Estadística.<br />BIBLIOGRAFIA<br />Zurita, Gaudencio. Probabilidad y Estadística, Fundamentos y Aplicaciones. Ediciones del Instituto de Ciencias Matemáticas ESPOL. 2008. Guayaquil, Ecuador.<br />Software: Microsoft Excel 2007<br /> Minitab 16<br />

×