Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

control estadistico de procesos-prueba de hipotesis

33,407 views

Published on

Published in: Education

control estadistico de procesos-prueba de hipotesis

  1. 1. 1 “PRUEBA DE HIPÓTESIS” CONTROL ESTADÍSTICO DE PROCESOS “PRUEBA DE HIPÓTESIS” IV – “A”
  2. 2. 2 “PRUEBA DE HIPÓTESIS” "AÑO DE LA PROMOCIÓN DE LA INDUSTRIA RESPONSABLE Y DEL COMPROMISO CLIMÁTICO" UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA” DE ICA FACULTAD DE ADMINISTRACIÓN “PRUEBA DE HIPÓTESIS” Curso : CONTROL ESTADÍSTICO DE PROCESOS Doctor : Dr. ORLANDO GABRIEL HERNÁNDEZ Año : IV - “A” Turno : MAÑANA Autores : CARRILLO MAMANI, GERALD FLORES JAUJE, LUIS HUARIPAUCAR GAMBOA, SONIA OCHOA SUAREZ, GIUSEPI 2014
  3. 3. 3 “PRUEBA DE HIPÓTESIS” INTRODUCCIÓN Es evidente que las distribuciones muestrales, vistas en el capítulo anterior, basadas en la teoría de la distribución normal, desarrollan un papel de gran importancia en la inferencia estadística. La inferencia estadística comprende dos partes principales, a saber: la estimación de parámetros y la prueba o docimasia de hipótesis. En este capítulo estudiaremos la segunda de ellas, con el fin de desarrollar métodos y observar su aplicación a problemas corrientes de la vida diaria. La inferencia estadística está basada en el supuesto de tomar muchas muestras, todas con igual probabilidad de ser seleccionadas y a través de una de ellas sabremos algo acerca de la población, mediante el cálculo de estimadores, que nos permitan hacer aseveraciones, incorrectas algunas veces, estableciéndose la probabilidad de error. Este método se basa en la aplicación de técnicas de muestreo, para lo cual se requiere de un buen diseño, además de la aplicación de métodos aleatorios de selección, cuando las probabilidades son iguales para cada elemento de una población. En algunos casos no requieren ser iguales, siempre que se conozcan y sean diferentes a cero. CONTENIDO  Conceptos generales, usos y procedimientos de aplicación.  Pruebas de hipótesis con aplicaciones en distribuciones de: Medias, Proporciones.  Teoría de las muestras pequeñas. Distribución “t” de Student.
  4. 4. 4 “PRUEBA DE HIPÓTESIS” Definición: Es un procedimiento para, a partir de una muestra aleatoria y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el valor de un parámetro desconocido de una población. Denominada también prueba de significación, tiene como objeto principal evaluar suposiciones evaluar suposiciones o afirmaciones acerca de los valores estadísticos de la población denominados parámetros. Hipótesis estadística: es un supuesto acerca de un parámetro o acerca de algún valor estadístico de una Población. Con ello encontramos que no todas las hipótesis son hipótesis estadísticas. Se debe tomar con referencia a un parámetro, ya sea una media aritmética, una proporción o varianza para que sea hipótesis estadística. Ejercicios: 1. Supongamos que se efectúan 100 lanzamientos de un amoneda y que se obtienen 60 caras (40 sellos). Vamos a probar la “legitimidad de la moneda” (que no esté cargada) tomando en cuenta que al lanzar 100 monedas, lo lógico sería que cayeran 50 caras y 50 sellos. Sin embargo, al realizar el experimento, encontramos que envés de obtener las 50 caras, se presentan 60; esta pequeña diferencia puede llevarnos a pensar, que la probabilidad de presentación de cara es mayor que la de sello, dicho en otras palabras que la moneda está cargada. Determinaremos en primer lugar la probabilidad de que se obtengan 60 caras o más. Una hipótesis estadística, también puede considerarse como la afirmación acerca de una característica ideal de una población sobre la cual hay inseguridad en el momento de formularla y que, a la vez es expresada de tal forma que puede ser rechazada
  5. 5. 5 “PRUEBA DE HIPÓTESIS” µ=np 𝜎 = √ 𝑛𝑝𝑞 µ = (1/2)100= 50 σ= √100 ( 1 2 ) ( 1 2 ) = √25 = 5 Al determinar la probabilidad de que en el lanzamiento de 100 monedas obtengamos 60 caras o más, utilizamos la distribución normal, como aproximación a la binomial. 𝑧 = 𝑥−𝜇 𝜎 = 59.5−50 5 = 1.9 El área es igual a 0.4713 0.5000- 0.4713 = 0.0287 p (x≥60)= 2.87% Se observa que la probabilidad de que se obtengan 60 caras o más, al lanzar 100 monedas, es de 2.87 % lo que se considera como una probabilidad muy pequeña. Se puede concluir: a. Que la hipótesis es cierta (la moneda es legitima) pero ha sucedido algo raro. b. La hipótesis no es correcta (luego la moneda no es legítima). La hipótesis puede ser formulada con el fin de rechazarla de acuerdo con el análisis estadístico. Esta clase de hipótesis se denomina hipótesis nula y se representa por 𝐻0. Se tiene también la hipótesis alternativa representada por 𝐻 𝑎: 𝜇 ≠ 50 (que el número de caras sea
  6. 6. 6 “PRUEBA DE HIPÓTESIS” mayor o menor de 50), es decir la moneda no es legítima o está cargada. Tipo de Error En la decisión anterior de aceptar o rechazar una hipótesis pueden cometerse dos tipos de error. a) Aceptar una moneda que es falsa (error tipo II). Aceptar las hipótesis cuando ha debido rechazarse. b) Rechazar una moneda que es verdadera (error tipo I). rechazar la hipótesis cuando ha debido aceptarse. Existen por lo tanto dos posibles decisiones: aceptar o rechazar la hipótesis, la que a la vez, puede ser cierta o falsa.
  7. 7. 7 “PRUEBA DE HIPÓTESIS” Tipos de Error Si se acepta una hipótesis verdadera la decisión es correcta. Si se acepta una hipótesis falsa. Cometemos error de tipo II. Si rechazamos una hipótesis verdadera, cometemos error tipo I. Si rechazamos una hipótesis falsa, la decisión es correcta. EJEMPLO: A. Supongamos que se detiene a una persona por robo y se le envía al juez quien podrá declararlo inocente o culpable. Al juez se les presenta los PRO Y los CONTRA y con base en toda la información, decide dejar libre o condenarlo. El juez no sabrá si hubo error en su decisión, solo lo podrá saber la persona que ha sido juzgada. D E C I S I O N E S Persona Juzgada Del Juez Inocente Error LIBRE CONDENADO ERROR CONDENADO ERROR DECISIÓN CORRECTA HIPOTESIS NULA y ALTERNATIVA Se ha dicho que una hipótesis estadística es un supuesto concerniente a los parámetros de la forma o la forma de distribución de probabilidad correspondiente a una o más poblaciones dadas. En otras palabras, se resumen diciendo que corresponde a un enunciado acerca del valor estadístico (parámetro poblacional baja). La hipótesis se debe formular en forma correcta o lógica y debe ser enunciada antes de obtener los datos muéstrales. Son ejemplos de hipótesis estadística: a) El promedio de calificación que tendrán los alumnos en mi curso de estadística será superior a 4.0. b) El 90% de mis estudiantes aprobaran el curso c) El 5% de las unidades producidas por una maquina serán defectuosas.
  8. 8. 8 “PRUEBA DE HIPÓTESIS” Hay dos tipos de hipótesis que se debe formular: la hipótesis nula simbolizada por 𝐻0 y la hipótesis alternativa por 𝐻 𝑎. La hipótesis nula es aquella por medio de la cual se hace una afirmación sobre un parámetro, que se va a constatar con el resultado muestrual. Cuando el fabricante dice que su producto tiene una duración de 5000 horas, se le considera como hipótesis nula, pues es lo que se quiere probar. La hipótesis alternativa, es toda aquella hipótesis que difiera de la hipótesis nula, es decir ofrece una alternativa afirmando que la hipótesis nula es falsa para ejemplo se podría decir que la hipótesis alternativa podría ser: a) El fabricante ha exagerado la duración de su producto (prueba unilateral a la izquierda) b) El producto tiene una duración superior al señalado por el fabricante (prueba unilateral la derecha) c) La duración del producto no es la señalada por el fabricante (prueba bilateral) Prueba unilateral y bilateral La prueba de hipótesis unilateral es aquella en la cual la zona de rechazo o zona crítica está completamente comprendida en unos de los extremos de la distribución. La prueba es unilateral a la derecha (de la curva); cuando la hipótesis alternativa de la que se quiere probar hace mención por ejemplo a los salarios que paga una empresa son mayores; que la calidad de un producto es superior; que el rendimiento académico es mejor, etc. Si, por contrario, la hipótesis alternativa se refiere a los salarios son inferiores que el producto es de menor de calidad que el rendimiento académico es bajo o que el productor exagera la duración del producto, etc.; corresponderá a una prueba unilateral a la izquierda. En el caso de que la prueba comprenda áreas o zona de rechazo y no en los extremos de la distribución, se dice que la prueba es bilateral asea que la hipótesis alternativa es diferente; por lo tanto se omiten los términos: superior, mayor, inferior, bajo, menor, etc.
  9. 9. 9 “PRUEBA DE HIPÓTESIS” Nivel de significación y puntos críticos Se entiende por nivel de significación, la máxima probabilidad de que especifique, con el fin de ser mínimo el primer tipo de error. Generalmente, esta probabilidad se fija antes de escoger la muestra. a) El nivel de significación de simboliza por alfa (α) siendo generalmente del 1%, 5% o 10%, pero se puede usar cualquier nivel dependiendo del tipo de investigación que se adelante. Existe la costumbre de trabajar con el nivel de 0.05 ósea del 5%, especialmente cuando el enunciado del problema no lo da. Cuando se trabaja con un nivel del 5% el resultado es significativo; si se emplea el 1%, el resultado. El valor del nivel de significación corresponde a un área bajo la curva de probabilidad o normal, denominada región critica o zona de rechazo. Se tendrán casos en que la región critica este situado a la derecha de la curva y se dirá que se trata de una docima unilateral. Si se sitúa a la izquierda será una docima unilateral hacia la izquierda. En caso de tener de tener dos regiones críticas, se hablara de una docima bilateral. En las docimas unilaterales se tomara el valor total de alfa; para las docimas bilaterales alfa se dividirá por dos. La región no sombreada o no cubierta por el nivel de significación se determinara zona de aceptación o de no rechazo. Grafica de regiones criticas a) Docima unilateral hacia la derecha con α = 0.05 b) Docima unilateral hacia la izquierda con α = 0.05 c) Docima bilateral con α = 0.05 Procedimiento a seguir en las pruebas hipótesis 1. Formular la hipótesis nula, y la alternativa 2. Seleccionar el nivel de significación 3. Conocer a estimar la varianza 4. Determinar la técnica y la prueba de estadística 5. Determinar los valores críticos y sus regiones de rechazo 6. Calcular los datos muestrales, utilizando las formulas correspondientes. 7. Tomar la decisión estadística.
  10. 10. 10 “PRUEBA DE HIPÓTESIS” Ampliaremos el resumen anterior; para ello se recomienda tener presente, además de los siguientes pasos, las alternativas que se dan para cada situación especial. 1.- Establecer las hipótesis Ho: hipótesis nula Ha: hipótesis alternativa a) En el caos de la moneda se podrían presentar las hipótesis de la siguientes formas: Ho: µ=50 Ho: µ= 50 Ho: µ=50 Ha: µ≠50 Ha: µ< 50 Ha: µ >50 (Docima Bilateral) (Docima Unilateral a la izquierda) (Docima Unilateral a la derecha) b) En el caso de una distribución de diferencias entre dos medias muestrales, puede plantearse, así: Ho: µx= µy Ho: µx= µy Ho: µx= µy Ha: µx≠ µy Ha: µx >µy Ha: µx < µy (Docima Bilateral) (Docima Unilateral a la izquierda) (Docima Unilateral a la derecha) c) En las proporciones se escribirá para cada caso, así: Ho: µp= 0.50 Ho: µp= 0.50 Ho: µp= 0.50 Ha: µp≠ 0.50 Ha: µp >0.50 Ha: µp<0.50 (Docima Bilateral) (Docima Unilateral a la izquierda) (Docima Unilateral a la derecha) d) Diferencias entre dos proporciones: Ho: µp1= µp1 Ho: µp1= µp1 Ho: µp1= µp1
  11. 11. 11 “PRUEBA DE HIPÓTESIS” Ha: µp2≠ µp2 Ha: µp2 >µp2 Ha: µp2< µp2 (Docima Bilateral) (Docima Unilateral a la izquierda) (Docima Unilateral a la derecha) 2.- Elegir riesgo α= % Los niveles de significación más utilizados son: a) α=0.05 ó 5% b) α= 0.01 ó 1% c) α= 0.10 ó 10% 3.- Se establecen riesgos supuestos a) La muestra es aleatoria. b) La población es normal. c) La varianza poblacional es conocida (en la mayoría de casos como no se conoce es estimada). 4.- Se formula la respectiva variante estadística. a) Distribución normal: 𝑍 = x−u 𝜎 b) Distribución de medias muestrales: 𝑧 = 𝑥̅ 𝜎/√ 𝑛 o 𝑧 = 𝑥̅−µ 𝑠/√ 𝑛 𝑐𝑢𝑎𝑛𝑑𝑜 𝑛 > 30 c) Distribución de proporciones muestrales: 𝑧 = 𝑝−𝑃 √ 𝑝𝑞 𝑛 siendo n>30 d) Distribución de diferencias entre dos medias muestrales: 𝑧 = (𝑥̅− 𝑦̅)−(𝜇𝑥−𝜇𝑦) √ 𝜎 𝑥 2 𝑛1 + 𝜎 𝑦 2 𝑛2 O 𝑧 = (𝑥̅− 𝑦̅)−(𝑢 𝑥−𝑢 𝑦) √ 𝑠 𝑥 2 𝑛1 + 𝑠 𝑦 2 𝑛2 (Siendo 𝑛1 y 𝑛2 mayores que 30) e) Distribución de diferencias entre dos proporciones muestrales:
  12. 12. 12 “PRUEBA DE HIPÓTESIS” 𝑧 = (𝑝1 − 𝑝2) − (𝜇 𝑝1 − 𝜇 𝑝2) √ 𝑝1 𝑞1 𝑛1 + 𝑝2 𝑞2 𝑛2 5.- Formular los puntos críticos Z1 y Z2 a) Al trabajar con un nivel de significación del 5% de docima bilateral, se obtendrá: 𝑧 𝑠=1.96 y 𝑧𝑖 = −1.96 b) Con el mismo nivel de significación y una docima unilateral: 𝑧 𝑠 = 1.64 si la prueba es hacia la derecha; 𝑧1 = −1.64, 𝑠𝑖 𝑙𝑎 𝑝𝑟𝑢𝑒𝑏𝑎 𝑠𝑒 ℎ𝑎𝑐𝑒 𝑎 𝑙𝑎 𝑖𝑧𝑞𝑢𝑖𝑒𝑟𝑑𝑎. 6.- Descripción de la región critica: (Bilateral con un α= 0.05) 𝑧 𝑠 ≥ 1.96 𝑧𝑖 ≤ 1.96 Docima unilateral a la izquierda 𝑧𝑖 < −1.64
  13. 13. 13 “PRUEBA DE HIPÓTESIS” Docima Unilateral a la derecha 𝑧 𝑠 < 1.64 7.- Se le dan valores a la variante estadística, con el fin de obtener el valor de Z. En el ejemplo de la moneda, se tiene que: 𝑧 = 59.5−50 5 = 1.9 8.- Adoptar una decisión, se acepta o se rechaza la hipótesis nula, al nivel de significación dado. Siguiendo el ejemplo, donde Z=1.9 y trabajando con una docima bilateral, además con un nivel de significación del 5% encontramos que 1. 9 se sitúa en la zona de aceptación, por lo tanto aceptamos la hipótesis nula (𝐻0: 𝜇 = 50), es decir, es legitima o correcta (no está cargada). En otras palabras la diferencia no es significativa. Pruebas cuando se conoce σ o la muestra es grande Recordemos que en los pasos que se han señalado para la realización de una prueba, se decía (paso 3), que la varianza es conocida; esto hace referencia a que se tiene información sobre la varianza poblacional (σ). En el supuesto de que no se conozca deberá ser sustituida por la varianza muestral, siempre y cuando el número de elementos que constituyen la muestra sea mayor de 30, la cual se considera como muestra grande. De todas formas el procedimiento y calculo será igual, conociendo o no la varianza o la desviación típica poblacional.
  14. 14. 14 “PRUEBA DE HIPÓTESIS” Prueba de hipótesis cuando se conoce y no se conoce el error estándar de la población σ, siendo n > 30 Recordemos que en los pasos que se han señalado para la realización de una prueba, se decía que la varianza es conocida, esto hace referencia a que se tiene información sobre la varianza poblacional (σ). En el supuesto de que no se conozca deberá ser sustituida por la varianza muestral, siempre y cuando el número de elementos que constituyen la muestra sea mayor a 30, la cual se considera como muestra grande. De todas formas el procedimiento y calculo será igual, conociendo o no la varianza o la desviación típica poblacional. Distribución de medias muéstrales Veamos algunos ejemplos, cuando se conoce la varianza poblacional y cuando es desconocida. Como orientación en este último caso, por lo general, después de señalar el tamaño de la muestra, y su media, vendrá la identificación de la desviación típica, evitando que se confunda la desviación o la varianza poblacional con la de la muestra. Ejemplos: 1. un inspector de calidad investiga las acusaciones contra una embotelladora por su deficiente llenado que debe ser, en promedio, de 32.5 onzas. Para ello toma una muestra de 60 botellas, encontrando que el contenido medio es de 31.9 onzas de líquido. Se sabe que la maquina embotelladora debe producir un llenado con una desviación típica de 3.6 onzas. ¿Puede el inspector llegar a la conclusión, a un nivel de significación del 5 %, que se está llenando las botellas por debajo de su especificación de contenido?
  15. 15. 15 “PRUEBA DE HIPÓTESIS” Datos Solución µ = 32.5 σ = 3.6 n = 60 𝑥̅ = 31.9 a) 𝐻0 : µ = 32.5 𝐻 𝑎 : µ < 32.5 b) α = 0.05 c) z = 31.9−32.5 3.6 √60 = -1.29 como -1.29 se sitúa en la zona de aceptación, es válida la hipótesis nula, lo cual significa que el inspector no debe llegar a la conclusión de que se esté llenando y vendiendo un producto por debajo de su especificación, al nivel del 5 % 2. un proceso está programado para empacar la cantidad, media, de una libra (16 onzas) de café. Se toma una muestra aleatoria de 36 paquetes; resulta una media de 14.2 onzas y desviación típica de 5.3 onzas. Al nivel del 5%, ¿se podrá afirmar que no se está cumpliendo con lo indicado en el empaque? Datos Solución µ = 16 n = 36 𝑥̅ = 14.2 S = 5.3 a) 𝐻0 : µ = 16 𝐻 𝑎 : µ ≠ 16 b) α = 0.05 c) z = 14.2−16 5.3 √36 ⁄ z=- 2.03 Al nivel del 5% se podrá afirmar que no se está cumpliendo con lo indicado por la fábrica por lo tanto aceptamos la hipótesis alternativa y rechazamos la hipótesis nula.
  16. 16. 16 “PRUEBA DE HIPÓTESIS” 3. Muchos años de experiencia en un examen de ingreso a la universidad en ingles arroja una calificación promedio de 64, con una desviación estándar de 8. Todos los estudiantes de cierta ciudad, en la cual existen 64, han obtenido una calificación promedio de 68. ¿Puede tener la certeza de que los estudiantes de esta ciudad son superiores en inglés? Datos Solución µ = 64 σ = 8 n = 64 𝑥̅ = 68 a) 𝐻0 : µ = 64 𝐻 𝑎 : µ > 64 b) α = 0.05 c) z = 68−64 8 64 = 4 Z = 4 se ubica en la zona de rechazo por lo tanto puede tenerse la certeza, con un nivel de significación del 5 % que los estudiantes de esta ciudad son superiores en inglés.
  17. 17. 17 “PRUEBA DE HIPÓTESIS” 4. Docimar la hipótesis de que la distancia media requerida para poder detener un automóvil que va a 20 km/h. es de 25 metros. Con base en una muestra de 100 conductores se obtiene que la distancia media es de 𝑥̅ = 27.3 metros, con una desviación estándar s = 2.1 metros. Utilizar un nivel de significación del 5 %. Datos Solución µ = 25 α = 0.05 n = 100 𝑥̅ = 27.3 S = 2.1 a) 𝐻0 : µ = 25 𝐻 𝑎 : µ ≠ 25 b) α = 0.05 c) 𝑧 = 27.3−25 2.1 √100 = 10.95 La distancia media requerida es diferente a 25 mts, al nivel del 5%
  18. 18. 18 “PRUEBA DE HIPÓTESIS” 5. Cuatrocientos estudiantes, elegidos aleatoriamente se someten a un “test” de rendimiento, obteniéndose los siguientes resultados: 𝑥̅ = 76 y s = 16, con base en esta información docimar la hipótesis µ = 74 frente a la alternativa µ ≠ 74, al nivel del 1 %. Datos Solución n = 400 𝑥̅ = 76 S = 16 a) 𝐻0 : µ = 74 𝐻 𝑎 : µ ≠ 74 b) α = 0.01 c) Z = 76−74 16 √400 = 2.5 Se ubica en la zona de aceptación; aceptamos que µ = 74, al nivel del 1 %
  19. 19. 19 “PRUEBA DE HIPÓTESIS” 6. Una encuesta revela que los 100 autos particulares, que constituyen una muestra aleatoria, se condujeron a un promedio de 12,500 km. Durante un año, con una desviación estándar de 2400 km. Con base en esta información, docimar la hipótesis donde, en promedio, los autos particulares se condujeron a 12,000 km durante un año, frente a la alternativa de que el promedio sea superior. Utilizar el nivel de significación del 5%. Datos Solución n = 100 𝑥̅ = 12,500 S = 2,400 a) 𝐻0 : µ = 12,000 𝐻 𝑎 : µ > 12,000 b) α = 0.05 c) z = 12,500−12,000 2,400 √100 = 2.083 rechazamos la hipótesis de que µ = 12,000, luego aceptamos que los autos se condujeron durante un nivel superior en ese año, al nivel del 5%
  20. 20. 20 “PRUEBA DE HIPÓTESIS” 7. Una fábrica de cuerdas ha establecido con base en una experiencia de muchos años, que las cuerdas tienen una fuerza de ruptura de 15.9 libras, con una desviación estándar de 2.3 libras. Se efectúa un cambio en el proceso de fabricación, y se obtiene una muestra de 64 artículos cuya fuerza media de ruptura es de 15.0 libras. ¿Debe considerarse que el nuevo proceso tiene un efecto significativo negativo a la resistencia de las cuerdas? Datos Solución µ = 15.9 σ = 2.3 n = 64 𝑥̅ = 15 a) 𝐻0 : µ = 15.9 𝐻 𝑎 : µ < 15.9 b) α = 0.05 c) Z = 15−15.9 2.3 √64 = - 3.13 Se ubica en la región de rechazo, por lo tanto aceptamos que el nuevo proceso tiene un efecto significativo negativo, respecto a la resistencia de las cuerdas, al nivel del 5%
  21. 21. 21 “PRUEBA DE HIPÓTESIS” 8. Los salarios diarios en una sector de la industria están distribuidos normalmente con una media de $ 13,200 y una desviación estándar de $ 2,500. Si una empresa del sector, que cuenta con 40 obreros, paga, en promedio, $ 12,200, ¿puede decirse que esta compañía paga salarios inferiores al nivel de significación del 1%? Datos Solución µ = 13,200 σ = 2,500 n = 40 𝑥̅ = 12,200 a) 𝐻0 : µ = 13,200 𝐻 𝑎 : µ < 13,200 b) α = 0.01 c) z = 12,200 − 13,200 2,500 √40 = − 1,000 2,500 6.33 = -2.53 Se ubica en la región de rechazo, por lo tanto, se puede decir que la compañía paga salarios inferiores, al nivel del 1%
  22. 22. 22 “PRUEBA DE HIPÓTESIS” 9. Un distribuidor de botas especiales de trabajo le garantiza al jefe de una empresa que el promedio de duración de las botas es de 8 meses con una desviación típica de mes y medio. El cliente de la empresa decide comprar 36 pares de botas, que en promedio duran 8 meses 10 días. ¿Tiene razón el fabricante con un nivel de significación del 5%? Datos Solución µ = 8 σ = 1.5 n = 36 𝑥̅ = 8.33 a) 𝐻0 : µ = 8 𝐻 𝑎 : µ ≠ 8 b) α =0.05 c) z = 8.33−8 1.5 √36 = 0.33 (6) 1.5 = 1.32 Aceptamos que el fabricante tiene razón, al nivel del 5%
  23. 23. 23 “PRUEBA DE HIPÓTESIS” 10.- un fabricante de aparatos de calefacción, tiene un proveedor que le suministra ciertos componentes, que tienen como especificación una resistencia de 400 °C al calor. El fabricante realiza una selección al azar de 64 de dichos componentes y comprueba que si resistencia media al calor es de 395 °C, con desviación estándar de 20 °C. ¿Puede llegar a la conclusión de que su proveedor no sostiene las especificaciones acordadas, a un nivel de significación del 5%? Datos Solución µ = 400 α = 0.05 n = 64 𝑥̅ = 395 S = 20 a) 𝐻0 : µ = 400 𝐻 𝑎 : µ ≠ 400 b) Z = 395−400 20 √64 = - 2 El proveedor no sostiene las especificaciones acordadas, al nivel del 5%
  24. 24. 24 “PRUEBA DE HIPÓTESIS” 𝑧 = 𝑝 − 𝑃 √ 𝑝𝑞 𝑛 Distribución de proporciones Los procedimientos de decisión de las proporciones son similares a los ya indicados para las medias, salvo que por lo general la desviación típica y por ende el error estándar de la proporción se calcula con datos obtenidos en la muestra, la cual debe tener, en este, caso más de 30 elementos. Su fórmula: 1.-Por estadística que se tienen, se ha podido establecer que por lo menos el 40% de los jóvenes toman regularmente coca- cola, cuando tiene sed. Una muestra aleatoria de 450 jóvenes revelo que 200 de ellos solían tomar dicha bebida, cuando tenían sed. ¿Cuál podría ser su conclusión al nivel del 1%, acerca de lo que muestran las estadísticas? Datos Solución p =200/450 = 44% n = 450 q = 250/450 = 0.56 a) 𝐻0: 𝑃 = 0.40 𝐻1: 𝑃 ≠ 0.40 b) α = 0.01 𝑍 = 0.44 − 0.40 √0.44(0.56) 450 = 1.71
  25. 25. 25 “PRUEBA DE HIPÓTESIS” z= 1.71 se ubica en la zona de aceptación, luego al nivel del 5%, la conclusión a que se llega, es la de aceptar el 40% que arrojan las estadísticas; por lo tanto no hay razón para rechazarlas. 2.-una empresa al seleccionar su personal lo somete a un curso de entrenamiento. Por experiencia, el 76% de los aspirantes aprueban el curso. Se efectúan en el programa para la cual se inscriben 40 y aprueban 24. ¿Podría afirmarse que los cambios introducidos reducen la selección? 1% Datos Solución n = 40 p = 24/40 = 0.60 q = 0.40 a) 𝐻0: 𝑃 = 0.76 𝐻1: 𝑃 < 0.76 b) α = 0.01 c) 𝑧 = 0.60−0.76 √ (0.6)(0.4) 40 = -2.07 Como -2.07 cae en la región de aceptación, no reducen la selección los cambios introducidos, al nivel del 1%
  26. 26. 26 “PRUEBA DE HIPÓTESIS” 3.- el fabricante de cierto producto estima tener el 50% del mercado de la categoría del producto. Al realizar un sondeo en una muestra probabilística de 400 consumidores de la categoría del producto, 180 de ellos indicaron ser consumidores. ¿Es correcta la estimación hacha por el fabricante? (5 %) Datos Solución P = 0.50 n = 400 p = 0.45 α = 0.05 a) 𝐻0: 𝑃 = 0.50 𝐻1: 𝑃 ≠ 0.50 b) 𝑧 = 0.45− 0.50 √ (0.45)(0.50) 400 = −2 No es correcta la estimación hecha por el fabricante, al nivel del 5%
  27. 27. 27 “PRUEBA DE HIPÓTESIS” 4.- por evidencia experimental se sabe que cierta droga pediátrica es eficaz en un 80% de los casos, cuando está correctamente administrada. Se aplica dicha droga a 400 niños y se obtienen únicamente 300 resultados positivos. ¿Puede considerarse este resultado como evidencia de que la droga no estuvo bien administrada? (1%) Datos Solución P = 0.80 n = 400 p = 0.75 α = 0.01 a) 𝐻0: 𝑃 = 0.80 𝐻1: 𝑃 < 0.80 b) 𝑧 = 0.75−0.80 √ (0.75)(0.25) 400 = −2.27 Este resultado si puede ser considerado como evidencia de que la droga estuvo bien administrada, al nivel del 1%
  28. 28. 28 “PRUEBA DE HIPÓTESIS” TABLA DE DISTRIBUCIÓN “t” DE STUDENT Grados de libertad Nivel de significación para pruebas de una cola 0.25 0.10 0.05 0.025 0.01 0.005 Nivel de significación para pruebas de dos colas 0.50 0.20 0.10 0.05 0.02 0.01 1 2 3 4 5 1.0000 0.8165 0.7649 0.7407 0.7267 3.0777 1.8856 1.6377 1.5332 1.4759 6.3138 2.9200 2.3534 2.1318 2.0150 12.7062 4.3027 3.1824 2.7764 2.5706 31.8207 6.9646 4.5407 3.7469 3.3649 63.6574 9.9248 5.8409 4.6041 4.0322 6 7 8 9 10 0.7176 0.7111 0.7064 0.7027 0.6998 1.4398 1.4149 1.3968 1.3830 1.3722 1.9432 1.8946 1.8595 1.8331 1.8125 2.4469 2.3646 2.3060 2.2622 2.2281 3.1427 2.9980 2.8965 2.8214 2.7638 3.7074 3.4995 3.3554 3.2498 3.1693 11 12 13 14 15 0.6974 0.6955 0.6938 0.6924 0.6912 1.3634 1.3562 1.3502 1.3450 1.3406 1.7959 1.7823 1.7709 1.7613 1.7531 2.2010 2.1788 2.1604 2.1448 2.1315 2.7181 2.6810 2.6503 2.6245 2.6025 3.1058 3.0545 3.0123 2.9768 2.9467 16 17 18 19 20 0.6901 0.6892 0.6884 0.6876 0.6870 1.3368 1.3334 1.3304 1.3277 1.3253 1.7459 1.7396 1.7341 1.7291 1.7247 2.1199 2.1098 2.1009 2.0930 2.0860 2.5835 2.5669 2.5524 2.5395 2.5280 2.9208 2.8982 2.8784 2.8609 2.8453 21 22 23 24 25 0.6864 0.6858 0.6853 0.6848 0.6844 1.3232 1.3212 1.3195 1.3178 1.3163 1.7207 1.7171 1.7139 1.7109 1.7081 2.0796 2.0739 2.0687 2.0639 2.0595 2.5177 2.5083 2.4999 2.4922 2.4851 2.8314 2.8188 2.8073 2.7969 2.7874 26 27 28 29 30 0.6840 0.6837 0.6834 0.6830 0.6828 1.3150 1.3137 1.3125 1.3114 1.3104 1.7056 1.7033 1.7011 1.6991 1.6973 2.0555 2.0518 2.0484 2.0452 2.0423 2.4786 2.4727 2.4671 2.4620 2.4573 2.7787 2.7707 2.7633 2.7564 2.7500 40 0.6807 1.3031 1.6839 2.0211 2.4233 2.7045 60 0.6786 1.2958 1.6706 2.0003 2.3901 2.6603 120 0.6765 1.2886 1.6577 1.9799 2.3578 2.6174  0.6745 1.2816 1.6449 1.9600 2.3263 2.5758
  29. 29. 29 “PRUEBA DE HIPÓTESIS” Distribución de las medias muestrales Cuando el problema de la desviación típica muestral y el tamaño de la muestra es menor o igual a 30 (n ≤ 30), se considera que esta sin corregir, procediendo a su corrección, para ser aplicada en la variante estadística “t”. Simbolicemos a 𝑆̂ (desviación típica sin corregir) y S (desviación típica corregida). 𝑠 = 𝑠̂√ 𝑛 𝑛 − 1 𝑠 = √ ∑(𝑥1 − 𝑥̅)2 𝑛 − 1 = √ ∑ 𝑥𝑖 2 − 𝑛𝑥̅2 𝑛 − 1 También se le puede corregir directamente, al calcular la variante estadística: 𝑡 = 𝑥̅ − 𝜇 𝑠̂ √ 𝑛 − 1 Ejemplo: 1. Una muestra de 25 observaciones tiene una media de 42.0 y una desviación de 8. Trabajando con un nivel de significación del 1%. ¿existe razón para rechazar la hipótesis de que la media de la población es 46.0? Datos: Solución: n =25 𝑥̅=42 𝜇=46 ŝ = 8 𝛼 = 0.01 𝐻0 : 𝜇 𝑥 = 46 𝐻 𝑎 : 𝜇 𝑥 ≠ 46 𝑡 = 𝑥̅ − 𝜇 𝑠̂ √ 𝑛 − 1
  30. 30. 30 “PRUEBA DE HIPÓTESIS” 𝑡 = 42 − 46 8 √25 − 1 t = - 4 8 √24 t = -2.45 gl= n-1=25-1=24 Tabla “t” => 2.7969 Respuesta: Se acepta la hipótesis de que 𝜇= 46, es decir, no existe razón para rechazar, que la media de la población es 46, al nivel de confianza del 1%.  Es necesario observar que si el nivel de significación, como en este ejemplo, es de 𝛼=0.01, se tomara el mismo nivel para cada una de las zonas críticas (zona de rechazo) tal como aparece en la tabla donde dice “nivel de significación para pruebas de dos colas”  En caso de que sea de una cola, suponiendo que 𝛼=0.05, debe observarse, en la tabla, donde dice, “nivel de significación para pruebas de una cola”, es decir, debe corresponder al doble para pruebas de dos colas, así que a pesar de ser 𝛼=0.05, se está trabajando con 𝛼=0.10.
  31. 31. 31 “PRUEBA DE HIPÓTESIS” 2. Una inspectora de calidad, investiga las acusaciones contra una fábrica de cerveza, porque no llena bien sus envases, afirmando que contienen 35 onzas de líquido. Se muestrearon 28 latas de cerveza, encontrando un contenido medio de 33.2 onzas, con una desviación estándar de 2.2 onzas. ¿Debe la inspectora llegar a la conclusión, al nivel del 5%, que se está exagerando su contenido? Datos: Solución: n = 28 𝑥̅ = 33.2 ŝ = 2.2 u = 35 𝛼 = 0.05 𝐻0 : 𝜇 𝑥 = 35 𝐻 𝑎 : 𝜇 𝑥 < 35 𝑡 = 𝑥̅ − 𝜇 𝑠̂ √ 𝑛 − 1 𝑡 = 32.2 − 35 2.2 √28 − 1 t = - 2.8 2.2 √27 t = -4.25 gl= n-1=28-1=27 Tabla “t” => 1.703 Obsérvese como se tiene el valor del punto crítico, siendo 𝛼 = 0.05 (nivel de significación), localizamos el 0.05 donde dice la prueba de una sola cola, y encontramos que equivale al 10%, en las pruebas de dos colas, es decir el doble, por lo tanto siendo el grado de libertad de 27 y el punto crítico del 0.10 será de 1.703 y como se localiza a la izquierda se le da signo negativo. Respuesta: Al nivel del 5%, el inspector si puede llegar a la conclusion de que se esta exagerando el llenado
  32. 32. 32 “PRUEBA DE HIPÓTESIS” 3. Un fabricante desea hacer, a fin de aumentar sus ventas, que el contenido de nicotina de sus cigarrillos tiene un promedio inferior a los 22mg. Una oficina gubernamental de salud y del medio ambiente, realiza un análisis de 10 cigarrillos y obtiene los contenidos de nicotina para cada uno, siendo de: 21, 24, 18, 16, 22, 23, 20, 20, 24, 16. a. ¿tiene justificación lo aseverado por el fabricante? b. ¿Cuándo cometería un error de tipo 1? Datos: Solución: n=10 𝑥̅ = ∑ 𝑥𝑖 𝑛 = 204 10 = 20.4 𝜇 = 22 𝛼 = 0.05 𝐻0 : 𝜇 = 22 𝐻 𝑎 : 𝜇 < 22 s = √ 𝜮 𝒙 𝒊 𝟐 − 𝒏𝒙̅ 𝟐 𝒏−𝟏 𝑠 = √ 4242 − 10 (20.4)² 10 − 1 𝑠 = √ 4242 − 10 (16.16) 9 S= 2.99 t = 𝑥̅–𝑢 𝑆 √ 𝑛 t = 20.4 − 22 2.99 √10 t= −1.6 0.9455210204 t=-1.69 gl= n-1=10-1=9 𝛼 = 0.10 Tabla “t” => 1.833 a) No hay justificacion al nivel del 5%. b) Aceptar que u=22 mg, cuando el contenido de nicotina es en realidad diferente.
  33. 33. 33 “PRUEBA DE HIPÓTESIS” DISTRIBUCIÓN DE UNA PROPORCIÓN MUESTRAL El proceso a seguir, en la correccion de la desviacion típica de una proporcion, al realizar una prueba de hipotesis, consiste en trabajar con n-1, es decir, se resta 1 al tamano de la muestra, lo demas es igual a lo visto hasta el momento para distribuciones de medias proporcionales. La formula a utilizar es: t = 𝒑 − 𝑷 √ 𝒑.𝒒 𝒏 − 𝟏
  34. 34. 34 “PRUEBA DE HIPÓTESIS” EJEMPLOS: 1. Se dice con frecuencia que la proporción de funcionarios públicos que tienen el hábito de fumar en horas de trabajo es del 42%. La oficina gubernamental de salud desea realizar una campaña a fin de disminuir este porcentaje, para ello debe comprobar ese porcentaje, así que decide realizar una investigación por muestreo a 25 funcionarios encontrando que 13 de ellos fuman. ¿Al nivel del 1% la oficina puede aceptar el porcentaje del 42% como indicador? DATOS: SOLUCIÓN: 𝝁 𝒑 = 𝑷 = 𝟒𝟐% p = 13 25 = 0.52 n =25 𝛼 = 0.01 𝐻0: 𝜇 𝑝=0.42 𝐻 𝑎: 𝜇 𝑝 ≠0.42 t = 𝒑 − 𝑷 √ 𝒑.𝒒 𝒏 − 𝟏 t = 0.52 − 0.42 √ 0.52 . (0.48) 25 − 1 t = 0.1 √ 0.2496 24 t = 0.1 0.1019803903 t= 0.98 gl= n-1=25-1=24 𝛼 = 0.01 Tabla “t” => 2.797 Respuesta: Si hay razon para aceptar el % de 42, como indicador de fumadores en horas de trabajo, al nivel del 1%.
  35. 35. 35 “PRUEBA DE HIPÓTESIS” 2. El distribuidor de una maquina afirma que el máximo de elementos defectuosos por hora que presente su funcionamiento es del 3%. En una determinada hora, se toman como muestra 20 artículos producidos, los que a su vez son sometidos a control, encontrando un artículo defectuoso. ¿Al nivel del 5% se podrá decir que el % de defectuosos es superior al señalado por el distribuidor? DATOS: SOLUCIÓN: 𝝁 𝒑 = 𝑷 = 𝟑% p = 1 20 = 0.03 n =20 𝛼 = 0.05 𝐻0: 𝜇 𝑝=0.03 𝐻 𝑎: 𝜇 𝑝>0.03 t = 𝒑 − 𝑷 √ 𝒑.𝒒 𝒏 − 𝟏 t = 0.05 − 0.03 √ 0.05 (0.95) 20 − 1 t = 0.02 √ 0.0475 19 t = 0.02 0.05 t= 0.4 gl= n-1=20-1=19 𝛼 = 0.1 Tabla “t” =>1.729 Respuesta: No se puede concluir que el porcentaje de defectuosos sea superior al señalado por el distribuidor, al nivel del 5%.
  36. 36. 36 “PRUEBA DE HIPÓTESIS” CONCLUSIÓN Si se condensan los resultados hasta aquí obtenidos, a manera de conclusiones se puede abordar, que todo problema de prueba de hipótesis consiste en lo siguiente: 1. Identificar una variable aleatoria X que tiene una distribución conocida, es decir, que pertenece a una clase determinada, por ejemplo a las del tipo normal, y con relación a la cual se quiere tomar una decisión respecto al valor de un parámetro desconocido, pero asociado a ella. 2. Se plantea una hipótesis nula, donde se asume un valor para el parámetro; y una hipótesis alternativa donde se contradice lo expresado en la hipótesis nula. 3. Se escoge el nivel de significación a, que es la probabilidad de rechazar la hipótesis nula siendo esta cierta. 4. Se selecciona una muestra de tamaño n para estimar el parámetro desconocido y poder posteriormente decidir si se rechaza o no H0. 5. Se define la región crítica para la prueba de hipótesis de interés. 6. Se toma la decisión de rechazar H0, con un nivel de significación a si el valor estimado del parámetro está en la región crítica y de no rechazar Ho si este valor no está en la región crítica.
  37. 37. 37 “PRUEBA DE HIPÓTESIS” RECOMENDACIÓN  Se recomienda usar las tablas de distribución. BIBLIOGRAFÍA  CIRO MARTÍNEZ BENCARDINO: ESTADÍSTICA Y MUESTREO AÑO 2008. EDICIÓN 2/R ACT UALIZADA EDICIONES ECOE.

×