Your SlideShare is downloading. ×
Prueba de hipótesis
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Prueba de hipótesis

7,292
views

Published on


0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
7,292
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
162
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOPRUEBA DE HIPÓTESIS La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una población. Sin embargo es frecuente que usemos la información de una muestra para probar un reclamo o conjetura sobre la población. El reclamo o conjetura se refiere a una hipótesis. El proceso que corrobora si la información de una muestra sostiene o refuta el reclamo se llama prueba de hipótesis.HIPÓTESIS Y NIVELES DE SIGNIFICANCIA En la prueba de hipótesis se pone a prueba un reclamo hecho sobra la naturaleza de una población a base de la información de una muestra. El reclamo se llama hipótesis estadística. Hipótesis Estadística: Una hipótesis estadística es un reclamo hecho sobre la naturaleza de una población. Por ejemplo, la premisa formulada por un productor de baterías para autos de que su batería dura en promedio 48 meses, es una hipótesis estadística porque el manufacturero no inspecciona la vida de cada batería que él produce. Si surgieran quejas de parte de los clientes, entonces se pone a prueba el reclamo del manufacturero. La hipótesis estadística sometida a prueba se llama la hipótesis nula, y se denota como H0.COMO ESTABLECER LA HIPÓTESIS NULA Y LA ALTERNA Hipótesis Nula (H0): premisa, reclamo, o conjetura que se pronuncia sobre la naturaleza de una o varias poblaciones. Por ejemplo, para probar o desaprobar el reclamo pronunciado por el productor de baterías debemos probar la hipótesis estadística de que 48. Por lo tanto, la hipótesis nula es: H0 : 48. Luego se procede a tomar una muestra aleatoria de baterías y medir su vida media. Si la información obtenida de la muestra no apoya el reclamo en la hipótesis nula (H0), entonces otra cosa es cierta. La premisa alterna a la hipótesis nula se llama hipótesis alterna y se representa por H1. Hipótesis Alterna: Una premisa que es cierta cuando la hipótesis nula es falsa. Por ejemplo, para el productor de baterías H0 : 48 y H1 : < 48 Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula la información, como el promedio, la proporción, etc. Esta información muestral se llama estadística de prueba. Estadística de Prueba: Una estadística de prueba se basa en la información de la muestra como la media o la proporción.ERROR TIPO 1 Y ERROR TIPO 2 A base de la información de una muestra nosotros podemos cometer dos tipos de errores en nuestra decisión. 1. Podemos rechazar un H0 que es cierto.
  • 2. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO 2. Podemos aceptar un H0 que es falso. El primero se llama error Tipo 1 Error Tipo 1: Cuando rechazamos una Hipótesis Nula que es cierta cometemos error tipo 1. Y el segundo error se llama error Tipo 2. Error Tipo 2: Cuando aceptamos una Hipótesis Nula que es falsa cometemos error tipo 2.NIVEL DE SIGNIFICANCIA ( ) Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de rechazar H0, denotada por . A ésta se le llama nivel de significancia. Nivel de Significancia: La probabilidad ( más alta de rechazar H0 cuando H0 es cierto se llama nivel de significancia. Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeño de . Usando un valor preasignado de se construye una región de rechazo o región crítica en la curva normal estándar o en la curva t que indica si debemos rechazar H0. Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la curva de z o de la curva t donde se rechaza H0. La región puede ser de una cola o de dos dependiendo de la hipótesis alterna.Ejemplos Para H1: > valor aceptado, la región de rechazo está dada por: (cola derecha, z ó t) Para H1 : < valor aceptado, la región de rechazo está dada por: (cola izquierda, z ó t) Para H1 : valor aceptado, la región de rechazo es de dos colas y está dada por: (2-colas, z ó t) /2 /2Ejemplo 1: Determine si la región de rechazo es de la cola derecha, de la cola izquierda o de dos colas. a. H0 : = 15, H1 : 15, =.05 b. H0 : p 0.7, H1 : p > 0.7, =.02
  • 3. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOSolución: La forma de la región de rechazo está determinada por la hipótesis alterna. a. H1 : 15 significa que la región está en ambas colas. .05/2 .05/2 b. H1 : p > 7 significa que la región está en la cola derecha. .02Ejemplo 2: En el Ejemplo 1a, presumamos que la región de rechazo es parte de la curva normal estándar. Complete el dibujo de la región crítica para los valores siguientes: a. = .05Solución: a. Del ejemplo 1(a), tenemos: De la tabla de la distribución normal, .05/2=0.025 .05/2=0.025 la P(Z z) =.025 corresponde a un valor Z= -1.96. Por simetría la -1.96 1.96 P(Z>z)=.025 corresponde a Z= 1.96.Ejemplo 3: En el ejemplo 1a, presumamos que la región de rechazo es parte de la curva t. Complete el dibujo de la región de rechazo para: a. = .05 y = 14Solución: a. Del ejemplo 1(a), = .05, y = 14, tenemos: De la tabla de la distribución t, la .05/2=0.025 .05/2=0.025 P(T t) =.025 corresponde a un valor t= -2.086. Por simetría la -2.086 2.086 P(T>t)=.025 corresponde a t= 2.086.Ejemplo 4: Establezca las hipótesis nula y alterna. a. Las millas por galón (mpg) promedio de un nuevo modelo de automóvil es 32. b. Más del 65% de los empleados de un colegio aportan a Fondos Unidos. c. En promedio, los empleados de cierta compañía viven a no más de 15 millas de la misma.
  • 4. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO d. Al menos un 60% de la población adulta de una comunidad votará en las próximas elecciones Presidenciales. e. El peso promedio de un pollo para asar es de al menos cuatro libras.Solución: a. H0 : = 32 b. H0 : p .65 c. H0 : 15 H1 : 32 H1 : p .65 H1 : > 15 d. H0 : p .6 e. H0 : 4 H1 : p < .6 H1 : <4EJERCICIOS En los ejercicios (1-6) determine si la región de rechazo para la hipótesis nula está en la cola izquierda, en la cola derecha, o ambas colas. Para el nivel de significancia dibuje la región de rechazo. 1. H0 : 11; H1 : > 11 2. H0 5.8; H1 : < 5.8 3. H0 : p = 0.4; H1 : p 0.4 4. H0 : = 110; H1 : 110 5. H0 : p 0.3; H1 : p < 0.3 6. H0 : p 0.8; H1 : p < 0.8 En los ejercicios (7 - 18) complete la región de rechazo (encuentre el valor de z y t). 7. a) z, si = .05 b) t, si = .025 y =9 8. a) z, si = .01 b) t, si = .05 y = 13 9. a) z, si = .02 b) t, si = .01 y =5 10. a) z, si = .025 b) t, si = .01 y =9 11. a) z, si = .05 b) t, si =.05 y = 10 /2 /2
  • 5. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO 12. a) z, si = .01 b) t, si =0.1 y =7 /2 /2 En los ejercicios (13 - 18) establezca las hipótesis nula y alterna. 13. Los automóviles estacionados en el estacionamiento de periodo prolongado del aeropuerto internacional de Bogotá permanecen un promedio de 2.5 días. 14. Una nueva marca de llantas radiales dura en promedio más de 48,000 millas. 15. El balance promedio de una cuenta de cheques en el First State Bank es de al menos $150 dólares. 16. Se reclama que al menos el 60% de las compras realizadas en cierta tienda por departamentos son artículos de especiales. 17. Se reclama que el 20% de los graduados de cierto colegio privado solicitan admisión a escuelas de medicina. 18. Un dentista reclama que el 5% de sus pacientes sufren enfermedades en las encías. PRUEBA DE HIPÓTESIS PARA UNA MUESTRAINTRODUCCIONDentro del estudio de la inferencia estadística, se describe como se puede tomar una muestraaleatoria y a partir de esta muestra estimar el valor de un parámetro poblacional en la cual se puedeemplear el método de muestreo y el teorema del valor central lo que permite explicar cómo a partirde una muestra se puede inferir algo acerca de una población, lo cual nos lleva a definir y elaboraruna distribución de muestreo de medias muestrales que nos permite explicar el teorema del límitecentral y utilizar este teorema para encontrar las probabilidades de obtener las distintas mediasmaestrales de una población.Pero es necesario tener conocimiento de ciertos datos de la población como la media, la desviaciónestándar o la forma de la población, pero a veces no se dispone de esta información.En este caso es necesario hacer una estimación puntual que es un valor que se usa para estimar unvalor poblacional. Pero una estimación puntual es un solo valor y se requiere un intervalo de valoresa esto se denomina intervalo de confianza y se espera que dentro de este intervalo se encuentre elparámetro poblacional buscado. También se utiliza una estimación mediante un intervalo, el cual esun rango de valores en el que se espera se encuentre el parámetro poblacionalEn nuestro caso se desarrolla un procedimiento para probar la validez de una aseveración acerca deun parámetro poblacional este método es denominado Prueba de hipótesis para una muestra.HIPOTESIS Y PRUEBA DE HIPOTESISTenemos que empezar por definir que es una hipótesis y que es prueba de hipótesis.Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba, paraverificar si la afirmación es razonable se usan datos.En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacenlas pruebas para verificar la aseveración o para determinar que no es verdadera.Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría deprobabilidad; se emplea para determinar si la hipótesis es una afirmación razonable.
  • 6. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOPrueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso:Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis,pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística noproporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá deuna duda razonable. Analizaremos cada paso en detalleObjetivo de la prueba de hipótesis.El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral),sino hacerun juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado delparámetro.Procedimiento sistemático para una prueba de hipótesis de una muestraPaso 1: Plantear la hipótesis nula Ho y la hipótesis alternativa H1.Cualquier investigación estadística implica la existencia de hipótesis o afirmaciones acerca de laspoblaciones que se estudian.La hipótesis nula (Ho) se refiere siempre a un valor especificado del parámetro de población, no a unaestadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por logeneral hay un "no" en la hipótesis nula que indica que "no hay cambio" Podemos rechazar o aceptarHo.La hipótesis nula es una afirmación que no se rechaza a menos que los datos maestralesproporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siemprecontiene un signo de igualdad con respecto al valor especificado del parámetro.La hipótesis alternativa (H1) es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmaciónque se acepta si los datos maestrales proporcionan evidencia suficiente de que la hipótesis nula esfalsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesisalternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.Paso 2: Seleccionar el nivel de significancia.Nivel de significancia: Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denotamediante la letra griega α, también es denominada como nivel de riesgo, este término es másadecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera.Este nivel esta bajo el control de la persona que realiza la prueba.Si suponemos que la hipótesis planteada es verdadera, entonces, el nivel de significación indicará laprobabilidad de no aceptarla, es decir, estén fuera de área de aceptación. El nivel de confianza(1-α), indica la probabilidad de aceptar la hipótesis planteada, cuando es verdadera en la población.
  • 7. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOLa distribución de muestreo de la estadística de prueba se divide en dos regiones, una región derechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística deprueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula.La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba queno tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores noson tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de norechazo de la de rechazo.Tipos de erroresCualquiera sea la decisión tomada a partir de una prueba de hipótesis, ya sea de aceptación de la Ho ode la H1, puede incurrirse en error:Un error tipo I se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía seraceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa αUn error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando dehecho es falsa y debía ser rechazada.En cualquiera de los dos casos se comete un error al tomar una decisión equivocada.En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y lasconsecuencias posibles.Tabla 1. Consecuencias de las Decisiones en Pruebas de Hipótesis. Situaciones Posibles Decisiones Posibles La hipótesis nula es verdadera La hipótesis nula es falsa Aceptar la Hipótesis Nula Se acepta correctamente Error tipo II Rechazar la Hipótesis Nula Error tipo I Se rechaza correctamentePara que cualquier ensayo de hipótesis sea bueno, debe diseñarse de forma que minimice los erroresde decisión. En la práctica un tipo de error puede tener más importancia que el otro, y así se tiene aconseguir poner una limitación al error de mayor importancia. La única forma de reducir ambostipos de errores es incrementar el tamaño de la muestra, lo cual puede ser o no ser posible.La probabilidad de cometer un error de tipo II denotada con la letra griega beta β, depende de ladiferencia entre los valores supuesto y real del parámetro de la población. Como es más fácilencontrar diferencias grandes, si la diferencia entre la estadística de muestra y el correspondienteparámetro de población es grande, la probabilidad de cometer un error de tipo II, probablemente seapequeña.El estudio y las conclusiones que obtengamos para una población cualquiera, se habrán apoyadoexclusivamente en el análisis de una parte de ésta. De la probabilidad con la que estemos dispuestos
  • 8. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOa asumir estos errores, dependerá, por ejemplo, el tamaño de la muestra requerida. Lascontrastaciones se apoyan en que los datos de partida siguen una distribución normalExiste una relación inversa entre la magnitud de los errores α y β: conforme a aumenta, β disminuye.Esto obliga a establecer con cuidado el valor de a para las pruebas estadísticas. Lo ideal seríaestablecer α y β. En la práctica se establece el nivel α y para disminuir el Error β se incrementa elnúmero de observaciones en la muestra, pues así se acortan los limites de confianza respecto a lahipótesis planteada .La meta de las pruebas estadísticas es rechazar la hipótesis planteada. En otraspalabras, es deseable aumentar cuando ésta es verdadera, o sea, incrementar lo que se llama poderde la prueba (1- β) La aceptación de la hipótesis planteada debe interpretarse como que lainformación aleatoria de la muestra disponible no permite detectar la falsedad de esta hipótesis.Paso 3: Cálculo del valor estadístico de pruebaValor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza lahipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticosz y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestrasson de la prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se utiliza elestadístico t.Tipos de pruebaa) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdadEjemplo H0 : µ = 200 H1 : µ ≠ 200b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤ H0 : µ ≥ 200 H0 : µ ≤ 200 H1 : µ < 200 H1 : µ > 200En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación estándar (σ)poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es zy se determina a partir de:
  • 9. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOEl valor estadístico z, para muestra grande y desviación estándar poblacional desconocida sedetermina por la ecuación:En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacionaldesconocida se utiliza el valor estadístico t.Paso Formular la regla de decisiónSE establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones enque no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores queson tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que lahipótesis nula es verdadera, es muy remotaDistribución muestral del valor estadístico z, con prueba de una cola a la derechaValor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la regiónen la que no se rechaza la hipótesis nula.Paso 5: Tomar una decisión.En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con elvalor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en unaprueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula.Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no deberíahaberse rechazado (error tipo I). También existe la posibilidad de que la hipótesis nula se aceptecuando debería haberse rechazado (error de tipo II).Ejemplo en la cual se indica el procedimiento para la prueba de hipótesisEl jefe de la Biblioteca Especializada de la Facultad de Ingeniería Eléctrica y Electrónica de la UNACmanifiesta que el número promedio de lectores por día es de 350. Para confirmar o no este supuestose controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Se considera el nivelde significancia de 0.05Datos:
  • 10. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO Día Usuarios Día Usuarios Día Usuario 1 356 11 305 21 429 2 427 12 413 22 376 3 387 13 391 23 328 510 14 380 24 411 5 288 15 382 25 397 6 290 16 389 26 365 7 320 17 405 27 405 8 350 18 293 28 369 9 403 19 276 29 429 10 329 20 417 30 364Solución: Se trata de un problema con una media poblacional: muestra grande y desviación estándarpoblacional desconocida.Paso 01: Seleccionamos la hipótesis nula y la hipótesis alternativa Ho: μ═350 Ha: μ≠ 350Paso 02: Nivel de confianza o significancia 95% α═0.05Paso 03: Calculamos o determinamos el valor estadístico de pruebaDe los datos determinamos: que el estadístico de prueba es t, debido a que el numero de muestras esigual a 30, conocemos la media de la población, pero la desviación estándar de la población esdesconocida, en este caso determinamos la desviación estándar de la muestra y la utilizamos en laformula reemplazando a la desviación estándar de la población.Calculamos la desviación estándar muestral y la media de la muestra empleando Excel, lo cual semuestra en el cuadro que sigue. Columna1 Media 372.8 Error típico 9.56951578 Mediana 381 Moda 405 Desviación estándar 52.4143965 Varianza de la muestra 2747.26897 Curtosis 0.36687081 Coeficiente de asimetría 0.04706877 Rango 234 Mínimo 276 Máximo 510 Suma 11184 Cuenta 30 Nivel de confianza (95.0%) 19.571868
  • 11. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO x 372.8 350 22.8 Z 2.38 s 52.4 9.6 n 30Paso 04: Formulación de la regla de decisión.La regla de decisión la formulamos teniendo en cuenta que esta es una prueba de dos colas, la mitadde 0.05, es decir 0.025, está en cada cola. el área en la que no se rechaza Ho está entre las dos colas, espor consiguiente 0.95. El valor critico para 0.05 da un valor de Zc = 1.96.Por consiguiente la regla de decisión: es rechazar la hipótesis nula y aceptar la hipótesis alternativa,si el valor Z calculado no queda en la región comprendida entre -1.96 y +1.96, esto es 1.96 Z 1.96 . En caso contrario no se rechaza la hipótesis nula si Z queda entre -1.96 y +1.96.Paso 05: Toma de decisión.En este último paso comparamos el estadístico de prueba calculado en el paso 3 que es Z = 2.38 y locomparamos con el valor critico de Zc = 1.96. Como el estadístico de prueba calculado cae a laderecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el supuesto del Jefe de laBiblioteca.Conclusiones: Se rechaza la hipótesis nula (Ho), se acepta la hipótesis alterna (H1) a un nivel de significancia de α = 0.05. La prueba resultó ser significativa. La evidencia estadística no permite aceptar la aceptar la hipótesis nula. CÁLCULO E INTERPRETACIÓN DE VALORES DE PEl valor de p es una medida de probabilidad. En concreto, se trata de la probabilidad de que la mediamuestral sea como mínimo tan extrema (tan alta o tan baja) como la obtenida en realidad, siempreque el valor hipotético de µ sea cierto. El valor de p mide la probabilidad de que, si la mediapoblacional no es igual al valor hipotético, los resultados muestrales sean al menos tan extremoscomo los realmente obtenidos en la muestra. Es decir, siempre con la condición de que la hipótesisnula sea cierta, el valor de p mide la probabilidad de que los resultados muestrales sean: 1. Al menos tan altos o 2. Al menos tan bajos como los hallados en la muestra.Algo más importante quizá es que “el valor de p es el valor más pequeño de al cual se puederechazar la hipótesis nula”.El siguiente ejemplo ilustra el modo de calcular estos valores de p.La mayor cadena de venta al por menor, WAL- MART, cifra en 15 millones de dólares sus ventas portienda. A. Si se elige al azar una muestra de 120 tiendas y se hallan unas ventas promedio de 15.39 millones de dólares, con una desviación típica de 2.9 millones de dólares, será que se encuentra respaldada la hipótesis de que μ =15 millones de dólares al nivel de significación del 10%?. Ho: µ=15 H1: µ
  • 12. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO Región de rechazo Región de rechazo Región de no rechazo Ho: µ=15 Z = -1.65 Z = 1.65 Recuerde que el Z crítico, Z( , se obtiene en la tabla del apéndice II (Áreas bajo la curva normal), y que para nuestro ejemplo corresponde a un área de 0,45 y por tanto Z = -1.65 y Z = 1.65 2.9 xc 15 1.65 * 120 x c1 14.56 x c 2 15.44 REGLA DE DECISIÓN: No rechazar la hipótesis nula si 14.56 X 15.44 y rechazar la hipótesis nula si X 14.56 o X 15.44 CONCLUSIÓN: No rechazar la hipótesis nula ya que se encuentra respaldada a ese nivel de significancia B. Calcular el valor de p asociado con estos datos. 15.39 15 Z test 1.47 2.9 120 Al buscar en el apéndice II encontramos que para Z = 1.47 se obtiene un área de 0.4292 Por tanto el valor de p será: p (0.5 0.4292) * 2 0.1416 “Y esto significa que la hipótesis nula será rechazada a niveles de significancia superiores al 14.16%” ERRORES DE TIPO I Y DE TIPO II EN UN CONTRASTE DE HIPÓTESISSi rechazamos una hipótesis cuando debiera ser aceptada, cometemos un error de tipo I, mientrasque si la aceptamos debiendo ser rechazada diremos que hemos cometido un error de tipo II.Minimizar los errores no es una cuestión sencilla, un tipo suele ser más grave que otro y los intentosde disminuir uno suelen producir el aumento del otro. La única forma de disminuir ambos a la vez esaumentar el tamaño de la muestra.
  • 13. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOLa probabilidad de cometer un error de tipo I es el nivel de significación , la probabilidad decometer un error de tipo II depende del verdadero valor de µ y del tamaño de la muestra.Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad de uno por logeneral tiene como resultado un aumento en la probabilidad del otro.El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I, siempre sepuede reducir al ajustar el o los valores críticos.Un aumento en el tamaño muestral n reducirá y de forma simultánea.Si la hipótesis nula es falsa, es un máximo cuando el valor real del parámetro se aproxima alhipotético. Entre más grande sea la distancia entre el valor real y el valor hipotético, será menorEl rechazo de una hipótesis nula cuando es cierta se denomina error de tipo I, y su probabilidad (quees también el nivel de significancia) se simboliza como .El hecho de que p sea muy bajo no califica el acontecimiento como imposible. Simplemente que tienepoca probabilidad de ocurrir al azar. A la probabilidad de cometer error tipo I se la denominanivel de significación Habitualmente el investigador fija a priori el nivel de significación críticopara rechazar Ho ( ). Si P es menor que , se rechaza. En caso contrario, se acepta Ho.El hecho de aceptar una hipótesis nula cuando es falsa se denomina error de tipo II, y su probabilidadse simboliza como . La probabilidad de cometer un tipo de error puede reducirse sólo si deseamosincrementar la probabilidad de cometer el otro tipo de error. Con el propósito de obtener una baja,tendremos que tolerar una alta. Los responsables de la toma de decisiones deciden el nivel designificancia adecuado, al examinar los costos o desventajas vinculadas con ambos tipos de errores.Una vez especificado el valor de el de queda fijado para cualquier tamaño de muestradeterminado. El valor de o probabilidad de cometer un error de tipo II, depende del valorverdadero de µ. Si, por ejemplo, µ vale 100, existirá un determinado valor para . Pero si µ es enrealidad 110, existe un valor de diferente.La pregunta se convierte entonces en ésta: si la hipótesis nula es falsa, cuál es la probabilidad de norechazarla y por consiguiente cometer un error de tipo II?.Veámoslo con un ejemplo:Para el ejemplo anterior si µ es en realidad 14.8 millones, cuál es la probabilidad de cometer un errorde tipo II?P(error tipo II ) P(14.16 x 15.44)Hallamos Z para cada uno de estos valores extremos 15.44 14.8Z 2.42 2.9 120que corresponde a un área de 0.4922 (Apéndice II, tabla de la distribución normal)
  • 14. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO 14.56 14.8Z 0.91 2.9 120que corresponde a un área de 0.3186 (Apéndice II, tabla de la distribución normal)Por tanto P(error tipo II ) 0.4922 0.3186 0.8108 o 81.08%Ejercicios 1. La mayor cadena de venta al por menor, WAL- MART, cifra en 15 millones de dólares sus ventas por tienda. Si se elige al azar una muestra de 120 tiendas y se hallan unas ventas promedio de 15.39 millones de dólares, con una desviación típica de 2.9 millones de dólares, será que se encuentra respaldada la hipótesis de que μ =15 millones de dólares al nivel de significación del 10%?. 2. Resuelva el ejercicio anterior, si la estimación de ventas se ha expresado así: “los ingresos no superan los 15 millones de dólares por tienda” 3. Una revista especializada decía que la gente tardaba 34 horas de promedio en aprender un nuevo programa informático. Está respaldada esta afirmación al nivel del 10% si 35 personas emplearan una media de 40.58 horas, con una desviación típica de 19.7 horas? 4. Un convenio trabajadores- dirección exige una producción media diaria de 50 unidades. Una muestra de 150 días revela una media de 47.3 con una desviación típica de 5.7 unidades. Poner α=5% y determinar si se cumple esta clausula del contrato. 5. Se utiliza una máquina para llenar latas de 18 onzas. Si la máquina funciona mal, tiene que ser reajustada. Se elige una muestra de 500 latas, que dan una media de 18.9 onzas con una desviación típica de 4.7 onzas. Para un nivel de significancia del 5% determine si se debe reajustar la máquina.
  • 15. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO 6. En un artículo se debatía la creciente tendencia a que los empleados demanden a sus empresas por incumplimiento de sus promesas en relación con algunos beneficios sanitarios y concluía que el juicio medio se entablaba por 115000 dólares, Si 42 juicios dieron una media de 114412 dólares con una desviación típica de 14000 dólares, determine si está respaldada la hipótesis al nivel del 7%. 7. Un medicamento en estudio tiene que reducir en 13 puntos la presión sanguínea en pacientes cardíacos antes de ser aceptado para uso general. En una prueba sobre 51 pacientes se redujo la presión en 12.2 puntos en promedio con una desviación típica de 2.3 puntos. Al nivel del 1% se debe aprobar este medicamento? 8. Los miembros de un club están desencantados por la decisión del dueño de un campo de fútbol al limitar las reservas a un tiempo inaceptable. Afirman que cada partido dura en promedio 2 horas. De 27 partidos recientes, se halló una media de 1.82 horas con una desviación típica de 0.32 horas. El dueño del campo está dispuesto a retirar el límite de tiempo si los miembros del club tiene la razón. A un nivel del 2%, cuál será la decisión? 9. Determine el nivel de significancia más pequeño para el cual se puede rechazar la hipótesis nula en los ejercicios anteriores. PRUEBA DE HIPOTESIS PARA LA PROPORCION Frecuentemente se desea estimar la proporción de elementos que tienen una característica determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza información cualitativa y se está interesado en verificar un supuesto acerca de la proporción poblacional de elementos que tienen determinada característica, es útil trabajar con la prueba de hipótesis para la proporción. Así por ejemplo; un político puede estar interesado en conocer si ha habido un aumento en la proporción (porcentaje) de votantes que lo favorecen en las próximas elecciones; un productor de cereales puede querer conocer si ha ocurrido o no una baja en la proporción de clientes que prefieren su marca de cereal; un hospital desea confirmar el reclamo de un manufacturero de medicamentos quien afirma que éste cura al 80% de los usuarios. Estos ejemplos son algunas de las situaciones donde nos interesa probar alguna afirmación referente a una proporción. El procedimiento para probar una proporción en una población normal es casi igual al usado para las medias. La información que suele disponerse para la estimación de una porción real o verdadera x (porcentaje o probabilidad) es una proporción muestral , donde x es el número de veces n que ha ocurrido un evento en n ensayos. Por ejemplo, si en una muestra aleatoria de 600 compras realizadas en una tienda y 300 se realizan con tarjeta de crédito, entonces x 300 0.50 se puede utilizar esa cifra como estimación de punto de la proporción real n 600 de compras realizadas en ese negocio que se abonaron a tarjetas de crédito. De la misma forma muchas compañías podrían estimar las proporciones de muchas transacciones. La hipótesis alterna puede ser una de las alternativas usuales unilateral o bilateral tales como: p p 0 , p p 0 , ..o.. p p 0 .
  • 16. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO El proceso de prueba de hipótesis para la proporción poblacional p es muy similar al de μ. Un valor Zc calculado a partir de la muestra se compara con un valor crítico de Z dados en las  p p x np tablas. Zc se obtiene así: Zc . O también se puede utilizar: Zc p.q npq n ¿Cómo probar una proporción? Podemos usar cualquiera de los siguientes métodos: 1. Método de la región de rechazo (Método 1) ó 2. Método del valor P (Método 2)A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1) Digamos que po es la proporción aceptada o reclamada. Paso 1 Establezca las hipótesis. Ho : p = po H1 : p > po ó p < po ó p po Paso 2 Use el nivel de significancia ( ) y dibuje la región de rechazo en la curva normal estándar (curva z). /2 /2 z -z -z z (H1: p > po) (H1: p < po) (H1: p po) x Paso 3 Calcule el valor z para la proporción muestral p usando la fórmula n p p0 p0 (1 p0 ) Z= , p p n Paso 4 Dibuje este valor de z en el diagrama de la región de rechazo (Paso 2). Paso 5 Si el valor z cae dentro de la región de rechazo (sombreada), entonces rechace Ho. Si cae fuera de la región sombreada, entonces no rechace Ho. Paso 6 Escriba la conclusión de la prueba.Ejemplo 1: Prueba la hipótesis H0 : po = 0.4 H1 : p 0.4 suponga que p = 0.45, n = 200, y = .01
  • 17. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOSolución: Paso 1 H0 : po = 0.4 H1 : p 0.4 Paso 2 Usando = .01, el diagrama de la región de rechazo es: .005 .005 -2.575 2.575 Paso 3 Calculando el valor z para la proporción muestral p = 0.45, obtenemos: 0.4(1 0.4) p 0.0346 200 0.45 0.4 Z= 1.45 0.0346 Paso 4 Dibujando z = 1.45 en el diagrama de la región de rechazo (Paso 2) obtenemos: 1.45 .005 .005 -2.575 2.575 Paso 5 Como el valor z está fuera de la región de rechazo (sombreada), por lo tanto no rechazamos Ho. Paso 6 La proporción en la población es 0.4.B. MÉTODO DEL VALOR P (MÉTODO 2) Dejemos que p0 sea la proporción aceptada o reclamada. Paso 1 Establezca las hipótesis: H0 : p = p0 H1 : p > p0 ó p < p0 ó p p0 x Paso 2 Calcule el valor z para la proporción muestral p usando la fórmula: n p p0 p0 (1 p0 ) Z= , donde p . p n Paso 3 Usando la hipótesis alterna dibuja la región bajo la curva z que representa los valores extremos.
  • 18. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO Valor P Valor P P/2 P/2 z -z -z z (H1 : p > po) (H1 : p < po) (H1 : p po) Paso 4 El valor P = al área de la cola sombreada (s) en el Paso 3. Paso 5 Si el valor P < , entonces rechaza H0 Si el valor P , entonces no rechaces H0. Paso 6 Escribe la conclusión de la prueba.Ejemplo 1: Pruebe la hipótesis H0 : p = 0.4 H1 : p 0.4 Presuma que = 0.45, n = 200, y = 0.01.Solución: Paso 1 H0 : p = 0.4 H1 : p 0.4 Paso 2 Calculando el valor z de p , obtenemos 0.4(1 0.4) p 0.0346 200 0.45 0.4 Z= 1.45 0.0346 Paso 3 La región bajo la curva z que contiene los valores extremos de Z es P/2 P/2 -1.45 1.45 Paso 4 El valor P = suma de las áreas de las regiones sombreadas en el Paso 3. = 2(el área a la derecha de 1.45) = 2(0.5 – .4265) = 0.147 Paso 5 Como el valor P es mayor que , entonces no podemos rechazar H0. Paso 6 La proporción en la población es 0.4.Ejercicios resueltos 1. Se afirma que, de todas las familias que salen de Cumana por lo menos el 30 % se mudan a Maracaibo. Si una muestra de 600 mudanzas tomada al azar de los
  • 19. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO registros de la Alcaldía de Cumana revela que de los permisos de mudanza autorizados 153 fueron para Maracaibo, pruebe la hipótesis nula p = 0.30 contra la hipótesis alternativa p < 30 con un nivel de significancia del 1 %. SOLUCIÓN: Para calcular la proporción p lo primero que se ha de hacer es determinar la proporción, luego se plantea una hipótesis unilateral con un nivel de significancia al 1%.  153 n 600,.. p 0.255,.. p 0.30,..q 0.70,..Z 2.33,.x 153. 600 Hipótesis: H0 : p 0.30 H1 : p 0.30 Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: Z c Z es decir, Z c 2.33 . Aplicando formula se tiene:  p p 0.255 0.300 0.045 0.045 Zc Zc 2.41 p.q 0.3x0.7 0.00035 0.0187 n 600 O también Aplicando: x np 153 600(0.30) 153 180 27 Zc 2.41 npq 600(0.30)(0.70) 126 11,225 Conclusión: Como Z c es menor que Z , es decir, Z c 2.41 2.33 , se rechaza H0 : p 0.30 con un nivel de significancia de 0.01. Esto se puede observar en la grafica D en donde Zc 2.41 cae fuera del área de aceptación, por lo tanto, se cumple que H1 : p 0.30 , es decir, menos del 30 % de las familias que salen de Cumana, se mudan a Maracaibo. Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio. 2. Se sabe que el 10 % de los fumadores prefieren la marca de cigarrillo Malboro. Después de una campaña publicitaria del cigarrillo Malboro, se entrevistaron a 200 fumadores para determinar la eficiencia de la campaña publicitaria. El resultado de la muestra realizada detecto un total de 26 personas que fumaban Malboro. ¿Pueden considerarse que esos datos presentan evidencia suficiente para indicar que hubo un aumento en la aceptación del cigarrillo Malboro. Obtenga las conclusiones del planteamiento desarrollando un contraste de hipótesis con un nivel de significancia del 5 %. SOLUCIÓN: Para resolver el problema se plantea una hipótesis alternativa unilateral por la derecha. Por tabla se sabe que al 5 % por la derecha Z 1,645 .
  • 20. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO  26 Datos: p 0.10,..q 0.90...... p 0.13,..n 200. 200 Hipótesis: H0 : p 0.10 H1 : p 0.10 Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si Z c Z , es decir, Zc 1,645 . Aplicando formula se tiene:  p p 0.13 0.10 0.03 0.03 Zc Zc 1.41 p.q 0.1x0.9 0.00045 0.02127 n 200 Conclusión: Como Z c es menor que Z , es decir, Z c 1.41 1.96 , se acepta H0 : p 0.10 con un nivel de significancia de 0.05. Esto se puede observar en la grafica A en donde Zc 1.41 cae dentro del área de aceptación, por lo tanto, el 10 % de los fumadores prefieren Malboro, lo que indica que la campaña publicitaria no fue efectiva ya que de haberlo sido se hubiese aceptado la hipótesis H1 : p 0.10. Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio. 3. Un fabricante de semiconductores produce controladores que se emplean en el sistema eléctrico de vehículos. El cliente requiere que la proporción de controladores defectuosos no sea mayor de 0.05, y que el fabricante demuestre estas características del proceso de fabricación con este nivel de calidad, con un nivel de significancia del 5 %. El fabricante de semiconductores toma una muestra aleatoria de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El fabricante puede demostrar al cliente la calidad exigida? Saque sus conclusiones. SOLUCIÓN: para resolver el problema hay que plantear una hipótesis alternativa unilateral de una cola por la izquierda es decir, p< 0.05 y para ello se busca en la tabla el valor de Z ,..que..es..Z 1,645 .  Datos: p 0.05, q 0.95, p 4 200 0.02, n 200. Hipótesis: H0 : p 0.05 H1 : p 0.05 Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si Z c Z ,es decir, Z c 1,645 .
  • 21. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO Aplicando formula se tiene:  p p 0.02 0.05 0.03 0.03 Zc Zc 1.95 p.q 0.05x0.95 0.0002375 0.0154 n 200 Conclusión: Como Z c es menor que Z , es decir, Z c 1.95 1,645 , se rechaza H0 : p 0.05 con un nivel de significancia de 0.05. Esto se puede observar en la grafica A en donde Zc 1.95 cae fuera del área de aceptación, por lo tanto, H1 : p 0.05 se acepta y se concluye que la proporción de artículos defectuosos es menor del 5 %, como quería el cliente. Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio. 4. Se ha afirmado que por lo menos el 60 % de los alumnos de primero y segundo semestre de un Tecnológico prefieren estudiar a partir de las dos de la madrugada. Si 4 de una muestra de alumnos de primero y segundo semestre de n =14 tomadas al azar, afirman estudiar a partir de las dos de la madrugada, pruebe con un nivel de significancia del 5 % si se debe aceptar la hipótesis nula p≥0.60 contra la hipótesis alternativa p<0.60. Datos: p 0.60,..q 0.40,..n 14,..x 14,..nivel..de..significancia..al..0.05. SOLUCIÓN: Por tabla al 0.05 de significancia se sabe que la hipótesis alternativa unilateral por la izquierda es Z 1,645 . Hipótesis: H0 : p 0.60 H1 : p 0.60 Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si Z c Z ,es decir, Z c 1,645 . Aplicando formula se tiene: x np 4 14(0.60) 4 8.40 4.4 Z 2.40 npq 14(0.60)(0.40) 3.36 1,833 Conclusión: Como Z c es menor que Z , es decir, Z c 2.40 1,645 , se rechaza H0 : p 0.60 con un nivel de significancia de 0.05. Esto se puede observar en la grafica A en donde Zc 2.40 cae fuera del área de aceptación, por lo tanto, H1 : p 0.60 se acepta y se concluye que la proporción de estudiantes del primero y segundo semestre que prefieren estudiar a partir de las dos de la madrugada es menor del 60 %. Se recomienda al estudiante que aplique el método del valor p para solucionar el ejercicio.
  • 22. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCOEJERCICIOS En los ejercicios (1-5) use el método de la región de rechazo para probar la hipótesis. 1. H0 : 0.6 H1 : p 0.6, x= 0.65, n = 100, y = 0.01 2. H0 : p = 0.29 H1 : p 0.29, x= 0.26, n = 90, y = 0.01 3. H0 : p = 0.36 H1 : p < 0.36, x = 0.34, n = 630, y = 0.05 4. Un manufacturero de juguetes Tailandés reclama que solo un 10% de los osos de juguete hechos para hablar están defectuosos. Cuatrocientos de éstos juguetes se sometieron a prueba de forma aleatoria y se encontró que 50 estaban defectuosos. Pruebe el reclamo del manufacturero con un nivel de significancia de 5%. 5. Una agencia de empleos afirma que el 80% de todas las solicitudes hechas por mujeres con hijos prefieren trabajos a tiempo parcial. En una muestra aleatoria de 200 solicitantes mujeres con niños, se encontró que 110 prefirieron trabajos a tiempo parcial. Pruebe la hipótesis de la agencia con un nivel de significancia de 5%. En los ejercicios (6 - 10) use el método del valor-p para pruebas de hipótesis. 6. H0 : p = 0.2 H1 : p > 0.2, x= 0.245, n = 400, y = 0.01 7. H0 : p = 0.55 H1 : p < 0.55, x = 175, n = 300, y = 0.05 8. H0 : p = 0.2 H1 : p 0.2, x = 235, n = 1000, y = 0.02 9. Nacionalmente, un 16 % de los hogares tiene una computadora personal. En una muestra aleatoria de 80 hogares en Baltimore, solo 13 poseían una computadora personal. Con un nivel de significancia de 5%, pruebe si el porciento de hogares en Baltimore que tienen computadoras personales es menor que el porcentaje nacional. 10. El registrador de cierta universidad ha dicho que está dispuesto a permitir una sección del curso ESTAD 121 una vez a la semana si más del 65% de los estudiantes matriculados en el curso expresan que prefieren el curso una vez a la semana, en vez de dos veces a la semana. En una muestra aleatoria de 40 estudiantes, 26 indicaron su preferencia de una vez a la semana. Usando un nivel de significancia de 0.01, debe
  • 23. PRUEBA DE HIPÓTESIS ÁLVARO VALENCIA OROZCO el registrador autorizar el ofrecimiento del curso ESTAD 121 una vez? 11. El director de un supermercado piensa que el 50% de sus clientes gastan menos de 10 dólares durante una visita a la tienda. Muchas de sus decisiones en materia de fijación de precios se basa en esa hipótesis. Decide contrastar la hipótesis con una muestra de 50 clientes cuyos gastos totales se indican a continuación. Qué revelan estos datos sobre las decisiones de fijación de precios del director?. Utilice un nivel de significancia del 5% 18.17 8.73 21.12 10.00 4.12 0.65 8.73 17.17 8.42 18.42 7.17 4.12 17.18 5.12 27.18 11.12 2.17 11.17 7.12 4.82 2.08 8.15 6.12 5.12 2.17 3.32 6.42 17.89 9.17 5.55 4.17 5.15 2.12 12.12 8.15 4.83 12.18 11.12 2.63 11.11 18.02 17.15 9.99 18.17 3.02 10.12 8.84 8.92 21.22 17.83