INGENIERIA EN ADMINISTRACION
ESTADISTICA II
ING.JOSE GUADALUPE RODRIGUEZ RAMOS
CUARTO SEMESTRE
Elizabeth Paniagua Tegchi
U...
HIPOTESIS ESTADISTICAS
Una hipótesis Estadística es un proposición sobre los parámetros de una
población o sobre la distri...
Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para
los sistemas de salida de emergencia en ...
Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo
de la Hipótesis H0: m=50 cm/seg, cuando ést...
H0 es Verdadera H0 es Falsa
Se acepta H0 Decisión correcta Error tipo II
Se rechaza H0 Error tipo I Decisión tipo II
PRUEB...
H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
En las pruebas de hipótesis para la media (μ), cuando se conoce la des...
Distribución t de Student
En probabilidad y estadística la distribución t (de Student) es una distribución de
probabilidad...
se dispersarán los datos en torno a la media y la curva será más
plana.
Prueba sobre una sola proporción
Prueba Sobre una ...
Comparando media de dos poblaciones usando muestras pareadas
En este caso se trata de comparar dos métodos o tratamientos,...
Upcoming SlideShare
Loading in...5
×

RESUMEN UNIDAD 1

1,385

Published on

UNIDAD 1 PRUEBA DE HIPOTESIS

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,385
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
29
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "RESUMEN UNIDAD 1"

  1. 1. INGENIERIA EN ADMINISTRACION ESTADISTICA II ING.JOSE GUADALUPE RODRIGUEZ RAMOS CUARTO SEMESTRE Elizabeth Paniagua Tegchi UNIDAD I PRUEBA DE HIPOTESIS La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algún parámetro estadístico.Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la proposiciónEstas proposiciones se denominan Hipótesis y el procedimiento para decidir si se aceptan o se rechazan se denomina Prueba de HipótesisUna prueba de hipótesis es una herramienta de análisis de datos que puede en general formar parte de un experimento comparativo más completo. Procedimiento general para la prueba de Hipótesis Antes de Examinar los datos muestrales: 1. Identificar el parámetro de interés 2. Establecer la Hipótesis Nula H0 3. Especificar una Hipótesis alternativa adecuada H1 4. Seleccionar un nivel de significancia a Usando los datos muestrales: 5. Establecer un estadístico de prueba adecuado 6. Establecer una región de rechazo 7. Calcular todas las cantidades muestrales necesarias para el estadístico 8. Decidir si debe o no rechazarse H0
  2. 2. HIPOTESIS ESTADISTICAS Una hipótesis Estadística es un proposición sobre los parámetros de una población o sobre la distribución de probabilidad de una variable aleatoria. Una hipótesis estadística es afirmación respecto a una característica de una población. Contrastar una hipótesis es comparar las predicciones que se deducen de ella con la realidad que observamos: si hay coincidencia, dentro del margen de error admisible, mantendremos la hipótesis; en caso contrario, la rechazaremos. Rechazar una hipótesis implica sustituirla por otra capaz de explicar los datos observados. Las siguientes afirmaciones son hipótesis estadísticas:  El tabaco produce cáncer de pulmón.  Disminuir los impuestos disminuye el fraude fiscal.  Las mujeres son más apasionadas que los hombres. Estas tres hipótesis no se refieren a individuos particulares, sino al conjunto de elementos de una o varias poblaciones. En estos ejemplos vemos que el contraste de hipótesis requiere, como pasos previos:  Especificar la población de interés  Definir la variable a que nos referimos y como medirla.  Relacionar la hipótesis con los parámetros de la o las poblaciones. Para llegar a tomar decisiones, conviene hacer determinados supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se llaman hipótesis estadísticas y, en general, lo son sobre las distribuciones de probabilidad de las poblaciones. En muchos casos se formulan las hipótesis estadísticas con el solo propósito de rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda está cargada, se formula la hipótesis de que la moneda está bien, es decir, p : 0.5; donde p es la probabilidad de cara. Análogamente, si se quiere decidir sobre si un procedimiento es mejor que otro, se formula la hipótesis de que no hay diferencia entre los procedimientos (es decir, cualquier diferencia observada se debe meramente a fluctuaciones en el muestreo de la misma población).Tales hipótesis se llaman también hipótesis nulas y se denotan por Ho. . Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis alternativa. Por ejemplo: Si una hipótesis es p=0.5, hipótesis alternativas son p=O.7; p#O.5; p>0.5.Unahipótesisalternativa de la hipótesis nula se denota por H1
  3. 3. Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable aleatoria con alguna distribución de probabilidad). Especialmente interesa la rapidez de combustión promedio (que es un parámetro (m) de dicha distribución). De manera más específica, interesa decidir si esta rapidez promedio es o no 50 cm/seg. El planteamiento formal de la situación se realiza en términos de una Hipótesis Nula (que es la proposición que se quiere poner a prueba) y una Hipótesis Alternativa, la cual se aceptará si se rechaza la hipótesis nula: Hipótesis Nula: H0: Promedio = 50 cm/seg Hipótesis Alternativa: H1 Promedio  50 cm/seg ERRORES TIPO I Y TIPO II Al comprobar una hipótesis nos puede llevar a dos conclusiones erróneas. Erros Tipo I.- Se rechaza H0 cuando ésta es verdadera Error Tipo II.- Se acepta H0 cuando ésta es falsa Error Tipo I A la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el nivel o tamaño de significancia de la prueba es decir a = P(error Tipo I)= P(rechazar H0 | H0 es verdadera) Ejemplo: Calcular a para el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es s=2.5 cm/seg. Solución: en este caso a = P( x caiga en la región crítica | m=50), es decir: a = P( x< 48.5) + P( x > 51.5) Recordando que la distribución de x es Normal con media m=50 y desviación estándar s/N =0.79
  4. 4. Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H0: m=50 cm/seg, cuando ésta es verdadera. Es claro que a se puede reducir de dos maneras:  - Aumentando la región de aceptación.  - Aumentando el tamaño de la muestra ERROR TIPO II Para evaluar un experimento de prueba de hipótesis también se requiere calcular la probabilidad del error de Tipo II, denotada por b, es decir b = P (error Tipo II) = P(aceptar H0 | H0 es falsa) La probabilidad máxima con la que en el ensayo de una hipótesis se puede cometer un error del Tipo I se llama nivel de significación del ensayo. Esta probabilidad se denota frecuentemente por a; generalmente se fija antes de la extracción de las muestras, de modo que los resultados obtenidos no influyen en la elección. Sin embargo, no es posible calcular b si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de combustión m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: m=50 cuando el valor verdadero es m=52. En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo se elige un nivel de significación del O.05 ó 5%, al diseñar un ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 en que se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con un 95% de confianza de que se toma la decisión adecuada. En tal caso se dice que la hipótesis ha sido rechazada aI nivel de significación del O.O5,lo que significa que se puede cometer error con una probabilidad de 0.05.
  5. 5. H0 es Verdadera H0 es Falsa Se acepta H0 Decisión correcta Error tipo II Se rechaza H0 Error tipo I Decisión tipo II PRUEBAS UNILATERALES Y BILATERALES Valor estadístico de prueba Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se utiliza el estadístico t. Tipos de prueba a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad Ejemplo H0 : µ = 200 H1 : µ ≠ 200 b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤
  6. 6. H0 : µ ≥ 200 H0 : µ ≤ 200 H1 : µ < 200 H1 : µ > 200 En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es z y se determina a partir de: El valor estadístico z, para muestra grande y desviación estándar poblacional desconocida se determina por la ecuación: En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional desconocida se utiliza el valor estadístico t. Prueba sobre dos medias con distribución Normal y “t” Student
  7. 7. Distribución t de Student En probabilidad y estadística la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra. Distribución normal La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar, denotadas generalmente por y . Propiedades de la distribución normal: La distribución normal posee ciertas propiedades importantes que conviene destacar: i. Tiene una única moda, que coincide con su media y su mediana. ii. La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre y es teóricamente posible. El área total bajo la curva es, por tanto, igual a 1. iii. Es simétrica con respecto a su media . Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. iv. La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación típica ( ). Cuanto mayor sea , más aplanada será la curva de la densidad. v. El área bajo la curva comprendida entre los valores situados aproximadamente a dos desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo . vi. La forma de la campana de Gauss depende de los parámetros y . La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , más
  8. 8. se dispersarán los datos en torno a la media y la curva será más plana. Prueba sobre una sola proporción Prueba Sobre una Sola Proporción. Las pruebas de hipótesis que se relacionan con proporciones son muy utilizadas en muchas áreas. El político se interesa en conocer que fracción de votantes lo favorecerá en la siguiente elección. Todas las empresas fabricantes se preocupan por la proporción de artículos defectuosos cuando se realiza un embarque. Consideremos el problema de probar la hipótesis de que la proporción de éxitos en un experimento binomial es igual a algún valor especifico. Es decir, probaremos la hipótesis nula H0, que p = p0 donde p es el parámetro de la distribución binomial. La hipótesis alternativa puede ser una de las alternativas bilaterales usuales: H0: p=p0H1: p&lt; p En la Prueba Sobre una Sola Proporción utilizamos la distribución binomial para calcular el valor p P=P (X≤x) cuando p=p0El valor x es el numero de éxitos en nuestra muestra de tamaño n. si este valor P es menor que o igual a α, nuestra prueba es significativa en el nivel α y rechazamos H0 a favor de H1. De manera similar, para probar la hipótesisH0: p=p0H1: p&gt; p0 En el nivel de significancia α, P=P(X≥x) Cuando p=p0Y rechazamos H0 a favor de H1 si este valor P es menor que o igual a α. Finalmente, para probar la hipótesis.H0: p=p0H1: p≠p0al nivel de significancia α, calculamos= 2P(X ≤ x cuando p=p0) si x &lt; np0, o P= 2P(X ≥ x cuando p=p0)Si x&gt; np0 y se rechaza H0 a favor deH1 si el valor P calculado es menor o igual a α.
  9. 9. Comparando media de dos poblaciones usando muestras pareadas En este caso se trata de comparar dos métodos o tratamientos, pero se quiere que las unidades experimentales donde se aplican los tratamientos sean las mismas, o los más parecidas posibles, para evitar influencia de otros factores en la comparación, como por ejemplo cuando se desea comparar dos medicamentos para curar una enfermedad es bastante obvio que el sujeto al cual se aplica los medicamentos influye sustancialmente en la comparación de los mismos. Otro ejemplo es en educación, supongamos que se da un seminario sobre un tópico en particular y queremos luego evaluar la efectividad del seminario. Es natural pensar que algunos individuos entenderán mejor el material que otra tal vez, debido a la preparación que tienen de antemano. Así que lo más justo es dar un test antes y después del seminario y comparar estos resultados individuo por individuo. Sea Xi el valor del tratamiento I y Yi el valor del tratamiento II en el i-ésimo sujeto. Consideremos di =Xi -Yi la diferencia de los tratamientos en el i-ésimo sujeto. Las inferencias que se hacen son acerca del promedio poblacional μd de las di . Si μd =0, entonces significa que no hay diferencia entre los dos tratamientos.

×