Prueba de hipotesis y intervalos de confianza

19,614 views

Published on

2 Comments
4 Likes
Statistics
Notes
No Downloads
Views
Total views
19,614
On SlideShare
0
From Embeds
0
Number of Embeds
100
Actions
Shares
0
Downloads
159
Comments
2
Likes
4
Embeds 0
No embeds

No notes for slide

Prueba de hipotesis y intervalos de confianza

  1. 1. Alumna: Alina Isela Moreno Hernández.Prof. Lic. Gerardo Mata.Cuatrimestre: 2do Sección: A
  2. 2.  Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal contraste involucra la toma de decisión acerca de las hipótesis. La decisión consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis estadística se denota por “H” y son dos: - Ho: hipótesis nula - H1: hipótesis alternativa Partes de una hipótesis 1. Hipótesis - La hipótesis nula “Ho” Se refiere siempre a un valor especifico del parámetro de la población, no a una estadística de muestra. La letra H significa hipótesis y el subíndice cero no hay diferencia. Por lo general hay un “no” en la hipótesis nula que indica que “no hay cambio” Podemos rechazar o aceptar Ho. Por lo tanto la hipótesis nula es una afirmación que no se rechaza a menos que los datos muestrales proporcionen evidencia convincente de que es falsa. El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro. - La hipótesis alternativa “H1” Es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se acepta si los datos muestrales proporcionan evidencia suficiente de que la hipótesis nula es falsa. Se le conoce también como la hipótesis de investigación. El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.
  3. 3. 2. Nivel de significancia Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota mediante la letra griega α, también es denominada como nivel de riesgo, este término es mas adecuado ya que se corre el riesgo de rechazar la hipótesis nula, cuando en realidad es verdadera. La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región de aceptación, no se puede rechazar la hipótesis nula. Estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo. Errores tipo I y II Error tipo l se presenta si la hipótesis nula Ho es rechazada cuando es verdadera y debía ser aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa α Un error tipo II, se denota con la letra griega β se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada. 3. Estadístico de prueba Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son iguales a 30 o mas se utiliza el estadístico z, en caso contrario se utiliza el estadístico t.
  4. 4. TIPOS DE PRUEBAS
  5. 5. 4. Formular la regla de decisión Se establece las condiciones específicas en la que se rechaza la hipótesis nula y las condiciones en que no se rechaza la hipótesis nula. La región de rechazo define la ubicación de todos los valores que son tan grandes o tan pequeños, que la probabilidad de que se presenten bajo la suposición de que la hipótesis nula es verdadera, es muy remota Distribución muestral del valor estadístico z, con prueba de una cola a la derecha Valor critico: Es el punto de división entre la región en la que se rechaza la hipótesis nula y la región en la que no se rechaza la hipótesis nula. 5. Tomar una decisión. En este último paso de la prueba de hipótesis, se calcula el estadístico de prueba, se compara con el valor crítico y se toma la decisión de rechazar o no la hipótesis nula. Tenga presente que en una prueba de hipótesis solo se puede tomar una de dos decisiones: aceptar o rechazar la hipótesis nula. Debe subrayarse que siempre existe la posibilidad de rechazar la hipótesis nula cuando no debería haberse rechazado (error tipo I ). También existe la posibilidad de que la hipótesis nula se acepte cuando debería haberse rechazado ( error de tipo II ).
  6. 6.  La estadística inferencial es el proceso de uso de los resultados derivados de las muestras para obtener conclusiones acerca de las características de una población. La estadística inferencial nos permite estimar características desconocidas como la media de la población o la proporción de la población. Existen dos tipos de estimaciones usadas para estimar los parámetros de la población: la estimación puntual y la estimación de intervalo. Una estimación puntual es el valor de un solo estadístico de muestra. Una estimación del intervalo de confianza es un rango de números, llamado intervalo, construido alrededor de la estimación puntual. El intervalo de confianza se construye de manera que la probabilidad del parámetro de la población se localice en algún lugar dentro del intervalo conocido. Suponga que quiere estimar la media de todos los alumnos en su universidad.
  7. 7. Sin embargo, la media de la muestra puede variar de una muestra a otra porque depende delos elementos seleccionados en la muestra. Tomando en cuenta la variabilidad de muestra amuestra, se aprenderá a desarrollar la estimación del intervalo para la media poblacional.
  8. 8. Se emplea la siguiente fórmula:Donde:Z = valor crítico de la distribución normal estandarizadaSe llama valor crítico al valor de Z necesario para construir un intervalo de confianza para ladistribución. El 95% de confianza corresponde a un valor ( de 0,05. El valor crítico Z correspondienteal área acumulativa de 0,975 es 1,96 porque hay 0,025 en la cola superior de la distribución y el áreaacumulativa menor a Z = 1,96 es 0,975.Un nivel de confianza del 95% lleva a un valor Z de 1,96.El valor de Z es aproximadamente 2,58 porque el área de la cola alta es 0,005 y el áreaacumulativa menor a Z = 2,58 es 0,995.Ejemplo ilustrativo
  9. 9. Con lectura en la tabla de la distribución normal para un área de 0,025 se obtiene Z = -1,96. Por simetría se encuentra el otro valor Z = 1,96 Remplazando valores y realizando lo cálculos se obtiene:Los cálculos en Excel se muestran en la siguiente figura:
  10. 10. Esta expresión tiene la misma forma que el estadístico Z en la ecuación para la distribución muestralde la media con la excepción de que S se usa para estimar la desconocida.Entre las principales propiedades de la distribución t se tiene:En apariencia, la distribución t es muy similar a la distribución normal estandarizada. Ambasdistribuciones tienen forma de campana. Sin embargo, la distribución t tiene mayor área en losextremos y menor en el centro, a diferencia de la distribución normal.
  11. 11. Los grados de libertad de esta distribución se calculan con la siguiente fórmulaDonde n = tamaño de la muestraEjemplo: Imagínese una clase con 40 sillas vacías, cada uno elige un asiento de los queestán vacíos. Naturalmente el primer alumno podrá elegir de entre 40 sillas, el segundo deentre 39, y así el número irá disminuyendo hasta que llegue el último alumno. En este puntono hay otra elección (grado de libertad) y aquel último estudiante simplemente se sentará enla silla que queda. De este modo, los 40 alumnos tienen 39 o n-1 grados de libertad.
  12. 12. Para leer en la tabla de la distribución t se procede de la siguiente manera:
  13. 13. Usted encontrará los valores críticos de t para los grados de libertad adecuados en la tabla parala distribución t. Las columnas de la tabla representan el área de la cola superior de ladistribución t. Cada fila representa el valor t determinado para cada grado de libertad específico.Por ejemplo, con 10 grados de libertad, si se quiere un nivel de confianza del 90%, se encuentrael valor t apropiado como se muestra en la tabla. El nivel de confianza del 90% significa que el5% de los valores (un área de 0,05) se encuentran en cada extremo de la distribución.Buscando en la columna para un área de la cola superior y en la fila correspondiente a 10grados de libertad, se obtiene un valor crítico para t de 1.812. Puesto que t es una distribuciónsimétrica con una media 0, si el valor de la cola superior es +1.812, el valor para el área de lacola inferior (0,05 inferior) sería -1.812. Un valor t de -1.812 significa que la probabilidad de que tsea menor a -1.812, es 0,05, o 5% (vea la figura).

×