Planteamiento de Hipótesis para dos poblaciones (WORD)

23,223 views
22,845 views

Published on

Published in: Education
0 Comments
3 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
23,223
On SlideShare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
337
Comments
0
Likes
3
Embeds 0
No embeds

No notes for slide

Planteamiento de Hipótesis para dos poblaciones (WORD)

  1. 1. PLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES<br />PARA LA PROPORCIÓN<br />APLICACIÓN<br />Su aplicación determina si razonablemente puede pensarse que las mediciones muéstrales provengan de una población que tenga una normal distribución teórica.<br /> En la prueba se compara la distribución de frecuencia acumulativa de la distribución teórica con la distribución de frecuencia acumulativa observada. Se determina el punto en el que estas dos distribuciones muestran la mayor divergencia. Y a continuación presentamos el desarrollo del estudio acerca del planteamiento de la hipótesis cuando existen dos poblaciones, y haciendo mención, en lo referente a la proporción:<br />Estructura de la base de datos<br />Normalmente la estructura que tiene la base de datos es la de utilizar una variable para entrar los resultados de la medición y la otra donde se particiona estos resultados en los dos grupos.<br />Premisas<br />La única premisa que se necesita es que las mediciones se encuentren al menos en una escala ordinal. Adicionalmente se necesita que la medición considerada sea básicamente continua.<br />Potencia-Eficiencia<br />Comparada ante la alternativa paramétrica de la t de student para dos muestras independientes (o el modelo de Análisis de Varianza clasificación simple para dos muestras), cuando las premisas paramétricas se cumplen, tiene una potencia eficiencia de cerca del 96%, que tiende a decrecer ligeramente a medida que se aumentan los tamaños de muestra.<br />Hipótesis<br />Las hipótesis de esta dócima, expresadas en palabras son:<br />Ho: Las distribuciones poblacionales son iguales.<br />H1: Las distribuciones poblacionales son distintas.<br />Ahora bien se recomienda en general hacer el enunciado de las hipótesis de forma tal que indique en un mayor grado la característica que va a ser docimada.<br />Estadígrafo y distribución muestral.<br />Designemos por T1 y por T2 las tablas de distribución de frecuencias relativas acumuladas, particionadas en k categorías. Donde el primer subíndice corresponde al número de la muestra y el segundo al orden de la clase.<br />Se analiza entonces en la columna de las diferencias de las frecuencias, en qué clases se obtiene el valor máximo. Se tendrá entonces en símbolos:<br />El estadígrafo de esta dócima se designa por χ2 y para tamaños de muestra suficientemente grandes, está distribuido según chi-cuadrado con dos grados los de libertad. En símbolos:<br />12954065405Goodman, ha demostrado que si los tamaños de muestra son pequeños la dócima se comporta conservadoramente.<br />Salidas de la dócima<br />Las salidas usuales de una dócima son tres:<br />Máxima diferencia negativa. Donde se muestra cuál es la mayor diferencia negativa alcanzada.<br />Máxima diferencia positiva. Donde se muestra la mayor diferencia positiva alcanzada.<br />Valor de la probabilidad para dos colas.<br />GLOSARIO<br />CONCEPTODEFINICIÓNTRADUCCIÓNDócimaEs un procedimiento que nos permite contrastar 2 hipótesis bajo ciertas consideraciones y tomar una decisión respecto de ellas.It is a procedure that allows to contrast 2 hypotheses under certain considerations and to make a decision regarding them.Distribución MuestralEs lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la poblaciónIt's what results from considering all the possible samples that can be taken of a population. Their study allows calculating the probability that one has, given a single sample, of coming closer to the population's parameter.Distribución ji-cuadradaSe genera al sumar variables normales independientes (0,1) elevadas al cuadrado. El parámetro que define la distribución se llama grados de libertad y es el número de variables normales que sumas.It's generated when adding independent normal variables (0,1) high to the square. The parameter that defines the distribution is called grades of freedom and it's the number of normal variables that you add.Prueba de Kolmogórov-SmirnovLa prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí.The Kolmogorov–Smirnov test (K–S test) is a form of minimum distance estimation used as a nonparametric test used to compare a sample with a reference probability distribution or to compare two samples.Distribución de frecuencia acumulativaEs la frecuencia total de todas las clases menos que el límite de la clase superior de una clase determinada. “A table showing the cumulative frequencies is called a cumulative frequency distribution”. Hay dos tipos de distribuciones de frecuencias acumuladas.Menos de distribución de frecuencias acumuladas y Más de distribución de frecuencias acumuladasIt's the total frequency of all the classes less than the limit of the top class of a certain class. There are two types of distributions of accumulated frequencies:Less distribution of accumulated frequencies and more distribution of accumulated frequenciesHomocedásticaLa homocedasticidad es una propiedad fundamental del modelo de regresión lineal general y está dentro de sus supuestos clásicos básicos. Se dice que existe homocedasticidad cuando la varianza de los errores estocásticos de la regresión es la misma para cada observación i.The homocedasticity is a fundamental property of the pattern of general lineal regression and it is inside its basic classic suppositions. It is said that homocedasticity exists when the variance of the stochastic errors of the regression is the same one for each observation i.ParticionadaEn teoría de números, una partición de un entero positivo n es una forma de descomponer n como suma de enteros positivos. Dos sumas se considerarán iguales si solo difieren en el orden de los sumandos. De modo más riguroso, una partición de un número entero positivo n es una secuencia de enteros positivos.In theory of numbers, a partition of a positive integer " n" is a form of decomposing " n" like it adds of whole positive. Two sink they will consider same if alone they differ in the order of the adding-up. In a more rigorous way, a partition of a positive whole number n is a sequence of whole positive.EstadígrafoEs la medida que en Estadística se aplica sobre una muestra. En general se utilizan dos tipos: Los de Tendencia Central y los de Dispersión.It is the measure that is applied on a sample in Statistic. In general two types are used: Those of Central Tendency and those of Dispersion.<br />FORMULARIO:<br />Planteamiento de Hipótesis en Dos poblaciones para la Proporción<br />INTRODUCCIÓN<br />El uso de la Estadística es de gran importancia en la investigación. Casi todas las investigaciones aplicadas requieren algún tipo de análisis estadístico para que sea posible evaluar sus resultados. La elección de uno u otro tipo de análisis estadístico depende del problema que se plantee en el estudio así como de la naturaleza de los datos. <br />Dentro de la estadística se aplican en la investigación los test o décimas paramétricos y no paramétricos, entre los test no paramétricos que comúnmente se utilizan para verificar si una distribución se ajusta o no a una distribución esperada, en particular a la distribución normal se encuentran el test de Kolmogorov-Smirnov que es bastante potente con muestras grandes. <br />El nivel de medición de la variable y su distribución son elementos que intervienen en la selección del test que se utilizará en el procesamiento posterior. De hecho, si la variable es continua con distribución normal, se podrán aplicar técnicas paramétricas. Si es una variable discreta o continua no normal, solo son aplicables técnicas no paramétricas pues aplicar las primeras arrojaría resultados de dudosa validez. <br />TEORIA<br />En algunos diseños de investigación, el plan muestral requiere seleccionar dos muestras independientes, calcular las proporciones muestrales y usar la diferencia de las dos proporciones para estimar o probar una diferencia entre las mismas.<br />Las aplicaciones son similares a la diferencia de medias, por ejemplo si dos empresas consultoras ofrecen datos de proporciones de personas que van a votar por el PRI y al hacer dos estudios diferentes salen resultados ligeramente diferentes ¿pero qué tanta diferencia se requiere para que sea estadísticamente significativo? De eso se tratan las pruebas estadísticas de diferencias de proporciones.<br />El estadístico Z para estos casos se calcula de la siguiente manera:<br />2032022225<br />1 ˆp = proporción de la muestra 1.<br />2 ˆp = proporción de la muestra 2.<br />1 p = proporción de la población 1.<br />2 p = proporción de la población 2.<br />1 n = tamaño de la muestra 1.<br />2 n = tamaño de la muestra 2.<br />Contraste bilateral <br />El contraste bilateral sobre la diferencia de proporciones es <br />Entonces se define <br />y se rechaza la hipótesis nula si o si <br />Contrastes unilaterales <br />En el contraste <br />se rechazará H0 si . Para el test contrario <br />se rechaza H0 sí . <br />SUPUESTOS<br />La distribución de los datos tiene que ser normal (o cualquier distribución, en el caso de que los tamaños muestrales sean grandes, n>30)<br />La distribución de la diferencia entre las dos mediciones realizadas tiene que ser normal (o cualquier distribución, en el caso de que los tamaños muestrales sean grandes, n>30)<br />Las distribuciones son normales<br />Las muestras se seleccionaron al azar<br />Las poblaciones se distribuyen normalmente<br />Las muestras han sido seleccionadas al azar<br />Todas las observaciones son independientes entre sí<br /> Tamaño de muestra “grande” para que se cumpla el teorema del límite central<br />En variables numéricas, no deben haber valores extremos o sesgos que limiten la representatividad del promedio como medida de tendencia central.<br />RESTRICCIONES<br />En el caso concreto de comparar dos o más poblaciones existen cinco restricciones o condiciones que se deben cumplir estrictamente para realizar este tipo de análisis (1-3):<br /> 1) Las observaciones deben ser independientes entre si;<br /> 2) Las observaciones deben hacerse en poblaciones distribuidas normalmente;<br /> 3) Estas poblaciones tienen que tener homocedasticidad (igualdad de varianzas) (o, en casos especiales deben tener una proporción de varianzas conocidas)<br />4) Las variables correspondientes deben ser cuantitativas continuas y, <br />5) Cuando existen más de dos poblaciones comparadas, las medias de estas poblaciones normales y homocedásticas deben ser combinaciones lineales de efectos debidos a las columnas y a las filas o a ambos. Cuando estas condiciones se satisfacen, entonces se puede aplicar la prueba " t" o " F" , según sea el caso.<br />GRAFICOS<br />FORMULA<br />Para contrastar la Ho se utiliza la siguiente fórmula de (Zc) para calcular el tamaño de cada población de donde proceden las muestras, para comparar dos proporciones poblacionales, con la siguiente fórmula.<br />UTILIDAD<br />El concepto de prueba de hipótesis para proporción se puede utilizar para probar hipótesis en relación con datos cualitativos, dado que se desea llegar a conclusiones en cuanto a la proporción de los valores que tienen una característica particular.<br />…..<br />En muchas ocasiones la toma de decisiones las personas necesitan determinar si los parámetros de dos poblaciones son iguales o diferentes.<br /> En una empresa por ejemplo, puede tener la intención de probar si sus empleadas reciben un salario medio que el de sus empleados varones, por realizar el mismo trabajo. <br />Un director de capacitación, puede querer determinar si la proporción de empleados que están listos para ascenso en una dependencia gubernamental es diferente al de la proporción de otra. <br />Un fabricante de medicina puede tener la necesidad de saber si un nuevo medicamento ocasiona una reacción en grupo de animales para experimentación y otra reacción distinta de otro grupo.<br />TABLAS<br />Una tabla de contingencia es una herramienta que nos permite poner a prueba si dos criterios de clasificación de una misma muestra son independientes o no, por ejemplo:<br />Población Criterio 1 Criterio 2 Ingenieros recién egresados Salario inicial Institución de origen Estudiantes Nivel Socioeconómico Promedio académico Número de fallas en un proceso Maquinaria utilizada Turno Estudiantes Calif. en Materia 1 Calif. en Materia 2 Fallas en un transformador Tipo de falla Ubicación Etc... <br />786765141605<br />EJEMPLOS DE RESOLUCIÓN<br />EJEMPLO 1<br />El tamaño de las muestras seleccionadas de Casos (630, que representó a toda la población) y de Controles (1005) se incrementó en relación al cálculo necesario para el estudio en los ocho hospitales de la ciudad de México, seguramente para obtener una mayor precisión en los resultados esperados.<br />Para la reconstrucción de cálculo necesario, como un ejercicio docente, se utilizan los siguientes criterios.<br />El cálculo del tamaño de la muestra en estudios de dos poblaciones para comparar dos proporciones poblacionales, con el siguiente enfoque:<br />Nd1 Grupo de Casos : Mujeres con CACU<br />Nd2 ----- Grupo de Controles : Mujeres sin CACU<br />El siguiente planteamiento de Hipótesis Estadística:<br />H0 = Hipótesis nula (niega) H0 : Õ 1 ≥ Õ 2<br />H1 = Hipótesis alternativa (afirma) H1 : Õ 1 < Õ 2<br />" En el grupo de Casos la asociación del CACU (No/Si) tendrá una diferencia estadísticamente significativa mayor con los factores de riesgo reproductivo e historia de vida sexual, que en el Grupo de Controles" .<br />Dirección de la hipótesis ---------- una sola cola derecha (unilateral).<br />Donde:<br />za = 1.64 para un error a = 0.05 (5%) (una cola)<br />zb = 0.84 para un error b de 0.20 (0.20) (una cola)<br />p1 = 0.03 (1)<br />p2 = 0.01 (1)<br />q1 = 0.97 (1)<br />q2 = 0.99 (1)<br />n1 = 600 mujeres para el Grupo de Casos<br />n2 = 600 mujeres para el Grupo de Controles<br />Al haberse utilizado 630 casos y 1005 controles, como tamaño muestral en los grupos, se logrará una mayor precisión en la estimación de los resultados esperados.<br />EJEMPLO 2<br />El cálculo del tamaño de la muestra en estudio de dos poblaciones para comparar dos proporciones poblacionales, con el siguiente enfoque:<br />Ns1 ®Grupo de intervención, 125 pares de madres e hijos (n1), con lactancia materna exclusivaNd2 ®Grupo testigo, 125 pares de madres e hijos (n2), con lactancia materna exclusiva<br />El siguiente planteamiento de Hipótesis Estadística:<br />Ho = Hipótesis nula (niega) ® Ho : p 1 ≥ p 2<br />Ha = Hipótesis alternativa (afirma) ® Ha : p 1<p 2<br />En el grupo de intervención (n1) que recibe orientación sobre la lactancia materna exclusiva (No/Si) tendrá una mayor diferencia estadísticamente significativa porque al momento del egreso el porcentaje de madres que alimenten a sus hijos exclusivamente al pecho, será mayor en comparación con el Grupo Testigo, que sólo recibe educación rutinaria.<br />Dirección de la hipótesis ® una sola cola derecha (unilateral)<br />Para contrastar la Ho se utiliza la siguiente fórmula de (n) para calcular el tamaño de cada población de donde proceden las muestras:<br />Donde:<br />za = 1.64 para un valor nivel error a = 0.05 (5%)<br />zb = 0.84 para un valor nivel error b = 0.20 (20%)<br />p1 = 63% menores de 3 meses que recibieron<br />Lactancia materna exclusiva (1)<br />q1 = 37% menores de 3 meses que no recibieron<br />Lactancia materna exclusiva<br />p2 = 28% menores de 3 meses que no fueron<br />Amamantados<br />q2 = 72% menores de 3 meses que sí fueron<br />Amamantados<br />Reemplazando valores en la formula de (n)<br />n1 = 22 pares de madres e hijos (grupo de Intervención)<br />n2 = 22 pares de madres e hijos (grupo Testigo o Control)<br />Al haberse utilizado 125 pares de madres e hijos en cada grupo, como tamaño muestral, se ha logrado una mayor precisión en la estimación de los resultados esperados.<br />EJEMPLO 3<br />Se realizó un estudio para comparar los años promedio de servicio de quienes se retiraron en 1979 con los que se retiraron el año anterior en Delong Manufacturing Co. Con un nivel de significancia de .01 ¿podemos concluir que los trabajadores que se retiraron el año pasado trabajaron más años según la siguiente muestra? Nota: sea población #1= año anterior.<br /> <br />Paso 1:<br />Paso 2: Rechace H0 si z > 2.33Paso 3:<br />EJEMPLO 4<br /> (Los exámenes de Estado- Pruebas del ICFES)<br />Se desea comparar la preparación de los estudiantes de último año de bachillerato con base en las pruebas de estado (ICFES). <br />Se desea estimar la diferencia de los puntajes medios μ.<br />1 − μ<br />2 para los estudiantes de colegios públicos μ1 y de colegios privados μ2.<br />El puntaje de las pruebas de estado varía en una escala de 0 a 400 puntos.<br />Para desarrollar estos propósitos, se han tomado muestras al azar entre todos los inscritos, de tal manera que de los estudiantes de colegios públicos se ha tomado una muestra de 100 estudiantes, mientras que de los colegios privados se tomaron 81 estudiantes.<br />Para cada una de las muestras se calculó el puntaje promedio obtenido y su correspondiente desviación estándar, arrojando los siguientes resultados:<br />95821595250<br />Los datos obtenidos retan la hipótesis de que los colegios privados preparan mejor a sus estudiantes para las pruebas de estado que los colegios públicos?<br />Bueno, manos a la obra. De acuerdo con el contexto del problema, tenemos un primer problema de estimación de la diferencia de puntajes medios en las dos poblaciones, lo cual puede hacersemediante la construcción de un intervalo de confianza.<br />En segundo lugar está formulada una pregunta (hipótesis), la cual debe ser sometida a una prueba de significancia, es decir debe calcularse el valor P, que mide la compatibilidad entre los datos y la hipótesis planteada.<br />EJERCICIOS DE RESOLUCIÓN<br />Ejemplo 5 <br />¿Es más probable que los trabajadores solteros falten más que los trabajadores casados? <br />Una muestra de 250 trabajadores casados indicó que 22 faltaron más de 5 días el año pasado, mientras que una muestra de 300 trabajadores solteros indicó que 35 faltaron más de 5 días. Utilice .05 de nivel de significancia. <br />Nota: sea población #1 = trabajadores solteros. <br />148209078740<br />Paso 4: H0 no se rechaza. No existe diferencia entre la proporción de trabajadores casados y solteros que faltan más de 5 días al trabajo.El valor p = P{ z > 1.1} = .1357<br />Ejemplo 1: <br />Unos grandes almacenes han instalado unas cajas de cobro automáticas. Durante los primeros meses, tan sólo las han usado un 8% de la clientela, por lo que deciden iniciar una campaña publicitaria a fin de incrementar ese uso en un 10%, y justificar así su instalación. Durante unos días, en horas elegidas aleatoriamente, han efectuado un recuento  y han descubierto que de un conjunto de 2340 clientes, tan sólo han usado las cajas 208. Después de desarrollar la campaña, han repetido el estudio, y esta vez, de 1978 clientes, han pasado por las nuevas cajas 395. ¿Justifican estos resultados, al 95% de nivel de confianza, que se ha logrado el incremento deseado del 10%?<br />1482090143510<br />En este caso aplicaremos el estadístico de contraste en el que las proporciones en la población son 8% y 18% respectivamente (si admitimos esto como hipótesis nula) y las de la muestra 208/2340=0,0889 y 395/1978=0,1887.<br />Como el error es pequeño, se toman aquí como parámetros de la población los mismos valores que en la muestra, y sólo hay que rellenar la diferencia de proporciones supuesta (aquí el 10%)<br />Suponemos contraste bilateral y fijamos el 95% de nivel de confianza:<br />80581525400<br />El resultado del contraste será que se rechaza la hipótesis de un incremento del 10%. Si rellenas los datos observarás que ha subido un 11,1% de forma significativa.<br />Ejercicio 2: <br />Se desea establecer si la exigencia de ser libres de Leucosis Bovina para exportación en ganado lechero determinó un cambio en la prevalencia de esta enfermedad en una región. Para eso se tomaron dos muestras aleatorias de un banco de sueros. La primera correspondió a sueros extraídos entre 1970-1975 A y la segunda entre 1995-2000 B. En la muestra A de 144 sueros se encontraron 50 positivos y en la muestra B de 400 sueros se hallaron 188 positivos.<br />Hay alguna evidencia de que esta política afecto la prevalencia de la enfermedad con un nivel de significación de 0.05. <br />Ejercicio 3:<br />De 2.000 empresas muestreadas aleatoriamente en el año 2002, 58 tenían alguna anomalía en sus cuentas auditadas en EE.UU. mientras que en 2000, de otra muestra de 2.500 empresas, 61 tenían algún error en la contabilización de sus cuentas. , ¿La proporción de empresas con algún error en sus cuentas auditadas en 2002, fue significativamente distinta que la proporción de ellas en el año 2000?<br />Para realizar el contraste, vamos a calcular un intervalo de confianza para la diferencia de proporciones de empresas con algún error en sus cuentas de los dos años para poder comprobar si la diferencia entre los dos años es significativa o no.<br />El intervalo de confianza para la diferencia de proporciones, a nivel del 95%, está entre 0,0049 y 0,0141. Esto parece apuntar a que el porcentaje de empresas que tiene alguna anomalía en sus cuentas contables no es significativamente diferente en los dos años.<br />El estadístico de contraste es z = 0,96 cuyo p-valor es 0,339 que al ser menor que el nivel de significación del 5%, el p-valor resulta coherente con la impresión anterior, por lo que no rechazaremos la hipótesis nula.<br />Ejercicio 4:<br />En un anuncio publicitario de discos duros para ordenador, el fabricante asegura que sus precios son más económicos y que el porcentaje de sus discos defectuosos es igual al de la competencia. Para contrastar esta última afirmación hemos tomado dos muestras aleatorias, cada una de ellas compuesta por 150 unidades. Los resultados obtenidos se muestran en la tabla siguiente:<br />Es inmediato comprobar que se cumplen los supuestos para este caso, por lo que pasaremos a calcular un intervalo de confianza del 95% para la diferencia entre proporciones y a realizar el correspondiente test de hipótesis:<br />El intervalo de confianza para la diferencia de proporciones, a nivel del 95%, tiene por extremos los valores positivos 0,003 y 0,117 (observar que no contiene el valor 0, aunque por muy poco). Esto parece apuntar a que el porcentaje de defectos en los discos del anunciante es significativamente superior al porcentaje de la competencia. Para un nivel de significación del 0,05, el p-valor resulta coherente con la impresión anterior, por lo que resulta sensato rebatir la afirmación del anunciante (si bien las cosas cambiarían si tomásemos α = 0,01).<br />311785191770= - 2,5550 + 188144 + 400= 0,4375= 0,470= 0,347= 0,4375= 0,5625|Zc |> |Ztab|Rechazo Ho1,96Ho: P1=P2 H1: P1 = P2<br />Ejercicio 5: <br />Oficiales escolares comparan el coeficiente intelectual entre niños de dos grupos.<br />De una muestra de 159 niños del grupo 1 78 califican con más de 100 puntos, de una muestra de 250 niños del grupo 2 123 califican con más de 100 puntos.<br />Construya un intervalo de confianza para la diferencia entre las dos proporciones del grupo 1 y 2 de los niños con califican con más de 100.<br />3202305-7620<br /> q1 = 50.95%<br /> q2 = 50.8%<br /> P1 – P2=<br />Se puede concluir que no hay un grupo mejor que el otro en ambos casos<br />Ejercicio 6:<br />Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.<br />Solución:<br />Datos:<br />PH = 0.12<br />PM = 0.10<br />nH = 100<br />nM = 100<br />p(pH-pM 0.03) = ?<br /> <br />Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está utilizando la distribución normal.<br />-3810-4445<br />-3810137160<br />Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.<br />Ejercicio 7:<br />Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más?<br />Solución:<br />En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se debe de utilizar la distribución muestral de proporciones con P1= P2, ya que es una misma población.<br />Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un período de por lo menos dos años, sólo se conoce la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa proporción.<br />En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se necesita saber las proporciones de las poblaciones, las cuales en este ejercicio las desconocemos, por lo que se utilizará el valor de 0.20 como una estimación puntual de P. En el siguiente tema se abordará el tema de estimación estadística y se comprenderá el porque estamos utilizando de esa manera el dato.<br />También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más?, la palabra difiera quiere decir que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos áreas en la distribución y al final sumarlas.<br />Datos:<br />p1 = 0.20<br />n1 = 320 trabajadores<br />n2 = 320 trabajadores<br />P1 = P2<br />15773401143000<br />La probabilidad de que su proporcion muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 0.05 o más es de 0.1260.<br />Ejercicio 8:<br />Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:<br />¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en por lo menos 0.10?<br />Solución:<br />Datos:<br />P1 = 3/6 = 0.5<br />P2 = 2/5 = 0.4<br />n1 = 120 objetos<br />n2 = 120 objetos<br />p(p2-p10.10) = ? <br />Otra manera de hacer este ejercicio es poner P1-P2:<br />1171575-26035<br />La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011.<br />Ejercicio 9:<br />Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:<br />¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2 en por lo menos 0.15?<br />p(p1-p2<br />0.15)=? <br />La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357.<br />Ejercicio 10:<br />Ejemplo 1. Una muestra de 87 mujeres trabajadoras profesionales mostró que la cantidad promedio que pagan a un fondo de pensión privado el 5% de su sueldo. Una muestra de 76 hombres trabajadores profesionales muestra que la cantidad que paga a un fondo de pensión privado es el 6.1% de su sueldo. Un grupo activista de mujeres desea demostrar que las mujeres no pagan tanto como los hombres en fondos de pensión privados. Si se usa alfa = 0.01 ¿Se confirma lo que el grupo activista de mujeres desea demostrar o no?<br />Paso 1. Determinar la hipótesis Nula “Ho” y Alternativa “Ha”.<br />Nótese que este problema es de una cola.<br />Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor<br />a lo que pagan los hombres (algunos autores solo le colocan igual).<br />La hipótesis alternativa es lo que las mujeres del grupo activista desea demostrar.<br />Paso 2. Determinar el nivel de significancia. Definido por el analista,en este caso se desea usar α = 0.01<br />Gráficamente el nivel de significancia se distribuye en la curva de<br />660400322580Distribución normal tal como se muestra en la figura:<br />Paso 3. Calcular los intervalos que implican ese nivel de significancia.<br />Para dicho nivel de significancia el valor de Z es: Z=-2.326<br />1739265529590Gráficamente queda de la siguiente manera:<br />-35560250825<br />EJERCICIO 11:<br />Llamamos p1 a la incidencia de la osteoporosis en las mujeres de más de 50 años y p2 a la de los hombres. Calculemos un intervalo de confianza para la diferencia (p1 −p2). Si 0 no forma parte de dicho intervalo con una confianza del 95% podemos decir que p1 es diferente a p2 (con tal grado de confianza, por supuesto).<br />La estimación puntual insesgada que podemos hacer de ambos parámetros a partir de los datos muestrales son:<br />1453515162560<br />Es decir, Tenemos una confianza del 95% en la afirmación de que la diferencia entre la incidencia de osteoporosis en mujeres y hombres está entre 0,02 (2 %) y 0,18 (18 %).<br />Obsérvese que como 0% no es un valor de dicho intervalo puede concluirse con una confianza del 95% que hay diferente incidencia de osteoporosis en hombres que en mujeres para las personas de más de 50 años. Esta conclusión es algo más pobre de lo que hemos obtenido con el intervalo de confianza, pero visto de esta manera, este ejemplo puede considerarse como una introducción a los contrastes de hipótesis.<br />EJERCICIO 12:<br />Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman muestras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento nuevo también lo son, encuentre un intervalo de confianza de 90% para la diferencia real en la fracción de defectuosos entre el proceso actual y el nuevo. <br />Solución:<br />Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y nuevo, respectivamente. De aquí, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con el uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.<br />-0.0017<P1-P2<0.0217<br />Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo procedimiento producirá una disminución significativa en la proporción de artículos defectuosos comparado con el método existente.<br />EJERCICIO 13:<br />Un artículo relacionado con la salud, reporta los siguientes datos sobre la incidencia de disfunciones importantes entre recién nacidos con madres fumadoras de marihuana y de madres que no la fumaban: <br /> UsuariaNo UsuariaTamaño Muestral124611178Número de disfunciones42294Proporción muestral0.03370.0263<br />Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.<br />Solución:<br />Representemos P1 la proporción de nacimientos donde aparecen disfunciones entre todas las madres que fuman marihuana y definamos P2, de manera similar, para las no fumadoras. El valor de z para un 99% de confianza es de 2.58.<br />-0.0064<P1-P2<0.0212<br />Este intervalo es bastante angosto, lo cual sugiere que P1-P2 ha sido estimado de manera precisa. <br />Determinación de Tamaños de Muestra para Estimaciones<br />Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con conceptos que ya se han visto a través de este material.<br />EJEMPLO 14:<br />203203082925<br />EJEMPLO 15:<br /> En un proceso de producción de botellas de vidrio se tomó una muestra de 400 de las cuales 28 estaban defectuosas, en otro proceso se tomaran 300 muestra de botellas de la cuales 15 estaban defectuosas. Demuestre la hipótesis nula p1= p2 de que los dos procesos generan proporciones iguales de unidades defectuosas, contra la hipótesis alternativa p1 ≠ p2 con un nivel de significancia de 0.05.<br />Datos:<br />SOLUCIÓN: Para resolver este problema se plantearán las hipótesis y luego se aplica la formula.<br />Hipótesis:<br />Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ,es decir, .<br /> Aplicando formula se tiene:<br />Conclusión: Como es menor que , es decir,, se acepta con un nivel de significancia de 0.05. Esto se puede observar en la grafica A en donde cae dentro del área de aceptación, por lo tanto, no se puede concluir que exista diferencias reales entre las dos proporciones verdaderas de unidades defectuosas.<br />EJEMPLO 16: <br />Un fabricante de productos medicinales esta probando dos nuevos compuestos destinados a reducir los niveles de presión sanguínea los compuestos son suministrados a dos conjuntos diferentes de animales de laboratorio. En el grupo A, 71 de 100 animales probados respondieron al medicamento A con niveles menores de presión arterial. En el grupo B, de 90 animales 58 respondieron al medicamento B con menores niveles de presión sanguínea. El fabricante desea probar a un nivel de significancia de 0.05 si existe una diferencia entre la eficiencia de las dos medicinas. ¿De qué manera se debe proceder en este caso?<br />SOLUCIÓN: Se plantean las hipótesis, se ordenan los datos y en la tabla se busca el valor de al 5 % para una hipótesis alternativa bilateral que según la tabla tienen un valor de . Se plantean las reglas de decisión y finalmente se aplica la fórmula para el caso.<br />Datos:<br /> Hipótesis:<br />Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ,es decir, .<br /> <br />Aplicando formula se tiene:<br />Conclusión: Como es menor que , es decir,, se acepta con un nivel de significancia de 0.05. Esto se puede observar en la grafica A en donde cae dentro del área de aceptación, por lo tanto, se puede concluir que no exista diferencias significativas reales entre las dos medicamentos lo que indica que los dos medicamentos producen efecto en la presión sanguínea que son significativamente iguales.<br />EJEMPLO 17: <br />En un sondeo de opinión en el IUTJAA, 60 de 200 estudiantes del sexo masculino han expresado su disgusto sobre la forma de dirigir el tren directivo la institución, de la misma forma han opinado 75 de 300 alumnos del sexo femenino. Se quiere saber si existe una diferencia real de opinión entre los alumnos y las alumnas del IUTJAA. Para realizar el contraste de hipótesis de las proporciones utilice un nivel de significancia de 0.10.<br /> SOLUCIÓN: Se plantean las hipótesis, se ordenan los datos y en la tabla se busca el valor de al 5 % para una hipótesis alternativa bilateral que según la tabla tienen un valor de . Se plantean las reglas de decisión y finalmente se aplica la fórmula para el caso.<br />Datos:<br /> Hipótesis:<br />Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si ,es decir, .<br /> <br />Aplicando formula se tiene:<br />Conclusión: Como es menor que , es decir,, se acepta con un nivel de significancia de 0.10. Esto se puede observar en la grafica B en donde cae dentro del área de aceptación, por lo tanto, se puede concluir que no exista diferencias significativas reales entre las dos opiniones emitidas por los alumnos y alumnas lo que indica que los dos opiniones están en concordancia de que los directivos están dirigiendo mal a la institución. <br />EJEMPLO 18: <br />En el Departamento de Agropecuaria del IUTJAA se investiga si cierto tipo de fertilizante es efectivo. Para ello se deja sin fertilizar 100 plantas de tomate y de esas, 52 plantas tienen un crecimiento satisfactorio. De la misma forma se fertilizaron 400 plantas, y se detecto que 275 presentaron un crecimiento satisfactorio. ¿Qué conclusión pueden obtener los investigadores del Departamento de Agropecuaria si para contrastar la hipótesis utilizan un nivel de significancia de 0.05?<br />SOLUCIÓN: Se plantean las hipótesis la cual tendría como hipótesis alternativa ; luego se ordenan los datos y en la tabla se busca el valor de al 5 % para una hipótesis alternativa bilateral. Se plantean las reglas de decisión y finalmente se aplica la formula para el caso.<br />Datos:<br />Hipótesis:<br />Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si , es decir, . <br />Aplicando formula se tiene:<br />Conclusión: Como es menor que , es decir,, se rechaza con un nivel de significancia de 0.05. Esto se puede observar en la grafica B en donde cae fuera del área de aceptación, por lo tanto, se puede concluir que exista diferencias significativas reales entre el crecimiento de las plantas, por lo que hay razones para creer que el fertilizante sea realmente efectivo. <br />Ejercicio 19:<br />En una muestra aleatoria de 85 soportes para el cigüeñal de un motor de automóvil, 10 tienen un terminado que es más rugoso de los que las especificaciones permiten. Supóngase que se hace una modificación al proceso de acabado de la superficie y que, de manera subsecuente, se toma una segunda muestra de 85 ejes. El número de ejes defectuosos en esta segunda muestra es de 8. Obtengase un intervalo de confianza del 95% para la diferencia en la proporción de los soportes defectuosos producidos por ambos procesos y pruebe la hipótesis de que la proporción de soportes defectuosos producidos por ambos procesos es la misma. <br />Solución. <br />De lo observado en las muestras se obtiene que y . El interés es la diferencia en la proporción de los soportes defectuosos entre : <br />Un intervalo de confianza del 95% para la diferencia en la resistencia a la tensión promedio es: <br />Este intervalo de confianza incluye al cero, así que, con base en los datos muestrales, parece poco probable que los cambios hechos en el proceso de acabado de la superficie hayan reducido el número de soportes defectuosos para cigüeñal producidos por el proceso. <br />Si se utiliza el estadístico presentado en (1), se encuentra: <br />Rechazandose tambien la hipótesis nula, por lo tanto se concluye que los cambios hechos en el proceso de acabado de la superficie no han reducido el número de soportes defectuosos para cigüeñal producidos por el proceso. <br />Ejercicio 20:<br />Continuando con la investigación sobre tabaquismo, desea contrastarse si fuman más las chicas que los chicos. Se toma una muestra de 20 chicas y se encuentra que fuman 12. En una muestra de 18 chicos fuman 8.<br />Realizar el contraste con α=0,01.<br />1. Hipótesis<br />H0: π1 ≤ π2 <br />H1: π1 > π2<br />2. Supuestos<br />Muestra aleatoria<br />π1 y π2 constantes en cada extracción<br />3. Estadístico de contraste<br />n1 = 20; P1 = 12/20 = 0,60<br />n2 = 18; P2 = 8/18 = 0,44<br />4. Zona crítica: Z ≥ 0,99z = 2,33<br />5. Decisión: Mantener H0. No puede concluirse que las chicas fuman más.<br />- BIBLIOGRAFIA -<br />CONTRASTE DE HIPÓTESIS DE DOS POBLACIONES<br />Autores: Ángel A. Juan (ajuanp@uoc.edu), Máximo Sedano (msedanoh@uoc.edu), Alicia Vila<br />(avilag@uoc.edu), Anna López (alopezrat@uoc.edu)<br />EJERCICIOS RESUELTOS DE ESTADÍSTICA II<br />RESUMEN DE EJERCICIOS DADOS EN CLASES – PARTE II<br />POR:<br />EILEEN JOHANA ARAGONES GENEY<br />UNIVERSIDAD DE CARTAGENA<br />PROGRAMA DE ADMINISTRACIÓN INDUSTRIAL CARTAGENA<br />PRIMER SEMESTRE DE 2008<br />Estadística Inferencial 3.6. Prueba para diferencia de proporciones<br />Elaboró: MC. Marcel Ruiz Martínez<br />Levin, Richard I. Estadística para Administradores, Ed. Prentice Hall, Segunda Edición, México 1987.<br /> www.itescam.edu.mx/principal/sylabus/fpdb/.../r16639.DOC<br />

×