UNIVERSIDAD VERACRUZANA<br />FACULTAD DE ADMINISTRACIÓN<br />Estadística Inferencial<br />TEMA<br />Tamaño de la muestra<b...
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Tamaño de la muestra original
Upcoming SlideShare
Loading in...5
×

Tamaño de la muestra original

25,842

Published on

Published in: Education, Technology
1 Comment
3 Likes
Statistics
Notes
No Downloads
Views
Total Views
25,842
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
388
Comments
1
Likes
3
Embeds 0
No embeds

No notes for slide

Transcript of "Tamaño de la muestra original"

  1. 1. UNIVERSIDAD VERACRUZANA<br />FACULTAD DE ADMINISTRACIÓN<br />Estadística Inferencial<br />TEMA<br />Tamaño de la muestra<br />EQUIPO: Restaurantes 2<br />Aguilar Hernández Leticia<br />Avila Ortega Gabriela<br />Barcelata Beltrán Ana María<br />Domínguez Rivera Laura María<br />Durán Fabián Luis Selin<br />García Velázquez Anahí<br />González Cabañas Lizeth<br />Pacheco Betancourt Adriana Nohemi<br />PROGRAMA EDUCATIVO: Lic. Admón. Turística<br />Veracruz, Ver., a 10 de mayo del 2010<br />GLOSARIO<br />CONCEPTODEFINICIONTRADUCCIÓNParámetro. Son las medidas o datos que se obtienen sobre la poblaciónAre the measures or data obtained on the populationEstadístico.Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimación de los parámetros.Data or measures obtained on a sample and an estimate of the parametersError Muestral, de estimación o estándar.Es la diferencia entre un estadístico y su parámetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la población, nos da una noción clara de hasta dónde y con qué probabilidad una estimación basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo.It is the difference between a statistician and its corresponding parameter. It is a measure of the variability of samples repeated on the value of the population estimates, gives us a clear notion of up to where and with what probability estimate based on a sample moves away from the value that would have been obtained by means of a comprehensive census.Nivel de Confianza. Probabilidad de que la estimación efectuada se ajuste a la realidad. Cualquier información que queremos recoger está distribuida según una ley de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad de que el intervalo construido en torno a un estadístico capte el verdadero valor del parámetroThe probability that made estimate conforms to reality. Any information we collect is distributed according to a law of probability Gauss (Student), and level of confidence we call the probability that the range built around a statistician captures the true value of the parameterMUESTRA:Porción de un producto o mercancía que sirve para conocer la calidad del género.Portion of a product or merchandise is used to know the quality of the genus.<br />FORMULARIO<br />PRUEBA DE HIPÓTESIS PARA MAS DE DOS POBLACIONES F DE FISHERC a s oE s t a d í s t it c oanálisis de varianza Calculo de hipótesisestimador insesgado de 2(varianza dentro del grupo)Varianza entre grupos.estimadores de las varianzas poblacionales conceptualesSCT =SCE = SCD = SCT - SCEVariabilidad entre las varianzas muestrales Medias de cada grupoCalculo de las varianzas Calculo del estadístico de prueba M/CM = 1 + <br />INTRODUCCION<br />  La experimentación es un procedimiento de observación controlada, y al llevar a cabo un experimento, partimos con el objetivo de obtener las bases para una conclusión generalizable. La validez de la generalización de los resultados obtenidos en el experimento va a estar relacionada, en gran medida, con el grado en que los sujetos con los que hemos trabajado sean representativos de la población a la que queremos generalizar nuestros resultados, nuestras conclusiones.<br />     El problema que se nos plantea, entonces, es el de cómo conseguir esa representatividad; es decir, cómo elegir a los sujetos de nuestro experimento y conseguir que sean representativos de la población a la que pertenecen.<br />En Estadística el tamaño de la muestra es el número de individuos que realmente se estudiarán, es un subconjunto de la población. Para que se puedan generalizar a la población los resultados obtenidos en la muestra, ésta ha de ser «representativa» de dicha pulsación. Para ello, se han de definir con claridad los criterios de inclusión y exclusión y, sobre todo, se han de utilizar las técnicas de muestreo apropiadas para garantizar dicha representatividad.<br />El tamaño de la muestra depende de tres aspectos:<br />1) Error permitido<br />2) Nivel de confianza estimado<br />3) Carácter finito o infinito de la población.<br />Aunque el razonamiento para la predeterminación del tamaño de muestra es tremendamente sencillo, y a pesar de que existen multitud de tablas publicadas y de programas para su cálculo, por algún extraño motivo muchos investigadores consideran la predeterminación del tamaño de muestra una tarea de " expertos" en estadística, lo que como veremos no tiene ningún sentido, pues la información más importante para ese cálculo se basa en conocer ciertos datos del proceso que se va a estudiar.<br />Como todo el mundo sabe, en un estudio comparativo podemos cometer dos tipos de errores, un error tipo I o , que ocurre cuando se afirma que existe diferencia y en realidad ésta es cero, y un error tipo II o, que consiste en declarar que no hemos encontrado diferencias estadísticamente significativas cuando sí que son diferentes los dos grupos. Obviamente la realidad no la conocemos, y precisamente vamos a efectuar un trabajo para intentar saber más sobre ésta. Es habitual fijar de antemano la probabilidad de cometer un error de tipo I en un valor pequeño, normalmente inferior a 0.05. Uno de los problemas del contraste estadístico de hipótesis es que por pequeña que sea una diferencia ésta será estadísticamente significativa siempre que el tamaño de muestra sea suficientemente grande, de ahí el interés del concepto de relevancia clínica de una diferencia observada. Dado que al investigador lo que le interesa es encontrar diferencias con una magnitud de cierta importancia práctica y dado que el coste de un estudio aumenta con el tamaño de muestra, o lo que es lo mismo disminuye su viabilidad, ese orden de magnitud de la diferencia mínima que deseamos detectar permitirá acotar el tamaño de muestra necesario para nuestro estudio. La declaración de principios es que buscamos un tamaño de muestra lo más pequeño posible, pero no tanto que no seamos capaces de detectar una diferencia de una magnitud tal que ya empieza a tener interés práctico, es decir que si la observásemos en nuestro experimento deseamos tener un tamaño de muestra suficiente para poder afirmar que es estadísticamente significativa.<br />TAMAÑO DE LA MUESTRA<br />Las fórmulas generales para determinar el tamaño de la muestra son las siguientes:<br />n=t² x p(1-p)m²<br />Nomenclatura:<br />n = Número de elementos de la muestra<br />N = Número de elementos de la población o universo<br />P/Q = Probabilidades con las que se presenta el fenómeno.<br />Z2 = Valor crítico correspondiente al nivel de confianza elegido; siempre se opera con valor zeta 2, luego Z = 2.<br />E = Margen de error permitido (determinado por el responsable del estudio).<br />Veamos los pasos necesarios para determinar el tamaño de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son: <br />1.- Obtener el tamaño muestral imaginando que:<br />Dónde: : z correspondiente al nivel de confianza elegido : varianza poblacional e: error máximo<br />2.- Comprobar si se cumple  si esta condición se cumple el proceso termina aquí, y ese es el tamaño adecuado que debemos muestrear.<br />Si no se cumple, pasamos a una tercera fase: 3.- Obtener el tamaño de la muestra según la siguiente fórmula: <br />CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR UNA MEDIA<br />¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la media poblacional?<br /> La respuesta depende del error estándar de la media, si este fuera cero, entonces se necesitaría una sola media que será igual necesariamente a la media poblacional desconocida, porque  = 0. Este caso extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras menor sea el error estándar de la media, menor es el tamaño de muestra necesario para lograr un cierto grado de precisión.<br />Se estableció antes que una forma de disminuir el error de estimación es aumentar el tamaño de la muestra, si éste incluye el total de la población, entonces  sería igual a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible determinar un tamaño de la muestra tal que el error de estimación sea tan pequeño como queramos, para ser más preciso, dado un nivel de confianza y un error fijo de estimación, se puede escoger un tamaño de muestra n tal que P () = Nivel de confianza. Con el propósito de determinar n. El error máximo de estimación está dado por:<br />Si se eleva al cuadrado ambos lados de esta ecuación y se despeja n de la ecuación resultante, obtenemos:<br />Como n debe de ser un número entero, redondeamos hacia arriba todos los resultados fraccionarios.<br />En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en:<br />De nuevo se eleva al cuadrado ambos lados y se despeja la n, obteniendo:<br />TAMAÑO DE MUESTRA PARA ESTIMAR LA PROPORCIÓN DE LA POBLACIÓN<br />Para calcular el tamaño de muestra para la estimación de proporciones poblacionales hemos de tener en cuenta los mismos factores que en el caso de la media. La fórmula que nos permitirá determinar el tamaño muestral es la siguiente:<br />Dónde : z correspondiente al nivel de confianza elegido P: proporción de una categoría de la variable e: error máximo N: tamaño de la población<br />El problema radica en que para determinar el tamaño de muestra necesitamos conocer P1 y P2, las proporciones en los dos grupos, que es precisamente lo que deseamos saber y para lo que pensamos efectuar un trabajo de investigación. Hablando coloquialmente, es la pescadilla que se muerde la cola, y sólo se puede resolver efectuando suposiciones, de ahí que quizás por no existir una solución " automática" es por lo que se considera, inmerecidamente, y en tantas ocasiones una tarea de " gurús" . La forma habitual de proceder consiste en suponer un orden de magnitud de la tasa de respuesta en el grupo de control P1, basada en la experiencia previa, en la literatura, en un estudio piloto o simplemente en la intuición, y postular qué diferencia D en esa respuesta se puede empezar a considerar ya de interés, de tal manera queP2=P1+D. A partir de esos datos se calcula ya el tamaño de muestra necesario.<br />Es conveniente analizar en qué medida un valor diferente, pero también posible, de la tasa de respuesta conduce a otros tamaños de muestra, y sopesar así un rango de posibles tamaños junto con las restricciones logísticas y económicas, las cuales suelen tener la última palabra al respecto. Es habitual también prever que puede haber pérdidas de casos a lo largo del estudio, y de acuerdo a experiencias previas sobredimensionar inicialmente ese tamaño de muestra para garantizar que el tamaño al final del estudio no sea menor que el inicialmente previsto.<br />Para la comparación de medias de datos cuantitativos, además de fijar el orden de magnitud de la diferencia D que se considera ya de cierta importancia y que queremos garantizar que seremos capaces de detectar con una probabilidad entre 0.8 a 0.9 (potencia de la prueba), es preciso además conocer el valor de la desviación típica s que esperamos para nuestros datos, siendo éste el punto más complicado. También se puede acudir a fijar la relación entre esa diferencia y la desviación típica, el cociente d=D/s, cociente que se conoce con el nombre d Cohen, y que se suele utilizar para tabular posibles tamaños de muestra en función de ese valor d. Aquí el cuello de botella se encuentra, sobre todo en un estudio novedoso sin información previa, en cómo tener idea de una estimación sensata del valor de la desviación típica. Una alternativa posible es reestimar el tamaño de muestra una vez que hemos recogido ya parte de los datos, lo que nos permite obtener una estimación más real de la desviación típica. Este procedimiento nos lleva a técnicas de análisis secuencial que se comentan más adelante.<br />A la hora de determinar el tamaño de muestra necesario hay que tener en cuenta también el tipo de diseño y el tipo de muestreo utilizado, ya que éste condiciona la fórmula que se utilizará para calcular el error estándar de la estimación, y dado que manipulando esa fórmula se obtiene el valor de N, también éste será diferente según sea el diseño del estudio. Así, entre otros casos, habrá que tener en cuenta si se trata de una comparación de muestras independientes o pareadas, si el esquema del muestreo es aleatorio simple (el más utilizado en los ensayos clínicos) o si se empleó un método de muestreo diferente (por ejemplo un muestreo estratificado o un muestreo por conglomerados).<br />Resulta curiosa la afirmación sostenida por algunos de que para estimar una proporción desconocida, con una precisión dada, el tamaño de muestra mínimo necesario se obtiene suponiendo un valor de p=0.5, basándose en que para estimar una proporción P con margen de tolerancia D la fórmula que proporciona el tamaño de muestra es:<br />Donde Z=1.96 para =0.05.<br />Para D fijo esa fórmula toma su valor máximo con P=0.5. Pero D es la tolerancia en la estimación de la proporción y está claro que la magnitud de esa tolerancia no se puede fijar si no tenemos alguna idea respecto a la proporción a estimar. Un margen de tolerancia del 1% puede ser aceptable en la estimación de un porcentaje del 50%, o por ejemplo en un porcentaje del 20%, es decir que el intervalo de confianza de la estimación estaría en este último caso entre el 19% y el 21%. Pero esa misma tolerancia es probablemente inadmisible para estimar un porcentaje del 2%, ya que entonces el margen absoluto del 1% constituye la mitad del valor estimado. El propio sentido común nos dice que para estimar sucesos infrecuentes necesitaremos tamaños de muestra mayores que para estimar sucesos frecuentes.<br />CONCLUSION<br />El cálculo del tamaño de la muestra constituye una parte fundamental Tanto de los estudios controlados como de aquéllos de prevalencia o incidencia. Aun cuando existen diversos métodos para su cálculo, los principios en general son muy similares; esto, al tomar en cuenta los resultados en promedios o proporciones de los estudios previamente realizados, que deben ser el punto de partida de dicho tipo de trabajos. De Igual modo, son Importantes los niveles alfa (a) y beta ({J), con la finalidad de llegar a conclusiones válidas, así como los valores esperados tanto del grupo control, habitualmente conocido, como del grupo experimental, del que existe casi siempre un antecedente que tiene que ser validado para poder generalizar los resultados.<br />Por último. Es Importante mencionar que el cálculo del tamaño de la muestra tiene una estrecha relación con la factibilidad de la ejecución del estudio; una opción razonable sería no efectuar el estudio si éste rebasa la capacidad del sitio donde pretende llevarse a cabo o las posibilidades de organización de un trabajo excelente.<br />EJEMPLOS:<br />1.- Veamos un ejemplo: La Consejería de Trabajo planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que empleemos?Buscamos en las tablas de la curva normal el valor de  que corresponde con el nivel de confianza elegido: = ±1.96 y seguimos los pasos propuestos arriba.1.- 2.- Comprobamos que no se cumple , pues en este caso10000 < 3706 (3706 - 1); 10000 < 137307303.- <br />2.- supongamos que se desea estudiar la existencia de una asociación entre el consumo de tabaco y el hecho de sufrir un infarto de miocardio. Para poner en evidencia dicha asociación y cuantificar su magnitud se diseña un estudio de casos y controles en el que se investigará el consumo de tabaco de una serie de pacientes que han padecido un infarto de miocardio (casos) y una serie de pacientes sanos (controles). Se cree que alrededor de un 40% de los controles son fumadores y se considera como diferencia importante entre ambos grupos un odds ratio de 4. Con estos datos, podemos calcular el tamaño de muestra necesario en cada grupo para detectar un odds ratio de 4 como significativamente diferente de 1 con una seguridad del 95% y un poder del 80%. De acuerdo con lo expuesto con anterioridad, conocemos los siguientes parámetros:<br />Frecuencia de exposición entre los controles: 40%<br />Odds ratio previsto: 4<br />Nivel de seguridad: 95%<br />Poder estadístico: 80%<br />De acuerdo con estos datos, se estima que la frecuencia de exposición entre los casos vendrá dada por:<br />Esto es, se estima que aproximadamente un 73% de los casos son fumadores. Aplicando la Ecuación 1, se obtiene:<br />Es decir, se necesitaría estudiar a 35 sujetos por grupo (35 pacientes con infarto de miocardio y 35 controles) para detectar como significativo un valor del odds ratio de 4.<br />Si se reduce el tamaño del efecto a detectar, asumiendo que el odds ratio es aproximadamente igual a 3, se obtiene:<br />y, de acuerdo con la Ecuación 1, serían necesarios n=54 pacientes por grupo para llevar a cabo el estudio.<br />En algunos estudios, el investigador reúne un número mayor de controles que de casos con el objeto de incrementar el poder estadístico. Supongamos que en el presente ejemplo se planea obtener dos controles por caso, y se asume que el odds ratio a detectar es aproximadamente igual a 3. Aplicando la Ecuación 2:<br />Por tanto, se necesitaría un grupo de n=40 casos (pacientes con infarto de miocardio) y m=2x40=80 controles para llevar a cabo la investigación.<br />El cálculo del tamaño de la muestra en los estudios de casos y controles debe formar parte del diseño metodológico del mismo, ya que la ejecución de este tipo de estudios es costosa. El iniciar un estudio sin conocer el poder estadístico y la seguridad para detectar diferencias, si es que existen, podría ser motivo de cometer un error de tipo II en el sentido de no detectar diferencias cuando realmente las hay.<br />TABLA 1.   Disposición de los sujetos incluidos en un estudio de casos y controles.  Tabla de 2 x 2. CasosControles Expuestosaba + bNo expuestoscdc + d a + cb + dn<br />-187961-535024<br />5.- Para un trabajo de investigación de mercados en el Perú (población infinita 24’000,000 de habitantes), entre otras cosas, queremos saber cuántas personas viajarán a trabajar al extranjero, con la decisión de radicar definitivamente en el país de destino. ¿Cuál debe ser el tamaño de la muestra para un nivel de confianza de la encuesta del 95.5% y un margen posible de error de 4%?<br />Solución<br />Z = 2; P = 50; Q = 50; E = 4; n =?<br />Respuesta:<br />El tamaño necesario de la muestra para un nivel de confianza de 4% es 625 personas.<br />EJERCICIOS TAMAÑO DE MUESTRA<br />1.-Por estudios previos se tiene conocimiento que la distribución del peso al nacer de niños que cumplen su período de gestación de 40 semanas es aproximadamente normal con una media de 3550 gramos y una desviación estándar de s=400 gramos. Se va a realizar un nuevo estudio para una población con características similares, con el fin de estimar el peso promedio al nacer de los niños. Con base en el estudio previo determine el tamaño de muestra. Además, se considera que un error de máximo 45 gramos logra una estimación valida, la confiabilidad del estudio es del 93%.<br />n = (Z2 α/2)2 (σ)2 <br /> e2<br />n = (1.81)2 (400)2 = 259 nacidos<br /> 452<br />2.-Determinar el número de profesionales a encuestar en una región donde se estima en 500 el número de ellos. El objetivo del estudio es determinar entre otras cosas, la intencionalidad de seguir estudios de maestría, con una prueba piloto de 20 profesionales, se determinó que la proporción de profesionales con afán de continuar sus estudios era del 25%. La confiabilidad del estudio, dado que sus resultados serán validados con otras fuentes se definió en el 90%, el error puede estar entre el 4 %, dependiendo de los costos se definirá cual tamaño seleccionar.<br />N = 4500 p = .25 q = .75 α = .10 = 1.64 e = .4<br />n = (Z2 α/2)2 (.p) (.q) <br /> e2<br />n = (1.64)2 (.25) (.75) = 4 estudiantes<br /> .42<br /> 3.-Se quiere obtener una muestra sistemática que seleccione egresados de un programa de la Universidad de Antioquia que tiene 1200 de ellos. La variable clave del estudio es dicotómica y se aduce que la proporción es del 25%, además, se quiere un error del 4% y una confiabilidad del 90%.<br />n = (Z2 α/2)2 (.p) (.q) <br /> e2<br />n = (1.64)2 (.25) (75) = 316 egresados<br /> .042<br /> 4.Una Institución de Salud tiene 6100 empleados, se quiere determinar como es el clima laboral en la organización, usando una confiabilidad del 95%, un error admisible de 6% y considerando que la proporción de empleados no satisfechos es del 30%. Calcule el número de empleados a consultar por categoría, si se tiene en cuenta, que las diferentes categorías de empleados pueden influir en la opinión de los trabajadores.<br />n = (Z2 α/2)2 (.p) (.q) <br /> e2<br />n = (1.96)2(.3)(.7) = 224.4 n= 225 empleados<br /> (.06)2<br /> 5.-Se realiza un estudio para estimar el porcentaje de ciudadanos del Bajo Cauca que están a favor de que su agua se trate con flúor. Qué tan grande debe ser una muestra si se desea tener una confianza de al menos 95% de que la estimación estará dentro del 2% del porcentaje real? Realice las consideraciones necesarias para calcular n.<br />n = (Z2 α/2)2 (.p) (.q) <br /> e2<br />n = (1.96)2 (.5) (.5) = 2401 personas<br /> .022<br />FUENTES:<br />http://www.monografias.com/trabajos42/seleccion-muestra/seleccion-muestra.shtml<br />http://www.seh-lelha.org/tamuestra.htm<br />Calero Vinelo, Arístides. Técnicas de Muestreo / Arístides Calero Vinelo.- La Habana: Editorial. Pueblo y Eduacación, 1978.- 514p.<br />Metodología de la Investigación / M. En C. Roberto Hernández Sampiere ... et al. – México:/5.n/, 1997.---505p<br />Sánchez Älvares, Rafael. Estadística Elemental 7 Rafael Sánchez Älvares y José A. Torres Delgado.- La Habana : Ed. Pueblo y Eduacació, 1989.- 326p.<br />Taro, Yamane. Elementary Sampling Theory / Yamane Taro.- La Habana: Editorial Pueblo y Educación, 1989.- 405p.<br />http://www.fisterra.com/mbe/investiga/9muestras/9muestras.asp<br />http://www.medigraphic.com/pdfs/imss/im-2006/ims062o.pdf<br />

×