Apuntes sobre muestreo

34,030 views

Published on

Material de apoyo sobre procedimientos de muestreo

1 Comment
3 Likes
Statistics
Notes
No Downloads
Views
Total views
34,030
On SlideShare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
607
Comments
1
Likes
3
Embeds 0
No embeds

No notes for slide

Apuntes sobre muestreo

  1. 1. Apuntes sobre Muestreo APUNTES SOBRE MUESTREO Elaborado por Héctor Medina Disla Santo domingo, D. N. Septiembre 2009 Elaborado por Héctor Medina Disla. Septiembre 2009 1
  2. 2. Apuntes sobre Muestreo Muestreo y Distribución Muestral Objetivo de esta unidad El desarrollo de esta unidad tiene como objetivos fundamentales que los alumnos y alumnas aprendan sobre: 1. La importancia de trabajar con muestra en lugar de trabajar con la población completa. 2. Las diferentes tipos de muestras, así como las ventajas y desventajas de cada una de estas 3. Como seleccionar una muestra a partir de una población determinada 4. La importancia de clasificar la población para reducir variabilidad en la estimación hecha a partir de los datos muestrales. En el día a día, en las actividades diarias se toman decisiones, esas decisiones, se toman luego de un procesamiento interno de una serie datos, los cuales, en la mayoría de los casos, provienen de una muestra y es así, porque rara vez tenemos oportunidad de analizar una población completa, por múltiples razones que se detallaran más adelante en este capítulo. Un ejemplo sencillo es cuando acudimos al médico para la realización una prueba de laboratorio, una vez que nos registramos, nos envían a “toma de muestra”, donde alguien se encargara de nuestro sufrimiento introduciendo una aguja entre nuestras venas, igual seleccionamos una muestra en un ambiente más agradable, cuando compramos un perfume, tomamos una pequeña porción y decidimos si el aroma se ajusta a nuestra piel o no, no esperamos a consumir todo el perfume para luego decidir si compramos o no el perfume, cuando cocinamos, tomamos una pequeña muestra para saber si se han colocado los condimentos adecuadamente y así sucesivamente. En un ambiente fuera de los laboratorios, la tienda o el hogar, un ambiente como las organizaciones donde laboramos, nos encontramos en muchas situaciones en las que se hace necesario analizar el comportamiento de una o múltiples variables a partir de los datos de una muestra, por ejemplo cuando se analiza la producción diaria para fines de control de la calidad, cuando se estudia el comportamiento de los empleados de una empresa, o cuando queremos estudiar la preferencia de los consumidores por un bien o servicio, cuando queremos evaluar la efectividad de un programa de entrenamiento, o de un nuevo método de enseñanza en una escuela , entre otros casos. En todos estos casos se observa que existe una población a partir de la cual seleccionamos una muestra a partir de la cual se analiza un fenómeno y se toman las decisiones que se consideran pertinentes. A ese procedimiento mediante el cual obtenemos una muestra de una población es lo que denominamos muestreo. De tal forma, podemos definir el Muestreo como una herramienta de la investigación Elaborado por Héctor Medina Disla. Septiembre 2009 2
  3. 3. Apuntes sobre Muestreo mediante el cual se selecciona una muestra y su función principal es determinar que parte de la población en estudio se debe examinar a fin de estimar los parámetros de dicha población. Importancia del Muestreo Existen múltiples razones por las cuales se analiza una población a partir de una muestra, desde razones de logística del trabajo de campo, (recolección de datos), hasta razones económicas y de viabilidad y factibilidad de una investigación. Entre las razones para usar un muestreo y no el análisis de la población completa se citan: 1. Analizar la población completa no siempre es posible. Realizar un censo resulta muy costoso en términos de recursos económicos, tiempo y recursos materiales. Esto imposibilita tener a tiempo información acerca del fenómeno que está estudiando y por tanto retraza las acciones necesarias para un mejor resultado. 2. Cuando la población es infinita o tan grande que imposibilita el análisis completo de dicha población, por ejemplo un proceso de producción continuo en una empresa, imposibilita analizar la población completa. 3. En muchos casos desconocemos la población total o no se tiene una ubicación exacta de los elementos que forman dicha población. Por ejemplo un biólogo marino que quiere estudiar el comportamiento de alguna especie marina o un psicólogo que quiere estudiar los factores asociados a la ansiedad, entre otros casos. 4. Cuando las pruebas que se realizan implican la destrucción de las unidades muestrales, (pruebas destructivas), por ejemplo cuando se prueba un perfume, o la comida, o cuando se mide la resistencia de circuito, o la resistencia de los automóviles a un choque de fuerza. 5. Los estudios por muestreo pueden proporcionar información más exacta sobre el comportamiento de un fenómeno. Esto se debe a que cuando se realizan estudios por muestreo se pone más empeño, cuidado y supervisión que cuando se realiza un censo. De igual forma, realizar un estudio por muestreo conlleva contemplar un margen de error, es decir una diferencia entre las estimaciones de la muestra y los parámetros poblacionales, cosa que en el censo no se contempla, sin embargo siempre se cometen errores en estos procesos. Desventajas del uso del muestreo. Elaborado por Héctor Medina Disla. Septiembre 2009 3
  4. 4. Apuntes sobre Muestreo Si bien es cierto que el uso de la técnica de muestreo se hace casi imprescindible para la realización de investigaciones científicas, no menos cierto es que su uso presenta tres limitaciones básicas: 1. Cuando se realiza una investigación haciendo uso del muestreo no se tiene conocimiento sobre la ubicación física de los elementos de la población. 2. Si el procedimiento de muestreo que se utiliza en una investigación no es el apropiado o no se sigue un procedimiento riguroso en la selección de la muestra, los resultados proporcionados por la investigación puede que no se correspondan con la realidad del fenómeno estudiado. 3. El desconocimiento sobre una población determinada impide conocer el nivel de confiabilidad de las estimaciones hechas a partir del muestreo. Algunos conceptos de muestreo Cuando se habla del muestreo, existen una serie de conceptos asociado a este término, por ejemplo, en las líneas anteriores se ha escrito mucho sobre la población, la muestra, los parámetros, los estimadores o estadígrafos entre otros y por ello en la próxima sección se hace una definición de estos conceptos a fin de lograr una mayor familiaridad con los mismos. Población: en el muestreo cuando nos referimos a este concepto se hace referencia a un conjunto de elementos con características parecidas o similares y que es de interés para realizar un estudio. La población se define en función de los aspectos que nos interesa estudiar. Por ejemplo, si quisiéramos conocer la preferencia política de un grupo de persona, la población estaría formada por las personas mayores de edad y con derecho a ejercer el voto, pero si lo que interesa es estudiar la desnutrición infantil de una comunidad, la población estaría definida por todos los niños y niñas de dicha comunidad. Muestra: una muestra se define, sencillamente, como un subconjunto de la población. Cuando los elementos que forman la muestra tienen las mismas características que los elementos de la población de cual se seleccionó se dice que la muestra es representativa. Marco muestral: el marco muestral es el listado que contienen los elementos de la población disponibles para el estudio o la población accesible a la investigación. Suponga que se desea conocer el nivel de satisfacción de los clientes de un banco comercial, y se selecciona una muestra de los clientes que asisten durante un tiempo determinado a dicho banco, la población que asiste durante el tiempo de la investigación es lo que se llama marco muestral, la población está formada, en este caso por todos los clientes del banco. Procedimiento para establecer el marco muestral Elaborado por Héctor Medina Disla. Septiembre 2009 4
  5. 5. Apuntes sobre Muestreo Una de las dificultades que presenta el muestreo probabilístico es la necesidad de disponer de un marco muestral y para establecer dicho marco muestral podemos hacer una de tres cosas: 1. Obtener un listado de todos los elementos de la población 2. Proveerse de una regla para identificarlos, ya que listar los elementos no siempre es posible, por ejemplo fijar un intervalo de tiempo para la selección de los elementos. 3. Hacer un listado con los elementos de la población (si se posee) Limitaciones que se presentan al elaborar un marco muestral Al elaborar un marco muestral se presentan algunas limitaciones, las cuales se presentan de acuerdo a la población bajo estudio. Entre las principales limitaciones se encuentran: 1. Elementos perdidos, lo que provoca un marco muestral inadecuado 2. Elementos extraños en la población, lo que dificulta una buena definición del marco muestral 3. Agrupaciones, no permiten clasificar claramente cuales son las unidades muestrales. 4. Duplicaciones, cuando ocurren, no ofrecen un marco muestral realista. Unidad muestral o unidad de muestro: la unidad de muestreo o unidad muestral es la unidad que se selecciona en el muestreo, es decir, es cada uno de los posibles elementos que forman el marco muestral, que puede ser un elemento o un conjunto de elemento. Todo miembro de la población pertenecerá a una y sólo una unidad de muestreo. Determinar con claridad la unidad de muestreo es de suma importancia para la investigación, ya que permite conocer sobre cuales elementos se tendrá información. Las unidades de muestreo pueden ser personas, viviendas, unidades producidas, grupo de productos, extensiones de tierra, entre otras. Unidad de Análisis: se refiere a la unidad específica sobre la cual se toman las mediciones correspondientes para el análisis. Una unidad muestral puede tener múltiples unidades de análisis, por ejemplo: Es una encuesta de hogar, se pueden medir diferentes características, por ejemplo, de la vivienda, de las personas que habitan la vivienda. Otro ejemplo que pude dejar claro este concepto es cuando se hace una encuesta sobre la preferencia electoral, en este caso se puede tomar las viviendas como unidad de muestreo, es decir se seleccionarán viviendas, sin embargo, dentro de la vivienda puede seleccionarse solo una persona que esté acto para ejercer el voto. Parámetro: Es una medida de referencia la cual se calcula a partir de datos de una población completa. El parámetro se refiere a la medida de una variable en la Elaborado por Héctor Medina Disla. Septiembre 2009 5
  6. 6. Apuntes sobre Muestreo población. Por ejemplo, cuando se aplican las Pruebas Nacionales y se obtiene el promedio de las calificaciones, esta medida es un parámetro de las calificaciones de los estudiantes. Estimador o Estadígrafo: Es una medida calculada a partir de los datos obtenidos en una muestra y se utiliza para estimar el valor del parámetro, ya que en la mayoría de los casos, se hace difícil y muy costoso conocer el valor real o verdadero de la variable. Por ejemplo cuando se toma una muestra para conocer la preferencia política de la población, los porcentajes que se obtienen a partir de la encuesta son estimadores del porcentaje de real de preferencia de todos/as las votantes. Tipos de Muestra Existen dos tipos de procedimiento para seleccionar una muestra, el muestreo no probabilístico y el muestreo probabilístico, cada uno de estos procedimientos tiene sus particularidades, área y momento de aplicación como se muestra a continuación: I - Muestras no probabilísticas: una muestra no probabilística es aquella en la que los elementos se seleccionan atendiendo a criterios subjetivos o personales, es decir que los elementos que se seleccionan para formar la muestra no se seleccionan atendiendo a un criterio científico y por tal razón no se conoce la probabilidad que tiene cada uno de ello de ser incluido en la muestra. Aunque las muestras no probabilísticas no permiten generalizaciones, las mismas tienen las siguientes ventajas: 1. Permite incluir en la muestra a los elementos de población que se desean analizar. Es decir que el investigador selecciona los casos que le interesa estudiar. 2. Resulta de gran utilidad y de bajo costo en estudios exploratorios, que proporcionan información para estudios más profundos o amplios. 3. La muestra no probabilísticas es menos costosa que una muestra probabilísticas. 4. Una muestra no probabilística es de fácil selección ya que no requiere de un marco muestral. Su principal desventaja es que los resultados que se obtienen a partir de ella no se pueden inferir a la población, es decir, que solo puede utilizar para describir los elementos de la muestra. Las principales técnicas para obtener muestras no probabilísticas son:  Muestreo intencional o por conveniencia.  Muestreo de juicio o de experto.  Muestreo por cuota. Elaborado por Héctor Medina Disla. Septiembre 2009 6
  7. 7. Apuntes sobre Muestreo  Muestre por bola de niveles. 1. Muestreo intencional o por conveniencia Es aquel en el que cada unidad muestral se selecciona de acuerdo a la intención o a la conveniencia del investigador. Por ejemplo: un psicólogo que utiliza los pacientes para investigar sobre algunas características de este, el orientador que aprovecha la presencia de un grupo de estudiantes en las aulas para analizar las características de estos, o un reportero que pregunta a las personas que pasan por una esquina determinada sobre un tema de interés. Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Por ejemplo es frecuente utilizar en sondeos preelectorales, encuestar a las personas de una determinada zonas que en anteriores votaciones han marcado tendencias en la intención del voto. 2.- Muestreo de juicio o de experto Es aquel en el que las unidades muestrales son seleccionadas pro una persona experta en el tema que se esta investigando, es decir que la inclusión de una unidad muestral en la muestra depende del nivel de conocimiento que tenga quien selecciona la muestra de cada elemento de la población. Por ejemplo: Un psicólogo puede elegir un grupo determinado de niños y niñas para probar un nuevo método de enseñanza, o el gerente de recursos humanos que en función del conocimiento que tiene sobre sus empleados selecciona un grupo de estos para entrenarlos en una tarea específica, entre otros. La principal limitación de este tipo de muestreo es que depende única y exclusivamente del nivel de conocimiento del experto que selecciona la muestra, lo que limita el marco muestral del estudio. 3.- Muestreo por cuota Es aquel en el que se elige una cantidad determinada de elementos para la muestra. Este tipo de muestreo se basa de un buen conocimiento de los estratos de la población o de las unidades muestrales "representativas" o "adecuadas" para los fines de la investigación. Es muy parecido al muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de este. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de unidades muestrales que reúnen unas determinadas características, por ejemplo: 20 personas de 25 a 40 años, de sexo femenino y residentes en una comunidad. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. En el muestreo por cuota se utiliza la asignación proporcional, esto es que Elaborado por Héctor Medina Disla. Septiembre 2009 7
  8. 8. Apuntes sobre Muestreo a cada grupo de población se asigna una cuota en la muestra proporcional a su tamaño, así por ejemplo si el grupo A representa el 50.0% de la población, en la muestra este grupo debe tener 50.0%. 4.- Muestreo por bola de nieve Es aquel en que las unidades muestrales se seleccionan de acuerdo a las informaciones suministradas por las demás unidades muestrales. En este tipo de muestreo las primeras unidades se seleccionan de forma aleatoria o de forma intencional por el investigador y las demás unidades se seleccionan por la información dada por las primeras. La segunda unidad se selecciona a partir de la primera, tercera unidad se selecciona a partir de la información dada por la segunda, y así sucesivamente. El muestreo por bola de nieve se utiliza en poblaciones que son muy pequeñas y de la cual se desconoce la ubicación de sus miembros. La principal limitación que presenta este tipo de muestreo es que depende totalmente de la información suministrada por los elementos abordados y por tanto del nivel de conocimiento de estos sobre la población. II - Muestreo probabilístico: El muestreo probabilístico es aquel en el que las unidades muestrales se seleccionan atendiendo a criterios científicos y cada elemento de la población, cada unidad muestral tiene una probabilidad determinada de ser incluido en la muestra. En este tipo de muestreo las unidades muestrales que se incluyen en la muestra no dependen del juicio o del criterio de una persona en particular. Este procedimiento le da ciertas ventajas al muestreo probabilístico sobre el no probabilístico. Las principales ventajas que ofrece el muestreo probabilístico están las siguientes: 1. Permite obtener muestras representativas, ya que la selección de las unidades muestrales no se corresponde con criterios personales o subjetivos. 2. Los resultados que se obtienen con este tipo de muestreo permite hacer generalizaciones, (inferir los resultados) sobre la población. 3. Cada unidad muestral tiene una probabilidad mayor que cero de ser incluido en la muestra. 4. No requiere de un conocimiento elevado de la población. Sin embargo, el muestreo probabilístico presenta algunas limitaciones o desventajas que se deben tomar en consideración a la hora de seleccionar una muestra a partir de este método. Entre estas limitaciones se pueden citar: 1. El uso del muestreo probabilístico requiere de un marco muestral definido, es decir, que se requiere tener un listado con cada uno de los elementos que forman la población. Elaborado por Héctor Medina Disla. Septiembre 2009 8
  9. 9. Apuntes sobre Muestreo 2. El muestreo probabilístico es más costoso que el muestreo no probabilístico. 3. No permite incluir en la muestra unidades muestrales de interés particular. Técnicas de muestreo probabilístico Existen cuatro procedimientos para obtener muestras probabilísticas: 1. Muestreo aleatorio simple. 2. Muestreo aleatorio sistemático. 3. Muestreo estratificado. 4. Muestreo por conglomerado. Para ilustrar el procedimiento para seleccionar una muestra a partir de una de las técnicas de muestreo probabilístico se parte una población hipotética de 30 estudiantes de los cuales se tiene información sobre cinco variables: la edad, el sexo, el número de asignaturas cursadas en el semestre, el índice académico del semestre anterior y el gasto en transporte desde la residencia hasta la universidad. Para la ilustración se tomará una muestra de 10 estudiantes con el objetivo de conocer el rendimiento promedio, así como la proporción de estudiante de sexo femenino. Tabla 1: Datos personales de 30 estudiantes de Informática Edad del Sexo del Número de Índice Gasto en No. estudiante estudiante asignaturas Académico transporte 01 22 M 3 80.0 20 02 24 F 3 77.8 50 03 23 M 4 75.6 60 04 25 M 5 74.6 30 05 21 M 3 82.1 30 06 25 F 3 74.3 50 07 22 M 3 77.7 40 08 21 F 6 80.1 40 09 28 F 3 70.3 40 10 28 F 4 70.3 40 11 29 M 5 73.5 40 12 25 F 3 74.3 20 13 20 M 4 79.8 40 14 30 F 2 73.3 20 15 28 F 3 81.5 40 16 24 F 4 74.4 40 17 28 F 3 78.6 40 18 24 F 6 76.7 40 19 21 F 4 77.7 20 20 24 M 3 79.4 20 21 35 M 2 75.7 40 Elaborado por Héctor Medina Disla. Septiembre 2009 9
  10. 10. Apuntes sobre Muestreo 22 21 F 4 83.0 40 23 24 M 3 81.2 50 24 22 F 3 76.8 60 25 21 F 4 80.7 30 26 26 F 3 70.8 50 27 25 F 4 71.3 20 28 24 M 5 74.9 80 29 29 M 3 82.6 30 30 25 F 5 80.6 20 1.- Muestreo aleatorio simple Una muestra aleatoria simple es aquella en la que todas las unidades muestrales tienen igual probabilidad de ser incluidas en la muestra. Por la forma de selección de la muestra, el muestreo aleatorio simple es el muestreo que le garantiza al investigador una mayor representatividad de la muestra seleccionada. Para obtener una muestra aleatoria simple, cada elemento en la población debe tener la misma probabilidad de ser seleccionado y para ello es necesario utilizar un procedimiento que garantice tal aleatoriedad, siendo el más común la tabla de números aleatorios. Para obtener una muestra a partir del muestreo aleatorio simple se siguen los siguientes pasos. 1. Establecer el marco muestral para la selección de la muestra. Se debe tener una numeración para cada elemento en la población a estudiar. 2. Se determina el tamaño de la muestra por la cantidad de unidades a investigar. 3. Una vez establecido el tamaño de la muestra y teniendo el marco muestral disponible se generan los números aleatorios que indiquen cuales elementos de la población serán incluidos en la muestra. Los números aleatorios pueden generarse a partir de diferentes procedimiento, por ejemplo se pueden obtener los número de los elementos cortarlo e introducirlo en una bolsa o una tómbola, (esto cuando se tiene una población pequeña), se puede obtener a partir de una tabla de número aleatorios, como la que se muestra al final del capítulo o a partir de un medio electrónico como la calculadora de bolsillo o a partir de un programa de computadora. Ejemplo: suponga que se desea tomar una muestra de 10 estudiantes a partir de la población hipotética representada en la tabla I. Como la población está numerada del 01 al 30, en la tabla XII de número aleatorios se inicia con las dos primeras columnas buscando los números que sean menores de 30 que es el máximo de la población. Si en las dos primeras columnas no se encuentran los Elaborado por Héctor Medina Disla. Septiembre 2009 10
  11. 11. Apuntes sobre Muestreo diez números aleatorios menores de 30 se continúa en las dos columnas siguientes y así sucesivamente. Observando en las dos primeras columnas, (columna uno y dos) de la tabla de números aleatorios, se encuentran que el primer número de menor o igual de 30 que aparece es el 17 que esta en la fila uno, luego le siguen el 23, en la fila 19, el 25 en la fila 20, el 18 en la fila 21, el 24 en la fila y el 29 en la fila 40. Como no se puede completar los diez números aleatorios, se sigue con dos columnas más, en este caso la columna dos y la columna tres y en estas se observa que el primer número menor de 30 es el 04 en fila cinco, seguido del 02 en la fila 10, el 15 en la fila 11 y el 26 en la fila 14, con los que se completa la muestra tamaño 10. Los números seleccionados en orden ascendente son: 02, 04, 15, 17, 18, 23, 24, 25, 26 y 29. Los datos se muestran en la tabla II. A partir de los datos obtenidos se obtienen las medidas de interés, como el promedio, desviación estándar, proporción, entre otras. Tabla 2: datos de una muestra de 10 estudiantes Edad del Sexo del Número de Índice Gasto en No. estudiante estudiante asignaturas Académico transporte 02 24 F 3 77.8 50 04 25 M 5 74.6 30 15 28 F 3 81.5 40 17 28 F 3 78.6 40 18 24 F 6 76.7 40 23 24 M 3 81.2 50 24 22 F 3 76.8 60 25 21 F 4 80.7 30 26 26 F 3 70.8 50 29 29 M 3 82.6 30 2.- Muestreo Aleatorio Sistemático Es aquel en el que las unidades muestrales se seleccionan sistemáticamente a partir de un número aleatorio. Una muestra sistemática es obtenida cuando los elementos son seleccionados en una manera ordenada. La manera de la selección depende del número de elementos incluidos en la población y el tamaño de la muestra. El número de elementos en la población, (N) es dividido por el número deseado en la muestra, (n) a este cociente se denomina Coeficiente de Elevación, (CE). Este cociente indicará cada cuantos elementos en la población va a ser seleccionada la muestra. El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una muestra sistemática puede dar la misma precisión de estimación acerca de la población que una muestra aleatoria simple cuando los elementos en la población están ordenados al azar. Elaborado por Héctor Medina Disla. Septiembre 2009 11
  12. 12. Apuntes sobre Muestreo Para obtener una muestra aleatoria sistemática se siguen los siguientes pasos: 1. Definir el marco austral y determinar el tamaño de la muestra y de la población. 2. Calcular el coeficiente de elevación, 3. Se busca un número aleatorio, (en la tabla de números aleatorios, en la calculadora o en la computadora o por otro medio que garantice un número totalmente aleatorio) que sea menor al coeficiente de elevación, y este será el primer elemento de la muestra o arranque aleatorio. 4. Completar los números aleatorios de forma sistemática, estos se obtienen sumando el coeficiente de elevación a cada número anterior. Ejemplo: suponga que de la población hipotética mostrada en la tabla I se desea tomar una muestra de 10 estudiantes. Como la población está numerada del 01 al 30, ya se tiene el marco austral y el tamaño de la muestra, por lo tanto se procede a calcular el coeficiente de elevación, el cual se obtiene dividiendo la población entre la muestra, para este caso, N=30 y n=10, por los tanto el coeficiente de N 30 elevación es CE    3, ahora se obtiene por cualquier método un número n 10 aleatorio menor que tres. En la tabla de números aleatorios, utilizando la primera columna, el primer número menor de tres que se observa es el uno que se encuentra en la fila uno, luego este será el primer elemento de la muestra o arranque aleatorio. Los demás números a seleccionar son: Tabla 3: número de muestra a seleccionar según un muestreo aleatorio sistemático. Número de Arranque Número para orden aleatorio la muestra 01 01 01 02 01 + 3 04 03 04 + 3 07 04 07 + 3 10 05 10 + 3 13 06 13 + 3 16 07 16 + 3 19 08 19 + 3 22 09 22 + 3 25 10 25 + 3 28 Con los números aleatorios se acude a la población para hacer la selección de la muestra y los datos se muestran en la tabla IV. Al igual que con el muestreo aleatorio simple, con los datos de la muestra se pueden obtener las medidas o indicadores de interés. Elaborado por Héctor Medina Disla. Septiembre 2009 12
  13. 13. Apuntes sobre Muestreo Tabla 4: datos de una muestra de 10 estudiantes Edad del Sexo del Número de Índice Gasto en No. estudiante estudiante asignaturas Académico transporte 01 22 M 3 80.0 20 04 25 M 5 74.6 30 07 22 M 3 77.7 40 10 28 F 4 70.3 40 13 20 M 4 79.8 40 16 24 F 4 74.4 40 19 21 F 4 77.7 20 22 21 F 4 83.0 40 25 21 F 4 80.7 30 28 24 M 5 74.9 80 3.- Muestreo Estratificado En una muestra aleatoria estratificada la población se divide en grupos o estratos que son iguales a lo interno de ellos, pero diferentes entre ellos. El objetivo del muestreo estratificado es lograr una mayor representatividad de los grupos que conforman la población, así como una reducción en los niveles de variabilidad en las mediciones al analizar grupos que son homogéneos. La principal limitante para un muestreo aleatorio estratificado es la disponibilidad de información sobre los diferentes grupos que conforman la población y además no permite la comparación entre los grupos o estratos ya que estos son diferentes entre ellos. El número de elementos seleccionado de cada estrato puede ser proporcionar o desproporcionar al tamaño del estrato en relación con la población. Específicamente, la cantidad de elementos a seleccionar en cada estrato puede obtenerse a partir de una de tres procedimientos: Afijación simple: A cada estrato le corresponde igual número de unidades muestrales. Afijación proporcional: La distribución se hace de acuerdo con el peso o tamaño de la población en cada estrato. Por ejemplo, si un estrato representa el 25.0% de la población se le asigna el 25.0% de la muestra. Afijación óptima: Se toma en consideración la variabilidad o dispersión de los resultados que se obtendrán, de modo que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele conocer la desviación estándar de la variable antes de estudiarla. Para seleccionar una muestra estratificada se siguen los siguientes pasos: 1. Se divide la población en grupos o estratos. Elaborado por Héctor Medina Disla. Septiembre 2009 13
  14. 14. Apuntes sobre Muestreo 2. Determinar el tamaño de la muestra a seleccionar en cada uno de los estratos 3. Seleccionar las unidades de cada estrato utilizando para ello el muestreo aleatorio simple o aleatorio sistemático. Ejemplo: suponga que de la población hipotética mostrada en la tabla I se desea tomar una muestra estratificada por sexo de 10 estudiantes. Como la muestra es estratificada por sexo se tendrá dos estratos y como en la población el 60.0% es de sexo femenino y el 40.0% masculino, si se utiliza una asignación proporcional, en la muestra el 60.0% debe ser de sexo femenino y el 40.0% de sexo masculino. Tabla 5: Asignación proporcional para la estratificación de la población por sexo Sexo Población, Ni Fracción Muestra, ni Femenina 18 0.60 6 Masculino 12 0.40 4 Total 30 1.00 10 Los datos organizados por sexo se muestran en la tabla 6 Tabla 6: Datos personales de 30 estudiantes de Informática estratificado por sexo Edad del Sexo del Número de Índice Gasto en Estrato No. estudiante estudiante asignaturas Académico transporte 1 24 F 3 77.8 50 2 25 F 3 74.3 50 3 21 F 6 80.1 40 4 28 F 3 70.3 40 5 28 F 4 70.3 40 6 25 F 3 74.3 20 7 30 F 2 73.3 20 8 28 F 3 81.5 40 9 24 F 4 74.4 40 Uno 10 28 F 3 78.6 40 11 24 F 6 76.7 40 12 21 F 4 77.7 20 13 21 F 4 83.0 40 14 22 F 3 76.8 60 15 21 F 4 80.7 30 16 26 F 3 70.8 50 17 25 F 4 71.3 20 18 25 F 5 80.6 20 Dos 1 22 M 3 80.0 20 2 23 M 4 75.6 60 3 25 M 5 74.6 30 Elaborado por Héctor Medina Disla. Septiembre 2009 14
  15. 15. Apuntes sobre Muestreo 4 21 M 3 82.1 30 5 22 M 3 77.7 40 6 29 M 5 73.5 40 7 20 M 4 79.8 40 8 24 M 3 79.4 20 9 35 M 2 75.7 40 10 24 M 3 81.2 50 11 24 M 5 74.9 80 12 29 M 3 82.6 30 Para la selección de la muestra en cada estrato generan números aleatorios de acuerdo al tamaño de la muestra, por ejemplo, en estrato de uno hay que seleccionar seis elementos y como la población de este estrato es de 18 es necesario tomar en cuenta dos columnas, en el caso del estrato dos, la población es de 12 y también es necesario tomar en cuenta dos columnas. Para iniciar con el estrato uno tomamos la columna uno y dos de la tabla de números aleatorios. Los números menores o igual a 18 son el 17 en la fila uno, seguido del 18 en la fila 21, como no hay más número menores de 18 en estas dos columna, se sigue con la columna dos y tres y aquí los números menores de 18 son el 04 en la fila cinco, seguido del 02 en la fila 10, el 15 en la fila 11 y el 07 en la fila 33. De forma que los números aleatorios seleccionados son 02, 04, 07, 15, 17 y el 18 Para seleccionar la muestra en el estrato dos se sigue el mismo procedimiento, tomando los primeros números aleatorios menores o igual a 12. Para buscar los números se toman las columnas tres y cuatro los números son 07 en la fila 21, seguido del 06 en la fila 40, el 04 en la fila 50. Como no se completa la muestra se sigue con las columnas cuatro y cinco y el primer número que aparece es el 12 en la fila 24. De esta forma los números a incluir en la muestra del estrato dos son 04, 06, 07 y el 12. Los datos de las muestras seleccionadas se muestran en la tabla VII. Tabla 7: Datos personales de 30 estudiantes de Informática estratificado por sexo Edad del Sexo del Número de Índice Gasto en Estrato No. estudiante estudiante asignaturas Académico transporte 2 25 F 3 74.3 50 4 28 F 3 70.3 40 7 30 F 2 73.3 20 Uno 15 21 F 4 80.7 30 17 25 F 4 71.3 20 18 25 F 5 80.6 20 4 21 M 3 82.1 30 6 29 M 5 73.5 40 Dos 7 20 M 4 79.8 40 12 29 M 3 82.6 30 Elaborado por Héctor Medina Disla. Septiembre 2009 15
  16. 16. Apuntes sobre Muestreo La selección de la muestra en cada estrato se puede hacer mediante un procedimiento de muestreo aleatorio sistemático, con el cual el proceso de selección es más rápido y sencillo de realizar. En este caso, el coeficiente de elevación se obtiene dividiendo la población de cada estrato entre la muestra de N cada estrato, esto es, CE i  i . Cuando la cantidad de elementos en cada estrato ni se hace mediante una asignación proporcional, el coeficiente de elevación es el mismo para cada estrato. 4. Muestreo por conglomerado En una muestra por conglomerado, la población se divide en grupos o conglomerados que son de igual tamaño o que son convenientes para el muestreo, es decir, que son iguales entre ellos, pero diferentes a lo interno de ellos. El muestreo por conglomerado permite hacer comparaciones entre grupos que son de igual tamaño y se utilizan principalmente cuando no se tiene información acerca de la estructura de la población. Bajo este método, aunque no todos los grupos son muestreados, cada grupo tiene igual probabilidad de ser seleccionado, por lo tanto la muestra es aleatoria. Para ilustrar el proceso se ha dividido la población hipotética en seis conglomerados de cinco elementos cada uno. Tabla 8. Datos personales de 30 estudiantes divido por conglomerado Edad del Sexo del Número de Índice Gasto en Conglomerado No. estudiante estudiante asignaturas Académico transporte 1 22 M 3 80.0 20 2 24 F 3 77.8 50 Uno 3 23 M 4 75.6 60 4 25 M 5 74.6 30 5 21 M 3 82.1 30 6 25 M 3 74.3 50 7 22 M 3 77.7 40 Dos 8 21 F 6 80.1 40 9 28 F 3 70.3 40 10 28 F 4 70.3 40 11 29 M 5 73.5 40 12 25 M 3 74.3 20 Tres 13 20 M 4 79.8 40 14 30 F 2 73.3 20 15 28 F 3 81.5 40 Cuatro 16 24 F 4 74.4 40 17 28 F 3 78.6 40 Elaborado por Héctor Medina Disla. Septiembre 2009 16
  17. 17. Apuntes sobre Muestreo 18 24 F 6 76.7 40 19 21 F 4 77.7 20 20 24 M 3 79.4 20 21 35 M 2 75.7 40 22 21 F 4 83.0 40 Cinco 23 24 M 3 81.2 50 24 22 F 3 76.8 60 25 21 F 4 80.7 30 26 26 F 3 70.8 50 27 25 F 4 71.3 20 Seis 28 24 M 5 74.9 80 29 29 M 3 82.6 30 30 25 F 5 80.6 20 Una muestra de conglomerados, usualmente produce un mayor error muestral (por lo tanto, da menor precisión de las estimaciones acerca de la población) que una muestra aleatoria simple del mismo tamaño. El muestreo por conglomerados es un muestreo polietápico ya que se desarrolla en dos o más etapas. En este tipo de muestreo la unidad primaria de selección es el conglomerado y luego se seleccionan las unidades de análisis en cada conglomerado. Tanto para la selección del conglomerado como de las unidades muestrales en cada grupo o conglomerado se utiliza el muestreo aleatorio simple o el muestreo aleatorio sistemático. En el muestreo por conglomerado, una vez que se han seleccionado los conglomerados, en los mismos se selecciona una muestra, utilizando para ello un procedimiento de muestreo aleatorio simple o aleatorio estratificado o se pueden estudiar todos los elementos de dicho conglomerado. Para la población hipotética de 30 estudiantes se ha divido en seis conglomerados de cinco elementos cada uno, de forma que si se quiere seleccionar una muestra de 10 estudiantes, se deben tomar dos conglomerados. Para la selección de los conglomerados se utiliza uno de los procedimientos de muestreo conocido, aleatorio simple y aleatorio sistemático. Para el caso de la población que se está estudiando y utilizando la tabla de números aleatorios para la selección de los conglomerados, tomando la columna 20, este número se elige de manera aleatoria, por ejemplo preguntando a una persona que se encuentre cerca que diga un número entre uno y 40 que es el número de columnas que tiene la tabla. En este caso, el primer número aleatorio menor a seis es el número cuatro que está en la fila uno, seguido del número seis en la fila dos. Luego los conglomerados a seleccionar para la muestra son el número cuatro y número seis y los datos se muestran en la tabla siguiente: Tabla 9. Datos personales de 30 estudiantes divido por conglomerado Elaborado por Héctor Medina Disla. Septiembre 2009 17
  18. 18. Apuntes sobre Muestreo Edad del Sexo del Número de Índice Gasto en Conglomerado No. estudiante estudiante asignaturas Académico transporte 16 24 F 4 74.4 40 17 28 F 3 78.6 40 Cuatro 18 24 F 6 76.7 40 19 21 F 4 77.7 20 20 24 M 3 79.4 20 26 26 F 3 70.8 50 27 25 F 4 71.3 20 Seis 28 24 M 5 74.9 80 29 29 M 3 82.6 30 30 25 F 5 80.6 20 Tabla 10: Cuadro comparativo de los procedimientos de muestreo probabilístico Tipo de Características Ventajas Inconvenientes Muestreo Requiere que se  Sencillo y de fácil posea de comprensión. antemano un Se selecciona una  Cálculo rápido de listado completo muestra de tamaño n medias y de toda la de una población de N varianzas. población. Cuando Aleatorio unidades, cada  Se basa en la se trabaja con simple elemento, tiene una teoría estadística, muestras probabilidad de y por tanto existen pequeñas es inclusión igual y paquetes posible que no conocida de n/N. informáticos para represente a la analizar los datos población adecuadamente. Conseguir un listado de  Fácil de aplicar. Si la constante de los N elementos de la  No siempre es muestreo está población necesario tener un asociada con el Determinar tamaño listado de toda la fenómeno de Sistemático muestral n. población. interés, las Definir Coeficiente de  Cuando la estimaciones Elevación, CE= N/n. población está obtenidas a partir Elegir un número ordenada de la muestra aleatorio k, entre 1 y siguiendo una pueden contener Elaborado por Héctor Medina Disla. Septiembre 2009 18
  19. 19. Apuntes sobre Muestreo CE (k= arranque tendencia sesgo de selección aleatorio). conocida, asegura Seleccionar los una cobertura de elementos de la lista. unidades de todos los tipos.  Tiende a asegurar que la muestra sea En ciertas ocasiones representativa de resultará conveniente la población en estratificar la muestra función de las según ciertas variables variables de interés. Para ello se  Es necesario seleccionadas. deben conocer las conocer la  Se obtienen características de la estructura de estimaciones más población objetivo. Una la población Estratificado precisas vez que se establece el para poder  Su objetivo es tamaño de la muestra, establecer los conseguir una se asigna a cada estratos en la muestra lo más estrato, generalmente, misma. semejante posible de manera proporcional a la población en la cantidad de muestra lo que a la o las a seleccionar en cada variables de uno. estratificación utilizadas. Se realizan varias fases  Es muy eficiente  El error de muestreo sucesivas cuando la estándar es (polietápico) población es muy mayor que en La necesidad de grande y dispersa. el muestreo listados de las  No es preciso tener Conglomerados aleatorio simple unidades de una etapa un listado de toda o estratificado. se limita a aquellas la población, sólo  El cálculo del unidades de muestreo de las unidades error estándar seleccionadas en la primarias de es complejo. etapa anterior. muestreo. Elaborado por Héctor Medina Disla. Septiembre 2009 19
  20. 20. Apuntes sobre Muestreo Tabla 11: Tabla de número aleatorios1 F i Columnas l 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 a s 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 1 7 8 5 1 2 6 6 9 7 3 5 3 9 0 4 9 7 4 4 8 7 1 7 3 5 6 6 2 5 8 1 7 2 7 7 4 5 4 5 2 3 6 7 6 7 1 6 2 8 5 9 5 7 7 9 3 3 4 4 6 4 5 4 9 5 5 4 2 3 5 9 9 6 4 4 7 9 1 4 3 3 9 7 2 5 7 7 1 7 7 6 3 6 0 1 4 4 4 4 5 2 7 4 5 6 8 7 9 3 9 5 2 6 3 2 3 4 6 8 5 6 4 5 4 5 4 1 5 5 9 7 0 4 3 5 5 6 5 1 6 8 6 0 0 0 7 6 5 9 4 1 7 7 6 6 5 5 7 6 6 8 7 5 7 0 4 1 6 5 6 2 6 6 1 0 1 6 2 5 0 4 4 4 5 5 2 5 9 7 6 6 5 8 3 3 9 8 9 5 5 3 8 6 6 6 6 2 6 5 4 6 8 6 4 6 0 2 3 0 6 2 6 4 7 6 6 4 0 4 8 3 4 8 5 5 4 7 2 5 7 2 2 6 2 7 4 4 4 6 4 5 0 6 4 5 7 4 8 0 9 6 0 7 4 7 8 2 4 8 6 9 9 4 4 7 4 9 3 3 5 5 3 6 5 7 8 6 5 7 1 6 1 6 4 5 8 5 4 0 8 4 8 5 4 2 3 4 2 4 3 7 0 3 5 5 6 4 0 3 2 6 6 2 6 7 3 9 5 5 2 8 1 4 3 5 7 8 2 7 4 1 6 2 2 9 3 5 9 4 7 3 4 3 6 7 6 5 7 7 3 0 3 3 8 5 3 3 10 6 0 2 4 0 4 8 4 6 8 7 3 6 0 7 0 9 5 6 7 6 1 8 3 8 4 1 7 5 2 7 5 5 8 4 0 2 8 7 5 11 4 1 5 3 3 3 3 3 0 5 5 1 7 2 5 4 2 2 9 3 5 0 3 6 5 9 7 5 8 7 5 4 1 6 5 7 3 6 5 3 12 9 6 4 1 9 6 0 2 3 6 4 6 1 8 4 2 4 2 7 3 1 7 8 2 4 6 5 6 6 4 7 1 5 8 6 4 6 2 4 6 13 9 8 6 1 3 2 5 8 7 7 7 8 3 9 2 0 4 5 9 8 3 2 2 9 2 8 6 2 7 1 6 6 3 5 3 5 6 7 3 6 14 5 2 6 6 5 5 9 6 3 4 5 4 5 3 7 9 2 1 5 9 5 4 5 7 9 2 4 5 5 3 2 7 2 6 4 5 2 6 1 9 15 8 6 4 3 2 2 0 2 3 6 5 5 2 7 1 0 1 6 3 6 4 3 9 2 2 9 3 3 7 5 6 5 5 4 6 1 5 7 2 2 16 2 8 4 8 6 6 5 6 8 6 4 1 0 4 8 7 0 4 7 6 6 7 2 9 3 2 6 5 7 3 7 5 1 7 5 7 2 7 5 7 17 4 3 5 7 6 8 6 9 5 8 6 5 6 9 6 1 4 3 2 5 7 3 3 4 7 1 7 5 5 5 8 4 8 4 6 6 4 2 3 6 18 8 4 6 3 3 5 1 8 4 6 5 5 4 5 0 1 3 2 1 3 4 4 4 6 2 7 8 7 5 2 6 6 5 5 5 4 4 4 2 7 19 2 3 2 6 2 5 7 4 7 6 5 2 7 7 2 4 8 3 3 2 0 7 0 5 9 4 3 9 1 7 7 3 5 4 1 7 6 3 4 2 20 2 5 1 6 3 5 0 3 5 5 7 9 9 5 0 1 5 3 1 1 6 8 6 9 8 4 6 7 9 6 1 8 7 5 3 7 5 8 7 3 21 1 8 0 7 4 3 9 2 8 3 0 8 9 3 5 7 0 1 7 5 6 3 2 4 8 1 0 1 9 4 1 8 5 4 8 9 4 2 2 4 22 3 6 4 2 5 2 3 4 4 8 4 4 0 0 1 0 1 7 8 4 7 5 3 5 6 9 6 7 5 7 0 4 2 3 2 8 2 5 8 5 23 8 4 4 7 6 6 5 8 2 8 7 8 8 5 1 9 9 6 2 0 4 7 6 2 4 8 4 2 5 2 5 5 3 4 7 3 6 5 7 8 24 4 8 7 1 2 7 3 6 3 7 2 1 6 2 4 4 7 5 3 4 4 6 2 0 8 2 5 5 6 0 9 3 4 5 4 6 4 4 2 5 25 7 4 3 9 7 3 1 9 6 1 5 4 4 4 5 8 4 7 2 7 3 6 6 4 6 6 7 2 4 7 4 5 3 2 4 5 2 1 2 9 26 5 3 6 0 7 4 1 8 5 4 5 2 5 4 3 1 3 4 3 7 4 1 0 6 6 3 5 0 5 2 4 4 9 1 6 6 2 4 4 0 27 8 5 5 0 9 5 5 3 4 2 7 5 4 1 5 2 5 4 3 6 6 5 6 7 5 5 8 3 2 2 3 4 7 4 6 6 6 5 6 0 28 8 3 5 4 9 8 4 4 1 4 5 4 0 5 9 6 0 5 2 5 2 5 8 1 8 4 0 8 6 6 9 5 3 1 7 4 8 7 1 5 29 9 4 3 8 2 1 9 5 4 5 4 6 3 0 4 8 3 8 3 5 5 2 5 3 1 4 6 3 5 8 4 4 5 2 3 5 4 6 3 1 30 5 5 5 3 4 3 1 2 5 6 6 2 2 8 0 2 2 3 4 8 5 6 7 5 5 4 5 5 5 1 6 6 4 8 6 4 5 3 6 5 31 4 5 7 6 8 5 9 1 2 1 3 4 0 1 7 0 0 8 9 6 4 7 8 2 1 8 5 0 6 7 4 7 2 4 5 6 2 8 3 5 32 8 7 8 6 7 3 6 8 6 4 4 5 6 7 4 5 6 2 8 8 5 7 2 0 4 8 4 2 5 6 4 5 6 3 6 8 4 4 6 7 33 5 0 7 2 4 7 7 4 7 2 1 8 3 9 7 2 3 8 3 7 4 4 3 6 3 4 7 9 3 5 8 9 5 6 5 7 4 5 6 5 34 4 4 7 2 6 3 5 4 5 6 5 6 2 2 1 0 2 5 4 1 6 3 8 4 4 5 2 4 9 5 7 5 4 6 7 7 6 8 2 5 35 3 7 3 5 6 5 0 3 5 4 4 4 1 3 9 3 1 5 7 3 8 6 5 7 9 3 6 5 5 7 7 3 5 6 1 3 5 7 5 4 36 8 8 2 5 5 2 8 9 9 8 2 8 9 6 0 1 9 5 1 3 5 1 2 9 3 1 8 6 6 7 3 9 6 3 3 1 3 4 2 2 37 4 2 3 2 6 3 3 6 6 3 4 3 4 4 0 9 4 3 2 5 7 4 3 9 8 7 5 6 7 5 2 5 4 1 7 7 5 5 5 7 38 2 4 5 8 9 6 3 8 5 5 3 2 8 1 1 7 8 7 5 2 3 3 5 0 7 8 7 6 6 6 6 7 6 7 9 2 5 4 5 2 39 3 3 6 9 4 7 3 4 5 2 6 4 5 0 5 6 5 3 4 5 7 1 8 8 7 3 7 6 3 7 7 5 4 9 1 0 4 7 7 8 40 2 9 0 6 6 5 6 2 5 6 4 4 0 6 4 4 0 3 7 7 5 7 3 6 2 5 3 6 3 5 7 5 2 8 0 1 8 8 2 3 41 5 9 9 6 3 1 2 7 5 8 5 7 5 1 9 2 3 1 2 5 5 7 5 4 3 5 5 5 6 7 3 8 5 5 7 5 7 0 1 8 42 5 4 6 6 2 4 9 8 2 7 5 3 3 4 5 1 2 8 7 4 3 2 1 5 3 4 4 5 7 6 4 6 3 6 0 0 9 9 4 3 43 7 6 5 5 1 1 7 4 5 4 5 6 2 0 3 2 1 9 3 8 5 2 7 4 3 2 8 5 0 5 5 5 3 9 6 4 5 6 3 4 44 6 6 6 8 4 5 2 8 6 3 7 8 4 8 5 6 5 7 7 7 4 7 3 0 5 7 1 7 5 9 3 6 4 1 9 3 4 7 4 5 45 6 5 3 4 1 8 9 3 8 6 6 7 1 3 0 1 0 3 0 7 1 3 9 3 1 8 5 6 7 7 3 6 3 6 2 5 7 1 5 5 46 8 8 9 5 5 8 4 4 6 3 7 5 6 9 6 2 8 8 6 6 4 5 5 2 9 5 0 5 1 6 6 4 6 4 0 6 3 0 1 5 47 1 7 8 2 4 5 6 5 2 5 3 5 9 7 4 5 9 7 4 3 3 7 9 4 6 6 4 3 8 3 7 8 1 6 3 2 2 6 7 9 48 4 2 1 9 6 6 5 4 6 4 5 4 4 9 1 5 5 8 4 7 8 2 1 0 6 4 0 7 6 8 8 8 9 8 8 2 4 7 5 9 49 6 3 5 4 2 8 9 1 9 5 7 6 8 0 2 3 7 4 2 4 6 5 7 8 8 8 4 0 8 1 3 9 7 0 1 2 1 7 5 1 50 9 8 0 4 3 4 4 2 5 6 3 6 3 5 6 0 3 3 1 3 8 5 5 3 4 3 5 6 3 5 6 5 2 5 5 7 5 6 2 2 1 Elaborada por Héctor Medina Disla. Octubre 2007. Protegido por derecho de autor Elaborado por Héctor Medina Disla. Septiembre 2009 20

×