1. TECNICAS DE INVESTIGACION EN CIENCIAS SOCIALES
Cátedra: Lago Martínez
1º Cuatrimestre 2011
Material de Cátedra
Silvia Lago Martínez
SELECCIÓN DE UNIDADES DE OBSERVACIÓN:
DISEÑOS PROBABILISTICOS Y NO PROBABILISTICOS
Una investigación politológica puede centrarse sobre innumerables cuestiones: desde el
comportamiento político, la participación política, el estudio de las políticas públicas, las
decisiones judiciales, las relaciones entre distintas instituciones, la organización de los
partidos políticos, el funcionamiento de las administraciones públicas, la representación
política, ideologías políticas, sistema político, partidos y grupos de presión, actitudes
políticas, relaciones internacionales, etc.
Se puede estudiar lo que se quiera, siempre que se haga con arreglo a reglas determinadas
que permitan avanzar en el conocimiento válido y confiable de la realidad política que
interesa al investigador.
El proceso de investigación está lleno de situaciones en las que se debe elegir: de que
fuentes obtener la información, que variables observar y cuáles ignorar, como definir sus
categorías, como seleccionar las unidades de observación, que técnicas de análisis utilizar,
etc.
Nos vamos a ocupar aquí de la selección de unidades de observación, en una investigación
cuantitativa, de cómo se lleva a cabo dicha elección dependerá en buena medida la calidad
de la información que se recoja. Por ello es de suma importancia la planificación y
ejecución del diseño de la muestra.
En esta clase vamos a ver en qué consiste el diseño muestral, en grandes líneas como hay
que proceder para la consecución de una muestra apropiada, que es una muestra, que tipos
de diseños muéstrales existen.
Una de las primeras decisiones a tomar es la especificación y acotación de la población a
analizar. Es esencial definir tanto la muestra (unidades observadas) como el universo
(conjunto de unidades de análisis tanto observadas como no observadas). De manera que
definimos:
POBLACIÓN: conjunto de unidades (pueden ser personas, familias, escuelas) sobre las
que se interesa el investigador y por lo tanto se desea obtener cierta información. La misma
debe estar definida conceptualmente, espacialmente y temporalmente. Por ejemplo un
estudio sobre comportamiento electoral tiene como universo al conjunto de los electores de
una determinada entidad territorial, podría ser los electores de la ciudad de Buenos Aires en
el segundo semestre de 2002
2. MUESTRA: es una parte de la población, sólo aquellas unidades que se observan, es un
grupo de unidades seleccionadas con la intención de estimar los valores verdaderos de la
población. Por ejemplo: estimar el promedio de edad de los electores, nivel educativo,
grado de cercanía a un partido político, voto en las últimas elecciones a Jefe de Gobierno
DEFINIR PARÁMETROS Y ESTADÍSTICOS
Una vez definida la población se procede al diseño de la muestra, la selección de las
unidades de dicha población sobre las cuales se va a obtener la información.
Por razones de economía (en tiempo y dinero), por decisión teórica u otras, u otras, rara vez
se observa a cada una de las unidades que lo conforman, por el contrario se decide la
extracción de una muestra de los integrantes del universo. Esta decisión depende
fundamentalmente de la estrategia de la investigación que se haya elegido para llegar a los
objetivos buscados.
A través de muestras se puede obtener, en muchos casos, la información requerida con un
ahorro sustantivo de recursos humanos, económicos y de tiempo sin que ello implique un
alejamiento de la realidad que se desea conocer.
De manera que la elección de una (o varias) de las modalidades de muestreo (probabilístico
o no probabilístico) se halla determinada por la confluencia de tres componentes claves en
la práctica de cualquier investigación: los objetivos, los recursos y el tiempo dado para su
realización.
Diseño de la muestra
Conjunto de operaciones necesarias para el desarrollo de una muestra:
Los métodos o técnicas de selección.
Las fórmulas de cálculos de los errores de muestreo.
Las fórmulas y cálculos del tamaño de la muestra.
Los métodos de estimación de los parámetros poblacionales a partir de los estadísticos
muestrales.
La teoría de muestreo indica los procedimientos o técnicas para extraer una parte o muestra
del colectivo o población que se quiere estudiar y del resultado de este análisis inferir o
afirmar algo del universo total.
Hoy sólo vamos a ver un aspecto de esta teoría, más específicamente los métodos o técnicas
de selección de una muestra.
Pero previamente vamos a ver un esquema que resume los distintos pasos que debemos
seguir para seleccionar una muestra:
3. PASOS EN EL PROCEDIMIENTO DEL MUESTREO
En el esquema que sigue diagramamos la secuencia de pasos para
seleccionar una muestra.
Unidades Elementales
Unidades de Muestreo
DEFINIR LA
Paso 1 POBLACIÓN
Cobertura
Períodos
Listas
Directorios
IDENTIFICA
Paso 2 R
Guías
EL MARCO
Mapas
4. Muestras Probabilísticas
SELECCIONA
Paso 3 R
EL TIPO DE
Muestras No Probabilísticas
Muestras Probabilísticas:
Aleatorio simple
Al azar sistemático
Estratificado
Por conglomerados o por áreas
ELEGIR EL
Paso 4 MÉTODO
DE
Muestras No Probabilísticas:
Coincidental o por conveniencia
Opinático
Por cuotas
Elección razonada
Dispersión de la variable
V. numéricas: varianza (σ 2)
V. cualitativas: (P x Q)
DETERMINA Nivel de significación (α )
Paso 5 R EL
Coeficiente de confianza (z)
TAMAÑO DE Error de estimación
V. numéricas: error abs (e)
V. cualitativas: error rel (e%)
Tamaño poblacional (N)
Universos finitos ( N ≤ 100.000)
o infinitos (N > 100.000)
5. Unidades elementales: es la unidad acerca de la cual se solicita información. Esta unidad
es la que suministra la base del análisis.
Unidades de muestreo: cada uno de los elementos que comprende la base de la muestra y
que figuran numerados o individualizados en el registro.
Descripción de la Cobertura: Debe darse una descripción exacta de la región geográfica
que alcanza la muestra, y delimitar espacialmente a la población representada por la
muestra. Por ejemplo: Capital Federal y 22 partidos del Conurbano Bonaerense.
Períodos: Fecha y duración del relevamiento de información con la muestra seleccionada.
Veamos un ejemplo: supongamos que realizamos un estudio sobre opinión política y
comportamiento electoral con el objetivo de conocer las opiniones sobre la
representatividad de los políticos y los partidos políticos en el marco de la crisis social,
económica y política de la argentina y su relación con la intención de voto a Jefe de
Gobierno para mayo de 2002. La técnica de recolección es la encuesta.
Unidad elemental: Hombre y mujeres de 18 a 65 años en el momento de la encuesta,
residentes en la Ciudad de Buenos Aires y en condiciones de votar.
Unidad de muestreo: 1ª Distritos electorales de la Ciudad de Buenos Aires, 2ª
Manzanas (conglomerado o àreas de 9 manzanas), 3ª Viviendas, 4ª Unidades familiares
(hogares), 5° elector, un miembro del hogar seleccionado al azar con probabilidad
proporcional de electores en el hogar..
Cobertura: a) Ciudad de Buenos Aires
Períodos: octubre / noviembre de 2002.
MARCO MUESTRAL:
Cualquier diseño muestral (máxime los probabilísticos) comienza con la búsqueda de
documentación que ayude a la identificación de la población de estudio. Por ejemplo un
censo general de población, un listado que comprende a las unidades de la población, un
padrón electoral, un mapa catastral con representación de manzanas, etc. La aplicación de
determinado tipo de muestreo no es indiferente. Depende de la información disponible
sobre el marco muestral, pero además condiciona el proceso y repercute en los errores
muestrales . De manera que lo importante es que ese marco muestral esté completo y/o
actualizado. En la medida en que el conocimiento de dicho marco sea más exacto, se
reduciría, en primer lugar, los sesgos que se podrían introducir por su desconocimiento.
Ejemplificación del marco muestral
En la “Encuesta Permanente de Hogares” (Diseño de la muestra, Plan de muestreo y
Organización del marco muestral de la EPH), para la primera etapa el marco muestral
estuvo integrado por todos los aglomerados urbanos de más de 100.000 habitantes que sean
capitales de provincias.
6. Desde el punto de vista político-administrativo las provincias están divididas en
departamentos (municipios). Estos departamentos han sido subdivididos a su vez, con
fines censales, en radios que se agrupan en fracciones.
Pero a medida que el tiempo transcurría los datos censales no ofrecían la adecuación
a la realidad que se requería para organizar el marco sobre ellos. Así es que, en todo el
proceso de incorporación de aglomerados urbanos al programa hubo que organizar los
marcos partiendo de las cifras censales pero completándolos o corrigiéndolos con cualquier
tipo de información disponible y realizando recorridos en terreno para establecer la
delimitación definitiva de la zona a estudiar.
Un aglomerado urbano: es un conjunto de localidades urbanas geográficamente
continuas entre sí, sin interposición de zonas no urbanas, que exceden los límites de
divisiones administrativas municipales o provinciales. Para diferenciarlo de su localidad se
le antepone el adjetivo Gran: “Gran Buenos Aires” (GBA), que incluye a la Capital Federal
y los partidos de Conurbano Bonaerense: Vicente López, San Isidro, Gral. San Martín, Tres
de Febrero, Lomas de Zamora, Morón, y Lanús, (cuyas superficies se integran totalmente al
aglomerado), más 15 partidos cuyas superficies se integran parcialmente al aglomerado,
constituyendo así los 22 partidos del Conurbano Bonaerense.
El marco muestral queda formado, entonces, para la Capital Federal, por ejemplo,
como un conjunto de distritos escolares (del I al XXII) que se subdividen en fracciones
censales (que agrupan viviendas), que a su vez se subdividen en radios censales (grupo con
un tamaño promedio de 300 viviendas), que a su vez se dividen en manzanas. 1
TIPO DE MUESTREO: el procedimiento mediante el cual se extrae una muestra de una
población dada. Como ya dijimos es toda parte representativa de un conjunto - población-
cuyas características debe reproducir en pequeño lo más exactamente posible.
Los tipos de muestreo son dos: probabilístico y no probabilístico.
Muestreo probabilístico
Se fundamenta en la aleatorización como criterio esencial de selección muestral. Las
condiciones básicas de representatividad son las siguientes:
a) Cada unidad de la población tenga una probabilidad conocida a priori de participar en
la muestra.
b) La elección de cada unidad muestral sea independiente de las demás.
c) El cálculo del error muestral puede hacerse dentro de unos márgenes de probabilidad
específico.
MÉTODOS DE MUESTREO PROBABILÍSTICO
Muestreo aleatorio simple: requiere de la existencia de un marco muestral, una vez
localizado se asigna a cada unidad de la población (en el listado) un número secuencial de
identificación para luego proceder a la extracción aleatoria de los integrantes de la muestra.
La selección puede realizarse por un proceso mecánico, por ejemplo una urna con bolitas
numeradas o bien por medio de una tabla de cifras aleatoria o con las mismas calculadoras
1
“Encuesta Permanente de Hogares”, Diseño de las muestras, Primera Etapa, INDEC, pág. 9.
7. científicas o un programa de computación o bien cualquier procedimiento que garantice
que:
a) Cada unidad de la población tenga una probabilidad igual de participar en la muestra.
Esta probabilidad viene determinada por la fracción de muestreo= n/N (tamaño de la
muestra/tamaño de la población).
b) Cada combinación de "n" elementos tenga igual probabilidad de ser seleccionado.
c) La selección muestral sea totalmente aleatoria hasta alcanzar el tamaño de la muestra
establecido. No obstante se aconseja extraer un número mayor de unidades como
reemplazo.
La elección de las unidades muestrales puede hacerse sin reemplazamiento (cuando cada
unidad de la población puede ser elegida una sola vez o con reemplazamiento (participa en
elecciones sucesivas). Lo habitual es sin reemplazamiento.
Cómo manejarse con la Tabla de números aleatorios se resume en los siguientes pasos:
PASO 1: Decidir la dirección en la que leerá la tabla (hacia abajo, hacia arriba, hacia la
derecha, incluso diagonalmente), entonces a ciegas deje caer un lápiz sobre la tabla de
números aleatorios y comience a leer.
PASO 2: Desde el punto de inicio comience a seleccionar números aleatorios sucesivos que
pueden potencialmente ser igualados a las unidades de población, para "n" menor que 100
seleccione números de dos dígitos, para "n" menos que 1.000 seleccione números de tres
dígitos.
PASO 3: las unidades de población cuyos números asignados concuerden con los números
obtenidos aleatoriamente constituyen la muestra aleatoria.
Este tipo de muestreo se aplica, fundamentalmente en investigaciones sobre poblaciones
pequeñas, plenamente identificables, más aún si son universos específicos y diferenciados.
En el caso de poblaciones grandes ofrece mayores dificultades
Ejemplificación del muestreo al azar simple
Supongamos que sobre la misma temática comentada arriba el interés se centra en conocer
la opinión sobre la llamada crisis de “representatividad” entre los miembros del Colegio
profesional de Ciencias Políticas de la ciudad de Buenos Aires, teniendo en cuenta que
nuestro universo o población no son todos los politólogos del país sino aquellos que se
encuentran colegiados en esa institución, el instrumento a utilizar es un cuestionario semi-
estructurado. Debemos contar con el listado actualizado de todos los miembros del Colegio,
y haber calculado el tamaño de mi muestra. Se numeran desde el 00 al último número que
corresponda según número de miembros. Luego recurro a la tabla de números al azar,
o puedo seleccionar otra fuente de extracción como el paquete estadístico SPSS, donde
se puede generar números aleatorios en la opción Selección aleatoria de casos (Random
Number Seed) del menú Transformar (Transform) de la ventana del Editor de Datos.
Decido leer la tabla de izquierda a derecha y continuar con la línea siguiente. Después
necesito elegir una cifra inicial al azar, si el número obtenido está fuera de la serie que nos
interesa, continuamos con otros números descartando aquellos que no entran en nuestra
serie. El primer número seleccionado que está dentro de la escala que necesitamos, por
ejemplo el N° 10 incorpora a un miembro, continuamos leyendo hasta llegar al 2º número
8. que es 02 .Continúo leyendo y aparece nuevamente la 02, por lo tanto realizo la muestra
con reemplazamiento y lo omito, continúo y la siguiente es la 00 Finalmente arribo al
número de miembros del colegio que forman parte de la muestra.
Muestreo Aleatorio Simple
Ventajas Desventajas
Tiende a reflejar todas las Listado completo (no siempre es
características de la población posible)
Facilidad de cálculos estadísticos Demanda tiempo en poblaciones
grandes
Las estimaciones realizadas son menos
precisas que las realizadas con una
estratificada.
Aumentan costos y tiempos cuando las
unidades si son individuos viven
distantes.
Muestreo al azar sistemático
Similar a aleatorio simple, hay que confeccionar un listado de todos los elementos que
incluye la población, la diferencia estriba en el método de selección de los casos. Consiste
en seleccionar los diferentes elementos de la muestra mediante intervalos preestablecidos, a
partir de uno de ellos elegidos al azar.
Se define la fracción ´k´ dada por el cociente:
N/n
La primera unidad se selecciona al azar simple entre las primeras k unidades del listado, y
las subsiguientes se seleccionan sistemáticamente cada fracción ‘k’.
Ejemplificación del muestreo al azar sistemático
Considerando el mismo listado del ejercicio anterior, para elegir una muestra por ejemplo
de 50 entre 200, la fracción ‘k’ es 200/50= 4. Se procede del mismo modo que en el
muestreo al azar simple: se lista, se enumera del nº 00 al nº 199, se elige al azar entre los 4
primeros números el que será el primer elemento de la muestra.
El segundo será igual al número obtenido + k
Y asi sucesivamente cuando llegamos a un número mayor al 200 y sabemos que K es 4,
contamos hacia abajo y continuamos contando en el inicio del listado hasta llegar a los 50
que conforman nuestra muestra.
La selección sistemática posee la ventaja de extender la muestra sobre toda la población,
ser de fácil aplicación, y conseguir un efecto similar al de la estratificación si las unidades
se han ordenado previamente siguiendo un cierto criterio. Por el contrario puede inducir
sesgos debido al hecho de que cada unidad en la muestra es seleccionada con una
periodicidad constante igual a Kn. Para evitar este peligro hay que hacer un estudio previo
9. del universo y de los listados que lo contienen, incluso podría “desordenarlos” para
preparar la selección de elementos muestrales.
Algunos autores consideran este muestreo desde el punto de vista estrictamente
estadístico como no probabilístico ya que si bien es correcto que una vez iniciado el
muestreo las probabilidades son las mismas para la primera selección -es decir para los n
sujetos que están incluidos en el número fijo-, una vez elegido este número, la
probabilidad de los sujetos 14, 18, 02 y 06 es 1, mientras que la probabilidad de cualquier
otro sujeto en el listado es 0
Muestreo Aleatorio sistemático
Ventajas Desventajas
No requiere del uso contínuo de la Tabla Desde un p.v. estadístico no es
de número aleatorios. probabilístico . Lo es al inicio 1º Paso
pero no en los siguientes Pasos.
La P de los seleccionados es 1 mientras
que la P de cualquier otro sujeto es 0
Extiende la muestra sobre toda la Puede inducir sesgos debido al hecho
población de cada unidad en la muestra es
seleccionada con una periodicidad
constante igual a kn.
Fácil aplicación y consigue un efecto Sesgos en los listados
similar al de la estratificación si las
unidades se han ordenado previamente
siguiendo un cierto criterio
Muestreo estratificado:
Este tipo de muestreo es conveniente cuando la población o universo puede ser dividido en
categorías o estratos o grupos que tienen un interés analítico, y que por razones teóricas y
empíricas presentan diferencias entre ellos. La ventaja es que se logra una mayor
homogeneización de la muestra final.
Por ejemplo uno puede estratificar una población según la edad, el género, la educación, la
situación ocupacional, el status socioeconómico, la afiliación política, etc. Si las unidades
son comunidades se puede estratificar según su nivel de desarrollo socioeconómico,
características de producción, geográficas.
Es decir que la estratificación en sí, la definición de cada uno de los estratos, es un
problema de los propósitos de investigación, tipo de preguntas que nos queremos responder
y teoría sustantiva.
Una vez definidos los estratos y dividido el universo en estratos o valores, según una o
varias variables, es posible diferenciar dos tipos de muestras estratificadas
a) Muestra estratificada proporcional: se asigna a cada estrato en la muestra un número
proporcional a la cantidad de casos del estrato en la población
10. b) Muestra estratificada no proporcional: no se guarda la proporción en relación con la
población. Generalmente se realiza aumentando el porcentaje en los estratos más
reducidos y disminuyendo de manera equivalente los demás con el fin de obtener una
mayor representación de dichos estratos en la muestra o de contar en ellos un número
suficiente de individuos para el análisis
Ejemplificación del muestreo estratificado proporcional
Si continuamos con el ejemplo anterior, si en lugar de seleccionar las unidades al azar
simple o sistemático, decidimos estratificar la población de acuerdo a la inserción laboral
de los politólogos, teniendo en cuenta su actividad principal en: administración pública (ya
sea nacional o provincial), en la actividad privada (relacionada con la profesión) o en la
actividad académica (docentes, investigadores), se debe tener en cuenta claramente cuál es
su actividad principal dado que las categorías no son excluyentes. Ahora supongamos que
tomamos a dichos profesionales de la institución que cuenta con una población de 500
asociados, determinada la inserción laboral, resulta que: 50 profesionales trabajan en
ámbitos privados, 300 en la administración pública y 150 en Instituciones académicas.
Supongamos que el tamaño de la muestra fuera de 50 casos, 50 casos representan el 10%
del total de la población. Si utilizáramos un muestreo aleatorio simple, la probabilidad de
que la muestra resultante contenga exactamente un 10 % de cada estrato es muy baja.
Nosotros queremos garantizar que vamos a obtener exactamente esa cantidad. Por eso
trabajaremos con un muestreo aleatorio estratificado proporcional.
Por lo tanto los tamaños de los estratos muestrales quedan determinados de la siguiente
manera.
Estratos Nº de personas en la % en la Población Nº de elementos en
población cada estrato
Actividad privada 50 10 5
Administración 300 60 30
pública
Actividad académica 150 30 15
Total 500 100 50
Paso 1: Estratifico la población en tres clases
Paso 2: Confecciono un listado independiente en cada estrato, enumerando a cada
profesional: los que se insertan en la actividad privada estarán enumerados de 00 a 49, los
de la administración pública de 000 a 299 y los académicos de 000 a 149.
Paso 3: Procedo a la elección por los métodos indicados en el muestreo aleatorio simple,
pero por separado para cada estrato
Ejemplificación del muestreo estratificado no proporcional
11. Siguiendo con el ejemplo anterior, mediante el muestreo estratificado proporcional no
contamos con suficientes casos de politólogos que trabajen en la actividad privada, solo
tenemos 5
Decido entonces que para los propósitos de mi análisis voy a necesitar 25 casos en cada
estrato, por lo tanto la muestra total va a ser de 75 casos. Este el muestreo no proporcional,
ya que no respeto la proporción original en el universo.
Estratos Nº de personas en la % en la Población Nº de elementos en
población cada estrato
Actividad privada 50 10 25
Administración 300 60 25
pública
Actividad académica 150 30 25
Total 500 100 75
2
Uno de los inconvenientes fundamentales de la estratificación no proporcional es la
necesidad de ponderar la muestra, si se desea la obtención de estimaciones muestrales
para el conjunto de la población. No se precisa de la ponderación cuando sólo se realizan
análisis individuales y /o comparativos entre los estratos.
Ponderación: proceso de asignación de "pesos" a cada estrato, de manera que logre
compensarse la desigual probabilidad de selección dada a cada unidad de población que
compone el estrato. Se devuelve a los datos su proporcionalidad.
La ponderación más usual consiste en dividir el porcentaje que representa el estrato en la
población entre el porcentaje que representa en la muestra. Este procedimiento se realiza
con cada uno de los estratos. DISTINGUIR ENTRE PONDERAR LA BASE Y
PONDERAR LOS ESTADÍSTICOS.
De esta manera se obtienen los pesos o coeficientes de ponderación, las que se
multiplicarán por cada una de las estimaciones muestrales de los estratos
correspondientes, para inferir los respectivos parámetros poblacionales.
Muestreo Estratificado
Ventajas Desventajas
Asegura la representación de
las Conocimiento previo de las
variables de estratificación características de la población, para
estratificar
Supone un menor error muestral, por lo Cálculos estadísticos más complejos
tanto mayor precisión de la estimación
muestral
No Proporcional: posibilita un mejor
conocimiento de grupos pequeños
2
Es una de las soluciones posibles. No es necesario que todos los estratos tengan la misma cantidad de casos.
12. Muestreo aleatorio por conglomerado o áreas
Primer paso: Consiste en dividir al conjunto total de la población en grupos o
subconjuntos llamados conglomerados. Lo que tiene en común con el estratificado es la
división de la población en grupos pero se diferencian en:
1) En el muestreo estratificado se busca la homogeneidad dentro del estrato y la
heterogeneidad entre los estratos. En el muestreo por conglomerados es a la inversa el error
muestral disminuye conforme aumenta la heterogeneidad dentro del grupo (conglomerado)
Cada conglomerado debe representar la variedad de componentes del universo.
2) En el muestreo estratificado se selecciona aleatoriamente una muestra para cada estrato
3) En el muestreo por conglomerados se extrae una muestra aleatoria de conglomerados,
sus integrantes formarán la muestra. En el muestreo estratificado, la unidad de muestreo es
el individuo. En cambio en el de conglomerados es el conglomerado o conjunto de
individuos.
Los conglomerados pueden ser las áreas geográficas que dividen a la población que se
analiza (municipio, distrito, áreas censales, viviendas) pero también pueden ser
organizaciones u instituciones (colegios, hospitales, cárceles, clínicas psiquiátricas, etc.).
Ejemplos de conglomerados o áreas:
Manzanas para estudiar viviendas
Hogares para investigar jefes de hogar
Aulas de clase para entrevistar a los alumnos
Colegios para entrevistar a los maestros
Muestreo aleatorio por conglomerados
Ventajas Desventajas
Disminuyen los costos de investigación Mayor error muestral (menor precisión
porque se concentran el trabajo de en las estimaciones) porque los
campo en un número limitado de puntos conglomerados suelen ser muy
de muestreo homogéneos (se puede reducir el error
aumentando en Nº de conglomerados)
Requiere cálculos estadísticos
complejos en la estimación del error
muestral.
Si a partir de una muestra por conglomerados, se extrae una nueva muestra, con referencia
a cada uno de los conglomerados previamente elegidos, y así sucesivamente, se está ante un
diseño muestral denominado muestreo polietápico.
MUESTREO POLIETAPICO
13. En este tipo de muestreo, la selección de las unidades últimas se realiza por etapas
sucesivas.. El polietápico consiste en una jerarquía de diferentes tipos de unidades, cada
unidad de primera etapa se divide, o es potencialemente divisible, en unidades de segunda
etapa etc. Las unidades de primera etapa se llaman unidades primarias de muestreo y a las
unidades subsecuentes, unidades de segunda etapa, etc; a las unidades finales se las suele
llamar unidades últimas de muestreo.
En el muestreo in etápico tiene mucha importancia la estructura del conglomerado. Se hace
referencia a su homogeneidad o heterogeneidad y a su tamaño. Lo primero influye en el
número de conglomerados que se selecciona, mientras que el tamaño en el método de
selección de los mismos.
Como los conglomerados no siempre tienen un tamaño similar y esto afecta al proceso de
selección de la muestra, ya que no deben tener la misma probabilidad de formar parte de la
muestra conglomerados con pesos poblacionales distintos.
Cabe aclarar que en general por razones de tiempo y dinero no se llevan a cabo diseños que
sean probabilísticos en todas las etapas del muestro, la última etapa, la selección del
encuestado, suele realizarse por cuotas, procedimiento que mencionaré mas adelante
cuando me refiera a las muestras no probabilísticas .
EJEMPLO DE MUESTREO POLIETAPICO A NIVEL NACIONAL
Estudio : Evaluación social de la autopercepción de los pobres en la Argentina. Banco
Mundial. Enero de 1999.
Los objetivos generales de la investigación se han centrado en la identificación de las
diversas formas de auto percepción de la situación de pobreza en diversos sectores de la
sociedad argentina. Ello ha comprendido la caracterización de los intereses y valoraciones
vigentes sobre la materia, la detección de áreas de responsabilidad institucional y
competencia en el desarrollo de políticas sociales específicas y el análisis de factores
asociados a situaciones de pobreza y exclusión en el caso de sectores de pobreza crítica.
La investigación abarcó dos etapas sucesivas.
a) La primera etapa se basó en la realización de una encuesta nacional, referida a
Opiniones y actitudes con respecto a la pobreza. Comprendió la realización de 1.200
entrevistas directas en domicilio, basadas en la aplicación de un cuestionario semi-
estructurado. La muestra diseñada especialmente para este estudio alcanzó una cobertura
nacional y se distribuyó en 29 ciudades: Capital Federal, GBA, Córdoba, Rosario, La Plata,
Mar del Plata, Santa Fe, Bahía Blanca, Paraná, Lobos, Dean Funes, Correa, Resistencia,
Posadas, Formosa, Pto Tirol, Las Palmas, Mendoza, San Juan, San Luis, Rivadavia, San
Miguel de Tucumán, Salta, Santiago del Estero, San Fernando del Valle de Catamarca, La
Rioja, Tafí Viejo, Neuquén y Comodoro Rivadavia.
La muestra fue diseñada según una estratificación por tamaño de ciudades y de acuerdo a la
pertenencia a Región. Se utilizaron cinco estratos poblacionales: Area Metropolitana,
ciudades mayores a 100 mil habitantes, ciudades entre 50 y 100 mil habitantes, ciudades
entre 10 y 50 mil habitantes y ciudades menores a 10 mil habitantes. La regionalización
utilizada es la sugerida por el INDEC en el Censo Nacional de Población y vivienda. Se
divide el País en 6 regiones: Metropolitana, Pampeana, Noroeste, Cuyo, Noreste y
Patagonia.
14. Comprendió, como se ha consignado, un total de 1200 casos, con un error de +/-2,8 %
global para los totales, para un nivel de confianza de 95%.
Las entrevistas se realizaron entre los días 18 y 25 de noviembre de 1998. El procesamiento
de la información se realizó mediante la utilización del programa SPSS.
b) La segunda etapa abarcó una encuesta metropolitana en la Ciudad de Buenos Aires, a
los efectos de aplicación de un segundo cuestionario más amplio y detallado, tambien semi-
estructurado de aproximadamente 60 preguntas.
En esta etapa se realizaron 600 entrevistas en hogares de la Ciudad de Buenos Aires,
conforme con un diseño muestral no proporcional, sobre representando los sectores socio-
económicos medios y bajos, a fin de garantizar la eficiencia de la base estadística. El
tamaño de la muestra implica un error standard de +/- 4.08% en los casos en que p=0.5, con
un nivel de confiabilidad de 95.5%. En la fase de procesamiento, los resultados finales
fueron debidamente ponderados para devolver a cada una de las zonas su peso real en el
universo estudiado. La selección de entrevistados se efectuó a partir de la determinación de
puntos muestra al azar, considerados como origen de rutas aleatorias para la selección de
hogares. Una vez seleccionado el hogar, la determinación del individuo a encuestar se
efectuó de acuerdo con cuotas predeterminadas de sexo y edad.
En este caso la selección de las unidades últimas de muestreo se realizó por cuotas.
EJEMPLO DE ESTUDIO DE COMPORTAMIENTO ELECTORAL
POLIETAPICO
Cuando los objetivos se refieren a comportamiento político y opinión pública el
procedimiento usual es “In-etápico” eligiendo aleatoriamente areas según información
censal, luego hogares y finalmente al encuestado que debiera hacerse aleatoriamente dentro
del hogar.
Volvamos al ejemplo citado más arriba, una encuesta sobre la opinión acerca de la
representatividad de la llamada “clase política” y el comportamiento electoral para las
elecciones de jefe de gobierno.
Como podemos observar en el cuadro siguiente sobre la elección de legisladores de la
Ciudad de Buenos Aires en 1997, se cuenta con información sobre la población de las 28
circunscripciones de la Ciudad de Buenos Aires. Se extrae una muestra aleatoria de
conglomerados. Los conglomerados no tienen el mismo tamaño (cantidad de población en
cada circunscripción), de manera que es posible diseñar la muestra según estratificación por
tamaño de las circunscripciones, o seleccionarlas por azar simple.
El padrón de electores de la Ciudad cuenta hoy con 2.572.268 electores, 10,3% del padrón
nacional.
Una vez seleccionados los conglomerados uno de los procedimientos prácticos más usuales
es el siguiente:
a) sobre cartografía del universo bajo estudio, 28 circunscripciones electorales, con una
escala que permita la identificación de manzanas y visualización de calles, una
posibilidad es cuadricular la superficie total de modo que las coordenadas tengan un
tamaño aproximado de tres por tres manzanas (PM: Punto Muestra).
15. b) Se enumeran y se sortean con la tabla de números al azar la cantidad de puntos muestras
necesarios para cubrir el tamaño de la muestra. Dentro de cada circunscripción se
cubren la cantidad de casos proporcional a la cantidad de electores de la misma. Esta es
la muestra base o muestra de áreas.
c) En cada punto muestra seleccionado se determina la manzana original (nº 1), también
por sorteo al azar, y las manzanas de reemplazo (manzanas números 2 al 9).
d) En la manzana señalada como manzana original se establecerá, también al azar, un n°
de vivienda, un intervalo de timbreo preestablecido (una vivienda por medio, por
ejemplo) según la densidad de viviendas en la zona.
e) El recorrido de todas las manzanas se efectuará en el sentido de las agujas del reloj,
ubicándose el encuestador con el brazo derecho pegado a la pared, e iniciará el
recorrido a partir de la esquina de arranque. Si el encuestador tuviera que hacer uso de
las manzanas de reemplazo, para completar la cantidad de encuestas por punto muestra,
lo hará según el procedimiento indicado.
f) Finalmente se sortea a la persona de 18 a 65 años en condiciones de votar con
probabilidad proporcional a la cantidad de electores en el hogar.
En síntesis se lleva a cabo el procedimiento de muestreo: estratificado por conglomerados
con selección de las unidades de primera etapa de forma proporcional, de segunda de forma
aleatoria simple y la última etapa por rutas y tablas aleatorias.
MÉTODOS DE MUESTREO NO PROBABILÍSTICO
Muestreo por cuotas
Los criterios a tener en cuenta a la hora de diseñar una muestra de cuotas hacen
referencia a las variables que se van a utilizar, en la práctica estas son difíciles de conseguir
entonces se tienen en cuenta variables demográficas o características específicas, como
grupos de edades, sexo, nivel socioeconómico, ciudadanos que hayan votado en la elección
presidencial anterior al partido XX, etc. La muestra se divide en cuotas (número de
personas de determinada clase) según parámetros poblacionales (datos censales, resultados
electorales nacionales).
En el ejemplo anterior la selección de unidades últimas de muestreo podría
realizarse por cuotas según parámetros poblacionales de edad, sexo y eventualmente NSE,
de acuerdo a los objetivos pude interesar tener en cuenta el voto anterior según resultados
electorales, pero justamente en este ejemplo es uno de los interrogantes que queremos
responder.
16. Cálculo de las cuotas de edad y sexo para una muestra de 400 personas de la Capital
Federal 3
Edad
Total 15-24 25-34 35-44 45-54 55-64 65 y +años
Hombres 172 34 34 29 22 24 29
43% 20% 20% 17% 12% 14% 17%
Mujeres 228 39 36 36 32 32 53
57% 17% 16% 16% 14% 14% 23%
Total 400 73 70 65 54 56 82
100% 18% 18% 16% 13% 14% 21%
Para que el proceso se acerque más a la realidad se suelen dar instrucciones
concretas a los encuestadores para evitar rutinas. Si se utiliza en la última etapa de del
muestreo en etapas se respetan los PM , la selección de la vivienda, incluso es posible el
retorno a la hogar a entrevistar al encuestado que reúne las características buscadas, etc.
Este muestreo es muy utilizado porque agiliza y simplifica el trabajo de campo. No
es un muestreo probabilístico y por ello no se pueden hacer estimaciones rigurosas, con
medición de errores muestrales e intervalos de confianza.
Ventajas Desventajas
Resulta más económico en tiempo y Supone un mayor error muestral
dinero que los probabilísticos
Fácil de administrar Inexistencia de algún método válido
para calcular el error típico
No precisa de un listado de la población No se pueden realizar estimaciones
rigurosas con medición de errores
muestrales e intervalos de confianza.
Dificultad para controlar el trabajo de
campo
Muestreo coincidental o accidental
Se define la circunstancia o lugar donde realizar las encuestas, según criterios del
investigador. En general se concurre a terminales de trenes, ómnibus, aviones, plazas,
avenidas comerciales, a la salida de supermercados, de espectáculos públicos, en puertas
de fábricas, bancos, colegios, etc. según los objetivos de investigación y las circunstancias
y hábitos de concurrencia de las unidades elementales. Con frecuencia se combina con el
muestreo por cuotas.
Muestreo opinático
3
Censo Nacional de Población y Vivienda, Capital Federal, Resultados definitivos, Características
seleccionadas, Serie B, Parte 1, INDEC, 1991, págs. 66-67.
17. El muestreo opinático tiene dos acepciones:
a) Cuando se toma en cuenta la opinión de un experto sobre la definición de las unidades
elementales. Es el caso de la formación de una muestra de líderes de opinión, prestigio
y poder y se recurre a expertos en relaciones públicas y periodistas para listar los
informantes clave; (denominado intencional por otros autores) y
b) Cuando se realizan reportajes a una muestra de opinantes para realizar una nota, o
cuando las audiencias de programas radiales o televisivos llaman por teléfono a las
emisoras para opinar o contestar una pregunta.
Estas muestras no son representativas, y cualquier aumento en el tamaño de la
muestra no mejorará su calidad muestral. Recordemos que la representatividad de una
muestra depende del procedimiento de selección al azar.