Your SlideShare is downloading. ×
0
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Estadistica ii
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Estadistica ii

589

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
589
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
30
Comments
0
Likes
1
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Song : without you by air supply Estadística Introducción a la estadísticaEstadistica (2003 – 2004) – UNFV-
  • 2. ¿Para qué sirve la estadística? La Ciencia se ocupa en general de fenómenos observables La Ciencia se desarrolla observando hechos, formulando leyes que los explican y realizando experimentos para validar o rechazar dichas leyes Los modelos que crea la ciencia son de tipo determinista o aleatorio (estocástico) La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza “La Bioestadística [...] enseña y ayuda a investigar en todas las áreas de las Ciencias de la Vida donde la variablidad no es la excepción sino la regla”
  • 3. Definición La Estadística es la Ciencia de la • Sistematización, recogida, ordenación y a tiv presentación de los datos referentes a un fenómeno rip que presenta variabilidad o incertidumbre para su scDe estudio metódico, con objeto de • ddeducir las leyes que rigen esos fenómenos, ad b ili b aPro • ia y poder de esa forma hacer previsiones sobre los c en mismos, tomar decisiones u obtener conclusiones. er f In post-grado en administración - 2004 -
  • 4. Pasos en un estudio estadístico Plantear hipótesis sobre una población  Los fumadores tienen “más bajas” laborales que los no fumadores  ¿En qué sentido? ¿Mayor número? ¿Tiempo medio? Decidir qué datos recoger (diseño de experimentos)  Qué individuos pertenecerán al estudio (muestras)  Fumadores y no fumadores en edad laboral.  Criterios de exclusión ¿Cómo se eligen? ¿Descartamos los que padecen enfermedades crónicas?  Qué datos recoger de los mismos (variables)  Número de bajas  Tiempo de duración de cada baja  ¿Sexo? ¿Sector laboral? ¿Otros factores? No tenéis que Recoger los datos (muestreo) entenderlo (aún)  ¿Estratificado? ¿Sistemáticamente? Describir (resumir) los datos obtenidos  tiempo medio de baja en fumadores y no (estadísticos)  % de bajas por fumadores y sexo (frecuencias), gráficos,... Realizar una inferencia sobre la población  Los fumadores están de baja al menos 10 días/año más de media que los no fumadores. Cuantificar la confianza en la inferencia  Nivel de confianza del 95%  Significación del contraste: p=2%
  • 5. Método científico y estadística Plantear Diseñar hipótesis experimento Obtener Recoger datos conclusiones y analizarlos
  • 6. Población y muestra Población (‘population’) es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia).  Normalmente es demasiado grande para poder abarcarlo. Muestra (‘sample’) es un subconjunto suyo al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones)  Debería ser “representativo”  Esta formado por miembros “seleccionados” de la población (individuos, unidades experimentales). maestría en administración - 2004 -
  • 7. Variables Una variable es una característica observable que varía entre los diferentes individuos de una población. La información que disponemos de cada individuo es resumida en variables. En los individuos de la población española, de uno a otro es variable:  El grupo sanguíneo  {A, B, AB, O}  Var. Cualitativa  Su nivel de felicidad “declarado”  {Deprimido, Ni fu ni fa, Muy Feliz}  Var. Ordinal  El número de hijos  {0,1,2,3,...}  Var. Numérica discreta  La altura  {1’62 ; 1’74; ...}  Var. Numérica continua jfgt
  • 8. Tipos de variables Cualitativas Si sus valores (modalidades) no se pueden asociar naturalmente a un número (no se pueden hacer operaciones algebraicas con ellos)  Nominales: Si sus valores no se pueden ordenar  Sexo, Grupo Sanguíneo, Religión, Nacionalidad, Fumar (Sí/No)  Ordinales: Si sus valores se pueden ordenar  Mejoría a un tratamiento, Grado de satisfacción, Intensidad del dolor Cuantitativas o Numéricas Si sus valores son numéricos (tiene sentido hacer operaciones algebraicas con ellos)  Discretas: Si toma valores enteros  Número de hijos, Número de cigarrillos, Num. de “cumpleaños”  Continuas: Si entre dos valores, son posibles infinitos valores intermedios.  Altura, Presión intraocular, Dosis de medicamento administrado, edad
  • 9.  Es buena idea codificar las variables como números para poder procesarlas con facilidad en un ordenador. Es conveniente asignar “etiquetas” a los valores de las variables para recordar qué significan los códigos numéricos.  Sexo (Cualit: Códigos arbitrarios)  1 = Hombre  2 = Mujer  Raza (Cualit: Códigos arbitrarios)  1 = Blanca  2 = Negra,...  Felicidad Ordinal: Respetar un orden al codificar.  1 = Muy feliz  2 = Bastante feliz  3 = No demasiado feliz Se pueden asignar códigos a respuestas especiales como  0 = No sabe  99 = No contesta... Estas situaciones deberán ser tenidas en cuentas en el análisis. Datos perdidos (‘missing data’)
  • 10.  Aunque se codifiquen como números, debemos recordar siempre el verdadero tipo de las variables y su significado cuando vayamos a usar programas de cálculo estadístico. No todo está permitido con cualquier tipo de variable.
  • 11.  Los posibles valores de una variable suelen denominarse modalidades. Las modalidades pueden agruparse en clases (intervalos)  Edades:  Menos de 20 años, de 20 a 50 años, más de 50 años  Hijos:  Menos de 3 hijos, De 3 a 5, 6 o más hijos Las modalidades/clases deben forman un sistema exhaustivo y excluyente  Exhaustivo: No podemos olvidar ningún posible valor de la variable  Mal: ¿Cuál es su color del pelo: (Rubio, Moreno)?  Bien: ¿Cuál es su grupo sanguíneo?  Excluyente: Nadie puede presentar dos valores simultáneos de la variable  Estudio sobre el ocio  Mal: De los siguientes, qué le gusta: (deporte, cine)  Bien: Le gusta el deporte: (Sí, No)  Bien: Le gusta el cine: (Sí, No)  Mal: Cuántos hijos tiene: (Ninguno, Menos de 5, Más de 2)
  • 12. Presentación ordenada de datos 7 6Género Frec. 5Hombre 4 4 3 2Mujer 6 1 0 Hom bre Mujer Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. Las dos exponen ordenadamente la información recogida en una muestra.jfgt
  • 13. Tablas de frecuencia Exponen la información recogida en la muestra, de forma que no se pierda nada de información (o poca).  Frecuencias absolutas: Contabilizan el número de individuos de cada modalidad  Frecuencias relativas (porcentajes): Idem, pero dividido por el total  Frecuencias acumuladas: Sólo tienen sentido para variables ordinales y numéricas  Muy útiles para calcular cuantiles (ver más adelante)  ¿Qué porcentaje de individuos tiene menos de 3 hijos? Sol: 83,8  ¿Entre 4 y 6 hijos? Soluc 1ª: 8,4%+3,6%+1,6%= 13,6%. Soluc 2ª: 97,3% - 83,8% = 13,5% Sexo del encuestado Número de hijos Porcentaje Porcentaje Porcentaje Frecuencia Porcentaje válido Frecuencia Porcentaje válido acumulado Válidos Hombre 636 41,9 41,9 Válidos 0 419 27,6 27,8 27,8 Mujer 881 58,1 58,1 1 255 16,8 16,9 44,7 Total 1517 100,0 100,0 2 375 24,7 24,9 69,5 3 215 14,2 14,2 83,8 Nivel de felicidad 4 127 8,4 8,4 92,2 Porcentaje Porcentaje 5 54 3,6 3,6 95,8 Frecuencia Porcentaje válido acumulado 6 24 1,6 1,6 97,3 Válidos Muy feliz 467 30,8 31,1 31,1 7 23 1,5 1,5 98,9 Bastante feliz 872 57,5 58,0 89,0 Ocho o más 17 1,1 1,1 100,0 No demasiado feliz 165 10,9 11,0 100,0 Total 1509 99,5 100,0 Total 1504 99,1 100,0 Perdidos No contesta Perdidos No contesta 8 ,5 13 ,9 Total 1517 100,0 Total 1517 100,0
  • 14. Datos desordenados y ordenados en tablas Género Frec. Frec. relat. Variable: Género porcentaje  Modalidades: Hombre 4 4/10=0,4=40%  H = Hombre  M = Mujer Mujer 6 6/10=0,6=60% 10=tamaño muestral Muestra: MHHMMHMMMH  equivale a HHHH MMMMMM
  • 15. Ejemplo ¿Cuántos individuos tienen Número de hijos menos de 2 hijos?  frec. indiv. sin hijos Porcent. Porcent. + Frec. (válido) acum. frec. indiv. con 1 hijo 0 419 27,8 27,8 = 419 + 255 1 255 16,9 44,7 = 674 individuos 2 375 24,9 69,5 ≥50% 3 215 14,2 83,8 ¿Qué porcentaje de individuos 4 127 8,4 92,2 tiene 6 hijos o menos? 5 54 3,6 95,8  97,3% 6 24 1,6 97,3 7 23 1,5 98,9 ¿Qué cantidad de hijos es tal Ocho+ 17 1,1 100,0 que al menos el 50% de la población tiene una cantidad Total 1509 100,0 inferior o igual?  2 hijos
  • 16. Gráficos para v. cualitativas Diagramas de barras  Alturas proporcionales a las frecuencias (abs. o rel.)  Se pueden aplicar también a variables discretas Diagramas de sectores (tartas, polares)  No usarlo con variables ordinales.  El área de cada sector es proporcional a su frecuencia (abs. o rel.) Pictogramas  Fáciles de entender.  El área de cada modalidad debe ser proporcional a la frecuencia. ¿De los dos, cuál es incorrecto?.
  • 17. Gráficos diferenciales para variables numéricas 419 400 375 Son diferentes en función de que las 300 255 Recuento 215 variables sean discretas o continuas. 200 127 Valen con frec. absolutas o relativas. 100 54 24 23  Diagramas barras para v. discretas 17 0 1 2 3 4 5 6 7 Ocho o más  Se deja un hueco entre barras para indicar Número de hijos los valores que no son posibles 250  Histogramas para v. continuas 200 Recuento  El área que hay bajo el histograma entre 150 dos puntos cualesquiera indica la cantidad 100 (porcentaje o frecuencia) de individuos en 50 el intervalo. 20 40 60 80 Edad del encuestado
  • 18. Diagramas integrales Cada uno de los anteriores diagramas tiene su correspondiente diagrama integral. Se realizan a partir de las frecuencias acumuladas. Indican, para cada valor de la variable, la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo. No los construiremos en clase. Se pasan de los diferenciales a los integrales por integración y a la inversa por derivación (en un sentido más general del que visteis en bachillerato.)
  • 19. ¿Qué hemos visto? Definición de estadística Población Muestra Variables  Cualitativas  Numéricas Presentación ordenada de datos  Tablas de frecuencias  absolutas  relativas  acumuladas  Representaciones gráficas  Cualitativas  Numéricas  Diferenciales  Integrales
  • 20. Song : big in japan by Alphaville Inferencia estadística 1.- Principales conceptos. Muestreo. Distribución muestral de un estadístico. Principales distribuciones muestrales.Maestria en Administración –– Maestria en Administración(2003- 2004 ) )- -UNFV -- (2003- 2004 UNFV
  • 21. Principales conceptos en inferencia estadística Idea básica: Hacer inferencias sobre la población apartir de la muestra que hemos extraído de la misma. Ello nos lleva a tratar (brevemente) el tema del muestreo.Pensemos que la muestra habrá de ser representativa de lapoblación, para que podamos efectuar inferencias que tengansentido.
  • 22. Muestreo Definición: Proceso que nos permite la extracción de una muestra a partir de una poblaciónHay dos tipos básicos de muestreo:1. Muestreo probabilístico. En este tipo de muestreo, la probabilidad de aparición en una muestra de cualquier elemento de la población es conocida (o calculable). Es el único científicamente válido, y es sobre el que nos extenderemos especialmente.2. Muestreo no probabilístico. Es aquel en el que la selección de los elementos de la muestra no se hacen al azar.
  • 23. Muestreo probabilísticoEste muestreo garantiza que, a la larga, las muestras que se van obteniendo dela población sean representativas de la misma. Vamos a ver varios tipos demuestreo probabilístico.140 M eta 2002 Normalizada120100 80 60 % 40 0 8 . 20 p < N l s G o 3 o 0 tr T H T 3 to A n P A T o s o r D D IR P a e a C E n N D P t r u . to t e c r b a o 4 o V M c i n u Obs 2000 M eta 2001 M eta 2000 1. Muestreo aleatorio simple M 2. Muestreo estratificado 3. Muestreo por conglomerados 4. Muestreo por etapas (o polietápico) 5. Muestreo sistemático (?)
  • 24. Muestreo probabilístico1. Muestreo aleatorio simpleEs aquel en el que, a priori, todos los elementos de la muestra tienen la mismaprobabilidad de aparición.Supongamos que tengamos una población de 50.000 individuos, y quetenemos un listado con sus nombres. Si queremos elegir 100 personas, lo quenecesitamos es que el ordenador elija al azar a 100 individuos de esos 50.000.
  • 25. Muestreo probabilístico2. Muestreo estratificado En el muestreo estratificado, los investigadores han de dividir alos sujetos en diferentes subpoblaciones (o estratos), en función decierta característica relevante, y después lo que hacen es un muestroaleatorio simple de cada estrato.Evidentemente, cada individuo debe pertenecer a un estrato (y solo uno),y cada individuo del estrato habrá de tener la misma probabilidad de serescogido como parte de la muestra.Ejemplo: Supongamos que, en Cajamarca, 70% de los niños de primariavan a escuela pública y el 30% a concertada. Si queremos 1,000 niños, loque haremos es dividir los alumnos en 2 estratos (pública y concertada) yse eligen aleatoriamente 700 niños de la pública y aleatoriamente 300 dela concertada.
  • 26. Muestreo probabilístico3. Muestreo por conglomeradosEn el muestreo por conglomerados, en lugar de considerar cadaelemento de la población, lo que consideramos son“conglomerados de elementos”. El proceso es elegiraleatoriamente uno o varios conglomerados y la muestra estaráformada por TODOS los elementos de los conglomerados.Ejemplos:-En las encuestas durante las elecciones, los conglomeradospueden ser las mesas electorales, y lo que se hace es escogeralgunas mesas al azar (y de ahí se toman todos los votos de lasmesas seleccionadas).-En otros ejemplos, los conglomerados pueden ser los bloquesde viviendas, los municipios, etc.
  • 27. Muestreo probabilístico4. Muestreo por etapas En este caso se combina el muestreo aleatoriosimple con el muestreo por conglomerados:Primero se realiza un muestreo por conglomerados (v.g., si losconglomerados son colegios en Lince, se seleccionan aleatoriamentevarios de ellos).Segundo, no se eligen todos los alumnos (como ocurriría en un muestropor conglomerados), sino que se elige una muestra aleatoria. (Dichamuestra puede ser obtenida por muestreo aleatorio simple o puede serestratificado.)Es decir, hemos tenido 2 etapas de muestreo. Y claro está, es posibletener más de 2 etapas...
  • 28. Muestreo probabilístico5. Muestreo aleatorio sistemáticoSupongamos que tengamos una lista de N elementos (e.g., estudiantes de secundaria) y queramos una muestra de tamaño “n”. En este caso, lo que se hace es ordenarlos (v.g., en función de los apellidos) y después se elige aleatoriamente un elemento entre los N/n=k primeros, y luego se elige de manera sistemática el que esté k lugares después del primer elemento, y así sucesivamente.Ejemplo: Tenemos 10000 estudiantes (en una lista) y queremos obtener una muestra de 100 estudiantes. Primero elegimos al azar un estudiante entre los 10000/100=100 primeros (supongamos que salga el 26), el segundo elemento será el estudiante 100+26 (126), el siguiente será el 226, luego el 326, etc.
  • 29. Muestreo no probabilístico1. Muestreo sin norma (o de conveniencia) Se elige a una muestra por ser conveniente, fácil,económica. Pero no se hace en base a un criterio dealeatoridad. Ejemplo: las encuestas en los periódicos electrónicos;el muestreo habitual en los trabajos en psicología.2. Muestreo intencionalEn este caso, si bien el muestreo no es probabilístico, losinvestigadores procuran que se garantice larepresentatividad de la muestra
  • 30. Distribución muestral de un estadístico Supongamos que tenemos una variable aleatoria, cuya distribución es f ( x) Supongamos, por simplicidad, que obtenemos una muestra aleatoria simple con tamaño n = X1, X2, ... XnEntonces, un estadístico es cualquier función h definida sobre X1,X2, ... Xn y que no incluye parámetro desconocido alguno:Y=h(X1, X2, ... Xn)La distribución de dicho estadístico Y la vamos a denominar g(y)
  • 31. Distribución muestral de un estadísticoObservad: f(x) es la distribución de la v.a. bajo estudio g(y) es la distribución del estadístico que tenemosEs vital conocer la distribución muestral del estadísticode interés para poder efectuar inferencias sobre elparámetro correspondiente.Esto es, para efectuar inferencias sobre la mediapoblacional µ, necesitamos conocer la distribuciónmuestral de X
  • 32. Distribución muestral de la media Veremos primero el caso de que la distribución subyacente sea normal, con media µ y varianza σ 2 La media de la distribución muestral de medias es µ La varianza de la distribución muestral de medias esσ 2 /n La forma de la distribución muestral de la media es normal.Nota: La desviación típica de la distribución muestral suele ser denominada: error típico Nota: La desviación típica de la distribución muestral suele ser denominada: error típicode tal estadístico (v.g., “error típico de la media”, etc.) de tal estadístico (v.g., “error típico de la media”, etc.)
  • 33. Distribución muestral de la media. Ejemplo 1400 La línea (en este y sucesivos ejemplos) es una curva normal Distribución poblacional subyacente (dist. Normal):300 Media=100 (Varianza=225)200 Desv.Típica=15 Distribución muestral de la Distribución muestral de la100 media: media: Desv. típ. = 4.75 Tamaño muestral=10 Tamaño muestral=10 Media = 99.9 0 N = 3600.00 Media=100 Media=100 (Varianza=225/10=22.5) 82 84 86 88 90 92 94 96 98 10 10 .0 10 .0 10 .0 10 .0 11 .0 11 .0 11 .0 11 .0 (Varianza=225/10=22.5) .0 .0 8 6. .0 .0 .0 .0 .0 .0 .0 0 2 4 6 0 2 4 0 N10 En este y sucesivos gráficos: Número de réplicas Desv.típica= 22.5 = 4.74 Desv.típica=
  • 34. Distribución muestral de la media. Ejemplo 2500400 Distribución poblacional subyacente (dist. Normal):300 Media=100 Desv.Típica=15200 Distribución muestral de la Distribución muestral de la100 media: media: Desv. típ. = 3.36 Media = 100.0 Tamaño muestral=20 Tamaño muestral=20 0 N = 3600.00 Media=100 Media=100 88 90 92 94 96 98 10 10 10 10 10 11 11 11 (Varianza=225/20=11.3) .0 0. 4. 2. 4. .0 .0 .0 .0 .0 2. 6. 8. 0. (Varianza=225/20=11.3) 0 0 0 0 0 0 0 0 N20 Desv.típica=3.35 Desv.típica=3.35
  • 35. Distribución muestral de la media. Ejemplo 3700600 Distribución poblacional500 subyacente (dist. Normal):400 Media=100300 Desv.Típica=15200 Distribución muestral de la Distribución muestral de la media: media:100 Desv. típ. = 2.12 Media = 99.95 Tamaño muestral=50 Tamaño muestral=50 0 N = 3600.00 Media=100 Media=100 93 95 97 99 10 10 10 10 10 .2 .2 1. 3. 5. 7. .2 .2 9. (Varianza=225/50=4.5) 5 25 25 25 (Varianza=225/50=4.5) 5 5 5 25 25 N50 Desv.típica=2.12 Desv.típica=2.12
  • 36. Distribución muestral de la media Veremos ahora el caso de que la distribución subyacente sea arbitraria, si bien sabemos que la media es y la varianza sea σ 2 La media de la distribución muestral de medias es µµ La varianza de la distribución muestral de medias es σ 2 /nLa forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. En La forma de la distribución muestral de la media TAMBIÉN tiende a ser normal. Enconcreto, la distribución muestral se acercará más yymás a la distribución normal concreto, la distribución muestral se acercará más más a la distribución normal(media µ yyvarianza σ2/n) a medida que se aumente el tamaño de cada muestra. (media µ varianza σ2/n) a medida que se aumente el tamaño de cada muestra.
  • 37. Distribución muestral de la media. Ejemplo 4 Distribución poblacional subyacente (dist. GAMMA): p 100 La distribución GAMMA tiene 2 parámetros: Media=100= = = 100 λ 1 p 100 λ que es un parámetro de escala (1) Varianza=100= = = 100 λ 2 12 p que es un parámetro de forma (100) 0.045 0.04 0.035 0.03 0.025 0.02 0.015 0.01 0.005 0 80 85 90 95 100 105 110 115 120
  • 38. Distribución muestral de la media. Ejemplo 4500 Distribución poblacional subyacente (dist. GAMMA):400 Media=100300 Varianza=100200 Distribución muestral de la media:100 Desv. típ. = 3.12 Tamaño muestral=10 Media = 100.0 0 N = 3600.00 Media=100 90 92 94 96 98 10 10 10 10 10 11 (Varianza=100/10=10) .0 .0 .0 .0 .0 0. 2. 4. 6. 8. 0. 0 0 0 0 0 0 DISGAMMA Desv.típica= 10 = 3.16
  • 39. Distribución muestral de la media. Ejemplo 5Distribución poblacional (dist.EXPONENCIAL): La distribución EXPONENCIAL tiene 1Media=0.1=1/λ parámetro: λ (en el ejemplo: 10)Varianza=0.01=1/λ2 12 10 8 6 4 2 0 0 0.1 0.2 0.3 0.4 0.5 0.6Ejemplo de distr.exponencial en psicología: v.g., tiempo transcurrido entre 2 pulsacionesde una rata en una caja de Skinner.
  • 40. Distribución muestral de la media. Ejemplo 5a 400 300 Distribución poblacional (dist. EXPONENCIAL): Media=0.1=1/λ 200 Varianza=0.01=1/λ2 100 Distribución muestral de la Desv. típ. = .03 media: Media = .100 0 N = 3600.00 Tamaño muestral=10 .0 .0 .0 .0 .0 .0 .1 .1 .1 .1 .1 .1 .1 .1 .2 .2 .2 .2 Media=.100 69 69 94 31 44 56 81 94 06 19 31 44 56 81 06 19 31 44 EXPON10 (Varianza=0.01/10=.001)Observad que la dist. muestral se aproxima a la normal Desv.típica=.03
  • 41. Distribución muestral de la media. Ejemplo 5b 500 400 Distribución poblacional (dist. 300 EXPONENCIAL): 200 Media=0.1=1/λ Varianza=0.01=1/λ2 100 Desv. típ. = .02 Media = .099 Distribución muestral de la 0 N = 3600.00 media: .0 .0 .0 .0 .0 .1 .1 .1 .1 .1 .1 .1 .1 Tamaño muestral=20 44 56 69 81 94 06 19 31 44 56 69 81 94 EXPON20 Media=.100Observad que la distribución muestral se aproxima más a (Varianza=0.01/20=.0005)la normal (al elevar el tamaño muestral). Desv.típica=.022
  • 42. OTRAS DISTRIBUCIONES MUESTRALES (1)Distribución muestral de X− µ s/ n % Cuando la distribución de la que obtenemos las medias muestrales es gaussiana (“distr.normal”), la expresión anterior se distribuye según la distribución t de Student con tn-1 grados de libertad. (Esta distribución es básica para efectuar inferencias entre dos medias.) s12 % Asumiendo varianzasDistribución muestral de 2 s % poblacionales iguales 2 Cuando las distribuciones de la que obtenemos las varianzas muestrales son gaussianas, la expresión anterior se distribuye según la distribución F de Fisher con n1-1 grados de libertad en el numerador y n2-1 grados de libertad en el denominador. (Recordad que la distribución F es básica para la razón de varianzas: ANOVA.)
  • 43. OTRAS DISTRIBUCIONES MUESTRALES (2) Distribución muestral de ns 2 / σ 2 Cuando las distribución de la que obtenemos la varianza muestral es gaussiana, la anterior expresión se distribuye según la distribución chi-cuadrado con n-1 grados de libertad.jfgt
  • 44. Song . California dreaming by The mamas and the papas. Simulación a eventos discretos
  • 45. Independencia de las muestrasLos resultados de una corrida de simulación, son muestras dealguna distribución.Esos resultados los llamamos "respuestas".Las respuestas pueden ser: promedios de valores recolectados entoda o parte de la corrida, o simplemente una única medida (ej.largo de la cola al final de la corrida).Las respuestas son muestras de distribuciones, por lo tanto puedenvariar de una corrida a otra o en la misma corrida.El promedio de la distribución de respuestas la notamos µ y lollamamos la media (valor medio) de la distribución.
  • 46. Independencia de lasmuestrasCuando los resultados son promedios de valores recolectados enestado estacionario, una sola respuesta “puede” ser usada comola estimación de la media de la distribución.En sistemas terminales o no estacionarios siempre debenrealizarse varias corridas, de modo de obtener varias muestrascomo respuestas, tanto para calcular la media como paracalcular la varianza,
  • 47. Dispersión de la muestraLa dispersión de la variable aleatoria respecto de su media, semide mediante la desviación estándar σ o la varianza σ2.Si la varianza es grande quiere decir que no todos los valoresque toma la V.A. están cerca de la media.Para calcular la varianza de la distribución muestreada esnecesario obtener varias respuestas independientes.
  • 48. Análisis de resultados En general es aconsejable realizar varias corridas independientes para tomar varias muestras como respuestas tanto para calcular la media como la varianza (y la desviación estándar). Por lo tanto.... El análisis estadístico de los experimentos de simulación requieren de varias respuestas independientes x1, ...,xn. Cada una de estas muestras se obtienen a partir de alguno de los siguientes métodos.
  • 49. Métodos muestreo resultados(1) 1.- Se realizan n corridas que generan x1, ..., xn. Cada corrida con torrentes de números aleatorios diferentes e independientes. Cada corrida es una replicación. Se pueden registrar resultados solamente en determinados períodos de interés.
  • 50. Métodos muestreo resultados(2) 2.- El método de replicación en sistemas estacionarios. Los datos se toman solamente en el período estacionario, la muestra o resultado es un promedio de los datos obtenidos durante la corrida o replicación.
  • 51. Métodos muestreo resultados(3) 3.- Método batch means, usado en simulaciones de estado estacionario, aquellos que llevan mucho tiempo en alcanzar ese estado. Se corre el período run-in una sola vez; a partir de allí se registran valores de xi en intervalos sucesivos de tiempo de igual longitud, 1 ... n. Riesgo: correlación entre resultados sucesivos.
  • 52. Métodos muestreoresultados (4)4.-El método regenerativo se utiliza cuando nos interesanmedidas en períodos o instantes específicos(particulares) del tiempo.Por ejemplo nos interesa el largo de la cola cuando serompe una máquina (cantidad de máquinas rotas en esaocasión).Entonces consideramos un punto regenerativo (laruptura de la máquina), y se registra una muestraindependiente inmediatamente después de cadaruptura.
  • 53. Cálculo media y varianza Media, Varianza son los parámetros que mas interesan calcular. Si xi es la i-ésima respuesta de n replicaciones o batches entonces podemos estimar la media µ, n n ∑ ∑ (x − X) 2 xi 1  n 2 1 n   i 2 X= i= 1 s2 = i= 1 =  ∑ xi −  ∑ xi   n n− 1 n − 1  i= 1 n  i= 1       s2 un estimador sin sesgo de la varianza σ2 de las respuestas.
  • 54. Intervalo de confianzaNos interesa saber con qué grado de seguridad estamosestimando el valor medio de la distribución.La estimación es el promedio muestreado de un conjunto derespuestas, entonces el intervalo de confianza nos brinda unamedida de la confianza que le podemos tener a esaestimación;Los límites de un 95% de confianza son los puntos extremosde un intervalo alrededor de la media de la muestra; significaque la media de la distribución se muestreará con unaprobabilidad de 0.95.
  • 55. Intervalo de ConfianzaLa varianza de la media de la muestra de tamaño n es σ 2 s2 2 estimada mediante = sx n n n ∑ (x − X) 2 i 1  n 2 1 n   2 s2 = i= 1 =  ∑ xi −  ∑ xi   n− 1 n − 1  i= 1 n  i= 1      
  • 56. Intervalo de ConfianzaLos límites del 95% del intervalo de confianza se puedencalcular de tablas de distribución Student paramuestras pequeñas y de tablas de la distribuciónNormal para muestras grandes .Para la Normal los límites de un intervalo de confianzade 95% son X ± 1.96 s x
  • 57. Intervalo de Confianza P  x − λ α D < m < x + λ α D  = 1 − α = 0.95    2 2  λ α = 1.96 D = sx 2
  • 58. Otras técnicas de análisisLa Técnica predictiva se usa en simulaciones no terminales queno alcanzan estado estacionario.Se toma una medida de la media xt en un intervalo de tiempo t yse grafican los valores tomados (xt vs t) para tener una idea decomo varían los valores con el tiempo.Si queremos una idea mas precisa, se pueden realizar varias ydiferentes corridas y tomar promedios de ellas.También se puede usar técnicas de regresión múltiple paraajustar los valores obtenidos a algún tipo de curva, aunque aveces el patrón de conducta de xt puede ser complejo, lo quedificulta el análisis de la misma.
  • 59. Verificación de hipótesisEsta técnica se usa para determinar cuando las respuestas de simulacionescomparativas son significantes estadísticamente.Si x es una respuesta de una v.a de media µx de una corrida e y ( media µy) esla respuesta de la corrida con valores cambiados de las var. de decisión,entonces la hipótesis a verificar es µx = µy.Si realizamos n corridas para un conjunto de valores de las variables dedecisión y repetimos el mismo número de corridas para los valorescambiados, entonces la media muestreada de la primera experiencia es X yde la segunda es Y. La verificación se basa en la diferencia entre X e Y y cuánto se aleja ladesviación estándar de la media.El cálculo de la desviación estándar dependerá de cuan independientes sonlos valores xi e yi de las corridas realizadas (distribución t o Normal).
  • 60. Análisis de factores (1)Esta técnica estadística se utiliza para evaluar odeterminar los efectos que los cambios en lasvariables de decisión producen en las salidas oresultados de la simulación.Las variables de decisión se llaman factores, por lotanto corremos la simulación con distintos valoresasignados a los factores (niveles) para medir cuántoafecta a los resultados de la simulación, los distintosfactores ya sea individualmente como interactuandouno con otro.
  • 61. Análisis de factores (2)La complejidad del análisis creceexponencialmente con la cantidad de factores,ya que si tenemos n factores y nos interesa elfactor i medido en el nivel mi,tenemos Π mi diferentes posibles formas dehacerlo.Esto además se complica mas, si existe mas deuna salida a considerar.
  • 62. Análisis de factores (2)Esta técnica es usable para simulaciones con muchosfactores a ser testeados en varios niveles.Pero es una técnica muy costosa en tiempo y por lotanto muchos test estadísticos no pueden serterminados.De todos modos es valiosa para tener una idea oimágen de los efectos ocasionados por distintoscambios en los factores de la simulación. (Law yKelton 82).Depende tambien de la cantidad de torrentesaccesibles
  • 63. Resumen cap. 5Simulación terminal , estacionaria.Detección estado estacionario.Parámetros interesantescomo registrarlos y presentarlos.Facilidades de PascalSIM.Técnicas de Análisis de resultados
  • 64. Modelo de simulación Producir un modelo de simulación no es solamente escribir código. La estructura de la simulación y sus distribuciones se derivarán de : OBJETIVOS HIPOTESIS DE TRABAJO RESPUESTAS VARIABLES DE DECISION
  • 65. Modelo de simulación El modelo se compone de: + Objetivos, hipótesis, variables de decisión y respuestas, + diagramas de actividades + especificación + pesudocódigo + código
  • 66. Modelo de simulación OBJETIVOS deben ser claros, subjetivos o muy detallados, pero determinarán: i) las variables de decisión, ii) cuándo es necesaria una salida visual, un detallado tratamiento estadístico o ambos y iii) qué salidas son importantes.
  • 67. Modelo de simulación HIPOTESIS DE TRABAJO. Existen hipótesis implícitas al modelo y otras explícitas. Ambas deben ser documentadas. Los programas deben ser diseñados de forma de permitir cambios en etapas posteriores del proyecto. (reducen la complejidad del modelo)
  • 68. Modelo de simulación RESPUESTAS tipos de parámetros y medidas de interés, así como estadísticas y datos a recolectar para el análisis. VARIABLES DE DECISION. Los objetivos indicarán cuáles serán fijos y cuáles cambiables.
  • 69. Especificación Sala internación El sistema es una simplificación del problema real (describirlo). La especificación del problema está dada por el detalle de los objetivos, las hipótesis de trabajo, las variables de decisión, las respuestas y las duraciones de las distintas actividades (tabla 6.1) y el diagrama de actividades (fig 2.2).
  • 70. Especificación Sala internación Aclaración de hipótesis: a) El arribo de los pacientes se describe mediante Proceso Poisson de tasa constante (aproximación burda pero inicial) b) El sistema opera continuamente, cuando en realidad pacientes agendados para operación no arriban por la noche. Consideraremos el sistema en estado estacionario, por lo tanto investigaremos el efecto de cambiar valores de las variables de decisión en parámetros estables. (estudio completo cap 8). Medidas importantes: utilización de camas y tiempos de espera.
  • 71. ProgramaSe programa según algún método elegido.La sala de operaciones es agendada por dos tipos de eventos: fin de operación, y tiempo en que está cerrada.Se define una variable booleana que controla esas condicionesen la entidad "sala de operaciones" que siempre está en elcalendario (ver record en libro pag 107).Las variables de decisión se declaran como constante globales.
  • 72. ProgramaEl unidad de tiempo de la simulación es la hora.q4 es una cola ficticia, ventaja:cada actividad está compuesta por el par deeventos C y B, lo que facilita la modificaciónposterior del programa.Los histogramas se declaran ynuevos valores son ingresados cada vez que hayaun cambio en algún tipo de evento C o B.
  • 73. Período Run-inSimulación del Hospital es de tipo "Estacionaria",debemos determinar cuando comenzar a tomardatos para procesar.Utilizamos el método de promedios acumulados(tabla 6.2) se agrega código en la fase B delejecutivo para producir promedios de lasrespuestas cada 49 hs simuladas.La Fig 6.1 grafica los datos obtenidos.
  • 74. Período Run-inObservar que: la cola de solo internados y el tiempo deespera para operación alcanzan el estado establerápidamente ( se admite para operación si no haypacientes tipo solo internación).La estabilidad se alcanza alrededor de las 720 hs.En un proyecto real, se deben obtener un cierto númeroconsiderable de promedios acumulados de respuestas,usando diferentes torrentes de números para asegurarsede que realmente se ha alcanzado el estado estacionario.
  • 75. ResultadosSe simularon 14 días luego de alcanzada la estabilidad. Seutilizaron números distintos que los utilizados para determinar elperíodo run-in.Observar: - La distribución de las filas de "solo internados" ypacientes a operar, tienen una varianza grande. - Las camas han tenido un gran porcentaje de utilización( 20 en 318 hs de 336 simuladas) - 26 pacientes fueron operados y su tiempo de espera fuemuy variado. Cada corrida con un conjunto de diferentes torrentesproducen una replicación. Se necesitan varias replicaciones paraobtener datos mas acertados. Los datos ameritan reducción devarianza.
  • 76. Taller de reparacionesSimulación terminal. Alcanza estabilidadenseguida. Se toman datos durante toda lasimulación.Se podrían considerar las máquinas comovariables de decisión. La lógica del programase presta para adecuarlo a este cambio.A tener en cuenta: cómo continuar luego deteminada la jornada de trabajo (estudienlo!).
  • 77. Taller de reparaciones (2)Buena práctica: declarar los niveles de recursosy torrentes de número como constantes globales.Fácil de alterar durante la experimentación.Resultados: el número de máquinas rotas varióentre 0 y 10. La utilización de mecánicos fuemayor que la de equipos (84.25% vs 68.7%).Durante un gran período de tiempo losmecánincos estuvieron todos ocupados.
  • 78. IMPORTANTE 4.5 4 Maestristas a nivel 3.5 nacional en 3 administración 2.5 2 1.5 1 0.5 0 1998 1999 2000 Ejecutado
  • 79. MUESTREO POBLACIÓN DE TAMAÑO N MUESTRA DE TAMAÑO n
  • 80. Censo Muestreo Conocer parámetros Estimar parámetros+ Tiempo para realizarlo - Tiempo para realizarlo + Costo -Costo Personal profesional Promedio µ x Proporción P p Total T t
  • 81. MUESTREO ALEATORIO IRRESTRICTO (MAI; MSA) MUESTREO SISTEMÁTICO DISEÑOS DE IGUAL MUESTREO ESTRATIFICADO PROPORCIONALESTADÍSTICO NEYMAN ÓPTIMA POLIETÁPICO POR CONGLOMERADOS
  • 82. MUESTREO ESTUDIO DE QUE DISEÑO DE MUESTREO SE DEBE UTILIZAR MUESTREO CUAL ES EL TAMAÑO ÓPTIMO DE LA MUESTRA QUE CARACTERÍSTICAS DE LA POBLACIÓN DISEÑO DISEÑO DE MUESTREO PARÁMETRO A ESTIMAR (PROMEDIO, PROPORCIÓN, TOTALTAMAÑO DELA MUESTRA TAMAÑO DE LA POBLACIÓN N GRADO DE VARIABILIDAD σ NIVEL DE PRECISIÓN σ 2 NIVEL DE CONFIABILIDAD d t (TABLAS)
  • 83. MUESTREO SIMPLE ALEATORIO POBLACIÓN DE TAMAÑO N MUESTRA DE TAMAÑO n EN FORMA ALEATORIA
  • 84. PARA QUE SE UTILIZA: PARA ESTIMAR EL VALOR DE PARÁMETROS DE INTERÉS CUANDO LA VARIABILIDAD DECUANDO SE UTILIZA: LOS ELEMENTOS DE LA POBLACIÓN BAJO ESTUDIO, SEA MÍNIMASUGERENCIA CUANDO EL COEFICIENTE DEPRÁCTICA VARIACIÓN < 15 %
  • 85. ETAPAS EN UN ESTUDIO DE MUESTREO:1. OBJETIVOS DEL ESTUDIO2. DEFINICIÓN DE LA POBLACIÓN BAJO ESTUDIO3. ESTABLECIMIENTO DEL MARCO DE MUESTREO4. DEFINIR PARAMETROS A ESTIMAR5. MUESTREO PRELIMINAR6. DEFINIR EL DISEÑO DE MUESTREO7. DETERMINAR CONFIABILIDAD Y PRECISIÓN8. DETERMINAR EL TAMAÑO DE LA MUESTRA9. DEFINIR LAS VARIABLES BAJO ESTUDIO10.ESTRUCTURACIÓN DEL CUESTIONARIO11.PRUEBA DEL CUESTIONARIO12.REALIZACIÓN DEL TRABAJO DE CAMPO
  • 86. DETERMINACIÓN DEL TAMAÑO ÓPTIMO DE LA MUESTRA Nsn= 2  d N − 1  + s ENDSA Indicadores 1989 1994 1998 z  Tasa de mortalidad infantil (por   1000 nacidos vivos) Tasa global de fecundidad 99 5.6 75 4.8 67 4.2 Npq % de mujeres que usann= 12.2 17.8 25.3 anticonceptivos modernos 2  d % de niños menores de 5 años 13.3 15.7 7.6 con desnutrición moderada N − 1  + pq  z  Cobertura de Parto Institucional 37,6 42.3 59.2   Cobertura de IRA Cobertura de EDA 28.7 24 43.4 32.4 47.2 36.2 PAI Nsn= 2 DPT 3 Sarampión 28.4 57.5 42.8 55.7 48.6 50.8  d N − 1  + s Polio 37.8 47.5 39.1 Elaboración: Unidad de Reforma de Salud - MSyPS 1998 z  * Informe Preliminar  
  • 87. UNIDAD 5: TEORIA DEL MUESTREO EL MUESTREOPor ser la técnica del muestreo de aplicación casi general en las investigaciones sociales, es evidente la importancia que tiene su estudio y la necesidad en que se halla en investigador social de conocer por lo menos sus principios y prácticas básicos, aunque se trate de una materia basada en las leyes de azar y el cálculo de probabilidades, que pertenece al campo matemático de la estadística.Una muestra es una parte representativa de un conjunto, población o universo, cuyas características debe reproducir en pequeño lo más exactamente posible.De momo más científico, se pueden definir las muestras como una parte de un conjunto o población debidamente elegida, que se somete a observación científica en representación del conjunto, con el propósito de obtener resultados válidos, también para el universo total investigado.Las muestras tienen un fundamento matemático-estadístico. Este consiste en que obtenidos de una muestra, elegida correctamente y en proporción adecuada, unos determinados resultados, se puede hacer la inferencia o generalización, fundada matemáticamente, de que dichos resultados son válidos para el universo del que se ha extraído la muestra, dentro de unos límites de error y probabilidad, que se pueden determinar estadísticamente en cada caso.
  • 88. UNIDAD 5: TEORIA DEL MUESTREO : EL MUESTREOLas muestras presentan las siguientes ventajas:1. Mediante ellas, con una muestra relativamente reducida con relación al universo, se pueden encuestar grandes poblaciones y núcleos humanos, que de otra manera sería muy difícil o prácticamente imposible investigar.2. Las muestras suponen una gran economía en las encuestas y la posibilidad de mayor rapidez en su ejecución.3. Una muestra puede ofrecer resultados más precisos que una encuesta total, aunque esté afectada del error que resulta de limitar el todo a una parte.La condiciones de las muestras son:1. Que comprendan parte del universo y no la totalidad de este.2. Que su amplitud sea estadísticamente proporcionada a la magnitud del universo. Esta condición e halla en relación con el punto práctico de determinación del tamaño de la muestra y sirve para decidir si, según las unidades que comprende respecto al universo, una muestra es o no admisible.3. La ausencia de distorsión en la elección de los elementos de la muestra. Si esta elección presenta alguna anomalía, la muestra resultará por este mismo viciada.
  • 89. UNIDAD 5: TEORIA DEL MUESTREO EL MUESTREO• La selección de las unidades de observación es un paso primordial en toda investigación. De cómo se realice dicha operación dependerá la calidad de los resultados de la investigación.• Una de las primeras decisiones a tomar es la especificación y acotación de la población a analizar. Esta depende de cuál sea el problema y los objetivos principales de la investigación.• Universo o Población se refieren al conjunto total de elementos que constituyen un área de interés analítico. Comúnmente se entiende como un conjunto de unidades sobre las cuales se desea obtener información.• Las unidades pueden ser personas, familias, viviendas, organizaciones, artículos de prensa, etc.• Lo que constituye la población total está definido por problemáticas de tipo teórico. El universo puede ser la población total de la humanidad, la población de un país, de una región, etc.• En la definición y acotación de la población se deben mencionar ls características esenciales que la ubiquen en un espacio y tiempo concreto. Ej. En una investigación sobre la ocupación del tiempo luego de jubilar, una posible definición del universo de estudio sería la siguiente: Población de 65 años y màs que residen en la V región.
  • 90. UNIDAD 5: TEORIA DEL MUESTREO . EL MUESTREOUna vez definida la población, se procede al diseño de la muestra: la selección de unas unidades concretas de dicha población.Aunque el universo sea de pequeña dimensión, por razones de economía (en tiempo y dinero), rara vez se observa a cada una de las unidades que lo forman. Por el contrario, se decide la extracción de una muestra de entre los integrantes del universo.La representatividad depende del tamaño de la muestra y del procedimiento seguido para la selección de las unidades muestrales.Si a partir de los datos obtenidos en una muestra, quieren inferirse las características correspondientes de la población (parámetros poblacionales), es necesario diseñar una muestra que constituya una representación a pequeña escala de la población a la que pertenece.Los diseños muestrales probabilísticos se fundamentan en la Estadística Inferencial configurada a partir de la Teoría de las Probabilidades.Cualquier diseño muestral comienza con la búsqueda de documentación que ayude a la identificación de la población de estudio.Con el término marco se hace referencia al “listado que comprende las unidades de la población”. Puede ser un Censo general de la población, un registro de individuos o cualquier otro procedimiento que lleve a la identificación de los miembros de una población.
  • 91. UNIDAD 5: TEORIA DEL MUESTREO : EL MUESTREOLos elementos principales de la muestra son la base y la unidad de la misma.La base de la muestra es la población de la que se obtiene o saca la muestra.La importancia de la base de la muestra se deriva de que esa, operativamente, es elresultado de la elección de unidades dentro de una población o conjuntopreviamente determinado de aquellas. Por ello, fundamento básico de la muestra,es la existencia de un registro de dicho conjunto, en el que aparezcanindividualizadas todas sus unidades y permita realizar la elección mediante unsorteo riguroso.Esta concreción individualizada de las unidades del universo es el punto de partiday el fundamento necesario para realizar con rigor al elección en que consiste lamuestra y por ello se dice que constituye la base de la muestra en sentido estricto.Esta puede consistir en un Censo, un registro, una lista, un fichero, un catálogo, unmapa, un plano, etc.En la base de la muestra deben figurar individualizadas todas las unidades queforman la población con expresión de su número en el universo, nombre, domicilioen su caso, etc.La base de la muestra hace posible la identificación de los elementos que se hayanseleccionado mediante la muestra y su encuesta posterior.La base de la muestra no siempre existe. Ej. Público que circula por las calles ni losasistentes a un espectáculo. Aquí se elige una muestra con un procedimientoaleatorio imperfecto como encuestar uno de cada cinco que se encuentren en la
  • 92. UNIDAD 5: TEORIA DEL MUESTREO: REQUISITOS DEL MARCO MUESTRALEl marco muestral debe cumplir los siguientes requisitos para que sea un descriptor válido de la población:1. Debe ser lo más completo posible. La muestra escogida sólo podrá considerarse representativa de la población comprendida en el marco de muestreo elegido, es decir, a aquellos que han tenido la probabilidad de ser elegidos para participar en la muestra. Por esta razón, la comprehensividad se convierte en una exigencia básica de todo marco muestral.2. La comprehensividad del marco muestral conlleva la exigencia de su actualización. En la medida que el marco muestral se halle actualizado las posibilidades de omisiones se restringen. Por el contrario, aumenta la probabilidad de que éste contenga a los miembros reales de la población que representa.3. Cuando la investigación persigue la generalización de los datos muestrales (a la población que conforma el marco muestral) es preciso que cada componente de la población esté igualmente representado en el marco de muestreo. Es decir, no deben haber duplicidades.4. El marco muestral no debe incluir unidades que no correspondan a la población que se analiza. La inclusión de estas unidades reduce la probabilidad de elección de las unidades que sí pertenecen a la población.5. El marco muestral debe contener información suplementaria que ayude a la localización de las unidades seleccionadas: teléfono y dirección.
  • 93. UNIDAD 5: TEORIA DEL MUESTREOEJEMPLOS DE MARCOS MUESTRALESEjemplo de comprehensividad del marco de muestreo:La Guía Telefónica es un marco de muestreo habitual en una encuestatelefónica. Pero tiene restricciones porque limita la población a las personas conun número de teléfono registrado y excluye a aquellos que no tienen teléfono.Por otro lado, generalmente el número está registrado a nombre del jefe dehogar, apareciendo la mayoría hombres.Si la finalidad de la investigación fuese conocer la opinión de los psicólogosespañoles sobre su actividad profesional, un marco de muestreo idóneo sería eldirectorio de psicólogos colegiados. Pero la muestra sólo será representativa delos psicólogos colegiados y no de la totalidad de los psicólogos españoles.Tampoco incluye a los psicólogos que se han inscrito recientemente.Ejemplo de supresión en un marco de muetreo:Si se hiciera una encuesta a la población mayor de 40 años, habría quecircunscribir la población a esta cuota de edad. Las personas de 40 años ymenos deberían eliminarse del marco muestral. Esto podría hacerse a priori(antes de proceder a la extracción de la muestra) o a posteriori (una vez que lamuestra ha sido seleccionada). Aquí, de la muestra obtenida, se sustraenaquellas unidades que no pertenezcan a la población de interés. 93
  • 94. UNIDAD 5: TEORIA DEL MUESTREOELECCION DE LA MUESTRA  Operativamente la muestra es una selección de unidades dentro de un conjunto, que no es otro que la base de la muestra. Esta es, entonces, el resultado de una elección y por tanto, su bondad depende de la bondad de la elección.  La bondad de esta elección depende de dos condiciones fundamentales: una estadística y otra teórica.  De acuerdo con la primera, debe ser válida la generalización de los resultados obtenidos en la muestra a la población.  Según la teórica, la muestra elegida debe ser adecuada para el logro de la investigación y la prueba de las hipótesis teóricas que constituyan su razón de ser.  Estadísticamente, el principio básico de elección de la muestra es que ésta se haga, siempre que sea posible, de tal modo que cada elemento de la población tenga la misma probabilidad de ser elegido.  Esto se cumple si la elección tiene lugar por un procedimiento aleatorio riguroso.  Pero no siempre es posible realizarlo así, de aquí que existen diversos procedimientos de elección de la muestra que se pueden clasificar según se conozca o no la probabilidad de elección de cada unidad. 94
  • 95. UNIDAD 5: TEORIA DEL MUESTREO EJERCICIOS MUESTREODadas las investigaciones que se encuentran a continuación, determinerazonablemente si se basan en una muestra del universo correspondiente y si, encaso afirmativo, la muestra es correcta.Para realizar el sociograma de una clase, se pide a todos los alumnos queexpresen en una papeleta los nombres de sus compañeros de clase que lesgustaría tener sentados a su lado y aquellos que no.Respuesta: No es muestra pues fueron encuestados todos los alumnos de laclase.Para estudiar las prácticas sexuales de los varones en una prisión se entrevistó atodos los que se presentaron voluntariamente a responder el cuestionario que sehabía preparado.Respuesta: Genéricamente se puede decir que hay una muestra ya que se hizo laencuesta a sólo una parte del universo. Sin embargo, se trata de una muestraviciada, basada en un sistema de elección inadecuado, por lo que no se puedeconsiderar representativa del universo ni sus resultados extensibles a este.
  • 96. UNIDAD 5: TEORIA DEL MUESTREOEJERCICIOS MUESTREO Un antropólogo social ha convivido durante dos años con una familia típica de una localidad de Chile, se ha ganado su confianza y ha logrado que sus miembros le expusieran los aspectos de su vida de interés para su investigación. Respuesta: Este estudio, aunque se diga que se basa en una familia típica, no se puede considerar como muestra, pues un solo caso no es suficiente. Para estudiar las infracciones de circulación cometidas por no detención ante el signo PARE, un equipo permaneció de 8 de la mañana a 8 de la noche ante la señal durante tres días de la semana consecutivos. Respuesta: El universo son todas las infracciones. Como sólo se investiga una parte, se puede hablar de una muestra de todas ellas. Pero esta muestra es desviada y no representativa del universo porque sólo proporciona información de unas horas determinadas y de sólo tres días de la semana. post-grado en administración UNFV
  • 97. UNIDAD 5: TEORIA DEL MUESTREOEJERCICIOS MUESTREO Para predecir los resultados de elección municipal en una comunidad, el encuestador preguntó su candidato preferido a todos los hombres y mujeres con derecho a voto. Respuesta: No existe muestra pues se consulta a todo el universo y no parte de ellos. En otra elección a diputados en que se presentaba un candidato de derecha y otro de izquierda, se realizó el sondeo de opinión a una muestra elegida al azar con base en la lista telefónica, por medio del teléfono. Se obtuvo un resultado favorable al candidato de derecha, aunque fue elegido luego el de izquierda. Respuesta: En este sondeo, la muestra tampoco es representativa, aunque se halla escogido al azar. Presenta la distorsión que supone el hecho de que los que poseen teléfono son de un cierto nivel económico.
  • 98. UNIDAD 5: TEORIA DEL MUESTREOEJERCICIOS MUESTREO Para estudiar las actitudes políticas de una sociedad cultural que agrupa 5.000 miembros se ha decidido realizar una encuesta por cuestionario a 500 de ellos elegidos arbitrariamente, además de 200 entrevistas a otros tantos socios elegidos al azar, si bien en la realidad los entrevistadores se permitieron sustituir frecuentemente los socios elegidos por otros. Respuesta: Hay en los dos casos, en principio, muestra del universo. Sin embargo, la primera es inadmisible por cuanto no reúne la condición de basarse la elección en un procedimiento racional, si es posible al azar, y además se opone al principio de que dicha elección no debe ser arbitraria, pues hay un gran peligro de que prevalezcan criterios subjetivos en ella. En el segundo caso, la muestra correcta inicialmente ha resultado viciada en la realidad por la sustitución personal y, por tanto, subjetiva que los entrevistadores se han permitido.
  • 99. UNIDAD 5: TEORIA DEL MUESTREO: EJERCICIOS MUESTREOSupuestos los siguientes estudios que se ha pensado realizar por encuesta muestral, sepide indicar la base y la unidad de la muestra.Un estudio sobre las condiciones estructurales y funcionales de las asociaciones voluntariasprivadas de España, con exclusión de las económicas, religiosas, políticas y sindicales.Respuesta: La base de la muestra es el registro oficial de asociaciones. La unidad es cadaaosciación.Una investigación sobre la relación entre la estabilidad familiar y la clase social en una ciudadpequeña.Respuesta: La Base sería el Censo o padrón de vecinos de la ciudad. La unidad sería lafamilia.Un estudio sobre las condiciones de vivienda familiares de la zona madrileña de Vallecas.Respuesta: La base sería el plano de la zona. Las manzanas serían la unidad de la muestra Que tengas un buen día..

×