Your SlideShare is downloading. ×
0
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Estadística inferencial
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Estadística inferencial

666

Published on

Published in: Education
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
666
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
18
Comments
0
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Investigación Cuantitativa Su valor en la investigación basada en datos Por Sandra Crucianelli @spcrucianelli
  • 2. El Valor de la Observación Asociar cambios a noticiasUn rápido test de medición: ¿mayor puntaje en el menor tiempo? http://www.thatquiz.org/ Medidas y Gráficos de línea
  • 3. Dimensionando un problema Estadística DescriptivaAnaliza todos los casosEjemplos: censo nacional poblacional, censonacional agropecuario, censo electoral, censoeconómico.¿Otros casos de censos?¿Censos propios a partir de trabajos de campo?
  • 4. Dispersión de los datos Rango: es la diferencia entre el valor máximo y el valor mínimo en un grupo de números . Se expresa como un intervalo: [ 2- 40] Desviación típica o estándar : diferencia entre el valor de la variable y su media o promedio Varianza: cuadrado de la desviación. D y V: Nos indican qué tanto se aleja una serie de valores de la media o del valor esperadoMedidas de posición no centralesQuintiles: Es la quinta parte de una población estadística ordenada de menora mayor. Se calcula ordenando a la población desde el individuo más pobre almás adinerado, para luego dividirla en 5 partes de igual número de individuos;con esto se obtienen 5 quintiles ordenados por sus ingresos, donde el primerquintil ( Q1) representa la porción de la población más pobre y así hasta elquinto quintil (Q5), representante de la población más rica.Cuartiles: Medida de localización que divide la población o muestra en cuatropartes iguales.Otras medidas: decil (entre 10) y percentil (entre 100)
  • 5. CorrelaciónCuando 2 o + fenómenos crecen o decrecenen forma simultánea debido a factoresexternos.Si lo hacen al mismo tiempo, se dice queestán positivamente correlacionados.Si mientras uno crece, el otro decrece, sedice que están negativamentecorrelacionados.
  • 6. Estadística InferencialObtiene conclusiones generales apartir de una muestra en estudio, extraída del Universo a estudiar Permite formular predicciones Casos: encuestas electorales, de opinión pública, de mercadeo
  • 7. ¿Qué debe informar una encuesta? Ficha Técnica1) Tamaño del Universo y de la muestra2) Margen de error estadístico3) Nivel de confianza4) Método de muestreo5) Texto del cuestionario y fecha realización6) Autor de la encuesta7) Origen de la financiación del trabajo
  • 8. Ficha Técnica: condición de calidad Universo o Población: Se llama así al conjunto total de elementos que son objeto de estudio. Puede estar formado/a por personas, hogares, empresas u objetos. Muestra: Es una parte de ese universo que lo representa Tamaño de la muestra: Magnitud de los elementos que van a ser relevados, medidos o estudiados (factor determinante en el resultado) Error de muestreo: Error cometido y estimado, admitido por el encuestador. Se expresa como intervalos (+/- 5%) Nivel o Intervalo de Confianza: Probabilidad de que los resultados obtenidos se encuadren dentro del error admitido por el encuestador. En electorales, se trabaja con IC que varían entre el 95 y el 99% Z: (Zeta) Coeficiente que representa al IC
  • 9. ¿De dónde sale Z? Z = valor crítico de una distribución normal estandarizadaSe llama valor crítico al valor de Z necesario para construir un intervalo de confianza para la distribución.Normalmente en Estadística, la variable Z suele representar auna distribución normalizada, es decir la distribución normal con media 0 y desviación 1. Se calcula con la ayuda de tablas o software. Un nivel de confianza del 95% lleva a un valor Z de 1,96.
  • 10. Metodología de la Encuesta Determinar objetivo o necesidad de información Determinar el diseño del cuestionario y las fuentes de datos (estudio minucioso del padrón) Desarrollar un esquema para la recolección de datos Determinar el tamaño de la muestra Recolectar los datos Clasificación de datos Análisis de datos Conclusión
  • 11. Regla de la AleatoriedadTodos y cada uno de los miembros de una población sobre la que se pretenden generalizar los resultados (muestra) han de tener la misma probabilidad de formar parte de la muestra
  • 12. ¿Cómo cumplir con esta regla?Dar a cada miembro de la población enestudio la misma posibilidad de ser incluido,usando un método estadístico-matemáticocorrectoEl proceso en el que se agudiza esterequerimiento es en la determinación deltamaño de la muestra y la selección de losindividuos o elementos a incluir.
  • 13. Pirámide Poblacional En general, para que las conclusiones tengan representatividad la muestra se conforma según la distribución geográfica Ejemplo: muestra=1.000 ciudadanos Ciudad dividida en 8 secciones: Las mismas concentran el 25%-20%-15%-10%-9%-7%-8%-6% Se relevarán: 250, 200,150,100,90,70,80 y 60 personas respectivamente. Igualmente, edades y sexo deben responder a proporción de la pirámide
  • 14. Pirámide PoblacionalIndispensable para estudios generales (enespecial electorales)Encuestas representativas deben basarse eneste conceptoSin pirámide poblacional no hayrepresentatividad.Sin pirámide poblacional se viola la regla dealeatoriedad.
  • 15. Muestreo• Imposibilidad de analizar a toda la población.• Usa menos recursos y da buenos resultados.• El resultado nunca será “igual”, pero puede ser confiable.• Los intervalos de confianza, expresados en %, nos dan una idea de la probabilidad de que el valor obtenido se acerque al real.
  • 16. ProbabilidadConjunto de posibilidades de que un evento ocurra o no.La escala es de 0 a 1.Si un evento tiene P de no ocurrir, p=0.Si ocurre con certeza, p=1.Lo contrario, la posibilidad de que un evento no ocurra se denota con laletra q.La suma de p + q debe dar 1.Según lo anterior, la condición más desfavorable en este campo es:p = q = 0,5Está relacionado con el Principio de Incertidumbre.Cuando no hay estudios previos, se le asignan estos valores a p y q
  • 17. Cálculo Probabilidad Simple• Supongamos que una persona tiene 12 pares de medias, 5 de las cuales son marrones y 7 son negras...todas mezcladas.• Si se despierta todas las mañanas con poco tiempo y cuando abre el cajón, saca un par sin mirar ¿qué probabilidad tiene de sacar una marrón?• P = 5 / 12 (se calcula dividiendo 5 entre 12) = 0,4• Por lo tanto, multiplicando por 100, Daniel tiene un 40 % de probabilidad de sacar un par de medias color marrón... Obviamente, la probabilidad de que saque una negra es• P= 7 / 12 = 0,6 y en porcentaje el 60 %, aunque se podría haber llegado al mismo resultado restando (1 - 0,4), ya que como les expliqué, la suma de las probabilidades puras siempre da 1.• Este es el concepto más simple de probabilidad (dividir una parte entre el total) y luego multiplicar por 100
  • 18. Teoría de la Probabilidad P de formar parte de la muestraCiudad con 1.000.000 de electores (U)Muestra de 1.500 (m)P=m/U= 1.500/1.000.000= 0,0015Convirtiendo en %, si multiplicamos por 100, laP de un elector de ser elegido para formar partedel estudio es de 0.15 %
  • 19. A la inversa: Un encuestado ¿cuántos electores representa? Se lo llama Factor de Representación y como reporteros, lo podemos calcular. FR=U/m= 1.000.000/1.500= 666,666 ≈ 667 Conclusión: Un entrevistado representa a 667 empadronados.
  • 20. ¿Qué podrían calcular?1) La cantidad promedio de automóviles que circulan diariamente (excluya camiones y colectivos) y la cantidad de accidentes de tránsito que se producen diariamente. Con esos datos pueden calcular la probabilidad porcentual que un conductor tiene de ser víctimas de un accidente de tránsito2) Con el número de hogares totales y el número de hogares en los que diariamente se cometen delitos calificados contra la propiedad , podrían calcular la probabilidad % que cada hogar tiene de resultar víctima.3) En tiempos de encuestas electorales, con el dato de la cantidad de electores, si las consultoras realizan encuestas sobre n cantidad de personas (muestra) pueden calcular la probabilidad % que tiene un elector de formar parte de la muestra.
  • 21. Teoría del Muestreo Tiene por objeto estudiar a una población a partir de una muestra. Cualquier periodista medianamente entrenado puede estudiar una muestra (propia o ajena), con el objeto de encontrar una noticia o varias en los resultados. Tal actitud ubica al periodista en un rol activo y no en mero transmisor
  • 22. Tipos de muestreoVeremos los de uso corriente en periodismo:1) Método Aleatorio Simple2) Método Estratificado (Proporcional): Es el usado en encuestas electorales
  • 23. Muestreo AleatorioSe usa si se dispone de una lista total de loselementos de la población y el azar determina a cuálse estudiaráTodos los individuos tienen la misma chance deformar parte de la muestraMismo concepto del sorteo de loteríaNingún procedimiento debe violar la aleatoriedad dela medición
  • 24. Ejemplo Aleatorio SimpleEn una ciudad hay 900 médicos y quieroentrevistarlos para consultarlos sobre sus hábitos defumar.La muestra fue determinada en 270Numeraré a los 900 médicos y sortearé 270 Si uno no contesta: se da como parte de la encuesta(NC). Si no se lo encuentra, se sortea otro.
  • 25. Muestreo por Estratos (Proporcional)Se divide a la población por grupos (primeroregiones y luego circuitos).Se toma una sub-muestra de cada unomediante el método aleatorioRespeta pirámide proporcional (en número,edad y sexo)
  • 26. Ejemplo: estratificado proporcional para una ciudad• Ciudad con 100.000 electores• Muestra: 400• 6 circuitos electorales (35%, 25%,10%,10%,15%, 5%)• Calcular proporciones sobre la base de 400http://www.csgnetwork.com/csgpercent.html• Seleccionar la manzana al azar (aleatorio simple) dentro de cada circuito.• Se usan programas informáticos (SPSS)
  • 27. ¿Cómo determinar el tamaño de la muestra?• ¿Cuántos elementos debo medir para que ese conjunto sea representativo del total?• El tamaño de la muestra se calcula mediante fórmulas.• Previamente el investigador establece nivel de confianza y margen de error con los que trabajará.
  • 28. Datos previos IC Z80 % 1.2885 % 1.4490 % 1.6495 % 1.9697.5 % 2.2499 % 2.57
  • 29. Error Admitido: Se expresa en porcentaje en la ficha técnica, pero en las fórmulas se indica en decimales Ej: error del 5 %, en la fórmula va 0,05 Para investigación social, el error máximo admisible no debería superar el 5 % (criterio de calidad) En encuestas electorales, lo ideal sería trabajar con errores que van del 1 al 3 % Se expresan como intervalo: +/- 3%
  • 30. Regla• Trabajar con un nivel de confianza alto o con un margen de error pequeño. (¡90 no es alto!)• Es imposible combinar las dos situaciones optimas, salvo si se emplea una muestra muy grande.
  • 31. ¿De dónde sale el número 384? Tamaño de muestra Método Aleatorio SimplePrimera aproximación, independiente del Universo total:m= [Z² x (pq)] / e²(El cuadrado del coeficiente que corresponde al IC por elproducto de p por q (situación de proporcionalidad másdesfavorable), dividido entre el cuadrado del error estimado).m = [(1,96)².(0,5 x 0.5)] / (0,05)² = 384Tamaño de muestra que corresponde al IC 95 %, con error del+/- 5%Ajuste de la muestra:M= 384/ [1 + (384/U)] (Cuando conozco el Universo)
  • 32. Método estratificado proporcional (otra fórmula) Poblaciones < de 100.000 (Para IC 95%): Ciudades medianas o pequeñas Muestra error 4% error 5% error 10% 500 ----- 222 83 1000 385 286 91 2000 476 333 95 3000 517 353 97 4000 541 364 98 5000 556 370 98 10.000 588 385 99 15.000 600 390 99 20.000 606 392 100 25.000 610 394 100 50.000 617 397 100 100.000 621 398 100
  • 33. Poblaciones > 100.000 (electorales nacionales)Error Tamaño Muestra1% 10.0002% 2.5003% 1.1114% 6255% 4006% 2787% 2048% 1569% 12310% 100
  • 34. Verificación del error muestralLa verificación del error responde a una fórmula y su igualdad se debe cumplir e = Z √ (p q)/m• Error: = El coeficiente Zeta multiplicado por la raíz cuadrada de la división del producto p x q, dividido entre m (tamaño de la muestra)• O despejando de m = 4 (p x q)/e²Ejemplo:Encuesta con muestra de 700 encuestados, IC del 95 % y error del +/- 2 %• e = 1.96 √(0.5 x 0,5)/ 700 = 0,037• e % = 0,037 x 100 = 3,7 %• En realidad se trabajó con el (+/-) 3,7 % de error
  • 35. Cálculo de intervalos• Cantidato A : 20 % intención de voto• Cantidato B: 15 % intención de votoSi se trabajó con +/- 3 % error la predicción es: A: [17 % - 23 %] B: [12 % - 18%]
  • 36. Regla de la Aleatoriedad: ¿Se cumplió?• Mapa del país: Pirámide Poblacional. Cada región debe estar representada• Dentro de cada región: Pirámide poblacional. Cada circuito electoral debe estar representado• Dentro de cada circuito: Sorteo aleatorio de manzanas (al azar). Todas deben tener la misma posibilidad de salir sorteadas.• En cada manzana sorteada se elige un número aleatorio de hogares (al azar). Todos deben tener la misma posibilidad de ser elegidos.• En cada hogar seleccionado, cada morador debe tener la misma posibilidad de completar la encuesta.
  • 37. Nivel de éxito• Es el número de gente que respondió dividido por el número total de gente que se intentó contactar• Cuando la tasa de respuesta cae por debajo del 50 % el riesgo aumenta. Los no localizados pueden distorsionar demasiado el resultado (¿Se achica la muestra?)
  • 38. Niveles de Predicción• Dependen del momento en que se realice la encuesta. No se debe olvidar que una encuesta es una foto del momento en que se realiza.• Cuanto más nos acercamos al día de la elección, más predicción se obtiene.• La encuesta comienza a ser predictiva, en términos electorales, aproximadamente 30 días antes del día de la elección• El pronóstico se mantiene siempre y cuando el escenario político-social-económico no observe grandes cambios.
  • 39. Los demonios de Campbell (Donald T. Campbell- Harvard)• El contexto: Si se mide algo en dos momentos diferentes y se encuentra una diferencia, ésta puede deberse a factores externos.• La maduración: Si se mide algo en mismos individuos (políticos), hay que considerar que el paso del tiempo modifica posturas u opiniones y en consecuencia respuestas. Factor edad y sucesos influyen.• Regresión estadística: No conviene, basándose en estudios previos, analizar los extremos, ya que una nueva medición puede acercarlos hacia el centro (caso Brasil, aumento dólar y riesgo país)• Selección: Si dos grupos a comparar no fueron seleccionados aleatoriamente, la comparación no sirve.• Mortalidad de la muestra: Si la experimentación dura un cierto tiempo, resulta difícil mantener las mismas condiciones.
  • 40. Herramientas Digitales• http://www.newslab.org/links/calculatorlinks.htm• http://www.percent-change.com/• http://www.quickmath.com/webMathematica3/quickmath/page.js p?site=quickmath&s1=numbers&s2=percentages&s3=basic#reply• http://www.metric-conversions.org/es/calculadoras-para- conversiones.htm• http://www.csgnetwork.com/fincountdaysfromtocalc.html• http://jumk.de/calc/longitud.shtml
  • 41. Links EncuestasPLANIFICACIÓN DE LA COBERTURA ELECTORALhttp://aceproject.org/ace-es/topics/me/mef/mef02 FÓRMULAS ELECTORALEShttp://www.iidh.ed.cr/comunidades/redelectoral/docs/red_diccionario/formula%20electoral.htm10 REGLAS PRÁCTICAS DE CÓMO LEER ENCUESTAS ELECTORALEShttp://www.zagoyasociados.com.ar/index.php/informacion/articulos-de-interes/66-diez-reglas-practicas-de-como-leer- encuestas-electorales.htmlOBSERVATORIO ELECTORAL LATINOAMERICANOhttp://www.observatorioelectoral.org TECNICAS DE MUESTREOhttp://www.bioestadistica.uma.es/libro/node87.htm FIANCIAMIENTO DE CAMPAÑASwww.opensecrets.org CONSULTORIO POLÍTICOhttp://www.consultoriopolitico.org/VOTÁ INTELIGENTEhttps://votainteligente.com.ar/LA ESPIRAL DEL SILENCIOhttp://www.alipso.com/monografias/espiral_del_silencio_op/ FINANCIAMIENTO ELECTORALhttp://dineroypolitica.org/ EL GÉNERO EN LA COBERTURA ELECTORALhttp://www.slideshare.net/ACTransparencia/resultadosmonitoreo

×