Estadidtica descriptiva graficos

  • 37 views
Uploaded on

 

More in: Education
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
37
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
0
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. 1 Estadística Lic. Olga S. Filippini
  • 2. 2 Metodología de la Investigación • La investigación es un proceso – sistemático, – organizado y – objetivo destinado a responder a una pregunta • La respuesta lo que pretende es aclarar la incertidumbre de nuestro conocimiento.
  • 3. 3 ¿Qué investigar?¿Qué investigar? Definición del problemaDefinición del problema ¿Para qué?¿Para qué? Definición del propósitoDefinición del propósito ¿Qué estudiar concretamente? ¿Qué estudiar concretamente? Definición de los objetivosDefinición de los objetivos ¿Cómo?¿Cómo? Definición del tipo de diseño Definición del tipo de diseño ¿Preguntas a responder?
  • 4. 4 Esquema general del planteamiento de un estudio • Hipótesis de trabajo • Objetivos • Diseño de estudio • Selección de variables • Definición de variables • Escala de medida • Protocolo de recogida de datos • Construcción de bases de datos • Depuración de los datos • Análisis • Resultados • Conclusiones Estadística: Herramienta indispensable
  • 5. 5 Esquema del proceso de obtener conclusiones a partir de los datos OBJETIVO Materia Prima DATOS Procesamiento ORGANIZACION Y ANALISIS Producto CONCLUSIONES
  • 6. 6 El caso de análisis • Una empresa dedicada al alquiler de campos y producción de girasol recibe el ofrecimiento de 4 lotes para alquiler ubicados en 4 localidades diferentes. Todos los lotes ofrecidos tienen la misma superficie, los costos de producción son idénticos y se precisa obtener un rendimiento mínimo de 15 quintales/ha para obtener un resultado económico positivo. Se dispone de información sobre los rendimiento del girasol en los últimos 12 años de las 4 localidades donde se ubican los lotes ofrecidos. Usted es el asesor técnico de la empresa y se le pide que, a partir de dicha información, recomiende un lote para alquilar.
  • 7. 7 Objetivos del análisis de los datos • Para producir la recomendación pedida, deberá analizar los datos de modo de contestar la siguiente pregunta general: • ¿Cómo fueron los rendimientos de girasol de los últimos 12 años en cada una de las cuatro localidades? • En relación con esta pregunta general, interesará establecer y documentar, mediante gráficos y medidas, los siguientes puntos para cada localidad: • ¿Los rendimientos fueron altos o bajos? • ¿Los rendimientos fueron parejos entre años? • ¿Los resultados económicos negativos fueron frecuentes o raros? • ¿Los resultados económicos sobresalientes fueron frecuentes o raros?
  • 8. 8 Datos: rendimientos de girasol [kg/ha] Año Loc. A Loc. B Loc. C Loc. D 1994 1400 1900 2000 920 1995 4000 2600 1690 1600 1996 1150 500 1500 1180 1997 2400 1380 1700 750 1998 2200 960 1580 800 1999 3600 0 2100 900 2000 850 2100 1100 1230 2001 3400 1700 1650 1350 2002 1360 1940 1760 1150 2003 1940 1100 1550 1120 2004 2900 1300 1850 1450 2005 260 2230 1730 1130
  • 9. 9 En la actualidad el conjunto de métodos que la estadística brinda para atender todos los problemas hace que se la divida en 2 grandes campos, Estadística Descriptiva e Inferencial. Clasificación de la estadística moderna Cuadros representación de datos Tablas Gráficos Descriptiva Promedios Reducción de datos Dispersiones Predice, infiere Inferencial Trabajo en base a muestras Decide sobre las poblaciones
  • 10. 10 VARIABLE CUALITATIVAS O CATEGORICAS aquellas que indican una cualidad o sea una característica no medible o contable, a) Ordenables: cuando puede hacer una correspondencia lógica entre los valores de la variable y los números naturales. Ejemplo: x= resistencia a Roya =no resistente, resistente o muy resistente b) No ordenables: caso contrario al anterior. •Ejemplo : x= Pelajes = Bayo, Zaino, etc.
  • 11. 11 VARIABLE CUANTITATIVAS Las que indican características medibles o contables, a) Discretas : aquellas cuyos valores se interrumpen o separan. • Ejemplo : x= número de vacas de una granja en una determinada región. Los valores posibles son 0, 1, 2,... existe un salto o ruptura entre ellos, (por ejemplo entre 15 y 16, la variable x número de vacas, no puede tomar un valor 15,2). b) Continuas: aquellas cuyos valores posibles no tienen interrupción. • Ejemplo : x= peso de las vacas de una granja en una determinada región. Entre 400 y 500 kg podemos tener infinitos valores.
  • 12. 12 TAREA ESTADISTICA 1. Recopilación de datos 2. Presentación de datos 3. Análisis de datos 4. Interpretación de resultados
  • 13. 13 Definiciones básicas “Población es un conjunto de elementos definidos en el tiempo y en el espacio, sobre los cuales se realizarán las observaciones en el caso de una encuesta exhaustiva o censo, o a los cuales se referirán los resultados de la investigación en el caso de un estudio por muestreo”. “Muestra es el subconjunto de unidades seleccionadas de la población definida. En esta recae la realización de las observaciones”. “Valores poblacionales” Parámetros “Estimadores” Estadísticos
  • 14. 14 Los datos recopilados para cada sujeto , unidad de observación, ó expertimental pueden provenir de distintos tipos de variables y escalas de medición: Análisis de datos N o m in a l O r d in a l E s c a la d e m e d ic ió n C u a lita tiv a o A tr ib u to In te r v a lo R a z ó n E s c a la d e m e d ic ió n D is c r e t a C o n tin u a T ip o C u a n t it a tiv a o N ú m e r ic a V a r ia b le s
  • 15. 15 Unidad Estadística A cada elemento que integra la población se lo llama unidad estadística, unidad elemental o simplemente elemento. Para seleccionar una muestra, se toman unidades estadísticas de la población en estudio. Unidad de Muestreo Se designa de esta manera a cada uno de los grupos de unidades estadísticas, que se determinan con el objetivo de seleccionar la muestra.
  • 16. 16 Presentaciones visuales, reducción de datos Tablas, Gráficos y Distribuciones ¿Qué representación mental le sugiere la palabra estadística a la mayor parte de la gente ? Una tabla es una ordenación de datos en filas y columnas utilizada para documentar o comunicar información. Desde este punto de vista de su uso, existen dos tipos de tablas a saber : Tablas generales o de Referencia y Tablas Específicas o de Resumen
  • 17. 17 Distribución de una variable cuantitativa discreta Veamos con un ejemplo la tabla de distribución de frecuencias. En 13 cajones de huevos se contó la cantidad de huevos desechables por cajón: xi fi Fi fr = if n fri% Fr= F n Fr % 1 2 2 0,1538 15,38 0,1538 15,38 2 4 6 0,3077 30,77 0,4615 46,15 3 1 7 0,0769 7,69 0,5385 53,85 4 3 10 0,2308 23,08 0,7692 76,92 5 2 12 0,1538 15,38 0,9231 92,30 6 1 13 0,0769 7,69 1,0000 100,00 Totales 13 1,000 100,00
  • 18. 18 Distribución de una variable cuantitativa continua Ahora si lo que nos interesa son los índices de Productividad ponderado de 20 establecimientos estamos frente a una variable cuantitativa continua. En este caso los valores individuales carecen de interés, por la propia naturaleza de dicha variable, por lo tanto se los agrupa en los llamados “intervalos de clase”. La cantidad de intervalos necesarios para construir una distribución de frecuencias no se puede determinar por alguna regla precisa, depende de la experiencia y el sentido del investigador, generalmente se utilizan entre 5 -15.
  • 19. 19 Distribución de una variable cuantitativa continua El límite inferior del primer intervalo debe ser algo menor que el valor más pequeño de la variable, y el límite superior del último intervalo algo mayor al dato más grande. Definiendo: xmáx = valor extremo superior de la variable xmín = valor extremo inferior de la variable La diferencia entre estos dos valores nos da la “amplitud total” A=xmáx -xmín Si creemos que la cantidad de intervalos conveniente es h entonces la amplitud de los intervalos será aproximadamente a=A/h
  • 20. 20 Distribución de una variable cuantitativa continua Veamos por ejemplo... X= valor de índice de Productividad de 20 establecimientos. 45,0 55,0 48,9 40,5 42,8 52,0 49,0 52,5 51,7 50,0 50,0 56,5 57,0 52,0 45,0 49,0 44,3 41,0 59,2 46,3 Vemos cuál es el valor extremo inferior xmín =40,5 y el extremo superior, xmáx =59,2
  • 21. 21 Distribución de una variable cuantitativa continua Para obtener a= amplitud del intervalo. 4 5 20 5 4060 == − =a Los intervalos se construyen de tal forma que contienen al extremo inferior pero no al superior. Intervalo de clase fi Fi fri Fri 40,0 - 44,0 3 3 3/20=0,15 3/20=0,15 44,0 - 48,0 4 7 4/20=0,20 7/20=0,35 48,0 - 52,0 6 13 6/20=0,30 13/20=0,65 52,0 - 56,0 4 17 4/20=0,20 17/20=0,85 56,0 - 60,0 3 20 3/20=0,15 20/20=1,00 20 1,00
  • 22. 22 Distribución de una variable cuantitativa continua La representación gráfica correspondiente a la distribución de frecuencias simples o relativas de una variable cuantitativa continua es el HISTOGRAMA HISTOGRAMA 0 1 2 3 4 5 6 7 40,0 - 44,0 44,0 - 48,0 48,0 - 52,0 52,0 - 56,0 56,0 - 60,0 X FRECUENCIAS
  • 23. 23 1)Construya un tabla de frecuencias con 10 clases. 2)Construya un histograma que corresponde a la tabla anterior, 3)Realice un diagrama de tallo y hoja. 4)Construya un diagrama de caja. 5)Utilice la tabla de frecuencias para encontrar la media y el desvío estándar de los números de tomates que se rechazan. 29 58 80 35 30 23 88 49 35 97 12 73 54 91 45 28 61 61 45 84 83 23 71 63 47 87 36 8 94 26 95 63 86 42 22 44 88 27 20 33 28 91 87 15 67 10 45 67 26 19 Caso estudio Los siguientes puntajes representan el número de tomates rechazados en un día en un mercado mayorista. Los puntajes corresponden a 50 días seleccionados aleatoriamente:
  • 24. 24
  • 25. 25 Análisis de Datos
  • 26. 26 Análisis de Datos Histograma
  • 27. 27 Histograma
  • 28. 28
  • 29. 29 Medidas que resumen información Promedios y Dispersión Mediana Medidas de tendencia Central Modo Media Aritmética Promedios Media Geométrica Media Armónica Rango Medidas de variabilidad y concentración Desvío medio- Varianza Desvío típico (estándar) Rango intercuartilar Coeficiente de Variación
  • 30. 30 Valor Extremo leve Valores extremos leves Extremo o Outlier 3 D 1.5 D D H I N G E H I N G E M E D I A N A Diagrama de Caja (BoxPlot)
  • 31. 31 Coeficiente de Variación x S cv = se puede expresar como % 100* x S %cv = Si el CV ≤ 5% ----> datos muy homogéneos, Media aritmética muy representativa Si el 5% ≤ CV < 20% ----> datos con homogeneidad aceptable. La media aritmética es representativa Si el CV ≥ 20% ----> datos heterogéneos, la media aritmética es poco representativa
  • 32. 32 Loc DLoc CLoc BLoc A 4.000 3.000 2.000 1.000 0 7 Comparación de los rindes según localidades Descriptive Statistics 12 3740 260 4000 2121,67 339,319 1175,437 1381652 12 2600 0 2600 1475,83 217,519 753,506 567772,0 12 1000 1100 2100 1684,17 73,520 254,682 64862,879 12 850 750 1600 1131,67 74,619 258,486 66815,152 12 Loc A Loc B Loc C Loc D Valid N (listwise) Statistic Statistic Statistic Statistic Statistic Std. Error Statistic Statistic N Range Minimum Maximum Mean Std. Deviation Variance