Ucn Fundamentos De Estadadistica

2,581 views

Published on

Trabajo y taller para curso de Estadística de La Fundación Universitaria Católica Del Norte de Colombia

Published in: Education, Technology, Business
  • Be the first to comment

Ucn Fundamentos De Estadadistica

  1. 2. FUNDAMENTOS DE ESTADISTICA DESCRIPTIVA Una de las ramas de la Estadística más accesible a la mayoría de la población es la Descriptiva. Esta parte se dedica única y exclusivamente al ordenamiento y tratamiento mecánico de la información para su presentación por medio de tablas y de representaciones gráficas, así como de la obtención de algunos parámetros útiles para la explicación de la información. Es un primer acercamiento a la información y, por esa misma razón, es la manera de presentar la información ante cualquier lector, ya sea especialista o no. Sin embargo, lo anterior no quiere decir que carezca de metodología o algo similar, sino que, al contrario, por ser un medio accesible a la mayoría de la población humana, resulta de suma importancia considerarla para así evitar malentendidos, tergiversaciones o errores.
  2. 3. I. Medidas de tendencia Central <ul><li>Las Medidas de Tendencia central son la media, la mediana y la moda: </li></ul><ul><li>A. La Media : es la suma de los valores de los elementos dividida por la cantidad de estos. </li></ul><ul><li>Es conocida tambien como promedio , o media aritmetica </li></ul><ul><li>Ej: calcule la media de los siguientes numeros: </li></ul><ul><li>10,11,12,12,13 </li></ul><ul><li>10+11+12+12+13=58 </li></ul><ul><li>Dividir la suma por la cantidad de elementos </li></ul><ul><li>58/5 </li></ul><ul><li>El resultado es la media: 11.6. </li></ul><ul><li>Por o tanto, la media de los 5 numeros es 11.6. Note que la media esta entre el rango de elementos, en ete caso 11.6 esta entre 10,11,12 y 13 </li></ul>
  3. 4. Ejemplos de Media estadística <ul><li>9, 3, 7, 1 </li></ul><ul><li>La media de 9, 3, 7, 1 es 5 </li></ul><ul><li>5, 7, 9 </li></ul><ul><li>La media de 5, 7, 9 es 7 </li></ul><ul><li>8, 7 </li></ul><ul><li>La media de 8, 7 es 8 </li></ul><ul><li>5, 11, 7, 9 </li></ul><ul><li>La media de 5, 11, 7, 9 es 8 </li></ul>
  4. 5. Ahora usted Averigua la media de los números: <ul><li>3, 6 5, 9, 1, </li></ul><ul><li>2, 10, 7, 2, 11, 8, 1 </li></ul><ul><li>5, 1, 11 </li></ul><ul><li>2, 10, 4, 10, 9, 8 </li></ul><ul><li>7, 6, 11, 3 </li></ul><ul><li>1, 7, 6, 1, 7, 11 </li></ul><ul><li>11, 9, 4, 10, 8 </li></ul><ul><li>10, 5, 4, 5, 8, 5 </li></ul>
  5. 6. Recordemos Media estadística <ul><li>La media estadística es comúnmente llamada promedio: </li></ul><ul><li>Para averiguar la media de un grupo de números: </li></ul><ul><li>Suma los números todos juntos </li></ul><ul><li>Divide por la cantidad de números que fueron sumados </li></ul>
  6. 7. Medidas de tendencia Central <ul><li>B. Mediana estadística </li></ul><ul><li>La mediana estadística es el número central de un grupo de números ordenados por tamaño. Si la cantidad de términos es par, la mediana es el promedio de los dos números centrales: </li></ul><ul><li>Para averiguar la mediana de un grupo de números: </li></ul><ul><li>Ordena los números según su tamaño </li></ul><ul><li>Si la cantidad de términos es impar, la mediana es el valor central. </li></ul><ul><li>Si la cantidad de términos es par, suma los dos términos del medio y divide por 2. </li></ul>
  7. 8. Ejemplos de Mediana estadística <ul><li>La mediana de los números: </li></ul><ul><li>657, 523, 887 </li></ul><ul><li>La mediana de 657, 523, 887 = 657 </li></ul><ul><li>306, 287, 688, 354, 1004, 497 </li></ul><ul><li>La mediana de 306, 287, 688, 354, 1004, 497 = 425.5 </li></ul><ul><li>980, 963, 555 = 963 </li></ul><ul><li>La mediana de 980, 963, 555 = 963 </li></ul><ul><li>816, 751, 131, 932 </li></ul><ul><li>La mediana de 816, 751, 131, 932 = 783.5 </li></ul><ul><li>444, 361, 339, 435 </li></ul><ul><li>La mediana de 444, 361, 339, 435 = 398 </li></ul><ul><li>739, 834, 772, 1005, 808, 643 </li></ul><ul><li>La mediana de 739, 834, 772, 1005, 808, 643 = 790 </li></ul>
  8. 9. Ahora usted Averigüe la mediana de los números: <ul><li>268, 476, 284 </li></ul><ul><li>962,282,821,235 </li></ul><ul><li>981,204 </li></ul><ul><li>309,431,258 </li></ul><ul><li>1012,216,551,940,358 </li></ul><ul><li>818, 503, 545, 696 </li></ul><ul><li>939, 1018, 417, 341, 121, 739, 196 </li></ul>
  9. 10. Medidas de tendencia Central <ul><li>C. Moda estadística </li></ul><ul><li>La moda estadística es el valor que más se repite en un grupo de números. </li></ul><ul><li>Para averiguar la moda en un grupo de números: </li></ul><ul><li>Ordena los números según su tamaño. </li></ul><ul><li>Determina la cantidad de veces de cada valor numérico. </li></ul><ul><li>El valor numérico que más se repite es la moda. </li></ul><ul><li>Puede haber más de una moda cuando dos o más números se repiten la misma cantidad de veces y además este es el máximo número de veces del conjunto. </li></ul><ul><li>No hay moda si ningún número se repite más de una vez. </li></ul><ul><li>Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5. </li></ul><ul><li>Ahora usted busque la moda de: 5, 12, 9, 5, 8, 7, 1 </li></ul><ul><li>En una muestra pueden exister varias modas </li></ul>
  10. 11. Medidas de Dispersión <ul><li>E. Rango estadístico </li></ul><ul><li>El rango estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números. </li></ul><ul><li>Para averiguar el rango de un grupo de números: </li></ul><ul><li>Ordena los números según su tamaño </li></ul><ul><li>Resta el valor mínimo del valor máximo. </li></ul>
  11. 12. Ejemplos de Rango estadístico <ul><li>9, 4, 9 </li></ul><ul><li>El rango de 9, 4, 9 = 5 </li></ul><ul><li>8, 6, 3, 5, 7, 3, 2 </li></ul><ul><li>El rango de 8, 6, 3, 5, 7, 3, 2 = 6 </li></ul><ul><li>3, 2, 10, 5, 4, 6, 5 </li></ul><ul><li>El rango de 3, 2, 10, 5, 4, 6, 5 = 8 </li></ul><ul><li>8, 3, 4, 3, 5, 7 </li></ul><ul><li>El rango de 8, 3, 4, 3, 5, 7 = 5 </li></ul>
  12. 13. Ahora usted Averigüe el Rango estadístico de los números: <ul><li>8, 4, 1, 7, 8, 4, 3 </li></ul><ul><li>7, 5, 2, 4 </li></ul><ul><li>5, 4, 9, 1, 9, 5, 2, 7 </li></ul><ul><li>3, 1, 10, 2, 10 </li></ul><ul><li>4, 10, 2 </li></ul><ul><li>9, 10, 6, 4 </li></ul><ul><li>8, 3, 10 </li></ul><ul><li>8, 9, 8, 6, 10, 8 </li></ul>
  13. 14. Población y muestra <ul><li>Algo importante que hay que mencionar es que no siempre se trabaja con todos los datos. Esto por diversas razones, que pueden ser desde prácticas hasta por economía.  Por esta razón se considera un subconjunto del total de los casos, sujetos u objetos que se estudian y que se les obtienen los datos. La  población , entonces, es el total hipotético de los datos que se estudian o recopilan. Ante la imposibilidad ocasional de conseguir a la población, entonces se recurre a la  muestra , que viene siendo un subconjunto de los datos de la población, pero tal subconjunto tiene que contener datos que pueden servir para posteriores generalizaciones de las conclusiones. </li></ul>
  14. 15. I: Ejemplos de Construcción de tablas de frecuencia . <ul><li>Punto 1: Conjuntos de datos </li></ul><ul><li>  </li></ul><ul><li>Imagina que hemos preguntado a un conjunto de  N  personas qué opinión tienen acerca de la subvención (entiéndase ayuda monetaria) que el Gobierno ha concedido a los Grandes Industriales a través del Ministerio de Agricultura y de su programa Agro Ingreso. Las  N  respuestas se encuentran en una escala que va de 1 a 9, donde 1 representa un total desacuerdo con la subvención, mientras que 9 quiere significar un acuerdo total. </li></ul><ul><li>El resultado de la medición es el siguiente: </li></ul><ul><li>7 5 6 8 6 5 9 5 8 6 5 7 5 5 4 5 8 5 4 2 6 6 4 6 4 8 4 3 4  3 3 1 4 5 6 5 8 5 4 7 4 3 5 3 4 9 4 2  6 3 4 2 4 1 3 6 3 1 2 4 4 6 2 4 7 4 2 4 6 4 4 6 7 5 8 5 7 6 5 6 5 7 5 6  4 5 4 1 6 5 6 5 5 5 4 6 2 5 5 6 5 4 4 3 5 5 9 4 3 6 5 7 3 2  4 4 7 4 2 1 8 2 7 4 5 5 7 5 5 1 5 8 5  6 7 6 6 7 7 5 2 5 6 5 8 5 3 6 5 5    </li></ul><ul><li>Realiza Tabla 1:  Conjunto original de datos(vea ejemplos aquí masabajo) </li></ul>
  15. 16. REPASEMOS Y APLIQUEMOS 1 <ul><li>La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. </li></ul><ul><li>Las variables pueden ser de dos tipos: Variables cualitativas o atributos : no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). </li></ul><ul><li>Variables cuantitativas : tienen valor numérico (edad, precio de un producto, ingresos anuales). </li></ul><ul><li>Las variables también se pueden clasificar en: Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase). </li></ul><ul><li>Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). </li></ul><ul><li>Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase). </li></ul><ul><li>Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: </li></ul><ul><li>Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45). </li></ul><ul><li>Continuas : pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc. </li></ul>
  16. 17. REPASEMOS Y APLIQUEMOS 2 <ul><li>Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: </li></ul><ul><li>Individuo : cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. </li></ul><ul><li>Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. </li></ul><ul><li>Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. </li></ul>
  17. 18. REPASEMOS Y APLIQUEMOS 3 <ul><li>Medidas de posición central </li></ul><ul><li>Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos. </li></ul><ul><li>Las medidas de posición son de dos tipos: </li></ul><ul><li>a) Medidas de posición central : informan sobre los valores medios de la serie de datos. </li></ul><ul><li>b) Medidas de posición no centrales : informan de como se distribuye el resto de los valores de la serie. </li></ul><ul><li>a) Medidas de posición central </li></ul><ul><li>Las principales medidas de posición central son las siguientes: </li></ul><ul><li>1.- Media : es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las más utilizadas: </li></ul><ul><li>a) Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra: </li></ul><ul><li>Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información. </li></ul><ul><li>Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad. </li></ul>
  18. 19. REPASEMOS Y APLIQUEMOS 3 <ul><li>Medidas de posición central </li></ul><ul><li>2 .- Mediana : es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). </li></ul><ul><li>No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido). </li></ul><ul><li>3.- Moda : es el valor que más se repite en la muestra. </li></ul>
  19. 20. REPASEMOS Y APLIQUEMOS 4 <ul><li>Ejemplo: vamos a utilizar una tabla de distribución de frecuencias con los datos de la estatura de los alumnos </li></ul>Variable Frecuencias absolutas Frecuencias relativas (Valor) Simple Acumulada Simple Acumulada 1,20 1 1 3,3% 3,3% 1,21 4 5 13,3% 16,6% 1,22 4 9 13,3% 30,0% 1,23 2 11 6,6% 36,6% 1,24 1 12 3,3% 40,0% 1,25 2 14 6,6% 46,6% 1,26 3 17 10,0% 56,6% 1,27 3 20 10,0% 66,6% 1,28 4 24 13,3% 80,0% 1,29 3 27 10,0% 90,0% 1,30 3 30 10,0% 100,0%
  20. 21. REPASEMOS Y APLIQUEMOS 4 <ul><li>Vamos a calcular los valores de las distintas posiciones centrales: </li></ul><ul><li>1.- Media aritmética: </li></ul><ul><li>Xm = </li></ul><ul><li>(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3) </li></ul><ul><li>-------------------------------------------------------------------------------------------------- </li></ul><ul><li>30 </li></ul><ul><li>Luego: </li></ul><ul><li>Xm = </li></ul><ul><li>1,253 </li></ul><ul><li>Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm. </li></ul>
  21. 22. REPASEMOS Y APLIQUEMOS 4 <ul><li>3.- Mediana: </li></ul><ul><li>La mediana de esta muestra es 1,26 cm, ya que por debajo está el 50% de los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas acumuladas. </li></ul><ul><li>En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se situaría exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la división entre el 50% inferior y el 50% superior. </li></ul><ul><li>4.- Moda: </li></ul><ul><li>Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria cuenta con 3 modas. </li></ul>
  22. 23. REPASEMOS Y APLIQUEMOS 4 <ul><li>Medidas de dispersión </li></ul><ul><li>Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. </li></ul><ul><li>Existen diversas medidas de dispersión , entre las más utilizadas podemos destacar las siguientes: </li></ul><ul><li>1.- Rango : mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. </li></ul><ul><li>Medidas de dispersión </li></ul><ul><li>2.- Varianza : Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra. </li></ul><ul><li>La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están. </li></ul><ul><li>3.- Desviación típica : Se calcula como raíz cuadrada de la varianza. </li></ul><ul><li>4.- Coeficiente de variación de Pearson : se calcula como cociente entre la desviación típica y la media. </li></ul>
  23. 24. REPASEMOS Y APLIQUEMOS 4 <ul><li>Ejemplo Medidas de dispersión : vamos a utilizar una tabla de distribución de frecuencias con los datos de la estatura de los alumnos y vamos a calcular sus medidas de dispersión. </li></ul>Variable Frecuencias absolutas Frecuencias relativas (Valor) Simple Acumulada Simple Acumulada 1,20 1 1 3,3% 3,3% 1,21 4 5 13,3% 16,6% 1,22 4 9 13,3% 30,0% 1,23 2 11 6,6% 36,6% 1,24 1 12 3,3% 40,0% 1,25 2 14 6,6% 46,6% 1,26 3 17 10,0% 56,6% 1,27 3 20 10,0% 66,6% 1,28 4 24 13,3% 80,0% 1,29 3 27 10,0% 90,0% 1,30 3 30 10,0% 100,0%
  24. 25. REPASEMOS Y APLIQUEMOS 4 <ul><li>Medidas de dispersión </li></ul><ul><li>  1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego el rango de esta muestra es 10 cm. </li></ul><ul><li>2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego, aplicamos la fórmula: </li></ul><ul><li>Por lo tanto, la varianza es 0,0010 </li></ul><ul><li>3.- Desviación típica: es la raíz cuadrada de la varianza. </li></ul><ul><li>4.- Coeficiente de variación de Pearson : se calcula como cociente entre la desviación típica y la media de la muestra. </li></ul>
  25. 26. II: Ejercicios de Construcción de tablas de frecuencia .1 <ul><li>Con el fin de seleccionar un profesional para dirigir una selección departamental, se citaron a tres ex jugadores del deporte, dos Especialistas en la materia y una persona empírica (sólo experiencia). Dado la idoneidad de los aspirantes, el cargo se va a proveer al azar. a) Cuál es la probabilidad que se seleccione un Especialista? b) Se seleccione un ex jugador? c) No se seleccione un Especialista? d) Sea Especialista o ex jugador?. Si se seleccionan dos personas, cuál es la probabilidad de que: e) ambos sean ex jugadores, f) todos Especialistas, g) uno ex jugador y el otro Especialista. Si se seleccionan tres aspirantes cual es la probabilidad de: H) Dos sean Especialistas, I) mínimo uno sea ex jugador, j) redacte otra pregunta que se acomode a los datos del problema </li></ul>
  26. 27. II: Ejercicios de Construcción de tablas de frecuencia . 2 <ul><li>Los siguientes datos representan las notas de un grupo de estudiantes en Estadística Descriptiva . </li></ul><ul><li>Construya la distribución de frecuencia simple y diga cual es la moda. </li></ul><ul><li>Que porcentaje de estudiantes ganó la materia. </li></ul><ul><li>Si se requiere que las notas estén entre 4.3 y 4.0. Que porcentaje de ellas no cumple con la regla? </li></ul><ul><li>Si para habilitar, se requiere mínimo una nota de 2.0, que porcentaje de estudiantes no puede habilitar? </li></ul><ul><li>Agrupe en cinco intervalos e interprete un valor de cada columna. Cual es el gráfico adecuado. </li></ul>2.5 3.6 2.8 4.3 4.0 3.6 2.3 3.1 3.5 2.5 4.2 3.5   3.5 4.1 4.2 3.6 2.6 3.6   2.7 4.0 3.7 2.8 3.1 3.3   3.3 3.8 4.3 3.5 3.8 2.6   4.0 2.7 2.5 2.7 4.5 3.2  
  27. 28. II: Ejercicios de Construcción de tablas de frecuencia .3 <ul><li>El número de pacientes que llegaron por urgencias a tres I.P.S en una semana se muestra a continuación. </li></ul>DÍA I.PS 1 I.PS 2 I.P.S 3 1 20 13 8 2 15 14 8 3 16 13 8 4 14 12 8 5 15 13 8 6 18 12 8
  28. 29. II: Ejercicios de Construcción de tablas de frecuencia.3 <ul><li>a) Si le pidiesen un informe gráfico de los datos anteriores, Cuál presentaría Usted?. Por qué?. Mire Teoría y ejemplos de gráficos mas abajo. </li></ul><ul><li>Además, se quiere presentar un gráfico que muestre la participación relativa de cada entidad con respecto al total de la demanda. </li></ul><ul><li>Cuál de ellas presenta mayor variabilidad? Porqué? </li></ul><ul><li>Con las medidas de posición diga si la IPS 2 tiene forma de campana. Qué forma tienen los datos de la IPS 3. Por qué? </li></ul>
  29. 30. II: Ejercicios de Construcción de tablas de frecuencia .3 Los siguientes datos corresponden al número de personas reportadas con enfermedad diarreica aguda, en un brote en una comunidad que ha estado expuesta a cólera por día. 47 55 43 42 45 45 45 42 45 56 44 41 41 45 55 49 50 45 44 52 45 40 50 49 42 58 42 48 45 40
  30. 31. II: Ejercicios de Construcción de tablas de frecuencia .3 <ul><li>a). Que porcentaje de los días se reportaron menos de 43 o más de 50 enfermos. </li></ul><ul><li>b). Se tiene la norma que, cuando el número de reportados es mínimo de 50, dicho día se considera anormal. Qué porcentaje de los días son anormales?. </li></ul><ul><li>c). Qué porcentaje se puede afirmar que son normales? </li></ul><ul><li>d). Agrupe en cinco intervalos e interprete un valor de cada columna. </li></ul><ul><li>e) Cuál gráfico es el adecuado? Mire ejemplos de gráficas mas abajo. Por qué? </li></ul>
  31. 32. II: Ejercicios de Construcción de tablas de frecuencia .4 Las siguientes distribuciones muestran el número de accidentes de tránsito ocurridos en Bogotá y Medellín durante varios días. A) Se le solicita identificar en cuál de ellas se presenta mayor heterogeneidad? Por qué?. MEDELLIN SANTA FE DE BOGOTA Accidentes Días Accidentes Días 9 5 20 10 11 6 21 12 12 7 22 14 14 6 23 15 16 5 24 14
  32. 33. II: Ejercicios de Construcción de tablas de frecuencia .4 <ul><li>B) Para Medellín diga que forma parecen tener los datos y calcule el porcentaje respectivo para una desviación estándar alrededor de la media. Calcule el intervalo. </li></ul><ul><li>  </li></ul><ul><li>C) Se detectó que el auxiliar dejo de anotar 2 accidentes por día, cuál es en nuevo promedio y cuál el nuevo coeficiente de variabilidad, use propiedades. </li></ul><ul><li>  </li></ul><ul><li>D) Por el contrario en Bogotá, se anotaron 3 accidentes de más, recalcule las nuevas medidas. </li></ul>
  33. 34. III. Representaciones gráficas Con Ejemplos <ul><li>Gran parte de la utilidad que tiene la Estadística Descriptiva es la de proporcionar un medio para informar basado en los datos recopilados. La eficacia con que se pueda realizar tal proceso de información dependerá de la presentación de los datos, siendo la forma gráfica uno de los más rápidos y eficientes, aunque también uno de los que más pueden ser manipulados o ser malinterpretados si no se tienen algunas precauciones básicas al realizar las gráficas. Existen también varios  tipos de gráficas , o  representaciones gráficas , utilizándose cada uno de ellos de acuerdo al tipo de información que se está usando y los objetivos que se persiguen al presentar la información. </li></ul><ul><li>Entonces, mencionaremos algunas  consideraciones  que conviene tomar en cuenta al momento de realizar cualquier gráfica a fin de que la información sea transmitida de la manera más eficaz posible y sin distorsiones: </li></ul><ul><li>El eje que represente a las frecuencias de las observaciones (comúnmente el vertical o de las ordenadas) debe comenzar en cero (0), de otra manera podría dar impresiones erróneas al comparar la altura, longitud o posición de las columnas, barras o líneas que representan las frecuencias. </li></ul><ul><li>La longitud de los espacios que representan a cada dato o intervalo (clase) en la gráfica deben ser iguales. </li></ul><ul><li>El tipo de gráfico debe coincidir por sus características con el tipo de información o el objetivo que se persigue al representarla, de otra manera la representación gráfica se convierte en un instrumento ineficaz, que produce más confusión que otra cosa, innecesario o productor de malinterpretaciones. Por ejemplo, si se desea representar la proporción de población masculina en un país conviene más usar una  gráfica de pastel o circular  que una  gráfica de barras  al compararla contra la población femenina; por un lado se puede apreciar dicha proporción, por el otro se aprecia cuál de las dos poblaciones es mayor. </li></ul><ul><li>Hay un punto que conviene remarcar: existe  software  que permite la construcción rápida y eficiente de gráficas a partir de bases de datos o hojas de cálculos, pero no importa cuán bonita, bien delineada, bien coloreada o bien presentada esté una gráfica, si no se han tomado en cuenta consideraciones de este tipo que tienen que ver más sobre el objetivo de estas herramientas y la Estadística:  la transmisión eficiente de la información . </li></ul>
  34. 35. Tipos de Representaciones gráficas El   histograma: Para las distribuciones de frecuencias la representación gráfica más común es el  histograma . Un ejemplo es el que se presenta a continuación y que representa el número de &quot;visitas&quot; que ha tenido un Centro medico de acuerdo a la hora de la visita.
  35. 36. El   histograma: <ul><li>De esta manera, el histograma está compuesto rectángulos, cuyo número coincide con la cantidad de intervalos considerados, el ancho de la base de cada uno de esos rectángulos es la misma siempre y coincide con las fronteras de los intervalos, y la altura corresponde a la frecuencia de cada intervalo. </li></ul><ul><li>Es importante observar que resulta difícil utilizar este tipo de representación cuando existen intervalos abiertos o cuando los intervalos no son iguales entre sí. </li></ul>
  36. 37. Gráfica de columnas .  <ul><li>Para este tipo de gráfica, elaboradas con rectángulos también, se pide que sus bases sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo, a diferencia del  histograma , no es necesario tener una escala horizontal continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas entre sí. </li></ul><ul><li>Otra observación pertinente es que se pueden representar en la misma gráfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una gráfica con varias  series , correspondiendo cada una de ellas a cada observación de la muestra (o población), y teniéndose una gráfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre sí, pero distinta de las demás. Para este tipo de gráfica, elaboradas con rectángulos también, se pide que sus bases sean del mismo ancho y sus alturas equivalentes con las frecuencias. Para este tipo, a diferencia del  histograma , no es necesario tener una escala horizontal continua, por lo que los rectángulos (o barras) no tienen que aparecer juntas entre sí. </li></ul><ul><li>Otra observación pertinente es que se pueden representar en la misma gráfica, utilizando las mismas escalas horizontales y verticales, varios datos correspondientes a las mismas variables producto de varias observaciones. Esto produce una gráfica con varias  series , correspondiendo cada una de ellas a cada observación de la muestra (o población), y teniéndose una gráfica compuesta. Es conveniente que cada serie de datos (u observaciones) sean ilustradas o iluminadas de igual manera entre sí, pero distinta de las demás. </li></ul>
  37. 38. Ejemplo 1 de Representación en gráfica de columnas El ejemplo que sigue pertenece al comportamiento de las calificaciones parciales de tres alumnos universitarios. Las series (cada una de las calificaciones parciales) están coloreadas con diferente color para mostrar el comportamiento tanto individual, como de cada uno de los alumnos con respecto a los demás. Es interesante observar que la escala horizontal no es continua (es nominal).
  38. 39. Ejemplo 2 de Representación en gráfica de columnas Existe la posibilidad, y si los recursos lo permiten, de representar gráficos compuestos de una manera &quot;tridimensional&quot;, es decir, con gráficos que posean no sólo dos ejes, sino tres; y en los que los rectángulos son sustituidos por prismas de base rectangular (ocasionalmente el  software  en el mercado permite utilizar prismas cuya base son polígonos regulares de más de cuatro lados, pirámides o cilindros). Un ejemplo es el siguiente:
  39. 40. Gráfica de barras horizontales <ul><li>También es posible realizar  gráficas de barras horizontales , los cuales se parecen mucho a las gráficas de columnas, con la salvedad importante de que la función de los ejes se intercambian y el eje horizontal queda destinado a las frecuencias y el eje vertical a las clases. </li></ul><ul><li>Es muy común que este tipo de gráficos se utilicen para ilustrar el tamaño de una población dividida en estratos como, por ejemplo, son sus edades. </li></ul>
  40. 41. Ejemplos de Representaciones gráficas de barras horizontales El ejemplo que se presenta es la población de un país ficticio llamado &quot;Timbuctulandia&quot;: A este tipo de gráficos en particular se le llama  pirámide de edades   por su forma. Incluso, cuando se compara la población masculina y femenina por estratos de edades, se estila utiliza el lado izquierdo para la población de un sexo y el lado derecho para el otro, el resultado es una &quot;pirámide&quot; casi simétrica (dependerá de la población en particular).
  41. 42. Representación en gráficas de líneas <ul><li>Cuando los datos se relacionan entre sí, es decir, cuando podemos decir que existe cierta continuidad entre las observaciones (como por ejemplo el crecimiento poblacional, la evolución del peso o estatura de una persona a través del tiempo, el desempeño académico de un estudiante a lo largo de su instrucción escolar, las variaciones presentadas en la medición realizada en algún experimento cada segundo o minuto) se pueden utilizar las  gráficas de líneas , que consisten en una serie de puntos trazados en las intersecciones de las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con líneas: </li></ul>
  42. 43. Ejemplo1 de Representaciones gráficas de líneas Este ejemplo muestra el comportamiento del peso corporal (en kilogramos) de dos individuos a lo largo de cinco observaciones anuales. Al igual que en el caso de las graficas de columna  (y de otras más) es posible presentar varias series de observaciones (en este caso cada serie de observaciones son los pesos de un individuo).
  43. 44. Ejemplo 2 de Representaciones gráficas de líneas <ul><li>Otra forma de representación de un uso menos común, y muy parecida a las graficas de líneas, es el polígono de frecuencias. La diferencia fundamental entre ambas es que en el polígono de frecuencias se añaden dos clases con frecuencias cero: una antes de la primera clase con datos y otra después de la última. El resultado es que se &quot;sujeta&quot; la línea por ambos extremos al eje horizontal y lo que podría ser una línea separada del eje se convierte, junto con éste, en un polígono. </li></ul>
  44. 45. Continuación Ejemplo 2 de Representaciones gráficas de líneas El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigación durante el año de 1990 en cinco países (fuente: Revista &quot;Ciencia y Desarrollo&quot;, 1994, XIX(114):12):
  45. 46. Ejemplos de Representaciones gráficas de pastel  o  circular Cuando lo que se desea es resaltar las proporciones que representan algunos sub conjuntos con respecto al total, es decir, cuando se está usando Una escala categórica , conviene utilizar una gráfica llamada  de pastel  o  circular . Por ejemplo, para ilustrar la matrícula en licenciatura (en México) por áreas de conocimiento en el año de 1992 se puede usar algo así como sigue (Fuente: ANUIES,1995):
  46. 47. Ejemplos de Representaciones gráficas de pastel  o  circular De hecho, si se desea resaltar una de las categorías que se presentan, es válido tomar esa &quot;rebanada&quot; de la gráfica y separarla de las demás:
  47. 48. Ejemplos de Representaciones gráficas de pictograma <ul><li>Actualmente, y mucho en los medios masivos de comunicación, se utilizan gráficos para ilustrar los datos o los resultados de alguna investigación. Regularmente se utilizan dibujos para representar dicha información, y el tamaño o el número de estos dibujos dentro de una gráfica queda determinado por la frecuencia correspondiente. A este tipo de gráfica se le llama  pictograma  y éstos son dos ejemplos: </li></ul>
  48. 49. Ejemplo 1 de Representaciones gráficas en pictograma Esta Grafica representa la masa de tres planetas de nuestro sistema solar tomando como unidad a la masa de la Tierra (cada representa la masa de nuestro planeta: Venus tiene masa menor y Neptuno tiene más 17 veces más masa que la Tierra).
  49. 50. Ejemplo 2 de Representaciones gráficas en pictograma Esta grafica representa la población de los Estados Unidos (cada hombrecillo representa a dos millones de habitantes ).
  50. 51. Representaciones gráficas de dispersión .  <ul><li>Cuando se pretende ilustrar la dispersión de las observaciones realizadas, y así trabajar algunas cosas como correlaciones se puede utilizar una  gráfica de dispersión . Por ejemplo, el ejemplo de la izquierda es la dispersión que se presenta al comparar el número de tesis doctorales en ciencias exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales entre 1984 y 1990 (fuente: Revista &quot;Ciencia y Desarrollo&quot;, 1994, XIX(114):12): </li></ul>
  51. 52. Ejemplo 1 de Representación con gráficas de dispersión .  La dispersión que se presenta al comparar el número de tesis doctorales en ciencias exactas contra el número de total de tesis doctorales (todo en México) en observaciones anuales entre 1984 y 1990 (fuente: Revista &quot;Ciencia y Desarrollo&quot;, 1994, XIX(114):12):
  52. 53. Ejemplo 2 de Representación con gráficas de dispersión .   Este es el resultado de comparar el diámetro (en miles de kilómetros) de los planetas interiores del nuestro sistema solar contra sus densidades (en gramos por centímetro cúbico). Es interesante observar que los puntos parecen &quot;seguir&quot; una línea imaginaria que se asemeja a una recta, con excepción de un caso atípico: Mercurio.
  53. 54. UTILIDAD DE LAS GRAFICAS ESTADISTICAS <ul><li>La utilidad de los gráficas es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismas una poderosa herramienta para el análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para analizarla. </li></ul><ul><li>El propósito de una gráfica no es entonces muy diferente del de cualquier otra herramienta estadística: ayudar a la comprensión y comunicación de la evidencia aportada por los datos respecto a una hipótesis en estudio </li></ul><ul><li>La calidad de una gráfica estadística consiste en comunicar ideas complejas con precisión, claridad y eficiencia, de tal manera que: </li></ul><ul><li>Induzca a pensar en el contenido más que en la apariencia </li></ul><ul><li>No distorsione la información proporcionada por los datos </li></ul><ul><li>Presente mucha información (números) en poco espacio </li></ul><ul><li>Favorezca la comparación de diferentes grupos de datos o de relaciones entre los mismos (por ejemplo una secuencia temporal) </li></ul>
  54. 55. Glosario Fundamentos de Estadística Descriptiva <ul><li> La  estadística descriptiva  es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. </li></ul><ul><li>Las  variables  pueden ser de dos tipos: </li></ul><ul><li>Variables cualitativas o atributos : no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo). </li></ul><ul><li>Variables cuantitativas : tienen valor numérico (edad, precio de un producto, ingresos anuales). </li></ul><ul><li>Las  variables  también se pueden clasificar en: </li></ul><ul><li>Variables unidimensionales:  sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una clase). </li></ul><ul><li>Variables bidimensionales:  recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase). </li></ul><ul><li>Variables pluridimensionales:  recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase). </li></ul><ul><li>Por su parte, las  variables cuantitativas  se pueden clasificar en discretas y continuas: </li></ul><ul><li>Discretas:  sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45). </li></ul><ul><li>Continuas : pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc. </li></ul><ul><li>Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos: </li></ul><ul><li>Individuo : cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo. </li></ul><ul><li>Población:  conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeo que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad. </li></ul><ul><li>Muestra:  subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo. </li></ul>
  55. 56. Links en Web de Estadística Descriptiva <ul><li>http://www.stat.ucla.edu/index.php </li></ul><ul><li>http://www.ine.es/ </li></ul><ul><li>http://www.educateca.com/manuales_cursos/empresas_calidad.asp </li></ul><ul><li>http://www.aaamatematicas.com/ </li></ul><ul><li>http://www.aaamatematicas.com/sa/mny.htm Economia Dinero </li></ul>

×