Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

3 medidas de tendencia central y de dispersion

9,627 views

Published on

3 medidas de tendencia central y de dispersion

  1. 1. Núcleo Monagas, Campus Juanico Postgrado en Agricultura Tropical Universidad de Oriente Ramón Silva-Acuña (Ph. D) Renny Barrios M. (M. Sc.) Maturín, Mayo 2015 Estadística Descriptiva: Medidas de tendencia central y de dispersión
  2. 2. Unidad I. Estadística Descriptiva Tema 3. Medidas de tendencia central Media aritmética, mediana, moda, cuantiles. Tema 4. Medidas de dispersión o de variabilidad Rango, desviación estándar, varianza, coeficiente de variación, intervalos de confianza.
  3. 3. • Estadística: Descriptiva e inferencial a la recolección Presentación descripción análisis e interpretación de una colección de datos • Resumirlos con elementos de información (medidas • descriptivas): que caracterizan la totalidad de las • observaciones. Y poder elaborar las propias conclusiones
  4. 4. Estadística inferencial Generalizaciones del todo (POBLACIÓN) Partiendo de lo especifico (MUESTRA) PROCESO PARA LOGRAR Con riesgos implícitosCondiciones: 1- Representatividad de la muestra 2- Calidad de la información 3- La probabilidad de riesgo De la clase anterior
  5. 5. Medidas de tendencia central • ¿Que significa una temperatura promedio de 21°C? • Es una medida vaga pero informativa, asociarla con una de dispersión en publicaciones científicas. • Medidas de tendencia central – Moda – Mediana – Cuantiles • La medida de tendencia central mas común y la mejor en muchos casos es la media aritmética
  6. 6. Medidas de tendencia central • Que es la moda: el valor que ocurre con mas frecuencia en una muestra o en una población. El investigador muestra el tipo de observación que ocurre con mas frecuencia • Caso ocurra distribución de Poisson la moda y la media serian iguales • Distribución binomial la moda y la media están relacionadas, son diferentes
  7. 7. Escor (% de correctos) Frecuencia 58 2 60 2 62 3 64 2 66 3 67 4 68 1 69 1 70 1 93 5 Medidas de tendencia central ( La moda )
  8. 8. Ventajas de la moda  Permite visualizar cuando dos o más grupos distintos aparecen en un mismo grupo de datos. (Distribuciones bimodales, trimodales)  Cuando un valor predomina es fácil de detectar
  9. 9. Desventajas de la moda  No provee información referente a la distribución de frecuencia de un grupo de datos  No siempre existe  Pueden existir dos modas o sea dos grupos de valores con la misma frecuencia  Es insensible a la presencia de valores extremos
  10. 10. Medidas de tendencia central • La mediana (Posición) • Es una medida de tendencia central que divide los datos en partes iguales, tanto hacia arriba como hacia abajo • Para su calculo es necesario organizar los datos de mayor a menor • El numero de datos puede ser par o impar • Si el numero de datos es par 2 2 1 2 • Si es impar el calculo se realiza de la siguiente manera 1 2 • Donde n representa el numero de datos
  11. 11. Medidas de tendencia central La mediana • Caso que el numero de datos sea par, la mediana es el valor promedio de los dos valores centrales • La media y la mediana son mas confiables porque están próximas al lugar donde se encuentran la mayoría de las observaciones
  12. 12. Calculo de la mediana Planta Altura 1 2,06 2 2,05 3 2,00 4 2,00 5 1,95 6 1,90 7 1,80 8 1,71 9 1,70 10 1,70 Medidas de tendencia central Para datos pares. N = 10 ó
  13. 13. Calculo de la mediana Planta Altura 1 2,06 2 2,05 3 2,00 4 2,00 5 1,95 6 1,90 7 1,80 8 1,71 9 1,70 Medidas de tendencia central Para datos pares. N = 10
  14. 14. Medidas de tendencia central Ventajas de la mediana • No es muy sensible a la presencia de valores extremos • Reduce el efecto de valores extremos para obtener un valor representativo de centro
  15. 15. Medidas de tendencia central Desventajas de la mediana  Sensible al tamaño del conjunto de datos  Implica ordenar los datos  Insensible a la magnitud de los valores
  16. 16. Medidas de tendencia central • La necesidad de que ambos tipos de medidas estén asociadas (tendencia central y e dispersión) donde se presenten La media • Es la medida de tendencia central mas utilizada es conocida también como media aritmética. • La media de una muestra es una estimativa de la media de la población. • La diferencia entre una muestra y una población
  17. 17. Medidas de tendencia central • La media aritmética o simplemente la media + + + + ……+ )/n
  18. 18. Medidas de tendencia central Características de la media • De las medidas de tendencia central es la mas confiable, porque ella tiende a variar menos entre muestras de una misma población • Para cualquier distribución, la media es el punto alrededor del cual todos los valores de Xi se concentran. • La suma de los desvíos alrededor de la media es cero
  19. 19. Medidas de tendencia central La suma de los desvíos entorno a la media es igual a cero Xi Xi - X 65 (65 – 78) = -13 73 (73 – 78) = -5 77 (77 – 78) = -1 85 (85 – 78) = 7 90 (90 – 78) = 12  = 0 Rehacer el ejercicio empleando un valor mayor o menor a la media (79 y 76)
  20. 20. Medidas de tendencia central La suma de los desvíos entorno a la media es igual a cero Xi Xi - X 65 (65 – 79) = -14 73 (73 – 79) = -6 77 (77 – 79) = -2 85 (85 – 79) = +6 90 (90 – 79) = +11  = - 5
  21. 21. Medidas de tendencia central Ventajas de la media  Extrae el máximo de información de un conjunto de datos  Siempre existe  Es fácil de calcular
  22. 22. Medidas de tendencia central Desventaja de la media • Se ve seriamente afectada por valores extremos en un conjunto de datos
  23. 23. Medidas de tendencia central CUANTILES • Un cuantil es una medida de posición que permite determinar que valor de un grupo de datos es de tal forma que sólo cierto porcentaje del total de datos está por debajo de dicho valor.
  24. 24. Medidas de tendencia central CUANTILES • Los cuantiles más utilizados son: • Cuartiles: dividen un conjunto de datos en subgrupos de 25 • Deciles: dividen un conjunto de datos en subgrupos de 10 • Percentiles: dividen un conjunto de datos en subgrupos de 100
  25. 25. CUANTILES Las fórmulas para cálculo de estos cuantiles son (Datos no agrupados): 2 1 4   knk XQ 2 1 10   knk XD 2 1 100   knk XP PercentilesDecilesCuartiles Donde: k = Cuantil a calcular n = número de datos Medidas de tendencia central
  26. 26. CUANTILES Como el cálculo es sobre las posiciones de los valores al ordenarlos de manera ascendente se debe tomar en cuenta lo siguiente: • Si la posición calculada es un número entero se toma el valor que guarda dicha posición. • Si la posición calculada es un número con decimales entonces se toma el entero superior próximo. Medidas de tendencia central
  27. 27. Ejemplos Para el siguiente conjunto de datos obtener. El cuartil 1 y 3. El decil 3. El percentil 95. n = 70 89 94 96 99 103 107 109 90 94 97 99 103 107 110 90 95 97 99 104 107 110 90 95 97 100 104 108 111 91 95 97 101 104 108 111 92 95 97 101 105 108 112 92 95 97 102 106 108 114 92 96 98 102 106 108 117 92 96 99 102 106 109 117 93 96 99 103 106 109 1202 1 4   knk XQ 9618 2 1 4 )70)(1(1   XXQ
  28. 28. Ejemplos Para el siguiente conjunto de datos obtener. El cuartil 1 y 3. El decil 3. El percentil 95. n = 70 89 94 96 99 103 107 109 90 94 97 99 103 107 110 90 95 97 99 104 107 110 90 95 97 100 104 108 111 91 95 97 101 104 108 111 92 95 97 101 105 108 112 92 95 97 102 106 108 114 92 96 98 102 106 108 117 92 96 99 102 106 109 117 93 96 99 103 106 109 1202 1 4   knk XQ 10753 2 1 4 )70)(3(1   XXQ
  29. 29. Ejemplos Para el siguiente conjunto de datos obtener. El cuartil 1 y 3. El decil 3. El percentil 95. n = 70 89 94 96 99 103 107 109 90 94 97 99 103 107 110 90 95 97 99 104 107 110 90 95 97 100 104 108 111 91 95 97 101 104 108 111 92 95 97 101 105 108 112 92 95 97 102 106 108 114 92 96 98 102 106 108 117 92 96 99 102 106 109 117 93 96 99 103 106 109 1202 1 10   knk XD 97225.21 2 1 10 )70)(3(3   XXXD
  30. 30. Ejemplos Para el siguiente conjunto de datos obtener. El cuartil 1 y 3. El decil 3. El percentil 95. n = 70 89 94 96 99 103 107 109 90 94 97 99 103 107 110 90 95 97 99 104 107 110 90 95 97 100 104 108 111 91 95 97 101 104 108 111 92 95 97 101 105 108 112 92 95 97 102 106 108 114 92 96 98 102 106 108 117 92 96 99 102 106 109 117 93 96 99 103 106 109 1202 1 100   knk XP 11467 2 1 100 )70)(95( 2 1 100   XXXP knk
  31. 31. • La probabilidad de tener un accidente de tráfico aumenta con el tiempo que pasas en la calle. Por tanto, cuanto mas rápido circules, menor es la probabilidad de que tengas un accidente. • El 33% de los accidentes mortales involucran a alguien que ha bebido. Por tanto, el 67% restante ha sido causado por alguien que no había bebido. Datos curiosos Entonces, está claro, que la forma mas segura de conducir es ir borracho y a gran velocidad!!!
  32. 32. http://www.infostat.com.ar
  33. 33. MEDIDAS DE DISPERSIÓN • La varianza • La desviación estándar • La amplitud • El error estándar de la media • El coeficiente de variación
  34. 34. Media es igual a 10 MEDIDAS DE DISPERSIÓN 8 8 9 10 11 12 12 5 6 8 10 12 14 15 1 2 5 10 15 18 19 Las medidas de tendencias central solo proporcionan un resumen parcial de la información de un conjunto de datos; por lo tanto, es evidente que debe estar acompañada de una medida de dispersión • Las medias, similar a otras medidas de tendencia central no nos dice nada de la variación
  35. 35. MEDIDAS DE DISPERSIÓN 8 9 10 10 10 11 12 5 7 9 10 11 13 15 1 5 8 10 12 15 19 8 8 9 10 11 12 12 5 6 8 10 12 14 15 1 2 5 10 15 18 19 • En ambos cuadros el valor promedio es 10 • Observe que ambos grupos tienen dispersiones de 4, 10 y 18 • El primer conjunto presenta mas dispersión en los extremos • En el segundo grupo hay mayor concentración hacia la media Grupos de datos [La varianza]
  36. 36. MEDIDAS DE DISPERSIÓN La varianza • Parece deseable tener una definición que utilice todas las observaciones y que proporcione un valor pequeño cuando estas se encuentren alrededor de la media y un valor grande Cuando estén muy dispersas • Sean los números: 5, 6, 8, 10, 12, 14, 15 • De acuerdo con nuestra definición estos números no son mas variables que los números: 105, 106, 108, 110, 120, 140, 115 • Así, nuestra definición no depende del tamaño de los números en el sentido de relacionar la medida de la dispersión con la media, dará el mismo valor para los dos conjuntos de datos
  37. 37. s2 = +(X1 – X ) 2 ( X2 – X )2+ ( Xi –Xn )2 n – 1 s2 = ( Xi – X ) 2 n – 1 ∑ MEDIDAS DE DISPERSIÓN La Varianza • La medida numérica de dispersión resultante debe admitir interpretación en términos de observaciones. La unidad de la medida debe ser la misma. • La mejor medida de dispersión y la mas generalizada es la varianza o su raíz cuadrada la desviación estándar.
  38. 38. X 3, 6, 8 y 11 s2 = ( Xi – X ) 2 n – 1 ∑ X = 7 (3 - 7)2 + (6 - 7)2 + (8 - 7)2 + (11 - 7)2 (- 4)2 + (- 1)2 + (- 1)2 + (- 4)2 16 + 1 + 1 + 16 Veamos este ejemplo de calculo de varianza 34 / 3 = 11,33
  39. 39. Otra manera de presentarlo s2 = ( xi – X ) 2 n – 1 ∑ Xi Xi Xi – X ( Xi – X ) 22 3 6 8 11 9 36 64 121 ( 3 – 7 ) ( 6 – 7 ) ( 8 – 7 ) ( 11 – 7 ) - 4 - 1 + 1 + 4 16 1 1 16 0 34 / 3 = 11,33 s 2 = Xi 2 – 2 n – 1 ∑ (∑ Xi ) n
  40. 40. Otro ejemplo: con datos menos dispersos s2 = ( xi – X ) 2 n – 1 ∑ Xi Xi Xi – X ( Xi – X ) 22 4,1 3,7 3,5 4,0 18,81 13,69 12,25 16,00 ( 4,1 – 3,825) ( 3,7 – 3,825) ( 3,5 – 3,825) ( 4,0 – 3,825) 0,275 0,07 0,01 0,10 0,03 0 0,21 / 3 = 0,07s 2 = Xi 2 – 2 n – 1 ∑ (∑ Xi ) n - 0,125 - 0,325 0,175
  41. 41. Veamos la comparación de las varianzas y las medias con los dos ejemplos Xi1 Xi2 4,1 3,7 3,5 4,0 3,0 6,0 8,0 11,0 s2 0,07 11,33 X 3,82 7,00 Mas adelante calcularemos el coeficiente de variación, para estos valores
  42. 42. ¿Que representa la varianza, como resumen de la distribución de frecuencia? s2=2 s2=1 s2=0.4 26.34 31.46 36.59 41.72 46.84 Variable 0.00 0.02 0.04 0.06 0.08 frecuenciasrelativas Distribución de frecuencias con varianzas diferentes Muestra Distribución de frecuencias con varianzas diferentes S2 =2 S2 =1 S2 =0,4
  43. 43. [La desviación estándar] s 2 = ( xi – X )2 n – 1 ∑ s2 = Xi – 2 n – 1 ∑ (∑ Xi ) n 2 Varianza Desviación estándar s = ( xi – X )2 n – 1 ∑√ s = Xi – 2 n – 1 ∑ (∑ Xi ) n 2 √
  44. 44. Otras medida de dispersión: La diferencia entre el valor mas alto y el mas bajo del rol de datos [El error estándar de la media] [La amplitud] s y = s √ n
  45. 45. Otra medida de dispersión muy importante: [El coeficiente de variación] CV( % ) = 100 s X Es la medida usada por los investigadores para evaluar los resultados de diferentes experimentos con la misma característica y realizadas en diferentes investigaciones. La explicación de porque el coeficiente de variación es alto o bajo
  46. 46. X – t Sx ≤ µ ≤ X + t Sx Error estándar de la media
  47. 47. ¡¡¡¡¡Ahora si sabemos lo que significan las palanquitas!!!!!
  48. 48. EJERCICIOS DE ESTADISTICA EXPERIMENTAL (Calculo de estadísticas descriptivas e intervalo de confianza en rol de datos) Maturín, Abril-Septiembre, 2015 [Primer periodo]
  49. 49. Ejercicio de estadística descriptiva Ejemplo : Peso de 14 adultos muestreados al azar en un salón de aulas 76 75 74 73 72 71 70 69 68 67 66 65 64 63 Calcule la media, la mediana, la moda, la varianza, la desviación estándar y, el intervalo de confianza para la media Agricultura: Altura de plantas, estudios de taxonomia de insectos, etc.
  50. 50. M = 70 + 69 2 = 69,5 2- Calculo de la media X ∑ Xi = N X = 973 14 =X 69,5 Md = [ (n/2) + (n/2 + 1) / 2 ] Para datos pares = [ (14/2) + (14/2 + 1) / 2 ] = [ (7) + (8) / 2 ] = 7,5 posición Distribución normal
  51. 51. 1 76 76 - 69,5 6,5 (6,5)2 42,25 2 75 75 - 69,5 5,5 (5,5)2 30,25 3 74 74 - 69,5 4,5 (4,5)2 20,25 4 73 73 - 69,5 3,5 (3,5)2 12,25 5 72 72 - 69,5 2,5 (2,5)2 6,25 6 71 71 - 69,5 1,5 (1,5)2 2,25 7 70 70 - 69,5 0,5 (0,5)2 0,25 8 69 69 - 69,5 -0,5 (-0,5)2 0,25 9 68 68 - 69,5 -1,5 (-1,5)2 2,25 10 67 67 - 69,5 -2,5 (-2,5)2 6,25 11 66 66 - 69,5 -3,5 (-3,5)2 12,25 12 65 65 - 69,5 -4,5 (-4,5)2 20,25 13 64 64 - 69,5 -5,5 (-5,5)2 30,25 14 63 63 - 69,5 -6,5 (-6,5)2 42,25 227,50∑(Xi- X) = 0
  52. 52. 1- Calculo de la varianza (S2) s2 = ( xi – X )2 n – 1 ∑ = 13 227,50 s 2 = 17,5 2- Calculo de la desviación estándar (S) S = √ varianza (S2) = √ 17,5 = 4,18 s = 4,18
  53. 53. 3- Calculo del error estándar de la media ( Sx ) S x = Desviación estándar(S) √ N = 4,18 √14 = 4,18 3,74 1,11S x =
  54. 54. X – t Sx ≤ µ ≤ X + t Sx Se iguala a la media de la población
  55. 55. 4- Calculo del intervalo de confianza X – t Sx ≤ µ ≤ X + t Sx 69,5 – 2,16 . 1,11 ≤ µ ≤ 69,5 + 2,16 . 1,11 t = 2,16 13 g l α 0,05 ó 5% 67,5 ≤ µ ≤ 71,4 t Sx = 2,16 x 1,11 = 2,39 1,11S x = =X 69,5 69,5 – t 1,11 ≤ µ ≤ 69,5 + t 1,11 69,5 – 2,39 ≤ µ ≤ 69,5 + 2,39 ¿Qué significa esto? Interpretar el intervalo
  56. 56. La frase de la semana Todo dolor físico es la expresión de un dolor emocional

×