Otras Medidas de Dispersión

17,471
-1

Published on

Published in: Business, Travel
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
17,471
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
83
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Otras Medidas de Dispersión

  1. 1. UNIDAD 4. OTRAS MEDIDAS DE DISPERSIÓN Deizi Dejesús SEGUNDO CORTE
  2. 2. Corrección de Sheppard para la varianza   Una medida relacionada con la varianza es la corrección de Sheppard, esta medida sirve para corregir los errores que se cometen cuando se realizan cálculos de varianza para datos agrupados, su expresión es dada como:   Varianza Corregida =varianza de datos agrupados – (c ²/12) donde   (c ²/12) se conoce como la corrección de Sheppard.  La restricción que se impone para poder aplicar este tipo de corrección es el hecho que solo se puede aplicar para variables continuas, donde las colas de la distribución en ambas direcciones van a cero. Sin embargo, su inconveniencia esta en que la corrección puede modificar sustancialmente algunos resultados lo que con lleva a cometer otro error, lo que a generado mucha polémica sobre cuando usar la corrección. Deizi Dejesús
  3. 3. <ul><li>Rango entre percentiles (‘interquartile range’): </li></ul><ul><ul><li>Es la distancia entre percentil 90 y percentil 10. </li></ul></ul><ul><ul><ul><li>Rango entre percentiles = P 90 – P 10 </li></ul></ul></ul><ul><ul><li>Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores. </li></ul></ul><ul><ul><li>No es tan sensible a valores extremos </li></ul></ul>Deizi Dejesús
  4. 4. Dispersión relativa: mediana <ul><li>Es la razón entre el rango intercuartílico y la mediana. </li></ul><ul><ul><li>Mide el rango intercuartílico en forma de“qué tamaño tiene con respecto a la mediana” </li></ul></ul><ul><ul><li>Es frecuente mostrarla en porcentajes </li></ul></ul><ul><ul><ul><li>Si la mediana es 80 y el rango intercuartílico es de 5 entonces Vq=5/80*100=6,25% </li></ul></ul></ul><ul><li>Es una cantidad adimensional (independiente de las unidades de medida) . Interesante para comparar la variabilidad de diferentes variables. </li></ul><ul><ul><li>Si el peso tiene Vq=6,25% y la edad tiene Vq=10%, los individuos presentan más dispersión en edad que en peso. </li></ul></ul>Deizi Dejesús
  5. 5. Coeficiente de variación Hemos visto que las medidas de centralización y dispersión nos dan información sobre una muestra. Nos podemos preguntar si tiene sentido usar estas magnitudes para comparar dos poblaciones. Por ejemplo, si nos piden comparar la dispersión de los pesos de las poblaciones de elefantes de dos circos diferentes, nos dará información útil. ¿Pero qué ocurre si lo que comparamos es la altura de unos elefantes con respecto a su peso? Tanto la media como la desviación típica, y , se expresan en las mismas unidades que la variable. Por ejemplo, en la variable altura podemos usar como unidad de longitud el metro y en la variable peso, el kilogramo. Comparar una desviación (con respecto a la media) medida en metros con otra en kilogramos no tiene ningún sentido. El problema no deriva sólo de que una de las medidas sea de longitud y la otra sea de masa. El mismo problema se plantea si medimos cierta cantidad, por ejemplo la masa, de dos poblaciones, pero con distintas unidades. Este es el caso en que comparamos el peso en toneladas de una población de 100 elefantes con el correspondiente en miligramos de una población de 50 hormigas. El problema no se resuelve tomando las mismas escalas para ambas poblaciones. Por ejemplo, se nos puede ocurrir medir a las hormigas con las mismas unidades que los elefantes (toneladas). Si la ingeriería genética no nos sorprende con alguna barbaridad, lo lógico es que la dispersión de la variable peso de las hormigas sea practicamente nula (¡Aunque haya algunas que sean 1.000 veces mayores que otras!) En los dos primeros casos mencionados anteriormente, el problema viene de la dimensionalidad de las variables, y en el tercero de la diferencia enorme entre las medias de ambas poblaciones. El coeficiente de variación es lo que nos permite evitar estos problemas, pues elimina la dimensionalidad de las variables y tiene en cuenta la proporción existente entre medias y desviación típica. Se define del siguiente modo: Deizi Dejesús
  6. 6. Sólo se debe calcular para variables con todos los valores positivos. Todo índice de variabilidad es esencialmente no negativo. Las observaciones pueden ser positivas o nulas, pero su variabilidad debe ser siempre positiva. De ahí que sólo debemos trabajar con variables positivas. Deizi Dejesús
  7. 7. <ul><li>Coeficiente de variación de PEARSON </li></ul><ul><li>Es la razón entre la desviación típica y la media. </li></ul><ul><ul><li>Mide la desviación típica en forma de “qué tamaño tiene con respecto a la media” </li></ul></ul><ul><ul><li>También se la denomina variabilidad relativa. </li></ul></ul><ul><ul><li>Es frecuente mostrarla en porcentajes </li></ul></ul><ul><ul><ul><li>Si la media es 80 y la desviación típica 20 entonces CV=20/80=0,25=25% (variabilidad relativa) </li></ul></ul></ul><ul><li>Es una cantidad adimensional (independiente de las unidades de medida) . Interesante para comparar la variabilidad de diferentes variables. </li></ul><ul><ul><li>Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan más dispersión en peso que en altura. </li></ul></ul><ul><li>No debe usarse cuando para variables cuyo nivel de medición es por intervalos, es decir,la variable cuenta con un valor 0 fijado arbitrariamente. </li></ul><ul><ul><li>Por ejemplo 0ºC ≠ 0ºF </li></ul></ul><ul><ul><li>Si la variable presenta valores negativos, al calcular el coeficiente de variación de pearson los habrá que considerar como positivos </li></ul></ul>Dispersión relativa: media Deizi Dejesús
  8. 8. COEFICIENTE DE VARIACI ÓN PARA VARIABLES TIPIFICADAS Dada la distribución de edades (medidas en años) en un colectivo de 100 personas, obtener: 1. La variable tipificada Z . 2. Valores de la media y varianza de Z . 3. Coeficiente de variación de Z . Deizi Dejesús 100   4 20 -- 40 17 10 -- 20 32 4 -- 10 47 0 -- 4 Num. empleados Horas trabajadas
  9. 9. VARIABLES TIPIFICADAS Para cualquier variable cuantitativa, conociendo sus dos estadísticos media y desviación típica, todos esos valores pueden ser transformados en una nueva escala de medida completamente estandarizada o tipificada. Esta nueva escala se basa en medir la posición relativa que ocupa cada valor dentro de su distribución, entendida como distancia a la media en unidades de desviación típica. Esta nueva unidad es lo que se llama puntuación tipificada o puntuación zeta .
  10. 10. Solución: Para calcular la variable tipificada Z= (mi – X)/S partimos de los datos del enunciado. Será necesario calcular en primer lugar la media y desvición típica de la variable original ( X = años). Deizi Dejesús 9.181 693 n =100     3.600 120 4 30 20 – 40 3.825 255 17 15 10 – 20 1.568 224 32 7 4 – 10 188 94 47 2 0 – 4 mi²fi mifi fi mi LI --LS
  11. 11. A partir de estos valores podremos calcular los valores tipificados para las marcas de clase de cada intervalo y construir su distribución de frecuencias: Deizi Dejesús
  12. 12. Deizi Dejesús 100,002 0,021 n =100   48,609 13,944 4 3,486 25,303 20,720 17 1,220 0,004 0,352 32 0,011 26,086 -35,015 47 -0,745 z i 2 fi z i fi fi z i
  13. 13. A pesar de que no se debe calcular el coeficiente de variación sobre variables que presenten valores negativos (y Z los presenta), lo calculamos con objeto de ilustrar el porqué: Es decir, el coeficiente de variación no debe usarse nunca con variables tipificadas. Deizi Dejesús
  14. 14. EJERCICIO EJEMPLO Los datos que se dan a continuación corresponden a las edades de ochenta pacientes del Hospital San Juan de Dios, de la Ciudad de Mérida. 6 5 ; 7 4 ; 6 7 ; 5 4 ; 6 5 ; 6 5 ; 6 9 ; 6 1 ; 6 7 ; 7 3 ; 5 7 ; 6 2 ; 6 7 ; 6 8 ; 6 3 ; 6 7 ; 7 1 ; 6 8 ; 7 6 ; 6 0 ; 6 6 ; 7 7 ; 7 0 ; 6 6 ; 6 8 ; 5 7 ; 7 0 ; 6 6 ; 5 2 ; 7 5 ; 6 5 ; 6 9 ; 7 1 ; 5 8 ; 6 6 ; 6 7 ; 7 4 ; 6 1 ; 6 3 ; 6 9 ; 8 0 ; 5 9 ; 6 6 ; 7 0 ; 6 7 ; 7 8 ; 7 5 ; 6 4 ; 7 1 ; 8 1 ; 6 2 ; 6 4 ; 6 9 ; 6 8 ; 7 2 ; 8 3 ; 5 6 ; 6 1 ; 6 2 ; 6 3 ; 7 6 ; 6 1 ; 6 7 ; 6 7 ; 6 4 ; 7 2 ; 6 4 ; 7 3 ; 7 9 ; 5 8 ; 6 7 ; 7 1 ; 6 8 ; 5 9 ; 6 9 ; 7 0 ; 6 6 ; 6 2 ; 6 3 ; 6 6 ; a.Construya una distribución de frecuencias con intervalos de clase, sabiendo que el valor de la Amplitud “A”, es igual a 5. b.Determine el valor del: Rango entre Percentiles,Dispersión relativa de la mediana, Coeficiente de variación de Pearson, variables tipificadas y coeficiente de Variación de Z. Deizi Dejesús
  15. 15. Deizi Dejesús Tabla de Distribuci ón de Frecuencias
  16. 16. <ul><li>1.Rango entre percentiles (‘interquartile range’): </li></ul><ul><ul><li>Es la distancia entre percentil 90 y percentil 10. </li></ul></ul><ul><ul><ul><li>Rango entre percentiles = P90 – P10 </li></ul></ul></ul><ul><ul><ul><li>Debe calcularse el Percentil 10 y el 90 </li></ul></ul></ul>Deizi Dejesús
  17. 17. Deizi Dejesús LA CLASE P10 SE ENCUENTRA EN EL INTERVALO 2 (CLASE [57-62)) QUE ALMACENA HASTA EL 17.5% de los datos (observando los porcentajes acumulados % Acu) Luego Interpolando: 5______________________13.75% INCREMENTO ______________ 6.25% INCREMENTO = (6.25%x5)/13.75% INCREMENTO = 2.27 P10 = 57+2.27 P10= 59.27 13.75% 5 DIFERENCIA 3.75% 57 17.5% 62 %Acu Limites Superior
  18. 18. Deizi Dejesús LA CLASE P90 SE ENCUENTRA EN EL INTERVALO 5 (CLASE [72-77)) QUE ALMACENA HASTA EL 92.5% de los datos (observando los porcentajes acumulados % Acu) Luego Interpolando: 5______________________12.5% INCREMENTO ______________ 10% INCREMENTO = (10%x5)/12.5% INCREMENTO = 4 P90 = 72+4 P90= 76 Rango entre percentiles = P90 – P10 Rango entre percentiles = 76-59.27 = 16.73 12.5% 5 DIFERENCIA 80% 72 92.5% 77 %Acu Limites Superior
  19. 19. 2.Dispersión relativa de la mediana Q1 = 63.30 Q3 = 71.25. Calculados en la presentación Semana 8. Cálculo de la Mediana Me = Limed + [ [ (n/2) – (Fi-1)] / fimed ] . (A-1) Me = 67 + [ [ (40) – (37)] / 27] . (4) Me = 67 + [ [ (n/2) – (Fi-1)] / fimed ] . (A-1) Me = 67 + 0,44 = 67,44 Vq =[(71,25-63,30) /67,44]*100 = 11.78% Deizi Dejesús
  20. 20. 3.Coeficiente de variación de Pearson S = 6.14 X = 5405/80=67.56, determinados en la presentación anterior CV = (6,14 /67.56)*100 CV = 9.08% de dispersi ón entre los datos. Deizi Dejesús
  21. 21. 4.Para calcular la variable tipificada Z= (mi – X)/S; X= 67.56, S=6.14 Z1= (54.5-67.56) /6.14 = -2.12 Z2= (59.5-67.56) /6.14 = -1.22 Z3= (64.5-67.56) /6.14 = -0.49 Z4= (69.5-67.56) /6.14 = 0.31 Z5= (74.5-67.56) /6.14 = 1.13 Z6= (79.5-67.56) /6.14 = 1.94 Z7= (84.5-67.56) /6.14 = 2.75 Deizi Dejesús 12,76 11.3 10   1.13 2.59 8.37 27 0,31 5.52 -11.27 23 -0,49 16.37 -13,42 11 -1,22 13.48 -6.36 3 -2,12 z i 2 fi z i fi fi z i Total= 77.09 Total= 1.07 n= 80 7.56 2.75 1 2.75 18.81 9.7 5 1.94
  22. 22. La Media de Z = 1.07/80 = 0,01 es APROXIMADAMENTE 0 CERO La Varianza de Z es: S² = (∑zi²fi) /n - [( ∑zifi)/n] ² S² = (∑77,09) /80 - [( ∑1,07)/80] ² S² 0,96-0,0001 S² 0,95 S = √0,95 S = 0,97 es aproximadamente 1 Es decir, el coeficiente de variación no debe usarse nunca con variables tipificadas. Deizi Dejesús
  23. 23. Complete la siguiente distribución y encuentre: Rango entre Percentiles,Dispersión relativa de la mediana, Coeficiente de variación de Pearson, variables tipificadas y coeficiente de Variación de Z. Deizi Dejesús RESOLVER

×