Clase 4 medidas de tendencia no central

26,896 views

Published on

0 Comments
8 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
26,896
On SlideShare
0
From Embeds
0
Number of Embeds
624
Actions
Shares
0
Downloads
502
Comments
0
Likes
8
Embeds 0
No embeds

No notes for slide

Clase 4 medidas de tendencia no central

  1. 1. MEDIDAS DE POSICION NO CENTRAL
  2. 2. Medidas de dispersión <ul><li>Caracterizar una distribución solamente a través de una medida central no es apropiado. </li></ul><ul><li>Las distribuciones del ingreso de dos provincias con el mismo ingreso medio por hogar son muy distintas si una de ellas tiene extremos de pobreza y de riqueza, mientras que la otra tiene poca variación de ingresos entre familias. </li></ul><ul><li>Estamos interesados en la dispersión o variabilidad de los ingresos, además de estarlo en sus centros. </li></ul>
  3. 3. Medidas de dispersión <ul><li>El rango de pende sólo de las observaciones máxima y mínima, que podrían ser observaciones atípicas. </li></ul><ul><li>Podríamos mejorar nuestra descripción de la dispersión fijándonos, por ejemplo, también en la dispersión del 50% de los valores centrales de nuestros datos. </li></ul><ul><li>Un conjunto de estadísticos de utilidad son los cuartiles de una distribución. </li></ul>
  4. 4. Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles : son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles : son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles : son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados
  5. 5. Se puede definir otros índices para precisar la posición de los valores: Los Cuartiles Dividen los valores ordenados en cuatro partes iguales: el 1er cuartil que deja un cuarto de los valores por debajo. la 2do cuartil , que es la mediana. el 3er cuartil que deja un cuarto de los valores por arriba.
  6. 6. Cuartiles <ul><li>Para calcular los cuartiles de una distribución debemos: </li></ul><ul><ul><li>1. Ordenar las observaciones en orden creciente y localizar la mediana. </li></ul></ul><ul><ul><li>2 . El primer cuartil Q 1 es la mediana de las observaciones situadas a la izquierda de la mediana de la distribución. </li></ul></ul><ul><ul><li>3. El tercer cuartil Q 3 es la mediana de las observaciones situadas a la derecha de la mediana de la distribución. </li></ul></ul>
  7. 7. Cuartiles <ul><li>Los cuartiles son medidas de tendencia no central de una distribución. </li></ul><ul><li>Dividen los datos ordenados en 4 cuartos iguales: </li></ul><ul><li>El segundo cuartil de una distribución es su mediana. </li></ul>Q 1 Q 2 Q 3
  8. 8. 1er cuartil 3er cuartil Mediana
  9. 9. Percentiles <ul><li>Los percentiles son otro conjunto de medidas de tendencia no central de una distribución. </li></ul><ul><li>Dividen los datos ordenados en 100 partes iguales. </li></ul><ul><li>El percentil 25 es el primer cuartil ... </li></ul><ul><li>Ejemplo </li></ul><ul><ul><li>Supongamos que el 78% de los resultados de la nota del parcial es menor o igual a 4 puntos. Entonces, 4 es el percentil 78 de la distribución. </li></ul></ul>78% de todos los resultados 22%
  10. 10. <ul><ul><li>Percentiles frecuentemente utilizados </li></ul></ul><ul><ul><ul><li>Primer decil = percentil 10 </li></ul></ul></ul><ul><ul><ul><li>Primer cuartil, Q 1 , = percentil 25 </li></ul></ul></ul><ul><ul><ul><li>Segundo cuartil, Q 2 , = percentil 50 </li></ul></ul></ul><ul><ul><ul><li>Tercer cuartil, Q 3 , = percentil 75 </li></ul></ul></ul><ul><ul><ul><li>Noveno decil = percentil 90 </li></ul></ul></ul><ul><ul><li>Ejemplo </li></ul></ul><ul><ul><ul><li>Encontrar los cuartiles del siguiente conjunto de datos: </li></ul></ul></ul><ul><ul><ul><li>7, 8, 12, 17, 29, 18, 4, 27, 30, 2, 4, 10, 21, 5, 8 </li></ul></ul></ul>Percentiles
  11. 11. <ul><ul><li>Solución </li></ul></ul><ul><ul><li>Primero, ordenar las observaciones </li></ul></ul><ul><ul><ul><li>2, 4, 4, 5 7, 8, 10, 12 17, 18, 18 21 27, 29,30 </li></ul></ul></ul>Como máximo, (.25)(15) = 3.75 observaciones deberían aparecer por debajo del primer cuartil. Como máximo, (.75)(15)=11.25 observaciones deberían aparecer por encima del primer cuartil. Primer cuartil Si el numero de observaciones es par, los resultados se encuentran entre dos observaciones. En ese caso, hay que elegir el punto medio entre ambas observaciones . Segundo cuartil Tercer cuartil
  12. 12. <ul><li>Medidas de dispersión </li></ul><ul><li>  </li></ul><ul><li>Estudia la distribución de los valores de la serie, analizando si estos se encuentran más o menos concentrados, o más o menos dispersos. </li></ul><ul><li>Existen diversas medidas de dispersión , entre las más utilizadas podemos destacar las siguientes: </li></ul><ul><li>Rango </li></ul><ul><li>Varianza </li></ul><ul><li>Desviación tipica </li></ul><ul><li>Coeficiente de variación </li></ul><ul><li>Coeficiente de asimetria </li></ul>
  13. 13. MEDIDAS DE DISPERSIÓN Se tiene dos grupos de datos, el grupo A: 2, 98, 3, 97, y el grupo B: 49, 51, 48, 52; obsérvese que aunque en ambos grupos el promedio es 50, da la impresión de que este promedio representa mejor los datos del grupo B que los del grupo A, puesto que los datos del grupo B están menos dispersos.
  14. 14. Ejemplo de dos conjuntos de datos con igual media Datos con alta dispersión Datos con baja dispersión Medidas de dispersión
  15. 15. Medidas de dispersión <ul><li>Rango </li></ul><ul><li>Una manera de medir la dispersión es calcular el recorrido de la distribución empírica, es decir, la diferencia entre las observaciones máxima y mínima . </li></ul><ul><li>Su mayor ventaja es que se puede calcular facilmente, sin embargo, no brinda información sobre la dispersión existente entre ambos valores extremos. </li></ul>
  16. 16. La Varianza : Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. La sumatoria obtenido se divide por el tamaño de la muestra. La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
  17. 17. MEDIDAS DE DISPERSION 1 . Rango mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. R = Valor máximo – Valor mínimo 2. Varianza : Medidas de dispersión de los valores alrededor del promedio S 2 = ∑( Xi –X) 2 para muestras n-1 δ 2 = ∑( Xi –  ) 2 para población n Calcule la varianza y la desviación estándar Serie 7 14 14 14 21
  18. 18. Una medida de dispersión: La varianza <ul><li>La varianza s 2 de un conjunto de observaciones es el promedio de los cuadrados de la desviaciones de las observaciones respecto a su media. Formalmente: </li></ul><ul><li>De forma compacta: </li></ul>
  19. 19. VARIANZA: comparación de cada uno con el promedio elevar cada diferencia al cuadrado y sumar : X=166cm 181 180 176 175 170 168 168 162 160 158 155 154,150 Varianza : 1262.9 cm 2 =97 13 Desviación estándar = RAIZ(97) = 9.9 cm
  20. 20. Considere dos poblaciones: Población A: 8, 9, 10, 11, 12 Población B: 4, 7, 10, 13, 16 10 9 8 7 4 10 11 12 13 16 8 –10 = -2 9 –10 = -1 11 –10 = +1 12 – 10 = +2 Suma = 0 4 -10 = - 6 7- 10 = -3 13 -10 = +3 Suma = 0 16 -10 = +6 La media de ambas poblaciones es 10... … pero en B los datos están mucho mas dispersos que en A Comencemos calculando la suma de las desviaciones A B En ambos casos, la suma de las desviaciones es Cero (lo cual es siempre Cierto). Por lo tanto, usamos la suma de los cuadrados . La varianza
  21. 21. Calculemos la suma de las desviaciones al cuadrado para ambas poblaciones: La varianza
  22. 22. Una medida de dispersión: El desvío standard <ul><li>La desviación típica es la raíz cuadrada positiva de la varianza s 2 : </li></ul><ul><li>Ejemplo: </li></ul><ul><li>Tasas de retorno de dos fondos de inversiones durante 10 a ño s </li></ul><ul><li>¿ Cual de los dos es más riesgoso? </li></ul><ul><li>Fondo A: 8.3, -6.2, 20.9, -2.7, 33.6, 42.9, 24.4, 5.2, 3.1, 30.05 </li></ul><ul><li> Media: 14.6 Desvío standard: 16.74 </li></ul><ul><li>Fondo B: 12.1, -2.8, 6.4, 12.2, 27.8, 25.3, 18.2, 10.7, -1.3, 11.4 </li></ul><ul><li> Media: 11.75 Desvío standard: 9.97 </li></ul><ul><li>El fondo A es mas riesgoso dado que su desvío standard es mayor. </li></ul>
  23. 23. Propiedades de la desviación standard <ul><li>s mide la dispersión respecto a la media. Debe emplearse solo cuando se escoge la media como medida central de la distribución. </li></ul><ul><li>s = 0 solo ocurre cuando no hay dispersión: todas las observaciones toman el mismo valor. De lo contrario s > 0. </li></ul><ul><li>Cuanto más dispersión hay entre las observaciones, mayor es s. </li></ul><ul><li>s, al igual que la media, se encuentra fuertemente influenciado por las observaciones extremas. </li></ul>
  24. 24. EJEMPLO Se toma la información sobre el número de pacientes que llegan a un hospital el fin de semana durante las 2 y las 6 AM, observando una muestra de 25 fines de semana, se obtuvieron los siguientes resultados: 8, 6, 7, 9, 8, 7, 8, 10, 4, 10, 8, 7, 9, 8, 7, 6, 5, 10, 7, 8, 5, 6, 8, 10, 11. Construir la tabla de frecuencias, además de su distribución. Representar gráficamente la información. Calcular medidas de tendencia central y medidas de dispersión.
  25. 25. δ 2 = ∑f X 2 –  2 para población n <ul><li>La varianza en datos agrupados se calcula: </li></ul><ul><li>Se halla el punto medio de cada intervalo </li></ul><ul><li>La media clase obtenida se eleva al cuadrado </li></ul><ul><li>Se multiplica esta media clase elevada al cuadrado por la frecuencia </li></ul><ul><li>Se aplica la formula </li></ul>
  26. 26. 3. Desviación típica : Se calcula como raíz cuadrada de la varianza. 4. Coeficiente de variación : Permite determinar el grado de variabilidad. Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V
  27. 27. Coeficiente de variación <ul><li>El coeficiente de variación es una medida de dispersión relativa. </li></ul><ul><li>Muestra la dispersión de una distribución en relación a su media. </li></ul><ul><li>Se utiliza para comparar distintas distribuciones. </li></ul><ul><li>Su fórmula es: </li></ul><ul><li>Por ejemplo, un desvio standard de 10, puede ser grande si la media es 100, pero no lo es si la media es 500. </li></ul>

×