4. Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles : son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles : son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles : son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados
5. Se puede definir otros índices para precisar la posición de los valores: Los Cuartiles Dividen los valores ordenados en cuatro partes iguales: el 1er cuartil que deja un cuarto de los valores por debajo. la 2do cuartil , que es la mediana. el 3er cuartil que deja un cuarto de los valores por arriba.
13. MEDIDAS DE DISPERSIÓN Se tiene dos grupos de datos, el grupo A: 2, 98, 3, 97, y el grupo B: 49, 51, 48, 52; obsérvese que aunque en ambos grupos el promedio es 50, da la impresión de que este promedio representa mejor los datos del grupo B que los del grupo A, puesto que los datos del grupo B están menos dispersos.
14. Ejemplo de dos conjuntos de datos con igual media Datos con alta dispersión Datos con baja dispersión Medidas de dispersión
15.
16. La Varianza : Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. La sumatoria obtenido se divide por el tamaño de la muestra. La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
17. MEDIDAS DE DISPERSION 1 . Rango mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo. R = Valor máximo – Valor mínimo 2. Varianza : Medidas de dispersión de los valores alrededor del promedio S 2 = ∑( Xi –X) 2 para muestras n-1 δ 2 = ∑( Xi – ) 2 para población n Calcule la varianza y la desviación estándar Serie 7 14 14 14 21
18.
19. VARIANZA: comparación de cada uno con el promedio elevar cada diferencia al cuadrado y sumar : X=166cm 181 180 176 175 170 168 168 162 160 158 155 154,150 Varianza : 1262.9 cm 2 =97 13 Desviación estándar = RAIZ(97) = 9.9 cm
20. Considere dos poblaciones: Población A: 8, 9, 10, 11, 12 Población B: 4, 7, 10, 13, 16 10 9 8 7 4 10 11 12 13 16 8 –10 = -2 9 –10 = -1 11 –10 = +1 12 – 10 = +2 Suma = 0 4 -10 = - 6 7- 10 = -3 13 -10 = +3 Suma = 0 16 -10 = +6 La media de ambas poblaciones es 10... … pero en B los datos están mucho mas dispersos que en A Comencemos calculando la suma de las desviaciones A B En ambos casos, la suma de las desviaciones es Cero (lo cual es siempre Cierto). Por lo tanto, usamos la suma de los cuadrados . La varianza
21. Calculemos la suma de las desviaciones al cuadrado para ambas poblaciones: La varianza
22.
23.
24. EJEMPLO Se toma la información sobre el número de pacientes que llegan a un hospital el fin de semana durante las 2 y las 6 AM, observando una muestra de 25 fines de semana, se obtuvieron los siguientes resultados: 8, 6, 7, 9, 8, 7, 8, 10, 4, 10, 8, 7, 9, 8, 7, 6, 5, 10, 7, 8, 5, 6, 8, 10, 11. Construir la tabla de frecuencias, además de su distribución. Representar gráficamente la información. Calcular medidas de tendencia central y medidas de dispersión.
25.
26. 3. Desviación típica : Se calcula como raíz cuadrada de la varianza. 4. Coeficiente de variación : Permite determinar el grado de variabilidad. Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V