Medidas de tendencia central para datos agrupados

283,149 views
284,829 views

Published on

Se describe la manera de calcular la moda, la media y la mediana, para datos agrupados, mediante el llenado de la tabla de distribución de frecuencias.

Published in: Education
22 Comments
80 Likes
Statistics
Notes
No Downloads
Views
Total views
283,149
On SlideShare
0
From Embeds
0
Number of Embeds
6,856
Actions
Shares
0
Downloads
3,751
Comments
22
Likes
80
Embeds 0
No embeds

No notes for slide

Medidas de tendencia central para datos agrupados

  1. 1.  Al igual que en la distribución de los datos no agrupados, tenemos la moda, la mediana y el promedio; pero ahora, las medidas de tendencia central en algunas de ellas cambiaran de nombre; se llamaran: CLASE MODAL: La clase que más se repite, es la clase donde se encuentra la mayor frecuencia. Puede haber como en el caso anterior, dos o más modas, llamándose clase bimodal o multimodal, según sea el caso. MEDIANA: Es el dato que se encuentra exactamente a la mitad de los datos proporcionados en forma ordenada. MEDIA: Es también conocido como PROMEDIO (también es conocida como Media Aritmética, -no confundirla con la media geométrica-). Ahora, en este tipo de arreglo estadístico se ocupa cuando tenemos variables involucradas en gran cantidad, y además cuando el Rango de distribución de los datos es muy grande. Con esto logramos síntesis e información.
  2. 2.  De la producción diaria de una máquina se eligió una muestra de 100 baterías que se probaron para ver cuánto tiempo operarían en una lámpara . Los resultados fueron los siguientes: ◦ NOTA: El tiempo se midió en horas. 228 214 230 247 233 221 217 222 231 220 236 216 213 222 234 227 211 217 243 241 231 239 248 240 241 211 220 223 227 229 212 212 232 243 235 231 240 231 217 229 217 214 219 223 246 240 227 228 231 235 220 217 239 242 241 250 230 217 246 231 211 233 236 237 219 217 222 236 247 217 249 216 237 243 242 241 222 217 219 220 235 217 225 236 239 230 240 236 236 238 223 223 213 216 246 240 222 223 221 239
  3. 3.  Los primeros cálculos para agrupar los datos y realizar la tabla de distribución de frecuencias, son: ◦ 1º) El RANGO, R: También se conoce como RECORRIDO. Es una forma de medir la variación en un conjunto de valores. Se calcula tomando el dato mayor y el dato menor, y se le saca su diferencia. Es decir: R = D. mayor – D. menor En nuestro ejercicio, será: R = 250 – 211 = 39Nos vamos a nuestros datos, y buscamosel dato que tenga la mayor magnitud de los números dados, y ése será el DATO MAYOR; y también, buscamos el de Por tanto, el rango que menor magnitud, y ése será el DATO tenemos es de 39 unidades MENOR. Y aplicamos la fórmula.
  4. 4. ◦ 2º) El NÚMERO DE INTERVALOS DE CLASE, i: Se puede calcular de dos maneras:  La primera es, utilizando la Regla de Sturges, que consiste en: k = 1 + 3.322 (log10 n) o Donde, k, es el número de intervalos de clase y n, el número de datos.  La segunda es, calculando por: √n , donde n es el número de datos. o Para nuestro ejercicio, utilizaremos la segunda por razones prácticas. NOTA: Los dos métodos nos dan un acercamiento ante la distribución a realizar. Si después de hacer las operaciones, nos sobran datos por ejemplo, pues aumentamos el número de intervalos, es decir, ajustamos de acuerdo a nuestras necesidades. En nuestro ejercicio es: Como tenemos 100 datos, le sacamos la raíz √100 = 10 cuadrada y obtenemos 10 intervalos de clase
  5. 5. ◦ 3º) La AMPLITUD DE CLASE, A.c. (vamos a simbolizarla así): Ésta se calcula dividiendo el Rango entre el número de intervalo de clase; es decir: Sustituimos A.c. = R / i los valores ya encontradosPara nuestro ejercicio, será: en la fórmula y tenemos: A.c. = 39 = 3.9 ≈ 4 10Con esto, ya podemos empezar a trabajar en nuestra tabla de distribución de frecuencias.
  6. 6.  Para trabajar estos datos lo haremos llenando una tabla de distribución de frecuencias, para obtener los resultados e interpretarlos. Ésta consiste en:: Frecuencia Frecuencia relativa acumulada: Es el ir Marca de absoluta: sumando todos los clase, es Es el Frecuencia Frecuencia datos para Límite el número de absoluta relativa: Es corroborar la real de promedio veces con acumulada el dato de cantidad de datos Clase, clase, la de los que los : Es el ir la dados, nos tiene Número que intención números valores sumando frecuencia que dar el 100% o la de consta de es tener que tiene que consta todos los absoluta, re unidad.intervalo un dato datos sin la clase, el datos para presentand inferior y dejar Es el producto entre el intervalo corroborar o en forma un espacios entre la límite se la cantidad porcentual superior entre frecuencia inferior y encuentre de datos (o decimal). dato y absoluta y el el repetido. dados. dato dato en superior cuestión. i Clase L.R.C. Xi fi f. ac. f. rel. f. rel. xi (fi) (%) ac. (%)
  7. 7.  Procedamos al llenado de la tabla de distribución de frecuencias. Comenzamos a calcular LA CLASE.El número i Clase Esta la calcularemos de la siguiente manera: de 1 211 - 214 * Como ya hicimos los cálculos acerca de laintervalos, Amplitud de clase, que nos arrojó el valor de lo 2 215 - 218 4. ponemos de 3 219 – 222 * Ahora, vamos a contar las primeras cuatro acuerdo a cantidades de nuestros resultados, a saber: 4 223 – 226 las 211, 212, 213 y 214.operacion 5 es 227 – 230 •Lo vamos a representar como: 211 – 214; y lo primeras, 6 231 – 234 colocamos en la primera celda de nuestra cuando clase.aplicamos 7 235 – 238 • NOTA: No caigamos en el error de decir: 211la regla de Sturges o 8 239 – 242 + 4 = 215; y ponemos de 211 – 215. Esto espor medio 9 243 – 246 un error, porque aquí ya hay 5 y no 4 datos. de la raíz • En todo caso, lo que podemos hacer sería:cuadrada; 10 247 - 250 que nos 211 + 4 – 1 = 214; y llegamos al resultado.resultó en • Una vez que ya tenemos el primero, nuestro continuamos con el siguiente número, que es ejercicio el 215 y si hacemos lo anterior, tenderíamos: de 10. 215 + 4 – 1= 218; y sería 215 – 218. •Y así sucesivamente, hasta completar la tabla.
  8. 8.  Ahora calcularemos los Límites Reales de Clase (L.R.C.). Para esto, debemos identificar el LÍMITE INFERIOR DE CLASE (L.I.C) y el LÍMITE SUPERIOR DE CLASE (L.S.C.). Lo podemos representar como: XL – XsDonde:XL : Es el Límite Inferior de ClaseXS : Es el Límite Superior de ClaseAhora, una vez identificados, pasamos a calcular los L.R.C., haremos lo siguiente:Tomamos el L.I.C. y tomamos el número anterior a él, y los promediamos. Es decir:En nuestro ejemplo, tenemos como L.I.C. en el intervalo 1: 211 y el número anterior a él, es 210. Así, por tanto, el Límite Real Inferior de Clase (L.R.I.C.), será: L.R.I.C. = 210 + 211 = 421 = 210.5 2 2Y Para calcular el Límite Real Superior de Clase (L.R.S.C.), se hace lo mismo; pero ahora, tomamos el Límite Superior de Clase que, en nuestro ejemplo es 214, y ahora tomamos el número posterior a él, que es 215, y de igual manera los promediamos y obtenemos el L.R.S.C.: L.R.S.C. = 214 + 215 = 429 = 214.5 2 2
  9. 9. Nos queda, por tanto, la tabla de distribución de frecuencias: 210 + 211 = 421 = 210.5 2 2 i Clase L.R.C. 214 + 215 = 429 = 214.5 2 2 1 211 - 214 210.5 – 214.5 2 215 - 218 214.5 – 218.5 214 + 215 = 429 = 214.5 2 2 3 219 – 222 218.5 – 222.5 218 + 219 = 437 = 218.5 4 223 – 226 222.5 – 226.5 2 2 5 227 – 230 226.5 – 230.5 218 + 219 = 437 = 218.5 6 231 – 234 230.5 – 234.5 2 2 7 235 – 238 234.5 – 238.5 222 + 223 = 445 = 222.5 2 2 8 239 – 242 238.5 – 242.5 9 243 – 246 242.5 – 246.5 Esto se realiza para tener 10 247 - 250 246.5 – 250.5 datos en forma consecutiva, para que a la hora de graficar, Y seguimos teniendo de tengamos en caso del amplitud de clase = 4. Por Histograma barrastanto, no se han alterado las consecutivas y no separadas operaciones.
  10. 10.  Ahora, calcularemos la Marca de Clase, Xi.  La tabla queda así: Para calcular, la marca de clase, hacemos lo siguiente:i Clase L.R.C. Xi Tomamos los Límites de Clase,1 211 - 214 210.5 – 214.5 212.5 tanto el Inferior como el Superior y2 215 - 218 214.5 – 218.5 216.5 los promediamos, y de esa manera encontramos la marca de clase. Es3 219 – 222 218.5 – 222.5 220.5 decir:4 223 – 226 222.5 – 226.5 224.5 En el intervalo 1, tenemos 2115 227 – 230 226.5 – 230.5 228.5 (como L.I.C.) y 214 (como L.S.C.); los sumamos y los dividimos entre6 231 – 234 230.5 – 234.5 232.5 2:7 235 – 238 234.5 – 238.5 236.58 239 – 242 238.5 – 242.5 240.5 X1 = 211 + 214 = 425 = 212.5 2 29 243 – 246 242.5 – 246.5 244.5 Para el intervalo 2, tenemos:10 247 - 250 246.5 – 250.5 248.5 X2 = 215 + 218 = 433 = 216.5 2 2 Y así, sucesivamente hasta completar los datos.
  11. 11.  Ahora vamos a calcular la frecuencia absoluta, fi.  1º) Vamos a identificar los eventos (los datos) que están dentro del rango de la clase y los colocamos en nuestra columna que le llamamos, fi.  2º) Contamos cuantas veces se repiten los eventos, en este caso son números. Regreso a mis resultadosi Clase L.R.C. Xi fi obtenidos y empiezo a1 211 - 214 210.5 – 214.5 212.5 contar cuántos números del2 215 - 218 214.5 – 218.5 216.5 211 al 214 encuentro ( es3 219 – 222 218.5 – 222.5 220.5 decir, veo cuántos 211, 212, 213 y 214 hay, los junto y4 223 – 226 222.5 – 226.5 224.5 esa va a ser la fi del primer5 227 – 230 226.5 – 230.5 228.5 intervalo) y coloco esa cantidad en la primera6 231 – 234 230.5 – 234.5 232.5 celda; luego cuento cuantos7 235 – 238 234.5 – 238.5 236.5 215 al 218 y lo pongo en la8 239 – 242 238.5 – 242.5 240.5 segunda celda, y así sucesivamente hasta9 243 – 246 242.5 – 246.5 244.5 terminar de contar todos los10 247 - 250 246.5 – 250.5 248.5 datos. Así empiezo a vaciar los resultados en la tabla.
  12. 12. Una forma de resolver el problema sería de la siguiente manera, reconocer todos los datos de una clase (los identifico de un color) y los sumo; colocando el dato en la celda correspondiente al intervalo de claseal cual estamos trabajando y así hacerlo con cada una de las clases. O se puede ocupar otro recurso para diferenciar y agrupar, ya sea tachando con alguna figura, una cruz los de un intervalo, con un círculo los de otro intervalo, etc.
  13. 13.  Quedándonos así la tabla de distribución de frecuencias, hasta el momento: i Clase L.R.C. Xi fi 1 211 - 214 210.5 – 214.5 212.5 9 2 215 - 218 214.5 – 218.5 216.5 13 3 219 – 222 218.5 – 222.5 220.5 16 4 223 – 226 222.5 – 226.5 224.5 4 5 227 – 230 226.5 – 230.5 228.5 10 6 231 – 234 230.5 – 234.5 232.5 10 7 235 – 238 234.5 – 238.5 236.5 11 8 239 – 242 238.5 – 242.5 240.5 19 9 243 – 246 242.5 – 246.5 244.5 5 10 247 - 250 246.5 – 250.5 248.5 3
  14. 14.  A partir de estos cálculos que vamos a realizar, serán de la misma manera como los hicimos con los datos no agrupados. Una vez que tenemos estos datos, pasamos a corroborar nuestros datos con la frecuencia acumulada, además también nos es útil para verificar hacia donde vamos a encontrar la mediana. i fi f. ac. Para esto, tomamos el primer término de la frecuencia 1 9 9 absoluta, lo copiamos y lo 2 13 22 ponemos en la primera celda de 3 16 38 la columna de la frecuencia acumulada de nuestra tabla, 4 4 42 después sumamos ese número 5 10 52 con el siguiente de la segunda frecuencia absoluta y lo 6 10 62 ponemos en la segunda celda de 7 11 73 la frecuencia acumulada y así sucesivamente, en la última 8 19 92 debemos obtener el número 9 5 97 total de datos. 10 3 100
  15. 15.  Quedándonos así la tabla de distribución de frecuencias, hasta el momento: i Clase L.R.C. Xi fi f.ac. 1 211 - 214 210.5 – 214.5 212.5 9 9 2 215 - 218 214.5 – 218.5 216.5 13 22 3 219 – 222 218.5 – 222.5 220.5 16 38 4 223 – 226 222.5 – 226.5 224.5 4 42 5 227 – 230 226.5 – 230.5 228.5 10 52 6 231 – 234 230.5 – 234.5 232.5 10 62 7 235 – 238 234.5 – 238.5 236.5 11 73 8 239 – 242 238.5 – 242.5 240.5 19 92 9 243 – 246 242.5 – 246.5 244.5 5 97 10 247 - 250 246.5 – 250.5 248.5 3 100
  16. 16.  Ahora, calculamos la frecuencia relativa, como lo hicimos en Datos no agrupados: F. rel (%) = fi (100%) . Σfi Quedándonos de la siguiente manera: F. rel (%) = 9 (100%) = 9.0 % xi fi f. ac. f. rel. % 100 F. rel (%) = 13 (100%) = 13.0 % 1 9 9 9.0 100 F. rel (%) = 16 (100%) = 16.0 % 2 13 22 13.0 100 3 16 38 16.0 F. rel (%) = 4 (100%) = 4.0 % 100 4 4 42 4.0 F. rel (%) = 10 (100%) = 10.0 % 100 5 10 52 10.0 F. rel (%) = 10 (100%) = 10.0 % 100 6 10 62 10.0 F. rel (%) = 11 (100%) = 11.0 % 100 7 11 73 11.0 F. rel (%) = 19 (100%) = 19.0 % 8 19 92 19.0 100 F. rel (%) = 5 (100%) = 5.0 % 9 5 97 5.0 100 F. rel (%) = 3 (100%) = 3.0 % 10 3 100 3.0 100
  17. 17.  Pasamos a la penúltima columna, para el cálculo de la frecuencia relativa acumulada, vamos hacer lo mismo que hicimos en la frecuencia absoluta acumulada, nada más que ahora la suma nos tiene que dar 100% (o cercano a 100%, por los decimales tomados, -o si lo tomamos en decimales el total debe ser 1 o cercano a 1-): xi fi f. ac. f. rel. % f.rel.ac. % 1 9 9 9.0 9.0 2 13 22 13.0 22.0 ¡Lo 3 16 38 16.0 38.0 hicimos! 4 4 42 4.0 42.0 5 10 52 10.0 52.0 6 10 62 10.0 62.0 7 11 73 11.0 73.0 8 19 92 19.0 92.0 9 5 97 5.0 97.0 10 3 100 3.0 100.0 100 %
  18. 18.  Quedándonos así la tabla de distribución de frecuencias, hasta el momento: i Clase L.R.C. Xi fi f.ac. f. rel. % f.rel.ac. % 1 211 - 214 210.5 – 214.5 212.5 9 9 9.0 9.0 2 215 - 218 214.5 – 218.5 216.5 13 22 13.0 22.0 3 219 – 222 218.5 – 222.5 220.5 16 38 16.0 38.0 4 223 – 226 222.5 – 226.5 224.5 4 42 4.0 42.0 5 227 – 230 226.5 – 230.5 228.5 10 52 10.0 52.0 6 231 – 234 230.5 – 234.5 232.5 10 62 10.0 62.0 7 235 – 238 234.5 – 238.5 236.5 11 73 11.0 73.0 8 239 – 242 238.5 – 242.5 240.5 19 92 19.0 92.0 9 243 – 246 242.5 – 246.5 244.5 5 97 5.0 97.0 10 247 - 250 246.5 – 250.5 248.5 3 100 3.0 100.0
  19. 19.  Por último, pasamos a la última celda, que corresponde a la multiplicación de la marca de clase, Xi, por la frecuencia absoluta, fi, (tengan cuidado, no se vayan a equivocar con la acumulada). Es decir: i Xi fi Xi(fi) Aquí vamos a multiplicar Xi 1 212.5 9 1912.5 (fi), es decir: 2 216.5 13 2814.5 212.5(9) = 1912.5 216.5(13) = 2814.5 3 220.5 16 3528 220.5(16) = 3528 4 224.5 4 898 . . 5 228.5 10 2285 . 6 232.5 10 2325 Hasta el último: 248.5(3) = 745.5 7 236.5 11 2601.5 Una vez, hecho esto, sumo 8 240.5 19 4569.5 la columna y pongo el valor de la suma en la celda de 9 244.5 5 1222.5 abajo. 10 248.5 3 745.5 Quedándonos así: 22905
  20. 20.  Quedándonos así la tabla de distribución de frecuencias:i Clase L.R.C. Xi fi f.ac. f. rel. % f.rel.ac. % Xi(fi)1 211 - 214 210.5 – 214.5 212.5 9 9 9.0 9.0 1912.52 215 - 218 214.5 – 218.5 216.5 13 22 13.0 22.0 2814.53 219 – 222 218.5 – 222.5 220.5 16 38 16.0 38.0 35284 223 – 226 222.5 – 226.5 224.5 4 42 4.0 42.0 8985 227 – 230 226.5 – 230.5 228.5 10 52 10.0 52.0 22856 231 – 234 230.5 – 234.5 232.5 10 62 10.0 62.0 23257 235 – 238 234.5 – 238.5 236.5 11 73 11.0 73.0 2601.58 239 – 242 238.5 – 242.5 240.5 19 92 19.0 92.0 4569.59 243 – 246 242.5 – 246.5 244.5 5 97 5.0 97.0 1222.510 247 - 250 246.5 – 250.5 248.5 3 100 3.0 100.0 745.5 22905
  21. 21.  ¿Para qué hacer este último cálculo? ◦ Es necesario, porque vamos a empezar a calcular las llamadas “Medidas de Tendencia Central”, recordando: la Moda, la Media, y la Mediana. Y de esta manera se facilitarán los cálculos. Para este dato (que es el más fácil de ubicar), ahora se llamará Clase Modal, lo vamos a reconocer de la siguiente manera, nos vamos a nuestra tabla de distribución de frecuencias, buscamos el intervalo de clase que mayor frecuencia presente y ese es la Clase Modal.  En caso de haber dos datos que tengan la misma moda, se llamará: clase bimodal (y así sucesivamente).  En nuestro ejercicio, la CLASE MODAL, será el intervalo de clase: 8, que corresponde a 239 -242, por tener de frecuencia = 19.
  22. 22.  Para el cálculo de la media, vamos a ocupar la siguiente fórmula: X = Σ Xi(fi) Σfi o ◦ Para representar la media, se pone una “x testada”, o algunos ponen la letra griega . Nosotros ocuparemos la x. Regresamos a nuestra tabla de distribución de frecuencias, nos dirigimos a la columna que tiene Xi(fi), y vemos cuanto nos resultó la suma, y sustituimos los valores en nuestra fórmula. Quedándonos así: X = 22905 = 229.05 ¡Y esta es nuestra media o promedio de los datos! 100 hrs
  23. 23.  Procedemos a realizar el último cálculo correspondiente a las medidas de Tendencia Central, la Mediana. Algunos representan a la Mediana, como Me. Nosotros también la utilizaremos. Cuando se calcula la mediana, se supone que los valores están distribuidos uniformemente en todo el intervalo. Para ello vamos a recurrir a la frecuencia acumulada. Para esto, seguiremos los siguientes pasos:1º) Localizamos el intervalo de clase donde se encuentra la llamadaMediana Teórica, que es dividir el número total de datos por 2:Me t = n/2.En nuestro ejercicio, será: 100 / 2 = 50
  24. 24.  Continuación de los pasos a seguir:2º) Una vez calculada la mediana teórica, localizamos el intervalo donde seencuentra este valor, lo vamos a buscar en la frecuencia acumulada denuestra Tabla de distribución de frecuencias.En nuestro ejercicio, observamos que hasta el intervalo 4, se tiene unafrecuencia acumulada de 42, por tanto, en el intervalo 5, tenemos 52. Esaquí, en este intervalo donde vamos a encontrar la mediana. Está entre laclase 226.5 – 230.5, si se consideran los límites de clase verdaderos.3º) ¿Qué tanto debemos avanzar en este intervalo antes de llegar a lamediana? Debemos hacer lo siguiente: Restamos la Mediana teórica y lafrecuencia acumulada del intervalo anterior donde se encuentra la mediana;y dividimos este valor por la frecuencia absoluta del intervalo donde seencuentra la mediana.En nuestro ejercicio, será: (50 – 42) / 10 = 8 /10 = 0.84º) Una vez, teniendo este valor lo vamos a multiplicar por la diferencia de laclase (límite superior menos límite inferior de clase) y lo sumaremos al límiteinferior verdadero.
  25. 25.  Continuación de los pasos a seguir:En general, la mediana puede calcularse a partir de datos agrupadosmediante la siguiente fórmula: Mediana = Me = Li + jj (Ls – Li) Mediana = Me = Li + (Ls – Li) fi fiDondeLi = Límite inferior verdadero del intervalo que contiene a la mediana.Ls = Límite superior verdadero del intervalo que contiene a la mediana.j = Número de observaciones que aún faltan por alcanzar a la mediana unavez que se ha alcanzado el límite inferior del intervalo que contiene a lamedianafi = Frecuencia del intervalo que contiene a la mediana.En nuestro ejercicio, la mediana será entonces:Me = 226.5 + 8 (230.5 – 226.5) = 226.5 + 0.8(4) = 226.5 + 3.2 10 Esta es la mediana deMe = 229.7 nuestros datos agrupados
  26. 26.  Ahora, ya teniendo los datos lo vamos a presentar en gráficos. Se puede presentar la información en: ◦ Un histograma, ◦ Un polígono de frecuencias ◦ Y un gráfico circular. Va a depender de cómo queremos presentarla, para una mejor, fácil y rápida comprensión de los resultados. En Excel, lo puedes hacer de la siguiente manera:

×