1. Estrategia didáctica 1.2.2.2. Histogramas
Comentario: En esta estrategia se inicia el estudio de la graficación de datos. Esto
es esencial para determinar cuáles son las características de los datos que se
reunieron en la encuesta.
I. Para construir el histograma de una serie de datos, realiza los siguientes pasos:
1. Calcula la longitud del intervalo en el que se encuentran todos los datos. Para
ello, busca el dato mayor y el dato menor y réstalos. El resultado se le llama
rango (R). Para los salarios de los obreros de la industria textil es 330.17-184.8
= 145.37.
2. Calculemos el número adecuado de cortes o intervalos que contendrá el rango
para tener la mejor agrupación de los datos (y así tener mejor información de
ellos.) Usemos la regla de Sturges, en la que k es el número de clases o
intervalos que se usarán, n es el número de datos (hay 250 salarios) y log es la
función logaritmo.
k=1 + 3.3 log(n)
En nuestro caso: k = 1+3.3log(250) = 8.91
Comprobando con WolfranAlpha:
Esto quiere decir que se necesitan 8 clases para agrupar adecuadamente los 250
datos. El redondeo debe hacerse siempre al entero inmediato inferior.
2. 3. Para saber de qué longitud (amplitud) deben ser los 8 intervalos o clases, se
calcula R/k, esto es 145.37/8 = 18.17. Así, si sumamos 8 veces 18.17, tendremos
145.37, lo que significa que los 8 intervalos de esa longitud cubren todo el rango
que contiene a los 250 datos. Pero es más adecuado facilitar el conteo, si
redondeamos la longitud 18.17. Siempre es mejor que las clases tengan
longitudes enteras porque facilitan los cálculos.
4. Por ejemplo, si redondeamos 18.17 a 19, el entero inmediato superior, entonces
los 8 intervalos o clases cubrirán 8*19 = 152, lo que significa que hemos
cubierto un poco más de la longitud original del rango (145.36), es decir, hay un
exceso de 152-145.36 = 6.63. Dado que no hay reglas acerca de cuál debe ser la
longitud óptima de las clases, se puede proponer el redondeo de 18.17 a 20,
(necesariamente mayor a 18.17) lo que significa que las 8 clases cubrirían 8*20
= 160, y se tiene un exceso de 160-145.37=14.63. También a 21, es decir 8*21 =
168, y el exceso sería 168-145.37 = 22.63. En general, se pueden proponer
longitudes de clases con números enteros (en nuestro caso de 19, 20, 21, 22,
etcétera) o con números decimales, si los datos que tenemos requieren que se
clasifiquen de esta forma, (18.5, 19.5, 20.5, etcétera), pero todo depende del tipo
de datos que se tenga. La longitud de clase dependerá siempre de los valores de
los datos y a lo largo del curso se usarán de distintos tipos para que se aclare la
formación del histograma según las características de ellos. Es importante que
no se olvide que sólo la continua construcción de histogramas les ayudará a
desarrollar la habilidad y el sentido común para hacerlos porque no existe una
fórmula universal para construirlos.
5. En nuestro ejercicio, ¿cuál sería la longitud más adecuada? Podemos saber cuál
ya no es la más adecuada: Si el exceso es mayor al resultado obtenido al dividir
R/k = 18.17, entonces ya no es adecuada. Por tanto, no se deben usar clases de
longitud 21 o más porque el exceso que se obtiene ya es mayor a 18.17 (en el
caso de que la longitud sea 21, el exceso fue de 22.63). Queda entonces elegir
entre 19 y 20, pues ambas longitudes cumplen que el exceso no es mayor a
18.17. Elegiremos 20, porque es más fácil contar de 20 en 20 que de 19 en 19 y
porque el cuadro que se formará con ese conteo tendrá mejor presentación.
6. Para una longitud i = 20, el exceso es de 14.63. Si contamos de 20 en 20
empezando desde el dato menor 184.8, terminaríamos en 344.8. Pero recuerda
que el dato mayor es 330.17, por lo que habría un intervalo vacío entre 330.17 y
344.8 porque no hay datos mayores a 330.17. Lo más adecuado es repartir el
exceso de 14.63 antes del dato menor y después del dato mayor para no dejar un
intervalo tan grande vacío a la derecha del dato mayor, que sería casi de 15
unidades. Como el dato menor es de 184.8, entonces podemos empezar a contar
de 20 en 20 empezando desde 180, es decir 4.8 unidades menos del dato menor
y terminaríamos en 340, ya con las 8 clases de longitud 20 incluidas. Es decir
nos pasaríamos 9.83 unidades por encima del dato mayor. Si sumamos 4.8 +
9.83 = 14.63, lo que quiere decir que el exceso lo hemos repartido de manera
3. adecuada antes del dato menor y después del dato mayor para facilitar tanto el
conteo como la construcción de nuestro histograma. Esto se observará mejor en
el cuadro siguiente:
Intervalos o clases Frecuencia
1 180 – 199.99 7
2 200 – 219.99 49
3 220 – 239.99
4 240 – 259.99
5 260 – 279.99
6 280 – 299.99
7 300 – 319.99
8 320 – 339.99
total 250
7. El cuadro anterior se llama cuadro de frecuencias. Observa que las 8 clases
tienen longitud 20, y cumplen con todo lo que se discutió arriba. Se usan dos
decimales porque los datos tienen 2 decimales. Los valores 180, 200, 220, ...,
320 se les llama límites inferiores de clase; 199.99, 219.99,...,399.99 se les llama
límites superiores de clase. El conteo de 20 en 20 sirve para calcular los límites
inferiores de clase, los límites superiores se calculan fácilmente buscando un
número con dos decimales anterior al límite inferior de la clase siguiente. La
frecuencia es el número de datos (salarios) que caen en cada clase. Por ejemplo,
la clase 1 contiene 7 datos. Estos van del 184.8 al 194.25, revisa la tabla de
salarios. La clase 2 contiene 49 datos, del 201.05 al 219.75. Completa la tabla
contando de la misma forma cuántos datos contiene cada clase. La suma de las
frecuencias deberá ser 250.
8. Para construir el histograma, toma como base el diagrama siguiente. Sobre el eje
horizontal localiza solamente , a la misma distancia, los límites inferiores de
clase: 180, 200, ..., 320 y también el límite inferior de la novena clase 340. En el
eje vertical has una graduación que dependerá de la frecuencia mayor que hayas
obtenido en el cuadro de frecuencias. Por ejemplo, podrás graduar de 10 en 10 o
de 20 en 20, sin olvidar que en ese eje se miden las frecuencias de clase. El
primer rectángulo lo construyes de manera que tenga base entre los dos primeros
límites inferiores y de altura 7. El segundo rectángulo lo construyes con base
4. entre los límites inferiores segundo y tercero y de altura 49 y así sucesivamente.
Deberás tener 8 rectángulos que representan las clases del cuadro de frecuencia
y su altura indica cuántos datos son agrupados en cada intervalo. A mayor altura,
habrá más datos en esa clase. Una de las funciones del histograma es que te
indica en qué regiones o clases se concentran más los datos (salarios) para que te
des cuenta acerca de la manera en que se reparte el salario y cómo está
distribuido. La gráfica terminada se llama histograma de los salarios de los
obreros de la industria textil.
I. Con las dos siguientes series de datos construye un histograma para cada una
de ellas. ¿Cuál es la variable que gráficas en cada uno de los dos histogramas?:
Salarios mensuales de 250 obreros de la Salarios mensuales de 150 obreros
de la industria textil, dólares. la industria petrolera, dólares.
184.80 188.13 190.34 192.04 194.42 280.05 380.00 347.78
197.65 199.25 201.05 202.53 204.11 289.94 381.50 349.99
205.47 206.49 206.83 208.00 209.04 304.11 385.29 353.00
209.05 209.55 210.07 210.25 210.74 315.01 391.81 357.52
212.44 211.75 212.27 212.44 212.44 319.23 398.55 361.88
212.95 213.16 213.63 213.63 213.89 322.58 406.57 365.08
214.13 214.50 214.83 214.83 215.34 326.75 413.21 367.33
215.50 216.20 216.35 216.40 216.96 332.45 419.38 372.50
217.11 217.37 217.42 217.54 217.71 340.08 421.89 375.54
218.05 218.27 218.27 218.34 218.56 343.35 432.36 379.25
218.90 219.14 219.60 219.60 219.75 345.78 281.12 380.31
219.75 220.26 220.43 220.95 221.28 348.67 297.57 382.42
221.45 221.50 221.62 221.80 222.30 352.07 309.56 388.04
222.95 222.95 222.95 222.96 223.50 355.64 316.00 394.00
223.83 224.00 224.00 224.32 224.51 359.70 321.05 402.21
224.68 225.00 225.25 225.53 225.55 361.97 323.80 408.53
225.70 225.87 225.92 226.04 226.04 366.24 329.18 415.29
226.27 226.59 226.70 226.72 226.88 369.51 335.72 420.16
6. Max. :330.2 Max. :439.8
Puede observarse que los datos se tienden a acumular, en el caso de los salarios de los
obreros de la industria textil, en el intervalo que va de 230 a 240 dólares; en el caso de
los salarios de los obreros de los petroleros, estos se dispersan con mas variedad, pero
puede verse que hay cierta concentración entre los valores de 340 a unos 380 dólares.
Es evidente que en este caso, hay mayor variedad de salarios que en el caso de los de los
obreros textiles.
Se han construido los histogramas en primer lugar y las medidas en segundo, las
gráficas que están descritas mediante segmentos de recta, se llaman polígonos de
frecuencia.
Histogram of Salarios.textil
Salarios.textil
Frequency
200 250 300
0
60
Histogram of petrolera
petrolera
Frequency
300 350 400
0
20
40
7. II. Construye histogramas para las siguientes series de datos (Usa HEC y hazlos a
mano –opcional-, siguiendo las instrucciones dadas al principio de la
estrategia):
a) 32.5 15.2 35.4 21.3 28.4 26.9 34.6 29.3 24.5 31 21.2 28.3
25 32.7 29.5 30.2 23.9 23 26.4 27.3 33.7 29.4 21.9 29.3 17.3
36.8 29.2 23.5 20.6 29.5 21.8 37.5 33.5 29.6 26.8 28.7 34.8 27.1
0.0
46.7
93.3
140.0
Histograma
textil
Count
salarios de obreros de la industria textil
180.0
200.0
220.0
240.0
260.0
280.0
300.0
320.0
340.0
0.0
11.7
23.3
35.0
Histograma
petroleros
Count
salarios de obreros de la industria petrolera
280.0
300.0
320.0
340.0
360.0
380.0
400.0
420.0
440.0
8. 18.6 25.4 34.1 27.5 29.6 22.2 22.7 31.3 33.2 37 28.3 36.9 24.6
28.9 24.8 28.1 25.4 34.5 23.6 38.4 (resistencias a la ruptura en onzas)
b) 2.58 2.51 4.04 6.43 1.58 4.32 2.20 4.19 4.79 6.20 1.52 1.38
3.87 4.54 5.12 5.15 5.50 5.92 4.56 2.46 6.90 1.47 2.11 2.32 6.75
5.84 8.80 7.40 4.72 3.62 2.46 8.75 2.65 7.86 4.71 6.25 9.45 12.80
1.42 1.92 7.60 8.79 5.92 9.65 5.09 4.11 6.37 5.40 11.25 3.90 5.33
8.64 7.41 7.95 10.60 3.81 3.78 3.75 3.10 6.43 1.70 6.40 3.24 1.79
4.90 3.49 6.77 5.62 9.70 5.11 4.50 2.50 5.21 1.76 9.20 1.20 6.85 2.80
7.35 11.75. (tiempos de ignición de materiales de tapicería.)
c) De los siguientes datos que indican el porcentaje de algodón que se usa para
elaborar camisas para caballero, construye un histograma.
34.2 33.6 33.8 34.7 37.8 32.6 35.8 34.6 33.1 34.7
34.2 33.6 36.6 33.1 37.6 33.6 34.5 35 33.4 32.5
35.4 34.6 37.3 34.1 35.6 35.4 34.7 34.1 34.6 35.9
34.6 34.7 34.3 36.2 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.8 35.2 36.8 37.1 33.6 32.8 36.8 34.7 35.1
35 37.9 34 32.9 32.1 34.3 33.6 35.3 34.9 36.9
34.1 33.5 34.5 32.7
d) Si extraes una muestra de 40 datos de los salarios de los obreros petroleros
y realizas el histograma de estos datos, ¿qué esperarías que mostrara este
histograma comparado con el de los 250 datos? ¿por qué? ¿es esa una muestra
representativa de los 250 datos?
Guardar con el nombre nombre-apellido.E1.2.2.2.Histogramas-grupo.xls