1. Estadística
Capítulo 2.2
Organización de datos
numéricos
2-2008 1
2. ARREGLO ORDENADO
Una vez que los datos de la encuesta se
encuentran listos, el siguiente paso es
organizar la información y ordenarla.
• Por cada variable se hace un ordenamiento
simple.
• El determinar cual es el dato que tiene
menor valor y cual el de mayor valor es
información vital para empezar a trabajar
con variables cuantitativas.
2-2008 2
3. Suponga que decide llevar a cabo un estudio
del costo de una comida en un restaurante de
una gran ciudad. A 50 restaurantes citadinos se
les consultó sobre el precio promedio de sus
platos y se obtuvieron los siguientes resultados.
2-2008 3
6. Rango
Calcular el rango es determinar la longitud
numérica que existe entre el primer dato y el
último.
• Restar el dato menor del dato mayor de la
muestra y se obtiene el rango.
• Rango = DatoMayor - DatoMenor
2-2008 6
7. La pregunta que estamos analizando ya tiene
sus datos ordenados, ahora determinar a simple
vista cuales son los datos mayor y menor
respectivamente:
Dato Mayor $ 63.00
Dato Menor $ 14.00
2-2008 7
8. RANGO
En una muestra o población el rango
es la distancia entre el dato mayor y el
dato menor. Se calcula restando
ambos datos.
Rango = Dato Mayor − Dato Menor
2-2008 8
9. Cálculo del rango.
Muestra de restaurantes citadinos
Rango = DatoMayor − DatoMenor
Rango = 63 − 14
Rango = 49
2-2008 9
10. DISTRIBUCIÓN DE FRECUENCIAS
Sin importar si los datos están o no
ordenados, siempre es posible crear una
distribución de frecuencias para los datos
de una variable en una muestra.
La distribución de frecuencias es una tabla
de resumen en la que los datos están
organizados en clases o grupos
numéricamente ordenados.
2-2008 10
11. DISTRIBUCIÓN DE FRECUENCIAS
Se organiza en filas y columnas para
resumir la información y poder
realizar interpretaciones de manera
rápida y efectiva.
Seleccionar el número apropiado de
agrupaciones o clases para la tala,
determinando una amplitud conveniente de las
clases y estableciendo los límites de cada una
para evitar traslape.
2-2008 11
12. Amplitud de intervalo o clase
La Amplitud de cada intervalo o clase se
calcula dividiendo el rango entre el número
de intervalos elegidos.
Se ha convenido que todos los intervalos
tengan la misma amplitud.
Rango
Amplitud =
Numero de Intervalos elegidos
2-2008 12
13. Amplitud de un Intervalo o clase
La mayoría de las veces la amplitud de un
intervalo es mejor trabajarla con una anchura
que sea un número entero (aplican
restricciones).
Si el resultado de la división es decimal, se
redondea el resultado de la siguiente manera.
• Si el resulta es menor de 0.5 se elimina la parte
decimal.
• En caso contrario se pasa al próximo entero.
2-2008 13
14. Cálculo de la amplitud
Muestra de restaurantes citadinos
Rango = DatoMayor − DatoMenor
Rango = 63 − 14
Rango = 49
Intervalos = 7
Amplitud = 49 / 7
Amplitud = 7
2-2008 14
15. DISTRIBUCIÓN DE FRECUENCIAS
Se organiza en filas y 2
columnas: Variable Frecuencia
Columna 1: El nombre de
la variable que se está
analizando.
Columna 2: Las veces que
se repiten los datos con las
mismas características de
la variable y se le llama
frecuencia.
2-2008 15
16. DISTRIBUCIÓN DE
FRECUENCIAS
Cuando la variable es
numérica, se trata de valores Intervalos Frecuencia
y si éstos son más de 10
datos diferentes, es
conveniente hacer grupos
para administrarlos con
eficiencia. A cada grupo de
datos se le llama Intervalo o
clase.
2-2008 16
17. DISTRIBUCIÓN DE
FRECUENCIAS
Intervalos Frecuencia
Un intervalo es como un
rango, tiene un dato mayor y
un dato menor y el estilo de
representación puede ser de
varias maneras; la más
generalizada es:
DatoMenor pero menos que DatoMayor o
2-2008 17
18. DISTRIBUCIÓN DE
FRECUENCIAS
La información en cada intervalo Intervalos Frecuencia
debe ser única.
Para determinar el número de
intervalos para una distribución,
se calcula con la información del
valor del Rango.
2-2008 18
19. DISTRIBUCIÓN DE FRECUENCIAS
Se sugiere que una distribución de Frecuen
frecuencias no debe tener menos de Intervalos cia
5 intervalos, ni más de 15.
Intervalo 1 Frec. 1
Si no se sigue esta convención, la
interpretación de los datos puede Intervalo 2 Frec. 2
ser demasiado condensada o muy
Intervalo 3 Frec. 3
dispersa y en ambos casos los
resultados aunque están bien, no Intervalo 4 Frec. 4
son objetivos. Y puede afectar la
toma de decisiones. Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
2-2008 19
20. DISTRIBUCIÓN DE
FRECUENCIAS
Los datos por ser numéricos, Intervalos Frecuencia
pueden ir de 100 a 1000, o se
pueden extender a 10,000, etc. Intervalo 1 Frec. 1
Un intervalo es similar al rango, el Intervalo 2 Frec. 2
cual tiene un dato mayor y un
dato menor, solo que la distancia Intervalo 3 Frec. 3
entre ellos recibe el nombre de Intervalo 4 Frec. 4
Amplitud
Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
2-2008 20
21. DISTRIBUCIÓN DE
FRECUENCIAS
Intervalos Frecuencia
Determinar el número de
intervalos que sirva a una Intervalo 1 Frec. 1
muestra se basa en la
Intervalo 2 Frec. 2
experiencia o sentido común de
la persona que va a generar la Intervalo 3 Frec. 3
distribución de frecuencias.
Intervalo 4 Frec. 4
Intervalo 5 Frec. 5
Intervalo 6 Frec. 6
2-2008 21
22. Procedimiento para generar una
distribución de frecuencias
Calcular el rango.
Elegir el número de intervalos
Calcular la anchura de cada intervalo
Generar los intervalos de clases (no
deben menos de 5 ni más de 15)
Determinar la frecuencia para cada
intervalo.
2-2008 22
25. En este caso, se iniciará el primer intervalo con
el dato menor de la muestra = 14
A 14 se le suma la amplitud que es 7 y es = 21
El primer intervalo será el siguiente:
14 pero menos de 21
2-2008 25
26. Para calcular el segundo intervalo, se toma como
dato menor el 21 y se le suma la amplitud que es 7
= 28.
El segundo intervalo resulta ser:
De 21 a menos de 28
Para el tercer intervalo, se toma como dato menor
el 28 y se le suma 7 = 35
El tercer intervalo será:
De 28 a menos de 35
2-2008 26
27. En el cuarto intervalo, el dato menor es 35, se
suma la amplitud 7 = 42.
El cuarto intervalo resulta ser:
De 35 a menos de 42
En el quinto intervalo, al dato menor 42 se le suma
7 = 49
El quinto intervalo es:
De 42 a menos de 49
2-2008 27
28. Intervalos o clases
PRECIO DE PLATO Frecuencia
14 pero menos de 21
21 pero menos de 28
28 pero menos de 35
35 pero menos de 42
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
2-2008 28
29. Calcular la frecuencia de cada intervalo.
El primer intervalo de “14 pero menos de 21”, se
cuenta el número de datos que tienen esa
característica y solo es 14. Al contar los números
resulta que es 1 dato
El segundo intervalo de de “21 pero menos de 28” se
cuenta 22, 23, 25, 26 y 27 que son 5
2-2008 29
30. PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35
35 pero menos de 42
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
2-2008 30
31. El tercer intervalo de “28 pero menos de 35”,
se cuenta 30, 31, 31, 32, 33, 34, 34 (35 no);
la frecuencia es 7.
El cuarto intervalo de “35 pero menos de 42”
se cuentan 35, 35, 35, 36, 36, 37, 37, 38, 38,
38, 39, 39, 39, 39, 40, 41 y resultan 16
2-2008 31
32. PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35 7
35 pero menos de 42 16
42 pero menos de 49
49 pero menos de 56
56 pero menos de 63
63 pero menos de 70
2-2008 32
33. El quinto intervalo de “42 pero menos de 49”,
está formado por se cuenta con 42, 43, 44, 44,
44, 44, 45, 45, 48, 48 ; la frecuencia es 10.
El sexto intervalo de “49 pero menos de 56” se
cuentan 49, 50, 50, 50, 50, 51, 51, 53, 53 y
resultan 9
2-2008 33
34. PRECIO POR PLATO Frecuencia
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35 7
35 pero menos de 42 16
42 pero menos de 49 10
49 pero menos de 56 9
56 pero menos de 63
63 pero menos de 70
2-2008 34
35. El séptimo intervalo de “56 pero menos de 63”,
está formado por se cuenta con 56 y la
frecuencia es 1.
El sexto intervalo de “63 pero menos de 70” se
cuentan 63 y resulta 1.
2-2008 35
36. PRECIO POR PLATO Frecuencia
Los intervalos quedan de la siguiente manera:
14 pero menos de 21 1
21 pero menos de 28 5
28 pero menos de 35 7
35 pero menos de 42 16
42 pero menos de 49 10
49 pero menos de 56 9
56 pero menos de 63 1
63 pero menos de 70 1
2-2008 36
37. Fronteras de clase
Las fronteras de clase o límites de
clase, son los extremos numéricos de
una clase.
Un intervalo tiene la forma “a – b”,
contiene los números que empiezan en
“a” y que casi terminan de “b”
2-2008 37
38. Intervalo 14 pero menos de 21
• La frontera inferior es 14
• La frontera superior se acerca a 21
Intervalo 21 pero menos de 28
• La frontera inferior es 21
• La frontera superior se acerca a 28
2-2008 38
39. Frontera real de clase
Numéricamente, “antes de A” no es un
número.
Se establece un límite de acuerdo a la
formulación de los datos.
Si los datos se ministran con dos decimales,
se busca el número que está exactamente
antes de la frontera superior.
Intervalo normal Fronteras reales
21 pero menos de 28 21 y 27.9
21 pero menos de 28 21 y 27.99
2-2008 39
40. Calcular las fronteras reales de la siguiente
distribución:
Frontera Frontera
Intervalo o clase inferior Superior
14 pero menos de 21 14 21
21 pero menos de 28 21 28
28 pero menos de 35 28 35
35 pero menos de 42 35 42
42 pero menos de 49 42 49
49 pero menos de 56 49 56
2-2008 40
41. Marca de Clase
Es el punto medio de un intervalo
de clase, se calcula sumando sus
fronteras y dividiendo el resultado
entre dos. El intervalo es dividido
a la mitad
2-2008 41
42. Calcular las marcas de clase de la siguiente distribución:
Intervalo o clase Marca de clase
14 pero menos de 21 (14+21)/2 = 17.5
21 pero menos de 28 (21+28)/2 = 24.5
28 pero menos de 35 (28+35)/2 = 31.5
35 pero menos de 42 (35+42)/2 =38.5
42 pero menos de 49 (42+49)/2 = 45.5
49 pero menos de 56 (49+56)/2 = 52.5
2-2008 42
43. Frecuencia Relativa
La frecuencia relativa es la
proporción de frecuencia que
corresponde un intervalo con
relación al tamaño de la
muestra.
2-2008 43
44. Cálculo de la frecuencia relativa
Se suman todas las frecuencias
Se divide la frecuencia de cada
intervalo entre el total de frecuencias.
Todas las frecuencias son valores
entre 0.0 y 1.0
La suma de todas las frecuencias
relativas debe ser igual a uno (1)
2-2008 44
45. Frecuencia Relativa
Frecuencia
PRECIO POR PLATO Frecuencia Relativa
14 pero menos de 21 1 1/50 = 0.02
21 pero menos de 28 5 5/50 = 0.10
28 pero menos de 35 7 7/50 = 0.14
35 pero menos de 42 16 16/50 = 0.32
42 pero menos de 49 10 10/50 = 0.20
49 pero menos de 56 9 9/50 = 0.18
56 pero menos de 63 1 1/50 = 0.02
63 pero menos de 70 1 1/50 = 0.02
2-2008 45
46. Frecuencia Acumulada
La frecuencia acumulada es la
suma parcial para cada
intervalo, permite hacer
observaciones sobre los
intervalos que están por debajo
de él.
2-2008 46
47. Cálculo de la frecuencia
acumulada
Se suman todas las frecuencias
Se suma la frecuencia del intervalo con
todas las frecuencias anteriores.
La frecuencia acumulada de cada
intervalo nunca es menor que el valor
del intervalo anterior.
El último intervalo debe tener como
resultado la suma de todas las
frecuencias (tamaño de la muestra)
2-2008 47
48. Frecuencia Acumulada
Frecuencia
PRECIO POR PLATO Frecuencia Acumulada
14 pero menos de 21 1 1
21 pero menos de 28 5 6
28 pero menos de 35 7 13
35 pero menos de 42 16 29
42 pero menos de 49 10 39
49 pero menos de 56 9 48
56 pero menos de 63 1 49
63 pero menos de 70 1 50
2-2008 48
49. Frecuencia Porcentual
La frecuencia porcentual es la
misma frecuencia relativa pero
en formato de % (porcentaje).
El total de la muestra siempre
resulta ser 100%
2-2008 49
50. Frecuencia Porcentual
La frecuencia porcentual se
puede calcular para las
frecuencias absolutas o las
acumuladas
2-2008 50
51. Frecuencia
PRECIO POR PLATO Frecuencia Porcentual
14 pero menos de 21 1 0.02*100 = 2
21 pero menos de 28 5 0.10 *100 = 10
28 pero menos de 35 7 0.14*100 = 14
35 pero menos de 42 16 0.32*100 = 32
42 pero menos de 49 10 0.20*100 = 20
49 pero menos de 56 9 0.18*100 = 18
56 pero menos de 63 1 0.02*100 = 2
63 pero menos de 70 1 0.02*100 = 2
2-2008 51