1. 1
Estadística
UNICLA Plantel Zitácuaro
SECRETARÍA DE EDUCACIÓN PÚBLICA
SECRETARÍA DE EDUCACIÓN MEDIA SUPERIOR Y SUPERIOR
UNIVERSIDAD CONTEMPORÁNEA DE LAS AMÉRICAS
“PAZ, RAZÓN, CULTURA Y VERDAD”
PLANTEL ZITÁCUARO
Maestría en administración aplicada a la educación
Segundo cuatrimestre
Asignatura:
Estadística
Tema de investigación:
Datos cuantitativos
Maestra en formación:
Soto Esquivel Yasmin
Asesor:
Dr. Marco Antonio Alanís Martínez
Zitácuaro, Michoacán, marzo 2021.
2. 2
Estadística
UNICLA Plantel Zitácuaro
Índice
Introducción
Objetivo
1. Importancia de la Estadística Descriptiva en la investigación…………………. 5
2. Datos cuantitativos …………………………………………………………… 5
2.1 Definición ……………………………………………………………... 5
2.2 Clasificación …………………………………………………………... 6
2.2.1 No agrupados …………………………………………….. 6
2.2.2 Agrupados ………………………………………………... 11
2.3 Análisis de datos cuantitativos no agrupados …………………………... 17
2.3.1 Orden de rango …………………………………………… 18
2.3.2 Tablas de frecuencia ……………………………………… 18
2.3.3Representación gráfica ……………………………………. 19
2.3.3.1 Gráfica de frecuencias ……………………………... 20
2.3.3.2 Gráfica de frecuencias acumuladas ………………… 21
2.3.3.3 Gráfica de porcentajes ……………………………... 21
Fuentes de consulta
II
3. 3
Estadística
UNICLA Plantel Zitácuaro
Introducción
La estadística es de gran importancia en varios campos del saber, su extensa aplicación se
debe a que se encarga de estudiar métodos que permiten coleccionar datos estadísticos,
analizarlos y hacer deducciones a partir de ellos y presentarlos en forma tabular o gráfica.
Su propio nombre lo indica, trata de describir algo. Pero no describirlo de cualquiera
forma, sino de manera cuantitativa. Pensemos en el peso de una caja de verduras, en la
altura de una persona o en la cantidad de dinero que gana una empresa. De estas variables
podríamos decir muchas cosas. Por ejemplo, podríamos indicar que esta o aquella caja de
tomates pesa mucho o pesan menos que otras.
El análisis de datos es fundamental en la toma de decisiones basadas en la investigación,
para ello se recurre a un análisis de comparaciones numéricas y estadísticas. Un análisis
de datos cuantitativos eficaz nos mantendrá en el camino correcto para comprobar nuestra
teoría y tomar las mejores decisiones.
Para el análisis de los datos cuantitativos cuando son numerosos, se clasifican en
agrupados y no agrupados para poder realizar el análisis de estos. Esto facilita el análisis
de los datos y permite identificar el status de los mismos por rango, dándonos la pauta
para darle certeza a una investigación, saber cómo se va a dirigir y se haga un análisis
correcto de la investigación.
Los datos cuantitativos son la base del análisis estadístico, son datos que se pueden medir
y verificar, que nos brindan información, la cual se analiza y de acuerdo a los resultados
se pueden tomar decisiones. Las características de los datos cuantitativos es la
representación numérica, debido a que se toma valores numéricos con propiedades
estadísticas, y se le da un orden a estos mismos, por lo tanto, se pueden realizar
operaciones aritméticas con ellos. Es decir dan el soporte y sobre todo la confiabilidad a
nuestra investigación. Los podemos ubicar por categorías, darle un orden de acuerdo a su
importancia o unidad de medida. Se puede realizar gráficas o tablas para representarlos.
III
4. 4
Estadística
UNICLA Plantel Zitácuaro
Objetivo
Comprender la importancia que la estadística descriptiva tiene en la investigación, así
como conocer la clasificación de los datos cuantitativos e identificar el proceso de
elaboración de los datos cuantitativos no agrupados, por medio del análisis de la
información que sugiere la antología y fuentes de consulta externas.
IV
5. 5
Estadística
UNICLA Plantel Zitácuaro
1. Importancia de la estadística descriptiva en la investigación
La estadística descriptiva es la rama de la estadística que recolecta, analiza y caracteriza
un conjunto de datos, con el objetivo de describir las características y comportamientos
de este conjunto mediante medidas de resumen, tablas o gráficos.
Estos datos surgen de problemas cotidianos, experimentos, investigaciones y de un
sinnúmero de situaciones establecidas, de tal manera que se pueden seleccionar datos
estadísticos de diferentes campos.
Los cuales se pueden describir en tres maneras:
1) Tabular: Mediante la construcción de tablas representativas de la población.
2) Gráfica: Con la elaboración de esquemas o gráficos que describen de manera objetiva
la naturaleza de los datos. Por ejemplo: grafica de barras, diagramas de pastel,
pictogramas, ojivas, etc.
3) Aritmética: Calculando determinados valores cuya interpretación proporciona
aspectos relevantes de la población con el objeto de comparar dos o más parámetros
a fin de tomar una decisión adecuada.
La estadística descriptiva dentro de la investigación tiene un papel de suma importancia,
ya que permite la representación gráfica de los datos recabados, tales como los rangos de
edades en la población, el estatus de los alumnos respecto a su aprobación, así como las
expectativas de vida de las personas.
2. Datos cuantitativos
Todo lo que se puede medir y contar, decimos que se puede cuantificar. En cuanto a los
“datos cuantitativos” hace referencia precisamente a eso, a la información tangible, la que
es obtenida mediante algún método de investigación.
La parte más importante de la estadística son los datos, los cuales representan una gran
variedad de fenómenos y son el elemento básico para trabajar en la estadística.
2.1 Definición
Los datos cuantitativos son aquellos que nos proporcionan respuestas numéricas y pueden
ser de dos clases.
1) Discretos: Son datos numéricos que surgen de un proceso de conteo. Prácticamente
hablamos de números enteros, que se cuentan, no se miden.
6. 6
Estadística
UNICLA Plantel Zitácuaro
2) Continuos: Son datos numéricos que se obtienen de un proceso de medición. estos
datos no se restringen a valores enteros, se miden en lugar de contarse. Además, tienen
entre sus características que pueden dividirse.
2.2 Clasificación
Para poder trabajar con una gran cantidad de datos es conveniente agruparlos en
intervalos, para facilitar su análisis, mediante las medidas de dispersión. En este sentido
se reconocen como datos agrupados y no agrupados.
2.2.1 No agrupados
Son aquellos datos que no son muy grandes en cantidad y que se obtienen de la medición
y el conteo de los parámetros de una población. Para analizarlos primeramente se
organizan en forma adecuada del menor al mayor, luego se realiza una tabla de frecuencias
para determinar algunas características de los datos y finalmente se construyen las gráficas
correspondientes. Para llevar a cabo el análisis, consideraremos el siguiente ejemplo.
1) Medidas de dispersión: Miden la variabilidad de un conjunto de datos. Las medidas
más utilizadas son:Rango, Varianza, Desviación estándar, Coeficiente de variación,
Intervalo cuartilar.
2) Rango: Es la diferencia entre el valor más grande y el más pequeño del conjunto de
datos.
Rango para datos no agrupados.
Rango = Valor máximo - Valor
mínimoR = 64 – 12 = 52
Rango para datos agrupados:
R = límite superior de la última clase - límite inferior de la primera
claseR = 10.5 – 5.2 = 5.3
3) Varianza: Es la medida que cuantifica la variabilidad de los datos respecto al valor
de lamedia.
La varianza para la muestra se representa mediante una S al cuadrado:
7. 7
Estadística
UNICLA Plantel Zitácuaro
Usos de la Varianza:
En inferencia estadística.
Para calcular la desviación estándar.
Para calcular el tamaño de muestra.
Ejemplo: Para los datos siguientes calcular la varianza.
22 3
8
3
5
56 4
5
3
3
2
8
3
6
4
5
5
5
2
0
38
46 2
7
4
5
23 6
4
2
1
3
4
2
2
2
9
3
6
1
2
54
45 3
7
5
3
26 3
5
3
2
2
1
4
3
3
9
2
8
2
8
Se debe calcular primero la media.
X = (22 + 38 + 35 + 56 + 45 + 33 + 28 + 36 + 45 + 55 + 20 + 38 + 46 + 27 + 45 + 23
+ 64 + 21 + 34 + 22 + 29 + 36 + 12 + 54 + 45 + 37 + 53 + 26 + 35 + 32 + 21 + 43 +
39 + 28 + 28) / 35
X = 1250.99 / 35
X = 35.74
S2
= ((22 – 35.74)2
+ (38 – 35.74)2
+ (35 – 35.74)2
+ (56 – 35.74)2
+ (45 – 35.74)2
+ (33
– 35.74)2
+ (28 – 35.74)2
+ (36 – 35.74)2
+ (45 – 35.74)2
+ (55 – 35.74)2
+ (20 – 35.74)2
+ (38 – 35.74)2
+ (46 – 35.74)2
+ (27 – 35.74)2
+ (45 – 35.74)2
+ (23 – 35.74)2
+ (64 –
35.74)2
+ (21 – 35.74)2
+ (34 – 35.74)2
+ (22 – 35.74)2
+ (29 – 35.74)2
+ (36 –35.74)2
+ (12 – 35.74)2
+ (54 – 35.74)2
+ (45 – 35.74)2
+ (37 – 35.74)2
+ (53 – 35.74)2
+ (26 –
35.74)2
+ (35 – 35.74)2
+ (32 – 35.74)2
+ (21 – 35.74)2
+ (43 – 35.74)2
+ (39 –35.74)2
+ (28 – 35.74)2
+ (28 – 35.74)2
) / (35 – 1)
S2 = 145
4) Desviación Estándar: Es la raíz cuadrada positiva de la varianza. Mide la variabilidad
de los datos en las unidades en que se midieron originalmente. Los símbolos son: s, si es
una muestra y ; σ si es una población.
s = √ s2
s = √
145s = 12.04
8. 8
Estadística
UNICLA Plantel Zitácuaro
Características de la desviación estándar:
1. Siempre es un valor positivo.
2. Está influenciada por todos los valores de la muestra o población.
3. Mayor influencia ejercen los valores extremos debido a que son elevados
alcuadrado en el cálculo.
4. Sirve para definir la dispersión de los datos alrededor de la media.
La desviación estándar para datos agrupados.
s = √(∑(fi * Xc2
) – (∑(fiXc)2
) / n) / n – 1
Proceso:
1. Primero se eleva el punto medio al cuadrado y luego se multiplica por la
frecuencia absoluta de clase.
2. Se obtiene el total de la frecuencia absoluta por la marca de clase y se eleva
al cuadrado, este resultado se divide entre el tamaño de la muestran.
3. Se resta el primer resultado del segundo y se divide ente n – 1.
Para obtener la varianza se eleva la desviación estándar al cuadrado.
Ej.
Intervalo de clase F
i
Xc F
i
* Xc X
c
2
F
i
*
Xc
2
5
.
2
- 6.0 3 5.6 16.
8
31.36 94
.0
8
6.1 – 6.9 5 6.5 32.
5
42.25 211
.25
7.0 – 7.8 9 7.4 66.
6
54.76 492
.84
7.9 – 8.7 7 8.3 58.
1
68.89 482
.23
8.8 – 9.6 5 9.2 46.
0
84.64 423
.20
9.7 – 10.5 3 10.1 30.
3
102.01 306
.30
Total 32 250.
4
2009
.63
9. 9
Estadística
UNICLA Plantel Zitácuaro
s = √2009.63 – 250.4 2
/ 32) / 32
– 1s = √2009.63 –62700.16/ 32) /
31
s = √2009.63 – 1959.38) /
31s = √50.25 / 31
s = √ 1.62
s = 1.27
Varianza es: s2 = 1.62
5) Coeficiente De Variabilidad: Medida de variabilidad relativa: Se usa para comparar la
variabilidad entre dos o más muestras medidas en las mismas unidades o no. Los datos
que se expresan en porcentaje en la cual se compara la desviación estándar con el
respectivo valor del promedio de los datos:
6) Medida De Forma: Asimetría O Sesgo: Evalúa el grado de distorsión o inclinación que
adopta la distribución de los datos respecto a su valor promedio tomado como centro de
gravedad. El coeficiente de asimetría de Pearson es:
10. 10
Estadística
UNICLA Plantel Zitácuaro
7) Medida De Forma: Curtosis
8) Amplitud cuartílica.
AC = tercer cuartil – primer cuartil
Desviación cuartílica.
DC (tercer cuartil - primer cuartil) / 2
9) La Grafica de caja y brazo y el Resumen de 5 números.
Una buena descripción de un conjunto de datos incluye una medida de la tendencia
central, junto con información sobre la forma y la dispersión de los datos. Una
gráfica de caja es una herramienta útil para mostrar la forma y la dispersión de los
datos.
11. 11
Estadística
UNICLA Plantel Zitácuaro
Los segmentos que se salen de la “caja” se llaman “bigotes” (“whiskers”). Una
gráfica de caja divide los datos en cuatro partes iguales. El bigote izquierdo, la parte
izquierda de la caja, la parte derecha de la caja, y el bigote derecho representan cada
uno un cuarto de los datos y la mediana se coloca en el centro de la caja.
El resumen de cinco números da los valores de los puntos claves de una gráfica de
caja. Los cinco números son el valor mínimo, el primer cuartil, la mediana, el tercer
cuartil, y el valor máximo, respectivamente. Los datos superiores al valor máximo y
los inferiores al valor mínimo se denominan Datos Atípicos.
10) Regla Empírica
Cuando la distribución de frecuencia es simétrica:
Por ejemplo: Si el Promedio es 7.87 y Desviación estándar 1.293 podremos afirmar
que:
El 68% se encuentran (+- 1s) más menos una desviación estándar.
El 95% se encuentran (+- 2s) más menos dos desviación estándar.
El 99.7% se encuentran (+- 3s) más menos tres desviación estándar.
2.2.2 Agrupados
Es aquella distribución en la que la disposición tabular de los datos estadísticos se
encuentra ordenados en clases y con la frecuencia de cada clase; es decir, los datos
originales de varios valores a hechas entes del conjunto se combinan para formar un
intervalo de clase.
12. 12
Estadística
UNICLA Plantel Zitácuaro
1. Medidas de tendencia central: Son medidas estadísticas que se usan para describir cómo
se puede resumir la localización de los datos. Ubican e identifican el punto alrededor del
cual se centran los datos. Las medidas de tendencia central nos indican hacia donde se
inclinan o se agrupan más los datos. Las más utilizadas son: la media, la mediana y la
moda.
Los propósitos de las medidas de tendencia central son:
1. Mostrar en qué lugar se ubica el elemento promedio o típica del grupo.
2. Sirve como un método para comparar o interpretar cualquier valor en relación
con el puntaje central o típico.
3. Sirve como un método para comparar el valor adquirido por una misma
variable en dos diferentes ocasiones.
4. Sirve como un método para comparar los resultados medios obtenidos por
dos o más grupos.
La media o media aritmética, usualmente llamada promedio, se obtiene sumando
todos los valores de los datos y divide el resultado entre la cantidad de datos. Si los
datos proceden de una muestra la media se representa con una x testada (x) y si
provienen de la población se representan con la letra griega miu (µ).
Media aritmética para datos no agrupados muéstrales
Media aritmética para datos no agrupados poblacionales
Media aritmética para datos agrupados
13. 13
Estadística
UNICLA Plantel Zitácuaro
Donde
X: promedio muestral
(estadístico). µ: promedio
poblacional (parámetro).
∑: signo de sumatoria.
N = número de datos de la población.n: número de datos de la muestra.
fi: frecuencia absoluta.
Xc: Marca de clase o punto medio. Ejemplo de cómo se emplea la media o promedio con
el siguiente ejemplo paradatos no agrupados:
A continuación se presenta una muestra de las puntuaciones en un examen deun
curso de estadística:
70 9
0
9
5
7
4
5
8
7
0
9
8
7
2
7
5
85
95 7
4
8
0
8
5
9
0
6
5
9
0
7
5
9
0
69
Podemos calcular el promedio de las puntuaciones para conocer cuántosestudiantes
obtuvieron puntuaciones por encima y por debajo del promedio.
Primero, sumamos todos los valores de los datos y el resultado lo divide entre el
total de datos o tamaño de la muestra. Al sumar todas las puntuaciones en el ejemplo
anterior obtendrás un total de 1600, que dividido por 20(total de datos), es igual a 80.
Si empleamos la fórmula obtenemos:
La media para datos agrupados,
Ejemplo: Para los gastos diarios en periódicos del hotel agrupados en una tabla de
frecuencia:
Intervalo de clase Fi Xc Fi * Xc
5.2 - 6.0 3 5.6 16.8
6.1 – 6.9 5 6.5 32.5
7.0 – 7.8 9 7.4 66.6
7.9 – 8.7 7 8.3 58.1
8.8 – 9.6 5 9.2 46.0
9.7 – 10.5 3 10.1 30.3
Total 32 250.4
14. 14
Estadística
UNICLA Plantel Zitácuaro
El promedio aritmético es:
1ro
) Se construye la tabla de distribución de frecuencias.
2do
) se obtiene el total de la frecuencia absoluta de clase por el punto medio.
3ro
) El resultado obtenido se divide entre el tamaño de la muestra.
Propiedades de la Media:
1ª) La suma de las desviaciones de los valores o datos de una variable X, respecto
a su media aritmética es cero.
Ventajas e inconvenientes:
1. La media aritmética viene expresada en las mismas unidades que la variable.
2. En su cálculo intervienen todos los valores de la distribución.
3. Es el centro de gravedad de toda la distribución, representando a todos los
valores observados.
4. Su principal inconveniente es que se ve afectada por los valoresextremadamente
grandes o pequeños de la distribución.
La Mediana: La segunda medida de tendencia central que analizaremos es la mediana, en
ocasiones se le llama media posicional, porque queda exactamente en la mitad de un
grupo de datos, luego de que los datos se han colocado de forma ordenada. En este caso
la mitad (50%) de los datos estará por encima de la mediana y la otra mitad (50%) estará
por debajo de ella. La mediana es el valor intermedio cuando los valores de los datos se
han ordenado.
La Mediana (Me) para datos no agrupados:
1. Primero se ordenan los datos.
2. Luego se calcula la posición de la mediana con la siguiente formula: (n+1)÷2
donde, n es el número de datos.
Por ejemplo, se tiene una muestra de tamaño 5 con los siguientesvalores: 46,
54, 42, 48 y 32.
Primer paso, ordenar los datos: 32 42 46 48 54
Como la cantidad de datos es impar (5 datos), la mediana es el valor del dato que
se encuentra ubicado en la posición (5+1) ÷2=3, la mediana es: Me = 46.
Se ha obtenido una muestra con los valores de datos: 27, 25, 27, 30, 20 y 26.
15. 15
Estadística
UNICLA Plantel Zitácuaro
¿Cómo se determina la mediana en este caso?
Primer paso, ordenar los datos de forma ascendente: 20 25 26 27 27 30
Como el número de datos es par (6), la mediana es el promedio de los datos que se
encuentran en las posiciones (6+1) ÷1 = 3.5. Por lo tanto la mediana es:
Donde:
Li: Límite inferior real de la clase que contiene la
mediana.n: tamaño de la muestra.
Fi-1 = AFA: Frecuencia acumulada anterior a la clase que contiene la mediana.
Fi: frecuencia de clase absoluta de la clase mediana.
Para identificar la clase mediana se divide n/2 y la primera clase que contenga una
frecuencia acumulada mayor que n/2.
n = 32, entonces n/2 = 32/2 = 16. Buscar la primera frecuencia acumulada mayor
que 16, esa será la clase mediana.
Intervalo de clase f
i
Xc fi * Xc fa Limites reales
5.2 - 6.0 3 5.6 16.8 3 5.15 – 6.05
6.1 – 6.9 5 6.5 32.5 8 6.05 – 6.95
7.0 – 7.8 9 7.4 66.6 17 6.95 – 7.85
7.9 – 8.7 7 8.3 58.1 24 7.85 – 8.75
8.8 – 9.6 5 9.2 46.0 29 8.75 – 9.65
9.7 – 10.5 3 10.1 30.3 32 9.65 – 10.55
Total 32 250.4
Ahora se aplica la fórmula:
Me = (6.95 + (((32/2 – 8)/9)*(0.9)) = 6.95 + (16 – 8) /
9)*(0.9)Me = (6.95 +(8/9)*(0.9)) = 6.95 +(0.88*0.9)
Me = 6.95 + 0.79
Me = 7.75 ≈ 7.8
Ventajas e inconvenientes:
1. Es la medida más representativa en el caso de variables que solo admitan laescala
ordinal.
2. Es fácil de calcular.
16. 16
Estadística
UNICLA Plantel Zitácuaro
3. En la mediana solo influyen los valores centrales y es insensible a los valores
extremos u “outliers ”.
4. En su determinación no intervienen todos los valores de la variable.
La moda: Es el dato que más se repite o el dato que ocurre con mayor frecuencia.Un
grupo de datos puede no tener moda, tener una moda (unimodal), dos modas (bimodal) o
más de dos modas (multimodal).
Veamos los siguientes ejemplos:
Se tiene una muestra con valores 20, 23, 24, 25, 25, 26 y 30. Mo = 25 es unimodal
Se tiene una muestra con valores 20, 20, 23, 24, 25, 25, 26 y 30.Mo= 20 y 25, se dice
que es bimodal.
Se tiene una muestra con valores 20, 23, 24, 25, 25, 26, 30 y 30.Mo= 20, 25 y 30, se dice
que es multimodal.
En los datos agrupados la Mo es la marca de clase de la clase que contenga la mayor
frecuencia absoluta.
Intervalo de clase fi Xc fi * Xc fa Limites
reales
5.2 - 6.0 3 5.6 16.8 3 5.15 – 6.05
6.1 – 6.9 5 6.5 32.5 8 6.05 – 6.95
7.0 – 7.8 9 7.4 66.6 17 6.95 – 7.85
7.9 – 8.7 7 8.3 58.1 24 7.85 – 8.75
8.8 – 9.6 5 9.2 46.0 29 8.75 – 9.65
9.7 – 10.5 3 10.1 30.3 32 9.65 – 10.55
Total 32 250.4
Mo = 7.4
También se puede calcular a través de la fórmula:
Donde:
Lir: límite inferior verdadero de la clase modal.
y
fi es la frecuencia absoluta de la clase modal.
fi-1 es la frecuencia de clase absoluta anterior a la clase modal
fi+1 es la frecuencia de clase absoluta posterior a la de la clase modal.
i es el intervalo de clase.
17. 17
Estadística
UNICLA Plantel Zitácuaro
La clase modal es aquella que contiene la mayor frecuencia absoluta.
Intervalo de clase fi Xc fi * Xc fa Limites reales
5.2 - 6.0 3 5.6 16.8 3 5.15 – 6.05
6.1 – 6.9 5 6.5 32.5 8 6.05 – 6.95
7.0 – 7.8 9 7.4 66.6 17 6.95 – 7.85
7.9 – 8.7 7 8.3 58.1 24 7.85 – 8.75
8.8 – 9.6 5 9.2 46.0 29 8.75 – 9.65
9.7 – 10.5 3 10.1 30.3 32 9.65 – 10.55
Total 32 250.4
d1 = 9 – 4 = 4
d2 = 9 – 7 = 2
Mo = 6.95 + ( 4 / 4 + 2) * 0.9 = 6.95 + ( 4 / 6) * 0.9 = 6.95 + 0.66 * 0.9
Mo = 6.95 + 0.59
Mo = 7.55 ≈ 7.6
Es mejor utilizar la fórmula para el cálculo de la moda.
Ventajas e inconvenientes:
1. Su cálculo es sencillo.
2. Es de fácil interpretación.
3. Es la única medida de posición central que puede obtenerse en las variablesde
tipo cualitativo.
4. En su determinación no intervienen todos los valores de la distribución.
2.3 Análisis de datos cuantitativos no agrupados
Los datos no agrupados son el conjunto de datos que no se ha clasificado y es presentada
en su forma de aparición en una tabla de datos donde cada valor se representa de forma
individual y el tamaño de muestra es menor a 30 datos.
Lo primero que podemos hacer es ordenarlos, en forma ascendente, una vez ordenados los
datos de las muestras se organizan en una tabla de frecuencias.
Por ejemplo; Las temperaturas máximas registradas en grados centígrados, en el mes de
febrero de 2021 en el municipio de Zitácuaro, Michoacán, son los siguientes:
17 18 15 16 19 20 16 18 17 18
19 17 15 16 19 16 20 18 17 18
20 15 18 20 18 16 17 15
18. 18
Estadística
UNICLA Plantel Zitácuaro
Datos ordenados
15 16 17 18 18 20
15 16 17 18 19 20
15 16 17 18 19 20
15 16 17 18 19
16 17 18 18 20
2.3.1 Orden y rango
El rango es el valor numérico que indica la diferencia entre el valor máximo y el valor
mínimo de una población o muestra estadística.
El rango es utilizado para obtener la dispersión total de la población o muestra.
Formula del rango:
𝑅 = 𝑀á𝑥 − 𝑀í𝑛
Donde:
R= Es el rango.
Máx= Es el valor máximo de la muestra o población.
Mín= Es el valor mínimo de la muestra o población.
Continuando con el ejemplo anterior:
𝑅 = 20 − 15 = 5
2.3.2Tablas de frecuencia
La frecuencia es la cantidad de veces que se repite una observación durante la realización
de un muestreo, una tabla de frecuencias, también llamada de Distribución de Frecuencias,
está formada por las categorías o valores de la variable y sus correspondientes frecuencias,
a continuación se explica de forma breve la manera en la que está integrada cada columna.
1) Datos por rango: en este apartado se ordenan los datos de forma ascendente obtenidos
con anterioridad.
2) Frecuencia Absoluta: Es el número de veces que se repite una variable, y es
representada con f¡ón¡
3) Frecuencia acumulada: Es la suma de las frecuencias consecutivamente hasta llegar al
total de la muestra y se representa N¡.
4) Frecuencia Relativa: Es la cantidad de veces que se repite una observación, expresada
como proporción de la muestra. Es representada f= n/N. Su valor se expresa como
porcentaje.
19. 19
Estadística
UNICLA Plantel Zitácuaro
n= el número de veces que se repite la variable.
N= el tamaño de la muestra.
5) Frecuencia Relativa Acumulada: Es la sumatoria de todas las frecuencias relativas
inferiores o iguales al valor en cuestión. Se representa con F¡ ó H¡.
6) Porcentaje: Representa la parte proporcional de cada dato y se obtienen multiplicando
por 100 la frecuencia relativa.
7) Porcentaje acumulado: Representa la parte proporcional de los daos, que al sumarse
consecutivamente da como resultado 100.
Continuando con el ejemplo, la tabla de frecuencia quedaría:
Datos Frecuencias Frecuencia
acumulada
Frecuencia
Relativa
Frecuencia
Relativa
acumulada
Porcentaje Porcentaje
Acumulado
15 4 4 0.14 0.14 14 14
16 5 9 0.18 0.22 18 22
17 5 14 0.18 0.40 18 40
18 7 21 0.25 0.65 25 65
19 3 24 0.11 0.76 11 76
20 4 28 0.14 1 14 100
Tabla de frecuencia de la temperatura en grados centígrados, durante el mes de febrero del 2021, en el
municipio de Zitácuaro, Michoacán.
2.3.3 Representación gráfica
Una vez obtenido el rango y la tabla de frecuencia será necesario realizar la representación
gráfica la cual se entiende como la expresión de la información obtenida de manera clara,
concisa y precisa, determinada por figuras, símbolos o líneas que hace alusión a los datos
recolectados para que el investigador resuma a través de los mismos lo obtenido. Así
mismo esta permite mantener una relación estrecha de la información para su análisis de
forma sencilla pero entendible. En palabras de Pérez (2012):
Se entiende por representación gráfica de una serie estadística cualquier tipo de dibujo que nos
permita detectar a primera vista alguna de sus características más notables, esto es, que nos
ofrezca una visión general del fenómeno en estudio. La representación gráfica es un instrumento
que ayuda a resumir o desglosar la información que se encuentra contenida en la tabla estadística
y al mismo tiempo puede descubrir una parte de esa información que este oculta en la
representación numérica. (p. 16)
20. 20
Estadística
UNICLA Plantel Zitácuaro
A medida que se recopila la información el investigador puede ir determinando el tipo de
representación gráfica que vaya más acorde a lo que quiere expresar, pues ha sucedido
que cuando los datos son excesivos siempre es útil utilizar un gráfico que permita mostrar
cantidades más grandes para evitar confusión. Existe una infinidad de representaciones
gráficas, pero dentro de la limitante de los trabajos de investigación se sugiere que se
utilicen la gráfica de frecuencias, de frecuencias acumuladas y de porcentajes, para los
datos no agrupados ya que estos representan cantidades no muy grandes.
2.3.3.1 Gráfica de frecuencias: esta permite organizar los datos por la cantidad de veces
que ocurren (frecuencia), es una de las gráficas más sencillas de elaborar pues permite
expresar el número de veces que el mismo dato se repite dentro de la aplicación de un
cuestionario, encuesta, entrevista o cualquier instrumento aplicado a la muestra dentro de
una investigación.
La forma en la que se elabora es representar sobre ejes de coordenadas, en el eje de
abscisas (línea horizontal) se colocan los valores de la muestra, y sobre el eje de ordenadas
(línea vertical) las frecuencias en que se repitió el dato, los puntos así formados con los
datos obtenidos se unen mediante segmentos de recta, por ejemplo la gráfica del ejercicio
quedaría de la siguiente forma:
Gráfica de frecuencia de la temperatura en grados centígrados, durante el mes de febrero del 2021, en el
municipio de Zitácuaro, Michoacán.
4
5 5
7
3
4
0
1
2
3
4
5
6
7
8
15 16 17 18 19 20
Frecuencia
Grados °C
Temperatura de febrero
21. 21
Estadística
UNICLA Plantel Zitácuaro
2.3.3.2 Gráficas de frecuencias acumuladas: En la mayoría de los casos se utiliza para
representar como su nombre lo indica distribuciones de frecuencias acumuladas, lo cual
consiste en representar la gráfica de una función que una por segmentos las alturas
correspondientes a los extremos superiores de cada intervalo, tengan o no todos igual
amplitud, siendo dicha altura igual a la frecuencia acumulada, aparentando la forma de
una escalera.
Se elabora colocando en el eje de las ordenadas (eje vertical) las frecuencias acumuladas
de los datos y en las abscisas (eje horizontal) cada uno de los datos de la muestra, de cierta
forma se hace coincidir ambos datos para que de esta manera se unan los puntos que
forman los peldaños que asimilan lo mencionado con anterioridad, he aquí el ejemplo con
base al ejercicio anterior:
Gráfica de frecuencia acumulada de la temperatura en grados centígrados, durante el mes de febrero del
2021, en el municipio de Zitácuaro, Michoacán.
2.3.3.3 Gráfica de porcentajes: Este tipo de gráficas permiten identificar de forma
sencilla en que porcentaje se encuentra distribuida la información obtenida, las categorías
se presentan de manera individual, repartidas en sectores con valores correspondientes a
los resultados obtenidos. Es una de las gráficas que permite al investigador tener los
resultados de manera rápida y digerible, pues su comprensión no es tan complicada en
términos estadísticos, usualmente la barra representa el porcentaje total al que corresponde
el resultado que se quiere indagar.
0
5
10
15
20
25
30
15 16 17 18 19 20
Frecuencia
acumulada
Grados °C
Temperatura de febrero
22. 22
Estadística
UNICLA Plantel Zitácuaro
Para su elaboración se tiene que repartir los datos en dos ejes, en el horizontal se colocan
los datos de la muestra y en el vertical los porcentajes de cada dato, por ende esto permite
que coincidan datos con porcentajes. Para su explicación y muestra se hará uso de los
datos utilizados con anterioridad en las otras gráficas:
Gráfica de porcentajes de la temperatura en grados centígrados, durante el mes de febrero del 2021, en el
municipio de Zitácuaro, Michoacán.
Teniendo en cuenta lo elaborado y explicado a detalle a manera de síntesis durante el
desarrollo del presente trabajo, se puede determinar la importancia que tiene la estadística
para la representación formal de los datos cuantitativos, sin importar su clasificación, es
decir si son agrupados o no agrupados.
Para ello es necesario identificar las herramientas necesarias, para abordar cada uno de
ellos, como lo son las tablas de frecuencia, el orden de rango y los diferentes tipos de
gráficas, lo que permiten expresar la información obtenida de los instrumentos aplicados
por medio de números, líneas y símbolos.
14
18 18
25
11
14
0
5
10
15
20
25
30
15 16 17 18 19 20
Porcentajes
Grados °C
Temperatura de febrero
23. 23
Estadística
UNICLA Plantel Zitácuaro
Fuentes de consulta
Libros
ALANÍS MARTÍNEZ, M. A. 2014. Probabilidad y estadística. 1ra edición México, FCE,
SEP, DGETI.
PÉREZ, RIGOBERTO. 2012. Introducción a la estadística económica. Argentina.
Creative commons. 171 p.
SHELDON M. ROSS. 2007. Introducción a la estadística. Barcelona. Editorial Reverté,
S.A. 795 p.
Internet
https://www.sectormatematica.cl/psu/Estadistica%20Datos%20Agrupados.pdf fecha de
consulta 5 de marzo 2021.
https://www.emagister.com/uploads_courses/Comunidad_Emagister_66885_66885.pdf
fecha de consulta 5 de marzo.
https://es.slideshare.net/renatabriseno/datos-agrupados-y-no-agrupados-53382948 fecha
de consulta 4 de marzo.
https://enciclopediaeconomica.com/frecuencia-estadistica/ Fecha de consulta 02 de marzo
del 2021.
https://www.cch-sur.unam.mx/guias/matematicas/estadist1_2012.pdf Fecha de consulta
03 de marzo del 2021.
https://books.google.com.mx/books?id=31d5cGxXUnEC&printsec=frontcover&dq=esta
distica+descriptiva&hl=es-419&sa=X&ved=2ahUKEwjp4_- Fecha de consulta 03 de
marzo del 2021.
https://www.portaleducativo.net/quinto-basico/515/Tablas-de-frecuencia-y-graficos
fecha de consulta 02 de marzo del 2021.
https://www.slideshare.net/DaliaReyes1/expo-35067131 fecha de consulta 02 de marzo
del 2021.
Revistas digitales
Rendón-Macías, Mario Enrique, & Villasís-Keeve, Miguel Ángel, & Miranda-Novales,
María Guadalupe (2016). Estadística descriptiva. Revista Alergia México, 63(4),397-407.
[fecha de Consulta 4 de marzo de 2021]. ISSN: 0002-5151. Disponible en:
https://www.redalyc.org/articulo.oa?id=4867/486755026009
24. 24
Estadística
UNICLA Plantel Zitácuaro
Palacios Martínez, Ignacio (dir.), Rosa Alonso Alonso, Mario Cal Varela, Yolanda Calvo
Benzies, Francisco Xabier Fernández Polo, Lidia Gómez García, Paula López Rúa, Yonay
Rodríguez Rodríguez & José Ramón Varela Pérez. 2019. Diccionario electrónico de
enseñanza y aprendizaje de lenguas. [fecha de Consulta 4 de marzo de 2021]. Disponible
en: https://www.dicenlen.eu/es/diccionario/entradas/datos-cuantitativos
QuestionPro (2021). Software para encuestas Questionpro. [fecha de Consulta 4 de marzo
de 2021]. Disponible en: https://www.questionpro.com/es/datos-cuantitativos.html
Liliana Orellana (2001). Estadística descriptiva. Departamento de Matemática Facultad
de Ciencias Exactas y Naturales Universidad de Buenos Aires. [fecha de Consulta 4 de
marzo de 2021]. ISSN: 0002-5151. Disponible en:
https://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo%20descriptiva.pdf