2. Una variable estadística es el conjunto de valores que puede tomar cierta característica de
la población sobre la que se realiza el estudio estadístico. Estas variables pueden ser: la edad,
el peso, las notas de un examen, etc.
Las variables estadísticas se pueden clasificar por diferentes criterios. Según su medición
existen dos tipos de variables:
Cualitativa (o categórica): son las variables que pueden tomar como valores cualidades o
categorías.
Ejemplos:
Sexo (hombre, mujer)
Salud (buena, regular, mala)
Cuantitativas (o numérica): variables que toman valores numéricos.
Ejemplos:
Número de casas (1, 2,…)
Edad (12,5; 24,3; 35;…)
3. VARIABLES CUALITATIVAS
Tipos Definición Ejemplos
Nominal
Variables cualitativa cuyas categorías no siguen ningún
orden.
- Color (blanco, rojo,
azul,…)
- Lateralidad (zurdo,
diestro)
Ordinal Son las variables categóricas con orden
- Nota examen
(suspenso, aprobado,
notable, sobresaliente)
– Nivel económico
(pobre, clase media, rico)
Binaria
Es un caso particular de variable nominal con solo dos
categorías. Si las dos categorías determinan dos estados
cualesquiera (ejemplo: sexo) se denomina binaria
simétrica. Si el 1 determina la presencia de una
característica y el 0 la ausencia (ejemplo: depresión,
enfermedad,…) la variable se dice binaria asimétrica.
- Sexo (mujer, hombre)
- Enfermo (si, no)
Las variables cualitativas se pueden clasificar según sigan un orden determinado o no:
4. VARIABLES CUANTITATIVAS
Tipos Definición Ejemplos
Discreta
La variable solo puede tomar valores en
número determinado de valores. En cada
intervalo de valores la variable solo puede
tomar un valor.
- Canastas en un partido (20; 21;
22; pero no 21,5)
Continua
La variable puede adquirir cualquier valor
dentro de un intervalo de valores
determinado.
- Peso (53,53kg; 89,4kg;…)
Las variables se pueden clasificar también según si son independientes o dependientes:
Variable independiente: Es una variable que su valor no depende de otra variable. La variable
independiente suele representarse en las gráficas en el eje de abscisas (x).
Variable dependiente: Es una variable cuyos valores dependen de los valores que tome otra
variable. Se representa en el eje de ordenadas (y).
Las variables cuantitativas se clasifican según el número de valores que puede tomar la
variable:
5. POBLACIÓN - es el conjunto total de individuos, objetos o medidas que poseen algunas características
comunes observables en un lugar y en un momento determinado. Cuando se vaya a llevar a cabo alguna
investigación debe de tenerse en cuenta algunas características esenciales al seleccionarse la población
bajo estudio.
Entre éstas tenemos:
1.Homogeneidad - que todos los miembros de la población tengan las mismas características según las
variables que se vayan a considerar en el estudio o investigación.
2.Tiempo - se refiere al período de tiempo donde se ubicaría la población de interés. Determinar si el
estudio es del momento presente o si se va a estudiar a una población de cinco años atrás o si se van a
entrevistar personas de diferentes generaciones.
3.Espacio - se refiere al lugar donde se ubica la población de interés. Un estudio no puede ser muy
abarcador y por falta de tiempo y recursos hay que limitarlo a un área o comunidad en específico.
4.Cantidad - se refiere al tamaño de la población. El tamaño de la población es sumamente importante
porque ello determina o afecta al tamaño de la muestra que se vaya a seleccionar, además que la falta de
recursos y tiempo también nos limita la extensión de la población que se vaya a investigar.
6. MUESTRA - la muestra es un subconjunto fielmente representativo de la población.
Hay diferentes tipos de muestreo. El tipo de muestra que se seleccione dependerá de la calidad y cuán
representativo se quiera sea el estudio de la población.
1.ALEATORIA - cuando se selecciona al azar y cada miembro tiene igual oportunidad de ser incluido.
2.ESTRATIFICADA - cuando se subdivide en estratos o subgrupos según las variables o características que
se pretenden investigar. Cada estrato debe corresponder proporcionalmente a la población.
3.SISTEMÁTICA - cuando se establece un patrón o criterio al seleccionar la muestra. Ejemplo: se
entrevistará una familia por cada diez que se detecten.
Las poblaciones suelen ser muy numerosas, por lo que es difícil
estudiar a todos sus miembros; además de que esto no es
posible, no es necesario. Es como si se quisiera estudiar la
composición química del agua de un río y para ello se intentará
analizar todo el agua que corre por su cauce, cuando solamente
se puede tomar unas muestras para realizar ese estudio y llegar a
conclusiones generalizables con respecto a la composición
química del agua a todo el río
7. Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística.
Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.
Tipos de parámetros estadísticos
Hay tres tipos parámetros estadísticos:
De centralización.
De posición
De dispersión.
Medidas de centralización
Nos indican en torno a qué valor (centro) se distribuyen los datos.
La medidas de centralización son:
Media aritmética
La media es el valor promedio de la distribución.
Mediana
La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior, es decir
divide la serie de datos en dos partes iguales.
Moda
La moda es el valor que más se repite en una distribución.
8. Ejemplo de media aritmética:
En matemáticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3…n = 6 (número total de datos)
La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio.
Ejemplo de moda:
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.
5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)
20, 12, 14, 23, 78, 56, 96
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de valores no tiene moda.
Ejemplo de mediana:
- Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.
- El siguiente conjunto de datos está ordenado en forma decreciente, de mayor a menor, y corresponde a un conjunto de valores
pares, por lo tanto, la Med será el promedio de los valores centrales.
21, 19, 18, 15, 13, 11, 10, 9, 5, 3
9. Medidas de posición
Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.
La medidas de posición son:
Cuartiles: los cuartiles dividen la serie de datos en cuatro partes iguales.
Deciles: los deciles dividen la serie de datos en diez partes iguales.
Percentiles: los percentiles dividen la serie de datos en cien partes iguales.
Medidas de dispersión
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribución.
Las medidas de dispersión son:
Rango o recorrido
El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
Desviación media
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a
la media.
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media.
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.
10. Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en observación.
Este proceso utiliza diversas escalas: nominal, ordinal, de intervalo y de razón.
Las variables de las escalas nominal y ordinal se denominan también categóricas, por otra parte las variables
de escala de intervalo o de razón se denominan variables numéricas. Con los valores de las variables
categóricas no tiene sentido o no se puede efectuar operaciones aritméticas. Con las variables numéricas sí.
La escala nominal sólo permite asignar un nombre al elemento medido. Esto la convierte en la menos
informativa de las escalas de medición.
Ejemplos de variables con este tipo de escala:
Nacionalidad.
Uso de anteojos.
Número de camiseta en un equipo de fútbol.
Número de Cédula Nacional de Identidad.
A pesar de que algunos valores son formalmente numéricos, sólo están siendo usados para identificar a los
individuos medidos.
La escala ordinal, además de las propiedades de la escala nominal, permite establecer un orden entre los
elementos medidos.
Ejemplos de variables con escala ordinal:
Preferencia a productos de consumo.
Etapa de desarrollo de un ser vivo.
Clasificación de películas por una comisión especializada.
Madurez de una fruta al momento de comprarla.
11. La escala de intervalo, además de todas las propiedades de la escala ordinal, hace que tenga sentido
calcular diferencias entre las mediciones.
Ejemplos de variables con esta escala:
Temperatura de una persona.
Ubicación en una carretera respecto de un punto de referencia (Kilómetro 85 Ruta 5).
Sobrepeso respecto de un patrón de comparación.
Nivel de aceite en el motor de un automóvil medido con una vara graduada.
Finalmente, la escala de razón permite, además de lo de las otras escalas, comparar mediciones
mediante un cociente.
Algunos ejemplos de variables con la escala de razón son los siguientes:
Altura de personas.
Cantidad de litros de agua consumido por una persona en un día.
Velocidad de un auto en la carretera.
Número de goles marcados por un jugador de básquetbol en un partido.
La escala de intervalo tiene un cero que se establece por convención y puede tener variaciones. Es
arbitrario. Por otra parte, la escala de razón tiene un cero real, fijo, no sujeto a variaciones; es propio de la
medición hecha.
12. La sumatoria o sumatorio se emplea para representar la suma de muchos o infinitos sumandos.
La expresión se lee: "sumatoria de Xi, donde i toma los valores de 1 a n".
La operación sumatoria se expresa con la letra griega sigma mayúscula Σ.
i es el valor inicial llamado límite inferior.
n es el valor final llamado límite superior.
Es la relación entre dos fenómenos independientes, el rango es de cero a infinito positivo.
Por ejemplo: en un Hospital existen mil pacientes y un total de cincuenta médicos, por lo cual se tiene
una razón de 1000/50=20, en otras palabras en el Hospital por cada médico existen 20 pacientes.
La fórmula de razones (ri) es: ri=xi
n
13. Es el cociente del número de veces que se presenta un valor o característica con respecto al total de la
muestra de la variable en estudio.
Por ejemplo: en un estudio médico sobre el Alzheimer se examinaron 280 mujeres y 220 hombres,
entonces se puede notar que:
Proporción (mujeres) = 280/500 = 0,56
Proporción (hombres) = 220/500 = 0,44
Es importante aclarar que las proporciones, se relacionan con las frecuencias relativas simples; su
rango, va desde cero hasta uno (ambos inclusive), en otras palabras, el campo de existencia de las
proporciones se encuentra en el intervalo [0,1] y la sumatoria de las proporciones es igual a uno.
La fórmula general de proporciones (Pi) es:
Pi= xi
n
14. Es la rapidez de cambio de un fenómeno, se obtiene mediante el cociente del número de veces que ocurre la situación
investigada en un lugar y lapso de tiempo determinado, entre la población en estudio, multiplicada por una potencia de 10,
su rango es de cero a infinito positivo.
Cabe agregar que, las tasas que se refieren a toda la población se llaman crudas, mientras que las tasas que se refieren
solo a una parte de la población se denominan especificas.
Las tasas más comunes son:
Tasas de mortalidad: riesgo de morir.
Tasas de morbilidad: riesgo de contraer determinada enfermedad.
Tasas de natalidad: miden el crecimiento de las poblaciones.
Tasas de letalidad: miden la gravedad de las enfermedades.
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.
15. Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento y se representa por ni.
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o
iguales al valor considerado.
Se representa por Fi.
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número
total de datos. Se puede expresar en tantos por ciento.
16. xi fi Fi xi · fi |x − x | |x − x | · fi xi
2 · fi
61 5 5 305 6.45 32.25 18 605
64 18 23 1152 3.45 62.10 73 728
67 42 65 2814 0.45 18.90 188 538
71 27 92 1890 2.55 68.85 132 300
73 8 100 584 5.55 44.40 42 632
100 6745 226.50 455 803
Sea una distribución estadística que viene dada por la siguiente tabla:
Calcular:
1 La moda, mediana y media.
2 El rango, desviación media, varianza y desviación típica.
xi 61 64 67 70 73
fi 5 18 42 27 8
Moda
Mo = 67
Mediana
100/2 = 50 Me = 67
Media
Desviación media
Varianza
Desviación típica Rango
r = 73 − 61 = 12