1. Grados de libertad:
Función de probabilidad para la media muestral con muestra pequeña:
(a-μ)√(n-1)/s ∼ t(n-1)
donde:
a: media aritmética de la muestra → a =Σx/n
s: desviación estándar en la muestra → s² = Σ(x -a)²/n
μ: media poblacional
n: tamaño de la muestra
Trataremos de explicar en forma intuitiva porque son n-1 grados de libertad.
Para poder determinar "s²" es necesario calcular antes la media muestra "a" con los datos
disponibles de la muestra "n". Si al principio es cierto que disponiamos de "n" variables
independientes (cada elemento de la muestra se considera una variable aleatoria independiente)
en el momento que calculamos la media muestral perdemos un grado de libertad; conocido el valor
de la media muestral, sólo n-1 de las variables de la muestras permanecen independientes.
Si tenemos una muestra de 4 elementos y la media muestral es 10, sólo 3 de las variables de la
muestra pueden variar libremente puesto que la cuarta variable queda determinada.
10 = (x1+x2+x3+x4)/4 → x4 = 40-x1-x2-x3
Por ejemplo, si x1=9, x2=15, x3=10 (variables independientes), la cuarta variable debe ser
necesariamente 6 (x4 = 40-9-15-10 = 6 variable dependiente) para que la media muestral sea 10.
Conclusión:
Los grados de libertad son el número de variables aleatorias independientes de la muestra.
2. ¿Cómo determina si un valor es realmente un valor atípico?
A. Uno de los problemas arduos en el análisis de datos es manejar los valores atípicos en un
grupo de datos. Un valor atípico es una observación con un valor que no parece corresponderse
con el resto de los valores en el grupo de datos. Los valores atípicos también suelen llamarse
valores aberrantes o inconsistentes. Por lo general surgen dos preguntas: 1) ¿Es este valor
realmente un valor atípico? 2) ¿Puedo eliminar este valor y continuar con el análisis de datos?
La pregunta 1 se refiere a la identificación de un valor atípico, y dos herramientas básicas
relacionadas son la representación gráfica y la prueba estadística. Un excelente gráfico para
observar la distribución de pequeños grupos de datos es el gráfico de puntos. Por ejemplo,
tomemos los datos 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3 para los que se muestra el gráfico de puntos
en la Figura 1.
Figura 1 — Trazado de puntos para los datos, 5.3, 3.1, 4.9, 3.9, 7.8, 4.7 y 4.3.
Aquí, el valor 7.8 parecer ser un valor atípico porque está bien a la derecha del resto en el
gráfico de puntos. En el gráfico, en realidad estamos mirando los espacios entre los valores de
datos.
Dos de las pruebas estadísticas utilizadas con mayor frecuencia en un grupo de datos único son
la prueba de Dixon y la prueba de Grubbs. La prueba de Dixon utiliza relaciones de los espacios
entre datos de diferentes modos según la cantidad de valores en el grupo de datos. En el
ejemplo anterior, el tamaño de la muestra es 7, y la relación utilizada es el espacio entre el valor
atípico (7.8) y su vecino más próximo (5.3) dividido por el espacio entre los valores más
grandes y más pequeños en el grupo. Por lo tanto, el índice de Dixon es:
(7.8 – 5.3)/(7.8 – 3.1) = 2.5/4.7 = 0.532
Este valor se compara con un valor crítico de una tabla, y el valor se declara valor atípico si
supera ese valor crítico. El valor crítico depende del tamaño de la muestra, n, y de un nivel de
representatividad elegido, que es el riesgo de rechazar una observación válida. La tabla por lo
general utiliza niveles de baja representatividad tal como 1% o 5%. Para Para un n = 7 y un
riesgo del 5%, el valor crítico es 0.507. El índice de Dixon 0.532 excede este valor crítico,
indicando que el valor 7.8 es un valor atípico.
La prueba de Grubbs utiliza una estadística de prueba, T, que es la diferencia absoluta entre el
valor atípico, XO, y el promedio de la muestra dividida por la desviación estándar de la
muestra, s. Para el ejemplo anterior, el promedio de la muestra es = 4.86 y la desviación
estándar de la muestra es = 1.48. La estadística calculada de la prueba es:
Para un n = 7 y un riesgo del 5%, el valor crítico es 1.938 y el T = 1.99 excede este valor
crítico, indicando que el valor 7.8 es un valor atípico.
Con respecto a la pregunta 2, debe saberse que las pruebas estadísticas se utilizan para
identificar valores atípicos, no para retirarlos del grupo de datos. Técnicamente, una observación
no debe retirarse a menos que una investigación halle una causa probable para justificar esta
acción. Algunas compañías han definido procedimientos para estas investigaciones, incluyendo la
repetición de la prueba del material asociado a la observación de valores atípicos, en caso de ser
posible.
En algunos casos, la situación física puede definir el problema. Para las tres observaciones, 98.7,
90.0 y 99.7, el índice de Dixon es
8.7/9.7 = 0.897
El valor crítico para un n = 3 y un riesgo de 5% es 0.941, ¡por lo que el valor 90.0 no puede
identificarse como valor atípico! Parte del motivo puede ser la proximidad cercana de los otros
dos valores. Sin embargo, si los valores registrados son temperaturas del cuerpo humano en
grados Fahrenheit, no hace falta una prueba de valor atípico para llegar a la conclusión de que
3. algo está mal. Este ejemplo también ilustra que es difícil identificar valores atípicos en pequeños
grupos de datos, tal como n < 5. La norma ASTM E691, método para llevar a cabo un estudio
entre laboratorios para determinar la precisión de un método de prueba, desalienta estas
pruebas de valores atípicos para pequeños grupos de resultados de pruebas repetidos en un
mismo laboratorio y sugiere otras metodologías para identificar grupos de datos aberrantes.
¿Por qué no hay datos atípicos?
Prueba de Grubbs
La sección final de la salida muestra los resultados de una o más pruebas formales para valores
atípicos:
La primera prueba se debe a Grubbs y se calcula si n ≥ 3. También llamada Prueba de la
Desviación Estudentizada Extrema (ESD), se basa en el mayor valor Estudentizado (sin
eliminación) tmax. El estadístico de prueba T se calcula de acuerdo con:
Se obtiene un valor aproximado de P de dos colas calculando la probabilidad de exceder |T|
basada en una distribución t de Student con n - 2 grados de libertad y multiplicando el resultado
por 2n. Un pequeño valor de P lleva a la conclusión de que ese punto más extremo es de hecho un
valor atípico. Para pequeñas muestras, uno puede en cambio remitirse a Iglewicz y Hoaglin (1993)
quienes dan valores al 5% y 1% para tmax en el Apéndice A de su monografía, así como para una
prueba generalizada que involucre r > 1 valores atípicos potenciales.
En los mismos datos, la fila 15 es el punto más extremo, con un valor Estudentizado igual a casi
3.5. Ya que el valor de P es menor que 0.05, ese punto puede ser declarado como valor atípico
estadísticamente significativo a un nivel de confianza del 5%. Esta conclusión se hace sujeta al
supuesto de la prueba de Grubbs de que todas los demás valores de los datos provienen de una
distribución normal.
Prueba de Dixon
Para muestras pequeñas con 4 ≤ n ≤ 30, también se realiza la prueba de Dixon. Esta prueba
comienza ordenando los valores de los datos de menor a mayor. Sea x(j) el j - ésimo valor más
pequeño de los datos, las estadísticas se calculan entonces para probar 5 situaciones potenciales:
4. El estadístico calculado r se compara entonces con valores críticos en tablas tales como el
Apéndice A.3 de Iglewicz y Hoaglin (1993). Para cada prueba, STATGRAPHICS indica si el resultado
es o no estadísticamente significativo a los niveles de 5% y 1%. Un resultado significativo indica la
presencia de la situación hipotética.