Tema 19. Inmunología y el sistema inmunitario 2024
Coeficientes de Correlacion de Spearman y Pearson
1. Republica Bolivariana de Venezuela
Ministerio de Poder Popular Para la Educación
Instituto Universitario Politécnico Santiago Mariño
Barcelona Edo-Anzoategui
Escuela de Ingeniería Industrial
Estadística I Sección YV
Coeficiente de correlación de
Spearman y Pearson.
2. Coeficiente de Correlativo de
Spearman
En estadística, el coeficiente de correlación de
Spearman, ρ (rho) es una medida de la correlación (la asociación
o interdependencia) entre dos variables aleatorias continuas. Para
calcular ρ, los datos son ordenados y reemplazados por su
respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos
de orden de x - y. N es el número de parejas.
La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas respectivamente,
0 cero, significa no correlación pero no independencia. La tau de
Kendall es un coeficiente de correlación por rangos, inversiones
entre dos ordenaciones de una distribución normal bivariante.
3. Es un coeficiente para medir el grado de asociación entre dos
variables ordinales cuyos valores indican rangos en cada una de
ellas. Rho toma el valor +1 cuando existe igualdad de rangos de
los casos en las dos variables y -1 cuando tienen rangos
exactamente opuestos. Los valores intermedios pueden ser
interpretados según sus magnitudes relativas. Su fórmula de
cálculo es:
En la cual:
D = diferencia de rangos en las dos variables, o, diferencia entre
los correspondientes estadísticos de orden de x - y.
N = número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora
de ordenarlos, aunque si éstos son pocos, se puede ignorar tal
circunstancia
Para muestras mayores de 20 observaciones, podemos utilizar la
siguiente aproximación a la distribución t de Student.
La interpretación de coeficiente de Spearman es igual que la
del coeficiente de correlación de Pearson. Oscila entre -1 y +1,
indicándonos asociaciones negativas o positivas
respectivamente, 0 cero, significa no correlación pero no
independencia. La tau de Kendall es un coeficiente de correlación
por rangos, inversiones entre dos ordenaciones de una
distribución normal bivariante.
4. Ventajas y Desventajas de
Spearman
No esta afectada por los cambios en las unidades de medida.
Al ser una técnica no parámetro, es libre de distribución
probabilística.
Spearman Al ser Spearman una técnica no paramétrica es libre
de distribución probabilística (2,5,9).
Los supuestos son menos estrictos. Es robusto a la presencia
de outliers (es decir permite ciertos desvíos del patrón normal).
La manifestación de una relación causa-efecto es posible sólo a
través de la comprensión de la relación natural que existe entre
las variable y no debe manifestarse sólo por la existencia de
una fuerte correlación (1, 5).
5. Desventajas
Es recomendable usarlo cuando los datos
presentan valores extremos, ya que
dichos valores afectan mucho el
coeficiente de correlación de Pearson, o
ante distribuciones no normales.
r no debe ser utilizado para decir algo
sobre la relación entre causa y efecto.
6. Usos de enfoque Spearman
Para aplicar la correlación de Spearman se requiere que al
menos las variables estén medidas en al menos escala ordinal,
es decir, de forma que las puntuaciones que la representan
puedan ser colocadas en dos series ordenadas. Una
generalización del coeficiente de Spearman es útil en la
situación en la cual hay tres o más condiciones, varios
individuos son observados en cada una de ellas, y predecimos
que las observaciones tendrán un orden en particular. Por
ejemplo, un conjunto de individuos pueden tener tres
oportunidades para intentar cierta tarea, y predecimos que su
habilidad mejorará de intento en intento. El coeficiente de
correlación de Spearman es recomendable utilizarlo cuando los
datos presentan valores extremos, ya que dichos valores
afectan mucho el coeficiente de correlación de Pearson, o ante
distribuciones no normales. No está afectada por los cambios en
las unidades de medida. Este coeficiente es una medida de
asociación lineal que utiliza los rangos, números de orden, de
cada grupo de sujetos y compara dichos rangos. Existen dos
métodos para calcular el coeficiente de correlación de los
rangos: uno, señalado por Spearman y otro, por Kendall. El r de
Spearman llamado también rho de Spearman es más fácil de
calcular que el de Kendall.
7. Coeficiente de Correlativo de
PearsonEs una prueba estadística para analizar la relación entre
dos variables medidas en un nivel por intervalos o de razón.
Prueba Hi del tipo de “A mayor X, mayor Y”; “A mayor X, menor
Y”; etc.
La prueba en si no considera a una como independiente y la otra
como dependiente, porque no evalúa la causalidad, solo
la relación mutua(correlación).
El coeficiente se calcula a partir de las puntuaciones obtenidas
en una muestra de dos variables. Se relacionan las
puntuaciones obtenidas de una variable con las puntuaciones
obtenidas de otra variable, en los mismos sujetos.
Mide niveles de variables de intervalo o de razón.
Puede variar de -1,00 a +1,00
(HFB2: 377)
8. Ejemplo de la (co)relación entre la variable “estatura” y “peso” de
alumnos de Ing. Comercial en clases el 12.2011. (Calculo
obtenido con Excel).
Correlación positiva considerable
ESTATURA PESO
1,72 98
1,64 65
1,84 98
1,66 65
1,63 70
1,70 105
1,82 110
r = 0,79
9. Ventajas y Desventajas de Pearson
El valor del coeficiente de correlación es independiente
de cualquier unidad usada para medir variables.
Mientras mas grande sea la muestra mas exacta será
la estimación.
Puede utilizarse para medir el grado de relación de dos
variables siempre y cuando ambas sean cuantitativas.
Su magnitud indica el grado de asociación entre las
variables
10. Desventajas
Error que se comete para la medida. Cuanto mayor
número de pares o de personas es más fiable.
No refleja cambios en los patrones de compra conforme
pasa el tiempo.
Requiere supuestos acerca de la naturaleza o formas de
las poblaciones afectadas.
Requiere que las dos variables hayan ido medidas hasta
un nivel cuantitativo continuo y que la distribución de
ambas sea semejante a la de la curva normal.
11. Usos del Coeficiente de Correlación
de Pearson
Permite predecir el valor de una variable dado un valor
determinado de la otra variable.
Se trata de valorar la asociación entre dos variables cuantitativas
estudiando el método conocido como correlación.
Dicho cálculo es el primer paso para determinar la relación entre
las variables.
Consiste en la posibilidad de calcular su distribución muestral y así
poder determinar su error típico de estimación.
Reporta un valor de correlación cercano a 0 como un indicador de
que no hay relación lineal entre 2 variables.
12. Usos del Coeficiente de Correlación
de Pearson
Reporta un valor de correlación cercano a 1 como un indicador de
que existe una relación lineal positiva entre las 2 variables.
Un valor mayor a cero que se acerque a 1 da como resultado una
mayor correlación positiva entre la información.
13. 1. Cuando el signo es positivo refleja una correlación directa.
2. Mientras mas altos sean los valores de la variable
independiente más altos serán los de la variable dependiente.
3. Cuando el signo es negativo refleja una correlación inversa.
4. Mientras más altos sean los valores de la variable
independiente más bajos serán los de la variable dependiente.
ENFOQUES DE PEARSON Y
SPEARMAN EN PROBLEMAS
ESTADÍSTICOS
14. Bibliografía
1. Www.wikipedia.com Tema N° 1: Coeficiente de correlación
de Spearman. Tema N° 2: Coeficiente de Correlación de
Pearson.
2. Www.monografías.com Tema N°1: Correlación. Tema N° 2:
Coeficiente de correlación de Karl Pearson.
3. Www.es.scribd.com Tema: Coeficiente de correlación de
Pearson y Spearman - Dr. Enrique Sierra.
4. Www.ehowenespanol.com Tema: Cómo usar el coeficiente
de correlación de Pearson.
5. Www.scielo.sld.cu Tema: Coeficiente de correlación de los
rangos de Spearman.