2. Que es el Coeficiente de Correlación
de Pearson
En estadística, el coeficiente de correlación de Pearson es una medida de la
relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la
covarianza, la correlación de Pearson es independiente de la escala de
medida de las variables.
De manera menos formal, podemos definir el coeficiente de correlación de
Pearson como un índice que puede utilizarse para medir el grado de
relación de dos variables siempre y cuando ambas sean cuantitativas.
3. Que es una variable?
Definición: Una variable estadística es cada una de
las características o cualidades que poseen los individuos
de una población.
Una variable es una propiedad que puede fluctuar y cuya
variación es susceptible de adoptar diferentes valores, los
cuales pueden medirse u observarse.
Las variables adquieren valor cuando se relacionan con
otras variables, es decir, si forman parte de una hipótesiso
de una teoría. En este caso se las
denomina constructos o construcciones hipotéticas.
4. Interpretación
El valor del índice de correlación varía en el intervalo [-1,1]:
Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia
total entre las dos variables denominada relación directa: cuando una de ellas aumenta,
la otra también lo hace en proporción constante.
Si 0 < r < 1, existe una correlación positiva.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las
variables son independientes: pueden existir todavía relaciones no lineales entre las
dos variables.
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia
total entre las dos variables llamada relación inversa: cuando una de ellas aumenta,
la otra disminuye en proporción constante.
5. Variable cuantitativa: es la que se expresa mediante un número,
por tanto se pueden realizar operaciones aritméticas con ella. Podemos
distinguir dos tipos:
1. variable discreta: es aquella que toma valores aislados, es
decir no admite valores intermedios entre dos valores específicos.
Ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
2. variable continua: es aquella que puede tomar valores comprendidos
entre dos números.
Ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
6. Pasos Para Usar El Coeficiente de
Correlación de Pearson
Paso 1
Identifica el dependiente variable que se probará entre dos
observaciones derivadas independientemente.
Uno de los requisitos del coeficiente de correlación de
Pearson es que las dos variables que se comparan
deben observarse o medirse de manera independiente para
eliminar cualquier resultado sesgado.
7. Paso 2
Calcula el coeficiente de correlación de Pearson. Para
cantidades grandes de información, el calculo puede ser
tedioso. Además de los varios programas de estadística,
muchas calculadoras científicas pueden calcular el valor.
8. Paso 3
Reporta un valor de correlación cercano a 0 como un
indicador de que no hay relación linear entre las dos
variables. Conforme el coeficiente de correlación se
acerque al 0, los valores se vuelven menos correlacionados,
lo que identifica las variables que no pueden ser relacionadas
entre sí
9. Paso 4
Reporta un valor de correlación cercano al 1 como
indicador de que existe una relación linear positiva entre
las dos variables. Un valor mayor a cero que se acerque a 1
da como resultado una mayor correlación positiva entre la
información. Conforme una variable aumenta cierta cantidad,
la otra aumenta en cantidad correspondiente. La
interpretación debe determinarse de acuerdo con el
contexto del estudio.
10. Paso 5
Reporta un valor de correlación cercano a -1 como
indicador de que hay una relación linear negativa entre las
dos variables. Conforme el coeficiente se acerca a -1, las
variables se vuelven negativamente más correlacionadas, lo
que indica que conforme una variable aumenta, la variable
disminuye por una cantidad correspondiente. La
interpretación, de nuevo, debe determinarse de acuerdo con
el contexto del estudio.
11. Paso 6
Interpreta el coeficiente de correlación de acuerdo con el contexto de los datos
particulares.
El valor de correlación es esencialmente un valor arbitrario que debe aplicarse de
acuerdo
con las variables que se comparan. Por ejemplo, un valor r de 0.912 indica una relación
linear positiva muy fuerte
entre las dos variables. En un estudio donde se comparan dos variables que
normalmente se identifican
como relacionadas, estos resultados dan evidencia de que una variable puede afectar de
manera
positiva a la otra, lo que resulta un caso para mayor investigación entre
las dos. Sin embargo, el mismo valor r en un estudio que compara dos variables donde
está probado que tienen una
relación linear positiva puede identificar un error en la información u otros problemas
potenciales en el diseño experimental.
Por ello, es importante entender el contexto de la información cuando se reporta e
interpreta el coeficiente de correlación de Pearson.
12. Paso 7
Determina la importancia de los resultados. Esto se logra
con el uso del coeficiente de correlación, grados de libertad y
una tabla de valores críticos del coeficiente de correlación. Los
grados de libertad se calculan como el número de las dos
observaciones menos 2. Con este valor, identifica el valor
crítico correspondiente en la tabla de correlación para una
prueba de 0.05 y 0.01 que identifique 95 y 99 por ciento de
nivel de confiabilidad respectivamente. Compara el valor
crítico al coeficiente de correlación previamente calculado. Si
el coeficiente de correlación es mayor, los resultados son
importantes.
13. Coeficiente de correlación de
Spearman
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida
de la correlación (la asociación o interdependencia) entre dos variables
aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados
por su respectivo orden.
El estadístico ρ viene dado por la expresión:
donde D es la diferencia entre los correspondientes estadísticos de orden
de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de
ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia
14. Dibuja tu tabla. Esta organizará la información que necesitas para calcular el
coeficiente de correlación de Spearman.
Necesitarás:6 columnas con encabezados como se muestra a continuación.
Las filas necesarias para poner los pares de datos que tengas.
Métodos Para usar el Coeficiente de
correlación de Spearman
15. Llena las primeras dos columnas con los pares de datos.
En tu tercer columna clasifica tus datos de la primera columna del 1
hasta n(el número de datos que tienes). Comienza con el más bajo, el cual
debe tener el 1, el siguiente número más bajo el 2 y así sucesivamente.
16. En tu cuarta columna haz lo mismo que en el paso 3, pero clasifica la
segunda columna en lugar de la primera.
En la columna "d" calcula la diferencia del número de clasificación para cada
par de datos.
17. Eleva al cuadrado cada número de la columna "d" y escribe estos valores en
la columna "d2".
Suma todos los valores que hay en la columna "d2". Este resultado es Σd2.
18. Escoge alguna de las siguientes fórmulas:
•Si no hay ninguna relación en los pasos anteriores, introduce este valor en la fórmula
simplificada del coeficiente de correlación de Spearman
y reemplaza "n" por el número de pares de datos que tienes para calcular la respuesta.
•Si hay alguna relación en cualquiera de los pasos anteriores, usa más bien la fórmula estándar de coeficiente de co
19. Ventajas y desventajas del Coeficiente de
Correlacion de Pearson y Spearman
Pearson:
Ventajas : El valor del coeficiente de correlación es independiente de cualquier unidad
usada para medir variables. Mientras mas grande sea la muestra mas exacta será la
estimación.
Desventajas Requiere supuestos acerca de la naturaleza o formas de las poblaciones
afectadas. Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva
normal.
Spearman:
Ventajas: No esta afectada por los cambios en las unidades de medida. Al ser una
técnica no parámetra, es libre de distribución probabilística.
Desventajas: Es recomendable usarlo cuando los datos presentan valores extremos, ya
que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante
distribuciones no normales. r no debe ser utilizado para decir algo sobre la relación
entre causa y efecto.