La Sostenibilidad Corporativa. Administración Ambiental
Métodos de Correlación
1. Republica Bolivariana De Venezuela
Ministerio del Poder Popular para la Educación
Instituto Politécnico Santiago Mariño
Barcelona – Edo Anzoátegui
Profesor:
Ramón Aray Bachiller:
José David Coello
C.I: 26124492
Barcelona , Febrero de 2016
2. COEFICIENTE DE PEARSON
La covariación es el grado de concordancia de
las posiciones relativas de los datos de dos
variables. En consecuencia el coeficiente de
correlación de Pearson opera con puntuaciones
tipificadas (que miden posiciones relativas) y se
define como
El fundamento del coeficiente de Pearson es el
siguiente ; Cuanto más intensa sea la concordancia
(en sentido directo o inverso) de las posiciones
relativas de los datos en las dos variables, el
producto del numerador toma mayor valor (en
sentido absoluto). Si la concordancia es exacta, el
numerador es igual a N (o a -N), y el índice toma un
valor igual a 1 (o -1).
Ejemplo 1 (Máxima covariación positiva)
3. Observa que los datos tipificados (expresados como
puntuaciones z) en las dos columnas de la derecha tienen los
mismos valores en ambas variables, dado que las posiciones
relativas son las mismas en las variables X e Y.
Si obtenemos los productos de los valores tipificados para
cada caso, el resultado es:
El cociente de dividir la suma de productos (5)
por N (hay que tener en cuenta que N es el
número de casos, NO el número de datos) es
igual a 1:
4. Ejemplo 2
(Covariación positiva de alta intensidad)
Y por tanto.
Ejemplo 3 (Ausencia de covariación)
Características del Coeficiente de PEARSON
a) El coeficiente de correlación de Pearson puede
tomar valores entre -1 y 1.
b) La correlación de una variable con ella misma
siempre es igual a 1.
c) El valor 0 indica ausencia de covariación lineal,
pero NO si la covariación es de tipo no lineal.
5. VENTAJAS Y DESVENTAJAS
Ventajas
El valor del coeficiente de correlación es independiente de cualquier
unidad usada para medir variables.
Mientras mas grande sea la muestra mas exacta será la estimación
• Desventajas
• Requiere supuestos acerca de la naturaleza o formas de las
poblaciones afectadas.
• Requiere que las dos variables hayan ido medidas hasta un nivel
cuantitativo continuo y que la distribución de ambas sea semejante a la
de la curva normal.
6. COEFICIENTE DE CORRELACIÓN POR RANGOS
DE SPEARMAN
Este coeficiente se emplea cuando una o
ambas escalas de medidas de las variables
son ordinales, es decir, cuando una o ambas
escalas de medida son posiciones. Ejemplo:
Orden de llegada en una carrera y peso de
los atletas.
Se calcula aplicando la siguiente ecuación:
Nota: Los datos hay que traducirlos u ordenarlos en rangos. A los
puntajes más elevados le asignamos el rango 1 al siguiente el rango 2
y así sucesivamente. Si se repiten dos puntajes o más se calculan las
medias aritméticas.
7. Ejemplo ilustrativo N° 1: La siguiente tabla
muestra el rango u orden obtenido en la primera
evaluación (X) y el rango o puesto obtenido en
la segunda evaluación (Y) de 8 estudiantes
universitarios en la asignatura de Estadística.
Calcular el coeficiente de correlación por rangos
de Spearman.
Estudiante X Y
Dyana 1 3
Elizabeth 2 4
Mario 3 1
Orlando 4 5
Mathias 5 6
Josue 6 2
Anita 7 8
Lucia 8 7
8. Solución:
Para calcular el coeficiente de correlación por rangos de
Spearman de se llena la siguiente tabla:
Se aplica la siguiente
formula:
9. VENTAJAS Y DESVENTAJAS
Ventajas
No esta afectada por los cambios en las unidades de medida
Al ser una técnica no parámetra, es libre de distribución probabilística.
Desventajas
Es recomendable usarlo cuando los datos presentan valores
extremos, ya que dichos valores afectan mucho el coeficiente de
correlación de Pearson, o ante distribuciones no normales.
r no debe ser utilizado para decir algo sobre la relación entre
causa y efecto.