2. Definiciones
• Dependencia lineal: relación entre las variables que se analizan.
• Covarianza: valor que indica el grado de variación conjunta de dos
variables aleatorias respecto a sus medias, como una especie de
medida promedio de la dependencia lineal.
3. Covarianza (𝑆𝑥𝑦)
𝑆𝑥𝑦 =
𝑥𝑦 − 𝑛𝑥𝑦
𝑛 − 1
La covarianza mide la cantidad de relación lineal entre las variables y el
sentido de esta, de la forma:
• 𝑆𝑥𝑦 > 0, relación lineal positiva (si crece una variable, la otra
también)
• 𝑆𝑥𝑦 < 0, relación lineal negativa (si crece una variable, la otra
decrece).
• 𝑆𝑥𝑦 = 0, no hay relación lineal entre las variables.
Media
aritmética o
promedio
𝒙 , 𝒚
4. Coeficiente de correlación (Pearson)
𝑟 =
𝑆𝑥𝑦
𝑆𝑥𝑆𝑦
• Es una medida adimensional
• Siempre toma valores en el intervalo [−1,1]
• Mantiene el signo de 𝑆𝑥𝑦
Donde:
𝑆𝑥 =
1
𝑛−1
𝑥2 −
𝑥 2
𝑛
𝑆𝑦 =
1
𝑛−1
𝑦2 −
𝑦 2
𝑛
5. Ejemplo
Consideramos el conjunto de datos:
S = {(1; 3,6), (1,5; 4,35), (2,1; 5,25), (2,9; 6,45), (3,2; 6,9)}
Hallar la covarianza y el coeficiente de relación.
PASO 1:
X Y XY X² Y²
CONJUNTO DE
DATOS
1 3,6 3,6 1 12,96
1,5 4,35 6,525 2,25 18,9225
2,1 5,25 11,025 4,41 27,5625
2,9 6,45 18,705 8,41 41,6025
3,2 6,9 22,08 10,24 47,61
TOTAL SUMA 10,7 26,55 61,935 26,31 148,6575
PROMEDIO 2,14 5,31