Analsis Korelasi
Semester Genap 2024/2025
Asep Saepulrohman
Ilmu Komputer
Universitas Pakuan
June 22, 2025
1 / 36
Pengertian Analisis Korelasi
Analisis Korelasi
Analisis korelasi adalah metode statistik yang digunakan untuk mengukur kuat dan arah
hubungan linier antara dua variabel numerik.
• Analisis korelasi digunakan untuk mengukur kuat dan arah hubungan antara dua
variabel numerik.
• Menjawab pertanyaan seperti:
• ”Apakah tinggi badan berhubungan dengan berat badan?”
• Korelasi tidak menunjukkan sebab-akibat (kausalitas).
2 / 36
Koefisien Korelasi Pearson (r)
−1 ≤ r ≤ 1
• r = 1: Korelasi positif sempurna
• r = −1: Korelasi negatif sempurna
• r = 0: Tidak ada hubungan linier
3 / 36
Interpretasi Nilai Korelasi
Nilai r Interpretasi
r = 1 Positif sempurna
0.7 ≤ r < 1 Positif kuat
0.3 ≤ r < 0.7 Positif sedang
0 < r < 0.3 Positif lemah
r = 0 Tidak ada hubungan linier
−0.3 < r < 0 Negatif lemah
−0.7 < r ≤ −0.3 Negatif sedang
−1 < r ≤ −0.7 Negatif kuat
4 / 36
Jenis-Jenis Korelasi
• Korelasi Positif: Kenaikan satu variabel diikuti kenaikan variabel lain.
• Korelasi Negatif: Kenaikan satu variabel diikuti penurunan variabel lain.
• Korelasi Nol: Tidak ada pola hubungan linier.
5 / 36
Contoh Korelasi Positif dan Negatif
• Positif: Tingkat pendidikan dan pendapatan.
• Negatif: Jumlah rokok yang dikonsumsi dan harapan hidup.
• Nol: Ukuran sepatu dan nilai ujian.
6 / 36
Rumus Korelasi Pearson (r)
Rumus:
r =
P
(Xi − X̄)(Yi − Ȳ )
pP
(Xi − X̄)2 ·
P
(Yi − Ȳ )2
Versi alternatif (untuk penghitungan manual):
r =
n
P
XY − (
P
X)(
P
Y )
p
[n
P
X2 − (
P
X)2][n
P
Y 2 − (
P
Y )2]
Kegunaan: Mengukur hubungan linier dua variabel kuantitatif.
7 / 36
Rumus Korelasi Spearman ()
Digunakan untuk data ordinal (peringkat) atau data tidak normal.
ρ = 1 −
6
P
d2
i
n(n2 − 1)
• di = selisih peringkat antara Xi dan Yi
• n = jumlah pasangan data
Kelebihan: Tidak sensitif terhadap outlier.
8 / 36
Koefisien Determinasi (R2
)
R2
= r2
• Menyatakan proporsi variasi pada variabel Y yang dapat dijelaskan oleh variabel X.
• Nilai R2 berkisar antara 0 dan 1, atau dalam persen.
• Contoh: Jika r = 0.8, maka R2 = 0.64 → 64
9 / 36
Contoh Soal Korelasi
Seorang peneliti mencatat data tinggi badan (cm) dan berat badan (kg) dari 5 orang:
Orang Tinggi (X) Berat (Y)
A 160 50
B 165 55
C 170 58
D 175 65
E 180 70
Hitung koefisien korelasi Pearson r dan interpretasikan hasilnya.
10 / 36
Pembahasan Korelasi
Langkah-langkah:
• Rata-rata X̄ = 170, Ȳ = 59.6
• Gunakan rumus:
r =
P
(Xi − X̄)(Yi − Ȳ )
pP
(Xi − X̄)2 ·
P
(Yi − Ȳ )2
• Hasil: r ≈ 0.987
11 / 36
Interpretasi
• Nilai r = 0.987 mendekati 1.
• Terdapat hubungan positif yang sangat kuat antara tinggi dan berat badan.
• Kenaikan tinggi cenderung diikuti kenaikan berat.
12 / 36
Contoh Soal Korelasi Spearman
Seorang guru ingin mengetahui hubungan antara peringkat 6 siswa pada dua mata
pelajaran: Matematika dan Fisika.
Siswa Matematika (X) Fisika (Y)
A 1 2
B 2 1
C 3 4
D 4 3
E 5 6
F 6 5
Hitung koefisien korelasi Spearman () dan interpretasikan hasilnya.
13 / 36
Langkah 1: Hitung Selisih dan Kuadrat Selisih
Siswa X Y di = X − Y d2
i
A 1 2 -1 1
B 2 1 1 1
C 3 4 -1 1
D 4 3 1 1
E 5 6 -1 1
F 6 5 1 1
Jumlah 6
X
d2
i = 6 dan n = 6
14 / 36
Langkah 2: Masukkan ke Rumus Spearman
ρ = 1 −
6
P
d2
i
n(n2 − 1)
ρ = 1 −
6 × 6
6(62 − 1)
= 1 −
36
210
ρ = 1 − 0.1714 = 0.8286
15 / 36
Interpretasi Hasil
• Nilai ρ ≈ 0.83
• Artinya terdapat hubungan positif yang kuat antara peringkat Matematika dan Fisika.
• Siswa dengan peringkat tinggi di Matematika cenderung juga berperingkat tinggi di
Fisika.
16 / 36
Contoh Kasus
Seorang guru ingin mengetahui hubungan antara jumlah jam belajar dan nilai ujian
matematika.
Siswa Jam Belajar (X) Nilai Ujian (Y)
A 2 60
B 4 65
C 6 75
D 8 80
E 10 88
F 12 95
Hitung koefisien korelasi Pearson dan koefisien determinasi.
17 / 36
Langkah 1: Tambahan Data Perhitungan
X Y XY X2 Y2
2 60 120 4 3600
4 65 260 16 4225
6 75 450 36 5625
8 80 640 64 6400
10 88 880 100 7744
12 95 1140 144 9025
P
42 463 3490 364 36619
18 / 36
Langkah 2: Hitung Korelasi Pearson
r =
n
P
XY − (
P
X)(
P
Y )
p
[n
P
X2 − (
P
X)2][n
P
Y 2 − (
P
Y )2]
r =
6(3490) − 42 · 463
p
(6 · 364 − 422)(6 · 36619 − 4632)
r =
20940 − 19446
p
(2184 − 1764)(219714 − 214369)
r =
1494
√
420 · 5345
≈
1494
1498.3
≈ 0.9971
19 / 36
Langkah 3: Hitung Koefisien Determinasi
R2
= r2
= (0.9971)2
≈ 0.9942
• Artinya: 99.42% variasi nilai ujian dapat dijelaskan oleh jumlah jam belajar.
• Sisanya 0.58% dijelaskan oleh faktor lain (konsentrasi, metode belajar, dsb).
20 / 36
Kesimpulan
• Korelasi r ≈ 0.9971 menunjukkan hubungan sangat kuat dan positif.
• Koefisien determinasi R2 ≈ 0.9942 berarti hampir seluruh variasi nilai ujian dapat
dijelaskan oleh jam belajar.
• Model regresi sederhana sangat baik dalam menjelaskan hubungan dua variabel ini.
21 / 36
Pengertian Korelasi Parsial
• Korelasi parsial mengukur hubungan linier antara dua variabel (X dan Y ), dengan
menghilangkan pengaruh variabel ketiga (Z).
• Digunakan saat ingin mengetahui apakah hubungan antara X dan Y tetap signifikan
setelah mengendalikan pengaruh Z.
22 / 36
Rumus Korelasi Parsial (3 Variabel)
rXY ·Z =
rXY − rXZ rYZ
q
(1 − r2
XZ )(1 − r2
YZ )
Keterangan:
• rXY = korelasi antara X dan Y
• rXZ = korelasi antara X dan Z
• rYZ = korelasi antara Y dan Z
23 / 36
Contoh Soal
Diketahui:
• rXY = 0.8
• rXZ = 0.6
• rYZ = 0.7
Hitung korelasi parsial antara X dan Y setelah mengontrol Z: rXY ·Z
24 / 36
Pembahasan
Gunakan rumus:
rXY ·Z =
0.8 − (0.6)(0.7)
p
(1 − 0.62)(1 − 0.72)
=
0.8 − 0.42
p
(1 − 0.36)(1 − 0.49)
=
0.38
p
(0.64)(0.51)
=
0.38
√
0.3264
≈
0.38
0.5713
rXY ·Z ≈ 0.6647
25 / 36
Interpretasi Hasil
• Nilai rXY ·Z ≈ 0.665
• Artinya, setelah mengendalikan pengaruh Z, hubungan X dan Y tetap kuat.
• Korelasi asli rXY = 0.8, tetapi sebagian pengaruh tersebut disebabkan oleh variabel
Z.
26 / 36
Koefisien Korelasi Parsial
• Mengukur kekuatan hubungan linier antara dua variabel (misalnya Y dan X1) setelah
menghilangkan pengaruh variabel lain (X2, X3, . . .).
• Dilambangkan sebagai:
rYX1·X2,...,Xk
• Nilai antara -1 sampai 1 (tanpa satuan).
27 / 36
Koefisien Regresi Parsial
• Koefisien regresi β1 dalam model regresi ganda:
Y = β0 + β1X1 + β2X2 + · · · + ε
• Menyatakan perubahan rata-rata Y saat X1 naik satu unit, dengan variabel lain
tetap konstan.
• Memiliki satuan sesuai dengan variabel.
28 / 36
Persamaan Tujuan, Pendekatan Berbeda
• Keduanya digunakan untuk mengetahui pengaruh suatu variabel terhadap variabel
lain dengan mengendalikan variabel ketiga.
• Korelasi parsial → ukuran kekuatan hubungan.
• Regresi parsial → ukuran besarnya pengaruh numerik.
29 / 36
Perbandingan Regresi dan Korelasi Parsial
Aspek Regresi Parsial vs Korelasi Parsial
Tujuan Ukur pengaruh X terhadap Y setelah kontrol
Satuan Regresi: tergantung satuan variabel
Korelasi: tanpa satuan, -1 s.d. 1
Pendekatan Regresi: perubahan rata-rata Y
Korelasi: kekuatan hubungan Y-X
Output β1 vs rYX1·X2
30 / 36
Keterkaitan Matematis
Dalam kasus regresi linear ganda:
β1 = rYX1·X2 ·
sY
sX1·X2
• rYX1·X2 : korelasi parsial antara Y dan X1 setelah kontrol X2
• sY : standar deviasi Y
• sX1·X2 : standar deviasi residual dari X1
31 / 36
Contoh Soal
Diketahui:
• rY ,X1 = 0.85
• rY ,X2 = 0.70
• rX1,X2 = 0.60
• Standar deviasi: sY = 10, sX1·X2 = 5
Tugas:
1. Hitung korelasi parsial rYX1·X2
2. Hitung koefisien regresi parsial β1
32 / 36
Langkah 1: Korelasi Parsial
Gunakan rumus:
rYX1·X2 =
rYX1 − rYX2 · rX1X2
q
(1 − r2
YX2
)(1 − r2
X1X2
)
=
0.85 − (0.70)(0.60)
p
(1 − 0.702)(1 − 0.602)
=
0.43
√
0.51 · 0.64
=
0.43
√
0.3264
rYX1·X2 ≈
0.43
0.5713
≈ 0.7524
33 / 36
Langkah 2: Regresi Parsial
Gunakan hubungan:
β1 = rYX1·X2 ·
sY
sX1·X2
= 0.7524 ·
10
5
= 0.7524 · 2 = 1.5048
Hasil:
β1 ≈ 1.50
34 / 36
Interpretasi
• rYX1·X2 ≈ 0.75 menunjukkan hubungan positif yang kuat antara Y dan X1 setelah
efek X2 dikendalikan.
• β1 ≈ 1.50: setiap kenaikan 1 unit pada X1 menyebabkan kenaikan rata-rata sebesar
1.50 unit pada Y , jika X2 tetap konstan.
35 / 36
Terima Kasih
Pertanyaan?
36 / 36

15__Analisis_Korelasi (universitas pakuan).pdf

  • 1.
    Analsis Korelasi Semester Genap2024/2025 Asep Saepulrohman Ilmu Komputer Universitas Pakuan June 22, 2025 1 / 36
  • 2.
    Pengertian Analisis Korelasi AnalisisKorelasi Analisis korelasi adalah metode statistik yang digunakan untuk mengukur kuat dan arah hubungan linier antara dua variabel numerik. • Analisis korelasi digunakan untuk mengukur kuat dan arah hubungan antara dua variabel numerik. • Menjawab pertanyaan seperti: • ”Apakah tinggi badan berhubungan dengan berat badan?” • Korelasi tidak menunjukkan sebab-akibat (kausalitas). 2 / 36
  • 3.
    Koefisien Korelasi Pearson(r) −1 ≤ r ≤ 1 • r = 1: Korelasi positif sempurna • r = −1: Korelasi negatif sempurna • r = 0: Tidak ada hubungan linier 3 / 36
  • 4.
    Interpretasi Nilai Korelasi Nilair Interpretasi r = 1 Positif sempurna 0.7 ≤ r < 1 Positif kuat 0.3 ≤ r < 0.7 Positif sedang 0 < r < 0.3 Positif lemah r = 0 Tidak ada hubungan linier −0.3 < r < 0 Negatif lemah −0.7 < r ≤ −0.3 Negatif sedang −1 < r ≤ −0.7 Negatif kuat 4 / 36
  • 5.
    Jenis-Jenis Korelasi • KorelasiPositif: Kenaikan satu variabel diikuti kenaikan variabel lain. • Korelasi Negatif: Kenaikan satu variabel diikuti penurunan variabel lain. • Korelasi Nol: Tidak ada pola hubungan linier. 5 / 36
  • 6.
    Contoh Korelasi Positifdan Negatif • Positif: Tingkat pendidikan dan pendapatan. • Negatif: Jumlah rokok yang dikonsumsi dan harapan hidup. • Nol: Ukuran sepatu dan nilai ujian. 6 / 36
  • 7.
    Rumus Korelasi Pearson(r) Rumus: r = P (Xi − X̄)(Yi − Ȳ ) pP (Xi − X̄)2 · P (Yi − Ȳ )2 Versi alternatif (untuk penghitungan manual): r = n P XY − ( P X)( P Y ) p [n P X2 − ( P X)2][n P Y 2 − ( P Y )2] Kegunaan: Mengukur hubungan linier dua variabel kuantitatif. 7 / 36
  • 8.
    Rumus Korelasi Spearman() Digunakan untuk data ordinal (peringkat) atau data tidak normal. ρ = 1 − 6 P d2 i n(n2 − 1) • di = selisih peringkat antara Xi dan Yi • n = jumlah pasangan data Kelebihan: Tidak sensitif terhadap outlier. 8 / 36
  • 9.
    Koefisien Determinasi (R2 ) R2 =r2 • Menyatakan proporsi variasi pada variabel Y yang dapat dijelaskan oleh variabel X. • Nilai R2 berkisar antara 0 dan 1, atau dalam persen. • Contoh: Jika r = 0.8, maka R2 = 0.64 → 64 9 / 36
  • 10.
    Contoh Soal Korelasi Seorangpeneliti mencatat data tinggi badan (cm) dan berat badan (kg) dari 5 orang: Orang Tinggi (X) Berat (Y) A 160 50 B 165 55 C 170 58 D 175 65 E 180 70 Hitung koefisien korelasi Pearson r dan interpretasikan hasilnya. 10 / 36
  • 11.
    Pembahasan Korelasi Langkah-langkah: • Rata-rataX̄ = 170, Ȳ = 59.6 • Gunakan rumus: r = P (Xi − X̄)(Yi − Ȳ ) pP (Xi − X̄)2 · P (Yi − Ȳ )2 • Hasil: r ≈ 0.987 11 / 36
  • 12.
    Interpretasi • Nilai r= 0.987 mendekati 1. • Terdapat hubungan positif yang sangat kuat antara tinggi dan berat badan. • Kenaikan tinggi cenderung diikuti kenaikan berat. 12 / 36
  • 13.
    Contoh Soal KorelasiSpearman Seorang guru ingin mengetahui hubungan antara peringkat 6 siswa pada dua mata pelajaran: Matematika dan Fisika. Siswa Matematika (X) Fisika (Y) A 1 2 B 2 1 C 3 4 D 4 3 E 5 6 F 6 5 Hitung koefisien korelasi Spearman () dan interpretasikan hasilnya. 13 / 36
  • 14.
    Langkah 1: HitungSelisih dan Kuadrat Selisih Siswa X Y di = X − Y d2 i A 1 2 -1 1 B 2 1 1 1 C 3 4 -1 1 D 4 3 1 1 E 5 6 -1 1 F 6 5 1 1 Jumlah 6 X d2 i = 6 dan n = 6 14 / 36
  • 15.
    Langkah 2: Masukkanke Rumus Spearman ρ = 1 − 6 P d2 i n(n2 − 1) ρ = 1 − 6 × 6 6(62 − 1) = 1 − 36 210 ρ = 1 − 0.1714 = 0.8286 15 / 36
  • 16.
    Interpretasi Hasil • Nilaiρ ≈ 0.83 • Artinya terdapat hubungan positif yang kuat antara peringkat Matematika dan Fisika. • Siswa dengan peringkat tinggi di Matematika cenderung juga berperingkat tinggi di Fisika. 16 / 36
  • 17.
    Contoh Kasus Seorang guruingin mengetahui hubungan antara jumlah jam belajar dan nilai ujian matematika. Siswa Jam Belajar (X) Nilai Ujian (Y) A 2 60 B 4 65 C 6 75 D 8 80 E 10 88 F 12 95 Hitung koefisien korelasi Pearson dan koefisien determinasi. 17 / 36
  • 18.
    Langkah 1: TambahanData Perhitungan X Y XY X2 Y2 2 60 120 4 3600 4 65 260 16 4225 6 75 450 36 5625 8 80 640 64 6400 10 88 880 100 7744 12 95 1140 144 9025 P 42 463 3490 364 36619 18 / 36
  • 19.
    Langkah 2: HitungKorelasi Pearson r = n P XY − ( P X)( P Y ) p [n P X2 − ( P X)2][n P Y 2 − ( P Y )2] r = 6(3490) − 42 · 463 p (6 · 364 − 422)(6 · 36619 − 4632) r = 20940 − 19446 p (2184 − 1764)(219714 − 214369) r = 1494 √ 420 · 5345 ≈ 1494 1498.3 ≈ 0.9971 19 / 36
  • 20.
    Langkah 3: HitungKoefisien Determinasi R2 = r2 = (0.9971)2 ≈ 0.9942 • Artinya: 99.42% variasi nilai ujian dapat dijelaskan oleh jumlah jam belajar. • Sisanya 0.58% dijelaskan oleh faktor lain (konsentrasi, metode belajar, dsb). 20 / 36
  • 21.
    Kesimpulan • Korelasi r≈ 0.9971 menunjukkan hubungan sangat kuat dan positif. • Koefisien determinasi R2 ≈ 0.9942 berarti hampir seluruh variasi nilai ujian dapat dijelaskan oleh jam belajar. • Model regresi sederhana sangat baik dalam menjelaskan hubungan dua variabel ini. 21 / 36
  • 22.
    Pengertian Korelasi Parsial •Korelasi parsial mengukur hubungan linier antara dua variabel (X dan Y ), dengan menghilangkan pengaruh variabel ketiga (Z). • Digunakan saat ingin mengetahui apakah hubungan antara X dan Y tetap signifikan setelah mengendalikan pengaruh Z. 22 / 36
  • 23.
    Rumus Korelasi Parsial(3 Variabel) rXY ·Z = rXY − rXZ rYZ q (1 − r2 XZ )(1 − r2 YZ ) Keterangan: • rXY = korelasi antara X dan Y • rXZ = korelasi antara X dan Z • rYZ = korelasi antara Y dan Z 23 / 36
  • 24.
    Contoh Soal Diketahui: • rXY= 0.8 • rXZ = 0.6 • rYZ = 0.7 Hitung korelasi parsial antara X dan Y setelah mengontrol Z: rXY ·Z 24 / 36
  • 25.
    Pembahasan Gunakan rumus: rXY ·Z= 0.8 − (0.6)(0.7) p (1 − 0.62)(1 − 0.72) = 0.8 − 0.42 p (1 − 0.36)(1 − 0.49) = 0.38 p (0.64)(0.51) = 0.38 √ 0.3264 ≈ 0.38 0.5713 rXY ·Z ≈ 0.6647 25 / 36
  • 26.
    Interpretasi Hasil • NilairXY ·Z ≈ 0.665 • Artinya, setelah mengendalikan pengaruh Z, hubungan X dan Y tetap kuat. • Korelasi asli rXY = 0.8, tetapi sebagian pengaruh tersebut disebabkan oleh variabel Z. 26 / 36
  • 27.
    Koefisien Korelasi Parsial •Mengukur kekuatan hubungan linier antara dua variabel (misalnya Y dan X1) setelah menghilangkan pengaruh variabel lain (X2, X3, . . .). • Dilambangkan sebagai: rYX1·X2,...,Xk • Nilai antara -1 sampai 1 (tanpa satuan). 27 / 36
  • 28.
    Koefisien Regresi Parsial •Koefisien regresi β1 dalam model regresi ganda: Y = β0 + β1X1 + β2X2 + · · · + ε • Menyatakan perubahan rata-rata Y saat X1 naik satu unit, dengan variabel lain tetap konstan. • Memiliki satuan sesuai dengan variabel. 28 / 36
  • 29.
    Persamaan Tujuan, PendekatanBerbeda • Keduanya digunakan untuk mengetahui pengaruh suatu variabel terhadap variabel lain dengan mengendalikan variabel ketiga. • Korelasi parsial → ukuran kekuatan hubungan. • Regresi parsial → ukuran besarnya pengaruh numerik. 29 / 36
  • 30.
    Perbandingan Regresi danKorelasi Parsial Aspek Regresi Parsial vs Korelasi Parsial Tujuan Ukur pengaruh X terhadap Y setelah kontrol Satuan Regresi: tergantung satuan variabel Korelasi: tanpa satuan, -1 s.d. 1 Pendekatan Regresi: perubahan rata-rata Y Korelasi: kekuatan hubungan Y-X Output β1 vs rYX1·X2 30 / 36
  • 31.
    Keterkaitan Matematis Dalam kasusregresi linear ganda: β1 = rYX1·X2 · sY sX1·X2 • rYX1·X2 : korelasi parsial antara Y dan X1 setelah kontrol X2 • sY : standar deviasi Y • sX1·X2 : standar deviasi residual dari X1 31 / 36
  • 32.
    Contoh Soal Diketahui: • rY,X1 = 0.85 • rY ,X2 = 0.70 • rX1,X2 = 0.60 • Standar deviasi: sY = 10, sX1·X2 = 5 Tugas: 1. Hitung korelasi parsial rYX1·X2 2. Hitung koefisien regresi parsial β1 32 / 36
  • 33.
    Langkah 1: KorelasiParsial Gunakan rumus: rYX1·X2 = rYX1 − rYX2 · rX1X2 q (1 − r2 YX2 )(1 − r2 X1X2 ) = 0.85 − (0.70)(0.60) p (1 − 0.702)(1 − 0.602) = 0.43 √ 0.51 · 0.64 = 0.43 √ 0.3264 rYX1·X2 ≈ 0.43 0.5713 ≈ 0.7524 33 / 36
  • 34.
    Langkah 2: RegresiParsial Gunakan hubungan: β1 = rYX1·X2 · sY sX1·X2 = 0.7524 · 10 5 = 0.7524 · 2 = 1.5048 Hasil: β1 ≈ 1.50 34 / 36
  • 35.
    Interpretasi • rYX1·X2 ≈0.75 menunjukkan hubungan positif yang kuat antara Y dan X1 setelah efek X2 dikendalikan. • β1 ≈ 1.50: setiap kenaikan 1 unit pada X1 menyebabkan kenaikan rata-rata sebesar 1.50 unit pada Y , jika X2 tetap konstan. 35 / 36
  • 36.