Slaid ini merupakan pembaharuan yang major di mana terdapat kesalahan input data dalam seksyen dua, yakni kehilangan beberapa buah data penting.
Kesilapan ini telah menyebabkan analisis regresi di bahagian soalan dua salah secara total.
Oleh hal yang demikian, slaid ini telah membaiki kekurangan tersebut dan yakin bahawa hasil dan jalan kerja di seksyen lain tidak terganggu akibat kesalahan di seksyen dua.
Mana-mana pelajar yang menggunakan slaid ini sebagai rujukan perlu berhati-hati sebelum memuat data anda ke dalam analisis regresi.
Module 9 : Asas Sains Data dalam Pengangkutan (Revised Edition)
1. Tugasan 9: Pisah Ragaman
Muhammad Norsyafiq Bin Zaidi (A154445)
.-=Revised Edition=-.
2. Pengenalan: Revised Edition
• Slaid ini merupakan pembaharuan yang major di mana terdapat kesalahan input data
dalam seksyen dua, yakni kehilangan beberapa buah data penting.
• Kesilapan ini telah menyebabkan analisis regresi di bahagian soalan dua salah secara
total.
• Oleh hal yang demikian, slaid ini telah membaiki kekurangan tersebut dan yakin
bahawa hasil dan jalan kerja di seksyen lain tidak terganggu akibat kesalahan di
seksyen dua.
• Mana-mana pelajar yang menggunakan slaid ini sebagai rujukan perlu
berhati-hati sebelum memuat data anda ke dalam analisis regresi.
Revised Edition juga mempunyai tips untuk melakukan formula set di dalam Excel.
3. Pengenalan
• Tugasan 9 ini mempunyai dua tugasan dan setiap tugasan mempunyai
seksyen tersendiri.
• Oleh yang demikian, tugasan 9 (1) akan dibuat dalam seksyen 1 dan tugasan 9
(2) akan dilaksanakan dalam bahagian seksyen 2.
• Setiap jalan kerja menggunakan Excel dan pendeskripsian dibuat dalam
PowerPoint.
• Maka, hasil kerja Excel akan dipindahkan ke sini dan diikuti dengan huraian
4. Seksyen A : Tugasan 9 (1)
Seorang Datuk Bandar hendak mengurangkan penggunaan kereta
dalam bandar. Kaedah yang digunakan ialah dengan menaikkan
kadar parkir kereta. Data yang diperolehi hasil soal selidik kepada
pengguna kereta beralih kepada pengangkutan awam adalah
seperti jadual di bawah:
(a) Tuliskan model fungsi logistik yang sesuai
(b) Plotkan graf bagi data di bawah
(c) Tukarkan data dalam bentuk ln (log e)
(d) Plotkan graf dan dapatkan persamaan garisan regresi.
(e) Masukkan angka-angka parameter fungsi logistik anda
(f) Dengan menggunakan model yang dibina, kirakan
kebarangkalian pengguna kereta beralih kepada
5. Tuliskan model fungsi logistik yang sesuai
• Untuk mendapatkan model fungsi
logistik yang sesuai, maka rumus
berkenaan digubah agar sesuai
dengan kehendak soalan.
• Maka, rumus berkenaan dibentuk
seperti sebelah:
• 𝑃 =
1
1+𝑒 α x 𝑘𝑎𝑑𝑎𝑟+𝐶
6. Plotkan graf bagi data di bawah
• Untuk memplotkan graf:
• Kadar parkir satu jam adalah x
• Kebarangkalian peralih kepada
pengangkutan awam adalah y
• Maka:
8. Tukarkan data dalam bentuk ln (log e)
• 𝑃 =
1
1+𝑒 α x 𝑘𝑎𝑑𝑎𝑟+𝐶
•
1 −P
P
= 𝑒 α x kadar + C
Untuk mencari
1 −P
P
, maka kita perlu
menukar rumus 𝑃 =
1
1+𝑒 α x 𝑘𝑎𝑑𝑎𝑟+𝐶
kepada
1 −P
P
= 𝑒 α x kadar + C
• Maka, hasilnya
1 −P
P
adalah seperti
berikut (sila lihat jadual di slaid
berikutnya)
9. Kadar Parkir satu jam Kebarangkalian peralih kepada pengangkutan awam (P)
1 − P
P
0.50 0.04 24
1.00 0.06 15.66667
1.50 0.10 9
2.00 0.17 4.882353
2.50 0.28 2.571429
3.00 0.39 1.564103
3.50 0.50 1
4.00 0.65 0.538462
4.50 0.75 0.333333
5.00 0.80 0.25
5.50 0.83 0.204819
6.00 0.86 0.162791
Untuk mendapatkan
1 −P
maka, kita perlu 1 - Kebarangkalian peralih kepada pengangkutan awam / Kebarangkalian peralih kepada pengangkutan awam
10. Tukarkan data dalam bentuk ln (log e)
• Setelah kita dapat senarai penuh
1 −P
P
itu, maka
barulah kita dapat mencari nilai bagi In (Log e)
• Maka, untuk mencari In (Log e), maka kita perlu
masukkan rumus berkenaan dalam kalkulator
saintifik.
• Tekan “In” pada kalkulator dan buka kurungan
untuk isi nilai
1 −P
P
dan tutup semula kurungan.
• Contoh : In (24) dan tekan “Jumlah”
• Dalam Excel, kita boleh permudahkan kaedah
mengira dengan menggunakan formula set.
• Tekan simbol “=“, kemudian, tekan huruf LN dan
tekan tanda buka kurungan dan isikan nilai
1 −P
P
dan tutup semula kurungan.
• Tekan Enter dan kita akan dapat hasil untuk In
(Log e)
• Kita juga boleh permudahkan kiraan dengan
menggunakan simbol dollar ($) untuk mengunci
formula bagi menetapkan nilai bagi setiap
horizontal
• Contohnya : =LN(24)
Maka, nilai bagi In (Log e) bagi jadual berikut adalah:
11. Kadar Parkir satu jam
Kebarangkalian peralih kepada pengangkutan
awam (P)
1 − P
P Ln(
1 −P
P
)
0.50 0.04 24 3.17805383
1.00 0.06 15.66667 2.751535313
1.50 0.10 9 2.197224577
2.00 0.17 4.882353 1.585627264
2.50 0.28 2.571429 0.944461609
3.00 0.39 1.564103 0.447312218
3.50 0.50 1 0
4.00 0.65 0.538462 -0.619039208
4.50 0.75 0.333333 -1.098612289
5.00 0.80 0.25 -1.386294361
5.50 0.83 0.204819 -1.585627264
6.00 0.86 0.162791 -1.815289967
12. Plotkan graf dan dapatkan persamaan garisan regresi.
• Untuk memplotkan graf, kita akan menggunakan
• Y= Ln(
1 −P
P
) dan
• X= Kadar Parkir satu jam
• Sila rujuk graf pada slaid berikutnya.
13. y = -0.9623x + 3.5107
R² = 0.9834
-3
-2
-1
0
1
2
3
4
0.00 1.00 2.00 3.00 4.00 5.00 6.00 7.00
ln((1-P)/P)
Kadar Parkir Satu Jam (RM)
14. Masukkan angka-angka parameter fungsi logistik
anda
• Kita ambil semula fungsi logistik
yang kita tinggalkan tadi,
• 𝑃 =
1
1+𝑒 α x 𝑘𝑎𝑑𝑎𝑟+𝐶
• Kemudian, kita isikan parameter
yang kita peroleh dari graf regresi
sebelumnya dan lengkapkan fungsi
di atas. Maka:
• α = −0.9623
• C = 3.5107 maka,:
• 𝑃 =
1
1+𝑒 (0.9623 x 𝑘𝑎𝑑𝑎𝑟)+3.5107
15. Dengan menggunakan model yang dibina, kirakan kebarangkalian
pengguna kereta beralih kepada pengangkutan awam
• 𝑃 =
1
1+𝑒 (0.9623 x 𝑘𝑎𝑑𝑎𝑟)+3.5107
17. Tips
• Untuk memudahkan para pengguna
Excel, masukkan data seperti
berikut:
• =1/((1+EXP(-0.9623*$kadar+3.5107)))
• Atau =1/((1+EXP(-0.9623*$0.5+3.5107)))
• Anda juga boleh buat salinan bagi
tiap-tiap kadar tanpa mengubah
kadar tambang.
P/s: Pastikan simbol dollar ($) diletakkan
18. Seksyen A : Tugasan 9 (2)
• 2. Dalam usaha untuk mengurangkan penggunaan
kereta, masa perjalanan menaiki bas hendak
dikurangkan dengan membina satu laluan khas bas
dan dalam masa yang sama tambang bas pun juga
akan dikurangkan. Data dari hasil soal selidik ke
atas pengguna kereta beralih kepada bas adalah
seperti jadual di bawah
• (a) Tuliskan fungsi logistik yang sesuai
• (b) Tukarkan dalam bentuk ln (log e)
• (c) Lakukan analisis regresi
• (d) Tuliskan model logistik dengan parameter dari
analisis regresi
20. Tuliskan dalam bentuk In (Log e)
𝑃 =
1
1 + 𝑒 α tambang +ß jimat masa + 𝐶
1 −P
P
= 𝑒 α tambang +ß jimat masa +𝐶
Untuk mendapatkan In (Log e), kita pertama sekali perlu mendapatkan 1-P/P
21. 1 − P
P
Berikut merupakan hasil daripada pengiraan Excel
untuk mendapatkan nilai bagi setiap (1 −P)/P
Tambang bas Jimat masa
Kebarangkalian
Pengguna kereta
beralih kepada
bas (1 −P)/P
2.9 0 0.1 9
2.9 5 0.14 6.142857
2.9 10 0.19 4.263158
2.9 15 0.25 3
2.9 20 0.32 2.125
2.9 25 0.4 1.5
2.9 30 0.48 1.083333
2 20 0.35 1.857143
2.25 20 0.34 1.941176
2.5 20 0.33 2.030303
2.75 20 0.32 2.125
3 20 0.31 2.225806
3.25 20 0.31 2.225806
3.5 20 0.3 2.333333
3.75 20 0.29 2.448276
22. (1-P)/P kepada bentuk In
(Log E)
Berikut merupakan jadual yang telah
ditukarkan kepada bentuk In (Log e)
Tambang bas Jimat masa
Kebarangkalian
Pengguna
kereta beralih
kepada bas (1 −P)/P In (Log e)
2.9 0 0.1 9 2.197225
2.9 5 0.14 6.142857 1.81529
2.9 10 0.19 4.263158 1.45001
2.9 15 0.25 3 1.098612
2.9 20 0.32 2.125 0.753772
2.9 25 0.4 1.5 0.405465
2.9 30 0.48 1.083333 0.080043
2 20 0.35 1.857143 0.619039
2.25 20 0.34 1.941176 0.663294
2.5 20 0.33 2.030303 0.708185
2.75 20 0.32 2.125 0.753772
3 20 0.31 2.225806 0.800119
3.25 20 0.31 2.225806 0.800119
3.5 20 0.3 2.333333 0.847298
3.75 20 0.29 2.448276 0.895384
Untuk mendapatkan nilai In (Log E), tekan =LN(masukkan nilai 1-P/P) dan tekan Enter
23. Analisis Regresi
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.999641
R Square 0.999281
Adjusted R
Square 0.999162
Standard Error 0.015489
Observations 15
ANOVA
df SS MS F Significance F
Regression 2 4.003782 2.001891 8344.664 1.38E-19
Residual 12 0.002879 0.00024
Total 14 4.006661
Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept 1.733472 0.029611 58.54148 4.08E-16 1.668955 1.797989 1.668955 1.797989
X Variable 1 0.15118 0.009556 15.82023 2.11E-09 0.130359 0.172001 0.130359 0.172001
X Variable 2 -0.07042 0.00055 -128.046 3.45E-20 -0.07162 -0.06922 -0.07162 -0.06922
Mengapa tiada graf? Analisis regresi tidak boleh dilakukan pada graf sekiranya ada lebih daripada satu pemboleh ubah
24. Makanya,
• α = 0.15118 , ß = -0.07042
• C = eksp(1.733472) = 5.660271
Maka,
• 𝑃 =
1
1+𝑒0.15118 tambang +(−0.070417106 ) jimat masa +5.660271
• Sila lihat sebelah untuk lihat jadual untuk P
Untuk mendapatkan C = E, maka gunakan Excel dengan menggunakan formula ini, =EXP(Intercept)