Regression,
Classification and
Data Time Series
Universitas Sriwijaya
Regression
Universitas Sriwijaya
Apa itu Regresi?
Regresi merupakan metode statistik yang digunakan untuk
memodelkan hubungan antara satu variabel dengan
variabel lainnya.
Tujuan Regresi?
Memprediksi atau memahami hubungan antar variabel
Jenis jenis Regresi
1. Simple Linear Regression
2. Multiple Linear Regression
Jenis Model Regresi
1. Regresi Linear
Regresi Linear merupakan jenis dalam regresi yang akan
memodelkan hubungan linear antara variabel independen
(prediktor) dengan variabel dependen (respon), hasilnya ialah
untuk mencari garis lurus (linear) yang terbaik menggambarkan
hubungan antara variabel independen dan variabel dependen.
Jenis Model Regresi
2. Regresi Polinomial
Regresi Polinomial merupakan jenis regresi yang mana hubungan
antara variabel independen dan dependen dimodelkan sebagai
fungsi polinomial. Jenis ini memungkinakn kita untuk menangkap
hubungan yang lebih kompleks dan tidak linear antara variabel
independen dan dependen.
Jenis Model Regresi
3. Regresi Logistik
Regresi Logsitik merupakan regresi yang digunakan untuk
memodelkan hubungan antara variabel independen dengan variabel
dependen biner.
Peengolahan data
● Eksploratory Data Analysis :
○ Statistic Desckriptif
○ Eksplorasi Data
● Preprocessing Data :
○ Cek missing value dan duplikat dari data data yang akan kita
proses.
○ Memilih variabel yang akan di proses(feature selection).
○ Feature Scaling, dengan cara normalisasi/standarisasi variabel
independen.
○ Feature engineering, membuat fitur baru berdasarkan fitur-fitur
yang ada.
○ Feature encoding, merubah nilai categorical menjadi numerik.
Pemodelan Dan Evaluasi
1. Pembagian Data, yang mana akan dilatih seberapa banyak data
train dan data test
2. Pembuatan Model, data data akan dibuat menjadi model.
3. Evaluasi, yang mana model yang telah tercipta akan dievaluasi
agar dapat diketahui akurasi dari model yang telah tercipta.
Contohnya gimana?
CODE
Classification
Universitas Sriwijaya
Apa Itu Classification
Classification merupakan sebuah teknik ML yang
digunakan untuk memprediksi label atau kategori
suatu data berdasarkan input variabel.
Tujuan Classification
Mengetahui klasifikasi atau label dari data
Jenis Jenis Klasifikasi
1. Klasifikasi Binary(label terdiri dari biner)
2. Klasifikasi MultiClass(Label terdiri dari lebih 2 label)
Peengolahan data
● Eksploratory Data Analysis :
○ Statistic Desckriptif
○ Eksplorasi Data
● Preprocessing Data :
○ Cek missing value dan duplikat dari data data yang akan kita
proses.
○ Memilih variabel yang akan di proses(feature selection).
○ Feature Scaling, dengan cara normalisasi/standarisasi variabel
independen.
○ Feature engineering, membuat fitur baru berdasarkan fitur-fitur
yang ada.
○ Feature encoding, merubah nilai categorical menjadi numerik.
Pemodelan Dan Evaluasi
1. Pembagian Data, yang mana akan dilatih seberapa banyak data
train dan data test
2. Pembuatan Model, data data akan dibuat menjadi model.
3. Evaluasi, yang mana model yang telah tercipta akan dievaluasi
agar dapat diketahui akurasi dari model yang telah tercipta.
Data Time Series
Universitas Sriwijaya
Apa itu Data Time Series?
Data Time Series merupakan data yang diambil atau diukur
dalam interval waktu tertentu.
Tujuan penggunaan data time series secara umum adalah
untuk menganalisis data-data di masa lalu untuk meramalkan
kondisi di masa depan.
Jenis Jenis Data Time Series?
1. Trend (Kecenderungan):
Penjualan harian sebuah produk selama beberapa tahun.
Pertumbuhan populasi kota setiap tahun.
Harga saham perusahaan dalam beberapa bulan terakhir.
1. Seasonality (Musiman):
Penjualan toko ritel yang meningkat menjelang liburan seperti Natal.
Tingkat kunjungan wisatawan ke destinasi tertentu selama musim panas.
Produksi pertanian yang bervariasi tergantung pada musim.
1. Cyclic Patterns (Siklikal):
Siklus bisnis yang naik-turun dalam jangka waktu beberapa tahun.
Siklus ekonomi seperti resesi dan pemulihan.
Siklus pasar real estate yang berulang.
1. Irregularity (Tidak Teratur):
Gangguan acak seperti bencana alam yang mempengaruhi penjualan.
Event marketing yang tidak terduga yang mempengaruhi pola pembelian.
Perubahan aturan atau kebijakan yang mempengaruhi perilaku konsumen.

Linear Regression, Classification and Data Time Series - Day 2 Study Jams GDSC Unsri.pptx

  • 1.
    Regression, Classification and Data TimeSeries Universitas Sriwijaya
  • 2.
  • 3.
    Apa itu Regresi? Regresimerupakan metode statistik yang digunakan untuk memodelkan hubungan antara satu variabel dengan variabel lainnya. Tujuan Regresi? Memprediksi atau memahami hubungan antar variabel
  • 4.
    Jenis jenis Regresi 1.Simple Linear Regression 2. Multiple Linear Regression
  • 5.
    Jenis Model Regresi 1.Regresi Linear Regresi Linear merupakan jenis dalam regresi yang akan memodelkan hubungan linear antara variabel independen (prediktor) dengan variabel dependen (respon), hasilnya ialah untuk mencari garis lurus (linear) yang terbaik menggambarkan hubungan antara variabel independen dan variabel dependen.
  • 6.
    Jenis Model Regresi 2.Regresi Polinomial Regresi Polinomial merupakan jenis regresi yang mana hubungan antara variabel independen dan dependen dimodelkan sebagai fungsi polinomial. Jenis ini memungkinakn kita untuk menangkap hubungan yang lebih kompleks dan tidak linear antara variabel independen dan dependen.
  • 7.
    Jenis Model Regresi 3.Regresi Logistik Regresi Logsitik merupakan regresi yang digunakan untuk memodelkan hubungan antara variabel independen dengan variabel dependen biner.
  • 8.
    Peengolahan data ● EksploratoryData Analysis : ○ Statistic Desckriptif ○ Eksplorasi Data ● Preprocessing Data : ○ Cek missing value dan duplikat dari data data yang akan kita proses. ○ Memilih variabel yang akan di proses(feature selection). ○ Feature Scaling, dengan cara normalisasi/standarisasi variabel independen. ○ Feature engineering, membuat fitur baru berdasarkan fitur-fitur yang ada. ○ Feature encoding, merubah nilai categorical menjadi numerik.
  • 9.
    Pemodelan Dan Evaluasi 1.Pembagian Data, yang mana akan dilatih seberapa banyak data train dan data test 2. Pembuatan Model, data data akan dibuat menjadi model. 3. Evaluasi, yang mana model yang telah tercipta akan dievaluasi agar dapat diketahui akurasi dari model yang telah tercipta.
  • 10.
  • 11.
  • 12.
    Apa Itu Classification Classificationmerupakan sebuah teknik ML yang digunakan untuk memprediksi label atau kategori suatu data berdasarkan input variabel. Tujuan Classification Mengetahui klasifikasi atau label dari data
  • 13.
    Jenis Jenis Klasifikasi 1.Klasifikasi Binary(label terdiri dari biner) 2. Klasifikasi MultiClass(Label terdiri dari lebih 2 label)
  • 14.
    Peengolahan data ● EksploratoryData Analysis : ○ Statistic Desckriptif ○ Eksplorasi Data ● Preprocessing Data : ○ Cek missing value dan duplikat dari data data yang akan kita proses. ○ Memilih variabel yang akan di proses(feature selection). ○ Feature Scaling, dengan cara normalisasi/standarisasi variabel independen. ○ Feature engineering, membuat fitur baru berdasarkan fitur-fitur yang ada. ○ Feature encoding, merubah nilai categorical menjadi numerik.
  • 15.
    Pemodelan Dan Evaluasi 1.Pembagian Data, yang mana akan dilatih seberapa banyak data train dan data test 2. Pembuatan Model, data data akan dibuat menjadi model. 3. Evaluasi, yang mana model yang telah tercipta akan dievaluasi agar dapat diketahui akurasi dari model yang telah tercipta.
  • 16.
  • 17.
    Apa itu DataTime Series? Data Time Series merupakan data yang diambil atau diukur dalam interval waktu tertentu. Tujuan penggunaan data time series secara umum adalah untuk menganalisis data-data di masa lalu untuk meramalkan kondisi di masa depan.
  • 18.
    Jenis Jenis DataTime Series? 1. Trend (Kecenderungan): Penjualan harian sebuah produk selama beberapa tahun. Pertumbuhan populasi kota setiap tahun. Harga saham perusahaan dalam beberapa bulan terakhir. 1. Seasonality (Musiman): Penjualan toko ritel yang meningkat menjelang liburan seperti Natal. Tingkat kunjungan wisatawan ke destinasi tertentu selama musim panas. Produksi pertanian yang bervariasi tergantung pada musim. 1. Cyclic Patterns (Siklikal): Siklus bisnis yang naik-turun dalam jangka waktu beberapa tahun. Siklus ekonomi seperti resesi dan pemulihan. Siklus pasar real estate yang berulang. 1. Irregularity (Tidak Teratur): Gangguan acak seperti bencana alam yang mempengaruhi penjualan. Event marketing yang tidak terduga yang mempengaruhi pola pembelian. Perubahan aturan atau kebijakan yang mempengaruhi perilaku konsumen.