Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
No Downloads

Views

Total Views
952
On Slideshare
0
From Embeds
0
Number of Embeds
1

Actions

Shares
Downloads
45
Comments
0
Likes
2

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. Deteksi Influence Analisis Eksplorasi Data ST1312
  • 2. Outlier
    • (Sekelompok) Data yang terpisah/terpencil dari kumpulannya
    • Mengapa penting ?
    • Jika berpengaruh thd model  model tidak merepresentasikan data dengan tepat
    • Mengapa sesuatu yang sedikit bisa mempengaruhi kesimpulan ?
    • Dunia dibentuk oleh para outlier : Diktator sangat kejam, penemuan ilmuwan sangat pintar, miss world sangat cantik, koruptor paling rakus, permainan harga oleh pedagang sangat kaya, kebijakan satu orang sangat berkuasa terhadap rakyatnya
  • 3. Outlier tak berpengaruh Marlboro
  • 4. Outlier berpengaruh kasus data time series Dugaan : beda satuan = kasus Mars Kasus ‘Telkom’ USA
  • 5. Outlier berpengaruh kasus clustering
    • Outlier :
    • Tidak berpengaruh
    • Berpengaruh  Influence
  • 6. Regresi dengan/tanpa outlier
    • The regression equation is Sale = 5.02 + 20.5 Adv
    • Predictor Coef SE Coef T P
    • Constant 5.019 0.710 7.07 0.000
    • Adv 20.505 1.025 20.00 0.000
    • S = 0.9807 R-Sq = 97.6% R-Sq(adj) = 97.3%
    • Tanpa Marlboro
    • The regression equation is Sale = 5.03 + 20.5 Adv
    • Predictor Coef SE Coef T P
    • Constant 5.035 1.857 2.71 0.024
    • Adv2 20.476 3.291 6.22 0.000
    • S = 1.034 R-Sq = 81.1% R-Sq(adj) = 79.0%
  • 7. Beberapa alat pendeteksi influence
    • Leverage (h i =v ii =r ii )
      • Alat pendeteksi pencilan pada variabel prediktor (X) (tanpa dihubungkan respon)
      • Leverage observasi ke-i (h i ) adalah elemen diagonal ke-i. Leverage observasi ke-i h i > 3p/n disebut Unusual observation / observasi yang jauh dari “seharusnya”.
      • p= banyak parameter termasuk  0
      • n= banyak observasi
  • 8. Beberapa alat pendeteksi influence
    • 2. Cook’s Distance
      • Alat pendeteksi pencilan yang mengkombinasi leverage dan Studentized Residual untuk mengukur seberapa jauh kombinasi X,Y menyimpang dari “seharusnya”
      • Cook’s Distance(i) mengukur jarak antar koefisien jika observasi ke-i dimasukkan dan tidak pada model.
    > F .5,p,0-p
  • 9. Beberapa alat pendeteksi influence
    • 3. DFFIT
      • Alat pendeteksi pencilan berdasarkan perbedaan nilai Y-hat dengan dan tanpa pengamatan ke-i
  • 10. Beberapa alat pendeteksi influence
    • 4. DFBetas
      • Alat pendeteksi pencilan berdasarkan perbedaan nilai koefisien regresi dengan dan tanpa pengamatan ke-i
  • 11. Beberapa alat pendeteksi influence
    • 5. CovRatio
      • Rasio determinan matriks koefisien regresi dengan dan tanpa pengamatan ke-i
  • 12. Tips mengatasi Influence
    • Apa penyebabnya ?
    • Salah ukur, salah entry, kejadian luar biasa  Cari tahu sebabnya
    • Solusi ?
    • Modelkan tersendiri
      • Dummy variable (Regr, Time Series),
      • Model Intervensi (Time Series)
    • Anggap Missing Value (Time Series, Regr, ANOVA dsb)
  • 13. Contoh
    • SPSS  Data world95
    • Minitab  Exh_regr
  • 14. SPSS
  • 15. Data>Select Cases…
    • Data tertentu
  • 16. Analyze>Regression>Linear…
    • syntax
    respon prediktor Deteksi influence
  • 17. Klik save
  • 18. Minitab File>open worksheet…>exh_regr
  • 19. Stat>regression>regression
  • 20.