Deteksi Influence

1,216 views

Published on

Published in: Education, Technology, Spiritual
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,216
On SlideShare
0
From Embeds
0
Number of Embeds
16
Actions
Shares
0
Downloads
46
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Deteksi Influence

  1. 1. Deteksi Influence Analisis Eksplorasi Data ST1312
  2. 2. Outlier <ul><li>(Sekelompok) Data yang terpisah/terpencil dari kumpulannya </li></ul><ul><li>Mengapa penting ? </li></ul><ul><li>Jika berpengaruh thd model  model tidak merepresentasikan data dengan tepat </li></ul><ul><li>Mengapa sesuatu yang sedikit bisa mempengaruhi kesimpulan ? </li></ul><ul><li>Dunia dibentuk oleh para outlier : Diktator sangat kejam, penemuan ilmuwan sangat pintar, miss world sangat cantik, koruptor paling rakus, permainan harga oleh pedagang sangat kaya, kebijakan satu orang sangat berkuasa terhadap rakyatnya </li></ul>
  3. 3. Outlier tak berpengaruh Marlboro
  4. 4. Outlier berpengaruh kasus data time series Dugaan : beda satuan = kasus Mars Kasus ‘Telkom’ USA
  5. 5. Outlier berpengaruh kasus clustering <ul><li>Outlier : </li></ul><ul><li>Tidak berpengaruh </li></ul><ul><li>Berpengaruh  Influence </li></ul>
  6. 6. Regresi dengan/tanpa outlier <ul><li>The regression equation is Sale = 5.02 + 20.5 Adv </li></ul><ul><li>Predictor Coef SE Coef T P </li></ul><ul><li>Constant 5.019 0.710 7.07 0.000 </li></ul><ul><li>Adv 20.505 1.025 20.00 0.000 </li></ul><ul><li>S = 0.9807 R-Sq = 97.6% R-Sq(adj) = 97.3% </li></ul><ul><li>Tanpa Marlboro </li></ul><ul><li>The regression equation is Sale = 5.03 + 20.5 Adv </li></ul><ul><li>Predictor Coef SE Coef T P </li></ul><ul><li>Constant 5.035 1.857 2.71 0.024 </li></ul><ul><li>Adv2 20.476 3.291 6.22 0.000 </li></ul><ul><li>S = 1.034 R-Sq = 81.1% R-Sq(adj) = 79.0% </li></ul>
  7. 7. Beberapa alat pendeteksi influence <ul><li>Leverage (h i =v ii =r ii ) </li></ul><ul><ul><li>Alat pendeteksi pencilan pada variabel prediktor (X) (tanpa dihubungkan respon) </li></ul></ul><ul><ul><li>Leverage observasi ke-i (h i ) adalah elemen diagonal ke-i. Leverage observasi ke-i h i > 3p/n disebut Unusual observation / observasi yang jauh dari “seharusnya”. </li></ul></ul><ul><ul><li>p= banyak parameter termasuk  0 </li></ul></ul><ul><ul><li>n= banyak observasi </li></ul></ul>
  8. 8. Beberapa alat pendeteksi influence <ul><li>2. Cook’s Distance </li></ul><ul><ul><li>Alat pendeteksi pencilan yang mengkombinasi leverage dan Studentized Residual untuk mengukur seberapa jauh kombinasi X,Y menyimpang dari “seharusnya” </li></ul></ul><ul><ul><li>Cook’s Distance(i) mengukur jarak antar koefisien jika observasi ke-i dimasukkan dan tidak pada model. </li></ul></ul>> F .5,p,0-p
  9. 9. Beberapa alat pendeteksi influence <ul><li>3. DFFIT </li></ul><ul><ul><li>Alat pendeteksi pencilan berdasarkan perbedaan nilai Y-hat dengan dan tanpa pengamatan ke-i </li></ul></ul>
  10. 10. Beberapa alat pendeteksi influence <ul><li>4. DFBetas </li></ul><ul><ul><li>Alat pendeteksi pencilan berdasarkan perbedaan nilai koefisien regresi dengan dan tanpa pengamatan ke-i </li></ul></ul>
  11. 11. Beberapa alat pendeteksi influence <ul><li>5. CovRatio </li></ul><ul><ul><li>Rasio determinan matriks koefisien regresi dengan dan tanpa pengamatan ke-i </li></ul></ul>
  12. 12. Tips mengatasi Influence <ul><li>Apa penyebabnya ? </li></ul><ul><li>Salah ukur, salah entry, kejadian luar biasa  Cari tahu sebabnya </li></ul><ul><li>Solusi ? </li></ul><ul><li>Modelkan tersendiri </li></ul><ul><ul><li>Dummy variable (Regr, Time Series), </li></ul></ul><ul><ul><li>Model Intervensi (Time Series) </li></ul></ul><ul><li>Anggap Missing Value (Time Series, Regr, ANOVA dsb) </li></ul>
  13. 13. Contoh <ul><li>SPSS  Data world95 </li></ul><ul><li>Minitab  Exh_regr </li></ul>
  14. 14. SPSS
  15. 15. Data>Select Cases… <ul><li>Data tertentu </li></ul>
  16. 16. Analyze>Regression>Linear… <ul><li>syntax </li></ul>respon prediktor Deteksi influence
  17. 17. Klik save
  18. 18. Minitab File>open worksheet…>exh_regr
  19. 19. Stat>regression>regression

×