A.   PendahuluanDalam kehidupan sehari-hari tanpa disadari sebenarnya kita sering membuat suatu kegiatan evaluasidan selal...
Dari hal ini kita dapat mengetahui bahwa dalam proses penilaian kita menggunakan 3 ukuran, yakniukuran baku (meter, kilogr...
D.   Penilaian Dalam PendidikanPenilaian (assessment) adalah penerapan berbagai cara dan penggunaan beragam alat penilaian...
Berdasarkan pengertian di atas dapat kita simpulkan bahwa penilaian adalah suatu proses untukmengambil keputusan dengan me...
kemampuan siswa yang sulit diukur secara kuantitatif dan mencakup objektifitas misalnya aspekefektif psikomotor.Jenis-jeni...
Tertutup, kuesioner yang alternative jawaban sudah ditentukan terlebih dahulu. Responden     hanya memilih diantara altern...
(2). Merumuskan kegiatan(3). Menyusun langkah-langkah(4). Menyusun kisi-kisi(5). Menyusun panduan angket(6). Menyusun alat...
Contoh observasi sistematis misalnya guru yang sedang mengamati anak-anak menanam bunga.Disini sebelum guru melaksanakan o...
PENGERTIAN TES, JENIS-JENIS TES,16   DECDAN KRITERIA SUATU INSTRUMEN TES YANG BAIKPenilaian pendidikan bukanlah semata-mat...
b.    Tes Lisan ( oral test)Tes lisan dilakukan dengan pembicaraan atau wawancara tatap muka antara guru dan murid.c.    T...
Peserta didik dapat mengetahui bagian dari bahan yang mana yang belum dikuasainya.     b.     Tes Summatif     Tes sumatif...
a) Menentukan tujuan, tujuan pembelajaran yang baik hendaklah berorientasi kepada pesertadidik, bersifat menguraikan hasil...
Macam-macam validitas     1). Validitas isi (content validity)     Validitas isi sering juga disebut validitas logis atau ...
Validitas instrument dapat diketahui dengan mencari korelasi hasil instrument dengan dengan    kriterium atau melakukan an...
Untuk individu yang benar diberi angka 1, sedangkan yang salah diberi angka nol.    2.    Jumlahkan skor total untuk tiap ...
2)      Metode UlanganPelaksanaannya dilakukan dua kali kepada sejumlah subjek yang sama, dalam waktu yang berbeda.Reliabi...
3. Analisis soal tesUntuk mendapatkan kualitas soal yang baik, maka dilakukan langkah-langkah sebagai berikut:1)   Daya pe...
Ik = indeks kesukaranDt = jumlah skor dari kelompok tinggiDr = jumlah skor dari kelompok rendahm = skor setiap soal jika b...
Upcoming SlideShare
Loading in …5
×

Vivi tgs evaluasi pembelajaran smsstr 5

3,181 views
3,070 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
3,181
On SlideShare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
49
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Vivi tgs evaluasi pembelajaran smsstr 5

  1. 1. A. PendahuluanDalam kehidupan sehari-hari tanpa disadari sebenarnya kita sering membuat suatu kegiatan evaluasidan selalu menggunakan prinsip mengukur dan menilai. Namun, banyak orang belum memahami secaratepat arti kata evaluasi, pengukuran, dan penilaian bahkan masih banyak orang yang lebih cenderungmengartikan ketiga kata tersebut dengan suatu pengertian yang sama.Secara umum orang hanya mengidentikkan kegiatan evaluasi sama dengan menilai, karena aktifitasmengukur biasanya sudah termasuk didalamnya. Pengukuran, penilaian dan evaluasi merupakankegiatan yang bersifat hierarki. Artinya ketiga kegiatan tersebut tidak dapat dipisahkan satu sama laindan dalam pelaksanaannya harus dilaksanakan secara berurutan.B. Pengertian Pengukuran, Penilaian, dan EvaluasiUntuk memahami pengertian evaluasi, pengukuran dan penilaian kita dapat memahaminya lewat contohberikut :1. Apabila ada seseorang yang memberikan kepada kita 2 pensil yang berbeda ukuran ,yang satu panjang dan yang satu lebih pendek dan kita diminta untuk memilihnya, maka otomatis kita akan cenderung memilih pensil yang panjang karena akan bisa lebih lama digunakan. Kecuali memang ada kriteria lain sehingga kita memilih sebaliknya.2. Peristiwa menjual dan membeli di pasar. Kadang kala sebelum kita membeli durian di pasar, sering kali kita membandingkan terlebih dahulu durian yang ada sebelum membelinya. Biasanya kita akan mencium, melihat bentuknya, jenisnya ataupun tampak tangkai yang ada pada durian tersebut untuk mengetahui durian manakah yang baik dan layak dibeli.Dari kedua contoh diatas maka dapat kita simpulkan bahwa kita selalu melakukan penilaian sebelummenentukan pilihan untuk memilih suatu objek/benda. Pada contoh pertama kita akan memilih pensilyang lebih panjang dari pada pensil yang pendek karena pensil yang lebih panjang dapat kita gunakanlebih lama. Sedangkan pada contoh yang kedua kita akan menentukan durian mana yang akan kita beliberdasarkan bau, bentuk, jenis, ataupun tampak tangkai dari durian yang dijual tersebut. Sehingga kitadapat memperkirakan mana durian yang manis.Untuk mengadakan penilaian, kita harus melakukan pengukuran terlebih dahulu. Dalam contoh 1 diatas,jika kita mempunyai pengaris, maka untuk menentukan pensil mana yang lebih panjang maka kita akanmengukur kedua pensil tersebut dengan menggunakan pengaris kemudian kita akan melakukanpenilaian dengan membandingkan ukuran panjang dari masing-masing penggaris sehingga padaakhirnya kita dapat mengatakan bahwa “Yang ini panjang” dan “Yang ini pendek” lalu yang panjanglahyang kita ambil.Dalam contoh yang ke 2, kita memilih durian yang terbaik lewat bau, tampak tangkai, maupun jenisnya.Hal itu juga diawali dengan proses pengukuran dimana kita membanding-bandingkan beberapa durianyang ada sekalipun tidak menggunakan alat ukur yang paten tetapi berdasarkan pengalaman. Barulahkita melakukan penilaian mana durian yang terbaik berdasarkan ukuran yang kita tetapkan yang akandibeli.
  2. 2. Dari hal ini kita dapat mengetahui bahwa dalam proses penilaian kita menggunakan 3 ukuran, yakniukuran baku (meter, kilogram, takaran, dan sebagainya), ukuran tidak baku (depa, jengkal, langkah, dansebagainya) dan ukuran perkiraan yakni berdasarkan pengalaman.Langkah – langkah mengukur kemudian menilai sesuatu sebelum kita mengambilnya itulah yangdinamakan mengadakan evaluasi yakni mengukur dan menilai. Kita tidak dapat mengadakan evaluasisebelum melakukan aktivitas mengukur dan menilai.Berdasarkan contoh diatas dapat kita simpulkan pengertian pengukuran, penilaian, dan evaluasi sebagaiberikut : Pengukuran adalah kegiatan membandingkan sesuatu dengan ukuran tertentu dan bersifat kuantitatif. Penilaian adalah kegiatan mengambil keputusan untuk menentukan sesuatu berdasarkan kriteria baik buruk dan bersifat kualitatif. Sedangkan Evaluasi adalah kegiatan yang meliputi pengukuran dan penilaianC. Evaluasi dalam PendidikanSecara harafiah evaluasi berasal dari bahasa Inggris evaluation yang berarti penilaian atau penaksiran(John M. Echols dan Hasan Shadily: 1983). Menurut Stufflebeam, dkk (1971) mendefinisikan evaluasisebagai “The process of delineating, obtaining, and providing useful information for judging decisionalternatives”. Artinya evaluasi merupakan proses menggambarkan, memperoleh, dan menyajikaninformasi yang berguna untuk merumuskan suatu alternatif keputusan.Evaluasi menurut Kumano (2001) merupakan penilaian terhadap data yang dikumpulkan melalui kegiatanasesmen. Sementara itu menurut Calongesi (1995) evaluasi adalah suatu keputusan tentang nilaiberdasarkan hasil pengukuran. Sejalan dengan pengertian tersebut, Zainul dan Nasution (2001)menyatakan bahwa evaluasi dapat dinyatakan sebagai suatu proses pengambilan keputusan denganmenggunakan informasi yang diperoleh melalui pengukuran hasil belajar, baik yang menggunakaninstrumen tes maupun non tes.Secara garis besar dapat dikatakan bahwa evaluasi adalah pemberian nilai terhadap kualitas sesuatu.Selain dari itu, evaluasi juga dapat dipandang sebagai proses merencanakan, memperoleh, danmenyediakan informasi yang sangat diperlukan untuk membuat alternatif-alternatif keputusan. Dengandemikian, Evaluasi merupakan suatu proses yang sistematis untuk menentukan atau membuatkeputusan sampai sejauhmana tujuan-tujuan pengajaran telah dicapai oleh siswa (Purwanto, 2002).Arikunto (2003) mengungkapkan bahwa evaluasi adalah serangkaian kegiatan yang ditujukan untukmengukur keberhasilan program pendidikan. Tayibnapis (2000) dalam hal ini lebih meninjau pengertianevaluasi program dalam konteks tujuan yaitu sebagai proses menilai sampai sejauhmana tujuanpendidikan dapat dicapai.Berdasarkan tujuannya, terdapat pengertian evaluasi sumatif dan evaluasi formatif. Evaluasi formatifdinyatakan sebagai upaya untuk memperoleh feedback perbaikan program, sementara itu evaluasisumatif merupakan upaya menilai manfaat program dan mengambil keputusan (Lehman, 1990).
  3. 3. D. Penilaian Dalam PendidikanPenilaian (assessment) adalah penerapan berbagai cara dan penggunaan beragam alat penilaian untukmemperoleh informasi tentang sejauh mana hasil belajar peserta didik atau ketercapaian kompetensi(rangkaian kemampuan) peserta didik. Penilaian menjawab pertanyaan tentang sebaik apa hasil atauprestasi belajar seorang peserta didik.Hasil penilaian dapat berupa nilai kualitatif (pernyataan naratifdalam kata-kata) dan nilai kuantitatif (berupa angka). Pengukuran berhubungan dengan proses pencarianatau penentuan nilai kuantitatif tersebut.Penilaian hasil belajar pada dasarnya adalah mempermasalahkan, bagaimana pengajar (guru) dapatmengetahui hasil pembelajaran yang telah dilakukan. Pengajar harus mengetahui sejauh mana pebelajar(learner) telah mengerti bahan yang telah diajarkan atau sejauh mana tujuan/kompetensi dari kegiatanpembelajaran yang dikelola dapat dicapai. Tingkat pencapaian kompetensi atau tujuan instruksional darikegiatan pembelajaran yang telah dilaksanakan itu dapat dinyatakan dengan nilai.E. Pengukuran dalam pendidikanPengukuran adalah penentuan besaran, dimensi, atau kapasitas, biasanya terhadap suatu standaratau satuan pengukuran. Pengukuran tidak hanya terbatas pada kuantitas fisik, tetapi juga dapatdiperluas untuk mengukur hampir semua benda yang bisa dibayangkan, seperti tingkat ketidakpastian,atau kepercayaan konsumen.Pengukuran adalah proses pemberian angka-angka atau label kepada unit analisis untukmerepresentasikan atribut-atribut konsep. Proses ini seharusnya cukup dimengerti orang walau misalnyadefinisinya tidak dimengerti. Hal ini karena antara lain kita sering kali melakukan pengukuran.Menurut Cangelosi (1995) yang dimaksud dengan pengukuran (Measurement) adalah suatu prosespengumpulan data melalui pengamatan empiris untuk mengumpulkan informasi yang relevan dengantujuan yang telah ditentukan. Dalam hal ini guru menaksir prestasi siswa dengan membaca ataumengamati apa saja yang dilakukan siswa, mengamati kinerja mereka, mendengar apa yang merekakatakan, dan menggunakan indera mereka seperti melihat, mendengar, menyentuh, mencium, danmerasakan. Menurut Zainul dan Nasution (2001) pengukuran memiliki dua karakteristik utama yaitu: 1)penggunaan angka atau skala tertentu; 2) menurut suatu aturan atau formula tertentu.Measurement (pengukuran) merupakan proses yang mendeskripsikan performance siswa denganmenggunakan suatu skala kuantitatif (system angka) sedemikian rupa sehingga sifat kualitatif dariperformance siswa tersebut dinyatakan dengan angka-angka (Alwasilah et al.1996). Pernyataan tersebutdiperkuat dengan pendapat yang menyatakan bahwa pengukuran merupakan pemberian angka terhadapsuatu atribut atau karakter tertentu yang dimiliki oleh seseorang, atau suatu obyek tertentu yangmengacu pada aturan dan formulasi yang jelas. Aturan atau formulasi tersebut harus disepakati secaraumum oleh para ahli (Zainul & Nasution, 2001). Dengan demikian, pengukuran dalam bidang pendidikanberarti mengukur atribut atau karakteristik peserta didik tertentu. Dalam hal ini yang diukur bukan pesertadidik tersebut, akan tetapi karakteristik atau atributnya. Senada dengan pendapat tersebut, Secara lebihringkas, Arikunto dan Jabar (2004) menyatakan pengertian pengukuran (measurement) sebagai kegiatanmembandingkan suatu hal dengan satuan ukuran tertentu sehingga sifatnya menjadi kuantitatif.F. Perbedaan Evaluasi, Penilaian dan Pengukuran
  4. 4. Berdasarkan pengertian di atas dapat kita simpulkan bahwa penilaian adalah suatu proses untukmengambil keputusan dengan menggunakan informasi yang diperoleh melalui pengukuran hasil belajarbaik yang menggunakan tes maupun nontes. Pengukuran adalah membandingkan hasil tes denganstandar yang ditetapkan. Pengukuran bersifat kuantitatif. Sedangkan menilai adalah kegiatan mengukurdan mengadakan estimasi terhadap hasil pengukuran atau membanding-bandingkan dan tidak sampai ketaraf pengambilan keputusan.Penilaian bersifat kualitatif.Agar lebih jelas perbedaannya maka perlu dispesifikasi lagi untuk pengertian masing-masing : Evaluasi pembelajaran adalah suatu proses atau kegiatan untuk menentukan nilai, kriteria-judgment atau tindakan dalam pembelajaran. Penilaian dalam pembelajaran adalah suatu usaha untuk mendapatkan berbagai informasi secara berkala, berkesinambungan, dan menyeluruh tentang proses dan hasil dari pertumbuhan dan perkembangan yang telah dicapai oleh anak didik melalui program kegiatan belajar. Pengukuran atau measurement merupakan suatu proses atau kegiatan untuk menentukan kuantitas sesuatu yang bersifat numerik. Pengukuran lebih bersifat kuantitatif, bahkan merupakan instrumen untuk melakukan penilaian. Dalam dunia pendidikan, yang dimaksud pengukuran sebagaimana disampaikan Cangelosi (1995: 21) adalah proses pengumpulan data melalui pengamatan empiris. DAFTAR PUSTAKAAlwasilah, et al. (1996). Glossary of educational Assessment Term. Jakarta: Ministry of Education andCulture.Arikunto, S & Jabar. 2004. Evaluasi Program Pendidikan. Jakarta: Bumi AksaraCalongesi, J.S. 1995. Merancang Tes untuk Menilai Prestasi Siswa. Bandung : ITBKumano, Y. 2001. Authentic Assessment and Portfolio Assessment-Its Theory and Practice. Japan:Shizuoka University.Pengertian Non tesTeknik penilaian non tes berarti tehnik penilaian dengan tidak menggunakan tes. Tehnik penilaian iniumumnya untuk menilai kepribadian anak secara menyeluruh meliputi sikap, tingkah laku, sifat, sikapsosial, ucapan, riwayat hidup dan lain-lain. Yang berhubungan dengan kegiatan belajar dalampendidikan, baik secara individu maupun secara kelompok. Alat penilaian non-test, yang biasanyamenyertai atau inheren dalam pelaksanaan proses belajar mengajar sangat banyak macamnya. Diantaranya bisa disebutkan adalah angket (kuesioner), observasi, wawancara, sosiometri, checklist,concept map, portfolio, student journal, pertanyaan-pertanyaan, dan sebagainya. Keberhasilan siswadalam proses belajar-mengajar tidak dapat diukur dengan alat tes. Sebab masih banyak aspek-aspek
  5. 5. kemampuan siswa yang sulit diukur secara kuantitatif dan mencakup objektifitas misalnya aspekefektif psikomotor.Jenis-jenis Instrument Non TesBerikut ini adalah beberapa instrument yang tergolong ke dalam non tes yaitu:a. KuesionerKuesioner juga sering dikenal sebagai angket. Pada dasarnya, quesioner adalah sebuah daftarpertanyaan yang harus diisi oleh orang yang akan diukur (responden). Pada umumnya tujuanpenggunaan angket atau kuesioner dalam proses pembelajaran terutama adalah untuk memperolehdata mengenai latar belakang peserta didik sebagai salah satu bahan dalam menganalisis tingkah lakudan proses belajar mereka. Hal ini juga disampaikan oleh Yusuf (dalam Arniatiu, 2010) yangmenyatakan kuisioner adalah suatu rangkaian pertanyaan yang berhubungan dengan objek yangdinilai dengan maksud untuk mendapatkan data atau inform.Selain itu, data yang dihimpun melalui angket biasanya juga berupa data yang berkenaan dengankesulitan-kesulitan yang dihadapi oleh siswa dalam mengikuti pelajaran. Misalnya: cara belajar,bimbingan guru dan orang tua, sikap belajar dan lain sebagainya.Angket pada umumnya dipergunakan untuk menilai hasil belajar pada ranah afektif. Angket dapatdisajikan dalam bentuk pilihan ganda atau skala sikap. Tujuan Pengembangan Kuesionar (Angket)Adapun beberapa tujuan dari pengembangan angket adalah :(1). Mengumpulkan informasi sebanyak mungkin dari siswa tentang pembelajaran matematika.(2).Membimbing siswa untuk belajar efektif sampai tingkat penguasaan tertentu.(3). Mendorong siswa untuk lebih kreatif dalam belajar.(4). Membantu anak yang lemah dalam belajar.(5).Untuk mengetahui kesulitan – kesulitan siswa dalam pembelajaran matematika. Jenis-jenis kuesioner (menurut Yusuf , dalam Artiatiu, 2010)1. Kuesioner dari segi isi dapat dibedakan atas 4 bagian yaitu: Pertanyaan fakta adalah pertanyaan yang menanyakan tentang fakta antara lain seperti jumlah sekolah, jumlah jam belajar, dll. Pertanyaan perilaku adalah apabila guru menginginkan tingkah laku seseorang siswa dalam kegiatan di sekolah atau dalam proses belajar mengajar. Pertanyaan informasi adalah apabila melalui instrument itu guru ingin mengungkapkan berbagai informasi atau menggunakan fakta. Pertanyaan pendapat dan sikap adalah kuesioner yang berkaitan dengan perasaan, kepercayaan predisposisi, dan nilai-nilai yang berhubungan dengan objek yang dinilai.2. Kuesioner dari jenisnya dapat dibedakan atas 3 yaitu :
  6. 6. Tertutup, kuesioner yang alternative jawaban sudah ditentukan terlebih dahulu. Responden hanya memilih diantara alternative yang telah disediakan. Terbuka, kuesioner ini memberikan kesempatan pada siswa untuk mengemukakan pendapatnya tentang sesuatu yang ditanyakan sesuai dengan pandangan dan kemampuannya. Alternative jawaban tidak disediakan. Mereka menciptakan sendiri jawabannya dan menyusun kalimat dalam bahasa sendiri Tertutup dan terbuka, kuesioner ini merupakan gabungan dari kedua bentuk yang telah dibicarakan. Yang berarti bahwa dalam bentuk ini, disamping disediakan alternative, diberi juga kesempatan keoada siswa/mahasiswa untuk mengemukakan alternative jawabannya sendiri, apabila alternative yang disediakan tidak sesuai dengan keadaan yang bersangkutan.3. Kuesioner dari segi yang menjawab dapat dibedakan atas 2, yaitu : Kuesioner langsung, yaitu kuesioner yang langsung dijawab/diisi oleh individu yang akan diminta keterangannya. Kuesioner tidak langsung, yaitu kuesioner yang diisi oleh orang lain, (orang yang tidak diminta keterangannya).4. Kuesioner dari sisi bagaimana kuesioner itu diadministrasikan pada responden dapatdibedakan atas 2, yaitu : Kuesioner yang dikirimkan (Mail Questionaire) Kuesioner yang dapat dibagikan langsung pada responden. Kelebihan dan Kekurangan AngketAda beberapa hal yang menjadi kelebihan angket sebagai instrument evaluasi, diantaranya yaitu:(1). Dengan angket kita dapat memperoleh data dari sejumlah anak yang banyak yang hanyamembutuhkan waktu yang sigkat.(2). Setiap anak dapat memperoleh sejumlah pertanyaan yang sama(3). Dengan angket anak pengaruh subjektif dari guru dapat dihindarkanSedangkan kelemahan angket, antara lain:(1). Pertanyaan yang diberikan melalui angket adalah terbatas, sehingga apabila ada hal-hal yangkurang jelas maka sulit untuk diterangkan kembali(2). Kadang-kadang pertanyaan yang diberikan tidak dijawab oleh semua anak, atau mungkin dijawabtetapi tidak sesuai dengan kenyataan yang sebenarnya. Karena anak merasa bebas menjawab dantidak diawasi secara mendetail.(3). Ada kemungkinan angket yang diberikan tidak dapat dikumpulkan semua, sebab banyak anakyang merasa kurang perlu hasil dari angket yang diterima, sehingga tidak memberikan kembaliangketnya. Langkah-langkah Pengembangan AngketAdapun cara penyusunan atau pengembangan angket adalah sebagai berikut:(1). Merumuskan tujuan
  7. 7. (2). Merumuskan kegiatan(3). Menyusun langkah-langkah(4). Menyusun kisi-kisi(5). Menyusun panduan angket(6). Menyusun alat penilaianb. Pengamatan (observation)Pengamatan observasi adalah suatu tehnik yang dilakukan dengan cara mengadakan pengamatansecara teliti serta pencatatan secara sistematis terhadap fenomena-fenomena yang dijadikan objekpengamatanObservasi sebagai alat evaluasi banyak digunakan untuk menilai tingkahlaku individu atau prosesterjadinya suatu kegiatan yang dapat diamati. Observasi yang dapat menilai atau mengukur hasilbelajar adalah tingkah laku para siswa ketika guru sedang mengajar. Tujuan Pengembangan ObservasiSebagai alat evaluasi , observasi digunakan untuk:a) Menilai minat, sikap dan nilai yang terkandung dalam diri siswa.b) Melihat proses kegiatan yang dilakukan oleh siswa maupun kelompok.c) Suatu tes essay / obyektif tidak dapat menunjukan seberapa kemampuan siswa dapat menjelaskanpendapatnya secara lisan, dalam bekerja kelompok dan juga kemampuan siswa dalam mengumpulkandata. Jenis-jenis ObservasiObservasi atau pengamatan dapat dilakukan dalam berbagai cara. Berdasarkan cara dan tujuan,onservasi dapat dibedakan menjadi 3 yaitu:1) Observasi partisipatif dan nonpartisipatifObservasi partisipatif adalah yaitu observasi yang dilakuakan oleh pengamat diamna pengamat sendirimemasuki atau mengikuti kegiatan kelompok yang sedang diamati. Sedangkan observasinonpartisipatif, observasi tidak mengambil bagian dalam kegiatan yang dilakukan oleh objeknya. Atauevaluator berada “diluar garis” seolah-olah sebagai penonton belaka.Contoh observasi partisipatif : Misalnya guru mengamati setiap anak. Kalau observasi nonpartisipatif,guru hanya sebagai pengamat, dan tidak ikut bermain.2) Observasi sistematis dan observasi nonsitematisObservasi sistematis adalah observasi yang sebelum dilakukan, observer sudah mengatur srukturyang berisi kategori atau kriteria, masalah yang akan diamati Sedangkan observasi nonsistematisyaitu apabila dalam pengamatan tidak terdapat stuktur ketegori yang akan diamati.
  8. 8. Contoh observasi sistematis misalnya guru yang sedang mengamati anak-anak menanam bunga.Disini sebelum guru melaksanakan observasi sudah membuat kategori-kategori yang akan diamati,misalnya tentang: kerajinan, kesiapan, kedisiplinan, ketangkasan, kerjasama dan kebersihan.Kemudian ketegori-kategori itu dicocokkan dengan tingkah laku murid dalam menanam bunga. Kalauobservasi nonsistematis maka guru tidak membuat kategori-kategori diatas, tetapi langsungmengamati anak yang sedang menanam bunga.3) Observasi experimental, yaitu observasi yang dilakukan dalan situasi yang dibuat ataudirancang oleh observer. Kelebihan dan Kekurangan ObservasiObservasi sebagai alat penilain nontes, mempunyai beberapa kelebihan, antara lain:(1). Observasi dapat memperoleh data sebagai aspek tingkah laku anak.(2). Dalam observasi memungkinkan pencatatan yang serempak dengan terjadinya suatu gejalaatau kejadian yang penting(3). Observasi dapat dilakukan untuk melengkapi dan mencek data yang diperoleh dari teknik lain,misalnya wawancara atau angket.(4). Observer tidak perlu menggunakan bahasa untuk berkomunikasi dengan objek yang diamati,kalaupun menggunakan, maka hanya sebentar dan tidak langsung memegang peran.Sedangkan kelemahan dari observasi adalah:(1). Observer tiidak dapat mengungkapkan kehidupan pribadi seseorag yang sangat dirahasiakan.(2). Apabila si objek yang diobservasikan mengetahui kalau sedang diobservasi maka tidak mustahiltingkah lakunya dibuat-buat, agar observer merasa senang.(3). Observer banyak tergantung kepada faktor-faktor yang tidak dapat dapat dikontrol sebelumya. Langkah-langkah Pengembangan Observasi1. Merumuskan tujuan2. Merumuskan kegiatan3. Menyusun langkah-langkah4. Menyusun kisi-kisi5. Menyusun panduan observasi6. Menyusun alat penilaian
  9. 9. PENGERTIAN TES, JENIS-JENIS TES,16 DECDAN KRITERIA SUATU INSTRUMEN TES YANG BAIKPenilaian pendidikan bukanlah semata-mata penilaian hasil belajar, tetapi mencangkup aspek yanglebih luas yaitu input/komponen, proses, produk dan program pendidikan. Untuk dapat menilaiaspek-aspek tersebut dengan komponen-komponen yang menyertainya, maka instrumen-instrumenpenilaian pendidikan yang digunakan harus terkait dengan aspek yang dinilai dan tujuan padamasing-masing aspek tersebut. Secara garis besar instrumen evaluasi dapat diklasifikasikan atas duabagian yaitu tes dan non tes. Perbedaan yang prinsip antara tes dan non tes, terletak pada jawabanyang diberikan. Dalam suatu tes hanya ada kemungkinan benar atau salah, sedangkan untuk non testidak ada jawaban benar atau salah, semuanya tergantung kepada keadaan seseorang. Selanjutnyaakan diuraikan lebih rinci mengenai tes sebagai sebagai alat evaluasi hasil belajar.A. Pengertian TesTes merupakan alat atau prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalamsuasana, dengan cara dan aturan-aturan yang sudah ditentukan. Tes hasil belajar adalah sekelompokpertanyaan atau tugas-tugas yang harus dijawab atau diselesaikan oleh siswa dengan tujuan untukmengukur kemajuan belajar siswa.B. Jenis-Jenis Tes1. Dari segi bentuk pelaksanaannyaa. Tes Tertulis ( paper and pencil test)Tes tertulis dalam pelaksanaannya lebih menekankan pada penggunaan kertas dan pencil sebagaiinstrumen utamanya, sehingga tes mengerjakan soal atau jawaban ujian pada kertas ujian secaratertulis, baik dengan tulisan tangan maupun menggunakan komputer.
  10. 10. b. Tes Lisan ( oral test)Tes lisan dilakukan dengan pembicaraan atau wawancara tatap muka antara guru dan murid.c. Tes Perbuatan (performance test)Tes perbuatan mengacu pada proses penampilan seseorang dalam melakukan sesuatu unit kerja. Tesperbuatan mengutamakan pelaksanaan perbuatan peserta didik.2. Dari segi bentuk soal dan kemungkinan jawabannyaa. Tes Essay (uraian)Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur dan siswa menyusun,mengorganisasikan sendiri jawaban tiap pertanyaan itu dengan bahasa sendiri. Tes essay ini sangatbermanfaat untuk mengembangkan kemampuan dalam menjelaskan atau mengungkapkan suatupendapat dalam bahasa sendiri.b. Tes ObjektifTes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan alternatif jawabannya.Tes ini terdiri dariberbagai macam bentuk, antara lain ;Tes Betul-Salah (TrueFalse)Tes Pilihan Ganda (Multiple Choice)Tes Menjodohkan (Matching)Tes Analisa Hubungan (Relationship Analysis)3. Dari segi fungsi tes di sekolaha. Tes FormatifTes Formatif, yaitu tes yang diberikan untuk memonitor kemajuan belajar selama prosespembelajaran berlangsung. Tes ini diberikankan dalam tiap satuan unit pembelajaran. Manfaat tesformatif bagi peserta didik adalah :Untuk mengetahui apakah peserta didik sudah menguasai materi dalam tiap unit pembelajaran.Merupakan penguatan bagi peserta didik.Merupakan usaha perbaikan bagi siswa, karena dengan tes formatif peserta didik mengetahuikelemahan-kelemahan yang dimilikinya.
  11. 11. Peserta didik dapat mengetahui bagian dari bahan yang mana yang belum dikuasainya. b. Tes Summatif Tes sumatif diberikan dengan maksud untuk mengetahui penguasaan atau pencapaian peserta didik dalam bidang tertentu. Tes sumatif dilaksanakan pada tengah atau akhir semester. c. Tes Penempatan Tes penempatan adalah tes yang diberikan dalam rangka menentukan jurusan yang akan dimasuki peserta didik atau kelompok mana yang paling baik ditempati atau dimasuki peserta didik dalam belajar. d. Tes Diagnostik Tes diagnostik adalah tes yang digunakan untuk mendiagosis penyebab kesulitan yang dihadapi seseorang baik dari segi intelektual, emosi, fisik dan lain-lain yang mengganggu kegiatan belajarnya. C. Ciri-ciri Tes Yang Baik Sebuah tes dikatakan baik jika memenuhi persyaratan:1. Bersifat valid atau memiliki validitas yang cukup tinggi. Suatu tes dikatakan valid bila tes itu isinya dapat mengukur apa yang seharusnya di ukur, artinya alat ukur yang digunakan tepat2. Bersifat reliable, atau memiliki reliabelitas yang baik. Reliabelitas sering diartikan dengan keterandalan. Suatu tes dikatakan relliabel jika tes itu diberikan berulang-ulang memberikan hasil yang sama.3. Bersifat praktis atau memiliki kepraktisan. Tes memiliki sifat kepraktisan artinya praktis dari segi perencanaan, pelaksanaan tes dan memiliki nilai ekonomi tetapi harus tetap mempertimbangkan kerahasiaan tes. Namun syarat minimum yang harus dimiliki oleh sebuah tes yang baik adalah valid dan reliable. D. Langkah-langkah Pengembangan Tes Ada enam tahap dalam merencanakan dan menyusun tes agar diperoleh tes yang baik,yaitu: 1) Pengembangan spesifikasi tes Spesifikasi tes adalah suatu ukuran yang menunjukkan keseluruhan kualitas tes dan ciri-ciri yang harus dimiliki oleh tes yang akan dikembangkan. Hal yang perlu diperhatikan adalah :
  12. 12. a) Menentukan tujuan, tujuan pembelajaran yang baik hendaklah berorientasi kepada pesertadidik, bersifat menguraikan hasil belajar, harus jelas dan dapat dimengerti, mengandung kata kerjayang jelas (kata kerja operasional), serta dapat diamati dan dapat di ukur.b) Menyusun kisi-kisi soal, penyusunan kisi-kisi soal bertujuan untuk merumuskan setepatmungkin ruang lingkup, tekanan dan bagian-bagian tes sehingga perumusan tersebut dapat menjadipetunjuk yang efektif bagi penyusun tes.c) Memilih tipe soal, dalam memilih tipe soal perlu diperhatikan kesesuaian antara tipe soaldengan materi, tujuan evaluasi, skoring, pengelolaan hasil evaluasi, penyelenggaraan tes, sertaketersediaan dana dan kepraktisan.d) Merencanakan tingkat kesukaran soal, untuk soal objektif dapat diketahui melalui uji coba ataudapat juga diperkirakan berdasarkan berat ringannya beban penyeleaian soal tersebute) Merencanakan banyak soalf) Merencanakan jadwal penerbitan soal2) Penulisan soal3) Penelaahan soal, yaitu menguji validitas soal yang bertujuan untuk mencermati apakah butir-butir soal yang disusun sudah tepat untuk mengukur tujuan pembelajaran yang sudah dirumuskan,ditinjau dari segi isi/materi, kriteria dan psikologis.4) Pengujian butir-butir soal secara empiris, kegiatan ini sangat penting jika soal yang dibuat akandibakukan.5) Penganalisisan hasil uji coba.6) Pengadministrasian soalE. Menganalisis TesMenganalisis instrument (alat evaluasi) bertujuan untuk mengetahui apakah alat ukur yangdigunakan atau yang akan digunakan sudah memenuhi syarat-syarat sebagai alat ukur yang baik,tepat mengukur sesuatu sesuai tujuan yang telah dirumuskan. Sebuah instrument dikatakan baikjika memenuhi syarat validitas, reliabelitas dan bersifat praktis.1. Validitas TesSuatu tes dikatakan valid jika tes itu dapat mengukur apa yang seharusnya diukur. Valid disebut jugasahih, terandalkan atau tepat. Tes hasil belajar yang valid, harus dapat menggambarkan hasil belajaryang di ukur
  13. 13. Macam-macam validitas 1). Validitas isi (content validity) Validitas isi sering juga disebut validitas logis atau validitas rasional. Validitas isi dapat dianalisis dengan bantuan kisi-kisi tes dan pedoman penelaahan butir soal. Penelaahan butir soal secara umum ditinjau dari tiga aspek yaitu:1.1. Aspek materi2. Aspek bahasa3. Aspek konstruksi 2). Validitas ramalan (predictive validity) Suatu tes dikatakan memiliki validitas ramalan, apabila hasil pengukuran yang dilakukan dengan tes itu dapat digunakan untuk meramalkan, atau tes itu mempunyai daya prediksi yang cukup kuat. Untuk mengetahui apakah suatu tes hasil belajar dapat dinyatakan sebagai tes yang memiliki validitas ramalan dapat dilakukan dengan mengkorelasikan tes hasil belajar yang sedang diuji dengan kriterium yang ada. 3) Validitas bandingan (concurent validity) Suatu tes dikatakan memiliki validitas concurrent, apabila tes tersebut mempunyai kesesuaian dengan hasil pengukuran lain yang dilaksanakan saat itu. Misalnya, membandingkan hasil tes dari soal yang sedang dicari validitasnya dengan hasil tes dari soal standar. Jika terdapat korelasi yang positif antara kedua tes tersbut, berarti soal tes yang dibuat mempunyai validitas concurrent. 4).Construct validity (validitas konstruk) Validitas konstruk artinya butir-butir soal dalam tes tersebut membangun setiap aspek berpikir seperti yang tercantum dalam tujuan pembelajaran yang telah dirumuskan. Penganalisisan validitas ini dapat dilakukan dengan jalan melakukan pencocokan antara aspek berpikir yang dikehendaki diungkapkan oleh tujuan pembelajaran, yaitu melalui penelaahan butir-butir soal. Meski terdapat beberapa jenis validitas, dalam periode terakhir validitas dianggap sebagai suatu konsep utuh, tidak dipilah-pilah sebagai jenis validitas.o Cara menentukan validitas instrumen
  14. 14. Validitas instrument dapat diketahui dengan mencari korelasi hasil instrument dengan dengan kriterium atau melakukan analisis butir. Apabila data yang digunakan adalah data interval maka dapat digunakan rumus Product Moment Korelasi, sebagai berikut : v Rumus Angka Kasar Keterangan : = Koefisien korelasi antara instrument X dan instrument Y v Rumus untuk skor deviasi Kriteria- kriteria hasil validitas : Antara sangat tinggi Antara tinggi Antara cukup Antara rendah Antara sangat rendah (Yusuf, 2005:75).o Cara menentukan validitas tiap butir soal Tinggi rendahnya validitas soal secara keseluruhan berhubungan dengan validitas tiap butir soal. Validitas butir soal dapat dicari dalam hubungannya dengan skor total tiap individu yang ikut serta dalam evaluasi. Langkah-langkah yang ditempuh sebagai berikut : 1. Skor suatu instrument dengan baik dan teliti
  15. 15. Untuk individu yang benar diberi angka 1, sedangkan yang salah diberi angka nol. 2. Jumlahkan skor total untuk tiap individu. 3. Gunakan rumus product moment correlation atau korelasi biserial. 2. Reliabilitas Suatu alat ukur dikatakan reliabel, apabila alat ukur itu dicobakan kepada objek yang sama secara berulang-ulang maka hasilnya akan tetap sama, konsisten, stabil atau relatif sama.o Faktor-faktor yang mempengaruhi reliabilitas a. Konstruksi item yang tidak tepat, sehingga tidak dapat mempunyai daya pembeda yang kuat. b. Panjang/pendeknya suatu instrumen c. Evaluasi yang surjektif akan menurunkan reliabilitas d. Ketidaktepatan waktu yang diberikan e. Kemampuan yang ada dalam kelompok f. Luas/tidaknya sampel yang diambil.o Teknik pengujian reliabilitas tes hasil belajar a. Bentuk objektif 1) Metode Belah dua Dalam pelaksanaanya,seorang penilai hanya melakukan ujian satu kali terhadap sejumlah peserta, sehingga tidak ada pengaruh dari instrumen yang terdahulu. Jumlah butir soal yang diberikan harus genap sehingga dapat dibagi dua dan tiap kelompok mempunyai jumlah butir yang sama. Koefisien reliabilitas akan menunjukkan internal konsistensi dari pada butir soal dalam keseluruhan instrumen. Cara membelah dua instrumen tersebut dapat dilakukan dengan cara nomor genap dan ganjil, awal dan akhir. Untuk menentukan reliabilitas kedua bagian instrumen tersebut dapat digunakan Product Moment Coorelation, sedangkan untuk mencari reliabilitas keseluruhan instrumen dapat digunakan rumus Spearman Brown, sebagai berikut : Keterangan : : koefisien reliabilitas r : korelasi antara bagian instrumen
  16. 16. 2) Metode UlanganPelaksanaannya dilakukan dua kali kepada sejumlah subjek yang sama, dalam waktu yang berbeda.Reliabilitas metode ulangan ini untuk melihat bagaimana stabilnya skor setiap individu apabiladilakukan pengujian dalam waktu yang berbeda, dengan kondisi dan perlengkapan yang sama/hampir bersamaan. Rumus yang digunakan untuk menentukan metode ulangan ini adalah ProductMoment Correlation.3) Metode Bentuk ParalelBentuk ini dapat digunakan untuk memperkirakan reliabilitas dari semua tipe, tetapi koefisien yangdihasilkan hanya menggambarkan ekivalensi antara kedua instrumen. Tidak akan menunjukkanekivalensi dalam kesukaran butir dan isi. Kedua bentuk instrumen yang diberikan mengukura halyang sama, dengan memiliki tingkat kesukaran yang sama, pengetahuan dan keterangpilan yangsama dengan sistematika yang tidak berbeda antara kedua bentuk instrumen tersebut, tetapi dalambentuk pertanyaan yang berbeda. Rumus yang dapat digunakan untuk menentukan reliabilitasinstrumen dalam bentuk paralel ini adalah product moment correlation dan Rank order correlation.b. Bentuk essayRumus yang digunakan untuk mengukur reliabilitas tes berbentuk uraian dinamakan rumus Alpha,yaitu :Dimana:: Koefisien reliabilitas tesn : banyaknya butir item yang dikeluarkan dalam tes: Jumlah variansi skor dari tiap-tiap butir item:VariansitotalInterpretasi terhadap koefisien reliabilitas tes pada umumnya digunakan patokan sebagai berikut:0,80 < r11 £ 1,00 reliabilitas sangat tinggi0,60 < r11 £ 0,80 reliabilitas tinggi0,40 < r11 £ 0,60 reliabilitas sedang0,20 < r11 £ 0,40 reliabilitas rendah0,00 < r11 £ 0,20 reliabilitas sangat rendahNilai r yang diperoleh dibandingkan dengan rtabel. Jika rhitung > rtabel maka dapat disimpulkan bahwasoal tes reliabel.
  17. 17. 3. Analisis soal tesUntuk mendapatkan kualitas soal yang baik, maka dilakukan langkah-langkah sebagai berikut:1) Daya pembedaDaya pembeda soal adalah kemampuan suatu soal untuk membedakan antara siswa yang pandaidengan siswa yang bodoh. Angka yang menunjukkan besarnya daya pembeda disebut indekdiskriminan. Untuk menentukan daya pembeda soal dapat dilakukan seperti yang dikemukakan olehPrawironegoro (1985:11):Terlebih dahulu dicari degress of freedom (df) dengan rumus:df = (nt – 1) + (nr – 1)dimana:nt = nr = 27% x Nkemudian digunakan rumus:dimana:Ip = daya pembeda soalMt = rata-rata skor dari kelompok tinggiMr = rata-rata skor dari kelompok rendah= jumlah kuadrat deviasi skor kelompok tinggi= jumlah kuadrat deviasi skor kelompok rendahn = 27% x NN = banyak pengikut tesSoal mempunyai daya pembeda yang berarti (signifikan) jika Ip hitung ³ Ip tabel pada derajatkebebasan yang sudah ditentukan.2) Indek kesukaran.Agar tes dapat digunakan secara luas, setiap soal harus diselidiki tingkat kesukarannya yaitu apakahsoal tersebut termasuk soal yang mudah, sedang atau sukar. Untuk menentukan indek kesukarandigunakan rumus yang dikemukakan Prawironegoro (1985:14) yaitu:dimana:
  18. 18. Ik = indeks kesukaranDt = jumlah skor dari kelompok tinggiDr = jumlah skor dari kelompok rendahm = skor setiap soal jika benarn = 27% x NN = banyak pengikut tesSoal dinyatakan sukar, jika 0% £ Ik < 27%sedang, jika 27% £ Ik £ 73%mudah, jika Ik > 73%3) Penerimaan soalSetiap soal yang telah dianalisa perlu diklasifikasikan menjadi soal yang tetap dipakai, direvisi ataudibuang. Menurut Prawironegoro (1985:16) tentang klasifikasi soal:a) Soal yang baik akan tetap dipakai jika Ip signifikan dan 0% < Ik £ 100%.b) Soal diperbaiki jika:i. Ip signifikan dan Ik = 100% atau Ik = 0%.ii. Ip tidak signifikan dan 0% < Ik < 100%.c) Soal diganti jika Ip tidak signifikan dan Ik = 100% atau Ik = 0%.

×