PPT PENDIDIKAN KELAS RANGKAP MODUL 3 KELOMPOK 3.pptx
Pengembangan alat ukur penelitian
1. MENCIPTA ALAT UKUR PENELITIAN
(RESEARCH INSTRUMENT DEVELOPMENT)
Dr. EKO DARMINTO, M.Si.
Universitas Negeri Surabaya
2. TERMINOLOGI
ASSESMENT TEST MEASUREMENT
A broad term that encompasses
the entire process of collecting,
synthesizing, and interpreting
information, whether formal or
informal, numerical or textual.
Tests are a subset of assessment,
as are observations and interviews.
A test is a formal, systematic, usually
paper and pencil procedure for
gathering information about peoples’
cognitive and affective characteristics
• a cognitive characteristic is a
mental characteristic related to
intellect, such as achievement;
• an affective characteristic is a
mental characteristic related to
emotion, such as attitude.
Tests typically produce numerical
scores
• Process of quantifying or
scoring performance on an
assessment instrument.
3. Terminologi
ASSESMENT
TEST
Any procedure to gather information about people
A type of assessment that uses specific procedures to obtain
information and convert that information to numbers or
scores
A set of stimuli presented to an individual in order to elicit
responses on the basis of which a numerical score can be
assigned
4. Test and Non test
Test
1. Present specific question to answer/task to
perform.
2. A standard administration procedure
3. A specific mechanism to score response
Degree of control exerted over the
information-gathering-process
Non test
Idem, but there is more flexibility in the
information-gathering-process and more reliance
on jufgement and interpretation of responses
5. Penggunaan Tes
Purposes
RATING Menilai tingkat kinerja individu pada Suatu domaintertentu
berdasarkan skor tes
PLACEMENT Mengevaluasi kemakpuan/karakteristik seseorang sehingga
mereka dapat ditempatkan dalam Suatu lingkungan atau
diberikan pelayanan secara tepat penempatan staf
sesuai dengan kemampuanya; penempatan siswa dalam
suatu kelas akselerasi
SELECTION Menyeleksi pelamar pada Suatu organisasi atau sekolah
sesuai dengan kriteria karakteristik/kemampuan yang telah
ditetapkan
6. Overviu Pengukuran
ALL
RESEARCH
INSTRUMENT
(a tool used to
collect data)
DATA
COLLECTION
ANSWER
QUESTIONS
TEST
HYPOTHESES
Record naturally
available data
Administer a self-
developed
instrument
Administer a
Standardized
Instruments
METHODS
Measurement
DATA
Analysis and
interpretation
Analysis and
interpretation
7. Menggunakan alat ukur/instrument yg sudah ada
Bisa
digunakan
apabila
Konstruk variabel yang diukur oleh
instrumen tersebut juga sama dengan
konstruk variabel yang hendak diukur
dalam penelitian
Teori yang dijadikan landasan
penyusunan instrumen tersebut sesuai
dengan teori yang diacu dalam
penelitian
• A standardized instrument is one
that is administered, scored, and
interpreted in the same way no
matter where or when it is used.
• Standardized instruments tend to
be developed by experts, who
possess needed test construction
skills.
8. Menggunakan instrumen yg dicipta sendiri
Instrumen
terstandar
belum ada
Prosedur
pengembangan
instrument
penelitian
Quantitative
Research
Qualitative
research
Perlu mencipta
sendiri
10. Teknik dan Instrumen Non test
METHOD/TECHNIQUE INSTRUMENTS
SELF-REPORT Questionnaire
Inventories
Attitude Scale
OBSERVATION Observation Guide
INTERVIEW Interview Guide
DOC. STUDY Documentation Guide
11. Antara kuesioner, skala/inventory, dan tes
ASPEK KUESIONER SKALA/INVENTORI TES
VARIABEL Faktual (jenis kelamin, tk
pendidikan, pekerjaan, dll.)
Konsep, Konstruk, Performansi
Tipikal (sikap, motivasi, moral,
dll.)
Kognisi, Konten Performansi
Maksimum (kemampuan,
bakat, hasil belajar, dll)
PERTANYAAN/
PERNYATAAN
Langsung terarah pada
informasi/data yang akan
diungkap
Stimulus pada indikator
perilaku/atribut yang diukur
(tidak langsung)
Terarah pada isi/ substansi
yang diukur.
RESPONDEN Tahu persis apa yang ditanyakan,
informasi yang diharapkan oleh
peneliti.
Memahami isi pertanyaan/
pernyataan yang harus direspon,
tetapi tidak harus tahu
kesimpulan yang akan diambil
peneliti
Melakukan atau menjawab
sesuai kemampuan
JAWABAN Tidak dapat diberikan sekor,
hanya dapa diklasifikasi (deskrit).
Diberikan sekor dengan proses
penskaliaan (scalling).
Diberikan sekor berdasarkan
kriteria yang ditetapkan
sebelumnya
VALIDASI Tidak perlu divalidasi. Validitas
dan reliabilitas ditentukan oleh
kejelasan tujuan dan lingkup
informasi yang diungkap.
Perlu validasi baik secara teoretis
maupun empiris.
Perlu validasi baik secara
teoretis maupun empiris.
12. Domain Pengukuran
Test
Kinierja tipikal
(Typically Performance)
Kinerja Maksimal
(Maximal performance)
Mengukur kemampuan maksimal
individu
Non test
• Cognitive and Skills domain
• Right and wrong answers
• Ability/achievement/aptitude
test
• Affective and personality
• Measure construct or
usual/habitual thoughts, feelings,
interest, attitudes, pattern of
behavior (everyday characteristic
and behavior on a daily basis)
13. Skala Pengukuran
Variable
Characteristic under
study/Measure
Physical Dimension
(Ex: length or weight)
Psychological Dimensions
(ex: intelligence, self-concept)
Nominal/catagoric
(sex; color; SES; life style)
Ordinal/rank
(size; grade; level)
Interval
(difference of 1,2,3 unit is
equivalent at any place)
Ratio
(equal with interval but has a
true zero point)
MEASUREMENT SCALE
14. Doman Konstruk (Construct Domain)
• Not all instrument cover knowledge, skills, or behavior domains
• Some instrument designed to measure construct theoretical abstraction/hypothetical
dimensions on which individual differ.
• Construct :
• a concept invented to explain behavior
• abstrak cannot be measure directly Ex: intelligence, personality, teacher effectiveness,
creativity, ability, achievement, and motivation. To be measurable
• constructs must be operationally defined—that is, defined in terms of processes or operations
that can be observed and measured
must be inferred from measurement of specific behaviors
a list behaviors, beliefs, or attitides that demonstrate the presence of the construct consisten and not
consistent
16. Konstruk dan Variabel
Construct
Conceptually
Definition
Variables (operationally
definition)
(Embed a score, grade, or activity)
An asertive behavior training
program conducted through four
stages: deductic discussion,
modeling, behavioral rehearsal, in
vivo practice
A training program to
develop asertive behavior
according Reed &
Portierfield (1990)
Assertive training
Personality
Two personality
characteristic: Introvert &
extrovert according to
Jung (1977)
scores on a 30-item personality scale,
with a high score indicating a more
introverted personality and a low score
indicating a more extroverted
personality
17. Contof: Construct of Friendliness
Behaviors consistent with the presence of frienliness Behaviors inconsistent with the presence of frienliness
Initiating contact with other people Avoiding contact with other people
Frequently spending time with other people Rarely spending time with other people
Choosing to spend time with other people rather than
spending time alone
Choosing to spend time alone rather than spending
time with other people
Initiating conversation with new people Engaging in conversation with people only when others
initiate the conversations
Smilling, talking, and laughing in the company of other
people
Demonstrating physiological and behavioral signs of
distress when in the comoany of other people
Making frequent eye contact with other people Rarely making eye contact with other people
Sourcer: Friedenberg, 1995:52
18. Properti Psikiometri Alat Tkur
RELIABLE/
Consistency
VALID/
ACCURATE
A reliable measurement will provide a consistent measure
of knowledge, reaction, skills, or characteristic on the
basis current and another administration
• Measures what it was designed to measure
• The degree to which a instrument measures what it is
suppsed to measure
19. Reliability Analysis
Noted:
• In all cases, realiablity is represented statitiscally as a correlation reliability coefficient
Type Technique
Test –retest 2 x measurement on two different days
Using to set score correlation using two set score (1 x 2)
Alternate-form reliability measured with two different version measuring same
characteristics with different item/two equivalent
instrument using two set score (2 x 1)
Internal consistency measured with subset of item from the test using one set
score/administered only once ( 1 x 1) split-half ; Alpha
Cronbach; KR (KR 20), items scored dichotomy (0 or 1)
21. VALIDITY ANALYSIS
CRITERION VALIDITY
• Predict future performance on appropriate variables
• Ability of instrument to predict performance on another measure
• score on achievement motive (predictor) achievement (criterion)
• Concurrent validity the degree to which the score of test are related to the scores on
another that administered at same time.
• Statitsik correlation between test score with a current criterion measure score on achievement
motive scale and GPA statistical problem underestimate
• Predictive validity the degree to which a tes can predit how well an individual will do in a future
situation.
• Criterion validity coefficient relationship between score on two variables
22. VALIDITY ANALYSIS
• CONTENT VALIDITY
• Measures an appropriate domain the degree to which a instrument measure an
intended content area (domain)
• Proses kualitatif meninjau keselarasan butir-butir instrument dengan domain yang diukur
pengembang instrument perlu menspesifikasi sejelas mungkin domain yg akan diukur
• Sering dirancukan dengan Face Validity (butir2 instrument tampak mengukur apa yg mau
diukur)
• Conten validity justifikasi butir dibuat oleh ahli
• Face validity justifikasi dibuat oleh kelompok sasaran
• Pendekatan statistik:
• Cronbach (1971) Mengkorelasikan dua perangkat skor hasil pengukuran dari dua
instrumen yang mengukur domain yg sama tetapi disusun secara berbeda atau oleh
dua tim.
• Brown (1983) (1) pretest-posttest; (2) mengkorelasikabn dua perangkat skor yang
dihasilkan dari dua instrument yang disusun untuk mengukur domain yang sama
24. VALIDITY ANALYSIS
• CONSTRUCT VALIDITY
• Measures appropriate characteristic of individu
• Mengukur what is intended be measured
• Focus on psychological construct or personality dimensions/traits:
intelligence, motivation, self-concept, aggression, locus of control, etc.
• Procedures:
• Congruent validity
• Convergent validity
• Criterion validity
• Discriminant or divergent validity
• Factor analysis
• Item analysis
25. VALIDITY ANALYSIS
•CONSTRUCT VALIDITY
•Congruent validity
• Statistically : mengkorelasikan skor hasil pengukuran dari instrument
yang baru disusun/dicipta dengan skor hasil pengukuran dari
instrument lain yang mengukur konstruk yg sama
• Ex: skor pada alat ukur (instrument) kecemasan yg baru disusun harus
memiliki korelasi positif yang tinggi dengan skor pada instrument
kecemasan lain yang sudah ada
26. VALIDITY ANALYSIS
•CONSTRUCT VALIDITY
•Convergent validity
• Statitiscally: mengkorelasikan skor hasil pengukuran dari
instrument yang baru disusun(misalnya skala kecemasan) dengan
skor hasil pengukuran instrument lain yang mengukur konstruk
yang berkaitan (misalnya skala depresi)
• Skor pada skala kecemasan harus berkorelasi dengan positif
dengan skor pada skala depresi
27. VALIDITY ANALYSIS
•CONSTRUCT VALIDITY
•Criterion validity
• Hasil pengukuran suatu konstruk harus dapat memprediksikan
munculnya perilaku yang berkaitan dengan konstruk yg diukur.
• Mengokorelasikan skor hasil pengukuran dengan contoh perilaku
yg mendeskripsikan konstruk
• Ex: skor pada skala kecemasan harus dapat memprediksikan
kontak mata selama wawancara bisa dilakukan melalui
eksperimen individu dg skor rendah dna tinggi harus
memperlihatkan reaksi yg berbeda
28. VALIDITY ANALYSIS
•CONSTRUCT VALIDITY
•Discriminant or divergent validity
• Corelate scor on the new instrument with score on other
instrument of unrelated construct, especially thise linked to
behaviors inconsistent with the behaviors implied by the
construct under study.
Koefisien korelasi mendekati 0 or negative
• Ex: Skor skala kecemasan dengan skor skala ekstoversi
29. VALIDITY ANALYSIS
• CONSTRUCT VALIDITY
• Factor/item analysis
• A statistical procedure that can used to study the internal
structure of a instrument
• A sophisticated correlation technique that looks for the
relationship between performance/score on sets of instrument
items
• To determine whether the pattern of score is consistent with
construct under study
• Analisis factor Mengkorelesaikan skor butir dengan skor total
factor
• Analisis butir mengkorelasikan skor butir dengan skor total butir
30. Problem Pengukuran Konstruk
• Pengukuran konstruk psikologis tidak 100% akurat (precise)
• Hanya mengukur sampel perilaku dari seluruh perilaku yg diselidiki, tidak mengukur
keseluruhan domain Respons terhadap item pada skala depresi digunakan untuk
menyimpulkan tingkat depresi kita meyimpulkan dari pengukuran yg terbatas
menggunakan item terbatas mudah dipengaruhi oleh variable extranous
• Pengukuran konstruk psikologis tak bisa langsung
• Inferensi dibuat berdasarkan atribut dari karakteristik yang diukur
(berdasarkan respon terhadap item)
• Yag diukur adalah konstruk, bukan perilaku actual karakteristik hipotetis
abstraksi teoretis, tak dapat diukur secara langsung
• Mmebutuhkan defiisi operasional yang seringkali tidak akurat
31. Langkah-langkah penyusunan instrumen
Tetapkan konsep/konstruk/
variable yg mau diukur
Kaji teori tentang
konsep/konstruk/variable
Definisikan secara konseptual
& operasional
Identifikasikan dimensi dan
indicator-indikator
Susun table spesifikasi
pengukuran/ Bule Print
Tetapkan Jenis Instrumen &
format respon
Uji Keterbacaan dg kolega
Reviu /justifikasi ahli
Uji keterbacaan oleh
khalayak sasaran
UJI COBA
Analisis validitas &
Reliabelitas
Tulis butir/item
pertanyaan/pernyataan
Pertanyaan penelitian/
hipotesis
GUNAKAN
32. Langkah-langkah penyusunan instrumen
• Tetapkan konsep/konstruk/variable yg mau diukur
• Bisa ditemukan di pertanyaan penelitian, atau
• Bisa ditemukan di rumusan hipotesis
• Bisa satu, dua, tiga, atau lebih konsep/konstruk/variable (univariat; bivariat;
multivariat)
CONCEPT/CONSTRUCT VARIABLE
Achievement GPA
Motivation Level of motivation (high, middle, low)
Type of motivation (intrincsic – extrincsic)
Score of motivation ( 57; 68; 90 )
Parenting Parenting style (authoritarian; authoritative; uninvolved;
permissive)
33. Langkah-langkah penyusunan instrumen
• Kaji teori tentang konsep/konstruk/variable
CONCEPT/
CONSTRUCT
LITERATURE
REVIU
DEFINITION OF
EXPERT
Research
results
THEORIES
34. Langkah-langkah penyusunan instrumen
• Definisikan secara konseptual & operasional
• Dari hasil kajian literatur diperoleh definisi tentang konsep/konstruk yang
akan diukur:
• Definisi konseptual konsep
• Definisi operasional konsep rumusan konsep/konstruk dalam bentuk perilaku yang
dapat diamati dan diukur secara langsung
LITERATURE
REVIU INDICATORS
CONCEPTUAL AND
OPERATIONALLY
DEFINITION
DIMENSIONS/
ASPECTS
35. Langkah-langkah penyusunan instrumen
• Kaji teori tentang konsep/konstruk/variable
Mendefinisikan
Konstruk
LITERATURE
REVIU
DEFINITION
OF EXPERT
Research
results/Journal
THEORIES
SINTESIS
Def. Konseptual
Indikator
Def. Operasional
Dimensi
Mendefinisikan
sendiri Bersama
Tim/pakar
37. Definisi variable (mengikuti teori)
VARIABEL DIMENSI
(Defined according to Maccoby &
Martin, 1983)
INDIKATOR
PARENTING STYLE
How parents take care of their
children
AUTHORITARITARIAN
(Parents place a high value on obedience
and conformity – the child should acdept
without question the rules and standard))
• Punitive
• Absolut
• Forceful diciplanary
• etc
AUTHORITATIVE
(set standards for the child’s conduct but
form expectations that are consistent
with the child’s developing needs and
capabilities)
• Rational
• Issue oriented
• Engaging in discussion and
explanation with their children over
matters of discipline
• etc
INDULGEN
INDIFFERENT
38. Menyusun kisi-kisi pengukuran/table spesifikasi
VARIABEL DIMENSI INDIKATOR
ITEM
(+) (-) ∑
DIMENSI 1 Indikator ke 1 2 1 3
Indikator ke 2 2 1 3
Indikator ke n 2 1 3
DIMENSI 2 Idem 9
DIMENSI 3 Idem 9
DIMENSI 4 Idem 9
∑ 36
39. Contoh lain: “Dukungan Sosial” (Social Support)
Definisi: Persepsi terhadap sumber-sumber dukungan sosial
NO DIMENSI
(Sumber Dukunga Sosial)
INDIKATOR ITEM
Faf. No. ∑ %
1 Dukungan emosional Merasa mendapat kehangatan F 7, 23, 47 3
30
UF 20, 28, 40 3
Merasa mendapat empati F 31, 45 2
UF 2, 22 2
Merasa mendapat kepedulian F 9, 57 2
UF 30, 46 2
2 Dukungan penghargaan 30
3 Dukungan instrumental 20
4 Dukungan informasi 20
∑ 100
40. Memilih format respon
• Format respon cara bagaimana khalayan ukur diharapkan memberikan
tanggapan/jawaban terhadap butir-butir instrument
• Beberapa bentuk respon yg umum digunakan untuk mengukur konstruk:
• “Ya” atau “tidak” berdoa setiap kali mau tidur : ya/tidak
• Isian singkat apa yang dilakukan ketika mau tidur: ……………
• Pilihan ganda pilih satu pilihan jawaban yag paling menggambarkan diri
anda : a. …….. ; b. ………. ; c. ………..; d. …………..; e. …………….
• Skala : jawablah dengan memilih (mencentang) salah atu angka/skala yang
tersedia di sebelah kanan pernyataan : 1 2 3 4 5
• Memberi cek beri tanda cek pernyataan-pernyaan yang menggambarkan
diri anda ; _____ ababababab _______ ababababab
_____ ababababab _______ ababababab
41. Memberi tanda cek
Select the number that best describes your actions
• Sangat sering Tidak Pernah
5 4 3 2 1 0
• Sangat benar Sangat Tidak Benar
5 4 3 2 1 0
42. Format Skala
• Gambarkanlah diri Anda secara jujur dengan cara menggunakan
salah satu bilangan yang ada di samping kanan pernyataan dengan
pengertian berikut:
• 5 : Selalu/Sangat benar
• 4 : Hampir selalu/benar
• 3 : Kadang-kadang/cukup benar
• 2 : Jarang/sedikit benar
• 1 : Tidak pernah/sangat tidak benar
43. MENULIS BUTIR
• Yang perlu diperhatikan dalam menulis item alat ukur
• ISI
• JUMLAH BUTIR:
• BAHASA/REDAKSI
44. MENULIS ITEM
• Konten item
• Mengacu pada indikator perilaku, tidak menanyakan atribut/dimensi atau variable
secara langsung
• Perhatikan indikator perilaku yang hendak diungkap sehingga pernyataan item dan
pilihan jawaban tetap relevan dengan tujuan pengukuran
• Isi item tidak boleh mengandung keinginan sosial ataupun yang dianggap baik atau
tidak baik dalam norma social item yang mengandung norma baik cenderung
akan disetujui, dan yang buruk akan ditola bukan karena sesuai dengan perasaan
atau keadaan dirinya, namun karena orang pikiran normative.
• Untuk menghindari adanya stereotype jawaban atau memberikan jawaban pada sisi
kanan atau kiri tanpa membaca item perlu dibuat dalam arah favorable (positif)
dan dalam arah unfavorable (negatif) sehingga responden akan membaca lebih teliti
dan sungguh‐sungguh jumlah + dan – toidak harus seimbang
45. MENULIS ITEM
• Jumah butir
• Sebaiknya tidak terlalu banyak tidak membebani responden merasa
capek dan enggan
• Lazimnya antara 30 s.d. 40 tergantung pada jumlah dimensi yg diukur atau
kekomplekan konstruk bila komplek bisa dipecah menjadi bebera sub
• Contoh DAS Depression, Anxiety, Stress
• Jumlah butir antar indicator sebaiknya seimbang (bila jumlah indicator antar
factor mendekati sama)
• Jumlah butir antar factor/dimensi sebaiknya mendekati seimbang
46. MENULIS ITEM
• BAHASA
• Gunakan kata‐kata, kalimat, dan istilah yang sederhana, jelas, mudah
dimengerti namun tetap sesuai dengan kaidah tata tulis & tata bahasa baku.
• Hindari pernyataan yang menimbulkan penafsiran ganda.
• Sebaiknya item hanya terdiri atas satu pernyataan/kalimat.
• Satu Kalimat/pernyataan tidak terlalu panjang biasanya tidak lebih dari 20
kata
• Setiap pernyataan haya mengungkap satu informasi
47. Beberapa contoh item buruk
CONTOH
Satu butir pertanyaan untuk beberapa jawaban
dan terlalu luas
Saya merasa ingin tahu tentang perkembangan gadget, laptop,
internet, sosial media dan lain-lain
Pernyataan panjang sehingga memerlukan
waktu lama untuk membaca
Kurangnya sarana dan prasarana di sekolah tempat saya
bekerja menyebabkan para guru kurang dapat mengikuti
perkembangan teknologi informasi dan komunikasi digital
sehingga memerlukan pelatihan di luar sekolah
Menggunakan bahasa yang sulit dipahami Perkembangan gadget, laptop, internet, sosial media memberi
nurturing effect negatif pada siswa
Pernyataan mengarah pada pemilihan satu
jawaban normatif
Untuk menguasai teknologi informasi dan komunikasi digital
dibutuhkan keterampilan khusus
Pernyataan bersifat kondisional yang mungkin
tidak sesuai dengan kondisi responden
Saya selalu mempelajari perkembangan teknologi informasi dan
komunikasi digital walaupun lingkungan sosial saya mengabaikan
hal tersebut
Pertanyaan cukup sensitif untuk dijawab Saya mengakses situs-situs khusus orang dewasa untuk
menghilangkan kejenuhan selama bekerja, atau
Saya mengkonsumsi sabu untuk menghilangkan kejenuhan setelah