MAKALAH EVALUASI PEMBELAJARAN DI SD MODUL 5 KUALITAS ALAT UKUR (INSTRUMEN)
Sabtu, 26 Oktober 2019
Edit
TUGAS KELOMPOK EVALUASI PEMBELAJARAN DI SD
MODUL 5 KUALITAS ALAT UKUR (INSTRUMEN)
Disusun Oleh: DINI LADY PUSPITHA ; HERMIN NURANIFAH ; SEPTIYAN DIAN TRISTIANA ; WIDIANTO HARI WIDODO
MODUL 5
KEGIATAN BELAJAR I
KUALITAS ALAT UKUR (INSTRUMEN)
PENDAHULUAN
Untuk mengetahui perkembangan dan kemajuan belajar siswa,
perlu dilakukan suatu penilaian dengan menggunakan berbagai teknik yang tepat.
Penilaian dalam pembelajaran dilakukan tidak hanya untuk menilai hasil belajar
siswa melainkan juga menilai proses belajar siswa. Dalam melakukan penilaian
pembelajaran, ada beberapa hal yang harus diperhatikan guru, terutama yang
berhubungan dengan jenis kompetensi yang akan dinilai, tujuan penilaian yang
dilakukan, teknik – teknik penilaian yang digunakan, dan jenis penilaian yang
akan digunakan. Dengan demikian kegiatan penilaian yang dilakukan menjadi tepet
sasaran, terarah, dan terencana.
Secara teoritis terdapat hubungan timbal balik antara tujuan
pembelajaran, proses pembelajaran, dan penilaian hasil belajar. Jika tujuan
pembembelajaran yang dirumuskan sudah tepat dan proses pembelajaran yang
dilakukan sudah maksimal maka salah satu hal yang perlu kita cermati adalah
alat penilaian hasil belajar. pengukuran memiliki dua karakteristik utama yaitu
pertama penggunaan angka atau skala tertentu, dan kedua menurut suatu aturan
atau formula tertentu. Contoh kegiatan pengukuran adalah ketika kita mengukur
tinggi atau berat badan seseorang. Kita akan mengetahui berapa tingginya atau
beratnya. Atribut atau karakteristik yang kita cari dari contoh pengukuran
tersebut yaitu tinggi atau berat, kemudian hasil pengukuran tersebut kita akan
memperoleh angka, misalkan tinggi 1,75 meter atau beratnya 70 kilogram.
-benar mampu mengukur kemampuan siswa.
apakah alat ukur yang anda gunakan ( dalam hal ini tes yang
anda susun atau instrumen lain yang anda gunakan ) mempunyai kualitas yang baik
sehingga dapat digunakan untuk mengukur tujuan pembelajaran yang telah anda
tetapkan ?.
Untuk menjawab permasalahan tersebut, kita akan diajak untuk
mempelajari lebih rinci berbagai cara yang dapat ditempuh untuk meningkatkan
kualitas alat ukur atau instrumen yang anda gunakan agar benar – benar dapat
mengukur apa yang ingin anda ukur. Dalam pembahasan ini akan dibahas mengenai
pengujian kualitas alat ukur atau instrumen yang akan membahas tentang
validitas dan reliabilitas hasil pengukuran dan tentang bagaimana cara
menganalisis butir soal dan bagaimana cara meningkatkan kualitas butir soal
berdasarkan hasil analisis serta bagaimana meningkatkan kualitas alat ukur
non-tes.
Validitas dan Reliabilitas Hasil
Pengukuran
Untuk mengukur sesuatu kita harus
dapat memilih alat ukur yang sesuai agar kita dapat memperoleh hasil pengukuran
yang tepat. Sebagai contoh, seorang pemanah akan dinyatakan sebagai pemenang
jika hasil bidikannya dapat dengan tepat mengenai sasaran yaitu daerah
lingkaran yang paling dalam atau yang paling mendekati lingkaran yang paling
dalam. Jika hasil bidikan peserta didik dapat mengenai daerah di lingkaran paling
dalam maka ia akan memperoleh skor tertinggi dan perolehan skor tersebut
semakin berkurang jika hasil bidikannya jauh dari sasaran. Karena anak panah
yang harus dilepaskan tidak hanya satu maka pemanah dituntut untuk tetap dapat
melepaskan anak panahnya tepat mengenai sasaran.
Hasil bidikan dari peserta bisa
tepat mengenai sasaran atau juga melesat dari sasaran. Hasil yang sama dapat
terjadi pada saat anda mengukur hasil belajar siswa. Jika alat ukur yang anda
gunakan tidak anda persiapkan dengan cermat maka skor yang anda peroleh tidak
dapat menggambarkan dengan tepat tingkat kemampuan siswa.Dari penjelasan
tersebut terdapat dua masalah pokok yang harus diperhatikan dalam menyusun alat
ukur hasil belajar yang baik yaitu masalah yang berhubungan dengan ketepatan
hasil pengukuran dan ketetapan hasil pengukuran.Masalah yang
berhubungan dengan ketepatan hasil pengukuran inilah yang dikenal dengan
istilah validitas sedangkan maslah – masalah yang berhubungan dengan ketetapan
hasil pengukuran dikenal dengan istilah reliabilitas.
A. Validitas
Alat ukur yang baik adalah alat ukur
yang dapat dengan tepat mengukur apa yang ingin diukur. Jika kita ingin
mengukur panjang sebuah meja maka kita harus dapat memilih alat ukur yang tepat
untuk mengukur panjang meja tersebut.Untuk menghitung waktu tempuh pelari cepat
dalam perlombaan lari cepat 100 meter maka kita juga harus dapat memilih alat
ukur yang tepat untuk digunakan. Demikian juga jika kita ingin mengukur hasil
belajar siswa maka kita juga dituntut untuk menggunakan alat ukur ( dalam hal
ini tes ) yang dapat dengan tepat mengukur hasil belajar yang kita harapkan.
Pengertian validitas mengacu pada
ketepatan interpretasi yang dibuat dari hasil pengukuran atau evaluasi (
Gronlund dan Linn, 1990). Secra umum validitas ada tiga jenis :
a.
Validitas
isi ( concent validity ).
b. Validitas konstrak ( construct
validity ).
c.
Validitas
yang dikaitkan dengan kriteria tertentu ( criterion related validity ).
Validitas isi diperlukan untuk menjawab pertanyaan “ sejauh
mana item – item yang ada dalam tes dapat mengukur keseluruhan materi yang
telah diajarkan “. Tinggi rendahnya validitas isi dapat ditetapkan berdasarkan
analisis rasional atau pertimbangan ahli terhadap isi tes tersebut.Hal ini
merupakan tuntutan yang harus dipenuhi oleh tes hasil belajar. Tinggi rendahnya
validitas isi suatu tes dapat dilihat pada perencanaan atau kisi – kisi tes.
Semakin representatif materi yang dapat ditanyakan dalam tes tersebut
menunjukkan semakin tinggi validitas isinya.
Validitas konstrak mengacu pada sejauh mana alat ukur
tersebut dapat mengungkap keseluruhan konstrak yang digunakan sebagai dasar
dalam penyusunan tes tersebut.Yang dimaksud dengan konstrak disini adalah
konsep hipotesis (hipotetical concept) yang digunakan sebagai dasar
dalam penyusunan alat ukur.Validitas konstrak ini banyak digunakan terutama
dalam pengukuran – pengukuran psikologi seperti pengukuran sikap, minat,
tingkah laku dan sebagainya.Campbell dan Fiske (Demari Mardapi, 2004)
mengembangkan satu pendekatan untuk menentukan validitas konstrak dengan
menggunakan teknik multi trait-multi method.Validasi dengan multi trait
– multi method dilakukan dengan menggunakan lebih dari satu metode untuk
mengukur lebih dari satu acam trait ( sifat ). Dengan menggunakan matrik
korelasi sehingga interkorelasi antara trait dan metode dapat dilihat dengan
jelas.
Jika suatu tes dimaksudkan untuk memprediksi keberhasilan
seseorang di masa yang akan datang atau dimaksudkan untuk mengetahui kesesuaian
anatar pengetahuan dengan keterampilan yang dimiliki maka alat ukur yang
digunakan harus mempunyai criterion related validity yang tinggi.
B.. Reliabilitas
Hasil – hasil pengukuran yang
berhubungan dengan aspek – aspek fisik seperti mengukur panjang meja, tinggi
almari, berat badan dan tinggi badan biasanya menghasilkan reliabilitas yang
sangat tinggi.Artinya walaupun pengukuran dilakukan lebih dari sekali tetapi
tetap memberikan hasil yang ridak jauh berbeda. Hasil pengukuran yenag berbeda
akan sering kita temukan jika kita melakukan pengukuran terhadap hal – hal yang
berhubungan dengan aspek – aspek psikologi dan sosial seperti dalam pengukuran
mewakili intelegensi, sikap, dan konsep diri. Aspek – aspek sosial-psikologi
seperti itu tidak dapat diukur dengan ketepatan dan konsistensi yang tinggi.Hal
ini disebabkan karena hasil pengukuran yang diperoleh tidak dapat lepas dari
pengaruh hal - hal diluar maksud pengukuran tersebut misalnya alat ukur itu
sendiri bukan merupakan alat ukur yang tepat untuk mengukur aspek yang
diinginkan. Disamping itu karena subjek pengukurannya adalah manusia maka cara
– cara penyajian tes, emosi, motivasi. Kondisi fisik dan keadaan ruangan tes
akan mempengaruhi hasil pengukuran walaupun sebenarnya aspek – aspek yang ingin
kita ukur tersebut tidak berubah. Dengan demikian hasil pengukuran yang
diperoleh menjadi kurang reliabel.
Pengertian reliabilitas mengacu pada
ketetapan hasil yang diperoleh dari suatu Pengukuran ( Grondlund dan
Linn, 1990 ). Salah satu cara untuk mengetahui ketetapan atau reliabilitas
suatu pengukuran, dapat diperoleh dengan cara melakukan pengukuran dua kali.
Hasil pengukuran dikatakan mempunyai reliabilitas yang tinggi jika hasil
pengukuran pertama hampir sama dengan hasil pengukuran kedua. Dan sebaliknya
hasil pengukuran dikatakan mempunyai reliabilitas yang rendah jika hasil
pengukuran pertama jauh berbeda dengan hasil pengukuran kedua. Hubungan antar
skor yang diperoleh pada pengukuran pertama dengan kedua akan menghasilkan
angka korelasi bergerak antara -1 sampai dengan +1. Semakin tinggi angka
koefisien reliabilitas (mendekati 1) maka semakin tinggi reliabilitas tersebut.
Suatu perangkat tes dinyatakan cukup reliabel jika mempunyai reliabilitas lebih
besar 0,5 (Fernandes, 1984).
Konsep reliabilitas dalam arti
equivalent tes dimaksudkan untuk mengetahui apakah dua set tes yang digunakan
paralel atau tidak. Keparalelan dua set tes ini diperoleh dengan cara mengembangkan
dua set tes yang paralel dari kisi - kisi tes yang sama kemudian masing -
masing tes tersebut diujikan pada dua kelas yang mempunyai tingkat kemampuan
yang sama. Hasil kedua tes tersebut dikorelasikan, jika hasil korelasinya
tinggi, hal ini menunjukan kedua tes paralel.koefisien korelasinya dapat
dihitung dengan menggunakan formula product-moment.
konsep reliabilitas dalam arti
konsistensi internal dimaksudkan untuk mengetahui apakah kumpulan butir soal
yang ada dalam satu set tes tersebut mengukur dimensi hasil belajar yang sama
atau tidak. Konsep reliabilitas dalam asrti konsistensi dapat dihitung
menggunakan formula Kuder-Richardson (KR-20 atau KR-21). Jika hasil korelasinya
tinggi, hal ni menunjukan bahwa antara butir soal dalam satu set tes tersebut
adalah konsisten dengan yang lain.
C. Hubungan antara validitas dan
reliabilitas
Ketepatan hasil pengukuran (
validitas ) sangat diperlukan untuk memperoleh alat ukur yang dapat memberikan
hasil pengukuran yang tepat ( valid ). Walaupun demikian alat ukur yang
mempunyai reliabilitas tinggi belum tentu secara otomatis mempunyai validitas
yang tinggi. Karena tingginya reliabilitas yang dihasilkan oleh suatu
alat ukur jika tidak dibarengi dengan tingginya validitas dapat memberikan informasi
yang salah tentang apa yang ingin kita ukur.
D. Meningkatkan Reliabilitas Tes
Reliabilitas suatu tes dapat
ditingkatkan dengan menambah jumlah butir kedalam tes tersebut. Penambahan
butir soal pada tes akan meningkatkan reliabilitas jika butir soal yang
ditambahkan adalah butir soal yang homogen dengan butir soal – soal yang ada.
KEGIATAN
BELAJAR 2
ANALISIS DAN PERBAIKAN INSTRUMEN
A.ANALISIS BUTIR SOAL
Menurut Nitko (1983), analisis butir
soal menggambarkan suatu proses pengambilan data dan penggunaan informasi
tentang tiap - tiap butir soal terutama tentang respon siswa terhadap setiap
butir soal. Lebih Lnjut dikatakan bahwa arti penting penggunaan analisis butir
soal adalah sebagai berikut :
1. Untuk mengetahui apakah butir soal –
butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh
penyusun soal. Untuk menentukan apakah soal – soal yang kita susun telah
berfungsi sebagaimana seharusnya maka kita harus memperhatikan hal – hal
sebagai berikut :
a.
Apakah soal
– soal yang disusun sudah sesuai untuk mengukur perubahan tingkah laku seperti
telah dirumuskan dalam tujuan instruksional khusus ?
b. Apakah tingkat kesukaran sudah kita
perhatikan ?
c.
Apakah soal
tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang
kurang pandai ?
d. Apakah kunci soal yang kita buat
sudah benar sesuai dengan maksud soa ?
e.
Jika
menggunakan tes pilihan berganda, apakah pengecoh yang kita pilih sudah berfungsi
dengan baik ?
f.
Apakah soal
tersebut dapat ditafsirkan ganda atau tidak ?
2. Sebagai umpan balik bagi siswa untuk
mengetahui kemampuan mereka dalam menguasai suatu materi.
3. Sebagai umpan balik bagi guru untuk
mengetahui kesulitan – kesulitan yang dialami siswa dalam memahami suatu
materi.
4. Sebagai acuan untuk merevisi soal.
5. Untuk memperbaiki kemapuan kita
dalam menulis soal.
Pada saat kita engujikan suatu set
soal untuk mengambil keputusan penting tentang hasil belajar siswa maka
idealnya kita harus yakin bahwa set soal tersebut adalah valid dan reliabel.
Validitas set soal dapat diketahui dari kisi – kisi soal sedangkan reliabelitas
soala baru dapat diketahui setelah uji coba. Dalam rangka memperoleh
reliabilitas set soal inilah analisis butir soal dilakukan. Dalam menganalisis
butir soal paling tidak ada dua karakteristik butir soal yang perlu
diperhatikan yaitu tingkat kesukaran dan daya beda butir – butir soal.
B. KAPAN ANALISIS BUTIR SOAL DILAKUKAN ?
1) Tingkat kesukaran butir soal
Besarnya tingkat kesukaran butir
soal, dapat dihitung dengan memperhatikan proporsi peserta tes yang menjawab
benar terhadap setiap butir soal. Secara matematis tingkat kesukaran butir soal
dapat dihitung dengan rumus :
P =
Keterangan
:
P adalah indeks kesukaran butir soal
B adalah jumlah peserta tes yang
menjawab benar
N adalah jumlah peserta tes
Menurut Fernandes (1984), kategori
kesukaran butir soal adalah sebagai berikut :
P > 0,75 : mudah
0,25 ≤ P ≤ 0,75 : sedang
P < 0,24 : sukar
Butir soal yang baik adalah butir
soal yang memiliki tingkat kesukaran dalam kategori sedang.
2) Daya beda
Daya beda butir soal memiliki
pengertian seberapa jauh butir soal tersebut dapat membedakan kemampuan
individu peserta tes. Daya beda butir soal dapat dihitung dengan menggunakan
rumus :
D=PA – PB
dimana,
D = indeks daya beda butir soal
PA = proporsi kelompok atas yang
menjawab benar
PB = proporsi kelompok bawah yang menjawab
salah
Secara teoritis indeks beda soal (D)
= 1 akan tercapai apabila semua siswa dalam kelompok atas menjawab benar dan
semua siswa dalam kelompok bawah menjawab salah. Indeks daya beda soal (D) = -1
jika semua sisa dalam kelompok atas menjawab salah dan semua siswa dalam
kelopok bawah justru menjawab benar. Sedangkan indeks daya beda soal (D) = 0
apabila proporsi siswa yang menjawab benar dalam kelompok atas dan kelompok
bawah adalah sama. Menurut Fernandes (1984) kategori indeks daya beda butir soal
adalah :
D ≥ 0,40 = sangat baik
0,30 ≤ D ≤ 0,40 = baik
0,20 ≤ D < 0,30 = sedang
D < 0,20 = tidak baik
Butir soal yang perlu diperbaiki
adalah butir soal yang terlalu sukar atau terlalu mudah dan butir soal yang
pengecohnya mempunyai daya beda positif atau kuncinya mempunyai daya beda
negatif. Perbaikan butir soal dapat dilakukan pada pokok soal atau pada
alternatif jawaban.
C. Menganalisis Tes Uraian
Cara menganalisis tes uraian menurut
Whitney dan Sabers (Mehrens dan Lehmann, 1984) adalah : (1) tentukan jumlah
siswa yang termasuk kelompok atas (25%) dan kelompok bawah (25%), (2) hitung
jumlah skor kelompok atas dan jumlah skor kelompok bawah, dan (3) hitung
tingkat kesukaran dan daya beda setiap butir soal dengan rumus berikut :
Dimana
SA
: jumlah skor kelompok atas
SB
: jumlah skor kelompok bawah
N
: 25%
peserta didik
Skor
maks : skor maksimal tiap buti tes
Skor
min : skor minimal tiap butir tes
D. Memperbaiki Butir Soal
Beberapa hal yang perlu diperhatikan
dalam memperbaiki butir soal antara lain : a) perhatikan tingkat kesukaran
soal. Butir soal dianggap baik jika mempunyai tingkat kesukaran (P) antara 0,25
sampai dengan 0,75 atau mendekati angka tersebut, b) perhatikan daya beda butir
soal. Butir soal dianggap baik jika kunci atau jawabannya dianggap benar
mempunyai beda positif tinggi dan pengecohnya mempunyai daya beda negatif.
E. Memperbaiki Non-Tes
Prosedur memperbaiki instrument
non-tes sama dengan prosedur memperbaiki tes. Penyempurnaan butir yang lemah
dapat dilaksanakan dengan memperbaiki butir yang kurang baik atau mengganti
butir yang lama dengan butir yang baru. Penyebab butir soal kurang baik, antara
lain: a) penggunaan bahasa kurang komunikatif, b) kalimat dapat ditafsirkan
ambiguous (dapat ditafsirkan ganda), c) pertanyaan / pernyataan yang dibuat
menyimpang dari indikator, dan d) pertanyaan / pernyataan tidak mengukur tarif
(sifat) yang akan diukur.