VALIDITAS dan RELIABILITAS
MAKALAH
VALIDITAS dan RELIABILITAS
Disusun
untuk memenuhi tugas mata kuliah Evaluasi Pembelajaran
Dosen
pengampu : Dr. H. Mokhamad Endri Julianto, M.Pd.
Disusun oleh :
Durotus Shaimah (15170009)
Ja’far Shodiq (15170012)
Ulfatus Syafa’ah (15170015)
Irkham Rois Annur (15170045)
JURUSAN MANAJEMEN PENDIDIKAN ISLAM
FAKULTAS ILMU TARBIYAH DAN KEGURUAN
UIN MAULANA MALIK IBRAHIM MALANG
2017
A.
Pendahuluan
1. Latar belakang
Kegiatan
menilai dapat diibaratkan kegiatan memotret. Dalam memotret memerlukan alat
potret. Gambar potret atau foto dikatakan baik apabila sesuai dengan keadaan
yang sebenarnya. Alat potret dalam kegiatan penilaian disebut dengan instrument
penilaian, baik menggunakan tes maupun non-tes. Gambar hasil pemotretan dalam
kegiatan penilaian dikenal dengan data penilaian. Data yang baik adalah data
yang sesuai dengan kenyataan yang sebenarnyadan data tersebut besifat tetao,
ajeg atau dapat dipercaya. Data yang sesuai dengan keadaan yang sebenarnya
disebut data yang falid. Data yang dapat di percaya disebut data yang reliabel.
Agar dapat diperoleh data yang valid dan reliabel, maka instrument penilaian
yang digunakan untuk mengukur objek yang akan dinilai baik tes maupun non-tes
harus memiliki bukti validitas dan realibilitas
2. Rumusan Masalah
a. Apa pengertian validitas dan reliabilitas
?
b. Apa macam-macam validitas ?
c. Bagaimana cara-cara mengetahui validitas
alat ukur ?
d. Apa yang dimaksud validitas butir soal
atau validitas item ?
e. Bagaimana cara mencari besarnya
reliabilitas ?
3. Tujuan
a. Untuk mengetahui pengertian dari
validitas dan reliabilitas.
b. Untuk mengetahui macam-macam dari
validitas.
c. Untuk mengetahui validitas alat ukur dan
besaran reliabilitas.
d. Untuk mengetahui validitas butir soal
atau validitas item.
e. Untuk mengetahui cara mencari besarnya
reliabilitas.
B. Pembahasan
1. Pengertian validitas dan
reliabilitas
Alat
ukur dikatakan valid apabila alat ukur itu dapat dengan tepat mengukur apa yang
hendak diukur. Dengan kata lain validitas berkaitan dengan “ketepatan” dengan
alat ukur. Tes sebagai salah satu alat ukur hasil belajar dapat dikatakan valid
apabila tes itu dapat tepat mengukur hasil belajar yang hendak diukur. Dengan
tes yang valid akan menghasilkan data hasil belajar yang valid pula.[1]
Valid
berarti cocok atau sesuai. Suatu tes dikatakan valid, apabila tes tersebut benar-benar
menyasar kepada apa yang di tuju. Tes tersebut benar-benar dapat memberikan
keterangan atau gambaran tentang apa yang diinginkan. Jika tes itu Bahasa, maka
tes tersebut harus memberikan gambaran tentang kemampuan dan kecakapan anak
dalam hal Bahasa, dan bukan menunjukkan gambaran kecakapan anak dalam hal
ekonomi, ilmu bumi dan sebagainya.[2]
Sedangkan
reliabilitas dalam Bahasa Indonesia diambil dari kata reliability dalam Bahasa
inggris, berasal dari kata asal reliable yang artinya dapat dipercaya. Seorang
dikatakan dapat dipercaya jika seorang tersebut selalu bicara ajek (konsisten),
tidak berubah-ubah pembicaraannya dari waktu ke waktu. Demikian juga halnya
dengan sebuah tes. Tes tersebut dikatan dapat dipercaya (reliable) jika
memberikan hasil yang tetap atau ajek (consistent) apabila diteskan
berkali-kali. Jika kepada siswa diberikan tes yang sama yang pada waktu yang
berlainan, maka setiap siswa akan tetap berada dalam urutan (ranking) yang sama
atau ajek dalam kelompoknya.
Ajek
atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajek.
Jika keadaan A mula-mula berada lebih rendah dibandingkan dengan B, maka jika
diadakan pengukuran ulang, si A tetap berada lebih rendah dari B. itulah yang
dikatakan ajek atau tetap, yaitu tetap dalam kedudukan siswa di antara anggota
kelompok yang lain. Jika dihubungkan dengan validitas, maka validitas
berhubungan dengan ketepatan, sedangkan reliabilitas berhubungan dengan
ketetapan atau keajekan.[3]
2. Macam-macam validitas
Secara umum
ada dua macam validitas, yaitu validitas logis dan validitas empiris.
a.
Validitas logis
Istilah "validitas logis mengandung kata"
logis "yang berasal dari kata" logika ", yang berarti penalaran.
Dengan makna tersebut maka validitas logis untuk instrumen evaluasi mengacu
pada kondisi instrumen yang memenuhi persyaratan yang berlaku berdasarkan hasil
penalaran. Kondisi yang berlaku dianggap terpenuhi karena instrumen yang
bersangkutan dirancang dengan baik, mengikuti teori dan ketentuan yang ada.
Seperti halnya eksekusi tugas lainnya misalnya membuat sebuah karangan jika
penulis sudah siap aturan mengarang, tentu saja secara logis karangannya sudah
baik. Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun
berdasarkan teori. Dari penjelasan tersebut kita bisa memahamibahwa validitas
logis dapat dicapai. Dengan demikian dapat disimpulkan bahwa validitas logis
tidak perlu diuji kondisinya, tetapi langsung diperoleh sesudah instrumen
tersebut selesai disusun.
Ada dua
macam validasi logis yang dapat di capai oleh sebuah instrumen, yaitu:
validitas isi dan validitas kontras (contruct validity). Validitas isi bagi
sebuah instrumen menunjuk suatu komdisi kondisi sebuah instrumen yang disusun
berdasarkan isi materi pelajaran yang dievaluasi. Selanjutnya validitas kontrak
sebuah instrumen yang disusun berdasarkan
konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi. Penjelasan lebih jauh
tentang kedua jenis validitas logis inl akan diberikan berturut-turut dalam
membahas jenis-jenis validitas instrumen nanti
b.
Validitas
Empiris
Istilah
"validitas empiris" kata kunci "empiris" yang berarti sebuah
instrumen dapat dikatakan memiliki validitas empiris. Sebagai contoh
sehari-hari, seseorang dapat saling mengabulkan oleh masyarakat dalam
pengalaman yang dibuktikan orang tersebut memang jujur. Contoh lain, seseorang
bisa dikatakan kreatif dari pengalaman yang sudah dibuktikan orang itu sudah
banyak terbentuk ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada.
Dari penjelasan dan contoh-contohnya yang diketahui validitas empiris tidak
dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan validitas
logis, maka harus dibuktikan melalui pengalaman.
Ada dua
macam validitas empiris, ada dua cara yang dapat dilakukan untuk menguji bahwa
sebuah instrumen memang valid.
Pengujian
tersebut dilakukan dengan membandingkan kondisi instrumen yang bersangkutan
dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai
pembanding kondisi instrumen dimaksud ada dua, yaitu: yang sudah tersedia dan
yang belum ada tetapi akan terjadi di waktu yang akan datang. Bagi instrumen
yang kondisinya sesuai dengan kriterium yang sudah tersedia, yang sudah ada,
disebut memiliki validitas ada sekarang", yang dalam istilah bahasa
Inggris disebut memiliki concurrent validity. Selanjutnya instrumen yang
kondisinya sesuai dengan kriterium yang diramalkan akan terjadi, disebut
memiliki validitas ramalan atau validitas prediksi, yang dalam istilah bahasa
Inggris disebut memiliki predictive validity.
Dari uraian
adanya dua jenis validitas, yakni validitas logis yang ada dua macam, dan
validitas empiris, yang juga ada dua macam, maka secara keseluruhan kita
mengenal adanya empat validitas, yaitu: (1) validitas isi, (2) validitas
konstrak, (3) validitas "ada sekarang", dan (4) validitas predictive.
Dua yang
pertama, yakni (1) dan (2) dicapai melalui penyusunan berdasarkan ketentuan
atau teori, sedangkan dua berikutnya, yakni (3)dan (4) dicapai atau diketahui
sesudah dibuktikan melalui pengalaman. Adapun penjelasan masing-masing
validitas adalah sebagai berikut.
1)
Validitas
isi (content validity)
Sebuah tes
dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang
sejajar dengan materi atau isi pelajaran yang diberikan olehkarena materi yang
diajarkan tertera dalam kurikulum maka validitas isi ini sering juga disebut
validitas kurikuler.
validitas
isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara memerinci
materi kurikulum atau mater, buku pelajaran. Bagaimana cara memerinci materi
untuk kepentingan diperolehnya validitas isi sebuah tes akan dibicarakan secara
lebih mendalam pada waktu menjelaskan cara penyusunan tes.
2)
Validitas
konstruksi (construct validity)
Sebuah tes
dikatakan memiliki validitas konstruksi apa bila butir-butir oal yang membangun
tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan
Instruksional Khusus. Dengan kata lain jika butir butir soal mengukur aspek
berpikir tersebutsudah sesuai dengan aspek berpikiryang menjadi tujuan
instruksional.
Sebagai
contoh jika rumusan Tujuan Instruksional Khusus (TIK): "Siswa dapat
membandingkan antara efek biologis dan efek psikologis" maka butir soal
pada tes merupakan perintah agar siswa membedakan antara dua efektersebut.
Sekarang TIK dikenal dengan Indikator.
"Konstruksi"
dalam pengertian ini bukanlah "susunan" seperti yang sering dijumpai
dalam teknik, tetapi merupakan rekaan psikologis, yaitu suatu rekaan yang
dibuat oleh para ahli llmu Jiwa yang dengan suatu cara tertentu "memerinci
isi jiwa atas beberapa aspek seperti: ingatan (pengetahuan), pemahaman,
aplikasi, dan seterusnya. Dalam hal ini, mereka menganggap seolah-olah jiwa
dapat dibagi-bagi, tetapi sebenarnya tidak demikian. Pembagian ini hanya
merupakan tindakan sementara untuk mempermudah mempelajari.
Seperti
halnya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci
dan memasangkan setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya
dilakukan berdasarkan logika, bukan pengalaman. Dalam pembicaraan mengenai
penyusunan tes hal ini akan disinggung lagi.
3)
Validitas
"ada sekarang" (concurrent validity)
Validitas
ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki
validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah
sesuai" tentu ada dua hal yang dipasangkan. Dalam hal ini, hasil tes
dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah
lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang,
concurrent).
Dalam
membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat
banding. Maka hasil tes merupakan sesuatu yang dibandingkan. Untuk jelasnya di
bawah ini dikemukakan sebuah contoh.
Misalnya,
seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau
belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya
dimiliki. Misalnya nilai ulangan harian atau nilai ulangan sumatifyang lalu.
4)
Validitas
prediksi (predictive validity)
Memprediksi
artinya meramal, dengan meramal selalu mengenal hat yang akan datang jadi
sekarang belum terjadi. Sebuah tes dika takan memiliki validitas prediksi atau
validitas ramalan apabila mempunyal kemampuan untuk meramalkan apa yang akan
terjadi pada masa yang akan datang.
Misalnya, tes masuk Perguruan Tinggi adalah sebuah tes
yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti
kuliah di masa yang akan datang. Calon yang tersaring berdasarkan hasil tes
diharapkan mencerminkan tinggi-rendahnya kemampuan mengikuti kuliah. Jika nilai
tesnya tinggi tentu menjamin keberhasilannya kelak. Sebaliknya, seorang calon
dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi
diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.
sebagai alat pembandi validitas prediksi adalah
nilai-nilai yang diperoleh setelah
peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang
memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan
yang dahulu nilai tesnya lebih rendah, maka tes masuk yang dimaksud tidak
memiliki validitas prediksi.[4]
3. Validitas alat ukur
Sebuah
tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam
arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik
yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh
pearson.
Rumus
korelasi product moment ada 2 (dua) macam, yaitu:
a. Korelasi product moment dengan simpangan.
Rumus
korelasi product moment dengan
simpangan:
Di mana:
Contoh
perhitungan:
Misalnya akan
menghitung validitas tes prestasi belajar matematika. Sebagai kriterium diambil
rata-rata ulangan yang akan dicari validitasnya diberi kode X dan rata-rata
nilai harian diberi kode Y.
b. Korelasi product moment dengan angka kasar.
Rumus
korelasi product moment dengam angka
kasar.
Dimana:
4. validitas butir soal atau
validitas item
Pengertian umum untuk
validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai
dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total
menjadi tinggi atau rendah dengan kata lain dapat dikemukakan disini bahwa sebuah
item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran
dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga
untuk mengetahui validitas item digunakan rumus korelasi.
Untuk soal-soal bentuk objektif skor untuk
item biasa diberikan dengan 1 (bagi item yang di jawab benar) dan 0 (item yang
di jawab salah), sedangkan skor total selanjutnya merupakan jumlah dari skor
untuk semua item yang membangun soal tersebut.
Misalnya, akan dihitung validitas item
no.6 maka skor item tersebut variable X dan skor total disebut variable Y.
selanjutnya perhitungan dilakukan dengan menggunakan rumus korelasi product
moment, baik dengan rumus simpangan maupun rumus angka kasar.
5. Cara-cara mencari besarnya
reliabilitas
Sekali lagi reliabilitas adalah
ketetapan suatubtes apanila diteskan kepada subjek yang sama. Untuk mengetahui
ketetapan ini pada dasarnya dilihat
kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus
korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam
reliabilitas tes.
Kriteria yang digunakan untuk
mengetahui ketetapan ada yang berada duliar tes (consistency external) dan
opada tes itu sendiri (consistency internal).
a. Metode bentuk parallel (equivalent)
Tes
parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan,
tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam
istilah bahasa inggris disebut altenate forms method.
Dengan
metode bentuk parallel ini, dua buah tes yang parallel misalnya tes Matematika
seri A yang akan
dicari reliabilitasnya dan tes seri B diteskan kepada sekelompok siswa yang
sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes
inilah yang menunjukkan
koefien reliabilitas tes seri A. jika koefisiennya tinggi maka tes tersebut
sudah reliable dan dapat digunakan sebagai alat pengetes yang terandalkan.
Dalam
menggunakan metode tes parallel ini pengetes harus menyiapakan dua buah tes,
dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada
orang yang menyebutkan sebagai double test-double –trial method. Penggunaan
metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada
factor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-effect
dan corry-over effect, artinya ada factor yang dibawa oleh pengikut tes karena
sudah mengerjakan soal tersebut.
Kelemahan
dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun
dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua
kali tes.
b. Metode Tes Ulang (test-retest Method)
Metode
tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam
menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes,
tetapi dicobkan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali,
maka metode ini dapat disebut dengan single-test-double method. Kemudian hasil
dari kedua kali ini tersebut dihitung korelasinya.
Untuk
tes yang banyak mengungkap pengetahuan dan pemahaman, cara ini kurang mengena
karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu,
tenggang waktu antara pemberian tes pertama dengan kedua menjadi permasalahan
tersendiri. Jika tenggang waktu terlalu sempit, siswa mmasih banyak ingat
materi. Sebaliknya kalau tenggang waktu terlalu lama, maka factor-faktor atau
kondisi tes sudah akan berbeda dan siswa sendiri barangkali sudah mempelajari
sesuatu. Tentu saja factor-faktor ini akan berpengaruh pula terhadap
reliabilitas.
Metode
ini juga disebut korelasi diri sendiri (self-correlation method) karena
mengkorelasi hasil tes yang sama.
c. Metode Belah dua atau Split-half method
Kelemahan
penggunaan metode dua tes dua kali percobaan dan satu tes dua kali percobaan
diatasi dengan metode ketiga ini, yaitu metode belah dua. Dalam menggunakan
metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh
karena itu, disebut juga sungle-test-single trial method
Berbeda
dengan metode pertama dan kedua yang setelah ditemukannya koefisien korelasi
langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga
ini tidak dapat demikian. Pada waktu membelah dua dan korelasikan dua belahan,
Baru diketahui reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh
tes harus digunakan rumus spearman-brown.
Banyak
pemakai metode ini salah membelah hasil tes pada waktu, menganalisis. Yang
mereka lakukan adalah mengelompokkan hasil separo subjek pesrta tes dan separo
yang lain kemudian hasil kedua kelompok dikorelasikan. Yang benar adalah
membelah item atau butir-soal. Tidak akan keliru kiranya bagi pemakai metode
ini harus ingat bahwa banyaknya butir soal harus genap agar dapat dibelah.
Ada
dua cara membelah dua soal ini, yaitu:
A. Membelah atas item genap dan item ganjil
yang selanjutnya disebut belahan ganjil-genap.
B. Membelah atas item-item awal dan
item-item akhir yaitu separo jumlah pada nomor-nomor awal dan separo pada nomor
– nomor akhir yang selanjutnya disebut belahan awal-akhir.[6]
C. Kesimpulan
1. Validitas berhubungan dengan kemampuan
untuk mengukur secara tepat sesuatu yang diinginkan diukur.[7]
Reliabilitas
berhubungan dengan akurasi instrument dalam mengukur apa yang diukur,
kecermatan hasil ukur dan seberapa akurat seandainya dilakukan pengukuran
ulang.[8]
2.
Secara umum
ada dua macam validitas, yaitu validitas logis dan validitas empiris.
3. Sebuah tes dikatakan memiliki validitas
jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara
hasil tes tersebut dengan kriterium.
4. validitas item adalah demikian sebuah
item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total.
5. Metode dalam mencari besarnya
reliabilitas dibagi menjadi tiga metode bentuk parallel, metode tes ulang, dan
metode Belah dua atau Split-half method.
DAFTAR
PUSTAKA
Widoyoko,
eko putro, 2009, Evaluasi Program
Pembelajaran, Yogyakarta : Pustaka Pelajar
Sulistyorini,
2009, Evaluasi Pendidikan, Yogyakarta
: Teras
Arikunto,
Suharsimi, 2012, dasar-dasar Evaluasi
Pendidikan, Jakarta : PT Bumi Askara
Purwanto,
2009, Evaluasi Hasil Belajar,
Yogyakarta : Pustaka Belajar
[1] Prof.
Dr. S. Eko Putro Widoyoko, M.Pd, Evaluasi Program Pembelajaran, (Yogyakarta:
Pustaka Pelajar, 2009), 98.
[4] Prof.
Dr. Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi
Askara, 2012), 80-84.
[5] Prof.
Dr. Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi
Askara, 2012), 85-87.
[6] Prof.
Dr. Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi
Askara, 2012), 104.
[7] DR. Purwanto, Evaluasi hasil belajar, (Yogyakarta: Pustaka Belajar,
2009), 114.
[8] Ibid, 154.
Komentar
Posting Komentar