Kegiatan menilai dapat diibaratkan kegiatan memotret. Dalam memotret memerlukan alat potret. Gambar potret atau foto dikatakan baik apabila sesuai dengan keadaan yang sebenarnya. Alat potret dalam kegiatan penilaian disebut dengan instrument penilaian, baik menggunakan tes maupun non-tes. Gambar hasil pemotretan dalam kegiatan penilaian dikenal dengan data penilaian. Data yang baik adalah data yang sesuai dengan kenyataan yang sebenarnyadan data tersebut besifat tetao, ajeg atau dapat dipercaya. Data yang sesuai dengan keadaan yang sebenarnya disebut data yang falid. Data yang dapat di percaya disebut data yang reliabel. Agar dapat diperoleh data yang valid dan reliabel, maka instrument penilaian yang digunakan untuk mengukur objek yang akan dinilai baik tes maupun non-tes harus memiliki bukti validitas dan realibilitas

2. Rumusan Masalah

a. Apa pengertian validitas dan reliabilitas ?

b. Apa macam-macam validitas ?

c. Bagaimana cara-cara mengetahui validitas alat ukur ?

d. Apa yang dimaksud validitas butir soal atau validitas item ?

e. Bagaimana cara mencari besarnya reliabilitas ?

3. Tujuan

a. Untuk mengetahui pengertian dari validitas dan reliabilitas.

b. Untuk mengetahui macam-macam dari validitas.

c. Untuk mengetahui validitas alat ukur dan besaran reliabilitas.

d. Untuk mengetahui validitas butir soal atau validitas item.

e. Untuk mengetahui cara mencari besarnya reliabilitas.

B. Pembahasan

1. Pengertian validitas dan reliabilitas

Alat ukur dikatakan valid apabila alat ukur itu dapat dengan tepat mengukur apa yang hendak diukur. Dengan kata lain validitas berkaitan dengan “ketepatan” dengan alat ukur. Tes sebagai salah satu alat ukur hasil belajar dapat dikatakan valid apabila tes itu dapat tepat mengukur hasil belajar yang hendak diukur. Dengan tes yang valid akan menghasilkan data hasil belajar yang valid pula.[1]

Valid berarti cocok atau sesuai. Suatu tes dikatakan valid, apabila tes tersebut benar-benar menyasar kepada apa yang di tuju. Tes tersebut benar-benar dapat memberikan keterangan atau gambaran tentang apa yang diinginkan. Jika tes itu Bahasa, maka tes tersebut harus memberikan gambaran tentang kemampuan dan kecakapan anak dalam hal Bahasa, dan bukan menunjukkan gambaran kecakapan anak dalam hal ekonomi, ilmu bumi dan sebagainya.[2]

Sedangkan reliabilitas dalam Bahasa Indonesia diambil dari kata reliability dalam Bahasa inggris, berasal dari kata asal reliable yang artinya dapat dipercaya. Seorang dikatakan dapat dipercaya jika seorang tersebut selalu bicara ajek (konsisten), tidak berubah-ubah pembicaraannya dari waktu ke waktu. Demikian juga halnya dengan sebuah tes. Tes tersebut dikatan dapat dipercaya (reliable) jika memberikan hasil yang tetap atau ajek (consistent) apabila diteskan berkali-kali. Jika kepada siswa diberikan tes yang sama yang pada waktu yang berlainan, maka setiap siswa akan tetap berada dalam urutan (ranking) yang sama atau ajek dalam kelompoknya.

Ajek atau tetap tidak selalu harus sama, tetapi mengikuti perubahan secara ajek. Jika keadaan A mula-mula berada lebih rendah dibandingkan dengan B, maka jika diadakan pengukuran ulang, si A tetap berada lebih rendah dari B. itulah yang dikatakan ajek atau tetap, yaitu tetap dalam kedudukan siswa di antara anggota kelompok yang lain. Jika dihubungkan dengan validitas, maka validitas berhubungan dengan ketepatan, sedangkan reliabilitas berhubungan dengan ketetapan atau keajekan.[3]

2. Macam-macam validitas

Secara umum ada dua macam validitas, yaitu validitas logis dan validitas empiris.

a. Validitas logis

Istilah "validitas logis mengandung kata" logis "yang berasal dari kata" logika ", yang berarti penalaran. Dengan makna tersebut maka validitas logis untuk instrumen evaluasi mengacu pada kondisi instrumen yang memenuhi persyaratan yang berlaku berdasarkan hasil penalaran. Kondisi yang berlaku dianggap terpenuhi karena instrumen yang bersangkutan dirancang dengan baik, mengikuti teori dan ketentuan yang ada. Seperti halnya eksekusi tugas lainnya misalnya membuat sebuah karangan jika penulis sudah siap aturan mengarang, tentu saja secara logis karangannya sudah baik. Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun berdasarkan teori. Dari penjelasan tersebut kita bisa memahamibahwa validitas logis dapat dicapai. Dengan demikian dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya, tetapi langsung diperoleh sesudah instrumen tersebut selesai disusun.

Ada dua macam validasi logis yang dapat di capai oleh sebuah instrumen, yaitu: validitas isi dan validitas kontras (contruct validity). Validitas isi bagi sebuah instrumen menunjuk suatu komdisi kondisi sebuah instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Selanjutnya validitas kontrak sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi. Penjelasan lebih jauh tentang kedua jenis validitas logis inl akan diberikan berturut-turut dalam membahas jenis-jenis validitas instrumen nanti

b. Validitas Empiris

Istilah "validitas empiris" kata kunci "empiris" yang berarti sebuah instrumen dapat dikatakan memiliki validitas empiris. Sebagai contoh sehari-hari, seseorang dapat saling mengabulkan oleh masyarakat dalam pengalaman yang dibuktikan orang tersebut memang jujur. Contoh lain, seseorang bisa dikatakan kreatif dari pengalaman yang sudah dibuktikan orang itu sudah banyak terbentuk ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan dan contoh-contohnya yang diketahui validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen berdasarkan ketentuan validitas logis, maka harus dibuktikan melalui pengalaman.

Ada dua macam validitas empiris, ada dua cara yang dapat dilakukan untuk menguji bahwa sebuah instrumen memang valid.

Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai pembanding kondisi instrumen dimaksud ada dua, yaitu: yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang sudah tersedia, yang sudah ada, disebut memiliki validitas ada sekarang", yang dalam istilah bahasa Inggris disebut memiliki concurrent validity. Selanjutnya instrumen yang kondisinya sesuai dengan kriterium yang diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang dalam istilah bahasa Inggris disebut memiliki predictive validity.

Dari uraian adanya dua jenis validitas, yakni validitas logis yang ada dua macam, dan validitas empiris, yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya empat validitas, yaitu: (1) validitas isi, (2) validitas konstrak, (3) validitas "ada sekarang", dan (4) validitas predictive.

Dua yang pertama, yakni (1) dan (2) dicapai melalui penyusunan berdasarkan ketentuan atau teori, sedangkan dua berikutnya, yakni (3)dan (4) dicapai atau diketahui sesudah dibuktikan melalui pengalaman. Adapun penjelasan masing-masing validitas adalah sebagai berikut.

1) Validitas isi (content validity)

Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan olehkarena materi yang diajarkan tertera dalam kurikulum maka validitas isi ini sering juga disebut validitas kurikuler.

validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara memerinci materi kurikulum atau mater, buku pelajaran. Bagaimana cara memerinci materi untuk kepentingan diperolehnya validitas isi sebuah tes akan dibicarakan secara lebih mendalam pada waktu menjelaskan cara penyusunan tes.

2) Validitas konstruksi (construct validity)

Sebuah tes dikatakan memiliki validitas konstruksi apa bila butir-butir oal yang membangun tes tersebut mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan Instruksional Khusus. Dengan kata lain jika butir butir soal mengukur aspek berpikir tersebutsudah sesuai dengan aspek berpikiryang menjadi tujuan instruksional.

Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK): "Siswa dapat membandingkan antara efek biologis dan efek psikologis" maka butir soal pada tes merupakan perintah agar siswa membedakan antara dua efektersebut. Sekarang TIK dikenal dengan Indikator.

"Konstruksi" dalam pengertian ini bukanlah "susunan" seperti yang sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis, yaitu suatu rekaan yang dibuat oleh para ahli llmu Jiwa yang dengan suatu cara tertentu "memerinci isi jiwa atas beberapa aspek seperti: ingatan (pengetahuan), pemahaman, aplikasi, dan seterusnya. Dalam hal ini, mereka menganggap seolah-olah jiwa dapat dibagi-bagi, tetapi sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan sementara untuk mempermudah mempelajari.

Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara memerinci dan memasangkan setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan berdasarkan logika, bukan pengalaman. Dalam pembicaraan mengenai penyusunan tes hal ini akan disinggung lagi.

3) Validitas "ada sekarang" (concurrent validity)

Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah sesuai" tentu ada dua hal yang dipasangkan. Dalam hal ini, hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent).

Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat banding. Maka hasil tes merupakan sesuatu yang dibandingkan. Untuk jelasnya di bawah ini dikemukakan sebuah contoh.

Misalnya, seorang guru ingin mengetahui apakah tes sumatif yang disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai ulangan sumatifyang lalu.

4) Validitas prediksi (predictive validity)

Memprediksi artinya meramal, dengan meramal selalu mengenal hat yang akan datang jadi sekarang belum terjadi. Sebuah tes dika takan memiliki validitas prediksi atau validitas ramalan apabila mempunyal kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan datang.

Misalnya, tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah di masa yang akan datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin keberhasilannya kelak. Sebaliknya, seorang calon dikatakan tidak lulus tes karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.

sebagai alat pembandi validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya lebih rendah, maka tes masuk yang dimaksud tidak memiliki validitas prediksi.[4]

3. Validitas alat ukur

Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran adalah teknik korelasi product moment yang dikemukakan oleh pearson.

Rumus korelasi product moment ada 2 (dua) macam, yaitu:

a. Korelasi product moment dengan simpangan.

Rumus korelasi product moment dengan simpangan:

Di mana:

= koefisien korelasi antara variable X dan variable Y, dua variable yang dikorelasikan (x = X- X dan y = Y- Y).

= jumlah perkalian x dan y.

= kuadrat dari x.

= kuadrat dari y.

Contoh perhitungan:

Misalnya akan menghitung validitas tes prestasi belajar matematika. Sebagai kriterium diambil rata-rata ulangan yang akan dicari validitasnya diberi kode X dan rata-rata nilai harian diberi kode Y.

b. Korelasi product moment dengan angka kasar.

Rumus korelasi product moment dengam angka kasar.

Dimana:

= koefisien korelasi antara variable X dan variable Y, dua variable yang di korelasikan.[5]

4. validitas butir soal atau validitas item

Pengertian umum untuk validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total. Skor pada item menyebabkan skor total menjadi tinggi atau rendah dengan kata lain dapat dikemukakan disini bahwa sebuah item memiliki validitas yang tinggi jika skor pada item mempunyai kesejajaran dengan skor total. Kesejajaran ini dapat diartikan dengan korelasi sehingga untuk mengetahui validitas item digunakan rumus korelasi.

Untuk soal-soal bentuk objektif skor untuk item biasa diberikan dengan 1 (bagi item yang di jawab benar) dan 0 (item yang di jawab salah), sedangkan skor total selanjutnya merupakan jumlah dari skor untuk semua item yang membangun soal tersebut.

Misalnya, akan dihitung validitas item no.6 maka skor item tersebut variable X dan skor total disebut variable Y. selanjutnya perhitungan dilakukan dengan menggunakan rumus korelasi product moment, baik dengan rumus simpangan maupun rumus angka kasar.

5. Cara-cara mencari besarnya reliabilitas

Sekali lagi reliabilitas adalah ketetapan suatubtes apanila diteskan kepada subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.

Kriteria yang digunakan untuk mengetahui ketetapan ada yang berada duliar tes (consistency external) dan opada tes itu sendiri (consistency internal).

a. Metode bentuk parallel (equivalent)

Tes parallel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesukaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa inggris disebut altenate forms method.

Dengan metode bentuk parallel ini, dua buah tes yang parallel misalnya tes Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan koefien reliabilitas tes seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat digunakan sebagai alat pengetes yang terandalkan.

Dalam menggunakan metode tes parallel ini pengetes harus menyiapakan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang yang menyebutkan sebagai double test-double –trial method. Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada factor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-effect dan corry-over effect, artinya ada factor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.

Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.

b. Metode Tes Ulang (test-retest Method)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes, tetapi dicobkan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali, maka metode ini dapat disebut dengan single-test-double method. Kemudian hasil dari kedua kali ini tersebut dihitung korelasinya.

Untuk tes yang banyak mengungkap pengetahuan dan pemahaman, cara ini kurang mengena karena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu antara pemberian tes pertama dengan kedua menjadi permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa mmasih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu lama, maka factor-faktor atau kondisi tes sudah akan berbeda dan siswa sendiri barangkali sudah mempelajari sesuatu. Tentu saja factor-faktor ini akan berpengaruh pula terhadap reliabilitas.

Metode ini juga disebut korelasi diri sendiri (self-correlation method) karena mengkorelasi hasil tes yang sama.

c. Metode Belah dua atau Split-half method

Kelemahan penggunaan metode dua tes dua kali percobaan dan satu tes dua kali percobaan diatasi dengan metode ketiga ini, yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan satu kali. Oleh karena itu, disebut juga sungle-test-single trial method

Berbeda dengan metode pertama dan kedua yang setelah ditemukannya koefisien korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan korelasikan dua belahan, Baru diketahui reliabilitas separo tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus spearman-brown.

Banyak pemakai metode ini salah membelah hasil tes pada waktu, menganalisis. Yang mereka lakukan adalah mengelompokkan hasil separo subjek pesrta tes dan separo yang lain kemudian hasil kedua kelompok dikorelasikan. Yang benar adalah membelah item atau butir-soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapat dibelah.

Ada dua cara membelah dua soal ini, yaitu:

A. Membelah atas item genap dan item ganjil yang selanjutnya disebut belahan ganjil-genap.

B. Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada nomor-nomor awal dan separo pada nomor – nomor akhir yang selanjutnya disebut belahan awal-akhir.[6]

C. Kesimpulan

1. Validitas berhubungan dengan kemampuan untuk mengukur secara tepat sesuatu yang diinginkan diukur.[7]

Reliabilitas berhubungan dengan akurasi instrument dalam mengukur apa yang diukur, kecermatan hasil ukur dan seberapa akurat seandainya dilakukan pengukuran ulang.[8]

2. Secara umum ada dua macam validitas, yaitu validitas logis dan validitas empiris.

3. Sebuah tes dikatakan memiliki validitas jika hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes tersebut dengan kriterium.

4. validitas item adalah demikian sebuah item dikatakan valid apabila mempunyai dukungan yang besar terhadap skor total.

5. Metode dalam mencari besarnya reliabilitas dibagi menjadi tiga metode bentuk parallel, metode tes ulang, dan metode Belah dua atau Split-half method.

DAFTAR PUSTAKA

Widoyoko, eko putro, 2009, Evaluasi Program Pembelajaran, Yogyakarta : Pustaka Pelajar

Sulistyorini, 2009, Evaluasi Pendidikan, Yogyakarta : Teras

Arikunto, Suharsimi, 2012, dasar-dasar Evaluasi Pendidikan, Jakarta : PT Bumi Askara

Purwanto, 2009, Evaluasi Hasil Belajar, Yogyakarta : Pustaka Belajar

[1] Prof. Dr. S. Eko Putro Widoyoko, M.Pd, Evaluasi Program Pembelajaran, (Yogyakarta: Pustaka Pelajar, 2009), 98.

[2] Sulistyorini, evaluasi pendidikan, (Yogyakarta: Teras, 2009), 161.

[3] Ibid, 99-100.

[4] Prof. Dr. Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi Askara, 2012), 80-84.

[5] Prof. Dr. Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi Askara, 2012), 85-87.

[6] Prof. Dr. Suharsimi Arikunto, Dasar-dasar Evaluasi Pendidikan, (Jakarta: PT Bumi Askara, 2012), 104.

[7] DR. Purwanto, Evaluasi hasil belajar, (Yogyakarta: Pustaka Belajar, 2009), 114.

[8] Ibid, 154.

Cari Blog Ini

japra's blog

VALIDITAS dan RELIABILITAS

Daftar Isi

A. Pendahuluan

B. Pembahasan

1. Pengertian validitas dan reliabilitas

2. Macam-macam validitas

3. Validitas alat ukur

4. validitas butir soal atau validitas item

5. Cara-cara mencari besarnya reliabilitas

C. Kesimpulan

DAFTAR PUSTAKA

Komentar

Posting Komentar

Postingan Populer

PERANCANGAN SISTEM INFORMASI MANAJEMEN PENDIDIKAN

Lingkungan Eksternal Organisasi Pendidikan