VALIDITAS BERDASARKAN KRITERIA (CRITERION-RELATED VALIDITY)

Oleh : Hendryadi

ABSTRAK

Validitas adalah sejauh mana skor dihasilkan oleh instrumen mengukur karakteristik atau variabel yang dimaksudkan dapat digunakan untuk mengukur populasi tertentu. Secara umum, dikenal tiga jenis validitas yaitu validitas konten / content validity, yaitu sejauh mana item pada instrumen mewakili konten yang diukur, validitas terkait-kriteria / criterion related-validiy yaitu sejauh mana skor pada instrumen yang terkait dengan variabel eksternal / kriteria independen lainnya, dan validitas konsep / construct validity yaitu sejauh mana instrumen dapat diartikan sebagai ukuran yang tepat dari beberapa karakteristik atau sejauh mana test yang dimaksud mengukur sebuah konstrak teoritis atau ciri-sifat. Artikel ini secara khusus akan membahas mengenai validitas kriteria sebagai kelanjutan tulisan sebelumnya mengenai validitas konten.

Keyword: criterion-related validity

PENDAHULUAN

Validitas dalam sebuah pengembangan instrument merupakan isu penting sekaligus memiliki banyak kontroversi dan perdebatan. Evaluasi pertama dalam upaya untuk menentukan kesesuaian tes dimulai Guilford (1946) yang kemudian validitas ini memperoleh spesifikasi teoritis. Pada tahun 1949 Cronbach mengembangkan gagasan mengenai validitas logis dan empiris. Validitas logis disebut penilaian tentang apa langkah-langkah tes dan validitas empiris yang mengacu pada Guilford  (1946) melalui perbandingan statistik dari skor tes dengan langkah-langkah yang sama. Pada tahun 1954 Anastasi memberikan kategori validitas dalam beberapa jenis, yaitu validitas tampang (face validity), konten (content validity), faktorial dan validitas empiris. Pada tahun yang sama, Rekomendasi Teknis (APA, 1954) membagi empat jenis validitas (yaitu, konten, prediksi, bersamaan, dan validitas konstak (content, predictive, concurrent, and construct validities). Keempat jenis ini kemudian dikurangi menjadi tiga dengan kombinasi validitas prediktif dan kriteria (APA, 1966).

CRITERION-RELATED VALIDITY

Validitas berdasarkan kriteria atau criterion-related validity merupakan sebuah ukuran validitas yang ditentukan dengan cara membandingkan skor-skor tes dengan kinerja tertentu pada sebuah ukuran luar. Ukuran luar ini seharusnya memiliki hubungan teoritis dengan variabel yang di ukur oleh tes itu. Misalnya, tes intelijensi mungkin berkorelasi dengan rata-rata nilai akademis.

Criterion-Related Validity merupakan tingkat kesesuaian antara ukuran satu alat test dengan satu atau lebih kriteria/referensi eksternal lain, biasanya diukur menggunakan korelasi

Validitas criteria (criterion-related validity) terpenuhi jika pengukuran membedakan individu menurut suatu criteria yang dharapkan diprediksi. Hal tersebut bisa dilakukan dengan menghasilkan validitas konkuren (concurrent validity) atau validitas predictive (predictive validity). Validitas konkuren dihasilkan jika skala membedakan individu yang diketahui berbeda, yaitu mereka harus menghasilkan skor yang berbeda pada instrument, sedangkan validitas predictive menunjukkan kemampuan instrument pengukuran untuk membedakan orang dengan referensi pada suatu criteria masa depan (Sekaran, 2006). Dengan demikian, perbedaan antara concurrent validity dengan predictive validity adalah waktu pengujian, dimana concurrent validity diambil dalam waktu yang sama (atau kurang lebih sama), sedangkan predictive validity dilakukan beberapa saat (dalam periode waktu tertentu) setelah terlebih dahulu dahulu skor hasil tes diperoleh.

Concurrent dan Predictive Validity : Contoh Kasus

Concurrent Validity

Misalkan kita melakukan survei karyawan di sebuah perusahaan dan meminta mereka untuk melaporkan tingkat absensi mereka. Data yang diperoleh ini kemudian dapat kita validasi menggunakan data absensi yang ada diperusahaan. Oleh karenanya, kita dapat menilai validitas survei (tingkat absensi dilaporkan oleh karyawan) dengan menghubungkan kedua kriteria ini. Semakin rendah hubungan antara skor penilaian karyawan dengan kondisi sebenarnya yang tercatat di perusahaan, maka semakin rendah pula tingkat validitas item tersebut.

Contoh lainnya adalah dengan cara menguji hubungan antara skor test pada satu alat ukur dengan alat ukur lainnya. Jika cara sebelumnya dilakukan dengan membandingkan hasil penilaian responden dengan kriteria yang diperoleh dari luar/eksternal, maka metode kedua ini adalah memberikan dua alat ukur yang sama kepada responden. Misalnya, responden diberikan dua alat ukur yang memiliki fungsi berbeda yaitu engagement dan burnout yang secara teori kedua konsep ini adalah berbanding terbalik (Schaufeli et al., 2004).

Tabel 1. Skor Penilaian Burnout dan Engagement

No Res Skor Engagement Skor Burnout
1 70 52
2 72 60
3 78 48
4 80 32
5 85 30
6 85 35
7 90 25
8 75 49
9 65 55
10 85 35
11 75 65
12 75 25
13 65 30
14 60 65
15 85 25
16 90 20
17 95 25
18 85 30
19 75 45
20 65 60

 

Hasil korelasi pada dua skor di atas adalah sebesar – 0.802 dan masuk dalam kategori kuat. Karena korelasinya negative, maka dapat disimpulkan bahwa kedua skala yang digunakan merupakan skala yang memiliki sifat hubungan berbanding terbalik, dan hal ini sesuai dengan teori.

Predictive Validity

Penggunaan test kepribadian Myers-Briggs yang mengkategorikan kepribadian dalam beberapa kategori yaitu introvert/ekstrovert, intuititf/sensitif, pemikir/perasa, dan judging/perceiving. Hasil test calon karyawan kemudian akan dicocokkan dengan bidang/jenis pekerjaan dalam perusahaan. Artinya, perusahaan akan menentukan apa kriteria kepribadian yang diperlukan untuk pekerjaan tertentu. Misalnya, calon tenaga penjualan harus memiliki kriteria mudah bergaul, ramah, dan lainnya.

Validitas predictive menunjukkan kemampuan instrument pengukuran untuk membedakan orang dengan referensi pada suatu criteria masa depan (Sekaran, 2006). Misalnya, tes potensi akademik dilakukan pada awal masuk perguruan tinggi, dan selanjutnya 2 (dua) tahun kemudian digunakan untuk memprediksi prestasi akademik melalui indeks prestasi kumulatif (IPK), maka contoh di atas juga secara teknis dapat dilakukan untuk pengujian validitas prediktif. Dimana, korelasi antara skor TPA pada saat masuk perguruan tinggi diharapkan akan berfungsi sebagai prediksi prestasi akademik mahasiswa.

 

Tabel 2. Skor TPA dan IPK Semester V

No Res SKOR TPA IPK SMT V
1 420 3.25
2 422 3.52
3 428 3.15
4 430 3.18
5 435 3.45
6 435 3.6
7 440 3.45
8 425 3.38
9 415 3.45
10 385 2.82
11 375 2.73
12 375 2.78
13 365 2.92
14 360 2.82
15 385 2.89
16 390 2.75
17 395 2.89
18 385 3.15
19 375 3.05
20 365 3.15

 

Hasil korelasi antara skor TPA (tes potensi akademik) yang diperoleh pada saat seleksi awal dikorelasikan dengan skor IPK (indeks prestasi akademik) mahasiswa 3 tahun kemudian yaitu pada semester 6. Hasilnya adalah ditemukan korelasi sebesar 0.793 (masuk kategori kuat) sehingga dapat disimpulkan bahwa alat ukur TPA yang digunakan memiliki validitas prediktif dalam kaitannya dengan prestasi mahasiswa di masa depan.

Perbedaan antara Concurrent dan Predictive Validity

Concurrent validity misalnya dapat dilakukan pada pengukuran tingkat intelijensia dan secara bersamaan dilakukan asesmen mengenai prestasi akademis pada kelompok subjek. Sedangkan, predictive validity dapat dilakukan dengan mengukur tingkat intelijensia pada waktu masuk perguruan tinggi dan kemudian akan dihubungkan dengan pretasi akademis mahasiswa tersebut di masa depan. Dengan demikian, validitas concurrent berfungsi untuk mengukur kesesuaian antara hasil ukur istrumen dengan hasil ukur lain yang relevan yang sudah teruji, sedangkan predictive validity memiliki fungsi prediksi dengan skor yang relevan di masa depan.

Validitas prediktif lebih cocok digunakan untuk seleksi atau klasifikasi personel, seperti seleksi / rekrutment pegawai baru, penempatan kerja, memprediksi prestasi akademik berdasarkan tes potensi akademik, dan lain sebagainya. Sementara validitas konkuren tidak ditujukan untuk memprediksi apa yang akan terjadi di masa depan. Ketika berbagai alat test yang digunakan untuk menentukan seberapa cocok seseorang kandidat pada posisi tertentu, maka hasil test ini haruslah divalidasi di masa depan dengan memeriksa kinerja pegawai tersebut.

Sebagai contoh, ketika kandidat A terpilih sebagai tenaga penjual berdasarkan kecocokan hasil test dengan syarat yang ditentukan oleh perusahaan, maka untuk mengukur validitas alat test tersebut adalah dengan mencocokkan skor test di awal dengan kondisi riil di masa depan. Jika, skor test di awal memiliki korelasi yang tinggi dengan kinerja di masa depan, maka dapat dipastikan bahwa alat test tersebut adalah valid. Sebaliknya, jika hasil test di awal ternyata tidak berkorelasi dengan kinerja riil di masa depan, maka dapat dipastikan alat ukur yang dipergunakan kurang valid untuk memprediksi kinerja di masa depan. Oleh karenanya, perlu dipertimbangkan untuk menggunakan alat ukur atau metode yang lain sebagai pembanding.

 

KELEMAHAN VALIDITAS KRITERIA

Groth-Marnat (2010) memberikan penjelasan bahwa “metode Contruct Validity dikembangkan sebagian untuk mengoreksi ketidak-adekuatan dan kesulitan yang dialami dengan pendekatan content dan pendekatan criterion. Bentuk-bentuk awal validitas isi terlalu banyak mengandalkan pada judgement subjektif, sementara validitas criterion terlalu restriktif dalam bekerja dengan ranah-ranah atau struktur konstrak-konstrak yang diukur. Validitas criterion memiliki kesulitan lain dalam arti bahwa sering kali tidak ada kesepakatan dalam menetapkan kritera luar yang adekuat”.

REFERENSI

Daftar Referensi silahkan di download pada artikel PDF

 

Leave a Reply

Your email address will not be published. Required fields are marked *

Silahkan jawab Pertanyaan *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

You might also likeclose