Sekilas tentang Teori Tes Klasik

Teori tes klasik atau classical test theory (CTT) merupakan salah satu pendekatan yang digunakan dalam dunia pengukuran di bidang Psikologi. Teori tes klasik dikenal juga dengan sebutan teori skor murni (true score theory). Hal ini berkaitan dengan fokus kajian teori tes klasik yang ingin melihat nilai skor murni dari skor tampak yang diperoleh. Teori ini dikembangkan oleh Charles Spearman tahun 1904 dan masih terus digunakan hingga saat ini. Spearman mengembangkan CTT dengan menggabungkan konsep eror dan korelasi (Salkind, 2007). CTT merupakan teori psikometri yang populer serta banyak digunakan pada berbagai disiplin ilmu (psikologi, pendidikan, dan ilmu sosial lainnya). Istilah “klasik” yang digunakan tidak hanya mengacu kronologi model ini, tetapi juga sebagai kontras dengan lebih teori psikometri yang lebih baru yang disebut sebagai sebagai Teori Respon Butir (Item Response Theory), yang sering kali disebut juga dengan istilah "teori modern". Terdapat beberapa perbedaan yang mendasari teori tes klasik dengan teori respon butir.

Dari sisi pendekatan, teori tes klasik mengadopsi pendekatan deterministik (certainty) dimana fokus utama analisis adalah skor total individu (X). Setiap tes memiliki eror (E) yang menyertai setiap hasil pengukuran dalam mengukur sifat manusia. Skor murni (T) dan error (E) keduanya adalah variabel laten, namun tujuan pengujian adalah untuk menarik kesimpulan mengenai skor murni individu. Skor per-item juga dapat dipastikan benar dan salahnya yaitu misalnya jika jawaban seseorang benar maka diberi skor 1 dan salah diberi skor 0. Sedangkan IRT berfokus pada probabilitas dalam menjawab setiap item dimana menilai jawaban bukan pada total skor seseorang melainkan mempertimbangkan respon/jawaban seseorang pada level item. Pemberian skornya juga bukan dengan cara menentukan skor 1 atau 0, melainkan probabilitas orang tersebut mendapat skor 1 atau skor 0.

Asumsi Teoritik Mengenai Skor
Seperti yang dijelaskan sebelumnya, teori tes klasik memiliki banyak asumsi di dalamnya. Performasi subjek pada suatu skala pengukuran dinyatakan dalam angka yang disebut skor. Skor ini merupakan skor perolehan pengukuran yang selanjutnya disebut sebagai skor tampak atau dilambangkan dengan X. Di dalam skor tampat terdapat skor murni (T) dan error pengukuran (E) yang tidak pernah dapat diketahui besarannya (Azwar, 2011). Teori tes klasik bekerja pada tataran skor tampak dengan menggunakan model linier dalam menjelaskan model skor. Beberapa asumsi yang mendasar skor dalam teori tes klasik diantaranya sebagai berikut (disarikan dari Azwar, 2015)  


Asumsi ini menyatakan bahwa hubungan Skor tampak (X), skor murni (T), dan eror pengukuran (E) bersifat aditif. Skor tampak (X) yang diperoleh individu merupakan akumulasi dari skor murni (T) dan eror pengukuran (E).

Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan X. Karena besar skor murni diasumsikan tetap dalam setiap pengukuran, maka besar varians skor tampak akan tergantung pada variasi eror pengukuran.

Korelasi antara eror pengukuran dan skor murni adalah nol. Menurut asumsi ini, bagi suatu kelompok populasi subjek yang dikenai tes distribusi eror pengukuran dan distribusi skor murni adalah independen satu sama lain. variasi eror tidak tergantung pada variasi skor murni.

Bila e1 adalah eror pengukuran tes pertama dan e2 adalah eror pengukuran tes kedua, maka asumsi ini menyatakan bahwa distribusi eror kedua tes tersebut tidak berkorelasi satu sama lain.

Asumsi kelima menyatakan bahwa eror pada suatu tes tidak berkorelasi degan skor murni pada tes lain.

Catatan Mengenai Teori Skor Klasik
Seperti dijelaskan sebelumnya, teori skor klasik bukan satu-satunya pendekatan dalam psikometri. Sumintono & Widhiarso (2015) memberikan catatan penggunaan skor mentah/raw score sebagai ukuran prestasi yang memiliki beberapa kelemahan, di antaranya sebagai berikut.
  1. Skor mentah pada dasarnya bukanlah hasil pengukuran. Lebih tepatnya skor mentah adalah jumlah jawaban benar dari soal yang dikerjakan siswa.
  2. Skor mentah adalah informasi awal. Skor mentah juga biasanya dinyatakan dalam persentase (%) yang tidak lain hanyalah ringkasan data berupa angka, tetapi tidak memberikan data dari suatu pengukuran.
  3. Skor mentah memiliki makna kuantitatif yang lemah. Makna kuantitatif dari skor mentah yang didapat akan berbeda, bergantung pada banyaknya soal, sedangkan persentase jawaban betul selalu bergantung pada tingkat kesulitan soal.
  4. Skor mentah tidak menunjukkan kemampuan seseorang terhadap tugas tertentu. Skor mentah juga tidak bisa banyak menjelaskan tingkat kesulitan soalnya.
  5. Skor mentah dan persentase jawaban benar tidak selalu bersifat linier. Dalam sebuah tes yang bersifat linier, siswa yang memiliki skor 15 (skala 0 hingga 100) selalu memiliki kemampuan lebih tinggi dibanding yang memiliki skor 10. Namun, secara empirik terkadang keduanya memungkinkan memiliki kemampuan yang sama.
Meskipun secara sekilas teori tes klasik memiliki banyak keterbatasan, namun bukan berarti pendekatan ini tidak memiliki kelebihan. Beberapa kelebihan teori tes klasik dibandingkan teori respon butir diantaranya adalah terkait dengan analisis yang lebih sederhana dan mudah dipahami. Teori ini memiliki nilai praktis yang tinggi dalam menerangkan masalah reliabilitas dan validitas, disamping pemahamannya yang tidak menuntut pengetahuan mendalam mengenai fungsi distribusi statistik dan model-model matematiknya (Azwar, 2011). Selain itu dalam melakukan analisis, sampel yang diperlukan bisa lebih sedikit jika dibandingkan dengan pendekatan teori respon butir, sehingga sangat cocok dilakukan untuk penilaian di kelas dan perbaikan evaluasi pembelajaran.

Referensi
Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar

Salkind, N. J. (2007). Encyclopedia of measurement and statistics volume 1. California: SAGE Publications, Inc.

Sumintono, B., & Widhiarso, W. (2015). Aplikasi Pemodelan Rasch Pada Assessment Pendidikan. Bandung: Trim Komunikata



Mahasiswa PhD di ELTE, Hungaria. Dosen Psikologi di UMM, Indonesia.

Share this

Related Posts

Previous
Next Post »
Teori tes klasik atau classical test theory (CTT) merupakan salah satu pendekatan yang digunakan dalam dunia pengukuran di bidang Psikologi. Teori tes klasik dikenal juga dengan sebutan teori skor murni (true score theory). Hal ini berkaitan dengan fokus kajian teori tes klasik yang ingin melihat nilai skor murni dari skor tampak yang diperoleh. Teori ini dikembangkan oleh Charles Spearman tahun 1904 dan masih terus digunakan hingga saat ini. Spearman mengembangkan CTT dengan menggabungkan konsep eror dan korelasi (Salkind, 2007). CTT merupakan teori psikometri yang populer serta banyak digunakan pada berbagai disiplin ilmu (psikologi, pendidikan, dan ilmu sosial lainnya). Istilah “klasik” yang digunakan tidak hanya mengacu kronologi model ini, tetapi juga sebagai kontras dengan lebih teori psikometri yang lebih baru yang disebut sebagai sebagai Teori Respon Butir (Item Response Theory), yang sering kali disebut juga dengan istilah "teori modern". Terdapat beberapa perbedaan yang mendasari teori tes klasik dengan teori respon butir.

Dari sisi pendekatan, teori tes klasik mengadopsi pendekatan deterministik (certainty) dimana fokus utama analisis adalah skor total individu (X). Setiap tes memiliki eror (E) yang menyertai setiap hasil pengukuran dalam mengukur sifat manusia. Skor murni (T) dan error (E) keduanya adalah variabel laten, namun tujuan pengujian adalah untuk menarik kesimpulan mengenai skor murni individu. Skor per-item juga dapat dipastikan benar dan salahnya yaitu misalnya jika jawaban seseorang benar maka diberi skor 1 dan salah diberi skor 0. Sedangkan IRT berfokus pada probabilitas dalam menjawab setiap item dimana menilai jawaban bukan pada total skor seseorang melainkan mempertimbangkan respon/jawaban seseorang pada level item. Pemberian skornya juga bukan dengan cara menentukan skor 1 atau 0, melainkan probabilitas orang tersebut mendapat skor 1 atau skor 0.

Asumsi Teoritik Mengenai Skor
Seperti yang dijelaskan sebelumnya, teori tes klasik memiliki banyak asumsi di dalamnya. Performasi subjek pada suatu skala pengukuran dinyatakan dalam angka yang disebut skor. Skor ini merupakan skor perolehan pengukuran yang selanjutnya disebut sebagai skor tampak atau dilambangkan dengan X. Di dalam skor tampat terdapat skor murni (T) dan error pengukuran (E) yang tidak pernah dapat diketahui besarannya (Azwar, 2011). Teori tes klasik bekerja pada tataran skor tampak dengan menggunakan model linier dalam menjelaskan model skor. Beberapa asumsi yang mendasar skor dalam teori tes klasik diantaranya sebagai berikut (disarikan dari Azwar, 2015)  


Asumsi ini menyatakan bahwa hubungan Skor tampak (X), skor murni (T), dan eror pengukuran (E) bersifat aditif. Skor tampak (X) yang diperoleh individu merupakan akumulasi dari skor murni (T) dan eror pengukuran (E).

Asumsi ini menyatakan bahwa skor murni merupakan nilai harapan X. Karena besar skor murni diasumsikan tetap dalam setiap pengukuran, maka besar varians skor tampak akan tergantung pada variasi eror pengukuran.

Korelasi antara eror pengukuran dan skor murni adalah nol. Menurut asumsi ini, bagi suatu kelompok populasi subjek yang dikenai tes distribusi eror pengukuran dan distribusi skor murni adalah independen satu sama lain. variasi eror tidak tergantung pada variasi skor murni.

Bila e1 adalah eror pengukuran tes pertama dan e2 adalah eror pengukuran tes kedua, maka asumsi ini menyatakan bahwa distribusi eror kedua tes tersebut tidak berkorelasi satu sama lain.

Asumsi kelima menyatakan bahwa eror pada suatu tes tidak berkorelasi degan skor murni pada tes lain.

Catatan Mengenai Teori Skor Klasik
Seperti dijelaskan sebelumnya, teori skor klasik bukan satu-satunya pendekatan dalam psikometri. Sumintono & Widhiarso (2015) memberikan catatan penggunaan skor mentah/raw score sebagai ukuran prestasi yang memiliki beberapa kelemahan, di antaranya sebagai berikut.
  1. Skor mentah pada dasarnya bukanlah hasil pengukuran. Lebih tepatnya skor mentah adalah jumlah jawaban benar dari soal yang dikerjakan siswa.
  2. Skor mentah adalah informasi awal. Skor mentah juga biasanya dinyatakan dalam persentase (%) yang tidak lain hanyalah ringkasan data berupa angka, tetapi tidak memberikan data dari suatu pengukuran.
  3. Skor mentah memiliki makna kuantitatif yang lemah. Makna kuantitatif dari skor mentah yang didapat akan berbeda, bergantung pada banyaknya soal, sedangkan persentase jawaban betul selalu bergantung pada tingkat kesulitan soal.
  4. Skor mentah tidak menunjukkan kemampuan seseorang terhadap tugas tertentu. Skor mentah juga tidak bisa banyak menjelaskan tingkat kesulitan soalnya.
  5. Skor mentah dan persentase jawaban benar tidak selalu bersifat linier. Dalam sebuah tes yang bersifat linier, siswa yang memiliki skor 15 (skala 0 hingga 100) selalu memiliki kemampuan lebih tinggi dibanding yang memiliki skor 10. Namun, secara empirik terkadang keduanya memungkinkan memiliki kemampuan yang sama.
Meskipun secara sekilas teori tes klasik memiliki banyak keterbatasan, namun bukan berarti pendekatan ini tidak memiliki kelebihan. Beberapa kelebihan teori tes klasik dibandingkan teori respon butir diantaranya adalah terkait dengan analisis yang lebih sederhana dan mudah dipahami. Teori ini memiliki nilai praktis yang tinggi dalam menerangkan masalah reliabilitas dan validitas, disamping pemahamannya yang tidak menuntut pengetahuan mendalam mengenai fungsi distribusi statistik dan model-model matematiknya (Azwar, 2011). Selain itu dalam melakukan analisis, sampel yang diperlukan bisa lebih sedikit jika dibandingkan dengan pendekatan teori respon butir, sehingga sangat cocok dilakukan untuk penilaian di kelas dan perbaikan evaluasi pembelajaran.

Referensi
Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar

Salkind, N. J. (2007). Encyclopedia of measurement and statistics volume 1. California: SAGE Publications, Inc.

Sumintono, B., & Widhiarso, W. (2015). Aplikasi Pemodelan Rasch Pada Assessment Pendidikan. Bandung: Trim Komunikata



No comments

Artikel Lainnya