Sekilas tentang Teori Respon Butir

Teori tes klasik memang telah mendominasi dan banyak digunakan dalam dunia pengukuran dalam beberapa dekade terakhir. Hampir semua konsep validitas dan reliabilitas yang dikenal saat ini merupakan pengembangan dari teori tes klasik. Namun seperti dijelaskan di tulisan sebelumnya, teori tes klasik memiliki beberapa keterbatasan. Oleh kaena itu, mulai berkembanglah teori respon butir atau Item Response Theory (IRT) yang merupakan teori yang dikembangkan untuk memperbaiki keterbatasan-keterbatasan teori tes klasik. Teori Respon Butir biasa disebut juga teori sifat laten (latent trait theory). Konsep dasar Teori Respon Butir adalah, (1) performansi subjek pada suatu tes dapat diprediksi atau dijelaskan oleh seperangkat faktor yang disebut traits, latent traits atau abilitas, dan (2) hubungan antara performansi subjek pada suatu butir dan seperangkat kemampuan laten yang mendasarinya dapat digambarkan oleh suatu fungsi yang menaik secara monoton yang disebut sebagai kurva karakteristik butir (Item characteristic curve-ICC) (Hambleton, Swaminathan, & Rogers, 1991).

Asumsi dalam Teori Respon Butir
Setidaknya terdapat tiga asumsi dasar dalam Teori Respon Butir yang harus dipenuhi. Asumsi-asumsi tersebut adalah asumsi unidimensi, independensi lokal, dan ketepatan kurva karakteristik butir (Hambleton, dkk, 1991).
Asumsi unidimensi
Asumsi ini merujuk pada abilitas yang diukur dalam suatu perangkat soal adalah tunggal. Idealnya, setiap butir tes yang dibuat hanya  mengukur salah satu dari kemampuan peserta tes, bukan mengukur dua atau lebih kemampuan peserta tes. Jika suatu butir mengukur hal yang bersifat multidimensi, maka skor pada butir tersebut merupakan kombinasi dari berbagai kemampuan subjek. Meskipun begitu pada praktiknya asumsi unidimensi ini tidak dapat secara ketat diterapkan karena adanya faktor-faktor yang mempengaruhi seperti kognitif, kepribadian, dan faktor yang berkaitan dengan aspek administrasi tes. Hal yang paling penting dalam asumsi ini adalah adanya satu komponen dominan yang mempengaruhi performasi subjek.
Asumsi independensi lokal (local independence)
Asumsi ini merujuk apabila kemampuan-kemampuan yang mempengaruhi performansi tes dijadikan konstan, maka respons subjek terhadap butir manapun akan independen secara statistik. Independensi lokal terhadap butir dapat diartikan bahwa respon subjek pada butir satu tidak berpengaruh terhadap respon pada butir lain atau secara sederhana dapat dikatakan bahwa asumsi indepensi lokal akan terpenuhi apabila jawaban peserta terhadap suatu butir soal tidak bergantung pada jawaban peserta terhadap butir soal yang lain.
Asumsi Invariansi
Kurva karakteristik butir haruslah merefleksikan secara benar hubungan antara variabel yang tidak terobservasi dan variabel yang terobservasi. Fungsi ini haruslah bersifat tetap dan tidak berubah. Karakteristik butir tetap atau tidak berubah sekalipun subpopulasi peserta tes yang menjawab butir yang sama itu berubah-ubah. Untuk kelompok yang sama, ciri mereka adalah tetap sekalipun butir yang mereka jawab itu berubah-ubah. Sifat ini disebut juga sebagai invariansi.

Menurut Stark, dkk (2001) paling tidak ada dua keuntungan teori respon butir bila dibandingkan dengan tori tes klasik, yaitu:

  1. Parameter butir dan peserta tes tidak saling mempengaruhi, sehingga memungkinkan untuk melihat konstribusi butir sewaktu butir itu ditambahkan atau dikurangi pada suatu perangkat tes.
  2. Memungkinkan peneliti untuk melakukan pengukuran yang sangat cermat pada kelompok-kelompok yang ekuivalen namun  berbeda kultur sehingga dapat diketahui ada bias atau tidak pada hasil pengukuran itu.
Penjelasan mengenai hal ini juga dijabarkan lebih lanjut oleh Embretson & Reise (2000) yang mengemukakan sepuluh kelebihan teori respon butir dibanding teori tes klasik, yaitu:
  1. Tes yang lebih pendek bisa jadi lebih reliabel dibanding tes yang lebih panjang.
  2. Perbandingan skor-skor tes antar berbagai format akan optimal jika tingkat kesulitan tes bervariasi antar peserta.
  3. Estimasi-estimasi yang tidak bias bisa diperoleh dari sampel yang tidak representatif.
  4. Skor tes memiliki arti manakala dibandingkan dengan karakteristik aitem-aitem.
  5. Standard Error of Measurement (SEM) memiliki nilai yang berbeda-beda antar skor (atau pola-pola respon), tetapi bersifat umum antar populasi.
  6. Skala yang bersifat interval dicapai dengan menggunakan model pengukuran yang lebih logis.
  7. Tes dengan format aitem campuran dapat menghasilkan skor tes yang optimal.
  8. Skor-skor yang berubah dapat dibandingkan secara berarti jika tingkat skor awal berbeda.
  9. Hasil faktor analisis pada data skor kasar aitem menghasilkan sebuah full information factor analysis.
  10. Sifat-sifat aitem sebagai stimulus dapat secara langsung berhubungan dengan sifat-sifat psikometriknya.

Model dalam Teori Respon Butir
Model ogive normal merupakan model bentuk kurve karakteristik item yang sangat dominan pada masa awal penelitian mengenai Teori Respon Butir, namun pada saat ini mulai banyak digantikan oleh model-model logistik. Ada tiga macam model logistik. Perbedaan mendasar antara berbagai model yang populer adalah terletak pada jumlah parameter yang digunakan dalam mendeskripsikan butir. Oleh karena itu penyusunan model dalam perkembangannya merujuk pada jumlah parameter yang digunakan, yaitu parameter indeks kesukaran, daya diskriminasi butir, dan probabilitas tebakan semu.
Model Logistik Satu Parameter (1PL)
Model 1PL ini disebut juga sebagai model Rasch. Pada penyusunan model 1PL ini, karakteristik butir yang dilibatkan hanya satu, yaitu parameter taraf kesukaran butir (bi). Parameter (bi) digambarkan dalam suatu kurva ICC sebagai titik dalam skala kemampuan yang memiliki probabilitas menjawab benar sebesar 0,5. Semakin tinggi taraf kesukaran butir, maka dibutuhkan abilitas yang lebih besar untuk mempertahankan probabilitas 0,5 dalam kurva. Oleh karena itu pada kurva ICC butir-butir yang sulit selalu berada di sebelah kanan butir yang mudah (Azwar, 2015).


Model Logistik Dua Parameter (2PL)
Model logistik dua parameter (2PL) menggunakan dua parameter dalam penyusunan model, yaitu parameter taraf kesukaran butir (bi) dan daya beda butir (ai).


Model Logistik Tiga Parameter (3PL)
Model logistik tiga parameter menggunakan semua parameter butir yang ada, yaitu taraf kesukaran butir (bi) daya beda butir (ai), dan probabilitas tebakan semu (ci).


Gambar Kurve Karakteristik Item dengan 3 parameter ditunjukkan sebagai berikut


Referensi
Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar
Hambleton, R. K., Swaminathan, H., & Rogers, J. H. (1991). Fundamentals of Item Response Theory. California: SAGE PUBLICATIONS

Stark, S., Chernyshenko, O. S., Chan, K.-Y., Lee, W. C., & Drasgow, F. (2001). Effects of the testing situation on item responding: Cause for concern. Journal of Applied Psychology, 86, 943-953.

Mahasiswa PhD di ELTE, Hungaria. Dosen Psikologi di UMM, Indonesia.

Share this

Related Posts

Previous
Next Post »

6 komentar

Write komentar
April 22, 2018 at 10:53 PM delete

Maaf mau tanya, teori ini akan digumalan dalam sistem penilaian sbmptn, untuk itu apakah siswa dalam menjawab soal salah akan mengakibatkan penurunan yg sangat tajam pada hasil penilaian? Soalnya panitia pusat bilang kalau salah nilainya tetap 0, dan tidak dijawab nilainya juga 0, terimakasih sebelumnya🙏

Reply
avatar
April 24, 2018 at 2:34 AM delete

Sebenarnya perhitungan skor akhir dengan pendekatan teori respon butir cukup kompleks, karena tiap soal akan memiliki bobot sendiri sesuai dengan data keseluruhan peserta tes. Jadi menjawab benar pada soal sulit dan mudah akan berdampak berbeda terhadap skor akhir, begitu juga ketika salah. Mungkin simulasi pada link ini bisa memberi gambaran bagaimana perhitungan skor akhir dengan pendekatan IRT. https://www.zenius.net/blog/wp-content/uploads/2018/04/watermarked_Simulasi-Try-Out-dengan-Perhitungan-Item-Response-Theory.pdf

Reply
avatar
October 6, 2018 at 6:54 AM delete This comment has been removed by the author.
avatar
October 6, 2018 at 6:56 AM delete

maaf mau nanya, untuk model 1PL (taraf sukar butir) apakah ada contoh perhitungan menggunakan rumus di atas?
karena saya masih bingung untuk mendapatkan nilai θ dan bi pada rumus di atas bagaimana jika kita hanya menyediakan butir soal dan kunci jawaban?
terima kasih

Reply
avatar
January 20, 2021 at 10:20 AM delete

Untuk mengetahui cara penghitungan nilai utbk jayak gimn ya kak?

Reply
avatar
Teori tes klasik memang telah mendominasi dan banyak digunakan dalam dunia pengukuran dalam beberapa dekade terakhir. Hampir semua konsep validitas dan reliabilitas yang dikenal saat ini merupakan pengembangan dari teori tes klasik. Namun seperti dijelaskan di tulisan sebelumnya, teori tes klasik memiliki beberapa keterbatasan. Oleh kaena itu, mulai berkembanglah teori respon butir atau Item Response Theory (IRT) yang merupakan teori yang dikembangkan untuk memperbaiki keterbatasan-keterbatasan teori tes klasik. Teori Respon Butir biasa disebut juga teori sifat laten (latent trait theory). Konsep dasar Teori Respon Butir adalah, (1) performansi subjek pada suatu tes dapat diprediksi atau dijelaskan oleh seperangkat faktor yang disebut traits, latent traits atau abilitas, dan (2) hubungan antara performansi subjek pada suatu butir dan seperangkat kemampuan laten yang mendasarinya dapat digambarkan oleh suatu fungsi yang menaik secara monoton yang disebut sebagai kurva karakteristik butir (Item characteristic curve-ICC) (Hambleton, Swaminathan, & Rogers, 1991).

Asumsi dalam Teori Respon Butir
Setidaknya terdapat tiga asumsi dasar dalam Teori Respon Butir yang harus dipenuhi. Asumsi-asumsi tersebut adalah asumsi unidimensi, independensi lokal, dan ketepatan kurva karakteristik butir (Hambleton, dkk, 1991).
Asumsi unidimensi
Asumsi ini merujuk pada abilitas yang diukur dalam suatu perangkat soal adalah tunggal. Idealnya, setiap butir tes yang dibuat hanya  mengukur salah satu dari kemampuan peserta tes, bukan mengukur dua atau lebih kemampuan peserta tes. Jika suatu butir mengukur hal yang bersifat multidimensi, maka skor pada butir tersebut merupakan kombinasi dari berbagai kemampuan subjek. Meskipun begitu pada praktiknya asumsi unidimensi ini tidak dapat secara ketat diterapkan karena adanya faktor-faktor yang mempengaruhi seperti kognitif, kepribadian, dan faktor yang berkaitan dengan aspek administrasi tes. Hal yang paling penting dalam asumsi ini adalah adanya satu komponen dominan yang mempengaruhi performasi subjek.
Asumsi independensi lokal (local independence)
Asumsi ini merujuk apabila kemampuan-kemampuan yang mempengaruhi performansi tes dijadikan konstan, maka respons subjek terhadap butir manapun akan independen secara statistik. Independensi lokal terhadap butir dapat diartikan bahwa respon subjek pada butir satu tidak berpengaruh terhadap respon pada butir lain atau secara sederhana dapat dikatakan bahwa asumsi indepensi lokal akan terpenuhi apabila jawaban peserta terhadap suatu butir soal tidak bergantung pada jawaban peserta terhadap butir soal yang lain.
Asumsi Invariansi
Kurva karakteristik butir haruslah merefleksikan secara benar hubungan antara variabel yang tidak terobservasi dan variabel yang terobservasi. Fungsi ini haruslah bersifat tetap dan tidak berubah. Karakteristik butir tetap atau tidak berubah sekalipun subpopulasi peserta tes yang menjawab butir yang sama itu berubah-ubah. Untuk kelompok yang sama, ciri mereka adalah tetap sekalipun butir yang mereka jawab itu berubah-ubah. Sifat ini disebut juga sebagai invariansi.

Menurut Stark, dkk (2001) paling tidak ada dua keuntungan teori respon butir bila dibandingkan dengan tori tes klasik, yaitu:

  1. Parameter butir dan peserta tes tidak saling mempengaruhi, sehingga memungkinkan untuk melihat konstribusi butir sewaktu butir itu ditambahkan atau dikurangi pada suatu perangkat tes.
  2. Memungkinkan peneliti untuk melakukan pengukuran yang sangat cermat pada kelompok-kelompok yang ekuivalen namun  berbeda kultur sehingga dapat diketahui ada bias atau tidak pada hasil pengukuran itu.
Penjelasan mengenai hal ini juga dijabarkan lebih lanjut oleh Embretson & Reise (2000) yang mengemukakan sepuluh kelebihan teori respon butir dibanding teori tes klasik, yaitu:
  1. Tes yang lebih pendek bisa jadi lebih reliabel dibanding tes yang lebih panjang.
  2. Perbandingan skor-skor tes antar berbagai format akan optimal jika tingkat kesulitan tes bervariasi antar peserta.
  3. Estimasi-estimasi yang tidak bias bisa diperoleh dari sampel yang tidak representatif.
  4. Skor tes memiliki arti manakala dibandingkan dengan karakteristik aitem-aitem.
  5. Standard Error of Measurement (SEM) memiliki nilai yang berbeda-beda antar skor (atau pola-pola respon), tetapi bersifat umum antar populasi.
  6. Skala yang bersifat interval dicapai dengan menggunakan model pengukuran yang lebih logis.
  7. Tes dengan format aitem campuran dapat menghasilkan skor tes yang optimal.
  8. Skor-skor yang berubah dapat dibandingkan secara berarti jika tingkat skor awal berbeda.
  9. Hasil faktor analisis pada data skor kasar aitem menghasilkan sebuah full information factor analysis.
  10. Sifat-sifat aitem sebagai stimulus dapat secara langsung berhubungan dengan sifat-sifat psikometriknya.

Model dalam Teori Respon Butir
Model ogive normal merupakan model bentuk kurve karakteristik item yang sangat dominan pada masa awal penelitian mengenai Teori Respon Butir, namun pada saat ini mulai banyak digantikan oleh model-model logistik. Ada tiga macam model logistik. Perbedaan mendasar antara berbagai model yang populer adalah terletak pada jumlah parameter yang digunakan dalam mendeskripsikan butir. Oleh karena itu penyusunan model dalam perkembangannya merujuk pada jumlah parameter yang digunakan, yaitu parameter indeks kesukaran, daya diskriminasi butir, dan probabilitas tebakan semu.
Model Logistik Satu Parameter (1PL)
Model 1PL ini disebut juga sebagai model Rasch. Pada penyusunan model 1PL ini, karakteristik butir yang dilibatkan hanya satu, yaitu parameter taraf kesukaran butir (bi). Parameter (bi) digambarkan dalam suatu kurva ICC sebagai titik dalam skala kemampuan yang memiliki probabilitas menjawab benar sebesar 0,5. Semakin tinggi taraf kesukaran butir, maka dibutuhkan abilitas yang lebih besar untuk mempertahankan probabilitas 0,5 dalam kurva. Oleh karena itu pada kurva ICC butir-butir yang sulit selalu berada di sebelah kanan butir yang mudah (Azwar, 2015).


Model Logistik Dua Parameter (2PL)
Model logistik dua parameter (2PL) menggunakan dua parameter dalam penyusunan model, yaitu parameter taraf kesukaran butir (bi) dan daya beda butir (ai).


Model Logistik Tiga Parameter (3PL)
Model logistik tiga parameter menggunakan semua parameter butir yang ada, yaitu taraf kesukaran butir (bi) daya beda butir (ai), dan probabilitas tebakan semu (ci).


Gambar Kurve Karakteristik Item dengan 3 parameter ditunjukkan sebagai berikut


Referensi
Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar
Hambleton, R. K., Swaminathan, H., & Rogers, J. H. (1991). Fundamentals of Item Response Theory. California: SAGE PUBLICATIONS

Stark, S., Chernyshenko, O. S., Chan, K.-Y., Lee, W. C., & Drasgow, F. (2001). Effects of the testing situation on item responding: Cause for concern. Journal of Applied Psychology, 86, 943-953.

6 comments

  1. Maaf mau tanya, teori ini akan digumalan dalam sistem penilaian sbmptn, untuk itu apakah siswa dalam menjawab soal salah akan mengakibatkan penurunan yg sangat tajam pada hasil penilaian? Soalnya panitia pusat bilang kalau salah nilainya tetap 0, dan tidak dijawab nilainya juga 0, terimakasih sebelumnya🙏

    ReplyDelete
    Replies
    1. Sebenarnya perhitungan skor akhir dengan pendekatan teori respon butir cukup kompleks, karena tiap soal akan memiliki bobot sendiri sesuai dengan data keseluruhan peserta tes. Jadi menjawab benar pada soal sulit dan mudah akan berdampak berbeda terhadap skor akhir, begitu juga ketika salah. Mungkin simulasi pada link ini bisa memberi gambaran bagaimana perhitungan skor akhir dengan pendekatan IRT. https://www.zenius.net/blog/wp-content/uploads/2018/04/watermarked_Simulasi-Try-Out-dengan-Perhitungan-Item-Response-Theory.pdf

      Delete
  2. This comment has been removed by the author.

    ReplyDelete
  3. maaf mau nanya, untuk model 1PL (taraf sukar butir) apakah ada contoh perhitungan menggunakan rumus di atas?
    karena saya masih bingung untuk mendapatkan nilai θ dan bi pada rumus di atas bagaimana jika kita hanya menyediakan butir soal dan kunci jawaban?
    terima kasih

    ReplyDelete
  4. Untuk mengetahui cara penghitungan nilai utbk jayak gimn ya kak?

    ReplyDelete

Artikel Lainnya