Analisis Instrumen Tes dengan Winstep

Selain menyajikan hasil analisis pada level item, Winstep juga mampu menyediakan hasil analisis pada tes. Script yang sudah kita buat dalam tulisan sebelumnya untuk latihan dapat didownload di siniUntuk mendapatkan informasi mengenai ringkasan statistik dari alat tes yang disajikan kita bisa munculkan dari menu output tables lalu pilih tabel 3.1 summary statistics. Akan muncul tampilan seperti ini

Keterangan dari output tersebut akan dijelaskan di bawah
  • Mean measure pada person adalah sebesar -0,85. Nilai mean yang lebih kecil dari 0 menunjukkan bahwa kecenderungan abilitas subjek lebih kecil dibandingkan dengan tingkat kesulitan soal.
  • Nilai Alpha Cronbach (KR-20) adalah koefisien reliabilitas yang dihitung berdasarkan pendekatan teori tes klasik. Nilai ini merupakan interaksi antara person dan item secara keseluruhan. Nilai Alpha adalah sebesar 0,54. Hal ini menunjukan reliabilitas tes ecara umum masih belum memuaskan
  • Nilai person reliability adalah 0,49 dan nilai item reliability adalah 0,95. Hal ini menunjukkan bahwa konsistensi jawaban dari subjek kita masih lemah, namun kualitas butir soal dalam instrumen aspek reliabilitasnya cukup baik.
  • Nilai INFIT dan OUTFIT MNSQ niai yang ideal adalah yang mendekati 1 sedangkan untuk nilai INFIT dan OUTFIT ZSTD nilai yang ideal adalah mendekati 0. Untuk tabel person dan item, nilai meannya INFIT dan OUTFIT MNSQ serta INFIT dan OUTFIT ZSTD sudah mendekati ideal.   
  • Nilai separation juga menunjukkan kualitas instrumen maupun kualitas subjek kita. Semakin besar nilai separation semakin bagus karena bisa mengidentifikasi kelompok subjek (mampu – tidak mampu) dan kelompok butir (sulit – mudah) yang lebih luas. Rumus yang bisa digunakan untuk melihat pengelompokan secara lebih teliti disebut pemisahan strata dengan formula sebagai berikut:
           H = [(4 X separation) + 1] / 3
  • Jadi misalkan item separation kita adalah 4,18 maka H = [(4 X 4,18) + 1] / 3 yakni 5,9 atau dibulatkan 6, yang berarti terdapat 6 kelompok butir soal.

Secara lebih lengkap, Fisher, W.P. Jr memberikan panduan untuk menilai kualitas instrumen yang dapat dilihat di tabel di bawah.

Fungsi Informasi Pengukuran
Setiap pengukuran menghasilkan informasi mengenai hasil pengukuran. Informasi pengukuran yang diinginkan bukan berdasar pada individu yang diukur, melainkan informasi pada fokus pengukuran. Informasi pengukuran ini berdasar pada hubungan antara tes dengan individu. Sumintono dan Widhiarso (2015) menjelaskan beberapa manfaat dari fungsi informasi tes adalah sebagai berikut:
  1. Fungsi informasi akan menunjukkan untuk apa pengukuran dilakukan. Sebagai contoh, untuk tes screening, tes remidi, dan tes untuk Anak Berkebutuhan Khusus memusatkan tes dengan fungsi informasi seperti grafik warna merah. Sebaliknya jika tes dilakukan untuk seleksi yang ketat, fungsi informasi tes yang dibutuhkan adalah tes dengan fungsi informasi seperti pada grafik warna hitam.
  2. Fungsi informasi menunjukkan reliabilitas pengukuran yang dilakukan. Model Rasch menekankan pada koefisien separasi (item separation). Semakin tinggi puncak informasi yang dapat dicapai, semakin tinggi nilai reliabilitas pengukuran yang dilakukan.


Untuk melihat fungsi informasi pengukuran, kita dapat melihat melalui menu graph kemudian pilih test information function, maka akan diperoleh outut seperti di bawah ini.

Dari grafik di atas kita dapat menyimpulkan bahwa dari 40 soal yang kita sajikan pada 185 subjek menunjukkan item-item soalnya cocok untuk menetahui tingkat abilitas siswa yang sedang saja.

Referensi
Sumintono, B., & Widhiarso, W. (2015). Aplikasi Pemodelan Rasch pada Assessment PendidikanCimahi: Trim Komunikata.


Mahasiswa PhD di ELTE, Hungaria. Dosen Psikologi di UMM, Indonesia.

Share this

Related Posts

Previous
Next Post »

5 komentar

Write komentar
June 27, 2019 at 4:57 PM delete

Maaf sebelumnya saya mau tanya, apakah sama tabel untuk menentukan kriteria kualitas rating scale dengan instrumen tes?

Reply
avatar
March 23, 2021 at 6:19 PM delete

Assalammu'alaikum, maaf sebeumnya izin bertanya mengenai test information function. Apakah ada kriteria khusus yang digunakan untuk menentukan hasil grafik tersebut menandakan instrumen baik digunakan untuk kelompok peserta didik dengan kemampuan yang bagaimana? Terima kasih

Reply
avatar
April 5, 2021 at 4:07 AM delete This comment has been removed by the author.
avatar
April 5, 2021 at 4:09 AM delete

Maaf mau tanya, jika nilai reliability person kurang dr 0,67 ttp nilai reliability item lebih dr 0,67 apakah bisa dilanjutkan penelitian ya?

Reply
avatar
April 30, 2022 at 8:03 AM delete

Ini bisa dilakukan dengan melihat perpotongan antara grafik fungsi informasi dengan garis Standar eror of measurement

Daerah di dalam batasan tersebut merupakan rentang ability yang optimal diukur oleh instrumen

Reply
avatar
Selain menyajikan hasil analisis pada level item, Winstep juga mampu menyediakan hasil analisis pada tes. Script yang sudah kita buat dalam tulisan sebelumnya untuk latihan dapat didownload di siniUntuk mendapatkan informasi mengenai ringkasan statistik dari alat tes yang disajikan kita bisa munculkan dari menu output tables lalu pilih tabel 3.1 summary statistics. Akan muncul tampilan seperti ini

Keterangan dari output tersebut akan dijelaskan di bawah
  • Mean measure pada person adalah sebesar -0,85. Nilai mean yang lebih kecil dari 0 menunjukkan bahwa kecenderungan abilitas subjek lebih kecil dibandingkan dengan tingkat kesulitan soal.
  • Nilai Alpha Cronbach (KR-20) adalah koefisien reliabilitas yang dihitung berdasarkan pendekatan teori tes klasik. Nilai ini merupakan interaksi antara person dan item secara keseluruhan. Nilai Alpha adalah sebesar 0,54. Hal ini menunjukan reliabilitas tes ecara umum masih belum memuaskan
  • Nilai person reliability adalah 0,49 dan nilai item reliability adalah 0,95. Hal ini menunjukkan bahwa konsistensi jawaban dari subjek kita masih lemah, namun kualitas butir soal dalam instrumen aspek reliabilitasnya cukup baik.
  • Nilai INFIT dan OUTFIT MNSQ niai yang ideal adalah yang mendekati 1 sedangkan untuk nilai INFIT dan OUTFIT ZSTD nilai yang ideal adalah mendekati 0. Untuk tabel person dan item, nilai meannya INFIT dan OUTFIT MNSQ serta INFIT dan OUTFIT ZSTD sudah mendekati ideal.   
  • Nilai separation juga menunjukkan kualitas instrumen maupun kualitas subjek kita. Semakin besar nilai separation semakin bagus karena bisa mengidentifikasi kelompok subjek (mampu – tidak mampu) dan kelompok butir (sulit – mudah) yang lebih luas. Rumus yang bisa digunakan untuk melihat pengelompokan secara lebih teliti disebut pemisahan strata dengan formula sebagai berikut:
           H = [(4 X separation) + 1] / 3
  • Jadi misalkan item separation kita adalah 4,18 maka H = [(4 X 4,18) + 1] / 3 yakni 5,9 atau dibulatkan 6, yang berarti terdapat 6 kelompok butir soal.

Secara lebih lengkap, Fisher, W.P. Jr memberikan panduan untuk menilai kualitas instrumen yang dapat dilihat di tabel di bawah.

Fungsi Informasi Pengukuran
Setiap pengukuran menghasilkan informasi mengenai hasil pengukuran. Informasi pengukuran yang diinginkan bukan berdasar pada individu yang diukur, melainkan informasi pada fokus pengukuran. Informasi pengukuran ini berdasar pada hubungan antara tes dengan individu. Sumintono dan Widhiarso (2015) menjelaskan beberapa manfaat dari fungsi informasi tes adalah sebagai berikut:
  1. Fungsi informasi akan menunjukkan untuk apa pengukuran dilakukan. Sebagai contoh, untuk tes screening, tes remidi, dan tes untuk Anak Berkebutuhan Khusus memusatkan tes dengan fungsi informasi seperti grafik warna merah. Sebaliknya jika tes dilakukan untuk seleksi yang ketat, fungsi informasi tes yang dibutuhkan adalah tes dengan fungsi informasi seperti pada grafik warna hitam.
  2. Fungsi informasi menunjukkan reliabilitas pengukuran yang dilakukan. Model Rasch menekankan pada koefisien separasi (item separation). Semakin tinggi puncak informasi yang dapat dicapai, semakin tinggi nilai reliabilitas pengukuran yang dilakukan.


Untuk melihat fungsi informasi pengukuran, kita dapat melihat melalui menu graph kemudian pilih test information function, maka akan diperoleh outut seperti di bawah ini.

Dari grafik di atas kita dapat menyimpulkan bahwa dari 40 soal yang kita sajikan pada 185 subjek menunjukkan item-item soalnya cocok untuk menetahui tingkat abilitas siswa yang sedang saja.

Referensi
Sumintono, B., & Widhiarso, W. (2015). Aplikasi Pemodelan Rasch pada Assessment PendidikanCimahi: Trim Komunikata.


5 comments

  1. Maaf sebelumnya saya mau tanya, apakah sama tabel untuk menentukan kriteria kualitas rating scale dengan instrumen tes?

    ReplyDelete
  2. Assalammu'alaikum, maaf sebeumnya izin bertanya mengenai test information function. Apakah ada kriteria khusus yang digunakan untuk menentukan hasil grafik tersebut menandakan instrumen baik digunakan untuk kelompok peserta didik dengan kemampuan yang bagaimana? Terima kasih

    ReplyDelete
    Replies
    1. Ini bisa dilakukan dengan melihat perpotongan antara grafik fungsi informasi dengan garis Standar eror of measurement

      Daerah di dalam batasan tersebut merupakan rentang ability yang optimal diukur oleh instrumen

      Delete
  3. This comment has been removed by the author.

    ReplyDelete
  4. Maaf mau tanya, jika nilai reliability person kurang dr 0,67 ttp nilai reliability item lebih dr 0,67 apakah bisa dilanjutkan penelitian ya?

    ReplyDelete

Artikel Lainnya