Perbedaan Indeks Diskriminasi Item, Korelasi Point-biserial, dan Korelasi Biserial

Dalam proses penyusunan alat tes, proses seleksi item menjadi bagian yang sangat krusial. Proses ini bertujuan untuk memilih item mana saja yang layak kita masukkan dalam alat tes kita. Dalam analisis dengan teori tes klasik, daya diskriminasi item menjadi salah satu paramater yang paling utama dalam seleksi item. Daya diskriminasi item menunjukkan seberapa baik item dalam membedakan individu mana yang memiliki kemampuan dan mana yang tidak. Dalam konteks tes kognitif, dimana jawaban soal hanya diskor benar dan salah (1/0), ada tiga jenis parameter diskriminasi item yang biasa digunakan, yakni indeks diskriminasi item, korelasi point-biserial, dan korelasi biserial. Diantara ketiganya, terkadang kita bingung mau menggunakan yang mana karena tidak terlalu memahami perbedaannya. Tulisan ini akan menjelaskan perbedaan ketiganya dan bagaimana penggunaannya.


Indeks Diskriminasi Item
Indeks diskriminasi item (di) merupakan salah satu parameter daya beda yang sederhana. Indeks ini mengukur seberapa baik item dapat membedakan antara subjek yang memiliki skor tinggi dan skor rendah. Karena kemudahannya dalam penghitungan dan interpretasinya, indeks diskriminasi terus menjadi salah satu metode yang paling populer dan sangat cocok untuk analisis item di kelas yang dilakukan dengan perhitungan manual.

Indeks diskriminasi item (diadalah selisih antara proporsi benar dalam kelompok Tinggi dan kelompok Rendah (Crocker & Algina, 1986). Untuk memperoleh indeks diskriminasi item, kelompok subjek dibagi menjadi dua kelompok, yakni kelompok subjek yang memiliki skor total tertinggi dan kelompok subjek yang memiliki skor total terendah sesuai dengan batas yang ditetapkan. Analisis pada kelompok sampel yang besar biasanya hanya dilakukan pada 27% kelompok subjek yang memiliki skor total tertinggi dan 27% kelompok subjek yang memiliki skor total terendah. Namun pada kasus dimana subjek terlalu sedikit, bisa juga dibagi dua separuh-separuh. Suatu item yang memiliki indeks dikriminasi tinggi bila dijawab dengan benar oleh semua atau sebagian besar kelompok Tinggi dan tidak bisa dijawab benar oleh semua atau sebagian besar kelompok Rendah.

Indeks diskriminasi item (di) dapat dihitung dengan formula
Indeks ini memiliki kisaran kemungkinan -1,0 hingga +1,0. Ebel (1965) menawarkan panduan berikut untuk interpretasi item berdasarkan indeks diskriminasi itemnya, yakni sebagai berikut:
Indeks Diskriminasi
Interpretasi
0,40 atau lebih
Item berfungsi sangat baik
0,30 – 0,39
Item sudah baik, mungkin diperlukan revisi kecil
0,20 – 0,29
Item masih meragukan dan perlu direvisi
Kurang dari 0,20
Item harus dibuang atau direvisi total

Korelasi Point-biserial
Korelasi point-biserial adalah korelasi product moment Pearson yang berlaku pada skor item yang bersifat dikotomi diskret (0/1) dengan skor total pada suatu tes yang bersifat interval. Maksud dari dikotomi diskret di sini adalah bahwa perbedaan nilai 1 dan 0 adalah nyata dan tidak nilai kontinum di dalamnya. Misalnya adalah hidup dan mati. Keduanya adalah diskret karena tidak ada setengah hidup dan setengah mati. Sebagian besar analisis item menggunakan metode korelasi point-biserial sebagai acuan analisis item.

Korelasi point-biserial (rpbis) dapat dihitung dengan formula
Karena korelasi point-biserial sesungguhnya sama dengan korelasi product moment Pearson, maka nilai koefisien ini berkisar antara -1,00 sampai dengan +1,00. Dalam seleksi item, hanya nilai positif saja yang dapat dianggap sebagai item yang baik, karena nilai negatif menunjukkan fungsi diskriminasi yang terbalik. Nilai negatif juga bisa terjadi karena kesalahan pembuatan kunci jawaban. Prinsip utama dalam pemilihan item dengan melihat koefisien korelasi point-biserial adalah dengan mencari nilai koefisien setinggi mungkin dan membuang atau merevisi setiap item yang mempunyai korelasi negatif (-) atau koefisien yang mendekati nol (0,00)

Korelasi Biserial
Korelasi biserial adalah korelasi antara skor item dikotomi kontinum (0/1) dengan total skor suatu tes. Maksud dari dikotomi kontinum di sini adalah perbedaan nilai 1 dan 0 ini bisa saja memiliki makna hanya buatan saja karena masih ada lagi nilai kontinum di dalamnya. Misalnya, kepuasan pelanggan, meskipun secara kategori hanya dinyatakan puas dan tidak puas, namun di dalamnya sebenarnya ada kontinum seperti puas sekali, lumayan puas, sedikit puas, tidak puas, sangat tidak puas. Korelasi ini didasarkan pada asumsi bahwa skor item memiliki distribusi normal. Perlu diperhatikan, dikarenakan korelasi biserial bukan merupakan korelasi product moment, maka nilainya memungkinkan untuk lebih dari 1,0.

Korelasi biserial (rbis) dapat dihitung dengan formula
Atau secara matematis, hubungan antara korelasi biserial dan point-biserial dapat dinyatakan sebagai berikut
Dikarenakan nilai y selalu lebih rendah dari nilai √p(1-p), maka nilai korelasi biserial selalu setidaknya 1/5 lebih besar daripada nilai korelasi point-biserial. Pada item dengan tingkat kesukaran sedang, perbedaan nilai korelasi biserial dan point-biserial tidak terlalu besar, namun pada item dengan tingkat kesukaran sangat tinggi atau sangat rendah, perbedaan ini bisa meningkat sangat besar. Oleh karena itu, perbedaan nilai parameter diskriminasi dengan korelasi point-biserial dan biserial sebenarnya bukan menunjukkan perbedaan kualitas dari item tersebut, melainkan karena pemilihan formula yang digunakan.

Sama seperti pada korelasi point-biserial, semakin tinggi nilai koefisien berarti item berfungsi semakin baik, sedangkan item yang bernilai negatif atau mendekati nol kurang berfungsi dengan baik. Namun yang patut mendapat catatan adalah, korelasi biserial bukanlah korelasi product moment, sehingga memungkinkan nilainya melebihi 1,00.

Paramater Diskriminasi mana yang harus kita pilih?
Crocker dan Algina (1986) memberikan rangkuman pertimbangan yang dapat digunakan unuk pemilihan parameter diskriminasi item yang dapat digunakan.
1.  Jika tingkat kesukaran item sedang, sebenarnya tidak akan banyak berbeda menggunakan ketiga metode tersebut. Jika yang menjadi pertimbangan adalah kemudahan perhitungannya, indeks diskriminasi item dapat digunakan. Jika yang menjadi pertimbangan adalah signifikansi statistiknya, salah satu dari korelasi pont-biserial atau biserial dapat digunakan.
2.  Jika tujuan seleksi item adalah untuk memilih item dengan tingkat kesukaran tinggi, korelasi biserial lebih disarankan (jika asumsi distribusi normal pada item dapat dipenuhi).
3.  Jika pengembang tes menduga bahwa sampel lain yang akan dites memiliki kemampuan yang berbeda dengan kelompok yang dites saat ini, korelasi biserial lebih direkomendasikan. Hal ini karena nilai korelasi biserial relatif lebih stabil pada sample yang berbeda tingkat kemampuannya. Dengan kata lain, jika nilai korelasi biserial pada item yang sangat mudah atau sangat sukar ternyata rendah, hal ini memang menunjukkan daya diskriminasi item yang buruk. Namun jika nilai korelasi point-biserial pada item yang sangat mudah atau sangat sukar rendah, hal ini tidak berarti bahwa daya diskriminasi item tersebut buruk.
4.  Jika pengembang tes yakin bahwa sampel lain yang akan dites memiliki kemampuan yang relatif sama dengan kelompok yang dites saat ini, dan tujuan pemilihan item adalah untuk mencari item yang memiliki konsistensi internal tinggi, maka direkomendasikan untuk menggunakan korelasi point-biserial.

Referensi bacaan
Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Monterey, CA: Brooks/Cole.

Crocker, L. M., & Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston.

Ebel, R. L. (1965). Measuring educational achievement. Englewood Cliffs, N.J: PrenticeHall

Mahasiswa PhD di ELTE, Hungaria. Dosen Psikologi di UMM, Indonesia.

Share this

Related Posts

Previous
Next Post »

2 komentar

Write komentar
June 20, 2021 at 9:21 PM delete

Selamat pagi, Pak. Izin bertanya, saya membuat kuesioner Health Belief Model dengan kategori jawaban Likert 1-4.
Karena ketika dicek normalitas ternyata tidak normal, tidak dapat menggunakan kategorisasi milik Azwar dan dosen saya menyarankan menggunakan cut-off milik Ankur Barua, di mana di dalam rumusnya dibutuhkan indeks diskriminasi yang dapat dilihat dari koefisien korelasi Spearman tiap item tiap variabel.
Responden saya berjumlah 116, bagaimana cara membagi kelompok skor tinggi dan kelompok skor rendah? Apakah lebih baik menggunakan 27% kelompok dengan skor rendah dan 27% kelompok dengan skor tinggi atau membagi menjadi 2 kelompok 58 orang dengan skor tinggi:58 orang dengan skor rendah?
Terima kasih banyak Pak..

Reply
avatar
September 22, 2021 at 7:17 PM delete

Selamat siang, apabila data dikotomi likert tapi tidak normal, apakah masih bisa menggunakan korelasi biserial? atau pindah ke point biserial ya? terimakasih

Reply
avatar
Dalam proses penyusunan alat tes, proses seleksi item menjadi bagian yang sangat krusial. Proses ini bertujuan untuk memilih item mana saja yang layak kita masukkan dalam alat tes kita. Dalam analisis dengan teori tes klasik, daya diskriminasi item menjadi salah satu paramater yang paling utama dalam seleksi item. Daya diskriminasi item menunjukkan seberapa baik item dalam membedakan individu mana yang memiliki kemampuan dan mana yang tidak. Dalam konteks tes kognitif, dimana jawaban soal hanya diskor benar dan salah (1/0), ada tiga jenis parameter diskriminasi item yang biasa digunakan, yakni indeks diskriminasi item, korelasi point-biserial, dan korelasi biserial. Diantara ketiganya, terkadang kita bingung mau menggunakan yang mana karena tidak terlalu memahami perbedaannya. Tulisan ini akan menjelaskan perbedaan ketiganya dan bagaimana penggunaannya.


Indeks Diskriminasi Item
Indeks diskriminasi item (di) merupakan salah satu parameter daya beda yang sederhana. Indeks ini mengukur seberapa baik item dapat membedakan antara subjek yang memiliki skor tinggi dan skor rendah. Karena kemudahannya dalam penghitungan dan interpretasinya, indeks diskriminasi terus menjadi salah satu metode yang paling populer dan sangat cocok untuk analisis item di kelas yang dilakukan dengan perhitungan manual.

Indeks diskriminasi item (diadalah selisih antara proporsi benar dalam kelompok Tinggi dan kelompok Rendah (Crocker & Algina, 1986). Untuk memperoleh indeks diskriminasi item, kelompok subjek dibagi menjadi dua kelompok, yakni kelompok subjek yang memiliki skor total tertinggi dan kelompok subjek yang memiliki skor total terendah sesuai dengan batas yang ditetapkan. Analisis pada kelompok sampel yang besar biasanya hanya dilakukan pada 27% kelompok subjek yang memiliki skor total tertinggi dan 27% kelompok subjek yang memiliki skor total terendah. Namun pada kasus dimana subjek terlalu sedikit, bisa juga dibagi dua separuh-separuh. Suatu item yang memiliki indeks dikriminasi tinggi bila dijawab dengan benar oleh semua atau sebagian besar kelompok Tinggi dan tidak bisa dijawab benar oleh semua atau sebagian besar kelompok Rendah.

Indeks diskriminasi item (di) dapat dihitung dengan formula
Indeks ini memiliki kisaran kemungkinan -1,0 hingga +1,0. Ebel (1965) menawarkan panduan berikut untuk interpretasi item berdasarkan indeks diskriminasi itemnya, yakni sebagai berikut:
Indeks Diskriminasi
Interpretasi
0,40 atau lebih
Item berfungsi sangat baik
0,30 – 0,39
Item sudah baik, mungkin diperlukan revisi kecil
0,20 – 0,29
Item masih meragukan dan perlu direvisi
Kurang dari 0,20
Item harus dibuang atau direvisi total

Korelasi Point-biserial
Korelasi point-biserial adalah korelasi product moment Pearson yang berlaku pada skor item yang bersifat dikotomi diskret (0/1) dengan skor total pada suatu tes yang bersifat interval. Maksud dari dikotomi diskret di sini adalah bahwa perbedaan nilai 1 dan 0 adalah nyata dan tidak nilai kontinum di dalamnya. Misalnya adalah hidup dan mati. Keduanya adalah diskret karena tidak ada setengah hidup dan setengah mati. Sebagian besar analisis item menggunakan metode korelasi point-biserial sebagai acuan analisis item.

Korelasi point-biserial (rpbis) dapat dihitung dengan formula
Karena korelasi point-biserial sesungguhnya sama dengan korelasi product moment Pearson, maka nilai koefisien ini berkisar antara -1,00 sampai dengan +1,00. Dalam seleksi item, hanya nilai positif saja yang dapat dianggap sebagai item yang baik, karena nilai negatif menunjukkan fungsi diskriminasi yang terbalik. Nilai negatif juga bisa terjadi karena kesalahan pembuatan kunci jawaban. Prinsip utama dalam pemilihan item dengan melihat koefisien korelasi point-biserial adalah dengan mencari nilai koefisien setinggi mungkin dan membuang atau merevisi setiap item yang mempunyai korelasi negatif (-) atau koefisien yang mendekati nol (0,00)

Korelasi Biserial
Korelasi biserial adalah korelasi antara skor item dikotomi kontinum (0/1) dengan total skor suatu tes. Maksud dari dikotomi kontinum di sini adalah perbedaan nilai 1 dan 0 ini bisa saja memiliki makna hanya buatan saja karena masih ada lagi nilai kontinum di dalamnya. Misalnya, kepuasan pelanggan, meskipun secara kategori hanya dinyatakan puas dan tidak puas, namun di dalamnya sebenarnya ada kontinum seperti puas sekali, lumayan puas, sedikit puas, tidak puas, sangat tidak puas. Korelasi ini didasarkan pada asumsi bahwa skor item memiliki distribusi normal. Perlu diperhatikan, dikarenakan korelasi biserial bukan merupakan korelasi product moment, maka nilainya memungkinkan untuk lebih dari 1,0.

Korelasi biserial (rbis) dapat dihitung dengan formula
Atau secara matematis, hubungan antara korelasi biserial dan point-biserial dapat dinyatakan sebagai berikut
Dikarenakan nilai y selalu lebih rendah dari nilai √p(1-p), maka nilai korelasi biserial selalu setidaknya 1/5 lebih besar daripada nilai korelasi point-biserial. Pada item dengan tingkat kesukaran sedang, perbedaan nilai korelasi biserial dan point-biserial tidak terlalu besar, namun pada item dengan tingkat kesukaran sangat tinggi atau sangat rendah, perbedaan ini bisa meningkat sangat besar. Oleh karena itu, perbedaan nilai parameter diskriminasi dengan korelasi point-biserial dan biserial sebenarnya bukan menunjukkan perbedaan kualitas dari item tersebut, melainkan karena pemilihan formula yang digunakan.

Sama seperti pada korelasi point-biserial, semakin tinggi nilai koefisien berarti item berfungsi semakin baik, sedangkan item yang bernilai negatif atau mendekati nol kurang berfungsi dengan baik. Namun yang patut mendapat catatan adalah, korelasi biserial bukanlah korelasi product moment, sehingga memungkinkan nilainya melebihi 1,00.

Paramater Diskriminasi mana yang harus kita pilih?
Crocker dan Algina (1986) memberikan rangkuman pertimbangan yang dapat digunakan unuk pemilihan parameter diskriminasi item yang dapat digunakan.
1.  Jika tingkat kesukaran item sedang, sebenarnya tidak akan banyak berbeda menggunakan ketiga metode tersebut. Jika yang menjadi pertimbangan adalah kemudahan perhitungannya, indeks diskriminasi item dapat digunakan. Jika yang menjadi pertimbangan adalah signifikansi statistiknya, salah satu dari korelasi pont-biserial atau biserial dapat digunakan.
2.  Jika tujuan seleksi item adalah untuk memilih item dengan tingkat kesukaran tinggi, korelasi biserial lebih disarankan (jika asumsi distribusi normal pada item dapat dipenuhi).
3.  Jika pengembang tes menduga bahwa sampel lain yang akan dites memiliki kemampuan yang berbeda dengan kelompok yang dites saat ini, korelasi biserial lebih direkomendasikan. Hal ini karena nilai korelasi biserial relatif lebih stabil pada sample yang berbeda tingkat kemampuannya. Dengan kata lain, jika nilai korelasi biserial pada item yang sangat mudah atau sangat sukar ternyata rendah, hal ini memang menunjukkan daya diskriminasi item yang buruk. Namun jika nilai korelasi point-biserial pada item yang sangat mudah atau sangat sukar rendah, hal ini tidak berarti bahwa daya diskriminasi item tersebut buruk.
4.  Jika pengembang tes yakin bahwa sampel lain yang akan dites memiliki kemampuan yang relatif sama dengan kelompok yang dites saat ini, dan tujuan pemilihan item adalah untuk mencari item yang memiliki konsistensi internal tinggi, maka direkomendasikan untuk menggunakan korelasi point-biserial.

Referensi bacaan
Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Monterey, CA: Brooks/Cole.

Crocker, L. M., & Algina, J. (1986). Introduction to classical and modern test theory. New York: Holt, Rinehart and Winston.

Ebel, R. L. (1965). Measuring educational achievement. Englewood Cliffs, N.J: PrenticeHall

2 comments

  1. Selamat pagi, Pak. Izin bertanya, saya membuat kuesioner Health Belief Model dengan kategori jawaban Likert 1-4.
    Karena ketika dicek normalitas ternyata tidak normal, tidak dapat menggunakan kategorisasi milik Azwar dan dosen saya menyarankan menggunakan cut-off milik Ankur Barua, di mana di dalam rumusnya dibutuhkan indeks diskriminasi yang dapat dilihat dari koefisien korelasi Spearman tiap item tiap variabel.
    Responden saya berjumlah 116, bagaimana cara membagi kelompok skor tinggi dan kelompok skor rendah? Apakah lebih baik menggunakan 27% kelompok dengan skor rendah dan 27% kelompok dengan skor tinggi atau membagi menjadi 2 kelompok 58 orang dengan skor tinggi:58 orang dengan skor rendah?
    Terima kasih banyak Pak..

    ReplyDelete
  2. Selamat siang, apabila data dikotomi likert tapi tidak normal, apakah masih bisa menggunakan korelasi biserial? atau pindah ke point biserial ya? terimakasih

    ReplyDelete

Artikel Lainnya