Memaknai Corrected Item-Total Correlation pada Alat Ukur Penelitian

Ketika kita menggunakan pendekatan kuantitatif dalam melakukan sebuah penelitian, tentunya kita akan menggunakan alat ukur untuk mendapatkan data yang dibutuhkan. Alat ukur berguna untuk menguantifikasikan variabel yang ingin diukur. Seperti halnya jika kita ingin mengetahui tekanan darah, kita bisa menggunakan tensimeter. Tentunya, tensimeter yang sudah dikalibrasi sehingga menghasilkan nilai tekanan darah yang valid dan reliabel. Pengukuran tekanan darah merupakan contoh pengukuran atribut fisik. Bagaimana jika kita ingin mengukur atribut psikologis?


Untuk mengukur atribut psikologis, alat ukur yang bisa digunakan ialah tes dan skala (Azwar, 2016). Tes mengukur atribut psikologis yang bersifat performa maksimal. Sedangkan skala mengukur atribut psikologis yang bersifat tipikal atau kecenderungan. Bagaimana kita tahu alat ukur tersebut valid dan reliabel? Inilah yang sering menjadi pertanyaan besar bagi kita semua.

Alat ukur yang reliabel bisa dilihat dari koefisien reliabilitasnya. Lalu, bagaimana dengan alat ukur yang valid ? Dengan cara apa kita mengetahui alat ukur tersebut valid ?
Kebanyakan penelitian mahasiswa S1 (skripsi) menyimpulkan instrumen penelitian mereka valid dengan dasar nilai corrected item-total correlation yang baik. Nilai tersebut baik karena bernilai di atas 0,3 atau sedikit toleransi hingga di atas 0,25 (Azwar, 2015, 2018). Di tambah dengan expert judgement terutama dosen pembimbing. Pertanyaan yang muncul, apakah benar kedua hal tersebut dapat menjadi patokan validitas alat ukur?
Jawabannya, BENAR namun tidak sepenuhnya benar. Mengapa?
  1. Expert judgement merupakan satu cara untuk mendapatkan bukti validitas berdasar isi tes (Furr & Bacharach, 2013). Ketika pendapat expert terhadap teori dan konsep psikometri menunjukkan bahwa alat tersebut valid maka hal ini menjadi salah satu indikator validitas alat ukur tersebut. Namun demikian, kita tidak boleh langsung mengatakan alat ukur ini valid. Masih terdapat beberapa “parameter” mengenai validitas yang harus didapatkan bukti keberadaannya.
  2. Corrected item-total correlation merupakan salah satu parameter dari properti psikometris level butir. Namun demikian, nilai ini tidak termasuk parameter yang secara spesifik mendukung validitas bahkan tidak termasuk dalam bukti validitas pada konsep validitas terbaru (Furr & Bacharach, 2013).

Lantas, apa yang ditunjukkan oleh nilai corrected item-total correlation pada hasil uji coba skala?
Corrected item-total correlation merupakan output dari analisis yang dilakukan oleh SPSS. Corrected item-total correlation berasal dari nilai item-total correlation yang disempurnakan. Maksudnya disempurnakan ialah untuk menghilangkan efek spurious overlap (baca “Pedoman Analisis Item Menggunakan Pendekatan Teori TesKlasik”). Item-total correlation merupakan nilai korelasi antara skor butir dengan skor total skala. Korelasi skor yang didapat subjek pada butir nomor 24 dengan skor total yang didapat subjek pada skala tersebut merupakan nilai item-total correlation untuk butir nomor 24.

Prinsipnya ialah korelasi, lebih spesifiknya korelasi menggunakan product moment pearson. Berarti ketika suatu butir berkorelasi dengan keseluruhan skor skala, maka dapat dikatakan butir tersebut mengukur hal yang selaras. Perlu diingat, kata selaras berbeda dengan kata tepat. Mengapa? Karena ketika suatu alat ukur tersebut memiliki butir yang selaras namun tidak mengukur apa yang diukur maka dapat dikatakan skala tersebut tidak valid atau tidak tepat.

Secara gampangnya, corrected item-total correlation merupakan salah satu parameter yang bertujuan untuk melihat kesesuaian fungsi butir dengan fungsi keseluruhan skala. Semakin tinggi nilai korelasinya maka alat tersebut memiliki keselarasan atau konsistensi pada skala tersebut. Dengan demikian, kita pasti bertanya, konsistensi? Mirip dengan reliabilitas ya? Iya memang, namun bukan nilai reliabilitas melainkan parameter yang dapat meningkatkan atau menurunkan reliabilitas.

Selain untuk melihat kesesuaian fungsi butir dengan fungsi keseluruhan skala, corrected item-total correlation memperlihatkan seberapa mampu butir tersebut membedakan kelompok subjek berdasarkan performanya pada variabel yang diukur (kelompok rendah dan kelompok tinggi). Hal ini yang membuat corrected item-total correlation menjadi sebuah properti psikometris yang dinamakan daya diskriminasi butir atau daya beda butir.
Prinsip daya beda butir ini sebenarnya mirip dengan fungsi sebelumnya, yaitu melihat korelasi. Namun demikian, pemaknaannya sedikit berbeda. Secara lebih jelas, berikut ilustrasi mengenai kedua prinsip tersebut.

ILUSTRASI
Gambar 1 Tabulasi nilai corrected item-total correlation skala AM-12 (Marvianto, 2018)
Gambar 2 Hasil korelasi product moment antara AM 10 dengan seluruh skor AM tanpa butir AM 10
Gambar 3  Korelasi product moment antara AM 10 dengan seluruh butir AM

Berdasarkan Gambar 1 dapat dilihat nilai korelasi butir total 12 butir skala Achievement Motivation versi pendek. Kita perhatikan pada butir AM 10, korelasi butir-total sebesar 0,538. Gambar 2 menunjukkan bahwa hasil korelasi antara butir AM 10 dengan  seluruh butir AM tanpa skor AM 10 menunjukkan nilai yang sama persis dengan hasil di Gambar 1. Hal ini menunjukkan bahwa corrected item-total correlation sudah menghilangkan efek spurious overlap. Efek ini dapat dilihat pada Gambar 3, nilai korelasi yang tertera pada gambar tersebut menunjukkan nilai yang lebih besar atau dapat dikatakan overestimate. Hal ini terjadi karena skor total mengandung skor dari butir AM 10. 


Berdasar Gambar 1, dapat kita simpulkan bahwa butir AM 1, 7 dan 9 tidak selaras dengan keseluruhan butir pada AM-12. Pertanyaan yang akan muncul dan pasti muncul ialah “Apakah ketiga butir ini akan langsung dibuang?”. Pertanyaan yang sangat menakjubkan. Perlu pembahasan yang panjang untuk menjawab pertanyaan tersebut. Dalam web ini akan dijelaskan bagaimana proses membuang atau merevisi butir. Ditunggu yaa hehe….
Lalu, bagaimana ilustrasi untuk daya diskriminasi?

Kita ambil contoh dua butir pada AM-12. Butir AM 10 dan butir AM 7. Butir 10 tergolong memiliki daya diskriminasi yang baik karena di atas 0,3. Sedangkan, butir AM 7 tergolong memiliki daya diskriminasi yang buruk karena nilainya di bawah 0,3. Secara statistik kita dapat melihat perbedaan skor tersebut melalui grafik korelasinya. Berikut gambar kedua korelasi butir-total pada butir AM 10 dan AM 7.
 
Gambar 4 Grafik korelasi AM 10 dengan keseluruhan skala tanpa butir AM 10
Gambar 5 Grafik korelasi AM 7 dengan keseluruhan skala tanpa butir AM 7

Kita perhatikan Gambar 4 dan Gambar 5. Berbeda bukan? Apa yang membedakan? Garis linearnya? Iya secara umum seperti itu. Namun mari kita cermati Gambar 4, pada gambar empat, subjek yang menjawab angka 1 (Angka 0 menunjukkan performa yang rendah dan angka 4 menunjukkan performa paling tinggi) memiliki skor di antara 10 – 15, subjek yang menjawab angka 2 memiliki skor di antara 15 – 30, dan subjek yang menjawab angka 3 memiliki skor total berkisar 20-35. Secara sekilas, terdapat perbedaan antara skor total subjek yang menjawab 1 dengan menjawab 3. Hal ini yang dimaksud daya diskriminasi butir. Seberapa besar butir dapat membedakan kelompok rendah dan kelompok tinggi.
Pada Gambar 5, subjek yang menjawab 1 memiliki skor total 15 – 25, sedangkan yang menjawab 2 memiliki skor di antara 10 – 30, dan yang menjawab 3 memiliki skor di antara 15 – 30. Secara sekilas tidak terlalu ada perbedaan antara subjek yang menjawab 1 dan 3. Mengapa? Karena subjek yang menjawab 1 masih berada pada range skor di mana subjek menjawab 3. Hal ini membuat daya diskriminasi butir rendah karena butir tidak bisa membedakan subjek dengan kemampuan rendah dan tinggi.

KESIMPULAN
Corrected item-total correlation merupakan salah satu parameter yang digunakan untuk mengevaluasi properti psikometris alat ukur. Dengan kata lain, corrected item-total correlation merupakan properti psikometris yang dinamakan daya beda butir atau daya diskriminasi butir. Fungsi dari properti ini untuk melihat kesesuaian fungsi butir dengan keseluruhan tes dan melihat seberapa mampu butir membedakan subjek berdasarkan performanya. Oleh karena itu, kita tidak dapat berlandas pada properti ini untuk mengatakan bahwa alat ukur kita valid.

REFERESI
Azwar, S. (2015). Penyusunan Skala Psikologi (Edisi 2). Yogyakarta: Pustaka Pelajar.
Azwar, S. (2016). Konstruksi Tes Kemampuan Kognitif (Edisi 1). Yogyakarta: Pustaka Pelajar.
Azwar, S. (2018). Metode Penelitian Psikologi (Edisi II). Yogyakarta: Pustaka Pelajar.
Furr, M. R., & Bacharach, V. R. (2013). Psychometric: An Introduction (2nd ed.). Amazon: SAGE Publisher.
Marvianto, R. D. (2018). Adaptasi dan Evaluasi Properti Psikometris Skala Academic Motivation Scale (AMS) versi Bahasa Indonesia. Universitas Gadjah Mada.


Seorang mantan wota dan mantan mahasiswa S1 yang ingin belajar dan menjadi mahasiswa lagi

Share this

Related Posts

Previous
Next Post »

2 komentar

Write komentar
Anonymous
November 7, 2019 at 9:32 AM delete

Saya tomy. Saya mau tanya, dari keterangan diatas corrected item-total correlation tidak bisa disebut sebagai alat untuk uji validitas, berarti bagaimana menguji validitas yang benar? Bagaimana dengan korelasi product moment?

Reply
avatar
Anonymous
April 30, 2020 at 7:58 PM delete

prinsip korelasi product moment sama seperti korelasi butir-total spt penjelasan diatas,oleh sebab itu korelasi product moment pun tidak dapat menyebutkab bahwa butir valid/tidak. Gunakan uji validitas isi spt expert judgment atau uji analisis faktor

Reply
avatar
Ketika kita menggunakan pendekatan kuantitatif dalam melakukan sebuah penelitian, tentunya kita akan menggunakan alat ukur untuk mendapatkan data yang dibutuhkan. Alat ukur berguna untuk menguantifikasikan variabel yang ingin diukur. Seperti halnya jika kita ingin mengetahui tekanan darah, kita bisa menggunakan tensimeter. Tentunya, tensimeter yang sudah dikalibrasi sehingga menghasilkan nilai tekanan darah yang valid dan reliabel. Pengukuran tekanan darah merupakan contoh pengukuran atribut fisik. Bagaimana jika kita ingin mengukur atribut psikologis?


Untuk mengukur atribut psikologis, alat ukur yang bisa digunakan ialah tes dan skala (Azwar, 2016). Tes mengukur atribut psikologis yang bersifat performa maksimal. Sedangkan skala mengukur atribut psikologis yang bersifat tipikal atau kecenderungan. Bagaimana kita tahu alat ukur tersebut valid dan reliabel? Inilah yang sering menjadi pertanyaan besar bagi kita semua.

Alat ukur yang reliabel bisa dilihat dari koefisien reliabilitasnya. Lalu, bagaimana dengan alat ukur yang valid ? Dengan cara apa kita mengetahui alat ukur tersebut valid ?
Kebanyakan penelitian mahasiswa S1 (skripsi) menyimpulkan instrumen penelitian mereka valid dengan dasar nilai corrected item-total correlation yang baik. Nilai tersebut baik karena bernilai di atas 0,3 atau sedikit toleransi hingga di atas 0,25 (Azwar, 2015, 2018). Di tambah dengan expert judgement terutama dosen pembimbing. Pertanyaan yang muncul, apakah benar kedua hal tersebut dapat menjadi patokan validitas alat ukur?
Jawabannya, BENAR namun tidak sepenuhnya benar. Mengapa?
  1. Expert judgement merupakan satu cara untuk mendapatkan bukti validitas berdasar isi tes (Furr & Bacharach, 2013). Ketika pendapat expert terhadap teori dan konsep psikometri menunjukkan bahwa alat tersebut valid maka hal ini menjadi salah satu indikator validitas alat ukur tersebut. Namun demikian, kita tidak boleh langsung mengatakan alat ukur ini valid. Masih terdapat beberapa “parameter” mengenai validitas yang harus didapatkan bukti keberadaannya.
  2. Corrected item-total correlation merupakan salah satu parameter dari properti psikometris level butir. Namun demikian, nilai ini tidak termasuk parameter yang secara spesifik mendukung validitas bahkan tidak termasuk dalam bukti validitas pada konsep validitas terbaru (Furr & Bacharach, 2013).

Lantas, apa yang ditunjukkan oleh nilai corrected item-total correlation pada hasil uji coba skala?
Corrected item-total correlation merupakan output dari analisis yang dilakukan oleh SPSS. Corrected item-total correlation berasal dari nilai item-total correlation yang disempurnakan. Maksudnya disempurnakan ialah untuk menghilangkan efek spurious overlap (baca “Pedoman Analisis Item Menggunakan Pendekatan Teori TesKlasik”). Item-total correlation merupakan nilai korelasi antara skor butir dengan skor total skala. Korelasi skor yang didapat subjek pada butir nomor 24 dengan skor total yang didapat subjek pada skala tersebut merupakan nilai item-total correlation untuk butir nomor 24.

Prinsipnya ialah korelasi, lebih spesifiknya korelasi menggunakan product moment pearson. Berarti ketika suatu butir berkorelasi dengan keseluruhan skor skala, maka dapat dikatakan butir tersebut mengukur hal yang selaras. Perlu diingat, kata selaras berbeda dengan kata tepat. Mengapa? Karena ketika suatu alat ukur tersebut memiliki butir yang selaras namun tidak mengukur apa yang diukur maka dapat dikatakan skala tersebut tidak valid atau tidak tepat.

Secara gampangnya, corrected item-total correlation merupakan salah satu parameter yang bertujuan untuk melihat kesesuaian fungsi butir dengan fungsi keseluruhan skala. Semakin tinggi nilai korelasinya maka alat tersebut memiliki keselarasan atau konsistensi pada skala tersebut. Dengan demikian, kita pasti bertanya, konsistensi? Mirip dengan reliabilitas ya? Iya memang, namun bukan nilai reliabilitas melainkan parameter yang dapat meningkatkan atau menurunkan reliabilitas.

Selain untuk melihat kesesuaian fungsi butir dengan fungsi keseluruhan skala, corrected item-total correlation memperlihatkan seberapa mampu butir tersebut membedakan kelompok subjek berdasarkan performanya pada variabel yang diukur (kelompok rendah dan kelompok tinggi). Hal ini yang membuat corrected item-total correlation menjadi sebuah properti psikometris yang dinamakan daya diskriminasi butir atau daya beda butir.
Prinsip daya beda butir ini sebenarnya mirip dengan fungsi sebelumnya, yaitu melihat korelasi. Namun demikian, pemaknaannya sedikit berbeda. Secara lebih jelas, berikut ilustrasi mengenai kedua prinsip tersebut.

ILUSTRASI
Gambar 1 Tabulasi nilai corrected item-total correlation skala AM-12 (Marvianto, 2018)
Gambar 2 Hasil korelasi product moment antara AM 10 dengan seluruh skor AM tanpa butir AM 10
Gambar 3  Korelasi product moment antara AM 10 dengan seluruh butir AM

Berdasarkan Gambar 1 dapat dilihat nilai korelasi butir total 12 butir skala Achievement Motivation versi pendek. Kita perhatikan pada butir AM 10, korelasi butir-total sebesar 0,538. Gambar 2 menunjukkan bahwa hasil korelasi antara butir AM 10 dengan  seluruh butir AM tanpa skor AM 10 menunjukkan nilai yang sama persis dengan hasil di Gambar 1. Hal ini menunjukkan bahwa corrected item-total correlation sudah menghilangkan efek spurious overlap. Efek ini dapat dilihat pada Gambar 3, nilai korelasi yang tertera pada gambar tersebut menunjukkan nilai yang lebih besar atau dapat dikatakan overestimate. Hal ini terjadi karena skor total mengandung skor dari butir AM 10. 


Berdasar Gambar 1, dapat kita simpulkan bahwa butir AM 1, 7 dan 9 tidak selaras dengan keseluruhan butir pada AM-12. Pertanyaan yang akan muncul dan pasti muncul ialah “Apakah ketiga butir ini akan langsung dibuang?”. Pertanyaan yang sangat menakjubkan. Perlu pembahasan yang panjang untuk menjawab pertanyaan tersebut. Dalam web ini akan dijelaskan bagaimana proses membuang atau merevisi butir. Ditunggu yaa hehe….
Lalu, bagaimana ilustrasi untuk daya diskriminasi?

Kita ambil contoh dua butir pada AM-12. Butir AM 10 dan butir AM 7. Butir 10 tergolong memiliki daya diskriminasi yang baik karena di atas 0,3. Sedangkan, butir AM 7 tergolong memiliki daya diskriminasi yang buruk karena nilainya di bawah 0,3. Secara statistik kita dapat melihat perbedaan skor tersebut melalui grafik korelasinya. Berikut gambar kedua korelasi butir-total pada butir AM 10 dan AM 7.
 
Gambar 4 Grafik korelasi AM 10 dengan keseluruhan skala tanpa butir AM 10
Gambar 5 Grafik korelasi AM 7 dengan keseluruhan skala tanpa butir AM 7

Kita perhatikan Gambar 4 dan Gambar 5. Berbeda bukan? Apa yang membedakan? Garis linearnya? Iya secara umum seperti itu. Namun mari kita cermati Gambar 4, pada gambar empat, subjek yang menjawab angka 1 (Angka 0 menunjukkan performa yang rendah dan angka 4 menunjukkan performa paling tinggi) memiliki skor di antara 10 – 15, subjek yang menjawab angka 2 memiliki skor di antara 15 – 30, dan subjek yang menjawab angka 3 memiliki skor total berkisar 20-35. Secara sekilas, terdapat perbedaan antara skor total subjek yang menjawab 1 dengan menjawab 3. Hal ini yang dimaksud daya diskriminasi butir. Seberapa besar butir dapat membedakan kelompok rendah dan kelompok tinggi.
Pada Gambar 5, subjek yang menjawab 1 memiliki skor total 15 – 25, sedangkan yang menjawab 2 memiliki skor di antara 10 – 30, dan yang menjawab 3 memiliki skor di antara 15 – 30. Secara sekilas tidak terlalu ada perbedaan antara subjek yang menjawab 1 dan 3. Mengapa? Karena subjek yang menjawab 1 masih berada pada range skor di mana subjek menjawab 3. Hal ini membuat daya diskriminasi butir rendah karena butir tidak bisa membedakan subjek dengan kemampuan rendah dan tinggi.

KESIMPULAN
Corrected item-total correlation merupakan salah satu parameter yang digunakan untuk mengevaluasi properti psikometris alat ukur. Dengan kata lain, corrected item-total correlation merupakan properti psikometris yang dinamakan daya beda butir atau daya diskriminasi butir. Fungsi dari properti ini untuk melihat kesesuaian fungsi butir dengan keseluruhan tes dan melihat seberapa mampu butir membedakan subjek berdasarkan performanya. Oleh karena itu, kita tidak dapat berlandas pada properti ini untuk mengatakan bahwa alat ukur kita valid.

REFERESI
Azwar, S. (2015). Penyusunan Skala Psikologi (Edisi 2). Yogyakarta: Pustaka Pelajar.
Azwar, S. (2016). Konstruksi Tes Kemampuan Kognitif (Edisi 1). Yogyakarta: Pustaka Pelajar.
Azwar, S. (2018). Metode Penelitian Psikologi (Edisi II). Yogyakarta: Pustaka Pelajar.
Furr, M. R., & Bacharach, V. R. (2013). Psychometric: An Introduction (2nd ed.). Amazon: SAGE Publisher.
Marvianto, R. D. (2018). Adaptasi dan Evaluasi Properti Psikometris Skala Academic Motivation Scale (AMS) versi Bahasa Indonesia. Universitas Gadjah Mada.


2 comments

  1. Saya tomy. Saya mau tanya, dari keterangan diatas corrected item-total correlation tidak bisa disebut sebagai alat untuk uji validitas, berarti bagaimana menguji validitas yang benar? Bagaimana dengan korelasi product moment?

    ReplyDelete
    Replies
    1. prinsip korelasi product moment sama seperti korelasi butir-total spt penjelasan diatas,oleh sebab itu korelasi product moment pun tidak dapat menyebutkab bahwa butir valid/tidak. Gunakan uji validitas isi spt expert judgment atau uji analisis faktor

      Delete

Artikel Lainnya