Perbedaan Kategorisasi Data berdasarkan Statistik Hipotetik dan Empirik

Hanif Akhtar July 08, 2018
Dalam kita mengkategorisasikan data, terkadang pertanyaan yang sering muncul adalah, kita mau pakai statistik hipotetik atau empirik nih? Dulu waktu skripsi, saya menggunakan statistik hipotetik karena dalam buku salah satu profesor saya (Pak Azwar), untuk mengkategorikan subjek ke dalam kelompok tinggi, sedang, dan rendah yang digunakan adalah statistik hipotetik. Namun kemudian oleh dosen penguji prosedur saya ini dikatakan salah. “Untuk apa kita mengambil data sampel, kalau kita mengkategorisasikannya memakai statistik hipotetik”, begitu kata beliau. Saya yang saat itu masih polos diam saja dan mengiyakan saja perkataan dosen penguji. Sekarang saya coba merefleksikan saran itu kembali dan menuliskan pendapat saya mengenai perbedaan keduanya di sini. Untuk cara kategorisasinya dapat dilihat di sini

Oiya,  bagi yang belum tahu maksudnya statistik hipotetik dan empirik, jadi gambarannya begini. Statistik yang dimaksud di sini banyak merujuk ke mean dan standar deviasi (SD). Jadi statistik hipotetik adalah nilai mean dan SD yang mungkin diperoleh dari sejumlah item soal. Jadi kalau suatu tes dengan skala 0-4 memiliki 6 item, maka nilai terendah (Xmin) yang mungkin diperoleh adalah 0 dan nilai tertinggi yang mungkin diperoleh (Xmaks) adalah 24. Dengan demikian mean hipotetiknya adalah titik tengah 0 dan 24 yaitu 12. Sementara SD hipotetiknya adalah 24/6=4. Sementara statistik empirik adalah statistik yang diperoleh dari data sesungguhnya pada sampel kita. Bisa jadi nilai mean dan SD nya lebih tinggi, lebih rendah, atau sama dengan mean dan SD hipotetiknya. 

Ilustrasi
Dalam suatu ujian matematika, dari 100 soal yang ada, Ali berhasil menjawab soal 55 dengan benar. Pertanyaannya, bagaimanakah kategori nilai Ali tersebut, apakah termasuk kelompok rendah, sedang, atau tinggi? Jika dalam ujian itu hanya Ali saja yang diuji, tentulah kita tidak memiliki pembanding, dengan demikian satu-satunya pembanding yang dapat digunakan adalah alat tes tersebut. Karena nilai 55 hanya sedikit di atas mean (mean hipotetik=50), maka bisa kita katakan nilai Ali tersebut sedang. Namun bagaimana jika soal tersebut sebenarnya sangat sulit, dan mean dari nilai 100 siswa dalam ujian matematika ini adalah 25? Tentu bisa kita katakan, nilai Ali ini masuk kategori tinggi dalam kelompoknya. Kita juga bisa mengatakan, jika dengan melihat jumlah soal, secara keseluruhan nilai matematika 100 siswa tersebut adalah rendah.

Jika digambarkan bentuk histogramnya kira-kira seperti ini.


Kembali ke pengelompokan menggunakan statistik hipotetik atau empirik. Penggunaan statistik empirik didasarkan pada kurve normal distribusi skor suatu kelompok, dengan demikian kategorisasi dengan menggunakan statistik empirik akan selalu menghasilkan pola kategori yang sesuai seperti bentuk kurve normal, yakni yang masuk kategori sedang selalu lebih banyak dibanding yang masuk kategori tinggi dan rendah. Sementara penggunaan statistik hipotetik tidak selalu mengikuti kurve normal dari skor kelompok.

Sebagai gambaran, dari contoh di atas kalau digunakan statistik empirik dan hipotetik, kurang lebih kategoriasinya akan seperti ini.

Hasil kategorisasi berdasarkan statistik empirik
Kelompok
Jumlah
Rendah
21 (21%)
Sedang
50 (50%)
Tinggi
19 (19%)

Hasil kategorisasi berdasarkan statistik hipotetik
Kelompok
Jumlah
Rendah
93 (93%)
Sedang
4 (4%)
Tinggi
1 (1%)

Dari dua contoh kategorisasi skor matematika di kelas dengan menggunakan statistik empirik dan hipotetik di atas kita dapat lihat bahwa, jika kita menggunakan statistik empirik, kategorisasi akan membentuk distribusi normal, sedangkan pada statistik hipotetik tidak. Lalu apa beda keduanya? Kembali lagi pada tujuan mengkategorisasikannya. Jika tujuannya adalah melihat posisi relatif individu pada kelompoknya, maka yang digunakan adalah statistik empirik. Jadi nilai Ali yang hanya 55 masuk kategori tinggi dalam kelompok kelas itu. Namun jika tujuannya adalah melihat skor kelompok secara umum, maka yang digunakan adalah statistik hipotetik.

Jadi secara umum, statistik empirik tepat jika digunakan untuk interpretasi pada level individu, sedangkan statistik hipotetik cocok untuk interpretasi kelompok. Menggunakan statistik empirik untuk interpretasi kelompok tentu akan bias dan tidak memberikan banyak informasi, karena sudah pasti secara umum subjek akan berada ada kategori sedang. Sementara menggunakan statistik hipotetik untuk interpretasi individu juga tidak fair karena tidak melihat nilai anggota kelompok yang lain.

Dalam interpretasi hasil pengukuran kita juga mengenal ada dua pendekatan yang sering digunakan, yakni referensi berupa norma (norm referenced) dan referensi berupa kriteria (criterion referenced). Penggunaan referensi berupa norma berusaha untuk membedakan antara individu dalam populasi, sementara refrensi berdasarkan kriteria berusaha membedakan penguasaan individu berdasarkan kriteria yang ditentukan. Sebenarnya kedua hal ini juga setara dengan penggunaan statistik empirik dan hipotetik. Statistik empirik setara dengan pendekatan referensi berupa norma, sementara statistik hipotetik setara dengan pendekatan referensi berupa kriteria.

Dampak dari penggunaan referensi berupa norma adalah melibatkan sampel yang jumlahnya cukup besar, seperti yang digunakan dalam tes inteligensi. Skor yang diperoleh seseorang akan dilihat posisi relatifnya berdasarkan skor pada populasi. Contohnya adalah pada tes Inteligensi. Pada tahap pembuatan alat tes akan dibuat norma yang digunakan untuk interpretasi skor individu. Norma dibuat dengan mengambil sampel yang cukup banyak, karena diharapkan norma ini akan mewakili populasi. (sebagai contoh norma tes WJ-IV dibuat dari sampel sejumlah 7.000 orang).

Sementara penggunaan referensi menggunakan kriteria menghendaki alat ukur yang sudah tervalidasi berulang kali. Kriteria yang ditetapkan bisa disesuaikan dengan tujuan pengukuran. Misalnya, tes TOEFL digunakan untuk seleksi beasiswa. Pantia menetapkan batas minimal tes TOEFL adalah 500, dengan demikian interpretasi skor tersebut hanya berlaku pada individu tersebut tanpa melihat skor kelompok.  

Dari penejelasan di atas, dapat dirangkum perbedaan penggunaan statistik empirik dan hipotetik sebagai berikut.
Statistik empirik
Statistik hipotetik
Digunakan untuk melihat posisi relatif individu terhadap kelompok
Digunakan untuk melihat posisi relatif kelompok beasarkan alat ukur
Interpretasi relatif terhadadap kelompok. Berbeda kelompok akan menghasilkan kategori yang berbeda.
Interpretasi relatif terhadap alat ukur. Berbeda tingkat kesulitan alat ukur (meskipun megukur variabel yang sama) dapat menghasilkan kategori yang berbeda.
Menggunakan sampel yang besar
Menggunakan alat ukur yang sudah tervalidasi berulang kali

Jadi memakai statistik empirik atau hipotetik?
Secara mudah seperti ini saja
-    Jika tujuan utama untuk melihat posisi relatif individu dalam kelompok, maka gunakan statistik empirik. Jika tujuan utama untuk melihat posisi relatif kelompok secara umum terhadap alat tes, gunakan statistik hipotetik.
-   Jika alat tes sudah memiliki norma yang disusun dari statistik empirik sampel dalam jumlah banyak sebelumnya, gunakan statistik empirik. Misal, tes inteligensi yang sudah dibuat normanya berdasarkan ribuan sampel sebelumnya, gunakan kategorisasi dari statistik empirik alat tes inteligensi tersebut.
- Jika penelitian hanya dilakukan pada sampel yang sedikit, atau hanya untuk menggambarkan data kita secara umum tanpa digunakan untuk interpretasi lebih mendalam terhadap individu, gunakan statistik hipotetik.



  

Mahasiswa PhD di ELTE, Hungaria. Dosen Psikologi di UMM, Indonesia.

Share this

Related Posts

Previous
Next Post »

14 komentar

Write komentar
May 2, 2019 at 6:56 PM delete

Subjek penelitian saya adalah remaja yang mengalami kekerasan emosional, untuk memilih subjek dalam penelitian saya menggunakan instrumen. Remaja yang kekerasan emosinya berada pada kategori tinggi saya pilih menjadi subjek penelitian saya. Akan tetapi, saya masih bingung untuk pengkategoriannya apakah saya harus menggunakan statistik empirik atau hipotetik ya? Terimakasih

Reply
avatar
March 26, 2020 at 12:19 PM delete

Mas Saya mau tanya, apakah rumus pengkategorian statistik empirik dan hipotetik itu sama?
Atau apakah rumus mencari mean dan SD hipotetik dan empirik itu sama mas?

Reply
avatar
March 27, 2020 at 7:07 AM delete

Rumus kategorisasinya sama saja, Kalau rumus mencari mean dan SD empirik dan hipotetik sedikit beda. Kalau empirik ya pakai rumus ngitung data asli pada umumnya (banyak di buku-buku statistik), kalau hipotetik ada di sini https://www.semestapsikometrika.com/2018/07/membuat-kategori-skor-skala-dengan-spss.html

Reply
avatar
April 27, 2020 at 11:40 PM delete

saya mau tanya untuk pengkategorian data tapi distribusi tidak normal harus menggunakan apa?

Reply
avatar
August 25, 2020 at 12:47 AM delete

Pada paragraf 2 : Jadi statistik hipotetik adalah nilai mean dan SD yang mungkin diperoleh dari sejumlah item soal. Jadi kalau suatu tes dengan skala 0-4 memiliki 6 item, maka nilai terendah (Xmin) yang mungkin diperoleh adalah 0 dan nilai tertinggi yang mungkin diperoleh (Xmaks) adalah 24. Dengan demikian mean hipotetiknya adalah titik tengah 0 dan 24 yaitu 12. Sementara SD hipotetiknya adalah 24/6=4. Sementara statistik empirik adalah statistik yang diperoleh dari data sesungguhnya pada sampel kita. Bisa jadi nilai mean dan SD nya lebih tinggi, lebih rendah, atau sama dengan mean dan SD hipotetiknya.

Paragraf 8 : jika kita menggunakan statistik empirik, kategorisasi akan membentuk distribusi normal, sedangkan pada statistik hipotetik tidak.

Sepertinya ada kontadiksi, Brother.

Reply
avatar
September 7, 2020 at 9:57 PM delete

klo mau meniali 130 responden itu pakai empirik atau hipotetik. karna tidak ada kriteria responden yg spessifik?

Reply
avatar
April 30, 2021 at 7:29 PM delete

Ka mau tanya

Penelitian saya ttg minat motivasi dan kebiasaan belajar tempat bimbel saya bekerja sebanyak 80 sampel statistik yg tepat digunakan empirik atau hipotetik ka?

Terimakasih sebelumnya ka

Reply
avatar
August 31, 2021 at 1:21 AM delete

Kk mau tanya hasil ukur di DO itu patokanny apakah di master tabel nilai meannya apa boleh kita bikin skore patokan sendiri kk?

Reply
avatar
September 24, 2021 at 5:46 PM delete

Kk mau tanya hasil penelitian saya dg menggunakan tabel kategorisasinya nilai empirik lebih rendah dari nilai hipotetik kira" saat dtnya penguji alasannya knp ya,? Terima kasih

Reply
avatar
Anonymous
April 9, 2022 at 6:27 AM delete

apakah saya bisa meminta referensi artikel ini? saat ini saya sedang menyusun skripsi dan membutuhkan penjelasan terkait kedua kategorisasi data, namun saya tidak bisa mengutip blog pribadi. Terima kasih

Reply
avatar
April 5, 2023 at 11:44 PM delete

Apakah menerbitkan buku menganai kategorisasi skor empirik dan hipotetik? Saya bisa beli dimana?

Reply
avatar
May 1, 2023 at 5:41 PM delete This comment has been removed by the author.
avatar
Dalam kita mengkategorisasikan data, terkadang pertanyaan yang sering muncul adalah, kita mau pakai statistik hipotetik atau empirik nih? Dulu waktu skripsi, saya menggunakan statistik hipotetik karena dalam buku salah satu profesor saya (Pak Azwar), untuk mengkategorikan subjek ke dalam kelompok tinggi, sedang, dan rendah yang digunakan adalah statistik hipotetik. Namun kemudian oleh dosen penguji prosedur saya ini dikatakan salah. “Untuk apa kita mengambil data sampel, kalau kita mengkategorisasikannya memakai statistik hipotetik”, begitu kata beliau. Saya yang saat itu masih polos diam saja dan mengiyakan saja perkataan dosen penguji. Sekarang saya coba merefleksikan saran itu kembali dan menuliskan pendapat saya mengenai perbedaan keduanya di sini. Untuk cara kategorisasinya dapat dilihat di sini

Oiya,  bagi yang belum tahu maksudnya statistik hipotetik dan empirik, jadi gambarannya begini. Statistik yang dimaksud di sini banyak merujuk ke mean dan standar deviasi (SD). Jadi statistik hipotetik adalah nilai mean dan SD yang mungkin diperoleh dari sejumlah item soal. Jadi kalau suatu tes dengan skala 0-4 memiliki 6 item, maka nilai terendah (Xmin) yang mungkin diperoleh adalah 0 dan nilai tertinggi yang mungkin diperoleh (Xmaks) adalah 24. Dengan demikian mean hipotetiknya adalah titik tengah 0 dan 24 yaitu 12. Sementara SD hipotetiknya adalah 24/6=4. Sementara statistik empirik adalah statistik yang diperoleh dari data sesungguhnya pada sampel kita. Bisa jadi nilai mean dan SD nya lebih tinggi, lebih rendah, atau sama dengan mean dan SD hipotetiknya. 

Ilustrasi
Dalam suatu ujian matematika, dari 100 soal yang ada, Ali berhasil menjawab soal 55 dengan benar. Pertanyaannya, bagaimanakah kategori nilai Ali tersebut, apakah termasuk kelompok rendah, sedang, atau tinggi? Jika dalam ujian itu hanya Ali saja yang diuji, tentulah kita tidak memiliki pembanding, dengan demikian satu-satunya pembanding yang dapat digunakan adalah alat tes tersebut. Karena nilai 55 hanya sedikit di atas mean (mean hipotetik=50), maka bisa kita katakan nilai Ali tersebut sedang. Namun bagaimana jika soal tersebut sebenarnya sangat sulit, dan mean dari nilai 100 siswa dalam ujian matematika ini adalah 25? Tentu bisa kita katakan, nilai Ali ini masuk kategori tinggi dalam kelompoknya. Kita juga bisa mengatakan, jika dengan melihat jumlah soal, secara keseluruhan nilai matematika 100 siswa tersebut adalah rendah.

Jika digambarkan bentuk histogramnya kira-kira seperti ini.


Kembali ke pengelompokan menggunakan statistik hipotetik atau empirik. Penggunaan statistik empirik didasarkan pada kurve normal distribusi skor suatu kelompok, dengan demikian kategorisasi dengan menggunakan statistik empirik akan selalu menghasilkan pola kategori yang sesuai seperti bentuk kurve normal, yakni yang masuk kategori sedang selalu lebih banyak dibanding yang masuk kategori tinggi dan rendah. Sementara penggunaan statistik hipotetik tidak selalu mengikuti kurve normal dari skor kelompok.

Sebagai gambaran, dari contoh di atas kalau digunakan statistik empirik dan hipotetik, kurang lebih kategoriasinya akan seperti ini.

Hasil kategorisasi berdasarkan statistik empirik
Kelompok
Jumlah
Rendah
21 (21%)
Sedang
50 (50%)
Tinggi
19 (19%)

Hasil kategorisasi berdasarkan statistik hipotetik
Kelompok
Jumlah
Rendah
93 (93%)
Sedang
4 (4%)
Tinggi
1 (1%)

Dari dua contoh kategorisasi skor matematika di kelas dengan menggunakan statistik empirik dan hipotetik di atas kita dapat lihat bahwa, jika kita menggunakan statistik empirik, kategorisasi akan membentuk distribusi normal, sedangkan pada statistik hipotetik tidak. Lalu apa beda keduanya? Kembali lagi pada tujuan mengkategorisasikannya. Jika tujuannya adalah melihat posisi relatif individu pada kelompoknya, maka yang digunakan adalah statistik empirik. Jadi nilai Ali yang hanya 55 masuk kategori tinggi dalam kelompok kelas itu. Namun jika tujuannya adalah melihat skor kelompok secara umum, maka yang digunakan adalah statistik hipotetik.

Jadi secara umum, statistik empirik tepat jika digunakan untuk interpretasi pada level individu, sedangkan statistik hipotetik cocok untuk interpretasi kelompok. Menggunakan statistik empirik untuk interpretasi kelompok tentu akan bias dan tidak memberikan banyak informasi, karena sudah pasti secara umum subjek akan berada ada kategori sedang. Sementara menggunakan statistik hipotetik untuk interpretasi individu juga tidak fair karena tidak melihat nilai anggota kelompok yang lain.

Dalam interpretasi hasil pengukuran kita juga mengenal ada dua pendekatan yang sering digunakan, yakni referensi berupa norma (norm referenced) dan referensi berupa kriteria (criterion referenced). Penggunaan referensi berupa norma berusaha untuk membedakan antara individu dalam populasi, sementara refrensi berdasarkan kriteria berusaha membedakan penguasaan individu berdasarkan kriteria yang ditentukan. Sebenarnya kedua hal ini juga setara dengan penggunaan statistik empirik dan hipotetik. Statistik empirik setara dengan pendekatan referensi berupa norma, sementara statistik hipotetik setara dengan pendekatan referensi berupa kriteria.

Dampak dari penggunaan referensi berupa norma adalah melibatkan sampel yang jumlahnya cukup besar, seperti yang digunakan dalam tes inteligensi. Skor yang diperoleh seseorang akan dilihat posisi relatifnya berdasarkan skor pada populasi. Contohnya adalah pada tes Inteligensi. Pada tahap pembuatan alat tes akan dibuat norma yang digunakan untuk interpretasi skor individu. Norma dibuat dengan mengambil sampel yang cukup banyak, karena diharapkan norma ini akan mewakili populasi. (sebagai contoh norma tes WJ-IV dibuat dari sampel sejumlah 7.000 orang).

Sementara penggunaan referensi menggunakan kriteria menghendaki alat ukur yang sudah tervalidasi berulang kali. Kriteria yang ditetapkan bisa disesuaikan dengan tujuan pengukuran. Misalnya, tes TOEFL digunakan untuk seleksi beasiswa. Pantia menetapkan batas minimal tes TOEFL adalah 500, dengan demikian interpretasi skor tersebut hanya berlaku pada individu tersebut tanpa melihat skor kelompok.  

Dari penejelasan di atas, dapat dirangkum perbedaan penggunaan statistik empirik dan hipotetik sebagai berikut.
Statistik empirik
Statistik hipotetik
Digunakan untuk melihat posisi relatif individu terhadap kelompok
Digunakan untuk melihat posisi relatif kelompok beasarkan alat ukur
Interpretasi relatif terhadadap kelompok. Berbeda kelompok akan menghasilkan kategori yang berbeda.
Interpretasi relatif terhadap alat ukur. Berbeda tingkat kesulitan alat ukur (meskipun megukur variabel yang sama) dapat menghasilkan kategori yang berbeda.
Menggunakan sampel yang besar
Menggunakan alat ukur yang sudah tervalidasi berulang kali

Jadi memakai statistik empirik atau hipotetik?
Secara mudah seperti ini saja
-    Jika tujuan utama untuk melihat posisi relatif individu dalam kelompok, maka gunakan statistik empirik. Jika tujuan utama untuk melihat posisi relatif kelompok secara umum terhadap alat tes, gunakan statistik hipotetik.
-   Jika alat tes sudah memiliki norma yang disusun dari statistik empirik sampel dalam jumlah banyak sebelumnya, gunakan statistik empirik. Misal, tes inteligensi yang sudah dibuat normanya berdasarkan ribuan sampel sebelumnya, gunakan kategorisasi dari statistik empirik alat tes inteligensi tersebut.
- Jika penelitian hanya dilakukan pada sampel yang sedikit, atau hanya untuk menggambarkan data kita secara umum tanpa digunakan untuk interpretasi lebih mendalam terhadap individu, gunakan statistik hipotetik.



  

14 comments

  1. Subjek penelitian saya adalah remaja yang mengalami kekerasan emosional, untuk memilih subjek dalam penelitian saya menggunakan instrumen. Remaja yang kekerasan emosinya berada pada kategori tinggi saya pilih menjadi subjek penelitian saya. Akan tetapi, saya masih bingung untuk pengkategoriannya apakah saya harus menggunakan statistik empirik atau hipotetik ya? Terimakasih

    ReplyDelete
  2. Mas Saya mau tanya, apakah rumus pengkategorian statistik empirik dan hipotetik itu sama?
    Atau apakah rumus mencari mean dan SD hipotetik dan empirik itu sama mas?

    ReplyDelete
  3. Rumus kategorisasinya sama saja, Kalau rumus mencari mean dan SD empirik dan hipotetik sedikit beda. Kalau empirik ya pakai rumus ngitung data asli pada umumnya (banyak di buku-buku statistik), kalau hipotetik ada di sini https://www.semestapsikometrika.com/2018/07/membuat-kategori-skor-skala-dengan-spss.html

    ReplyDelete
  4. saya mau tanya untuk pengkategorian data tapi distribusi tidak normal harus menggunakan apa?

    ReplyDelete
  5. Pada paragraf 2 : Jadi statistik hipotetik adalah nilai mean dan SD yang mungkin diperoleh dari sejumlah item soal. Jadi kalau suatu tes dengan skala 0-4 memiliki 6 item, maka nilai terendah (Xmin) yang mungkin diperoleh adalah 0 dan nilai tertinggi yang mungkin diperoleh (Xmaks) adalah 24. Dengan demikian mean hipotetiknya adalah titik tengah 0 dan 24 yaitu 12. Sementara SD hipotetiknya adalah 24/6=4. Sementara statistik empirik adalah statistik yang diperoleh dari data sesungguhnya pada sampel kita. Bisa jadi nilai mean dan SD nya lebih tinggi, lebih rendah, atau sama dengan mean dan SD hipotetiknya.

    Paragraf 8 : jika kita menggunakan statistik empirik, kategorisasi akan membentuk distribusi normal, sedangkan pada statistik hipotetik tidak.

    Sepertinya ada kontadiksi, Brother.

    ReplyDelete
  6. klo mau meniali 130 responden itu pakai empirik atau hipotetik. karna tidak ada kriteria responden yg spessifik?

    ReplyDelete
  7. Ka mau tanya

    Penelitian saya ttg minat motivasi dan kebiasaan belajar tempat bimbel saya bekerja sebanyak 80 sampel statistik yg tepat digunakan empirik atau hipotetik ka?

    Terimakasih sebelumnya ka

    ReplyDelete
  8. Kk mau tanya hasil ukur di DO itu patokanny apakah di master tabel nilai meannya apa boleh kita bikin skore patokan sendiri kk?

    ReplyDelete
  9. Kk mau tanya hasil penelitian saya dg menggunakan tabel kategorisasinya nilai empirik lebih rendah dari nilai hipotetik kira" saat dtnya penguji alasannya knp ya,? Terima kasih

    ReplyDelete
  10. apakah saya bisa meminta referensi artikel ini? saat ini saya sedang menyusun skripsi dan membutuhkan penjelasan terkait kedua kategorisasi data, namun saya tidak bisa mengutip blog pribadi. Terima kasih

    ReplyDelete
  11. Apakah menerbitkan buku menganai kategorisasi skor empirik dan hipotetik? Saya bisa beli dimana?

    ReplyDelete
  12. This comment has been removed by the author.

    ReplyDelete

Artikel Lainnya