Semesta Psikometrika: Perbedaan Classical Test Theory (CTT), Item Response Theory (IRT), dan Rasch Model

Monday, October 16, 2023

Perbedaan Classical Test Theory (CTT), Item Response Theory (IRT), dan Rasch Model

Analisis item dalam psikometri pada umumnya dapat dibagi menjadi dua pendekatan: Classical Test Theory (CTT) dan Item Response Theory (IRT). CTT merupakan pendekatan yang paling populer dan paling banyak digunakan oleh peneliti Indonesia. CTT memfokuskan hasil pengukuran pada skor total dari item-item tes. Satu hal yang paling menarik dari CTT ada kemudahan dalam menghitungnya, sehingga tidak diperlukan keahlian khusus untuk memahami hasil analisisnya. Selain itu, CTT juga lebih mudah digunakan untuk komunikasi publik karena secara intuitif, orang akan lebih mudah menerima bahwa orang yang memiliki skor total tinggi memiliki kemampuan yang tinggi pula.

Namun demikian CTT memiliki beberapa ketebatasan. Yang paling utama adalah, tingkat kesulitan item tidak bebas dari sampel yang digunakan; sebaliknya, hasil pengukuran juga tidak terlepas dari tingkat kesulitan item yang digunakan. Jika individu secara acak menerima soal yang sulit, maka besar kemungkinan skor totalnya akan rendah, berbeda dengan jika individu tersebut secara acak menerima soal yang mudah. Begitu juga sebaliknya, jika suatu item dikerjakan oleh orang-orang yang jenius, maka item tersebut akan nampak mudah, berbeda dengan jika item tersebut dikerjakan oleh orang dengan kemampuan rendah. Karena sifat CTT yang sampel-dependent dan item-dependent inilah yang membuat perbandingan antar tes atau perbandingan antar individu lebih rumit dilakukan. Selain itu, peneliti juga tidak bisa membuat item bank untuk Computerized Adaptive Testing dengan CTT.

Pendekatan lainnya adalah dengan IRT yang mampu mengatasi keterbatasan CTT. IRT sendiri merupakan keluarga besar dalam analisis item. Ada beberapa model dalam IRT, seperti model untuk item dikotomi (jawaban benar-salah), model untuk item politomi (misal: likert), model unidimensi, dan model multidimensi. Berdasarkan jumlah parameternya, IRT juga memiliki banyak jenis, seperti model 1PL (hanya tingkat kesulitan butir), 2PL (tingkat kesulitan dan diskriminasi), 3PL (tingkat kesulitan, diskriminasi, dan tebakan semu), dan 4PL (tingkat kesulitan, diskriminasi, tebakan semu, dan kecerobohan).

Dengan semangat yang sama, ada juga model Rasch. Rasch secara matematis sama dengan IRT 1PL, namun memiliki tujuan filosofis yang berbeda. IRT adalah model deskriptif yang tujuannya adalah mencari model mana yang paling cocok menggambarkan data. Misal, data diuji dengan model 1PL dan tidak cocok, maka dicari alternatif model lain dengan menambah parameter lain, misal dengan 2PL, 3PL, atau 4PL. Sementara Rasch adalah model preskriptif yang tujuannya adalah mencocokan data dengan model. Jika data tidak cocok dengan model ideal Rasch, maka perlu diagnosa mengapa data ini tidak cocok. Langkah yang dilakukan bisa dengan menghapus item atau menghapus data dari orang-orang yang pola jawabannya “aneh”. Dengan kata lain, Rasch mendewakan model, sementara IRT mendewakan data.

Apa konsekuensi dari perbedaan Rasch dan IRT ini? Karena Rasch selalu berusaha agar data cocok dengan model, sementara model tidak akan berubah-ubah, maka pendukung Rasch berpendapat bahwa pengukuran yang objektif hanya bisa dicapai dengan Rasch. Pada Rasch, semua item memiliki diskriminasi yang setara, sehingga tidak ada item yang memiliki bobot lebih dalam menentukan skor akhir. Dengan demikian, skor total sebenarnya sudah bisa memberikan informasi yang cukup untuk mengukur suatu konstruk, asalkan asumsi Rasch terpenuhi. Oleh karena itu, hasil pengukuran dengan Rasch dan dengan CTT (skor total) selalu menghasilkan korelasi yang tinggi, lebih dari 0,90.

Sementara itu, IRT mengaggap tiap item itu unik. Mengasumsikan semua item memiliki diskriminasi yang setara sangat tidak masuk akal dalam realitanya. Oleh karenanya IRT membebaskan diskriminasi item bervariasi sesuai dengan data aslinya. Konsekuensinya, tiap item memiliki bobot yang berbeda dalam menentukan skor akhir. Item dengan diskriminasi tinggi akan memiliki bobot lebih besar. Pada model 3PL, parameter tebakan semua juga diizinkan bervariasi. Item dengan tebakan semu lebih rendah akan memiliki bobot lebih dalam menentukan skor akhir. Dengan demikian, skor akhir tidak hanya ditentukan oleh jumlah jawaban benar, tapi juga item mana yang dijawab benar. Korelasi antara skor total dengan skor akhir pada IRT pada akhirnya akan lebih rendah.

12 comments:

UdudjdjfjjfFebruary 14, 2024 at 11:48 PM
Why YouTube Views Matter
Views are the currency of validation in the YouTube ecosystem. Beyond being a performance metric, they significantly influence algorithms that determine a video's reach, positioning, and opportunity for virality. High view counts attract organic views, making your content appear more appealing, and thus more likely to be recommended by YouTube. The psychology is simple: people gravitate towards what's popular. Therefore, while the path to YouTube stardom is paved with subscriber milestones, it's the views that pave the highway.
https://www.buyyoutubesubscribers.in/youtube-video-views/
ReplyDelete
Replies
AnonymousMay 13, 2025 at 4:20 AM
Leadership is a robust subject matter, but leadership homework might be difficult to handle by yourself. If you are a college or university student and pursuing leadership, then we are here for you. At The Tutors Help, we want your learning to become easier and convenient.
Don't wait! Chat with The Tutors Help right away and get the best leadership assignment help that you can trust!
thetutorshelp.com/leadership-assignment-help.php
Leadership Assignment Hel
ReplyDelete
Replies
AnonymousMay 13, 2025 at 4:20 AM
Marketing is a business and strategic, analytical, and innovative career. Nevertheless, trying assignments on your own becomes chaotic. With The Tutors Help, you do not have to worry. We provide Expert Marketing Assignment Support so you get your work done, learn the subject, and succeed academically.
Let us open the door to your success for you. Chat with The Tutors Help today and get the professional assistance you deserve to perform to the best of your abilities in your academic life.
thetutorshelp.com/marketing-assignment-help.php

Marketing Assignment Help
ReplyDelete
Replies
Rajkumar singhMay 21, 2025 at 5:29 AM
Shapoorji Pallonji Sector 46 Gurgaon construct what looks to be a brand-new home. Superior 3 and 4 BHK living luxury houses are available at new finders' pricing at Shapoorji Pallonji Dualis Gurgaon. With the aid of domestic living technology and security measures, residents in equipment, a completely sustainable lifestyle,
Visit- https://www.shapoorjipallonji.ind.in/shapoorji-sector-46-gurgaon/
ReplyDelete
Replies
Industry Mage NewsMay 22, 2025 at 11:09 PM
The Soft Robotics Market is rapidly expanding, driven by growing demand in fields such as medical rehabilitation, food handling, and wearable devices. Soft robots, constructed from highly compliant materials, offer safer interactions with humans and delicate objects, opening opportunities in both healthcare and industrial automation. Key innovations in materials science and bioinspired design are enabling flexible actuators and sensors with improved responsiveness. As traditional rigid robotics face limitations in unstructured environments, soft robotics is poised to transform sectors that require adaptability, sensitivity, and human-robot collaboration.
ReplyDelete
Replies
Iron Fairies!June 27, 2025 at 8:06 PM
This is a very insightful comparison between CTT, IRT, and the Rasch Model. I appreciate how clearly you explained the fundamental differences in assumptions and applications. It's especially helpful to see how each model handles item difficulty and person ability. Great read for anyone diving into psychometrics or educational measurement!
ReplyDelete
Replies
sdmsdigitalmarketingJuly 31, 2025 at 12:04 AM
This was a very informative post! I appreciate how clearly you explained the differences between CTT, IRT, and the Rasch Model. It's helpful to see how each theory approaches measurement and item analysis in its own way. The comparison really helped me understand when and why researchers might choose one model over another. Great work—looking forward to more posts like this!
ReplyDelete
Replies
jack hunterAugust 6, 2025 at 4:55 AM
For business students, crafting the right pricing models can be a daunting task. That’s why professional best pricing strategy assignment help is such a valuable resource. Midway through working on your paper, if you find concepts like value-based or competitive pricing confusing, expert help simplifies everything. They guide you through theories, case studies, and real-world examples, making your assignment well-rounded and insightful. With this support, you can confidently tackle pricing strategy topics and score higher in your business courses.
ReplyDelete
Replies
david zainabMay 14, 2026 at 10:04 PM
This article explains the differences between CTT and IRT in a very clear and structured way. Educational content like this is becoming more valuable as digital learning trends and technology discussions around android waves 2026 continue growing across online communities.
ReplyDelete
Replies
david zainabJune 10, 2026 at 9:22 PM
This article explains Classical Test Theory and Item Response Theory in a clear and useful way. I found it while reading different educational topics and wa gb pro terbaru apk updates, and the comparison helped make the concept easier to understand.
ReplyDelete
Replies
david zainabJune 11, 2026 at 10:41 PM
The explanation of the differences between Classical Test Theory (CTT) and Item Response Theory (IRT) is clear and helpful for understanding educational measurement concepts. Informative content like this is valuable for learners, just as users look for trusted resources such as insta pro 14.85 apk download when searching for updated applications.
ReplyDelete
Replies

Add comment