Analisis Regresi dengan Variabel Dummy di SPSS


Kata “dummy” kalau diterjemahkan secara harfiah artinya “buatan”. Jadi yang dimaksud dengan variabel dummy adalah variabel yang nilainya sebenarnya adalah buatan, karena nilai variabel tersebut sebenarnya bukanlah skala. Atau secara mudahnya, variabel dummy adalah variabel independen yang wujudnya berskala non-metrik atau kategori. Jika variabel independen berukuran kategori atau dikotomi, maka dalam model regresi kita harus nyatakan sebagai variabel dummy dengan memberi kode 0 atau 1. Setiap variabel dummy menyatakan satu kategori variabel, dan setiap variabel dengan k kategori dapat dinyatakan dalam k-1 variabel dummy.

Analisis dengan variabel dummy dilakukan pada saat kita tertarik pada pengaruh variabel independen kategori, atau kita ingin memasukkan variabel kategori tersebut untuk meningkatkan kualitas penelitian kita. Analisis regresi dengan menggunakan variabel dummy memiliki kompleksitas, hasil analisis ini memiliki kemiripan dengan analisis kovarian (anakova), namun sistematika komputasinya sedikit berbeda. Ingat, prosedur yang disajikan dalam tulisan ini adalah prosedur analisis regresi dengan variabel independen berupa kategori, namun jika yang berwujud kategori adalah variabel dependen, maka teknik analisis yang dilakukan adalah dengan analisis regresi logistik.

Misalkan kita ingin variabel demografi apa saja yang mampu memprediksi agresivitas. Desain penelitian kita adalah sebagai berikut.  
·         Variabel dependen            : agresivitas
·         Variabel independen         : umur, jenis kelamin, suku

Kita punya tiga variabel independen yakni umur (X1), jenis kelamin (X2), dan suku (X3). Umur adalah variabel kuantitatif, sedangkan jenis kelamin dan suku merupakan kategori. Jenis kelamin terdiri atas dua kategori, yakni laki-laki dan perempuan, sedangkan suku terdiri atas tiga kategori, yakni Jawa, Sunda, Madura. Karena jenis kelamin terdiri atas 2 kategori, maka variabel jenis kelamin hanya memiliki satu variabel dummy (2-1), sedangkan suku terdiri atas 3 kategori, sehingga variabel suku memiliki 2 variabel dummy (3-1).  

Membuat kode variabel dummy
Seperti yang sudah disinggung di atas, jumlah kategori ditentukan dengan rumus k-1, sedangkan kode yang diberikan adalah 1 dan 0. Semua responden yang menjadi anggota kategori yang diberi kode 1 sedangkan responden tidak dalam kategori tersebut dikode dari 0. Dengan cara seperti ini maka setiap responden akan memiliki kode 1 pada kategori yang sesuai dengannya dan kode 0 pada kategori yang tidak sesuai dengannya.

Misalkan kita memiliki data seperti di bawah ini.
Subjek
Agresivitas
Umur
Jenis kelamin
Suku
A
45
52
Laki-laki
Jawa
B
43
41
Perempuan
Sunda
C
47
40
Laki-laki
Madura
D
53
58
Perempuan
Jawa
E
60
46
Laki-laki
Madura

Pada kategori  2 kelompok, sebenarnya tidak ada aturan baku mana yang harus diberi kode 1 mana yang 0. Tapi agar memudahkan pemaknaan terhadap hasil berilah angka 1 pada kategori yang secara teoritik akan memiliki nilai prediksi lebih tinggi. Misal secara teoritik, agresivitas ini lebih mampu diprediksi oleh laki-laki, maka laki-laki kita beri kode 1. Dari data mentah kita, kita bisa ubah input data kita seperti di bawah ini.
Subjek
Agresivitas
Umur
Laki-laki
Jawa
Sunda
A
45
52
1
1
0
B
43
41
0
0
1
C
47
40
1
0
0
D
53
58
0
1
0
E
60
46
1
0
0
 Subjek A adalah laki-laki Jawa, maka pada variabel laki-laki dan Jawa kita beri skor 1, sedangkan ada variabel sunda kita beri skor 0. Sedangkan subjek E adalah laki-laki madura, maka pada variabel laki-laki kita beri skor 1, sedangkan pada variabel Jawa dan Sunda kita beri skor 0 (artinya bukan keduanya).

Input data di SPSS
Karena pemberian kode 1 dan 0 terlalu melelahkan jika harus dilakukan secara manual, apalagi kalau subjek kita sampai ratusan, maka ada beberapa cara yang lebih cepat untuk membuat kode. Salah satu cara yang paling umum dilakukan adalah dengan fungsi “if” di excel. Pada tulisan ini saya akan langsung memberikan cara inut kode variabel dummy di SPSS.
Sebelum kita membuat variabel dummy, seperti biasa, kita ubah terlebih dahulu variabel kategori kita dengan angka nominal. Misalkan dalam contoh di atas, saya ubah laki-laki=1, perempuan=2, Jawa=1, Sunda=2, Madura=3. Dengan demikian pada contoh data di atas data akan berubah seperti ini. Untuk mengubah kode ini cukup mudah, gunakan saja find and replace dengan menekan ctrl+h.
Subjek
Agresivitas
Umur
Jenis kelamin
Suku
A
45
52
1
1
B
43
41
2
2
C
47
40
1
3
D
53
58
2
1
E
60
46
1
3

Misalkan kita akan membuat variabel Dummy laki-laki. Untuk membuat kode pada variabel dummy laki-laki, ikut langkah berikut.
1.    Klik transform – recode into defferent variables
2.    Masukkan variabel JenisKelamin, kemudian pada output variable name tuliskan laki, lalu klik change. Ini artinya kita akan membuat variabel baru bernama laki dari data variabel JenisKelamin.
3.    Klik old and new value
4.    Pada old value, masukkan nilai value adalah 1, kemudian pada new value masukan nilai value adalah 1. Kemudian tekan Add. Prosedur ini akan mengubah laki-laki yang sudah kita kode 1 tadi menjadi angka 1
5.    Kemudian pada old value klik all other values, dan pada new values masukkan value adalah 0. Prosedur ini akan mengubah nilai yang bukan merupakan 1 (laki-laki) menjadi nilai 0.
6.    Klik continue, lalu ok
Jika kita kembali ke data kita, maka sudah muncul variabel baru, yakni laki. Variabel laki memiliki nilai 1 dan 0, dimana 1 menunjukkan laki-laki, dan nol menunjukkan perempuan.
Untuk membuat variabel dummy Jawa dan Sunda, lakukan kembali prosedur di atas. Data SPSS yang sudah dibuat variabel dummy untuk latihan ini dapat di download di sini.

Mulai analisis regresi dengan variabel dummy
Untuk analisis regresi di SPSS, kita bisa menggunakan regresi berganda (multiple regression) atau regresi berjenjang (hierarchical regression). Jika kita hendak melihat peran semua variabel independen kita gunakan regresi berganda. Namun jika kita ingin melihat peran tiap variabel independen secara berurutan kita gunakan regresi berjenjang. Pada contoh kali ini kita akan menggunakan regresi berganda.
Analisis regresi berganda kali ini dilakukan untuk melihat peran umur, jenis kelamin, dan suku secara bersama-sama terhadap agresivitas. Untuk mulai analisis regresi berganda, ikuti langkah berikut.
1.    Klik analyze – regression – linear
2.    Masukan variabel agresivitas pada kotak dependent
3.    Masukkan variabel umur, laki, jawa, dan sunda pada kotak independent
4.    Klik ok
Output hasil analisis dapat dilihat pada gambar di bawah

Terlihat pada tabel ANOVA bahwa secara bersama-sama semua variabel independen berperan terhadap agresivitas secara signifikan (F=8,850 dan p<0,05). Pada tabel Model Summary, diketahui bahwa sumbangan efektif variabel umur, jenis kelamin, dan suku terhadap agresivitas adalah 26,1% (R square = 0,261). Sisanya dijelaskan oleh hal lain diluar ketiga variabel tersebut.

Pada tabel coefficients, kita dapat melihat bahwa secara sendiri-sendiri, hanya umur dan laki saja yang signifikan. Artinya hanya kedua variabel ini saja yang berperan terhadap agresivitas.

Umur berperan terhadap agresivitas (B=-0,194, dan P<0,05). Karena B nilainya negatif, artinya arah hubungan antara umur dan agresivitas adalah berbanding terbalik. Jika umur naik satu poin, maka agrasifitas diprediksikan akan turun 0,194 poin.
Laki juga berperan terhadap agresivitas (B=8,275 dan p<0,05), atau secara sederhana kita dapat mengatakan bahwa ada perbedaan yang signifikan agresivitas antara laki-laki dan perempuan. Laki-laki memiliki agresivitas yang lebih tinggi. Secara matematis, jika jenis kelamin berubah dari perempuan menjadi laki-laki (dari 0 menjadi 1), maka skor agresivitas diprediksikan akan naik 8,275 poin. Interpretasi matematis ini tentu harus disertai pertimbangan logis.

Pada variabel dummy suku, Jawa memiliki agresivitas yang lebih rendah dibanding Madura (exclude group). Hal ini ditunjukkan oleh nilai B yang negatif. Begitu pula Sunda juga memiliki agresivitas yang lebih rendah dibandingkan Madura. Namun, perlu diperhatikan bahwa semua variabel dummy pada suku tersebut tidak signifikan. Hal ini berarti sebenarnya tidak ada perbedaan agresivitas pada tiga suku Jawa, Sunda, Madura. Jadi interpretasi di atas akan berguna jika secara statistik koefisien variabel dummy signifikan.


Pensiunan guru SD yang sudah promosi menjadi dosen Psikologi di Universitas Muhammadiyah Malang

Share this

Related Posts

Previous
Next Post »

3 komentar

Write komentar
September 19, 2018 at 4:57 PM delete

pak kenapa datanya tidak bisa di download ? harus minta akses dulu

Reply
avatar
October 6, 2018 at 8:10 PM delete

Mau tanya pak.. apa arti dari nilai koefisien variabel dummy.? Bagaimana menerangkan koefisien dummy yang negatif..
Terima kasih

Reply
avatar

Artikel Lainnya