Uji Normalitas dengan R

Hampir semua analisis statistika parametrik memiliki asumsi normalitas. Jadi sebelum dilakukan analisis statistik, seperti analisis korelasi, regresi, t-test, atau anova, terlebih dahulu harus diuji apakah data kita normal atau tidak. Uji Normalitas dilakukan untuk memastikan data yang telah dikumpulkan berdistribusi normal atau diambil dari populasi normal. Pada dasarnya distribusi normal merupakan suatu distribusi yang menunjukkan sebaran data yang seimbang yang sebagian besar data adalah mendekati nilai mean. Kalau digambarkan dengan histrogram, akan menyerupai bentuk lonceng. Ada beberapa cara untuk menguji normalitas data, baik itu dengan visual maupun dengan analisis statistik seperti shapiro-wilk dan kolmogorov-smirnov.

Untuk memanggil kembali data kita seperti pada analisis sebelumnya, ketikkan kembali script setwd("C:/Users/Hanif/Google Drive/BLOGSPOT/UNTUK DIDOWNLOAD") dan perilakucsv<-read.csv("perilaku merokok.csv",header=TRUE,sep = ";") lalu kita run. Maka akan muncul data perilakucsv. Script silakan disesuaikan dengan nama file anda dan tempat menyimpan file tersebut. Jangan lupa untuk mengubah tanda back-slash (\) menjadi tanda slash (/) untuk menunjukkan lokasi file. Data ini yang akan kita gunakan di analisis selanjutnya. Data dapat didownload di sini

Uji Normalitas dengan Visual
Ada beberapa metode visual yang bisa dipakai untuk menguji normalitas. Seperti dengan Q-Q plot, boxplot, dan histogram.

Q-Q plot
Misalkan kita ingin melihat apakah variabel sikap terdistribusi normal atau tidak, kita bisa masukan script qqnorm(perilakucsv$SIKAP), kemudian run. Untuk menampilkan garis normal, masukan script qqline(perilakucsv$SIKAP), lalu run. Maka akan muncul tampilan seperti ini di bagian kotak plot.
Gambar tersebut menampilkan penyimpangan data dari normal. Semakin sedikit titik yang menjauhi garis, berarti data semakin normal. Dilihat dari gambar tersebut, sekilas terlihat bahwa data mendekati garis normal.

Boxplot
Boxplot digunakan melihat apakah data terbagi secara simetris, median tepat di tengah, serta tidak ada outlier atau nilai ekstrim. Misalkan kita ingin melihat boxplot variabel sikap, maka masukan script boxplot(perilakucsv$SIKAP), lalu run. Kita dapat melihat output seperti ini.

Dari gambar di atas sekilas terlihat bahwa data simetris. Namun terlihat bahwa ada outlier yakni ada responden yang memiliki nilai ekstrem rendah.

Histogram
Cara paling umum dilakukan untuk melihat normalitas data adalah dengan melihat histogram. Histogram merupakan distribusi frekuensi skor. Untuk menampilkan histogran, masukan script hist(perilakucsv$SIKAP), lalu run. Maka akan diperoleh output seperti ini.
Dari gambar di atas telihat sekilas data berdistribusi normal. Data yang mendekati nilai mean berjumlah banyak dan berangsur menurun semakin menjauhi mean. Dari gambar juga terlihat ada responden yang memiliki nilai ekrem rendah. Hal ini seperti yang ditunjukan pada boxplot.

Cara-cara tadi adalah melihat normalitas data secara visual. Perlu diperhatikan bahwa cara ini hanya tepat untuk langkah awal saja, apakah data mengikuti distribusi normal atau tidak. Melihat normalitas secara visual saja rawan terjadi bias, oleh karena itu dalam penelitian biasanya dilakukan uji normalitas secara statistik dengan kolmogorov-smirnov atau dengan shapiro-wilk.

Uji Normalitas dengan Shapiro-Wilk
Cara paling umum dilakukan untuk melihat normalitas dalam skripsi mahasiswa adalah dengan kolmogorov-smirnov. Uji kolmogorov smirnov memanglah uji yang paling umum, namun uji tersebut mempunyai sedikit kelemahan, yaitu cocok pada pengujian dengan sampel besar > 200. Selain itu, uji kolmogorov smirnov juga tidak bisa dilakukan untuk menguji normalitas pada RStudio. Cara lain untuk uji normalitas adalah dengan shapiro-wilk. Untuk melihat apakah variabel sikap terdistribusi secara normal atau tidak, masukan script shapiro.test(perilakucsv$SIKAP), lalu run. Maka akan terlihat output seperti ini.



Shapiro-wilk mencocokan apakah data kita menyimpang dari data normal. Jika nilai p<0,01 maka, dapat dikatakan ada perbedaan antara data kita dengan data normal. Namun jika p>0,05 berarti tidak ada perbedaan antara data kita dengan data normal. Dari output di atas, nilai p=0,26 (p>0,05) yang menunjukkan tidak ada perbedaan antara data kita dengan data normal. Hal ini berarti data kita terdistribusi secara normal. 

Pensiunan guru SD yang sudah promosi menjadi dosen Psikologi di Universitas Muhammadiyah Malang

Share this

Related Posts

Previous
Next Post »

Artikel Lainnya