Pada
tulisan sebelumnya telah dibahas
proses bootrapping dan kelebihannya. Salah satu kelebihan bootstrapping adalah
dapat melakukan analisis pada data yang tidak terdistribusi secara normal. Tulisan
ini akan memberikan ilustrasi bagaimana analisis bootsrapping ini dapat
dilakukan pada data yang tidak normal, sehingga menghasilkan estimasi yang
lebih cermat. Sebagaimana kita ketahui, statistik inferensial parametrik pada
umumnya menghendaki asumsi normalitas terpenuhi. Pelanggaran asumsi normalitas
yang cukup parah, apalagi jika jumlah sampel tidak cukup besar dapat
mengakibatkan nilai p yang diperoleh tidak akurat.
Di
bawah ini saya sajikan data fiktif mengenai tiga variabel, yaitu prestasi,
motivasi, dan IQ. Data dapat didownload di sini. Pada analisis kali ini, saya ingin mengetahui korelasi antar
ketiga variabel tersebut. Artinya saya akan menguji korelasi antara prestasi
dan motivasi, prestasi dan IQ, serta motivasi dan IQ. Analisis dilakukan dengan
korelasi Pearson. Meskipun di contoh ini saya hanya menyajikan analisis
korelasi saja, metode bootstrap dapat dilakukan untuk berbagai uji statistik
seperti korelasi, regresi, t-test, dan Anova.
Sebelum
saya lakukan analisis, saya lihat terlebih dahulu histogramnya untuk melihat
apakah data saya terdistribusi normal atau tidak. Analisis akan dilakukan
dengan SPSS. Untuk cara uji normalitas silakan lihat artikel ini. Histogram ketiga variabel ditunjukkan pada gambar di
bawah. Dari gambar di bawah terlihat bahwa variabel prestasi terdistribusi
secara tidak normal, sedangkan variabel motivasi dan IQ sudah normal.
Analisis korelasi Pearson
Meskipun
asumsi normalitas variabel prestasi tidak terpenuhi, namun saya akan mencoba
tetap melakukan analisis korelasi Pearson. Untuk cara analisis silakan lihat di
artikel ini. Setelah analisis
dilakukan, berikut adalah hasilnya.
Dari
output terlihat bahwa ketiga variabel saling berkorelasi secara signifikan (p
< 0,05), baik prestasi dengan motivasi (r = 0,304), prestasi dengan IQ (r =
287), dan motivasi dengan IQ (R= 384). Namun sebagaimana kita tahu dari uji
normalitas tadi, variabel prestasi mengalami penyimpangan asumsi normalitas
yang cukup parah. Sehingga nilai p yang dihasilkan masih perlu dipertanyatan. Sekarang
mari kita coba uji korelasi tersebut dengan metode bootstrapping.
Analisis korelasi Pearson
dengan boostrapping
Untuk
melakukan analisis korelasi dengan boostrapping, langkahnya kurang lebih sama,
klik analyze – correlate – bivariate,
dan masukkan ketiga variabel. Lalu klik boostrap..
maka akan muncul seperti ini.
Lalu
centang perform bootstrapping, dan
tentukan jumlah sampel kita. By default SPSS akan mengeluarkan 1.000, artinya
kita akan melakukan resample sejumlah 1.000 kali. Kita bisa meningkatkan angka
ini sehingga hasilnya bisa lebih akurat, namun sebagian besar ahli berpendapat
bahwa menaikkan sampel lebih sari 1.000 tidak akan berdampak besar. Semakin besar
sampel, semakin lama pula komputer akan melakukan komputasi. Untuk contoh kali
ini kita gunakan 1.000 sampel saja. Jika sudah klik continue dan OK. Output
dapat dilihat di bawah
Untuk
membaca hasil analisis dengan bootstrapping, kita cukup melihat pada baris yang
bertuliskan bootstrap. Hasil tersebut adalah hasil analisis boostrap dengan
1.000 sampel pada taraf kepercayaan 95%. Untuk melihat apakah korelasinya
signifikan atau tidak, kita lihat pada batas bawah (lower) dan batas atas
(upper). Lower dan upper merupakan rentang nilai r yang sesungguhnya dengan
taraf kepercayaan 95%. Misalkan, korelasi prestasi dan motivasi adalah r =
0,304; dan nilai sesungguhnya berada pada rentang antara -0,018 (lower) sampai
dengan 0,538 (upper). Dikarenakan dalam rentang tersebut mengandung nilai nol
yang berarti tidak ada hubungan, jadi dapat disimpulkan bahwa tidak ada
hubungan antara prestasi dan motivasi. Atau cara mudahnya, jika upper dan lower
berada pada satu kutub yang sama, misal sama-sama memiliki nilai positif atau sama-sama
memiliki nilai negatif maka korelasinya signifikan; namun sebaliknya jika upper
dan lower kutubnya berbeda, maka tidak signifikan.
Dari
output tersebut kita tahu bahwa sesungguhnya antara prestasi dan motivasi tidak
berhubungan, begitu juga dengan prestasi dan IQ. Hasil ini berbeda dengan
analisis sebelumnya yang tanpa menggunakan boostrapping. Jika disuruh memilih,
kita akan menggunakan hasil yang mana? Tentu saja saya lebih percaya pada hasil
analisis dengan bootstrapping karena asumsi normalitas variabel prestasi tadi
tidak terpenuhi. Sementara jika kita menggunakan bootstrap, kita tidak
memerlukan asumsi normalitas. Jika kita lihat lebih lanjut pada korelasi antara
motivasi dengan IQ yang keduanya berdistribusi normal, baik menggunakan
analisis biasa ataupun dengan boostrapping menghasilkan hasil yang sama, yakni sama-sama
ada korelasi yang signifikan.
Saya melakukan analisis
boostrapping beberapa kali kok hasilnya berbeda?
Ya,
seringkali ketika kita melakukan bootstrapping, hasil nilai lower dan upper antar
satu analisis dengan analisis yang lain hasilnya berbeda. Mengapa demikian? Karena
komputer melakukan resample secara acak, jadi ada kemungkinan yang akan data
yang terambil juga berbeda. Sayangnya jika kita analisis dengan SPSS, kita
tidak bisa mengetahui hasil resample data kita. Namun perbedaan hasil itu
semakin kecil kemungkinannya jika kita menggunakan sampel bootstrapping yang
sangat besar, misal di atas 10.000. Namun kembali lagi, konsekuensi menggunakan
sampel yang besar adalah analisis yang memakan waktu cukup lama.
33 komentar
Write komentarsaya coba praktekkan dengan data fiktif yang disajikan pada tulisan ini via spss 25... tapi hasil boostrap nya tidak keluar pada hasil output spss... why? mohon pencerahannya...
ReplyApakah perform bootstrapnya sudah dicentang? Jika sudah dan tidak keluar, moaaf saya juga kurang tahu kenapa
ReplyI am impressed by the information that you have on this blog. It shows how well you understand this subject.
Replydata analytics course
data science course
big data course in malaysia
360DigiTMG
big data analytics training in malaysia
I’m excited to uncover this page. I need to to thank you for ones time for this particularly fantastic read!! I definitely really liked every part of it and i also have you saved to fav to look at new information in your site.
Replydata science course
360DigiTMG
halo. ingin request materi tentang
Reply- penafsir parameter
- ketidakbiasan
- macam2 distribusi peluang
terimakasii☺️
ReplyMohon maaf mas Hanif, ditempat saya juga tidak keluar hasil analisi boostrapnya. Ataukah mungkin versi SPSSnya yang kurang mendukung
ReplyGreat post i must say and thanks for the information. Education is definitely a sticky subject. However, is still among the leading topics of our time. I appreciate your post and look forward to more.
ReplyPMP Certification in Malaysia
PMP Certification
360DigiTMG
I am impressed by the information that you have on this blog. It shows how well you understand this subject.
Replydata analytics course
data science course
big data course
big data course
360DigiTMG
We are really grateful for your blog post. You will find a lot of approaches after visiting your post. Great work
Replydata science course in malaysia
data science certification
data science course malaysia
data science malaysia
data scientist course malaysia
I am impressed by the information that you have on this blog. It shows how well you understand this subject.
Replydata analytics course
data science course
big data course
big data course
Kalau regresi linier cara baca hasil boostsrap nya gimana mas, dilihat dari nilai lower-upper nya juga kah
ReplyIya betul, sama yang dilihat
ReplyYou actually make it look so easy with your performance but I find this matter to be actually something which I think I would never comprehend. It seems too complicated and extremely broad for me. I'm looking forward for your next post, I’ll try to get the hang of it!
Reply360DigiTMG PMP Certification
360DigiTMG PMP Course
360DigiTMG PMP Course in Malaysia
360DigiTMG PMP Training in Malaysia
360DigiTMG PMP Training
I don t have the time at the moment to fully read your site but I have bookmarked it and also add your RSS feeds. I will be back in a day or two. thanks for a great site.data science course
ReplyAwesome blog. I enjoyed reading your articles. This is truly a great read for me. I have bookmarked it and I am looking forward to reading new articles. Keep up the good work!
Replydata analytics course
big data analytics malaysia
big data course
Great post i must say and thanks for the information. Education is definitely a sticky subject. However, is still among the leading topics of our time. I appreciate your post and look forward to more. PMP Certification 360DigiTMG
ReplyPMP Course 360DigiTMG
PMP Course in Malaysia 360DigiTMG
PMP Training in Malaysia 360DigiTMG
PMP Training 360DigiTMG
This is really very nice post you shared, i like the post, thanks for sharing..data science course
ReplyAwesome blog. I enjoyed reading your articles. This is truly a great read for me. I have bookmarked it and I am looking forward to reading new articles. Keep up the good work!
Replydata analytics course
big data analytics malaysia
big data course
Thank you for sharing wonderful contentpmp certification in malaysia
ReplyIf you don't mind, then continue this excellent work and expect more from your great blog posts
Replydata science course in noida
Simply the manner in which I have anticipated. Your site truly is intriguing.
Replytraining provider in malaysia
I have a strategic I'm seconds ago chipping away at, and I have been at the post for such data
Reply360DigiTMG data analytics course
ReplyThis site is astounding data and realities it's truly fantastic
"
hrdf claimable courses"
I would recommend my profile is important to me, I invite you to discuss this topic...
Replybest institutes for digital marketing in hyderabad
Assalamualaikum. Ditulis:
Reply1) "Misalkan, korelasi prestasi dan motivasi adalah r = 0,304; dan nilai sesungguhnya
berada pada rentang antara -0,018 (lower) sampai dengan 0,538 (upper)".
Pada jadual, korelasi prestasi dan motivasi: nilai r adalah jelas iaitu 0.304. Bagaimnana tuan beroleh nilai -0.018 (lower) sampai 0.538 (upper)? Bukankah nilainya adalah 0.005 (lower) dan 0.573 (upper)?
2) "Dari output tersebut kita tahu bahwa sesungguhnya antara prestasi dan motivasi tidak
berhubungan, begitu juga dengan prestasi dan IQ."
"Atau cara mudahnya, jika upper dan lower berada pada satu kutub yang sama, misal sama-
sama memiliki nilai positif atau sama-sama memiliki nilai negatif maka korelasinya
signifikan; namun sebaliknya jika upper dan lower kutubnya berbeda, maka tidak
signifikan."
Persoalannya bagaimana dikatakan antara prestasi dan motivasi tidak berhubungan,
begitu juga dengan prestasi dan IQ? Jika dilihat dalam jadual, nilai upper dan lower bagi kedua-dua perkara (prestasi dan motivasi serta prestasi dan IQ) masing-masing adalah kedua-duanya bernilai positif (mempunyai kutub yang sama).Tidakkah kedua-dua perkara mempunyai korelasi yang signifikan?
Mohon pencerahan daripada tuan. Saya agak keliru bila membaca penyataan yang telah
diberikan. Terima kasih dan Jazakallah.
Apakah ada penelitian/jurnal yg dapat menjadi patokan berapa banyak resampling dalam pengujian?
ReplyGreat Article Artificial Intelligence Projects
ReplyProject Center in Chennai
JavaScript Training in Chennai
JavaScript Training in Chennai
Apakah metode bootstrap ini dapat digunakan untuk analisis faktor yang memepengaruhi suatu hal? Misalnya penggunaan metode bootstrap untuk mengetahui faktor faktor kemiskinan
ReplyThank you for excellent article.You made an article that is interesting.
Replydata science course gurgaon
nice blog!! i hope you will share a blog on Data Science.
Replydata analytics course in yelahanka
EmoticonEmoticon