Analisis Data yang Tidak Berdistribusi Normal dengan Bootstrapping di SPSS


Pada tulisan sebelumnya telah dibahas proses bootrapping dan kelebihannya. Salah satu kelebihan bootstrapping adalah dapat melakukan analisis pada data yang tidak terdistribusi secara normal. Tulisan ini akan memberikan ilustrasi bagaimana analisis bootsrapping ini dapat dilakukan pada data yang tidak normal, sehingga menghasilkan estimasi yang lebih cermat. Sebagaimana kita ketahui, statistik inferensial parametrik pada umumnya menghendaki asumsi normalitas terpenuhi. Pelanggaran asumsi normalitas yang cukup parah, apalagi jika jumlah sampel tidak cukup besar dapat mengakibatkan nilai p yang diperoleh tidak akurat.

Di bawah ini saya sajikan data fiktif mengenai tiga variabel, yaitu prestasi, motivasi, dan IQ. Data dapat didownload di sini. Pada analisis kali ini, saya ingin mengetahui korelasi antar ketiga variabel tersebut. Artinya saya akan menguji korelasi antara prestasi dan motivasi, prestasi dan IQ, serta motivasi dan IQ. Analisis dilakukan dengan korelasi Pearson. Meskipun di contoh ini saya hanya menyajikan analisis korelasi saja, metode bootstrap dapat dilakukan untuk berbagai uji statistik seperti korelasi, regresi, t-test, dan Anova.

Sebelum saya lakukan analisis, saya lihat terlebih dahulu histogramnya untuk melihat apakah data saya terdistribusi normal atau tidak. Analisis akan dilakukan dengan SPSS. Untuk cara uji normalitas silakan lihat artikel ini. Histogram ketiga variabel ditunjukkan pada gambar di bawah. Dari gambar di bawah terlihat bahwa variabel prestasi terdistribusi secara tidak normal, sedangkan variabel motivasi dan IQ sudah normal.

Analisis korelasi Pearson
Meskipun asumsi normalitas variabel prestasi tidak terpenuhi, namun saya akan mencoba tetap melakukan analisis korelasi Pearson. Untuk cara analisis silakan lihat di artikel ini. Setelah analisis dilakukan, berikut adalah hasilnya.
Dari output terlihat bahwa ketiga variabel saling berkorelasi secara signifikan (p < 0,05), baik prestasi dengan motivasi (r = 0,304), prestasi dengan IQ (r = 287), dan motivasi dengan IQ (R= 384). Namun sebagaimana kita tahu dari uji normalitas tadi, variabel prestasi mengalami penyimpangan asumsi normalitas yang cukup parah. Sehingga nilai p yang dihasilkan masih perlu dipertanyatan. Sekarang mari kita coba uji korelasi tersebut dengan metode bootstrapping.

Analisis korelasi Pearson dengan boostrapping
Untuk melakukan analisis korelasi dengan boostrapping, langkahnya kurang lebih sama, klik analyze – correlate – bivariate, dan masukkan ketiga variabel. Lalu klik boostrap.. maka akan muncul seperti ini.
Lalu centang perform bootstrapping, dan tentukan jumlah sampel kita. By default SPSS akan mengeluarkan 1.000, artinya kita akan melakukan resample sejumlah 1.000 kali. Kita bisa meningkatkan angka ini sehingga hasilnya bisa lebih akurat, namun sebagian besar ahli berpendapat bahwa menaikkan sampel lebih sari 1.000 tidak akan berdampak besar. Semakin besar sampel, semakin lama pula komputer akan melakukan komputasi. Untuk contoh kali ini kita gunakan 1.000 sampel saja. Jika sudah klik continue dan OK. Output dapat dilihat di bawah
Untuk membaca hasil analisis dengan bootstrapping, kita cukup melihat pada baris yang bertuliskan bootstrap. Hasil tersebut adalah hasil analisis boostrap dengan 1.000 sampel pada taraf kepercayaan 95%. Untuk melihat apakah korelasinya signifikan atau tidak, kita lihat pada batas bawah (lower) dan batas atas (upper). Lower dan upper merupakan rentang nilai r yang sesungguhnya dengan taraf kepercayaan 95%. Misalkan, korelasi prestasi dan motivasi adalah r = 0,304; dan nilai sesungguhnya berada pada rentang antara -0,018 (lower) sampai dengan 0,538 (upper). Dikarenakan dalam rentang tersebut mengandung nilai nol yang berarti tidak ada hubungan, jadi dapat disimpulkan bahwa tidak ada hubungan antara prestasi dan motivasi. Atau cara mudahnya, jika upper dan lower berada pada satu kutub yang sama, misal sama-sama memiliki nilai positif atau sama-sama memiliki nilai negatif maka korelasinya signifikan; namun sebaliknya jika upper dan lower kutubnya berbeda, maka tidak signifikan.

Dari output tersebut kita tahu bahwa sesungguhnya antara prestasi dan motivasi tidak berhubungan, begitu juga dengan prestasi dan IQ. Hasil ini berbeda dengan analisis sebelumnya yang tanpa menggunakan boostrapping. Jika disuruh memilih, kita akan menggunakan hasil yang mana? Tentu saja saya lebih percaya pada hasil analisis dengan bootstrapping karena asumsi normalitas variabel prestasi tadi tidak terpenuhi. Sementara jika kita menggunakan bootstrap, kita tidak memerlukan asumsi normalitas. Jika kita lihat lebih lanjut pada korelasi antara motivasi dengan IQ yang keduanya berdistribusi normal, baik menggunakan analisis biasa ataupun dengan boostrapping menghasilkan hasil yang sama, yakni sama-sama ada korelasi yang signifikan.

Saya melakukan analisis boostrapping beberapa kali kok hasilnya berbeda?  
Ya, seringkali ketika kita melakukan bootstrapping, hasil nilai lower dan upper antar satu analisis dengan analisis yang lain hasilnya berbeda. Mengapa demikian? Karena komputer melakukan resample secara acak, jadi ada kemungkinan yang akan data yang terambil juga berbeda. Sayangnya jika kita analisis dengan SPSS, kita tidak bisa mengetahui hasil resample data kita. Namun perbedaan hasil itu semakin kecil kemungkinannya jika kita menggunakan sampel bootstrapping yang sangat besar, misal di atas 10.000. Namun kembali lagi, konsekuensi menggunakan sampel yang besar adalah analisis yang memakan waktu cukup lama.

Berkenalan dengan Bootstrapping dalam Statistik


Bootstrapping adalah prosedur statistik dengan cara mengubah data dari sampel yang kita peroleh dan melakukan replikasi dari data sampel tersebut (resampling) secara acak untuk diperoleh data simulasi baru. Prosedur ini dapat digunakan untuk menghitung standar error, interval kepercayaan, dan melakukan pengujian hipotesis untuk berbagai jenis analisis statistik. Metode bootstrap adalah pendekatan alternatif untuk pengujian hipotesis tradisional dan cukup populer saat ini karena memiliki banyak manfaat. Tulisan ini akan memperkenalkan cara kerja teknik bootstrap dan perbedaannya dengan teknik statistik konvensional.

Baik metode bootstrap maupun metode tradisional menggunakan suatu sampel untuk menarik kesimpulan tentang populasi. Perbedaan utama antara bootstrap dan statistik tradisional adalah bagaimana mereka memperkirakan distribusi sampel. Pada uji hipotesis statistik tradisional, untuk memperoleh hasil yang valid, peneliti menggunakan uji statistik yang ketat dan harus memenuhi asumsi tertentu (misalnya normalitas). Metode bootstrap menggunakan pendekatan yang sangat berbeda untuk memperkirakan distribusi sampling. Metode ini mengambil data sampel yang diperoleh, dan kemudian melakukan resample data tersebut berulang-ulang untuk membuat banyak simulasi sampel. Prosedur bootstrap menggunakan distribusi sampel ini sebagai dasar untuk menentukan interval kepercayaan dan pengujian hipotesis. Mari saya contohkan bagaimana proses bootsrapping ini bekerja.

Gambar di atas adalah dataset yang saya miliki dengan jumlah subjek 5 orang. Dari data tersebut kemudian dilakukan bootstrap sebanyak 5 sampel. Dataset yang di-resample memiliki ukuran yang sama dengan dataset asli dan hanya berisi skor-skor yang ada di dataset asli. Selain itu, skor ini dapat muncul lebih banyak atau lebih sedikit di dataset yang di-resample dibandingkan di dataset asli. Proses resampling dilakukan acak dan bisa menciptakan dataset simulasi yang berbeda. Setiap proses bootstrap menghasilkan parameter sampel baru, misalkan di gambar itu saya tuliskan nilai mean. Mean ini kemudian dirata-rata lagi sampai seluruh proses bootstrap selesai, sehingga kita bisa memperoleh  estimasi rerata dari populasi. Dari contoh di atas misalkan, didapatkan estimasi rerata dari populasi adalah 2,92; sementara rerata dari data aslinya adalah 3. Dari nilai tersebut kita mendapatkan nilai bias sebesar 2,92 - 3 = 0,8. 

Tentu saja, contoh ini adalah contoh paling sedernaha. Dalam penelitian yang sesungguhnya peneliti harus menggunakan subjek yang lebih banyak dan melakukan resampling yang lebih banyak pula, pada umumnya hingga ribuan kali. Dikarenakan resample ini dilakukan ribuan kali, sudah pasti kita butuh bantuan komputer untuk melakukannya. Perlu diingat bahwa bootstrap tidak membuat data baru, namun dia memperlakukan sampel asli sebagai proxy untuk populasi dan kemudian mengambil sampel acak dari data itu. Oleh karena itu, asumsi utama untuk bootstrap adalah bahwa sampel asli secara akurat mewakili populasi aktual.

Kelebihan metode bootstrap dibanding metode tradisional
Metode tradisional pada umumnya mengasumsikan bahwa data harus mengikuti distribusi normal atau distribusi lainnya. Namun bagaimana jika ternyata distribusi data kita tidak normal. Jika anda membaca tentang central limit theorem atau robust-nya berbagai teknik analisis statistik paramterik, mungkin Anda akan tetap hajar saja melakukan analisis dengan statistik parametrik, asalkan jumlah sampel Anda cukup besar. Namun jika sampel kita juga tidak cukup banyak dan bahkan penyimpangan terhadap asumsi normalitasnya cukup parah, apa yang harus dilakukan? Sebagai alternatifnya, teknik bootstrap ini dapat digunakan. Misalkan, peneliti memiliki data yang tidak berdistribusi normal dengan jumlah sampel terbatas. Dikarenakan dia tidak memenuhi asumsi normalitas, maka alternatif solusi yang dapat digunakan adalah menggunakan boostrapping.

Bootstrap tidak memerlukan asumsi apapun tentang distribusi data Anda. Boostrap sudah melakukan resample dari data sampel anda hingga ribuan kali, dan menghitung paramater statistik dari hasil resample tersebut. Dikarenakan resample dilakukan ribuan kali, central limit theorem berbicara di sini, dimana teorema ini mengatakan bahwa ketika ukuran sampel cukup besar, distribusi sampel dari mean untuk suatu variabel akan mendekati distribusi normal terlepas dari bagaimana distribusi variabel itu dalam populasi. Dengan demikian, asumsi normalitas tidak diperlukan lagi di sini.

Gambar di bawah ini merupakan ilustrasi perbandingan data asli, data dengan boostrapping 10 sampel, dan data dengan boostrapping 1.000 sampel. Pada data original, distribusi data terlihat menceng ke kanan. Seperti yang terlihat pada gambar, semakin besar resample yang dilakukan, distribusi sampel akan semakin mendekati bentuk distribusi normal.
Untuk menguji hipotesis dengan metode bootstrapping, peneliti perlu melihat pada nilai taraf kepercayaan (confidence interval). Bootstrap akan memberikan batas bawah (lower) dan batas atas (upper) dari taraf kepercayaan yang ada. Suatu analisis dikatakan signifikan jika batas atas dan batas bawah berada pada satu kutub yang sama, misal sama-sama memiliki nilai positif atau sama-sama memiliki nilai negatif. Bootstrap ini dapat dilakukan untuk berbagai uji statistik seperti korelasi, regresi, t-test, Anova, bahkan SEM. Beberapa software analisis statistik juga sudah memfasilitasi metode bootstrap ini, seperti dengan SPSS. Demonstrasi analisis statistik pada data yang tidak memenuhi asumsi normalitas dengan metode boostrap dapat dilihat pada artikel selanjutnya.    













Analisis Data yang Tidak Berdistribusi Normal dengan Bootstrapping di SPSS

Pada tulisan sebelumnya telah dibahas proses bootrapping dan kelebihannya. Salah satu kelebihan bootstrapping adalah dapat melakukan analisis pada data yang tidak terdistribusi secara normal. Tulisan ini akan memberikan ilustrasi bagaimana analisis bootsrapping ini dapat dilakukan pada data yang tidak normal, sehingga menghasilkan estimasi yang lebih cermat. Sebagaimana kita ketahui, statistik inferensial parametrik pada umumnya menghendaki asumsi normalitas terpenuhi. Pelanggaran asumsi normalitas yang cukup parah, apalagi jika jumlah sampel tidak cukup besar dapat mengakibatkan nilai p yang diperoleh tidak akurat.

Di bawah ini saya sajikan data fiktif mengenai tiga variabel, yaitu prestasi, motivasi, dan IQ. Data dapat didownload di sini. Pada analisis kali ini, saya ingin mengetahui korelasi antar ketiga variabel tersebut. Artinya saya akan menguji korelasi antara prestasi dan motivasi, prestasi dan IQ, serta motivasi dan IQ. Analisis dilakukan dengan korelasi Pearson. Meskipun di contoh ini saya hanya menyajikan analisis korelasi saja, metode bootstrap dapat dilakukan untuk berbagai uji statistik seperti korelasi, regresi, t-test, dan Anova.

Sebelum saya lakukan analisis, saya lihat terlebih dahulu histogramnya untuk melihat apakah data saya terdistribusi normal atau tidak. Analisis akan dilakukan dengan SPSS. Untuk cara uji normalitas silakan lihat artikel ini. Histogram ketiga variabel ditunjukkan pada gambar di bawah. Dari gambar di bawah terlihat bahwa variabel prestasi terdistribusi secara tidak normal, sedangkan variabel motivasi dan IQ sudah normal.

Analisis korelasi Pearson
Meskipun asumsi normalitas variabel prestasi tidak terpenuhi, namun saya akan mencoba tetap melakukan analisis korelasi Pearson. Untuk cara analisis silakan lihat di artikel ini. Setelah analisis dilakukan, berikut adalah hasilnya.
Dari output terlihat bahwa ketiga variabel saling berkorelasi secara signifikan (p < 0,05), baik prestasi dengan motivasi (r = 0,304), prestasi dengan IQ (r = 287), dan motivasi dengan IQ (R= 384). Namun sebagaimana kita tahu dari uji normalitas tadi, variabel prestasi mengalami penyimpangan asumsi normalitas yang cukup parah. Sehingga nilai p yang dihasilkan masih perlu dipertanyatan. Sekarang mari kita coba uji korelasi tersebut dengan metode bootstrapping.

Analisis korelasi Pearson dengan boostrapping
Untuk melakukan analisis korelasi dengan boostrapping, langkahnya kurang lebih sama, klik analyze – correlate – bivariate, dan masukkan ketiga variabel. Lalu klik boostrap.. maka akan muncul seperti ini.
Lalu centang perform bootstrapping, dan tentukan jumlah sampel kita. By default SPSS akan mengeluarkan 1.000, artinya kita akan melakukan resample sejumlah 1.000 kali. Kita bisa meningkatkan angka ini sehingga hasilnya bisa lebih akurat, namun sebagian besar ahli berpendapat bahwa menaikkan sampel lebih sari 1.000 tidak akan berdampak besar. Semakin besar sampel, semakin lama pula komputer akan melakukan komputasi. Untuk contoh kali ini kita gunakan 1.000 sampel saja. Jika sudah klik continue dan OK. Output dapat dilihat di bawah
Untuk membaca hasil analisis dengan bootstrapping, kita cukup melihat pada baris yang bertuliskan bootstrap. Hasil tersebut adalah hasil analisis boostrap dengan 1.000 sampel pada taraf kepercayaan 95%. Untuk melihat apakah korelasinya signifikan atau tidak, kita lihat pada batas bawah (lower) dan batas atas (upper). Lower dan upper merupakan rentang nilai r yang sesungguhnya dengan taraf kepercayaan 95%. Misalkan, korelasi prestasi dan motivasi adalah r = 0,304; dan nilai sesungguhnya berada pada rentang antara -0,018 (lower) sampai dengan 0,538 (upper). Dikarenakan dalam rentang tersebut mengandung nilai nol yang berarti tidak ada hubungan, jadi dapat disimpulkan bahwa tidak ada hubungan antara prestasi dan motivasi. Atau cara mudahnya, jika upper dan lower berada pada satu kutub yang sama, misal sama-sama memiliki nilai positif atau sama-sama memiliki nilai negatif maka korelasinya signifikan; namun sebaliknya jika upper dan lower kutubnya berbeda, maka tidak signifikan.

Dari output tersebut kita tahu bahwa sesungguhnya antara prestasi dan motivasi tidak berhubungan, begitu juga dengan prestasi dan IQ. Hasil ini berbeda dengan analisis sebelumnya yang tanpa menggunakan boostrapping. Jika disuruh memilih, kita akan menggunakan hasil yang mana? Tentu saja saya lebih percaya pada hasil analisis dengan bootstrapping karena asumsi normalitas variabel prestasi tadi tidak terpenuhi. Sementara jika kita menggunakan bootstrap, kita tidak memerlukan asumsi normalitas. Jika kita lihat lebih lanjut pada korelasi antara motivasi dengan IQ yang keduanya berdistribusi normal, baik menggunakan analisis biasa ataupun dengan boostrapping menghasilkan hasil yang sama, yakni sama-sama ada korelasi yang signifikan.

Saya melakukan analisis boostrapping beberapa kali kok hasilnya berbeda?  
Ya, seringkali ketika kita melakukan bootstrapping, hasil nilai lower dan upper antar satu analisis dengan analisis yang lain hasilnya berbeda. Mengapa demikian? Karena komputer melakukan resample secara acak, jadi ada kemungkinan yang akan data yang terambil juga berbeda. Sayangnya jika kita analisis dengan SPSS, kita tidak bisa mengetahui hasil resample data kita. Namun perbedaan hasil itu semakin kecil kemungkinannya jika kita menggunakan sampel bootstrapping yang sangat besar, misal di atas 10.000. Namun kembali lagi, konsekuensi menggunakan sampel yang besar adalah analisis yang memakan waktu cukup lama.

Berkenalan dengan Bootstrapping dalam Statistik

Bootstrapping adalah prosedur statistik dengan cara mengubah data dari sampel yang kita peroleh dan melakukan replikasi dari data sampel tersebut (resampling) secara acak untuk diperoleh data simulasi baru. Prosedur ini dapat digunakan untuk menghitung standar error, interval kepercayaan, dan melakukan pengujian hipotesis untuk berbagai jenis analisis statistik. Metode bootstrap adalah pendekatan alternatif untuk pengujian hipotesis tradisional dan cukup populer saat ini karena memiliki banyak manfaat. Tulisan ini akan memperkenalkan cara kerja teknik bootstrap dan perbedaannya dengan teknik statistik konvensional.

Baik metode bootstrap maupun metode tradisional menggunakan suatu sampel untuk menarik kesimpulan tentang populasi. Perbedaan utama antara bootstrap dan statistik tradisional adalah bagaimana mereka memperkirakan distribusi sampel. Pada uji hipotesis statistik tradisional, untuk memperoleh hasil yang valid, peneliti menggunakan uji statistik yang ketat dan harus memenuhi asumsi tertentu (misalnya normalitas). Metode bootstrap menggunakan pendekatan yang sangat berbeda untuk memperkirakan distribusi sampling. Metode ini mengambil data sampel yang diperoleh, dan kemudian melakukan resample data tersebut berulang-ulang untuk membuat banyak simulasi sampel. Prosedur bootstrap menggunakan distribusi sampel ini sebagai dasar untuk menentukan interval kepercayaan dan pengujian hipotesis. Mari saya contohkan bagaimana proses bootsrapping ini bekerja.

Gambar di atas adalah dataset yang saya miliki dengan jumlah subjek 5 orang. Dari data tersebut kemudian dilakukan bootstrap sebanyak 5 sampel. Dataset yang di-resample memiliki ukuran yang sama dengan dataset asli dan hanya berisi skor-skor yang ada di dataset asli. Selain itu, skor ini dapat muncul lebih banyak atau lebih sedikit di dataset yang di-resample dibandingkan di dataset asli. Proses resampling dilakukan acak dan bisa menciptakan dataset simulasi yang berbeda. Setiap proses bootstrap menghasilkan parameter sampel baru, misalkan di gambar itu saya tuliskan nilai mean. Mean ini kemudian dirata-rata lagi sampai seluruh proses bootstrap selesai, sehingga kita bisa memperoleh  estimasi rerata dari populasi. Dari contoh di atas misalkan, didapatkan estimasi rerata dari populasi adalah 2,92; sementara rerata dari data aslinya adalah 3. Dari nilai tersebut kita mendapatkan nilai bias sebesar 2,92 - 3 = 0,8. 

Tentu saja, contoh ini adalah contoh paling sedernaha. Dalam penelitian yang sesungguhnya peneliti harus menggunakan subjek yang lebih banyak dan melakukan resampling yang lebih banyak pula, pada umumnya hingga ribuan kali. Dikarenakan resample ini dilakukan ribuan kali, sudah pasti kita butuh bantuan komputer untuk melakukannya. Perlu diingat bahwa bootstrap tidak membuat data baru, namun dia memperlakukan sampel asli sebagai proxy untuk populasi dan kemudian mengambil sampel acak dari data itu. Oleh karena itu, asumsi utama untuk bootstrap adalah bahwa sampel asli secara akurat mewakili populasi aktual.

Kelebihan metode bootstrap dibanding metode tradisional
Metode tradisional pada umumnya mengasumsikan bahwa data harus mengikuti distribusi normal atau distribusi lainnya. Namun bagaimana jika ternyata distribusi data kita tidak normal. Jika anda membaca tentang central limit theorem atau robust-nya berbagai teknik analisis statistik paramterik, mungkin Anda akan tetap hajar saja melakukan analisis dengan statistik parametrik, asalkan jumlah sampel Anda cukup besar. Namun jika sampel kita juga tidak cukup banyak dan bahkan penyimpangan terhadap asumsi normalitasnya cukup parah, apa yang harus dilakukan? Sebagai alternatifnya, teknik bootstrap ini dapat digunakan. Misalkan, peneliti memiliki data yang tidak berdistribusi normal dengan jumlah sampel terbatas. Dikarenakan dia tidak memenuhi asumsi normalitas, maka alternatif solusi yang dapat digunakan adalah menggunakan boostrapping.

Bootstrap tidak memerlukan asumsi apapun tentang distribusi data Anda. Boostrap sudah melakukan resample dari data sampel anda hingga ribuan kali, dan menghitung paramater statistik dari hasil resample tersebut. Dikarenakan resample dilakukan ribuan kali, central limit theorem berbicara di sini, dimana teorema ini mengatakan bahwa ketika ukuran sampel cukup besar, distribusi sampel dari mean untuk suatu variabel akan mendekati distribusi normal terlepas dari bagaimana distribusi variabel itu dalam populasi. Dengan demikian, asumsi normalitas tidak diperlukan lagi di sini.

Gambar di bawah ini merupakan ilustrasi perbandingan data asli, data dengan boostrapping 10 sampel, dan data dengan boostrapping 1.000 sampel. Pada data original, distribusi data terlihat menceng ke kanan. Seperti yang terlihat pada gambar, semakin besar resample yang dilakukan, distribusi sampel akan semakin mendekati bentuk distribusi normal.
Untuk menguji hipotesis dengan metode bootstrapping, peneliti perlu melihat pada nilai taraf kepercayaan (confidence interval). Bootstrap akan memberikan batas bawah (lower) dan batas atas (upper) dari taraf kepercayaan yang ada. Suatu analisis dikatakan signifikan jika batas atas dan batas bawah berada pada satu kutub yang sama, misal sama-sama memiliki nilai positif atau sama-sama memiliki nilai negatif. Bootstrap ini dapat dilakukan untuk berbagai uji statistik seperti korelasi, regresi, t-test, Anova, bahkan SEM. Beberapa software analisis statistik juga sudah memfasilitasi metode bootstrap ini, seperti dengan SPSS. Demonstrasi analisis statistik pada data yang tidak memenuhi asumsi normalitas dengan metode boostrap dapat dilihat pada artikel selanjutnya.    













Artikel Lainnya