Cari Blog Ini

SELAMAT DATANG SOBAT...

Salam...

Selama ini, statistika sering diidentikkan dengan bidang yang lumayan sulit. Kesulitan dalam mempelajari statistika dikarenakan bidang ini terkait langsung dengan matematika. Bidang ilmu yang ketika mendengar namanya saja kebanyakan kita sudah kebakaran jenggot.. hehehe..

Ditengah situasi seperti itulah blog ini hadir. blog ini berusaha untuk menjembatani orang-orang yang mencari informasi yang berhubungan dengan statistik. Untuk lebih mempermudah analisis statistik, maka blog inipun memberikan panduan bagaimana melakukan analisis dengan menggunakan software SPSS.

Untuk lebih membuat blog ini lebih bermanfaat, sumbang saran dari pembaca sekalian sangat penulis harapkan dan kita akan sama-sama belajar... Ayo semangat!! Buat Indonesia melek dengan statistika.

Wassalam
Djunaidi L, Manado


Rabu, 14 Januari 2009

Pengujian Normalitas Data dengan One Sample Kolmogorov-Test

Pada postingan terdahulu, kita sudah pernah membahas mengenai pengujian normalitas dengan menggunakan histogram. Nah, pada postingan ini saya akan mendemonstrasikan bagaimana melakukan pengujian normalitas menggunakan teknik pengujian nonparametric one-sample kolmogorov smirnov test. 

Kita akan menggunakan data nilai siswa yang diperoleh dari empat metode mengajar. Data tersebut, telah kita pergunakan pada pengujian analisis varian. Pada postingan ini data nilai tersebut akan kita uji apakah berdistribusi normal atau tidak. Data tersebut kita masukkan ke dalam program SPSS seperti berikut ini:


Langkah-langkah melakukan uji normalitas adalah klik ANALYZE > NONPARAMETRIC TEST > 1-SAMPLE KS hingga muncul kota dialog 1-sample KS.


Masukkan variabel nilai pada kotak TEST VARIABLE LIST serta tandai NORMAL pada TEST DISTRIBUTION. Kemudian klik OK hingga muncul output SPSS untuk 1 KS-TEST.

Hasil pengujian normalitas dapat diketahui berdasarkan nilai Asymp. Sig. (2-tailed). Nilai sebesar 0,859 berarti lebih besar dari 0,05. Dengan demikian dapat dikatakan bahwa data nilai tersebut berdistribusi normal. Hal ini diperkuat dengan kata-kata dibawah table di atas : Test distribution is Normal.

Share

Senin, 12 Januari 2009

perbedaan One Way Anava dan Two Way Anava

Dalam penelitian eksperimen, sangat diperlukan analisis statistic untuk menyimpulkan hasil eksperimen. Salah satu teknik analisis yang cocok untuk ini adalah ANAVA (analisis varian) atau dalam bahasa Inggris ANOVA (Analysis of variance). Dalam statistic dikenal istilah one way ANOVA (ANAVA satu jalur) dan two way ANOVA (ANAVA dua jalur). Apa perbedaan dari kedua istilah tersebut?

ANAVA satu jalur sering pula disebut COMPLETELY RANDOMIZED DESIGN (CRD) karena berlaku jika variabel-variabel yang digunakan dalam penelitian diambil secara acak dari setiap kelompok. Dalam menganalisis perbedaan tiga variabel atau lebih, ANAVA satu jalur sangat berguna untuk dimanfaatkan. Jika variabel-variabel tiap kelompok tidak diambil secara acak melainkan ditempatkan dalam cluster-cluster tertentu sesuai dengan karakteristik yang mungkin ada dalam variabel itu, maka teknik analisisnya adalah two way ANOVA.

Sebagai contoh ANAVA satu jalur, jika kita melakukan analisis untuk membedakan 4 buah metode mengajar, maka nilai yang diperoleh setiap siswa dapat dibuat tabel seperti berikut ini:

Akan tetapi, dalam ANAVA dua jalur setiap variabel di bagi lagi ke dalam kelompok tertentu yang memiliki karakteristik khusus. Dengan demikian, akan ada kluster-kluster yang lebih kecil dari setiap variabel. Dalam contoh di atas, jika kita menggolongkan siswa kedalam dua kelompok, misalnya laki-laki dan perempuan, maka teknik ANAVA yang digunakan adalah ANAVA dua jalur. Tabel yang kita buat akan seperti ini: 


Share

Analisis Faktor Konfirmatori

Pada postingan ini, saya akan memberikan contoh bagaimana prosedur analisis factor eksploratori. Untuk melihat konsep analisis factor, silahkan anda buka di http://statistikpendidikan.wordpress.com. Contoh yang kita gunakan berasal dari tutorial SPSS. Dalam hal ini, kita akan menguji variabel apa saja yang mempengaruhi pilihan responden terhadap sebuah mobil.

Kita menggunakan variabel-variabel tipe mobil (type), harga mobil (price), ukuran mesin(engine size), horsepower, wheelbase, lebar mobil (width), panjang mobil (length), berat curb, kapasitas bahan bakar (fuel capacity) serta efisiensi bahan bakar (fuel efficiency).

Langkah pertama melakukan analisis factor adalah memasukkan variabel-variabel tersebut ke dalam kotak Variables.

Klik descriptive dan pilih initial solution pada Statistics serta KMO and Bartlett’s test of sphrecity dan Anti-image pada correlation matrix dan klik Continue

Klik extraction dan pilih Principal components pada Method, pada Analyze pilih correlation matrix, pada display pilih unrotated factor solution serta scree plot, sedangkan di extract pilih nilai 1 untuk Eigenvalues over serta 25 pada maximum iterations for convergence. Klik continue

Klik rotation hingga terbuka kotak factor analysis: rotation. Pilihlah varimax dan rotated solution. Klik continue

Setelah itu bisa langsung klik OK. Saya tidak akan menjelaskan semua output dari SPSS karena akan membutuhkan hasil yang panjang. Saya hanya menjelaskan hal-hal yang memiliki kaitan dengan hal-hal yang kita diskusikan saat ini. Hasil analisis pertama adalah KMO and Bartlett’s test.

Berdasarkan analisis nilai KMO sebesar 0,833 jauh di atas 0,5 sehingga dapat disimpulkan secara keseluruhan, instrument yang dipergunakan adalah valid. Hal ini di perkuat dengan nilai Sig. Bartlett’s Test of sphericity sebesar 0,000.

Pada anti image matrice perhatikan kolom anti-image correlation. Apabila angka anti-image correlation <>


Share

Selasa, 06 Januari 2009

Analisis Regresi: Sebuah Pengantar

Salah satu teknik analisis data yang sedang ngetrend belakangan ini adalah regresi. Regresi adalah salah satu metode peramalan yang dikenal dalam statistic. dalam dunia pendidikan, regresi sangat sering digunakan oleh mahasiswa yang sedang menyelesaikan tugas akhir.

Analisis regresi berguna untuk mengetahui pengaruh antara variable bebas (yang juga dikenal dengan prediktor) yang disimbolkan dengan X dan variable terikat (yang juga dikenal dengan kriterium) yang disimbolkan dengan Y.

Istilah variable bebas dan variable terikat berasal dari matematika. Dalam penelitian, variable bebas adalah variable yang dimanipulasikan oleh peneliti. Misalnya seorang peneliti di bidang pendidikan yang mengkaji akibat dari berbagai metode pengajaran. Peneliti dapat menentukan metode (sebagai variable bebas) dengan menggunakan berbagai macam metode. Dalam bahasa yang lebih lugas, variable bebas adalah variable yang meramalkan sedangkan variable terikat adalah variable yang diramalkan. Variable terikat adalah akibat yang di duga mengikuti perubahan dari variable bebas.

Sebagai contoh, misalnya kita mengkaji tentang hubungan antara kecerdasan dan prestasi sekolah, maka kecerdasan adalah variable bebas dan prestasi sekolah adalah variable terikat. Jika kita meneliti hubungan antara merokok dan penyakit kanker, maka merokok adalah variable bebas dan penyakit kanker adalah variable terikat.

Dalam melakukan penentuan variable bebas dan variable terikat harus dilandasi dengan teori yang kuat. Hal ini karena statistic tidak dapat membedakan data yang memiliki teori dengan data yang tidak berteori. Jika data yang kita gunakan tidak memiliki landasan teori yang kuat, maka kesimpulan yang kita ambil akan sangat menyesatkan. Misalnya, kita memprediksi prestasi belajar dengan hasil panen padi. Secara statistic, bisa jadi prestasi belajar dipengaruhi oleh panen padi. Akan tetapi dalam kenyataannya, hasil analisis ini tidak dapat dibuktikan.

Model regresi bermacam-macam. Misalnya, regresi linear, regresi parabola, regresi hiperbola, regresi fungsi pangkat tiga dan lain-lain. Akan tetapi, regresi yang paling sering digunakan adalah regresi linear. model regresi linear dapat dituliskan dalam bentuk matematis sebagai berikut:

β0 = intersep Y untuk populasi
β0 = slope untuk populasi
ε = random error dalam Y untuk observasi ke-i

Dalam menentukan persamaan model regresi linear sederhana diperlukan metode tertentu. Metode yang paling sering digunakan adalah metode kuadrat terkecil (Least Square method). Pada dasarnya, least square method adalah metode meminimasi persamaan kuadrat. Dengan meminimasi persamaan kuadrat tersebut, maka akan didapatkan nilai untuk slope dan nilai untuk intersep yang akan membuat persamaan itu menjadi yang paling baik.

Misalnya, jika kita ingin meramal hubungan antara intelejensi dan prestasi belajar. Dengan menggunakan metode regresi linear sederhana, kita mendapatkan persamaan sebagai berikut:
Y = 2,55 + 0,93 (X) Maka -12,77 disebut intersep dan 0,93 disebut slope. Slope sebesar 0,93 berarti bahwa setiap peningkan 1 unit X (intelejensi), maka diperkirakan akan terjadi peningkatan sebesar 0,93 pada prestasi belajar. Nilai 2,55 melambangkan prestasi belajar. Kita bias gunakan model regresi yang telah kita hasilkan tersebut untuk memprediksi prestasi belajar seorang anak apabila dia memiliki intelejensi tertentu.

Pada postingan berikut insya Allah saya akan mendemonstrasikan bagaimana melakukan perhitungan untuk menemukan model persamaan regresi linear sederhana.




Share

Pengujian Linearitas

Salah satu teknik analisis regresi yang paling sering digunakan adalah regresi linear. regresi linear dapat digunakan apabila asumsi linearitas dapat terpenuhi. Apabila asumsi ini tidak terpenuhi, maka kita tidak dapat menggunakan analisis regresi linear. akan tetapi kita bias menggunakan analisis regresi nonlinear.

Asumsi linearitas adalah asumsi yang akan memastikan apakah data yang kita miliki sesuai dengan garis linear atau tidak. Asumsi ini dapat diketahui dengan mencari nilai deviation from linearity dari uji F linear. untuk mengetahui nilai tersebut, kita akan menggunakan data yang kita miliki pada postingan sebelum ini. 


Masukkan variable science pada kotak Dependent List dan math pada kotak Independent List. Kemudian klik option dan tandai test for linearity. Kemudian klik OK.


pada output SPSS, akan kita dapatkan hasil pengujian yang dirangkum dalam table analisis varian (ANOVA Table) seperti berikut ini:

Jika angka pada Deviation From Linearity lebih besar dari 0,05 ( > 0,05), berarti hubungan antara variable dependen dengan variable independen adalah linear. berdasarkan hasil pengujian terlihat bahwa nilai Sig. untuk Deviation from Linearity sebesar 0,133 yang berarti lebih besar dari 0,05 dengan demikian, dapat disimpulkan bahwa terdapat hubungan yang linear antara variable dependen dan independen. 

Share

Senin, 05 Januari 2009

pengujian asumsi klasik regresi

Analisi regresi merupakan alat analisis yang paling sering digunakan para peneliti akhir-akhir ini. Hal ini tentu saja di dorong oleh perkembangan software komputer yang semakin mempermudah proses kalkulasi yang dulunya sangat sulit dikerjakan secara manual. Analisis regresi adalah alat analisis yang termasuk dalam statistik parametrik. Dengan demikian, untuk mempergunakan regresi, seorang peneliti harus melakukan pengujian asumsi terlebih dahulu. Asumsi yang harus diuji adalah, normalitas sebaran, linieritas (jika kita hendak mempergunakan regresi linier), heteroskedastisitas, multikolinearitas serta autokorelasi.

Pada postingan edisi tahun baru ini, saya hendak mendemonstrasikan bagaimana kita melakukan pengujian terhadap asumsi-asumsi statistika parametrik jika kita hendak menggunakan analisis regresi. Karena keterbatasan tempat, saya hanya akan memperlihat pengujian terhadap asumsi normalitas sebaran data, homokedastisitas serta multikolinearitas. Dua asumsi yang lain akan saya selanjutnya karena memerlukan pembahasan tersendiri.

Saya akan menggunakan data dari buku Applied Statistics for the Behavioral Sciences karangan Hinkle dan kawan-kawannya. Kita hendak menguji apakah sekor yang diperoleh siswa pada mata pelajaran matematika (X) dapat mempengaruhi sekor siswa pada mata pelajaran science (Y). pertama kita masukkan data ke dalam program SPSS seperti berikut ini:


Setelah itu klik analyze > Regression > Linear sehingga muncul kotak dialog linier regression.  

Masukkan variabel science pada kotak Dependent dan variabel math pada kotak independent(s). kemudian klik statistics sehingga muncul tampilan seperti berikut ini:

Tandai Durbin-Watson pada Residuals untuk melihat nilai autokorelasi, collinearity diagnostics untuk melihat asumsi multikolinearitas. Klik continue untuk melanjutkan. Setelah itu klik kotak Plots dan tandai histogram dan normal probability plot pada standardized residual plot. Kemudian masukkan variabel SRESID ke dalam kotak Y dan ZPRED ke dalam kotak X untuk melihat asumsi heteroskedastisitas. Tekan continue.

Abaikan yang lain dan klik OK untuk melihat hasil analisis yang telah dilakukan oleh SPSS. Sekarang akan terbuka window baru yang berisi output SPSS. Nah, sekarang kita lihat hasil pengujian asumsi-asumsi tersebut.

1. Asumsi normalitas sebaran
Asumsi normalitas dapat diketahui dengan berbagai cara. Baik melalui pengujian statistik seperti Chi Square, Kolmogorov-Smirnov maupun Shapiro Wilk, berikut ini, pengujian normalitas dilakukan dengan histogram dan Plot Normal.



Berdasarkan output histogram di atas, terlihat bahwa sebaran data yang ada menyebar merata ke semua daerah kurva normal. Dengan demikian dapat disimpulkan bahwa data yang kita miliki mempunyai distribusi normal. Demikian juga dengan normal P-P Plot memperlihatkan hasil yang sama.
2. Asumsi homokedastisitas
Pengujian homokedastisitas juga sering disebut uji homogenitas. Dalam postingan ini, pengujian homogenitas dilakukan dengan menggunakan Scatter Plot nilai residual variabel dependen. Pengambilan kesimpulan dilakukan dengan memperhatikan sebaran plot data.


Berdasarkan plot data di atas, dapat kita tarik kesimpulan bahwa tidak terjadi persoalan heterokedastisitas. Artinya bahwa data yang kita kita miliki adalah data yang homogen. Jika terjadi persoalan heterokedastisitas, maka dapat dilakukan transformasi log natural (LN)

3. Asumsi multikolinearitas
Pengujian multikolinearitas juga sering disebut uji independensi. Pengujian ini akan melihat apakah antara sesama prediktor memiliki hubungan yang besar atau tidak. Jika hubungan antara sesama prediktor kuat maka antara prediktor tersebut tidak independen. Dalam contoh kita ini, hanya memiliki satu prediktor yaitu sekor matematika sehingga dapat dikatakan terbebas dari persoalan multikolinearitas. Akan tetapi, jika kita memiliki satu predikto dan hendak menguji asumsi ini, kita bisa melihat pada output SPSS berikut ini.



Pengujian multikolinearitas diketahui dari nilai VIF setiap prediktor. Jika nilai VIF prediktor tidak melebihi 10, maka dapat kita katakan bahwa data kita terbebas dari persoalan multikolinearitas. Pada contoh di atas, nilai VIF tidak melebihi 10 sehingga dapat disimpulkan bahwa model tidak terkena persoalan multikolinearitas.

Share