Cari Blog Ini

Memuat...

SELAMAT DATANG SOBAT...

Salam...

Selama ini, statistika sering diidentikkan dengan bidang yang lumayan sulit. Kesulitan dalam mempelajari statistika dikarenakan bidang ini terkait langsung dengan matematika. Bidang ilmu yang ketika mendengar namanya saja kebanyakan kita sudah kebakaran jenggot.. hehehe..

Ditengah situasi seperti itulah blog ini hadir. blog ini berusaha untuk menjembatani orang-orang yang mencari informasi yang berhubungan dengan statistik. Untuk lebih mempermudah analisis statistik, maka blog inipun memberikan panduan bagaimana melakukan analisis dengan menggunakan software SPSS.

Untuk lebih membuat blog ini lebih bermanfaat, sumbang saran dari pembaca sekalian sangat penulis harapkan dan kita akan sama-sama belajar... Ayo semangat!! Buat Indonesia melek dengan statistika.

Wassalam
Djunaidi L, Manado


Senin, 22 Desember 2008

Chi Square dan Goodness-Of-Fit Test

Salah seorang pengunjung blog kita ini bertanya tentang apa sebenarnya yang dimaksud dengan chi square? 

Dalam statistik, distribusi chi square (dilambangkan dengan χ2) termasuk dalam statistik nonparametrik. Distribusi nonparametrik adalah distribusi dimana besaran-besaran populasi tidak diketahui. Distribusi ini sangat bermanfaat dalam melakukan analisis statistik jika kita tidak memiliki informasi tentang populasi atau jika asumsi-asumsi yang dipersyaratkan untuk penggunaan statistik parametrik tidak terpenuhi.

Beberapa hal yang perlu diketahui berkenaan dengan distribusi chi square adalah :

a. Distribusi chi square memiliki satu parameter yaitu derajad bebas (db)

b. Nilai-nilai chi square di mulai dari 0 disebelah kiri, sampai nilai-nilai positif tak terhingga di sebelah kanan

c. Probabilitas nilai chi square di mulai dari sisi sebelah kanan

d. Luas daerah di bawah kurva normal adalah 1. Nilai dari chi square bisa dicari jika kita memiliki informasi luas daerah disebelah kanan kurva serta derajad bebas. Misalnya jika luas daerah disebelah kanan adalah 0,1 dan derajad bebas sebanyak 7, maka nilai chi square adalah 12, 017.

Dalam statistic, distribusi chi square digunakan dalam banyak hal. Mulai dari pengujian proporsi data multinom, menguji kesamaan rata-rata Poisson serta pengujian hipotesis. Pengujian hipotesis yang menggunakan dasar distribusi chi square misalnya Goodness-of-fit test, pengujian indepensi, pengujian homogenitas serta pengujian varians dan standar deviasi populasi tunggal.

Pada postingan kali ini, kita saya akan menunjukkan penggunaan distribusi chi square untuk menguji Goodness-of-fit. Dalam Goodness-of-fit test ada hal-hal yang harus diperhatikan yaitu: 

a. Adanya frekuensi observasi atau frekuensi yang benar-benar terjadi dalam eksperimen dan dilambangkan dengan O.

b. Adanya frekuensi yang diharapkan terjadi yang dilambangkan dengan

E = np

c. Derajad bebas adalah k – 1 dimana k adalah jumlah kategori. Misalnya jika kita melempar dadu, maka aka nada 6 kategori kejadian sehingga k = 6. Dengan demikian db = 6 – 1 = 5.

d. Nilai chi square hitung diperoleh dari rumus:

X^2 = E [ (E-O)^2/E]

e. Jumlah sampel yang digunakan harus mencukupi nilai harapan paling sedikit 5 (E > 5)

Baiklah, kita akan melihat contoh penggunaan chi square dalam Goodness-of-fit Test. Contoh soal ini saya ambil dari buku Statistik Induktif karangan Abdul Hakim. Sebuah mall di Yogya memiliki 5 buah toko. Seorang analis ingin mengetahui apakah konsumen sama senangnya berbelanja di kelima toko tersebut. Dia mengumpulkan 1000 konsumen yang paling sering berbelanja ke mall tersebut. Datanya dirangkam dalam tabel berikut ini

Toko                 a          b        c        d          e
Frekuensi     214       231   182    154      219

Langkah pertama yang dilakukan untuk menjawab masalah di atas adalah menentukan rumusan hipotesis terlebih dahulu. Rumusan hipotesis adalah

H0 : proporsi konsumen yang berkunjung kelima toko itu sama. (jika proporsinya dianggap sama, maka proporsi untuk setiap toko adalah 1/5 = 0,2
H1 : paling tidak dua diantara toko tersebut memiliki proposi yang tidak sama dengan 0,2.

Langkah kedua adalah menentukan rumus/distribusi yang akan digunakan. Dalam kasus ini, dikarenakan terdapat 5 kategori, maka kita akan menggunakan distribusi chi square. 

Langkah ketiga adalah menentukan daerah penolakan hipotesis. Dengan alpha sebesar 0,01 dan df = 5 – 1 = 4 maka nilai chi square tabel atau nilai kritis penolakan hipotesis adalah 13,227. Artinya bahwa jika statistic hitung di atas statistic tabel, maka hipotesis nol ditolak.
Langkah keempat adalah menentukan nilai statistic hitung (uji) dengan cara kita membuat tabel seperti dibawah ini untuk mempermudah perhitungan.

 

langkah terakhir adalah menarik kesimpulan. Dengan nilai statistic hitung sebesar 19,79 berarti lebih besar dari nilai statistic tabel sebesar 13,227. Dengan demikian, hipotesis nol kita tolak. Sehingga kita dapat mengatakan bahwa proporsi orang yang datang kelima toko tersebut tidaklah sama.

Jika kita menggunakan program SPSS, maka pengujian hipotesis dapat kita lakukan sebagai berikut:
Masukkan data dari kelima toko tersebut ke dalam program SPSS sebagai berikut : 


Setelah itu kita beri bobot data dengan cara klik: Data > Weight Case sehingga kotak dialog weight case muncul. Pilih Weight Case By dan masukkan variable frekuensi ke dalam kotak Frequency Variable. Dan klik OK

Selanjutnya klik Analyze > Nonparametric Test > Chi Square sehingga kotak dialog analisis chi square muncul.

Masukkan varabel toko pada kotak Test variable list, pilih get from data pada kotak Expected Range dan All Categories equal pada kotak Expected Values. Kemudian klik OK sehingga hasil analisis SPSS akan muncul. Bandingkan dengan hasil perhitungan manual. 

Share

11 komentar:

Anonim mengatakan...

Pak, saya saat ini sedang mengerjakan penelitian dan ternyata data sekunder yang saya gunakan TIDAK berdistribusi normal sehingga saya harus menggunakan Mann Whitney U tes. Yang membuat saya bingung adalah bagaimana cara mengoperasikan program tsb di SPSS V.17 dan membaca hasilnya?
Terimakasih sebelumnya.
Salam
Ferry di Sidoarjo

Anonim mengatakan...

Pak, saya mengadakan penelitian yang harus diuji dengan uji regresi- binary logistic. Alat uji saya sudah valid dan reliabel, tapi goodness of fit test model saya tidak layak? Mengapa? Apa yg harus saya lakukan?
Trims.

charitier mengatakan...

pak saya sedang mengerjakan tugas akhir menggunakan multinom logit..
namun datanya tidak bisa tepat selalu ada warning..yang isinya seperti ini..
(Warnings
There are 36 (50.0%) cells (i.e., dependent variable levels by subpopulations) with zero frequencies.
Unexpected singularities in the Hessian matrix are encountered. This indicates that either some predictor variables should be excluded or some categories should be merged.
The NOMREG procedure continues despite the above warning(s). Subsequent results shown are based on the last iteration. Validity of the model fit is uncertain.)
kemungkinan kesalahannya di mana ya pak??terimakasih sebelumnya...

Q 051 M mengatakan...

terima kasih bayak pak atas info dan amalnya. met mjalankan ibadah puasa. Wasslmkm

bisnis blog mengatakan...

masak setiap komen di blog ini gak dibalas oleh admin, terpaksa saya yang jwab deh...emang payah
1. utuk uji Mann Whitey U, caranya beli buku ststistika nonparametrik aja, beli yang dasar saja dan mudah dipaham
2. goodness of fit test model saya tidak layak, berarti model gak cocok, ada beberapa kemungkinan. satu datanya gak bener alias bukan binner, kedua data gak ada yang salah tapi modelnya yang gak cocok. kalo dah begitu berarti penelitian selesai.. kesimpulannya gk ada hubungan aje.
3. untuk charitier, warning di spss itu muncul karena cell data dari chi square anda di bawah 5 alias ada yang kosong sekitar 5%. solusinya gunakan uji fisher sebagai ganti dari uji fitness nyA chi square.

aris mengatakan...

Salam sejahtera semoga blog statistik pendidikan menjadi pilihan utama pembacanya. Saya ingin bertanya, bagaimanakah cara menentukan kalimat pada hipotesa nul dengan hipotesa alternatif? Apakah pada hipotesa nul selalu disertai dengan kata sama antara hasil observasi dengan hasil diharapkan? Apakah ada hal lain yang mempengaruhi penentuan Ho dan Ha? Atas jawabannya saya ucapkan terima kasih.

djo3n mengatakan...

H0 secara tersirat berarti hipotesis nihil. biasanya dalam H0 terdapat kata 'tidak' dan pada Hipotesis alternatif kata tidak itu dihilangkan. misalnya
H0 : tidak ada perbedaan antara prestasi siswa yang masuk kelas pada sore hari dan pagi hari
H1 : ada perbedaan antara prestasi siswa yang masuk kelas pada sore hari dan pagi hari.

Anonim mengatakan...

mengapa nilai-nya harus lebih besar dari 5?

wahyublogspot mengatakan...

bos, penelitian saya hanya ada 2 variabe. variabel independen dan dependen. saya bingung dalam pengolahan data dependen. mohon bantuannya dan bagaimana uji chi squarenya, trim. email says : idanur82@gmail.com.

Anonim mengatakan...

buat mas wahyu.. penelitian kalo cuman 1 variabel seperti dependen saja atau independen saja, biasanya cuman di olah pake statistik deskriptif saja. untuk uji chi square, silahkan liat di bagian lain blog ini. makasih

Anonim mengatakan...

Saya cahyo mahasiswa yang sedang mengerjakan skripsi dengan topik SEM.
Saya mau bertanya pak, bagaimana interpretasi pada hasil uji validitas yang pada sign-2tailed hasil 0,000 semw pak...
twrima kasih.