Uji Asumsi 1
Shared by: andesraya
Categories
Tags
-
Stats
- views:
- 3160
- posted:
- 12/21/2009
- language:
- Indonesian
- pages:
- 5
Document Sample


Uji Asumsi 1 : Uji Normalitas Setelah cukup lama bingung pilih-pilih tema yang mau diangkat perdana, saya akhirnya mencoba memilih satu tema ini : Uji Asumsi Statistik Parametrik. Uji Asumsi yang pertama akan saya bahas adalah Uji Normalitas. Apa itu ? Kita mulai dulu dari apa itu uji normalitas. Uji normalitas adalah uji yang dilakukan untuk mengecek apakah data penelitian kita berasal dari populasi yang sebarannya normal. Uji ini perlu dilakukan karena semua perhitungan statistik parametrik memiliki asumsi normalitas sebaran. Formula/rumus yang digunakan untuk melakukan suatu uji (t-test misalnya) dibuat dengan mengasumsikan bahwa data yang akan dianalisis berasal dari populasi yang sebarannya normal. Ya bisa ditebak bahwa data yang normal memiliki kekhasan seperti mean, median dan modusnya memiliki nilai yang sama. Selain itu juga data normal memiliki bentuk kurva yang sama, bell curve. Nah dengan mengasumsikan bahwa data dalam bentuk normal ini, analisis statistik baru bisa dilakukan. Bagaimana Caranya? Ada beberapa cara melakukan uji asumsi normalitas ini yaitu menggunakan analisis Chi Square dan Kolmogorov-Smirnov. Bagaimana analisisnya untuk sementara kita serahkan pada program analisis statistik seperti SPSS dulu ya. Tapi pada dasarnya kedua analisis ini dapat diibaratkan seperti ini : 1. pertama komputer memeriksa data kita, kemudian membuat sebuah data virtual yang sudah dibuat normal. 2. kemudian komputer seolah-olah melakukan uji beda antara data yang kita miliki dengan data virtual yang dibuat normal tadi. 3. dari hasil uji beda tersebut, dapat disimpulkan dua hal : o o jika p lebih kecil daripada 0,05 maka dapat disimpulkan bahwa data yang kita miliki berbeda secara signifikan dengan data virtual yang normal tadi. Ini berarti data yang kita miliki sebaran datanya tidak normal. jika p lebih besar daripada 0,05 maka dapat disimpulkan bahwa data yang kita miliki tidak berbeda secara signifikan dengan data virtual yang normal. Ini berarti data yang kita miliki sebaran datanya normal juga. Ukuran inilah yang digunakan untuk menentukan apakah data kita berasal dari populasi yang normal atau tidak. Bagaimana Jika Tidak Normal? Tenang...tenang... data yang tidak normal tidak selalu berasal dari penelitian yang buruk. Data ini mungkin saja terjadi karena ada kejadian yang di luar kebiasaan. Atau memang kondisi datanya memang nggak normal. Misal data inteligensi di sekolah anak-anak berbakat (gifted) jelas tidak akan Lalu normal, apa besar kemungkinannya yang bisa akan kita juling positif. lakukan? 1. Kita perlu ngecek apakah ketidaknormalannya parah nggak. Memang sih nggak ada patokan pasti tentang keparahan ini. Tapi kita bisa mengira-ira jika misalnya nilai p yang didapatkan sebesar 0,049 maka ketidaknormalannya tidak terlalu parah (nilai tersebut hanya sedikit di bawah 0,05). Jika ketidaknormalannya tidak terlalu parah lalu kenapa? Ada beberapa analisis statistik yang agak kebal dengan kondisi ketidaknormalan ini (disebut memiliki sifat robust), misalnya F-test dan t-test. Jadi kita bisa tetap menggunakan analisis ini jika ketidaknormalannya tidak parah. 2. Kita bisa membuang nilai-nilai yang ekstrem, baik atas atau bawah. Nilai ekstrem ini disebut outliers. Pertama kita perlu membuat grafik, dengan sumbu x sebagai frekuensi dan y sebagai semua nilai yang ada dalam data kita (ini tentunya bisa dikerjakan oleh komputer). Nah dari sini kita akan bisa melihat nilai mana yang sangat jauh dari kelompoknya (tampak sebagai sebuah titik yang nun jauh di sana dan nampak terasing...sendiri...). Nilai inilah yang kemudian perlu dibuang dari data kita, dengan asumsi nilai ini muncul akibat situasi yang tidak biasanya. Misal responden yang mengisi skala kita dengan sembarang yang membuat nilainya jadi sangat tinggi atau sangat rendah. 3. Tindakan ketiga yang bisa kita lakukan adalah dengan mentransform data kita. Ada banyak cara untuk mentransform data kita, misalnya dengan mencari akar kuadrat dari data kita, dll. 4. Bagaimana jika semua usaha di atas tidak membuahkan hasil dan hanya membuahkan penyesalan (wah..wah.. nggak segitunya kali ya?) . Maka langkah terakhir yang bisa kita lakukan adalah dengan menggunakan analisis non-parametrik. Analisis ini disebut juga sebagai analisis yang distribution free. Sayangnya analisis ini seringkali mengubah data kita menjadi data yang lebih rendah tingkatannya. Misal kalo sebelumnya data kita termasuk data interval dengan analisis ini akan diubah menjadi data ordinal. Well, demikian kiranya paparan atau sharing tentang normalitas. Semoga dalam waktu dekat saya bisa tahu gimana caranya meng-upload gambar ke dalam blog ini dalam posisi yang manis jadi penjelasan saya bisa jadi lebih visualized gitu deh. Semoga juga saya juga bisa segera mengubah tampilan SPSS menjadi JPG, jadi kita bisa belajar baca hasil analisis di blog ini, OK? Semoga..... (kayak lagunya katon nih) Chi Square dan Goodness-Of-Fit Test Salah seorang pengunjung blog kita ini bertanya tentang apa sebenarnya yang dimaksud dengan chi square? Dalam statistik, distribusi chi square (dilambangkan dengan χ2) termasuk dalam statistik nonparametrik. Distribusi nonparametrik adalah distribusi dimana besaran-besaran populasi tidak diketahui. Distribusi ini sangat bermanfaat dalam melakukan analisis statistik jika kita tidak memiliki informasi tentang populasi atau jika asumsi-asumsi yang dipersyaratkan untuk penggunaan statistik parametrik tidak terpenuhi. Beberapa hal yang perlu diketahui berkenaan dengan distribusi chi square adalah : a. Distribusi chi square memiliki satu parameter yaitu derajad bebas (db) b. Nilai-nilai chi square di mulai dari 0 disebelah kiri, sampai nilai-nilai positif tak terhingga di sebelah kanan c. Probabilitas nilai chi square di mulai dari sisi sebelah kanan d. Luas daerah di bawah kurva normal adalah 1. Nilai dari chi square bisa dicari jika kita memiliki informasi luas daerah disebelah kanan kurva serta derajad bebas. Misalnya jika luas daerah disebelah kanan adalah 0,1 dan derajad bebas sebanyak 7, maka nilai chi square adalah 12, 017. Dalam statistic, distribusi chi square digunakan dalam banyak hal. Mulai dari pengujian proporsi data multinom, menguji kesamaan rata-rata Poisson serta pengujian hipotesis. Pengujian hipotesis yang menggunakan dasar distribusi chi square misalnya Goodness-of-fit test, pengujian indepensi, pengujian homogenitas serta pengujian varians dan standar deviasi populasi tunggal. Pada postingan kali ini, kita saya akan menunjukkan penggunaan distribusi chi square untuk menguji Goodness-of-fit. Dalam Goodness-of-fit test ada hal-hal yang harus diperhatikan yaitu: a. Adanya frekuensi observasi atau frekuensi yang benar-benar terjadi dalam eksperimen dan dilambangkan dengan O. b. Adanya frekuensi yang diharapkan terjadi yang dilambangkan dengan E = np c. Derajad bebas adalah k – 1 dimana k adalah jumlah kategori. Misalnya jika kita melempar dadu, maka aka nada 6 kategori kejadian sehingga k = 6. Dengan demikian db = 6 – 1 = 5. d. Nilai chi square hitung diperoleh dari rumus: X^2 = E [ (E-O)^2/E] e. Jumlah sampel yang digunakan harus mencukupi nilai harapan paling sedikit 5 (E > 5) Baiklah, kita akan melihat contoh penggunaan chi square dalam Goodness-of-fit Test. Contoh soal ini saya ambil dari buku Statistik Induktif karangan Abdul Hakim. Sebuah mall di Yogya memiliki 5 buah toko. Seorang analis ingin mengetahui apakah konsumen sama senangnya berbelanja di kelima toko tersebut. Dia mengumpulkan 1000 konsumen yang paling sering berbelanja ke mall tersebut. Datanya dirangkam dalam tabel berikut ini Toko Frekuensi a 214 b 231 182 154 c 219 d e Langkah pertama yang dilakukan untuk menjawab masalah di atas adalah menentukan rumusan hipotesis terlebih dahulu. Rumusan hipotesis adalah H0 : proporsi konsumen yang berkunjung kelima toko itu sama. (jika proporsinya dianggap sama, maka proporsi untuk setiap toko adalah 1/5 = 0,2 H1 : paling tidak dua diantara toko tersebut memiliki proposi yang tidak sama dengan 0,2. Langkah kedua adalah menentukan rumus/distribusi yang akan digunakan. Dalam kasus ini, dikarenakan terdapat 5 kategori, maka kita akan menggunakan distribusi chi square. Langkah ketiga adalah menentukan daerah penolakan hipotesis. Dengan alpha sebesar 0,01 dan df = 5 – 1 = 4 maka nilai chi square tabel atau nilai kritis penolakan hipotesis adalah 13,227. Artinya bahwa jika statistic hitung di atas statistic tabel, maka hipotesis nol ditolak. Langkah keempat adalah menentukan nilai statistic hitung (uji) dengan cara kita membuat tabel seperti dibawah ini untuk mempermudah perhitungan. langkah terakhir adalah menarik kesimpulan. Dengan nilai statistic hitung sebesar 19,79 berarti lebih besar dari nilai statistic tabel sebesar 13,227. Dengan demikian, hipotesis nol kita tolak. Sehingga kita dapat mengatakan bahwa proporsi orang yang datang kelima toko tersebut tidaklah sama. Jika kita menggunakan program SPSS, maka pengujian hipotesis dapat kita lakukan sebagai berikut: Masukkan data dari kelima toko tersebut ke dalam program SPSS sebagai berikut : Setelah itu kita beri bobot data dengan cara klik: Data > Weight Case sehingga kotak dialog weight case muncul. Pilih Weight Case By dan masukkan variable frekuensi ke dalam kotak Frequency Variable. Dan klik OK Selanjutnya klik Analyze > Nonparametric Test > Chi Square sehingga kotak dialog analisis chi square muncul. Masukkan varabel toko pada kotak Test variable list, pilih get from data pada kotak Expected Range dan All Categories equal pada kotak Expected Values. Kemudian klik OK sehingga hasil analisis SPSS akan muncul. Bandingkan dengan hasil perhitungan manual.
Get documents about "