Modull Ebook

Document Sample
Modull Ebook Powered By Docstoc
					                                                                                       Statistika

                                          BAB I
                                      PENDAHULUAN
        Menurut definisi, statistika adalah sekumpulan konsep dan metode yang digunakan
untuk mempelajari bagaimana mengumpulkan, manganalisis dan menginterpretasikan data
mengenai suatu kegiatan tertentu dan mengambil kesimpulan dalam keadaan dimana terdapat
ketidakpastian.
        Dalam prakteknya, statistika digunakan untuk berbagai bidang seperti ekonomi, politik,
psikologi, kedokteran, kimia, fisika, biologi, geografi, komunikasi, dsb. Secara umum statistika
dibagi menjadi dua kelompok utama, yaitu:
1. Statistika Deskriptif
    Statistika Deskriptif berusaha menjelaskan, meringkas dan menggambarkan karakteristik-
    karakteristik penting dari data, seperti rata-rata, median, penyajian dalam bentuk tabel atau
    grafik.
2. Statistika Inferensi
   Statistika inferensi berusaha membuat penaksiran, keputusan, peramalan atau generalisasi
   terhadap suatu populasi berdasarkan sampel yang diambil dari populasi tersebut.
Istilah-istilah penting dalam Statistika
    1. Populasi : himpunan data yang mencirikan suatu fenomena yang akan diamati.
    2. Sampel : bagian dari populasi yang diambil dengan cara tertentu.
    3. Sensus : pengumpulan data dari seluruh populasi.
    4. Survey : pengumpulan data dari sampel.
    5. Parameter : ukuran deskriptif dari populasi.
    6. Statistik : ukuran deskriptif dari sampel.
    7. Skala Pengukuran Data :
        a. Data kualitatif (Data Kategorik) : data yang dinyatakan bukan dalam bentuk angka,
           terbagi dua yaitu:
           1. Skala nominal :
                Data kategori tanpa memperhatikan adanya urutan
                Contoh: jenis kelamin, golongan darah, warna rambut, dsb
           2. Skala ordinal :
                Data kategori dengan memperhatikan adanya urutan
                Contoh: tingkat pendidikan, preferensi, kepangkatan, dsb.
        b. Data kuantitatif (Data Numerik) : data yang dinyatakan dalam bentuk angka,
           terbagi dua yaitu:
           1. Skala interval :
                Data numerik yang tidak mempunyai nol mutlak
                Contoh: suhu, tahun, dsb
           2. Skala rasio :
                Data numerik yang mempunyai nol mutlak
                Contoh: tinggi badan, berat badan, dsb.

MANAJEMEN DATA

       SPSS (Statistical Product and Service Solutions) merupakan perangkat lunak aplikasi
komputer untuk membantu mengolah dan menganalisis data statistik. SPSS dapat digunakan
untuk seluruh jenis data dan membuat laporan yang berbentuk tabulasi, grafik, plot dari
berbagai distribusi, statistik deskriptif atau untuk analisa statistik yang lebih kompleks.

TIPE WINDOWS SPSS
Dalam menunjang kerjanya, SPSS for Windows menggunakan beberapa window diantaranya :
   1. Data Editor, berisi data file, disini kita bisa membuat data file baru atau memodifikasi
      data file yang diinginkan


Modul SPSS                                                                                   -1-
Bambang Ruswandi, M.Stat
                                                                                  Statistika
   2. Viewer, menampilkan output analisa SPSS
   3. Draft Viewer, digunakan untuk menampilkan output dalam bentuk teks sederhana
   4. Syntax Editor, digunakan untuk pengolahan data yang memerlukan perintah-perintah
      yang belum tersedia langsung dari SPSS.
   5. Pivot Table Editor, berisi tampilan output hasil analisis
   6. Chart Editor, digunakan untuk memodifikasi chart atau plot
   7. Text Output Editor, digunakan untuk mengubah atau mengedit output, bentuk font
      (type, style, warna dan ukuran)

DATA EDITOR

Menu Data Editor

Data editor pada SPSS 15 for window terdiri dari 2 sheet yaitu Data View dan Variable View.
Data View digunakan untuk proses pengisian data, sedangkan Variable View digunakan untuk
pendefinisian variabel.
Ada beberapa menu utama yang dimiliki oleh SPSS 15 for Window
 File, digunakan untuk membuat file baru, membuka file tertentu, mengambil data dari
   program lain, mencetak isi editor, dsb.
 Edit, digunakan untuk memodifikasi, mengkopi, menghapus, mencari dan mengganti data
   atau text dari output window maupun syntax window.
 View, digunakan untuk mengatur font, gridline, toolbar dsb.
 Data, digunakan untuk membuat perubahan data SPSS secara keseluruhan, seperti
   mengurutkan data, menyeleksi data berdasarkan kriteria tertentu, menggabung data, dsb.
 Transform, digunakan untuk mentransformasi data yaitu pembentukan variabel baru yang
   nilainya merupakan hasil transformasi dari nilai variabel yang ada atau memodifikasi
   variabel yang sudah ada berdasarkan variabel lain.
 Analyze, digunakan untuk memilih berbagai prosedur analisa statistik
 Graphs, digunakan untuk menampilkan data berupa bar chart, pie chart, histogram, scatter
   plot dan bentuk grafik lainnya.
 Utilities, digunakan untuk mengakses data, menampilkan file info atau index dari peintah-
   perintah SPSS
 Window, digunakan untuk mengatur, memilih dan mengontrol atribut window
 Help, berisi informasi bantuan yang berkaitan dengan SPSS

Konsep Data dan Variabel pada SPSS
1. Struktur Data
   Dalam SPSS, data disusun berdasarkan baris dan kolom. Tiap baris dinamakan case, kolom
   disebut variabel dan perpotongan baris dan kolom dikatakan value. Lihat gambar 1
   (skematis)




                               Gambar SPSS Data View Editor

Modul SPSS                                                                              -2-
Bambang Ruswandi, M.Stat
                                                                                     Statistika
2. Format Data
   Dalam SPSS digunakan format fixed artinya setiap variabel menempati posisi dalam lokasi
   kolom tertentu, dan untuk masing-masing case dalam file data tersebut lokasinya sama.
3. Missing Value
   Istilah untuk menyatakan data yang hilang atau tidak lengkap, hal ini perlu diperhatikan
   karena data yang hilang akan berpengaruh pada hasil pengolahan maupun analisis
   keseluruhan data.
4. Konsep Variabel
   Variabel terdiri dari
    Variabel kualitatif, berbentuk klasifikasi atau kategori seperti jenis kelamin, tingkat
       pendidikan dsb
    Variabel kuantitatif, berbentuk skor (numerik) seperti jumlah penduduk, umur, berat
       badan dsb

Menggunakan Data Editor

   Pada bagian ini akan diuraikan cara-cara :

   1. Memilih prosedur statistik
      Untuk memilih prosedur statistik dapat dipilih dari menu Analyze
   2. Membuka file data
      Langkahnya :
          Klik File
          Klik Open
          Klik Data
   3. Membuat file data baru
      Langkahnya :
          Klik File
          Klik New
          Klik Data
          Note : Dari data baru anda bisa langsung mengisikan data pada sel-sel data
             editor tetapi terlebih dahulu harus didefinisikan variabel data tersebut.
   4. Mendefinisikan variabel
      Langkahnya :
          Klik Variable View
      Akan muncul tampilan berikut :




                               Gambar SPSS Variable View Editor


Modul SPSS                                                                                    -3-
Bambang Ruswandi, M.Stat
                                                                                      Statistika


      Dari sini anda dapat memberi nama, format, label, value label, tipe variabel, alignment
      dsb. Untuk melakukan entry data anda harus balik ke Data View.

      Name: klik pada sel di bawah kolom name kemudian ketik nama sesuai dengan variabel
      yang dimiliki.
      Note: Perhatikan bahwa untuk bagian nama ini, SPSS selalu membuat huruf kecil dengan
      jumlah maksimal 8 karakter dan tidak diperbolehkan untuk memakai spasi,tanda titik,
      koma, dan karakter lainnya kecuali _

      Type: tipe data yang dipilih disesuaikan dengan jenis data yang akan didefinisikan pada
      variabel. Jika variabel yang didefinisikan adalah nama maka tipe variabel yang dipilih
      adalah string. Sedangkan data yang berupa angka, tipe variabel yang dipilih adalah
      numeric. Pemilihan tipe ini dilakukan dengan melkaukan klik pada kotak kecil di kanan
      sel type.




                                Gambar Variable Type Editor

      Width: Pilihan ini menyediakan digit untuk memasukkan karakter dari data dengan
      jumlah maksimal 255.
      Note: Pengisian angka dapat dilakukan dengan mengetik secara langsung ataupun
      dengan menggunakan fasilitas scroll number untuk menaikkan atau menurunkan
      banyaknya digit yang diinginkan yang berada di sebelah kanan sel.

      Decimals: Pilihan ini disediakan untuk data numerik yang mempunyai angka desimal.
      User dapat memilih berapa desimal yang diinginkan sesuai dengan data yang ada.

      Label: karena pada bagian name hanya memungkinkan untuk menulis sampai 8
      karakter saja maka untuk penjelasan yang lebih panjang dapat dilakukan pada label.
      Misalkan nama variabel adalah jns_pkj, di bagian label ditulis Jenis Pekerjaan.
      Note : Label tidak mempengaruhi proses pengolahan data.

      Values: Pilihan ini berguna untuk data kualitatif, karena data kategori yang masih
      berupa string biasanya dikode ulang dengan pengkategorian menggunakan angka.
      Misalkan variabel yang diamati adalah jenis kelamin. Kategori laki-laki diberi kode 1 dan
      perempuan di beri kode 0, maka untuk proses pemberian kodenya dilakukan sebagai
      berikut:
      Klik mouse pada kotak kecil di sebelah kanan sel, sehingga tampil layar berikut:




Modul SPSS                                                                                      -4-
Bambang Ruswandi, M.Stat
                                                                                  Statistika




                                 Gambar Value Labels Editor

      Masukkan angka 1 pada bagian value dan tulis Laki-laki pada bagian value label.
      Kemudian klik add, dst.
      Note: Untuk melakukan proses edit isi value atau value label cukup dengan mengganti
      langsung kemudian klik change atau remove jika ingin menghapus.

      Missing: Missing adalah data yang hilang atau data yang tidak lengkap.

      Column: Hampir sama dengan width hanya fungsi column menyediakan lebar kolom
      yang diperlukan untuk proses input data dan diperlihatkan dengan kolom yang semakin
      lebar jika lebar kolom yang dipilih cukup besar. Batas maksimalnya juga sama dengan
      width yaitu 255 karakter.

      Align: Align berfungsi untuk menentukan posisi data apakah di kiri, tengah atau kanan.
      Pemilihan dilakukan dengan melakukan klik pada bagian kanan sel kemudian pilih
      sesuai dengan kebutuhan

      Measure: Untuk data string, ada dua pilihan yaitu nominal atau ordinal. Sedangkan data
      yang sudah berupa angka baik yang benar-benar angka numerik maupun hasil
      kodefikasi, maka pilihan yang ada adalah ordinal atau scale.

   5. Menyimpan file data
      Langkahnya :
          Klik File
          Klik Save As
          Klik OK
      Note : Ekstensi file dari data pada SPSS adalah .sav

   6. Mengedit data
      Tidak berbeda jauh dengan aplikasi lain yang berupa tabel, untuk SPSS, proses editing
      data meliputi menghapus data, mengganti isi data, melakukan duplikasi data ataupun
      mencari data.
      Menghapus data: dapat dilakukan dengan memilih sel atau kolom atau baris yang akan
      dihapus kemudian klik edit dan pilih clear atau cut.
      Mengganti isi data: dapat dilakukan dengan memilih sel yang akan diganti datanya
      kemudian langsung ketik perubahan yang diinginkan.
      Melakukan duplikasi data: dapat dilakukan dengan memilih sel yang akan diduplikasi
      kemudian klik edit dan pilih copy. Setelah itu pilih sel yang akan diisi dengan data
      duplikasi kemudian pilih edit dan klik paste.




Modul SPSS                                                                               -5-
Bambang Ruswandi, M.Stat
                                                                                      Statistika

                                       BAB II
                               STATISTIKA DESKRIPTIF

2.1. Pendahuluan
            Statistika deskripsi adalah bidang statistika yang membicarakan cara atau metode
     mengumpulkan, menyederhanakan dan menyajikan data sehingga bisa memberikan
     informasi. Dalam statistika deskripsi belum sampai pada upaya menarik suatu kesimpulan,
     tetapi baru sampai pada tingkat memberikan suatu bentuk ringkasan data sehingga
     khalayak/masyarakat awam statistika pun dapat memahami informasi yang terkandung
     dalam data.

2.2. Klasifikasi Peubah
             Berbicara statistika tentu akan berbicara tentang data. Data merupakan kumpulan
     dari karakteristik objek/individu yang diamati atau sering juga disebut sebagai kumpulan
     dari peubah-peubah (variables). Berdasarkan skala pengukurannya, peubah dapat
     dikategorikan menjadi empat yaitu peubah berskala nominal, ordinal, interval dan rasio.
     Tetapi ada juga ilmuwan statistika mengklasifikasikan menjadi peubah kategorik dan
     peubah pengukuran. Peubah kategorik merupakan peubah yang nilai-nilainya hanya
     bersifat mengkelas-kelaskan objek/individu yang saling terpisah (nominal dan ordinal).
     Sedangkan peubah pengukuran merupakan peubah yang nilai-nilainya diperoleh dengan
     menggunakan alat ukur tertentu seperti meteran, timbangan, thermometer dan lain-lain
     (interval dfan rasio). Peubah pengukuran dapat diklasifikasikan lagi menjadi peubah
     diskrit dan peubah kontinu.

     2.2.1. Skala Nominal
             Angka-angka yang disajikan pada skala nominal hanya sebagai nama
     penggolongan. Angka tersebut tidak mengukur besaran tetapt hanya sebagai lambing.
     Disini, angka 1 tidak lebih besar dari 0 begitu pula 0 tidak lebih kecil dari 1. perhatikan
     pemberian kode 1 pada laki-laki dan 0 pada perempuan tidak berarti laki-laki mempunyai
     nilai satu dan perempuan nol. Angka-angka tersebut hanyalah membedakan antara laki-
     laki dan perempuan, dengan demikian kita juga bisa meukar laki-laki menjadi 0 dan
     perempuan menjadi 1 tanpa merubah makna.

     2.2.2. Skala Ordinal
             Seperti halnya pada skala nominal, angka-angka yang disajikan hanya sebagai
     nama penggolongan. Perbedaan dengan skala nominal, peggolongan pada skala ordinal
     telah membentuk suatu tataan. Pada skala ini ada yang dianggap tingkat terendah dan
     tertinggi. Walaupun demikian jarak antara dua angka atau penggolongan yang berurutan
     tidak perlu sama.
     Perhatikan table berikut yang merupakan tingkat pendidikan.

                                  Table 2.1. Pendidikan
                           Pernyataan                  Nilai
                           Lulus Sarjana                5
                           Lulus SMA                    4
                           Lulus SMP                    3
                           Lulus SD                     2
                           Tidak lulus SD               1




Modul SPSS                                                                                  -6-
Bambang Ruswandi, M.Stat
                                                                                      Statistika
     2.2.3. Skala Selang (Interval scale)
             Pada skala selang, angka-angka yang disajikan telah menunjukkan tingkat, angka 1
     lebih kecil dari 2, 2 lebih kecil dari 3 dan seterusnya. Kelebihan dari skala ordinal, pada
     skala selang, dua angka yang berurutan memiliki jarak yang sama tetapi angka-angka
     tersebut tidak dapat diperbandingkan.
             Kita perhatikan suatu bentuk Contoh pengukuran suhu dengan standar derajat
     Celcius, perbedaan (jarak) antara suhu 20o dan 10o sama dengan perbedaan antara suhu
     90o dan 80o yaitu masing-masing 10o, tetapi benda yang memiliki suhu 80o tidak berarti
     panasnya dua kali benda yang memiliki 40o. hal ini dapat dijelaskan karena skala selang
     tidak memiliki nilai dasar mutlak. Nilai dasar pada thermometer Celcius, yaitu 0 oC
     merupakan suatu kondisi perjanjian pada saat air murni membeku menjadi es pada
     tekanan udara 76 Hg dan bukan berarti kondisi pada saat ini tidak memiliki derajat panas.
     Hal tersebut berlaku pula pada penilaian persepsi seseorang. Penilaian tentang baik, buruk
     merupakan nilai relatif. Seseorang yang dinilai sangat baik dibandingkan yang sangat
     buruk memiliki selisih yang sama untuk setiap penilaian.

     2.2.4. Skala Rasio/Nisbah
             Skala rasio merupakan skala pengukuran tertinggi. Pada skala rasio, data bersifat
     seperti skala selang yaitu antara dua nilai yang berurutan mempunyai jarak yang sama.
     Kelebihannya dibanding skala selang, nilai-nilai pada skala rasio dapat dibandingkan
     karena mempunyai nilai dasar yang mutlak. Nilai 80 pada hasil ujian seorang mahasiswa
     adalah dua kali lipat dari nilai 40 yang diperoleh temannya. Hal ini dapat diterangkan
     karena nilai hasil ujian memiliki nilai dasar mutlak nol yaitu pada saat seorang mahasiswa
     sama sekali tidak dapat mengerjakan soal ujian. Atau contoh lain dalam menimbang
     sesuatu jika bernilai nol berarti tidak ada barang yang ditimbang.

2.3. Peringkasan Data
     a) Ukuran Pemusatan
            Seorang peneliti, setelah mengumpulkan data tentunya ingin mengetahui
     bagaimana karakteristik data yang diperolehnya. Dia akan mencari sesederhana mungkin
     informasi dari data yang dikumpulkannya tapi memiliki pengertian yang dapat
     menjelaskan data secara keseluruhan. Untuk keperluan ini dalam statistika dikenal istilah
     ukuran pemusatan dan ukuran penyebaran.
            Ukuran pemusatan merupakan suatu gambaran (informasi) yang memberikan
     penjelasan bahwa data memiliki satu (mungkin lebih) titik dimana dia memusat atau
     terkumpul. Ukuran-ukuran pemusatan yang sering digunakan antara lain:
       1. Nilai Tengah (Rataan)
              Nilai tengah merupakan ukuran pemusatan data yang menimbang data menjadi
       dua kelompok data yang memiliki massa yang sama. Dengan kata lain nilai tengah
       merupakan titik keseimbangan massa dari segugusan data. apabila x1, x2, …, xN adalah
       anggota suatu populasi terhingga berukuran N, maka nilai tengah populasinya adalah:
                                                  N
                                            1
                                              N    Xi
                                                  i 1
              Sedangkan jika x1,x2, ...,xn adalah anggota suatu contoh berukuran n, maka nilai
       tengah contoh tersebut adalah:
                                                           n
                                              x      1
                                                      n    Xi
                                                          i 1
       2. Median
              Median adalah suatu nilai data yng membagi dua sama banyak kumpulan data
       yang telah diurutkan. Apabila banyaknya data ganjil, median adalah data yang tepat
       ditengah-tengah, sedangkan bila banyaknya data genap, median adalah rata-rata dua
       data yang ada ditengah.

Modul SPSS                                                                                  -7-
Bambang Ruswandi, M.Stat
                                                                                     Statistika
             Langkah-langkah yang dapat digunakan untuk mencari nilai median cara sebagai
      berikut:
       Urutkan data amatan terkecil sampai data amatan terbesar
       Posisi median (nmed) = (n+1)/2
       Jika posisi median bernilai bulat maka median adalah X(n+1)/2 sedangkan jika bernilai
          pecahan maka median adalah rata-rata dari Xn/2 dan X(n/2+1)

      3. Modus
               Suatu nilai data yang paling sering terjadi atau yang mempunyai frekuensi paling
      tinggi. Suatu kumpulan data mungkin saja mempunyai modus lebih dari satu buah.

      4. Kuartil
              Kuartil adalah nilai-nilai yang menyekat gugus data menjadi empat kelompok
      data yang masing-masing terdiri dari 25% amatan. Nilai-nilai yang menyekat data
      mejadi empat kelompok data tersebut dikenal dengan sebutan kuartil 1 (Q1), kuartil 2
      (Q2) dan kuartil 3 (Q3).
              Kuartil 1 (Q1) adalah nilai data yang menyekat kumpulan data yang telah
      diurutkan sehingga banyaknya data yang lebih kecil dari Q1 adalah 25% dan yang lebih
      besar dari Q1 adalah 75%.
              Kuartil 2 (Q2) sama dengan median yang merupakan nilai pembatas 50% data
      disebelah kiri Q2 dan 50% data disebelah kanan Q2.
              Kuartil 3 (Q3) adalah nilai data yang menyekat kumpulan data yang telah
      diurutkan sehingga banyaknya data yang lebih kecil dari Q3 adalah 75% dan yang lebih
      besar dari Q3 adalah 25%.
              Langkah-langkah perhitungan yang dapat digunakan sebagai pedoman dalam
      menentukan nilai-nilai kuartil adalah sebagai berikut:
       Urutkan data mulai data amatan terkecil sampi data amatan yang terbesar.
       Hitung posisi kuartil 2 (nq2), caranya sama dengan perhitungan posisi median, nq2 =
          (n+1)/2
       Jika posisi kuartil 2 bernilai bulat maka kuartil 2 adalah X(n+1)/2 sedangkan jika
          bernilai pecahan maka kuartil 2 adalah rata-rata dari Xn/2 dan X(n/2+1)
       Hitung posisi kuartil 1 dan 3 dengan menggunakan rumus berikut:
          nq1 = (posisi kuartil 2 terpangkas +1)/2 = (nq2+1) = nq3
       Penetapan nilai kuartil 1 dan 3 prinsipnya sama dengan penentuan kuartil 2. Nilai
          kuartil 1 posisi dihitung mulai pengamatan terkecil sedangkan nilai kuartil 3
          dihitung dari pengamatan terbesar.

     b) Ukuran Penyebaran
            Ukuran penyebaran data memberikan gambaran seberapa besar data menyebar
     dalam kumpulannya. Dengan ukuran penyebaran kita dapat melihat seberapa jauh data-
     data menyebar dari titik pemusatannya.
            Ukuran penyebaran yang sering digunakan antara lain:
      1. Wilayah (Range)
               Ukuran penyebaran data yang paling sederhana adalah mencari selisih
      pengamatan terkecil dengan pengamatan terbesar.
                                   W = xmax - xmin
      Ukuran ini cukup baik digunakan untuk mengukur penyebaran data yang simetrik dan
      nilai pengamatannya menyebar merata. Tetapi ukuran ini akan menjadi tidak relevan
      jika nilai pengamatan maksimum dan minimum merupakan data-data ekstrem.

      2. Jangkauan antar Kuartil (Inter Quartil Range)
              Jangkauan antar kuartil mengukur penyebaran 50% data ditengah-tengah
      setelah data diurut. Ukuran penyebaran ini merupakan ukuran penyebaran data yang
      terpangkas 25% yaitu dengan membuang 25% data terbesar dan 25% data terkecil.


Modul SPSS                                                                                 -8-
Bambang Ruswandi, M.Stat
                                                                                              Statistika
       Ukuran ini sangat baik digunakan jika data yang dikumpulkan banyak mengandung data
       pencilan. Jangkauan antar kuartil dihitung dari selisih antara kuartil 3 (Q3) dengan
       kuartil 1 (Q1), atau dapat dirumuskan sebagai berikut:
                                        `Jak = Q3 – Q1
       3. Ragam (Variance)
              Ukuran penyebaran data yang paling sering digunakan adalah ragam. Ragam
       merupakan ukuran penyebaran data yang mengukur rata-rata jarak kuadrat semua titik
       pengamatan terhadap titik pusat (rataan). Apabila x1,x2, …,xn adalah anggota suatu
       populasi terhingga berukuran N, maka ragam populasinya adalah:
                                                         N

                                                        ( Xi  )
                                          2       1                   2
                                                  N
                                                         i 1
       dan apabila x1,x2, …,xn adalah anggota suatu contoh berukuran N, maka ragam contoh
       tersebut adalah :
                                                   n
                                   s2     1
                                          n 1     ( Xi  X )
                                                  i 1
                                                                  2



       Akar dari ragam dikenal dengan simpangan baku yang dinotasikan dengan, sedangkan
       simpangan baku contoh dila,bangkan dengan s.

Contoh :
Pada suatu pengumpulan data dengan menarik contoh dari suatu populasi didapat data setelah
diurutkan sebagai berikut
               7.8910        8.7619                8.8901                 9.1033    9.8530
               9.8728        10.0135               10.3151                10.3221   10.8333
               11.0250       11.5518               11.9744                12.3591   12.7180
Dari data tersebut kita dapat menentukan ukuran-ukuran pemusatan maupun ukuran
penyebarannya.
1. Median, merupakan data yang tepat di tengah-tengah dan dalam kasus ini adalah 10.315.
2. Modus, merupakan data yang frekuensi kemunculannya paling tinggi dan dalam kasus ini
    semua data hanya muncul sekali.
3. Kuartil 1, data yang menyekat data lain sehingga data-data dibawahnya sebanyak 25%.
    Dalam kasus ini kuartil 1 adalah 9.1033.
4. Kuartil 3, data yang menyekat data lain sehingga data-data diatasnya sebanyak 25%. Dalam
    kasus ini kuartil 3 adalah 11.5518.
5. Rataan = (7.8910 + 8.7619 + 8.8901 + … + 12.7180)/15 = 10.366
6. Range = Xn – X1 = 12.7180 – 7.8910 = 4.8270.
7. Jangkauan = Q3 – Q1 = 11.5518 – 9.1033 = 2.4485.
8. Ragam, dalam kasus ini data merupakan data contoh sehingga rumus ragam yang digunakan
    adalah:
    s2 = [(7.8910 – 10.366)2 + (8.7619 – 10.366)2 + … + (12.7180 – 10.366)2]/14
  = 1.946.

Pada modul SPSS ini, statistik deskripsi yang akan dibahas yaitu:
1. Frekuensi
2. Deskripsi
3. Crosstab




Modul SPSS                                                                                          -9-
Bambang Ruswandi, M.Stat
                                                                                       Statistika
FREQUENCIES
        Prosedur Frequencies ini bertujuan untuk menampilkan tabel distribusi frekuensi dan
chart frekuensi. Pada tabel frekuensi ditampilkan nilai-nilai percentile, ukuran dispersi (ukuran
penyebaran data), tendensi sentral (ukuran pusat data) dan distribusi data. Sedangkan chart
frekuensi berupa histogram dan bar chart (diagram batang).

Contoh :
Data yang digunakan adalah data Cars.sav yang ada pada SPSS. Variabel yang digunakan adalah
Weight (Vehicle Weight) dan Origin (Country of Origin).
Tabel Frekuensi untuk Vehicle Weight
Oleh karena weight termasuk data kuantitatif maka akan dibuat tabel frekuensi serta statistika
deskriptif. Selain itu akan dilengkapi juga dengan chart frekuensi yang sesuai yaitu histogram.
Langkah-langkah :
1. Untuk menjalankan prosedur ini dari menu dipilih :
       Analyze → Descriptive Statistics → Frequencies…
Akan muncul kotak dialog berikut




Pindahkan satu atau lebih variabel yang akan dibuat tabel dan chart frekuensinya ke dalam
kotak Variable(s).
Dalam contoh soal ini, pindahkan variabel Weight ke dalam kotak Variable(s). Jika anda ingin
mencari frekuensi lebih dari 1 variabel, pindahkan variabel-variabel yang akan diselidiki ke
dalam kotak tersebut.
2. Klik tombol Statistics, akan muncul kotak dialog berikut :




Modul SPSS                                                                                  - 10 -
Bambang Ruswandi, M.Stat
                                                                                     Statistika

Pada kotak dialog tersebut terdapat beberapa statistik yang dapat dipilih sesuai keperluan yang
akan ditampilkan pada tabel frekensi.
Pada kotak Percentile Value, dapat dipilih satu atau lebih alternatif berikut :
    Quartiles; menampilkan persentil ke-25, 50 dan 75
    Cut points for n equal groups; menampilkan nilai-nilai persentil yang membagi sampel
      data ke dalam grup-grup case yang berukuran sama. Masukkan bilangan bualt antara 2
      s/d 100 ke text box yang tersedia ( default 10 grup) untuk menentukan banyaknya grup.
    Percentile(s) ; menempilkan persentil sesuai dengan yang ditentukan user. Masukkan
      bilangan bulat antara 0 hingga 100 pada text box yang tersedia
Pada kotak Dispersion dapat dipilih satu atau lebih alternatif berikut :
   Std. Deviation; menampilkan standar deviasi
   Variance; menampilkan variansi yaitu hasil kuadrat dari standar deviasi
   Range; menampilkan jangkauan dari nilai data (nilai terbesar dikurangi nilai terkecil )
   Minimum; menampilkan nilai data terkecil
   Maximum; menampilkan nilai data terbesar
   SE Mean; menampilkan error standar yaitu ukuran variabilitas dari mean sampel.
Pada kotak Central Tendency, dapat dipilih satu atau lebih alternatif berikut :
   Mean; menampilkan nilai rata-rata data
   Median; menampilkan nilai tengah data
   Modus; menampilkan modus atau nilai yang paling sering muncul
   Sum; menampilkan jumlah dari semua data
Pada kotak Distribution, dapat dipilih satu atau lebih alternatif berikut :
   Skewness; menampilkan derajat kemiringan beserta erorr standarnya
   Kurtosis; menampilkan kurtosis beserta error standarnya

3. Tombol selanjutnya adalah Chart. Tombol digunakan bila kita ingin menampilkan chart
   frekuensi.
    Klik Chart akan tampil kotak dialog berikut :




  Pada kotak chart type dapat dipilih salah satu alternatif berikut :
   None; tidak menampilkan chart, pilihan ini merupakan default
   Bar chart(s); menampilkan chart berbentuk batang (bar)
   Histogram(s); menampilkan histogram dari variabel-variabel numerik
   With normal curve; melengkapi histogram dengan kurva normal
Kotak Chart Values menghasilkan nilai yang akan ditampilkan pada Chart. Nilai ini dapat berupa
jumlah (frequencies) atau persentase (percentages).
Klik Continue
4. Klik OK untuk menjalankan seluruh prosedur

Modul SPSS                                                                                - 11 -
Bambang Ruswandi, M.Stat
                                                                                    Statistika
Output Frequencies
Frequencies
                                               Statistics

                     Vehicle Weight (lbs. )
                     N                         Valid                          406
                                               Missing                          0
                     Mean                                                2969,56
                     St d. Error of Mean                                  42,176
                     Median                                              2811,00
                     Mode                                                   1985a
                     St d. Dev iation                                    849,827
                     Variance                                           722206,2
                     Skewness                                                ,468
                     St d. Error of Skewness                                 ,121
                     Kurtosis                                               -,752
                     St d. Error of Kurtosis                                 ,242
                     Range                                                  4408
                     Minimum                                                  732
                     Maximum                                                5140
                     Sum                                                 1205642
                     Percent iles              10                        1985,00
                                               25                        2222,25
                                               50                        2811,00
                                               75                        3614,75
                                               90                        4262,10
                       a. Multiple modes exist. The smallest v alue is shown

Analisis
Tabel Statistics
 N atau jumlah data yang valid adalah 406 sedangkan data yang missing tidak ada.
 Mean atau rata-rata berat kendaraan adalah 2969.56 lbs dengan standar error adalah
   42.176 lbs. Standar error ini digunakan untuk memperkirakan rata-rata populasi melalui
   interval kepercayaan. Misalkan tingkat kepercayaan adalah 95% maka rata-rata populasi
   akan berada pada
   Rata-rata  2 standar error of mean
   Yaitu 2969.56  (2 x 42.176) = 2885.208 lbs sampai 3053.912 lbs
 Median atau titik tengah data diperoleh jika semua data diurutkan dan dibagi dua sama
   besar. Untuk masalah ini median adalah 2811 yang berarti bahwa 50 % data mempunyai
   berat mobil kurang dari 2811 dan 50%nya lagi lebih dari 2811
 Mode menyatakan nilai yang paling sering muncul (frekuensinya tertinggi). Untuk masalah
   ini ternyata terdapat beberapa nilai yang frekuensi kemunculannya sama. Jika terjadi hal
   seperti in maka SPSS akan menampilkan nilai ynag paling kecil, dalam hal ini adalah 1985.
 Standar deviasi adalah 849.827 lbs dan variansi 722.206.2 lbs2. Standar deviasi digunakan
   untuk menilai penyebaran data terhadap rata-rata sampel.
 Ukuran skewness adalah 0.468. Untuk mengatakan data berdistribus normal dapat
   dilakukan dengan mencari rasio skewness yaitu skewness/standard error of skewness yaitu
   3.868. Sebagai patokan adalah jika nilai rasio berada antara –2 dan 2 maka data
   berdistribusi normal. Oleh karena untuk masalah ini, nilai rasio skewness > 2 maka
   distribusi dari sampel mobil ini tidak berdistribusi normal.
 Ukuran kurtosis adalah -0.752. Untuk mengatakan data berdistribus normal dapat dilakukan
   dengan mencari rasio kurtosis yaitu kurtosis/standard error of kurtosis yaitu –3.107.
   Sebagai patokan adalah jika nilai rasio berada antara –2 dan 2 maka data berdistribusi


Modul SPSS                                                                               - 12 -
Bambang Ruswandi, M.Stat
                                                                                             Statistika
    normal. Oleh karena untuk masalah ini, nilai rasio kurtosis < -2 maka distribusi dari sampel
    mobil ini tidak berdistribusi normal.
   Data minimum adalah 732 dan maksimum adalah 5140
   Range adalah selisih nilai maksimum dengan minimum yaitu 4408




                                   Gambar Chart Histogram
Pada output ini ditampilkan chart dari data berdasarkan frekuensinya yang secara sepintas
terlihat tidak mengikuti distribusi normal. Untuk pengujian lebih lanjut tentang normalitas
dapat dilihat pada bagian explore

Tabel Frekuensi untuk Country of origin
Melalui contoh ini, akan dicari frekuensi masing-masing negara pada file tersebut. Karena
variabel origin merupakan variabel kualitatif maka tidak perlu ditampilkan statistika deskriptif
seperti mean, variansi, dsb. Adapun chart yang sesuai adalah bar chart atau pie chart.
Langkah-langkah yang dilakukan sama seperti variabel weight tetapi tidak ada pilihan untuk
statistics. Sedangkan dibagian chart pilih bar chart atau pie chart.
Output Frequencies
                                          Country of Origin

                                                                              Cumulat iv e
                                     Frequency   Percent      Valid Percent    Percent
                Valid     American         253       62.3              62.5          62.5
                          European          73       18.0              18.0          80.5
                          Japanese          79       19.5              19.5        100.0
                          Total            405       99.8             100.0
                Missing   Sy stem            1         .2
                Total                      406      100.0


Tabel ini menampilkan frekuensi dari masing-masing negara. Ada 3 negara pada variabel Origin
yaitu American, European dan Japanese. Tabel ini menampilkan jumlah pengamatan tiap-tiap
negara dalam bentuk frekuensi dan persentase.




Modul SPSS                                                                                        - 13 -
Bambang Ruswandi, M.Stat
                                                                                     Statistika




Output ini menampilkan chart frekuensi berupa grafik batang (bar chart)

DESCRIPTIVES

       Prosedur descriptives pada SPSS bertujuan untuk menampilkan statistik deskriptif dari
variabel numerik.
Contoh :
Data yang digunakan adalah data Cars.sav yang ada pada SPSS. Variabel yang digunakan adalah
horse (horse power).
Prosedur SPSS
   1. Untuk menjalankan prosedur ini, dari menu dipilih :
               Analyze → Descriptive Statistics → Descriptives…
       Akan muncul tampilan berikut :




       Seluruh variabel pada file data akan ditampilkan pada kotak daftar variabel. Pindahkan
       satu atau lebih variabel numerik ke kotak Variable(s).
       Terlihat di bagian kiri bawah terdapat save standardized values as variable, yang jika
       dipilih akan muncul satu variabel baru pada data editor SPSS yaitu nilai z dari variabel
       asal.

   2. Klik Options pada kotak dialog Descriptives, maka akan ditampilkan kotak dialog
      berikut.




Modul SPSS                                                                                - 14 -
Bambang Ruswandi, M.Stat
                                                                                                Statistika




Terdapat beberapa pilihan statistik yang ditampilkan seperti Mean, Sum, Dispersion (ukuran
penyebaran), Distribution (kemiringan dan kurtosis) serta Display Order (cara pengurutan
tabel pada output).
   3. Klik OK untuk menjalankan seluruh prosedur

Output SPSS
                                          Descriptive Statistics

                                N           Minimum     Maximum    Mean      St d. Dev iation
           Horsepower               400           46         230    104.83            38.52
           Valid N (listwise)       400


Output dari tabel ini meliputi statistika deskriptif seperti mean, minimum, maksimum, standar
deviasi yang telah dibahas pada bagian sebelumnya.


CROSSTAB (TABULASI SILANG)

        Prosedur Crosstab digunakan untuk membuat tabel yang memuat jumlah case yang
merupakan hasil kombinasi-kombinasi dari kategori-kategori yang dimiliki dua atau lebih
variabel. Crosstab juga bertujuan untuk melihat hubungan antara dua buah variabel kategori.
Data yang digunakan adalah data dengan tipe kategori. Uji statistik dapat diminta untuk
menentukan apakah ada hubungan antar variabel dalam tabel, dan jika ada kekuatan hubungan
dapat ditaksir.
        Contoh kasus yang menggunakan analisis Crosstab yaitu melihat hubungan antara status
sosial ekonomi dengan tingkat pendidikan pada database employee.sav yang terdapat dalam
SPSS.

Prosedur Crosstab
       Data yang digunakan dalam contoh kasus kali ini adalah data employee.sav. yang
terdapat dalam SPSS. Disini kita akan melihat hubungan antara Jenis Pekerjaan (Employment
Category) dengan Jenis Kelamin (Gender)

Langkah-langkah prosedur Crosstab yang dilakukan adalah :
1. Bukalah terlebih dahulu file data anda, yaitu OpenData employee.sav
2. Dari menu utama klik Analyze  Descriptive statistics  Crosstabs…



Modul SPSS                                                                                           - 15 -
Bambang Ruswandi, M.Stat
                                                                                    Statistika
  Spesifikasi minimum untuk crosstab adalah satu variabel baris dan satu variabel kolom.
  Tidak ada aturan untuk meletakkan variabel pada baris atau pada kolom (yang terpenting
  adalah bagaimana persentase dihitung).
  Kotak dialog yang akan tampil adalah sebagai berikut:




3. Pindahkan variabel Employee Category (jobcat) pada kotak Row(s)
4. Pindahkan variabel Gender pada kotak Column(s)
   Maksud dari pembuatan tabel crosstab adalah untuk mengkaji hubungan antara dua variabel.
   Apakah antara Jobcat dan Gender terdapat hubungan ? jika ya, bagaimana ?
   Beberapa hitungan persentase dapat ditumbuhkan pada tabel untuk mengetahui distribusi
   kasus. Persentase yang biasa digunakan adalah persentase baris atau kolom. Dalam kasus ini
   misalkan kita tertarik untuk mengetahui bagaimana jenis kerja berpengaruh terhadap jenis
   kelamin. Maka kita meminta persentase baris berdasarkan jobcat.
5. Klik pada tombol Cells…
   Pilih Observed pada kotak Counts dan Rows pada kotak percentages




   kemudian Klik Continue.
6. Mengetahui dua variabel saling bebas secara statistik atau mempunyai hubungan, tidak
   hanya berdasarkan hasil perhitungan jumlah dan persentase. Prosedur crosstab
   menghasilkan statistik yang digunakan untuk menguji adanya hubungan tersebut dan yang
   biasa digunakan adalah uji kebebasan Chi-Square.
     Klik tombol Statistics
     Klik Chi-squares untuk meminta uji tersebut.




Modul SPSS                                                                               - 16 -
Bambang Ruswandi, M.Stat
                                                                                                Statistika




     Klik Continue
7. Analisa Output dari SPSS tersebut.
                             Employment Category * Gender Crosstabulation

                                                                    Gender
                                                               Female      Male       Total
             Employ ment   Clerical    Count                      206         157         363
             Category                  % wit hin Employ ment
                                                                 56.7%      43.3%     100.0%
                                       Category
                           Custodial   Count                          0         27        27
                                       % wit hin Employ ment
                                                                   .0%     100.0%     100.0%
                                       Category
                           Manager     Count                          10        74        84
                                       % wit hin Employ ment
                                                                 11.9%      88.1%     100.0%
                                       Category
             Total                     Count                       216        258         474
                                       % wit hin Employ ment
                                                                 45.6%      54.4%     100.0%
                                       Category

Terlihat bahwa untuk clerical lebih banyak pada female, untuk Custodial tak ada satupun female
sedangkan untuk manager lebih banyak pada Male. Sehingga terdapat kecenderungan bahwa
untuk custodial dan manager lebih banyak didominasi oleh male.
                                               Chi-Square Tests

                                                                           Asy mp. Sig.
                                                   Value         df         (2-sided)
                       Pearson Chi-Square           79.277a            2           .000
                       Likelihood Ratio             95.463             2           .000
                       N of Valid Cases                474
                           a. 0 cells (.0%) hav e expect ed count less than 5. The
                              minimum expected count is 12.30.

Output ini menampilkan uji chi square untuk mengamati ada tidaknya hubungan antara dua
variabel kategorik (baris dan kokom).
Hipotesis untuk pengujian ini adalah:
H0 : Tidak ada hubungan antara baris dan kolom, dalam hal ini tidak ada hubungan antara jobcat
       dan gender
H1 : Terdapat hubungan antara baris dan kolom, dalam hal ini terdapat hubungan antara jobcat
       dan gender
Aturan keputusan untuk hipotesis ini adalah H0 ditolak jika sig < 0.05
Keputusan : Terlihat bahwa pada kolom Asymp. Sig adalah 0.000 < 0.05 maka H0 ditolak
Kesimpulan : Terdapat hubungan antara gender dengan jobcat.

Modul SPSS                                                                                           - 17 -
Bambang Ruswandi, M.Stat
                                                                                                                       Statistika
Menambahkan Layer
        Prosedur Crosstab mempunyai satu variabel pada baris dan satu pada kolom. SPSS
menyediakan fasilitas mengikutsertakan variabel ketiga sebagai kontrol untuk membuat
pemisah dari nilai yang ada. Variabel ini disebut layer dan digunakan dalam analisis apabila
hubungan tersebut berbeda antar nilai yang ada pada variabel kontrol.
        Dalam studi kasus di atas, diperkirakan bahwa hubungan antara Employment Catagory
dan Gender mungkin berbeda antara orang yang berkulit putih (yes) dan bukan putih (no).
Dalam hal ini perlu ditambahkan satu variabel baru yaitu Minority (minority Classification)
sebagai variabel layer.
         Lakukan hal yang sama seperti di atas dengan penambahan variabel Minority
Classification (minority) dipindahkan pada kotak Layer.

Sehingga didapatkan output sebagai berikut :
                           Employment Category * Gender * Mi nority Classifi cation Crosstabulation

                                                                                          Gender
             Minorit y Classif icat ion                                             Female       Male       Total
             No                           Employ ment    Clerical      Count            166         110         276
                                          Category                     % of Total     44,9%       29,7%      74,6%
                                                         Custodial     Count                          14          14
                                                                       % of Total                  3,8%       3,8%
                                                         Manager       Count              10          70          80
                                                                       % of Total      2,7%       18,9%      21,6%
                                          Total                        Count            176         194         370
                                                                       % of Total     47,6%       52,4%     100,0%
             Y es                         Employ ment    Clerical      Count              40          47          87
                                          Category                     % of Total     38,5%       45,2%      83,7%
                                                         Custodial     Count                          13          13
                                                                       % of Total                 12,5%      12,5%
                                                         Manager       Count                           4           4
                                                                       % of Total                  3,8%       3,8%
                                          Total                        Count              40          64        104
                                                                       % of Total     38,5%       61,5%     100,0%

Output ini menampilkan tabulasi silang antara jobcat dan gender dengan minority sebagai layer.
Perhatikan bahwa untuk setiap kategori dari variabel kontrol akan ditampilkan tabulasi silang
antara jobcat dan gender. Selebihnya interpretasikan seperti pada bagian sebelumnya.
                                                         Chi-Square Tests

                                                                                                      Asy mp.
                                                                                                        Sig.
                    Minorit y Classif icat ion                               Value         df        (2-sided)
                    No                            Pearson Chi-Square          69,651a           2          ,000
                                                  Likelihood Ratio            80,594            2          ,000
                                                  N of Valid Cases               370
                    Y es                          Pearson Chi-Square          12,701b           2          ,002
                                                  Likelihood Ratio            18,542            2          ,000
                                                  N of Valid Cases               104
                       a. 0 cells (,0%) hav e expected count less than 5. The minimum expected count is
                          6,66.
                       b. 2 cells (33,3%) hav e expect ed count less than 5. The minimum expected
                          count is 1,54.



Terlihat pada tabel diatas bahwa hubungan Jobcat dan Gender bervariasi berdasarkan Minority
Classification. Hal ini lebih jelas dilihat pada oputput statistik chi-square pada tabel berikut ini
yang kesemuanya signifikan, yaitu 0,000 untuk katagori minotiry “no” dan 0.002 untuk kategori
minority “yes”.




Modul SPSS                                                                                                                  - 18 -
Bambang Ruswandi, M.Stat
                                                                                       Statistika

                                            BAB III
                                            GRAFIK

3.1       PENDAHULUAN
      Dalam membuat laporan atau deskripsi data, sering kali lebih menarik dan informatif jika
laporan atau data tersebut ditampilkan dalam bentuk gambar. Dalam SPSS tersedia fasilitas
untuk membuat berbagai macam bentuk tampilan grafik yang menarik melalui prosedur
GRAPH. Anda juga dapat mengedit tampilan sesuai dengan kebutuhan melalui fasilitas pivot
dalam output editor.
Menu Graph menyediakan banyak pilihan, yaitu : Gallery, Interactive, Bar, Line, Area, Pie,
Highlow, Pareto, Control,Boxplot. Error Bar, Scatter, Histogram, PP, QQ, Sequencee, ROC Curve
dan Time Series.
      Dalam modul SPSS ini akan dibahas mengenai Gallery, Interactive, Bar, Line, Area, Pie,
Scatter dan Histogram saja. Grafik-grafik lainnya berkaitan dengan analisis statistik tingkat
lanjut.

3.2       MEMBUAT GRAFIK/CHART
     Data yang digunakan dalam modul graph ini adalah data Employee.Sav yang tersedia
dalam SPSS. Setelah file data siap, anda dapat langsung menggunakan prosedur graph untuk
membuat grafik.
     Pilih Graph dalam menu utama SPSS. Akan muncul dalam tampilan layar sebagai berikut :

1. Chart Builder
2. Legacy Dialog ; Pilihan ini berarti keterangan mengenai seluruh chart yang dapat dibuat
   melalui prosedur graph .
3. Interactive
   Dalam pilihan ini terdapat berbagai pilihan lain seperti bar, dot, line, ribbon dan lain-lain.

a. Bar ; Menghasilkan grafik batang
    Click interactive Bar…
    Pindahkan variabel sosek kedalam kotak axis (lihat gambar)




          Click OK untuk menjalankan prosedur.
Tampilan output dapat dimodifikasi sesuai keinginan anda.
Output grafik batang ditampilkan pada gambar :




Modul SPSS                                                                                  - 19 -
Bambang Ruswandi, M.Stat
                                                                              Statistika




b. Dot ; menghasilkan grafik titik/dot. Dengan prosedur yang sama, masukkan variabel
   Beginning Salary akan dihasilkan output sebagai berikut :




c. Line ; menghasilkan grafik garis, masukkan variabel current salary




d. Pie, Masukan variabel Jobcat, grafik yang dihasilkan dalam bentuk diagram lingkaran,
   seperti dalam gambar sebagai berikut :




Modul SPSS                                                                         - 20 -
Bambang Ruswandi, M.Stat
                                                                                    Statistika


Pilihan lain pada menu graph seperti Bar, Line, Area, dan lain - lain menghasilkan output yang
sama dengan pilihan interactive.. Perbedaannya pada pilihan Interactive fasilitas untuk
membuat grafik tampak lebih informatif dan lengkap.

3.3 MENGEDIT OUTPUT

1. Chart/Graph.
Output yang dihasilkan seperti pada tampilan gambar-gambar di atas dapat dimodifikasi sesuai
dengan kebutuhan yang di inginkan. Akan dijelaskan bagaimana cara mengedit output dalam
bentuk grafik batang. Sedangkan untuk jenis grafik lainnya dimodifikasi dengan menggunakan
prosedur yang sama. Data yang digunakan untuk contoh mengedit graph adalah data : GSS93
SUBSET. Terlebih dahulu buat bar chart dengan variabel Age Categories (Agecat4) sebagai
variabel yang akan diperhatikan.
Letakkan kursor pada tampilan output editor, double click pada output tersebut. Maka akan
muncul tampilan sebagai berikut :




Modul SPSS                                                                               - 21 -
Bambang Ruswandi, M.Stat
                                                                                    Statistika

                                          BAB IV
                                  STATISTIKA INFERENSIA

4.1   Peubah Acak

              Peubah acak merupakan suatu fungsi yang memetakan ruang kejadian (daerah
      fungsi) ke ruang bilangan riil (wilayah fungsi). Fungsi peubah acak merupakan suatu
      langkah dalam statistika untuk mengkuantifikasikan kejadian-kejadian alam. Pendefinisian
      fungsi peubah acak harus mampu memetakan setiap kejadian dengan tepat ke satu
      bilangan riil.
              Sebagai ilustrasi dalam percobaan pelemparan sebuah dadu bersisi enam yang
      seimbang. Ruang kejadiannya dapat disenaraikan sebagai berikut:
                                         R = {S1,S2,S3,S4,S5,S6}
              Dari percobaan ini dapat didefinisikan beberapa peubah acak yang mampu
      memetakan kejadian-kejadiannya ke dalam bilangan riil. Salah satu peubah acak yang
      dapat dibuat adalah:
              X = munculnya sisi dadu yang bermata genap
               = {0,1}
              Dengan demikian jika muncul sisi ganjil (S1,S3,S5) akan dipetakan ke nilai nol
      sedangkan jika muncul sisi genap (S2,S4,S6) akan dipetakan ke nilai satu.
                Pemetaan fungsi X dapat digambarkan sebagai berikut:
                Daerah Fungsi                                        Wilayah Fungsi


                           S1 .
                           S2 .
                           S3 .                                     .0
                           S4 .                                     .1
                           S5 .
                           S6 .
                                    Gambar Pemetaan fungsi

            Sebaran peluang dari peubah acak mengikuti sebaran peluang setiap kejadian. Jika
     terdapat beberapa kejadian dipetakan ke bilangan yang sama maka peluang dari nilai
     peubah acak tersebut adalah total peluang dari kejadian-kejadian tersebut. Dari kasus
     tersebut di atas adalah sebagai berikut:
                               Tabel 3.1 Peluang pelemparan dadu
                                                  Sisi yang muncul
                           S1         S2         S3          S4      S5           S6
  Peluang kejadian        1/6        1/6        1/6         1/6     1/6          1/6
          X                0           1          0          1       0            1

      Sehingga sebaran peubah acak X dapat dijabarkan sebagai berikut:
             p(x=0) = p(S1)+ p(S3)+ p(S5) = 1/6 + 1/6 + 1/6 = 3/6 = 0.5
             p(x=1) = p(S2)+ p(S4)+ p(S6) = 1/6 + 1/6 + 1/6 = 3/6 = 0.5
      Beberapa kaidah sebaran peluang, yaitu:
      a. 0  p(x1)  1, untuk i=1,2,…,n
            n
      b.    p( Xi )  1
           i 1
      c. p(A1+ A2+…+ Am) = p(A1)+ p(A2)+…+ p(Am), jika A1, A2,…,Am merupakan kejadian-
         kejadian yang terpisah.



Modul SPSS                                                                               - 22 -
Bambang Ruswandi, M.Stat
                                                                                       Statistika
      Suatu fungsi dikatakan sebagai fungsi peluang maka fungsi tersebut haruslah memenuhi
      ketiga kaidah peluang di atas.

4.2   Sebaran Peluang Populasi
             Sebaran peluang dalam analisis statistika menjadi sangat penting. Dengan
      diketahuinya sebaran peluang pada suatu populasi pengamatan, seorang peneliti akan
      dapat dengan mudah untuk melakukan inferensia. Secara garis besar, sebaran peluang
      populasi dapat dibedakan atas sebaran diskret dan kontinu.
             Sebaran diskret adalah fungsi peluang dari peubah-peubah acak diskret, seperti
      Bernoulli dan Binomial. Sedangkan sebaran kontinu adalah fungsi peluang peubah-
      peubah acak kontinu, antara lain Seragam dan Normal.

4.3   Pengujian Hipotesis
          Dalam statistika, pengujian hipotesis merupakan bagian terpenting untuk mengambil
      keputusan. Dengan melakukan pengujian hipotesis seorang peneliti akan dapat menjawab
      pertanyaan-pertanyaan yang diajukannya dengan menyatakan penolakan atau
      penerimaan terhadap hipotesis.
              Hipotesis adalah jawaban sementara sebelum percobaan dilaksanakan yang
      didasarkan pada hasil studi literatur. Hipotesis biasanya memuat pernyataan-pernyataan
      yang bersifat netral atau hal yang umum terjadi. Kebenaran hipotesis secara pasti tidak
      pernah diketahui kecuali jika dilakukan pengamatan terhadap seluruh anggota populasi.
      Untuk melakukan hal ini sangatlah tidak efisien apalagi bila ukuran populasinya sangat
      besar.
              Penarikan sejumlah contoh acak dari suatu populasi, diamati karakteristiknya dan
      kemudian dibandingkan dengan hipotesis yang diajukan merupakan suatu langkah
      melakukan uji hipotesis. Apabila contoh acak ini memberikan indikasi atau petunjuk yang
      mendukung hipotesis yang diajukan maka hipotesis tersebut diterima, sedangkan bila
      contoh acak itu memberikan indikasi yang bertentangan dengan hipotesis yang diajukan,
      maka hipotesis tersebut ditolak.
              Pengertian diterima atau ditolaknya suatu hipotesis tidak bersifat mutlak. Suatu
      hipotesis ditolak tidak berarti bahwa hipotesis tersebut salah, melainkan data telah
      memberikan petunjuk bahwa telah ada perubahan pada karakteristik populasi yang
      dihipotesiskan, sedangkan penerimaan terhadap sebuah hipotesis berarti belum cukup
      bukti untuk menerima hipotesis tandingannya.
              Hipotesis statistik dibedakan menjadi dua yaitu hipotesis nol (H0) dan hipotesis
      tandingan (H1). Pernyataan yang ingin ditolak kebenarannya ditetapkan sebagai hipotesis
      nol sedangkan pernyataan lawannya ditetapkan sebagai hipotesis tandingan.
              Dalam pengujian hipotesis dikenal dua jenis kesalahan yaitu kesalahan jenis I (type
      I error) dan kesalahan jenis II (type II error). Kesalahan jenis I adalah kesalahan yang
      terjadi akibat menolak H0 padahal H0 benar, sedangkan kesalahan jenis II adalah kesalahan
      yang terjadi akibat menerima H0 padahal H1 benar.
              Peluang terjadinya kesalahan jenis I dilambangkan sebagai  (alpha) yang sering
      juga disebut sebagai taraf nyata (level of significance). Sedangkan peluang terjadinya
      kesalahan jenis II dilambangkan dengan  (beta). Dalam pengujian hipotesis statistik
      diharapkan kedua besaran kesalahan tersebut berimbang dan disesuaikan dengan
      permasalahan yang dihadapi. Peluang 1- disebut tingkat kepercayaan (confidence
      interval) yang menyatakan peluang menerima H0 dan H0 memang benar, sedangkan
      peluang 1- disebut kuasa pengujian (power of test) yang menyatakan peluang menolak H0
      dan H0 memang salah.




Modul SPSS                                                                                  - 23 -
Bambang Ruswandi, M.Stat
                                                                                      Statistika
     Jenis Kesalahan :

                                                       Hipotesis
         Keputusan
                                     H0 benar                           H0 salah
                                  Keputusan tepat                   Kesalahan jenis II
          Terima H0
                                      (1-)                               ()
                                  Kesalahan jenis I                 Keputusan tepat
          Tolak H0
                                        ()                              (1-)


   Pada modul SPSS ini, yang akan dibahas yaitu:
   1. Uji Normalitas dengan Uji Kolmogorov-Smirnov
   2. Paired Sample T-Test.
   3. One Sample T-Test.
   4. Independent Sample T-Test.
   5. Uji T dengan Penggunaan Cut Point (Titik potong)
   6. One Way ANOVA

1) UJI NORMALITAS KOLMOGOROV-SMIRNOV
           Uji Kolmogorov-Smirnov satu sampel berguna untuk menguji apakah suatu sampel
   berasal dari suatu populasi dengan distribusi tertentu, terutama distribusi Normal, Uniform,
   Poisson dan Exponential. Uji ini bisa dipakai untuk uji keselarasan data yang berskala rasio,
   interval, minimal ordinal. Selain itu, digunakan untuk pengujian dengan tipe goodness of fit,
   yaitu berkaitan dengan derajat kesesuaian antara distribusi himpunan harga sampel dengan
   distribusi teoritis.
           Distribusi Normal memiliki fungsi densitas seperti lonceng terbalik yang simetris.
   Sekitar 68% nilai dari variasi normal jatuh pada 1 standar deviasi, 95% dalam 2 standar
   deviasi dan 99.7% dalam 3 standar deviasi.
   Contoh Kasus :
   Berikut adalah sampel berat sabun cuci yang diproduksi PT. Harum (dalam gram).
            Sabun ke          Berat                   Sabun ke           Berat
               1              200.1                      11              205.6
               2              200.3                      12              205.1
               3              203.4                      13              200.7
               4              204.5                      14              210.1
               5              200.5                      15              200.5
               6              201.6                      16              203.1
               7              204.6                      17              201.4
               8              207.1                      18              202.5
               9              200.7                      19              200.4
               10             204.4                      20              201.6
   Manager Produksi ingin mengetahui apakah data di atas berasal dari populasi yang
   berdistribusi normal ?
   1. Langkah-langkah pengolahan data dengan SPSS :
       Klik Analyze, kemudian pilih submenu Nonparametrik Tests. Dari serangkaian
         pilihan test, sesuai kasus pilih 1-Sample K-S maka tampak dilayar :




Modul SPSS                                                                                 - 24 -
Bambang Ruswandi, M.Stat
                                                                                               Statistika




        Test Variabele List atau variabel yang akan diuji. Oleh karena yang akan diuji hanya
         satu variabel, maka pindahkan variabel Berat.
        Kemudian klik OK untuk mengakhiri pengisian prosedur analisis

Penyelesaian :
                                          Descriptive Statistics

                             N           Mean         St d. Dev iation   Minimum    Maximum
                 BERAT            20    202,9100             2,68953       200,10     210,10

Tabel Descriptive Statistics memaparkan jumlah data (20), nilai rata-rata berat sabun (202.91),
nilai standar deviasi (2.68953) serta berat minimum (200.1) dan berat maksimum (210.1).
                                 One-Sample Kolmogorov-Smirnov Test

                                                                              BERAT
                     N                                                               20
                     Normal Parameters a,b       Mean                         202,9100
                                                 St d. Dev iation              2,68953
                     Most Ext reme               Absolute                          ,187
                     Dif f erences               Positiv e                         ,187
                                                 Negativ e                        -,148
                     Kolmogorov -Smirnov Z                                         ,836
                     Asy mp. Sig. (2-tailed)                                       ,487
                         a. Test distribution is Normal.
                         b. Calculated f rom dat a.


Hipotesis :
H0 : F(x) = F0(x), dengan F(x) adalah fungsi distribusi populasi yang diwakili oleh sampel, dan
      F0(x) adalah fungsi distribusi suatu populasi berdistribusi normal. Artinya data berat
      sabun adalah berdistribusi normal.
H1 : F(x) ≠ F0(x), data berat sabun tidak berdistribusi normal.
Pengambilan Keputusan : (berdasarkan probabilitas (prob))
 Jika Probabilitas > 0.05, maka H0 diterima
 Jika Probabilitas < 0.05, maka H0 ditolak.
Keputusan :
Terlihat bahwa pada kolom Asymp.Sig (2-tailed) adalah 0.487 atau probabilitas di atas 0.05
(0.487 > 0.05). Dengan demikian H0 diterima atau distribusi populasi berat sabun bisa dianggap
berdistribusi normal.


Modul SPSS                                                                                          - 25 -
Bambang Ruswandi, M.Stat
                                                                                      Statistika


2) PAIRED SAMPLE T-TEST (UJI MEAN UNTUK DUA SAMPEL YANG BERPASANGAN)
    Ada beberapa asumsi yang harus dipenuhi ketika kita akan melakukan pengujian ini yaitu :
          a. Dua sampel acak sederhana dan dependen
          b. Skala pengukuran sekurang-kurangnya interval
          c. Populasi berdistribusi normal dengan rata-rata  dan varians 2
    KASUS
    Untuk meningkatkan kemampuan para salesman dalam memasarkan roti, Manajer
    Pemasaran mengikut-sertakan 15 salesman pada sebuah pelatihan Wiraniaga. Setelah itu
    manajer pemasaran membandingkan kinerja penjualan roti sebelum dan sesudah
    mengikuti pelatihan, apakah ada peningkatan atau tidak, dengah hasil sebagai berikut.
      Salesman       Sebelum      Sesudah            Salesman     Sebelum      Sesudah
          1            525          554                   9         345          375
          2            550          550                  10         336          380
          3            560          587                  11         327          350
          4            450          489                  12         329          329
          5            400          450                  13         547          549
          6            435          435                  14         355          357
          7            450          445                  15         520          525
          8            445          490
     Dengan tingkat kepercayaan 95% dan tingkat signifikan α = 0.05, apakah ada perbedaan
     antara kinerja penjualan sebelum ikut pelatihan dengan sesudah ikut pelatihan tersebut ?
     1. Langkah-langkah pengolahan data dengan SPSS :
         Klik Analyze, kemudian pilih submenu Compare-Means. Dari serangkaian pilihan
            test, sesuai kasus pilih Paired-Samples T-Test, maka tampak dilayar :




            Paired Variable, atau variabel yang akan diuji. Oleh karena di sini akan diuji data
             sebelum dan sesudah, maka klik variabel sebelum dan sesudah sekali, maka akan
             terlihat pada kolom Current Selection di bawah terdapat keterangan untuk
             variabel 1 dan 2, kemidian klik tanda “>”, maka pada Paired Variabel terlihat tanda
             sebelum dan sesudah.
             Kemudian klik OK untuk mengakhiri pengisian prosedur analisis.




Modul SPSS                                                                                 - 26 -
Bambang Ruswandi, M.Stat
                                                                                                               Statistika
Analisis :
                                            Paired Samples Statisti cs

                                                                                           St d. Error
                                            Mean              N        St d. Dev iation       Mean
                   Pair       sebelum      438.2667               15         86.82286      22.41757
                   1          sesudah      457.6667               15         85.06944      21.96483

Output di atas menjelaskan deskriptif dari data kedua sampel. Untuk penjualan sebelum
pelatihan didapat rata-rata sebesar 438.2667 sedangkan penjualan sebelum pelatihan didapat
rata-rata sebesar 457.6667
                                           Paired Samples Correlations

                                                              N         Correlation         Sig.
                     Pair 1     sebelum & sesudah                 15           .974            .000

Pada bagian output Paired Samples Correlations menunjukkan hubungan atau korelasi antara
dua variabel yang diuji. Dari hasil pengujian diperoleh angka koefisien korelasi sebesar 0.974,
hal ini menunjukkan adanya korelasi yang sangat erat antara data sebelum pelatihan dan
sesudah pelatihan. Dengan nilai probabilitas sebesar 0.000 lebih kecil dari 0.05 (0.000 < 0.05)
maka dapat disimpulkan bahwa hubungan yang terjadi antar kedua variabel tersebut adalah
signifikan.
                                                   Paired Samples Test

                                             Paired Dif f erences
                                                                 95% Conf idence
                                                     St d.        Interv al of t he
                                       St d.        Error           Dif f erence
                              Mean   Dev iation     Mean         Lower        Upper         t         df   Sig. (2-tailed)
  Pair       sebelum -
                          -19.400       19.62797    5.06792       -30.270   -8.53039      -3.828      14             .002
  1          sesudah

Hipotesis :
H0 : tidak ada perbedaaan antara rata-rata penjualan sebelum dan sesudah pelatihan
H1 : terdapat perbedaaan antara rata-rata penjualan sebelum dan sesudah pelatihan

Pengambilan keputusan didasarkan atas dua metode :
1. Berdasarkan perbandingan nilai thitung dengan ttabel di mana µ1=µ2
       Jika |thitung| > ttabel, maka H0 ditolak
       Jika |thitung| < ttabel, maka H0 diterima
   Dari hasil pengolahan SPSS, diperoleh nilai thitung sebesar -3.828 dimutlakkan menjadi 3.828.
   Sedang ttabel bisa didapat pada tabel t-test, dengan α = 0.05, karena digunakan hipotesis dua
   arah, ketika mencari ttabel, nilai α dibagi dua menjadi 0.025, dan df = 14 (didapat dari rumus n-
   1, dimana n adalah jumlah data, 15-1=14). Didapat ttabel adalah 2.14.
   Keputusan : Oleh karena thitung > ttabel, (3.828 > 2.14), maka H0 ditolak, sehingga dapat
   disimpulkan bahwa terdapat perbedaaan antara rata-rata penjualan sebelum ikut pelatihan
   dan sesudah ikut pelatihan.
2. Berdasarkan nilai probabilitas dengan α = 0,05 :
      Jika probabilitas > 0,05 , maka H0 diterima
      Jika probabilitas < 0,05 , maka H0 ditolak
   Terlihat bahwa nilai probabilitas pada kolom Sig adalah 0.002 atau probabilitas di bawah
   0.05 (0.002 < 0.05). Dengan demikian H0 ditolak, sehingga mempunyai kesimpulan yang
   sama dengan uji t yaitu terdapat perbedaaan antara rata-rata penjualan sebelum ikut
   pelatihan dan sesudah ikut pelatihan.



Modul SPSS                                                                                                           - 27 -
Bambang Ruswandi, M.Stat
                                                                                          Statistika
3) ONE SAMPLE T TEST (UJI MEAN SATU SAMPEL)
    Pengujian satu sampel pada prinsipnya ingin menguji apakah suatu nilai tertentu (yang
    diberikan sebagai pembanding) berbeda secara nyata ataukah tidak dengan rata-rata
    sebuah sampel.
    Ada beberapa asumsi yang harus dipenuhi ketika kita akan melakukan pengujian ini yaitu :
    1. Sampel acak sederhana
    2. Skala pengukuran sekurang-kurangnya interval
    3. Tiap observasi saling bebas (independent)
    4. Populasi berdistribusi normal dengan rata-rata  dan varians 2
    Kasus :
    Waktu untuk memperbaiki sebuah alat elektronik adalah variabel random berdistribusi
    normal yang diukur dalam jam. 16 alat dipilih secara acak dan dicatat waktu perbaikannya
    (dalam jam) sebagai berikut :
                        Waktu Perbaikan                         Waktu Perbaikan
             No                                         No
                             (jam)                                  (jam)
              1               159                       9             222
              2               280                       10            363
              3               101                       11            168
              4               212                       12            250
              5               224                       13            149
              6               379                       14            260
              7               179                       15            485
              8               264                       16            170
    Apakah ada alasan untuk menyimpulkan bahwa rata-rata sebenarnya waktu perbaikan alat
    lebih besar dari 225 jam ? gunakan α = 0,05 dan tingkat kepercayaan 95%.
    1. Langkah-langkah pengolahan data dengan SPSS :
        Klik Analyze, kemudian pilih submenu Compare-Means. Dari serangkaian pilihan
         test, sesuai kasus pilih One-Samples T-Test, maka tampak dilayar :




            Test Variabel (s) atau variabel yang akan diuji. Oleh karena yang akan diuji waktu
             perbaikan, maka klik variabel waktu perbaikan kemudian klik tanda ‘>’.
            Test Value, karena akan diuji nilai hipotesis 225 jam, maka ketik 225.
            Kemudian klik OK untuk mengakhiri pengisian prosedur analisis.
Analisis :
                                    One-Sample Statistics

                                                                            St d. Error
                                    N         Mean       St d. Dev iation      Mean
                  waktu perbaikan       16     241.56            98.808         24.702

Output di atas menunjukan banyaknya data, N = 16 data, Rata-rata data sebesar 241.56,
simpangan baku data sebesar 98.808 dan Standar Error dari rata-rata sebesar 24.702.

Modul SPSS                                                                                     - 28 -
Bambang Ruswandi, M.Stat
                                                                                                       Statistika

                                              One-Sample Test

                                                        Test Value = 225
                                                                                  95% Conf idence
                                                                                   Interv al of t he
                                                                     Mean            Dif f erence
                            t       df         Sig. (2-tailed)    Dif f erence   Lower         Upper
        waktu perbaikan    .670          15              .513           16.563    -36.09           69.21

Hipotesis :
H0 : μ <= 225 ; rata-rata waktu perbaikan adalah 225 jam
H1 : μ > 225 ; rata-rata waktu perbaikan adalah lebih besar 225 jam
Pengambilan keputusan didasarkan atas dua metode :
1. Berdasarkan perbandingan nilai thitung dengan ttabel di mana µ1=µ2
      Jika |thitung| > ttabel, maka H0 ditolak
      Jika |thitung| < ttabel, maka H0 diterima
   Dari hasil pengolahan SPSS, diperoleh nilai thitung sebesar 0.670. Sedang ttabel bisa didapat
   pada tabel t-test, dengan α = 0.05, dan df = 15 (didapat dari rumus n-1, dimana n adalah
   jumlah data, 16-1=15). Didapat ttabel adalah 1.57.
   Keputusan : Oleh karena thitung < ttabel, (0.670 < 1.57), maka H0 diterima, sehingga dapat
   disimpulkan bahwa rata-rata waktu perbaikan adalah memang 225 jam.
2. Berdasarkan nilai probabilitas dengan α = 0,05 :
      Jika probabilitas > 0,05 , maka H0 diterima
      Jika probabilitas < 0,05 , maka H0 ditolak
   Terlihat bahwa nilai probabilitas pada kolom Sig adalah 0.513 atau probabilitas di atas 0.05
   (0.513 > 0.05). Dengan demikian H0 diterima, sehingga mempunyai kesimpulan yang sama
   dengan uji t yaitu rata-rata waktu perbaikan adalah memang 225 jam.


4) INDEPENDENT-SAMPLE T-TEST (MEMBANDINGKAN RATA-RATA DUA SAMLE-
   INDEPENDENT)
    Ada beberapa asumsi yang harus dipenuhi ketika kita akan melakukan pengujian ini yaitu :
           a. Dua sampel acak sederhana dan independen
           b. Skala pengukuran sekurang-kurangnya interval
           c. Tiap observasi saling bebas (independent)
           d. Populasi berdistribusi normal dengan rata-rata  dan varians 2
    Contoh Kasus :
    Terdapat dua kelas mahasiswa yang mengikuti ujian statistika. Diduga bahwa kedua kelas
    tersebut memiliki rata-rata nilai yang sama. Untuk membuktikan hal itu, diambil sampel
    acak sebanyak 20 mahasiswa dari masing-masing kelas dengan hasil sebagai berikut:

        No       Kelas A          Kelas B                        No        Kelas A          Kelas B
         1         73               56                           11          60               65
         2         75               48                           12          50               52
         3         67               69                           13          76               72
         4         57               75                           14          70               68
         5         87               90                           15          78               75
         6         91               45                           16          82               80
         7         56               67                           17          86               80
         8         78               77                           18          98               87
         9         56               87                           19          92               88
        10         77               89                           20          55               50



Modul SPSS                                                                                                  - 29 -
Bambang Ruswandi, M.Stat
                                                                                               Statistika
     Dengan menggunakan resiko kekeliruan sebesar 5% dan diasumsikan bahwa simpangan
     baku kedua kelompok sama, buktikan kebenaran dugaan tersebut !
     Membuat File Data :
     1. Definisikan variabel dari data yang akan diuji pada Variable View, Baris pertama pada
        kolom Name ketik Kelas, pada kolom Values lakukan pembagian data ke dalam dua
        grup, 1 untuk ‘Kelas A’, 2 untuk ‘Kelas’.
     2. Baris kedua pada kolom Name ketik Nilai.
     3. Setelah pendefinisian variabel selesai, klik Data View untuk mengisikan data yang
        telah tersedia, pada kolom Kelas, baris 1-20 isi dengan 1 (Kelas A), 21-40 isi dengan 2
        (Kelas B). Dan pada kolom Nilai baris 1-20 isi dengan nilai dari kelas A, 21-40 isi
        dengan nilai dari kelas B.
     4. Langkah-langkah pengolahan data dengan SPSS :
          Klik Analyze, kemudian pilih submenu Compare-Means. Dari serangkaian pilihan
            test, sesuai kasus pilih Independent-Samples T-Test, maka tampak dilayar :




            Test Variabel (s) atau variabel yang akan diuji. Oleh karena yang akan diuji hasil
             Nilai, maka klik variabel Nilai kemudian pindahkan ke kolom Test Variable(s).
            Grouping Variable atau variabel grup, karena variabel pengelompokan ada pada
             variabel Kelas, maka pindahkan variabel Kelas ke grouping variable (berupa Kelas
             (??)). Lalu klik Define Group tampak dilayar :




             Untuk Group 1, isi dengan 1 yang berarti grup 1 berisi tanda 1 atau ‘Kelas A’
             Untuk Group 2, isi dengan 2 yang berarti grup 2 berisi tanda 2 atau ‘Kelas B’
             Jika sudah selesai, klik continue
            Kemudian klik OK untuk mengakhiri pengisian prosedur analisis.
Analisis :
                                           Group Statisti cs

                     Kelas        N           Mean       St d. Dev iation   St d. Error Mean
             Nilai   Kelas A          20      73.2000          14.02104              3.13520
                     Kelas B          20      71.0000          14.53489              3.25010

Output di atas menunjukan banyaknya data, N = 20 data, Rata-rata Nilai Kelas A sebesar 73.2
dan Kelas B sebesar 71.00, simpangan baku masing-masing kelas sebesar 14.02104 dan
14.53489 serta Standar Error dari rata-rata sebesar 3.135 dan 3.25.


Modul SPSS                                                                                          - 30 -
Bambang Ruswandi, M.Stat
                                                                                                                       Statistika

                                                    Independent Samples Test

                               Lev ene's Test f or
                              Equality of Variances                            t-t est f or Equality of Means
                                                                                                                    95% Conf idence
                                                                                                                     Interv al of the
                                                                            Sig.         Mean        St d. Error       Dif f erence
                                  F          Sig.       t      df        (2-tailed)   Dif f erence   Dif f erence   Lower       Upper
  Nilai    Equal v ariances
                                      .029    .865     .487         38        .629      2.20000         4.51582     -6.942   11.3418
           assumed
           Equal v ariances
                                                       .487   37.951          .629      2.20000         4.51582     -6.942   11.3422
           not assumed

 Tabel ke-dua menampilkan beberapa besaran. Tetapi untuk keperluan pengujian hipotesis
  yang dibutuhkan adalah nilai dari statistik uji F (Levene’s Test) untuk melihat homogenitas
  varians dari kedua kelompok. Dengan rumusan hipotesis sebagai berikut:
       H0 :  12   2 (varians kedua populasi homogen)
                     2


          H1 :  12   2 (varians kedua populasi heterogen)
                        2


   Ternyata pada nilai “Sig.” diperoleh nilai sebesar 0.865, karena nilainya jauh di atas  = 5%,
   maka H0 diterima, yang menunjukkan bahwa dengan resiko kekeliruan sebesar 5%, varians
   kedua populasi tersebut Homogen, maka digunakan Equal variances assumed.
 Selanjutnya dilakukan pengujian beda dua rata-rata dengan Hipotesis :
      H0 : 1 = 2 ; tidak ada perbedaaan antara rata-rata nilai kelas A dan nilai kelas B
      H1 : 1 ≠ 2 ; terdapat perbedaaan antara rata-rata nilai kelas A dan nilai kelas B
  Pengambilan keputusan didasarkan atas dua metode :
  1. Berdasarkan perbandingan nilai thitung dengan ttabel di mana µ1=µ2
          Jika |thitung| > ttabel, maka H0 ditolak
          Jika |thitung| < ttabel, maka H0 diterima
      Dari hasil pengolahan SPSS, diperoleh nilai thitung sebesar 0.487. Sedang ttabel bisa didapat
      pada tabel t-test, dengan α = 0.05, karena digunakan hipotesis dua arah, ketika mencari
      ttabel, nilai α dibagi dua menjadi 0.025, dan df = 38 (didapat dari rumus n-2, dimana n
      adalah jumlah data, 40-2=38). Didapat ttabel adalah 2.024.
      Keputusan : Oleh karena thitung < ttabel, (0.487 < 2.024), maka H0 diterima, sehingga
      dapat disimpulkan bahwa tidak ada perbedaaan antara rata-rata nilai kelas A dan nilai
      kelas B.
   2.     Berdasarkan nilai probabilitas dengan α = 0,05 :
             Jika probabilitas > 0,05 , maka H0 diterima
             Jika probabilitas < 0,05 , maka H0 ditolak
          Terlihat bahwa nilai probabilitas pada kolom Sig adalah 0.629 atau probabilitas di atas
          0.05 (0.629 > 0.05). Dengan demikian H0 diterima, sehingga mempunyai kesimpulan
          yang sama dengan uji t yaitu tidak ada perbedaaan antara rata-rata nilai kelas A dan nilai
          kelas B.


5) UJI T DENGAN PENGGUNAAN CUT POINT (TITIK POTONG)
     Jika pada kasus Independen-Sample T-Test yang pertama, digunakan dasar pengujian
     dengan melakukan Grouping Variabel, maka pada kasus ini digantikan dengan Cut Point
     atau titik potong, yaitu suatu angka/data numerik yang berfungsi sebagai batas. Namun
     pada dasarnya tetap sama menggunakan dua sampel yang independent.
     Contoh Kasus :
     Seorang peneliti ingin mengetahui apakah ada perbedaan antara mereka yang berbobot
     lebih dari 50 kg mempunyai rata-rata tinggi badan yang lebih tinggi dibandingkan mereka
     yang berbobot kurang dari 50 kg ? berikut adalah datanya (angka tinggi dalam centimeter
     dan kilogram untuk berat)


Modul SPSS                                                                                                                    - 31 -
Bambang Ruswandi, M.Stat
                                                                                     Statistika


       No    Tinggi (cm)     Berat (kg)          No       Tinggi (cm)       Berat (kg)
        1       174.5          65.8               8          154.7            48.7
        2       178.6          62.7               9          152.7            45.7
        3       170.8          66.4              10          155.8            46.2
        4       168.2          68.9              11          154.8            43.8
        5       159.7          67.8              12          157.8            58.1
        6       167.8          67.8              13          156.7            54.7
        7       165.5          65.8              14          154.7            49.7
     Kasus di atas terdiri atas dua sampel yang bebas satu dengan yang lain, yaitu sampel yang
     mempunyai berat badan di atas 50 kg dan sampel yang mempunyai berat badan di bawah
     50 kg. Di sini diketahui populasi berdistribusi normal.

     1. Langkah-langkah pengolahan data dengan SPSS :
         Klik Analyze, kemudian pilih submenu Compare-Means. Dari serangkaian pilihan
           test, sesuai kasus pilih Independent-Samples T-Test, maka tampak dilayar :




           Test Variabel (s) atau variabel yang akan diuji. Oleh karena yang akan diuji data
            tinggi badan (tinggi), maka klik variabel tinggi kemudian klik tanda ‘>’.
           Grouping Variable atau variabel grup, karena variabel pengelompokan ada pada
            variabel Berat Badan (berat), maka klik berat kemudian klik tanda ‘>’, maka
            variabel berat badan berpindah ke grouping variable (berupa ‘berat(??)’). Lalu klik
            Define Group tampak dilayar :




            Di sini akan dipakai Cut Point, maka klik pilihan Cut Point, kemudian ketik 50
            untuk menyatakan variabel berat badan dibagi dengan batas/cut point adalah
            50(50kg). Lalu Continue.
           Kemudian klik OK untuk mengakhiri pengisian prosedur analisis.




Modul SPSS                                                                                - 32 -
Bambang Ruswandi, M.Stat
                                                                                                                                Statistika
Analisis :
                                                          Group Statistics

                                                                                                             Std. Error
                                    Berat Badan             N             Mean         Std. Dev iation         Mean
                 Tinggi Badan       >= 50.00                        9    166.6222            7.51927           2.50642
                                    < 50.00                         5    154.5400            1.12827            .50458

Output di atas menunjukan deskriptif dari data. Untuk yang berat badannya >= 50 dengan
jumlah data N=9 data, Rata-rata tinggi badannya sebesar 166.6222 dan untuk yang berat
badannya < 50 dengan jumlah data N=5 data, rata-rata tinggi badannya sebesar 154.54.
                                                         Independent Samples Test

                                     Lev ene's Test f or
                                    Equality of Variances                              t-t est f or Equality of Means
                                                                                                                            95% Conf idence
                                                                                                                             Interv al of the
                                                                                   Sig.         Mean        St d. Error        Dif f erence
                                       F          Sig.          t        df     (2-tailed)   Dif f erence   Dif f erence    Lower        Upper
  Tinggi Badan   Equal v ariances
                                       7.734        .017      3.509       12         .004     12.08222        3.44365      4.57916   19.58529
                 assumed
                 Equal v ariances
                                                              4.726     8.633        .001     12.08222        2.55671      6.26087   17.90357
                 not assumed

 Tabel ke-dua menampilkan beberapa besaran. Tetapi untuk keperluan pengujian hipotesis
  yang dibutuhkan adalah nilai dari statistik uji F (Levene’s Test) untuk melihat homogenitas
  varians dari kedua kelompok. Dengan rumusan hipotesis sebagai berikut:
       H0 :  12   2 (varians kedua populasi homogen)
                     2


        H1 :  12   2 (varians kedua populasi heterogen)
                      2

   Ternyata pada nilai “Sig.” diperoleh nilai sebesar 0.017, karena nilainya lebih kecil dari
    = 5%, maka H0 ditolak, yang menunjukkan bahwa dengan resiko kekeliruan sebesar 5%,
   varians kedua populasi tersebut heterogen, maka digunakan Equal variances not assumed.
 Selanjutnya dilakukan pengujian beda dua rata-rata dengan Hipotesis :
      H0 : 1 = 2 ; tidak ada perbedaaan rata-rata tinggi badan antara orang yang berberat
                         badan >= 50 kg dengan berberat badan < 50 kg.
      H1 : 1 ≠ 2 ; terdapat perbedaaan rata-rata tinggi badan antara orang yang berberat
                         badan >= 50 kg dengan berberat badan < 50 kg.
  Pengambilan keputusan didasarkan atas dua metode :
  1. Berdasarkan perbandingan nilai thitung dengan ttabel di mana µ1=µ2
         Jika |thitung| > ttabel, maka H0 ditolak
         Jika |thitung| < ttabel, maka H0 diterima
      Karena variansinya heterogen maka digunakan Equal variances not assumed. Dari hasil
      pengolahan SPSS, diperoleh nilai thitung sebesar 4.726. Sedang ttabel bisa didapat pada
      tabel t-test, dengan α = 0.05, karena digunakan hipotesis dua arah, ketika mencari ttabel,
      nilai α dibagi dua menjadi 0.025, dan df = 8.633 (Variansi yang heterogen menyebabkan
      kegagalan mengasumsikan). Didapat ttabel adalah 2.276.
      Keputusan : Oleh karena thitung > ttabel, (4.726 > 2.276), maka H0 ditolak, sehingga dapat
      disimpulkan bahwa terdapat perbedaaan rata-rata tinggi badan antara orang yang
      berberat badan >= 50 kg dengan berberat badan < 50 kg.
   2.    Berdasarkan nilai probabilitas dengan α = 0,05 :
            Jika probabilitas > 0,05 , maka H0 diterima
            Jika probabilitas < 0,05 , maka H0 ditolak
         Terlihat bahwa nilai probabilitas pada kolom Sig adalah 0.001 atau probabilitas di
         bawah 0.05 (0.001 < 0.05). Dengan demikian H0 ditolak, sehingga mempunyai
         kesimpulan yang sama dengan uji t yaitu terdapat perbedaaan rata-rata tinggi badan
         antara orang yang berberat badan >= 50 kg dengan berberat badan < 50 kg.


Modul SPSS                                                                                                                              - 33 -
Bambang Ruswandi, M.Stat
                                                                                    Statistika
6) ONE WAY-ANOVA (ANALISI VARIANSI (ANAVA))

    Jika Uji t digunakan untuk pengujian dua sampel, maka ONE WAY-ANOVA digunakan untuk
    pengujian lebih dari dua sampel. Asumsi yang digunakan pada pengujian ANOVA adalah :
    a. Populasi-populasi yang akan diuji berdistribusi normal
    b. Varians dari populasi-populasi tersebut adalah sama
    c. Sampel tidak berhubungan satu dengan yang lain.
    Kasus Pertama:
    Seorang Supervisor sebuah perusahaan air minum “SEGAR SELALU” ingin mengetahui
    apakah ada perbedaan yang nyata dari penjualan air minum di daerah penjualan
    JABOTABEK. Untuk itu diambil sampel berupa data penjualan air minum, masing-masing 10
    outlet untuk kawasan JABOTABEK, dengan data sebagai berikut :
                                        Daerah Penjualan
            No
                     Jakarta          Bogor       Tangerang           Bekasi
            1          632             564           567               532
            2          661             601           601               557
            3          632             654           576               543
            4          621             695           542               518
            5          652             651           587               529
            6          685             634           529               534
            7          639             624           521               548
            8          652             651           542               557
            9          638             653           551               524
            10         666             632           432               532
     Pada kasus ini terdapat empat sampel yang bebas satu dengan yang lain, yaitu daerah
     Penjualan Jakarta, Bogor, Tengerang dan Bekasi. Di sini diasmiskan populasi berdistribusi
     normal. Dengan tingkat kepercayaan 95% dan α = 0,05, apakah terdapat perbedaaan rata-
     rata penjualan diantara empat daerah penjualan tersebut ?
     Membuat File Data :
     1. Definisikan variabel dari data yang akan diuji pada Variable View, Baris pertama pada
        kolom Name ketik Daerah, pada kolom Values lakukan pembagian data ke dalam
        empat grup, 1 untuk ‘Jakarta’, 2 untuk ‘Bogor’, 3 untuk ‘Tengerang’, 4 untuk ‘Bekasi’.
        Baris kedua pada kolom Name ketik Penjualan.
     2. Pada Data View lakukan mengisikan data, pada kolom Daerah, baris 1-10 isi dengan 1
        (Jakarta), 11-20 isi dengan 2 (Bogor), 21-30 isi dengan (Tangerang), 31-40 isi dengan
        4(Bekasi) sesuai dengan pendefinisian pada value label. Dan pada kolom Penjualan di
        isi sesuai dengan hasil penjualan dari masing-masing daerah.
     3. Langkah-langkah pengolahan data dengan SPSS :
          Klik Analyze, kemudian pilih submenu Compare-Means. Dari serangkaian pilihan
             test, sesuai kasus pilih One-Way Anova, maka tampak dilayar :




Modul SPSS                                                                               - 34 -
Bambang Ruswandi, M.Stat
                                                                                                              Statistika
             Dependent List atau variabel yang akan diuji. Karena yang akan diuji adalah hasil
              penjualan, maka pindahkan variabel penjualan ke dependent list.
             Factor atau grup, karena variabel pengelompokkan ada pada variabel daerah,
              maka pindahkan variabel Daerah ke kolom Factor.
             Klik kolom Option, maka akan tampak layar :




              Untuk Statistics, pilih Descriptive, Mean Plot dan Homogeneity of variance test
              yang bertujuan untuk menguji asumsi untuk ANOVA, yaitu apakah keempat sampel
              mempunyai variansi yang sama atau berbeda.
             Untuk kolom Post-Hoc atau nalisis lanjutan dari F test, dengan mengkliknya akan
              tampak layar :




               Untuk melihat perbedaan antar dua variabel klik pilihan Tucey, dan pilihan
               lainnya diabaikan. Klik Continue jika pengisian selesai.
             Kemudian klik OK untuk mengakhiri pengisian prosedur analisis.
Analisis :
                                                     Descriptives

  Penjualan
                                                                  95% Conf idence Interv al f or
                                                                             Mean
               N        Mean     St d. Dev iation   St d. Error   Lower Bound   Upper Bound        Minimum    Maximum
  Jakarta          10   647.80           19.194          6.070          634.07         661.53           621        685
  Bogor            10   635.90           35.146         11.114          610.76         661.04           564        695
  Tangerang        10   544.80           47.140         14.907          511.08         578.52           432        601
  Bekasi           10   537.40           13.368          4.227          527.84         546.96           518        557
  Total            40   591.48           59.599          9.423          572.41         610.54           432        695

Output di atas menunjukkan deskriptif dari masing-masing daerah penjualan yange meliputi
jumlah data (N), rata-rata (Mean) Standar deviasi, maksimum, minimum dan seterusnya.

Modul SPSS                                                                                                          - 35 -
Bambang Ruswandi, M.Stat
                                                                                                Statistika

                                  Test of Homogeneity of Variances

                          Penjualan
                           Lev ene
                           St at ist ic     df 1             df 2          Sig.
                               1.898                3               36        .147

Statistik uji Levene’s Test digunakan untuk melihat homogenitas varians dari keempat
kelompok. Dengan rumusan hipotesis sebagai berikut:
         H0 : varians keempat populasi homogen
         H1 : varians keempat populasi heterogen
Terlihat bahwa nilai probabilitas pada kolom Sig adalah 0.147 atau probabilitas di atas 0.05
(0.147 > 0.05). Dengan demikian H0 dierima, yang menunjukkan bahwa dengan resiko
kekeliruan sebesar 5%, varians keempat populasi tersebut Homogen.
                                                   ANOVA

              Penjualan
                                  Sum of
                                 Squares           df        Mean Square        F       Sig.
              Between Groups     102487.5                3     34162.492       34.124    .000
              Within Groups      36040.50               36      1001.125
              Total              138528.0               39

Hipotesis :
      H0 : tidak ada perbedaaan rata-rata hasil penjualan di antara daerah JABOTABEK
      H1 : terdapat perbedaaan rata-rata hasil penjualan di antara daerah JABOTABEK

Pengambilan keputusan didasarkan atas dua metode :
1. Berdasarkan perbandingan nilai Fhitung dengan Ftabel
       Jika Fhitung >Ftabel, maka H0 ditolak dan H1 diterima
       Jika Fhitung < Ftabel, maka H0 diterima dan H1 ditolak
   Dari hasil pengolahan SPSS, diperoleh nilai Fhitung sebesar 34.124. Sedang Ftabel bisa didapat
   pada tabel F-test, dengan α = 0.05, dan df1 = 3 (didapat dari rumus N-1, dimana N adalah
   jumlah variabel bebas, 4-1=3), df2 = 36 (didapat dari rumus n-N, dimana n adalah jumlah
   data, 40-4=36). Didapat Ftabel adalah 2.866.
   Keputusan : Oleh karena Fhitung > Ftabel, (34.124 > 2.866), maka H0 ditolak, sehingga dapat
   disimpulkan bahwa terdapat perbedaaan rata-rata hasil penjualan di antara daerah
   JABOTABEK.
2. Berdasarkan nilai probabilitas dengan α = 0,05 :
        Jika probabilitas > 0,05 , maka H0 diterima
        Jika probabilitas < 0,05 , maka H0 ditolak
   Terlihat bahwa nilai probabilitas pada kolom Sig adalah 0.000 atau probabilitas di bawah
   0.05 (0.000 < 0.05). Dengan demikian H0 ditolak, sehingga mempunyai kesimpulan yang
   sama dengan uji F yaitu terdapat perbedaaan rata-rata hasil penjualan di antara daerah
   JABOTABEK.




Modul SPSS                                                                                           - 36 -
Bambang Ruswandi, M.Stat
                                                                                                       Statistika

                                             Multi ple Comparisons

     Dependent Variable: Penjualan
     Tukey HSD

                                      Mean
                                   Dif f erence                                  95% Conf idence Interv al
     (I) Daerah    (J) Daerah          (I-J)     St d. Error         Sig.      Lower Bound    Upper Bound
     Jakarta       Bogor                 11.900      14.150             .835         -26.21           50.01
                   Tangerang           103.000*      14.150             .000          64.89          141.11
                   Bekasi              110.400*      14.150             .000          72.29          148.51
     Bogor         Jakarta              -11.900      14.150             .835         -50.01           26.21
                   Tangerang             91.100*     14.150             .000          52.99          129.21
                   Bekasi                98.500*     14.150             .000          60.39          136.61
     Tangerang     Jakarta            -103.000*      14.150             .000        -141.11          -64.89
                   Bogor                -91.100*     14.150             .000        -129.21          -52.99
                   Bekasi                  7.400     14.150             .953         -30.71           45.51
     Bekasi        Jakarta            -110.400*      14.150             .000        -148.51          -72.29
                   Bogor                -98.500*     14.150             .000        -136.61          -60.39
                   Tangerang              -7.400     14.150             .953         -45.51           30.71
       *. The mean dif f erence is signif icant at the .05 lev el.

Output Post Hoc di atas menjelaskan antar daerah mana saja yang memiliki perbedaan dan yang
tidak memiliki perbedaan hasil penjualan. Sebagai contoh pada baris pertama menguji
perbedaan antara daerah Jakarta dengan Bogor, didapat selisih rata-rata antar keduanya
sebesar 11.9 dengan nilai signifikan lebih besar dari 0.05 (0.835 > 0.05), hal ini menyatakan
tidak ada perbedaan yang signifikan antara rata-rata penjualan di Jakarta dengan Bogor. Pada
baris kedua menguji perbedaan antara Jakarta dengan Tangerang, didapat selisih rata-rata antar
keduanya sebesar 103 dengan nilai signifikan lebih kecil dari 0.05 (0.000 < 0.05), hal ini
menyatakan ada perbedaan yang signifikan antara rata-rata penjualan di Jakarta dengan
Tangerang. Demikian seterusnya untuk perbandingan daerah lainnya. Atau untuk lebih
mudahnya perhatikan tanda bintang (*) pada Mean Difference, jika pada nilainya terdapat tanda
bintang maka memiliki perbedaan yang signifikan.
                                                Penjualan
                                      a
                         Tukey HSD
                                                         Subset f or alpha = . 05
                         Daerah               N             1             2
                         Bekasi                   10       537.40
                         Tangerang                10       544.80
                         Bogor                    10                     635.90
                         Jakarta                  10                     647.80
                         Sig.                                .953           .835
                         Means f or groups in homogeneous subset s are display ed.
                           a. Uses Harmonic Mean Sample Size = 10.000.

Homogeneus Subsets digunakan untuk menentukan variabel mana saja yang mempunyai
perbedaan rata-rata yang tidak berbeda secara signifikan. Berdasarkan output di atas diketahui
bahwa antara daerah Bekasi dan Tangerang tidak ada perbedaan rata-rata yang signifikan antar
keduanya, sehingga Bekasi dan Tangerang ada di dalan subset 1. Begitu juga untuk daerah Bogor
dan Jakarta, tidak ada perbedaan rata-rata yang signifikan antar keduanya, sehingga Bogor dan
Jakarta ada di dalan subset 2. Tetapi, rata-rata penjualan daerah Bekasi dan Tangerah berbeda
secara signifikan dengan rata-rata penjualan daerah Bogor dan Jakarta, sehingga dikelompokkan
dalam subset yang berbeda.


Modul SPSS                                                                                                    - 37 -
Bambang Ruswandi, M.Stat
                                                                                     Statistika

                                        BAB V
                                  APLIKASI KORELASI

       Dalam bab ini akan dibahas Korelasi atau asosiasi (hubungan) antara variabel-variabel
yang diamati. Di sini akan disoroti dua aspek untuk analisis korelasi, yaitu apakah data sampel
yang ada menyediakan bukti cukup bahwa ada kaitan antara variabel-variabel dalam populasi
asal sampel. Dan yang kedua, jika ada hubungan, seberapa kuat hubungan antar variabel
tersebut. Keeratan hubungan itu dinyatakan dengan nama koefisien korelasi “r”.

Arti Koefisien Korelasi :
Koefisien korelasi terletak antara -1 dan 1, atau -1  ryx  1
ryx = 1 menunjukkan hubungan linier positif sempurna antara X dan Y, dalam arti makin besar
          harga X makin besar pula harga Y, atau sebaliknya
ryx = -1 menunjukkan hubungan linier negatif sempurna antara X dan Y, dalam arti makin besar
          harga X maka harga Y semakin kecil, atau sebaliknya
ryx = 0 menunjukkan tidak ada hubungan linier antara X dan Y

Penafsiran koefisien korelasi:
Setelah melalui pengujian hipotesis hasilnya signifikan, maka untuk menentukan keeratan
hubungan bisa digunakan kriteria Guilford (1956) sebagai berikut :
  0,00   < 0,20             =  Hubungan yang sangat kecil dan bisa diabaikan
  0,20   < 0,40             =  Hubungan yang kecil (tidak erat)
  0,40   < 0,70             =  Hubungan yang moderat
  0,70   < 0,90             =  Hubungan yang erat
  0,90   < 1                =  Hubungan yang sangat erat

Koefisien Determinasi
Sebenarnya melihat keeratan hubungan antara variabel X dengan variabel Y kurang baik kalau
dilihat dari rYX , karena rYX hanya mengatakan erat atau tidak erat. Interpretasi yang lebih
lengkap adalah melalui koefisien determinasi.
Definisi : Koefisien Determinasi adalah kuadrat koefisien korelasi yang menyatakan besarnya
persentase perubahan pada Y yang bisa diterangkan oleh X melalui hubungan linier antara Y
dengan X, atau   d  rYX 100 %
                       2



        Hubungan yang paling sederhana antara dua buah variabel X dan Y disebut dengan
korelasi sederhana (derajat asosiasi). Dalam analisis korelasi tidak perlu diperhatikan yang
mana sebagai variabel bebas dan variabel takbebas, tetapi yang lebih diutamakan adalah skala
pengukuran dari kedua variabel tersebut.
Koefisien Korelasi (Derajat Asosiasi) ditinjau dari Skala Pengukuran :

                          Nominal                Ordinal            Interval/Rasio
     Nominal              Cramer                 Theta              Point Biseral
                          Pearson C                                 Eta
                          Tschuprov
                          Lambda
                          Phi
                          Tectrachoric
     Ordinal                                     Spearman           Biseral
                                                 Kendall            Jaspen
                                                 Gamma
                                                 Somer
     Interval/Rasio                                                 Pearson



Modul SPSS                                                                                - 38 -
Bambang Ruswandi, M.Stat
                                                                                               Statistika
5.1 KORELASI PEARSON
         Digunakan apabila antar dua buah variabel X dan Y yang masing-masing mempunyai
skala pengukuran data interval atau rasio dan hubungannya merupakan hubungan linier.
Perhitungan ini mensyaratkan bahwa populasi sampel mempunyai dua varian dan berdistribusi
normal. Korelasi Pearson diberi simbol ryx untuk sampel dan yx untuk populasi
                                             n               n      n
                                          n  X iYi   X i  Yi
                      rYX                  i 1            i 1   i 1

                               n 2  n                 2
                                                             n 2  n  2 
                               n X    X               n Y    Y  
                               i 1 i  i 1 i             i 1 i  i 1 i  
                                                                              
Kasus :
Muncul suatu dugaan bahwa waktu tayang iklan suatu produk berhubungan dengan persentase
peningkatan penjualannya. Untuk membuktikan hal itu, diambil sebanyak 10 sampel dari
periode waktu tertentu. Hasilnya adalah sebagai berikut:
          Waktu Tayang              30     28      25        32    40     55   60    54   53     40
      Persentase Peningkatan
                                     60    55      55         62   65     70   75    68   65     60
            Penjualan
a. Seberapa besar pengaruh dari waktu tayang terhadap persentase peningkatan penjualan?
b. Melalui pengujian hipotesis, dengan  = 5 %, apakah pengaruh tersebut signifikans?

Langkah-langkah pengolahan data dengan spss :
 Klik Analyze, kemudian pilih submenu correlate, sesuai kasus pilih Bivariate, maka tampak
  layar :




 Pindahkan semua variabel yang akan di korelasikan ke kolom variable.
 Pada kolom Correlation Coefficients atau alat hitung koefisien korelasi. Oleh karena data
  pada kasus adalah kuantitatif dan berskala rasio, maka pilih pearson dan abaikan alat hitung
  yang lain.
 Untuk kolom Test of Significance, karena akan diuji dua sisi, maka pilih Two-tailed.
 Untuk pilihan Flag significant correlations atau berkenaan dengan tanda untuk tingkat
  signifikansi 5% dan 10% akan ditampilkan pada output ataukah tidak. Untuk keseragaman
  pilihan tersebut dipakai hingga nanti pada output ada tanda * untuk 5% dan atau ** untuk
  10%.
 Kemudia klik OK untuk mengakhiri pengisisan prosedur analisis.




Modul SPSS                                                                                          - 39 -
Bambang Ruswandi, M.Stat
                                                                                                       Statistika
Analisis :
                                                   Correlati ons

                                                                                      Persentase
                                                                                      Peningkatan
                                                                      Wakt u Tay ang   Penjualan
              Wakt u Tay ang               Pearson Correlation                     1          .923**
                                           Sig. (2-tailed)                                    .000
                                           N                                      10            10
              Persentase                   Pearson Correlation                 .923**            1
              Peningkatan Penjualan        Sig. (2-tailed)                     .000
                                           N                                      10            10
                **. Correlation is signif icant at the 0.01 lev el (2-tailed).

 Besarnya koefisien korelasi sebesar 0.923, berdasarkan kriteria Guillford menunjukkan
  hubungan yang sangat erat antara waktu tayang dengan persentase peningkatan penjualan.
 Berdasarkan dugaan yang dibahas bahwa terdapat hubungan antara “Waktu Tayang” dengan
  “Persentase Peningkatan Penjualan”, maka dugaan tersebut bisa disajikan ke dalam rumusan
  hipotesis untuk uji dua pihak sebagai berikut:
     H0 : YX = 0 ; Tidak ada hubungan antara waktu tayang dengan persentase peningkatan
                    penjualan
     H1 : YX  0 ; Ada hubungan antara waktu tayang dengan persentase peningkatan penjualan
  Dengan menggunakan resiko kekeliruan  = 5%, ternyata hasil pengujiannya signifikan
  karena ternyata memiliki nilai Sig.(2-tailed) sebesar 0.000 yang jauh lebih keci dari  = 5%
  (0.000 < 0.05) sehingga H0 ditolak. Hal ini menyatakan adanya hubungan yang signifikan
  antara “Waktu Tayang” dengan “Persentase Peningkatan Penjualan”.

5.2 UJI KORELASI SPEARMAN DAN KENDALL
          Jika uji korelasi bivariate pearson digunakan untuk mengetahui korelasi terhadap data
kuantitatif (skala interval atau rasio), korelasi rank Spearman dan Kendall dapat digunakan
untuk mengukur korelasi pada statistik non parametrik (data dapat ordinal). Pengukuran lebih
dieratkan kepada hubungan antara peringkat-peringkat dibandingkan hasil pengamatan itu
sendiri. Walaupun pada prinsipnya sama, namun terdapat perbedaan diantara kedua metode,
yaitu jika pada korelasi Kendall (diberi simbol τ) merupakan suatu penduga tidak bias untuk
parameter populasi, maka korelasi Spearman (diberi simbol r) tidak memberikan dugaan untuk
koefisien peringkat suatu populasi.
Kasus :
Diduga bahwa terdapat hubungan antara tingkat pendidikan seseorang dengan tingkat
kemudahan dia memahami pesan iklan rokok tertentu. Untuk membuktikan hal tersebut,
diambil data sebanyak 15 responden. Skala Pemahaman : Sangat Sulit (SS), Sulit (S), Mudah
(M), Sangat Mudah (SM). Data yang diperolehnya adalah pada tabel di samping :

                 Tingkat          Tingkat                          Tingkat         Tingkat
 Responden                                          Responden
                Pendidikan Pemahaman                             Pendidikan Pemahaman
       1            SMP              SS                  9           SMP              SS
       2            SMU              S                  10           SMU              S
       3            SMU              M                  11           SMU              M
       4             S1              M                  12            S1              M
       5             S1              M                  13            S1              M
       6            SMP              S                  14           SMP              S
       7            SMU              M                  15           SMU              M
       8             S1              M
a.   Seberapa besar pengaruh dari waktu tayang terhadap persentase peningkatan penjualan?
b.   Melalui pengujian hipotesis, dengan  = 5 %, apakah pengaruh tersebut signifikans?


Modul SPSS                                                                                                  - 40 -
Bambang Ruswandi, M.Stat
                                                                                                      Statistika
Langkah-langkah pengolahan data dengan spss hampir sama dengan dengan langkah pada
korelasi Pearson, hanya pada kolom Correlation Coefficients atau alat hitung koefisien
korelasi, oleh karena data pada kasus adalah kualitatif dan berskala ordinal, maka pilih Kendalls
tau-b atau Spearman
Analisis :
                                                  Correlati ons

                                                                                Tingkat        Tingkat
                                                                               Pendidikan    Pemahaman
  Spearman's rho       Tingkat Pendidikan          Correlation Coef f icient         1.000           .858**
                                                   Sig. (2-tailed)                        .          .000
                                                   N                                    15             15
                       Tingkat Pemahaman           Correlation Coef f icient          .858**        1.000
                                                   Sig. (2-tailed)                    .000              .
                                                   N                                    15             15
     **. Correlation is signif icant at the 0.01 lev el (2-tailed).

 Besarnya koefisien korelasi sebesar 0.858, berdasarkan kriteria Guillford menunjukkan
  hubungan yang erat antara tingkat pendidikan dengan tingkat pemahaman.
 Berdasarkan dugaan yang dibahas bahwa terdapat hubungan antara “Tingkat Pendidikan”
  dengan “Tingkat Pemahaman”, maka dugaan tersebut bisa disajikan ke dalam rumusan
  hipotesis untuk uji dua pihak sebagai berikut:
  Hipotesis :
     H0 : S = 0 ; Tidak ada hubungan antara tingkat pendidikan dengan tingkat pemahaman
     H1 : S  0 ; Ada hubungan antara tingkat pendidikan dengan tingkat pemahaman
  Dengan menggunakan resiko kekeliruan  = 5%, ternyata hasil pengujiannya signifikan
  karena ternyata memiliki nilai Sig.(2-tailed) sebesar 0.000 yang jauh lebih keci dari  = 5%
  (0.000 < 0.05) sehingga H0 ditolak. Hal ini menyatakan adanya hubungan yang signifikan
  antara “Tingkat Pendidikan” dengan “Tingkat Pemahaman”.

5.3 KORELASI PARSIAL (PARTIAL CORRELATION)
Pembahasan korelasi parsial berhubungan dengan perlunya mempertimbangkan pengaruh atau
efek dari variabel lain dalam menghitung korelasi antara dua variabel. Oleh karena itu, dapat
dikatakan korelasi parsial mengukur korelasi antar dua variabel dengan mengeluarkan
pengaruh dari satu atau beberapa variabel (disebut variabel kontrol).

Contoh Kasus :
Seorang Manajer Personalia ingin mengetahui apakah ada hubungan antara prestasi kerja
seseorang dengan tingkat kecerdasan (diukur dengan IQ) dan motivasi kerja pekerja yang
bersangkutan. Untuk itu, diambil 9 orang pekerja dan seorang supervisor diminta memberi
penilaian pada setiap pekerja tersebut tentang prestasi kerja dan motivasi kerjanya. Berikut
adalah hasilnya :
                           Pekerja             Prestasi                IQ      Motivasi
                              1                  84                   110        85
                              2                  85                   100        82
                              3                  87                   90         84
                              4                  92                   110        91
                              5                  91                   100        83
                              6                  96                   110        88
                              7                  83                   95         82
                              8                  87                   90         86
                              9                  88                   100        84


Modul SPSS                                                                                                    - 41 -
Bambang Ruswandi, M.Stat
                                                                                                    Statistika


Akan dihitung korelasi parsial antara variabel prestasi dengan motivasi dengan variabel kontrol
adalah IQ.
Langkah-langkah pengolahan data dengan SPSS :
 Klik Analyze, kemudian pilih submenu correlate, sesuai kasus pilih partial, maka tampak
  layar :




 Karena yang akan diuji korelasi variabel prestasi dan motivasi, maka pindahkan kedua
  variabel tersebut ke kolom variable.
 Yang menjadi variabel kontrol adalah IQ, maka pindahkan variabel tersebut ke kolom
  Controlling for.
 Untuk kolom Test of Significance, karena akan diuji dua sisi, maka pilih Two-tailed.
 Kemudia klik OK untuk mengakhiri pengisisan prosedur analisis.

Analisis :
                                              Correlati ons

             Control Variables                                           prestasi     motiv asi
             iq                  prestasi    Correlation                    1.000          .556
                                             Signif icance (2-t ailed)            .        .153
                                             df                                  0            6
                                 motiv asi   Correlation                      .556       1.000
                                             Signif icance (2-t ailed)        .153              .
                                             df                                  6            0

 Dengan adanya variabel IQ sebagai kontrol, besarnya koefisien korelasi antara Prestasi
  dengan Motivasi sebesar 0.556, berdasarkan kriteria Guillford menunjukkan hubungan yang
  moderat atau cukup kuat antara Motivasi dengan Prestasi saat dikontrol dengan variabel IQ.




Modul SPSS                                                                                               - 42 -
Bambang Ruswandi, M.Stat
                                                                                    Statistika

                                       BAB VI
                                   ANALISIS REGRESI

        Dalam analisis regresi, akan dikembangkan sebuah estimating equation (persamaan
regresi) yaitu suatu formula matematika yang mencari nilai variabel dependen dari nilai
variabel independen yang diketahui. Analisis Regresi digunakan terutama untuk tujuan
peramalan, di mana dalam model tersebut ada sebuah variabel dependen (tergantung) dan
variabel independen (bebas). Sebagai contoh ada tiga variabel, uaitu Penjualan, Biaya Promosi
Penjualan dan Biaya Iklan. Dalam praktek, akan dibahas bagaimana hubungan antara biaya
promosi penjualan dan biaya iklan perhadap penjualan. Di sini berarti ada variabel dependen
yaitu penjualan, sedangkan variabel independennya adalah biaya promosi dan biaya iklan.
Metode Korelasi akan membahas keeratan hubungan antara variabel dependen dan variabel
independen. Sedangkan metode Regresi akan membahas prediksi (ramalan) dalam hal ini
apakah penjualan di masa mendatang dapat diramalkan jika biaya promosi penjualan dan biaya
iklan diketahui.
        Dalam praktek, regresi sering dibedakan antara regresi sederhana dan regresi berganda.
Disebut regresi sederhana (Simple Regression) jika hanya ada satu variabel independen,
sedangkan regresi berganda (Multiple Regression) jika ada lebih dari satu variabel independen.
        Sebelum uji regresi dilakukan, maka harus dilakukan lebih dahulu uji keberartian
masing-masing koefisien regresi, apakah regresi itu linear atau tidak. Jika tidak linear maka
pengujian bisa dilakukan dengan model lainya. Untuk mempermudah melihat apakah model itu
linear atau bentuk lainnya, dapat dibantu melalui diagram pancar (scatter plot) dalam sub menu
Curve Estimation. Pilihan menunya ada di Analyze lalu Regression kemudian pilih Curve
Estimation. Lalu pindahkan variabel dependen ke kotak Dependent, variabel bebas ke kotak
Independent. kemudia klik OK.

6.1 ANALISIS REGRESI LINIER SEDERHANA

PENGERTIAN :
    Sebuah model yang berusaha menerangkan hubungan fungsional antara dua buah
     variabel, di mana satu variabel menjadi prediktor terhadap variabel respon
    Sebuah model yang berusaha menerangkan hubungan dependensi dari dua variabel, di
     mana salah satu variabel bersifat dependen atas variabel lainnya.
    Hubungan ini tidak bersifat deterministik

JENIS HUBUNGAN
           Regresi Linier Sederhana
           Regresi Linier Multipel
           Regresi Non linier
Model Dasar Regresi Linier Sederhana
                                        Y =  + x + 
    adalah parameter intercept
    adalah parameter slope
    adalah residual yang merupakan variabel random dengan
     E() = 0 dan berdistribusi normal
Syarat variabel dalam regresi:
    Variabel X dan Y memiliki skala pengukuran sekurang-kurangnya interval
    Data yang terkumpul harus memenuhi model dasar
    Pengumpulan datanya bisa dilakukan melalui dua cara :
            - Variabel X ditentukan terlebih dahulu
            - Sekaligus dihitung X dan Y
    Karena harga variabel X fixed, maka distribusi variabel Y sama dengan variabel  yaitu
        mengikuti distribusi normal dengan rata-rata nol dan varians 2 (homoscedasticity)

Modul SPSS                                                                               - 43 -
Bambang Ruswandi, M.Stat
                                                                                          Statistika
Istilah-istilah:
     1. Kekeliruan (), menggambarkan dua keadaan, yaitu:
          - Kontribusi variabel-variabel independen lain yang tidak termasuk ke dalam model
          - Error of Measurement artinya pengukuran hanya terhadap sampeljadi pasti akan ada
              kesalahan atau kekeliruan
     2. Koefisien intercept, , menyatakan berapa besarnya rata-rata Y jika X = 0
     3. Koefisien regresi, , menunjukkan besarnya perubahan nilai rata-rata Y jika X berubah
         satu unit
     4. Koefisien Determinasi adalah kuadrat koefisien korelasi yang menyatakan
        besarnya persentase perubahan pada Y yang bisa diterangkan oleh X melalui
        hubungan linier antara Y dengan X, atau                       d  rYX 100 %
                                                                            2

   5. Variabel bebas / independent variable / regression variable / predictor / variabel
      explanatori (X)
   6. Variabel tak bebas / dependent variable / regressent variable / explained variabel /
      variabel respon (Y)
Contoh Garis Regresi:
                                   y

                                                                               



                                                                        



                                                


                                                                                      x
Taksiran Koefisien Regresi:

                    y  a  bx
                    ˆ
            n
                  n  n                     n
    n xi yi    xi   yi                 x  x  y
                                                          i       i    y
 b  i 1         i 1  i 1             i 1
                               2                      n
                       n 
                                                      x  x 
             n
          n xi    xi 
                2                                                     2
                                                              i
           i 1        i 1                        i 1
        n                n

        y  b x
                i              i
  a   i 1             i 1
                                    y  bx
                    n

6.2 ANALISIS REGRESI LINIER MULTIPEL

Regresi linier majemuk merupakan generalisasi dari regresi linier sederhana dan memiliki
model umum:
 Y =  +  1X1 +  2X2 + … + kXk + 
Model regresi di atas dapat didekati dengan menggunakan data sampel sehingga didapatkan
model yang di-fit-kan:
   Y = a + b1X1 + b2X2 + … + bkXk


Modul SPSS                                                                                     - 44 -
Bambang Ruswandi, M.Stat
                                                                                       Statistika
a.   ASUMSI DALAM REGRESI LINEAR

1.   Uji Linearitas
Uji linearitas bertujuan untuk mengetahui apakah dua variabel mempunyai hubungan yang
linear atau tidak secara signifikan. Uji ini biasa digunakan sebagai prasyarat dalam analisis
korelasi atau regresi linear. Pengujian Ada beberapa uji yang dapat dilakukan, diantaranya
adalah :
1). Uji Durbin Watson
2). Ramsey Test
3). Uji Lagrange Multiplier
4). Uji Grafik (Scetter Plot)

2.   Uji Normalitas
Uji Normalitas digunakan untuk mengetahui apakah populasi data berdistribusi normal atau
tidak. Kaitannya dengan analisis regresi, uji normalitas bertujuan untuk menguji apakah dalam
model regresi variabel pengganggu atau residual memiliki distribusi normal. Seperti diketahui
bahwa uji t dan uji F mengasumsikan bahwa nilai residual mengikuti distribusi normal. Jika
asumsi ini dilanggar, maka uji statistik menjadi tidak valid untuk jumlah sampel kecil. Terdapat
beberapa pengujian untuk mendeteksi apakah residual berdistribusi normal atau tidak,
diantaranya adalah :
1). Analisis Grafik
     Salah satu cara termudah untuk melihat normalitas residual adalah dengan melihat grafik
     histogram yang membandingkan antara data observasi dengan distribusi yang mendekati
     distribusi normal. Namun demikian histogram memiliki kelemahan terutama jika data yang
     dimiliki sedikit. Metode grafik yang lebih baik yaitu dengan melihat normal probability plot
     yang membandingkan distribusi kumulatif dari distribusi normal. Distribusi normal akan
     membentuk satu garis lurus diagonal, dan plot data residual akan dibandingkan dengan
     garis diagonal. Jika distribusi data residual normal, maka garis data akan mengikuti garis
     diagonalnya.
2). Analisis Statistik
     Analisis dengan grafik plot memiliki kelemahan yang cukup signifikan oleh karena jumlah
     pengamatan mempengaruhi hasil ploting. Semakin sedikit jumlah pengamatan semakin
     sulit menginterpretasikan hasil grafik plot. Oleh karena itu diperlukan uji statistik yang
     lebih dapat menjamin kekurangan hasil. Uji statistik sederhana dapat dilakukan dengan
     melihat nilai kurtosis dan skewness. Uji statistik lain yang dapat digunakan untuk pengujian
     normalitas residual adalah Uji Statistik Kolmogorov-Smirnov dan Uji Shapiro Wilks.
     Hipotesis yang diajukan untuk uji normlaitas adalah :
          H0 : Data residual berdistribusi normal
          H1 : Data residual tidak berdistribusi normal
3. Uji Heteroskedastisitas
Uji Heteroskedastisitas digunakan untuk menguji apakah dalam model regresi terjadi
ketidaksamaan variansi dari residual dari satu pengamatan ke pengamatan yang lain. Jika
variansi residual dari satu pengamatan ke pengamatan lain tetap, maka disebut
Homoskedastisitas dan jika berbeda disebut Heteroskedastisitas. Model regresi yang baik adalah
yang Homoskedastisitas atau tidak terjadi Heteroskedastisitas.
Dampak jika terdapat heteroskedastisitas, diantaranya adalah :
 Melalui MKTB diperoleh penaksir parameter yang tak bias, tetapi tidak efisien karena
   variansnya besar. Akibatnya, penaksir menjadi tidak BLUE
 Peramalan untuk nilai variabel tak bebas Y berdasarkan model regresi yang dibangun
   menjadi tidak efisien
 Selang kepercayaan menjadi semakin lebar
 Pengujian hipotesis mengenai signifikansi parameter model regresi baik melalui uji
   signifikansi maupun pendekatan selang kepercayaan tidak dapat diterapkan.

Modul SPSS                                                                                  - 45 -
Bambang Ruswandi, M.Stat
                                                                                       Statistika
Terdapat beberapa cara untuk mendeteksi ada atau tidaknya Heteroskedastisitas :
1). Metode Grafik
    Dasar analisis dalam metode grafik yaitu, jika ada pola tertentu seperti titik-titik yang ada
    membentuk pola tertentu (bergelombang, melebar kemudian menyempit, maka
    diindikasikan telah terjadi heteroskedastisitas. Namun Jika tidak ada pola yang jelas, serta
    titik-titik menyebar di atas data di bawah angka 0 pada sumbu Y, maka tidak terjadi
    Heteroskedastisitas.
         Gambar Pola Hipotesis Residual




2). Uji Statistik
    Sama halnya seperti uji plot pada uji normalitas, dimana Analisis dengan grafik plot
    memiliki kelemahan yang cukup signifikan oleh karena jumlah pengamatan mempengaruhi
    hasil ploting. Semakin sedikit jumlah pengamatan semakin sulit menginterpretasikan hasil
    grafik plot. Oleh karena itu diperlukan uji statistik yang lebih dapat menjamin kekurangan
    hasil. Ada beberapa uji statistik yang dapat digunakan untuk mendeteksi ada tidaknya
    heteroskedastisitas, diantaranya adalah Uji Park, Uji Glejser, Uji White, Uji Korelasi Rang
    Spearman, Uji Goldfeld – Quandt dan Uji Breusch Pagan Godfrey.
    Permasalahan heteroskedastisitas in harus ditanggulangi, ada beberapa macam teknik yang
    dapat digunakan untuk kepentingan tersebut, diantaranya adalah :
    1) Melakukan transformasi dalam bentuk model regresi dengan membagi model regresi
         dengan salah satu variabel independen yang digunakan dalam model tersebut.
         Misalkan model awal : Y  0  1 x1  2 x2 , kemudian model ditransformasi menjadi :
         Y 0 1 x1  2 x2
                  
         x1 x1   x1   x1
     2) Melakukan transformasi Logaritma sehingga model persamaan regresinya menjadi :
         log Y  0  1 log x1  2 log x2

4.   Uji Autokorelasi (Data Time Series)
Uji Autokorelasi digunakan untuk menguji apakah dalam model regresi linear ada korelasi
antara kesalahan penggangu pada periode t dengan kesalahan penggangu pada periode t-1
(sebelumnya). Jika ada korelasi, maka dinamakan problem Autokorelasi. Autokorelasi muncul
karena observasi yang berurutan sepanjang waktu berkaitan satu sama lainnya. Masalah ini
timbul karena residual tidak bebas dari satu observasi ke observasi lainnya. Hal ini sering
ditemukan pada data yang bersifat timeseries.
Dampak karena adanya outokorelasi adalah :
a) Taksiran parameter yang diperoleh tak bias, tetapi tidak efisien karena variansnya menjadi
   lebih besar. Akibatnya, penaksir tersebut menjadi tidak BLUE

Modul SPSS                                                                                  - 46 -
Bambang Ruswandi, M.Stat
                                                                                        Statistika
b) Taksiran interval dari parameter menjadi semakin lebar
c) Uji-uji nyata bagi koefisien regresi baik uji t ataupun F menjadi tidak sahih (valid) sehinga
   dapat mengacaukan kesimpulan
Terdapat beberapa cara untuk mendeteksi ada atau tidaknya Autokorelasi :
a) Metode Grafik
   Pada metode grafik, analisis dilakukan dengan cara memplotkan nilai t terhadap e. Dimana t
   bertindak sebagai sumbu x dan e bertindak sebagai sumbu y. Jika secara visual terdapat pola
   yang beraturan seperti pola siklis, trend linier naik, trend linier turun, atau kuadratik, maka
   dapat disarankan bahwa ada kecenderungan terdapat otokorelasi dalam gangguan. Akan
   tetapi jika tidak nampak pola yang beraturan, maka dapat disarankan tidak ada
   kecenderungan otokorelasi
b) Uji Statistik
   Sama halnya seperti pengujian asumsi sebelumnya, uji statistik ini digunakan untuk
   mendukung kesimpulan dari metode grafik. Pengujian Autokorelasi yang dapat digunakan
   diantaranya : Uji Durbin Watson, Uji Run, Uji Rasio Von Newman dan Uji Kebebasan dari
   Gangguan (Uji Chikuadrat).
          Untuk beberapa referensi (Trihendradi (1995)) menentukan batasan autokorelasi
          untuk Uji Durbin Watson :
          1.65 < DW < 2.35 tidak terjadi autokorelasi
          1.21 < DW < 1.65 atau 2.35 < DW < 2.79 tidak dapat disimpulkan
          DW < 1.21 atau DW > 2.79 terjadi autokorelasi.

5.   Uji Multikolinieritas (Khusus Regresi Berganda)
Uji Multikolinieritas digunakan untuk menguji apakah model regresi ditemukan adanya korlasi
antar variabel independen. Model regseri yang baik seharusnya tidak terjadi korelasi diantara
variabel independen. Ada beberapa metode pengujian yang bisa digunakan untuk mendeteksi
ada atau tidaknya multikolinieritas, diantaranya :
a) Dengan melihat nilai inflation factor (VIF) pada model regresi. Menurut Santoso (2001), pada
   umumnya jika VIF lebih dari 5, maka variabel tersebut mempunyai persoalan
   multikolilieritas dengan variabel bebas lainnya.
b) Dengan membandingkan nilai koefisien determinasi individula (r2) dengan nilai determinasi
   serentak (R2).
c) Dengan melihat eigen value dan condition index.
Jika dari hasil pengujian terdapat multikolinieritas antar variabel independen, penanggulangan
yang dapat dilakukan diantaranya :
a) Memanipulasi salah satu variabel bebas X dalam X lainnya
b) Memperbesar ukuran sampel
c) Melakukan transformasi data atau variabel
d) Menggabungkan data cross-section dengan data deret waktu
e) Membuang variabel X yang mengakibatkan multikolinear tinggi sepanjang tidak mengganggu
   teori dan ketentuan yang berlaku
f) Menggunakan Analisis Regresi Rigde


CONTOH KASUS
REGRESI LINIER BERGANDA

Penelitian mengenai prestasi kerja, dinyatakan dalam indeks prestasi (Y), terhadap 15 orang
pegawai telah dilakukan yang ditinjau dari skor tes kemampuan teoritis pada waktu masuk
diterima menjadi pegawai (X1) dan skor tes keterampilan atau kemampuan praktis (X2). Tujuan
penelitian ini ingin melihat hubungan dan pertautan antara X1 dan X2 sebagai prediktor dan Y
sebagai respon. Karena ada dugaan kuat bahwa prestasi kerja dapat diramalkan oleh
kemampuan dan keterampilan. Data yang diperoleh adalh sebagai berikut :


Modul SPSS                                                                                   - 47 -
Bambang Ruswandi, M.Stat
                                                                                  Statistika

                       No.        Y            X1           X2
                        1         10           69           41
                        2         11           70           43
                        3         12           71           46
                        4         15           77           47
                        5         11           71           45
                        6         12           75           48
                        7         13           78           49
                        8         14           79           48
                        9         15           76           49
                       10         18           80           48
                       11         15           82           49
                       12         14           81           52
                       13         13           82           42
                       14         15           84           40
                       15         18           84           39
Lakukan analisis regresi linier terhadap data tersebut.
 Klik Analyze, kemudian pilih submenu Regression, sesuai kasus pilih Linear.., maka tampak
  layar :




 Pindahkan variabel tergantung yaitu Indeks Prestasi ke kolom Dependent.
 Pindahkan variabel bebas (prediktor) yaitu Kemampuan Teoritis dan Praktis ke kolom
  Independent (s).
 Method atau cara memasukkan variabel. Metode ini bermacam-macam, seperti
   Enter, yaitu prosedur pemilihan variabel di mana semua variabel dalam blok dimasukkan
      dalam perhitungan.
   Remove,
   Stepwise, merupakan metode regresi reduksi bertahap, berfungsi untuk menambahkan
      atau mengeluarkan variabel-variabel individu, sesuai dengan kriteria yang ditentukan
      pada kotak options.
   Backward, merupakan metode yang akan mengeluarkan variabel-variabel individu sesuai
      yang dipilih pada options.
   Forward, merupakan metode yang berfungsi untuk menambahkan variabel- variabel
      individu.
 Pilihan WLS (Weight Least Square) berfungsi untuk melakukan pembobotan terhadap
  variabel yang dikehendaki. Dengan WLS akan memberikan bobot pengamatan yang berbeda.


Modul SPSS                                                                             - 48 -
Bambang Ruswandi, M.Stat
                                                                                     Statistika
 Selection Variable berguna untuk memilih atau membatasi jumlah case-case tertentu dari
  suatu variabel yang akan diikutsertakan dalam analisis. Jika ingin menyeleksi case-case
  tertentu yang akan dianalisis, masukkan variabel tertentu ke kotak selection variable, lalu
  klik Rule maka akan tampak layar :




   Pada kotak Set-Rule terdapat pilihan diantaranya : equal to (=), not equal to (≠), less than
   (<), less than or equal to (<=) dan greatr than (>).
 Klik Option sehingga tampak layar :




   Untuk Stepping Method Criteria, digunakan uji F yang mengambil standar angka
     probabilitas sebesar 5%. Melalui pilihan ini suatu variabel akan dimasukkan jika tingkat
     signifikan dari F lebih kecil dari harga entry, dan akan dikeluarkan jika tingkat
     signifikannya lebih besar dari harga Removal. Pilih pilihan ini.
   Untuk Use F Value, dengan pilihan ini, suatu variabel akan dimasukkan jika harga F lebih
     besar dari harga entry, dan akan dikeluarkan jika harga F lebih kecil dari harga Removal.
   Pilihan default Include constant in equation atau menyertakan konstanta tetap dipilih.
   Pada kotak Missing Values terdapat tiga pilihan, yaitu :
      Exclude cases listwise, menganalisis kasus yang hanya memiliki harga valid dari
        semua variabel.
      Exclude cases pairwise, menganalisis koefisien korelasi dari seluruh kasus yang
        berharga valid dari dua variabel yang dikorelasikan.
      Replace with mean, menggantikan missing value dengan mean variabel.
  Karena tidak ada data yang hilang, maka untuk Missing Values biarkan default seperti awal.
 Klik Statistics sehingga tampak layar : (pilihan ini berkenaan dengan perhitungan statistik
  regresi yang akan digunakan.




Modul SPSS                                                                                - 49 -
Bambang Ruswandi, M.Stat
                                                                                     Statistika
   Pengisian : Regression Coefficient atau perlakuan koefisien regresi, tetap aktifkan
      pilihan estimate atau taksiran (default dari SPSS).
   klik pilihan Descriptive pada kolom sebelah kanan, serta tetap aktifkan Model fit.
   Colinearity diagnostic, berguna untuk mendeteksi asumsi multikolinieritas pada kasus
      regresi berganda dengan menggunakan nilai VIF
   Residuals, klik pada Casewise diagnostics dan dari situ pilih all cases untuk melihat
      pengaruh regresi terhadap semua daerah.
   Durbin-Watson, digunakan untuk mendeteksi asumsi autokorelasi
 Pilih kolom Plots atau berhubungan dengan gambar/grafik untuk regresi sehingga tampak di
  layar:




    DEPENDENT (Variabel dependen)
    ZPRED (standarized predicted values), merupakan nilai-nilai prediksi yang terstandarisir.
    ZRESID (standarized residual), merupakan residual yang terstandarisir.
    DRESID (deleted residual)
    ADJPRED (adjusted predicted values), merupakan harga prediktor yang disesuaikan.
    SRESID (studentized residuals).
    ADRESID (studentized deleted residuals).
Pada kotak Standard Residual Plots, terdapat 2 pilihan plot :
    Histogram, untuk menampilkan distribusi dari residual yang terstandarisir.
    Normal Probability Plots, untuk membandingkan distribusi residual yang
      terstandarisasi dengan distribusi normal.
   Direncanakan ada tiga plot (gambar) sehubungan dengan analisis regresi :
   1. Klik pilihan SDRESID dan masukkan ke pilihan Y. lalu klik sekali lagoi pada pilihan ZPRED
      dan masukkan ke pilihan X. setelah kedua variabel Y dan X terisi, klik tombol Next untuk
      melanjutkan pengisian plot kedua.
   2. Tampak variabel Y dan X kosong kembali. sekarang klik pilihan ZPRED dan masukkan ke
      pilihan Y. lalu klik sekali lagi pada pilihan DEPENDENT dan masukkan ke pilihan X.
   3. Untuk plot ketiga, pada pilihan Standardized Residual Plots, klik pada Normal
      Probability Plot.
Kotak pilihan Produce all partial plots digunakan untuk menghasilkan diagram-diagram
pencar dari residual pada masing-masing variabel independent dengan residual variabel
dependent.
Klik continue untuk meneruskan.
Tekan OK untuk mengakhiri pengisian prosedur analisis.

Jawaban :
    Model yang diajukannya adalah sebagai berikut :
      ˆ ˆ      ˆ        ˆ
     Y   0  1 X 1   2 X 2
      Adapun hasil outputnya diperoleh sebagai berikut :




Modul SPSS                                                                                - 50 -
Bambang Ruswandi, M.Stat
                                                                                                    Statistika

                                      Variables Entered/Removedb


                                                             Variables
                       Model       Variables Entered         Remov ed       Method
                       1         Skor Keterampilan,
                                                  a                    .   Enter
                                 Skor Kemampuan
                          a. All requested v ariables entered.
                          b. Dependent Variable: Indeks Prestasi

Dengan menggunakan Metode Enter, semua variabel yang ada dimasukkan ke dalam model yang
diajukan tanpa melihat dia berpengaruh signifikan ataupun tidak.
                                             Model Summaryb

                                                   Adjusted      St d. Error of      Durbin-
              Model         R         R Square     R Square      the Estimate        Wat son
              1              .784a        .615          .551             1.591           1.269
                  a. Predictors: (Constant), Skor Keterampilan, Skor Kemampuan
                  b. Dependent Variable: Indeks Prestasi

Dari table di atas dapat diperoleh beberapa keterangn sebagai berikut :
- Angka R sebesar 0.784 yang menunjukkan bahwa korelasi (keeratan hubungan) antara
  Indeks Prestasi dengan Skor Keterampilan dan Skor Kemampuan adalah erat (Kriteria
  Guilford, 1956)
- Koefisien determinasi dapat dilihat pada R square sebesar R2 = (0.784 x 0.784) = 0.615 yang
  berarti bahwa 61.5 % variasi dari indeks prestasi bisa dijelaskan oleh variasi dari kedua
  variable independennya. Sedangkan sisanya sebesar 38.5 % (100% - 61.5%) dijelaskan oleh
  sebab-sebab lain yang tidak disertakan dalam analisis. (Catatan : apabila jumlah variable
  independent lebih dari dua, maka lebih baik digunakan Adjusted R Square)
- Standard Error of Estimate (SSE) adalah 1.591 yang menunjukkan besarnya penyimpangan
  yang mungkin terjadi.
                                                 ANOVAb

                                     Sum of
          Model                      Squares       df        Mean Square          F        Sig.
          1         Regression         48.574            2        24.287          9.600     .003a
                    Residual           30.360           12         2.530
                    Total              78.933           14
            a. Predictors: (Const ant), Skor Keterampilan, Skor Kemampuan
            b. Dependent Variable: Indeks Prest asi
    -
Tabel diatas menunjukkan statistik yang digunakan untuk uji secara overall (melibatkan semua
variable indepennya) dengan rumusan hipotesis sebagai berikut :
H0 : 1 = 2 = 0 (variable independent tidak memberikan pengaruh terhadap variable
      dependennya)
H1 : paling sedikit ada satu variable independent yang memmberikan pengaruh terhadap
      variabel dependennya
Resiko kekeliruan yang diajukan sebesar 5 % (  = 5 %)
      Ternyata pada table Anova di atas diperoleh F hitung sebesar 9.600 dengan tingkat
signifikansi 0.003. Karena tingkat signifikansi tersebut jauh lebih kecil dari  = 0.05, maka H0
ditolak yang menunjukkan bahwa pengujiannya signifikan, yaitu dengan resiko kekeliruan 5 %
maka paling sedikit ada satu variable independent yang memberikan pengaruh terhadap
variabel dependennya.



Modul SPSS                                                                                               - 51 -
Bambang Ruswandi, M.Stat
                                                                                                    Statistika
     Karena pengujian secara overall menunjukkan adanya pengaruh dari variable
independennya, maka tugas selanjutnya adalah ingin diketahui variable mana saja yang secara
nyata memberikan pengaruh tersebut. Hal ini bisa dilakukan melalui pengujian secara individu
untuk masing- masing variable independent yang ada dengan rumusan hipotesis sebagai berikut
     H0 : i = 0
     H1 : i  0
Pengambilan keputusan didasarkan atas dua metode:
1. Berdasarkan perbandingan nilai thitung dengan ttabel di mana µ1=µ2
       Jika |thitung| > ttabel, maka H0 ditolak
       Jika |thitung| < ttabel, maka H1 diterima
2. Berdasarkan nilai probabilitas dengan α = 0,05 :
      Jika probabilitas > 0,05 , maka H0 diterima
      Jika probabilitas < 0,05 , maka H1 ditolak

Dari output diperoleh sebagai berikut :
                                                  Coeffi ci entsa


                                         Unstandardized             St andardized
                                          Coef f icients            Coef f icients
        Model                             B          St d. Error        Beta            t       Sig.
        1       (Constant)              -16.045           8.121                       -1.976      .072
                Skor Kemampuan             .362             .083               .781    4.365      .001
                Skor Keterampilan          .039             .110               .063      .354     .729
          a. Dependent Variable: Indeks Prest asi

a.   Menguji signifiknasi koefisien β1 (Skor Kemampuan) pada model regresi :
     Berikut adalah hipotesis yang diajukan :
     H0 : β1 = 0 (koefisien β1 (Skor Kemampuan) tidak signifikan)
     H1 : β1 ≠ 0 (koefisien β1 (Skor Kemampuan) signifikan)
     Terlihat bahwa thitung untuk koefisien Skor Kemampuan adalah 4.465, Sedang ttabel bisa
     didapat pada tabel t-test, dengan α = 0.05, karena digunakan hipotesis dua arah, ketika
     mencari ttabel, nilai α dibagi dua menjadi 0.025, dan df = 13 (didapat dari rumus n-2, dimana
     n adalah jumlah data, 15-2=13). Didapat ttabel adalah 2.1604.
     Oleh karena thitung > ttabel, (4.465 > 2.1604), maka H0 ditolak, sehingga dapat disimpulkan
     bahwa koefisien Skor Kemampuan berpengaruh signifikan terhadap Indeks Prestasi.
     Dengan menggunakan uji probabilitas, Terlihat bahwa nilai probabilitas pada kolom Sig
     adalah 0.001 atau probabilitas di bawah 0.05 (0.001 < 0.05). Dengan demikian H0 ditolak,
     sehingga mempunyai kesimpulan yang sama dengan uji t yaitu koefisien Skor Kemampuan
     berpengaruh signifikan terhadap Indeks Prestasi.
b. Menguji signifiknasi koefisien β2 (Skor Keterampilan) pada model regresi :
   Berikut adalah hipotesis yang diajukan :
   H0 : β2 = 0 (koefisien β2 (Skor Keterampilan) tidak signifikan)
   H1 : β2 ≠ 0 (koefisien β2 (Skor Keterampilan) signifikan)
   Terlihat bahwa thitung untuk koefisien Skor Keterampilan adalah 0.354, Sedang ttabel bisa
   didapat pada tabel t-test, dengan α = 0.05, karena digunakan hipotesis dua arah, ketika
   mencari ttabel, nilai α dibagi dua menjadi 0.025, dan df = 13 (didapat dari rumus n-2, dimana
   n adalah jumlah data, 15-2=13). Didapat ttabel adalah 2.1604.
   Oleh karena thitung < ttabel, (0.354 < 2.1604), maka H0 diterima, sehingga dapat disimpulkan
   bahwa koefisien Skor Keterampilan tidak berpengaruh signifikan terhadap Indeks Prestasi.
   Dengan menggunakan uji probabilitas, Terlihat bahwa nilai probabilitas pada kolom Sig
   adalah 0.729 atau probabilitas di atas 0.05 (0.729 > 0.05). Dengan demikian H0 diterima,
   sehingga mempunyai kesimpulan yang sama dengan uji t yaitu koefisien Skor Keterampilan
   tidak berpengaruh signifikan terhadap Indeks Prestasi.


Modul SPSS                                                                                               - 52 -
Bambang Ruswandi, M.Stat
                                                                                                       Statistika
Oleh karena ada salah satu variable yang tidak berpengaruh secara nyata, maka proses analisis
diulang kembali dengan tanpa melibatkan variable yang tidak berpengaruh tersebut. Adapun
hasil output yang diperolehnya adalah sebagai berikut :
                                              Model Summaryb

                                                             Adjusted      St d. Error of
                      Model         R         R Square       R Square      the Estimate
                      1              .782a        .611            .581             1.536
                         a. Predictors: (Constant), Skor Kemampuan
                         b. Dependent Variable: Indeks Prestasi

Dari table di atas dapat diperoleh beberapa keterangn sebagai berikut :
- Angka R sebesar 0.782 yang menunjukkan bahwa korelasi (keeratan hubungan) antara
  Indeks Prestasi dengan Skor Kemampuan adalah erat (Kriteria Guilford, 1956)
- Koefisien determinasi dapat dilihat pada R square sebesar R2 = (0.782 x 0.782) = 0.611 yang
  berarti bahwa 61.1 % variasi dari indeks prestasi bisa dijelaskan oleh variasi dari variable
  independennya. Sedangkan sisanya sebesar 38.9 % (100% - 61.1%) dijelaskan oleh sebab-
  sebab lain yang tidak disertakan dalam analisis.
- Standard Error of Estimate (SSE) adalah 1.536 yang menunjukkan besarnya penyimpangan
  yang mungkin terjadi
                                                   ANOVAb

                                   Sum of
           Model                   Squares         df        Mean Square          F         Sig.
           1       Regression        48.256              1        48.256         20.449        .001a
                   Residual          30.677             13         2.360
                   Total             78.933             14
             a. Predictors: (Const ant), Skor Kemampuan
             b. Dependent Variable: Indeks Prest asi

Tabel diatas menunjukkan statistik yang digunakan untuk uji secara overall (melibatkan semua
variable indepennya) dengan rumusan hipotesis sebagai berikut :
H0 :  1 = 0 (variable independent tidak memberikan pengaruh terhadap variable dependennya)
H1 : paling sedikit ada satu variable independent yang memberikan pengaruh terhadap variabel
       dependennya
Resiko kekeliruan yang diajukan sebesar 5 % (  = 5 %)
      Ternyata pada table Anova di atas diperoleh F hitung sebesar 20.449 dengan tingkat
signifikansi 0.001. Karena tingkat signifikansi tersebut jauh lebih kecil dari  = 0.05, maka H0
ditolak yang menunjukkan bahwa pengujiannya signifikan, yaitu dengan resiko kekeliruan 5 %
maka paling sedikit ada satu variable independent yang memberikan pengaruh terhadap
variabel dependennya.
      Karena pengujian secara overall menunjukkan adanya pengaruh dari variable
independennya, maka tugas selanjutnya adalah ingin diketahui variable mana saja yang secara
nyata memberikan pengaruh tersebut. Hal ini bisa dilakukan melalui pengujian secara individu
untuk masing- masing variable independent yang ada dengan rumusan hipotesis sebagai berikut
     H0 : i = 0
     H1 : i  0
Pengambilan keputusan didasarkan atas dua metode:
1. Berdasarkan perbandingan nilai thitung dengan ttabel di mana µ1=µ2
         Jika |thitung| > ttabel, maka H0 ditolak
         Jika |thitung| < ttabel, maka H1 diterima
2. Berdasarkan nilai probabilitas dengan α = 0,05 :
         Jika probabilitas > 0,05 , maka H0 diterima
         Jika probabilitas < 0,05 , maka H1 ditolak

Modul SPSS                                                                                                  - 53 -
Bambang Ruswandi, M.Stat
                                                                                             Statistika

Dari output diperoleh sebagai berikut :
                                               Coeffi cientsa


                                       Unstandardized           St andardized
                                        Coef f icients          Coef f icients
      Model                            B         St d. Error         Beta         t       Sig.
      1       (Constant)             -14.287          6.209                      -2.301      .039
              Skor Kemampuan            .363           .080               .782    4.522      .001
        a. Dependent Variable: Indeks Prestasi

Menguji signifiknasi koefisien β1 (Skor Kemampuan) pada model regresi :
Berikut adalah hipotesis yang diajukan :
    H0 : β1 = 0 (koefisien β1 (Skor Kemampuan) tidak signifikan)
    H1 : β1 ≠ 0 (koefisien β1 (Skor Kemampuan) signifikan)
Terlihat bahwa thitung untuk koefisien Skor Kemampuan adalah 4.522, Sedang ttabel bisa didapat
pada tabel t-test, dengan α = 0.05, karena digunakan hipotesis dua arah, ketika mencari ttabel,
nilai α dibagi dua menjadi 0.025, dan df = 13 (didapat dari rumus n-2, dimana n adalah jumlah
data, 15-2=13). Didapat ttabel adalah 2.1604.
Oleh karena thitung > ttabel, (4.522 > 2.1604), maka H0 ditolak, sehingga dapat disimpulkan bahwa
koefisien Skor Kemampuan berpengaruh signifikan terhadap Indeks Prestasi.
Dengan menggunakan uji probabilitas, Terlihat bahwa nilai probabilitas pada kolom Sig adalah
0.001 atau probabilitas di bawah 0.05 (0.001 < 0.05). Dengan demikian H0 ditolak, maka
mempunyai kesimpulan yang sama dengan uji t yaitu koefisien Skor Kemampuan berpengaruh
signifikan terhadap Indeks Prestasi.

        Sehingga dari hasil perhitungan tersebut diperoleh suatu model regresi taksiran sebagai
berikut :
                                      ˆ
                                      Y   14.287  0.363 X1
Dari model di atas dapat dilihat bahwa ternyata skor kemampuan memberikan pengaruh yang
positif. Hal ini menunjukkan bahwa semakin bertambah kemampuan pekerja, maka indeks
prestasinya akan semakin bertambah pula.
Pengujian Asumsi Regresi Linear
1. Uji Linearitas




Dari gambar di atas, menunjukkan hubungan antara variable Independen (Skor Kemampuan
(X)) dengan variabel dependennya (Indeks Prestasi (Y)), tampak bahwa terdapat kecendrungan


Modul SPSS                                                                                          - 54 -
Bambang Ruswandi, M.Stat
                                                                                     Statistika
hubungan linear antara variabel Independen dengan variabel dependennya yang berbanding
lurus. Sehingga hal tersebut mengakibatkan semakin meningkat Skor Kemampuan maka
semakin besar pula Indeks Prestasi. Hal ini bisa dilihat dengan memperhatikan titik pengamatan
(Observed) mengikuti arah garis Linear (garis yang bergerak dari kiri bawah ke kanan atas).
2.   Uji Normalitas




Berdasarkan Normal Probability Plot of Residual, diketahui bahwa residual membentuk suatu
pola garis lurus, sehingga bisa disimpulkan bahwa residual berdistribusi normal.
Berikut ini adalah hasil uji Kolmogorov Smirnov terhadapa data residual menggunakan software
SPSS13 :
                                  One-Sample Kol mogorov-Smirnov Test

                                                                   Unstandardized
                                                                     Residual
                      N                                                        15
                      Normal Paramet ers a,b    Mean                    .0000000
                                                St d. Dev iation      1.48028293
                      Most Extreme              Absolute                     .197
                      Dif f erences             Positiv e                    .197
                                                Negativ e                   -.147
                      Kolmogorov -Smirnov Z                                  .761
                      Asy mp. Sig. (2-tailed)                                .608
                        a. Test distribution is Normal.
                        b. Calculated f rom dat a.

Berikut adalah hipotesisnya :
H0 : F(x) = F0(x), dengan F(x) adalah fungsi distribusi frekuensi hasil pengamatan, dan F0(x)
     adalah distribusi frekuensi harapan (teoritis) dalam artian residual berdistribusi normal.
H1 : F(x) ≠ F0(x) atau distribusi residual tidak normal
Pengambilan keputusan berdasarkan nilai probabilitas dengan α = 0,05 :
      Jika probabilitas > 0,05 , maka H0 diterima
      Jika probabilitas < 0,05 , maka H1 ditolak
Hasil uji normalitas pada data residual, berdasarkan uji kolmogorov-Smirnov diperoleh angka
probabilitas (Asymp. Sig. (2-tailed)) sebesar 0.608. Dengan menggunakan taraf signifikansi
alpha 5 % atau (0.05), maka diketahui nilai probabilitas 0.608 lebih besar dari 0.05 (0.608 >
0.05), maka H0 diterima, sehingga dapat disimpulkan bahwa data berdistribusi normal.
Kesimpulan tersebut sama seperti pengujian pada Normal Probability Plot of Residual.

Modul SPSS                                                                                - 55 -
Bambang Ruswandi, M.Stat
                                                                                               Statistika
3. Uji Heteroskedastisitas




Dari grafik scatterplots terlihat bahwa titik-titik dari data menyebar secara acak serta tersebar
baik di atas maupun di bawah angka nol pada sumbu Y dan tidak membentuk suatu pola
tertentu. Hal ini dapat disimpulkan bahwa tidak terjadi heteroskedastisitas pada model regresi,
sehingga model regresi layak digunakan untuk memprediksi Indeks Prestasi.
Analisis dengan grafik plot memiliki kelemahan yang cukup signifikan oleh karena jumlah
pengamatan mempengaruhi hasil ploting. Semakin sedikit jumlah pengamatan semakin sulit
menginterpretasikan hasil grafik plot. Oleh karena itu diperlukan uji statistik yang lebih dapat
menjamin kekurangan hasil. Uji statistik yang dipakai adalah Uji Breusch-Pagan, berikut adalah
pengujiannya :
Hasil regresi (Tabel Anova) antara variabel dependen Indeks Prestasi (Y) dengan variabel
independen Skor Kemampuan (X1) :
                                                   ANOVAb

                                   Sum of
           Model                   Squares         df        Mean Square    F       Sig.
           1       Regression        48.256              1        48.256   20.449      .001a
                   Residual          30.677             13         2.360
                   Total             78.933             14
             a. Predictors: (Const ant), Skor Kemampuan
             b. Dependent Variable: Indeks Prest asi

Hasil regresi (Tabel Anova) antara variabel dependen Ln (kuadrat dari residual hasil regresi)
dengan variabel independen Skor Kemampuan (X1) :
                                                   ANOVAb

                                   Sum of
          Model                    Squares         df        Mean Square    F       Sig.
          1        Regression        13.326              1        13.326    5.769      .032a
                   Residual          30.029             13         2.310
                   Total             43.354             14
             a. Predictors: (Const ant), Skor Kemampuan
             b. Dependent Variable: LN(Kuadrat Residual)




Modul SPSS                                                                                          - 56 -
Bambang Ruswandi, M.Stat
                                                                                           Statistika
                         2
         SSR  SSE 
      
       2
            :     
          2  n 
    SSR = Sum of Square Regression
    SSE = Sum of Square Error (Residual)
    n = Jumlah sample

Dari hasil output di atas, nilai SSR diambil dari Sum of Square Regression antara Ln(kuadarat
residual) dengan variable X1 yaitu sebesar = 13.326
Nilai SSE diambil dari Sum of Square Error (Residual) antara Y dengan variable X1 yaitu sebesar
= 30.677
     Sehingga perhitungan Chi-Square nya adalah sebagai berikut :
                              2
          13.326  30.677 
      
       2
                 :       
             2     15 
          6.663
     2         1.593
          4.183
Dari hasil perhitungan didapatkan nilai  hitung  1.593 , maka dicari nilai tabel (0.05,2)  5.99 .
                                          2                                    2


Karena  hitung lebih kecil dari pada tabel (0.05,2) (1.593 < 5.99) maka bisa disimpulkan bahwa
         2                              2


varians dari data adalah konstan sehingga dapat disimpulkan tidak terjadi heteroskedastisitas.

4. Uji Multikolinieritas
                                                  Coeffi cientsa



                                                             Collinearity Statistics
                             Model                           Tolerance       VI F
                             1          Skor Kemampuan           1.000       1.000
                                        Skor Keterampilan        1.000       1.000
                                  a. Dependent Variable: Indeks Prestasi

Dari hasil di atas, dapat diketahui bahwa nilai VIF kedua variabel yaitu Skor Kemampuan dan
Skor Keterampilan adalah 1.000 lebih kecil dari 5, sehingga bisa diduga bahwa antar variabel
independen tidak terjadi multikolinieritas.




Modul SPSS                                                                                      - 57 -
Bambang Ruswandi, M.Stat
                                                                                             Statistika

                                              BAB VII
                                  UJI VALIDITAS DAN RELIABILITAS

7.1 UJI VALIDITAS

        Validitas menunjukkan ukuran yang benar-benar mengukur apa yang akan diukur. Jadi
dapat dikatakan semakin tinggi validitas suatu alat test, maka alat test tersebut semakin
mengenai pada sasarannya, atau semakin menunjukkan apa yang seharusnya diukur. Suatu test
dapat dikatakan mempunyai validitas tinggi apabila test tersebut menjalankan fungsi ukurnya,
atau memberikan hasil ukur sesuai dengan makna dan tujuan diadakannya test tersebut. Jika
peneliti menggunakan kuesioner di dalam pengumpulan data penelitian, maka item-item yang
disusun pada kuesioner tersebut merupakan alat test yang harus mengukur apa yang menjadi
tujuan penelitian. Salah satu cara untuk menghitung validitas suatu alat test yaitu dengan
melihat daya pembeda item (item discriminality). Daya pembeda item adalah metode yang paling
tepat digunakan untuk setiap jenis test. Daya pembeda item dalam penalitian ini dilakukan
denan cara : “ korelasi item-total “
        Korelasi item-total yaitu konsistensi antara skor item dengan skor secara keseluruhan
yang dapat dilihat dari besarnya koefisien korelasi antara setiap item dengan skor keseluruhan,
yang dalam penelitian ini menggunakan koefisien korelasi Rank – Spearman dengan langkah-
langkah perhitungan sebagai berikut :
Koefisien Korelasi Rank Sperman
   Apabila item yang dihadapi berbentuk skala ordinal (skala sikap), maka untuk nilai korelasi
rank spearman pada item ke-i adalah :
           6 di2
rs  1 
           n  n  1
Rumus diatas digunakan apabila tidak terdapat data kembar, atau terdapat data kembar namun
sedikit. Apabila terdapat banyak data kembar digunakan rumus berikut ini
                                                 n 1 
                                                           2

                         R  X i  R Yi   n  2 
                                                      
rs                                    1                       1
                       n 1   
                               2 2
                                                   n 1 
                                                         2 2

         R  Xi   n          R Yi   n 
                   2                         2
                                                        
                       2                    2   
dimana : R(X) = Ranking nilai X
          R(Y) = Ranking nilai Y
        Validitas menunjukkan sejauh mana relevansi pertanyaan terhadap apa yang ditanyakan
atau apa yang ingin diukur dalam penelitian. Tingkat validitas kuesioner diukur berdasarkan
koefisien validitas yang dalam hal ini menggunakan koefisien korelasi item-total yang
terkoreksi. Dalam penentuan layak atau tidaknya suatu item yang akan digunakan, biasanya
dilakukan uji siginifikansi 0.05, artinya suatu item dianggap valid jika berkorelasi signifikan
terhadap skor total. Menurut Kaplan suatu pertanyaan dikatakan valid dan dapat mengukur
variabel penelitian yang dimaksud jika nilai koefisien validitasnya (koefisien korelasi) lebih dari
atau sama dengan 0,3.
     “ Not all validity coefficient are the same value, and there are no hard fast rule obout how
     large the coefficient must be in order to be meaningful. In practice, it is rare to see a validity
     coefficient larger than 0.6, and validity coefficient in the range of 0.3 to 0.4 are commonly
     considered high.”
    (Robert M. Kaplan & Dennis P. Saccuzzo, Phsycological Testing principles, application,
    and issues; Brooks/Cole Publishing Company, Pacific Grove, California,1993 p: 141).
        Tetapi menurut Azwar (1999), jika jumlah item belum mencukupi kita bisa menurunkan
sedikit batas kriteria 0.3 menjadi 0.25, namun menurunkan batas di bawah 0.2 tidak disarankan.


Modul SPSS                                                                                        - 58 -
Bambang Ruswandi, M.Stat
                                                                                            Statistika
Untuk pembahasan ini dilakukan uji signifikansi dengan kriteria menggunakan r kritis pada taraf
signifikan 0.05 atau ukuran standar lain dalam penelitian.
        Uji Validitas kuesioner dengan output SPSS dapat dilakukan dengan memperhatikan
bagian Corrected Item- Total Correlation. Pengujian menggunakan uji dua sisi dengan taraf
signifikan 0.05, kriteria pengujiannya adalah sebagai berikut :
      Jika r hitung ≥ r tabel, maka instrumen atau item pertanyaan berkorelasi signifikan
        terhadap skor total (item valid)
     Jika r hitung < r tabel, maka instrumen atau item pertanyaan tidak berkorelasi signifikan
      terhadap skor total (item tidak valid)

7.2 UJI RELIABILITAS
         Reliabilitas artinya adalah tingkat keterpercayaan hasil suatu pengukuran. Pengukuran
yang memiliki reliabilitas tinggi, yaitu pengukuran yang mampu memberikan hasil ukur yang
terpercaya (reliabel). Reliabilitas merupakan salah satu ciri atau karakter utama intrumen
pengukuran yang baik. Kadang-kadang reliabilitas disebut juga sebagai keterpercayaan,
keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya, namun ide pokok dalam konsep
reliabilitas adalah sejauh mana hasil suatu pengukuran dapat dipercaya, artinya sejauh mana
skor hasil pengukuran terbebas dari kekeliruan pengukuran (measurement error).
         Tinggi rendahnya reliabilitas, secara empiris ditunjukkan oleh suatu angka yang disebut
koefisien reliabilitas. Walaupun secara teoritis, besarnya koefisien reliabilitas berkisar antara
0,00 – 1,00; akan tetapi pada kenyataannya koefisien reliabilitas sebesar 1,00 tidak pernah
dicapai dalam pengukuran, karena manusia sebagai subjek pengukuran psikologis merupakan
sumber kekeliruan yang potensial. Di samping itu walaupun koefisien korelasi dapat bertanda
positif (+) atau negatif (-), akan tetapi dalam hal reliabilitas, koefisien reliabilitas yang besarnya
kurang dari nol (0,00) tidak ada artinya karena interpretasi reliabilitas selalu mengacu kepada
koefisien reliabilitas yang positif.
         Teknik perhitungan koefisien reliabilitas yang digunakan disini adalah dengan
menggunakan Koefisien Reliabilitas Alpha yang dihitung dengan menggunakan rumus sebagai
berikut :
                       k
                            2 
                  Si 
             k               
                1  i 12
           k 1      S total 
                             
                             
dimana :
k adalah banyaknya butir pertanyaan
Si2 adalah varians dari item ke-i
S2total adalah total varians dari keseluruhan item
Bila koefisien reliabilitas telah dihitung, maka untuk menentukan keeratan hubungan bisa
digunakan kriteria Guilford (1956), yaitu :
        1.   kurang dari 0,20     : Hubungan yang sangat kecil dan bisa diabaikan
        2.   0,20 - < 0,40        : Hubungan yang kecil (tidak erat)
        3.   0,40 - < 0,70        : Hubungan yang cukup erat
        4.   0,70 - < 0,90        : Hubungan yang erat (reliabel)
        5.   0,90 - < 1,00        : Hubungan yang sangat erat (sangat reliabel)
        6.   1,00                 : Hubungan yang sempurna
        Dalam program SPSS akan dibahas uji yang sering digunakan yaitu metode Alpha
Cronbach’s. Uji signifikansi dilakukan pada taraf 0.05, artinya instrumen dikatakan valid bila
nilai alpha lebih besar dari r kritis product moment. Atau beberapa sumber menyatakan
beberapa batasan, menurut Sekaran (1992) reliabilitas kurang dari 0.6 adalah kurang baik, atau
menurut Kaplan (1993) “It has been suggested that reliability estimates in the range of 0.7 to 0.8
are good enough for most purposes in basic research.”

Modul SPSS                                                                                       - 59 -
Bambang Ruswandi, M.Stat
                                                                                  Statistika
Beberapa hal yang harus diperhatikan dalam uji reliabilitas :

   1. Kehomogenan latar belakang responden. Jika kelompok orang yang diuji heterogen
      maka nilai reliabilitas menjadi tinggi. Sedangkan jika homogen akan menyebabkan nilai
      yang rendah.
   2. Faktor kesungguhan responden untuk menjawab pertanyaan, sehingga memungkinkan
      jawaban yang bervariasi.
   3. Banyaknya pertanyaan yang diajukan. Semakin banyak pertanyaan dengan mengulang-
      ulang jenis pertanyaan yang sama menghasilkan reliabilitas yang tinggi.
   4. Kehomogenan dari pertanyaan yang sejenis. Sedapat mungkin pertanyaan yang diajukan
      mempunyai kata-kata yang sepadan.

Contoh Kasus

             Reps      P1    P2    P3   P4     P5   P6   P7     P8   P8    P10
              A         5     4     1    4      5    5    4      4    4     4
              B         4     5     3    4      5    5    4      4    5     5
              C         4     4     2    3      4    5    4      4    5     4
              D         2     3     3    2      2    2    2      4    4     3
              E         3     2     2    3      4    4    4      4    4     4
              F         2     3     2    5      4    4    4      3    4     4
              G         5     5     4    5      5    5    5      5    5     5
              H         4     4     1    4      4    4    4      4    5     5
               I        4     4     1    4      5    4    5      5    5     5
               J        4     4     2    3      3    2    5      4    4     2
              K         2     4     2    4      4    4    4      4    4     4
              L         4     5     2    5      5    5    5      4    5     5
              M         4     4     2    4      4    4    4      4    4     4
              N         3     5     4    5      5    5    5      5    5     5
              O         3     4     2    4      4    3    4      4    5     4

Prosedur SPSS

Dari menu pilih
       Analyze
               Scale
                       Reliability Analysis…

Masukkan seluruh item pernyataan yang mendukung ke kotak Items




Modul SPSS                                                                             - 60 -
Bambang Ruswandi, M.Stat
                                                                                             Statistika
Klik tab Statistics…
                Pilih Scale if item deleted pada Descriptive for




Klik Continue lalu OK.

Output SPSS

Reliability


                                          Item-Total Statisti cs

                                               Scale          Corrected      Cronbach's
                         Scale Mean if       Variance if      Item-Total    Alpha if Item
                         Item Deleted      Item Deleted       Correlation      Delet ed
                P1              35.47             27.695             .470             .879
                P2              35.00             26.429             .740             .855
                P3              36.80             30.886             .172             .901
                P4              35.07             26.495             .692             .859
                P5              34.80             25.314             .866             .845
                P6              34.93             24.924             .735             .855
                P7              34.80             27.743             .641             .864
                P8              34.87             30.267             .535             .873
                P9              34.47             29.552             .668             .867
                P10             34.80             26.314             .737             .855



                                          Reliabi lity Statisti cs

                                         Cronbach's
                                           Alpha        N of Items
                                                .878            10




Modul SPSS                                                                                        - 61 -
Bambang Ruswandi, M.Stat
                                                                                         Statistika


Uji Validitas

       Uji Validitas dilakukan dengan membandingkan nilai r hitung (Corrected Item- Total
Correlation) dengan r tabel, dengan kriteria sebagai berikut :
 Jika Nilai r hitung (Corrected Item- Total Correlation) > nilai r tabel maka Item Valid
 Jika Nilai r hitung (Corrected Item- Total Correlation) < nilai r tabel maka Item Tidak
  Valid
       Nilai r tabel dapat diperoleh dimana df = n-2. dalam hal ini n adalah jumlah sampel atau
responden. jumlah sampel (n) = 15, maka besarnya df = 15-2 = 13. Dengan alpha = 0.05, maka
didapat nilai r tabel = 0.514.
        Dari hasil output dapat dilihat untuk butir pertanyaan (P1, P3 dan P8) nilai r hitung lebih
kecil dari pada r tabel, maka untuk butir P1, P3 dan P8 item tidak valid. Sedangkan untuk butir
pertanyaan (P2, P4, P5, P6, P7, P9 dan P10) nilai r hitung lebih besar dari r tabel, maka untuk
butir pertanyaan P2, P4, P5, P6, P7, P9 dan P10 adalah Valid.
        Sehingga dapat disimpulkan bahwa dari 10 butir pertanyaan 3 diataranya tidak valid
(P1, P3 dan P8) dan 7 lainya adalah valid (P2, P4, P5, P6, P7, P9 dan P10)

Uji Reliabilitas

Untuk Uji Reliabilitas, dilakukan dengan melihat nilai Alpha Cronbach’s dengan kriteria sebagai
berikut :
 Jika Nilai Alpha Cronbach’s > 0.7 (Kaplan, 1993) maka konstruk Reliabel
 Jika Nilai Alpha Cronbach’s < 0.7 (Kaplan, 1993) maka konstruk Tidak Reliabel
Dari hasil output didapat nilai alpha 0.878 > 0.7, sehingga dapat disimpulkan seluruh konstruk
adalah reliabel.




Modul SPSS                                                                                    - 62 -
Bambang Ruswandi, M.Stat
                                                                                 Statistika

                                 DAFTAR PUSTAKA



Alhusni, Syahri. 2003. Aplikasi Statistik Praktis dengan SPSS 10. Graha Ilmu, Yogyakarta.

E.Walpole, Ronald. 1995. Pengantar Statistika. PT. Gramedia Pustaka Utama, Jakarta.

Ghozali, Imam. 2007. Aplikasi Analisis Multivariate dengan Program SPSS. Badan
      Penerbit UNDIP, Semarang.

Gujarati, damodar. 1998. Ekonometrika Dasar. Jakarta, Erlangga.

I. Levin Richard, et al. 2002. Pengambilan Keputusan Secara Kuantitatif. PT.Raja Grafindi
        Persada, Jakarta.

Nachrowi, D & Hardius Usman. 2002. Ekonometrika Untuk Analisis Ekonomi dan
      Keuangan. Lembaga Penerbit FEUI : Jakarta.

Nazir, Moh. 1995. Metode Penelitian. Ghalia Indonesia, Jakarta.

Siegel. Sidney. 1988. Statistik Nonparametrik untuk Ilmu-ilmu Sosial. PT.Gramedia,
       Jakarta.

Sudjana. 1996. Metoda Statistika. Tarsito, Bandung.

Santoso, Singgih. 2005. Menguasai Statistika di Era Informasi dengan SPSS 12. PT.Elex
      Medai Komputindo, Jakarta.

Santoso, Singgih. 2005. Menggunakan SPSS untuk Statistik Parametrik. PT.Elex Media
      Komputindo, Jakarta.

S Uyanto, Stanislaus. 2006. Pedoman Analisis Data dengan SPSS. Graha Ilmu, Yogyakarta.

Trihendradi, Cornelius. 2005. Step by Step SPSS 13 Analisis Data Statistik. ANDI.
      Yogyakarta.




Modul SPSS                                                                            - 63 -
Bambang Ruswandi, M.Stat

				
DOCUMENT INFO
Shared By:
Stats:
views:1165
posted:4/26/2011
language:Indonesian
pages:63
Description: ebook buatan dosen UIN jakarta.