validitas dan reabilitas

Document Sample
validitas dan reabilitas Powered By Docstoc
					Validitas Tes
Dalam kehidupan sehari-hari, manusia senantiasa dihadapkan pada masalah
keakuratan sebuah informasi. Informasi yang diterima manusia setiap hari sangat
banyak dengan sumber yang semakin beragam. Koran dan televisi adalah dua
sumber informasi utama saat ini. Dengan semakin banyaknya sumber-sumber
informasi yang senantiasa berkembang, maka muncul sebuah pertanyaan mendasar
tentang sejauhmana informasi yang diperoleh tersebut dapat dipercaya?

Dalam penelitian-penelitian sosial, keakuratan informasi yang diperoleh sangat
mempengaruhi keputusan yang akan diambil. Sayangnya, akurasi informasi dalam
penelitian-penelitian sosial tersebut tidak mudah diperoleh disebabkan sulitnya
mendapatkan operasionalisasi konsep mengenai variabel yang hendak diukur.
Untuk mengungkap aspek-aspek yang hendak diteliti, maka diperlukan alat ukur
yang baik dan berkualitas. Alat ukur tersebut dapat berupa skala atau tes. Sebuah
tes yang baik sebagaimana disampaikan oleh Syaifuddin Azwar (2006 : 2) harus
memiliki beberapa kriteria antara lain valid, reliable, standar, ekonomis dan praktis.
Dalam Standards for Educational and Psychological Testing validitas adalah "... the
degree to which evidence and theory support the interpretation of test scores
entailed by proposed uses of tests " (1999: 9). Sebuah tes dikatakan valid jika ia
memang mengukur apa yang seharusnya diukur (Allen & Yen, 1979: 95). Dalam
bahasa yang hampir sama Djemari Mardapi (2004: 25) menyatakan bahwa validitas
adalah ukuran seberapa cermat suatu tes melakukan fungsi ukurnya. Menurut Nitko
& Brookhart (2007: 38) kevalidan sebuah alat ukur tergantung pada bagaimana hasil
tes tersebut diinterpretasikan dan digunakan. Dalam pandangan Samuel Messick
(1989: 13) validitas merupakan penilaian menyeluruh dimana bukti empiris dan
logika teori mendukung pengambilan keputusan serta tindakan berdasarkan skor tes
atau model-model penilaian yang lain
Jika dikaitkan dengan bidang psikologi, penggunaan validitas dapat dijumpai dalam
tiga konteks yaitu validitas penelitian, validitas soal dan validitas alat ukur. Validitas
penelitian merupakan derajad kesesuaian hasil penelitian dengan keadaan
sebenarnya. Validitas soal berkaitan dengan kesesuaian antara suatu soal dengan
soal lain. Sedangkan validitas alat ukur merujuk pada kecermatan ukurnya suatu tes
(Sumadi Suryabrata, 2004: 40).
Menurut Allen & Yen (1979: 95) validitas tes dapat dibagi kedalam tiga kelompok
utama yaitu : (1) validitas isi (content validity), (2) validitas konstruk (construct
validity) dan (3) validitas kriteria (criterion related validity). Meskipun idealnya
validasi dapat dilakukan dengan memakai semua bentuk validitas tes tersebut, tetapi
pengembang tes dapat memilih bentuk validasi dengan melihat tujuan
pengembangan tes (Kumaidi, 1994: 58).
Validitas isi menunjuk pada sejauhmana isi perangkat soal tersebut mengukur apa
yang seharusnya diukur. Dalam kaitannya dengan kegiatan pembelajaran menurut
Djemari Mardapi (1996: 22) validitas ini adalah kesesuaian antara materi ujian dan
materi yang telah dipelajari. Pengujian validitas isi tidak melalui analisis statistik
melainkan analisis rasional yaitu dengan melihat apakah butir-butirnya telah sesuai
dengan batasan domain ukur yang telah ditetapkan sebelumnya.
Allen & Yen (1979: 95) membagi validitas isi kedalam dua kelompok yaitu face
validity (validitas muka) dan logical validity (validitas logis). Validitas muka dapat
dicapai jika tampilan tes tersebut telah meyakinkan untuk mengungkap atribut yang
hendak diukur. Adapun validitas logis menunjukkan sejauhmana isi tes
mengungkapkan representasi dari ciri-ciri atribut yang hendak diukur.
Validitas konstruk merujuk pada sejauhmana suatu tes mengukur suatu konstruk
teoretik atau trait yang hendak diukurnya (Allen & Yen, 1979: 108) konstruk dalam
pengertian ini adalah berkaitan dengan aspek-aspek psikologi seseorang khususnya
aspek kognitif, afektif dan psikomotor.
Ada beberapa cara yang bisa digunakan untuk menguji validitas konstruk. Misalnya
dengan melakukan pencocokan antara aspek-aspek berpikir yang terkandung dalam
tes hasil belajar dengan aspek-aspek berpikir yang hendak diungkap oleh tujuan
instruksional khusus. Pengujian yang lebih sederhana tentang validitas konstruk
adalah malalui pendekatan multi trait multi-method (Saifuddin Azwar 2003: 176).
Pendekatan ini akan menghasilkan bukti validitas diskriminan yang ditunjukkan
dengan rendahnya korelasi antar skor yang mengukur trait yang berbeda bila
digunakan metode yang sama dan validitas konvergen yang ditunjukkan oleh
tingginya korelasi skor-skor tes yang mengukur trait yang sama dengan
menggunakan metode yang berbeda.
Contoh mengenai estimasi koefisien validitas berdasarkan metode multitrait
multimethod adalah sebagaimana disampaikan Fred N. Kerlinger (1973:742) tentang
matriks hubungan antara sikap sosial. Ada dua instrument berbeda yang digunakan
untuk mengukur liberalisme (L) dan konservatisme (C) dalam hubungannya dengan
sikap sosial seseorang yaitu dengan pernyataan sikap biasa (metode 1) dan referen
(metode 2) menggunakan referensi-referensi sikap seperti sepatah kata atau frase
singkat. Korelasi antara kedua instrument tersebut disajikan dalam bentuk matriks
multitrait-multimethod berikut :




Dalam contoh tersebut secara teoritis dituntut adanya korelasi negative atau
mendekati nol antara L dan C. korelasi antara L1 dengan C1 adalah -0,07 serta
antara L2 dengan C2 adalah -0,09 yang berarti bahwa keduanya hampir selaras
dengan teorinya. Korelasi silang antara L dan C yakni korelasi antara L pada metode
1 dan C pada metode 2 atau antara L1 dan C2 adalah -0,37 dan ini lebih tinggi
daripada yang diprediksikan oleh teorinya (-0,30). Maka, dengan perkecualian
korelasi silang yang besarnya -0,37 antara L1 dan C2 validitas konstruk dalam skala
sikap itu terdukung.
Validitas kriteria merupakan validitas yang disusun berdasarkan kriteria yang telah
ada sebelumnya. Dalam validitas kriteria, kesahihan alat ukur dilihat dari
sejauhmana hasil pengukuran tersebut sama dengan hasil pengukuran alat lain
yang dijadikan kriteria. Biasanya, dalam pengukuran psikologis, yang dijadikan
kriteria, adalab hasil Pengukuran lain yang telah dianggap sebagai alat ukur yang
baik misalnya tes Stanford Binnet atau tes Weschler.
Validitas kriteria dibedakan menjadi dua macam yaitu berdasarkan kapan kriteria itu
dapat dimanfaatkan. Jika dimanfaatkan dalam waktu dekat maka disebut validitas
konkurent (concurrent validity) dan jika dimanfaatkan diwaktu yang akan datang
disebut validitas prediktif (predictive validity).
Untuk memperoleh validitas kriteria, diperlukan pengujian dengan menggunakan
korelasi. Validitas kriteria ditunjukkan dengan angka korelasi antara skor pada alat
yang dipergunakan dengan skor yang dihasilkan dari alat yang dijadikan kriteria.
Tetapi dalam ujian masuk perguruan tinggi misalnya, koefisien validitas ditunjukkan
dengan skor pada saat ujian masuk dengan skor yang diperoleh pada saat
seseorang telah belajar selama beberapa waktu tertentu.
Menurut Sumadi Suryabrata, (2004: 46) dalam menafsirkan koefisien validitas yang
didapat dari mengkorelasikan skor alat ukur dengan kriterianya sebaiknya dilakukan
melalui koefisien determinasi yaitu koefisien korelasi kuadrat. Jadi jika diperoleh
koefisien korelasi sebesar 0,5, maka koefisien determinasinya adalah sebesar 0,25.
semakin tinggi angka koefisien determinasi, maka semakin tinggi pula kecermatan
prediksinya.
Diposkan oleh Djunaidi Lababa di 00:20




Home About Me Statistik Pendidikan


Jumat, 2008 Maret 28

Pengukuran, Penilaian dan Evaluasi Pendidikan
a. Pengukuran

Pengukuran dapat diartikan dengan kegiatan untuk mengukur sesuatu. Pada
hakekatnya, kegiatan ini adalah membandingkan sesuatu dengan atau sesuatu yang
lain (Anas Sudijono, 1996: 3) Jika kita mengukur suhu badan seseorang dengan
termometer, atau mengukur jarak kota A dengan kota B, maka sesungguhnya yang
sedang dilakukan adalah mengkuantifikasi keadaan seseorang atau tempat kedalam
angka. Karenanya, dapat dipahami bahwa pengukuran itu bersifat kuantitatif

Maksud dilaksanakan pengukuran sebagaimana dikemukakan Anas Sudijono (1996:
4) ada tiga macam yaitu : (1) pengukuran yang dilakukan bukan untuk menguji
sesuatu seperti orang mengukur jarak dua buah kota, (2) pengukuran untuk menguji
sesuatu seperti menguji daya tahan lampu pijar serta (3) pengukuran yang dilakukan
untuk menilai. Pengukuran ini dilakukan dengan jalan menguji hal yang ingin dinilai
seperti kemajuan belajar dan lain sebagainya.
Dalam dunia pendidikan, yang dimaksud pengukuran sebagaimana disampaikan
Cangelosi (1995: 21) adalah proses pengumpulan data melalui pengamatan empiris.
Proses pengumpulan ini dilakukan untuk menaksir apa yang telah diperoleh siswa
setelah mengikuti pelajaran selama waktu tertentu. Proses ini dapat dilakukan
dengan mengamati kinerja mereka, mendengarkan apa yang mereka katakan serta
mengumpulkan informasi yang sesuai dengan tujuan melalui apa yang telah
dilakukan siswa.
Menurut Mardapi (2004: 14) pengukuran pada dasarnya adalah kegiatan penentuan
angka terhadap suatu obyek secara sistematis. Karakteristik yang terdapat dalam
obyek yang diukur ditransfer menjadi bentuk angka sehingga lebih mudah untuk
dinilai. aspek-aspek yang terdapat dalam diri manusia seperti kognitif, afektif dan
psikomotor dirubah menjadi angka. Karenanya, kesalahan dalam mengangkakan
aspek-aspek ini harus sekecil mungkin. Kesalahan yang mungkin muncul dalam
melakukan pengukuran khususnya dibidang ilmu-ilmu sosial dapat berasal dari alat
ukur, cara mengukur dan obyek yang diukur.

Pengukuran dalam bidang pendidikan erat kaitannya dengan tes. Hal ini
dikarenakan salah satu cara yang sering dipakai untuk mengukur hasil yang telah
dicapai siswa adalah dengan tes. Selain dengan tes, terkadang juga dipergunakan
nontes. Jika tes dapat memberikan informasi tentang karakteristik kognitif dan
psikomotor, maka nontes dapat memberikan informasi tentang karakteristik afektif
obyek.

b. Penilaian

Penilaian merupakan bagian penting dan tak terpisahkan dalam sistem pendidikan
saat ini. Peningkatan kualitas pendidikan dapat dilihat dari nilai-nilai yang diperoleh
siswa. Tentu saja untuk itu diperlukan sistem penilaian yang baik dan tidak bias.
Sistem penilaian yang baik akan mampu memberikan gambaran tentang kualitas
pembelajaran sehingga pada gilirannya akan mampu membantu guru
merencanakan strategi pembelajaran. Bagi siswa sendiri, sistem penilaian yang baik
akan mampu memberikan motivasi untuk selalu meningkatkan kemampuannya.

Dalam sistem evaluasi hasil belajar, penilaian merupakan langkah lanjutan setelah
dilakukan pengukuran. informasi yang diperoleh dari hasil pengukuran selanjutnya
dideskripsikan dan ditafsirkan. Karenanya, menurut Djemari Mardapi (1999: 8)
penilaian adalah kegiatan menafsirkan atau mendeskripsikan hasil pengukuran.
Menurut Cangelosi (1995: 21) penilaian adalah keputusan tentang nilai. Oleh karena
itu, langkah selanjutnya setelah melaksanakan pengukuran adalah penilaian.
Penilaian dilakukan setelah siswa menjawab soal-soal yang terdapat pada tes. Hasil
jawaban siswa tersebut ditafsirkan dalam bentuk nilai.

Menurut Djemari Mardapi (2004: 18) ada dua acuan yang dapat dipergunakan dalam
melakukan penilaian yaitu acuan norma dan acuan kriteria. Dalam melakukan
penilaian dibidang pendidikan, kedua acuan ini dapat dipergunakan. Acuan norma
berasumsi bahwa kemampuan seseorang berbeda serta dapat digambarkan
menurut kurva distribusi normal. Sedangkan acuan kriteria berasumsi bahwa apapun
bisa dipelajari semua orang namun waktunya bisa berbeda.
Penggunaan acuan norma dilakukan untuk menyeleksi dan mengetahui dimana
posisi seseorang terhadap kelompoknya. Misalnya jika seseorang mengikuti tes
tertentu, maka hasil tes akan memberikan gambaran dimana posisinya jika
dibandingkan dengan orang lain yang mengikuti tes tersebut. Adapun acuan kriteria
dipergunakan untuk menentukan kelulusan seseorang dengan membandingkan
hasil yang dicapai dengan kriteria yang telah ditetapkan terlebih dahulu. Acuan ini
biasanya digunakan untuk menentukan kelulusan seseorang. Seseorang yang
dikatakan telah lulus berarti bisa melakukan apa yang terdapat dalam kriteria yang
telah ditetapkan dan sebaliknya. Acuan kriteria, ini biasanya dipergunakan untuk
ujian-ujian praktek.
Dengan adanya acuan norma atau kriteria, hasil yang sama yang didapat dari
pengukuran ataupun penilaian akan dapat diinterpretasikan berbeda sesuai dengan
acuan yang digunakan. Misalnya, kecepatan kendaraan 40 km/jam akan memiliki
interpretasi yang berbeda apabila kendaraan tersebut adalah sepeda dan mobil.

c. Evaluasi

Pengukuran, penilaian dan evaluasi merupakan kegiatan yang bersifat hierarki.
Artinya ketiga kegiatan tersebut dalam kaitannya dengan proses belajar mengajar
tidak dapat dipisahkan satu sama lain dan dalam pelaksanaannya harus
dilaksanakan secara berurutan.

Evaluasi Menurut Suharsimi Arikunto (2004: 1) adalah kegiatan untuk
mengumpulkan informasi tentang bekerjanya sesuatu, yang selanjutnya informasi
tersebut digunakan untuk menentukan alternatif yang tepat dalam mengambil
keputusan. Dalam bidang pendidikan, evaluasi sebagaimana dikatakan Gronlund
(1990: 5) merupakan proses yang sistematis tentang mengumpulkan, menganalisis
dan menafsirkan informasi untuk menentukan sejauhmana tujuan pembelajaran
telah dicapai oleh siswa. Menurut Djemari Mardapi (2004: 19) evaluasi adalah
proses mengumpulkan informasi untuk mengetahui pencapaian belajar kelas atau
kelompok.

Dari pendapat di atas, ada beberapa hal yang menjadi ciri khas dari evaluasi yaitu:
(1) sebagai kegiatan yang sistematis, pelaksanaan evaluasi haruslah dilakukan
secara berkesinambungan. Sebuah program pembelajaran seharusnya dievaluasi
disetiap akhir program tersebut, (2) dalam pelaksanaan evaluasi dibutuhkan data
dan informasi yang akurat untuk menunjang keputusan yang akan diambil. Asumsi-
asumsi ataupun prasangka. bukan merupakan landasan untuk mengambil
keputusan dalam evaluasi, dan (3) kegiatan evaluasi dalam pendidikan tidak pernah
terlepas dari tujuan-tujuan pembelajaran yang telah ditetapkan sebelumnya. Karena
itulah pendekatan goal oriented merupakan pendekatan yang paling sesuai untuk
evaluasi pembelajaran.
Rabu, 2008 Maret 26

Penyusunan Instrumen Nontes
Teknis nontes adalah suatu alat penilaian yang biasanya dipergunakan untuk
mendapatkan informasi tertentu tentang keadaan peserta tes (Inggris: testee)
dengan tidak menggunakan tes. Hal ini berarti bahwa jawaban yang diberikan oleh
peserta tes tidak bisa dikategorikan sebagai jawaban benar atau salah sebagaimana
interpretasi jawaban tes. Dengan teknik nontes maka penilaian atau evaluasi hasil
belajar peserta didik dilakukan tanpa “menguji” peserta didik melainkan dilakukan
dengan cara tertentu.

Penilaian yang dilakukan dengan teknis nontes terutama bertujuan untuk
memperoleh informasi yang berkaitan dengan evaluasi hasil belajar peserta didik
dari segi ranah sikap hidup (affective domain) dan ranah ketrampilan (psychomotoric
domain). David Krathwohl (1974), sebagaimana dikutip Anas Sudijono (2005 : 54)
mengembangkan taksonomi mengenai ranah afektif ini dengan membaginya
kedalam lima jenjang yaitu : (1) receiving (menerima) (2) responding (merespon) (3)
valuing (menilai atau memaknai), (4) organization (mengorganisasi) dan (5)
characterization by a value or value complex (karakterisasi dengan suatu nilai atau
nilai yang kompleks).

Kemampuan psikomotor (psychomotoric domain) adalah kemampuan yang
berhubungan dengan gerak yaitu kemampuan dalam menggunakan otot-otot seperti
berjalan, lari, melompat, berenang, melukis, membongkar dan memasang peralatan
dan lain sebagainya. Dalam dunia psikologi, kemampuan psikomotor dibagi kedalam
lima tingkatan yaitu gerak refleks, gerakan dasar, kemampuan perseptual,
kemampuan fisik, gerakan trampil dan komunikasi nondiskursip (Sax, 1980: 76).

Gerak reflek adalah gerakan yang muncul tanpa sadar. Gerakan dasar adalah
gerakan yang mengarah pada ketrampilan kompleks yang khusus seperti berlari dan
berjalan. Kemampuan perseptual merupakan kombinasi kemampuan kognitif dan
kemampuan motor, kemampuan fisik adalah kemampuan untuk mengembangkan
gerakan yang paling terampil seperti gerakan tari ataupun olahrega ekstrim tertentu.
Sedangkan komunikasi nondiskursip adalah kemampuan berkomunikasi dengan
menggunakan bahasa gerakan. Kemampuan terakhir ini berhubungan dengan
kemampuan mengucapkan kata-kata berbahasa asing.

Dalam dunia pendidikan teknik nontes yang sering digunakan adalah pengamatan
(observasi), dan terkadang, seorang guru juga menggunakan wawancara. Dalam
penelitian-penelitian sosial, teknik nontes biasanya juga digunakan untuk
mendapatkan informasi mengenai keadaan obyek penelitian. Teknik nontes yang
sering digunakan dalam penelitian-penelitian sosial penelitian adalah kuesioner.

Teknik pengamatan atau observasi merupakan salah satu bentuk teknik nontes yang
biasa dipergunakan untuk menilai sesuatu melalui pengamatan terhadap objeknya
secara langsung, seksama dan sistematis. Pengamatan memungkinkan untuk
melihat dan mengamati sendiri kemudian mencatat perilaku dan kejadian yang
terjadi pada keadaan sebenarnya.
Menurut Moleong (2005 : 176) pengamatan dapat dibedakan menjadi dua yaitu
pengamatan berperanserta dan tidak berperanserta. Dalam pengamatan yang tidak
berperanserta, seseorang hanya melakukan satu fungsi yaitu mengamati tetapi pada
pengamatan berperanserta seseorang disamping mengamati juga menjadi anggota
dari obyek yang diamati.
Pengamatan dapat pula dibagi atas pengamatan terbuka dan tertutup. Terbuka jika
obyek yang diamati mengetahui bahwa mereka sedang diamati dan sebaliknya.
Selain itu pengamatan juga dibagi pada latar alamiah (pengamatan tak terstruktur)
dan latar buatan (pengamatan terstruktur). Pengamatan ini biasanya dapat dilakukan
pada eksperimen. Dalam pengamatan berstruktur, kegiatan pengamatan itu telah
diatur sebelumnya. Isi, maksud, objek yang diamati, kerangka kerja, dan lain-lain,
telah ditetapkan sebelum kegiatan pengamatan dilaksanakan. Oleh karena itu,
kegiatan pencatatan hanya dilakukan terhadap data-data yang sesuai dengan
cakupan bidang kebutuhan seperti yang telah ditetapkan sejak semula. Lain halnya
dengan pengamatan tak berstrukur, dalam melakukan pengamatannya, si pengamat
tidak dibatasi oleh kerangka kerja yang telah dipersiapkan sebelumnya. Setiap data
yang muncul yang dianggap relevan dengan tujuan pengamatannya langsung
dicatat. Dengan demikian, data yang diperoleh lebih mencerminkan keadaan yang
sesungguhnya. Perilaku siswa dalam keadaan seperti itu bersifat wajar, apa adanya
dan tidak dibuat-buat.

Teknik pengamatan jika dilakukan untuk melihat apakah perbuatan siswa sudah
benar atau tidak dapat dikategorikan sebagai teknik tes. Misalnya jika dalam praktek
olahraga seorang guru akan melihat apakah cara melempar lembing seseorang
sudah sesuai dengan teori atau tidak, maka pengamatan jenis ini terkategori sebagai
teknik tes. Tetapi jika pengamatan dilakukan terhadap aspek afektif seperti cara
seorang siswa bersikap terhadap guru, menjaga kebersihan, perhatian terhadap
tugas-tugas sekolah dan sebagainya, maka teknik ini termasuk teknik nontes.

Wawancara atau interview merupakan salah satu alat penilaian nontes yang
dipergunakan untuk mendapatkan informasi tertentu tentang keadaan responden
dengan jalan tanya-jawab sepihak. Dikatakan sepihak karena pertanyaan-
pertanyaan yang diajukan dalam kegiatan wawancara itu hanya berasal dari pihak
pewawancara saja, sementara responden hanya bertugas sebagai penjawab.
Maksud diadakan wawancara sebagaimana dikutip Moleong dari Lincoln dan Guba
(1985 : 266) antara lain mengkonstruksi mengenai orang, kejadian, organisasi,
perasaan, motivasi, tuntutan, kepedulian dan lain sebagainya.

Ada banyak pembagian wawancara yang dilakukan para ahli. salah satu diantaranya
adalah membagi wawancara kedalam dua bentuk yaitu wawancara bebas dan
wawancara terpimpin. Yang dimaksud wawancara terpimpin adalah suatu kegiatan
wawancara yang pertanyaan-pertanyaan serta kemungkinan-kemungkinan
jawabannya itu telah dipersiapkan pihak pewawancara, responden tinggal memilih
jawaban yang sudah dipersiapkan pewawancara. Sebaliknya dalam wawancara
bebas, responden diberi kebebasan untuk menjawab pertanyaan-pertanyaan
pewawancara sesuai dengan pendapatnya tanpa terikat oleh ketentuan-ketentuan
yang telah dibuat pewawancaranya.

Kuesioner merupakan bentuk lain dari teknik nontes. Secara umum, ada dua jenis
kuesioner yaitu kuesioner tertutup dan terbuka. Kuesioner tertutup adalah kuesioner
yang telah disediakan alternatif jawabannya sehingga responden tinggal memilih
yang sesuai dengan keadaan dirinya. Sedangkan kuesioner terbuka adalah
kuesioner yang jawabannya belum disediakan sehingga responden bebas
menuliskan apa yang dia rasakan. Satu hal yang menjadi ciri utama kuesioner
adalah dalam kuesioner tidak ada jawaban benar atau salah.
Salah satu contoh kuesioner tertutup adalah :

Umur anda saat ini adalah :
a. 15 – 20 tahun
b. 20 – 25 tahun
c. 25 – 30 tahun
d. 35 – 35 tahun

Adapun contoh kuesioner terbuka adalah :
Setiap idul fitri tiba, ribuan orang seperti digerakkan untuk beridulfitri di kampung
halamannya. Uraikanlah menurut pendapat anda apa yang menjadi penyebab
pulangkampungnya orang yang ada diperantauan ketika Idul Fitri tiba!

Ada beberapa alasan kenapa kuesioner sering dipergunakan orang dalam
mengumpulkan informasi tertentu yaitu : (1) butir-butir kuesioner dapat diberikan
kepada responden secara serentak sehingga lebih efektif, (2) butir-butir dalam
kuesioner lebih menjamin keseragaman baik perumusan kata, isi maupun urutannya
serta kuesioner lebih memudahkan dalam memberikan jawaban, (3) kuesioner
memudahkan sumber data dalam memberikan jawaban serta kepraktisan serta
relative lebih murah dibandingkan metode nontes yang lain.




Selasa, 2008 Maret 25

Tes Prestasi Hasil Belajar
Menurut Linn & Gronlund (1990: 5) tes adalah “an Instrument or systematic
procedure for measuring a sample behaviour”. Disatu sisi Djemari Mardapi (2004:
71) menambahkan bahwa tes merupakan sejumlah pertanyaan yang memiliki
jawaban benar atau salah. Secara lebih lengkap, Lee J. Cronbach (1970)
menambahkan bahwa tes adalah “a systematic procedure for observing a person's
behaviour and describing it with the aid of a numerical scale or a category system”.
Dari beberapa pengertian yang disampaikan oleh beberapa ahli di atas, ada
beberapa aspek yang bisa disimpulkan berkaitan dengan pengertian tes yaitu :1.
Pengertian Tes



1. Prosedur yang digunakan dalam penyusunan tes adalah sistematis. Prosedur
yang sistematis itu sendiri bermakna ada aturan-aturan tertentu yang harus dipenuhi
dalam penyusunan tes mencakup pengertian obyektif, standar dan syarat-syarat
kualitas lainnya.
2. Isi tes merupakan sample dari hal yang hendak diukur. Hal ini bermakna, tidak
semua yang ingin diukur dapat tercakup dalam tes. Karenanya kelayakan sebuah
tes ditentukan oleh sejauhmana butir-butir soal yang terdapat dalam tes tersebut
mewakili kawasan (domain) yang hendak diukur.
3. Hal yang ingin diukur oleh tes adalah prilaku. Hal ini bermakna bahwa butir-butir
yang terdapat dalam tes bermaksud menunjukkan apa yang diketahui peserta tes.
Jawaban peserta tes merupakan sumber utama untuk menemukan apa yang
sebenarnya diinginkan oleh tes.
Sebagai salah satu alat ukur dalam bidang ilmu sosial khususnya pendidikan, tes
merupakan alat untuk menaksir tingkat kemampuan seseorang secara tidak
langsung melalui respon yang diberikannya atas soal-soal yang terdapat dalam tes.
Hasil tes kemudian biasa digunakan untuk memantau perkembangan mutu
pendidikan.

2. Klasifikasi Tes

Ada dua cara yang sering digunakan untuk mengukur aspek psikologi seseorang
termasuk belajar yaitu dengan tes dan nontes. Sebagai salah satu alat untuk
mengkuantifikasi sampel prilaku, maka para ahli memberikan berbagai macam
klasifikasi tes yang berbeda tergantung perspektif sang ahli tersebut. Beberapa
klasifikasi tersebut disebutkan di bawah ini.

Cangelosi (1995: 23) membedakan tes menjadi 2 buah yaitu tes baku dan tes
buatan guru. Sumadi Suryabrata (2005: 14) membuat penggolongan tes
berdasarkan atribut psikologis menjadi : (1) tes kepribadian, (2) tes intelegensi, (3)
tes potensi intelektual dan (4) tes hasil belajar. Cronbach (1970) sebagaimana
dikutip Saifuddin Azwar (2004: 5) membedakan tes menjadi dua kelompok besar
yaitu tes yang mengukur performansi maksimal (maximal performance) dan tes yang
mengukur performansi tipikal (typical performance).

Klasifikasi tes yang lebih lengkap disampaikan oleh Anas Sudijono (2005: 68 - 75)
yang mengklasifikasikan tes berdasarkan perspektif tertentu. Jika tes digolongkan
berdasarkan fungsi sebagai alat ukur perkembangan, maka ada 6 jenis tes yaitu :
tes seleksi, tes awal, tes akhir, tes diagnostik, tes formatif dan tes sumatif.
Berdasarkan aspek psikis yang ingin dinilai, tes dibedakan menjadi tes intelegensi,
tes kemampuan, tes sikap, tes kepribadian dan tes hasil belajar. Berdasarkan
banyaknya orang yang mengikuti maka tes dibedakan menjadi tes individu dan tes
kelompok. Jika digolongkan berdasarkan waktu yang disediakan, maka akan ada
dua jenis tes yaitu power test dan speed test. Ditinjau dari segi respon tes dapat
dibedakan menjadi dua bentuk yaitu tes verbal dan tes non verbal. Dan jika ditinjau
dari cara mengajukan pertanyaan, akan ada dua tes yaitu tes tertulis dan tes lisan.

Dari sekian banyak pengklasifikasian tes yang telah dilakukan, maka jika dikaitkan
dengan penelitian ini, maka jenis tes yang akan dikaji dan digunakan adalah jenis
tes prestasi hasil belajar (achievement test).

3. Teknik Penulisan Tes

Setiap kegiatan belajar harus diketahui sejauhmana proses belajar tersebut telah
memberikan nilai tambah bagi kemampuan siswa. Salah satu cara untuk melihat
peningkatan kemampuan tersebut adalah dengan melakukan tes. Tes yang
berkaitan dengan tujuan ini sering disebut tes prestasi hasil belajar (TPHB).

Saifuddin Azwar (2003: 9) menyatakan bahwa tes prestasi hasil belajar adalah tes
yang disusun secara terencana untuk mengungkap informasi subyek atas bahan-
bahan yang telah diajarkan. Menurut Anas Sudijono (2005: 73) tes prestasi hasil
belajar adalah tes yang digunakan untuk mengungkap tingkat pencapaian belajar.

Dari beberapa pengertian di atas, ada satu benang merah yang sepertinya
disepakati yaitu bahwa tes prestasi hasil belajar merupakan salah satu cara untuk
menelusuri kemampuan-kemampuan yang telah dimiliki siswa setelah mengikuti
proses belajar mengajar selama waktu tertentu. Meskipun tes bukanlah satu-satunya
cara untuk mengungkap hasil belajar siswa, tetapi ia merupakan alat yang paling
sering digunakan karena kepraktisan penggunaannya serta biaya yang murah.

Tidak seperti alat pengukur ilmu alam yang tunggal, alat pengukur dalam ilmu-ilmu
sosial dapat terdiri lebih dari satu macam. Tes sendiri jika ditinjau dari bentuk
soalnya dapat dibedakan menjadi 2 yaitu tes hasil belajar dalam bentuk uraian (non
obyektif dan tes hasil belajar bentuk obyektif. Disebut tes obyektif karena siapapun
yang memeriksa hasil tes akan menghasilkan skor yang sama sedangkan tes uraian
hasilnya dipengaruhi oleh pemberi skor.

Tes bentuk uraian dapat digolongkan kedalam dua bagian yaitu tes uraian bentuk
terbuka dan tes uraian terbatas. Pada tes uraian terbuka setiap peserta tes
sepenuhnya memiliki kebebasan untuk menjawab sesuai dengan yang
dipikirkannya. Sedangkan tes uraian terbatas jawaban yang dikehendaki adalah
jawaban yang sifatnya sudah dibatasi.

Tes bentuk obyektif memiliki model yang lebih banyak dan variatif dibandingkan tes
bentuk uraian. karena itulah tes obyektif lebih sering digunakan dalam tes prestasi
hasil belajar dibandingkan tes bentuk uraian. ada beberapa penggolongan tes
obyektif yaitu :

a. Tes benar salah

Tes benar salah adalah bentuk tes yang mengajukan beberapa pernyataan yang
bernilai benar atau salah. Biasanya ada dua pilihan jawaban yaitu huruf B yang
berarti pernyataan tersebut benar dan S yang berarti pernyataan tersebut salah.
Tugas peserta tes adalah menentukan apakah pernyataan tersebut benar atau
salah. Contoh salah satu tes bentuk uraian adalah :

B S : Ibukota Peru berjumlah lima buah.
B S : Manado adalah Ibukota propinsi Sulawesi Utara

b. Tes Menjodohkan

Tes menjodohkan ini memiliki satu seri pertanyaan dan satu seri jawaban. Tugas
peserta tes adalah mencari pasangan setiap pertanyaan yang terdapat dalam seri
pertanyaan dan seri jawaban. Contoh bentuk tes menjodohkan adalah :
c. Tes Isian

Tes bentuk isian dapat digunakan dalam bentuk paragraf-paragraf yang merupakan
rangkaian cerita atau karangan atau berupa satu pernyataan. Beberapa bagian
kalimatnya yang merupakan kata-kata penting telah dikosongkan terlebih dahulu.
Tugas peserta tes adalah mengisi bagian-bagian yang kosong dengan jawaban
yang sesuai. Salah satu contoh tes isian adalah sebagai berikut :

1. Yang merupakan nama asli dari Sultan Hamengkubuwono X adalah …..

2. Para filsuf zaman modern menegaskan bahwa pengetahuan tidak berasal dari
kitab suci atau ajaran agama, tidak juga dari para penguasa, tetapi dari diri manusia
sendiri. Namun tentang aspek mana yang berperan ada beda pendapat. Aliran
……………….. beranggapan bahwa sumber pengetahuan adalah rasio: kebenaran
pasti berasal dari rasio (akal). Aliran ……………, sebaliknya, meyakini
pengalamanlah sumber pengetahuan itu, baik yang batin, maupun yang inderawi.
Lalu muncul aliran ……………. yang mencoba memadukan kedua pendapat
berbeda itu.

d. Tes Pilihan ganda

Tes bentuk pilihan ganda merupakan tes yang memiliki satu pemberitahuan tentang
suatu materi tertentu yang belum sempurna serta beberapa alternatif jawaban yang
terdiri dari kunci jawaban dan pengecoh. Tugas peserta tes adalah memilih jawaban
dari pilihan yang tersedia dan paling sesuai dengan pernyataan yang ada dalam
soal.

Pedoman utama dalam pembuatan butir soal bentuk pilihan ganda adalah:

1) Pokok soal harus jelas
2) Pilihan jawaban homogen dalam arti isi
3) Panjang kalimat pilihan jawaban relatif sama
4) Tidak ada petunjuk jawaban benar
5) Hindari menggunakan pilihan jawaban: semua benar atau semua salah
6) Pilihan jawaban angka diurutkan
7) Semua pilihan jawaban logis
8) Jangan menggunakan negatif ganda
9) Kalimat yang digunakan sesuai dengan tingkat perkembangan peserta tes
10) Bahasa Indonesia yang digunakan baku
11) Letak pilihan jawaban benar ditentukan secara acak.
Contoh bentuk soal pilihan ganda adalah :

1. Pemilihan Presiden di Indonesia dilaksanakan setiap berapa tahun?
   a. 3 tahun
   b. 4 tahun
   c. 5 tahun
   d. 6 tahun

Dari beberapa bentuk tes yang tersedia, tidak semuanya dapat digunakan secara
bersamaan dalam satu kesempatan. Ada beberapa pertimbangan yang diperlukan
untuk memilih bentuk tes yang paling sesuai. Menurut Djemari Mardapi (2004: 73)
pemilihan bentuk tes yang tepat ditentukan oleh tujuan tes, jumlah peserta, waktu
yang tersedia untuk pemeriksaan lembar jawaban, cakupan materi tes dan
karakteristik mata pelajaran yang diujikan.

Kamis, 2008 April 10

Reliabilitas: Pendekatan Tes Ulang
Reliabilitas diterjemahkan dari kata reliability. Menurut John M. Echols dan Hasan
Shadily (2003: 475) reliabilitas adalah hal yang dapat dipercaya. Popham (1995: 21)
menyatakan bahwa reliabilitas adalah "...the degree of which test score are free from
error measurement". Dalam pandangan Brennan (2001: 295) reliabilitas merupakan
karakteristik skor, bukan tentang tes ataupun bentuk tes. Menurut Sumadi
Suryabrata (2004: 28) reliabilitas menunjukkan sejauhmana hasil pengukuran
dengan alat tersebut dapat dipercaya. Hasil pengukuran harus reliabel dalam artian
harus memiliki tingkat konsistensi dan kemantapan. Dalam pandangan Aiken (1987:
42) sebuah tes dikatakan reliabel jika skor yang diperoleh oleh peserta relatif sama
meskipun dilakukan pengukuran berulang-ulang. Untuk memperoleh skor yang
sama, maka tidak boleh ada kesalahan pengukuran. Dengan demikian, keandalan
sebuah alat ukur dapat dilihat dari dua petunjuk yaitu kesalahan baku pengukuran
dan koefisien reliabilitas. Kedua statistik tersebut masing-masing memiliki kelebihan
dan keterbatasan (Feldt & Brennan, 1989: 105)


Berdasarkan sejarah, reliabilitas sebuah instrumen dapat dihitung melalui dua cara
yaitu kesalahan baku pengukuran dan koefisien reliabilitas (Feldt & Brennan: 105).
Kedua statistik di atas memiliki keterbatasannya masing-masing. Kesalahan
pengukuran merupakan rangkuman inkonsistensi peserta tes dalam unit-unit skala
skor sedangkan koefisien reliabilitas merupakan kuantifikasi reliabilitas dengan
merangkum konsistensi (atau inkonsistensi) diantara beberapa kesalahan
pengukuran.

Dalam kerangka teori tes klasik, suatu tes dapat dikatakan memiliki reliabilitas yang
tinggi apabila skor tampak tes tersebut berkorelasi tinggi dengan skor murninya
sendiri. Interpretasi lainnya adalah seberapa tinggi korelasi antara skor tampak pada
dua tes yang pararel. (Saifuddin Azwar, 2006: 29). Reliabilitas menurut Ross E.
Traub (1994: 38) yang disimbolkan oleh dapat didefinisikan sebagai rasio antara
varian skor murni dan varian skor tampak . Secara matematis teori di atas dapat
ditulis :
Reliabilitas alat ukur tidak dapat diketahui dengan pasti tetapi dapat diperkirakan.
Dalam mengestimasi reliabilitas alat ukur, ada tiga cara yang sering digunakan yaitu
(1) pendekatan tes ulang, (2) pendekatan dengan tes pararel dan (3) pendekatan
satu kali pengukuran.

Pendekatan tes ulang merupakan pemberian perangkat tes yang sama terhadap
sekelompok subjek sebanyak dua kali dengan selang waktu yang berbeda.
Asumsinya adalah bahwa skor yang dihasilkan oleh tes yang sama akan
menghasilkan skor tampak yang relatif sama. Estimasi dengan pendekatan tes ulang
akan menghasilkan koefisien stabilitas. Untuk memperoleh koefisien reliabilitas
melalui pendekatan tes ulang dapat dilakukan dengan menghitung koefisien korelasi
linear antara distribusi skor subyek pada pemberian tes pertama dengan skor
subyek pada pemberian tes kedua. Pendekatan tes ulang sangat sesuai untuk
mengukur ketrampilan terutama ketrampilan fisik.

Misalnya seorang guru hendak melihat reliabilitas tes yang telah dibuatnya. Setelah
melakukan dua kali pengukuran didapatkan skor tes sebagai berikut:




Koefisien reliabilitas test di atas dapat dihitung dengan menggunakan formula
korelasi produk momen dari Pearson sebagai berikut:
Dengan demikian, korelasi sebesar 0,954 menggambarkan bahwa reliabilitas tes
cukup tinggi.
Salah satu kelemahan mendasar dari teknik test-retest adalah carry-over effect.
Masalah ini disebabkan oleh adanya kemungkinan pada test yang kedua
dipengaruhi oleh test pertama. Misalnya, jika peserta tes masih ingat dengan soal-
soal dan bahkan jawaban ketika dilakukan test pertama. Hal ini dapat meningkatkan
korelasi serta overestimasi terhadap PXX’.

				
DOCUMENT INFO
Shared By:
Categories:
Stats:
views:8760
posted:5/20/2010
language:Indonesian
pages:14