EVALUASI
Evaluasi adalah proses penilaian yang sistematis mencakup pemberian nilai, atribut, apresiasi, dan pengenalan permasalahan serta pemberian solusi-solusi atas permasalahan yang ditemukan. Evaluasi pendidikan adalah penilaian dalam pendidikan atau penilaian mengenai hal-hal yang berkaitan dengan kegiatan pendidikan.
Pengertian evaluasi berkaitan erat dengan pengertian pengukuran (measurement). Orang sering mencampuradukkan kedua pengertian ini. Untuk dapat memberikan penilaian secara tepat, misalnya tentang kemampuan siswa memahami teks argumentasi, pengajar memerlukan data-data tentang kemampuan siswa dalam hal itu. Untuk mendapatkan data tersebut, misalnya skor, pengajar memerlukan kegiatan yang disebut pengukuran. Jadi, pengukuran itu merupakan proses mengukur yang berfungsi sebagai alat evaluasi.
Pertama, apabila dilihat dari pendekatan proses kegiatan pendidikan secara sederhana dapat diketahui hubungan interdependensi antara tujuan pendidikan, proses belajar mengajar, dan prosedur evaluasi. Tujuan pendidikan akan menagarahkan bagaimana pelaksanaan proses belajar mengajar yang seharusnya dilaksanakan sekaligus merupakan kerangka acuan untuk melaksanakan kegiatan evaluasi hasil belajar. Evaluasi memiliki dua kepentingan yakni untuk mengetahui apakah tujuan pendidikan sudah tercapai dengan baik, dan kedua untuk memperbaiki serta mengarahkan pelaksanaan proses belajar mengajar
Alasan kedua kegiatan evaluasi terhadap hasil belajar merupakan salah satu ciri dari pendidik professional. Atau pekerjaan dipandang memerlukan kemampuan professional bila pekerjaan tersebut memerlukan pendidikan lanjut.
Ketiga dilihat dari pendekatan kelembagaan kegiatan pendidikan adalah merupakan kegiatan manajemen yang meliputi kegiatan planning, programming, organizing, actuating, controlling, dan evaluating.
Tujuan evaluasi dalam pendidikan
Tujuan khusus evaluasi pendidikan ada dua yakni :
- Untuk mengetahui kemajuan belajar peserta didik setelah ia menyadari pendidikan selama jangka waktu tertentu.
- Untuk mengetahui tingkat efisiensi metode pendidikan yang dipergunakan pendidikan selama jangka waktu tertentu tadi.
Dengan kemajuan belajar peserta didik dapat diketahui pula kedudukan mereka dalam kelompoknya dan dapat dipakai pula untuk mengadakan perencanaan yang realistik dalam mengarahkan dan mengembangkan masa depan mereka. Dalam bidang pengajaran evaluasi bertujuan menentukan kompetensi isi pengajaran spesifik yang dimiliki oleh peserta didik, dan memperbaiki proses belajar mengajar.
Dalam bidang hasil belajar evaluasi bertujuan :
- Untuk mengetahui perbedaan kemampuan peserta didik.
- Untuk mengukur keberhasilan mereka baik secara individual maupun kelompok.
Dalam bidang hasil belajar evaluasi bertujuan :
Ø Untuk mengetahui perbedaan kemampuan peserta didik,
Ø Untuk mengukur keberhasilan mereka baik secara individual maupun kelompok.
Evaluasi pendidikan bagi guru berfungsi sebagai berikut :
Ø Mengetahui kemajuan belajar peserta didik
Ø Mengetahui kedudukan masing–masing individu peserta didik dalam kelompoknya
Ø Mengetahui kelemahan dalam cara belajar mengajar dalam PBM
Ø Memperbaiki proses belajar mengajar
Ø Menentukan kelulusan peserta didik
Bagi peserta didik evaluasi pendidikan berfungsi :
Ø Mengetahui kemampuan dan hasil belajar
Ø Memperbaiki cara belajar
Ø Menumbuhkan motivasi dalam belajar
Bagi sekolah evaluasi pendidikan berfungsi :
Ø Mengukur mutu hasil pendidikan
Ø Mengetahui kemajuan dan kemunduran sekolah
Ø Membuat keputusan kepada peserta didik
Ø Mengadakan perbaikan kurikulum.
Bagi orang tua peserta didik fungsi evaluasi pendidikan yaitu :
Ø Mengetahui hasil belajar anaknya
Ø Menungkatkan pengawasan dan bimbingan serta bantuan kepada anaknya dalam usaha belajar
Ø Mengarahkan penilaian jurusan atau jenis sekolah pendidikan lanjutan bagi anaknya.
Adapun fungsi pendidikan bagi masyarakat yaitu :
Ø Mengetahui kemajuan sekolah
Ø Ikut mengadakan kritik dsan saran perbaikan bagi kurikulum pendidikan pada sekolah tersebut
Ø Lebih meningkatkan partisipasi masyarakat dalam usahanya membantu lembaga pendidikan.
Evaluasi juga bertujuan untuk melakukan diagnosis terhadap kesulitan belajar peserta didik yang selanjutnya dipakai sebagai upaya untuk mengadakan perbaikan terhadap cara mengajar yang ada. Di samping itu evaluasi pengajaran juga bertujuan memperoleh informasi tentang potensi peserta didik sehingga penempatannya dapat disesuaikan dengan bakat dan minatnya. Evaluasi dapat dipakai sebagai alat dalam mengadakan seleksi terhadap penerimaan siswa dan hasilnya berfungsi sebagai bahan dalam mengadakan bimbingan dan penyuluhan.
Evaluasi pendidikan bertujuan melakukan penilaian total terhadap pelaksanaan kurikulum pada suatu lembaga pendidikan, sehingga dengan demikian dapat dilakukan usaha perbaikan, mencari faktor penghambat dan pendukung terhadap pelaksanaan kurikulum.
Ciri-ciri evaluasi pendidikan
§ penilaian dalam pendidikan itu dilakukan secara tidak langsung.
§ penggunaan ukuran kuantitatif karena penilaian selalu dimulai dari pengukuran, maka hasil pengukuran akan menggunakan satuan-satuan secara kuantitatif. Penggunaan satuan kuantitatif ini untuk mendapatkan hasil pengukuran yang obyektif dan pasti setelah itu dapat diolah dan ditafsirkan ke dalam satuan kualitatif.
§ penilaian pendidikan itu menggunakan unit satuan tetap.
§ penilaian pendidikan bersifat relatif artinya hasil penilaian itu kendatipun sudah menggunakan satuan yang tetap hasilnya tidaklah selalu sama dari waktu ke waktu.
§ penilaian pendidikan tidak mungkin terhindar dari kesalahan.
Ruang lingkup evaluasi pendidikan
Dalam hubungan Stufflebeam membagi evaluasi pendidikan menjadi empat ruang lingkup yaitu :
- Evaluasi masukan (input) adalah evaluasi berkaitan dengan kualitas masukan yang berupa calon peserta didik baik menyangkut faktor kemampuan intelektualnya maupun aspek kepribadian yang bersifat nonintelektif.
- Evaluasi proses, adalah evaluasi yang sasarannya adalah proses belajar mengajar termasuk faktor instrumentalnya seperti evaluasi terhadap kemampuan guru dalam mengajar, kesesuaian metode yang digunakan oleh guru, evaluasi kurikulum, evaluasi terhadap media pendidikan, kelembagaan pendidikan.
- Evaluasi produk, adalah penilaian pendidikan yang sasarannya hasil akhir suatu proses pendidikan yakni peserta didik.
- Evaluasi konteks yakni evaluasi yang berkaitan dengan masalah kompleks yang melibatkan hal-hal di luar proses pendidikan tetapi ia secara langsung mempengaruhi proses maupun hasil pendidikan.
Langkah-langkah pokok evaluasi pendidikan meliputi tiga kegiatan utama yaitu :
- Persiapan
- Pelaksanaan
- Pengolahan hasil ’
Ketiga langkah tersebut dapat dijabarkan dalam langkah yang lebih operasional meliputi :
§ Perencanaan dan perumusan kriterium,
§ Pengumpulan data,
§ Pengolahan data,
§ Penafsiran data.
Langkah perencanaan dan perumusan kriterium mencakup :
Ø Perumusan tujuan evaluasi,
Ø Penetapan aspek-aspek yang akan diukur,
Ø Menetapkan metode dan mentuk tes,
Ø Merencanakan waktu evaluasi,
Ø Melakukan uji coba tes untuk mengukur validitas dan reliabilitasnya sebelum digunakan.
Pengumpulan data dimaksudkan untuk memperoleh informasi tentang keadaan obyek dengan menggunakan alat yang telah diujicobakan. Untuk pengumpulan data dapat menggunakan metode tes tertulis, tes lisan, dan tes tindakan yang akan dibicarakan tersendiri.
Persifikasi data merupakan langkah untuk penelitian terhadap data dimana antara data yang baik dan tidak yakni yang dapat memberikan gambaran sesungguhnya tentang keadaan individu.
Sedangkan langkah pengolahan data adalah langkah untuk menjadikan data lebih bermakna, sehingga dengan data itu orang dapat memperleh beberapa gambaran yang lebih lengkap tentang keadaan peserta didik.
Langkah penafsiran data adalah merupakan verbalisasi atau pemberian makna dari data yang telah diolah, sehingga tidak akan terjadi penafsiran yang overstatement maupun penfsiran yang understatement.
Evaluasi yang menggunakan tes uraian, observasi, dan wawancara. Dalam perencanaannya menggunakan alur berfikir tes obyektif. Sumadi mengemukakan ada lima tahap dalam merencanakan dan menyusun tes sehingga tes menjadi tesyang baikdan dapat dibakukan yaitu
Ø Pengembangan spesifikasi tes,
Ø Pengujian butir soal secara empirik,
Ø Penulisan soal,
Ø Penelaahan soal,
Ø Administrasi tes bentuk akhir untuk tujuan pembakuan.
Spesifikasi tes adalah suatu uraian yang menunjukkan keseluruhan kualitas tes dan ciri-cirinya yang harus dimiliki oleh tes yang akan dikembangka. Pengembangan spesifikasi tes nerupakan langkah awal yang menentukan dalam pengembangan perangkat tes.
Dalam pengembangan spesifikasi tes terdapat beberapa yang harus dibicarakan diantaranya sebagai berikut :
Ø menentukan tujuan evaluasi,
Ø menyusun kisi-kisi,
Ø memilih tipe soal,
Ø merencanakan taraf kesukaran soal,
Ø merencanakan banyak sedikitnya soal,
Ø merencanakan jadwal penerbitan soal.
Untuk menentukan dan merumuskan tujuan evaluasi diperlukan kepastian mengenai daerah medan psikologi peserta didik yang akan diukur, karakteristik peserta didik, dan kedudukan tujuan dalam rangka pencapaian tujuan pendidikan yang lebih tinggi. Oleh karena itu, Dr. Muchtar Buchori menawarkan model perumusan tujuan evaluasi yakni yang berorientasi kepada penguasaan materi yang mudah diukur secara operasional dan proses mental.
Untuk memudahkan dan cara merumuskan dan merencanakan evaluasi tujuan pendidikan hendaknya dirumuskan dalam tujuan instruksional yang mencakup tiga aspek pokok sebagaimana dijelaskan oleh Mayer sebagai berikut :
Ø Performance, tujuan instruksional harus mencakup pernyataan tentang kemampuan apa yag diharapkan dapat dilakukan oleh siswa,
Ø Conditions, tujuan instruksional harus dapat menjelaskan suatu kondisi tertentu yang diperlukan bagaimana performance itu terjadi,
Ø Creation, tujuan instruksional hendaknya menjelaskan kriteria performance yang diharapakan dengan menjelaskan bagaimana kriteria dari suatu performance yang dapat diterima sebagai hasil belajar.
Perlu diketahui bahwa tidak semua jenis mata pelajaran itu dapat dirumuskan TIK-nya secara baik, khususnya pada domain afektif banyak hasil belajar yang tidak dapat diukur secara operasional, setidaknya indikator yang dapat menunjukkan kemampuan yang terukur dan teramati mengalami kesulitan.
Oleh karena itu Dr. Muchtar Bukhori menawarkan model perumusan tujuan evaluasi yang lain yakni yang berorientasi kepada penguasaan materi yang mudah diukur secara operasional dan proses mental sebagaiamana dijelaskan berikut ini :
a. Pendekatan luas pengetahuan yaitu cara merumuskan tujuan evaluasi yang didasarkan atas rincian dan ruang lingkup bahan atau materi kurikulum yang diajarkan kepada peserta didik.
b. Tujuan evaluasi juga dapat didasarkan pada pendekatan proses mental yaitu dalam merumuskan tujuan evaluasi dengan jalan merinci secara psikis terhadap perubahan mental yang diharapkan setelah peserta didik menerima dan mengalami bahan pengajaran yang telah ditetapkan.
Tujuan penyusunan kisi-kisi soal adalah merumuskan setepat mungkin ruang lingkup, tekanan, bagian tes sehingga perumusan tersebut dapat menjadi petunjuk yang efektif bagi si penyusun tes. Dalam penyusunan kisi soal disusun dalam tabel analisis ganda sekurangnya terdiri dari dua aspek yaitu :
1. aspek isi pengetahuan, dan
2. aspek tujuan pendidikan.
Analisis dari dua aspek ini diperoleh informasi mengenai rincian tingkat kompetensi, sehingga sebaran soal pada tiap pokok bahasan yang menunjang kompetensi tersebut dapat diperhitungkan secara merata.
Dalam kisi soal juga dapat memasukkan tingkat kesukaran dan bentuk soal. Dengan demikian dalam satu kisi-kisi terdapat informasi tentang prosentase soal yang memiliki tingkat kesukaran, variasi penggunaan jenis soal, sesuai dengan kompetensi, dan tingkat kesukarannya.
Selanjutnya masalah format kisi-kisi soal dapat berkembang sesuai dengan kreasi masing-masing pendidik, namun secara umum prinsip analisis ganda antara isi pengetahuan, aspek psikologik yang diukur dan variasi penggunaan soal baik tingkat kesukarannya maupun bentuk soalnya masih tetap ada.
Dalam memilih tipe-tipe soal ada beberapa hal yang perlu diperhatikan diantaranya :
- Kesesuaian antara tipe soal dengan materi pelajaran,
- Kesesuaian antara tipe soal dengan tujuan evaluasi,
- Kesesuaian antara tipe soal dengan skoring,
- Kesesuaian antara tipe soal dengan pengolahan hasil evaluasi,
- Kesesuaian antara tipe soal dengan administrasi tes yaitu penyelenggaraan dan pelaksanaan tes,
- Kesesuaian antara tipe soal dengan dana dan kepraktisan.
Satu hal yang harus diperhitungkan oleh perancang tes adalah mempertimbangkan taraf kesukaran soal. Secara umum taraf kesukaran soal dapat diketahui secara empirik dari presentase peserta didik yang gagal dalam menjawab soal, secara rinci akan dijelaskan pada analisis item.
Kesukaran soal demikian itu hanya dapat diketahui bilamana soal tersebut telah diujikan. Namun pada bentuk soal tertentu seperti bentuk uraian pemberian tugas karya tulis sudah dapat diperhitungkan tingkat kesukarannya, yakni berdasarkan berat ringannya beban penyelesaian soal tersebut. Oleh karena itu bagi pendidik dalam merencanakan suatu tes sebaiknya butir-butir soal diujicobakan terlebih dahulu hasil ujicoba dapat dipakai untuk mengetahui tingkat kesukaran soalnya.
Pada setiap tes tingkat kesukaran item sebaiknya memiliki sebaran merata dari yang paling mudah sampai ke yang paling sukar. Secara empirik ada kelemahan mendasar pada butir soal yang memiliki tingkat kesukaran terendah dan tertinggi, ia tidak efektif untuk membedakan antara kedudukan peserta didik yang pandai dan bodoh. Oleh karena itu sebaiknya sebaran soal posisi yang paling banyak adalah butir soal yang memiliki tingkat kesukaran menengah ke atas, tetapi jangan terlalu tinggi atau terlalu rendah.
Faktor yang perlu dipertimbangkan berkaitan dengan tingkat kesukaran butir soal adalah acuan yang digunakan oleh pendidik untuk menentukan keberhasilan belajar/evaluasi. Bilamana pendidik menggunakan acuan patokan, maka tingkat kesukaran soal hendaknya dibuat dalam radius di sekitar daerah rata-rata, tetapi bilamana akan digunakan acuan kelompok (norma) penyebaran tingkat kesukaran dapat diperlonggar.
Dalam merencanakan banyak sedikitnya soal pada suatu tes perlu diperhatikan beberapa hal yaitu :
- Hubungan banyak sedikitnya soal dengan reliabilitas tes,
- Hubungan banyak sedikitnya soal dengan bobot keseluruhan bagian,
- Hubungan banyak sedikitnya soal dengan waktu tes, dan
- Hubungan banyak sedikitnya soal dengan ujicoba suatu tes.
Suatu tes yang baik hendaknya memiliki tingkat reliabilitas yang tinggi, reliabilitas merupakan interkorelasi antarbutir soal, sehingga makin banyak soal, makin tinggi pula tingkat reliabilitasnya. Untuk menghitung secara praktis tingkat reliabilitasnya suatu tes akan dijelaskan pada bab tersendiri.
Bilamana masing-masin butir soal diketahui bobotnya, maka pada tiap butir soal dapat diketahui berapa besar kontribusinya untuk menyumbang hasil tes secara keseluruhan. Apabila bobot semua butir soal sama, maka kontribusi terhadap keberhasilan suatu tes secara keseluruhan sama.
Kaitannya dengan waktu penyelenggaraan tes dengan banyaknya butir soal tergantung tujuan tes, dan jenis soal, sebab hal ini terkait dengan jumlah waktu yang diperlukan untuk menyelesaikan tiap butir soal. Maka tes bahasa tentang penguasaan kosa kata apabila ditulis dalam tes bentuk obyektif lima pilihan cukup memerlukan waktu 10-15 detiak tiap butir, sedangkan bila menggunakan asosiasi pilihan ganda memakan waktu sekitar 30-60 detik. Bila mata tes matematika, memakan waktu lebih lama sekitar 3-4 menit tiap butir soal.
Lamanya penyelesaian soal tidak terkait dengan tingkat kesukaran soal tetapi lebih ditentukan oleh sifat soal dan tujuan evaluasi yakni apakah dalam evaluasi akan mengukur kecepatan ataukah ingin mengukur kekuatan.
Kaitannya dengan ujicoba walaupun dalam kisi-kisi soal telah ditentukan sejumlah butir soal, namun ia tetap sebagai perencanaan yang dapat memberikan kepastian adalah hal ujicoba, sebab seringkali butir soal setelah dilakukan ujicoba banyak mengalami revisi, sehingga setelah diambil yang memenuhi syaarat tinggal tersisa sebagian kecil butir soal.
Dalam mempersiapkan suatu tes perlu diperhatikan waktu untuk menggandakan soal. Di samping faktor penggandaan menjadi pertimbangan utama bagi perencanaan tes, perlu juga dipertimbangkan tingkat kerumitan soal sebab untuk menyelesaikannya memerlukan waktu lebih lama.
Merencanakan sebaran butir soal mencakup seluruh kurikulum, merencanakan banyak sedikitnya soal, jenis soal, dan tingkat kesukaran soal belum menjamin soal itu ditulis dengan baik, kesalahan dalam penulisan soal berakibat kesalahan data yang terkumpul, dan salah pula analisa yang dilakukan selanjutnya keputusan yang diambil terhadap peserta tes menjadi salah pula.
Dalam menulis soal diperlukan kemampuan untuk membahasakan gagasan dalam bahasa verbal yang jelas dan mudah difahami, sebab soal merupakan wakil dari pendidik yang hadir di hadapan peserta didik. Selan itu penulis soal juga harus memiliki kemampuan khusus diantaranya :
- Penguasaan pengetahuan yang diteskan,
- Kesadaran akan tata nilai yang mendasari pendidikan,
- Pemahaman akan karakteristik individu yang tes,
- Kemampuan membahasakan gagasan,
- Penguasaan akan teknik penulisan soal,
- Kesadaran akan kekuatan dan kelemahan dalam menulis.
Penguasaan materi pengajaran mutlak diperlukan bagi orang yang menulis soal. Perancana evaluasi tidak cukup hanya menguasai teknik evaluasi saja. Yang utama adalah penguasaan materi yang akan ditulis dalam soal. Setiap butir soal hendaknya memiliki validitas content artinya alat ukur tersebut memang benar-benar bobot materi yang akan diukur, sehingga kesesuaian alat ukur dengan isi yang diukur benar-benar terwujud dalam penulisan soal.
Sebenarnya fungsi tes tidak semata-mata sabagai alat ukur saja, melainkan memiliki fungsi motivatif dan pembentukan sikap bagi peserta didik. Oleh karena itu penulis soal hendaknya memahami nilai-nilai yang mendasari pendidikan seperti tujuan pendidikan, filsafat pendidikan, sistem pendidikan, psikologi dan sebagainya, kendatipun pemahaman tersebut hanya bersifat garis besarnya saja.
Dalam menulis soal diperlukan kemampuan untuk membahasakan gagasan dalam bahasa verbal yang jelas dan mudah difahami maksudnya, sebab soal merupakan wakil dari pendidik yang hadir di hadapan peserta didik. Oleh karen itu penulisan soal membutuhkan bahasa yang lugas dan tidak terbelit-belit. Kasalahan pemilihan kosa kata berakibat salah pengertian apalagi jika kata tersebut memiliki pengertian ganda, diperlukan ketegasan.
Seorang penulis soal harus memiliki teknik penulisan soal yang baik dan benar, ia harus tahu tentang ciri masing-masing jenis soal dan bagaimana menulisnya, kelebihan dan kekurangannya, sehingga obyektivitas soal dapat terjamin.
Karena dalam penulisan soal membutuhkan persyaratan yang banyak, maka tidak semua orang memiliki kemampuan sempurna. Tiap orang mempuyai kelebihan dan kekurangan. Oleh karena itu ketika menafsirkan hasil tes untuk membuat keputusan penting terhadap peserta didik harus menyadari keterbatasan soal tersebut.
Setelah butir soal selesai ditulis dalam format penulisan soal, maka butir soal tersebut harus diuji validitas rasionalnya yaitu kesesuaian antara butir soal dengan materi pengajaran dan antara tujuan evaluasi dengan teknik penulisan soal yang baik.
Selain itu terdapat penelaahan soal yang dapat dilakukan oleh guru bersangkutan, namun bilamana tes akan diberlakukan untuk kalangan luas diperlukan tim khusus untuk melakukan penelaahan dan review soal. Di antara alat yang digunakan untuk melakukan penelaahan soal adalah kisi-kisi soal.
Selanjutnya pengujian soal memiliki tujuan yakni tujuan pengujian soal secara empirik adalah untuk mengetahui validitas dan reliabilitas tes secara empirik. Dalam melakukan pengujian soal diperhatikan karakteristik sampel hendaknya sesuai dengan karakteristik obyek yang akan mengikuti testing.
Sebelum melanjut ke pembahasan berikutnya kita harus mengetahui pengertian tes. Tes adalah alat pengukuran berupa pertanyaan, perintah, dan petunjuk yang ditujukan kepada testee untuk mendapatkan respon sesuai dengan petunjuk itu. Kemudian secara umum tes itu dibedakan berdasarkan obyek pengukurannya dibagi menjadi dua yaitu tes kepribadian dan tes hasil belajar. Tes yang banyak digunakan dalam pendidikan adalah
Ø pengukuran sikap,
Ø pengukuran minat,
Ø pengukuran bakat, dan
Ø tes intelegensi.
Berdasarkan fungsinya tes dibedakan menjadi empat jenis yaitu
1. tes penempatan,
2. tes formatif,
3. tes diagnostik, dan
4. tes sumatif.
Tes penempatan adalah tes yang mengukur kemampuan dasar yang dimiliki peserta didik. Kemampuan tersebut dapat dipakai meramalkan kemampuan peserta didik pada masa mendatang, sehingga dapat dibimbing, diarahkan/ditempatkan pada jurusan sesuai dengan kemampuan dasarnya.
Tes ini dibedakan menjadi dua jenis yaitu readiness test penyusunan item tes ini hendaknya menggunakan taraf kesukaran yang relatif rendah, tetapi penilaiannya menggunakan acuan patokan. Dan placement pre-test, tes ini pengukurannya ditekankan untuk mengetahui seberapa jauh penguasaan calon peserta didik terhadap tujuan, materi yang akan ditempuh. Oleh karena itu penyusunannya menggunakan tingkat kesulitan item secara merata, pengolahan hasil tes menggunakan acuan kelompok.
Tes pembinaan (formative test) diselenggarakan pada saat berlangsungnya proses belajar mengajar, diselenggarakan secara periodik, isinya mencakup semua unit pengajaran yang telah diajarkan. Tujuan utama untuk mengetahui keberhasilan dan kegagalan proses belajar mengajar. Dengan demikian dapat dipakai untuk memperbaiki dan menyempurnakannya.
Tes sumatif ini disebut juga tes akhir semester bertujuan mengukur keberhasilan belajar peserta didik secara menyeluruh, materi yang diujikan seluruh pokok bahasan. Standar yang digunakan untuk menentukan kualitas hasil evaluasi sumatif menggunakan acuan kelompok. Kemudian Tes diagnostik digunakan untuk mengetahui sebab kegagalan peserta didik dalam belajar. Dalam menyusun butir-butir soal seharusnya menggunakan item yang memiliki tingkat kesukaran rendah.
Tes diagnostik juga dapat digunakan untuk diagnostik kepentingan seleksi, untuk kepentingan pemilihan jabatan dan lapangan studi, untuk kepentingan psikoterapi, dan untuk kepentingan bimbingan dan penyuluhan belajar. Kita juga dapat melihat adanya tes standar dimana tes ini disusun oleh satu tim ahli atau lembaga khusus yang menyelenggarakan secara profesional.
Tes ini diketahui memenuhi syarat tes yang baik yakni diketahui validitas dan reliabilitasnya baik validitas rasional maupun validitas empirik. Tes ini digunakan dalam waktu relatif lama dapat diterapkan kepada beberapa obyek mencakup wilayah yang luas. Tes ini dapat digunakan untuk membandingkan prestasi belajar, membandingkan tingkat prestasi siswa dalam keterampilan di berbagai bidang studi, membandingkan prestasi siswa berbagai sekolah atau kelas, dan mempelajari perkembangan siswa dalam suatu periode tertentu.
Tes standar adalah tes yang disusun oleh suatu tim ahli atau disusun oleh lembaga yang khusus menyelenggarakan secara profesional. Tes tersebut diketahui memenuhi prasyarat sebagai tes yang baik yakni diketahui validitas dan reliabilitasnya baik validitas rasional maupun validitas empirik, reliabilitas dalam arti teruji tingkat stabilitas, maupun homoginitasnya.
Tes ini dapat digunakan dalam waktu lama. Dapat diterapkan kepada beberapa obyek mencakup wilayah yang luas. Untuk mengatur validitas dan reliabilitasnya telah diujicobakan beberapa kali sehingga hasilnya dapat dipertanggungjawabkan. Yang dituntut dalam tes standar bukan standar prestasi peserta didik dari penguasaan materi yang diajarkan pada suatu tingkat, lembaga pendidikan tertentu, melainkan adanya kesamaan performance pada kelompok peserta didik atau lembaga pendidikan disebabkan adanya kesamaan tolok ukur.
Tes non standar adalah tes yang disusun oleh seorang pendidik yang belum memiliki keahlian profesional dalam penyusunan tes, atau mereka yang memiliki keahlian tetapi tidak sempat menyusun tes secara baik, melakukan analisis sehingga validitas dan reliabilitasnya belum dapat dipertanggungjawabkan. Tes ini disusun oleh seorang guru bukan oleh sebuah tim ahli.
Tes tulis masuk ke dalam tes verbal adalah tes yang soal dan jawabannya yang diberikan oleh siswa berupa bahasan tulisan. Memiliki kelebihan dapat mengukur kemampuan sejumlah besar siswa dalam tempat yang terpisah dalam waktu yang sama. Tes ini secara umum dapat dibedakan menjadi dua bagian yaitu tes obyektif (tes struktur), tes subyektif (tes uraian).
Tes obyektif adalah tes tulis yang dapat dijawab dengan memilih jawaban yang sudah tersedia, sehingga peserta didik menampilkan keseragaman data baik bagi yang menjawab benar maupun yang salah. Tes subyektif ini peserta didik memiliki kebebasan memilih dan menentukan jawaban. Tes subyektif ini memiliki kelebihan yaitu
Ø Dapat menghindarkan terkaan dalam menjawab,
Ø Soal bentuk uraian ini tepat untuk mengukur kemampuan analitik, sintetik, evaluatif,
Ø Peserta didik dapat mengorganisasikan jawaban dengan fikiran sendiri,
Ø Jawaban yang diberikan diungkapkan dalam kata-kata dan kalimat yang disusun sendiri.
Selain itu juga memiliki kelemahan yakni diantaranya
Ø Bahan yang diujikan relatif sedikit, sehingga agak sulit untuk mengukur penguasaan siswa terhadap keseluruhan kurikulum,
Ø Soal jenis ini bila digunakan terus menerus dapat berakibat peserta didik belajar dengan cara untung-untungan,
Ø Sulit mendapatkan soal yang memiliki validitas dan reliabilitas tinggi,
Ø Sulit mendapatkan soal yang memiliki standar nasional maupun regional,
Ø Membutuhkan banyak waktu untuk memeriksa hasilnya,
Ø Penilaian yang diberikan terhadap hasil jawaban tes ini cenderung subyektif.
Tes uraian dibedakan menjadi dua bentuk yakni tes uraian bentuk bebas yaitu butir soal hanya menyangkut masalah utama yang dibicarakan, tanpa memberikan arahan tertentu dalam menjawabnya. Dan tes uraian terbatas peserta didik diberi kebebasan menjawab soal yang ditanyakan, arah jawaban soal dibatasi sedemikian rupa, sehingga kebebasan menjadi bebas yang terarah.
Hal yang perlu dicermati dalam tes ini adalah kelemahan tes uraian yang terletak pada variasi jawaban yang tak terbatas sehingga menyulitkan penskoran apalagi membandingkan antara peserta didik yang satu dengan yang lainnya. Untuk itu pemeriksaan hasil dapat ditempuh langkah peningkatan obyektivitas.
Tes lisan masuk kedalam kelompok tes verbal yaitu tes soal dan jawabannya menggunakan bahasa lisan. Tes ini memiliki kelebihan yakni
Ø Tepat Pendidik dapat mengetahui langsung hasil tes seketika,
Ø untuk mengukur kecakapan tertentu seperti kemampuan membaca, menghafal kalimat tertentu,
Ø Dapat digunakan untuk menilai kepribadian dan kemampuan pengetahuan peserta didik karena dilakukan secara face to face,
Ø Pendidik dapat menggali lebih lanjut jawaban peserta didik sampai mendetil sehingga mengetahui bagian mana yang paling dikuasai oleh peserta didik.
Selain itu juga memiliki kekurangan atau keterbatasan yakni
Ø Membutuhkan lama untuk melaksanakannya,
Ø Pertanyaan yang diajukan kepada peserta didik sering tidak sama jumlahnya maupun tingkat kesukarannya,
Ø Kebebasan peserta didik menjawab pertanyaan menjadi berkurang sebab seringkali pendidik memotong jawaban sebelum pemikirannya dituangkan keseluruhannya,
Ø Seringkali pendidik terlalu cepat menyimpulkan sebelum ia menjawab soal, Keadaan emosional peserta didik sangat dipengaruhi oleh kepribadian peribadi pendidik yang dihadapinya.
Dari segi persiapan dan cara bertanya tes lisan dibedakan menjadi dua yakni
1. Tes lisan bebas pendidik artinya pendidik dalam memberikan pertanyaan tanpa menggunakan pedoman yang dipersiapkan secara tertulis.
2. Tes lisan berpedoman yakni pendidik menggunakan pedoman tertulis tentang apa yang akan ditanyakan kepada peserta didik.
Dalam tes bebas dialog terjadi lebih orisinil tidak terikat formalitas, namun sering jawaban lupa tidak tercatat. Sedangkan kalau dengan pedoman pertanyaan terarah, jawaban lebih mudah dicatat, dan diseragamkan skoringnya.
Tes tindakan adalah tes dimana jawaban yang dituntut dari peserta didik berupa tindakan, tingkah laku kongkrit. Alat yang digunakan untuk melakukan tes ini adalah observasi terhadap tingkah laku tersebut. Tes ini digunakan untuk mengukur perubahan sikap peserta didik, kemampuan dalam meragakan atau mengaplikasikan jenis keterampilan tertentu. Bentuk tes ini berupa petunjuk atau perintah baik lisan atau tertulis.
Tes ini memiliki beberapa keuntungan dan beberapa kelemahan. Keuntungan bentuk tes ini antara lain yaitu
Tepat untuk mengukur aspek psikomotor,
Tepat untuk mengetahui sikap yang merefleksi dalam tingkah laku sehari-hari, Pendidik secara langsung mengamati dengan jelas jawaban sehingga mudah memberikan penilaian.
Dan kelemahannya antara lain :
Ø Seringkali terjadi gangguan dalam pengamatan menyebabkan penilaian tidak obyektif,
Ø Apabila perintah tidak jelas, maka tindakan yang muncul sesuai dengan apa yang diharapkan
Ø Membutuhkan waktu lama terutama kalau pengamatannya dilakukan perindividu,
Ø Seringkali pendidik terpengaruh oleh gerakan yang tidak menjadi indikator utama dalam penilaian.
Untuk menghindari kelemahan kelemahan tersebut diperlukan beberapa petunjuk praktis dalam menyiapkan tes tindakan anatar lain dikembangkan dalam bentuk tes,
1. Tes tindakan berpedoman,
2. Tes tindakan bebas (tidak berpedoman).
Tes tindakan yang berpedoman maksudnya adalah dalam melakukan observasi termasuk dalam memberikan perintah kepada peserta didik. Pendidik menggunakan pedoman tertulis, sehingga setiap peserta didik memperoleh tugas yang sama baik dari volume, tugas, ataupun tingkat kesukaran tugas tersebut.
Tes tindakan tidak berpedoman artinya dalam memberikan tugas kepada peserta didik. Pendidik tidak menggunakan pedoman tertulis. Pendidik secara langsung melakukan perintah dan tidak dilengkapi dengan alat observasi tertulis.
Di dalam tes obyektif menurut Berg, sebagaimana dikutip oleh Stanley, tes ini secara umum dapat dibagi menjadi dua macam yakni :
Free response terdiri dari :
Ø Completion test dan
Ø Short answer.
Fixed-response items terdiri dari :
Ø Tru-false,
Ø Multiple-choice,
Ø Matching,
Ø Rearrangement exercise.
Tipe soal obyektif jawab bebas baik dalam bentuk melengkapi maupun jawab pendek, pada hakikatnya tetap dapat dibedakan dengan tes uraian . Perbedaan itu terletak pada panjang pendeknya jawaban. Tes uraian jawaban dari peserta didik relatif lebih panjang, dan dimungkinkan munculnya beberapa alternatif jawaban benar. Tetapi dalam tes ini jawaban singkat jika perlu hanya terdiri dari satu kata dan hanya ada satu jawaban yang benar.
Untuk prinsip penyusunan tes obyektif jawab bebas ini secara umum sama dengan seluruh tes obyektif , yakni munculnya keseragaman dan kepastian tentang jawaban yang benar sesuai dengan pertanyaan. Dengan adanya keseragaman dan kepastian tentang jawaban yang benar tersebut pendidik dapat memberikan penilaian yang obyektif karena kesimpulan yang diambil sudah didasarkan atas data yang ajeg, dengan demikian memperkecil peluang munculnya subyektivitas penilaian.
Adapun prinsip penyusunan secara khusus untuk masing-masing tipe tes isian bebas ini adalah diantaranya untuk short-answer obyektive item ini memiliki beberapa petunjuk khusus dalam penyusunan tes ini yakni :
Ø Menggunakan bentuk kalimat tanya akan lebih baik daripada menggunakan kalimat berita,
Ø Hindarkan penggunaan susunan kalimat yang persis dalam buku teks,
Ø Apabila lembar jawaban ingin dijadikan satu dengan lembar soal, sebaiknya disediakan kolom jawaban yang terpisah dengan soalnya,
Ø Pertanyaan disusun sedemikian rupa sehingga hanya ada satu kemungkinan jawaban yang benar.
Tes bentuk ini tepat digunakan untuk mengukur kemampuan hafalan atau ingatan, khususnya kemampuan bidang matematika dan kemampuan penguasaan kosa kata dalam bahasa asing, maupun fakta-fakta spesifik, nama-nama tokoh serta tempat tertentu dalam sejarah.
Sedangkan completion test adalah merupakan salah satu bentuk tes jawaban bebas di mana butir soalnya berupa satu kalimat di mana bagian tertentu yang dianggap penting dikosongkan. Dan petunjuknya untuk penyusunan tes obyektif berbentuk completion ini adalah :
Ø Hindarkan pertanyaan yang tidak jelas,
Ø Jangan menghilangkan kata kunci terlalu banyak ,
Ø Hilangkan kata yang mengandung arti penting,
Ø Hindarkan munculnya indikator jawaban yang dapat dibaca dari pernyataan yang ada dalam teks soal,
Ø Usahakan agar jawaban yang diberikan cukup terdiri dari satu kalimat pendek,
Ø Sediakan kunci tentang semua kemungkinan jawaban yang dapat dipandang benar.
Fixed-response items ini dimana butir soal-soal yang diberikan kepada peserta didik disertai dengan alternative jawaban, sehingga peserta didik tinggal memilih satu diantara alternative yang disediakan. Jawaban tersebut hanya ada satu yang benar atau yang paling benar, sedangkan yang lainnya salah.
Yang menjadi persoalan adalah banyak sedikitnya alternatif yang harus dipilih. Atas dasar banyaknya kemungkinan tersebut tes bentuk ini dapat dibagi menjadi dua. Pertama memilih satu diantara dua alternatif jawaban dikenal dengan bentuk True False. Kedua memilih salah satu atau lebih dari beberapa kemungkinan pilihan yang lebih dari dua, tes ini disebut dengan bentuk Multiple Choice, Matching, dan Rearrangement Exercise.
Untuk True False Test adalah suatu bentuk tes dimana itemnya berupa statement yang mengandung dua kemungkinan yakni benar atau salah. Tetapi statement itu sebenarnya hanya memiliki satu kemungkinan yaitu benar atau hanya bisa salah, peserta didik diminta untuk menentukan pilihannya terhadap statement tersebut dengan memilih salah satu diantara benar atau salah.
Ciri bentuk tes ini yakni mudah disusun dan dapat mengungkapkan bahan yang cukup luas, sedangkan kelemahannya adalah faktor terkaan sangat besar sebab hanya memiliki dua kemungkinan antara benar atau salah, di samping itu validitas dan reliabilitasnya rendah.
Kesulitan yang dihadapi dalam menyusun tes ini adalah bagaimana cara menyusun statement yang baik yaitu pernyataan yang benar namun tampak seolah-olah salah, atau pernyataan yang salah tampak seolah-olah benar.
Adapun beberapa petunjuk praktis untyk menyusun item-item True-False Test ini adalah sebagai berikut :
§ Hindarkan penggunaan kalimat negatif lebih dari dua kali, sebab hal ini akan membingungkan peserta didik,
§ Hindarkan penggunaan kalimat yang diambil secara persis seperti dalam buku teks,
§ Hindarkan penggunaan kalimat yang sekedar bertujuan untuk menjebak peserta didik,
§ Gunakanlah kalimat yang singkat, tetapi padat isi,
§ Hindarkan kalimat atau ilustrasi yang tidak dikenal oleh peserta didik,
§ Usahakan jawaban yang benar sama dengan jumlah jawaban yang salah,
§ Penyusunan statement benar dan salah dilakukan secara acak, dan jangan disusun secara sistematik.
Cara untuk menghindari kelemahan tes ini, khususnya untuk menghindari besarnya unsur tebakan adalah dengan cara memperhitungkan faktor tebakan tersebut dalam pemberian skoring. Oleh karena perbandingan antara faktor tebakan dengan kesungguhan adalah 1:1, maka dalam menentukan tinggi rendahnya skor dengan jalan menghitung jumlah jawaban benar dikurangi jumlah jawaban yang salah (B-S). Jika terhadap hasil penjumlahan dan pengurangan menjadi minus, maka skornya ditentukan pada interval terendah tanpa memberikan tanda minus.
Multiple choice test adalah tes obyektif dimana masing-masing item disediakan lebih dari dua kemungkinan jawaban dan hanya satu dari pilihan tersebut yang benar atau yang paling benar. Adapun petunjuk umum menyusun tes yang berbentuk multiple-choice ini adalah sebagai berikut :
§ Kalimat pada tiap-tiap butir soal hendaknya dapat disusun dengan singkat dan jelas,
§ Soal hendaknya disusun menggunakan bahasa yang mudah difahami,
§ Hendaknya antara pernyataan dalam soal dengan alternatif jawaban terdapat kesesuaian,
§ Setiap butir pertanyaan hendaknya hanya mengandung satu masalah, meskipun masalah itu agak kompleks,
§ Hindarkan pengulangan kalimat antara yang terdapat dalam pernyataan dengan yang ada pada alternatif jawaban,
§ Dalam menyusun pernyataan-pernyataan hendaknya dihindari penyusunan yang persis sesuai dengan buku teks.
§ Kunci jawaban dan distraktornya harus memiliki kesuaian dengan pernyataan yang disusun.
Selanjutnya Prof. Sumadi Suryabrata, Ph.D. merinci bentuk pilihan ganda ke dalam menjadi tujuh macam yakni sebagai berikut :
§ Jenis jawaban benar,
§ Jenis jawaban paling tepat,
§ Jenis pertanyaan tidak selesai,
§ Jenis jawaban negative,
§ Jenis alternative tidak lengkap,
§ Jenis kombinasi,
§ Jenis kompleks (sebab-akibat).
Tes bentuk menjodohkan merupakan bentuk khusus dari tes pilihan jamak. Bentuk ini terdiri dari atas dua macam kolom pararel, tiap kolom berisi statement yang satu menempati posisi sebagai soal dan satunya sebagai jawaban, kemudian peserta didik diminta untuk menjodohkan kesesuaian antar dua statement tersebut.
Tes ini sering digunakan untuk mengukur informasi tentang fakta, pengertian, hubungan dan pengertian simbol tertentu. Penyusunan tes ini relatif mudah, dan faktor terkaan peserta didik dapat diperkecil. Kelemahan tes ini hanya dapat mengukur ingatan saja, sedangkan kemampuan analisis dan evaluatif sulit diketahui.
Beberapa petunjuk praktis menyusun tes bentuk ini adalah :
§ Kelompokkan hanya premis-premis yang homogen dan jawaban-jawaban yang homogen,
§ Statement yang menjadi jawaban hendaknya disusun dalam kalimat yang lebih pendek dan ringkas,
§ Karena kecilnya faktor terkaan dalam menjawab tes bentuk ini, nilai dihitung dari jumlah jawab yang benar,
§ Dalam membuat petunjuk, jelaskan dasar yang digunakan untuk menjodohkan,
§ Jangan membuat penjodohan sempurna satu lawan satu.
Sedangkan yang dimaksud dengan rearrangement exercise adalah bentuk tes berupa rangkaian kalimat utuh dan benar, kemudian diceraikan secara tidak beraturan, sehingga bentuk aslinya sulit dikenal, peserta didik diminta menyusun kembali sesuai dengan urutan yang benar.
Tes bentuk ini dapat mengukur kemampuan berfikir logik peserta didik. Bentuk tes ini banyak digunakan untuk mata pelajaran bahasa. Kesulitannya dalam menentukan topik bahasan yang memiliki homoginitas yang cukup baik. Apabila tes ini digunakan dalam ilmu sosial seperti sejarah, geografi, agama, problem hemoginitas tersebut muncul.
Di dalam suatu penilaian terdapat problema utama yakni masalah penggunaan acuan yang akan dijadikan standar untuk dibandingkan dengan hasil pengukuran. Dan untuk pengukuran problema utama adalah bagaimana menentukan obyek pengukuran, bagaimana menyusun alat ukur yang baik, kapan dan bagaimana prosedur pengukuran hasil belajar, dan bagaimana cara mengolah data hasil pengukuran.
- Penilaian dengan acuan patokan,
- Penilaian dengan acuan kelompok,
- Penilaian dengan acuan nilai.
Apabila kita membaca hasil penilaian terkandung pengertian bahwa hasil belajar tersebut menunjukkan kemampuan peserta didik bergerak dari ”tidak menguasai materi pelajaran”. Seberapa jauh tingkat penguasaan dianggap memadai tergantung kepada standar atau patokan yang ditetapkan.
Penilaian acuan patokan dapat dugunakan apabila dasar pemikiran yang digunakan untuk menyelenggarakan pendidikan adalah asumsi paedagogik. Asumsi ini didasarkan atas pertimbangan bahwa keragaman kemampuan peserta didik hendaknya dapat dikurangi hal ini berarti seorang peserta didik harus dapat memacu peserta didik yang berprestasi dan membantu yang lemah.
Di dalam penilain acuan kelompok ini pendidik menggunakannnya sebagai dasar penilaian didasarkan atas asumsi psikologik, yakni pandangan yang menyadari bahwa tidak semua orang itu memiliki kesamaan kemampuan, individu itu memiliki kemampuan yang beragam. Namun apabila keragaman ini ditarik dari penelitian atas sejumlah sampel akan memberikan gambaran yang membentuk distribusi frekuensi normal yakni sebagian besar frekuensi akan berada di sekitar daerah mean, sedangkan sebagian kecil berada di daerah ekor kanan dan kiri dalam posisi yang berimbang.
Penilaian dengan acuan ini dapat digunakan apabila pendidik menghadapi kurikulum yang bersifat dinamis artinya materi pelajaran yang dikembangkan selalu berubah sesuai dengan tuntutan lingkungan dan zaman, sehingga pendidik sulit menetapkan kriteria benar dan salah secara kaku.
Kriteria penilain dalam PAK ini adalah kemampuan rata-rata kelompok, kemudian individu diukur seberapa jauh penyimpangannya terhadap rata-rata tersebut. Hal ini berarti bahwa tes ini harus dapat memberikan gambaran diskriminatif antara kemampuan peserta didik yang pandai dengan yang bodoh. Dalam kaitannya dengan daya diskriminasi sebagai titik tolak pengembangan tes hasil belajar ada indikasi makin tinggi daya diskriminatif suatu butir soal, menandakan tes tersebut semakin baik. Daya diskriminasi itu mencakup :
§ Daya diskriminasi antarindividu,
§ Daya diskriminasi antarsituasi belajar mengajar, dan
§ Daya diskriminasi antarkelompok.
Jika persoalan yang dihadapi dalam penilaian acuan patokan adalah masalah sampling materi tes, dan penetapan tinggi rendahnya patokan yang ditetapkan sebagai kriteria keberhasilan dalam penilaian acuan kelompok adalah pengolahan data statistiknya. Sebab standar yang digunakan dalam penilaian ini adalah skor rata-rata kelompok mengikuti tes, sehingga penentuannya dilakukan dengan mengolah data nilai secara empirik. Pendidik tidak dapat menetapkan patokan lebih dahulu seperti pada penilaian acuan patokan.
§ memberikan skor pada setiap peserta didik,
§ mencari nilai rata-rata kelompok,
§ mencari besar kecilnya simpan baku,
§ membuat pedoman konversi berdasarkan skala yang dikehendaki,
§ menentukan nilai masing-masing peserta didik berdasarkan pedoman konversi tersebut.
Dalam pemberian skor mentah terlebih dahulu diperhatikan bentuk masing-masing subtes, dan bobot masing-masing subtes. Adapun cara memberikan skor masing-masing bentuk tes yaitu tes bentuk esai, tes obyektif bentuk true-false skornya dengan rumus (b-s), tes obyektif bentuk jawab singkat dan isian pendek cukup dengan menjumlah jawaban yang benar, tes obyektif bentuk multiple choice skornya dengan rumus B-S/n-1.
Keterangan B = jumlah jawaban benar,
S = jumlah jawaban salah,
N = jumlah option (alternatif jawaban).
Kemudian tes obyektif bentuk matching dengan menggunakan rumus B-S/(n1-1)(n2-1).
Keterangan B = jumlah jawaban yang benar
S = jumlah jawaban yang salah
n1 = jumlah item pada lajur kiri (soal),
n2 = jumlah item pada lajur kanan (jawaban).
Kemudian dengan tes obyektif bentuk rearrangement-exercise sama dengan cara memberikan skor pada multiple choice. Setelah mendapatkan skor mentah selanjutnya dicari besar kecilnya skor rata-rata peserta tes. Ada rumus yang digunakan yakni M = X/N.
Keterangan M = besarnya rata-rata yang dicari
X = jumlah nilai
N = jumlah peserta tes
Rumus kedua M = fX/N . fX = nilai dikalikan dengan frekuensi. Rumus ini digunakan apabila peserta tes cukup banyak dan nilai disusun berdasarkan distribusi frekuensi baik tunggal ataupun bergolong. Setelah diketahui besar kecilnya mean yang akan digunakan sebagai acuan dalam menentukan nilai tiap individu. Kemudian membuat pedoman konversi nilai. Untuk menyusun laporan ini perlu diperhatikan yakni menetapkan skala yang akan digunakan, menghitung dan menetapkan tabel konversi nilai untuk menentukan besar kecilnya nilai yang diperoleh peserta didik.
Suatu tes dapat dikatakan baik bilamana tes memiliki ciri sebagai alat ukur yang baik. Antara lain memiliki validitas yang cukup tinggi, memiliki reliabilitas yang baik, memiliki nilai kepraktisan. Validitas diartikan sebagai kesahihan, dan validitas diartikan sebagai keterandalan. Suatu alat ukur disebut memiliki validitas bilamana alat ukur tersebut isinya layak mengukur obyek yang seharusnya diukur dan sesuai dengan kriteria tertentu.
Adapun jenis validitas dikelompokkan ke dalam tiga kelompok yaitu validitas konstruksi, validitas isi, validitas kriteria yang meliputi validitas pengukuran setara, pengukuran serentak, prediktif. Validitas konstruksi adalah suatu tes di mana butir soal tersebut membangun setiap aspek berfikir sesuai dengan konsep yang digunakan untuk menguraikan aspek berfikir tersebut.
Validitas isi mempersoalkan apakah isi butir tes yang diujikan itu mencerminkan isi kurikulum yang seharusnya diukur atau tidak. Sedangkan validitas kriteria merupakan tes memiliki kesahihan bilamana terdapat kesesuaian dengan kriteria tertentu digunakan untuk menguji tingkat validitas tes tersebut.Validitas dan reliabilitas memiliki hubungan yang besifat independent, bebas satu sama lain dan dapat pula bersifat detrimental.
Bila tes itu heterogen mempunyai reliabilitas keajegan internal rendah, tetapi mempunyai validitas prediktif yang tinggi. Bila tes itu bersifat homogen mungkin mempertinggi reliabilitas tanpa mempengaruhi validitas. Reliabilitas maksimal membutuhkan interkorelasi tinggi antar item rendah. Reliabilitas maksimal membutuhkan item dengan tingkat kesukaran sama, sedangkan validitas prediktif maksimal menuntut tes memiliki taraf kesukaran berbeda, sehingga perlu kompromi.
Reliabilitas diartikan sebagai keterandalan artinya tes memiliki keterandalan bilaman tes tersebut diapakai mengukur berulang-ulang hasilnya sama. Selain itu diartikan keajegan bilamana tes tersebut diujikan berkali-kali hasilnya relatif sama. Dan diartikan stabilitas bilaman tes itu diujikan dan hasilnya diadakan analisis reliabilitas dengan menggunakan kriteria internal dalam tes tersebut.
Beberapa cara yang digunakan dalam menguji reliabilitas tes yakni
§ Metode Test-retest Reliability
§ Metode Equivalent-Forms Reliability
§ Metode Split-half Reliability
§ Uji hemogenitas
Metode tes-retest Reliability untuk menguji reliabilitas tes dengan jalan menguji tes tersebut dua kali atau lebih kemudian hasilnya dikorelasikan. Tujuan tes ini untuk mengetahui koefisien stabilitas tes. Tes tersebut memiliki keterandalan bilamana dipakai untuk mengukur obyek yang sama dalam waktu yang berbeda-beda hasilnya sama. Adapun langkah yang dapat ditempuh pada uji reliabilitas ini yakni
- Menyusun tes yang akan diukur reliabilitasnya
- Menguji tes yang tersusun tersebut
- Menghitung skor hasil tes tahap 1
- Menguji ulang tes yang tersusun tersebut (tahap 2)
- Menghitung skor hasil tes ulang (tahap 2)
- Menghitung reliabilitas tes tersebut dengan jalan mengkorelasikan skor tes 1 dengan skor tes 2.
Metode Equivalent-form Reliability adalah cara mengukur reliabilitas tes dengan jalan menyusun dua buah tes yang memiliki kemiripan. Walaupun tesnya terdiri dari dua macam, namun hakikatnya isinya mengukur hal yang sama dan alat ukur ini keduanya juga sama.
Adapun langkah ditempuh adalah :
§ menyusun dua buah tes yang ekuivalen,
§ menguji kedua tes tersebut,
§ memberikan skor hasil tes yang telah diujikan,
§ mencari koefisien stabilitas kedua tes.
Metode Split-half Reliability ini dipakai untuk mengetahui tingkat reliabilitas tes dengan jalan membelah tes menjadi dua bagian dan skor kedua belahan tersebut dikorelasikan dengan rumus tertentu. Cara melakukan pembelahan hasil tes dilakukan dengan membelah antara skor ganjil dengan skor genap atau membelah antara belahan nomor atas nomor bawah.
Asumsi penggunaan metode ini sebagai cara mengukur reliabilitas tes adalah tes tersebut disusun dengan pola sistematik, sehingga bilamana dibelah menurut belahan ganjil genap atau belahan atas bawah tidak akan mengubah posisi skor masing-masing siswa.
Adapun langkah secara umum yang ditempuh untuk mencari reliabilitas tes ini adalah :
§ Menyusun sebuah tes sebaiknya jumlah nomornya genap, sehingga bila di belah jumlahnya sama,
§ Mengujikan tes tersebut pada satu sampel,
§ Menghitung skor masing-masing peserta didik dalam dua kelompok skor, dapat dikelompokkan skor ganjil dan genap, dapat pula dikelompokkan skor belahan atas dan skor belahan bawah,
§ Mencari reliabilitas satu tes penuh dengan menggunakan rumus Spearman Brown atau rumus lainnya.
Beberapa rumus untuk mencari tingkat reliabilitas yang menggunakan teknik belah dua adalah :
§ Rumus Spearman Brown,
§ Rumus Flanagan,
§ Rumus Rulon.
Mencari reliabilitas dengan menggunakan rumus spearman-Brown
Rumus : r11 = 2 X r1/2 ½
(1 + r1/2 ½)
Keterangan : r11 = reliabilitas instrumen (satu penuh)
r ½ ½ = reliabilitas setengah tes
Mencari reliabilitas tes dengan rumus flanagan
Rumus : r11 = 2 X 0,65
1 + 0,65
Mencari reliabilitas dengan rumus rulon
Rumus : r11 = 1- SDd2
SDt2
SDd2 = standar deviasi kuadrat (varian) dari selisih skor ganjil dan genap.
Uraian yang dibicarakan mengenai validitas dan reliabilitas tes yang dimasudkan adalah tes tersebut valid dan reliabel secara umum artinya belum tentu seluruh item yang terdapat dalam tes tersebut valid dan reliabel. Untuk mengetahui apakah masing-masing item soal baik perlu dilakukan analisis terhadap empat hal yaitu :
- Seberapa besar peran yang disumbangkan oleh butir item tersebut terhadap skor totalnya.
- Seberapa besar tingkat kesukaran pada butir item itu.
- Apakah butir item itu mampu membedakan kemampuan antara siswa yang pandai dengan siswa yang kurang pandai.
- Apakar butir item tersebut menggunakan distraktor yang baik atau belum.
Selain analisis dari masing-masing item soal kita juga harus dapat mengetahui validitas butir. Validitas butir ini adalah butir tes dapat menjalankan fungsi pengukurannya dengan baik. Hal ini dapat diketahui dari seberapa besar peran yang dberikan oleh butir soal tes tersebut dalam mencapai keseluruhan skor seluruh tes.
Untuk menentukan item yang baik adalah item yang tingkat kesukarannya dapat diketahui tidak terlalu sukar dan tidak terlalu mudah. Sebab tingkat kesukaran item itu memiliki korelasi dengan daya pembeda. Bilamana item memiliki tingkat kesukaran maksimal, maka daya pembedanya akan rendah, demikian pila bila item itu terlalu mudah juga tidak akan memiliki daya pembeda. Oleh karena itu sebaiknya tingkat kesukaran soal itu dipertahankan dalam batas yang mampu memberikan daya pembeda.