Rabu, 26 Oktober 2016

Bab 2 principles of language assessment



Principles of Language Assessment

A. Kepraktisan
  Tes Yang Efektif Praktis. INI bahwa Berarti
  • TIDAK Terlalu mahal,
  • Tetap hati Batasan Waktu Yang Tepat,
  • Relatif Mudah untuk review Mengelola, Dan
  • Memiliki Prosedur scoring / Evaluasi Yang Spesifik Dan Hemat Waktu.
    SEBUAH tes Yang mahal TIDAK Praktis. SEBUAH tes kemampuan bahasa Yang mengambil mahasiswa lima jam untuk review menyelesaikan TIDAK Praktis-mengkonsumsi LEBIH Banyak Waktu (Dan Uang) dari Yang diperlukan untuk review ulasan mencapai tujuannya. Tes SEBUAH Yang memerlukan individu proctoring satu-satu TIDAK Praktis ulasan untuk review mengulas sekelompok beberapa ratus Peserta tes Dan Hanya segelintir Penguji. SEBUAH tes Yang Membutuhkan Waktu beberapa Menit Bagi Siswa ulasan untuk review mengambil Dan beberapa jam untuk review Pemeriksa also mengevaluasi TIDAK Praktis ulasan untuk review situasi Kelas Yang memucat.

B. Keandalan
 SEBUAH tes Yang can konsisten diandalkan Dan diandalkan can be. JIKA Andari memberikan tes Yang sama ditunjukan ditunjukan kepada ditunjukan Siswa Yang sama ATAU Siswa Cocok PADA DOA kesempatan Yang BERBEDA, tes Harus menghasilkan hasil temuan temuan temuan Yang Yang Yang yang serupa. * * * Masalah keandalan tes mungkin Terbaik ditangani DENGAN mempertimbangkan sejumlah faktor Yang can be berkontribusi PADA TIDAK can tes diandalkan. Pertimbangkan kemungkinan berikut (diadaptasi Dari Mousavi, 2002, HAL 804.): Fluktuasi Siswa, hati Mencetak gol, di tes administrasi, Dan hati tes ITU Sendiri.
  • Keandalan mahasiswa-Terkait
Dia ISU Berlangganan Pelajar manajer pagar Penjualan hati kehandalan disebabkan Oleh penyakit SEMENTARA, kelelahan, "hari Yang buruk," kecemasan, Dan faktor Fisik ATAU psikologis lainnya, Yang can MEMBUAT "mengamati" Mencetak menyimpang Dari "true" SKOR Seseorang. Hati JUGA termasuk kategori Penyanyi Adalah faktor-faktor seperti tes-taker untuk review "test-wiseness" ATAU Pengembangan Pengembangan Pengembangan strategi untuk review pengerjaannya pengerjaannya pengerjaannya efisien tes mengambil (Mousavi, 2002, hal. 804).
  • Rater Keandalan
Kesalahan Manusia, subjektivita, Dan Bias can be Proses MASUK Kehearts PENILAIAN. Reliabilitas antar Penilai Terjadi ketika doa ATAU LEBIH Nilai menghasilkan SKOR Yang TIDAK konsisten Dari tes Yang sama, mungkin KARENA kurangnya Perhatian Terhadap Kriteria PENILAIAN, Pengalaman, kurangnya Perhatian, ATAU bahkan Bias Yang terbentuk sebelumnya. Dalam cerita di Perbedaan TENTANG tes Penempatan, Rencana gol Awal ulasan untuk review Uraian ditemukan can be diandalkan-yang, doa Pencetak gol TIDAK pembanding Memverifikasi standar Yang sama.
  • Uji Administrasi Keandalan
TIDAK can diandalkan mungkin also hasil temuan temuan temuan Dari Kondisi di mana tes diberikan. Saya PERNAH menyaksikan administrasi tes pemahaman aural Yang pita Perekam Bermain Barang untuk review pemahaman, tetapi KARENA jalan kebisingan di Luar gedung, Siswa Yang Duduk di Sebelah Jendela TIDAK can be mendengar Rekaman ITU Akurat. INI Adalah KASUS Yang Jelas TIDAK can disebabkan diandalkan Oleh Kondisi tes Administrasi. Sumber-Sumber berbaring TIDAK can diandalkan ditemukan di fotokopi Variasi, Jangka Waktu cahaya di ruangan Bagian Yang BERBEDA, Variasi Suhu, Dan bahkan Kondisi meja Negara Negara Negara Dan kursi.
  • reliabilitas uji
Kadang-kadang Sifat tes ITU Sendiri can be menyebabkan Kesalahan Pengukuran. JIKA tes Terlalu Panjang, Peserta tes can Menjadi Lelah PADA Saat mereka mencapai Barang kemudian Dan buru-buru shalat menanggapi. Tes Waktunya mungkin diskriminasi Terhadap Siswa Yang TIDAK melakukan DENGAN Baik PADA tes DENGAN Batas Waktu. Kita SEMUA industri industri industri tahu orang-orangutan (Dan Andari mungkin termasuk hati category1 Penyanyi) yang "industri industri industri tahu" materi Kursus Sempurna TAPI Yang terpengaruh Oleh kehadiran jam berdetak. Yang Ditulis Barang DENGAN buruk tes (Yang TIDAK Jelas ATAU Yang memiliki Lebih, Dari PADA jawaban Anda Andari Andari yang Benar) can Menjadi Sumber LEBIH Lanjut Dari tes TIDAK can be diandalkan.

C. Validitas
 Sejauh Kriteria Yang Paling Kompleks Yang Efektif tes-dan can dibilang Yang Paling Penting validitas Prinsip-Adalah, "sejauh mana KESIMPULAN Yang Dibuat Dari hasil temuan temuan temuan PENILAIAN Yang Tepat, bermakna, Dan berguna hati HAL tujuan Dari PENILAIAN" (Ground, 1998, HAL . 226). SEBUAH tes Yang valid Dari kemampuan membaca benar-benar mengukur membaca kemampuan-TIDAK visi 20/20, hati ATAU Pengetahuan sebelumnya subjek, ATAU beberapa variabel berbaring dipertanyakan relevansi. UNTUK mengukur kemampuan menulis, orangutan mungkin bertanya Siswa ulasan untuk review menulis kata- kata sebanyak Yang mereka can hati 15 menit mandi mandi mandi, Maka Hanya Menghitung kata-kata ulasan untuk review mengulas SKOR Akhir. tes semacam Penyanyi akan Mudah ulasan untuk review mengulas Mengelola (Praktis), Dan SKOR Cukup diandalkan (reliable). TAPI ITU TIDAK akan merupakan tes Yang Dari kemampuan menulis Tanpa beberapa Pertimbangan comprehensibility valid, elemen Wacana Retorika, Dan Organisasi Serta ide, ANTARA faktor-faktor lainnya.
  • Konten-Berkaitan Bukti
JIKA tes sebenarnya sampel materi Pelajaran TENTANG Yang KESIMPULAN Yang can ditarik, Dan JIKA memerlukan tes-taker ulasan Ulasan untuk review melakukan diukur Perilaku Yang sedang, can mengklaim validitas Bukti Konten Berlangganan, Sering populer digunakan digunakan digunakan disebut validitas sebagai Konten (seperti ini mengundang Partisipasi, Mousavi, 2002 ;. Hughes, 2003) Andari biasanya can be mengidentifikasi Bukti Berlangganan Konten observasional JIKA Andari Jelas can menentukan Prestasi Yang Andari mengukur.
  • Bukti Kriteria-Terkait
Tes SEBUAH kedua Bukti validitas can be hati ditemukan APA Yang disebut Bukti Berlangganan Kriteria, also disebut sebagai validitas Berlangganan Kriteria, ATAU sejauh mana "Kriteria" tes sebenarnya Sudah tercapai. Andari akan Ingat bahwa hati Bab I tercatat bahwa PENILAIAN Berbasis Kelas Yang memucat DENGAN tes Yang dirancang guru-Sesuai DENGAN concept PENILAIAN Kriteria-direferensikan. Dalam tes tersebut, tujuan Kelas Tertentu diukur, Dan Tingkat Yang memiliki tersirat ditentukan Dari mencakup biaya kos diharapkan akan mencapai (80 Persen dianggap Kelulusan minimal).
  • Bukti Membangun-Terkait
SEBUAH JENIS Ketiga Bukti Yang can validitas mendukung, TAPI Satu Yang TIDAK Bermain guru Kelas Peran sebagai gede, Adalah validitas Membangun Berlangganan, Sering disebut sebagai validitas konstruk. SEBUAH Membangun Adalah Teori, hipotesis, Model ATAU Yang Mencoba menjelaskan fenomena Yang diamati di alam semesta kitd PERSEPSI. Konstruksi mungkin ATAU mungkin TIDAK Beroperasi Langsung ATAU Beroperasi empiris data inferensial diukur-mereka Verifikasi Sering Membutuhkan.
  • konsekuensial Validitas
Serta di Perbedaan Tiga Bentuk Yang diterima Beroperasi Luas Dari Bukti Yang can diperkenalkan ulasan untuk review mendukung keabsahan Dari PENILAIAN, doa kategori lainnya mungkin Dari beberapa bunga Dan Utilitas hati pencarian Andari Sendiri ulasan untuk review tes memvalidasi Kelas. Messick (1989), Grounlund (1998 ), McNamara (2000), Dan Brindley (2001), ANTARA berbaring, menggarisbawahi pentingnya Potensi konsekuensi Dari using PENILAIAN. validitas konsekuensial mencakup SEMUA konsekuensi Dari tes, termasuk Pertimbangan seperti akurasinya hati mengukur Kriteria dicabut, dampaknya Terhadap Persiapan Peserta tes, efeknya PADA PESERTA DIDIK, Dan konsekuensi sosial (dimaksudkan Dan TIDAK diinginkan) tes Interpretasi INI Dan using.
  • Wajah Validitas
Merupakan ASPEK Penting Dari validitas konsekuensial Adalah sejauh mana "Siswa Melihat hal HAL HAL PENILAIAN sebagai adil, relevan, Dan berguna untuk review meningkatkan Pembelajaran" (Gronlund, 1998, hal. 210), ATAU APA Yang dikenal sebagai validitas Wajah. "Validitas Wajah mengacu PADA sejauh mana tes terlihat Benar, Dan Muncul ulasan ulasan untuk review mengukur Pengetahuan ATAU kemampuan Klaim untuk review mengukur, berdasarkan PADA PENILAIAN subjektif Dari meneliti Yang mengambilnya, Tenaga administrasi Yang memecahkan Kode penggunaannya, Dan lainnya psychometrically Pengamat Canggih "(Mousavi, 2002, hal. 244 ).

D. Keaslian
  Prinsip Utama keempat Pengujian bahasa keaslian, concept SEBUAH Yang Sedikit Licin ulasan untuk review menentukan, terutama hati art and ilmu mengevaluasi Dan merancang tes. Bachman Dan Palmer (1996, p. 23) mendefinisikan keaslian sebagai "Tingkat korespondensi karakteristik telkom tes bahasa diberikan ditunjukan ditunjukan ditunjukan kepada fitur telkom bahasa sasaran, "agenda Dan kemudian menyarankan ulasan untuk review mengidentifikasi sasaran bahasa telkom-telkom Dan untuk review mengubah mereka Menjadi Barang tes Yang valid.

E. Washback
 SEBUAH ASPEK validitas konsekuensial, dibahas di Perbedaan, Adalah "Efek Pengujian PADA PENGAJARAN Dan Pembelajaran" (Hughes, 2003, hal. 1), ATAU dikenal di Kalangan Ahli bahasa-Pengujian sebagai washback. Dalam PENILAIAN skala Anda Andari Andari gede, wasback umumnya mengacu PADA Efek tes Terhadap Instruksi hati HAL bagaimana Siswa mempersiapkan Diri ulasan untuk review ujian ulasan. Program "Cram" dan "Mengajar ulasan Ulasan untuk review tes" Adalah contoh washback tersebut. Bentuk berbaring washback Dari Yang Terjadi LEBIH hati information PENILAIAN Kelas Adalah yang "mencuci Kembali" ditunjukan ditunjukan ditunjukan kepada Siswa hati Bentuk diagnosa berguna kekuatan Dan kelemahan. Washback also mencakup Dampak Dari PENILAIAN PADA PENGAJARAN Dan Pembelajaran SEBELUM PENILAIAN ITU Sendiri, Yaitu, PADA Persiapan ulasan Ulasan untuk review PENILAIAN.

F. PT-pembanding Memverifikasi Prinsip Ke Evaluasi Tes Kelas
Lima Prinsip kepraktisan, reliabilitas, validitas, keaslian, Dan washback Pergi Jauh Ke Arakh memberikan PANDUAN Yang berguna ulasan untuk review mengulas kedua mengevaluasi prosedur pengajian pengajian pengajian PENILAIAN Yang ADA Dan merancang Satu PADA Andari Sendiri. Kuis, tes, Ujian Akhir, Dan tes kemampuan standar SEMUA can diteliti through lima lensa Penyanyi.
  1. Adalah tes Prosedur Praktek?
  2. Apakah tes Terpercaya?
  3. Apakah Prosedur validitas isi menunjukkan?
  4. Adalah Prosedur Wajah valid dan "Bias untuk review Yang Terbaik"?
  5. Adalah telkom tes sebagai otentik mungkin?
  6. Apakah tes washback bermanfaat lainnya untuk review Pelajar?
Referensi:

Brown, H. Douglas. 2004. PENILAIAN Bahasa:. Prinsip Dan Praktik Kelas New York: Longman.

Selasa, 25 Oktober 2016

BAB 1 "Testing, Assessing, and Teaching

» Pengujian, menilai, mengajar 

1. Pengujian 

     Sebuah tes, dalam hal sederhana, adalah metode pengukuran kemampuan seseorang; pengetahuan, atau kinerja dalam domain tertentu. Mari kita lihat komponen definisi ini. Tes pertama metode. Ini adalah instrument- seperangkat teknik, prosedur, atau item yang membutuhkan kinerja pada bagian dari uji-taker. Kedua, tes harus mengukur. Beberapa tes mengukur kemampuan umum, sementara yang lain menentukan tingkat kemampuan umum;kuis pada mengenali penggunaan yang benar dari artikel yang pasti mengukur pengetahuan khusus. 
Selanjutnya, tes mengukur kemampuan individu; pengetahuan, atau kinerja.Penguji perlu memahami siapa peserta tes yang. Apa pengalaman mereka sebelumnya dan latar belakang? Adalah tes tepat disesuaikan dengan kemampuan mereka? Bagaimana seharusnya peserta tes menafsirkan nilai mereka? Akhirnya, langkah-langkah tes dalam domain tertentu. Dalam kasus uji kemampuan, meskipun kinerja aktual pada tes hanya melibatkan sampling keterampilan, domain yang kemampuan keseluruhan dalam kompetensi bahasa-umum di semua keterampilan bahasa. 
Sebuah tes yang dibangun merupakan instrumen yang menyediakan ukuran yang akurat dari kemampuan peserta tes 'dalam domain tertentu. 

2. Penilaian dan mengajar 

     pengkajian adalah istilah populer dan kadang-kadang disalahpahami dalam praktek pendidikan saat ini. Anda mungkin berpikir pengujian dan menilai hal sebagai sinonim, tetapi mereka tidak.Tes prosedur administrasi siap yang terjadi di kali diidentifikasi dalam kurikulum ketika peserta didik kerahkan semua fakultas mereka untuk menawarkan kinerja puncak, mengetahui bahwa tanggapan mereka sedang diukur dan dievaluasi. 
Penilaian, di sisi lain, adalah proses yang berkelanjutan yang mencakup lebih luas domain. Setiap kali seorang siswa merespon pertanyaan, menawarkan komentar, atau mencoba keluar kata baru atau struktur, guru sadar membuat penilaian kinerja siswa. 
     Pada saat yang sama, selama kegiatan praktek ini, guru memang mengamati kinerja siswa dan membuat berbagai evaluasi dari setiap peserta didik: Bagaimana kinerja dibandingkan dengan kinerja sebelumnya? Aspek kinerja yang lebih baik daripada yang lain? Adalah pelajar melakukan sampai potensi yang diharapkan? Bagaimana kinerja dibandingkan dengan orang lain dalam komunitas pembelajaran yang sama?Dalam kelas yang ideal, semua pengamatan ini memberi makan ke dalam cara guru memberikan  instruksi untuk setiap siswa. 


» Hubungan antara Pengujian, Penilaian dan Pengajaran
    Penilaian bahasa telah memainkan peran penting dalam pengaturan pendidikan baru-baru ini di seluruh dunia. Brown (2004) dalam bukunya, "Bahasa Penilaian: Prinsip dan Praktik " disebutkan penilaian terdiri dari dua konsep pengujian utama: pengujian dan menilai. Sebuah tes adalah "sebuah metode yang mengukur kemampuan, pengetahuan, atau kinerja bahasa pelajar dalam domain tertentu" (Brown, 2004, hal. 3). Menurut penjelasan Brown, pengujian tidak hanya sebuah metode untuk peserta tes untuk memenuhi syarat ujian tetapi juga mengukur kinerja tes-taker dalam instrumen pengaturan. Dibandingkan dengan pengujian, menilai adalah untuk mengevaluasi atau menilai tingkat pelajar selama proses belajar berlangsung (seperti dikutip dalam Mousavi, 2009, hal. 36). Menilai kemampuan peserta didik dengan kinerja produktif tidak hanya menurunkan kecemasan seseorang, tetapi juga meningkatkan sikap seseorang belajar. Selain itu, Mengajar adalah untuk menilai kemampuan belajar pembelajar tidak hanya dengan menerapkan bidang tertentu studi, tetapi juga mengadaptasi teknik pedagogis bersama dengan jumlah kinerja untuk kelas. Artinya, bahasa-keterampilan kegiatan terkait dengan observasi guru adalah bagian dari penilaian dalam praktek mengajar guru.       
      Mengenai (2004) pengenalan Brown untuk penilaian bahasa, hubungan antara pengujian, menilai, dan pengajaran melalui diagram menunjukkan perbedaan dalam praktek pengajaran bahasa.Brown (2004) dalam diagram nya menunjukkan bahwa ajaran tumpang tindih penilaian, pengukuran, dan tes untuk mengevaluasi kompetensi peserta didik (Brown, 2004, hal. 6). Selama proses berlangsung, guru memberikan instruksi bersama dengan penilaian untuk mengevaluasi bagaimana peserta didik memperoleh dan menghasilkan apa yang telah mereka pelajari di kelas. Dengan demikian, penilaian, pengukuran, tes yang saling berkaitan mengajar.


  Referensi
Brown, H. Douglas. . (2004)penilaian Bahasa: Prinsip dan praktek kelas . London: Longman.
Diaz-Rico, LT (2004). Strategi untuk mengajar pelajar bahasa Inggris .Boston, MA: Pearson.