Luận văn Đánh giá quy trình thiết kế đề thi trắc nghiệm khách quan tại khoa khoa học tự nhiên và xã hội đại học Thái Nguyên

Tài liệu Luận văn Đánh giá quy trình thiết kế đề thi trắc nghiệm khách quan tại khoa khoa học tự nhiên và xã hội đại học Thái Nguyên: ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC ______________________________ NGUYỄN TRƯỜNG SƠN ĐÁNH GIÁ QUY TRÌNH THIẾT KẾ ĐỀ THI TRẮC NGHIỆM KHÁCH QUAN TẠI KHOA KHOA HỌC TỰ NHIÊN VÀ XÃ HỘI ĐẠI HỌC THÁI NGUYÊN LUẬN VĂN THẠC SĨ Hà Nội – 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC ______________________________ NGUYỄN TRƯỜNG SƠN ĐÁNH GIÁ QUY TRÌNH THIẾT KẾ ĐỀ THI TRẮC NGHIỆM KHÁCH QUAN TẠI KHOA KHOA HỌC TỰ NHIÊN VÀ XÃ HỘI ĐẠI HỌC THÁI NGUYÊN Chuyên ngành: Đo lường và đánh giá trong giáo dục (Chuyên ngành đào tạo thí điểm) LUẬN VĂN THẠC SĨ Người hướng dẫn khoa học: PGS.TS Lê Đức Ngọc Hà Nội – 2010 LỜI CẢM ƠN Với lòng biết ơn sâu sắc, tôi xin chân thành cảm ơn thầy giáo – PGS.TS Lê Đức Ngọc, người đã định hướng khoa học và giúp đỡ tôi trong suốt quá trình thực hiện luận văn này. Tôi xin bày tỏ lòng biết ơn tới: Ban giám đốc Viện Đảm bảo chất lượng Giáo dục, các thầy cô giáo tham gia giảng dạy khóa đào tạ...

pdf129 trang | Chia sẻ: hunglv | Lượt xem: 1187 | Lượt tải: 0download
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Đánh giá quy trình thiết kế đề thi trắc nghiệm khách quan tại khoa khoa học tự nhiên và xã hội đại học Thái Nguyên, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC ______________________________ NGUYỄN TRƯỜNG SƠN ĐÁNH GIÁ QUY TRÌNH THIẾT KẾ ĐỀ THI TRẮC NGHIỆM KHÁCH QUAN TẠI KHOA KHOA HỌC TỰ NHIÊN VÀ XÃ HỘI ĐẠI HỌC THÁI NGUYÊN LUẬN VĂN THẠC SĨ Hà Nội – 2010 ĐẠI HỌC QUỐC GIA HÀ NỘI VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC ______________________________ NGUYỄN TRƯỜNG SƠN ĐÁNH GIÁ QUY TRÌNH THIẾT KẾ ĐỀ THI TRẮC NGHIỆM KHÁCH QUAN TẠI KHOA KHOA HỌC TỰ NHIÊN VÀ XÃ HỘI ĐẠI HỌC THÁI NGUYÊN Chuyên ngành: Đo lường và đánh giá trong giáo dục (Chuyên ngành đào tạo thí điểm) LUẬN VĂN THẠC SĨ Người hướng dẫn khoa học: PGS.TS Lê Đức Ngọc Hà Nội – 2010 LỜI CẢM ƠN Với lòng biết ơn sâu sắc, tôi xin chân thành cảm ơn thầy giáo – PGS.TS Lê Đức Ngọc, người đã định hướng khoa học và giúp đỡ tôi trong suốt quá trình thực hiện luận văn này. Tôi xin bày tỏ lòng biết ơn tới: Ban giám đốc Viện Đảm bảo chất lượng Giáo dục, các thầy cô giáo tham gia giảng dạy khóa đào tạo Thạc sỹ Đo lường và Đánh giá trong Giáo dục, cùng các anh chị và các bạn đang công tác và học tập tại Viện Đảm bảo chất lượng Giáo dục – Đại học Quốc gia Hà Nội; Ban giám hiệu trường Đại học Khoa học – Đại học Thái Nguyên, các giảng viên tại các Khoa, Bộ môn, các bạn bè và đồng nghiệp; Người thân và gia đình đã luôn giúp đỡ, động viên tôi hoàn thành luận văn này. Hà Nội, ngày 30 tháng 05 năm 2010 Tác giả Nguyễn Trường Sơn LỜI CAM ĐOAN Tôi là: Nguyễn Trường Sơn Là học viên lớp cao học Đo lường và Đánh giá trong giáo dục Khóa 2006 – 2009 (theo Quyết định công nhận học viên cao học số 1803/SĐH ngày 7/11/2006 của Giám đốc Đại học Quốc gia Hà Nội). Tôi xin cam đoan danh dự về công trình khoa học này là của tôi. Nếu sai tôi xin hoàn toàn chịu trách nhiệm. Hà Nội, ngày 30 tháng 05 năm 2010 Tác giả Nguyễn Trường Sơn MỤC LỤC Trang MỞ ĐẦU 1 1. Lý do chọn đề tài 1 2. Mục đích nghiên cứu của đề tài 3 3. Nhiệm vụ nghiên cứu của đề tài 3 4. Giới hạn, phạm vi nghiên cứu 3 5. Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài 3 5.1. Câu hỏi nghiên cứu 3 5.2. Giả thuyết nghiên cứu 4 6. Khách thể và đối tượng nghiên cứu 4 6.1. Khách thể nghiên cứu 4 6.2. Đối tượng nghiên cứu 4 7. Phương pháp nghiên cứu 4 7.1. Nghiên cứu lý thuyết 4 7.2. Nghiên cứu thực nghiệm 4 7.3. Phương pháp Toán học 4 8. Cấu trúc của luận văn 5 CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN 6 1.1. Lịch sử vấn đề nghiên cứu 6 1.1.1. Trên thế giới 6 1.1.2. Việt Nam 8 1.2. Các khái niệm cơ bản về đo lường và đánh giá trong giáo dục 11 1.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá 15 1.3.1. Kiểm tra đánh giá kết quả học tập 15 1.3.2. Mục đích, ý nghĩa của việc kiểm tra, đánh giá KQHT 16 1.3.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá 18 1.4. Quy trình xây dựng đề thi và ngân hàng câu hỏi TNKQ 22 1.4.1. Quy trình xây dựng đề thi TNKQ 22 i 1.4.2. Ngân hàng câu hỏi TNKQ 26 1.5. Kỹ thuật xây dựng các câu hỏi TNKQ 27 1.5.1. Loại đúng – sai (True or False) 27 1.5.2. Loại ghép đôi (Matching items) 29 1.5.3. Loại điền khuyết (Supply item) 30 1.5.4. Loại nhiều lựa chọn (Multi choice questions - MCQ) 31 1.5.5. So sánh trắc nghiệm khách quan và trắc nghiệm tự luận 35 1.6. Phân tích đánh giá câu hỏi và bài trắc nghiệm 37 1.6.1. Mục đích phân tích câu hỏi và bài trắc nghiệm 37 1.6.2. Phương pháp phân tích câu hỏi theo lý thuyết khảo thí hiện đại 38 1.6.3. Một số yêu cầu thống kê đối với câu hỏi và bài TNKQ 45 1.7. Kết luận chương 1 50 CHƯƠNG 2. THỰC TRẠNG QUY TRÌNH THIẾT KẾ ĐỀ THI TNKQ TẠI TRƯỜNG ĐẠI HỌC KHOA HỌC – ĐHTN 51 2.1. Vài nét về trường Đại học Khoa học – Đại học Thái Nguyên 51 2.2. Thông tin chung về các giảng viên tham gia khảo sát 52 2.3. Thực trạng quy trình thiết kế đề thi TNKQ tại đơn vị 54 2.3.1. Thực trạng sử dụng các phương pháp KTĐG 54 2.3.2. Thực trạng quy trình thiết kế đề thi TNKQ 56 2.3.3. Thực trạng phân tích và xử lý kết quả thi 62 2.3.4. Thực trạng chất lượng đề thi 65 2.4. Kết luận chương 2 73 CHƯƠNG 3: MỘT SỐ BIỆN PHÁP NÂNG CAO HIỆU QUẢ QUY TRÌNH THIẾT KẾ ĐỀ THI TNKQ TẠI TRƯỜNG ĐẠI HỌC KHOA HỌC - ĐHTN 74 3.1. Nguyên tắc đề xuất biện pháp 74 3.2. Một số biện pháp nâng cao hiệu quả quy trình thiết kế đề thi TNKQ tại đơn vị 74 3.3. Tổ chức thử nghiệm biện pháp 75 ii 3.4. Đánh giá chung của GV về tính khả thi và hiệu quả của các biện pháp đã triển khai 91 3.5. Kết luận chương 3 93 KẾT LUẬN VÀ KIẾN NGHỊ 95 TÀI LIỆU THAM KHẢO 99 PHỤ LỤC 102 iii CÁC CHỮ CÁI VIẾT TẮT TRONG LUẬN VĂN CNTT Công nghệ thông tin Disc Chỉ số độ phân biệt ĐHKH Đại học Khoa học ĐHQG HN Đại học Quốc gia Hà Nội ĐHTN Đại học Thái Nguyên ĐLĐG Đo lường đánh giá ĐBCLĐT&NCPTGD Đảm bảo chất lượng đào tạo và nghiên cứu phát triển giáo dục GV Giảng viên GD&ĐT Giáo dục và Đào tạo IRT Lý thuyết hồi đáp IRF Hàm đáp ứng câu hỏi KĐCL Kiểm định chất lượng KHKT Khoa học kỹ thuật KQHT Kết quả học tập KT, ĐG Kiểm tra, đánh giá MCQ Câu hỏi nhiều lựa chọn NCKH Nghiên cứu khoa học NHCH Ngân hàng câu hỏi NXB Nhà xuất bản TL Tự luận TNKQ Trắc nghiệm khách quan SV Sinh viên iv DANH MỤC CÁC BẢNG Tên bảng Trang Bảng chương 1 Bảng 1.1 Bảng trọng số cho các nội dung cần đánh giá 25 Bảng 1.2 So sánh phương pháp TNKQ và TNTL 36 Bảng chương 2 Bảng 2.1 Tỷ lệ các phương pháp mà GV sử dụng 54 Bảng 2.2 Nhận thức của GV về hiệu quả các phương pháp KTĐG 55 Bảng 2.3 Tỷ lệ GV phân tích độ khó 63 Bảng 2.4 Tỷ lệ GV phân tích độ phân biệt 63 Bảng 2.5 Thông tin về kết quả tính toán các câu hỏi học phần KHMTĐC 69 Bảng 2.6 Thông tin về kết quả tính toán năng lực của thí sinh 70 Bảng chương 3 Bảng 3.1 Bảng trọng số của học phần “Sinh lý thực vật” 78 Bảng 3.2 Kết quả thi thử nghiệm học phần “Sinh lý thực vật” 79 Bảng 3.3 Thông tin về kết quả tính toán các câu hỏi 83 Bảng 3.4 Thông tin về kết quả tính toán năng lực của thí sinh 86 Bảng 3.5 Kết quả phân tích câu hỏi số 3 88 v DANH MỤC CÁC HÌNH Tên hình Trang Hình chương 1 Hình 1.1 Tóm lược các phương pháp trắc nghiệm 19 Hình 1.2 Quy trình xây dựng đề thi TNKQ 23 Hình 1.3 Các loại câu hỏi TNKQ 27 Hình 1.4 Hàm đáp ứng câu hỏi (IRF) 41 Hình 1.5 Đường cong trả lời theo mô hình Rasch 43 Hình chương 2 Hình 2.1 Số lượng và tỷ lệ giảng viên tham gia khảo sát 53 Hình 2.2 Số năm kinh nghiệm giảng dạy của các giảng viên 53 Hình 2.3 Khó khăn khi thiết kế câu hỏi TNKQ chuẩn 59 Hình 2.4 Thời gian soạn câu hỏi TNKQ 60 Hình 2.5 Tỷ lệ GV phân tích câu hỏi thi 62 Hình 2.6 Tỷ lệ GV được bồi dưỡng phân tích câu hỏi thi 64 Hình 2.7 Sự phân bố năng lực chuẩn của 50 thí sinh 66 Hình 2.8 Kết quả thi học phần Xã hội học đại cương 66 Hình 2.9 Kết quả thi học phần Giải tích A1 67 Hình 2.10 Sự phân bố năng lực của các thí sinh với độ khó của bộ câu hỏi tốt 69 Hình 2.11 Sự phân bố của 50 câu hỏi trong học phần KHMTĐC 71 Hình 2.12 Ma trận so sánh năng lực thí sinh với độ khó của các câu hỏi thi 72 Hình chương 3 Hình 3.1 Kết quả thi thử nghiệm học phần “Sinh lý thực vật” 80 Hình 3.2 Sự phân bố của 50 câu hỏi đo năng lực của thí sinh trong học phần “Sinh lý thực vật” 82 Hình 3.3 Ma trận so sánh năng lực thí sinh với độ khó câu hỏi 84 vi DANH MỤC CÁC PHỤ LỤC Tên phụ lục Trang Phụ lục chương 2 Phụ lục 2.1 Phiếu điều tra khảo sát thực trạng quy trình thiết kế đề thi TNKQ 102 Phụ lục 2.2 Đề thi kết thúc học phần Xã hội học đại cương 105 Phụ lục 2.3 Đề thi kết thúc học phần Giải tích A1 114 Phụ lục 2.4 Đề thi kết thúc học phần Khoa học môi trường đại cương 118 Phụ lục chương 3 Phụ lục 3.1 Danh sách báo cáo viên và các CBGV tham dự bỗi dưỡng về quy trình và kỹ thuật xây dựng đề thi TNKQ, cách xử lý kết quả thi 125 Phụ lục 3.2 Danh sách nhóm GV tham gia xây dựng và thiết kế đề thi thử nghiệm (sau khi tập huấn) 125 Phụ lục 3.3 Đề thi kết thúc học phần “Sinh lý thực vật” 126 Phụ lục 3.4 Chương trình chạy phần mềm Quest 131 vii MỞ ĐẦU 1. Lý do chọn đề tài Hiện nay chất lượng giáo dục đang trở thành mối quan tâm chung của toàn xã hội, đặc biệt là chất lượng giáo dục đại học. Trong khi nguồn lực tại các cơ sở đào tạo còn hạn chế, chưa đủ đáp ứng kịp thời việc tăng nhanh quy mô và các loại hình đào tạo thì vấn đề chất lượng đào tạo trong giáo dục đại học hiện đang là điểm nóng rất cần được quan tâm. Một trong những nội dung quan trọng nhằm nâng cao chất lượng giáo dục đại học chính là việc đổi mới phương pháp giảng dạy, trong đó có việc đổi mới về phương pháp kiểm tra đánh giá kết quả học tập của người học. Có thể nói việc kiểm tra đánh giá là hoạt động không thể thiếu của quá trình dạy và học. Thông qua kiểm tra đánh giá trình độ nhận thức, kỹ năng, kỹ xảo của người học sẽ phát hiện những sai sót, những lỗ hổng về kiến thức… từ đó giúp giáo viên và học sinh tự điều chỉnh hoạt động dạy và hoạt động học. Theo cách thức thực hiện hệ thống các câu hỏi của quá trình dạy học, lý luận giáo dục xem xét kiểm tra và đánh giá như là một nhóm phương pháp dạy học. Từ xưa tới nay kiểm tra đánh giá kết quả học tập của người học nói chung thường sử dụng 2 hình thức thi chủ yếu là: thi viết (tự luận) và thi vấn đáp. Thực tế, hai hình thức này chưa kiểm tra, đánh giá đầy đủ kiến thức đã học của người học một cách nhanh gọn, toàn diện và khách quan. Thi viết (tự luận) và thi vấn đáp, phạm vi đề ra còn hạn chế về kiến thức, nhất là đối với kỳ thi học kỳ hoặc thi tốt nghiệp thì nội dung đề ra không thâu tóm, không bao quát hết chương trình môn học và không đánh giá được chính xác năng lực của người học. Mặt khác, hai hình thức thi này còn hạn chế về tính khách quan, giáo viên thường huy động kiến thức của một bài hoặc một chương để ra đề thi, dễ dẫn đến học sinh học tủ, học lệch, quay cóp… Hướng tới yêu cầu kiểm tra đánh giá công bằng, khách quan kết quả học tập của người học, để đổi mới phương pháp kiểm tra đánh giá người ta bổ sung các hình thức đánh giá khác như sử dụng hình thức thi trắc nghiệm khách quan; chú ý tới việc đánh giá quá trình lĩnh hội tri thức của người học; quan tâm tới việc tích cực 1 hoá hoạt động học tập của người học… Trên cơ sở nắm chắc kiến thức đo lường và đánh giá trong giáo dục, cần tiến hành xây dựng ngân hàng câu hỏi trắc nghiệm (gồm cả câu hỏi TNKQ và tự luận) chuẩn hoá cho từng môn học. Sử dụng ngân hàng này, người học có thể tự ôn tập kiểm tra kiến thức, giáo viên có thể sử dụng để kiểm tra đánh giá học sinh. Để làm được điều này, phải bắt đầu từ việc đào tạo đội ngũ chuyên gia về đánh giá trong giáo dục và bồi dưỡng các kiến thức về khoa học đo lường đánh giá trong giáo dục cho giáo viên ở mọi cấp học, bậc học. Công cuộc đổi mới phương pháp giảng dạy ở trường đại học hiện nay đang được đặc biệt quan tâm, các giảng viên được tập huấn về đổi mới phương pháp giảng dạy, các phương pháp kiểm tra đánh giá, tuy nhiên hiệu quả chưa cao. Sử dụng ngân hàng câu hỏi và thi trắc nghiệm khách quan hiện đang được các trường khuyến khích, tuy nhiên đa số các câu hỏi trắc nghiệm khách quan do giảng viên tự biên soạn chưa theo đúng quy trình, đặc biệt các câu hỏi sau khi sử dụng không được phân tích, đánh giá nên các đề thi/ kiểm tra hiện nay là chưa chuẩn và chất lượng không cao. Trước tình hình như vậy, tôi chọn đề tài luận văn: “Đánh giá quy trình thiết kế đề thi trắc nghiệm khách quan tại Khoa Khoa học Tự nhiên và Xã hội (nay là trường Đại học Khoa học) – Đại học Thái Nguyên”. Kết quả nghiên cứu của luận văn sẽ là tài liệu cần thiết góp phần vào quá trình nâng cao chất lượng và hiệu quả của việc biên soạn và thiết kế đề thi trắc nghiệm khách quan tại đơn vị, đồng thời giúp đưa ra những giải pháp nhằm nâng cao kỹ năng của giảng viên trong việc thiết kế câu hỏi TNKQ dùng để kiểm tra đánh giá kết quả học tập của sinh viên. 2. Mục đích nghiên cứu của đề tài • Đánh giá quy trình và hiệu quả của việc thiết kế và sử dụng các đề thi trắc nghiệm khách quan hiện nay của Nhà trường; • Đưa ra quy trình chuẩn thiết kế các đề thi trắc nghiệm khách quan. • Đưa ra những giải pháp nhằm nâng cao kỹ năng thiết kế đề thi TNKQ của giảng viên. 2 3. Nhiệm vụ nghiên cứu của đề tài Để thực hiện mục đích trên, đề tài có các nhiệm vụ sau: - Khảo sát thực trạng về quy trình, cách thức thiết kế đề thi trắc nghiệm khách quan của các giảng viên trong Trường. - Phân tích các câu hỏi trắc nghiệm khách quan của các đề thi đã được sử dụng (căn cứ vào kết quả trả lời trắc nghiệm của sinh viên). - Đưa ra quy trình chuẩn thiết kế đề thi trắc nghiệm khách quan. 4. Giới hạn, phạm vi nghiên cứu • Đề tài nghiên cứu phương pháp, cách thức thiết kế đề thi trắc nghiệm khách quan của các giảng viên trong Trường; • Nghiên cứu, đánh giá các câu hỏi trắc nghiệm khách quan của một số đề thi TNKQ đã được sử dụng trong Trường, từ đó đề xuất quy trình chuẩn thiết kế đề thi TNKQ. 5. Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài. 5.1. Câu hỏi nghiên cứu • Hiện nay các giảng viên trong Trường thiết kế đề thi TNKQ trên cơ sở nào? Theo quy trình nào? • Các giảng viên có nắm được quy trình thiết kế một đề thi TNKQ hay không? • Đề thi của các giảng viên có đáp ứng yêu cầu kiểm tra đánh giá thành quả học tập hay không? 5.2. Giả thuyết nghiên cứu • Việc thiết kế đề thi TNKQ trong Nhà trường hiện nay hoàn toàn theo tính chủ quan của các giảng viên. • Chất lượng của các câu hỏi, đề thi TNKQ do các giảng viên biên soạn không cao, không đánh giá chính xác năng lực của sinh viên. 6. Khách thể và đối tượng nghiên cứu 6.1. Khách thể nghiên cứu • Các giảng viên đang giảng dạy tại Trường và đang áp dụng hình thức thi TNKQ cho các kỳ thi của Nhà trường. 3 • Các bài thi TNKQ (kết quả thi TNKQ do sinh viên làm) 6.2. Đối tượng nghiên cứu • Nghiên cứu cách thức, quy trình thiết kế đề thi TNKQ của các giảng viên trong Trường hiện nay. 7. Phương pháp nghiên cứu 7.1. Nghiên cứu lý thuyết • Nghiên cứu các tài liệu về đo lường đánh giá trong giáo dục. 7.2. Nghiên cứu thực nghiệm • Quan sát: quan sát quá trình thực hiện đổi mới kiểm tra đánh giá của giảng viên, quá trình thử nghiệm xây dựng ngân hàng câu hỏi TNKQ. • Điều tra: bằng phiếu hỏi và phỏng vấn để tìm hiểu quy trình thiết kế đề thi TNKQ của các giảng viên trong Trường. • Phân tích và tổng kết kinh nghiệm 7.3. Phương pháp Toán học • Sử dụng phần mềm SPSS phân tích số liệu thống kê. • Sử dụng phần mềm chuyên dụng Quest, ConQuest. 8. Cấu trúc của luận văn Mở đầu Chương 1. Cơ sở lý luận và tổng quan về quy trình thiết kế đề thi. Chương 2. Thực trạng quy trình thiết kế đề thi TNKQ tại trường Đại học Khoa học – Đại học Thái Nguyên. Chương 3. Một số biện pháp nâng cao hiệu quả quy trình thiết kế đề thi TNKQ tại trường Đại học Khoa học. Kết luận và kiến nghị Tài liệu tham khảo Phụ lục 4 CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN 1.1. Lịch sử vấn đề nghiên cứu 1.1.1. Trên thế giới Ở Châu Âu và Mỹ khoa học đo lường trong giáo dục phát triển rất mạnh vào thời kì trước và sau chiến tranh thế giới thứ hai (mặc dù khoa học đo lường trong giáo dục có thể xem như bắt đầu cách đây một thế kỉ). Để đánh dấu một bước phát triển rất mạnh, lĩnh vực đo lường trong giáo dục có các dấu mốc quan trọng, một loạt các trắc nghiệm và kĩ thuật ra đời như: Trắc nghiệm trí tuệ Stanford-Binet xuất bản năm 1916, bộ trắc nghiệm thành quả học tập tổng hợp đầu tiên Stanford Achievement Test ra đời vào 1923. Với việc đưa vào chấm trắc nghiệm bằng máy của IBM năm 1935, việc thành lập National Council on Measurement in Education (NCME) vào thập niên 1950 và ra đời Educational Testing Services (ETS) năm 1947, một ngành công nghiệp trắc nghiệm đã hình thành ở Mỹ. Từ đó đến nay khoa học về đo lường trong tâm lý và giáo dục đã phát triển liên tục. Quá trình phát triển của khoa học đo lường trong giáo dục không phải không có những phản hồi mà quá trình phát triển này phải chịu những phê bình chỉ trích một cách thường xuyên, nhưng sự phê bình chỉ trích này không đánh đổ được khoa học đo lường trong giáo dục, mà làm cho khoa học đo lường trong giáo dục có cơ sở điều chỉnh những cái còn thiếu sót và khuyết điểm, những cái chưa làm được để cho khoa học đo lường đánh giá trong giáo dục phát triển mạnh mẽ hơn [18]. Ngành công nghiệp trắc nghiệm ở Mỹ hiện nay ước tính mỗi năm số lượt trắc nghiệm tiêu chuẩn hoá cỡ 1/4 tỉ và trắc nghiệm do giáo viên soạn lên đến con số 5 tỉ. Ngành công nghiệp trắc nghiệm phát triển nhanh kéo theo một loạt ngành liên quan phát triển theo như: ngành công nghệ thông tin, lí thuyết đo lường trong tâm lí phát triển giáo dục. Từ đó việc nâng cao độ chính xác trắc nghiệm ra đời, đó là công nghệ trắc nghiệm nhờ máy tính (Computer Adaptive Test – CAT). Một số nước trên thế giới dùng ngân hàng câu hỏi TNKQ để thi tuyển sinh đại học. 5 Ở Mỹ các trường đại học không tổ chức thi tuyển mà dựa vào kết quả của các kỳ thi do các công ty ngoài nhà nước tổ chức để xét tuyển. Có dịch vụ thi phục vụ công việc này, đó là SAT (Scholastic Assesment Test) do công ty ETS tổ chức, và ACT do Chương trình ACT (American College Testing Program) triển khai. SAT cho thi 2 môn: Anh ngữ và Toán, còn ACT cho thi 4 môn: ngoài Anh ngữ và Toán còn thi thêm đọc hiểu và suy luận khoa học. Còn Nhật Bản, “Trung tâm quốc gia về Tuyển sinh đại học” được thành lập năm 1977 tổ chức kỳ thi tuyển chung cho hầu hết các trường đại học công và tư của Nhật Bản hàng năm. Đề thi được soạn cho 31 môn cụ thể, mỗi thí sinh có thể lựa chọn thi 5 môn của 5 nhóm nào đó tuỳ theo quy định của trường đại học mà thí sinh dự định dự tuyển. Để tổ chức mỗi năm một kỳ thi, Trung tâm này chi tiêu hàng năm cỡ 100 triệu USD. Với Thái Lan, kỳ thi tuyển sinh đại học liên kết được tổ chức cho hầu hết các trường đại học công và tư từ hơn 30 năm nay. Với kết quả kỳ thi, thí sinh có thể xin dự tuyển vào 5 ngành khác nhau của các trường đại học. Từ năm 1998, Thái Lan bắt đầu cải tiến kỳ thi liên kết bằng cách xét thêm điểm trung bình học ở trường phổ thông (với trọng số 10%) và cho thi mỗi năm 2 lần. Ở Trung Quốc, từ năm 1989, việc tổ chức kỳ thi tốt nghiệp phổ thông trung học được giao cho các địa phương, còn kỳ thi tuyển đại học được tổ chức thống nhất trên cả lục địa Trung Quốc vào đầu tháng 7 hàng năm và đề thi chủ yếu bằng ngân hàng câu hỏi TNKQ [18]. 1.1.2. Việt Nam Khoa học về đo lường và đánh giá trong giáo dục ở nước ta trước đây trong tình trạng khá lạc hậu và chậm phát triển. Trước năm 1975, ở Miền Nam nước ta có một vài người được đào tạo về khoa học này từ các nước phương Tây, trong đó có giáo sư Dương Thiệu Tống. Ông đã đưa test vào ngành giáo dục để thực hiện nhưng không thành công. Sau đó ông chỉ áp dụng ngân hàng câu hỏi vào việc thi kiểm tra đánh giá và đặc biệt áp dụng vào việc thi tuyển sinh đại học. Trường Đại học áp dụng mô hình thi trắc nghiệm đầu tiên ở nước ta là trường Đại học Đà Lạt. Vào năm 6 1974, kỳ thi tú tài lần đầu tiên được tổ chức ở Miền Nam bằng phương pháp TNKQ. Vào những năm sau 1975, ở miền Bắc có một số cán bộ nghiên cứu về khoa học đo lường trong tâm lý. Đến năm 1993, Bộ GD & ĐT đã mời một số chuyên gia nước ngoài phổ biến về khoa học này, đồng thời cử cán bộ ra nước ngoài học tập. Từ đó một số trường đại học có tổ chức các nhóm nghiên cứu áp dụng các phương pháp đo lường trong giáo dục để thiết kế các công cụ đánh giá, soạn thảo các phần mềm hỗ trợ, mua máy quét quang học chuyên dụng (OMR) để chấm thi. Kỳ thi tuyển đại học thí điểm được tổ chức tại trường Đại học Đà Lạt vào tháng 7 năm 1996 bằng phương pháp TNKQ. Kỳ thi này có 7200 thí sinh dự tuyển, 2 loại đề TNKQ và TL được sử dụng để thí sinh tự chọn. Có khoảng 70% lượt thí sinh chọn đề TNKQ, bài thi được chấm bằng máy Opscan-7, trong khoảng 60 trường hợp vi phạm kỷ luật thi do quay cóp thì chỉ có 4 thí sinh từ nhóm làm đề TNKQ. [18] Năm 1997, tác giả Nguyễn Phụng Hoàng đã cho ra đời cuốn sách: “Phương pháp trắc nghiệm trong kiểm tra và đánh giá thành quả học tập”. Cuốn sách viết đại cương về các vấn đề đo lường, đánh giá, các phương pháp đo, cách soạn một bài trắc nghiệm khách quan,… tài liệu này rất bổ ích đối với các giáo viên và những người quan tâm đến việc đánh giá kết quả học tập của sinh viên [2]. Ngày 02/03/1995, Trung tâm Đảm bảo chất lượng đào tạo và Nghiên cứu phát triển giáo dục của Đại học Quốc gia Hà Nội được thành lập. Đây là đơn vị đầu tiên ở Việt Nam nghiên cứu chuyên sâu về đảm bảo chất lượng giáo dục, đo lường và đánh giá. Trung tâm đã và đang thực hiện nhiều đề tài nghiên cứu khoa học, các dự án trong nước và quốc tế về các lĩnh vực: khảo thí, đo lường và đánh giá, phương pháp giảng dạy và học tập tích cực, xử lý phân tích số liệu… Trung tâm hiện là đơn vị đầu tiên trong cả nước tổ chức đào tạo Thạc sĩ Đo lường và Đánh giá trong Giáo dục (Measurement and Evaluation in Education), theo quyết định số 307/SĐH của Giám đốc Đại học Quốc gia Hà Nội. Nội dung chính của Khóa đào tạo Thạc sĩ là cung cấp kiến thức và sự hiểu biết chuyên sâu về khoa học đo lường, đánh giá như: các mô hình lý thuyết đo lường đánh giá trong giáo dục, các phương pháp và công cụ đo lường đánh giá phù hợp cho từng lĩnh vực chuyên môn, kiến thức về xử lý, 7 phân tích các thông tin/ số liệu trong từng lĩnh vực thông qua việc sử dụng các phần mềm chuyên dụng… Năm 2002, Bộ Giáo dục và Đào tạo đã tổ chức kỳ thi tuyển đại học theo hình thức “3 chung” và ngày 18/7/2003, Cục Khảo thí và Kiểm định chất lượng giáo dục được thành lập theo Nghị định số 85/2003/NĐ-CP. Quyết định thành lập Cục Khảo thí và Kiểm định chất lượng giáo dục đánh dấu một thời kỳ mới của sự phát triển hệ thống đảm bảo chất lượng và kiểm định chất lượng giáo dục ở Việt Nam. Năm 2003, Khoa Sư phạm Đại học Quốc gia Hà Nội đã xuất bản cuốn “Giáo dục học Đại học”. Đây là cuốn tài liệu dùng để bồi dưỡng các lớp Giáo dục học đại học và Nghiệp vụ sư phạm đại học. Trong phần 1 của cuốn sách, tác giả Lâm Quang Thiệp đã có bài viết về Đo lường và đánh giá thành quả học tập. Tác giả đã đề cập đến rất nhiều nội dung như: đánh giá và đánh giá giáo dục; các phương pháp trắc nghiệm; chất lượng của các câu trắc nghiệm và của đề thi trắc nghiệm; đánh giá thành quả học tập ở trường đại học; và việc áp dụng khoa học đo lường trong giáo dục trên thế giới và ở Việt Nam. Đây là một nội dung rất hữu ích cho các sinh viên, học viên cao học và các nghiên cứu sinh ngành đo lường đánh giá trong giáo dục tham khảo [18]. Năm 2004, tác giả Nguyễn Công Khanh đã viết cuốn “Đánh giá và đo lường trong khoa học xã hội” do NXB Chính trị Quốc gia xuất bản. Nội dung cuốn sách trình bày các phương pháp luận, quy trình, các nguyên tắc và thiết kế công cụ đo lường, các phương pháp phân tích item, cách chọn mẫu, đánh giá độ tin cậy, độ hiệu lực… Cuốn sách đã và đang là tài liệu bổ ích về các kỹ năng thực hành nghiên cứu cho những ai quan tâm [3]. Trong cuốn Giáo dục đại học, tác giả Lê Đức Ngọc đã tổng hợp các bài tham luận tuyển chọn từ các hội thảo trong nước và quốc tế, trình bày các quan điểm và giải pháp về giáo dục đại học cho giai đoạn 1995-2010. Trong cuốn sách này có đề cấp một số vấn đề như: Cải tiến thi tuyển sinh đại học – một yêu cầu cấp thiết để nâng cao chất lượng đào tạo; Một số giải pháp nhằm nâng cao chất lượng dạy và học. Tháng 5/2005, tác giả Lê Đức Ngọc đã viết tiếp cuốn sách “Đo lường và đánh 8 giá thành quả học tập”, trong đó tác giả có nhấn mạnh các phương pháp đo lường, các loại câu hỏi trắc nghiệm, cấu trúc đề thi… Năm 2005, Trung tâm ĐBCLĐT&NCPTGD thuộc ĐHQGHN đã xuất bản cuốn “Giáo dục đại học - chất lượng và đánh giá”. Cuốn sách gồm có 3 phần: Phần 1: Đánh giá hoạt động giảng dạy và nghiên cứu khoa học của giảng viên; Phần 2: Đánh giá hoạt động học tập và nghiên cứu khoa học của sinh viên và học viên cao học; Phần 3: Đánh giá chương trình đào tạo và chương trình giảng dạy. Đây là cuốn sách với rất nhiều nội dung phong phú bao chứa các vấn đề được xã hội rất quan tâm về chất lượng giáo dục đại học. Cuốn sách này sẽ là một tài liệu tham khảo rất hữu ích cho các nhà quản lý giáo dục, các giảng viên, sinh viên, học viên cao học và tất cả những ai quan tâm đến việc nâng cao chất lượng giáo dục đại học Việt Nam [23]. Cũng trong thời gian này có nhiều công trình nghiên cứu của các tác giả: PGS.TS Nguyễn Phương Nga, PGS.TS Lê Đức Ngọc, TS Phạm Xuân Thanh và một số tác giả khác đã nghiên cứu về đề tài đo lường và đánh giá trong giáo dục. Với việc ngày càng chú trọng vào công tác đánh giá chất lượng giáo dục, Bộ GD & ĐT đã có nhiều biện pháp nhằm đổi mới quá trình đánh giá kết quả học tập cho học sinh, sinh viên nhằm đảm bảo tính khách quan, công bằng và đánh giá chính xác năng lực người học. 1.2. Các khái niệm cơ bản về đo lường và đánh giá trong giáo dục • Đo lường (Measurement) Đo lường là quá trình thu thập thông tin một cách định lượng (số đo) về các đại lượng đặc trưng của quá trình giáo dục (nhận thức, tư duy, kỹ năng và phẩm chất nhân văn). Nói một cách cụ thể hơn, đo lường là hoạt động thông qua việc thi kiểm tra để xác định mức độ người học nắm được kiến thức một môn học hoặc mức độ hiểu biết về một vấn đề nào đó. Kết quả đo lường thể hiện dưới dạng một đại lượng định lượng. Trong đánh giá, đo lường là so sánh một sự vật hiện tượng với một chuẩn mực nào đó. Khi sử dụng khái niệm này chúng ta muốn khẳng định tính định lượng, tính chính xác, tính đơn nhất của kết quả đánh giá. [11] 9 • Đánh giá (Evaluation) Có rất nhiều khái niệm về đánh giá trong giáo dục, tùy thuộc vào các cấp độ đánh giá, vào đối tượng, vào mục đích đánh giá mà mỗi định nghĩa đều nhấn mạnh về lĩnh vực cần đánh giá. Theo Jean Marie De Ketele, “đánh giá” có nghĩa là: + Thu thập thông tin đủ thích hợp, có giá trị và đáng tin cậy. + Xem xét mức độ phù hợp giữa tập hợp thông tin này với một tập hợp các tiêu chí phù hợp với mục tiêu định ra ban đầu hay đã điều chỉnh trong quá trình thu thập thông tin. + Nhằm ra một quyết định. Theo Ralph tyler: “Quá trình đánh giá chủ yếu là quá trình xác định mức độ thực hiện các mục tiêu trong các chương trình giáo dục.” Theo E.Beeby: “Đánh giá giáo dục là sự thu thập lí giải một cách hệ thống những bằng chứng, như một phần của quá trình, dẫn tới sự phán xét về giá trị theo quan điểm hoạt động.” Theo Robert F.mager: “Đánh giá là việc miêu tả tình hình của học sinh và giáo viên để dự đoán công việc phải tiếp tục và giúp học sinh tiến bộ.” Từ các định nghĩa trên chúng ta thấy khái niệm đánh giá trong giáo dục phần lớn được xem xét dựa trên sự phù hợp giữa mục tiêu đề ra với việc thực hiện mục tiêu đó. Vấn đề đo lường và đánh giá trong giáo dục thường được người ta quan tâm đến việc thông qua quá trình đánh giá để xem xét các mục tiêu giáo dục đề ra đạt được như thế nào. Bởi vậy: “Đánh giá là một khái niệm để chỉ việc thu thập thông tin một cách hệ thống, xử lý, phân tích dữ liệu làm cơ sở để đưa ra các quyết định nhằm nâng cao chất lượng giáo dục”. Đánh giá là quá trình thu thập và xử lý kịp thời có hệ thống thông tin về hiện trạng, khả năng hay nguyên nhân của chất lượng và hiệu quả giáo dục căn cứ vào mục tiêu giảng dạy, mục tiêu đào tạo làm cơ sở cho những chủ trương, biện pháp và hành động giáo dục tiếp theo nhằm phát huy kết quả, sửa chữa những thiếu sót. 10 • Lượng giá (Assessment) Lượng giá là việc đưa ra thông tin có tính ước lượng về một vấn đề nào đó. Trong giáo dục, lượng giá là ước lượng năng lực hoặc phẩm chất của sản phẩm đào tạo trong quá trình giáo dục theo các hệ thống quy tắc hoặc tiêu chuẩn nào đó, căn cứ vào các thông tin định tính hoặc định lượng (số đo). Lượng giá có thể thực hiện đầu quá trình giảng dạy để giúp tìm hiểu và chẩn đoán (diagnostic) về đối tượng giảng dạy, có thể triển khai trong tiến trình (formative) giảng dạy để tạo những thông tin phản hồi giúp điều chỉnh quá trình dạy và học, cũng có thể thực hiện lúc kết thúc (summative) để tổng kết. Trong giảng dạy ở nhà trường, các đo lường trong tiến trình thường gắn chặt với người dạy, tuy nhiên các đo lường kết thúc thường bám sát vào mục tiêu dạy học đã được đề ra, và có thể tách khỏi người dạy. [11] • Kiểm tra (testing) Theo khoa học giáo dục: Kiểm tra là phương tiện và hình thức của đánh giá. Trong kiểm tra người ta xác định được trước các tiêu chí và không thay đổi chúng trong quá trình kiểm tra cũng như không quan tâm đến quyết định đề ra. Như vậy, kiểm tra là quá trình hẹp hơn đánh giá, hay nói cách khác kiểm tra là một khâu của quá trình đánh giá. Trong quá trình dạy học, kiểm tra – đánh giá là một thành phần của quá trình dạy học, đảm nhận một chức năng lí luận dạy học cơ bản, chủ yếu không thể thiếu được trong quá trình này. Kiểm tra có 3 chức năng bộ phận liên kết, thống nhất, thâm nhập vào nhau và bổ sung cho nhau đó là: đánh giá, phát hiện lệch lạc và điều chỉnh. Về mặt lí luận dạy học: Kiểm tra có vai trò thông tin ngược trong dạy học, nó cho biết những thông tin, kết quả về quá trình dạy của thầy và quá trình học của trò để từ đó có những quyết định cho sự điều khiển tối ưu của cả thầy và trò. Học sinh sẽ học tốt hơn nếu thường xuyên được kiểm tra và được đánh giá một cách nghiêm túc, công bằng với kĩ thuật tốt và hiệu nghiệm. • Thi (Examination) 11 Thi: Làm bài theo đề đã ra nhằm kiểm tra kiến thức hoặc tay nghề để công nhận đạt trình độ, tiêu chuẩn nào đã có sẵn. Theo khoa học giáo dục: Thi cũng là kiểm tra nhưng có tầm quan trọng hơn, được dùng khi kết thúc một giai đoạn đào tạo. Nếu trong kiểm tra, tính chất “tổng kết” (summative) có thể nổi trội hoặc không nổi trội so với tính chất “quá trình” (formative) thì trong thi, tính chất tổng kết luôn luôn là tính chất nổi trội so với tính chất quá trình. • Kết quả học tập (Study achievement): Trong khoa học và trong thực tế thì KQHT được hiểu theo hai nghĩa sau đây: + Thứ nhất: KQHT là mức độ người học đạt được so với các mục tiêu đã xác định (dựa vào các tiêu chí). + Thứ hai: KQHT là mức độ mà người học đạt được so sánh với những người cùng học khác (theo chuẩn). Dù hiểu theo cách nào thì KQHT đều thể hiện ở mức độ đạt được mục tiêu của việc dạy học. Mục tiêu của việc dạy học gồm có mục tiêu về: kiến thức, kỹ năng và thái độ. Ở bậc đại học, việc đánh giá KQHT bao gồm 2 loại đánh giá khác nhau tùy theo mục tiêu đánh giá: + Đánh giá quá trình (Formative assessment): Loại đánh giá này được tiến hành nhiều lần trong quá trình đào tạo nhằm cung cấp các thông tin ngược để giảng viên và học viên kịp thời điều chỉnh quá trình đào tạo. Kiểu đánh giá này được tiến hành sau khi kết thúc một nội dung học tập, sau một bài học hay sau một đơn vị học trình hoặc thậm chí là một chương để thu thập sự phản hồi nhanh của sinh viên để giảng viên có thể kịp thời bổ sung những phần kiến thức còn thiếu hụt của họ, đồng thời bổ sung thêm phần tài liệu còn thiếu và điều chỉnh nội dung, chương trình và phương pháp giảng dạy cho phù hợp với người học ở các giai đoạn khác nhau. Loại đánh giá này cũng giúp sinh viên điều chỉnh hoạt động học tập của mình và nó cũng cung cấp các số liệu chứng minh sự tiến bộ của sinh viên. Bởi vậy loại đánh giá này nên được sử dụng thường xuyên. 12 + Đánh giá tổng kết (Summative assessment): Được tiến hành khi kết thúc quá trình đào tạo nhằm cung cấp các thông tin về chất lượng đào tạo. Loại đánh giá này nhằm xếp loại sinh viên được học tiếp hay không hoặc nó còn để cấp các văn bằng hay chứng chỉ. Đánh giá tổng kết cho số liệu để thừa nhận hay bác bỏ sự hoàn thành hoặc chưa hoàn thành một chương trình học, nó chỉ tiến hành sau khi kết thúc một giai đoạn học tập nhất định như kết thúc môn học, kết thúc khóa học. Do vậy, loại đánh giá này không được tiến hành thường xuyên. Với một học phần cụ thể thì đánh giá tổng kết chỉ ra mức độ mà sinh viên đạt được như thế nào trong các mục tiêu cụ thể trong môn học đó. 1.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá 1.3.1. Kiểm tra đánh giá kết quả học tập: Là quá trình đo lường mức độ đạt được của học sinh về các mục tiêu và nhiệm vụ của quá trình dạy học, là mô tả một cách định tính và định lượng: tính đầy đủ, tính đúng đắn, tính chính xác, tính vững chắc của kiến thức; mối liên hệ của kiến thức với đời sống, các khả năng vận dụng kiến thức vào thực tiễn, mức độ thông hiểu, khả năng diễn đạt bằng lời nói, bằng văn viết, bằng chính ngôn ngữ chuyên môn của học sinh… và cả thái độ của học sinh trên cơ sở phân tích các thông tin phản hồi từ việc quan sát, kiểm tra, đánh giá mức độ hoàn thành nhiệm vụ được giao, đối chiếu với những chỉ tiêu, yêu cầu dự kiến, mong muốn đạt được của môn học. Quy trình kiểm tra đánh giá gồm những công đoạn sau: 1- Phân tích mục tiêu học tập qua các kiến thức, kĩ năng trang bị cho người học. 2- Đặt ra các yêu cầu về mức độ đạt được các kiến thức, kĩ năng dựa trên những dấu hiệu có thể đo lường hoặc quan sát được. 3- Tiến hành đo lường các dấu hiệu đó để đánh giá mức độ đạt được về các yêu cầu đặt ra, biểu thị bằng điểm số. 13 4- Phân tích, so sánh các thông tin nhận được với các yêu cầu đặt ra rồi đánh giá, xem xét kết quả học tập của học sinh, xem xét mức độ thành công của phương pháp giảng dạy của giáo viên để từ đó cải tiến, khắc phục những nhược điểm. Điều quan trọng trong kiểm tra đánh giá là quán triệt nguyên tắc vừa sức, bám sát yêu cầu của chương trình. Kiểm tra đánh giá kết quả học tập dựa trên tiêu chí của mục tiêu dạy học sẽ nhận những thông tin phản hồi chính xác nhằm bổ sung, hoàn thiện quá trình dạy học. 1.3.2. Mục đích, ý nghĩa của việc kiểm tra, đánh giá KQHT: Kiểm tra, đánh giá là một yếu tố quan trọng của giáo dục, nó có mối quan hệ khăng khít với sự phát triển của xã hội. Mục đích của việc KTĐG là nhằm xác định mức độ tiếp thu của sinh viên và mức độ truyền thụ kiến thức của giáo viên so với mục tiêu đề ra. Tuy KT, ĐG là hai công việc khác nhau nhưng có mối quan hệ mật thiết và hữu cơ với nhau. Kiểm tra nghiêm túc thì sẽ dẫn đến việc đánh giá chính xác. Đánh giá chính xác sẽ là nguồn động lực thúc đẩy quá trình học tập của sinh viên. Do vậy, quá trình KT, ĐG không chỉ quan trọng và có ý nghĩa quyết định đối với sinh viên và giáo viên mà còn có ý nghĩa rất lớn đối với những người làm công tác quản lý. + Đối với giáo viên: Thông qua KT, ĐG, giáo viên thu được những thông tin về hoạt động nhận thức của sinh viên trong quá trình học, dự đoán xem sinh viên có đủ điều kiện để tiếp thu kiến thức mới hay không, từ đó định hướng cụ thể cho việc bồi dưỡng, điều chỉnh, bổ sung kiến thức cho phù hợp với từng đối tượng. Thông qua đó giáo viên tự điều chỉnh nội dung, phương pháp, hình thức tổ chức sư phạm cho phù hợp với từng nội dung bài giảng và từng đối tượng cụ thể. + Đối với sinh viên: Việc KT, ĐG có hệ thống và thường xuyên cung cấp kịp thời thông tin về kết quả học tập của sinh viên. Từ đó, sinh viên tự điều chỉnh, tự hoàn thiện quá trình học tập của mình cho phù hợp. 14 Việc KT, ĐG chỉ ra cho mỗi sinh viên thấy mình tiếp thu được và chưa được những gì và cần phải bổ sung kiến thức, kỹ năng ra sao. Thông qua các hình thức thi, kiểm tra, sinh viên có điều kiện tiến hành hoạt động trí tuệ như: ghi nhớ, tái hiện, chính xác hóa, khái quát hóa, hệ thống hóa kiến thức. Từ đó phát huy được năng lực tư duy sáng tạo, vận dụng linh hoạt các kiến thức đã học vào tình huống thực tế. KT, ĐG nếu được tổ chức nghiêm túc sẽ giúp cho sinh viên nâng cao tinh thần trách nhiệm trong học tập, ý trí vươn lên đạt những kết quả cao hơn, tự tin vào khả năng của chính mình, nâng cao ý thức tự giác, khắc phục tính chủ quan, tự mãn. + Đối với cán bộ quản lý: KT, ĐG cung cấp những thông tin cơ bản về thực trạng việc dạy và học trong nhà trường, qua đó có những biện pháp chỉ đạo kịp thời, nhằm đảm bảo thực hiện tốt mục tiêu đã đề ra của quá trình dạy và học trong một nhà trường nói riêng, mục tiêu đào tạo của cả nước nói chung. Như vậy, trong quá trình dạy và học thì việc KT, ĐG là một khâu hết sức quan trọng, không thể thiếu khi thực hiện các mục tiêu đào tạo của ngành giáo dục. 1.3.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá Trắc nghiệm là một loại công cụ đo lường, là phép lượng giá cụ thể mức độ khả năng thể hiện hành vi của một người nào đó, trong một lĩnh vực nào đó. Theo tác giả Lâm Quang Thiệp [18], có thể phân chia các phương pháp trắc nghiệm theo các hình thức sau: Về cách thực hiện trắc nghiệm, có thể phân chia các phương pháp trắc nghiệm ra làm ba loại lớn: loại quan sát, loại vấn đáp và loại viết. - Loại quan sát giúp đánh giá các thao tác, các hành vi, các phản ứng vô thức, các kỹ năng thực hành và cả một số kỹ năng về nhận thức, chẳng hạn cách giải quyết vấn đề trong một tình huống đang được nghiên cứu. - Loại vấn đáp có tác dụng tốt để đánh giá khả năng đáp ứng các câu hỏi được nêu một cách tự phát trong một tình huống cần kiểm tra, cũng thường được sử dụng 15 khi sự tương tác giữa người hỏi và người đối thoại là quan trọng, chẳng hạn để xác định thái độ người đối thoại. - Loại viết thường được sử dụng nhiều nhất. Trắc nghiệm viết lại được chia thành hai nhóm chính: + Nhóm các câu hỏi tự luận (essay test): Các câu hỏi buộc phải trả lời theo dạng mở, thí sinh phải tự mình trình bày ý kiến, đưa ra câu trả lời trong một bài viết để giải quyết vấn đề mà câu hỏi nêu ra. + Nhóm các câu hỏi trắc nghiệm khách quan (objective test): Đề thi thường bao gồm rất nhiều câu hỏi, mỗi câu nêu lên vấn đề và những thông tin cần thiết để thí sinh có thể lựa chọn câu trả lời cho từng câu một cách ngắn gọn. Các phương pháp trắc nghiệm Quan sát Viết Vấn đáp Trắc nghiệm tự luận Trắc nghiệm khách quan Hình 1.1. Tóm lược các phương pháp trắc nghiệm Về cách chuẩn bị đề trắc nghiệm, có thể phân chia thành trắc nghiệm tiêu chuẩn hoá và trắc nghiệm dùng ở lớp học. - Trắc nghiệm tiêu chuẩn hoá thường do các chuyên gia trắc nghiệm soạn thảo, thử nghiệm, tu chỉnh, do đó mỗi câu trắc nghiệm được gắn với các chỉ số cho biết thuộc tính và chất lượng của nó (độ khó, độ phân biệt, phản ánh nội dung và mức độ kỹ năng nào), mỗi đề thi trắc nghiệm có gắn với một độ tin cậy xác định, ngoài ra có những chỉ dẫn cụ thể về cách triển khai trắc nghiệm và giải thích kết quả trắc nghiệm. 16 - Trắc nghiệm dùng ở lớp học (hoặc trắc nghiệm do giáo viên soạn) là trắc nghiệm do giáo viên tự viết để sử dụng trong quá trình giảng dạy, có thể chưa được thử nghiệm và tu chỉnh công phu, thường chỉ sử dụng trong các kỳ kiểm tra với số lượng học sinh không lớn và không thật quan trọng. Về việc đảm bảo thời gian để làm trắc nghiệm, có thể phân chia loại trắc nghiệm theo tốc độ và trắc nghiệm không theo tốc độ. - Trắc nghiệm theo tốc độ thường hạn chế thời gian, chỉ một ít thí sinh làm nhanh mới có thể làm hết số câu của bài trắc nghiệm, nhằm đánh giá kỹ năng làm bài của thí sinh. - Trắc nghiệm không theo tốc độ thường cung cấp đủ thời gian cho phần lớn thí sinh có thể kịp suy nghĩ để làm hết bài trắc nghiệm. Về phương hướng sử dụng kết quả trắc nghiệm, có thể phân chia ra trắc nghiệm theo chuẩn (norm-referrenced test) và trắc nghiệm theo tiêu chí (criterion- referrenced test). - Trắc nghiệm theo chuẩn: là trắc nghiệm được sử dụng để xác định mức độ thực hiện của một cá nhân nào đó so với các cá nhân khác cùng làm một bài trắc nghiệm. - Trắc nghiệm theo tiêu chí: là trắc nghiệm được sử dụng để xác định mức độ thực hiện của một cá nhân nào đó so với tiêu chí xác định cho trước. Hiện nay Bộ Giáo dục và Đào tạo đã có nghiên cứu và thử nghiệm phương pháp thi/ kiểm tra hiện đại là phương pháp trắc nghiệm khách quan. Gọi là “khách quan” vì hệ thống cho điểm loại trắc nghiệm này thực sự khách quan, không có tính chủ quan như trắc nghiệm tự luận, kết quả chấm điểm các câu TNKQ sẽ như nhau đối với mọi người chấm nhờ ở đáp án cho điểm đã được soạn trước, nhất là khi chấm bằng máy. Tuy nhiên cũng không thể nói phương pháp này là tuyệt đối khách quan, vì việc soạn thảo các câu hỏi và định điểm cho câu hỏi hoàn toàn phụ thuộc vào trình độ nhận thức của người soạn. Một bài thi TNKQ bao gồm rất nhiều câu hỏi, mỗi câu hỏi nêu một vấn đề chứa đựng những thông tin cần thiết, sinh viên 17 chọn một câu trả lời trong các phương án cho sẵn. Phương pháp TNKQ có một số ưu điểm và hạn chế sau: Ưu điểm: - Đề thi có nhiều câu hỏi bao phủ được nội dung chương trình, do đó sinh viên không thể xem nhẹ chương nào, phần nào để tự bỏ bớt trong quá trình học tập. - Do có nhiều câu hỏi nên đề thi cuối học phần thường có phạm vi rộng để kiểm tra kiến thức của sinh viên nên buộc SV phải học kỹ, nắm được kiến thức mới có thể làm bài tốt. - Thi trắc nghiệm đòi hỏi sinh viên phải tự giác, chủ động, tích cực học tập, tránh học tủ để đối phó với thi cử. - Giáo viên bớt căng thẳng khi phải coi thi, hỏi thi, chấm thi vào cuối kỳ và đảm bảo thời gian quy định. - Số lượng câu hỏi nhiều, được dự trữ trong “ngân hàng câu hỏi” nên có thể tiến hành theo từng học phần ở nhiều nơi. - Khi làm bài thi TNKQ, số câu hỏi nhiều đòi hỏi sinh viên phải tranh thủ thời gian đọc và suy nghĩ, do đó rèn luyện kỹ năng làm bài và có tác phong nhanh nhẹn. - Điểm thi của bài TNKQ phần lớn do khả năng sinh viên quyết định, hạn chế các tác động tiêu cực từ bên ngoài. - Rất có ưu thế khi chấm bài với số lượng lớn, chấm nhanh, chính xác, khách quan hoặc khi cần so sánh trình độ các lớp sinh viên khác nhau. Hạn chế: - Việc soạn thảo câu hỏi TNKQ rất công phu, phải theo quy trình và tốn nhiều thời gian. - Do đề thi có sẵn các phương án trả lời nên khó đánh giá được quá trình suy nghĩ của sinh viên, có thể khuyến khích sinh viên đoán mò. - Nếu số lượng đề thi không đủ lớn thì sẽ không thể bảo mật được và sinh viên sẽ dựa vào các đề thi cũ để chuẩn bị các phương án trả lời. 18 - Kết quả của bài thi không đánh giá được tính năng động và khả năng sáng tạo của sinh viên. Những hạn chế trên của đề thi TNKQ có thể khắc phục được nếu chúng ta soạn thảo hệ thống ngân hàng câu hỏi TNKQ theo đúng quy trình kỹ thuật và đủ lớn để dự trữ và phải thường xuyên thay đổi, bổ sung làm cho đề thi luôn phong phú, đáp ứng yêu cầu kiểm tra đánh giá KQHT của sinh viên. 1.4. Quy trình xây dựng đề thi và ngân hàng câu hỏi TNKQ 1.4.1. Quy trình xây dựng đề thi TNKQ Khi xây dựng một đề thi/ kiểm tra theo phương pháp sử dụng câu hỏi TNKQ để đo lường thành quả học tập của học sinh cần phải đảm bảo các yêu cầu sau: - Có các khái niệm rõ ràng về các kết quả học tập dự định đánh giá (mong muốn học sinh đạt được mức kiến thức kỹ năng nào, phân bậc các kiến thức và kỹ năng đó, các tiêu chí đánh giá). - Đề thi/ kiểm tra đáp ứng được mục tiêu của kỳ thi/ kiểm tra. - Sử dụng các dạng thức thi/ kiểm tra khác nhau để loại trừ được nhược điểm của từng dạng thức. - Dạng thức thi/ kiểm tra phải phù hợp với các kết quả học tập dự định đo lường, với các thông tin dự định phản hồi với học sinh. - Có số lượng câu hỏi/ bài tập thích hợp để đánh giá đầy đủ và chính xác nhận thức của học sinh. - Quy trình thi/ kiểm tra phải công bằng với học sinh. - Có các tiêu chí cụ thể để phân tích, lý giải các kết quả đạt được của học sinh. - Có thông tin phản hồi kịp thời cho học sinh, nhấn mạnh những điểm mạnh cần phát huy và điểm yếu cần khắc phục. - Kết quả đo lường phải hỗ trợ cho việc chấm điểm (đối với người học) và hỗ trợ hệ thống báo cáo của nhà trường. Để đảm bảo các yêu cầu trên cần tuân thủ các bước soạn thảo chính theo quy trình sau: 19 1. Xác định mục đích sử dụng đề thi/ kiểm tra 2. Chọn mẫu NẾU CHƯA ĐỦ SỐ LƯỢNG 3. Xác định mục tiêu, phân tích nội dung chi tiết và xây dựng bảng trọng số 5. Xem lại câu hỏi thi lần 1 4. Viết câu hỏi thi 6. Thử nghiệm 8. Xem lại câu hỏi thi lần 2 7. Phân tích câu hỏi và bài thi 9. Chỉnh sửa câu hỏi 10. Tập hợp các câu hỏi thi Hình 1.2: Quy trình xây dựng đề thi TNKQ 20 Bước 1: Xác định mục đích sử dụng đề thi/ kiểm tra Đây là bước đầu tiên và cũng là bước khá quan trọng trong quy trình thiết kế một bài thi kiểm tra sử dụng câu hỏi TNKQ. Để tiến hành một kỳ thi/ kiểm tra, chúng ta phải xác định chính xác mục đích của kỳ thi/ kiểm tra đó là gì, ví dụ: - Để theo dõi, giám sát kết quả học tập. - Để phân loại học sinh. - Để tuyển sinh. - Các mục đích khác. Bước 2: Chọn mẫu - Đánh giá tất cả học sinh. - Đánh giá một mẫu đại diện (kỹ thuật chọn mẫu: ngẫu nhiên đơn giản, phân nhóm, phân tầng v.v). Bước 3: Xác định mục tiêu, phân tích nội dung chi tiết và xây dựng bảng trọng số Đây là bước rất quan trọng của quy trình. Để xác định đúng, chính xác mục tiêu đánh giá, đầu tiên ta phải phân tích nội dung của chương trình cho đến nội dung của từng bài, trọng tâm cần phải nắm vững là những phần nào? Trong mỗi một bài, phải xác định rõ mục tiêu cụ thể và các năng lực mà sinh viên cần đạt được, căn cứ vào đó để ta phân bố câu hỏi cho phù hợp với từng mục tiêu. Số lượng câu hỏi phụ thuộc vào tầm quan trọng của nội dung và mục tiêu đã xác định (những mục tiêu đặt ra phải đo lường được). Sau đó ta tiến hành lập bảng trọng số, bảng này phân bố các câu hỏi một cách chi tiết và phân bổ số câu hỏi phù hợp với từng nội dung cần đánh giá. Giảng viên có thể cân nhắc và quyết định xem câu hỏi nào ở mức năng lực nào cần cho điểm thích hợp. Với các trọng số khác nhau có thể cho điểm khác nhau. Cách dễ nhất là cho mỗi câu một điểm sau đó quy ra điểm tương ứng với thang điểm 10. 21 Bảng 1.1. Bảng trọng số cho các nội dung cần đánh giá STT Các nội dung cần đánh giá Các mục tiêu năng lực (nhận thức, tư duy, kỹ năng, kỹ xảo…) Tổng cộng 1 2 ... Tổng cộng: Bước 4: Viết câu hỏi thi Dựa vào bảng trọng số xác định được số lượng câu hỏi, mục tiêu, nội dung và mục đích của đề thi cần đạt được, sau đó tiến hành viết câu hỏi. Đây là công đoạn quan trọng và khó khăn nhất vì giá trị của bài thi trắc nghiệm phụ thuộc vào chất lượng của các câu hỏi. Nếu thiết kế được những câu hỏi tốt thì sẽ có một bài thi/ kiểm tra tốt và ngược lại. Thông thường việc thiết kế câu hỏi thi phải qua các bước sau: - Lựa chọn dạng thức câu hỏi thi. - Kiểm tra lại xem dạng câu hỏi thi đã được lựa chọn có tính khả thi không. - Lựa chọn và tập huấn những người tham gia viết câu hỏi thi để thống nhất cách viết. - Viết câu hỏi thi. Để có một bài trắc nghiệm đạt kết quả cao ta phải tiến hành viết các câu hỏi theo các kỹ thuật cụ thể của từng dạng thức câu hỏi thi mà ta đã lựa chọn. (xem phần 1.5) Bước 5: Xem lại câu hỏi thi lần 1 Sau khi viết đủ các câu hỏi theo số lượng và nội dung như bảng trọng số đã xây dựng, chúng ta cần xem lại các câu hỏi như phần nội dung, cách diễn đạt, độ chính xác của đáp án, lỗi chính tả, lỗi đánh máy… Bước 6: Thử nghiệm 22 Tổ chức cho sinh viên thi thử nghiêm túc sau đó chấm bài rồi nhập số liệu vào phần mềm. Bước 7: Phân tích câu hỏi và bài thi Sử dụng các phần mềm chuyên dụng để phân tích câu hỏi thi và bài thi. Bước 8: Xem lại câu hỏi thi lần 2 Khi số liệu phân tích có vấn đề, cần đối chiếu các câu hỏi trong đề thi để tìm rõ nguyên nhân. Bước 9: Chỉnh sửa câu hỏi Nếu do câu hỏi chưa tốt cần chỉnh sửa lại hoặc loại bỏ nếu cần. Bước 10: Tập hợp các câu hỏi thi Sau khi xem lại câu hỏi thi lần 2 và chỉnh sửa câu hỏi, nếu số lượng câu hỏi chưa đủ thì ta phải viết thêm câu hỏi mới. Lặp lại các bước từ 5 đến 10. 1.4.2. Ngân hàng câu hỏi TNKQ Ngân hàng câu hỏi TNKQ là một tập hợp các câu hỏi TNKQ và đáp án. Nó sẽ là một công cụ để đổi mới phương pháp dạy học, kiểm tra đánh giá và quản lý chất lượng đào tạo. - Trong giảng dạy: giáo viên căn cứ vào NHCH để thực hiện phương pháp dạy học tích cực trong quá trình dạy thu thập thông tin, dạy năng lực xử lý thông tin và năng lực giải quyết vấn đề. - Trong học tập: giúp học sinh xác định kiến thức chuẩn môn học mình cần phải nắm; giúp học sinh tự học và tự kiểm tra nhận thức của mình, mở rộng kiến thức qua các tài liệu tham khảo khác nhau; giúp học sinh có thể học nhóm, trao đổi thảo luận trên cơ sở các câu hỏi có sẵn trong ngân hàng. - Trong kiểm tra đánh giá: sử dụng ngân hàng câu hỏi TNKQ có sẵn giúp tiện lợi cho việc ra đề thi kiểm tra; hạn chế tiêu cực trong thi cử. - Sử dụng ngân hàng câu hỏi TNKQ cũng là giải pháp đa dạng hoá các loại hình đào tạo (tại chức, từ xa, e-learning,…), nhằm mở rộng quy mô đào tạo mà vẫn giữ vững và từng bước nâng cao chất lượng đào tạo. 1.5. Kỹ thuật xây dựng các câu hỏi TNKQ 23 Có nhiều loại câu hỏi trắc nghiệm khác nhau trong một bài kiểm tra đánh giá kết quả học tập và mỗi loại đều có những kỹ thuật xây dựng riêng của nó. Bởi vậy, để tìm hiểu nội dung này, chúng ta đi sâu vào phân tích kỹ thuật xây dựng từng loại câu hỏi TNKQ đó. Trắc nghiệm khách quan Đúng - Sai Ghép đôi Nhiều lựa chọn Điền khuyết Hình 1.3. Các loại câu hỏi TNKQ 1.5.1. Loại đúng – sai (True or False) Câu đúng sai là câu trắc nghiệm yêu cầu người thi phải phán đoán đúng hay sai đối với một câu trần thuật hoặc câu hỏi, cũng chính là để người thi tuỳ ý lựa chọn một trong hai đáp án đưa ra. • Ưu điểm của câu đúng – sai: - Ra đề dễ dàng. Đề thi vừa có thể là câu trần thuật vừa có thể là câu hỏi. Ý nghĩa của đề thi vừa có thể là khẳng định, cũng có thể là phủ định. - Người thi trả lời thuận tiện. - Có thể dùng máy để đánh giá, đọc bài thi trắc nghiệm, tiết kiệm được thời gian, sức lực, lại chính xác, khách quan. - Tất cả các môn học đều có thể sử dụng. - Hiệu suất trắc nghiệm khá cao. Trong một tiếng đồng hồ trả lời của người tham gia trắc nghiệm đúng sai nhiều hơn rất nhiều đề thi có nhiều lựa chọn. • Nhược điểm của câu đúng – sai: Nhược điểm lớn nhất của đề thi đúng sai là chịu ảnh hưởng tương đối lớn của khả năng đoán mò đáp án. Vì vậy nó có độ tin cậy thấp, dễ tạo điều kiện cho 24 học sinh thuộc lòng hơn là hiểu. Học sinh giỏi có thể không thỏa mãn khi phải chọn “đúng - sai” khi câu hỏi viết chưa kĩ càng. • Những gợi ý cho việc biên soạn câu hỏi đúng – sai: Để sử dụng có hiệu quả các câu hỏi đúng – sai chúng ta cần xem xét các nội dung sau: - Dạng câu hỏi này có phù hợp mục đích sử dụng không? - Mỗi câu hỏi có được xem xét rõ ràng là đúng hay sai không? - Đã tránh dùng các từ “thường xuyên”, “luôn luôn” chưa? - Có tránh dùng các câu quá đơn giản không? - Tránh dùng các câu phủ định chưa? - Có dùng từ chính xác để câu hỏi đơn giản và rõ ràng không? - Các câu hỏi về quan điểm có quy về một nguồn không? - Câu đúng và câu sai có độ dài bằng nhau không? - Số lượng các câu đúng và câu sai có gần bằng nhau không? - Có tránh dùng quy luật dễ nhận ra khi trả lời (ví dụ Đ, S, Đ, S) không? 1.5.2. Loại ghép đôi (Matching items) Trắc nghiệm ghép đôi là một loại của câu lựa chọn, cấu kết của nó bao gồm hai phần: một là, nhóm vấn đề; hai là, nhóm phương án lựa chọn đã chuẩn bị. Khi trả lời yêu cầu thí sinh dự thi chọn ra một phương án thích hợp nhất từ trong các lựa chọn trong mỗi vấn đề. Mỗi lựa chọn có thể sử dụng một lần, cũng có thể sử dụng nhiều lần và cũng có thể không sử dụng. • Ưu điểm của câu ghép đôi: - Thích hợp sử dụng nhất cho đo lường tri thức mang tính sự kiện và tính tương quan giữa các sự kiện. - Hiệu suất trắc nghiệm khá cao, diện kiến thức phủ khắp tương đối rộng trong thời gian trắc nghiệm. - Câu hỏi ghép đôi dễ viết, dễ dùng. Có thể dùng loại câu hỏi này để đo các mức trí năng khác nhau. Nó đặc biệt hữu hiệu trong việc đánh giá khả năng nhận biết các hệ thức hay lập các mối tương quan. 25 • Nhược điểm của câu ghép đôi: - Vẫn tồn tại những nhân tố đoán mò. - Loại câu hỏi trắc nghiệm ghép đôi không thích hợp cho việc thẩm định các khả năng như sắp đặt và vận dụng các kiến thức. Muốn soạn loại câu hỏi này để đo mức trí năng cao đòi hỏi nhiều công phu. Ngoài ra nếu danh sách mỗi cột dài thì tốn nhiều thời gian cho thí sinh đọc nội dung mỗi cột trước khi ghép đôi. • Những gợi ý cho việc biên soạn câu hỏi dạng ghép đôi: Để sử dụng có hiệu quả các câu hỏi dạng ghép đôi chúng ta cần xem xét các nội dung sau: - Dạng câu hỏi này có phù hợp mục đích sử dụng không? - Tài liệu có hai bảng liệt kê có đồng nhất không? - Có bảng liệt kê câu trả lời dài hơn hoặc ngắn hơn câu giả thiết/ câu hỏi không? - Có tóm tắt và khái quát câu trả lời và xếp ở bên phải không? - Các câu trả lời có được sắp xếp theo bảng chữ cái hay chuỗi số thứ tự không? - Ở phần chỉ dẫn có chỉ ra phần cơ bản của bài ghép nối không? - Ở phần chỉ dẫn có chỉ ra rằng với mỗi câu trả lời có thể được dùng nhiều hơn một lần không? - Có sắp xếp tất cả các câu ghép nối trong cùng một trang không? 1.5.3. Loại điền khuyết (Supply item) Đây là loại câu hỏi trắc nghiệm khách quan nhưng có câu trả lời tự do. Thí sinh biết câu trả lời bằng một hay vài từ hoặc một câu ngắn. Yêu cầu người thi điền vào chỗ trống trong mỗi câu, loại đề thi/ câu trắc nghiệm này gọi là đề thi/ câu trắc nghiệm điền vào chỗ trống. • Ưu điểm của câu hỏi trắc nghiệm điền khuyết: - Có thể đo lường mức độ ghi nhớ và lí giải kiến thức. - Tất cả các môn học đều có thể dùng, phạm vi ứng dụng rộng rãi. - Cơ hội đoán mò là rất nhỏ. 26 - Thí sinh có cơ hội trình bày những câu trả lời khác thường, phát huy óc sáng kiến. Thí sinh không có cơ hội đoán mò mà phải nhớ ra, nghĩ ra, tìm ra câu trả lời. Dù sao việc chấm điểm vẫn nhanh hơn TNTL song rắc rối hơn những loại câu hỏi trắc nghiệm khách quan khác. Loại này cũng dễ soạn hơn loại câu hỏi nhiều lựa chọn. • Nhược điểm của câu hỏi trắc nghiệm điền khuyết: - Nhìn từ bề ngoài thì đề thi điền vào chỗ trống yêu cầu hoạt động trí lực cao hơn đề thi lựa chọn. Vì nó đưa ra câu trả lời dựa trên cơ sở tái hiện, chứ không phải đưa ra câu trả lời dựa trên cơ sở nhận thức lại. Nhưng trên thực tế, đề thi điền vào chỗ trống không phân tích một cách sâu sắc năng lực nhận thức, tư duy và lý giải như đề thi lựa chọn. - Khó nắm bắt được đáp án người thi đưa ra, tính chính xác của đáp án đưa ra kém, tính chủ quan của người chấm điểm nhiều hơn. - Khó có thể dùng máy để chấm bài thi và cho điểm. - Khi soạn thảo loại câu hỏi này thường dễ mắc sai lầm là trích nguyên văn câu từ trong sách, rồi bỏ đi một vài từ. Phạm vi kiểm tra của loại câu hỏi này thường chỉ giới hạn vào chi tiết vụn vặt. Việc chấm bài mất nhiều thời gian và thiếu khách quan hơn loại câu hỏi nhiều lựa chọn. • Những gợi ý cho việc biên soạn câu hỏi dạng điền khuyết: Để sử dụng có hiệu quả các câu hỏi dạng điền khuyết chúng ta cần xem xét các nội dung sau: - Dạng câu hỏi này có phù hợp mục đích sử dụng không? - Các câu hỏi có thể được trả lời bằng số, biểu tượng, từ hay cụm từ tóm tắt không? - Các câu hỏi có tránh lấy nguyên văn các câu trong sách không? - Các câu hỏi có được xác định để chỉ có một câu trả lời chính xác? - Chỗ trống của câu trả lời có bằng độ dài của câu trả lời không? - Chỗ trống của câu trả lời có ở cuối mỗi câu không? 27 - Các câu hỏi có loại bỏ các dấu hiệu dễ nhận biết không? 1.5.4. Loại nhiều lựa chọn (Multi choice questions - MCQ) Câu hỏi trắc nghiệm yêu cầu người thi tuỳ ý lựa chọn đáp án chính xác trong một số đáp án được gọi là câu hỏi nhiều phương án lựa chọn, gọi tắt là câu hỏi nhiều lựa chọn. Câu hỏi nhiều lựa chọn tuy chủng loại nhiều, nhưng nhìn về kết cấu mà nói thì do hai bộ phận câu dẫn (chủ đề) và câu lựa chọn tạo nên. Bộ phận chủ đề chính thường dùng các từ, câu hỏi, hoặc câu trần thuật để biểu thị. Phần trả lời đã có thể dùng các câu ngắn gọn hoặc các nhóm từ để biểu thị. Trong 4 đến 5 phương án lựa chọn có một phương án hoặc một vài phương án đúng, các phương án còn lại là sai, còn gọi là phương án nhiễu. Căn cứ vào câu dẫn và các phương án lựa chọn khác nhau còn phân thành: * Câu nhiều lựa chọn khẳng định Trong các phương án lựa chọn của câu nhiều lựa chọn theo hình thức khẳng định, có một hoặc một vài phương án đúng còn các phương án khác đều là làm nhiễu. Khi trả lời yêu cầu lựa chọn ra một phương án hoặc tất cả các phương án đúng. * Câu nhiều lựa chọn phủ định Các phương án lựa chọn của câu nhiều lựa chọn có một đáp án sai, khi đưa ra đáp án yêu cầu đối tượng thi tìm ra đáp án sai này. * Câu nhiều lựa chọn theo hình thức tốt nhất chỉ có một phương án đúng (tốt nhất), còn các phương án khác, tuy ở một mức độ nào cũng đúng nhưng chúng đều không phải là đúng nhất. * Câu nhiều lựa chọn suy diễn. Câu nhiều lựa chọn suy diễn là căn cứ vào quan hệ của hai sự vật đã đưa ra để suy diễn, lý luận cho quan hệ của hai sự vật khác. Cách thức đưa ra phương án của nó vẫn là lựa chọn một phương án thích hợp nhất trong một số phương án lựa chọn. * Câu nhiều lựa chọn hỗn hợp 28 Câu nhiều phương án lựa chọn hỗn hợp là do một số đơn độc hoặc một số nhóm đáp án đơn độc không giống nhau tạo nên. • Ưu điểm của câu nhiều lựa chọn: - Thích hợp sử dụng cho tài liệu nhiều loại tầng bậc nhận thức. - Trả lời thuận tiện. - Đọc đề thi tiết kiệm thời gian, sức lực và đánh giá khách quan. - Cơ hội đoán đúng đáp án giảm đi. Nếu đối tượng thi toàn bộ làm dựa vào đoán thì cơ hội đoán đúng ở mỗi câu đúng sai là 50%, còn cơ hội để đoán đúng ở câu có 5 phương án lựa chọn chỉ là 20%. Đối với toàn bộ bài trắc nghiệm mà nói, thì cơ hội điểm số có được để có thể qua kì thi mà toàn bộ lại dựa vào đoán là bằng 0. - Số lượng câu để tạo nên một lần trắc nghiệm cũng khá lớn, phạm vi lấy mẫu đề thi cũng rộng, tính đại diện mạnh, vì thế nó chính là phương pháp áp dụng nhiều để tiêu chuẩn hoá trắc nghiệm. - Giáo viên có thể dùng loại câu hỏi này để kiểm tra - đánh giá những mục tiêu dạy học khác nhau. - Xác định mối tương quan nhân quả. - Nhận biết những điều sai lầm. - Ghép các kết quả hay các điều quan sát được với nhau. - Định nghĩa các khái niệm. - Tìm nguyên nhân của một số sự kiện. - Nhận biết điểm tương đồng giữa hai hay nhiều vật. - Xác định nguyên lí hay ý niệm tổng quát từ những sự kiện. - Xác định thứ tự hay cách sắp đặt nhiều vật. - Xét đoán vấn đề đang được tranh luận dưới nhiều quan điểm. - Độ tin cậy cao hơn. Yếu tố đoán mò hay may rủi giảm đi nhiều so với các loại TNKQ khác khi số phương án lựa chọn tăng lên. 29 - Tính giá trị tốt hơn. Với bài viết trắc nghiệm có nhiều câu trả lời để lựa chọn, người ta có thể đo được khả năng nhớ, áp dụng các nguyên lý, định luật, tổng quát hoá… rất hữu hiệu. - Thật sự khách quan khi chấm bài. Điểm số của bài trắc nghiệm khách quan không phụ thuộc vào chữ viết, khả năng diễn đạt của học sinh và trình độ người chấm bài… • Nhược điểm của câu nhiều lựa chọn: - Viết câu hỏi rất khó khăn. Vì việc biên soạn và đáp án chính xác vừa có khác biệt bản chất nhưng về bề mặt là có những chỗ tương đồng như 3, 4 phương án nhiễu, thực sự không phải là một việc dễ dàng. - Các nhân tố để đoán đúng đáp án đã giảm đi so với câu đúng sai nhưng nó vẫn tồn tại. - Loại câu hỏi này khó soạn vì phải tìm câu trả lời đúng nhất, còn những câu còn lại gọi là câu nhiễu thì cũng có vẻ hợp lý. Ngoài ra phải soạn câu hỏi thế nào đó để đo được các mức trí năng cao hơn mức biết, mức hiểu. - Có những học sinh có óc sáng tạo, tư duy tốt, có thể tìm ra những câu trả lời hay hơn đáp án thì sẽ làm cho học sinh đó cảm thấy không thoả mãn. - Các câu hỏi nhiều lựa chọn có thể không đo được khả năng phán đoán tinh vi và khả năng giải quyết vấn đề khéo léo, sáng tạo một cách hiệu nghiệm bằng loại câu hỏi TNTL soạn kĩ. - Ngoài ra, tốn kém giấy mực để in đề các loại câu hỏi này so với các loại câu hỏi khác và cũng cần nhiều thời gian để học sinh đọc nội dung câu hỏi. • Những gợi ý cho việc biên soạn câu hỏi nhiều lựa chọn: Để sử dụng có hiệu quả các câu hỏi nhiều lựa chọn, chúng ta cần xem xét các nội dung sau: - Đây có phải dạng câu hỏi trắc nghiệm thích hợp nhất để sử dụng không? - Có phải mỗi phần chính của câu trắc nghiệm đều trình bày một vấn đề được giải thích chặt chẽ? 30 - Có phải những phần chính của câu trắc nghiệm đều bắt đầu bằng một câu khẳng định không? - Nếu sử dụng, những từ mang nghĩa phủ định có được nhấn mạnh đặc biệt không? - Các phương án trả lời có cần phải phù hợp về mặt ngữ pháp với phần chính của câu trắc nghiệm không? - Các phương án trả lời có cần phải ngắn gọn, súc tích và không có những từ không cần thiết không? - Các phương án trả lời có giống nhau về độ dài và dạng trình bày? - Có phải chỉ có một phương án đúng hoặc một phương án rõ ràng nhất không? - Các phương án nhiễu có hợp lý để giảm yếu tố đoán mò không? - Câu trắc nghiệm không có các gợi ý về mặt ngôn từ tới câu trả lời đúng? - Các phương án trả lời bằng chữ có sắp xếp theo thứ tự bảng chữ cái? - Các phương án trả lời bằng số có sắp xếp theo thứ tự các con số? - Có cần tránh các đáp án “tất cả các phương án trên đều đúng” hoặc “không có phương án nào đúng” (sử dụng hạn chế và phù hợp)? 1.5.5. So sánh trắc nghiệm khách quan và trắc nghiệm tự luận Cả hai phương pháp, TNKQ và TNTL, đều là những phương pháp hữu hiệu để đánh giá kết quả học tập. Cần nắm vững bản chất từng phương pháp và công nghệ triển khai cụ thể để có thể sử dụng mỗi phương pháp đúng lúc, đúng chỗ. 31 Bảng 1.2. So sánh phương pháp TNKQ và TNTL Đề thi TNKQ Đề thi tự luận Hình thức câu hỏi / đề thi - Một bộ câu hỏi trong đó mỗi câu hỏi đều kèm theo các phương án trả lời cho sẵn để học sinh lựa chọn phương án trả lời. - Một bộ câu hỏi trong đó mỗi câu hỏi không kèm theo các phương án trả lời mà học sinh phải tự luận để đưa ra câu trả lời. - Khó soạn câu hỏi. - Dễ soạn câu hỏi. - Dễ sai về diễn đạt, nội dung câu hỏi thiếu chính xác (vì có nhiều câu hỏi nên khó rà soát). - Ít bị sai sót về diễn đạt, nội dung rõ ràng. - Dễ chuẩn bị đáp án, hướng dẫn chấm. - Khó xây dựng đáp án, hướng dẫn chấm, xây dựng đáp án phức tạp. Mức độ phức tạp khi viết câu hỏi và tổ hợp đề - Có nhiều câu hỏi nên khó nhớ, dễ bảo mật. - Khó bảo mật đề thi do có ít câu hỏi. - Tốn ít thời gian làm bài, đề kiểm tra có thể phủ toàn bộ chương trình. - Phải dành nhiều thời gian cho học sinh làm bài, khó kiểm tra toàn bộ chương trình. - Tốn nhiều thời gian cho việc in ấn, nhân đề. - Không tốn nhiều công sức in ấn đề. Mức độ phức tạp khi tổ chức thi- kiểm tra - Học sinh khó sử dụng tài liệu, loại trừ tiêu cực trong thi cử. - Học sinh dễ quay cóp sử dụng tài liệu, tiêu cực trong thi cử. Vấn đề đoán mò phương án trả lời đúng - Học sinh có thể đoán mò. - Học sinh không đoán được câu trả lời đúng. Độ tin cậy của đề thi - Độ tin cậy cao hơn. - Độ tin cậy thấp. - Có thể đánh giá đầy đủ các mức nhận thức nếu các câu hỏi được soạn kỹ. - Dễ đánh giá được các mức nhận thức cao (phân tích, tổng hợp, đánh giá). Tính giá trị của đề thi - Bao quát toàn bộ chương trình nên - Không bao quát toàn bộ chương 32 đánh giá chính xác hơn, có thể có độ giá trị cao hơn. trình nên độ giá trị có thể không cao. Sự phức tạp của việc chấm điểm - Chấm điểm khách quan, công bằng. - Chấm điểm phụ thuộc vào ý chủ quan của người chấm. Mức độ phức tạp khi phân tích, đánh giá câu hỏi thi - Có nhiều phần mềm để phân tích, đánh giá câu hỏi, lựa chọn những câu hỏi có chất lượng. - Khó phân tích, đánh giá câu hỏi. 1.6. Phân tích đánh giá câu hỏi và bài trắc nghiệm khách quan Sau khi chấm điểm một bài trắc nghiệm khách quan, chúng ta cần đánh giá hiệu quả của từng câu hỏi cũng như toàn bài trắc nghiệm thông qua việc phân tích các phương án trả lời của thí sinh đối với từng câu trắc nghiệm. 1.6.1. Mục đích phân tích câu hỏi và bài trắc nghiệm khách quan Việc phân tích câu hỏi và bài trắc nghiệm có hai mục đích chính: - Thông qua việc phân tích câu hỏi sẽ cho chúng ta thấy chất lượng của câu hỏi thi, từ đó chỉnh sửa, loại bỏ hay bổ sung các câu hỏi để bài TNKQ có chất lượng hơn. - Kết quả của bài thi có thể giúp giảng viên đánh giá mức độ thành công của việc giảng dạy và học tập, từ đó kịp thời điều chỉnh nội dung dạy học và phương pháp đánh giá kết quả học tập cho phù hợp. 1.6.2. Phương pháp phân tích câu hỏi theo lý thuyết khảo thí hiện đại Để biết một thí sinh có nắm được nội dung của môn học sau khi học xong môn học đó hay không, một bài TNKQ có thể cho chúng ta biết một cách chính xác năng lực của thí sinh đó ở mức nào (chỉ nhận biết kiến thức một cách máy móc hay còn có khả năng đánh giá, chuyển giao nhận thức của mình). Các công cụ đo lường, quan sát cần được thiết kế cẩn thận, có độ tin cậy cao để ghi nhận chính xác các hành vi, làm cơ sở để xác định các đại lượng ẩn. 33 • Lý thuyết khảo thí hiện đại hay còn gọi là lý thuyết hồi đáp (Items Response Theory – IRT) [21, 24] Lý thuyết hồi đáp (Item Response Theory hay viết tắt là IRT) của ông Georg Rasch nhằm mô hình hóa mối liên hệ giữa mức độ năng lực của một người và đáp ứng của người ấy với một câu trắc nghiệm hay câu hỏi. Vì các mức độ năng lực (hay gọi tổng quát là “đặc điểm” (trait) là những gì không thể quan sát được nên (IRT) cũng là một trong các mô hình thường được gọi là mô hình đặc điểm tiềm tàng (Latent trait model). Trái với lý thuyết cổ điển về trắc nghiệm, IRT đưa ra một số giả định về hành vi của một người khi trả lời câu hỏi. Các giả định này có một số lợi điểm: + Ta có thể mô tả, hay nêu ra độ khó của một câu hỏi mà không phải phụ thuộc vào mẫu (hay nhóm) người trả lời câu hỏi ấy. + Ta có thể mô tả hay nêu ra năng lực của một nguời mà không phải phụ thuộc vào mẫu (hay nhóm) các câu hỏi được đặt ra cho người ấy. Thế nhưng IRT cũng có một số điểm bất lợi. Hầu như người ta không thể kiểm chứng được hoàn toàn tính chính xác của các giả định mà lý thuyết ấy đưa ra, căn cứ trên các dữ kiện thu thập được. Hơn nữa, các ứng dụng của lý thuyết hồi đáp IRT rất tốn kém về chi phí và công sức, so với các ứng dụng tương tự của các lý thuyết cổ điển. Trong đa số các ứng dụng IRT, người ta phải sử dụng máy tính hiệu năng cao. Một số khái niệm căn bản của IRT + Các giả định: Phần nhiều các mô hình IRT đều đưa ra giả định rằng chỉ có một đặc điểm (trait) duy nhất làm căn bản cho thành tích đáp ứng một câu hỏi. Giả định này xét ra cũng khá hợp lý vì phần lớn các bài trắc nghiệm chỉ đo lường một đặc điểm (hay khả năng) duy nhất, chẳng hạn: khả năng ngôn ngữ, khả năng suy luận trừu tượng. Tất cả các mô hình IRT đều giả định rằng người ta có thể mô tả bằng toán học mối liên hệ giữa mức khả năng của một người và thành tích đáp ứng của người ấy với một câu hỏi. Khi mô tả bằng Toán học mối liên hệ giữa mức khả năng của 34 một người và thành tích đáp ứng câu hỏi này được gọi là “Hàm đáp ứng câu hỏi” (Item response function, viết tắt là IRF) hay “đường cong đặc trưng của câu hỏi “(item characteristic curve). + Hàm đáp ứng câu hỏi: Với các câu trắc nghiệm có hai điểm số (0 = sai, 1 = đúng), hàm đáp ứng câu hỏi (IRF) cho ta biết xác suất đáp ứng đúng một câu hỏi ở mức độ khả năng nào đó. Xác suất có điều kiện này là hàm của các đặc tính câu hỏi hay các “thông số” (parameters). Hàm đáp ứng câu hỏi (IRF) được phát biểu như sau: Nếu u biểu thị cho một đáp ứng với câu hỏi i (0 = sai, 1 = đúng), và θ là khả năng hay đặc điểm đang được đo lường thì hàm đáp ứng câu hỏi (logistic item responsse function) là P(ui = 1/θ ) = ci + (1 - ci)/1 + e - 1.702ai (θ - bi) Và đáp ứng hình đường cong chuẩn (normal ogive item response function) là: P(ui = 1/θ ) = ci + (1 - ci)φ [ai (θ - bi )] Trong đó φ [ai (θ - bi )] là hàm phân bố tích lũy chuẩn (normal comulative distribution function). Trong các phương trình trên đây ai, bi và ci là những thông số mô tả các đặc trưng của câu hỏi i. Hình vẽ dưới đây trình bày hàm đáp ứng câu hỏi (IRF) và ý nghĩa của ba thông số nói trên: ai là thông số độ phân biệt (discrimination) của câu hỏi, nó có liên hệ đến độ dốc của đường biểu diễn ở điểm uốn (point of inflection) của đường ấy; bi là độ khó của câu hỏi, nó là mức θ ở điểm uốn của đường biểu diễn; ci là thông số tạm coi như là thông số đoán mò, nó là xác suất của một người làm trắc nghiệm với khả năng rất thấp nhưng đáp ứng được đúng câu hỏi. Không phải tất cả mọi câu hỏi đều đòi hỏi phải có ba thông số nói trên. Một số chuyên gia đo lường thực hiện công trình nghiên cứu của họ với hai thông số: a 35 (độ phân biệt) và b (độ khó) (cho c = 0). Nhiều người khác, trong số đó có Georg Rasch, thực hiện các mô hình với một thông số mà thôi: bi (ai = cố định, ci = 0) P(Q) 1 0.5 0 tg α= ai Hình 1.4. Hàm đáp ứng câu hỏi (IRF) Điểm uốn P bi ci Mô hình Rasch với câu trắc nghiệm hai điểm số (0 và 1) Trong những năm từ 1950 đến năm 1960, Georg Rasch đã đưa ra một loạt các mô hình đo lường trên cơ sở lý thuyết nói trên. Mô hình căn bản nhất là mô hình Rasch áp dụng với câu trắc nghiệm với hai loại điểm số: 0 điểm, nếu làm sai câu hỏi, và 1 điểm nếu làm đúng câu hỏi. Trong trường hợp này mỗi câu trắc nghiệm được mô tả bằng một thông số (độ khó) kí hiệu là δ , và mỗi người làm trắc nghiệm được mô tả cũng bằng một thông số (khả năng), kí hiệu là β . Mỗi khi một người cố gắng trả lời một câu hỏi, các thông số, độ khó và khả năng, tác động lẫn nhau để cho xác suất đáp ứng của người làm trắc nghiệm ấy. Dạng toán học của mô hình này như sau: e(β n - δ i) Pr = 1 + e(β n - δ i) Trong đó Pr = xác suất của một người với khả năng β n làm đúng (tức được 1 điểm) câu trắc nghiệm có độ khó δ i 36 Đồ thị dưới đây cho thấy sự tác động lẫn nhau giữa độ khó của câu trắc nghiệm và khả năng của người làm trắc nghiệm. Đường cong này được gọi là “đường cong đặc trưng của câu hỏi trắc nghiệm” (item characteristic curve) Xác suất Pr của điểm 1 (đúng) hay điểm 0 (sai) chỉ có thể biến thiên giữa 0 và 1, như ta thấy trên tung độ. Hoành độ chỉ hiệu số: khả năng - độ khó. Hiệu số là số âm nếu độ khó lớn hơn khả năng, và là số dương khi khả năng lớn hơn độ khó. Trên hình vẽ, hiệu số giữa số β và δ là 0 ở giao điểm. Lúc ấy xác suất làm đúng câu hỏi là 0.50. Điều này có nghĩa là cơ may làm đúng câu hỏi cũng bằng cơ may làm sai câu hỏi ấy. Ở phía bên phải của giao điểm này, khả năng của người làm trắc nghiệm lớn hơn độ khó của câu hỏi, và xác suất trả lời đúng thì cao hơn xác suất trả lời sai. Cũng vậy, ở phía bên trái giao điểm, khi độ khó lớn hơn khả năng, xác suất làm đúng câu hỏi giảm xuống đến tận 0. Trong vùng này (bên trái), xác suất đáp ứng sai thì lớn hơn xác suất làm đúng câu ấy. Các đặc tính thống kê của mô hình này cho phép tách riêng ra hai thông số: độ khó của câu hỏi (δ ) và khả năng của người làm trắc nghiệm (β ) 37 { }vtP x (β n - δ i) 0 1 Pr(1) vt 1 P{x =1}> 2 1 2 (β n - δ i) = 0 vt 1 P{x =1}< 2 Pr(0) β −δ( )v t 0 βv δt Hình 1.5. Đường cong trả lời theo mô hình Rasch Định cỡ câu trắc nghiệm với hai loại điểm số (0 và 1) Mô hình Rasch đưa ra một lí thuyết mới để + Phân tích và lựa chọn câu trắc nghiệm + Lập một thang đo cho các điểm số trắc nghiệm Như đã nói ở trên, mô hình Rasch cho biết xác suất của một người trả lời đúng một câu hỏi trắc nghiệm, căn cứ trên hai thông số: - Thuộc tính của người làm trắc nghiệm. Thuộc tính này là bất cứ đặc điểm nào của người ấy mà ta muốn đo lường nhưng thông thường nhất là “khả năng” (ability), “thành quả” (achievement) hay “thái độ” (attitude). Nói chính xác hơn, đó là mức độ khả năng mà người ấy có để trả lời đúng một số câu hỏi tương tự như các câu trong bài trắc nghiệm đã cho. 38 - Thuộc tính của câu trắc nghiệm. Trong thực tế, đó là mức độ khó của câu trắc nghiệm. Mức độ khó này được định nghĩa như là điểm trên thang đo lường mà ở đó người làm trắc nghiệm có may rủi 50% trả lời đúng câu ấy. Do đó, mô hình Rasch đặt người làm trắc nghiệm và câu trắc nghiệm trên cùng một thang đo lường. Việc phỏng định hai thuộc tính nói trên – khả năng của người làm và độ khó của câu hỏi trắc nghiệm được gọi là định cỡ (calibration). Trước khi các số phỏng định nói trên được sử dụng trong việc định cỡ và đo lường, ta cần phải kiểm chứng xem các dữ kiện dùng để phỏng định đó có thích hợp để đo lường hay không. Nếu các dữ kiện không thể xử lí được theo mô hình Rasch, chúng không thể được dùng để định cỡ các câu trắc nghiệm hay đo lường khả năng con người theo bài trắc nghiệm ấy. Công việc kiểm chứng này được gọi là phân tích sự phù hợp (analysis of fit) Việc định cỡ câu trắc nghiệm (item calibration) đòi hỏi phải đánh giá sự hoà hợp (fit) của thông số độ khó với mô hình Rasch Việc định cỡ bài trắc nghiệm (test calibration) đòi hỏi phải đánh giá sự phù hợp của những người làm trắc nghiệm với mô hình Rasch và phỏng định thông số khả năng tương ứng với mỗi điểm số về bài trắc nghiệm ấy Tất cả các công việc trên – đánh giá sự phù hợp, định cỡ câu trắc nghiệm, và định cỡ bài trắc nghiệm đều phải thực hiện trên máy tính. Áp dụng lý thuyết khảo thí hiện đại, ứng dụng công nghệ thông tin, hiện nay có rất nhiều các phần mềm toán học có thể giúp ta nhanh chóng phân tích câu hỏi trắc nghiệm. Hiện nay chúng ta thường sử dụng phần mềm Quest được soạn thảo ở Úc. Phần mềm này có thể tính toán cho ra kết quả về độ khó, độ phân biệt của câu trắc nghiệm và khả năng của người làm trắc nghiệm, phân tích sự phù hợp của câu trắc nghiệm và của người làm trắc nghiệm, đồng thời cũng có thể chỉ ra kết quả bất thường của người làm câu TN nếu có. Các thành tựu quan trọng đó của IRT đã nâng độ chính xác của phép đo lường trong giáo dục lên một tầm cao mới về chất so với các lý thuyết đo lường cổ điển. Từ thành tựu tổng quát đó của IRT, người ta có thể đưa ra các quy trình để xây 39 dựng ngân hàng câu hỏi (item banking), phân tích các kết quả TNKQ để hiệu chỉnh ngân hàng câu hỏi, chủ động thiết kế các đề trắc nghiệm theo các mục đích đặt ra. 1.6.3. Một số yêu cầu thống kê đối với câu hỏi và bài TNKQ • Độ khó và độ phân biệt của câu trắc nghiệm Một số thống kê có thể chỉ ra những thuộc tính của câu hỏi thi, qua đó chúng ta biết được câu hỏi tốt và chưa tốt. Các nhà nghiên cứu (Crocker & Algina, 1986) đã phân loại các chỉ số thường được sử dụng trong phân tích định lượng như sau: 1- Những chỉ số mô tả sự phân bố trả lời của các thí sinh về một câu hỏi cụ thể (trung bình cộng và phương sai). 2- Những chỉ số mô tả mức độ của mối quan hệ giữa sự trả lời của học sinh về một câu hỏi và những tiêu chí cụ thể đang được quan tâm. 3- Những chỉ số liên quan đến phương sai của câu hỏi thi kiểm tra và mối liên hệ với những tiêu chí cụ thể. Một thống kê thường được sử dụng để mô tả các thông số trên câu hỏi thi kiểm tra là giá trị p (độ khó của câu hỏi), phương sai, một số chỉ số phân biệt như hệ số tương quan point-biserial, hệ số tương quan biserial, hệ số tương quan phi. Mỗi chỉ số thống kê này đều quan trọng với những mục tiêu cụ thể khi phân tích câu hỏi thi kiểm tra. Trong những bài kiểm tra TNKQ dùng trong lớp học, giáo viên thường quan tâm đánh giá câu hỏi qua hai đại lượng là độ khó và độ phân biệt của câu trắc nghiệm. Khi soạn xong một câu hoặc một bài trắc nghiệm người soạn chỉ có thể ước lượng độ khó hoặc độ phân biệt của nó bằng cảm tính. Độ lớn của các đại lượng đó chỉ có thể tính được cụ thể bằng phương pháp thống kê sau lần trắc nghiệm thử trên một mẫu thí sinh, dựa vào kết quả thu được từ các câu trắc nghiệm và bài làm của thí sinh. Để xác định độ khó, độ phân biệt thường được tiến hành như sau: chia mẫu học sinh tham gia làm bài kiểm tra thành 3 nhóm : + Nhóm điểm cao H: Từ 25% đến 27% số học sinh đạt điểm cao nhất. + Nhóm điểm thấp L: Từ 25% đến 27% số học sinh đạt điểm thấp nhất. 40 + Nhóm điểm trung bình M: Từ 46% đến 50% số học sinh còn lại. Tuy nhiên, nếu trong lớp học với số lượng học sinh không đông, có thể chỉ chia thành hai nhóm: nhóm điểm thấp (50%) và nhóm điểm cao (50%). Độ khó của câu hỏi (giá trị p, 0 < p < 1) bằng tỷ số phần trăm thí sinh làm đúng câu trắc nghiệm trên tổng số thí sinh tham gia trả lời câu hỏi. (%)100×++= N NNN p LMH Trong đó: N: tổng số học sinh tham gia làm bài kiểm tra NH: tổng số học sinh ở nhóm cao trả lời đúng câu hỏi. NL: tổng số học sinh ở nhóm thấp trả lời đúng câu hỏi. NM : tổng số học sinh ở nhóm trung bình trả lời đúng câu hỏi. Nhiều chuyên gia cho rằng độ khó của các câu hỏi trắc nghiệm được quy định trong khoảng sau: P < 30% là câu hỏi khó. 30% ≤ P ≤ 40% là câu tương đối khó. 40% ≤ P ≤ 60% là câu có độ khó trung bình. P ≤ 70% là câu có độ khó vừa phải. P > 70% là câu dễ. Các chuyên gia biên soạn câu hỏi TNKQ thường lựa chọn câu hỏi có hệ số P với 25% ≤ P ≤ 75% đối với các bài trắc nghiệm dùng trong lớp học. Khi ra một câu hoặc một bài trắc nghiệm cho một nhóm thí sinh nào đó, người ta thường muốn phân biệt trong nhóm ấy những người có năng lực khác nhau (giỏi, trung bình, kém v.v), khả năng của câu trắc nghiệm thực hiện được sự phân biệt ấy được gọi là độ phân biệt. Độ phân biệt của một câu hỏi được tính bằng công thức: N NND LH −= D: độ phân biệt. ( -1 ≤ D ≤ 1) Chỉ số D của một câu trắc nghiệm: 41 D ≥ 0,4: là rất tốt 0,3 ≤ D ≤ 0,39: là khá tốt. 0,2 ≤ D ≤ 0,29: chấp nhận được. D ≤ 0,19: kém, cần loại bỏ hoặc sửa chữa lại cho tốt hơn. Độ phân biệt của một câu liên quan đến độ khó. Thật vậy, nếu một câu trắc nghiệm dễ đến mức mọi thí sinh đều làm tốt, thì độ phân biệt của nó rất kém, vì mọi thí sinh đều có phản ứng như nhau đối với câu trắc nghiệm đó. Cũng vậy, nếu một câu trắc nghiệm khó đến mức mọi thí sinh đều làm không được, các điểm số đạt được chụm ở phần điểm thấp, thì độ phân biệt của nó cũng rất kém. Muốn có độ phân biệt tốt thì câu trắc nghiệm nên có độ khó ở mức trung bình. • Tiêu chuẩn để chọn câu hỏi hay Sau khi phân tích và tính toán các chỉ số của câu hỏi thỏa mãn các yêu cầu sau đây thì được xếp vào danh mục câu hỏi hay: - Độ khó nằm trong khoảng 40% < P < 60% - Độ phân biệt D > 0,20 trở lên là thỏa mãn về độ phân biệt. • Độ tin cậy: Trắc nghiệm là một phép đo mà thước đo là bài trắc nghiệm dùng để đo lường một năng lực nào đó của thí sinh. Độ tin cậy của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ bài trắc nghiệm. Qua nghiên cứu cho thấy các yếu tố sau có ảnh hưởng trực tiếp đến bài trắc nghiệm: - Bài trắc nghiệm càng thuần nhất thì độ tin cậy càng cao. Một bài trắc nghiệm được coi là thuần nhất nếu phần lớn các câu hỏi trong bài có độ khó trung bình. Tuy nhiên cần chú ý khi cố gắng làm tăng tính thuần nhất sẽ có nguy cơ thu hẹp nội dung đánh giá tức là làm giảm độ giá trị của bài trắc nghiệm. - Độ tin cậy của bài trắc nghiệm có mục đích khác nhau, chẳng hạn bài trắc nghiệm về thành quả tối thiểu hay thành quả tối đa có độ tin cậy khác với bài trắc nghiệm phân loại hay chuẩn đoán. 42 Các phương pháp ước lượng độ tin cậy là: phương pháp thi hai lần; dùng các bài trắc nghiệm tương đương; phương pháp dùng phép tính phương sai; phương pháp phân đôi bài trắc nghiệm; phương pháp Kuder – Richardson… Trong khuôn khổ luận văn này, tác giả đã sử dụng phần mềm thống kê SPSS và áp dụng lý thuyết IRT để tính độ tin cậy một cách đơn giản, nhanh chóng và cho kết quả chính xác. • Độ giá trị: Yêu cầu quan trọng nhất của bài trắc nghiệm với tư cách là một phép đo lường trong giáo dục là phép đo ấy đo được cái cần đo. Nói cách khác, phép đo ấy cần phải đạt được mục tiêu đề ra cho nó. Độ giá trị của bài trắc nghiệm là đại lượng biểu thị mức độ đạt được mục tiêu đề ra cho phép đo nhờ bài trắc nghiệm. Các loại tính chất giá trị: giá trị tiên đoán; giá trị so với tiêu chí cho sẵn; giá trị nội dung. Để bài trắc nghiệm có độ giá trị cao, cần phải xác định tỉ mỉ mục tiêu cần đo qua bài trắc nghiệm và bám sát mục tiêu đó trong quá trình xây dựng ngân hàng câu hỏi trắc nghiệm cũng như khi tổ chức triển khai kỳ thi. Nếu thực hiện các quá trình nói trên không đúng thì có khả năng kết quả của phép đo sẽ phản ánh một cái gì khác chứ không phải cái mà ta muốn đo nhờ bài trắc nghiệm. Qua định nghĩa về độ tin cậy và độ giá trị ta có thể thấy rõ mối tương quan giữa chúng. Khi bài trắc nghiệm không có độ tin cậy, tức là phép đo nhờ bài trắc nghiệm rất kém chính xác, thì chúng ta không thể nói đến độ giá trị của nó. Nói cách khác, khi bài trắc nghiệm không có độ tin cậy thì nó cũng không thể có độ giá trị. Đôi khi phép đo nhờ bài trắc nghiệm có thể đo chính xác, nhưng nó lại không đo cái cần đo, trong trường hợp đó thì bài trắc nghiệm có độ tin cậy cao nhưng độ giá trị rất thấp. • Độ phù hợp với mô hình của bài trắc nghiệm khách quan Một trong những dẫn chứng quan trọng để nói rằng bộ câu hỏi TNKQ là tốt khi xác định được tất cả các câu hỏi đều tạo thành một cấu trúc. Khi phân tích dữ liệu bằng phần mềm Quest dựa trên mô hình Rasch, nếu các câu hỏi đều có Infit MNSQ nằm trong khoảng từ 0.77 đến 1.30 là nằm trong giới hạn cho phép. Hay nói 43 cách khác, các câu hỏi trong bộ đề thi này đã tạo thành một cấu trúc đo đúng cái cần đo. Còn nếu câu nào nằm ngoài giới hạn cho phép trên có nghĩa là câu hỏi đó không phù hợp với mô hình, vì vậy các câu hỏi này cần sửa đổi hay loại bỏ. Ngoài ra chúng ta còn xem xét 2 chỉ báo sau: (Kiểm tra sự phù hợp trong thống kê với mô hình Rasch của các câu hỏi.) Summary of item Estimates ----------------------------------------- Mean : bằng 0 SD : gần 1 SD (adjusted) : gần 1 . Reliability of estimate : Fit Statistics --------------- Infit Mean Square Outfit Mean Square Mean = 1.00 Mean 1.00 SD gần = 0 SD .24 --------------------------------------------------------------------------------------- Nếu các chỉ báo trên đạt thì bộ câu hỏi đã xây dựng là tốt. 1.7. Kết luận chương 1 Trong chương 1 đã trình bày các vấn đề sau: - Khái quát các vấn đề nghiên cứu trên thế giới và Việt Nam; - Một số vấn đề lý luận cơ bản về đo lường và đánh giá trong giáo dục; - Quy trình xây dựng đề thi TNKQ; - Các kỹ thuật xây dựng câu hỏi TNKQ; - Cách phân tích đánh giá câu hỏi và bài thi TNKQ. 44 CHƯƠNG 2. THỰC TRẠNG QUY TRÌNH THIẾT KẾ ĐỀ THI TNKQ TẠI TRƯỜNG ĐẠI HỌC KHOA HỌC – ĐẠI HỌC THÁI NGUYÊN 2.1. Vài nét về trường Đại học Khoa học – Đại học Thái Nguyên Trường Đại học Khoa học thuộc Đại học Thái Nguyên được thành lập theo Quyết định số 1901/QĐ-TTg ngày 23 tháng 12 năm 2008. Tiền thân của trường là Khoa Khoa học Tự nhiên thuộc Đại học Thái Nguyên. Năm 2002, Khoa Khoa học Tự nhiên được thành lập với nhiệm vụ là đào tạo cán bộ chuyên ngành khoa học tự nhiên với các trình độ đại học và sau đại học, đồng thời giảng dạy chương trình khoa học tự nhiên cho các chuyên ngành đào tạo khác trong Đại học Thái Nguyên. Đến tháng 11/ 2006, để phù hợp với sự mở rộng của quy mô và ngành nghề đào tạo, Giám đốc Đại học Thái Nguyên đã có Quyết định số 803/QĐ-TCCB đổi tên Khoa Khoa học Tự nhiên thành Khoa Khoa học Tự nhiên và Xã hội. Ngoài nhiệm vụ đào tạo cán bộ chuyên ngành khoa học tự nhiên, khoa còn chịu trách nhiệm đào tạo cán bộ chuyên ngành khoa học xã hội như: cử nhân văn học, quản lý xã hội, lịch sử… Tháng 12/2008, sau 6 năm ổn định và phát triển, trường Đại học Khoa học được thành lập trên cơ sở khoa Khoa học Tự nhiên và Xã hội. Sự thành lập trường Đại học Khoa học xuất phát từ sự tổ chức lại mô hình đào tạo cho phù hợp với xu thế phát triển của Đại học Thái Nguyên, đáp ứng nhu cầu học ngày càng cao của xã hội và phục vụ mục tiêu cung cấp cán bộ khoa học có trình độ cao cho các tỉnh khu vực trung du, miền núi phía Bắc. Trường rất quan tâm đến việc xây dựng, bồi dưỡng đội ngũ, nâng cao trình độ cho cán bộ, viên chức, hiện nay trường có 227 cán bộ, viên chức, hợp đồng lao động làm việc, giảng dạy tại 05 phòng chức năng và 08 khoa, bộ môn thuộc trường, trong đó có: 03 PGS; 13 tiến sĩ; 86 thạc sỹ; 112 người có trình độ đại học; cán bộ giảng dạy là 177 người. Nhà trường đang đào tạo 15 ngành, trong đó có 11 ngành đại học, 03 ngành cao học và 01 ngành tiến sĩ với tổng số là 3381 sinh viên, học viên. 45 Sứ mạng của trường Đại học Khoa học là: Thông qua quá trình giáo dục và đào tạo, nghiên cứu khoa học cung cấp nguồn nhân lực trình độ cao trong lĩnh vực khoa học cơ bản và ứng dụng, góp phần nâng cao chất lượng cuộc sống, phát triển bền vững xã hội, phục vụ sự nghiệp công nghiệp hóa, hiện đại hóa của khu vực miền núi phía Bắc và của cả nước. Song song với đào tạo nguồn nhân lực có trình độ cao, trường Đại học Khoa học đã và đang phấn đấu trở thành trung tâm nghiên cứu, chuyển giao công nghệ thuộc các lĩnh vực khoa học cơ bản, khoa học ứng dụng góp phần quan trọng cho sự phát triển kinh tế xã hội của khu vực. 2.2. Thông tin chung về các giảng viên tham gia khảo sát • Về số lượng giảng viên: 80 giảng viên ở các Khoa: Toán Tin, Khoa học Môi trường, Hóa học, Văn – Quản lý xã hội, Sinh học. • Về giới tính: Số lượng giảng viên thuộc các Khoa tham gia khảo sát và tỷ lệ giảng viên nam - nữ được thể hiện ở hình 2.1. Số liệu ở hình 2.1 cho thấy tỷ lệ giảng viên nam và nữ là gần tương đương. Khoa có tỷ lệ giảng viên nữ nhiều nhất là Văn - QLXH. Khoa có tỷ lệ giảng viên nam nhiều nhất là Khoa Toán Tin. 0 2 4 6 8 10 12 Hình 2.1. Số lượng và tỷ lệ giảng viên tham gia khảo sát Nam 10 3 9 7 9 Nữ 7 12 8 9 6 Toán Tin Văn QLXH óa học Sinh học KHMTH 46 • Về số năm kinh nghiệm giảng dạy: Số liệu ở hình 2.2 cho thấy có gần 60% giảng viên có kinh nghiệm giảng dạy dưới 5 năm, nghĩa là, số giảng viên trẻ chiếm đa số giảng viên trong trường tham gia nghiên cứu này. Có gần 90% giảng viên có số năm kinh nghiệm giảng dạy dưới 10 năm. Điều này cho thấy trường ĐHKH đang trong giai đoạn phát triển mạnh nên đã tuyển một lượng lớn cán bộ giảng viên trẻ. Chỉ có hơn 10% giảng viên có số năm kinh nghiệm giảng dạy từ 10 năm trở lên trong tổng số giảng viên tham gia đợt khảo sát này. 8 (10,0%) 2 (2,4%) 47 (58,8%) 23 (28,8%) 0 10 20 30 40 50 Dưới 5 năm Từ 5-10 năm Từ 11-15 năm Trên 15 năm Hình 2.2. Số năm kinh nghiệm giảng dạy của các giảng viên 2.3. Thực trạng quy trình thiết kế đề thi TNKQ tại đơn vị 2.3.1. Thực trạng sử dụng các phương pháp KTĐG • Về số lượng các phương pháp: Theo kết quả điều tra từ các giảng viên, để kiểm tra đánh giá KQHT của sinh viên trong trường, các giảng viên đã sử dụng các phương pháp KTĐG để đánh giá KQHT của sinh viên như: Viết (tự luận), vấn đáp, thực hành, tiểu luận và trắc nghiệm khách quan. Trong tổng số 163 đề thi kết thúc học phần được khảo sát thì có tới 129 đề thi giảng viên đã sử dụng phương pháp thi tự luận và vấn đáp (chiếm 79%, trong đó: tự luận là 46,6%, vấn đáp là 32,4%). Một số ít giảng viên sử dụng phương pháp trắc nghiệm khách quan (gần 10%) để đánh giá KQHT cho sinh viên. 47 Bảng 2.1. Tỷ lệ các phương pháp mà GV sử dụng Hình thức thi Số lượng Phần trăm Tự luận 76 46,6 Vấn đáp 53 32,4 Thực hành 18 13,2 TNKQ 16 9,8 Tổng số 163 100,0 Số liệu ở bảng 2.1 cho thấy đa số giảng viên vẫn theo xu hướng cũ, ngại thay đổi hoặc chưa nắm được kỹ thuật xây dựng bộ câu hỏi trắc nghiệm khách quan nên số đề thi giảng viên biên soạn theo phương pháp này là rất ít. Tuy nhiên, thực tế cũng cho thấy vẫn có một số giảng viên đã mạnh dạn áp dụng phương pháp TNKQ vào việc KTĐG KQHT cho sinh viên, điều này cần được khuyến khích để nhân rộng phương pháp này vì những ưu điểm của nó. Kết hợp với phỏng vấn sâu chúng tôi được biết, phần lớn các đề thi/ kiểm tra trong quá trình học tập, hoặc thi giữa kỳ, các giảng viên đều sử dụng phương pháp tự luận, thỉnh thoảng có GV sử dụng phương pháp vấn đáp và không bao giờ sử dụng phương pháp TNKQ. Qua các phiếu điều tra của giảng viên, chúng tôi thấy được rằng các giảng viên đều có nhận thức rất rõ về mỗi phương pháp KTĐG KQHT của sinh viên, như: muốn đánh giá kỹ năng người học thì chọn phương pháp vấn đáp, thực hành; muốn chấm bài nhanh, xử lý kết quả thuận lợi, đề thi bao phủ kiến thức… thì chọn phương pháp TNKQ; muốn đánh giá khả năng diễn giải thì ra đề tự luận… tuy nhiên, trong thực tế, vì những lý do khác nhau mà phần lớn các giảng viên vẫn chọn phương pháp tự luận là chính, điều này đã làm ảnh hưởng không nhỏ tới tính khách quan, công bằng trong việc KTĐG KQHT cho sinh viên. • Nhận thức của GV về hiệu quả của các phương pháp: Tất cả các GV đều cho rằng khi họ lựa chọn một phương pháp KTĐG nào đó đều có liên quan đến nội dung và mục tiêu môn học mà họ đảm nhận và họ đều nhận thức được hiệu quả của phương pháp đó. 48 Bảng 2.2. Nhận thức của GV về hiệu quả các phương pháp KTĐG Biểu hiện Tự luận Vấn đáp Thực hành TNKQ Bao phủ chương trình học 13,7 26,8 25 23,3 Đánh giá kỹ năng người học 11,1 24,4 35 9,3 Kết quả đánh giá khách quan 11 10 23,3 Soạn đề nhanh 27,8 3,7 5 Chấm bài nhanh 5,6 8,5 10 25,5 Khả năng trình bày một vấn đề 5,6 19,5 10 Khả năng viết 25,2 5 2,3 Xử lý kết quả thuận lợi 11 6,1 16,3 Tổng cộng 100% 100% 100% 100% Thông số ở bảng 2.2 cho thấy, các GV đều nhận thức được hiệu quả của từng phương pháp, nếu muốn đánh giá kỹ năng người học thì nên chọn phương pháp thực hành; nếu muốn kết quả đánh giá khách quan, chấm bài nhanh, xử lý kết quả thuận lợi và đề thi bao phủ chương trình học thì sử dụng phương pháp TNKQ; muốn đánh giá khả năng diễn giải thì ra đề tự luận… 2.3.2. Thực trạng quy trình thiết kế đề thi TNKQ Để biết thực trạng thiết kế đề thi TNKQ như thế nào, ta cần nghiên cứu những vấn đề sau: • Xác định mục tiêu đánh giá, phân tích nội dung và xây dựng bảng trọng số. Có nhiều GV không xác định rõ mục tiêu của đề thi/ kiểm tra trong học phần đã dạy. Nói cách khác, các GV thường không lập bảng trọng số về mục tiêu kiến thức và nội dung của học phần để ra đề thi, dẫn đến có những nội dung đề cập nhiều và ngược lại, làm ảnh hưởng đến độ giá trị của đề thi. Thông thường, sau khi dạy xong một học phần với các nội dung theo đề cương chi tiết cụ thể của học phần đó, GV nghĩ rằng sinh viên nắm vững các yêu cầu về nội dung kiến thức, kỹ năng nào thì sẽ ra đề với các câu hỏi kiểm tra vào phần đó, cho nên sinh viên đạt được kết quả thi, kiểm tra một cách tương đối. Bởi 49 vậy, trong một học phần có những mục tiêu GV kiểm tra được sinh viên nhưng cũng có những mục tiêu mà học phần đề ra GV không thể biết được sinh viên có đạt hay không và đạt ở mức nào. Với cách ra đề thi kiểm tra như vậy, kết quả thu được không phản ánh được mức độ đạt được mục tiêu về kiến thức và kỹ năng của học phần đã quy định. Phỏng vấn sâu các GV được biết, họ ít khi xác định mục tiêu đánh giá và xây dựng bảng trọng số trước khi viết câu hỏi thi, các GV cho rằng điều đó là không cần thiết vì trong quá trình dạy học và biên soạn đề họ đã biết được phần nào quan trọng hơn. Có nhiều GV cho rằng, việc xây dựng bảng trọng số chỉ cần thiết đối với các GV trẻ, ít kinh nghiệm. Tóm lại, qua việc phân tích trên thấy rằng nhiều GV không xác định mục tiêu đánh giá, không phân tích nội dung và xây dựng bảng trọng số khi biên soạn đề thi. • Về độ bao phủ, độ khó, độ phân biệt, độ tin cậy, độ giá trị và thời gian thi, kiểm tra. Trong phương pháp dạy học truyền thống, GV là người truyền thụ, cung cấp kiến thức cho sinh viên, sinh viên là người tiếp thu những kiến thức được truyền đạt. Việc ĐGKQHT thường được thực hiện thông qua các câu hỏi do GV soạn thảo, các câu hỏi này chủ yếu là câu hỏi tự luận, như vậy, một bài kiểm tra gồm 1 số ít câu hỏi cho một vài vấn đề trọng tâm, vì thế sinh viên thường hay đoán mò hoặc học tủ một số vấn đề chính còn các kiến thức khác thì bỏ qua. Mặt khác, có thể vì thành tích của cá nhân, của lớp hoặc của trường mà đề kiểm tra thường không khó lắm, sinh viên khá giỏi có thể dễ dàng hoàn thành mà không cần phải tư duy nhiều. Trong các bài thi kiểm tra, các câu hỏi thường ở mức độ nhận thức biết và hiểu là chính, câu hỏi ở mức độ vận dụng ít, nhưng lại có những bài thi có ít câu hỏi lại thường đánh giá người học ở mức độ vận dụng nhiều. Bởi vậy việc ĐGKQHT chưa thật sự khoa học và công bằng, đồng thời độ chính xác là không cao. Bài thi với những câu hỏi ở mức độ vận dụng mà không có câu hỏi ở mức độ biết và hiểu, nếu sinh viên đạt kết quả không cao thì chúng ta không đánh giá chính xác khả năng và năng lực của sinh viên có đạt mục tiêu về kiến thức và kỹ năng của học phần đề 50 ra hay không? Cách cho điểm này có ưu điểm là đánh giá được khả năng bậc cao của sinh viên khá và giỏi nhưng khó có thể phân biệt được các sinh viên có năng lực trung bình, yếu và kém vì các em này có điểm số không chênh lệch nhau. Nếu GV thiết kế các câu hỏi chỉ đo mức độ nhớ và hiểu thì nếu sinh viên nào học tủ hoặc học theo kiểu ghi nhớ máy móc thì sẽ được điểm cao, các sinh viên học theo kiểu tư duy lại chỉ được điểm trung bình. Từ trước đến nay trường chưa có một lớp bồi dưỡng nào về xây dựng đề thi theo các yêu cầu kỹ thuật, hầu hết các GV đều tự ra các đề thi tự luận, vấn đáp, thực hành. Thời gian gần đây, các GV bắt đầu quan tâm đến loại hình câu hỏi TNKQ, nhưng cũng chỉ dừng lại ở mức độ tìm hiểu và áp dụng phần nào, chưa có sự quan tâm đúng mức và nghiên cứu sâu về loại hình này. GV nào muốn xây dựng đề TNKQ thì tự đọc tài liệu và dựa trên các đề thi có trong tài liệu để biên soạn, việc soạn thảo từng câu hỏi và đề thi chưa đáp ứng được yêu cầu kỹ thuật, sự cân đối về thời gian và nội dung trong một đề thi là chưa đạt. Theo kết quả điều tra có nhiều GV nhận thức rằng việc biên soạn đề thi TNKQ sẽ cho kết quả đánh giá khách quan và công bằng, tuy nhiên vì những lý do khác nhau mà GV vẫn hiếm khi sử dụng phương pháp TNKQ để đánh giá KQHT của sinh viên. Phần phân tích dưới đây sẽ làm rõ các vấn đề trên: • Lý do GV hiếm khi sử dụng phương pháp TNKQ. Thông qua Phiếu điều tra và qua việc phỏng vấn sâu các GV cho thấy, có nhiều lý do khiến GV hiếm khi sử dụng phương pháp TNKQ để ĐGKQHT cho SV, tập trung vào một số lý do chính sau: - GV gặp khó khăn khi thiết kế câu hỏi TNKQ đạt yêu cầu kỹ thuật 51 0 10 20 30 40 50 60 70 80 90 100 Toán Tin Văn‐QL Hóa hc Sinh hc KHMT Tng % Không Có Hình 2.3. Khó khăn khi thiết kế câu hỏi TNKQ chuẩn Dữ liệu hình trên cho thấy GV ở mỗi Khoa khác nhau gặp khó khăn khi biên soạn câu hỏi TNKQ chuẩn là khác nhau. Có 66% GV ở các khoa gặp khó khăn và 34% GV không gặp khó khăn khi biên soạn bộ câu hỏi TNKQ chuẩn. GV khoa Toán Tin và khoa Sinh học gặp ít khó khăn nhất. Các GV cho rằng ở mỗi khoa có các đặc thù riêng nên sử dụng các phương pháp thi khác nhau tùy theo mục đích chương trình đào tạo và mục tiêu học phần. Nếu được tập huấn và được thường xuyên sử dụng thì GV sẽ ít gặp khó khăn hơn. - GV chưa được bồi dưỡng về cách xây dựng đề thi TNKQ Thực tế nhà trường chưa tổ chức được các buổi tập huấn cho GV về kỹ thuật xây dựng đề thi TNKQ, qua phiếu điều tra và phỏng vấn sâu cho thấy rằng nếu được tập huấn và tiếp cận với hình thức thi TNKQ sớm thì họ sẽ áp dụng hình thức thi này để ĐGKQHT cho SV. Mặt khác, có nhiều GV trẻ mới về trường công tác, chưa có kiến thức và kinh nghiệm nhiều nên đây cũng chính là lý do mà các GV này không lựa chọn phương pháp TNKQ. - Thiếu thời gian soạn bộ câu hỏi TNKQ Phần lớn các GV đều cho rằng để biên soạn bộ đề thi TNKQ cần rất nhiều thời gian, cho nên chỉ có khoảng 21% GV cho rằng có thời gian biên soạn câu hỏi TNKQ. Giải thích cho tỷ lệ trên là do một đề thi TNKQ bao gồm rất nhiều câu hỏi, các câu hỏi đòi hỏi bao phủ toàn bộ nội dung chương trình môn học, hơn nữa, để soạn được từng câu hỏi TNKQ, GV phải nắm vững kỹ thuật viết: cách lựa chọn 52 dạng câu hỏi, độ khó, độ phân biệt, thời gian thi… sao cho phù hợp với nội dung chương trình của từng học phần. Bởi vậy để soạn được 1 bộ đề thi TNKQ mất rất nhiều công sức và thời gian. 0 10 20 30 40 50 60 70 80 90 100 Toán Tin Văn‐QL Hóa hc Sinh hc KHMT Tng % Không Có Hình 2.4. Thời gian soạn câu hỏi TNKQ - Thiếu kỹ năng phân tích, ngại thay đổi: Một số GV cho rằng họ không có kỹ năng phân tích đề thi cũng như phân tích kết quả thi. Mặt khác, do thiếu các trang thiết bị công cụ như máy tính hay các phần mềm chuyên dụng cho nên việc phân tích kết quả thi gặp rất nhiều khó khăn. Một số GV khác thì lại có tâm lý ngại thay đổi, họ cho rằng các đề thi tự luận hiện nay của họ hoàn toàn có thể đánh giá chính xác năng lực của SV nên họ không muốn và không cần phải thiết kế các đề thi TNKQ… Có những GV mặc dù đã được bồi dưỡng về xây dựng đề thi TNKQ, nhưng do chưa có kinh nghiệm tự thiết kế nên họ sợ sự quản lý của nhà trường và khoa về chất lượng biên soạn đề thi của mình. Đây cũng chính là lý do mà một số giáo viên chưa sử dụng hình thức thi TNKQ. Các lý do trên đã cho chúng ta thấy tại sao các GV chưa sử dụng hoặc hiếm khi sử dụng đề TNKQ để KTĐG KQHT cho SV. • Về thang điểm của đề thi. Theo kết quả điều tra các GV cho rằng, với các câu hỏi tự luận, câu hỏi vấn đáp GV thường cho điểm cả câu, còn các ý và các chi tiết trong câu hỏi, GV cho điểm tùy theo nội dung bài làm của SV và tâm trạng của GV khi chấm thi. Nếu điểm 53 của cả lớp tương đối thấp thì SV chỉ viết hoặc trả lời đúng ý cũng có thể đạt được một số điểm nhất định mà chưa cần phân tích, bình luận. Còn nếu điểm của cả lớp tương đối cao thì SV sẽ không được điểm cao nếu không phân tích và bình luận ý đó. Mặt khác, với cùng một bài thi nhưng hai GV chấm thi khác nhau có thể cho kết quả khác nhau. Điều này dẫn đến sự thiếu khách quan và công bằng. Từ trước đến nay các đề thi tự luận và vấn đáp thường tập trung vào một số vấn đề trọng tâm bởi vậy SV thường đoán mò, học tủ một số vấn đề chính. Có những bài thi chỉ đo năng lực SV ở mức biết, hiểu và phân tích. Bởi vậy nếu đa số SV đạt điểm cao, mức điểm chênh lệch không nhiều, GV rất khó phân biệt SV có năng lực thấp với năng lực cao. SV khá giỏi có thể hoàn thành bài thi một cách dễ dàng, không đòi hỏi phải tư duy nhiều. Từ đó SV thường chỉ làm theo những kiến thức và kỹ năng mà GV đã giảng và ít em có khả năng tổng hợp vấn đề, đánh giá và sáng tạo. Cũng có những bài thi đa số SV đạt kết quả thấp. Hơn nữa các đề thi tự luận thường cho điểm cả câu, các ý nhỏ thì cho điểm tùy theo bài viết của SV và tâm trạng GV khi chấm bài. Có GV khi thấy điểm số trung bình của cả lớp thấp thì chấm nhẹ tay đi, và ngược lại, khi thấy điểm của cả lớp cao thì lại chấm chặt tay hơn, điều này cho thấy việc đánh giá KQHT của SV thiếu chính xác và đề thi cũng không được đảm bảo về lượng kiến thức. Gần đây một số Khoa Bộ môn trong trường có sử dụng hình thức thi TNKQ tuy nhiên chưa được đầu tư đúng mức. Từ việc soạn thảo các đề thi cho đến phân tích câu hỏi sau khi thi đều chưa đáp ứng được các yêu cầu kỹ thuật. Chính vì vậy có đề thi thường bao gồm các câu hỏi đơn giản, có câu hỏi lại tối nghĩa nên SV thường làm bài một cách thụ động. Có đề thi vừa dài lại vừa khó dẫn đến các SV không hiểu, làm bài thi không đủ thời gian cho nên một số câu chưa làm được thì chọn lung tung mà không kịp suy nghĩ… Như vậy, qua các phân tích ở trên chúng ta có thể thấy rằng với quy trình thiết kế đề thi TNKQ như hiện nay ở phần lớn các khoa bộ môn trong trường ĐHKH sẽ không đánh giá chính xác được năng lực của SV. 2.3.3. Thực trạng phân tích và xử lý

Các file đính kèm theo tài liệu này:

  • pdfLuan Van Nguyen Truong Son DLDG2006.pdf
Tài liệu liên quan