Tài liệu Luận văn Tổng quan về phương pháp trắc nghiệm khách quan: Luận Văn
"Tổng quan về phương pháp trắc nghiệm khách quan"
Mở đầu
Để nâng cao chất lượng giáo dục ở các bậc học thì việc cải tiến hệ thống
kiểm tra, đánh giá kết quả của học sinh đóng vai trò hết sức quan trọng. Bên cạnh
việc sử dụng phương pháp truyền thống mà từ trước đến nay chúng ta vấn áp
dụng để kiểm tra bằng phương pháp tự luận, nhưng thực tế không phải lúc nào nó
cũng mang lại kết quả khả quan. Các phương pháp đánh giá kết quả học tập rất đa
dạng, mọi phương pháp đều có những ưu điểm, nhược điểm của nó, không có
phương pháp đều có những ưu, nhược điểm của nó, không có phương pháp nào là
hoàn mỹ với mọi mục tiêu giáo dục. Tuỳ theo mục tiêu cụ thể mà lựa chọn
phương pháp đánh giá cho thích hợp. Trên tinh thần hiện nay là chúng ta đang
thực hiện chương trình đổi mới phương pháp giảng dạy vì vậy trong bài khoá
luận này chúng tôi mạnh dạn đưa một phương pháp đánh giá bài thi đó là đánh
giá bằng phương pháp trắc nghiệm khách quan. Đây là một phương pháp h...
57 trang |
Chia sẻ: haohao | Lượt xem: 1332 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Tổng quan về phương pháp trắc nghiệm khách quan, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Luận Văn
"Tổng quan về phương pháp trắc nghiệm khách quan"
Mở đầu
Để nâng cao chất lượng giáo dục ở các bậc học thì việc cải tiến hệ thống
kiểm tra, đánh giá kết quả của học sinh đóng vai trò hết sức quan trọng. Bên cạnh
việc sử dụng phương pháp truyền thống mà từ trước đến nay chúng ta vấn áp
dụng để kiểm tra bằng phương pháp tự luận, nhưng thực tế không phải lúc nào nó
cũng mang lại kết quả khả quan. Các phương pháp đánh giá kết quả học tập rất đa
dạng, mọi phương pháp đều có những ưu điểm, nhược điểm của nó, không có
phương pháp đều có những ưu, nhược điểm của nó, không có phương pháp nào là
hoàn mỹ với mọi mục tiêu giáo dục. Tuỳ theo mục tiêu cụ thể mà lựa chọn
phương pháp đánh giá cho thích hợp. Trên tinh thần hiện nay là chúng ta đang
thực hiện chương trình đổi mới phương pháp giảng dạy vì vậy trong bài khoá
luận này chúng tôi mạnh dạn đưa một phương pháp đánh giá bài thi đó là đánh
giá bằng phương pháp trắc nghiệm khách quan. Đây là một phương pháp hết sức
mới mẻ với nền giáo dục nước ta nhưng nó lại đánh giá tương đối chính xác và
khách quan.
Phương pháp đánh giá bài thi bằng trắc nghiệm tự luận mà chúng ta vẫn
đang sử dụng hiện nay đang chiếm ưu thế, nhưng không có nghĩa là nó là phương
pháp tối ưu, nó vẫn có những hạn chế nhất định mà phương pháp trắc nghiệm
khách quan đã ra đời và khảng định được những ưu thế vượt trội. Tiếc thay một
phương pháp hay như vậy được thế giới hiện nay sử dụng rất rộng rãi trong các
kỳ thi tuyển sinh đại học mà lại có vẻ rất mơ hồ với cả những chuyên gia về giáo
dục nước ta. Đội ngũ cán bộ giảng dậy và những người biết về phương pháp này
lại rất mỏng. Vậy vấn đề đặt ra là chúng ta đổi mới phương pháp giảng dạy thì
nên chăng đổi mới phương pháp kiểm tra đánh giá bài thi là cần thiết ? Xuất phát
từ nhu cầu đó, chúng tôi xin biên soạn chủ đề về việc kiểm tra đánh giá thành quả
học tập bằng phương pháp trắc nghiệm khách quan.
Mục đích của việc nghiên cứu phương pháp đánh giá bằng trắc nghiệm
khách quan đầu tiên giới thiệu cho mọi người cùng biết cơ bản thế nào là phương
pháp trắc nghiệm khách quan. Chúng tôi muốn khẳng định ưu thế khi dùng
phương pháp trắc nghiệm khách quan so với việc dùng phương pháp tự luận.
Cuối cùng chúng tôi sẽ thực hiện thí điểm cho học sinh làm bài thi bằng các câu
hỏi dạng trắc nghiệm khách quan.
Đối tượng và khách thể nghiên cứu của đề tài là chúng tôi sẽ xây dựng bộ
câu hỏi trắc nghiệm trên nền tảng kiến thức bộ môn hoá lớp 10. Đối tượng nghiên
cứu là học sinh lớp 10 khối chuyên hoá trường trung học phổ thông Hai Bà Trưng
Hà Nội.
Nếu việc thử nghiệm cho học sinh làm đề thi bằng trắc nghiệm khách quan
của chúng tôi thành công thì qua phân tích kết quả chúng tôi sẽ khẳng định ưu thế
của việc dùng phương pháp trắc nghiệm khách quan là hoàn toàn có cơ sở khoa
học.
Nhiệm vụ khi nghiên cứu về đề tài này của chúng tôi là trước tiên xây dựng
được bộ các câu hỏi trắc nghiệm khách quan môn hoá lớp 10, thứ hai là thực hiện
thí điểm đề thi bằng trắc nghiệm khách quan và từ đó chúng tôi sẽ phân tích các
kết quả như tính độ khó, độ tin cậy … và cuối cùng tổng kết lại liệu phương pháp
này có đạt được mục tiêu giáo dục đề ra hay không.
Việc xây dựng bộ câu hỏi trắc nghiệm chỉ trong chương trình kiến thức lớp
dự định đề thi trong 30 phút và 1 đề thi sẽ gồm khoảng 30 câu. Phạm vi nghiên
cứu là học sinh lớp 10 chuyên hoá trường phổ thông trung học Hai Bà Trưng.
Phương pháp chúng tôi dùng khi nghiên cứu đề tài đó là phương pháp quan sát,
phương pháp điều tra, kiểm tra và cuối cùng là thống kê sau khi đã dùng trắc
nghiệm khách quan làm thí điểm trên học sinh. Chúng tôi nghĩ với sự chuẩn bị kỹ
lưỡng hệ thống các câu hỏi và việc thử nghiệm thành công thì sẽ khẳng định được
những ưu điểm của phương pháp trắc nghiệm khách quan là hoàn toàn có cơ sở
khoa học. Cấu trúc của khoá luận nghiên cứu của chúng tôi được cụ thể như sau:
-Mục lục
-Mở đầu
-Chương 1 Tổng quan về phương pháp trắc nghiệm khách quan
-Chương 2 các bước xây dựng bài kiểm tra bằng trắc nghiệm khách
quan
-Chương 3 Phân tích kết quả nghiên cứu đề tài
-Chương 4 :kết luận
10.Kế hoạch nghiên cứu
-Thảo luận nhóm phản biện về mục tiêu giáo dục, tiến trình và hình thức
hoạt động
-Chuẩn bị hệ thống câu hỏi và phân công nhiệm vụ trong nhóm
-Viết các câu hỏi dạng trắc nghiệm khách quan
-Phản biện câu hỏi trong nhóm (có điều chỉnh bổ sung)
-Chuẩn bị các dạng câu hỏi trắc nghiệm tương tương để thử nghiệm
-Trắc nghiệm thử
-Phân tích câu hỏi
MỤC LỤC
Mở đầu
Chương I: Tổng quan về phương pháp trắc nghiệm khách quan
I.1 Dại cương về phương pháp trắc nghiệm khách quan 4
I.1.1 Phân loại phương pháp trắc nghiệm 4
I.1.1.1 Phương pháp quan sát 5
I.1.1.2 Phương pháp vấn đáp 5
I.1.1.3 Phương pháp trắc nghiệm viết 5
I.1.2 Các dạng câu hỏi trắc nghiệm khách quan 5
I.1.2.1 Câu mở (Opendended) 5
I.1.2.2 Câu điền khuyết (Supply items) 5
I.1.2.3 Loại câu đúng sai (true flase) 5
I.1.2.4 Loại câu hỏi nhiều lựa chọn (Multiple choice-MCQ) 6
I.1.3 Ưu điểm cơ bản của phương pháp trắc nghiệm khách quan với
phương pháp tự luận
6
I.1.3.1 Câu hỏi trắc nghiệm khách quan đánh giá khách quan hơn các
câu hỏi tự luận
7
I.1.3.2 Câu hỏi trắc nghiệm khách quan kiểm tra được lượng học sinh
lớn hơn câu hỏi tự luận trong một lần thi
7
I.1.3.3 Câu hỏi trắc nghiệm khách quan ít chệch tủ hơn, ít may rủi hơn
các câu dạng tự luận
8
I.2 Những yếu tố đặc trưng để đánh giá một bài kiểm tra hay bài thi
bằng trắc nghiệm khách quan
8
I.2.1 Độ khó, độ phân biệt của một câu hoặc một bài trắc nghiệm 8
I.2.1.1 Độ khó của câu trắc nghiệm 8
I.2.1.2 Độ phân biệt của câu trắc nghiệm 9
I.2.2 Độ tin cậy và độ giá trị của một bài trắc nghiệm 10
I.2.2.1 Độ tin cậy của bài trắc nghiệm 10
I.2.2.2 Độ giá trị của bài trắc nghiệm 11
I.3 Các loại điểm trắc nghiệm 12
I.3.1 Điểm thô 12
I.3.2 Điểm tiêu chuẩn tuyệt đối 12
I.3.3 Điểm tương đối dựa vào phân bố chuẩn 13
I.3.4 Các loại điểm khác 14
I.3.4.1 Điểm trắc nghiệm tiêu chuẩn hoá của ETS 14
I.3.4.2 Điểm trắc nghiệm trí thông minh 14
I.3.5 Thang điểm được sử dụng ở nước ta 14
I.4 Lý thuyết ứng đáp câu hỏi và mô hình Rasch 14
I.4.1 Lý thuyết ứng dụng câu hỏi 14
I.4.1.1 Khái niệm chung về lý thuyết đáp ứng câu hỏi 14
I.4.1.2 Các thao tác tiến hành để xây dựng thuyết ứng đáp câu hỏi 15
I.4.2 Mô hình Rasch 16
I.4.2.1 Giả thiết của Rasch về việc ứng đáp câu hỏi 16
I.4.2.2 Hàm ứng đáp câu hỏi theo Rasch 16
I.4.2.3 Ứng dụng của mô hình Rasch 17
Chương II : các bước xây dựng bài kiểm tra bằng TNKQ
II.1 Các bước xây dựng một bài kiểm tra bằng TNKQ 18
II.1.1 Phân tích nội dung và phác thảo bài trắc nghiệm 18
II.1.2 Viết lại câu hỏi trắc nghiệm 19
II.1.3 Duyệt lại câu hỏi trắc nghiệm 19
II.1.4 Lưu ý chung khi viết câu hỏi khách quan 20
II.2 Bản đặc trưng 2 chiều 21
II.2.1 Sơ lược về kiến thức chương trình hoá 10 21
II.2.1.1 Cấu trúc chương trình 21
II.2.1.1 Nội dung kiến thức 22
II.3 Phương pháp đánh giá bài trắc nghiệm 26
II.3.1 Các mức độ mục tiêu trong lĩnh vực nhận thức 26
II.3.2 Yêu cầu bài thi trắc nghiệm khách quan 29
II.3.2.1 Yêu cầu về nội dung 29
II.3.2.2 Yêu cầu về các mức kỹ năng 30
II.3.2.3 Yêu cầu về cách tổ chức để kiểm tra 31
Chương III: Phân tích kết quả nghiên cứu
III.1 Các bước tiến hành thí nghiệm 33
III.2 Phân tích kết quả thực tế 33
III.2.1. Kết quả chung 33
III.2.2. Phân tích câu trắc nghiệm 34
III.3. Xây dựng mô hình Rasch trên số liệu thực 37
III.3.1. Sự phù hợp của các câu hỏi 37
III.3.2. Sự phù hợp của các thí sinh 38
III.3.3. Phân bố khả năng trả lời đúng của thí sinh và độ khó của các câu hỏi 40
III.3.4 Phân tích kết quả từng câu hỏi 41
III.3.5. Sơ đồ biểu diễn năng lực và độ khó của các câu hỏi trên một
thang đo
43
Chương IV: Kết luận
IV.1. Khoa học đo lường và đánh giá trong giáo dục trên thế giới và
nước ta
47
IV.1.1. Trên thế giới 47
IV.1.2. Nước ta 47
IV.2. Giải pháp về phát triển phương hướng khoa học đo lường ở nước
ta
48
Tài liệu tham khảo
Chương I : TỔNG QUAN VỀ PHƯƠNG PHÁP TRẮC NGHIỆM
KHÁCH QUAN
I.1. Đại cương về phương pháp trắc nghiệm khách quan
I.1.1.Phân loại các phương pháp trắc nghiệm
Trắc nghiệm là một phép lượng giá cụ thể mức độ khả năng thể hiện
hành vi trong lĩnh vực nào đó của một người cụ thể nào đó (thí
sinh).Phương pháp trắc nghiệm có thể được chia ra làm ba loại lớn:
loại quan sát, loại vấn đáp và loại viết được minh hoạ qua sơ đồ dưới
đây:
Các phương pháp
TN nghi nghiê cc
Quan sát Viết Vấn đáp
Trắc nghiệm khách quan Trắc nghiệm tự luận
Tiểu luận Cung cấp thông
tin
Ghép đôi Điền
khuyết
Trả lời
ngắn
Đúng sai Nhiều lựa
chọn
I.1.1.1. Phương pháp quan sát: Là phương pháp giúp các định những thái độ,
sự phản ứng vô ý thức, cách giải quyết vấn đề trong một tình huống đang được
nghiên cứu.
I.1.1.2.Phương pháp vấn đáp: Thường thích hợp với trẻ em, có lợi
khi nêu câu hỏi một cách tự phát trong một tình huống cần kiểm tra.
I.1.1.3.Phương pháp trắc nghiệm viết: Là phương pháp thường được sử
dụng nhiều nhất vì nó có một số ưu điểm cơ bản sau đây :
-Kiểm tra được nhiều học sinh trên một lần thi
-Cung cấp một bản ghi rõ ràng các câu trả lời của học sinh để dùng cho việc
chấm điểm.
-Dễ quản lý hơn vì bản thân người chấm không tham gioa vào bối cảnh
kiểm tra.
I.1.2.Các dạng câu hỏi trắc nghiệm khách quan
I.1.2.1.Câu mở (Open endecl): Loại câu này đòi hỏi học sinh phải nhớ lại
kiến thức hơn là nhận biết. Ví dụ: “Người vợ thứ ba của Henry VIII là ai ?”.
Hoặc có những câu có chỗ trống để điền vào hoặc có sự hướng dẫn để học sinh
cung cấp thông tin đáp ứng với câu dẫn như “Bên cạnh tên mỗi nước trong danh
mục này, hãy viết tên thủ đô nước đó”
I.1.2.2.Câu điền khuyết (Supply items): Học sinh phải nhớ lại kiến thức do
đó trả lời bằng một hay một số từ cho một câu hỏi trực tiếp hay một câu nhận
định chưa đầy đủ. Các loại câu này còn gọi là loại câu hỏi điền vào chỗ trống
(com pletion items).Ví dụ: Tên của một dụng cụ dùng để đo nhiệt độ là gì? Loại
câu hỏi này có ưu thế hơn các loại câu hỏi khách quan khác ở chỗ đòi hỏi học
sinh phải tìm kiếm câu trả lời đúng hơn là nhận ra câu trả lời đúng bằng các thông
tin đã cho.
I.1.2.3.Loại câu đúng sai (true False): Đó có thể là những phát biểu được
đánh giá là đúng hay là sai hoặc chúng có thể là các câu hỏi trực tiếp để trả lời là
“có” hay “không”. Các phương án trả lời là thích hợp để gợi nhớ lại kiến thức và
một khối lượng kiến thức đáng kể có thể được kiểm tra một cách nhanh chóng.
Tuy nhiên câu dẫn của loại câu hỏi này phải thật hoàn toàn rõ ràng để có thể trả
lời dứt khoát là “có” hay “không”. Điều này tạo ra sự khó khăn khi áp dụng loại
câu hỏi này để kiểm tra trình độ hiểu biết cao hơn, nó không tạo cơ hội cho học
sinh phân biệt những sắc thái tinh tế có ý nghĩa hay nhiều cách trả lời khác ở
trình độ cao hơn.
I.1.2.4.Loại câu hỏi nhiều lựa chọn (Multiple choice-MCQ): Loại này
thường có hình thức của một câu phát biểu không đầy đủ hay một câu hỏi dẫn
được nối tiếp bằng một số câu trả lời mà học sinh phải chọn.:
- Trả lời đúng rõ rệt
-Câu trả lời tốt nhất trong nhiều câu chọn hợp lý,
-Câu trả lời kém nhất hay câu trả lời không có liên quan gì nhất, hay có
nhiều hơn là một câu trả lời thích hợp.
Những câu trả lời không đúng được gọi là các câu nhiễu (distracter). Câu
dẫn có thể có dưới dạng sơ đồ hay đồ thị và không nhất thiết thuần tuý bằng lời.
Loại câu MCQ cần được xây dựng một cách thận trọng để tránh chỗ không rõ
nghĩa, nhưng chúng có thể được dùng để kiểm tra những trình độ cao hơn về
nhận thức tiện hơn các loại câu hỏi khách quan khác.
I.1.3.Ưu điểm cơ bản của phương pháp trắc nghiệm khách quan
với phương pháp tự luận.
Loại câu hỏi tự luận thường đòi hỏi học sinh phait viết nhiều câu để trả lời,
nó không có một câu trả lời đúng haty một kiểu trả lời. Để đánh giá được một
cách chính xác và có chất lượng, một bài tự luận phải được chấm bởi một người
có kinh nghiệm và hiểu biết về lĩnh vực của môn học tương ứng. Bài trắc nghiệm
tự luận không thể đánh giá một cách tuyệt đối là đúng hay là sai. Như vậy ưu
điểm của các câu hỏi khách quan so với dạng câu hỏi tự luận được thể hiện ở
bảng sau đây :
Ưu thế thuộc về phương
pháp
Vấn đề
Trắc nghiệm Tự luận
Ít tốn công ra đề x
Đánh giá được khả năng diễn đạt, đặc biệt là diễn đạt
tư duy trừu tượng
x
Việc sáng tạo khi trả lời không bị hạn chế bởi một
khung câu hỏi sẵn
x
Đề thi phru kín nội dung môn học x
Ít may rủi do trung tủ, trật tủ x
Ít tốn công chấm thi x
Khách quan trong chấm thi x
Áp dụng được công nghệ mới trong việc nâng cao
chất lượng đề thi, giữ bí mật đề thi, hạn chế quay cóp
khi thi, hạn chế tiêu cực trong chấm thi và giúp phân
tích kết quả thi.
x
I.1.3.1.Câu hỏi trắc nghiệm khách quan đánh giá khách quan hơn các câu
hỏi tự luận
Bởi vì các câu hỏi khách quan có đáp án chính xác, rõ ràng nên việc chấm
điểm thường rất chính xác. Kể cả những người không hiểu gì về chuyên môn
cũng có thể chấm điểm được nếu như cho sẵn đáp án. Việc chấm điểm các câu
hỏi loại này có thể được sử dụng vào quét bằng máy tính vừa nhanh mà rất chính
xác. Còn việc chấm các câu hỏi tự luận rất phụ thuộc chủ quan vào người chấm.
Những yếu tố chủ quan như tình cảm, thời tiết … sẽ ảnh hưởng tới điểm thi. Nên
cùng một bài thi nhưng nếu cùng một người chấm có thể sẽ cho số điểm khác
nhau ở các thời điểm khác nhau.
I.1.3.2.Câu hỏi trắc nghiệm khách quan kiểm tra được lượng học sinh lớn
hơn câu hỏi tự luận trong một lần thi.
Xuất phát từ một lý do là dạng câu hỏi tự luận chấm điểm dễ dàng hơn, có
thể chấm được hàng nghìn bài thi trong khoảng thời gian ngắn bằng cách sử dụng
máy chấm nên khi cần kiểm tra một lượng lớn học sinh thì phương pháp dùng
câu trắc nghiệm khách quan có ưu thế hơn hẳn vì các câu hỏi dạng tự luận chấm
điểm tốn rất nhiều thời gian vì người chấm là chủ quan.
I.1.3.3.Câu hỏi trắc nghiệm khách quan ít chệch tủ hơn, ít may rủi hơn các
câu tự luận.
Thật vậy, do các câu hỏi dạng khách quan bao quát, trải rộng toàn bộ kiến
thức, một đề thi lại có rất nhiều câu hỏi nên việc chệch tủ là ít hiếm xảy ra. Học
sinh cần phải học bao quát toàn bộ kiến thức không như loại câu hỏi tự luận, học
sinh sẽ dễ học tủ vì đề thi dạng này ít câu hỏi không xuyên suốt được toàn bộ
kiến thức đã học.
Nhiều người rất mơ hồ rằng cứ nghĩ khi khoanh ngẫu nhiên câu trả lời thì có
khả năng là đúng vì vậy dễ ăn điểm hơn loại câu tự luận. Nhưng nếu hiểu theo ý
đó thì hết sức sai lầm và thực sự người đó chưa hiểu gì về câu hỏi khách quan
hết. Ví dụ nếu ta trả lời đại một câu hỏi trắc nghiệm dạng nhiều lựa chọn (5 lựa
chọn chẳng hạn) thì xác suất chọn hú hoạ như vậy sẽ là 20%. Mà thường bài thi
dùng câu hỏi dạng này quy định nếu xác suất xấp xỉ 20% câu trả lời đúng lấy mốc
là điểm không. Như vậy một người chọn hú hoạ cũng chỉ có số điểm lân cận
điểm không mà thôi.
Tuy nhiên chúng ta không được khẳng định phương pháp đánh giá nào có
ưu thế tuyệt đối so với phương pháp kia. Tuỳ vào điều kiện, yếu tố ảnh hưởng và
yêu cầu của mục tiêu giáo dục mà lựa chọn phương pháp kiểm tra thích hợp chứ
không phải là đo được cái cần đo, trong trường hợp đó thi bài trắc nghiệm có độ
tin cậy cao nhưng độ giá trị rất thấp.
I.2.Những yếu tố đặc trưng để đánh giá một bài kiểm tra hay bài
thi bằng trắc nghiệm khách quan.
I.2.1.Độ khó, độ phân biệt của một câu hoặc một bài trắc nghiệm.
1.1.Độ khó của câu trắc nghiệm.
Độ khó của câu trắc nghiệm thức được định nghĩa bằng tỷ số của tổng số
người trả lời đúng câu trắc nghiệm so với tổng số ngươì làm câu trắc nghiệm ấy.
Độ khó P của câu thứ i = Error!
Nếu độ khó có giá trị nằm trong khoảng 0,25 đến 0,75 thì câu trắc nghiệm
vừa sức với học sinh. Còn nếu giá trị độ khó xa số 0,25 và 0,75 thì câu trắc
nghiệm là quá khó hay quá dễ với thí sinh.
Khi chọn lựa các câu trắc nghiệm theo độ khó người ta thường phải loại
những câu quá khó (không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một bài
trắc nghiệm tốt khi có nhiều câu ở độ khó trung bình.
Ví dụ một câu trắc nghiệm có 50 thí sinh tham gia trả lời thì có 30 thí sinh
trả lời đúng, vậy độ khó của câu trắc nghiệm đó sẽ là :
P = Error! = 0,6
Giá trị 0,6 nằm trong khoảng (0,25, 0,75) nên đây là câu trắc nghiệm vừa
sức với đối tượng dự thi.
I.2.Độ phân biệt của câu trắc nghiệm
Độ phân biệt của câu trắc nghiệm đo lường mức độ khác nhau giữa các đối
tượng khác nhau hay đo được năng lực làm bài giữa học sinh giỏi và học sinh
kém.
Để tính độ phân biệt của câu trắc nghiệm thường chúng sta làm theo phương
pháp cổ điển như sau: Trong một tập hợp thí sinh tham gia trả lời câu hỏi, dựa
vào tổng điểm thô của thí sinh người ta sẽ chia thành 2 nhóm khác nhau, một
nhóm gồm những học sinh giỏi đạt điểm cao từ trên xuống, còn một nhóm gồm
những học sinh kém đạt điểm kém từ dưới lên. Gọi C là số thí sinh làm đúng câu
hỏi thuộc nhóm giỏi, T là số thí sinh làm đúng câu hỏi thuộc nhóm kém, S là
lượng thí sinh của một trong 2 nhóm trên (đều chiếm số phần trăm về tổng số thí
sinh nhất định) độ phân biệt D của câu hỏi được tính theo công thức sau:
D = Error!
VD:Trong 100 thí sinh tham gia trả lời câu hỏi, chọn mỗi nhóm giỏi và kém
là 20 người. Xét một câu hỏi nào đó nhóm giỏi có 15 người trả lời được, nhóm
kém có 6 người trả lời được, vậy độ phân biệt của câu trắc nghiệm này là :
D = Error! = 0,45
Phương pháp trên để tính độ phân biệt tương đối đơn giản, có thể tính bằng
tay, nhưng tính độ phân biệt của câu trắc nghiệm ở mức độ khái quát hơn, đó là
hệ số tương quan giữa các điểm của câu trắc nghiệm đó với tổng điểm của bài
trắc nghiệm xét trên toàn bộ thí sinh làm bài trắc nghiệm (hay còn gọi là hệ số
tương quan nhị phân) thông thường trị số độ phân biệt của câu hỏi có thể chấp
nhận được phải lớn hơn 0,2 ứng vớimức ý nghĩa 0,05 trong phép thử.
I.2.2. Độ tin cậy và độ giá trị của một bài trắc nghiệm
I.2.2.1.Độ tin cậy của bài trắc nghiệm
Người ta có thể tính độ tin cậy của bài trắc nghiệm bằng các cách sau:
-Phương pháp trắc nghiệm -trắc nghiệm lại. Tức là dùng một bài trắc
nghiệm cho một nhóm thí sinh làm hai lần và tính hệ số tương quan giữa hai bộ
điểm.
-Phương pháp các bài trắc nghiệm tương đương: Cho một nhóm thí sinh làm
hai bài trắc nghiệm tương đương nhau, rồi tính độ tương quan giữa hai bộ điểm,
nhưng phương pháp này phải tốn rất nhiều công sức để soạn các bài trắc nghiệm
thực sự tương đương nhau.,
-Phương pháp phân đôi bài trắc nghiệm : Tạo 2 bài trắc nghiệm tương
đương nhau, mỗi bài là một nửa bài trắc nghiệm. Khi ấy độ tin cậy của nửa bài
trắc nghiệm bằng hệ số tương quan giữa hai bộ điểm của 2 nửa bài trắc nghiệm,
còn độ tin cậy của toàn bài trắc nghiệm thu được khi hiệu chỉnh việc tăng độ dài
gấp đôi. Sự phụ thuộc của độ tin cậy của bài trắc nghiệm vào độ dài của nó được
tính theo công thức tổng quát Spear man Baoun
Pn = Error!
Trong đó Rs là độ tin cậy của bài trắc nghiệm ngắn xuất phát Rn là độ tin cậy
của bài trắc nghiệm có độ dài gấp n lần. Như vậy trong trường hợp bài trắc
nghiệm có độ dài gấp đôi, ta dùng công thức:
R = Error!
-Phương pháp Kuoler- Richardson- 20 để tính độ tin cậy bài trắc nghiệm :
R = Error! 1 - 2
pq
Trong đó: k - Số câu hỏi bài trắc nghiệm
p- Tỷ lệ trường hợp trả lời đúng cho 1 câu
q- Tỷ lệ trả lời sai cho một câu, q = 1-p
62 - Phương sai của tổng điểm mọi thí sinh đối với toàn bài TNo
Trong trường hợp độ khó của các câu không khác nhau nhiều, tính độ tin
cậy bởi công thức dễ tính hơn - công thức k - R - 21
R = Error! 1-
M là giá trị trung bình của điểm số bài trắc nghiệm
I.2.2.2. Độ giá trị của bài trắc nghiệm
Độ giá trị của bài trắc nghiệm thành quả học tập thường được phân loại
thành các loại sau đây:
+Độ giá trị tiên đoán: một bài trắc nghiệm dùng để xét tuyển thường có giá
trị tiên đoán, tức là bodfọ điểm số của nó tương đối tốt với một bài trắc nghiệm
đánh giá hạc các tiêu chí để đánh giá theo mục tiêu. Ví dụ, bộ điểm bài trắc
nghiệm tuyển sinh đại học đối với một nhóm thí sinh nào đó phải tương quan tốt
với kết quả học tập cuối giai đoạn 1 học đại học.
+Độ giá trị đồng thời: tương tự giá trị tiên đoán, nhưng chỉ khác về thời gian
tức là bài trắc nghiệm đánh giá hoặc các tiêu chí để đánh giá xảy ra đồng thơì với
bài trắc nghiệm tiên đoán.
+Độ giá trị cấu trúc: liên quan đến các loại trí năng và mức kỹ năng cần đo
theo các mục tiêu cụ thể của môn học.
+Độ giá trị nội dung: phản ánh đầy đủ các mục tiêu xác định cho môn học,
bao trùm đầy đủ nội dung của môn học. Để xác định độ giá trị về nội dung không
thể chỉ dựa vào các tính toán thống kê như độ giá trị tiên đoán hoặc giá trị đồng
thời, mà phải phân tích tỷ mỷ và công phu bài trắc nghiệm đối chiếu với mục tiêu
và nôị dung môn học.
R chính là độ phân biệt của câu trắc nghiệm hay hệ số tương quan điểm nhị
phân mà chúng ta sẽ xét kỹ ở phần sau.
Hệ số tương quan là một đại lượng để đo mối quan hệ tuyến tính giữa hai
biến ngẫu nhiên, có giá trị phân bố trong khoảng từ -1 đến +1.
I.3.Các loại điểm trắc nghiệm.
Vì phân bố tần suất năng lực của một tập hợp học sinh về một chuyên môn
nào đó thường theo dạng chuẩn nên phân bố tần suất của điểm thi của thí sinh
(nếu phản ánh đúng năng lực) cũng tuân theo dạng chuẩn. Chúng ta sẽ xét một số
loại điểm sau đây:
I.3.1.Điểm thô.
Một đề thi TNKQ thường bao gồm nhiều câu hỏi. Mỗi câu hỏi được gán một
điểm số nào đó, thường là điểm 1 nếu làm đúng, điểm 0 nếu làm sai. Cộng điểm
số của từng thí sinh lại được gọi là điểm thô (rav score)
I.3.2.Điểm tiêu chuẩn tuyệt đối:Là cách cho điểm thường được dùng thuộc
loại này là điểm phần trăm đúng. Điểm được tính theo tỷ lệ phần trăm số câu làm
đúng trên tổng số câu của bài trắc nghiệm
X = 100 x Error!
Ví dụ một thí sinh làm đúng 35 câu hỏi trong tổng số 50 câu hỏi thì điểm
tiêu chuẩn tuyệt đối của thí sinh đó là x = 100 Error! = 70. Tuy nhiên việc cho
điểm theo kiểu này thường rơi vào tình trạng tuỳ tiện, không có tính khách quan.
I.3.3.Điểm tương đối dựa vào phân bố điểm: Giả sử điểm thô thu được từ
kết quả trắc nghiệm trên một nhóm nào đó có phân bố tần suất gần với dạng phân
bố chuẩn với giá trị trung bình là Xt và độ lệch tiêu chuẩn là 6s thường thì người
ta sẽ biến đổi các điểm thô này sang một thang điểm với giá trị trung bình là Xs
và độ lệch chuẩn là 6s.Để thực hiện phép biến đổi này chúng ta phải dãn đường
cong phân bố chuẩn ứng với thang điểm thô sao cho độ lệch chuẩn của đường
cong đạt giá trị 6s, sau đó dịch chuyển đường cong thu được sao cho điểm gốc
của nó dịch chuyển đến vị trí giá trị trung bình Xs trên trục số. Phép co giãn và
dịch chuyển đó được thực hiện bằng hệ thức sau:
t6
tXXt =
s6
sXXs Suy ra Xs = Error! Xt - Xt + Xs. Với một phân bố
chuẩn có giá trị trung bình được đặt tại 0 và độ lệch chuẩn được chọn bằng 1, thì
điểm chuẩn này được gọi là điểm Z. Điểm chuẩn Z được tính với hệ thức sau
đây:
Z =
6
XX .
Đường cong phân bố chuẩn ứng với điểm Z là tần suất xuất hiện các trường
hợp nằm trong khoảng giưã điểm trung bình Z =0 và các điểm Z bằng một số
nguyên lần độ lệch chuẩn. Đường cong phân bố chuẩn này được biểu diễn bởi
hình 3 dưới đây, thì thấy với một phân bố chuẩn lý thuyết khoảng (- 36, + 36) bao
gồm 99,8% các trường hợp của phân bố tức là trên thực tế là bao gồm toàn bộ các
trường hợp.
36 -26 -16 0 +16 +26 +36
Các độ lệch tiêu chuẩn
Điểm t: -3 -2 -1 0 +1 +2 +3
0,1%
2,1% 13,6%
34,1% 34,1% 13,6%
2,1%
0,1%
I.3.4.Các loại điểm khác.
I.3.4.1.Điểm trắc nghiệm tiêu chuẩn hoá của ETS
ETS (Edu cational testing Services - ETS) “Các dịch vụ trắc nghiệm giáo
dục” là công ty tư nhân lớn ở Hoa Kỳ, sản xuất các đề thi và tổ chức các đề thi
trắc nghiệm tiêu chuẩn hoá. Ví dụ như trắc nghiệm một số học sinh xác định; trắc
nghiệm tuyển sinh sau đại học ngành quản lý, trắc nghiệm ngoại ngữ tiếng Anh
(TOEFL…). Các trắc nghiệm này đều sử dụng cùng một loại thang điểm với giá
trị trung bình gán vào điểm 500, và độ lệch chuẩn 6 được chọn bằng 100 đơn vị
nguyên. Vậy thì khoảng (-36; +36) ứng với khoảng điểm (200, 800)
I.3.4.2.Điểm trắc nghiệm trí thông minh IQ (Intclligen Quotient)
Trắc nghiệm IQ sử dụng thang điểm với giá trị trung bình gán vào điểm 100,
độ lệch chuẩn được chọn là 15 đơn vị nguyên. Với cách quy định như vậy khoảng
(-36, +36) ứng với khoảng điểm (55, 145)
I.3.Thang điểm được sử dụng ở nước ta.
Thang điểm đang được sử dụng phổ biến ở nước ta là điểm 10, điểm tuyệt
đối là 10, điểm tối thiểu là 0, điểm trung bình nằm ở khoảng 5, chứ không phải là
điểm tiêu chuẩn dựa vào phân bố chuẩn và độ lệch. Vì vậy đối với kỳ thi tuyển
sinh đại học hiện nay người ta xét tuyển dựa vào tổng điểm thô của 3 môn đó, mà
thực tế phân bố điểm của 3 môn thường là rất khác nhau, do đó giá trị trung bình
và độ lệch chuẩn cũng hoàn toàn khác nhau. Cách tính điểm mà chúng ta đang sử
dụng không đánh giá chính xác được chất lượng làm bài của thí sinh vì nó không
dựa vào cơ sở khoa học tiến bộ về đo lường đánh giá mà các nước tiên tiến đã sử
dụng.
Với thang điểm 10 đang được sử dụng phổ biến ở nước ta hiện nay có thể sử
dụng thang điểm tiêu chuẩn với điểm trung bình là 5, độ lệch chuẩn bằng 2, khi
ấy khoảng (-2,56; +2,56) sẽ ứng với khoảng điểm (0; 10)
I.4.Thuyết ứng đáp câu hỏi và mô hình Rasch.
I.4.1.Thuyết ứng đáp câu hỏi
I.4.1.1.Khái niệm chung về thuyết ứng đáp câu hỏi
Muốn đánh giá một loại năng lực nào đó của thí sinh và câu hỏi người ta
dựa vào mô hình toán học về phép đo lường trong giáo dục, người ta xét mối
tương tác nguyên tố giữa thí sinh và câu hỏi, thuyết đó gọi là thuyết ứng đáp câu
hỏi (Item Response thcory - IRT). Để phản ánh quan hệ các mối tương tác
nguyên tố TS-CH, người ta xây dựng mô hình toán học dựa trên 2 giả định sau
làm cơ sở :
+Giả định thứ nhất về tính đơn thứ nguyên (Undimen Sionclity). Nghĩa là
chỉ một thuộc tính hoặc một năng lực được đo bởi các câu hỏi tạo nên bài trắc
nghiệm. Thực tế lại có rất nhiều yếu tố ảnh hưởng đến chất lượng làm bài trắc
nghiệm của thí sinh (sự hồi hộp, khả năng làm nhanh…) ngoài năng lực chính
được đo bởi bài trắc nghiệm để đạt được giả định về đơn thứ nguyên cần xây
dựng bài trắc nghiệm sao cho gần như các thành phần chính ảnh hưởng lên việc
làm bài trắc nghiệm. Điểm số đánh giá năng lực của thí sinh có thể thay đổi theo
thời gian do học thêm, quên bớt hay do các yếu tố khác.
+Giả định thứ hai là: có một hàm đặc trưng của câu hỏi phản ánh thực giữa
các biến không quan sát được (năng lực) và các biến quan sát được (việc trả lời
câu hỏi)
I.4.2.Các thao tác tiến hành để xây dựng thuyết ứng đáp câu hỏi.
Để xây dựng thuyết ứng đáp câu hỏi người ta công nhận 2 giả thuyết :
1-Việc trả lời của một thí sinh đối với một câu hỏi có thẻ dự báo bởi năng
lực của thí sinh.
2-Quan hệ giữa việc trả lời câu hỏi bởi thí sinh và năng lực làm cơ sở cho
việc trả lời đó có thể được mô tả bằng một hàm tăng đơn điệu được gọi là hàm
đặc trưng câu hỏi.
Với mô hình IRT, nó có thể chưa một hay nhiều tham số để mô tả câu hỏi cũng
như chưá một hay nhiều tham số để mô tả thí sinh. Vấn đề là để ứng dụng IRT
thì bước quan trọng đầu tiên là ước lượng các tham số đó của mô hình, thứ hai là
đánh giá sự phù hợp giữa mô hình và số liệu thực tế. Trong phạm vi sai số đo
lường, các giá trị ước lượng về năng lực thí sinh thì được từ nhiều bài trắc
nghiệm khác nhau sẽ như nhau, và các giá trị ước lượng về tham số câu hỏi thu
được từ các nhóm đánh giá khác nhau sẽ như nhau. Như vậy, thuyết IRT các
tham số của câu hỏi và năng lực thí sinh phải là bất biến. Tính bất biến đó thu
được bằng cách kết hợp thông tin về câu hỏi trong quá trình ước lượng năng lực
thí sinh và bằng cách kết hợp thông tin về năng lực thí sinh trong quá trình ước
lượng tham số của câu hỏi. Hình 3 trên minh hoạ đặc điểm đó. Các thí sinh có
cùng năng lực, dù ở nhóm đánh giá 1 hay 2 cũng có xác suất trả lời đúng câu hỏi
như nhau, vì xác suất để 1 thí sinh với năng lực đã biết trả lời đúng câu hỏi được
xác định bởi các tham số của câu hỏi, nên các tham số của câu hỏi cũng phải như
nhau trong 2 nhóm.Ngoài ra IRT còn có thể cho phép ước lượng các sai số chuẩn
của các giá trị ước lượng năng lực của mỗi thí sinh, chứ không phải là một ước
lượng sai số duy nhất cho mọi thí sinh như trong lý thuyết cổ điển.
I.4.2.Mô hình Rasch.
I.4.2.1.Giả thiết của Rasch về việc ứng đáp câu hỏi.
Nhà toán học người Đan Mạch Georg Rasch đã đưa ra một mô hình “ứng
đáp câu hỏi” để mô tả mối tương quan nguyên tố giữa một thí sinh với một câu
hỏi của bài trắc nghiệm và dùng mô hình đó để phân tích các dữ liệu của bài trắc
nghiệm. Đó là mối quan hệ trong đó thí sinh tài sản vô hình có một mức năng lực
v nào đó về lĩnh vực được đo ứng trước CHi có một độ khó đi.Mô hình của
Rasch được phát biểu như sau : “Một thí sinh có khả năng hơn thí sinh khác phải
có một xác suất lớn hơn để trả lời đung fmột câu hỏi bất kỳ, cũng tương tự như
vậy, một câu hỏi khó hơn một câu hỏi khác có nghĩa là đối với bất kỳ thí sinh nào
xác suất để trả lời đúng câu hỏi sau là lớn hơn so với câu hỏi trước (1960).Từ đó
Rasch đã xây dựng hàm ứng đáp câu hỏi và đường cong ứng đáp câu hỏi tương
ứng. Để biểu diễn các mối quan hệ này Rasch đã sử dụng thủ thuật để có thể biểu
diễn được năng lực và độ khó trên cùng một thang đo.
I.4.2.2.Hàm ứng đáp câu hỏi theo Rasch.
Theo Rasch, xác suất của tài sản vô hình trả lời đúng câu hỏi i, phụ thuộc
vào độ chênh lệch giữa năng lực v của thí sinh và độ khó i của câu hỏi, tức là
hiệu số (v - i). Khi v = i thì xác suất trả lời đúng câu hỏi là 112. Khi v
>i thì xác suất trả lời
đúng câu hỏi gần bằng 1. Vì vậy hàm ứng đáp câu hỏi tăng đơn điệu từ 0 - 1 khi
hiệu (v - i) biến đổi từ - đến + hàm, xác suất được Rasch chọn với biểu
thức toán học đơn giản nhất có dáng điệu biến đổi như vậy.
Pi (v) =Error!
(1Trong đó P(v) là xác suất của thí sinh có năng lực v trả lời đúng câu hỏi
có độ khó i.
I.4.2.3. Ứng dụng của mô hình Rasch
Trong các mô hình ứng đáp câu hỏi, mô hình Rasch được sử dụng nhiều
nhất vì nó mô tả quá trình ứng đáp câu hỏi tương đối đơn giản mà kết quả khá
phù hợp với dữ liệu thực tế.
Trên thế giới người ta đã soạn thảo nhiều phàn mềm máy tính để tính toán
các phép đo lường trong giáo dục dựa vào các mô hình được xây dựng bởi lý
thuyết ứng đáp câu hỏi như các phần mềm: Bigstep, pascal …
Việc nghiên cứu và áp dụng lý thuyết ứng đáp câu hỏi, đặc biệt là mô hình
Rasch trong những năm qua phát triển rất mạnh mẽ. Thực tế, để đơn giản chúng
ta đã hạn chế làm quen với sử dụng mô hình Rasch đối với mô hình các câu hỏi
lưỡng phân, tức là kết quả của việc trả lời câu hỏi chỉ là 0 hoặc 1. Người ta đã mở
rộng mô hình Rasch cho các loại mô hình câu hỏi với kiểu thang đo (rất không
đồng ý, không đồng ý, trung lập, đồng ý, rất đồng ý) và các loại thang đo khác
mà câu trả lời có nhiều mức phân cách khác nhau. Sự mở rộng này là rất quan
trọng, giúp hoàn thiện nhiều công cụ đo lường của nhiều loại trắc nghiệm và
nghiên cứu khác nhau.
Nhờ vậy việc ứng dụng lý thuyết ứng đáp câu hỏi và mô hình Rasch, người
ta có thể xây dựng ngân hàng câu hỏi trắc nghiệm chứa các câu hỏi được định cỡ
chính xác, từ đó lập các đề trắc nghiệm có khả năng đo lường năng lực với đodọ
chính xác rất cao. Nhờ vậy mà người ra có thể thiết kế các trắc nghiệm thích ứng
nhờ máy tính cho phép đo lường chính xác năng lực với một số lượng không lớn
các câu hỏi trắc nghiệm thích hợp.
Về việc nghiên cứu và áp dụng khoa học về đo lường trong tâm lý và giáo
dục, khoảng cách giữa nước ta với các nước tiên tiến trên thế giới về lĩnh vực này
còn quá xa. Để phát triển giáo dục và các khoa học liên quan đến tương tác với
con người, việc đầu tư vào nghiên cứu và vận dụng các khoa học nền tảng về tâm
lý và giáo dục, trong đó có khoa học về đo lường là một yêu cầu hết sức cấp
bách. Nhưng chúng ta hi vọng rằng trong tương lại khoảng cách này sẽ ngày một
ngắn lại nếu chúng ta biết tiếp thu và tận dụng các thành tựu khoa học công nghệ
mới của thời đại.
CHƯƠNG II: CÁCH TIẾN HÀNH THỰC NGHIỆM
II.1.Các bước để xây dựng một bài thi TNKQ
II.1.1.Phân tích nội dung và phác thảo bài trắc nghiệm
Một sự phân tích về nội dung sẽ cung cấp một bản tóm tắt những ý đồ của
chương trình giảng dạy được diễn đạt theo một nội dung nhất định. Nội dung nào
bao trùm trong khung chương trình học và có những chương nào quan trọng
trong nội dung này, những phần nào quan trọng trong các chương trình ấy hay
những lĩnh vực nào trong các nội dung ấyđưa vào trong trắc nghiệm đại diện
này?
Bản phác thảo bài trắc nghiệm định rõ những gì mà nó phải bao hàm hơn là
những gì đã có trong chương trình học. Một bài trắc nghiệm thường bao gồm tên
bài trắc nghiệm, mục đích cơ bản của bài trắc nghiệm, những khía cạnh nội dung
chương trình mà bài trắc nghiệm phải bao hàm và bản chỉ dẫn cho học sinh về
cách làm bài thi. Việc so sánh bản phác thảo trắc nghiệm với kết quả phân tích
nội dung chương trình đào tạo, phải cho thấy được bài trắc nghiệm là một mẫu
tiêu biểu hợp lý của nội dung chương trình đào tạo, hay nó cũng có thể bao hàm
cả những khía cạnh khác nữa. Khi bản phác thảo trắc nghiệm có nhiều khía cạnh,
có thể xem xét những căn cứ cần thu thập được phối hợp với các khía cạnh khác
nhờ một bảng ma trận và mức độ quan trọng của bằng chứng đó phải được đưa
vào của bài trắc nghiệm như test nào cho hợp lý.
II.1.2.Viết câu hỏi trắc nghiệm
Viết câu hỏi là việc chuẩn bị cho những công việc đánh giá, phát hiện kiến
thức và kỹ năng của học sinh về các nhiệm vụ được xem xét. Những công việc
làm cho học sinh lúng túng sẽ không thu hút được học sinh, làm cho học sinh xao
nhãng các công việc đã được định trước. Những công việc được đánh giá hợp lý
là những việc mà học sinh muốn tìm cách giải quyết mà nó nêu được một cách rõ
ràng những gì đòi hỏi ở học sinh và là những công việc cung cấp bằng chứng về
năng lực trí tuệ của học sinh. Một số người khi viết câu hỏi chỉ đo được những gì
đề đo hơn là đo được cái cần đo. Điều này cho phép đáp ứng được số lượng hình
thức câu hỏi nhưng không đạt được tính chất giá trị. Việc sử dụng các câu hỏi dễ
viết hơn là các câu hỏi quan trọng sẽ làm méo mó quá trình đánh giá và do đó sẽ
đem lại những thông tin không phù hợp về nội dung chương trình đào tạo đến
học sinh, giáo viên và các cộng đồng xã hội xung quanh trường.
II.1.3.Duyệt lại câu hỏi
Việc soạn thảo các công việc đánh giá sử dụng trong các bài trắc nghiệm đòi
hỏi nhiều kỹ năng. Đôi khi câu hỏi có vẻ rõ ràng với người viết nhưng không phải
lúc nào cũng rõ ràng đối với người khác. Trước khi tiến hành thử nghiệm, các
công việc đánh giá cần phải được xem xét lại do một ban xét duyệt chuyên môn
đặt ra các câu hỏi như sau:
-Nhiệm vụ có rõ ràng đối với từng câu hỏi không ? liệu người được hỏi có
hiểu rõ những gì đang được mong đợi ở họ hay không ?
-Mỗi một câu hỏi có phải là câu đúng quy định để đánh giá ở cấp độ giáo
dục đó hay không?
-Các từ ngữ sử dụng có phù hợp với trình độ thí sinh hay không?
-Có những đầu mối hở không chủ tâm để doán câu trả lời hay không?
-Có phải rõ ràng một câu trả lời đúng (hoặc tốt nhất) cho từng câu hỏi
không?
-Loại câu hỏi đó có phù hợp với thông tin cần biết hay không ?
-Những nhận định trong các câu hỏi có gì là xúc phạm hay không ?
-Có đủ các câu hỏi tiêu biểu để tạo ra được một mẫu thích hợp của các hành
vi được đánh giá hay không?
Việc xét duyệt các câu hỏi này được đem ra thử nghiệm là để đảm bảo sao
cho chúng ta tránh được cách diễn đạt bằng ngôn ngữ quá phức tạp đối với các ý
tưởng đang định trắc nghiệm, Tránh các từ thừa, các phủ định kép và các câu
nhiễu không hợp lý. Khi xem xét cũng cố gắng tìm ra các câu hỏi không có câu
trả lời đúng (hay tốt nhất) cũng như các câu có nhiều phương án trả lời đúng. Các
câu hỏi như vậy có thể được loại bỏ hay viết lại.
II.1.4.Lưu ý chung khi viết câu hỏi khách quan.
+Yêu cầu chung:
1.Sử dụng ngôn ngữ phù hợp với thí sinh
2.Không hỏi ý kiến riêng của thí sinh, chỉ hỏi sự kiện, kiến thức.
Loại nhiều lựa chọn:
1.Các phương án sai phải có vẻ hợp lý.
2.Chỉ nên dùng 4 hoặc 5 phương án chọn
3.Đảm bảo cho câu dẫn nối liền với mọi phương án chọn theo đúng ngữ
pháp.
4.Chỉ có một phương án chon là đúng
5.Tránh dùng câu phủ định, đặc biệt là phủ định hai lần.
6.Tránh lạm dụng kiểu “không phương án nào trên đây đúng” hoặc “mọi
phương án trên đây là đúng”
7.Tránh việc tạo phương án khác biệt so với các phương án khác (dài hơn
hoặc ngắn hơn, mô tả tỉ mỉ hơn…)
8.Phải sắp xếp phương án đúng theo thứ tự ngẫu nhiên.
II.2.Các đại lượng đặc trưng liên quan đến bài trắc nghiệm
II.2.1.Xác suất.
Đối với các hiện tượng ngẫu nhiên người ta không thể biết chắc chắn một sự
kiện hoặc biến cố gì đó xảy ra, chỉ có thể nói xác suất xẩy ra một biến cố nào đó.
Ví dụ xác suất xuất hiện một sự cố như sự xuất hiện “mặt lục” của xúc sắc 6 mặt
là 1/6. Xác suất là motọ số không âm, có giá trị từ 0 đến 1, xác suất bằng 0 ứng
với sự cố không thể xảy ra, xác suất bằng 1 ứng với sự cố chắc chắn xảy ra.
II.2.Bản đặc trưng 2 chiều
Khi chúng ta đã có trong tay một đề kiểm tra được xây dựng đúng theo các
bước như trên đây nhưng liệu chúng ta đã đảm bảo được chất lượng của đề thi đó
là tốt hay xấu chưa. Để trả lời câu hỏi này chúng tôi xin giải thích rõ hơn về bản
đặc trưng hai chiều. Vậy bản đặc trưng hai chiều là gì ? bản đặc trưng 2 chiều là
khái niệm để đánh giá đề thi mà chúng ta cho kiểm tra đã đạt chưa và đã đạt được
đúng mục tiêu giảng dạy chưa. Một đề thi muốn đạt được chất lượng tốt nghĩa là
nó phải đo được cái cần đo hay bám sát vào mục tiêu giảng dậy. Về nội dung
phải đảm bảo vừa tầm với học sinh, kiến thức bao quát được cả quá trình dạy, các
câu được phân bố đồng đều về cấu trúc cũng như nội dung chương trình. Như vậy
để đánh giá được cả một đề thi đó ra sao chúng ta phải đánh giá đến từng câu hỏi
một. Yêu cầu ở mỗi câu hỏi ở mức kỹ năng nào : nhớ, hiểu hay áp dụng … Để
hiểu rõ vấn đề chúng tôi xin phân tích đề thi mà chúng tôi đã tíến hành thử
nghiệm về nội dung và các yêu cầu của một đề thi bằng trắc nghiệm KQ qua các
phần sau đây:
I.2.1.Sơ lược về kiến thức chương trình hoá 10.
Đây là yếu tố quan trọng nhất để xây dựng một đề thi bất kỳ nào đó kể cả tự
luận hay trắc nghiệm. Chỉ có những người có chuyên môn thật vững kiến thức thì
mới có khả năng ra một đề thi tốt được. Mà một đề thi muốn tốt thì người ra đề
thực sự phải có chuyên môn sâu vì họ sẽ đánh giá cho câu hỏi về vấn đề gì mà
đảm bảo kiến thức xuyên suốt chương trình mà đạt được mức độ nhận thức theo
mức độ chương trình chung.
II.2.1.1.Cấu trúc chương trình
Chương trình hoá lớp 10 gồm 5 chương sau:
-Chương I: Cấu tạo nguyên tử
-Chương II: liên kết hoá học định luật tuần hoàn Menđelêep
-Chương III: Phản ứng Oxi hoá khử
-Chương IV: Phân nhóm chính nhóm VII- nhóm halogen
-Chương V: Oxi-lưu huỳnh lý thuyết phản ứng hoá học
II.2.1.2.Nội dung chính của từng chương
*Chương I: Cấu tạo nguyên tử
Yêu cầu chính của chương trình là học sinh nắm được các khái niệm cơ bản
thuyết cấu tạo nguyên tử. Ví dụ thành phần cấu tạo của nguyê ntử ra sao, hạt
nhân nguyên tử là gì, thế nào là nguyên tố hoá học, khái niệm về đồng vị, đặc biệt
nắm được cấu tạo của bảng hệ thống tuần hoàn, vì đây là phần đầu của chương
trình nên học sinh thường rất bỡ ngỡ và khó hiểu những khái niệm trừu tượng
như cấu hình (e) obi tan nguyên tử, electron lớp ngoài cùng. Phần quan trọng của
chương này chính là nắm được tính chất chung của bảng HTTH. Ví dụ khi câu
hỏi đưa ra một chất cho diện tích bằng bao nhiêu thì thường sẽ hỏi viết cấu hình
(e) của nguyên tố đó có mấy (e) lớp ngoài cùng, từ đó suy ra tính chất của nhân tố
đó có tính kim loại hay phi kim loại. Khi có trong tay bảng FTTH học sinh tối
thiểu phải trả lời được các câu hỏi như thế nào là chu kỳ, phân nhóm (chính, phụ)
số electron ngoài cũng có liên quan gì đến tính chất của nguyên tố đó. Nếu số
electron ngoài cùng là 1,2,3 thì nó thể hiện tính kim loại, 4,5,6 thể hiện tính phi
kim, bằng thể hiện tính chất của khí (khí hiếm)… Như vậy nếu học sinh
không hiểu được bản chất thì không thể trả lời được câu hỏi. Chẳng hạn, trong đề
kiểm tra thử nghiệm chúng tôi đưa ra 4 câu về chương cấu tạo chất chúng ta phân
tích một ví dụ cụ thể trong đề thi đó:
VD: Cho một nguyên tố có cấu hình (e) ngoài cùng 3523P5. Vậy nguyên tố
ấy sẽ là : A) B) P C) N D) F
Rõ ràng với yêu cầu của câu hỏi được đặt ra như vậy thì một học sinh kém
hay ở mức trung bình trở xuống sẽ không trả lời được. Để trả lời đúng câu này
học sinh phải nắm được khái niệm (e) lớp ngoài cùng có ý nghĩa như thế nào,
nắm được obitan nguyên tử và thế nào là điện tích nguyên tố. Khi câu hỏi đưa ra
dạng khuyết như vậy đầu tiên chúng ta sẽ phải viết được cấu hình đầy đủ của
nguyên tố đó có dạng : 1522522P5. Sau đó tính được điện tích nguyên tố bằng
tổng các electron được phân bố trên các obitan, sẽ tính được Z=17, dùng bảng
HTTH tra nguyên tố có thứ tự (hay điện tích nguyên tố bằng 17 sẽ là clo). Thực
tế có những học sinh kém đến mức không biết xác định nguyên tố tên là gì nếu
biết điện tích nguyên tố vì họ không hiểu được khái niệm điện tích nguyên tố là
gì và cấu trúc bảng HTTH như thế nào, cách tra ra sao ?
*Chương II: Liên kết hoá học định luật tuần hoàn Menđeleev
Nội dung chính của chương này đặt ra một số vấnđề như : vì sao các chất lại
tồn tại và chúng tồn tại theo một quy luật nhất định nào đó ? từ đó thuyết liên kết
hoá học ra đời và giải thích được câu hỏi đó. Yêu cầu đối với học sinh ở chương
này nắm được bản chất của liên kết hoá học là gì, có các loại liên kết hoá học
nào, bản chất của từng loại liên kết một. Ngoài ra học sinh phải nắm được định
luật tuần hoàn của Menđeleev cho phép chúgn ta biết được tính chất hoá học của
nguyên tố hoá học bất kỳ và tính chất của chúng biến đổi theo một quy luật nhất
định. Vì thời gian và số lượng câu nên chúng tôi không đưa nội dung này vào
trong đề kiểm tra của mình.
*Chương III: Phản ứng oxi hoá khử
Đây là một mảng kiến thức rất quan trọng trong không chỉ trong chương
trình lớp 10 mà nó xuyên suốt cả chương trình phổ thông. Yêu cấu tối thiểu đối
với học sinh bình thường phải nắm được các khái niệm như : Số ôxi hoá, chất ôxi
hoá, chất khử, phản ứng. Và đương nhiên phải hiểu được bản chất của vấn đề ví
như cho một phản ứng bất kì học sinh phải chỉ ra được nó có thuộc loại phản ứng
ôxy hoá khử hay không, đâu là chất oxy hoá, đâu là chất khử. Khi đã có các khái
niệm rồi thì yêu cầu cuối cùng và quan trọng nhất đối với học sinh trong chương
này chính là có thể cân bằng (e). Nếu học sinh không cân bằng nổi một phương
trình đơn giản thì kiến thức học sinh đó đáng báo động và phải điều chỉnh ngay vì
chưa biết cân bằng phương trình coi như không hiểu gì về chương oxi hoá-khử.
Trong đề thi của mình chúng tôi đã đưa ra 6 câu hỏi về chương này với các dạng
khác nhau với các mức yêu cầu khác nhau, có dạng đơn giản chỉ là xác định số
oxi hoá của một nguyên tố bất kỳ trong một hợp chất nào đất, có câu áp dụng
bằng phương trình oxi hoá khử hay có dạng cho một phương trình phản kứng yê
ucầu học sinh xác định đâu là chất khử, đâu là chất oxi hoá.
Ví dụ: cho phản ứng:
Fe304 +10 HN03 = 3 Fe (N03)3 + N)2 + 5H20 vậy thì:
A) Fe304 và HN03 đều là chất oxi hoá
B) Fe304, HN03 đều là chất khử
C) Fe304 là chất khử, HN03 chất oxi hoá
D) Fe304 chất oxi hoá, HN03 chất khử
Như vậy với ví dụ này nếu học sinh biết xác định số oxi hoá của nguyên tố
nào thay đổi và hiểu được định nghĩa thế nào là chất khử, chất oxi hoá thì sẽ làm
được câu hỏi này một cách dễ dàng.
*Chương IV: Phân nhóm chính nhóm VII - Nhóm Haloofen
Đây là chương rất quan trọng trong khối lượng kiến thức hoá 10 nên chúng
tôi đã xây dựng một số lượng các câu hỏi khá lớn trong đề kiểm tra của mình (8
câu trên 30 câu). Nội dung chính của chương này mà học sinh phải nắm được là
các tính chất vật lý hoá học chung của phân nhóm chính nhóm VII, sau đó đi chi
tiết tính chất của từng nguyên tố một. Theo như phân bố chương trình sách giáo
khoa nguyên tố clo được trình bày kỹ càng và trọng tâm nhất trong các nguyên tố
halogen. Học sinh cần phải nắm được các tính chất lí hoá học của nguyên tố clo
và tính chất đặc trưng của một số hợp chất chứa oxy cảu clo như : clorua vôi,
nước taven, axits clohidric, muối clorua… Ngoài ra các nguyên tố còn lại như
Flo, Brem, iDt không chỉ hiểu được các tính chất chung mà phải nắm được một
số tính chất riêng của từng nguyên tố là gì. Trong sách ra đề của chúng tôi trong
chương này vừa có dạng tổng quát như so sánh mức độ hoạt động của các nguyên
tố halogen, so sánh axít của chúng, tính chất của clo là gì, các phương pháp điều
chế clo, hay có những bài tập áp dụng có tính bán kết quả. Như vậy mục tiêu khi
ra câu hỏi không phải dừng ở mức kỹ năng nhớ, hiểu áp dụng mà nó đòi hỏi kỹ
năng tư duy tương đối cao (phân tích, đánh giá)
Chúng ta xét một câu hỏi trong bộ đề kiểm tra mà chúng tôi đã tiến hành thử
nghiệm. Một dạng câu hỏi áp dụng tính toán nhưng để làm được thì không những
học sinh phải sử dụng tính toán đơn thuần mà phải kết hợp được nhiều mức kỹ
năng khác nhau.
Cho 8,7 gam Mn02 tác dụng với dung dịch H dư thì thể tích khi Cl2 ( )
thu được sẽ là :
A)22,4 (l) B)4,48 (l)
C)2,24 (l) D)11,2 (l)
Để làm được câu hỏi này học sinh phải kết hợp viết và cân bằng được
phương trình và tính toán theo phương trình phản ứng mà điều này đối với học
sinh kém quả thực không mấy đơn giản chút nào vì làm trong một khoảng thời
gian ngắn đòi hỏi sự nhanh nhẹn và kỹ năng làm bài thành thạo.
*Chương V: Oxi-lưu huỳnh. Lý thuyết về phản ứng hóa học.
Đây cũng là chương được chúng tôi phân bố câu hỏi cũng tương đối nhiều
(khoảng 9 câu). Cũng giống như chương Halogen ngoài những tính chất đặc
trưng chung của phân nhóm chính. Nhóm VI học sinh phải nắm được tính chất
của một số các chất được trình bày riêng một bài. Yêu cầu học sinh phải nắm
được tính chất của oxi lưu huỳnh, hidosunfua, các oxits của lưu huỳnh, đặc biệt là
axít Sunfuric… Dạng câu hỏi chúng tôi xây dựng về chương này cũng vừa có lý
thuyết và có các dạng bài tập tính toán. Có câu đòi hỏi mức độ tư duy rất cao
dành cho học sinh giỏi, ví dụ:
Cho các chất: O2, S, H2S, SO2 chất tan nhất trong nước là :
A) SO2 B) S
C) H2S C) O2
Nếu học sinh không nắm được tính chất vật lí của từng bài về lưu huỳnh,
Oxi, hidroSunfua, Oxít của lưu huỳnh thì khó có thể trả lời được câu này vì nó
đòi hỏi không chỉ nhớ kiến thức qua từng bài mà học sinh phải biết tổng hợp kiến
thức qua mỗi bài học để so sánh từng chất với nhau.
Vì trong thời gian chúng tôi nghiên cứu đề tài nàyếu tố khi tiến hành thí
nghiệm học sinh gần kết thúc chương trình và để đánh giá chính xác thực lực học
sinh trong học kỳ 2 nên đề kiểm tra mà chúng tôi biên soạn chủ yếu tập trung vào
3 chương cuối cùng (chương oxi hoá khử, các nguyên tố halogen, các nguyên tố
nhóm VIA) nên có thể nội dung chưa xuyên suốt được toàn bộ chương trình lớp
10 nhưng gần như những vấn đề nổi cộm và cốt lõi nhất chúng tôi có đưa vào và
với sự đa dạng về các loại câu hy vọng kết quả của chúng tôi làm thử đạt được
như mong đợi.
II.3.Phương pháp đánh giá bài trắc TN
II.3.1.Các mức độ mục tiêu trong lĩnh vực nhận thức.
Nói đến mức độ mục tiêu trong lĩnh vực nhận thức chúng ta nghĩ ngay đến
Bloom, người đã xây dựng nên các cấp độ của các mục tiêu giáo dục hay gọi là
cách phân loại Bloom theo. Bloom trong lĩnh vực nhận thức được chưa thành các
mức độ hành vi từ đơn giản đến phức tạp nhất như sau:
1.Nhớ (Knou ledgo): Nghĩa là sự nhớ lại các dữ liệu đã được học trước đây
nghĩa là một người có thể nhắc lại một loạt các dữ liêụ từ các sự kiện đơn giản
đến các lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là
cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức. Ví dụ trong hoá
học học sinh có khả năng nhớ bài học có thể trả lời được câu hỏi như : Nêu các
tính chất hoá học của axit clohidric. Nhưng một bài kiểm tra mà ra các câu hỏi
kiểu dạng như thế này thì chưa đạt yêu cầu vì nó sẽ kích thích học sinh học thuộc
lòng, học vẹt mà thực chất lại không hiểu được vấn đề gì.
2.Hiểu (Comprehention): Nghĩa là khả năng nắm được ý nghĩa của tài liệu.
Hay nói cách khác có thể thực hiện bằng việc chuyển tài liệu từ dạng này sang
dạng khác bằng cách giải thích tài liệu (hay tóm tắt) và bằng cách ước lượng xu
hướng tương lai (dự báo các kết quả hoặc ảnh hưởng). Kết quả học tập được đo ở
mức độ này cao hơn so với nhớ, đây là mức độ thấp nhất để hiểu thấu sự vật.
Ví dụ: Số electron của một ion Mg2 là:
A) 2 B) 12
C) 24 D) 10
Nếu học sinh không hiểu được yêu cầu nội dung câu hỏi mà chỉ học thuộc
thôi thì rất dễ mắc bẫy. Muốn trả lời được câu hỏi này, thí sinh phải hiểu được
khái niệm thế nào là điện tích ion, thế nào là số electron của nguyên tố từ đó suy
ra được số electron của một ion mang điện tích dương hay âm bất kỳ nào đó. Nếu
thí sinh chọn phương án có 2 electron có nghe ra cũng có lý nếu hiểu điện tích
ion bằng số electron, nếu chọn 12 hay 24 cũng có vẻ không vô lý lắm vì nếu học
sinh học thuộc lòng thứ tự điện tích các nguyên tố thì thấy ngay số thứ tự của Mg
trong bảng HTTH là 12, còn số 24 là biết đâu do đoán mò lấy số 2 nhân với 12
thì may ra đúng. Như vậy, chúng ta thấy chỉ học thuộc lòng mà không hiểu bản
chất thì học sinh sẽ khó có thể trả lời đúng và đáp án đúng ở đay lại là 10
(phương án D) mà con số này nó có vẻ không hợp lý lắm so với kiến thức mà học
sinh đã được học. Vì bình thường nguyên tử của nguyên tố magie có 12 electron
nhưng ở đây người ta hỏi số electron của ion Mg2+ nghĩa là nguyên tử đã nhường
cho 2 electron để được ion dương Mg2+ và chỉ cần làm 1 phép tính đơn giản lấy
12- 2 = 10 (electron)
3.Áp dụng (application): được định nghĩa là khả năng sử dụng các tài liệu đã
học vào một hoàn cảnh cụ thể mới. Điều đó bao gồm việc áp dụng các quy tắc,
phương pháp, khái niệm, nguyên lý, định luật, lý thuyết. Kết quả học tập trong
lĩnh vực nào đó ở cấp độ này đòi hỏi sự thấu hiểu cao hơn so với mức kỹ năng
nhớ và hiểu một chút. Thí dụ khi học sinh học kiến thức về chương oxi hoá khử,
học sinh đã nắm được các bước để cân bằng một phản ứng oxi hoá khử theo
phương pháp thăng bằng electron thì khi gặp bất kỳ một phản ứng nào đều có thể
làm được. Bài tập dạng cân bằng như vậy chúng tôi có áp dụng vào trong đề kiểm
tra thử nghiệm này, có khoảng 2 câu về cân bằng phương trình ở mức độ trung
bình và một bài tương đối phức tạp một chút. Ví dụ:
Cho phản ứng: ANH3 + BO2 = CNO + DH2O. Các hệ số A, B, C, D sẽ là
A) 5,4,5,4 B) 4,4,5,5
C) 4,5,4,5 D) 4,5,4,6
Chúng ta thấy ngay rằng nếu hiểu và vận dụng đúng các bước cân bằng mà
học sinh đã học thì việc cân bằng này rất dễ dàng mà không tốn nhiều thời gian.
Ngoài ra nếu học sinh có thể thay đáp án thử lại xem kết quả nào hợp lý sau đó sẽ
chọn giá trị tương ứng nhưng cách làm đó rất thủ công và mất nhiều thời gian học
sinh phải thử đến 4 phép tính gây cảm giác rất rối và nặng nề. Vì đối với những
phương trình đơn giản có thể thử được nhanh nhưng có những phương trình cân
bằng với hệ số rất lớn thì công việc tính toán chiếm rất mất nhiều thời gian hơn là
cân bằng phương trình đó bình thường theo phương pháp đã học.
4.Phân tích (Analysis): Nghĩa là khả năng phân chia một tài liệu ra thành các
phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Điều đó có thể
bao gồm việc chỉ ra đúng các bộ phận phân tích mối quan hệ giữa các bộ phận và
nhận biết được các nguyên lý tổ chức được bao hàm. Kết quả học tập ở mớc độ
này đòi hỏi học sinh có mức độ trí tuệ cao hơn so với mức hiểu và áp dụng vì nó
yêu cầu một sự thấu hiểu cả nội dung và hình thái cấu trúc của tài liệu.
Thí dụ: ion X có cấu hình (e) lớp ngoài cùng: 3S23P6. Vậy X là :
A) B) S C) P D) N
Để trả lời được câu hỏi này học sinh phải phân tích được đề bài, dữ liệu bài
toán cho là ion X2 nhưng lại hỏi về nguyên tố X. Đầu tiên ta sẽ chuyển cấu hình
ion X2 về cấu hình X, sau đó từ cấu hình (e) lớp ngoài cùng viết cấu hình (e) đầy
đủ của X và tính số điện tích nguyên tố sẽ tra được nguyên tố đó dựa vào bảng
HTTH.
Rõ ràng với một câu hỏi như vậy chúng ta đã chuyển sang các dạng trung
gian khác nhau để tìm ra phương án trả lời.
5.Tổng hợp (Syn theis): Được định nghĩa là khả năng sắp xếp các bộ phận
lại với nhau để hình thành một tổng thể mới. Điều đó có thể bao gồm việc tạo ra
một cuộc giao tiếp đơn nhất, một kế hoạch hành động hoặc một mạng lưới các
quan hệ trừu tượng. Kết quả học tập trong lĩnh vực này nhấn mạnh các hành vi
sáng tạo, đặc biệt tập trung chủ yếu vào việc hình thành các mô hình hoặc cấu
trúc mới. Mức kỹ năng tổng hợp đòi hỏi trình độ, kiến thức học sinh tương đối
cao, thường những em học lực khá, giỏi mới có khả năng trả lời đúng câu hỏi.
6.Đánh giá (Evaluation): Là khả năng xác định giá trị cảu tài liệu (tuyên bố,
tiểu thuyết, báo cáo …) việc đánh giá dự trên các tiêu chí nhất định được đặt ra
sẵn. Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu chí bên ngoài
(phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được cung cấp
các tiêu chí. Kết quả học tập trong lĩnh vực này là cao nhất trong các cấp bậc
nhận thức vì nó chứa các yếu tố của mọi cấp bậc khác.Vậy các cấp độ nhận thức
theo Bloom có thể được mô tả bằng sơ đồ sau theo mức độ từ thấp đến cao
6.Đánh giá
5.Tổng
hợp
4.Phân
tích
3.áp dụng
2. Hiểu
1.Nhớ
Sơ đồ các mưc kỹ năng theo Bloom
Có những người nghĩ rằng chỉ có đề thi tự luận mới đánh giáđược tư duy ở
mức độ cao còn đánh giá bằng TNKQ chỉ đạt ở mức độ tối thiểu nào đó, lối suy
nghĩ như vậy là hoàn toàn sai lầm. Theo Bloom một bài kiểm tra có thể đánh giá
mức độ tư duy của học sinh tương đối cao, có thể đạt mức độ cao nhất. Thế thì
muốn ra được các câu hỏi yêu cầu học sinh ở mức độ nhận thức cao nó tuỳ thuộc
rất nhiều vào khả năng người ra đề. Với chương trình lớp 10 thì khả năng tư duy
còn nhiều hạn chế chính vì vậy thường thì học sinh học theo kiểu cảm nhận là
chính. Vì vậy khi soạn các câu hỏi trắc nghiệm chúng tôi chủ yếu tập trung ở các
mức độ 1, 2, 3. Cũng có những câu (nhưng không nhiều) yêu cầu học sinh ở mức
độ cao (4, 5, 6) thường dành cho các em khá giỏi. Tuỳ theo mục tiêu đạt ra đối
với học sinh cần đạt trình độ như thế nào để người ra đề thi cân nhắc và vận dụng
ở mức độ hợp lý đối với học sinh.
II.3.2.Yêu cầu đối với một bài thi TNKQ.
II.3.2.1.Yêu cầu về nội dung
Nội dung là yếu tố quan trọng nhất để đánh giá một bài học hay mọt bài
kiểm tra có tốt hay không. Mục đích của mỗi bài học là học sinh cần nắm những
phần gì quan trọng nhất, cái gì cần nhớ nhất, đó chính là nội dung của một bài
học. Còn đối với một đề kiểm tra cũng vậy, chúng ta phải luôn tự đặt trong đầu
các câu hỏi đề thi gồm những nội dung chính gì quan trọng nhất, phần nào bắt
buộc đối với mọi học sinh thì phải nhấn sâu cho nhiều câu hỏi vào. Điều quan
trọng là nội dung của mỗi câu hỏi có ăn khớp với nội dung học sinh đã được học
trên lớp chưa ? Tránh những trường hợp nội dung câu hỏi rất hay nhưng không hề
liên quan đến kiến thức cần kiểm tra như vậy sẽ dẫn đến một hậu quả rất nghiêm
trọng là chúng ta sẽ không đo được mục tiêu giáo dục đã đề ra. Với thời gian và
trong điều kiện cho phép, các câu hỏi mà chúng tôi đã biên soạn gần như bao phủ
được toàn bộ chương trình lớp 10 nhưng trọng tâm số câu hỏi rơi vào nhiêù nhất
là các chương: oxi hoá khử, phân nhóm chính nhóm VIIA, phân nhóm chính
VIA. Ngoài những câu hỏi học sinh học chắc tính chất hoá học, có một số câu đòi
hỏi học sinh thuộc cả tính chất vật lý, phương pháp điều chế….
II.3.2.2.Yêu cầu về các mức kỹ năng.
Như đã giới thiệu ở trên để đánh giá chất lượng đề thi và đo được mục tiêu
giảng dậy chúng ta phải đặt ra những yêu cầu về mức độ nhận thức đối với từng
câu hỏi. Với trình độ học sinh lớp 10 chủ yếu các mức kỹ năng cần đạt là mức kỹ
năng 1 (nhớ), kỹ năng (hiểu) và mức kỹ năng 3 (áp dụng) là tương đối đạt yêu
cầu của chương trình giảng dạy. Nên đa số các cấu hỏi trắc nghiệm đạt ở các mức
độ 1,2,3 mà chúng tôi chủ định biên soạn. Nhưng nếu một đề kiểm tra mà chỉ
dừng lại ở các mức kỹ năng đó thì chưa đạt được mục tiêu là phân chia sự nhận
thức khác nhau giữa học sinh kém và học sinh giỏi. Chính vì vậy đề thi phải có
một số các câu hỏi (thường là ít) yêu cầu học sinh ở cấp độ cao hơn. Vì các câu ở
mức kỹ năng cao mới đánh giá và phân biệt được khả năng tư duy ở hai trình độ
khácnhau thì chất lượng làm bài cũng phân chia rõ ràng. Ngoài ra các câu khó
này còn đánh giá được số điểm của từng đối tượng tương ứng với trình độ của
học sinh. Thường thì học sinh khá, giỏi sẽ sẽ trả lời được các câu hỏi khó để đạt
điểm 9, 10 còn học sinh trung bình đạt số điểm thường là 5,6. Nhưng cũng tránh
ra những câu quá khó, hay một đề thi có quá nhiều câu đòi hỏi ở cấp độ cao làm
cho hầu hết thí sinh không trả lời được (kể cả thí sinh giỏi) thì đề thi không phân
cấp được khả năng làm bài giữa học sinh thuộc nhóm kém và nhóm giỏi. Theo
chúng tôi, số lượng các câu hỏi ở mức độ khó nữa phải chiếm khoảng 20-30%,
còn số câu ở mức độ khó phải nhỏ hơn 10% thì hợp lý hơn cả. Như vậy các câu
hỏi được ra nằm ở các mức độ. Rất dễ (gần như ai cũng làm được ), dễ trung
bình, khó, rất khó. Và do đó, chúng ta sẽ nhận thấy rằng để đạt được điểm tốt
(9,10) thì học sinh phải thực sự có năng lực để trả lời các câu hỏi khó.
II.3.2.3.Yêu câu về cách tổ chức
Thường thì kiểm tra bằng TNKQcó thể kiểm tra đồng thời một số lượng học
sinh tương đối lớn, nên nếu khâu tổ chức triển khai không tốt, dù bất kỳ một sơ
suất nhỏ nào cũng đều có thể dẫn đến hậu quả xuất và những phản ứng xã hội bất
lợi. Do đó để triển khai một kỳ thi với quy mô lớn người ta phải chuẩn bị hết sức
cẩn thận về đề thi, quy trình thi, thể thức chấm điểm, cách công bố kết quả… Các
câu hỏi trong một đề thi là các câu đã được thử nghiệm, phân tích cân nhắc trau
chuốt và định cỡ ( xác định độ khó, độ phân biệt, độ tin cậy và độ giá trị của cả
bài). Để đạt được một kỳ thi hay bài kiểm tra, theo chúng tôi có thể tiến hành
theo các bước sau đây:
*Xác định môn thi và nội dung tổng quát với từng môn. Đồng thời định ra
yêu cầu về các mức kỹ năng: nhớ, hiểu, biết vận dụng, phân tích, tổng hợp, đánh
giá…Để thực hiện khâu này thường người ta lập một ma trận 2 chiều: các dòng
phân theo các nội dung chính, các cột phân theo các mức kỹ năng tương ứng
trong mỗi ô ghi số câu hỏi cần thiết của phần nội dung và mức kỹ năng đó.
*Trao đổi trong tổ chuyên môn, phát hiện và sửa chữa những câu sai mà bản
thân người ra đề không cảm thấy.
*Biên tập và đưa các câu trắc nghiệm vào ngân hàng câu hỏi lưu trong máy
tính phụ trách biên tập phải là người am hiểu cả về chuyên môn lẫn kỹ thuật viết
trắc nghiệm.
*Lập đề thi và tổ chức thi thử trên một số nhóm thí sinh.
*Chấm thi và phân tích thống kê kết quả thi thử từ đó xác định được các đặc
trưng của mỗi câu trắc nghiệm như độ khó, độ phân biệt…qua đó có thể xác định
được độ tin cậy của bài trắc nghiệm, phân loại chất lượng các câu trắc nghiệm.
*Ra đề thi chính thức căn cứ vào dàn bài (phân bố câu theo nội dung và mức
độ kỹ năng tương ứng vơí bản đặc trưng hai chiều). Từ một đề thi gốc, nhờ phần
mềm tin học có thể tạo ra các đề thi tương ứng có cùng nội dung nhưng khác
nhau về hình thức bằng cách đảo lộn thứ tự các câu hỏi và đảo các phương án trả
lời A,B.C,D…
*In và tổ chức thi: đề thi được in sẵn, mỗi thí sinh một đề riêng
*Chấm và phân tích các kết quả thi.
*Công bố kết quả
Ưu điểm lớn của các kỳ thi đại trà bằng trắc nghiệm khách quan là: Nhờ
những thông tin thu được qua việc phân tích thống kê toàn bộ bài làm của thí sinh
qua các kỳ thi là những số liệu rất quý báu để đánh giá định lượng về tình hình
giáo dục của từng khu vực, từng cộng đồng, từng nhóm thí sinh và đánh giá xu
thế phát triển chất lượng giáo dục theo thời gian.
CHƯƠNG III: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU
Ở chương I và chương II chúng tôi đã giới thiệu những kiến thức cơ bản để
xây dựng một đề thi hay đề kiểm tra bằng các cầu hỏi trăc nghiệm khách quan và
lý thuyết về các tài liệu đặc trưng để đánh giá đề thi trắc nghiệm khách quan
chúng tôi đã xây dựng để kiểm tra bằng phương pháp trắc nghiệm và đã tiến hành
thử nghiệm cho kiểm tra một tiết với học sinh lớp 10. Sau đó đã nhập các đáp án
trả lời của học sinh xử lý số liệu trên chương trình Quest. Chúng tôi xin giới thiệu
sơ lược về quá trình làm thí nghiệm của mình và kết quả có 4 phương án trả lời:
ABCD. Trong đó, có một phương án trả lời trả lời đúng sau khi phân tích được
sau đây.
III.1. Các bước tiến hành thí nghiệm
1. Xây dựng bộ các câu hỏi dạng trắc nghiệm, mỗi câu hỏi có 4 phương án
lựa chọn
2. Xây dựng một đề thi gồm 30 câu hỏi trắc nghiệm lấy từ trong "ngân
hàng" câu hỏi
3. Tham khảo về nội dung các câu hỏi với những người cùng chuyên môn,
có chỉnh sửa, bổ sung và thay thế những câu chưa đạt yêu cầu.
4. Hình thành một đề gốc sau đó bảo vị trí các câu và vị trí các đáp án trả lời
các câu hỏi nhờ phần mềm tin học.
5. In và cho kiểm tra thử trên thực tế khi kiểm tra chúng tôi đã tạo được tâm
lý vững chắc cho học sinh để mọi thí sinh đều coi đây là trắc nghiệm thật lấy
điểm 1 tiết để học sinh có tinh thần làm nghiêm túc, hết mình để phép thử đạt yêu
cầu.
6. Cuối cùng, nhập số liệu xử lý kết quả làm bài của học sinh bằng phần
mềm tin học
III.2. Phân tích kết quả thực tế
III. 2.1. Kết quả chung
- Số lượng câu trong một đề thi: 30 câu (30items)
- Số thí sinh làm trắc nghiệm: 100 thí sinh (100Cases)
- Mỗi câu hỏi nhất.
- Đáp án của đề gốc: CCDCCCDBAACCCACACAACCADCADACCA
1. Summary of item Estimates (Tóm lược các năng lực của câu trắc nghiệm )
Mean: .00
SD: 1.01
SD (adjusted): .98
Reliability of estimate: .94 (độ tin cậy của bài trắc nghiệm)
Giải thích: Mean: .00 nghĩa là số trung bình là 0.00. SD: 1.01 nghĩa là độ
lệch chuẩn so với năng lực. Kết quả xấp xỉ bằng một là tương đối tốt. Độ ổn định
của bài trắc nghiệm là 0,94 là một kết quả tương đối tốt và hoàn toàn chấp nhận
được.
2.
Infit Mean Square
Mean: 1.00
SD: .09
Out fit Mean Square
Mean: 1.01
SD: .18
3. O items with zero scores and O items with perfect scores: Nghĩa là:
không có một câu nào bỏ trống và không có một câu nào thí sinh trả lời đúng
hoàn toàn.
III.2.2. Phân tích câu trắc nghiệm
Để đánh giá chất lượng của bài trắc nghiệm, chúng ta sẽ đánh giá từng câu
hỏi một. Mỗi một câu hỏi lại được đánh giá qua các tiêu chí như: độ khó, độ phân
biệt, phương án đúng và phương án nhiều của câu hỏi ấy. Sau đây chúng tôi phân
tích hai câu trắc nghiệm để minh hoạ:
Ví dụ 1: Item 1 (câu số 1)
Nội dung câu hỏi: Cho 8, 7 gam MnO2 tác dụng với dung dịch HCl dư thì
thể tích khí Cl2 (đktc) thu được sẽ là:
A. 2,24 (l)
C. 4,48 (l)
B. 11,2 (l)
D. 22,4 (l)
Kết quả phân tích câu 1:
Item 1: item 1 (key = C)
Categories
Count
Percent (%)
Pt-Biserial
P- Value
A
11
11,1
-.25
.007
B
12
12,1
- .24
.009
C*
59
59,6
.35
.000
D
17
17,2
-.05
.322
Missing
1
Phân tích: đán án đúng của câu 1 là phương án C trong 4 lựa chọn A, B, C,
D. Cout là số thì sinh tham gia trả lời các phương án. Thấy ngay ở phương án A
có 11 thí sinh lựa chọn, B có 12, C có 59, D có 17 người lựa chọn, có 1 người
không làm câu này (missing). Percent (%) là số phần trăm thí sinh tham gia trả
lời các phương án ở phương án C (phương án đúng) có 59,6% thí sinh lựa chọn.
Pt - Biserial là tương quan điểm nhị phân hay độ phân biệt của câu hỏi. Với
phương án C độ phân biệt là dương (0,35 > 0,2) tương đối lớn còn các phương án
nhiễu đều có độ phân biệt âm nên đây có thể nói là một câu hỏi tương đối tốt
Ví dụ 2: Item 18 (câu 18)
A. Hợp chất với kim loại hoặc với Hiđrô chúng luôn có số ôxi hoá là -1.
B. Có số Ôxi hoá duy nhất là + 7
C. Có số Ôxihoa duy nhất là + 1
D. Cả A, B, C đều sai
Kết quả câu 18:
Item 18: item 18 (key = A)
Categories
Count
Percent (%)
Pt-Biserial
A*
29
30,9
11
B
5
5,3
-.20
C*
8
8.5
- .18
D
52
55,3
.0,8
Missing
6
Nghĩa là với câu 18 ta thấy số thí sinh lựa chọn phương án đúng là 29
(chiếm 30,9%) nhưng lại chọn phương án nhiễu D là 52 học sinh (55,35) lớn hơn
rất nhiều so với phương án đúng. Đối với câu hỏi này phải chăng phương án A
chưa phải là phương án đúng nhất nhưng ta đã nhằm gán cho nó là phương án
đúng phải chăng phương án D mới là phương án đúng 3 có hai khả năng làm cho
học sinh lựa chọn phương án nhiễu D nhiều hơn hẳn so với phương án đúng là
thứ nhất do trong quá trình giảng dạy đã tạo nên sự nhầm lẫn nào chăng, thứ hai
là do học sinh không hiểu rõ yêu cầu của câu hỏi gây ra nhầm lẫn điều này cần
xem lại cách diễn đạt của câu trắc nghiệm. Như vậy đây là một câu không có độ
phân biệt thấp (0,11< 0,2) nên cần điều chỉnh phương án nhiễu D hay thay bằng
một câu khác
III.3. Xây dựng mô hình Rasch trên số liệu thực
III.3.1. Sự phù hợp của các câu hỏi
Run One: Hoa hoc 10
--------------------------------------------------------------------------
Item Fit 14/ 5/2004 20:29 all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------
INFIT
MNSQ .63 .71 .83 1.00 1.20 1.40 1.60
--------------+---------+---------+---------+---------+---------+---------
1 item 1 . *| .
2 item 2 . * | .
3 item 3 . | * .
4 item 4 . * | .
5 item 5 . * | .
6 item 6 . * | .
7 item 7 . |* .
8 item 8 . | * .
9 item 9 . *| .
10 item 10 . * .
11 item 11 . * .
12 item 12 . * | .
13 item 13 . | * .
14 item 14 . * | .
15 item 15 . * | .
16 item 16 . | * .
17 item 17 . * | .
18 item 18 . | * .
19 item 19 . |* .
20 item 20 . *| .
21 item 21 . | * .
22 item 22 . * .
23 item 23 . * | .
24 item 24 . |* .
25 item 25 . * | .
26 item 26 . | * .
27 item 27 . * | .
28 item 28 . |* .
29 item 29 . | * .
30 item 30 . * | .
Hình 1
Qua hình 1 ta thấy cả 30 câu hỏi trong bài trắc nghiệm thử mà chúng ta đã
làm thí nghiệm đều hợp lý, nằm trong ngưỡng cho phép của mô hình Rasch
III.3.2. Sự phù hợp của các thí sinh (Hình 2):
Run One: Hoa hoc 10
-------------------------------------------------------------------------
Case Fit In input Order 14/ 5/2004 20:29
all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------
INFIT
MNSQ .63 .71 .83 1.00 1.20 1.40 1.60
--------------+---------+---------+---------+---------+---------+-----+---
1 09 . | * .
2 18 . | * .
3 21 . * | .
4 23 * . | .
5 24 . * | .
6 35 . * | .
7 42 . *| .
8 45 . *| .
9 47 . | * .
10 55 . | * .
11 59 . | * .
12 65 . * | .
13 66 . | * .
14 74 . | * .
15 78 . * | .
16 79 . * | .
17 80 . * | .
18 84 . * | .
19 26 . * | .
20 98 . | * .
21 14 . * .
22 17 . * | .
23 22 * | .
24 28 . | * .
25 30 . | * .
26 34 . | * .
27 37 . | *.
28 50 . * | .
29 51 . * | .
30 54 . | .*
31 56 . | * .
32 57 . | . *
33 64 . | * .
34 69 . | * .
35 75 . | . *
36 76 . | . *
37 77 . | * .
38 81 . | * .
39 90 . | . *
40 99 . * .
41 02 . * | .
42 10 . * | .
43 12 * | .
44 16 . * | .
45 19 . * | .
46 20 . * | .
47 25 . * | .
48 31 . * | .
49 36 . | * .
50 41 . | * .
Qua hình 2 đa số thí sinh đều nằm trong ngưỡng cho phép chỉ có một số
trường hợp vựot khỏi giới hạn. Như vậy số liệu thực tế tương đối phù hợp với mô
hình Rasch
.
III.3.3. Phân bố khả năng trả lời đúng của thí sinh và độ đó của các câu hỏi
Run One: Hoa hoc 10
--------------------------------------------------------------------------------
Item Estimates (Thresholds) 14/ 5/2004 20:29
all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------------
4.0 |
|
X |
|
|
3.0 X |
|
|
2.0 | 25
|
|
XXX |
X |
| 23
X |
X | 13 20 27
1.0 X | 8 18
XXXXXXX |
XXX |
XXXXXX | 29
XXX | 3 9 19 26
XXXXXXXXXX | 5 16
XXXXXXXXXXX | 2 10 15
.0 XXXXXXX |
XXXXXXXX |
XXXXXX | 12 24
XXXXXX | 1 30
XXXXXXXXX | 22 28
XXXX | 21
X |
XX |
-1.0 XX |
X | 11
| 4
| 6
XXX | 14
| 17
|
X |
-2.0 |
|
X |
|
-3.0 |
--------------------------------------------------------------------------------
Each X represents 1 students
Hình 3
Mỗi dấu X đại diện cho một thí sinh tham gia làm trắc nghiệm. Qua hình
ta thấy lượng thí sinh tập trung ở mức độ năng lực trung bình tại O là lớn nhất,
chiếm số đông trong vùng từ - 1,0 đến + 1,0, số lượng câu khó ở mức độ trung
bình tương đối nhiều. Câu 25 là câu khó nhất vì có ít thí sinh làm đúng nhất và
câu 7 là câu dễ nhất vì hầu như ai cũng trả lời đúng. Do vậy, mô hình chung cho
thấy kết quả thu được là tương đối tốt.
III.3.4. Phân tích kết quả của từng câu hỏi một
Bảng 1
Run One: Hoa hoc 10
--------------------------------------------------------------------------
Item Estimates (Thresholds) In input Order 14/ 5/2004 20:29
all on hoa10 (N = 100 L = 30)
-------------------------------------------------------------------------
ITEM NAME |SCORE MAXSCR| THRSH | INFT OUTFT INFT OUTFT
| | 1 | MNSQ MNSQ t t
-------------------------------------------------------------------------
1 item 1 | 59 99 | -.34 | .99 1.24 -.2 1.4
| | .22|
| | |
2 item 2 | 42 87 | .15 | .92 .87 -1.3 -.8
| | .23|
| | |
3 item 3 | 37 91 | .46 | 1.22 1.20 2.8 1.2
| | .23|
| | |
4 item 4 | 77 99 | -1.27 | .85 .71 -1.1 -1.2
| | .25|
| | |
5 item 5 | 39 90 | .35 | .84 .78 -2.5 -1.5
| | .23|
| | |
6 item 6 | 76 96 | -1.35 | .95 1.20 -.3 .8
| | .26|
| | |
7 item 7 | 88 95 | -2.61 | 1.01 .87 .1 -.1
| | .40|
| | |
8 item 8 | 27 92 | .99 | 1.10 1.39 .9 1.9
| | .24|
| | |
9 item 9 | 42 98 | .40 | .99 .97 -.1 -.1
| | .22|
| | |
10 item 10 | 42 91 | .25 | 1.00 .95 .0 -.3
| | .22|
| | |
11 item 11 | 73 99 | -1.04 | 1.00 .89 .0 -.4
| | .24|
| | |
12 item 12 | 52 94 | -.18 | .89 .85 -1.7 -1.0
| | .22|
| | |
13 item 13 | 24 86 | 1.04 | 1.07 1.15 .6 .8
| | .26|
| | |
14 item 14 | 81 99 | -1.52 | .96 .98 -.2 .0
| | .27|
| | |
15 item 15 | 43 90 | .14 | .94 .90 -1.0 -.6
| | .22|
| | |
16 item 16 | 40 91 | .32 | 1.07 1.12 1.0 .8
| | .22|
| | |
17 item 17 | 82 100 | -1.55 | .95 1.05 -.2 .3
| | .27|
| | |
18 item 18 | 29 94 | .96 | 1.09 1.28 .9 1.5
| | .24|
| | |
==========================================================================
*****Output Continues****
Run One: Hoa hoc 10
--------------------------------------------------------------------------
Item Estimates (Thresholds) In input Order 14/ 5/2004 20:29
all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------
ITEM NAME |SCORE MAXSCR| THRSH | INFT OUTFT INFT OUTFT
| | 1 | MNSQ MNSQ t t
--------------------------------------------------------------------------
19 item 19 | 37 91 | .46 | 1.01 .95 .2 -.2
| | .23|
| | |
20 item 20 | 26 91 | 1.05 | .98 1.12 -.2 .7
| | .25|
| | |
21 item 21 | 60 93 | -.59 | 1.08 1.07 1.0 .4
| | .23|
| | |
22 item 22 | 58 94 | -.47 | 1.00 .95 .0 -.2
| | .22|
| | |
23 item 23 | 22 94 | 1.36 | .93 .82 -.4 -.8
| | .26|
| | |
24 item 24 | 54 96 | -.22 | 1.01 1.18 .2 1.1
| | .22|
| | |
25 item 25 | 13 89 | 1.98 | .88 .69 -.5 -1.0
| | .32|
| | |
26 item 26 | 40 97 | .44 | 1.13 1.24 1.8 1.5
| | .22|
| | |
27 item 27 | 28 96 | 1.02 | .93 .88 -.6 -.6
| | .24|
| | |
28 item 28 | 61 97 | -.50 | 1.02 1.00 .3 .0
| | .22|
| | |
29 item 29 | 33 89 | .61 | 1.09 1.05 1.1 .3
| | .23|
| | |
30 item 30 | 54 92 | -.36 | .95 .91 -.7 -.5
| | .22|
-------------------------------------------------------------------------
Mean | | .00 | 1.00 1.01 .0 .1
SD | | 1.01 | .09 .18 1.0 .9
==========================================================================
Bảng 1 cho thấy các đại lượng đặc trưng có liên quan đến một câu trắc nghiệm
bất kỳ: Score là số thí sinh làm đúng, Maxscr là tổng số thí sinh tham gia trả lời
câu hỏi, Infit và Outfit nhận các giá trị xấp xỉ 1 là kết quả tốt.
III.3.5. Khả năng trả lời của thí sinh đối với các câu hỏi. Xét một ví dụ cụ
thể sau:
------------------------------- K I D M A P----------------------------
Candidate: 09 ability: .68
group: all fit: 1.23
scale: all % score: 63.33
------------Harder Achieved ----------------------Harder Not Achieved ------
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
| |
25 | |
| |
| |
| |
| | 23(C)
..........................................
| |
20 13 8 | | 18(D) 27(C)
| |
|XXX|
29 | |
9 | | 3(B) 19(D) 26(B)
16 10 5 ...........................
2 | | 15(D)
| |
| | 12(D)
24 | | 1(D) 30(B)
28 22 | |
21 | |
| |
| |
11 | |
| |
4 | | 6(B)
| |
17 14 | |
| |
7 | |
| |
| |
| |
------------Easier Achieved ----------------------Easier Not Achieved ------
==========================================================================
ability: là năng lực của thí sinh
fit: sự phù hợp với mô hình Rasch .
% Score: Phần trăm trả lời đúng số câu của bài trắc nghiệm với thí sinh 09
này, năng lực là 0,69 sự phụ hợp với mô hình Rasch là 1,23, phần trăm số câu
làm đúng là 63,33% nghĩa là bài làm của thí sinh tương đối tốt.
Các đặc trưng cho sự trả lời của mỗi thí sinh đối với bài trắc nghiệm được
tổng kết ở bảng 2 dưới đây.
Run One: Hoa hoc 10
-------------------------------------------------------------------------
Case Estimates In input Order 14/5/2004 20:29
all on hoa10 (N = 100 L = 30)
--------------------------------------------------------------------------
NAME |SCORE MAXSCR | ESTIMATE ERROR | INFIT OUTFT INFTOUTFT
| | | MNSQ MNSQ t t
--------------------------------------------------------------------------
1 09 | 19 30 | .68 .41 | 1.23 1.27 1.42 .84
2 18 | 17 21 | 1.62 .60 | 1.13 .90 .47 .09
3 21 | 18 30 | .51 .41 | .95 .86 -.29 .37
4 23 | 13 29 | -.26 .41 | .72 .65 -1.88 1.28
5 24 | 13 26 | .02 .44 | .81 .73 -1.15 .84
6 35 | 16 30 | .19 .40 | .82 .74 -1.24 .90
7 42 | 10 30 | -.81 .43 | .98 .84 -.02 .38
8 45 | 22 30 | 1.22 .44 | .98 1.23 -.02 .64
9 47 | 15 30 | .03 .40 | 1.24 1.23 1.58 .85
10 55 | 16 29 | .27 .41 | 1.25 1.67 1.62 1.96
11 59 | 16 28 | .35 .42 | 1.03 .94 .27 .07
12 65 | 10 26 | -.56 .44 | .83 .75 -.91 .72
13 66 | 12 27 | -.22 .43 | 1.06 1.02 .43 .16
14 74 | 7 25 | -1.05 .49 | 1.09 1.13 .43 .44
15 78 | 7 30 | -1.41 .47 | .93 1.21 -.18 .60
16 79 | 10 28 | -.71 .44 | .89 .80 -.54 .53
17 80 | 12 30 | -.46 .41 | .97 .88 -.12 .31
18 84 | 13 29 | -.23 .41 | .87 .78 -.76 .73
19 26 | 15 30 | .03 .40 | .95 .90 -.32 .28
20 98 | 28 30 | 3.00 .75 | 1.18 1.91 .48 1.02
21 14 | 20 30 | .85 .42 | 1.01 .90 .11 .17
22 17 | 14 28 | -.03 .42 | .90 .85 -.61 .46
23 22 | 13 30 | -.29 .41 | .77 .69 -1.54 1.11
24 28 | 17 29 | .44 .41 | 1.16 1.19 1.06 .67
25 30 | 16 30 | .19 .40 | 1.09 1.10 .68 .43
26 34 | 12 29 | -.40 .42 | 1.25 1.24 1.43 .83
27 37 | 11 30 | -.63 .42 | 1.27 1.27 1.45 .90
28 50 | 12 30 | -.46 .41 | .93 .91 -.35 .21
29 51 | 16 30 | .19 .40 | .90 .81 -.69 .60
30 54 | 18 30 | .51 .41 | 1.32 1.31 2.00 1.00
31 56 | 10 29 | -.77 .43 | 1.14 1.12 .75 .46
32 57 | 12 30 | -.46 .41 | 1.41 1.41 2.20 1.33
33 64 | 13 20 | .45 .51 | 1.07 .93 .39 .03
34 69 | 16 25 | .59 .46 | 1.12 1.04 .72 .23
35 75 | 10 19 | .22 .50 | 1.64 1.90 3.08 2.26
36 76 | 12 17 | .79 .58 | 1.61 2.13 2.11 1.75
37 77 | 14 30 | -.13 .40 | 1.11 1.06 .75 .31
38 81 | 7 30 | -1.41 .47 | 1.04 1.21 .26 .58
39 90 | 13 29 | -.23 .41 | 1.36 1.54 2.07 1.68
40 99 | 29 30 | 3.76 1.03 | 1.00 .56 .31 .22
41 02 | 20 30 | .85 .42 | .94 .82 -.28 .39
42 10 | 19 30 | .68 .41 | .88 .78 -.74 .60
43 12 | 16 30 | .19 .40 | .77 .69 -1.66 1.11
44 16 | 11 24 | -.38 .45 | .92 .93 -.44 .14
45 19 | 17 30 | .35 .40 | .84 .76 -1.13 .75
46 20 | 17 30 | .35 .40 | .91 .83 -.58 .50
47 25 | 17 30 | .35 .40 | .88 .80 -.84 .61
48 31 | 17 30 | .35 .40 | .85 .84 -1.03 .46
49 36 | 14 30 | -.13 .40 | 1.11 1.11 .72 .48
50 41 | 16 30 | .19 .40 | 1.04 1.00 .34 .09
51 58 | 14 23 | .34 .47 | .96 .86 -.19 .30
52 71 | 16 30 | .19 .40 | .88 .80 -.85 .64
53 72 | 16 30 | .19 .40 | .88 .80 -.83 .64
54 73 | 20 30 | .85 .42 | .85 .75 -.90 .61
55 83 | 12 30 | -.46 .41 | .95 .95 -.24 .07
56 93 | 14 30 | -.13 .40 | .86 .84 -.91 .50
============================================================================
*****Output Continues****
Run One: Hoa hoc 10
---------------------------------------------------------------------------
Case Estimates In input Order 14/5/2004 20:29
all on hoa10 (N = 100 L = 30)
----------------------------------------------------------------------------
NAME |SCORE MAXSCR | ESTIMATE ERROR | INFIT OUTFT INFT OUTFT
| | | MNSQ MNSQ t t
----------------------------------------------------------------------------
57 95 | 11 30 | -.63 .42 | .97 .93 -.08 .13
58 96 | 13 30 | -.29 .41 | .97 .96 -.12 .06
59 97 | 12 30 | -.46 .41 | .99 .99 .02 .06
60 100 | 4 30 | -2.21 .58 | .96 1.28 .03 .60
61 01 | 24 30 | 1.64 .48 | .97 1.27 -.03 .64
62 04 | 23 30 | 1.42 .46 | 1.05 1.36 .31 .82
63 05 | 14 27 | .12 .43 | .85 .78 -.96 .65
64 15 | 23 29 | 1.56 .49 | 1.11 1.50 .48 .98
65 32 | 15 30 | .03 .40 | .95 .90 -.30 .26
66 33 | 15 30 | .03 .40 | .95 .90 -.28 .25
67 40 | 14 30 | -.13 .40 | .97 .92 -.12 .21
68 43 | 16 30 | .19 .40 | .97 .91 -.18 .21
69 44 | 13 30 | -.29 .41 | .93 .90 -.37 .26
70 48 | 14 30 | -.13 .40 | .93 .89 -.42 .32
71 49 | 13 30 | -.29 .41 | 1.12 1.31 .80 1.09
72 52 | 13 18 | .81 .56 | .81 .66 -.74 .55
73 53 | 8 17 | -.22 .54 | 1.27 1.26 1.22 .77
74 60 | 14 19 | .94 .56 | .80 .60 -.73 .66
75 62 | 13 18 | .74 .56 | .78 .64 -.86 .62
76 63 | 8 14 | .00 .59 | 1.13 1.11 .61 .40
77 67 | 12 30 | -.46 .41 | 1.27 1.43 1.53 1.37
78 70 | 7 10 | .41 .74 | .92 .75 -.12 .29
79 86 | 14 30 | -.13 .40 | 1.03 1.24 .23 .89
80 88 | 14 30 | -.13 .40 | 1.22 1.48 1.39 1.57
81 03 | 21 30 | 1.03 .43 | .97 1.06 -.13 .27
82 06 | 12 30 | -.46 .41 | .80 .72 -1.19 .96
83 07 | 15 30 | .03 .40 | 1.01 .98 .15 .01
84 08 | 20 30 | .85 .42 | .78 .65 -1.34 .97
85 11 | 18 30 | .51 .41 | .85 .77 -1.04 .67
86 13 | 16 30 | .19 .40 | .75 .76 -1.84 .80
87 27 | 20 30 | .85 .42 | .78 .65 -1.35 .97
88 29 | 16 29 | .30 .41 | .75 .75 -1.79 .80
89 38 | 13 28 | -.16 .42 | .74 .67 -1.69 1.14
90 39 | 17 30 | .35 .40 | .93 .96 -.44 .04
91 46 | 18 30 | .51 .41 | .92 .87 -.48 .34
92 61 | 12 30 | -.46 .41 | 1.07 1.02 .44 .17
93 68 | 11 30 | -.63 .42 | .83 .79 -.96 .63
94 82 | 9 30 | -1.00 .44 | 1.09 1.06 .46 .27
95 85 | 18 30 | .51 .41 | .93 .87 -.42 .93
97 89 | 7 30 | -1.41 .47 | 1.09 1.19 .42 .55
98 91 | 13 23 | .31 .45 | 1.16 1.20 1.03 .73
99 92 | 9 30 | -1.00 .44 | 1.06 1.07 .35 .30
100 94 | 5 30 | -1.91 .53 | 1.45 1.78 1.31 1.29
----------------------------------------------------------------------------
Mean | | .10 | 1.01 1.01 .00 .05
SD | | .84 | .18 .30 1.00 .76
============================================================================
Bảng 2
Trong đó Esimate là năng lực của thí sinh, error là độ khó của bài trắc
nghiệm
CHƯƠNG IV: KẾT LUẬN
IV. Khoa học đo lường và đánh giá trong giáo dục trên thế giới và nước ta.
IV.1. Trên thế giới, khoa học đo lường đã có một lịch sử ra đời (khoảng một thế
kỷ) và phát triển hết sức mạnh mẽ. ở Châu Âu và đặc biệt là Mỹ, lĩnh vực khoa
học này phát triển mạnh từ thời kỳ trước và sau chiến tranh thế giới thứ 2. Việc
chấm bài trắc nghiệm bằng máy của IBM năm 1935, việc thành lập NCME vào
thập niên 1950 và ra đời ETS (dịch vụ trắc nghiệm giáo dục) năm 1947 ngành
công nghiệp trắc nghiệm đã hình thành ở Mỹ. Từ đó đến nay khoa học về đo
lường tâm lý và giáo dục đã phát triển liên tục tự phê bình chỉ trích và tự điều
chỉnh phát triển ngày một mạnh mẽ hơn thường xuyên hơn. Tương ứng với ngành
công nghiệp trắc nghiệm đồ sộ và sự phát triển như vũ bão của ngành công nghệ
thông tin, lý thuyết về đo lường trong tâm lý trong giáo dục cũng phát triển rất
nhanh. Đặc biệt là với sự ra đời của thuyết ứng đáp câu hỏi đã đạt được những
thành tựu quan trọng nâng cao độ chính xác của phương phaps trắc nhiệm .Ngoài
ra ,trên những thành tựu của IRT và ngôn ngữ học máy tính công nghệ E- RATE
chấm tự động các bài luận tiếng anh nhờ máy tính của ETS đã được triển khai
nhờ mạng Internet trong năm vùa qua. Trong các kỳ thi tuyển sinh đại học mà
dựa vào kết quả của các kỳ thi do các công ty ngoài Nhà nước tổ chức để xét
tuyển. Có hai dịch vụ hỗ trợ TTĐH ở Hoa Kỳ là SAT (Scholastic Achievement
Test) do công ty ETS (Educational Testing Services) tổ chức, và ACT
(American College Test) do chương trình ACT American College Testing
Program triển khai.
Cả SAT và ACT thường tổ chức thi mỗi năm 4 lần, cho các học sinh ở
những năm cuối bậc phổ thông trung học. Hiện naz hàng năm có khoảng 1,8 triệu
thí sinh thi SAT và 1,6 triệu thí sinh thi ACT.
IV.1.2. Ở Việt Nam Chúng ta đã tổ chức một mùa tuyển sinh đại học bằng trắc
nghiệm khách quan và đạt được kết quả ngoài sức tưởng tượng. Ban đầu khi
chúng ta tiến hành kỳ thi thửa đầu tiên tại Đà Nẵng tưởng chừng như học sinh
không chấp nhận và gây nhiều dư luận cho xã hội, nhưng khi tiến hành chúng ta
làm song song cả đề thi tiểu luận và đề thi trắc nghiệm cho thí sinh lựa chọn. Kết
quả là có 70% số thí sinh tham dự đã chọn đề thi bằng trắc nghiệm khách quan là
con số ngoài dự đoán và mong đợi của những nhà tổ chức. Lý do mà các thí sinh
lựa chọn đề thi trắc nghiệm là việc chấm điểm bằng máy tính tạo sự tin tưởng và
độ chính xác điểm vì khi tự luận đôi khi điểm chấm phụ thuộc vào rất nhiều các
yếu tố chủ quan khác nhau. Rõ ràng tuy mới được đưa vào thử nghiệm đầu tiên
nhưng trắc nghiệm khách quan đã thể hiện được ưu thế vượt trội của mình so với
sử dụng phương pháp tự luận truyền thống. Và kết quả chúng ta đã lựa chọn
tương đối khách quan và chính xác những người có khả năng vào đại học, trường
hợp may rủi xảy ra là rất ít. Từ mùa thi tại Đà Nẵng 1996 đó tới nay chúng ta đã
mở rộng ra tại nhiều tỉnh và đã áp dụng thi tuyển bằng trắc nghiệm cả trong Nam
và ngoài Bắc. Đến nay phương pháp trắc nghiệm được dùng ngay trong kỳ kiểm
tra học kỳ về một số môi thi học kỳ trong đại học.
IV.3. Giải pháp về phướng phát triển khoa học đo lường trong giáo dục ở
nước ta
Chúng tôi xin đề xuất những phương hướng sau:
- Tất cả giáo chức của các trường đại học cần được bồi dưỡng những hiểu
biết sơ đẳng về khoa học này.
- Mọi trường đại học đều nên tổ chức bộ phận nghiên cứu triển khai để áp
dụng khoa học về đo lường trong giáo dục vào các hoạt động kiểm tra đánh giá
kết quả học tập của sinh viên, hoạt động giảng dạy và phục vụ của giáo chức và
viên chức.
- Các trường đại học và viện nghiên cứu chuyên về giáo dục cần đẩy mạnh
việc nghiên cứu về khoa học đo lường trong giáo dục để thấu hiểu nó, từ đó
hướng dẫn áp dụng nó trong toàn hệ thống giáo dục từ mâu giáo đến sau đại học.
- Tiếp đến, cần trước khai áp dụng khoa học đo lường trong giáo dục ra
mọi hoạt động xã hội bên ngoài hệ thống giáo dục, vì rằng trong lương lai, với sụ
phát triển của kinh tế xã hội, tất yếu việc áp dụng khoa học đó sẽ trở thành một
ngành công nghiệp lớn.
TÀI LIỆU THAM KHẢO
1. Lâm Quang Thiệp 2000 Đo lường và đánh giá chất lượng giáo dục
2. Lâm Quang Thiệp 1994. Những cơ sở của kỹ thuật trắc nghiệm. Bộ giáo
dục và đào tạo vụ đại học
3.Dương Thiệu Tống: Trắc nghiệm và đo lường thành quả học tập (Tập 1)
Trường ĐHTH Thành Phố Hồ Chí Minh xuất bản năm 1995
4. Dương Thiệu Tống: Trắc nghiệm và đo lường thành quả học tập (Tập 2)
Trường ĐHTH Thành Phố Hồ Chí Minh xuất bản năm 1995
5. Cơ sở của Kỹ thuật trắc nghiệm (Trích các bài giảng của P.Griffin- Vụ
Đại học, 19994)
6. Nguyễn Phụng Hoàng và Võ Ngọc Lan: Phương pháp trắc nghiệm trong
kiểm tra và đánh giá thành quả học tập NXBGD.1996
7. Trần Trọng Thuỷ, Khoa học Chẩn đoán Tâm lý,NXBGD,Hà Nội, 1994.
8. Thorndike,E.L.I trodution to the Thẻoy of Meantal and Social
Maesanure . New Yhork:Teacher College,Clumbia University,1904.
Các file đính kèm theo tài liệu này:
- Luận Văn- Tổng quan về phương pháp trắc nghiệm khách quan.pdf