Luận Văn
"Tổng quan về phương pháp trắc nghiệm khách quan"
Mở đầu
Để nâng cao chất lượng giáo dục ở các bậc học thì việc cải tiến hệ thống
kiểm tra, đánh giá kết quả của học sinh đóng vai trò hết sức quan trọng. Bên cạnh
việc sử dụng phương pháp truyền thống mà từ trước đến nay chúng ta vấn áp
dụng để kiểm tra bằng phương pháp tự luận, nhưng thực tế không phải lúc nào nó
cũng mang lại kết quả khả quan. Các phương pháp đánh giá kết quả học tập rất đa
dạng, mọi phương pháp đều có những ưu điểm, nhược điểm của nó, không có
phương pháp đều có những ưu, nhược điểm của nó, không có phương pháp nào là
hoàn mỹ với mọi mục tiêu giáo dục. Tuỳ theo mục tiêu cụ thể mà lựa chọn
phương pháp đánh giá cho thích hợp. Trên tinh thần hiện nay là chúng ta đang
học.
Nhiệm vụ khi nghiên cứu về đề tài này của chúng tôi là trước tiên xây dựng
được bộ các câu hỏi trắc nghiệm khách quan môn hoá lớp 10, thứ hai là thực hiện
thí điểm đề thi bằng trắc nghiệm khách quan và từ đó chúng tôi sẽ phân tích các
kết quả như tính độ khó, độ tin cậy … và cuối cùng tổng kết lại liệu phương pháp
này có đạt được mục tiêu giáo dục đề ra hay không.
Việc xây dựng bộ câu hỏi trắc nghiệm chỉ trong chương trình kiến thức lớp
dự định đề thi trong 30 phút và 1 đề thi sẽ gồm khoảng 30 câu. Phạm vi nghiên
cứu là học sinh lớp 10 chuyên hoá trường phổ thông trung học Hai Bà Trưng.
Phương pháp chúng tôi dùng khi nghiên cứu đề tài đó là phương pháp quan sát,
phương pháp điều tra, kiểm tra và cuối cùng là thống kê sau khi đã dùng trắc
nghiệm khách quan làm thí điểm trên học sinh. Chúng tôi nghĩ với sự chuẩn bị kỹ
lưỡng hệ thống các câu hỏi và việc thử nghiệm thành công thì sẽ khẳng định được
những ưu điểm của phương pháp trắc nghiệm khách quan là hoàn toàn có cơ sở
khoa học. Cấu trúc của khoá luận nghiên cứu của chúng tôi được cụ thể như sau:
-Mục lục
-Mở đầu
-Chương 1 Tổng quan về phương pháp trắc nghiệm khách quan
-Chương 2 các bước xây dựng bài kiểm tra bằng trắc nghiệm khách
quan
-Chương 3 Phân tích kết quả nghiên cứu đề tài
-Chương 4 :kết luận
10.Kế hoạch nghiên cứu
-Thảo luận nhóm phản biện về mục tiêu giáo dục, tiến trình và hình thức
hoạt động
-Chuẩn bị hệ thống câu hỏi và phân công nhiệm vụ trong nhóm
-Viết các câu hỏi dạng trắc nghiệm khách quan
-Phản biện câu hỏi trong nhóm (có điều chỉnh bổ sung)
-Chuẩn bị các dạng câu hỏi trắc nghiệm tương tương để thử nghiệm
bằng trắc nghiệm khách quan
8
I.2.1 Độ khó, độ phân biệt của một câu hoặc một bài trắc nghiệm 8
I.2.1.1 Độ khó của câu trắc nghiệm 8
I.2.1.2 Độ phân biệt của câu trắc nghiệm 9
I.2.2 Độ tin cậy và độ giá trị của một bài trắc nghiệm 10
I.2.2.1 Độ tin cậy của bài trắc nghiệm 10
I.2.2.2 Độ giá trị của bài trắc nghiệm 11
I.3 Các loại điểm trắc nghiệm 12
I.3.1 Điểm thô 12
I.3.2 Điểm tiêu chuẩn tuyệt đối 12
I.3.3 Điểm tương đối dựa vào phân bố chuẩn 13
I.3.4 Các loại điểm khác 14
I.3.4.1 Điểm trắc nghiệm tiêu chuẩn hoá của ETS 14
I.3.4.2 Điểm trắc nghiệm trí thông minh 14
I.3.5 Thang điểm được sử dụng ở nước ta 14
I.4 Lý thuyết ứng đáp câu hỏi và mô hình Rasch 14
I.4.1 Lý thuyết ứng dụng câu hỏi 14
I.4.1.1 Khái niệm chung về lý thuyết đáp ứng câu hỏi 14
I.4.1.2 Các thao tác tiến hành để xây dựng thuyết ứng đáp câu hỏi 15
I.4.2 Mô hình Rasch 16
I.4.2.1 Giả thiết của Rasch về việc ứng đáp câu hỏi 16
I.4.2.2 Hàm ứng đáp câu hỏi theo Rasch 16
I.4.2.3 Ứng dụng của mô hình Rasch 17
Chương II : các bước xây dựng bài kiểm tra bằng TNKQ
II.1 Các bước xây dựng một bài kiểm tra bằng TNKQ 18
II.1.1 Phân tích nội dung và phác thảo bài trắc nghiệm 18
II.1.2 Viết lại câu hỏi trắc nghiệm 19
II.1.3 Duyệt lại câu hỏi trắc nghiệm 19
47
IV.1.1.
Trên thế giới 47
IV.1.2. Nước ta 47
IV.2. Giải pháp về phát triển phương hướng khoa học đo lường ở nước
ta
48
Tài liệu tham khảo
Chương I : TỔNG QUAN VỀ PHƯƠNG PHÁP TRẮC NGHIỆM
KHÁCH QUAN
I.1. Đại cương về phương pháp trắc nghiệm khách quan
I.1.1.Phân loại các phương pháp trắc nghiệm
Trắc nghiệm là một phép lượng giá cụ thể mức độ khả năng thể hiện
hành vi trong lĩnh vực nào đó của một người cụ thể nào đó (thí
sinh).Phương pháp trắc nghiệm có thể được chia ra làm ba loại lớn:
loại quan sát, loại vấn đáp và loại viết được minh hoạ qua sơ đồ dưới
đây:
Đúng sai
Nhiều lựa
ch
ọ
nI.1.1.1. Phương pháp quan sát: Là phương pháp giúp các định những thái độ,
sự phản ứng vô ý thức, cách giải quyết vấn đề trong một tình huống đang được
nghiên cứu.
I.1.1.2.Phương pháp vấn đáp: Thường thích hợp với trẻ em, có lợi
khi nêu câu hỏi một cách tự phát trong một tình huống cần kiểm tra.
I.1.1.3.Phương pháp trắc nghiệm viết: Là phương pháp thường được sử
dụng nhiều nhất vì nó có một số ưu điểm cơ bản sau đây :
-Kiểm tra được nhiều học sinh trên một lần thi
-Cung cấp một bản ghi rõ ràng các câu trả lời của học sinh để dùng cho việc
chấm điểm.
-Dễ quản lý hơn vì bản thân người chấm không tham gioa vào bối cảnh
kiểm tra.
I.1.2.Các dạng câu hỏi trắc nghiệm khách quan
I.1.2.1.Câu mở (Open endecl): Loại câu này đòi hỏi học sinh phải nhớ lại
kiến thức hơn là nhận biết. Ví dụ: “Người vợ thứ ba của Henry VIII là ai ?”.
Hoặc có những câu có chỗ trống để điền vào hoặc có sự hướng dẫn để học sinh
cung cấp thông tin đáp ứng với câu dẫn như “Bên cạnh tên mỗi nước trong danh
mục này, hãy viết tên thủ đô nước đó”
I.1.2.2.Câu điền khuyết (Supply items): Học sinh phải nhớ lại kiến thức do
đó trả lời bằng một hay một số từ cho một câu hỏi trực tiếp hay một câu nhận
định chưa đầy đủ. Các loại câu này còn gọi là loại câu hỏi điền vào chỗ trống
(com pletion items).Ví dụ: Tên của một dụng cụ dùng để đo nhiệt độ là gì? Loại
câu hỏi này có ưu thế hơn các loại câu hỏi khách quan khác ở chỗ đòi hỏi học
tự luận không thể đánh giá một cách tuyệt đối là đúng hay là sai. Như vậy ưu
điểm của các câu hỏi khách quan so với dạng câu hỏi tự luận được thể hiện ở
bảng sau đây : Ưu thế thuộc về phương
pháp
Vấn đề
Trắc nghiệm Tự luận
Ít tốn công ra đề x
Đánh giá được khả năng diễn đạt, đặc biệt là diễn đạt
tư duy trừu tượng
x
Việc sáng tạo khi trả lời không bị hạn chế bởi một
khung câu hỏi sẵn
x
Đề thi phru kín nội dung môn học x
Ít may rủi do trung tủ, trật tủ x
Ít tốn công chấm thi x
Khách quan trong chấm thi x
Áp dụng được công nghệ mới trong việc nâng cao
chất lượng đề thi, giữ bí mật đề thi, hạn chế quay cóp
khi thi, hạn chế tiêu cực trong chấm thi và giúp phân
tích kết quả thi.
x
I.1.3.1.Câu hỏi trắc nghiệm khách quan đánh giá khách quan hơn các câu
hỏi tự luận
Bởi vì các câu hỏi khách quan có đáp án chính xác, rõ ràng nên việc chấm
Tuy nhiên chúng ta không được khẳng định phương pháp đánh giá nào có
ưu thế tuyệt đối so với phương pháp kia. Tuỳ vào điều kiện, yếu tố ảnh hưởng và
yêu cầu của mục tiêu giáo dục mà lựa chọn phương pháp kiểm tra thích hợp chứ
không phải là đo được cái cần đo, trong trường hợp đó thi bài trắc nghiệm có độ
tin cậy cao nhưng độ giá trị rất thấp.
I.2.Những yếu tố đặc trưng để đánh giá một bài kiểm tra hay bài
thi bằng trắc nghiệm khách quan.
I.2.1.Độ khó, độ phân biệt của một câu hoặc một bài trắc nghiệm.
1.1.Độ khó của câu trắc nghiệm.
Độ khó của câu trắc nghiệm thức được định nghĩa bằng tỷ số của tổng số
người trả lời đúng câu trắc nghiệm so với tổng số ngươì làm câu trắc nghiệm ấy.
Độ khó P của câu thứ i = Error!
Nếu độ khó có giá trị nằm trong khoảng 0,25 đến 0,75 thì câu trắc nghiệm
vừa sức với học sinh. Còn nếu giá trị độ khó xa số 0,25 và 0,75 thì câu trắc
nghiệm là quá khó hay quá dễ với thí sinh.
Khi chọn lựa các câu trắc nghiệm theo độ khó người ta thường phải loại
những câu quá khó (không ai làm đúng) hoặc quá dễ (ai cũng làm đúng). Một bài
trắc nghiệm tốt khi có nhiều câu ở độ khó trung bình.
Ví dụ một câu trắc nghiệm có 50 thí sinh tham gia trả lời thì có 30 thí sinh
trả lời đúng, vậy độ khó của câu trắc nghiệm đó sẽ là :
P = Error! = 0,6
Giá trị 0,6 nằm trong khoảng (0,25, 0,75) nên đây là câu trắc nghiệm vừa
sức với đối tượng dự thi.
I.2.Độ phân biệt của câu trắc nghiệm
Độ phân biệt của câu trắc nghiệm đo lường mức độ khác nhau giữa các đối
tượng khác nhau hay đo được năng lực làm bài giữa học sinh giỏi và học sinh
kém.
Để tính độ phân biệt của câu trắc nghiệm thường chúng sta làm theo phương
pháp cổ điển như sau: Trong một tập hợp thí sinh tham gia trả lời câu hỏi, dựa
trắc nghiệm bằng hệ số tương quan giữa hai bộ điểm của 2 nửa bài trắc nghiệm,
còn độ tin cậy của toàn bài trắc nghiệm thu được khi hiệu chỉnh việc tăng độ dài
gấp đôi. Sự phụ thuộc của độ tin cậy của bài trắc nghiệm vào độ dài của nó được
tính theo công thức tổng quát Spear man Baoun
P
n
= Error!
Trong đó R
s
là độ tin cậy của bài trắc nghiệm ngắn xuất phát R
n
là độ tin cậy
của bài trắc nghiệm có độ dài gấp n lần. Như vậy trong trường hợp bài trắc
nghiệm có độ dài gấp đôi, ta dùng công thức:
R = Error!
-Phương pháp Kuoler- Richardson- 20 để tính độ tin cậy bài trắc nghiệm :
R = Error! 1 -
2
pq
Trong đó: k - Số câu hỏi bài trắc nghiệm
p- Tỷ lệ trường hợp trả lời đúng cho 1 câu
q- Tỷ lệ trả lời sai cho một câu, q = 1-p
6
2
- Phương sai của tổng điểm mọi thí sinh đối với toàn bài TNo
Trong trường hợp độ khó của các câu không khác nhau nhiều, tính độ tin
loại điểm sau đây:
I.3.1.Điểm thô.
Một đề thi TNKQ thường bao gồm nhiều câu hỏi. Mỗi câu hỏi được gán một
điểm số nào đó, thường là điểm 1 nếu làm đúng, điểm 0 nếu làm sai. Cộng điểm
số của từng thí sinh lại được gọi là điểm thô (rav score)
I.3.2.Điểm tiêu chuẩn tuyệt đối:Là cách cho điểm thường được dùng thuộc
loại này là điểm phần trăm đúng. Điểm được tính theo tỷ lệ phần trăm số câu làm
đúng trên tổng số câu của bài trắc nghiệm
X = 100 x Error!
Ví dụ một thí sinh làm đúng 35 câu hỏi trong tổng số 50 câu hỏi thì điểm
tiêu chuẩn tuyệt đối của thí sinh đó là x = 100 Error! = 70. Tuy nhiên việc cho
điểm theo kiểu này thường rơi vào tình trạng tuỳ tiện, không có tính khách quan.
I.3.3.Điểm tương đối dựa vào phân bố điểm: Giả sử điểm thô thu được từ
kết quả trắc nghiệm trên một nhóm nào đó có phân bố tần suất gần với dạng phân
bố chuẩn với giá trị trung bình là Xt và độ lệch tiêu chuẩn là 6
s
thường thì người
ta sẽ biến đổi các điểm thô này sang một thang điểm với giá trị trung bình là X
s
và độ lệch chuẩn là 6
s
.Để thực hiện phép biến đổi này chúng ta phải dãn đường
cong phân bố chuẩn ứng với thang điểm thô sao cho độ lệch chuẩn của đường
cong đạt giá trị 6
s
, sau đó dịch chuyển đường cong thu được sao cho điểm gốc
của nó dịch chuyển đến vị trí giá trị trung bình X
s
Điểm t: -3 -2 -1 0 +1 +2 +3
0,1%
2,1%
13,6%
34,1%
34,1%
13,6%
2,1%
0,1%I.3.4.Các loại điểm khác.
I.3.4.1.Điểm trắc nghiệm tiêu chuẩn hoá của ETS
ETS (Edu cational testing Services - ETS) “Các dịch vụ trắc nghiệm giáo
dục” là công ty tư nhân lớn ở Hoa Kỳ, sản xuất các đề thi và tổ chức các đề thi
trắc nghiệm tiêu chuẩn hoá. Ví dụ như trắc nghiệm một số học sinh xác định; trắc
nghiệm tuyển sinh sau đại học ngành quản lý, trắc nghiệm ngoại ngữ tiếng Anh
(TOEFL…). Các trắc nghiệm này đều sử dụng cùng một loại thang điểm với giá
trị trung bình gán vào điểm 500, và độ lệch chuẩn 6 được chọn bằng 100 đơn vị
nguyên. Vậy thì khoảng (-36; +36) ứng với khoảng điểm (200, 800)
I.3.4.2.Điểm trắc nghiệm trí thông minh IQ (Intclligen Quotient)
Trắc nghiệm IQ sử dụng thang điểm với giá trị trung bình gán vào điểm 100,
độ lệch chuẩn được chọn là 15 đơn vị nguyên. Với cách quy định như vậy khoảng
làm bài trắc nghiệm. Điểm số đánh giá năng lực của thí sinh có thể thay đổi theo
thời gian do học thêm, quên bớt hay do các yếu tố khác.
+Giả định thứ hai là: có một hàm đặc trưng của câu hỏi phản ánh thực giữa
các biến không quan sát được (năng lực) và các biến quan sát được (việc trả lời
câu hỏi)
I.4.2.Các thao tác tiến hành để xây dựng thuyết ứng đáp câu hỏi.
Để xây dựng thuyết ứng đáp câu hỏi người ta công nhận 2 giả thuyết :
1-Việc trả lời của một thí sinh đối với một câu hỏi có thẻ dự báo bởi năng
lực của thí sinh.
2-Quan hệ giữa việc trả lời câu hỏi bởi thí sinh và năng lực làm cơ sở cho
việc trả lời đó có thể được mô tả bằng một hàm tăng đơn điệu được gọi là hàm
đặc trưng câu hỏi.
Với mô hình IRT, nó có thể chưa một hay nhiều tham số để mô tả câu hỏi cũng
như chưá một hay nhiều tham số để mô tả thí sinh. Vấn đề là để ứng dụng IRT
thì bước quan trọng đầu tiên là ước lượng các tham số đó của mô hình, thứ hai là
đánh giá sự phù hợp giữa mô hình và số liệu thực tế. Trong phạm vi sai số đo
lường, các giá trị ước lượng về năng lực thí sinh thì được từ nhiều bài trắc
nghiệm khác nhau sẽ như nhau, và các giá trị ước lượng về tham số câu hỏi thu
được từ các nhóm đánh giá khác nhau sẽ như nhau. Như vậy, thuyết IRT các
tham số của câu hỏi và năng lực thí sinh phải là bất biến. Tính bất biến đó thu
được bằng cách kết hợp thông tin về câu hỏi trong quá trình ước lượng năng lực
thí sinh và bằng cách kết hợp thông tin về năng lực thí sinh trong quá trình ước
lượng tham số của câu hỏi. Hình 3 trên minh hoạ đặc điểm đó. Các thí sinh có
cùng năng lực, dù ở nhóm đánh giá 1 hay 2 cũng có xác suất trả lời đúng câu hỏi
như nhau, vì xác suất để 1 thí sinh với năng lực đã biết trả lời đúng câu hỏi được
xác định bởi các tham số của câu hỏi, nên các tham số của câu hỏi cũng phải như
nhau trong 2 nhóm.Ngoài ra IRT còn có thể cho phép ước lượng các sai số chuẩn
của các giá trị ước lượng năng lực của mỗi thí sinh, chứ không phải là một ước
lượng sai số duy nhất cho mọi thí sinh như trong lý thuyết cổ điển.
Trên thế giới người ta đã soạn thảo nhiều phàn mềm máy tính để tính toán
các phép đo lường trong giáo dục dựa vào các mô hình được xây dựng bởi lý
thuyết ứng đáp câu hỏi như các phần mềm: Bigstep, pascal …
Việc nghiên cứu và áp dụng lý thuyết ứng đáp câu hỏi, đặc biệt là mô hình
Rasch trong những năm qua phát triển rất mạnh mẽ. Thực tế, để đơn giản chúng
ta đã hạn chế làm quen với sử dụng mô hình Rasch đối với mô hình các câu hỏi
lưỡng phân, tức là kết quả của việc trả lời câu hỏi chỉ là 0 hoặc 1. Người ta đã mở
rộng mô hình Rasch cho các loại mô hình câu hỏi với kiểu thang đo (rất không
đồng ý, không đồng ý, trung lập, đồng ý, rất đồng ý) và các loại thang đo khác
mà câu trả lời có nhiều mức phân cách khác nhau. Sự mở rộng này là rất quan
trọng, giúp hoàn thiện nhiều công cụ đo lường của nhiều loại trắc nghiệm và
nghiên cứu khác nhau.
Nhờ vậy việc ứng dụng lý thuyết ứng đáp câu hỏi và mô hình Rasch, người
ta có thể xây dựng ngân hàng câu hỏi trắc nghiệm chứa các câu hỏi được định cỡ
chính xác, từ đó lập các đề trắc nghiệm có khả năng đo lường năng lực với đodọ
chính xác rất cao. Nhờ vậy mà người ra có thể thiết kế các trắc nghiệm thích ứng
nhờ máy tính cho phép đo lường chính xác năng lực với một số lượng không lớn
các câu hỏi trắc nghiệm thích hợp.
Về việc nghiên cứu và áp dụng khoa học về đo lường trong tâm lý và giáo
dục, khoảng cách giữa nước ta với các nước tiên tiến trên thế giới về lĩnh vực này
còn quá xa. Để phát triển giáo dục và các khoa học liên quan đến tương tác với
con người, việc đầu tư vào nghiên cứu và vận dụng các khoa học nền tảng về tâm
lý và giáo dục, trong đó có khoa học về đo lường là một yêu cầu hết sức cấp
bách. Nhưng chúng ta hi vọng rằng trong tương lại khoảng cách này sẽ ngày một
ngắn lại nếu chúng ta biết tiếp thu và tận dụng các thành tựu khoa học công nghệ
mới của thời đại.
CHƯƠNG II: CÁCH TIẾN HÀNH THỰC NGHIỆM
viết hơn là các câu hỏi quan trọng sẽ làm méo mó quá trình đánh giá và do đó sẽ
đem lại những thông tin không phù hợp về nội dung chương trình đào tạo đến
học sinh, giáo viên và các cộng đồng xã hội xung quanh trường.
II.1.3.Duyệt lại câu hỏi
Việc soạn thảo các công việc đánh giá sử dụng trong các bài trắc nghiệm đòi
hỏi nhiều kỹ năng. Đôi khi câu hỏi có vẻ rõ ràng với người viết nhưng không phải
lúc nào cũng rõ ràng đối với người khác. Trước khi tiến hành thử nghiệm, các
công việc đánh giá cần phải được xem xét lại do một ban xét duyệt chuyên môn
đặt ra các câu hỏi như sau:
-Nhiệm vụ có rõ ràng đối với từng câu hỏi không ? liệu người được hỏi có
hiểu rõ những gì đang được mong đợi ở họ hay không ?