ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC
BÀI TẬP
PHÂN TÍCH ĐỀ THI VÀ KẾT QUẢ THI
Môn tiếng Anh kỳ thi tuyển sinh vào lớp 10
trường THPT chuyên Quang Trung – năm học 2010 - 2011
Môn học: Mô hình Rasch và Phân tích dữ liệu bằng phần mềm QUEST Giảng viên: TS Phạm Xuân Thanh
Học viên: Nguyễn Văn Nghiêm
Lớp Thạc sĩ Đo lường đánh giá
Khóa 3 (2010) TP. HCM
TP. Hồ Chí Minh, tháng 5/2011
Trang | 1
MỤC LỤC
Bộ dữ liệu là kết quả làm bài đề thi tuyển vào lớp 10 trường THPT
chuyên Quang Trung năm học 2010 – 2011 môn tiếng Anh với 50 câu hỏi trắc
nghiệm (dạng 4 lựa chọn) gồm 1625 thí sinh tham gia dự thi.
File dữ liệu có 54 biến gồm: mahs, mahuyen, matruong, gioi, Cau1, Cau2,
Cau3, Cau4, Cau5, Cau6, Cau7, Cau8, Cau9, Cau10, Cau11, Cau12, Cau13,
Cau14, Cau15, Cau16, Cau17, Cau18, Cau19, Cau20, Cau21, Cau22, Cau23,
Cau24, Cau25, Cau26, Cau27, Cau28, Cau29, Cau30, Cau31, Cau32, Cau33,
Cau34, Cau35, Cau36, Cau37, Cau38, Cau39, Cau40, Cau41, Cau42, Cau43,
Cau44, Cau45, Cau46, Cau47, Cau48, Cau49, Cau50. Trong đó mahs là mã số
thí sinh (case), mahuyen là mã huyện (nơi thí sinh cư trú), matruong là mã số
trường thí sinh học lớp 9, gioi là thông tin về giới tính (0 là nữ, 1 là nam) và các
biến từ Cau1 đến Cau50 là kết quả trả lời của 50 câu trắc nghiệm (item).
2. Mục đích, yêu cầu
Tiểu luận này vận dụng lý thuyết khảo thí cổ điển và lý thuyết khảo thí
hiện đại nhằm đánh giá câu hỏi thi. Qua đó có thể trả lời các câu hỏi nghiên cứu
như:
- Đề thi có phù hợp với năng lực của nhóm thí sinh dự thi hay không? Nếu
chưa phù hợp thì cần điều chỉnh như thế nào?
- Có câu hỏi nào trong đề không phù hợp và cần chỉnh sửa hay loại bỏ hay
không?
Những phân tích này là cơ sở để lựa chọn câu hỏi đạt chất lượng xây dựng
ngân hàng câu hỏi thi cho kỳ thi tuyển đầu vào trường THPT chuyên Quang
Trung. Đồng thời đưa ra khuyến cáo cho công tác viết câu hỏi trắc nghiệm trong
những lần ra đề sau này đạt chất lượng được tốt nhất.
3. Cấu trúc tiểu luận gồm 4 chương:
Chương 1. Tổng quan tiểu luận
Chương 2. Phân tích đề thi bằng lý thuyết cổ điển
Trang | 3
Chương 3. Phân tích đề thi bằng lý thuyết hiện đại
Chương 4. Kết luận
D
1
13.05
9.35
6.40
70.65
0.55
0.71
26
11.88
65.35
13.85
8.12
0.80
0.65
2
67.38
4.18
18.09
9.72
0.62
0.67
27
37.42
18.58
22.34
20.18
1.48
0.37
3
30.46
11.63
1.42
0.37
30
15.75
11.69
42.77
28.62
1.17
0.43
6
24.92
16.62
14.89
42.34
1.23
0.25
31
16.98
41.17
15.57
24.86
1.42
0.41
7
14.28
13.54
61.91
9.42
34
16.68
12.43
23.02
46.46
1.42
0.46
10
13.72
52.49
14.95
18.09
0.74
0.52
35
19.57
15.69
49.42
14.15
1.17
0.49
11
16.80
8.80
12.06
61.48
0.86
0.61
36
15.75
23.32
1.11
0.50
14
56.37
12.55
19.88
9.78
1.42
0.56
39
61.23
11.14
15.88
10.65
1.11
0.61
15
32.49
19.02
21.54
26.22
0.74
0.32
40
17.29
7.63
51.45
22.46
1.17
21.11
16.18
34.77
26.95
0.98
0.27
43
22.46
41.91
19.26
15.51
0.86
0.42
19
50.65
10.34
16.92
21.11
0.98
0.51
44
14.95
53.54
15.32
15.38
0.80
0.54
20
4.86
3.57
1.48
0.37
47
24.31
25.97
35.94
12.43
1.35
0.36
23
11.88
60.62
12.49
13.97
1.05
0.61
48
9.42
43.57
24.98
21.42
0.62
0.44
24
51.69
32.00
7.57
8.25
0.49
0.52
<0.45
<0.4
<0.3
<0.2
Số câu
1
2
4
9
41
39
29
23
15
2
0
(%)
2.0
4.0
8.0
18.0
82.0
78.0
58.0
46.0
30.0
4.0
0.0
Bảng 1.1. Thống kê phân bổ độ khó
Trang | 5
(1 – 0.6)/(4-1) x 100% = 13.33 % cho mỗi phương án. Cùng với cách tính này ở
đây ta xác định mồi nhử kém khi tỷ lệ lựa chọn nhỏ hơn 50% tỷ lệ mong muốn.
Từ dữ liệu thống kê được ta thấy bài test có đến 6 câu xuất hiện mồi nhử
kém (gồm các câu: 2, 3, 24, 33, 37, 40).
Ở bảng 2 dưới đây, khi so sánh các phương án sai giữa nhóm trên gồm
những thí sinh có kết quả điểm toàn bài thi cao nhất chiếm 27% tổng số thí sinh
(Nh. trên) với nhóm dưới gồm những thí sinh có kết quả điểm toàn bài thi thấp
nhất chiếm 27% tổng số thí sinh (Nh. dưới) cho thấy có 22 câu có độ lệch rất
thấp (trong khoảng ±0.1). Điều này cho thấy các phương án sai này không có
hiệu quả đối với cả 2 nhóm có năng lực khác nhau.
Độ lệch của các phương án là đáp án của đề thi tương đối tốt. Có 46 câu
(92%) có độ lệch đáp án >0.2, trong đó có 13 câu có độ lệch đáp án >0.5. Có 2
câu có độ lệch đáp án <0 cần phải loại bỏ hoặc chỉnh sửa, đó là câu 6 và câu 18.
Trong 22 câu có độ lệch trong khoảng ± 0.1 thì có 19 câu là câu có mồi
nhử kém đã được tính ở trên (gồm các câu: 1, 7, 8, 12, 13, 14, 15, 16, 18, 19, 20,
21, 28, 29, 30, 31, 38, 41, 48) (chiếm 38% số câu trong đề thi). Điều này có
nghĩa là cả nhóm trên và nhóm dưới đều rất ít thí sinh chọn, cho thấy những mồi
nhử ấy thật sự là mồi nhử kém.
Nhận xét: Chất lượng của các phương án sai (mồi nhử) không cao vì cả
học sinh kém và học sinh giỏi đều có tỷ lệ trả lời sai gần nhau. Có nhiều câu cả
nhóm trên và nhóm dưới đều rất ít thí sinh chọn, cho thấy những mồi nhử ấy thật
sự là mồi nhử kém, nhất định phải chỉnh sửa mồi nhử trước khi đưa vào ngân
hàng câu hỏi hoặc có thể loại bỏ.
P.án
A
B
C
D
Câu
N.Trên
Câu
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
2.
0.90
0.53
0.37
0.01
0.05
-0.05
0.05
0.24
-0.19
0.04
0.16
-0.13
3.
0.06
0.07
-0.01
0.33
-0.12
0.03
0.19
-0.15
6.
0.11
0.31
-0.19
0.06
0.22
-0.15
0.05
0.25
-0.19
0.76
0.21
0.55
7.
0.06
0.23
-0.17
0.02
0.23
-0.21
0.87
0.38
0.49
0.05
0.14
-0.17
0.79
0.30
0.49
0.07
0.24
-0.17
0.09
0.23
-0.15
11.
0.06
0.27
-0.21
0.02
0.14
-0.12
0.06
0.16
-0.10
0.85
0.41
0.45
12.
0.21
0.22
-0.01
0.15
0.27
-0.12
0.63
0.23
15.
0.90
0.53
0.37
0.01
0.05
-0.05
0.05
0.24
-0.19
0.04
0.16
-0.13
16.
0.06
0.07
-0.01
0.08
0.23
-0.15
0.77
0.36
0.41
0.08
0.32
-0.24
17.
0.76
-0.15
0.05
0.25
-0.19
0.76
0.21
0.55
20.
0.06
0.23
-0.17
0.02
0.23
-0.21
0.87
0.38
0.49
0.05
0.14
-0.10
21.
0.63
0.26
0.37
0.16
0.25
-0.09
0.10
0.19
-0.08
0.06
0.27
-0.21
0.02
0.14
-0.12
0.06
0.16
-0.10
0.85
0.41
0.45
25.
0.21
0.22
-0.01
0.15
0.27
-0.12
0.56
0.22
0.34
0.08
0.25
-0.18
26.
0.03
0.20
-0.17
0.81
-0.08
0.17
0.31
-0.14
29.
0.15
0.25
-0.10
0.26
0.24
0.02
0.45
0.21
0.23
0.14
0.28
-0.14
30.
0.08
0.22
-0.14
0.76
0.27
0.49
0.12
0.32
-0.20
0.04
0.18
-0.14
0.03
0.05
-0.02
0.02
0.08
-0.06
0.94
0.76
0.18
34.
0.12
0.26
-0.14
0.10
0.19
-0.09
0.67
0.30
0.37
0.10
0.23
-0.13
35.
0.07
0.30
-0.23
0.05
0.20
-0.15
0.17
-0.07
38.
0.10
0.25
-0.14
0.75
0.24
0.51
0.09
0.26
-0.16
0.05
0.24
-0.19
39.
0.05
0.19
-0.14
0.88
0.44
0.44
0.05
0.21
-0.15
0.02
0.15
-0.13
40.
0.68
0.17
0.03
0.17
-0.15
0.76
0.29
0.46
43.
0.13
0.19
-0.06
0.05
0.17
-0.12
0.44
0.33
0.11
0.38
0.29
0.09
Trang | 8
P.án
A
B
C
D
Câu
N.Trên
N.Dưới
Lệch
N.Trên
0.46
0.03
0.18
-0.14
46.
0.02
0.12
-0.10
0.82
0.23
0.60
0.09
0.34
-0.25
0.07
0.30
-0.23
47.
0.06
0.26
-0.20
0.03
0.23
-0.21
0.10
0.29
-0.19
0.81
0.21
0.61
0.13
0.32
-0.19
0.64
0.18
0.47
0.04
0.15
-0.10
Bảng 2. Độ lệch giữa nhóm trên và nhóm dưới.
>0.7
>0.6
>=0.5
>0.4
>0.3
>0.2
>0.1
>0
<0
Số câu
0
2
13
37
44
46
48
48
2
Độ PB
Câu hỏi
Độ PB
1
0.23
11
0.45
21
0.37
31
0.37
41
0.43
2
0.37
12
0.34
22
0.54
32
0.46
42
0.52
3
0.41
13
0.41
23
0.51
33
0.60
46
0.46
7
0.49
17
0.49
27
0.51
37
0.47
47
0.41
8
0.37
18
-0.13
28
0.38
38
0.40
48
0.52
9
0.48
19
0.37
29
0.46
39
44
6
-0.19
0.42
0.61
Tỷ lệ (%)
0
4
26
74
88
12
Bảng 3.1. Thống kê phân bổ độ phân biệt
Từ số liệu thống kê trên cho thấy các câu hỏi đều có độ phân biệt trung
bình là 0.42 rải từ -0.19 đến 0.61. Có 37 câu (chiếm 74%) đạt độ phân biệt từ 0.4
trở lên, 44 câu có độ phân biệt từ 0.30 trở lên (chiếm 88%) điều này cho thấy đề
thi có độ phân biệt rất tốt. Các câu có độ phân biệt chưa tốt (< 0.25) gồm 6 câu:
1, 6, 16, 18, 20, 30 trong đó có hai câu có độ phân biệt < 0 là câu 6, và câu 18
(cũng là 2 câu nhầm đáp án).
Nhận xét: Có 88% số câu hỏi đạt độ phân biệt trong khoảng chấp nhận
được (từ 0.25 đến 0.75) Số câu đạt độ phân biệt ở mức rất tốt chiếm 74% đề thi,
chứng tỏ độ phân biệt của đề thi là rất tốt. Tuy nhiên cần chỉnh sửa một số câu
có độ phân biệt chưa tốt như câu 1, 6, 16, 18, 20, 30.
5. Hệ số tương quan giữa điểm của câu hỏi thi với điểm toàn bài thi
Giữa kết quả điểm của từng câu hỏi thi với điểm chung của toàn bài thi
phải có mối tương quan thuận (hệ số tương quan dương). Mối tương quan chặt
chẽ giữa câu hỏi thi và toàn bài thi góp phần làm tăng độ tin cậy của bài test.
Cần giữ lại những câu hỏi thi có mối tương quan cao và loại bỏ những câu hỏi
có mối tương quan thấp hoặc dưới 0 để làm tăng độ tin cậy của đề thi. Theo
Griffin (1998), những câu hỏi tốt là những câu hỏi có hệ số tương (Pt-Biserial)
0.40
2
0.35
12
0.31
22
0.48
32
0.42
42
0.47
3
0.34
13
0.35
23
0.42
33
0.48
43
0.40
4
0.38
14
0.35
24
0.43
34
0.47
44
0.38
8
0.38
18
-0.13
28
0.30
38
0.34
48
0.43
Trang | 10
9
0.38
19
0.34
29
0.36
39
0.37
49
0.44
10
0.37
20
0.18
30
0.05
40
0.43
kém và học sinh giỏi đều có tỷ lệ trả lời sai gần nhau. Các câu: 1, 7, 8, 12, 13,
14, 15, 16, 18, 19, 20, 21, 28, 29, 30, 31, 38, 41, 48, cả nhóm trên và nhóm dưới
đều rất ít thí sinh chọn (trong đó các câu 12, 15, 16, 18, 37, 41, 47 là những câu
có độ khó p<0.4) cho thấy những mồi nhử của các câu này thật sự là mồi nhử
Trang | 11
kém, cần phải chỉnh sửa mồi nhử trước khi đưa vào ngân hàng câu hỏi hoặc có
thể loại bỏ.
4. Có 88% số câu hỏi đạt độ phân biệt trong khoảng chấp nhận được (từ
0.25 đến 0.75) Số câu đạt độ phân biệt ở mức rất tốt chiếm 74% đề thi, chứng tỏ
độ phân biệt của đề thi là rất tốt. Tuy nhiên cần chỉnh sửa một số câu có độ phân
biệt chưa tốt như câu 1, 6, 16, 18, 20, 30.
5. Có 86% số câu hỏi đạt hệ số tương quan đạt trên 0.3 chứng tỏ các câu
hỏi có mối tương quan thuận và khá mạnh với điểm chung của bài thi. Riêng 2
câu có hệ số tương quan < 0 (tương quan nghịch với điểm toàn bài thi) cần phải
loại bỏ đó là câu 6 và câu 18.
Trang | 12
Chương 3. Xử lý số liệu và phân tích đề thi bằng lý thuyết hiện đại
Việc phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại cũng có thể đưa
ra những thông tin thống kê để phân tích câu hỏi thi như lý thuyết khảo thí cổ
điển. Tuy nhiên, việc phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại (sử
dụng phần mêm QUEST và các phần mềm chuyên dụng khác) còn có thể giúp
có được những thông tin đầy đủ hơn về đề thi và các câu hỏi thi. Để phân tích và
đánh giá đề thi này tác giả sẽ phân tích các chỉ số sau:
- Infit MNSQ
- Disc.
- Count
- Percent (%)
- Pt-Biserial
- P-value
Mean 46 Mean 20
SD 4.16 SD 3.29
0 items with zero scores
0 items with perfect scores
Trang | 13
1.2. Mức độ phù hợp của các câu hỏi với nhau
Trong biểu đồ Item Fit sau đây, mỗi câu trắc nghiệm biểu thị bằng dấu *.
Những câu trắc nghiệm nằm trong hai đường chấm thẳng đứng có giá trị trung
bình bình phương độ phù hợp INFIT MNSQ nằm trong khoảng (0.77;1.30) sẽ
phù hợp với mô hình Rasch. Nếu câu trắc nghiệm nào không phù hợp thì loại
bỏ.
Trong biểu đồ dưới đây ta thấy câu 6 và câu 18 có chỉ số phù hợp (INFIT
MNSQ) nằm ngoài vùng cho phép, cần loại bỏ.
INFIT
MNSQ .63 .67 .71 .77 .83 .91 1.00 1.10 1.20 1.30 1.40 1.50
1.60
+ + + + + + + + + + + +
1 item 1 . | * .
2 item 2 . * | .
3 item 3 . | * .
4 item 4 . * | .
5 item 5 . * | .
6 item 6 . | . *
7 item 7 . * | .
8 item 8 . *| .
9 item 9 . * | .
40 item 40 . * | .
41 item 41 . * | .
42 item 42 . * | .
43 item 43 . * | .
44 item 44 . * | .
45 item 45 . * | .
46 item 46 . * | .
47 item 47 . * .
48 item 48 . * | .
49 item 49 . * | .
50 item 50 . * | .
Sau khi loại bỏ câu 6 và 18, dùng phần mềm Quest chạy lại thì xuất
hiện thêm câu 30 có chỉ số INFIT MNSQ = 1.33, ngoài khoảng cho phép
nên ta tiếp tục bỏ câu 30 và chạy dữ liệu lại lần thứ 3.
Sau khi loại bỏ câu 6, 18 và 30 ta còn 47 câu có chỉ số phù hợp
(INFIT MNSQ) nằm trong vùng cho phép theo mô hình Rasch được thể hiện ở
biểu đồ sau:
Trang | 14 INFIT
MNSQ .63 .67 .71 .77 .83 .91 1.00 1.10 1.20 1.30 1.40 1.50
1.60
+ + + + + + + + + + + +
1 item 1 . | * .
2 item 2 . *| .
3 item 3 . | * .
4 item 4 . * .
5 item 5 . *| .
39 item 39 . *| .
40 item 40 . * | .
41 item 41 . * .
42 item 42 . * | .
43 item 43 . * .
44 item 44 . * .
45 item 45 . * .
46 item 46 . * .
47 item 47 . | * .
48 item 48 . * | .
49 item 49 . * | .
50 item 50 . * | . Câu
INFIT
MNSQ
Câu
INFIT
MNSQ
Câu
INFIT
MNSQ
Câu
INFIT
MNSQ
Câu
INFIT
MNSQ
1
1.00
14
1.03
24
0.96
34
0.92
44
1.00
5
0.99
15
0.96
25
0.98
35
0.93
45
1.00
6
Bỏ
16
1.13
26
0.99
36
0.89
46
1.00
7
1.01
20
1.01
30
Bỏ
40
0.96
50
0.97
Bảng 5. Chỉ số Infit MNSQ
2. Phân bố độ khó câu hỏi thi và năng lực thí sinh
Sơ đồ phân bố độ khó câu hỏi thi và năng lực thí sinh cho thấy mức độ
phù hợp của đề thi đối với thí sinh dự thi. Kết quả xử lý bằng phần mềm QUEST
cho một bản đồ phân bố năng lực học sinh và độ khó câu hỏi thi.
Các thông tin về kết quả tính toán từ bảng Summary of case Estimates cho
thấy năng lực trung bình của mẫu thí sinh (case) tham gia bài kiểm tra (-0.02)
Trang | 15
nhỏ hơn và gần bằng so với độ khó chung của bài kiểm tra (0.00) cho thấy độ
khó của đề thi tương đối phù hợp với năng lực thí sinh.
Sử dụng lý thuyết khảo thí hiện đại, năng lực của học sinh và độ khó của
câu hỏi được đánh giá bằng thang logistic. Theo sơ đồ trên, các câu hỏi có độ
khó từ - 2.20 đến 0.92 (thang logistic). Trong khi đó, năng lực của thí sinh phân
bố từ -2.26 đến 3.96 với trung bình cộng là -0.02 và độ lệch chuẩn 0.97. Điều
này đòi hỏi phải có thêm một số câu khó hơn để đo được toàn bộ năng lực của
học sinh với những mức năng lực khác nhau.
Bảng số liệu tính toán trên thí sinh tham gia:
Summary of case Estimates
=========================
Mean 02
SD .97
XX |
|
|
XX |
|
XX |
|
2.0 XX |
XX |
XX |
XXXXX |
XXX |
XXX |
XXX |
XXX |
1.0 XXXX | 16
XXXXX | 15
XXX | 41 50
XXXXXXXX | 5 12 22 27 37 47
XXXXX | 8 32 42
XXXXX | 28 31 36 43 45 49
XXXXXXXXXXXXXX | 25 48
.0 XXXXXXXX | 17 21 33 34
XXXXXXXXXXXXXXXX | 19 35 38 40
XXXXXXXXXX | 4 9 10 24 29 44
XXXXXXXXXXX | 3 14 46
XXXXXXXXXXXXXXXXXXXXX |
XXXXXXXXXXX | 7 11 13 23 39
XXXXXXXXXX |
Trang | 16
Độ phân biệt Disc.
Count
Percent (%)
Pt-Biserial
4 chỉ số cần được phân tích tiếp là:
P-value
Mean ability
Thresholds
Error.
P-value: là giá trị thống kê cho biết hệ số tương quan (Point Biserial) tính
toán được là có ý nghĩa thống kê ở mức nào, thông thường phải nhỏ hơn hoặc
bằng 0.05 (có ý nghĩa thống kê ở mức α = 0.05).
Trong số 50 câu hỏi được phân tích trên đều có p-value đạt yêu cầu, ở
những phương án là đáp án có ý nghĩa thống kê rất cao ở mức p-value = 0.000.
Điều này cho thấy hệ số tương quan tính được giữa câu hỏi thi và điểm thi của
toàn bài có ý nghĩa thống kê cao.
Trang | 17
Mean ability: Trung bình năng lực của những thí sinh đưa ra sự lựa chọn
của mình cho từng phương án trả lời. Phương án trả lời đúng phải có Mean
ability cao hơn các phương án trả lời sai, các phương án trả lời sai (mồi nhử)
thường có Mean Ability âm . Yêu cầu này đều đạt được ở tất cả các câu hỏi khi
đã loại bỏ các câu 6, 18 và 30.
Thresholds: Là ngưỡng năng lực yêu cầu (theo thang logistic) để trả lời
đúng câu hỏi đang phân tích. Với 47 câu hỏi này ta thấy chỉ số thresholds rải từ
-2.20 đến 0.92 trong khi đó ngưỡng năng lực của thí sinh phân bố từ -2.26 đến
3.96 cho thấy đề thi này không có những câu hỏi đủ khó để đánh giá thí sinh có
ngưỡng năng lực từ trên 0.92 đồng thời thiếu những câu hỏi đủ dễ để đánh giá
thí sinh có ngưỡng năng lực từ -1.09 trở xuống.
Error: là sai số tính toán, thông số này cho thấy độ tin cậy của số liệu tính
được cho từng câu hỏi, thông thường nhỏ hơn 0.2. Yêu cầu này đều đạt được ở
xử lý dữ liệu.
Item 30: item 30 Infit MNSQ = 1.33
Disc = .05
Categories - A B C* D missing
Count 16 256 190 695 465 3
Percent (%) 1.0 15.8 11.7 42.8 28.7
Pt-Biserial 07 07 15 .05 .13
p-value .001 .003 .000 .028 .000
Mean Ability 72 17 40 .02 .18 20
Trang | 18
Step Labels 1
Thresholds .27
Error .06 Câu 20 (trích file 3-thiTS.ita xử lý lần 3): Tỷ lệ chọn đúng cao (87.5%), ngưỡng
năng lực thresholds thấp (-2.20), mean ability = 0.04 cho thấy câu hỏi này quá
dễ tuy nhiên theo quan điểm của thuyết khảo thí hiện đại thì 2 câu này không
cần thiết phải loại bỏ.
Item 20: item 20 Infit MNSQ = 1.01
Disc = .18
Categories - A B C D* missing
Thresholds .92
Error .06 4. Khảo sát các câu hỏi có tính định kiến, thiên vị
Trong quá trình soạn câu hỏi thi, có thể có những câu hỏi khá dễ đối với
nhóm thí sinh này nhưng lại khó đối với nhóm thí sinh khác. Đó là các câu hỏi
có tính định kiến, thiên vị (biased). Nguyên nhân có thể do người soạn câu hỏi
thi dùng các từ ngữ địa phương, những từ ngữ không phổ biến, những kiến thức
không phổ thông, những kiến thức mà nhiều vùng học sinh không được học.
Một đề thi có chất lượng tốt phải không có các câu hỏi có tính định kiến, thiên
vị.
Trang | 19
Dữ liệu phân tích có 1625 thí sinh tham gia dự thi thuộc 11 huyện thị, các
huyện thị có mã số 7, 8, 8, 10, 11 là các trường thuộc thị trấn, thị xã gọi là nhóm
thành thị (tt) gồm 761 thí sinh; những huyện có mã số 1, 2, 3, 4, 5, 6 là những
huyện không thuộc thị trấn, thị xã và được gọi là vùng nông thôn (nt) gồm 864
thí sinh.
Trong đề thi này, câu 28 nằm ngoài vùng ±2 là câu hỏi định kiến, thiên vị
đối với 2 nhóm thí sinh tham gia kỳ thi: 1) nhóm nông thôn (nt) và 2) nhóm thị
xã (tt).
Từ biểu đồ ta thấy các câu hỏi phân bổ khá đồng đều cho cả 2 nhóm.
Riêng câu 28 dễ đối với nhóm thí sinh thành thị nhưng lại quá khó đối với nhóm
nông thôn, câu này cần phải loại bỏ hoặc điều chỉnh.
Biểu đồ phân bổ câu hỏi theo sự khác biệt giữa 2 nhóm thí sinh
THI TS 2010
Comparison of Item estimates for groups nt and tt on the thits scale
item 22 . | * .
item 23 . *| .
item 24 . | * .
item 25 . * | .
item 26 . * | .
item 27 . | * .
item 28 . | . *
item 29 . * | .
item 30 . | * .
item 31 . | * .
item 32 . | * .
item 33 . | * .
item 34 . * | .
item 35 . | * .
item 36 . * | .
item 37 . | * .
item 38 . * | .
item 39 . * | .
item 40 . * | .
item 41 . | * .
item 42 . * | .
item 43 . * | .
item 44 . * | .
item 45 . * | .
item 46 . * | .
item 47 . | * .
item 48 . | * .
item 49 . * | .
item 50 . | * .
item 15 . | * .
item 16 . * | .
item 17 . | * .
item 18 . |* .
item 19 . | * .
item 20 . * | .
item 21 . *| .
item 22 . | * .
item 23 . * .
item 24 . | * .
item 25 . * | .
item 26 . * | .
item 27 . | * .
item 29 . * | .
item 30 . | * .
item 31 . | * .
item 32 . | * .
item 33 . | * .
item 34 . * | .
item 35 . | * .
item 36 . * | .
item 37 . | * .
item 38 . * | .
item 39 . * | .
item 40 . * | .
item 41 . | * .
item 42 . *| .
item 43 . * | .
item 44 . * | .
item 45 . * | .
qua đó có thể chỉnh sửa và lựa chọn các câu hỏi tốt để đưa vào ngân hàng câu
hỏi thi. Đây là thao tác cần thiết và quan trọng để lựa chọn câu hỏi xây dựng
ngân hàng câu hỏi.
Ưu điểm:
Chất lượng đề thi tương đối tốt, phần lớn câu hỏi phù hợp với năng lực
của thí sinh.
Đề thi có độ tin cậy cao.
Độ phân biệt của đề thi tương đối tốt.
Các câu hỏi trong đề có độ phù hợp cao.
Phân bổ câu hỏi tương đối đồng đều giữa 2 nhóm thành thị và nông thôn.
Hạn chế:
Có 2 câu nhầm đáp án. Trường hợp này cần đặc biệt lưu ý để rút kinh
nghiệm cho công tác viết câu hỏi thi.
Đề thi thiếu những câu hỏi khó để phân biệt được giữa những thí sinh có
năng lực khá với học sinh giỏi (những học sinh có mức năng lực từ 0.92
trở lên theo thang logistic). Đồng thời cũng thiếu những câu hỏi dễ để
đánh giá những thí sinh có năng lực thấp từ -1.09 trở xuống.
Chất lượng của các phương án sai (hay mồi nhử) không cao vì ít thu hút
thí sinh hoặc học sinh kém và học sinh giỏi đều có tỷ lệ trả lời sai gần
nhau.
Câu 6, 18 và 30 không chấp nhận được cần được loại bỏ do ngoại lai. Câu
03 là câu quá thiên vị; câu 20 là câu quá dễ, câu 28 là câu có tính định
kiến-thiên vị cũng cần loại bỏ hoặc xem xét lại.
Trang | 23
Trong quá trình viết câu hỏi trắc nghiệm và trong quá trình tổ hợp lại
thành đề thi, xây dựng ngân hàng câu hỏi cần phải lưu ý đến chất lượng phương
án sai (mồi nhử) vì điều này tăng khả năng đoán mò hoặc dùng phương pháp
loại trừ khi làm bài của học sinh, do đó chất lượng câu hỏi thi và đề thi không
cau3 cau4 cau5 cau6 cau7 cau8 cau9 cau10 cau11 cau12 cau13
cau14 cau15 cau16 cau17 cau18 cau19 cau20 cau21 cau22
cau23 cau24 cau25 cau26 cau27 cau28 cau29 cau30 cau31
cau32 cau33 cau34 cau35 cau36 cau37 cau38 cau39 cau40
cau41 cau42 cau43 cau44 cau45 cau46 cau47 cau48 cau49
cau50(50a1).
execute.
Phụ lục 2. Lệnh tạo file dữ liệu data_diem.dat cho SPSS:
write outfile='D:\data_diem.dat'/
mahs(a8) mahuyen(a3) matruong(a2) gioi (f2) Cau1 Cau2
Cau3 Cau4 Cau5 Cau6 Cau7 Cau8 Cau9 Cau10 Cau11 Cau12 Cau13
Cau14 Cau15 Cau16 Cau17 Cau18 Cau19 Cau20 Cau21 Cau22
Cau23 Cau24 Cau25 Cau26 Cau27 Cau28 Cau29 Cau30 Cau31
Cau32 Cau33 Cau34 Cau35 Cau36 Cau37 Cau38 Cau39 Cau40
Cau41 Cau42 Cau43 Cau44 Cau45 Cau46 Cau47 Cau48 Cau49
Cau50(50f1).
execute.
Phụ lục 3. Cấu trúc file dữ liệu data.dat:
10010001 10 11BDDBAACBBCADBCDBCCDDDDBBCBDBADADABABACDDDBCBCBAABD
10020002 10 21DBDBABCDBDCBBACAADADCCBAADCBDCDBDCBCCAADCCABABCDCC
10020003 10 21DCBBBCCCBCDBDCBBCBCDACBBDCACDBDBACCCAAACACDBDBAACC
…
96701625 9671D CCCBDDDABADADCCDCCBBBBDBDCBDBDCDCDCDBADDDAACAD
Phụ lục 4. Cấu trúc file dữ liệu data_diem.dat:
1001000110 01 100000110100010000001011001000000000000000001010001
1002000210 02 110000010100011000111101100001100000011100001011000
1002000310 02 110001010101000000001001000101000001001111001010000