MỘT SỐ PHƯƠNG PHÁP ĐO ĐỘ TIN CẬY
CỦA MỘT BÀI KIỂM TRA
ThS. VŨ THANH HIỀN
Bộ môn Anh văn
Khoa Khoa học cơ bản
Trường Đại học Giao thông Vận tải
Tóm tắt: Độ tin cậy là một trong những tiêu chí thiết yếu nhất của một bài kiểm tra tốt.
Do vậy, việc đánh giá một bài kiểm tra chính là đánh giá độ tin cậy của bài kiểm tra đó. Báo
cáo xin giới thiệu một số phương pháp để đo độ tin cậy của một bài kiểm tra.
Summary: The reliability is one of the most essential criteria of a good test. Therefore,
evaluating a test is to evaluate the reliability of the test. The report will present some methods
of reliability computation of a test.
I. ĐẶT VẤN ĐỀ
Theo Bachman (1990:3), kiểm tra đóng
một vai trò hết sức quan trọng trong quá trình
giảng dạy. Thông qua kiểm tra, giáo viên có
thể (i) đánh giá được sự tiếp thu của người
học trong những giai đoạn nhất định; (ii) tự
đánh giá được các phương pháp giảng dạy
khác nhau; (iii) điều chỉnh kiến thức đầu vào
cho phù hợp trong quá trình giảng dạy. Chính
vì vậy, việc thiết kế được những bài kiểm tra
tốt với bốn tiêu chí chính: tính giá trị, độ tin
cậy, tính khả thi, và độ phân biệt là một điều
rất cần thiết.
Có thể nói độ tin cậy được coi là một
trong những tiêu chí thiết yếu nhất của một
người làm bài bao giờ cũng muốn đạt kết quả
cao hơn trong lần làm bài thứ hai này, nên có thể họ sẽ dành thời gian để ôn tập lại.
Để đo độ tin cậy theo hình thức này
Henning (1987:81) đã đưa ra công thức sau:
r
tt
= r
1,2
trong đó: r
tt
là hệ số đo độ tin cậy
r
1,2
là sự tương quan giữa kết
quả hai lần làm bài kiểm tra của cùng đối tượng
* Phương pháp chia đôi bài kiểm tra
(Split Half)
Để sử dụng phương pháp này, trước hết
bài kiểm tra phải được chia đôi thành hai phần
tương đương nhau và được tiến hành cùng cho
một đối tượng sinh viên. Để chia bài kiểm tra
thành hai phần tưương đương, người ta có thể
sử dụng một số cách khác nhau. Nếu bài kiểm
tra bao gồm các câu riêng lẻ, cách thông
thường nhất để chia bài kiểm tra thành hai
phần tương đương đó là một phần gồm các
câu số chẵn, phần kia gồm các câu số lẻ. Điểm
: là hệ số tương quan giữa hai điểm
số của hai phần của bài kiểm tra
Để tính hệ số tương quan giữa hai phần
của bài kiểm tra (R
A,B
), người ta có thể dùng
công thức sau:
)1n(n
D6
1R
2
2
B,A
−
−=
∑
trong đó: R
A,B
: là hệ số tương quan
Spearman
D: sự chênh lệch điểm của hai
phần bài kiểm tra
n: số lượng bài kiểm tra
Nếu R
A,B
: 0,8 – 1,0 sự tương quan tốt (độ
tin cậy cao)
0,6 – 0,8 sự tương quan trung bình (độ
tin cậy trung bình)
2
t
2
i
2
t
tt
S
SS
1n
n
R
trong đó:
R
tt
: độ tin cậy tính theo công thức 20 của Kuder-Richardson
n: số câu hỏi trong bài kiểm tra
S
2
t
: bình phương của độ lệch chuẩn (SD)
∑
S
2
i
: tổng số sự chênh lệch điểm của tất
tt
S
n
x
x
1
1n
n
R
trong đó:
R
tt
: độ tin cậy tính theo công
thúc 21 của
Kuder-Richardson
CNTT-CB
n
: số câu hỏi trong bài kiểm tra
x
: điểm trung bình chung (Mean)
S
2
t
: sự chênh lệch của điểm số
Tuy nhiên Shohamy (1985) cũng giới
thiệu công thức 21 của
Kuder-Richardson
theo một cách tính khác như sau:
là hệ số tin cậy phải dao động từ
0,7 đến 0,79.
III. KẾT LUẬN
Báo cáo đã giới thiệu bốn phương pháp
có thể áp dụng được để đo độ tin cậy – một
trong những tiêu chí cần thiết của một bài
kiểm tra tốt. Hy vọng báo cáo này sẽ là một
tài liệu tham khảo bổ ích cho những người
thiết kế bài kiểm tra để có được những bài
kiểm tra ngày càng chất lượng.
Tài liệu tham khảo
[1]. Bachman, L.F (1990). Fundemental
Considerations in Language Testing. Oxford:
Oxford University Press.
[2]. Harrison, A. (1983). A Language Testing
Handbook. London: Mcmillian Press.
[3]. Heaton, J.B. (1988). Writing English
Language Tests. London: Long man
[4]. Henning, G. (1987). A Guide to Language
Testing. Cambridge: Newbury House Publishers
[5]. Hughes, A. (1989). Testing for Language
Teachers. Cambridge: Cambridge University
Press.
[6]. Lado, R. (1961). Language Testing. London:
Longman.
[7]. Shohamy, E. (1985). A Practical Hanbook in
Language Testing for the Second Language
Teachers. Tel-Aviv: Tel-Aviv University Press♦
giảng dạy và học tập thì khâu kiểm tra đánh giá
là vô cùng quan trọng. Vì vậy kiểm tra đánh
giá trong dạy và học ngoại ngữ là một việc tất
yếu. Đề cập đến vấn đề này Arthur Hughes
trong cuốn Testing for Language Teachers đã
khẳng định “ kiểm tra đánh giá là rất cần thiết
nhằm cung cấp thông tin về những gì mà người
học đạt được, nếu thiếu khâu này sẽ khó có thể
đưa ra các quyết định giảng dạy phù hợp” ([1]
trang 4). Bàn về tầm quan trọng của kiểm tra
đánh giá Madsen (1988 : 4) cũng cho rằng các
bài kiểm tra tiếng Anh phù hợp có thể giúp
sinh viên học tốt ngôn ngữ này vì họ phải học
để kiểm tra, sau đó bài của họ lại được giáo
viên trả và chữa. Theo Heaton việc kiểm tra
cũng rất có ích cho giáo viên, giúp họ đánh giá
được công việc, sự nỗ lực của họ và từ đó có sự
điều chỉnh phù hợp trong giảng dạy để tăng
tính hiệu quả.
Rõ ràng kiểm tra đánh giá là việc làm
không thể thiếu trong giảng dạy nói chung và
trong giảng dạy ngoại ngữ nói riêng.Tuy
nhiên việc này chỉ phát huy được tính tích cực
của nó khi các bài kiểm tra, bài thi có độ tin
cậy cao. Bài báo sẽ đề cập đến những yếu tố
làm tăng độ tin cậy của một bài thi ngoại ngữ.
II. MỘT SỐ YẾU TỐ ẢNH HƯỞNG TỚI ĐỘ
TIN CẬY CỦA MỘT BÀI THI NGOẠI NGỮ
Độ tin cậy là gì?
Theo Harrison, độ tin cậy của một bài thi
mother?” và câu hỏi tiếp theo là “What was
unusual about the place ?”. Như vậy câu hỏi
thứ hai sẽ không làm tăng độ tin cậy của bài thi
vì nếu thí sinh trả lời sai câu thứ nhất thì sẽ dẫn
đến trả lời câu hỏi thứ hai cũng sai. Các câu hỏi
trong bài thi nên càng khác biệt càng tốt, khi đó
bài thi sẽ kiểm tra được nhiều kiến thức đa
dạng của người học và độ tin cậy của bài thi sẽ
càng cao. Điều này đã được Hughes và Cyril
Weir khẳng định “ các câu trong đề thi nên là
các câu không phụ thuộc nhau ” ([1] trang37);
“Nhìn chung cần tránh sự phụ thuộc nhau của
các câu hỏi, tức là việc trả lời một câu hỏi này
không nên liên quan đến khả năng trả lời một
câu hỏi khác ([2] trang 24). Độ dài của bài thi
cũng quyết định độ tin cậy của nó, bài thi càng
dài thì độ tin cậy càng cao ([5]). Tuy nhiên
theo cả Arthur Hughes và Cyril Weir thì bài thi
cũng không nên quá dài vì như vậy sẽ làm cho
thí sinh quá mệt mỏi, khi đó câu trả lời của họ
sẽ không còn phản ánh đúng khả năng của họ
nữa. Độ dài của bài thi nên tuỳ thuộc vào tầm
quan trọng của kết quả bài thi đó. Kết quả của
bài thi được sử dụng vào mục đích quan trọng
hơn thì bài thi nên dài hơn.
2. Yêu cầu các phần của bài thi cần cụ thể
Yêu cầu của câu hỏi càng cụ thể thì việc
đánh giá câu trả lời của các thí sinh sẽ càng
chính xác hơn. Ví dụ trong một bài thi viết, thí
sinh được cung cấp một loạt các chủ đề và họ
of a car on a busy Oxford Road after a fire started
under the bonnet this morning…”, và người ra đề
đã đặt câu hỏi “Where did the fire break out?” với
đáp án là “Oxford Road”, nhưng khi chấm chúng
tôi đã nhận được một câu trả lời rất khác nhưng
cũng đúng từ phía thí sinh là “under the bonnet”.
Như vậy, nếu không đọc bài đọc mà giáo viên cứ chấm theo đáp án thì câu trả lời “under the
bonnet” sẽ bị coi là sai và thí sinh sẽ mất điểm.
Những câu hỏi như thế sẽ làm cho độ tin cậy của
đề thi giảm đi. Để tránh tình trạng này đề thi nên
được đưa cho các giáo viên khác đọc và kiểm tra
thật kỹ lưỡng trước khi thi hoặc tiến hành kiểm
tra thử với một nhóm người có trình độ tương
đương với nhóm thí sinh đích. Tuy nhiên cũng
cần phải có biện pháp để bảo đảm bí mật của đề
thi. Trong trường hợp đặc biệt không thể làm như
vậy thì khi chấm giáo viên phải hết sức lưu ý để
phát hiện được các vấn đề nảy sinh và tìm ra cách
giải quyết hợp lý để đảm bảo sự công bằng cho
thí sinh.
4. Các câu chỉ dẫn trong đề thi phải
thật rõ ràng và chính xác
Điều này cần phải được chú ý đối với cả
những chỉ dẫn bằng lời nói hoặc bằng chữ viết.
Nhiều khi người ra đề cho rằng việc hiểu chính
xác yêu cầu đề bài là một việc dễ dàng với thí
sinh nên đã không cẩn thận khi ra đề và thường
được làm cẩn thận để có được những đề thi rõ
ràng tạo điều kiện cho thí sinh làm bài tốt.
6. Thí sinh nên được làm quen trước
với dạng bài thi và kỹ thuật làm bài
Để có được điều này các thí sinh nên
luyện trước các bài mẫu (sample tests) hoặc
làm các đề thi của những năm trước hoặc sử
dụng những tài liệu trong đó có các dạng bài
của đề thi. Cyril Weir đã đề cập này: “Nhìn
chung việc cung cấp cho thí sinh các dạng câu
hỏi thi để họ làm quen trước kỳ thi là rất hữu
ích…” ([2] trang 24). Qui trình kiểm tra đánh
giá môn tiếng Anh tại trường Đại học Giao
thông cũng đã có bước này. Sinh viên được
làm quen với dạng bài thi thông qua bài mẫu
trong giáo trình, bài kiểm tra giữa kỳ và được
giáo viên hướng dẫn kỹ thuật làm bài cẩn thận
trong quá trình học.
7. Việc tiến hành thi phải được tổ chức
đồng nhất trong điều kiện yên tĩnh
Một đề thi tốt nhưng không được tổ chức
thi nghiêm túc sẽ không đạt được độ tin cậy
cao. Kỳ thi được tiến hành trong các điều kiện
khác nhau sẽ cho các kết quả khác nhau vì vậy
sự đồng nhất trong cách tổ chức thi là rất quan
trọng. Ví dụ việc bố trí phòng thi, định thời
gian, giám sát thời gian làm bài, điều kiện âm
thanh, loa đài phải được chú ý thực hiện tốt,
đặc biệt khi cho thí sinh nghe không nên để
các âm thanh khác làm mất sự tập trung của
“…was closely associated with high ”. Đối
với đề thi viết, để việc cho điểm đạt độ khách
quan cao đề bài cần cho rất cụ thể (Ví dụ như
đề viết thứ tư ở phần 2)
- Phần đáp án và thang điểm cần phải thật
chi tiết.
CNTT_C
B
Tất cả các phương án trả lời chấp nhận
được đều phải được đưa ra. Muốn đạt độ tin
cậy, thang điểm nên càng cụ thể cho từng phần
nhỏ càng tốt. Để làm được điều này sự tham
khảo ý kiến của các đồng nghiệp là rất cần
thiết. Theo Cyril Weir, thì thang điểm và thời
gian làm bài của từng phần (nếu bài thi gồm
nhiều phần có độ dài khác nhau) cũng nên cho
thí sinh biết để họ có thể có chiến lược làm bài
đạt hiệu quả cao nhất ([2] trang 25).
- Giáo viên chấm thi cần phải được
hướng dẫn đầy đủ và cẩn thận, đặc biệt là
những người chấm bài viết luận.
- Nhóm chấm thi cần nghiên cứu đáp án
và thang điểm kỹ càng và chỉ bắt tay vào
chấm khi tất cả cùng nhất trí về đáp án cũng
như thang điểm đó. Trong quá trình chấm nếu
có vấn đề nảy sinh, cán bộ giám sát cần phải
trao đổi tìm ra giải pháp phù hợp rồi thông
báo cho tất cả cán bộ chấm thi có liên quan.
- Bài thi nên được đánh số chứ không nên ghi
tên để đảm bảo sự khách quan. Các nghiên cứu
Developing Language Tests.
[3]. Gary Buck. Assessing listening. Cambridge
University Press.
[4]. Nguyễn Thị Thu Hương. Towards improving
positive backwash effects of English in-term tests
A3 in assessment of students’ performance at the
university of transport and communications (Luận
văn thạc sỹ)
[5].Trang web :
http://www.ewaygo.net/site/index.php?option=co
m_content&view=article&id=85%3Atesting-and-
teaching-brief-
introduction&Itemid=64&limitstart
=2♦