MỞ ĐẦU
1. Lý do chọn đề tài
Để nâng cao chất lượng giảng dạy đại học, việc đánh giá chính xác
kết quả học tập của sinh viên là một vấn đề rất quan trọng. Trong thực
trạng giáo dục đại học còn nhiều tiêu cực và bất cập như hiện nay, việc áp
dụng hình thức thi, kiểm tra trắc nghiệm khách quan là một trong những
biện pháp có hiệu quả cho phép đánh giá tương đối chính xác kết quả học
tập của sinh viên. Khoa Công nghệ thông tin - Đại học Thái Nguyên cũng
như các trường đại học khác hiện đang tích cực áp dụng hình thức thi trắc
nghiệm khách quan cho khoảng 40% tổng số các môn học, coi đây là một
trong những biện pháp nhằm đổi mới phương pháp kiểm tra đánh giá, nâng
cao chất lượng giáo dục. Tuy nhiên một thực tế xảy ra là chất lượng các bộ
đề thi trắc nghiệm khách quan chưa được bảo đảm cả về độ giá trị cũng
như độ tin cậy. Do đó tôi đã lựa chọn đề tài “Đánh giá các yếu tố ảnh
hưởng đến chất lượng các bộ đề thi trắc nghiệm khách quan tại Khoa Công
nghệ thông tin - Đại học Thái Nguyên”
Thực tế hiện nay việc xây dựng các bộ đề thi trắc nghiệm khách quan
được giao cho các nhóm giáo viên phụ trách môn học thực hiện. Các giáo
viên xây dựng bộ đề hầu hết đều theo kinh nghiệm chủ quan của mình,
chưa được trang bị đầy đủ về kiến thức và kỹ năng thiết kế đề thi trắc
nghiệm. Các đề thi do giáo viên soạn thảo được đưa vào ứng dụng trực
tiếp, không qua quá trình thử nghiệm và đánh giá. Chính vì vậy phân bố
điểm thi không thể hiện tính chuẩn, do còn có nhiều câu hỏi kém chất
lượng. Như chúng ta biết, hiện nay chưa có công trình nào nghiên cứu cụ
thể về vấn đề này. Vì vậy chưa có một kết luận chính xác về độ tin cậy, độ
giá trị của các bộ đề thi trắc nghiệm khách quan cũng như các yếu tố ảnh
hưởng đến chất lượng bộ đề trắc nghiệm.
Thực hiện đề tài này, chúng tôi mong muốn sẽ đánh giá được thực
chất về độ giá trị, độ tin cậy của các bộ đề thi trắc nghiệm khách quan của
Nhà trường cũng như các yếu tố ảnh hưởng đến chất lượng các bộ đề thi
trắc nghiệm, từ đó chỉ ra được các giải pháp khắc phục.
việc ra đề trắc nghiệm (phù hợp hay khó thực hiện).
4.2. Khách thể và đối tượng nghiên cứu
Khách thể nghiên cứu là số liệu kết quả thi của 50 bộ đề trắc nghiệm
khách quan tại Khoa CNTT và các giáo viên trực tiếp xây dựng các bộ đề
đó.
Đối tượng nghiên cứu là các yếu tố ảnh hưởng đến chất lượng các bộ
đề thi trắc nghiệm.
4.3. Phương pháp tiếp cận nghiên cứu
1. Phương pháp lý thuyết: Căn cứ vào quy định về triển khai thực hiện
việc thi trắc nghiệm và xây dựng ngân hàng thi trắc nghiệm của Bộ
GD&ĐT; Các lý thuyết về đo lường đánh giá trong giáo dục.
2. Phương pháp điều tra khảo sát: Thực hiện qua hai bước chính là
nghiên cứu sơ bộ và nghiên cứu chính thức.
- Nghiên cứu sơ bộ: Thực hiện thông qua phương pháp định tính, sử
dụng kỹ thuật thảo luận nhóm để bổ sung mô hình.
- Nghiên cứu chính thức: Thực hiện thông qua phương pháp nghiên
cứu định lượng, sử dụng kỹ thuật thu thập thông tin qua việc phỏng vấn,
lấy phiếu điều tra trên các đối tượng giáo viên. Mục đích nghiên cứu này là
để sàng lọc các biến quan sát, xác định thành phần cũng như giá trị độ tin
cậy của thang đo và kiểm định mô hình lý thuyết.
2
3. Phương pháp lấy ý kiến chuyên gia: Tham khảo ý kiến của các
chuyên gia có kinh nghiệm trong giáo dục đại học và đo lường đánh giá
trong giáo dục.
4. Phương pháp thống kê toán học: Thu thập và xử lý số liệu (gồm
kết quả các môn thi trắc nghiệm và phiếu điều tra đối với giáo viên ra
đề thi trắc nghiệm) trong quá trình nghiên cứu bằng các phần mềm
SPSS và QUEST.
5. Những đóng góp mới của luận văn
Về mặt lý luận
Nó thích hợp với cả người dạy và người học, đặc biệt có lợi trong kiểm tra
xử lí tình huống, rèn phản ứng nhanh nhạy cho HS. Tuy nhiên phương
3
pháp này không thích hợp cho việc đánh giá một phổ rộng với khối lượng
lớn kiến thức, trên nhiều HS trong một thời gian ngắn. Câu hỏi để HS trả
lời đa số chỉ nằm trong một nội dung hẹp nào đó.
1.1.1.3. Phương pháp kiểm tra viết
Đây là hình thức được dùng phổ biến trong dạy học. Kiểm tra theo
kiểu này có những ưu điểm sau:
- Cho phép kiểm tra nhiều HS một lần.
- Cung cấp một bản ghi rõ ràng các câu trả lời của thí sinh dùng cho
việc chấm điểm.
- Cho phép thí sinh cân nhắc trước khi trả lời các câu hỏi, do đó kiểm
tra được sự phát triển trí tuệ ở mức cao hơn.
- Dễ quản lí vì bản thân người chấm không tham gia trực tiếp trong
thời gian kiểm tra.
1.1.2. Trắc nghiệm và những vấn đề liên quan
1.1.2.1. Khái niệm về trắc nghiệm
Trắc nghiệm “test” trong tiếng Anh có nghĩa là “sự khảo sát hoặc thử
các phẩm chất của một người hoặc vật”; còn trong tiếng Hán thì “trắc” có
nghĩa là “đo lường”, “nghiệm” có nghĩa là “suy xét, chứng thực”.
1.1.2.2. Trắc nghiệm tự luận và trắc nghiệm khách quan
Trắc nghiệm viết bao gồm hai loại: trắc nghiệm tự luận và trắc nghiệm
khách quan
- Trắc nghiệm tự luận (Essay test).
Trắc nghiệm tự luận bao gồm nhiều dạng khác nhau nhưng nhìn
chung HS có thể diễn đạt tư tưởng, câu văn nhờ kiến thức và kinh nghiệm
học tập đã có. Phương pháp này có thể đo được khả năng suy luận cũng
như phát huy được óc sáng tạo, khéo léo khi giải quyết vấn đề của HS,
khuyến khích HS thói quen suy diễn, phân tích, tổng hợp, khái quát hoá,
không thể gắn cho những kết quả trắc nghiệm giá trị tuyệt đối được.
- Trắc nghiệm chỉ là một phương tiện được sử dụng để thu thập thông
tin trong quá trình dạy học. Không nên quan niệm là chỉ cần thông qua trắc
nghiệm mà chất lượng dạy và học đương nhiên được cải thiện.
1.1.3. Độ tin cậy của bộ câu hỏi trắc nghiệm
Xem xét mô hình lý thuyết về độ tin cậy
Để xác định độ tin cậy của một phép đo, ta phải xuất phát từ một tiền
đề có tính giả thiết rằng phép đo sẽ đo lường một đặc tính tương đối ổn
định và bản thân phép đo phải có tính ổn định tương đối, ít hoặc không
thay đổi giữa các lần đo khác nhau. Bởi vì sẽ không có một phương pháp
đo đạc nào có giá trị nếu không đo một cái gì đó có tính ổn định tương đối
và bản thân phép đo phải có tính ổn định, ít hoặc không thay đổi giữa các
lần đo khác nhau. Như vậy, một thang đo có độ tin cậy tốt được xác định
như là một phép đo trên đó mọi người đạt số điểm tương tự ở những lần đo
khác nhau.
Các lý thuyết về trắc nghiệm đều cho rằng điểm số của trắc nghiệm đo
lường một đặc tính, phẩm chất hay năng lực nào đó ở một cá nhân bằng
điểm thực của cá nhân đó cộng với điểm sai số của sự đo lường.
X = T + E
X: Điểm trắc nghiệm
T: Điểm thực
E: Điểm sai số của phép đo
Điểm thực được xác định như là điểm trung bình của vô số những lần
đo của trắc nghiệm trên một cá nhân. Còn điểm sai số của phép đo là sự
khác biệt ở mỗi lần đo do các yếu tố cá nhân (động cơ, xúc cảm, tâm lý )
do các yếu tố tình huống, hoàn cảnh ảnh hưởng (môi trường, tiếng ồn, lời
5
hướng dẫn ), nhưng chúng ta chưa bao giờ đo được điểm thực ở cá nhân
một cách thực chính xác. Như vậy, để phân tích độ tin cậy của trắc nghiệm
người ta phải dựa vào kết quả làm trắc nghiệm của một nhóm người (điểm
Khi đó độ tin cậy của trắc nghiệm được xác định như là hệ số tương
quan (R
XX
) biểu thị tỷ lệ hay phần trăm giữa phương sai của điểm trắc
nghiệm theo công thức
22
2
2
2
ET
T
X
T
XX
R
σσ
σ
σ
σ
+
==
Một trắc nghiệm có độ tin cậy phải có một tỷ lệ lớn hơn của phương
sai điểm trắc nghiệm thuộc về sự khác biệt ở điểm thực (ngược laị, một
trắc nghiệm không có độ tin cậy sẽ có một tỷ lệ lớn hơn của phương sai
điểm trắc nghiệm thuộc về sự khác biệt ở điểm sai số của phép đo) [4].
Các phương pháp đánh giá độ tin cậy của phép đo
Theo lý thuyết đánh giá, có bốn phương pháp cơ bản để đánh giá độ
tin cậy của phép đo.
- Nhóm phương pháp đánh giá mức độ kiên định về điểm số giữa hai
lần đo (test-retest methods).
(thường chia theo số chẵn và số lẻ) rồi so sánh tương quan điểm giữa hai
nửa trắc nhiệm. Đây gọi là phương pháp tính độ tin cậy phân đôi trắc
nghiệm (split-half reliablity). Về lý thuyết, hai nửa trắc nghiệm có thể
được xem là hai form tương đương của cùng một trắc nghiệm. Do vậy
tương quan điểm số của hai nửa này được xem là hệ số tin cậy của trắc
nghiệm. Công thức tính như sau.
( )( )
))((
X-XE)(
XE
XEXO
XO
EXOXO
R
σσ
Σ
=
XO: Các item số lẻ
XE: Các item số chẵn
Tất nhiên khi sử dụng công thức này hệ số tin cậy sẽ giảm đi so với hệ
số tin cậy thật của trắc nghiệm vì trắc nghiệm vốn có số item gấp hai lần
(trắc nghiệm càng có nhiều item thì độ tin cậy càng cao). Ta có thể sử
dụng công thức chuyển hệ số độ tin cậy phân đôi thành hệ số độ tin cậy
của toàn trắc nghiệm gọi là công thức Spearman - Brown prophesy.
))(1(1
))((
XX
XX
RN
RN
σ
α
Σ
−
−
==
R
XX
Hệ số tương quan α
K - Số các item của trắc nghiệm
σ
2
i
- Giá trị của phương sai của từng item cụ thể của trắc nghiệm
σ
2
X
- Giá trị của phương sai của toàn bộ trắc nghiệm
Σσ
2
i
-Tổng các giá trị phương sai của tất cả các item của trắc nghiệm.
1.1.4. Độ giá trị (hiệu lực) của bộ câu hỏi trắc nghiệm
Độ giá trị là một trong những đặc trưng quan trọng nhất khi đánh giá
một trắc nghiệm. Mỗi trắc nghiệm không chỉ có một độ giá trị duy nhất mà
có nhiều kiểu giá trị (hiệu lực) khác nhau. vì vậy độ giá trị được hiểu như
là những dữ liệu điều tra một cách khoa học về ý nghĩa của trắc nghiệm
khi đo lường.
Các phương pháp cơ bản để đánh giá độ giá trị của một trắc nghiệm
Mặc dù độ giá trị nội dung và độ giá trị cấu trúc đều nói lên mức độ
vấn đề xây dựng một ngân hàng các câu hỏi TNKQ thì các chuyên gia
trong lĩnh vực này đều cho rằng nên chọn hình thức câu hỏi TNKQ đa lựa
chọn (với bốn hoặc năm lựa chọn). Trong phạm vi nghiên cứu của luận
văn, tôi cũng giới hạn việc nghiên cứu với đối tượng là các ngân hàng câu
hỏi TNKQ dạng đa lựa chọn.
1.2.1 Các quy tắc viết các câu hỏi trắc nghiệm nhiều lựa chọn
Đây là loại câu hỏi TNKQ được ưa chuộng nhất hiện nay. Một câu hỏi
loại này gồm một phần phát biểu chính, thường gọi là phần dẫn, hay câu
hỏi và bốn đến năm phương án trả lời sẵn để thí sinh chọn ra câu trả lời
đúng nhất, hay hợp lý nhất. Ngoài một câu đúng, các câu trả lời khác trong
phương án chọn phải có vẻ hợp lý đối với thí sinh. Khi soạn thảo câu hỏi
TNKQ cần tuân thủ các nguyên tắc sau:
- Phần chính, hay câu dẫn của câu hỏi phải diễn đạt rõ ràng một vấn
đề. Các câu trả lời để chọn phải là những câu khả dĩ thích hợp với vấn đề
đã nêu. Nên tránh dùng những câu có vẻ như câu hỏi loại “Đúng - Sai”
không liên hệ nhau được sắp chung một chỗ.
- Phần chính, hay câu dẫn của câu hỏi nên mang trọn ý nghĩa là một
câu hỏi và phần câu trả lời để chọn nên ngắn gọn. Muốn tiết kiệm
khoảng in câu hỏi và thời gian cho học sinh đọc câu hỏi, các chi tiết
cần thiết nên được sắp đặt vào phần chính hay câu dẫn, để các câu trả
lời lựa chọn được ngắn.
- Nên bỏ bớt các chi tiết không cần thiết. Khi mục đích câu hỏi không
phải trắc nghiệm khả năng nhận biết sự kiện chính trong một đoạn văn, ta
nên loại bỏ những chữ nào không cần thiết để diễn đạt ý nghĩa câu hỏi.
- Nên tránh dùng hai thể phủ định liên tiếp như hai chữ “Không “ trong
cùng một câu hỏi.
- Các câu trả lời để chọn lựa phải có vẻ hợp lý. Nếu một phương án
chọn lựa sai, thí sinh sẽ dễ dàng loại bỏ.
- Phải chắc chắn chỉ có một câu trả lời đúng. Khi viết câu hỏi nên mời
các giáo viên trong cùng nhóm môn học góp ý sửa chữa các điểm sai hay
- Câu trả lời đúng nhất hay hợp lý nhất phải được đặt ở các vị trí khác
nhau một số lần tương đương nhau.
- Tránh dùng các thể phủ định trong các câu hỏi. Người ta thường nên
nhấn mạnh khía cạnh xác định hơn khía cạnh phủ định trong kiến thức.
Khi bắt buộc phải dùng những từ này, nên gạch dưới hay in đậm để học
sinh chú ý hơn.
1.2.2. Xây dựng bảng trọng số của môn học
Để đề thi có thể đánh giá đúng mục tiêu của môn học, cấu trúc đề thi
phải được xây dựng phù hợp với cấu trúc của môn học và các yêu cầu khối
lượng kiến thức tương ứng. Mỗi đề thi được xây dựng phục vụ cho những
mục đích nhất định. Tuỳ theo mục đích thi người viết đề thi phải thiết kế
số câu hỏi và thể loại câu hỏi phù hợp tương ứng. Vì thế trước khi xây
dựng đề thi chúng ta cần xác định mục đích cụ thể của đề thi. Mục đích
của đề thi phải định ra được những nội dung kiến thức và cấp độ kiến thức
10
cần kiểm tra (cấp độ kiến thức tương ứng với thang bậc về năng lực nhận
thức). Tất cả những yêu cầu này được thể hiện trong bảng trọng số đề thi.
Về mặt nguyên tắc, đề thi TNKQ hết học phần bao phủ hết nội dung kiến
thức môn học, cho nên bảng trọng số của đề thi tương ứng với bảng trọng
số kiến thức của môn học.
1.2.3. Xây dựng ngân hàng đề thi trắc nghiệm cho môn học
Để thực hiện việc triển khai thi TNKQ một cách rộng rãi đòi hỏi phải
có một ngân hàng câu hỏi TNKQ. Đây là cơ sở dữ liệu để xây dựng các đề
thi một cách độc lập, có độ tin cậy, độ bao phủ kiến thức đồng đều cho các
lần thi. Vừa là nguồn dữ liệu cho sinh viên và cả giáo viên học tập. Việc
tiến hành xây dựng ngân hàng câu hỏi thi phải theo đúng những quy trình
và nguyên tắc kiểm tra đánh giá đã trình bày ở trên. Cụ thể phải tiến hành
theo các bước sau:
1. Xác định rõ mục tiêu đào tạo của từng giai đoạn cần kiểm tra
đánh giá.
2.1. Những định hướng, trọng tâm nghiên cứu
2.1.1. Chuyên đề nghiên cứu thứ nhất
Để đánh giá các yếu tố ảnh hưởng đến chất lượng bộ đề thi TNKQ,
luận văn phải xuất phát từ việc đánh giá chất lượng của các bộ đề thực tế
đã sử dụng tại nhà trường qua xử lý số liệu kết quả thi của các môn học
(50 môn học). Từ kết quả thi đã được xử lý và lý thuyết về đo lường đánh
giá có thể cho phép kết luận sơ bộ về chất lượng các bộ đề này (về độ tin
cậy, độ giá trị…). Nghiên cứu này được thực hiện bằng phương pháp
thống kê phân tích, xử lý số liệu trên phần mềm SPSS, QUEST, kết hợp
với phương pháp chuyên gia qua việc thẩm định độ giá trị nội dung, độ gía
trị cấu trúc… của các bộ đề thi.
2.1.2. Chuyên đề nghiên cứu thứ hai
Xuất phát từ thực tế là các bộ đề thi TNKQ trong nhà trường có chất
lượng không giống nhau. Câu hỏi đặt ra là “Vậy thì những yếu tố nào ảnh
hưởng đến chất lượng của các bộ đề thi TNKQ”? Có thể bỏ qua các yếu tố
như điều kiện bên ngoài, ta nhận thấy yếu tố ảnh hưởng lớn nhất chính là
từ phía những người xây dựng bộ đề thi này. Bằng kinh nghiệm thực tiễn
công tác cũng như tham khảo ý kiến của các chuyên gia trong lĩnh vực đo
lường đánh giá giáo dục, tác giả mạnh dạn đề xuất một bộ công cụ đo các
yếu tố ảnh hưởng đến chất lượng bộ đề thi TNKQ thực hiện trên nhóm
mẫu là giáo viên tham gia xây dựng đề thi. Chất lượng một bộ đề thi nói
chung phụ thuộc nhiều yếu tố nhưng chủ yếu và trực tiếp là các yếu tố tác
động đến chính bản thân người ra đề. Trong điều kiện giảng dạy hiện nay,
có thể khái quát thành 5 nhóm yếu tố giả thuyết có ảnh hưởng đến người ra
đề, đó là:
- Thời gian đầu tư cho công việc thiết kế trắc nghiệm.
- Động cơ của người thiết kế trắc nghiệm.
- Mức độ người ra đề được trang bị kỹ thuật thiết kế trắc nghiệm.
- Sự quan tâm của nhà trường.
- Tính chất, đặc điểm của các nhóm môn học.
- Tính chất các nhóm môn học: 03 item
Qua phân bố các item trong cấu trúc trên, dễ nhận thấy yếu tố thứ 3
“Mức độ nắm vững kỹ thuật ra đề TNKQ của giảng viên” có trọng số lớn
hơn cả. Điều này không phải là một nhận định quá chủ quan mà nó được
xây dựng trên kinh nghiệm cá nhân, thăm dò dư luận đám đông và ý kiến
của các chuyên gia có kinh nghiệm về đo lường đánh giá trong giáo dục.
Chương 3
XỬ LÝ SỐ LIỆU THI VÀ KẾT QUẢ PHIẾU ĐIỀU TRA
3.1. Xử lý số liệu kết quả thi TNKQ
3.1.1. Phân tích độ khó của item
Độ khó của item được dùng để tạo ra sự phân biệt giữa những người
làm trắc nghiệm. Mức độ khó của item được định nghĩa dựa trên tỷ lệ
người trả lời đúng item đó. Phân tích độ khó của item chỉ phù hợp cho
những trắc nghiệm đánh giá thành tích hay năng khiếu, những trắc nghiệm
cho phép bộc lộ tối đa năng lực của người làm trắc nghiệm. Phân tích độ
khó không phù hợp cho những trắc nghiệm đánh giá nhân cách hay quan
điểm thái độ.
Độ khó của từng item trực tiếp ảnh hưởng đến độ tin cậy và độ giá trị
(hiệu lực) của trắc nghiệm. Ví dụ, một trắc nghiệm có 50 item nhưng có
20 item quá khó (tất cả sinh viên đều nhận điểm 0 trên các item này). Như
13
vậy, phân bố điểm của trắc nghiệm gồm 50 item này cũng giống như phân
bố điểm của trắc nghiệm chỉ gồm 30 item. Khi đó, độ khó của các item đã
thực sự làm giảm độ dài của trắc nghiệm. Về mặt lý thuyết, độ dài của trắc
nghiệm giảm sẽ làm giảm độ tin cậy của trắc nghiệm và cũng làm giảm độ
hiệu lực của trắc nghiệm [4].
Công thức tính độ khó của item:
P = (Số người trả lời đúng trên item) / N
P: Độ khó của item
N: Tổng số người trả lời item
thấp nhất. Sau khi xác định được hai nhóm có điểm cao và điểm thấp, hãy
tính tỷ lệ % số người trả lời đúng trên từng item cho mỗi nhóm. Chỉ số
phân biệt của item được tính theo công thức sau:
14
Số người trả lời đúng Số người trả lời đúng
ở nhóm điểm cao ở nhóm điểm thấp
D = -
Tổng số người trả lời Tổng số người trả lời
ở nhóm điểm cao ở nhóm điểm thấp
D: Độ phân biệt của item
Với các trắc nghiệm đánh giá năng lực, ta có thể giải thích sự thay đổi
các giá trị của D như sau: Nếu item có câu trả lời khó cho những người ở
nhóm điểm thấp mà dễ cho những người ở nhóm điểm cao, thì khi đó chỉ
số D là tiếp cận 1,0 (item có độ phân biệt lý tưởng). Nếu item có câu trả
lời khó ngang bằng cho cả hai nhóm thì chỉ số D tiếp cận 0,0 (item không
có độ phân biệt hay độ phân biệt kém). Nếu item có câu trả lời dễ cho
những người ở nhóm điểm thấp mà lại khó cho nhóm người điểm cao thì
chỉ số phân biệt D tiếp cận – 1,0, khi đó item vẫn có độ phân biệt lý tưởng
nhưng không giống như mong đợi.
Theo các chuyên gia trong lĩnh vực này thì chỉ số phân biệt của từng
item, được coi là thích hợp khi D lớn hơn hoặc bằng 0,3. Những item có
chỉ số phân biệt nhỏ hơn hoặc bằng 0,2 nên được viết lại.
Phương pháp đánh giá độ phân biệt bằng cách đánh giá tương quan
giữa item và toàn bộ trắc nghiệm
Nếu trắc nghiệm và item cùng đo một đặc tính hay một cấu trúc thì
điểm trả lời trên item sẽ tương quan với tổng số điểm của trắc nghiệm.
Cũng vậy, nếu các item cùng đo một đặc tính hay một cấu trúc thì chúng
sẽ tương quan với nhau. Công thức tính tương quan điểm item và điểm
của trắc nghiệm như sau:
))((
nghiệm như đã chỉ ra ở trên chỉ có tính chất đánh giá cục bộ, đơn lẻ trên
các item. Những kết quả đó chưa phản ánh hết toàn bộ độ tin cậy của toàn
bộ bài trắc nghiệm. Để có kết luận một cách toàn diện về độ tin cậy của cả
bài trắc nghiệm người ta thường dùng phương pháp đánh giá dựa trên mô
hình tương quan Alpha của Cronbach (Cronbach’s coefficent alpha).
Các thông tin về độ tin cậy của toàn bài trắc nghiệm được cho trong
bảng sau
Hệ số tin cậy
Cronbach's Alpha
Hệ số tin cậy trên các item
chuẩn
Cronbach's Alpha Based on
Standardized Items
Số lượng item
N of Items
.805 .819 60
Bảng 2.2: Các thông số về độ tin cậy (Reliability Statistics)
Qua phân tích số liệu trên bảng Output ta thấy đề thi trên dù còn có
một số câu hỏi (item) chưa được tốt song độ tin cậy của toàn bộ trắc
nghiệm là khá cao. Kết quả phân tích cho hệ số tin cậy của toàn trắc
nghiệm α = 0,805 có nghĩa là 80,5% phương sai của điểm trắc nghiệm là
phương sai của điểm số thực và chỉ có 15,5% phương sai của điểm là do
sai số ngẫu nhiên của phép đo. Cũng bằng phép phân tích này, nhìn vào
bảng 1 ta thấy, những item có tương quan với các item còn lại là thấp (α
i
<
0.30) thì cần phải xem lại, những item có tương quan qúa thấp (α
i
< 0) thì
nên loại bỏ.
| 21 50 54
| 49 57
| 20 36
.0 X | 4 11 25 31 39 55 59
X | 13
|
XX | 17 43
| 51 58
| 33 41
| 5 52 56
| 9 16 19 46 60
|
X | 7
-1.0 |
| 18 28 29 34 38 47
|
| 1 12 42
|
| 27
|
|
| 10
-2.0 |
|
|
| 2
|
NăNG LỰC THấP | Độ KHó THấP
|
|
Item 7: item 7 Infit MNSQ = .97
Disc = .31
Categories 0 1 missing
Count 7 45 0
Percent (%) 13.5 86.5
Pt-Biserial 31 .31
p-value .013 .013
Mean Ability .54 1.18 NA
Step Labels 1
Thresholds 92
Error .42
Item 8: item 8 Infit MNSQ = 1.40
Disc = 28
Categories 0 1 missing
Count 35 17 0
Percent (%) 67.3 32.7
Pt-Biserial .28 28
p-value .023 .023
Mean Ability 1.24 .79 NA
kỹ thuật, chúng tôi cũng lấy đây là thông số chính để đánh giá chất lượng
của trắc nghiệm.
3.2. Xử lý số liệu mẫu phiếu phỏng vấn (phiếu hỏi) trong giảng viên
3.2.1. Đánh giá độ tin cậy của công cụ đo (mẫu phiếu hỏi)
Trên cơ sở mẫu phiếu đánh giá các yếu tố ảnh hưởng đến chất lượng
các bộ đề thi TNKQ đã nêu ở trên, chúng tôi đã tiến hành phỏng vấn và
lấy phiếu đối với 50 giáo viên trực tiếp soạn thảo 50 bộ đề của 50 môn học
áp dụng thi TNKQ hết học phần. Kết quả cụ thể như sau.
Nếu ta quy đổi thang bậc các mức đồng ý của các phiếu hỏi thành
điểm số tương ứng với 5 mức điểm từ 0 đến 4 (chú ý các item với phát
biểu ngược chiều lấy giá trị điểm ngược lại), ta sẽ có bảng các điểm số của
phiếu hỏi. Về mặt ý nghĩa đo lường, các phiếu hỏi cho điểm số tổng cộng
cao sẽ tương ứng với các cá nhân có các yếu tố thuận lợi cho việc xây
dựng đề trắc nghiệm, ngược lại các phiếu hỏi có điểm số tổng cộng thấp sẽ
tương ứng với các cá nhân có các yếu tố kém thuận lợi cho việc xây dựng
19
đề trắc nghiệm. Các phiếu có phân bố điểm tổng cộng từ 43 đến 94 điểm
(điểm tối đa có thể là 120 điểm) cho thấy phân bố điểm rất rộng chứng tỏ
các cá nhân tham gia xây dựng đề trắc nghiệm trong các điều kiện rất khác
nhau và nhận thức quan điểm cũng rất khác nhau.
Tiến hành xử lý số liệu trên phần mềm SPSS ta nhận thấy:
Đánh giá độ tin cậy của trắc nghiệm bằng phương pháp đánh giá độ
phù hợp của từng item (internal consistency methods) sử dụng mô hình
Cronbach’s Coefficent Alpha. Mô hình này đánh giá độ tin cậy của phép
đo dựa trên sự tính toán phương sai của từng item trong toàn phép đo và
tính tương quan điểm của từng item với với điểm tổng của các item còn lại
của phép đo. Phương pháp này thích hợp cho việc xác định độ tin cậy của
các loại trắc nghiệm có các item nhiều mức độ tính theo điểm số (kiểu
thang định khoảng hay thang định tỷ lệ).
Công thức tính như sau:
: Giá trị phương sai của toàn trắc nghiệm
∑ σ
2
i
: Tổng các giá trị phương sai của tất cả các item của trắc nghiệm
Thực hiện: Sử dụng mô hình Cronbach’s Coefficent Alpha đánh giá
độ tin cậy của phép đo các yếu tố ảnh hưởng đến chất lượng bộ đề trắc
nghiệm khách quan. Mô hình này đòi hỏi phép đo phải có phân bố chuẩn
(hoặc gần chuẩn), có các item được tính theo thang định khoảng.
Hầu hết tương quan giữa các item (30 item từ tg1 đến mh3) đều có trị
số lớn hơn 30%. Điều đó chứng tỏ các item trong phiếu trắc nghiệm có
tương quan chặt với nhau và đây là một công cụ đo có độ tin cậy đảm bảo
cho phép đánh giá các điều kiện thuận lợi cho một giáo viên khi xây dựng
bộ đề thi trắc nghiệm.
Có thể đánh giá độ tin cậy và phân tích mẫu các phiếu hỏi bằng mô
hình RASCH trên phần mềm QUEST. Trong phạm vi này chúng tôi chỉ
nghiên cứu trên nhóm các item trong thang đo hẹp, cụ thể là phân tích các
item trong thang đo thứ ba: “Mức độ nắm vững kỹ thuật ra đề trắc nghiệm
của giảng viên”.
Để thấy rõ hơn, ta phân tích Bảng 2.10.
20
all on phieu (N = 52 L = 16 Probability Level= .50)
MNSQ .63 .67 .71 .77 .83 .91 1.00 1.10 1.20
1.30 1.40 1.50 1.60
+ + + + + + + +
+ + + +
1 item 1 . * | .
2 item 2 . * | .
3 item 3 . * .
trong phiếu hỏi.
+ Ma trận tương quan giữa các item trong cùng một phiếu hỏi.
21
+ Sự phù hợp giữa mức độ đánh giá cao của trắc nghiệm đối với sự
nhất trí của giáo viên tham gia làm trắc nghiệm.
+ Tính đồng nhất của các item trong cùng một phiếu hỏi.
Với những kết quả đã phân tích trong mục [3.2.1], có thể kết luận
mẫu phiếu hỏi sử dụng trong nghiên cứu có độ giá trị tốt (độ tin cậy
cao và phù hợp với mô hình đo là các yếu tố ảnh hưởng đến chất
lượng bộ đề thi TNKQ).
3.3. Kết luận về các yếu tố ảnh hưởng đến chất lượng bộ đề thi
TNKQ
Nhìn vào Bảng chéo Crosstabs ta có thể kết luận:
- Trong 50 mẫu phiếu hỏi có 10 mẫu phiếu cho điểm số thấp, chiếm
20%, trong đó:
+ 03 phiếu ứng với người có đề chất lương kém, chiếm 30% của
nhóm.
+ 03 phiếu ứng với người có đề chất lượng vừa, chiếm 30% của
nhóm.
+ 04 phiếu ứng với người có chất lượng đề cao, chiếm 40% của
nhóm.
- Trong 50 mẫu phiếu có 30 mẫu cho điểm số trung bình, chiếm 60%
tổng số mẫu, trong đó:
+ 05 phiếu ứng với người có chất lượng đề kém, chiếm 16,7%
của nhóm
+ 21 phiếu ứng với người có chất lượng đề trung bình, chiếm
70% của nhóm
+ 04 phiếu ứng với người có chất lượng đề cao, chiếm 13,3%
của nhóm
- Trong 50 mẫu phiếu hỏi có 10 mẫu cho điểm số cao, chiếm 20% của
thuận lợi của các yếu tố ảnh hưởng đến người ra đề. Qua phân tích, ta thấy
điểm phiếu hỏi cao tương ứng với giáo viên có các yếu tố thuận lợi cho
việc ra đề thi TNKQ và ngược lại, điểm phiếu hỏi thấp ứng với giáo viên
có các yếu tố kém thuận lợi cho việc ra đề.
- Có sự tương quan chặt chẽ giữa điểm số của phiếu hỏi với chất lượng
đề thi của chính nghiệm thể đó (trừ số ít trường hợp ngoại lệ). Điều đó cho
thấy qua phân tích phiếu hỏi có thể dự đoán khá chính xác chất lượng đề
thi mà cá nhân đó chịu trách nhiệm biên soạn.
- Qua đánh giá các yếu tố ảnh hưởng đến chất lượng đề thi TNKQ, có
thể thấy yếu tố ảnh hưởng lớn nhất đến chất lượng đề thi là việc trang bị
kỹ thuật ra đề thi TNKQ cho giáo viên (16 item / tổng số 30 item của
phiếu hỏi).
B. ĐỀ NGHỊ
Từ các nghiên cứu và phân tích ở trên chúng tôi mạnh dạn đề xuất một
số giải pháp nhằm nâng cao chất lượng các bộ đề thi TNKQ như sau.
- Đầu tư thời gian, kinh phí tập huấn cho đội ngũ giáo viên tại các Bộ
môn lý thuyết về đo lường, đánh giá kết quả học tập, trong đó chú trọng
đến các kỹ thuật soạn thảo câu hỏi TNKQ.
- Triển khai xây dựng ngân hàng câu hỏi TNKQ theo đúng quy trình
đã được thống nhất trong toàn trường, có sự quản lý giám sát của bộ phận
chuyên trách.
- Tăng cường công tác khảo thí, xây dựng đội ngũ cán bộ khảo thí có
chuyên môn vững làm nhiệm vụ tư vấn trong xây dựng cũng như đánh giá
trực tiếp chất lượng ngân hàng đề thi TNKQ của nhà trường.
23
- Nhanh chóng áp dụng các phần mềm ra đề thi tự động, phần mềm thi
TNKQ trực tiếp trên máy tính. Áp dụng các kỹ thuật xử lý số liệu có trợ
giúp của máy tính trong phân tích, đánh giá chất lượng đề thi.
- Xây dựng một môi trường tương tác làm việc (trên mạmg iternet)
giữa bộ phận khảo thí với các giáo viên bộ môn sao cho giáo viên có thể