Kiểm tra tiêu chuẩn hóa trong kỳ thi theo tiêu chuẩn sat - Pdf 95

Kiểm tra tiêu chuẩn hóa trong kỳ thi
theo tiêu chuẩn sat
Có ý kiến cho rằng thử nghiệm được tiêu chuẩn hóa và ảnh hưởng của nó và thử
nghiệm tiêu chuẩn hóa và chính sách công được sáp nhập vào bài viết này. ( Thảo
luận ) đề xuất kể từ tháng Hai năm 2011.
Thanh niên ở Ba Lan ngồi để kỳ thi Matura . Các Matura là tiêu chuẩn để các trường đại học có thể dễ dàng so sánh kết
quả từ các sinh viên trên toàn quốc.
Bất kỳ thử nghiệm, trong đó cùng một thử nghiệm được đưa ra theo cách tương tự cho tất cả các thí sinh là
một thử nghiệm tiêu chuẩn hóa. Kiểm tra tiêu chuẩn hóa không cần phải là cao cổ phần kiểm tra , kiểm tra giới
hạn thời gian, hoặc kiểm tra trắc nghiệm .Đối diện của một bài kiểm tra tiêu chuẩn hóa là một thử nghiệm
không chuẩn . Kiểm tra không được tiêu chuẩn hóa cho các bài kiểm tra khác nhau đáng kể để thí sinh khác
nhau, hoặc cung cấp cho các thử nghiệm cùng một trong các điều kiện khác nhau đáng kể (ví dụ, một nhóm
được cho phép thời gian ít để hoàn thành các bài kiểm tra hơn so với nhóm tiếp theo), hoặc đánh giá họ khác
nhau (ví dụ, cùng một câu trả lời đúng được tính cho một học sinh, nhưng sai cho học sinh khác).
Kiểm tra tiêu chuẩn hóa được coi như là công bằng hơn so với các bài kiểm tra không được tiêu chuẩn
hóa. Tính nhất quán cũng cho phép so sánh các kết quả đáng tin cậy hơn trên tất cả các thí sinh.
Lịch sử
Trung Quốc
Bài viết chính: kiểm tra Imperial
Bằng chứng sớm nhất của thử nghiệm tiêu chuẩn là trong Trung Quốc ,
[ 1 ]
, nơi thi của triều đình bao phủ Sáu
Nghệ thuật bao gồm âm nhạc, bắn cung và cưỡi ngựa, số học, viết, và kiến thức về các nghi thức và nghi lễ
của cả hai phần công cộng và tư nhân. Sau đó, các phần về chiến lược quân sự, pháp luật dân sự, doanh thu
và thuế, nông nghiệp và địa lý đã được thêm vào thử nghiệm. Trong hình thức này, các kỳ thi đã được thể chế
hóa trong hơn một thiên niên kỷ.
Anh
Thử nghiệm tiêu chuẩn được đưa vào châu Âu trong những năm đầu thế kỷ 19, theo mô hình Trung
Quốc quan kiểm tra,
[ 2 ]
thông qua sự vận động của chính quyền thực dân Anh, hầu hết các "dai dẳng" trong số

hiện. Trong những trường hợp khác, các bài tiểu luận và phản ứng mở khác được phân loại theo một đánh giá
xác định trước phiếu đánh giá của học sinh lớp đào tạo.
Hoa Kỳ
Thông tin chi tiết: Danh sách các bài kiểm tra tiêu chuẩn ở Mỹ
Việc sử dụng các thử nghiệm tiêu chuẩn tại Hoa Kỳ là một hiện tượng của thế kỷ 20 với nguồn gốc của nó
trong Thế chiến I và Quân đội Alpha và Beta thử nghiệm được phát triển bởi Robert Yerkes và đồng nghiệp.
[ 4 ]
Tại Hoa Kỳ, sự cần thiết của chính phủ liên bang để so sánh có ý nghĩa trên một (kiểm soát tại địa phương) hệ
thống giáo dục công cộng cao de-tập trung cũng đã góp phần vào cuộc tranh luận về thử nghiệm tiêu chuẩn,
bao gồm Đạo luật Tiểu học và Trung học phổ thông năm 1965 với yêu cầu tiêu chuẩn hóa kiểm tra trong các
trường công. Mỹ Công Luật 107-110, được gọi là No Child Left Behind Act năm 2001, mối quan hệ tiếp tục tài
trợ các trường công lập để thử nghiệm tiêu chuẩn.
Thiết kế và chấm điểm
Một số thử nghiệm tiêu chuẩn sử dụng kiểm tra trắc nghiệm, tương đối rẻ tiền để ghi bàn, nhưng bất kỳ hình thức đánh giá
có thể được sử dụng.
Thử nghiệm tiêu chuẩn có thể bao gồm câu hỏi trắc nghiệm, câu hỏi đúng-sai, câu hỏi tiểu luận, đánh giá xác
thực , hoặc gần như bất cứ một sự đánh giá. Nhiều lựa chọn và đúng-sai mục thường được chọn vì chúng có
thể được đưa ra và ghi bàn không tốn kém và nhanh chóng bằng cách ghi tờ câu trả lời đặc biệt của máy tính
hoặc qua kiểm tra máy tính thích nghi . Một số xét nghiệm tiêu chuẩn có câu trả lời ngắn hoặc bài luận thành
phần văn bản được gán một số điểm đánh giá độc lập bởi người sử dụng chữ đỏ (quy định hoặc hướng dẫn)
và các giấy tờ chuẩn (ví dụ giấy tờ cho mỗi điểm có thể) để xác định các lớp được trao cho một phản
ứng. Hầu hết các đánh giá, tuy nhiên, không ghi được bởi những người, những người được sử dụng để vật
phẩm không thể được ghi dễ dàng bằng máy tính (ví dụ, các bài tiểu luận) ghi bàn. Ví dụ, thi Graduate
Record là một đánh giá máy tính thích nghi mà không cần điểm bởi những người (trừ phần văn bản).
[ 5 ]
Vấn đề điểm
Điểm con người thường có thể thay đổi, đó là lý do tại sao máy tính chấm điểm được ưa thích khi có thể. Ví
dụ, một số người tin rằng nhân viên được trả lương sẽ ghi các bài kiểm tra nặng.
[ 6 ]
Hiệp định giữa cầu thủ ghi

viên 2: Câu trả lời này là chính xác, nhưng
sinh viên tốt này sẽ có thể làm tốt hơn thế,
vì vậy tôi sẽ chỉ cung cấp cho một phần tín
dụng.
Sinh viên # 2:
Thế chiến II đã được gây ra bởi nhiều yếu tố, bao gồm cả
cuộc Đại suy thoái và tình hình kinh tế nói chung, sự gia
tăng của chủ nghĩa dân tộc, chủ nghĩa phát xít, chủ nghĩa
bành trướng đế quốc và, và oán giận chưa được giải quyết
liên quan đến Thế chiến I. Cuộc chiến tranh ở châu Âu đã
bắt đầu với cuộc xâm lược của Đức Ba Lan.
Giáo viên # 1:
Câu trả lời này đề cập đến một trong
những mặt hàng cần thiết, vì vậy nó là
chính xác. Giáo viên 2: Câu trả lời này là
đúng.
Giáo viên # 1:
Tôi cảm thấy như câu trả lời này là chính
xác và đầy đủ, vì vậy tôi sẽ cung cấp tín
dụng đầy đủ. Giáo viên # 2: Tôi cảm thấy
như câu trả lời này là chính xác, vì vậy tôi
sẽ cung cấp cho toàn bộ số điểm.
Sinh viên # 3:
Thế chiến II đã được gây ra bởi các vụ ám sát hoàng tử
nước Áo Ferdinand.
Giáo viên # 1:
Câu trả lời này không đề cập đến bất kỳ
các mặt hàng cần thiết. . Không có
điểm giáo viên # 2: Câu trả lời này là
sai. Không có tín dụng.

Tiêu chuẩn đánh giá
Trong lĩnh vực đánh giá , và đặc biệt là đánh giá giáo dục , các Uỷ ban Hỗn hợp về tiêu chuẩn đánh giá cho
giáo dục
[
8
]
đã công bố ba bộ tiêu chuẩn đánh giá. Các tiêu chuẩn đánh giá nhân sự
[ 9 ]
được xuất bản năm
1988, Tiêu chuẩn đánh giá Chương trình (2 phiên bản)
[ 10 ]
được xuất bản vào năm 1994, và Tiêu chuẩn đánh
giá sinh viên
[ 11 ]
được xuất bản vào năm 2003.
Mỗi ấn phẩm trình bày và trau chuốt một bộ tiêu chuẩn để sử dụng trong một loạt các môi trường giáo
dục. Các tiêu chuẩn hướng dẫn cho việc thiết kế, thực hiện, đánh giá và cải thiện các hình thức xác định đánh
giá. Mỗi phòng trong số các tiêu chuẩn đã được đặt trong một trong bốn loại cơ bản để thúc đẩy giáo dục đánh
giá thành phần phù hợp, hữu ích, khả thi, và chính xác.Trong các bộ tiêu chuẩn, giá trị và độ tin cậy cân nhắc
được bảo hiểm theo chủ đề chính xác. Ví dụ, các tiêu chuẩn chính xác sinh viên giúp đảm bảo rằng các đánh
giá sinh viên sẽ cung cấp âm thanh, chính xác và đáng tin cậy thông tin về học tập và thành tích học sinh.
Tiêu chuẩn thử nghiệm
Trong lĩnh vực psychometrics , các tiêu chuẩn về giáo dục và tâm lý kiểm tra
[

nhau hoặc các điều kiện khác nhau cho sinh viên theo chủng tộc, tình trạng kinh tế xã hội, hoặc cân nhắc
khác.
Nhược điểm và phê bình
"Bài kiểm tra tiêu chuẩn hóa không thể đo lường chủ động, sáng tạo, trí tưởng tượng, tư duy khái niệm, sự tò
mò, nỗ lực, sự mỉa mai, sự phán xét, cam kết, sắc thái, thiện chí, phản ánh đạo đức, hoặc một loạt các khuynh
hướng khác có giá trị và các thuộc tính. Những gì họ có thể đo đếm là những kỹ năng bị cô lập, sự kiện và
chức năng cụ thể, nội dung kiến thức, ít nhất là thú vị và các khía cạnh quan trọng nhất của việc học tập. "
- Bill Ayers
[
14
]

Kiểm tra tiêu chuẩn hóa là những công cụ hữu ích để đánh giá thành tích học sinh, và có thể được sử dụng để
tập trung hướng dẫn về kết quả mong muốn, chẳng hạn như kỹ năng đọc và toán.
[ 15 ]
Tuy nhiên, các nhà phê
bình cảm thấy rằng sử dụng quá nhiều và lạm dụng các xét nghiệm tác hại giảng dạy và học tập bằng cách thu
hẹp chương trình giảng dạy . Theo nhómFairTest , khi kiểm tra tiêu chuẩn hóa là yếu tố chính trong trách
nhiệm, trường học sử dụng các xét nghiệm để xác định chương trình giảng dạy trong gang tấc và hướng dẫn
tập trung.FairTest nói rằng hậu quả tiêu cực của việc lạm dụng xét nghiệm bao gồm thu hẹp chương trình
giảng dạy, giảng dạy để thử nghiệm, thúc đẩy học sinh ra khỏi trường học, giáo viên lái xe ra khỏi nghề nghiệp,
và phá hoại sự tham gia của sinh viên và khí hậu học. Những người chỉ trích nói rằng " dạy để kiểm
tra "disfavors học tập bậc cao. Mặc dù có thể sử dụng một bài kiểm tra tiêu chuẩn hóa mà không cho phép nội
dung của nó xác định chương trình đào tạo và giảng dạy, thường xuyên, những gì không được thử nghiệm

được cung cấp trong hai câu trả lời này.
Diện tích = 7,5 cm
2
Cơ sở = 5 cm; Chiều cao = 3 cm
Diện tích =
1
/
2
(Base × Chiều Cao)
=
1
/
2
(5 cm x 3 cm)
= 7,5 cm
2
Các chương trình đầu tiên ghi được mất thông tin. Giáo viên biết xem học sinh có câu trả lời đúng, nhưng không biết làm
thế nào sinh viên đến câu trả lời. Nếu câu trả lời là sai, giáo viên không biết liệu các sinh viên đã đoán, thực hiện một lỗi
đơn giản, hoặc về cơ bản hiểu sai chủ đề.
Khi thử nghiệm được ghi phải sai , một giả định quan trọng đã được thực hiện về học tập. Số lượng ngay câu
trả lời hoặc tổng điểm mục (trong đó tín dụng một phần được đưa ra) được giả định là các biện pháp thích hợp
và đầy đủ về tình trạng hoạt động hiện tại. Ngoài ra, một giả định thứ được thực hiện mà không có thông tin có
ý nghĩa trong saicâu trả lời.
Ở nơi đầu tiên, một câu trả lời chính xác có thể đạt được bằng cách sử dụng ghi nhớ mà không cần bất kỳ sự
hiểu biết sâu sắc về nội dung cơ bản hoặc cấu trúc khái niệm của vấn đề đặt ra. Thứ hai, khi có nhiều hơn một
bước để giải quyết được yêu cầu, thường có nhiều cách tiếp cận để trả lời đó sẽ dẫn đến một chính xác kết
quả. Thực tế là câu trả lời là đúng không chỉ ra của một số thủ tục có thể được sử dụng. Khi học sinh cung cấp
câu trả lời (hoặc cho công việc) thông tin này là có sẵn từ các tài liệu ban đầu.
Thứ hai, nếu sai câu trả lời là mù đoán, sẽ không có thông tin được tìm thấy trong số những câu trả lời. Mặt
khác, nếu sai câu trả lời phản ánh khởi hành giải thích từ một trong những mong đợi, những câu trả lời sẽ hiển

Trong số những phát hiện khác, chương này báo cáo rằng các thông tin thu hồi giải thích giữa hai và
ba lần của sự thay đổi thử nghiệm hơn xem xét chỉ câu trả lời đúng. Này mất lớn thông tin có thể được giải
thích bởi thực tế là các câu trả lời "sai" được loại bỏ từ các thông tin kiểm tra được thu thập trong quá trình
chấm điểm và không còn có sẵn để lộ ra lỗi thủ tục vốn có trong điểm phải sai. Các thủ tục bỏ qua những hạn
chế sản xuất bởi sự phụ thuộc tuyến tính vốn có trong dữ liệu thử nghiệm.
Kiểm tra thiên vị xảy ra khi một thử nghiệm hệ thống ủng hộ một nhóm khác hơn, mặc dù cả hai nhóm đều
bình đẳng về đặc điểm các biện pháp kiểm tra. Những người chỉ trích cáo buộc rằng các nhà sản xuất kiểm tra
và hỗ xu hướng đại diện cho một tầng lớp trung lưu, nền trắng. Các nhà phê bình cho rằng thử nghiệm tiêu
chuẩn phù hợp với các giá trị, thói quen, và ngôn ngữ của các nhà sản xuất kiểm tra
[ cần dẫn nguồn ]
. Tuy nhiên, là
hầu hết các bài kiểm tra đến từ một màu trắng, tầng lớp trung lưu nền, điều quan trọng cần lưu ý là các nhóm
điểm cao nhất không phải là người của nền tảng đó, nhưng thay vì có xu hướng đến từ dân cư châu Á.
Không phải tất cả các bài kiểm tra là tốt bằng văn bản, ví dụ, có chứa câu hỏi trắc nghiệm với câu trả lời không
rõ ràng, hoặc bảo hiểm nghèo của chương trình mong muốn. Một số xét nghiệm tiêu chuẩn bao gồm các câu
hỏi bài luận, và một số người đã chỉ trích hiệu quả của các phương pháp phân loại. Gần đây, chấm điểm trên
máy vi tính một phần của bài tiểu luận đã được giới thiệu cho một số xét nghiệm, mà thậm chí còn gây nhiều
tranh cãi.
[ 23 ]
Quyết định giáo dục
Điểm thi là trong một số trường hợp sử dụng như một tiêu chuẩn duy nhất, bắt buộc, hoặc chính cho nhập học
hoặc giấy chứng nhận. Ví dụ, một số tiểu bang Hoa Kỳ yêu cầu các kỳ thi tốt nghiệp trung học . Điểm số đầy
đủ về các kỳ thi ra được yêu cầu để tốt nghiệp trung học. Các phát triển giáo dục chung thử nghiệm thường
được sử dụng như là một thay thế cho một bằng tốt nghiệp trung học.
Các ứng dụng khác bao gồm theo dõi (quyết định một sinh viên phải được ghi danh vào "nhanh" hay "chậm"
phiên bản của một khóa học) và trao học bổng. Tại Hoa Kỳ, nhiều trường cao đẳng và đại học tự động dịch
điểm trên Advanced Placement kiểm tra vào tín chỉ đại học, đáp ứng yêu cầu tốt nghiệp, hoặc vị trí trong các
khóa học nâng cao hơn. Kiểm tra tổng quát như SAT hoặcGRE thường được sử dụng như một biện pháp
trong số nhiều, khi đưa ra quyết định nhập học. Một số tổ chức công cộng có điểm cắt cho kỳ thi SAT, điểm
trung bình , hoặc cấp bậc lớp học, để tạo các lớp của ứng tự động chấp nhận hoặc từ chối.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status