Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
SỞ GIÁO DỤC VÀ ĐÀO TẠO ĐỒNG NAI
Đơn vị: Trung Tâm GDTX Nhơn Trạch
Mã số: ……………………………
(Do HĐKH sở GD&ĐT ghi)
SÁNG KIẾN KINH NGHIỆM
XÂY DỰNG HỆ THỐNG DỰ ĐOÁN KẾT QUẢ
HỌC TẬP CỦA HỌC SINH
Người thực hiện: Nguyễn Bảo Nam
Lĩnh vực nghiên cứu :
Quản lý giáo dục:
Phương pháp dạy học bộ môn:
Phương pháp giáo dục:
Lĩnh vực khác: Tin học
Có đính kèm:
Mô hình Phần mềm Phim ảnh Hiện vật khác
Năm học: 2012 – 2013
Trang 1
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
SƠ LƯỢC LÝ LỊCH KHOA HỌC
I. THÔNG TIN CHUNG VỀ CÁ NHÂN
1. Họ và tên: Nguyễn Bảo Nam
2. Ngày tháng năm sinh: 21/03/1975
3. Nam, nữ: Nữ
4. Điạ chỉ: Xã Hiệp Phước, Huyện Nhơn Trạch, Tỉnh Đồng Nai
5. Điện thoại: (CQ): (NR) ĐTDĐ: 0909269820
6. Fax: E-mail:
7. Chức vụ: Giáo viên
8. Đơn vị công tác: Trung Tâm GDTX Nhơn Trạch
gần đây nhiều nhà nghiên cứu đã đề xuất những phương pháp, kỹ thuật mới nhằm
phân tích xử lý một cách hiệu quả trên các cơ sở dữ liệu để tìm các thông tin tìm
ẩn, tuy rất ít so với khối lượng dữ liệu rất lớn nhưng rất quan trọng.
Có thể xem cơ sở dữ liệu điểm học sinh như là một cơ sở dữ liệu chuỗi thời
gian. Kết quả học tập của học sinh được đánh giá theo từng học kỳ từ lớp 6 đến lớp
12 theo thứ tự thời gian, kết quả học tập của học sinh toàn trường là một cơ sở dữ
liệu chuỗi thời gian. Sau đó sử dụng kỹ thuật khai phá dữ liệu để khám phá tri thức
từ cơ sở dữ liệu điểm học sinh.
Đây chính là mục tiêu của đề tài : “Xây dựng hệ thống dự đoán kết quả học
tập của học sinh”.
II. TỔ CHỨC THỰC HIỆN ĐỀ TAI
1. Cơ sở lý luận
- Huyện Nhơn Trạch, tỉnh Đồng Nai là huyện có 10 trường trung học cơ sở, 3
trường trung học phổ thông và 1 Trung tâm GDTX, huyện có tỷ lệ đậu tốt nghiệp
trung học phổ thông rất thấp so với các huyện trong tỉnh Đồng Nai. Đa số các em
có học lực từ yếu đến trung bình ở những năm học cấp hai. Làm thế nào đó để sau
khi học xong chương trình phổ thông các em có thể đậu tốt nghiệp trung học phổ
thông đó là đều rất mong muốn của phụ huynh cũng như những nhà quản lí giáo
dục ở địa phương.
- Với mong muốn được giúp đỡ cho các em và phụ huynh thấy được con
đường học vấn trong tương lai, đó là khả năng đậu tốt nghiệp của mình như thế nào
để ngay từ ban đầu học sinh có ý thức hơn trong việc học. Cùng với sự cố gắng của
Trang 3
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
học sinh, không thể thiếu sự quan tâm, tạo điều kiện thuận lợi từ phía phụ huynh.
Hơn nữa, về phía lãnh đạo nhà trường cũng đề ra các biện pháp nhằm giúp đỡ các
em có một kết quả học tập tốt hơn trong tương lai.
- Một trong các cách đó là chúng ta cần cho học sinh thấy trước kết quả học
tập trong tương lai dựa vào một hệ thống có khả năng dự đoán khả năng đậu tốt
nghiệp trung học phổ thông của các em. Ứng dụng trên cơ sở dữ liệu điểm học sinh
6 4.0 3.5 4.5 4.9 6.5 6.6 6.5 6.5
7 5.0 5.2 6.0 5.6 6.0 6.1 5.9 6.0
8 3.6 4.0 4.2 4.5 6.0 5.7 6.0 5.7
9 3.5 3.7 4.0 4.5 4.8 4.8 4.4 4.8
… … … … … … … … … … …
- Sử dụng các kỹ thuật khai phá trên cơ sở dữ liệu chuỗi thời gian để khám
phá tri thức trên cơ sở dữ liệu mới nhận được dạng này.
Trang 4
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Kết quả nhận được là các luật biểu diễn mối quan hệ giữa các kết quả theo
thời gian. Với kết quả hiện có thì kết quả đạt được tiếp theo là gì?
Kết quả nhận được như sau:
If HK1, Toán = Kém HK2, Toán = Kém, . . . HK14, Toán = Kém
If HK1, Lý = TB HK2, Lý = TB, . . . HK14, Lý = TB
If HK1, AnhVan = K HK2, AnhVan = K, . . . HK14, Anh văn = Khá
. . .
If HK1, DiemTB = G HK2, DiemTB = G, . . . HK14, DiemTB = G
Mục tiêu là đưa ra thông tin của các luật sẽ hữu dụng cho quá trình quản lý
giáo dục, nhất là dự đoán và hoạch định phương pháp nâng cao chất lượng trong
trường phổ thông.
b. Biện pháp thực hiện
Dữ liệu sử dụng trong chương trình được thu thập trên 10 trường THCS, 3
trường trung học phổ thông và 1 Trung tâm GDTX trong huyện Nhơn Trạch. Do
các kết quả tổng kết điểm của học sinh trong các trường phổ thông được thực hiện
và lưu trữ bằng nhiều phần mềm khác nhau như Microsoft Access, Excel, Foxpro,
…nên ta cần chuyển dữ liệu về một dạng thống nhất là SQL Server. Trong các
bảng điểm tổng kết này thứ tự các môn học được thực hiện theo qui định của Bộ
giáo dục. Các bảng điểm thì có nhiều cột điểm như: điểm miệng, 15 phút, 1 tiết và
điểm thi, ta cần lọc các thông tin này. Trên cơ sở dữ liệu, mỗi dòng biểu diễn kết
quả của một học sinh. Kết quả của mỗi học kỳ được lưu trữ trong một bảng, có tất
gian thể hiện sự biến động về năng lực học sinh. Việc dự đoán tiến hành trên toàn
bộ cơ sở dữ liệu cho thông tin về dự báo kết quả học tập của học sinh.
Trong đề tài này chỉ tập trung dự đoán điểm tổng kết theo từng học kỳ của
ba môn học Toán, Lý, Anh văn và điểm tổng kết từng học kỳ của 13 môn học.
Kết quả học tập của học sinh được được đánh giá làm 5 loại: Giỏi, Khá, TB,
Yếu, Kém.
Tiêu chuẩn xếp loại như sau:
DiemTB>=8.0: Xếp loại Giỏi
DiemTB>=6.5 và DiemTB<8.0: Xếp loại Khá
DiemTB>=5.0 và DiemTB<6.5: Xếp loại TB
DiemTB>=3.5 và DiemTB<5.0: Xếp loại Yếu
DiemTB<3.5: Xếp loại Kém
Ta chỉ cần duyệt qua cơ sở dữ liệu một lần, mỗi lần gặp một giá trị điểm ta
thay nó bằng loại tương ứng. Sau bước này ta xây dựng được cơ sở dữ liệu có
dạng:
MaSV Toan1 Ly1 AV1 HK1 … … Toan14 Ly14 AV14 HK14
1 Y TB K Kem … … K TB G G
2 TB K Kem TB G K Y K
3 Y TB Kem K G TB K TB
… … … … … … … … … … …
Khi cài đặt chương trình dùng các số nguyên để ghi nhận các giá trị phân
loại như sau: Số 1 đại diện loại Kém, số 2 đại diện loại Yếu, số 3 đại diện loại TB,
số 4 đại diện loại Khá, số 5 đại diện loại Giỏi.
MaSV Toan1 Ly1 AV1 HK1 … … Toan14 Ly14 AV14 HK14
1 2 3 4 1 … … 4 3 5 5
2 3 4 1 3 5 4 2 4
3 2 3 1 4 5 2 4 3
… … … … … … … … … … …
Toàn bộ kết quả phân loại đặt trong một mảng 2 chiều và được sử dụng cho
nhiều thuật toán khác nhau.
- Để thực hiện quá trình dự đoán, ta chọn chức năng Hiển thị dữ liệu rồi mới
thực hiện các công việc khác chương trình sẽ liệt kê như sau:
+ Dữ liệu gốc là các điểm tổng kết từng học kỳ của 3 môn học Toán, Lý,
Anh văn và điểm tổng kết theo từng học kỳ (từ lớp 6 đến lớp 12).
+ Dữ liệu đã qua biến đổi được phân loại như sau: Kém (số 1), Yếu( số 2),
TB(số 3), Khá(số 4), Giỏi(số 5).
Trang 9
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Màn hình gom cụm (Cluster):
Hình 3. Giao diện gom cụm dữ liệu
- Chọn “Cluster Data” để gom cụm dữ liệu, nhập số lượng cần gom cụm (tùy
ý), sau đó chọn chức năng “Gom cụm”.
- Kết quả xuất là trọng tâm của nhóm là 14 học kỳ, gồm điểm TB, Toán, Lý,
Anh văn sau khi gom cụm và tỉ lệ phần trăm của chúng trong cơ sở dữ liệu.
Trang 10
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Màn hình dự đoán kết quả:
- Chọn chức năng “Dự đoán TB”: Xuất kết quả dự đoán điểm trung bình
của học sinh qua 14 học kỳ.
Hình 4. Giao diện dự đoán điểm trung bình
Trang 11
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Chọn chức năng “Dự đoán Toán”: Xuất kết quả dự đoán điểm Toán của
học sinh qua 14 học kỳ.
Hình 5. Giao diện dự đoán điểm toán
Trang 12
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
- Chọn chức năng “Dự đoán Lý”: Xuất kết quả dự đoán điểm Lý của học sinh qua
14 học kỳ.
Hình 6. Giao diện dự đoán điểm lý
- Qua các kết quả gom cụm ta có thể nhận ra các mẫu phổ biến nào chiếm tỷ
lệ cao trong cơ sở dữ liệu, nhờ đó mà giáo viên có thể đánh giá chính xác về tình
hình chất lượng của học sinh để có hướng giảng dạy tốt hơn trong giai đoạn sắp
tới.
Trang 15
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
b. Đánh giá kết quả thử nghiệm
Kết quả thử nghiệm dự đoán kết quả học tập của học sinh đã được trình bày
ở trên. Dữ liệu đưa vào khai phá khoảng 3.000 học sinh, ta thu được kết quả như
sau:
Dùng thuật toán K-Mean để gom cụm dữ liệu học sinh:
Dữ liệu đầu vào:
- Dữ liệu đưa vào khai phá 3.000 học sinh.
- Số cụm n = 4, thực hiện gom cụm trong 4 lần.
Kết quả:
- Gom cụm theo điểm TB: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ lệ
trong khoảng từ 18% - 19% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả TB,
khá chiếm tỉ lệ trong khoảng 20% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả
kém, yếu, TB chiếm tỉ lệ trong khoảng 9% trong toàn bộ dữ liệu. Nhóm học sinh
có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 21% - 55% trong toàn bộ dữ
liệu.
- Gom cụm theo điểm Toán: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ
lệ trong khoảng từ 16% - 30% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả
TB, khá chiếm tỉ lệ trong khoảng 35% - 44% trong toàn bộ dữ liệu. Nhóm học sinh
có kết quả kém, yếu, TB chiếm tỉ lệ trong khoảng 10% - 18% trong toàn bộ dữ
liệu. Nhóm học sinh có kết quả yếu, TB, khá chiếm tỉ lệ trong khoảng từ 29% -
55% trong toàn bộ dữ liệu.
- Gom cụm theo điểm Lý: Nhóm học sinh có kết quả khá, giỏi chiếm tỉ lệ
trong khoảng từ 12% - 17% trong toàn bộ dữ liệu. Nhóm học sinh có kết quả TB,
khá chiếm tỉ lệ trong khoảng 41% - 49% trong toàn bộ dữ liệu. Nhóm học sinh có
như là phù hợp. Để đạt được độ tin cậy của một số luật cao có thể cung cấp thông
tin hữu ích cho việc dự đoán.
IV. ĐỀ XUẤT, KIẾN NGHỊ KHẢ NĂNG ÁP DỤNG
- Do thời gian thực hiện đề tài có hạn nên mới chỉ tập trung dự đoán một số
môn như: Toán, Lý, Anh văn và điểm TB từng học kỳ( 14 học kỳ) còn các môn
còn lại chưa đưa vào chương trình để dự đoán. Hướng tới có thể dự đoán tất cả các
môn học còn lại.
- Chương trình còn mang tính minh họa cho thuật toán, giao diện chưa được
đẹp mắt, để sử dụng hiệu quả cần cài đặt thêm vài chức năng và các hướng dự
đoán khác để hoàn chỉnh và ứng dụng hiệu quả cho nhiều lĩnh vực khác nhau. Giúp
đỡ rất nhiều cho giáo viên và các nhà quản lý giáo dục trong việc cải thiện chất
lượng đào tạo.
- Bản thân tôi cũng mới bước đầu xây dựng phần mềm này trong quá trình
viết chương trình còn nhiều thiếu sót, nhưng được sự giúp đỡ của các đồng nghiệp
và đặc biệt là được sự hướng dẫn tận tình của PGS. TS Đỗ Phúc Trưởng ban đối
ngoại Đại học Quốc Gia TP. Hồ Chí Minh đến nay phần mềm đã hoàn thành. Cuối
cùng xin chân thành cảm ơn các đồng nghiệp và PGS.TS Đỗ Phúc đã giúp đỡ và
tạo điều kiện thuận lợi cho tôi trong suốt quá trình thực hiện đề tài “Xây dựng hệ
thống dự đoán kết quả học tập của học sinh”. Một lần nữa xin chân thành cám ơn.
V. TÀI LIỆU THAM KHẢO
1. Thông tư số: 58/2011/TT-BGDĐT ngày 12 tháng 12 năm 2011của Bộ trưởng Bộ
Giáo dục và Đào tạo.
2. Quyết định số 02/2007/QĐ-BGDĐT ngày 23/01/2007 của Bộ trưởng Bộ
GD&ĐT V/v ban hành Qui chế đánh giá xếp loại học viên theo học chương trình
GDTX cấp THCS và cấp THPT
3. Nhà kho và khai mỏ dữ liệu, Đỗ Phúc (2003), NXB Đại học quốc gia TP Hồ Chí
Minh.
4. Phát triển một số ứng dụng khai thác dữ liệu vào giáo dục đào tạo, Nguyễn Quốc
Thông (2002), Luận văn thạc sĩ, Trường Đại Học Khoa Học Tự Nhiên TP. Hồ Chí
Minh.
+ Chọn biểu tượng Start Debugging trên thanh công cụ hoặc nhấn phím F5.
Trang 18
Trung Tâm GDTX Nhơn Trạch GV: Nguyễn Bảo Nam
SỞ GD&ĐT ĐỒNG NAI
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc
………, Trạch, ngày tháng … năm 2013
PHIẾU NHẬN XÉT, ĐÁNH GIÁ SÁNG KIẾN KINH NGHIỆM
Năm học: 2012 - 2013
–––––––––––––––––
Tên sáng kiến kinh nghiệm: Xây dựng hệ thống dự đoán kết quả học tập của học sinh
Họ và tên tác giả: Nguyễn Bảo Nam Đơn vị (Tổ): GDTX Nhơn Trạch (Hướng Nghiệp
Nghề)
Lĩnh vực:
Quản lý giáo dục Phương pháp dạy học bộ môn: …………
Phương pháp giáo dục Lĩnh vực khác: Tin học
1. Tính mới
- Có giải pháp hoàn toàn mới
- Có giải pháp cải tiến, đổi mới từ giải pháp đã có
2. Hiệu quả
- Hoàn toàn mới và đã triển khai áp dụng trong toàn ngành có hiệu quả cao
- Có tính cải tiến hoặc đổi mới từ những giải pháp đã có và đã triển khai áp dụng trong
toàn ngành có hiệu quả cao
- Hoàn toàn mới và đã triển khai áp dụng tại đơn vị có hiệu quả cao
- Có tính cải tiến hoặc đổi mới từ những giải pháp đã có và đã triển khai áp dụng tại đơn vị
có hiệu quả
3. Khả năng áp dụng
- Cung cấp được các luận cứ khoa học cho việc hoạch định đường lối, chính sách:
Tốt Khá Đạt