Phân tích thống kê hiệu quả đào tạo cao đẳng tại trường Đại học Sao Đỏ - Pdf 25

1

PHÂN TÍCH THỐNG KÊ HIỆU QUẢ ĐÀO TẠO
CAO ĐẲNG TẠI TRƯỜNG ĐẠI HỌC SAO ĐỎ
LUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội – Năm 2013
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
PHAN VĂN TÁC
1

PHÂN TÍCH THỐNG KÊ HIỆU QUẢ ĐÀO TẠO
CAO ĐẲNG TẠI TRƯỜNG ĐẠI HỌC SAO ĐỎ
Chuyên ngành: Lí thuyết Xác suất và Thống kê toán học
Mã số: 60 46 15
1.3.1 Ký hiệu 38
1.3.2. Mô hình 38
1.3.3 Phân bố mẫu của các tổng bình phương 40
1.3.4. Kiểm tra tham số trên tập hợp con 40
1.3.5 Phép kiểm định phù hợp 42
1.3.6 Trường hợp độ biến động không thuần nhất 45
1.3.7 Phân bố không chuẩn và mô hình tuyến tính suy rộng 46
Chương 2: PHÂN TÍCH SỐ LIỆU 49
2.1 Khái quát về trường Đại học Sao Đỏ 49
2.2 Dữ liệu dùng trong nghiên cứu 50
2.3 Phân tích số liệu 51
2.3.1 Phân tích tác động riêng rẽ các nhân tố lên kết quả học tập 51
2.3.2 Phân tích tác động đồng thời của nhiều nhân tố lên kết quả học tập 65
2.3.3 Phân tích tác động của nhiều nhân tố lên mức độ tiến bộ của sinh viên 78
KẾT LUẬN 90
TÀI LIỆU THAM KHẢO 93
PHỤ LỤC 94

3 LỜI MỞ ĐẦU
Trong suốt cuộc đời cách mạng của mình, Chủ tịch Hồ Chí Minh đã dành
những tâm tư và tình cảm đặc biệt đối với sự nghiệp giáo dục của nước nhà.
Trong di sản tư tưởng của Người để lại, có tới hơn 592 lần nhắc đến “giáo
dục”, 159 lần nhắc đến “đào tạo”, trên 190 lần nhắc đến “trường học”, gần
100 lần nhắc đến “đại học”, 92 lần nhắc đến “trường học, giáo sư”, 81 lần
nhắc đến “giáo viên”, 80 lần nhắc đến “thầy giáo”, khoảng 145 lần nhắc đến
“sinh viên” và đến 225 lần nhắc đến “học sinh” Người coi “con người” là
vốn quý nhất, là yếu tố quyết định của sự nghiệp cách mạng. Người cũng

và học tại trường Đại học Sao Đỏ. Với số liệu thu thập được từ ba khoa: khoa
Điện, khoa Điện tử -Tin học và khoa Kinh tế của trường Đại học Sao Đỏ,
bằng các phương pháp thống kê thích hợp, luận văn này mong muốn chỉ ra
được các nhân tố ảnh hưởng đến kết quả học tập của sinh viên nhằm đưa ra
những đề xuất giúp nâng cao chất lượng học tập của sinh viên trường Đại học
Sao Đỏ.
Sau Lời mở đầu, luận văn này sẽ có hai chương, Kết luận, Danh mục tài liệu
tham khảo và phần phụ lục chứa các câu hỏi điều tra. Chương 1 sẽ trình bày
các phương pháp phân tích thống kê được dùng chủ yếu trong nghiên cứu cụ
thể ở đây. Phương pháp phân tích bằng mô hình hồi quy tuyến tính được mô
tả súc tích, cô đọng, đảm bảo chính xác về mặt toán học. Mô hình phân tích
phương sai sẽ được trình bày dựa trên cơ sở phân tích phương sai một nhân
tố, hai nhân tố rồi mở rộng ba nhan tố và bốn nhân tố. Sau cùng là mô hình
tuyến tính tổng quát mở rộng của hai mô hình trên.
5

Chương 2 gồm ba mục lớn. Mục một và hai được dành riêng cho việc mô tả
đối tượng nghiên cứu, phương pháp lấy mẫu, thu thập và tổ chức giữ liệu.
Mục ba sử dụng phần mềm SPSS tiến hành tất cả các tính toán và phân tích.
Để đánh giá các nhân tố ảnh hưởng thực sự đến kết quả học tập của từng học
kỳ và tác động lên sự tiến bộ của học kỳ sau so với kỳ trước.
Cuối cùng là phần Kết luận để bàn luận về các kết quả thu được. Các nhân tố
ảnh hưởng thực sự đến kết quả học tập của sinh viên đưa ra một số đề suất
nhằm nâng cao chất lượng học tập của sinh viên.
Luận văn này được hoàn thành dưới sự hướng dẫn của PGS.TS Hồ Đăng
Phúc, chuyên gia của Viện toán học, Viện KHCN Việt Nam. Tôi xin bày tỏ
biết tỏ lòng biết ơn sâu sắc đối với sự quan tâm chỉ dẫn đầy nhiệt huyết của
thầy.
Tôi xin chân thành cám ơn các thầy giáo của khoa Toán -Cơ -Tin trường Đại
học tự nhiên –ĐHQG Hà Nội đã tham gia giảng dạy lớp cao học khóa 2009-

Y= b
0
+ b
1
X + e (1.1)

trong đó
e
là sai số ngẫu nhiên của mô hình. Y được gọi biến phụ thuộc hay
biến được giải thích hay đáp ứng. X được gọi biến độc lập hay biến giải thích.
Với (X,Y), giả sử ta đã biết n cặp giá trị quan sát {(X
1
, Y
1
),…(X
n
,Y
n
)} tạo
thành một “đám mây điểm” trên mặt phẳng (X,Y). Hãy tìm một đường thẳng

01
(1.2)Y b b X

để xấp xỉ đám mây điểm trên. Tại quan sát thứ i, (1.1) và (1.2) có dạng:
Y
i
=b
0
+ b

,bb
sao cho tổng bình
phương các sai lệch:
22
0 1 0 1
11
S ( , ) ( )
nn
i i i
ii
S b b e Y b b X

    



đạt cực tiểu.
Lấy đạo hàm riêng của S theo
0
b

1
b
rồi gán bằng 0, ta được hai phương
trình:
01
1
( ) 0
n
ii


2
0
1 1 1
n n n
i i i i
i i i
b X X X Y
  

  

Nghiệm của chúng là
0
1
(1.3)b Y b X


1 1 1 1 1
1
2 2 2 2 2
X
1 1 1 1
XY [( )( )]/ ( )( )
X ( ) / ( )
n n n n n
i i i i i i i i
i i i i i XY
n n n n
X

b
,
1
ˆ
b
là các điểm dừng. Để khẳng định
0
ˆ
b
,
1
ˆ
b
làm cực tiểu S, cần
lấy đạo hàm riêng bậc 2 của S theo
01
,bb
, ta có ma trận Hessian:
22
2
0 0 1
2
22
2
0 1 1
22
22
i
ii
SS

i i i i
X
H n X X n X n X X
n
      

   

nên H là ma trận xác đinh dương và điểm dừng chính là điểm cực tiểu của S.
Các giả thiết của mô hình hồi quy tuyến tính đơn
9

1) Các giá trị của biến độc lập X là không ngẫu nhiên (tất định) và
được xác định từ trước.
2) Sai số ngẫu nhiên có kỳ vọng bằng 0:
( ) 0Ee 

3) Sai số ngẫu nhiên có phương sai cố định:
2
ar(e)= V


4) Các sai số không tương quan với nhau:
cov( , ) 0,
ij
e e i j  

5) Sai số là đại lượng ngẫu nhiên có phân bố chuẩn:
 
2

ii
ii
Y Y Y Y
nn

  


d) Các giá trị dự báo không tương quan với các sai lệch:
ˆ
ˆ
cov( , ) 0eY 

e) Sai lệch không tương quan với biến độc lập:
ˆ
cov( , ) 0eX 

Định lý Gaus-Markov
Với các giả thiết từ 1 đến 5 của mô hình HQTT đơn, ước lượng BPBN của các
hệ số hồi quy là các ước lượng
- Tuyến tính
10

- Không chệch
- Có phương sai bé nhất (ước lượng hiệu quả) trong lớp các ước lượng
tuyến tính không chệch của các hệ số hồi quy.
Hệ số xác định
Tại mỗi quan sát của mẫu, ta xét sai lệch giữa giá trị quan sát và giá trị ước
lượng:


2
()
i
YY

= SST, tổng bình phương này thể hiện sự biến động của Y.
2
ˆ
()
i
YY

= SSR thể hiện sự biến động được giải thích bằng hồi quy.
2
ˆ
()
i
YY

= SSE thể hiện sự biến động không được giải thích bằng hồi
quy. Đây chính là độ biến động ngẫu nhiên của sai số.
Khi đó (1.5) trở thành
SST=SSR+SSE
Từ những khái niệm trên, ta có thể định nghĩa hệ số xác định
2
R
như sau:
2
R
= Biến động được giải thích bằng hồi quy/ Biến động tổng cộng

động
Bậc tự
do (df)
Tổng bình phương

Trung bình bình phương

F

Hồi quy
Sai lệch
1
n-2
SSR=
2
ˆ
()
i
YY


SSE=
2
ˆ
()
ii
YY


MSR=

liệu với mô hình. Cụ thể dữ liệu được coi là phù hợp với mô hình (hay nói
cách khác, mô hình Hồi quy tuyến tính đơn có ý nghĩa đối với số liệu), nếu
[1- ;1;n-2]
SR
S
M
FF
ME


.
Khoảng tin cậy và kiểm định giả thuyết và trong phân tích hồi quy
a) Ta muốn kiểm định giả thuyết
0
H
:
1
0b 
(đường hồi quy song song với trục
X) so với đối thuyết
1
H
:
1
0b 
dựa trên giá trị
1
ˆ
b
và phân phối của nó. Độ

( S )
2
ii
e
YY
S M E
n





Khoảng tin cậy
 
1%


của
1
b
là:
 
11
,
lh
bb

Trong đó,

1 1 1 /2; 2)



với
(1 /2; 2)n
t


là giá trị phân vị có được bằng cách tra bảng phân phối Student
với (n-2) bậc tự do và với mức ý nghĩa

.
Liên quan đến việc kiểm định
0
H
, Ta có thể dùng khoảng tin cậy trên đây:
Nếu
 
11
, 0
lh
bb
thì chấp nhận giả thiết b
1
=0. Nêu ngược lại, ta bác bỏ giả
thiết.
Ta cũng có thể kiểm định
0
H
bằng cách tính thống kê
 

0
.
b) Tương tự, ta tìm khoảng tin cậy của
0
b
và kiểm định giả thuyết
0
H
:
0
b
=0 so
với đối thuyết:
10
:0Hb
. Độ lệch chuẩn của
0
ˆ
b
được ký hiệu là S(
0
ˆ
b
) và được
cho bởi
2
0
2
()
()

i
l
ne
i
X
b b t S
n X X








2
0 0 1 /2; 2)
2
()
i
h
ne
i
X
b b t S
n X X





b
t
c
Sb


rồi so sánh
c
t
với giá trị tới hạn
(1 /2; 2)n
t


có được qua tra bảng. Lúc đó,
nếu
(1 /2; 2)cn
tt



thì chấp nhận giả thuyết H
0
: b
0
= 0 . Nếu ngược lại, ta bác bỏ
giả thuyết H
0
.
c) Xác định độ lệch chuẩn của

1
p
pe
i
XX
S Y S
n
XX



  





Giá trị trên đạt cực tiểu khi
p
XX
và tăng dần khi
p
X
dịch chuyển xa dần
X
theo cả 2 hướng. Như vậy, khi khoảng cách giữa
p
X

X


;
01
ˆˆ
b Y b X

3. Phân tách các nguồn biến động:
SST= SSR+SSE
SSR = SST-SSE
4. Tính hệ số xác định:
 
 
2
2
2
ˆ
11
ii
i
YY
SSR SST SSE SSE
R
SST SST SST
YY


     




2
22
0
1
b
X
sS
e
n
X nX







1/ 2
1
22
b
S
e
s
X nX






  





Ví dụ 1: Số lần vào/ ra đĩa và thời gian sử dụng CPU của 7 chương trình máy
tính được thống kê như sau: (14,2) (16,5), (27,7), (42,9) (39,10), (50,13),
(83,20). Hãy lập một mô hình tuyến tính để dự đoán thời gian sử dụng CPU
theo số lần vào/ra đĩa.
Ta có n=7,
22
3375, 13.855, 271, 66, 828XY X X Y Y    
    
. Do
đó
38,71X 

9,43.Y 

3375 7 38.71 9,43
ˆ
0,2438
1
2 2 2
13.855 7 (38.71)
XY nXY
b
X nX
  

01
ˆˆ
ˆ
ii
Y b b X

2
ˆ
ˆ
i i i
e Y Y

2
ˆ
i
e

2
5
7
9
10
13
20
14
16
27
42
39
50

một hàm tuyến tính của k biến dự báo
1, 2
, ,
k
X X X
:
0 1 1
, 1, ,
i i k ki i
Y b b X b X e i n     

trong đó
 
01
, ,
k
b b b
là k+1 tham số và e là sai số ngẫu nhiên. Giả sử ta có một
mẫu gồm n quan sát
   
 
11 21 1 1 1 2
, , , , , , , , , ,
k n n kn n
X X X Y X X X Y
. Mô hình bao
gồm n phương trình sau:
1 0 1 11 2 21 1 1

kk

       
       
       

       
       
       
       
       
       

hay
17

Y=Xb + e, (1.6)
trong đó
Y là véc tơ cột gồm n giá trị quan sát được của Y =
 
12
, , ,
n
Y Y Y
;
X là ma trận n hàng k+1 cột, với các giá trị của cột 1 luôn bằng 1;
b
là véc tơ cột gồm k+1 phần tử
 
01
, ,
k

e Y Y Y Xb

dạng
0 1 1 2 2
ˆ
( )
i i i i k ki
e Y b b X b X b X     

Véc tơ
 
'
12
ˆ ˆ ˆ ˆ
, , ,
n
e e e e 
là véc tơ các sai số. Véc tơ b được chọn sao cho tổng
bình phương các sai lệch sau đạt cực tiểu,
' ' ' ' ' ' ' ' ' ' ' ' '
( ) ( ) 2ee Y Xb Y Xb Y Y b X Y Y Xb b X Xb Y Y b X Y b X Xb         
(1.9)
(điều này suy ra từ việc
'
'b X Y
là ma trận 1

1 tức là hằng số nên ma trận
chuyển vị của nó chính bằng nó, (
' ' ' '

là không ngẫu nhiên (tất định)
và được xác định từ trước
2) Sai số ngẫu nhiên có kỳ vọng bằng 0 :
( ) 0Ee 

3) Sai số ngẫu nhiên có phương sai cố định:
2
ar(e)= V


4) Các sai số không tương quan với nhau:
cov( , ) 0,
ij
e e i j  

5) Sai số là đại lượng ngẫu nhiên có phân bố chuẩn:
 
2
0,
i
eN



Các tính chất của ước lượng
a) Ước lượng của các hệ số hồi quy là ước lượng không chệch:
   
 
1
2'




   


là ước lượng không chệch của
2

tức là:
 
22
ˆ
E



d) Các giá trị dự báo của các tham số và sai lệch không tương quan với
nhau:
   
2
ˆˆ
ˆˆ
cov , 0;cov , 0b e b



Các bước thực hiện khi dùng mô hình hồi quy tuyến tính bội
1. Xác định mô hình:
0 1 1

()b X X X Y



trong đó
'
X
là ma trận chuyển vị của ma trận X.
3. Phân tách các nguồn biến động:
SST= SSR+SSE
4. Tính hệ số xác định:
2
R
=
SSR SST SSE
SST SST



5. Tính hệ số tương quan bội:
SSR
R
SST


6. Xác định bậc tự do cho các nguồn biến động: Các tổng bình phương sai số
SST, SSR và SSE có các bậc tự do tương ứng là (n-1), k và (n-k+1);
7. Tính các độ biến động trung bình
MSR=
SSR

C
là phần tử
20

thứ j trên đường chéo của ma trận
'1
()C X X


.
10. Tiến hành dự báo: Với một quan sát mới, ta có

0 1 2
12

p
k
p p kp
Y b b X b X b X    
   

11. Xác định độ lệch tiêu chuẩn của dự báo:
' ' 1
ˆ
S 1 ( ) .
p
e p p
Y
S X X X X



Dung lượng bộ
nhớ
2i
X

2
5
7
9
10
13
20
14
16
27
42
39
50
83
70
75
144
190
210
235
400
Trong trường hợp này ta có:
X =
1 14 70



C=
 
1
'
XX

=
0,6297 0,0223 0,0071
0,0223 0,0280 0,0058
0,0071 0,0058 0,0012









Các hệ số hồi quy sẽ là
' 1 '
ˆ
()b X X X Y


= (-0,1614, 0,1182, 0,0265)
Như vậy, ta có phương trình
Thời gian sd CPU = - 0,1614 +0,1182 lần vào ra đĩa +0,0265 dung lượng bộ

10
13
20
14
16
27
42
39
50
83
70
75
144
190
210
235
400
3,3490
3,1780
6,8472
9,8400
10.0151
11.9793
30,2589
-1,3490
1,2820
0,1528
-0,8400
-0,0151
1,0217

sai số
22

3
5,3/ 4 1.2
SSE
e
n
s

  
.
Để minh hoạ cho dự báo, ta xét trường hợp một quan sát riêng lẻ trong tương
lai với
1
100x 

2
550x 
. Giá trị trung bình dự báo được cho bởi
1 0 1 1 2 2
ˆ ˆ ˆ
ˆ
0,1614 0,1182(100) 0,0265(550) 26,2375
p
Y b b X b X       

Độ lệch tiêu chuẩn của quan sát dự báo là
 
 

Sử dụng ký hiệu tương ứng trong Bảng 1.2, phương trình trên được viết lại
thành
Y = µ + A + B + C + … + AB + AC + BC +…+S(nhóm)
23

trong đó,
 Y là giá trị thực nghiệm đo được của đại lượng cần nghiên cứu;
 µ là phần trung bình chung cho tất cả các quan sát, đại diện cho hiệu
quả chung của thí nghiệm;
 A, B, C,…, là các phần tác động chính của các nhân tố trong mô hình,
ảnh hưởng lên giá trị của đại lượng cần nghiên cứu.
 AB, BC, CA, … là tương tác giữa các nhân tố, AB, BC, CA là tương tác
hai chiều, trong mô hình còn có thể có các tương tác ba chiều ABC;
ABD; ACD; BCD và tương tác bốn chiều ABCD.
 S(nhóm) là sai số ngẫu nhiên trong mô hình, được tính bằng độ sai lệch
giữa giá trị của đại lượng cần nghiên cứu tại mỗi quan sát so với giá trị
trung bình tính riêng cho nhóm chứa quan sát đó.
Bảng 1.3. Các thành phần của dữ liệu thực nghiệm trong phân tích phương sai
Khía cạnh của thí nghiệm
Thành phần của mô hình
Ký hiệu
Biến phụ thuộc định lượng
Giá trị đo được của biến
Y
Ảnh hưởng chung của thí
nghiệm
Giá trị cơ bản (giá trị trung
bình chung)
µ
Nhân tố ảnh hưởng của thực

: ( ); , 1,2, ,
K
hk
H
H h k h k K
  

  
  

trong đó μi là kỳ vọng của biến ngẫu nhiên cần nghiên cứu trong nhóm thứ i,
i=1,…,K. Với một mức ý nghĩa α cho trước, ta cần đưa ra quyết định chấp
nhận hay bác bỏ giả thuyết.
Dữ liệu của mô hình thiết kế ngẫu nhiên có dạng trong Bảng 1.1.

Mức của nhân tố

1
2
3
….
k

11
Y

12
Y

.

Y



.
.
.

1K
Y

2K
Y

.
.
.
1
K
n
Y

Nếu biến ngẫu nhiên của thiết kế thỏa mãn điều kiện của Định lý 1 và giả
thuyết H
0
được xem là đúng, thì theo các Định lý 1 và Định lý 2,các thống kê
2
ij
11
22




có phân phối Khi - bình phương với bậc tự do tương ứng là N-1và K-1. Phần
biến động do sai số gây ra,
()
2 2 2
SS
SS SS
SA
YA
  


Trích đoạn Phân bố không chuẩn và mô hình tuyến tính suy rộng Khái quát về trường Đại học Sao Đỏ Dữ liệu dùng trong nghiên cứu
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status