1
Chương VI. PHÂN TÍCH PHƯƠNG SAI
Phương pháp kiểm định sẽ được mở rộng trong trường hợp so sánh trung bình của nhiều tổng
thể, được xây dựng trong việc xem xét các biến thiên (phương sai) của các giá trị trong nội bộ
nhóm. Do vậy, phương pháp kiểm định giả thuyết về sự bằng nhau của trung bình nhiều tổng thể
được gọi chung là phương pháp phân tích phương sai ANOVA.
1. Phân tích phương sai một yếu tố
Phân tích phương sai một yếu tố được sử dụng trong trường hợp chỉ có yếu tố nào đó được xem
xét nhằm xác định ảnh hưởng của nó đến một yếu tố khác.
Yếu tố được xem xét ảnh hưởng sẽ được dùng để phân loại các quan sát thành các nhóm khác
nhau.
Ví dụ: Một nghiên cứu được thực hiện nhằm xét xem phải chăng yếu tố thu nhập có ảnh hưởng
đến số tiền chi mua thực phẩm hàng tháng của các gia đình. Như vậy, dựa vào mức thu nhập, các
gia đình sẽ được chia thành các nhóm khác nhau, ghi nhận số tiền chi mua thực phẩm hàng
tháng, và so sánh số tiền chi mua thực phẩm hàng tháng trung bình theo các mức thu nhập khác
nhau này.
Nếu yếu tố thu nhập không ảnh hưởng thì trung bình của số tiền chi mua thực phẩm bằng nhau
của tất cả các nhóm.
Hay ngược lại, yếu tố thu nhập thực sự có ảnh hưởng, số tiền chi mua thực phẩm hàng tháng
trung bình của các gia đình có các mức thu nhập khác nhau sẽ không bằng nhau.
Tổng quát:
Giả sử ta có k- nhóm (mẫu); , ,…, quan sát được chọn ngẫu nhiên độc lập từ tổng thể
( , ,…, có thể khác nhau về kích thước).
Gọi , ,…, là các trung bình tổng thể;
là quan sát thứ của nhóm thứ .
Bảng các giá trị quan sát của nhóm
Nhóm
1
2
…
k
=
là tổng bình phương các chênh lệch giữa từng quan sát với trung bình của nhóm mà quan
sát thuộc về.
thể hiện sự biến thiên do các yếu tố khác, không do yếu tố nghiên cứu (yếu tố dùng để phân
chia các nhóm).
=
(
− ̅
)
thể hiện sự biến thiên do sự khác nhau giữa các nhóm, tức là biến thiên do yếu tố nghiên
cứu (yếu tố dùng để phân chia các nhóm).
= + .
Công thức này chính là cơ sở của phương pháp phân tích phương sai một yếu tố:
Biến thiên của các quan sát so với giá trị trung bình là tổng cộng của biển thiên được giải thích
bởi yếu tố nghiên cứu ( )và biến thiên do các yếu tố khác, không nghiên cứu ( ).
B3. Tính các ước lượng cho phương sai chung của tổng thể
=
−
; =
−1
3
Nếu giả thuyết đúng, ta có hai giá trị ước lượng cho phương sai chung của tổng thể.
Do đó, tỷ số và có thể dùng làm căn cứ để kết luận về giả thuyết .
Nếu đúng, nghĩa là trung bình của tổng thể bằng nhau, thì tỷ số sẽ gần với giá
trị 1.
Ngược lại, khi trung bình của tổng thể không bằng nhau thì lớn hơn thì tỷ
số sẽ lớn hơn 1.
B4. Tính giá trị kiểm định = .
Quy tấc quyết định: Bác bỏ ở mức ý nghĩa , nếu >
, ,
=
−1
=
− =
, ,
>
Within Groups
(trong nội bộ nhóm)
−
=
−
Total (tổng)
−1
Vấn đề đặt ra là một khi giả thuyết cho rằng trung bình của tổng thể bằng nhau bị bác bỏ thì
chấp nhận . Vậy trung bình của những tổng thể nào thì khác nhau, tổng thể nào có trung bình
lớn hơn hay nhỏ hơn?
Ở đây ta đề cập đến phương pháp Tukey so sánh từng cặp trung bình tổng thể với nhau.
2. So sánh từng cặp trung bình tổng thể: kiểm định Tukey
Do so sánh từng cặp trung bình tổng thể nên ta có tất cả bài toán kiểm định trung bình tổng
thể như sau:
: =
: ≠
(1,2) ;
: =
: ≠
(1,3) ;…;
: =
: ≠
( −1, )
Tính giá trị kiểm định = − ; ∀ , = 1,2,…,
1
2
…
1
2
…
…
…
….
….
….
….
…
Phân tích phương sai với nhóm, khối được thực hiện như sau:
Giả thuyết : trung bình của tổng thể (xét theo yếu tố nghiên cứu) thì bằng nhau, nghĩa là
: = = = .
(Ta cũng có thể kiểm định giả thuyết : trung bình của tổng thể (xét theo khối) thì bằng
nhau, nghĩa là : = = = .)
B1. Tính các giá trị trung bình nhóm ̅ (xét theo cột); ̅ (xét theo dòng); ̅ (xét theo cả dòng và
cột).
=
∑
; =
∑
; ̅ =
∑
=
∑
5
B2. Tính các đại lượng
; trong đó
,
( )( )
,
có phân phối Fisher với ( −1) bậc tự do của
tử số và
(
−1
)(
−1
)
bậc tự do của mẫu số.
(Bác bỏ : = = = ở mức ý nghĩa nếu >
,
( )( )
,
; trong đó
,
( )( )
,
có phân phối Fisher với ( −1)bậc tự do của tử số và
(
−1
)(
−1
)
bậc
tự do của mẫu số).
6
Biến thiên
Tổng cộng
−1
Giống như trong trường hợp phân tích phương sai một yếu tố, ở đây ta cũng có thể dùng kiểm
định Tukey để xác định từng cặp trung bình tổng thể khác nhau. Ta tính các giá trị so sánh
=
, ,
( )( )