Kiểm định giả thuyết thống kê
Hoàng Văn Hà
Ngày 6 tháng 4 năm 2012
Bài toán kiểm định giả thuyết
thống kê
Bài toán kiểm định giả thuyết thống kê
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 3
■ Định nghĩa
■ Giả thuyết không và đối thuyết
■ Cách đặt giả t huyết
■ Miền bác bỏ - Tiêu chuẩn kiểm định
■ Sai lầm loại I v à loại II
■ Bổ đề Neyman - Pearson
■ Kiểm định tỷ lệ hợp lý
■ p - giá trị
Định nghĩa
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 4
Định nghĩa 1. Giả thuyết thống kê là những phát biểu về c ác tham số, quy
luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra
kết luận để bác bỏ hay chấp nhận một giả thuyế t gọi là
kiểm định giả thuyết
thống kê
.
Ví dụ 1. Giám đốc một nhà máy sản xuất bo mạch chủ máy v i tính tuyên bố
rằng tuổi thọ trung bình của một bo mạch chủ do nhà máy sản xuất ra là 5
năm; đây là một giả thuyế t về kỳ v ọ ng của biến ngẫu nhiên X = tuổi thọ của
một bo mạch chủ. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết
trên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê.
Giả thuyết không và đối thuyết
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 5
Định nghĩa 2. Trong bài toán kiểm định giả thuyết, giả thuyết cần được
H
0
: θ ∈ Θ
0
H
1
: θ ∈ Θ
c
0
(1)
Giả thuyết không và đối thuyết
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 6
Ví dụ 2.
1. Gọi µ là độ thay đổi trung bình t rong huyết áp của một bệnh nhân sau khi
dùng thuốc; bác sĩ điều trị cần quan tâm đến giả thuyế t sau
H
0
: µ = 0 Không có ảnh hưởng của thuốc lên huyết áp của bệnh nhân
H
1
: µ = 0 Có ảnh hưởng của thuốc lên huyết áp của bệnh nhân
2. Một khách hàng quan t âm đến tỷ lệ s ản phẩm kém chất lượng t rong một
lô hàng mua của một nhà cung cấp. Giả sử tỷ lệ sản phấm kém tối đa được
phép là 5%. Khách hàng cần quan tâm đến giả t huyết sau
H
0
: p ≥ 0.05 Tỷ lệ sản phẩm kém cao hơn mức cho phép
H
: θ = θ
0
Một phía bên trái:
H
0
: θ ≥ θ
0
H
1
: θ < θ
0
Một phía bên phải:
H
0
: θ ≤ θ
0
H
1
: θ > θ
0
Miền bác bỏ - Tiêu chuẩn kiểm định
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 9
Định nghĩa 3. Xét bài toán kiểm định giả thuyết có giả thuyết H
0
và đối
thuyết H
1
. Giả sử rằng H
. Đại lượng ngẫu nhiên Z = h(X
1
, . . . , X
n
; θ
0
) gọi là
tiêu chuẩn kiểm định giả thuyết H
0
. Giá trị α gọi là mức ý nghĩa của bài toán
kiểm định.
Miền bác bỏ - Tiêu chuẩn kiểm định
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 10
Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X
1
, . . . , X
n
) ta thu được mẫu
thực nghiệm (x
1
, . . . , x
n
). Từ mẫu thực nghiệm này, ta tính được giá trị của
Z là z = h ( x
1
, . . . , x
n
; θ
0
).
0
trong
khi thực tế H
0
sai. Sai lầm loại II ký hiệu là β.
β = P (W
c
α
|H
1
) (4)
Sai lầm loại I và loại II
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 12
❳
❳
❳
❳
❳
❳
❳
❳
❳
❳
❳
❳
Quyết định
Thực tế
H
0
đúng H
khi H
0
đúng)
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 14
Tức là,
α = P(
¯
X < 48.5|µ = 50) + P(
¯
X > 51.5|µ = 50)
= P
¯
X − 50
2.5/
√
10
<
48.5 − 50
2.5/
√
10
+ P
¯
X − 50
2.5/
√
= 0.0057 + 0.0057 = 0.0114
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 15
Cách thứ hai để giảm α là tăng cỡ mẫu khảo sát, giả sử cỡ mẫu n = 16, ta c ó
σ/
√
n = 2.5/
√
16 = 0.625, với miền bác bỏ là ¯x < 48.5 hoặc ¯x > 51.5, ta có
α = P(
¯
X < 48.5|µ = 50) + P(
¯
X > 51.5|µ = 50)
= P
Z <
48.5 − 50
0.625
+ P
Z >
51.5
0.625
= 0.0082 + 0.0082 = 0.0164
Xác suất sai lầm loại II β được t ính như sau
β = P(Không bác bỏ H
≤
51.5 − 52
2.5/
√
10
= P(−4.43 ≤ Z ≤ −0.63) = P(Z ≤ −0.63) − P(Z ≤ −4.43)
= 0.2643 − 0.0000 = 0.2643
Giả sử giá trị thực sự µ = 50.5, khi đó
β = P(48.5 ≤
¯
X ≤ 51.5|µ = 50.5)
= P
48.5 − 50.5
2.5/
√
10
≤
¯
X − 50.5
2.5/
√
10
≤
51.5 − 50.5
2.5/
√
10
.
Sai lầm loại I và loại II - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 19
Ví dụ 3.
1. Xét X là biến ngẫu nhiên có phân phối nhị thức. Ta cần kiểm định giả
thuyết H
0
: p = 0.8 và đối thuyết H
1
: p < 0.8. Hãy tìm miền bác bỏ
{X ≤ c} và tính xác suất sai lầm loại I α và loại II β tương ứng với đối
thuyết H
1
: p = 0.6 khi n = 10 và n = 20.
2. Một mẫu ngẫu nhiên cỡ n được chọn từ tổng thể có phân phối chuẩn với
phương sai σ
2
= 9, tính được ¯x = 17. Ta cần kiểm định giả t huyết
H
0
: µ = 15 và H
1
: µ > 15. Giả sử α = 0.0 5,
a. Tìm miền bác bỏ có dạng {
¯
X > c}.
b. Với đối thuyết H
1
: µ = 16, tính β.
Bổ đề Neyman-Pearson
đối thuyết H
1
, miền bác bỏ W
α
và miền chấp nhận W
c
α
. Cho α, β lần lượt là
sai lầm loại I và loại II. Cố định giá trị α nhỏ, trong tất cả c ác t iêu chuẩn
kiểm định Z = h(X
1
, . . . , X
n
) có cùng mức sai lầm α thì tiêu chuẩn nào có
độ mạnh π = 1 −β lớn nhất thì được gọi là tiêu chuẩn tốt nhất (tố i ưu).
Bổ đề Neyman-Pearson
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 21
Định lý 6 (Bổ đề Neyman-Pearson). Xét bài toán kiểm định giả thuyết thống
kê H
0
, đối thuyế t H
1
dựa trên một mẫu ngẫu nhiên (X
1
, . . . , X
n
) lấy từ một
phân phối phụ thuộc vào tham số θ. Xét L(θ) = L (θ|X
1
, . . . , X
1
, . . . , x
n
) ∈ W
c
, với W ∪ W
c
= R
n
3. P [(X
1
, . . . , X
n
) ∈ W ; θ
0
] = α.
thì kiểm định với miền bác bỏ W sẽ có độ mạnh lớn nhất với giả thuyết H
0
và đối thuyết H
1
. Ta gọi α là độ lớn (size) của kiểm định và W là miền bác
bỏ tốt nhất với độ lớn α.
Bổ đề Neyman-Pearson - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 22
Xét X
1
, . . . , X
n
là mẫu ngẫu nhiên chọn t ừ tổng thể có phân phối Poiss on với
trung bình λ. Tìm kiểm định có độ mạnh lớn nhất cho giả thuyết H
−1
với m =
n
i=1
x
i
Với λ = 2
L(2) = 2
m
e
−2n
n
i=1
(x
i
!)
−1
Bổ đề Neyman-Pearson - Ví dụ
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 23
và λ = 1/2,
L(1/2) = (1/2)
m
e
−(1/2)n
2
≤ C
Lấy logarit 2 vế ta được,
m log(4) −
3n
2
< log(C) ⇒ m <
log(C) + (3n/2)
log(4)
Đặt C
=
log(C) + (3n/2)
log(4)
, ta sẽ bác bỏ H
0
khi
n
i=1
x
i
≤ C
.
Kiểm định tỷ lệ hợp lý (LRT)
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 24
Xét bài toán kiểm định giả thuyết
H
c
0
là
λ(x) =
sup
Θ
0
L(θ|x)
sup
Θ
L(θ|x)
(6)
Chú ý rằng 0 ≤ λ(x) ≤ 1.
Kiểm định tỷ lệ hợp lý
Kiểm định giả thuyết thống kê Hoàng Văn Hà – 25
Gọi
ˆ
θ
0
và
ˆ
θ lần lượt là ước lượng hợp lý cực đại của tham số θ xác định trên
không gian tham số Θ
0
và Θ. Khi đó, kiểm định tỷ lệ hợp lý là
λ(x) =
L(
ˆ
θ
0