Chương 4
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ
§1: Các khái niệm
1.1 Giả thiết thống kê
Định nghĩa: Bất kỳ giả thiết nào nói về tham số,
dạng quy luật phân phối hoặc tính độc lập của đại
lượng ngẫu nhiên, đều gọi là giả thiết thống kê.
Những giả thiết đó có thể đúng hoặc cũng có thể
sai. Việc xác định tính đúng sai của một giả thiết
được gọi là kiểm định giả thiết thống kê.
Giả thiết H: . Đối thiết
0
θ θ
=
0
:H
θ θ
≠
1.2 Mức ý nghĩa, miền bác bỏ
-Từ mẫu ngẫu nhiên ta chọn thống
kê sao cho nếu H đúng thì G có
phân phối hoàn toàn xác định.
( )
x 1 2
W , , ,
n
X X X
=
( )
đối thiết
0
W
α
θ
∈
H
-Nếu thì chấp nhận giả thiết H
0
W
α
θ
∉
1.3 Sai lầm loại 1 và sai lầm loại 2
-Sai lầm loại 1: là sai lầm mắc phải khi ta bác bỏ
giả thiết H trong khi H lại đúng và
( )
WP G
α
α
∈ =
-Sai lầm loại 2: là sai lầm mắc phải khi ta chấp
nhận giả thiết H trong khi H sai và
( )
W 1P G
α
α
∉ = −
Chú ý: +) Nếu muốn giảm sai lầm loại 1 sẽ làm
tăng sai lầm loại 2 và ngược lại.
D X
σ
=
Giả thiết : X có phân phối chuẩn hoặc cỡ mẫu n
đủ lớn
( )
30n
≥
Chọn thống kê làm tiêu chuẩn
kiểm định
( )
0
X n
U
µ
σ
−
=
Nếu giả thiết H đúng thì
( )
0,1U N∈
a) Bài toán (1)
( )
0
:H
µ µ
≠
- Với mức ý nghĩa cho trước, xác định phân
vị chuẩn ta tìm được miền bác bỏ:
( )
0 0
1
2
Wu u u
α α
−
≥ ∈
H
+) Nếu thì chấp nhận H
( )
0 0
1
2
Wu u u
α α
−
< ∉
b) Bài toán (2)
Với mức ý nghĩa cho trước, xác định phân vị
chuẩn ta tìm được miền bác bỏ:
α
1
u
α
−
[
)
Ví dụ: Một tín hiệu được gửi từ địa điểm A và
được nhận ở địa điểm B có phân phối chuẩn với
trung bình và độ lệch tiêu chuẩn .Tin rằng
giá trị của tín hiệu được gửi mỗi ngày. Người
ta tiến hành kiểm tra giả thiết này bằng cách gửi 5
tín hiệu một cách độc lập trong ngày thì thấy giá trị
trung bình nhận được tại địa điểm B là .Với
độ tin cậy 95%, hãy kiểm tra giả thiết đúng
hay không?
µ
2
σ
=
8
µ
=
9,5X
=
8
µ
=
0 0
: 8; : 8H H
µ µ
= ≠
Ta có n=5 < 30, độ tin cậy:
1 0,95, 1 0,975
2
2
σ
Giả thiết X có phân phối chuẩn
Chọn thống kê
( )
0
'
X
T n
S
µ
−
=
Nếu H đúng thì
( )
1n
T T
−
∈
a) Bài toán (1): Với mức ý nghĩa cho trước, ta
xác định phân vị Student (n-1) bậc tự do mức
α
1
2
α
−
0
0
'
α α
−
< ∉
b) Bài toán (2): Với mức ý nghĩa cho trước, ta
xác định phân vị Student (n-1) bậc tự do mức
α
1
α
−
[
)
1
W ;t
α α
−
= +∞
Miền bác bỏ
c) Bài toán (3): Với mức ý nghĩa cho trước, ta
xác định phân vị Student (n-1) bậc tự do mức
α
1
α
−
Miền bác bỏ
(
]
1
W ; t
α α
µ
− −
= = = ∈
Khoảng
48-48,5
48,5-49
49-49,5
49,5-50
50-50,5
48,25
48,75
49,25
49,75
50,25
2
5
10
6
2
96,5
243,75
492,5
298,5
100,5
4656,125
11882,812
24255,625
14850,375
5050,125
25 1231,75 60695,062
49,27; 49,27 0,27
25 25
25
0,27 0,2812 0,53
24
49,27 50 25
6,886 W
0,53
X S
S S
t
α
= = = − =
= = ⇒ =
−
= = ∈
Vậy giả thiết bị bác bỏ, điều nghi ngờ là đúng
Ví dụ 2: Để xác định trọng lượng trung bình
của các bao bột mỳ ta lấy ngẫu nhiên 17 bao
đem cân được kết quả: trọng lượng trung bình
39,8X kg=
'2
0,16S =
Hãy kiểm định giả thiết
: 40 : 40H kg H kg
µ µ
= ≠
Với mức ý nghĩa
t
α
−
= = ∉
Kết luận: chấp nhận giả thiết H
2.3 Trường hợp 3:
Giả thiết và X không chuẩn
30n ≥
Chọn thống kê:
( )
0
'
X n
U
S
µ
−
=
Nếu H đúng thì
( )
0,1U N∈
a) Bài toán 1:
0
0
'
1 1
2 2
W ; ; ;
x n
Chọn một mẫu ngẫu nhiên gồm 50 người mua
hàng, tính được số tiền họ tiêu là 154 ngàn đồng,
với độ lệch tiêu chuẩn điều chỉnh của mẫu là
. Với mức ý nghĩa 0,02 hãy kiểm định xem tuyên
bố của nhóm có đúng không?
'
62S
=
: 140; 140; 50 30; 1 0,99
2
H H n
α
µ
= ≠ = > − =
(
] [
)
0,99
2,33; W ; 2,33 2,33;u
α
= = −∞ − ∪ +∞
0
0
'
1,59 W
x n
u
S
α
µ
( )
0
0 0
1
f p n
U
p p
−
=
−
Nếu H đúng thì
( )
0,1U N
∈
a) Bài toán 1:
( )
0
: ;H p p≠
1- 1
2 2
W - ;-u ;u
α α α
−
= ∞ ∪ +∞
÷
b) Bài toán 2:
32
0,08
400
f = =
(
]
1
0
1 0,99 2,326
0,08 0,1 400
W ; 2,326 ; 1,333 W
0,1.0,9
u
u
α
α α
α
−
− = ⇒ =
−
= −∞ − = = ∉
Kết luận: Chấp nhận H và việc cải tiến có hiệu quả
Ví dụ 2: Một nhà sản xuất thuốc chống dị ứng
thực phẩm tuyên bố rằng 90% người dùng thuốc có
tác dụng trong vòng 8 giờ. Kiểm tra 200 người bị
dị ứng thực phẩm thì thấy trong vòng 8 giờ thuốc
làm giảm bớt dị ứng đối với 160 người. Hãy kiểm
định xem lời tuyên bố trên của nhà sản xuất có
đúng hay không với mức ý nghĩa
−
= = ∈
−
2.5 Kiểm định giả thiết về sự bằng nhau giữa hai
trung bình
Giả sử ta có hai mẫu ngẫu nhiên được rút
ra từ ĐLNN X và ĐLNN Y
X Y
W ,W
Bài toán đặt ra là: ta muốn kiểm tra xem hai mẫu
trên có phải được rút ra từ một phân phối hay không?
Ta xét bài toán đơn giản là so sánh 2 giá trị trung
bình EX và EY
2 2
1 2 1 2
; ; ;EX EY DX DY
µ µ σ σ
= = = =
Đặt:
( ) ( )
1 2 1 2
1 2 1 2
: :
1 2
: :
H H
H H
µ µ µ µ
µ µ µ µ
W ; ;u u
α α α
− −
= −∞ − ∪ +∞
÷
Với mức ý nghĩa cho trước, miền bác bỏ của
bài toán 2 là:
α
α
[
)
1
W ;u
α α
−
= +∞
b) Trường hợp 2: Chưa biết
Trong trường hợp này ta phải giả thiết
( )
2
1 1
,X N
µ σ
:
( )
2
α
1 2 1 2
2 2
W ; ;
2 2
n n n n
t t
α
α α
+ − + −
= −∞ − ∪ +∞
÷ ÷
÷
2 2
1 2
;
σ σ
Với mức ý nghĩa cho trước, miền bác bỏ của
bài toán 2 là:
α
( )
)
1 2
2
( ) ( ) ( ) ( )
: :H E X E Y H E X E Y
= ≠
0
50 50,6
1250 1012
X 50; 50,6; 2
25 20
1 1
25 20
Y u
−
= = = = = =
+
(
] [
)
1
2
0,05 1,96; W ; 1,96 1,96;u
α α
α
−
= ⇒ = = −∞ − ∪ +∞
Kết luận: bác bỏ giả thiết H
( ) ( ) ( ) ( )
: :H E X E Y H E X E Y
= ≠
( ) ( ) ( ) ( )
: :H E X E Y H E X E Y