Bài giảng xác suất thống kê chương 7 kiểm định giả thiết thống kê - Pdf 32

ThS. Phạ m Trí Cao * Chương 7

CHƯƠNG 7:
KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ

1

Trong thực tế ta thường gặp vấn đề: phải
kiểm tra xem 1 điều gì đó đúng hay sai,
nội dung thông tin mà ta nhận được từ các
nguồn cung cấp (1 người, 1 cơ quan, 1 tờ
báo, 1 tổ chức,...) có đáng tin cậy không.
Công việc kiểm tra lại nội dung thông tin
mà ta nhận được xem có đáng tin cậy
không chính là bài toán kiểm đònh.

 Ta

tiến hành kiểm đònh (kiểm tra) như sau:
 Thu thập số liệu thực tế (lấy mẫu): đo chiều cao
của khoảng 1 triệu người
 Dùng 1 quy tắc kiểm đònh tương ứng với giả thiết
đang xét (kiểm đònh giá trò trung bình) để quyết
đònh: chấp nhận hay bác bỏ H0

 Chấp

nhận H0: tổ chức này báo cáo đúng. Con số
1.65m là đáng tin cậy.
 Bác bỏ H0: tổ chức này báo cáo sai.
3


p=0.5
 H1: p≠0.5
 p: tỷ lệ học viên thực tế thi đạt môn XSTK
 p0= 0.5 : tỷ lệ học viên thi đạt môn XSTK theo lời
người này.
4

1


ThS. Phạ m Trí Cao * Chương 7

 Thí

dụ 3: Một cô gái được cho là thùy mò, nết na, đằm
thắm, dòu dàng, ngăn nắp, chu đáo, …nói chung là hết…
ý! Và ta muốn để ý!
 Ta phải kiểm tra điều này! Tuy nhiên ta sẽ không
quyết đònh được lập giả thiết thống kê như thế nào, bởi
vì sai lầm nào cũng đau khổ cả! Và ta không thể tự
mình tiến hành kiểm đònh được!
 Bài toán loại này ta không thể xét được, bởi vì không
có quy tắc quyết đònh chung. Ctmb quyết đònh như thế
nào!

5

 Ta


P(sll2)= P(chấp nhận H 0/H0 sai)

6

Một người bò nghi ngờ là ăn trộm.
lập giả thiết:
H0: người này là vô tội
H1: người này là có tội
(Trong xã hội văn minh, dân chủ thì luôn mong muốn
điều tốt đẹp xãy ra!)

 VD1:
 Ta

 Công

an đi thu thập chứng cớ để bác bỏ H0, nếu có
đủ chứng cớ thì kết luận người này có tội (bác bỏ
H0), nếu không đủ chứng cớ thì vẫn phải kết luận
người này vô tội (chấp nhận H0).
8

2


ThS. Phạ m Trí Cao * Chương 7

 Ta

có 2 loại sai lầm sau:

CÁC DẠNG KIỂM ĐỊNH:
Kiểm
 Do

đó ta đưa ra quy tắc kiểm đònh sao cho:
 P(sll1)
đònh giá trò trung bình
 Kiểm đònh tỷ lệ
 Kiểm đònh phương sai

 a)

Kiểm đònh 2 phía
H0: =0 ; H1: 0

 b)

Kiểm đònh một phía
 Phía phải: H0: =0 ; H1: >0
 Phía trái: H0: =0 ; H1: 

Trong thực hành:
(x   )
0
Tính t 
/ n

18

|t|> t: bác bỏ H0

n  30 , biết 2:
(x   ) n
0
t

  t (tra bảng G)
|t| < t : chấp nhận H0
|t|  t : bác bỏ H0 , chấp nhận H1
Trong trường hợp bác bỏ H 0 :
+ Nếu x  o thì  > 0

1.

+ Nếu x  o thì  < 0

Nếu không biết 2: thay  bằng s
(x   ) n
0
t

|t|  t(n–1) : bác bỏ H0
1.

Giả thiết H 0 :  = 600 ; H 1:   600
 : là tiền lương trung bình thực sự của công nhân hiện nay
o = 600 : là tiền lương trung bình của công nhân theo lời giám đốc
x = 520 , n = 36 > 30 ,  = 40 ,  = 5%
 = 5%   = 1 –  = 0,95  t = 1,96
Ta có t  (xo) n  (520600) 36 12
40

|t|= 12 > 1,96= t  : bác bỏ H 0
Kết luận : với mức ý nghóa là 5%, không tin vào lời của giám đốc.
Lương trung bình thực sự của công nhân bé hơn 600 ngàn đồng /
23
tháng (do x 520600 o).

Bài 1 : Giám đốc một xí nghiệp cho biết lương
trung bình của 1 công nhân thuộc xí nghiệp hiện
nay là 600 ngàn đồng/tháng.
Chọn ngẫu nhiên 36 công nhân thấy lương trung
bình là 520 ngàn đồng/tháng, với độ lệch chuẩn
 = 40 ngàn đồng/tháng. Lời báo cáo của giám
đốc có tin cậy được không, với mức có ý nghóa
là  = 5%.
22

Chú ý quan trọng:
 Trước tiên phải đặt giả thiết thống kê rùi muốn làm
gì thì làm!

t

 1,9364
s
2
|t| =1,9364 < t (n– 1) = 2,1448 : Chấp nhận H 0
Kết luận : với mức có ý nghóa là 5%, sức mua của khách
hàng hiện hay không thay đổi so với trước đây.

Cách 3: dùng p-value

Bài 1:

Biết  : T ~ N(0,1)
|x  |
|x  |
0 ) = 0,5-(
0 )
p-value= P(T 
/ n
/ n

Cách 1: KTC
  t  1,96 40 13,067
n
36

tra bảng F

  x  = 52013,067  506,933
26

27

2*p-value < =0,05 : bác bỏ H0

28

7


ThS. Phạ m Trí Cao * Chương 7

KIỂM ĐỊNH TỶ LỆ
H0: p=p0

; H1: pp0

Cách 1: pp KTC
Xác đònh KTC của p. nếu p0 thuộc KTC này thì ta
chấp nhận H0.

 Cách

2: pp giá trò tới hạn

Cách 3: p-value
|f p | n
0
)


0
Trong trường hợp bác bỏ H 0 :
+ Nếu f > p 0 thì p > p 0
+ Nếu f < p 0 thì p < p 0

29

30

Lưu ý: cần nhớ kỹ cái gì?

Bài 4 : Theo một nguồn tin thì tỉ lệ hộ dân thích
xem dân ca trên Tivi là 80%. Thăm dò 36 hộ
dân thấy có 25 hộ thích xem dân ca.
Với mức có ý nghóa là 5%. Kiểm đònh xem
nguồn tin này có đáng tin cậy không?

31

32

8


ThS. Phạ m Trí Cao * Chương 7

Bài 5 : Một máy sản xuất tự động, lúc đầu tỷ lệ sản phẩm
loại A là 20%. Sau khi áp dụng một phương pháp sản xuất
mới, người ta lấy 40 mẫu, mỗi mẫu gồm 10 sản phẩm để kiểm

Bài 4:

H0:p=20% ; H1:p 20% ;  = 0,05 thì t  = 1,96.
Trong đó p là tỷ lệ sản phẩm loại A của máy sau khi áp
dụng phương pháp sản xuất mới.
Theo số liệu ở bảng trên thì tỷ lệ sản phẩm loại A của mẫu

f  2 1 4  3  6  4  8 5 10  6  4  7  5 8 1 9
400
 215  0,5375
400
Vậy t  (0,53750,2) 400 16,875
0,2(10,2)

Cách 1: KTC
 1,96 0,69(1 0,69)  0,151
36

|t| = 16,875 > t  = 1,96 : bác bỏ H0 . Do f=0,5375>p o=0,2 nên
ta kết luận pp sản xuất mới làm tăng tỷ lệ sản phẩm loại A.

p f  0,690,151 0,539 < p < 0,841
p0= 0,8  (0,539 ; 0,841) : chấp nhận H0
cách 3: p-value

35





1
2
2
Trong trường hợp bác bỏ H0 :
+ Nếu s2 > o2 thì 2 > o2
+ Nếu s2 < o2 thì 2 < o2

Bài 8: Nếu máy móc hoạt động bình thường thì
kích thước của một loại sản phẩm (cm) là đại
lượng ngẫu nhiên phân phối theo quy luật chuẩn
với phương sai 2=25 cm2 . Nghi ngờ máy hoạt
động không bình thường, người ta đo thử 20 sản
phẩm và tính được s 2 = 27,5cm 2 .
Với  = 0,02 , hãy kết luận về điều nghi ngờ
này?
37

Giải:
H0 : 2 = 25
H 1 : 2  25
2 : phương sai của kích thước sản phẩm hiện nay
 2  25 : phương sai của kích thước sản phẩm khi máy hoạt
0
động bình thường
Tra bảng I ta có 2 (19)= 7,6327 ; 2 (19)= 36,1908
0,01
0,99
2
Ta có 2 (n1)s 1927,520,9
25

do đó chỉ cần phải lựa chọn hai khả năng: =0 hay
>0
a. n  30 , biết  :
(x   ) n
0
Tính t =
, tra bảng tìm t 2

t > t2 : bác bỏ H0
t  t2 : chấp nhận H 0
Nếu chưa biết : thay  bằng s
41
(x   ) n
0
t=
s

b. n < 30,  đã biết (X có quy luật phân phối chuẩn)
(x ) n
Tính t = 0
, tra bảng tìm t2
t > t2 : bác bỏ H0
c. n < 30,  chưa biết (X có quy luật phân phối
chuẩn)
(x ) n
0
Tính t =
, tra bảng tìm t2(n1)
s
t > t2(n-1) : bác bỏ H0


44

11


ThS. Phạ m Trí Cao * Chương 7

Điều kiện áp dụng (kiểm đònh phía trái và phải) :

n.p 5


0

45
n.(1 p )  5

0

III. KIỂM ĐỊNH PHƯƠNG SAI
1.Phía phải:
H0 :  2   2 ; H1 :  2   2
0
0
2
Tính 2 = (n 1)s
, tra bảng tìm
 02
2 >  2 (n 1) : bác bỏ H0

 1, 7 6
s
215
1)  = 5%  t2 = 1,6449
t > t2 : bác bỏ H0. Vậy HT mới tốt
hơn HT cũ.
2)  = 1%  t2 = 2,3263
t < t2 : chấp nhận H0. Vậy HT mới
không tốt hơn HT cũ.
Câu hỏi: Theo bạn thì có mâu thuẫn gì
không giữa kết luận của câu 1 và 2?

2.Phía trái:
H0 : p = p 0
H1 : p < p 0
(p  f ) n
, tra bảng tìm t 2
Tính t = 0
p (1 p )
0
0
t > t2 : bác bỏ H 0

47

 2 (n 1)
1

2 (n 1)
46

H1 : p > 0,18
f = 22/80 = 0,275
( f  p ) n (0,2750,18) 80
0
t

2,21
0,180,82
p (1 p )
0
0
 = 2%  t2 = 2,0537
t > t2 : bác bỏ H0
Vậy trong các gia đình có trẻ em đi học, tỷ lệ gia
đình có máy tính cao hơn tỷ lệ chung.

Giải:
H0 : 2 = (0,2)2 = 0,04
H1 : 2 > 0,04
(11)   2 (11) 19,6752
 2 (n1)   2
1
10,05
0,95
2
2
 2  (n 1)s  (121).(0,3)  24,75
0,04
2
0


Biết  : T ~ N(0,1)
( f  p )
0
p-value= P(T
p 0 (1  p 0 ) /
( f  p ) n
0
= 0,5-(
)
p 0 (1  p 0 )

tra bảng F

n

)

tra bảng F

Chưa biết  (n
55

56

14


ThS. Phạ m Trí Cao * Chương 7

Tính xác suất mắc sai lầm loại 2:
1) kiểm đònh trung bình:
1a) 2 phía: H0: µ= µ0 , H1: µ  µ0
Nếu giá trò thực tế của µ là µ1 thì











   n 
1
    t  0 s 1 
2

1– gọi là lực kiểm đònh

suất mắc sai lầm loại 2 không vượt quá  cho trước,
với giá trò thực 1 của  sai lệch so với 0 không
vượt quá  cho trước thì cỡ mẫu là:
 2 (t  t ) 2
2
n
với |1–0|  
2
  1 t ,   12 t
2
 2(t t )2
2 2
58
Trường hợp:0 10   thì n 
2

Bài 2 : Trong thập niên 80, trọng lượng trung bình
của thanh niên là 48kg. Nay để xác đònh lại trọng
lượng ấy, người ta chọn ngẫu nhiên 100 thanh niên
đo trọng lượng được trọng lượng trung bình là 50kg
và phương sai mẫu hiệu chỉnh s2 = (10kg)2.
1) Thử xem trọng lượng thanh niên hiện nay phải
chăng có thay đổi, với mức có ý nghóa là 1%.
2) Nếu trọng lượng thực tế của thanh niên là 1 =
51kg thì xác suất mắc sai lầm loại 2 là bao nhiêu
60

15



10
|t|= 2 < t = 2,58 : Chấp nhận H 0
Kết luận : với mức có ý nghóa là 1%, trọng lượng
trung bình thanh niên hiện nay thực sự không thay
đổi so với thập niên 80.

|   | n
  1   (t  0 s 1
)
2
2)
 1   ( 2 ,58  | 48  51 | 100 )
2
10
= 0,5 – (0,42) = 0,5 – 0,1628 = 0,3372
: xác suất mắc sai lầm loại 2
Lực kiểm đònh là 1–  = 0,6628

3)  = 0,01  t2 = t0,02 = 2,32
(Nếu tra bảng G thì
 = 0,05  t2 = t0,1 = 1,65
nhìn = 0,90 . Nếu tra bảng F thì nhìn dòng 1.6 và
cột 5)
0 ≤ 1 –0 = 52 – 48 = 4 ≤  = 4
s 2 (t
t
)2
2
2




ThS. Phạ m Trí Cao * Chương 7

Kiểm đònh với  ,  cho trước
Nếu muốn xác suất mắc sai lầm loại 1 là  và xác
suất mắc sai lầm loại 2 không vượt quá  cho trước,
với giá trò thực p1 của p sai lệch so với p0 không vượt
quá  cho trước thì cỡ mẫu là:
 2 ( t  t
)2

2
với |p1–p0|  
n
2
    1    t
   1 2  t
2

2) kiểm đònh tỷ lệ:
1a) 2 phía: H0: p= p0 , H1: p  p0
Nếu giá trò thực tế của p là p1 thì








Nếu muốn xác suất mắc sai lầm loại 1 là  và xác
suất mắc sai lầm loại 2 không vượt quá  cho trước,
với giá trò thực p1 của p sai lệch so với p0 không vượt
quá  cho trước thì cỡ mẫu là:
t
)2
 2 (t
2
2


với |p1–p0|  
n
67
2

66

 PHẦN

II: KIỂM ĐỊNH PHI THAM SỐ
 KIỂM ĐỊNH QUY LUẬT PHÂN PHỐI XÁC
SUẤT
 KIỂM ĐỊNH TÍNH ĐỘC LẬP

68

17



n = n1 + n2 +…+ nk : cỡ mẫu
Lập giả thiết
H0 : X phân phối theo quy luật A
H1 : X không phân phối theo quy luật A

70

3. Quy tắc kiểm đònh
2


 n  np 
k


 2    i np i 
i
i1
Với mức ý nghóa    2  k  r 1

1 
trong đó:
r = số tham số chưa xác đònh của quy luật X
k là số điểm (khoảng) chia các giá trò của X
Quy tắc quyết đònh:
 2   2  k  r 1 : bác bỏ H0
1
72
2
   2  k  r 1 : chấp nhận H0

Gọi X là số lần xuất hiện của đối tượng trong 1
ngày, ta có:
X
0 1 2 3 4 5 6 7 8 9 10
Số ngày 5 10 19 29 21 6 9 0 0 1 0
Với  =5%, hãy xét xem X ~B (10 ; 0,3) ?
75

74

Giải:
H0: X có quy luật phân phối nhò thức B(10; 0,3)
H1: X không có quy luật phận phối nhò thức
B(10; 0,3)
Trước hết, ta thu ngọn mẫu để cho thỏa n i không
quá nhỏ: ni  5
X 0 1 2 3 4 5 6
ni 5 10 19 29 21 6 10
Nếu giả thiết H0 đúng, ta tính được các xác suất:
pi=P(X=xi)= C xi (0,3) xi (0,7 )10  xi xi= 0,1,2,...,6
10
76
Ví dụ: p1= P(X=0)= C 0 (0,3) 0 (0,7 )10  0,0282
10

19


ThS. Phạ m Trí Cao * Chương 7


0,1029
0,0474
1

2,82
12,11
23,35
26,68
20,01
10,29
4,74

n  np
i
i
np
i
1,6852
0,3676
0,8104
0,2017
0,0490
1,7885
5,8370
10,7394






ni: số phụ nữ 14 36 24 6
Với mức ý nghóa 5%, kiểm đònh xem liệu lọai
thức ăn A có tác dụng đến việc sinh con trai
79
không?

78

Giải:
H0 : loại thức ăn A không có tác dụng đến giới
tính của bào thai.
Nếu H0 đúng thì số bé trai trong gia đình có 3 con
là 1 ĐLNN có qluật nhò thức với n=3, p= ½
Gọi X là số con trai trong 1 gia đình có 3 con
H0 : X~B(3, ½)
Đặt : Bk = biến cố trong 3 đứa trẻ có k đứa là
con trai.
80

20


ThS. Phạ m Trí Cao * Chương 7

Nếu H0 đúng thì:

Ta lập bảng sau:
xi
ni


1
3 2 
8
8
3
3




p  P ( B )  C 2  1   3 , p  p ( B )  C 3  1   1
3
2
3 2
4
3
32
8
8

Vậy 2 = 5,6
=0,05 , k=4 , r=0
( 3 )  7 ,8147
 2
( k  r  1)   2
1 
0 ,95
 2   2 (3) : chấp nhận H0
0,95
81


ThS. Phạ m Trí Cao * Chương 7

Ta lập bảng sau:
ni
pi
xi
0
1
2
3
Tổng

6
14
110
70

npi

n  np
i
i
np
i
0,017576 3,5152 1,75644
0,150072 30,0144 8,5446
0,427128 85,4256 7,06932
0,405224 81,0448 1,50519


P2 = P(X=3) = e-4,7 ( 4 ,7 ) = 0,1574
3!
-4,7 ( 4 ,7 ) 4
P3= P(X=4)= e
= 0,1849
4!
5
P4 = P(X=5) = e-4,7 ( 4 ,7 ) = 0,1738
5!
6
P5 = P(X=6) = e-4,7 ( 4 ,7 ) = 0,1362
6!
6
P6 = P(X  7) = 1–  p ( X  k )  0 ,1954
k 0

85

Giải:

87

Bài 4: Một nhà máy sản xuất máy in nói rằng số
lỗi in trong 1 cuốn sách dày 300 trang của máy
in là 1 ĐLNN có quy luật phân phối Poisson với
tham số =4,7 . Kiểm tra 300 trang sách in của
50 máy in cùng loại, ta thu được:
Số lỗi 0 1 2 3 4 5 6 7 8  9
Số máy 1 1 8 6 13 10 5 5 1 0
Với mức ý nghóa 1%, hỏi lời tuyên bố của nhà

0,1362
0,1954

7,6150
7,8692
9,2463
8,6915
6,8083
9,7697

n np 
i
i
np
i
0,7470
0,4440
1,5239
0,1970
0,4803
1,4546





2

n =50 1
4,8468

x  1n  n x  1 [65*10+90*9+105*13+115*14
i i 120
+125*21+135*15+145*12+155*13 + 165*13]
= 124,875
s 2  1 ( n x 2  n( x) 2 )
i i
n 1
 1 (1963675 120 (124 ,875 ) 2 )  776 ,6649
120 1
s  776 ,6649  27 ,8687
91
2

Xem X ~ N (124,875 ; (27,8687) )

Bài 6: Quan sát chiều cao của 120 cây khuynh diệp ở 1 năm
tuổi ta được bảng số liệu:
Chiều cao (cm) 50-80 80-100 100-110 110-120 120-130
Số cây
10 9
13
14
21
Chiều cao 130-140 140-150 150-160 160-170
Số cây 15
12
13
13
Với mức ý nghóa 5%, hãy kiểm đònh giả thiết: chiều cao cây
khuynh diệp có phân phối chuẩn?

0,1340
0,1105

0,2808
1,1259
0,0725
0,1197

(150, 160) 13
(160, +) 13

0,0803 9,636 11,3165 1,1744
0,1038 12,456 0,2959 0,0238








(80, 100)
(100, 10)

Tổng

n =120 1

npi



23


ThS. Phạ m Trí Cao * Chương 7


p1= P(X< 80)= 0,5+   80  124 ,875

27 ,8687








= 0,5  (1,61) = 0,5-0,4463 = 0,0537
p2= P(80
=  ( i1
)( i
)
25
25

95

p7 = P (140 < X < 150 ) = (0,90) - (0,54)
= 0,3159 – 0,2054 = 0,1105
p8 = P (150 < X < 160 ) = (1,26) - (0,90)
= 0,3962 – 0,3159 = 0,0803
p9 = P (X>160 ) = 0,5 - (1,26)
= 0,5 – 0,3962 = 0,1038
Hay p9 = 1–(p1 + . . . + p8) = 0,1038
 = 0,05, k = 9, r = 2
 2
(6 )  12 ,5916
(9  2  1)   2
1 0,05
1 0,95
2 = 7,8047 <  2
(6) : chấp nhận H 0
0,95

94

Vậy có thể xem X~N(124,875 ; (27,8687) 2)

PHẦN II.2 : KIỂM ĐỊNH TÍNH ĐỘC LẬP

n11 n12
n21 n22

n1k n10
n2k n20

nr1 nr2
nrk nr0
n01 n02 ….. n0k n
k
r
k
k
n   n , n   n , n   n   n : cỡ mẫu
i0 j1 ij
0 j i1 ij
i1 i0 j1 oj

97

98

Giải

Ví dụ: Để nghiên cứu xem quy mô của một công ty có ảnh hưởng
đến hiệu quả quảng cáo đối với khách hàng hay không, người ta
tiến hành phỏng vấn 356 khách hàng và thu được kết quả sau:
Hiệu quả quảng
cáo Mạnh Vừa phải Yếu Tổng
Quy mô công ty

H0: Quy mô không ảnh hưởng hiệu quả quảng cáo



202  522  322  532  472 

2 356140*104 131*104 85*104 140*128 131*128
282  672  322  252 1




*124 85*124

 85*128 140*124 131
= 29,638 >  2
(31)(31)   2 (4)  9,4877:
10,05
0,95

99

bác bỏ H0
Tức quy mô công ty có ảnh hưởng đến hiệu quả
của quảng cáo

100

25


Nhờ tải bản gốc
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status