1
CHƯƠNG: LÝ THUYẾT LƯNG
1.KHÁI NIỆM :
Xét một tổng thể,trong đó ta quan tâm tới biến lượng X đo lường một dấu hiệu nào đó
của tổng thể.Giả sử X là ĐLNN có quy luật phân phối
),(
xF
, tham số
chưa biết, cần
xác đònh
, việc tìm giá trò thực sự của
khó khăn, nên người ta chỉ ước lượng
dựa
trên các kết quả của mẫu. Vấn đề đặt ra là từ tổng thể, tìm một mẫu ngẫu nhiên
(
n
XXX , ,
21
), trong đó
n
XXX ,
21
là các ĐLNN độc lập có cùng phân phối với ĐLNN
X. Chúng ta dựa vào đó xây dựng thống kê
), ,(
21
n
XXX
của n giá trò
n
XXX , ,
21
được gọi là một hàm ước
lượng của
.Giá trò
), ,(
21
^
n
xxx
là một ước lượng điểm của
.
VD
: Một công ty A có hàng ngàn công nhân.Thăm dò thu nhập của 100 công nhân của
công ty nhận thấy thu nhập trung bình là 1,5 triệu đồng/tháng.
Ta nói thu nhập trung bình của công nhân công ty được ước lượng là 1,5 triệu
đồng/tháng,
Đó là ước lượng điểm của trung bình tổng thể.
Trong chương này chúng ta quan tâm đên các ước lượng:trung bình tổng thể, phương
sai tổng thể, tỷ lệ tổng thể.
2.CÁC TIÊU CHUẨN CỦA ƯỚC LƯNG
2.1 ƯỚC LƯNG KHÔNG CHỆCH
phương sai tổng thể.
2
^
S
độ lệch chuẩn của mẫu là một ước lượng chệch của độ lệch chuẫn của tổng
thể
pfE )(
:tỷ lệ của mẫu là một ước lượng không chệch của tỷ lệ tổng thể.
2.2 ƯỚC LƯNG VỮNG
ĐỊNH NGHĨA :
Ước lượng
^
được gọi là ước lượng vững của tham số
nếu
P
^
hay
1)|(|
^
là hai ước lượng không chệch của tham số
, được xây dựng trên cùng
một mẫu quan sát. Thì
1
^
được gọi là hiệu quả hơn
2
^
nếu
)()(
2
^
1
^
VarVar
ĐỊNH NGHĨA:
Nếu
^
là một ước lượng không chệch của
Và không có ước lượng không chệch nào có phương sai nhỏ hơn, thì
^
), ,(
21 n
xxx ) mà tham số
thuộc vào khoảng đó được gọi là khoảng ước lượng.
ĐỊNH NGHĨA:
Giả sử
là một tham số chưa biết của tổng thể. Dựa vào mẫu ngẫu nhiên chọn ra từ
tổng thể, ta tìm hai đại lượng ngẫu nhiên A , B sao cho :
3
1)( BAP
;
10
Nếu dựa vào một mẫu cụ thể A và B được biểu thò là a và b , thì khoảng (a,b) được gọi
là khoảng tin cậy của
;
)1(
được gọi là độ tin cậy (
10
1)|(| xP
Thì :
Khoảng
),(
xx
được gọi là
khoảng tin cậy của trung bình tổng thể
(
1
) là độ tin cậy
được gọi là độ chính xác (hay sai số)
NHẬN XÉT:
Sự tương quan giửa độ tin cậy và độ chính xác
i) Độ tin cậy càng cao thì độ chính xác kém (sai số lớn)
ii) Độ chính xác tốt (sai số nhỏ) thì độ tin cậy thấp
3.2.1 TỔNG THỂ CÓ PHÂN PHỐI CHUẨN VÀ KÍCH THƯỚC MẪU ≥ 30
),(~
2
NX
i)
22
4
Chứng minh:
Ta có :
)1,0(~
)(
N
nX
Z
Thì :
n
z
2
n
z
xx
2
Vậy khoảng tin cậy là
n
z
x
n
z
xxx
2
Hay nói khác hơn với độ tin cậy là
)1(
,thì khoảng tin cậy của trung bình tổng thể là:
n
z
x
n
sz
x
2
^
2
HÌNH VẼ
5
; kích thước mẫu n . Tìm khoảng tin cậy
ii) Cho độ chính xác; kích thước mẫu. Tìm độ tin cậy.
iii) Cho độ chính xác; độ tin cậy.Tìm kích thước mẫu
VD:
Thu nhập của công nhân công ty A có phân phối chuẩn với độ lệch chuẩn là 0,2 triệu
đồng.Thăm dò 100 công nhân của công ty trên thấy thu nhập trung bình là 2 triệu
đồng/tháng.
a/ với độ tin cậy là 90%, hãy ước lượng thu nhập trung bình của công nhân công ty trên
b/ Nếu độ chính xác là 40 ngàn đồng thì độ tin cậy là bao nhiêu?
GIẢI:
Gọi X(triệu đồng) là thu nhập của công nhân công ty trên.
là thu nhập trung bình của công nhân công ty ( chưa biết).
x
là thu nhập trung bình của công nhân theo mẫu = 2 (triệu đồng).
=0,2 (triệu đồng)độ lệch chuẩn của tổng thể .
n=100 :kích thước mẫu
%901
:độ tin cậy
Sử dụng
x để ước lượng
Dùng phân phối chuẩn để tìm khoảng tin cậy
a/
từ độ tin cậy :
b/ Trường hợp độ chính xác là
040,0
triệu đồng.
Ta có:
4772,0)2(2
2,0
100.04,0
2
n
z
Suy ra độ tin cậy là:
%44,959544,0)(21
2
z
CHÚ Ý:
Sử dụng EXCEL
a/Từ
suy ra
9545,01)2(.2)|(|1
2
NORMSINVzZP
3.2.2 TỔNG THỂ KHÔNG CÓ PHÂN PHỐI CHUẨN,KÍCH THƯỚC MẪU
30n
Giả sử chúng ta có một mẫu ngẫu nhiên của n quan sát từ một tổng thể không có phân
phối chuẩn,có trung bình
.
Với trung bình và độ lệch chuẩn hiệu chỉnh của mẫu cụ thể lần lượt là
^
; sx .
Nếu n lớn ( n≥ 30 ) øsử dụng đònh lý giới hạn trung tâm ,
ta có
)1,0(~
)(
N
nX
Z
x
2
2
2
ii)Trường hợp
2
chưa biết thay thế bởi
^
2
s
Thì
)1,0(~
)(
^
N
s
nX
Z
x
điểm trung bình theo mẫu = 3,92
^
s
độ lệch chuẩn của mẫu hiệu chỉnh = 1,57
n kích thước mẫu = 256
Độ tin cậy
%991
sử dụng
x
để ước lượng
Nhận xét: n > 30 dùng phân phối chuẩn để tìm khoảng tin cậy.
Từ
58,299,01
2
z
Suy ra
25,092,3
256
57,1.58,2
92,3
nX
Z
Với độ tin cậy là
)1(
thì khoảng tin cậy của trung bình tổng thể là : n
z
x
n
z
x
22
ii)Trường hợp
n
st
x
^
2
Hay nói khác hơn với độ tin cậy
)1(
,
thì khoảng tin cậy của trung bình tổng thể là :
n
st
x
n
st
x
^
2
^
2
t
(tra bảng phân phối STUDENT hoặc dùng EXCEL)
Với
n
st
s
n
t
^
2
^
2
.
n
st
xx
^
2
1-α
α/2 α/2 t
2/
t
2/
t
1)(
2/2/
tTtP
VD
:
Một hãng xe hơi thử nghiệm mức tiêu hao nhiên liệu của một loại xe đời mới ( số
km/lít).Chọn ngẫu nhiên 6 xe cho chạy thử được số liệu như sau:
7,83 8,17 7,75 8,08 8,63 8,76
Với độ tin cậy là 90% .Hãy tìm khoảng tin cậy của mức tiêu hao nhiên liệu trung bình của
(tra bảng phân phối STUDENT hoặc dùng EXCEL)
2
)()|(|)|(|1
222
tTPtTPtTP
Suy ra 34,020,8
6
41,0.015,2
20,8
^
2
n
st
x
Vậy khoảng tin cậy của mức tiêu hao nhiên liệu trung bình của loại xe trên là :
( 7,86 - 8,54 ) km/ lít
3.3 KHOẢNG TIN CẬY CỦA TỶ LỆ TỔNG THỂ
11
ii) (
1
) là độ tin cậy
iii)
là độ chính xác (sai số)
Giả sử
f
là tỷ lệ thành công trong một mẫu gồm n quan sát từ một tổng thể có tỷ lệ
thành công là
p
. Trường hợp n lớn (n≥ 30 ).
Với độ tin cậy
)1(
, thì khoảng tin cậy của tỷ lệ tổng thể là :
n
ff
zfp
n
ff
zf
)1()1(
Vì
n
k
f
là một đại lượng ngẫu nhiên có phân phối xấp xỉ chuẩn với kỳ vọng
pfE )(
Và phương sai
n
pp
fVar
)1(
)(
Nhưng vì p chưa biết nên thay thế bởi f.
Điều kiện
1)|(|
1)
)1()1(
||
(1)|(|
2
zZP
ff
n
ff
npf
PpfP
Tra bảng hàm hoặc dùng EXCELù suy ra
2
z
Với
n
ff
z
ff
n
22
CÁC DẠNG TOÁN CỦA ƯỚC LƯNG TỶ LỆ
i) Cho ,độ tin cậy, kích thước mẫu.Tìm khoảng tin cậy.
ii) Cho độ chính xác, kích thước mẫu.Tìm khoảng tin cậy.
iii) Cho độ tin cậy,độ chính xác.Tìm kích thước mẫu.
VD:
Tại một đòa phương thăm dò 400 người dân về mức độ hài lòng của người dân về các
dòch vụ công,có 160 người không hài lòng về thái độ ứng xử của các tiếp viên xe buýt.
a/ Với độ tin cậy 95%.Hãy ước lượng tỷ lệ người dân đòa phương không hài lòng về thái
độ ứng xử của các tiếp viên xe buýt.
b/ Nếu độ chính xác là 3% thì độ tin cậy là bao nhiêu?
c/ Nếu độ tin cậy là 90% và độ chính xác là 3% thì cần thăm dò bao nhiêu người ?
GIẢI:
a/
p
: tỷ lệ người dân đòa phương không hài lòng (chưa biết)
%40
400
160
f
: tỷ lệ người dân không hài lòng theo mẫu
%951
z
Ta có
400
6,0.4,0
96,140,0
)1(
2
n
ff
zfp
Vậy khoảng tin cậy của tỷ lệ người dân đòa phương không hài lòng là:
( 35,199% - 44,801%)
b/ Trường hợp độ chính xác
%3
từ
23,1
24,0
400
03,0
%901
%3
Tìm kích thước mẫu n
Phương pháp 1
:
Trong trường hợp này ,ta sử dụng f=40% làm ước lượng ban đầu cho p.
Từ :
65,190,01
2
z
Mà 726
)03,0(
6,0.4,0.)65,1(
)1(
)1(
2
2
2
14
Từ
1)
)1()1(
||
(1)|(|
pp
n
pp
npf
PpfP
Suy ra
2
2
2
)1(
ppz
^
2
s
.
S
ử dụng
^
2
s
để ước lượng
2
.
Với độ tin cậy
)1(
, thì khoảng tin cậy của phương sai tổng thể là :2
2
1
^
2
2
2
2
^
2
Sử dụng phân phối chi bình phương,bậc tự do k=n-1 để tìm khoảng tin cậy của phương
sai tổng thể.
i)
)1(~
)1(
2
2
^
2
2
n
sn
ii)
)1(~
22
n
15
2
)(
2
^
s
= 14 (ngàn đồng)
%951
độ tin cậy
Sử dụng
^
s
để ước lượng
Dùng phân phối chi bình phương bậc tự do k=n-1=29 .
Sử dụng EXCEL, ta có
72,45)29;025,0(
2
025,0
2
2
CHIINV
05,16)29;975,0(
2
975,0
2
Khoảng ước lượng của
là;
2
2
1
^
2
2
2
^
2
)1()1(
snsn
82,1815,11
( ngàn đồng)
)(
YX
là
n
st
d
n
st
d
d
YX
d
22
CHÚ Y
Ù:
Trường hợp này sử dụng phân phối STUDENT để tìm khoảng tin cậy.
)1(~ nTT
( T có phân phối STUDENT , bậc tự do k=n-1 )
GIẢI:
d =7.5 :trung bình của các giá trò :
6,1, iyx
ii
2
d
s
=359,5
d
s =18,96
17
Từ
015,2%80)1(
2
t
(dùïng phân phối STUDENT bậc tự do k=n-1=5
Tra bảng hoặc dùng EXCEL)
Suy ra
60,15
6
96,18.015,2
2
n
Giả sử chúng ta có một mẫu ngẫu nhiên cuả
X
n
quan sát từ tổng thể có phân phối
chuẩn với trung bình
X
,phương sai
2
X
và một mẫu ngẫu nhiên của
Y
n
quan sát từ
tổng thể có phân phối chuẩn với trung bình
Y
, phương sai
2
Y
.
Nếu trung bình hai mẫu cụ thể lần lượt là
yx;
.
Thì với độ tin cậy
)1(
22
;
YX
chưa biết có thể thay thế bởi phương sai mẫu hiệu chỉnh
^
2
^
2
;
YX
ss .
Trường hợp kích thước mẫu lớn
30;30
YX
nn tổng thể không có phân phối chuẩn
,chúng ta vẫn có thể sử dụng phân phối chuẩn để tìm khoảng tin cậy.
Trong trường hợp này khoảng tin cậy của hiệu hai trung bình là:
Y
Y
X
X
YX
Y
Y
X
X
n
s
trung bình các công nhân này vắng mặt trong công việc là 1,69 giờ/tháng, và độ lệch
chuẩn của mẫu là 1,91 giờ/tháng.
Với độ tin cậy là 99%.
Tìm khoảng tin cậy của hiệu của hai trung bình tổng thể.
GIẢI:
Với công nhân nghiện thuốc lá
15,2x
60
X
n
09,2
^
x
s
Với công nhân không hút thuốc lá
69,1y
206
Y
n
91,1
^
Y
s
Vì kích thước mẫu lớn,sử dụng phân phối chuẩn và xấp xỉ phương sai tổng thể bởi
phương sai mẫu hiệu chỉnh
Từ
^
2
2
^
2
^
2
2
11,119,0
YX
(giờ)
3.5.3 TRƯỜNG HP HAI MẪU ĐỘC LẬP CÓ KÍCH THƯỚC MẪU NHỎ (n < 30) VÀ HAI TỔNG THỂ
CÓ
22
YX
YX
YX
YX
YX
YX
nn
nn
styx
nn
nn
styx
^
2
^
)()(
2
Với
)2(
)1()1(
^
2
nnTT
( T có phân phối STUDENT với bậc tự do là
2
YX
nnk
).
2
)(
2
tTP
VD:
Tại một hội chợ việc làm của sinh viên năm cuối các ngành khối kinh tế.Các sinh viên
tham dự phỏng vấn để tìm việc làm.
Với một nhân viên phỏng vấn thứ nhất có 21 sinh viên được phỏng vấn, điểm trung bình
nhận được của các sinh viên trên là 72,1
( thang điểm 100), độ lệch chuẩn của mẫu hiệu chỉnh là 11,3.
Với một nhân viên phỏng vấn thứ hai có 18 sinh viên được phỏng vấn, điểm trung bình
của các sinh viên trên là 73,8, và độ lệch chuẩn của mẫu hiệu chỉnh là 10,6.
Hai mẫu trên độc lập ø được chọn từ hai tổng thể có phân phối chuẩn có cùng phương
sai.
Với độ tin cậy 80%, tìm khoảng tin cậy của hiệu trung bình hai tỗng thể.
s
nn
snsn
s
YX
YYXX
Sử dụng phân phối STUDENT, bậc tự do
37221182
YX
nnk 20
Từ
026,290,01
2
t
(tra bảng phân phối STUDENT với bậc tự do là k=37 hoặc dùng EXCEL)
Khoảng tin cậy của hiệu hai trung bình
(điểm)
3.6 KHOẢNG TIN CẬY CỦA HIỆU HAI TỶ LỆ
Giả sử
X
f là tỷ lệ thành công trong một mẫu ngẫu nhiên của
X
n
quan sát từ một tổng
thể có tỷ lệ thành công là
X
pY
f
là tỷ lệ thành công trong một mẫu ngẫu nhiên của
Y
n
quan sát từ một tổng thể có tỷ
lệ thành công là
Y
p
.
Nếu các mẫu có kích thước lớn
)30;(
YX
nn
,
Thì với độ tin cậy
)1()1(
)(
2
2
CHÚ Ý:
Trường hợp này sử dụng phân phối chuẩn để tìm khoảng tin cậy
VD:
Một công ty có hai phân xưởng cùng sản xuất một loại sản phẩm.Kiểm tra ngẫu nhiên
100 sản phẩm do phân xưởng 1 sản xuất thấy có 4 phế phẩm, kiểm tra 120 sản phẩm do
phân xưởng 2 sản xuất thấy có 6 phế phẩm.
Với độ tin cậy 90%, tìm khoảng tin cậy của sự chênh lệch về tỷ lệ phế phẩm do 2 phân
xưởng sản xuất.
GIẢI:
100
X
n
Y
YY
X
XX
XY
XY
Y
YY
X
XX
XY
n
ff
n
ff
zff
pp
n
ff
n
ff
zff
)1()1(
1()1(
2
2