CHƯƠNG 2:
ƯỚC LƯỢNG KHOẢNG TIN CẬY
(Confidence Interval Estimation) I. KHÁI NIỆM
II. ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO TRUNG BÌNH TỔNG
THỂ (KHI BIẾT PHƯƠNG SAI)
III. ƯỚC LƯỢNG KHOẢNG TIN CẬY CỦA TRUNG BÌNH TỔNG
THỂ (KHI CHƯA BIẾT PHƯƠNG SAI TỔNG THỂ)
IV. ƯỚC LƯỢNG KHOÀNG TIN CẬY CHO TỶ LỆ P TỔNG THỂ:
TRƯỜNG HỢP MẪU LỚN
V. ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO SỰ KHÁC BIỆT GIỮA
TRUNG BÌNH CỦA HAI TỔNG THỂ
1. Ước lượng khoảng tin cậy dựa trên sự phối hợp từng cặp
2. Ước lượng khoảng tin cậy dựa vào mẫu độc lập của phương sai
khác nhau
3. Ước lượng khoảng tin cậy dựa vào mẫu độc lập có phương sai
bằng nhau
VI. ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO SỰ KHÁC BIỆT GIỮA
HAI TỶ LỆ TỔNG THỂ
VII. ƯỚC LƯỢNG CỞ MẪU
1. Cở mẫu cho những khoảng tin cậy của trung bình tổng thể có
phân phối chuẩn khi biết phương sai
2. Cở mẫu cho những khoảng tin cậy của tỉ lệ tổng thể
BÀI TẬP I. KHÁI NIỆM
Khoảng tin cậy là một dãy giá trị mà trong đó các tham số của tổng thể như
số trung bình ((), tỉ lệ (p) và phương sai ((2) cần được ước lượng nằm trong
có trọng lượng trung bình mỗi bao 19,8 kg.
Tìm khoảng tin cậy 95% cho trọng lượng trung bình tổng thể được sản xuất bởi
qui trình.
Bảng tra phân phối chuẩn Z được tóm tắt như sau:
0,005 0,01 0,025 0,05 0,1
Z
2,575 2,33 1,96 1,645 1,28
· Khoảng tin cậy 95% cho trung bình tổng thể là:
Vậy, khoảng tin cậy 95% cho trọng lượng trung bình của tất cả các bao
đường của qui trình sản xuất nằm trong khoảng từ 19,33kg đến 20,27kg. Như
ta mong đợi, trung bình mẫuĠlà điểm giữa của khoảng chứa đựng (, thì
khoảng rộng w chứa đựng tham số sẽ là:
Chú ý:
1. Nếu (1 - () và ( không thay đổi, n càng lớn dẫn đến khoảng tin cậy càng
hẹp cho trung bình tổng thể (, nghĩa là việc ước lượng ( càng chính xác hơn.
2. Nếu (1 - () và n cố định, độ lệch chuẩn ( càng lớn thì khoảng tin cậy càng
rộng cho (, càng không chắc chắn hay không chính xác cho ước lượng (.
3. Nếu n và ( cố định, (1 - () càng lớn thì khoảng tin cậy càng rộng, dẫn đến (
sẽ rơi vào khoảng giá trị lớn hơn, ước lượng khó chính xác hơn.
Cụ thể:
Trong trường hợp mẫu quan sát lớn, ta có thể sử dụng công thức (6.1) để tính
khoảng tin cậy cho tham số (tổng thể nhưng thay độ lệch chuẩn của tổng thể (
bằng độ lệch chuẩn của mẫu (Sx):
Ví dụ: Một mẫu ngẫu nhiên gồm 1562 sinh viên ghi danh học môn Marketing đã
Ví dụ: Một mẫu ngẫu nhiên gồm 6 kiện hàng được chọn ra từ tất cả các kiện
hàng được sản xuất bởi nhà máy trong một tuần. Trọng lượng của 6 kiện hàng
lần lượt như sau (kg):
18,6 18,4 19,2 20,8 19,4 20,5
Tìm khoảng tin cậy 90% cho trọng lượng trung bình tổng thể của tất cả
các kiện hàng của nhà máy, giả sử phân phối của tổng thể là phân phối chuẩn.
Kiện hàng
(i)
Trọng lượng
(kg)
(x
i
)
(x
i
2
)
1 18,6 345,96
2 18,4 338,56
3 19,2 368,64
4 20,8 432,64
5 19,4 376,36
6 20,5 420,25
Tổng cộng 116,9 2282,4
1
Từ dữ liệu bảng trên tính được:ĉ Ľ 19,4833Ġ
ngân hàng của bạn có bất kỳ thực tế nào mà bạn xem như không đúng nguyên tắc,
nội qui và đạo lý. Kết quả có 39 câu trả lời không. Tìm khoảng tin cậy 95% cho tỉ
lệ tổng thể những lãnh đạo ngân hàng trả lời không.
Vì vậy, khoảng tin cậy 95% cho phần trăm của tất cả các lãnh đạo ngân hàng nói
chung nhận thấy trong ngành của mình không có những rủi ro trong kinh doanh do
không làm đúng nguyên tắc và đạo lý là khoảng từ 42% đến 64,8%.
V. ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO SỰ KHÁC BIỆT GIỮA TRUNG BÌNH C
ỦA HAI
TỔNG THỂ
1. Ước lượng khoảng tin cậy dựa trên sự phối hợp từng cặp: (Matched pair)
Giả sử rằng chúng ta có một mẫu ngẫu nhiên gồm n cặp quan sát từ những
phân phối với trung bình (x và (y. ÐặtĠ và Sd là trung bình và độ lệch chuẩn
của n sự khác biệt di= xi - yi. Nếu phân phối của những khác biệt này là phân
phối chuẩn thì
· Khoảng tin cậy 100 (1 - () % cho ((x - (y) được tính như sau:
(2.4)
Trong đóĠlà một số sao cho P Ĩľ) =Ġ
Ví dụ: Trọng lượng của các kiện hàng (kg) được sản xuất bởi hai phân xưởng
trong một nhà máy được cho trong bảng dưới đây:
Bảng 2.1:
Kiện hàng
Phân xưởng
A
Phân xưởng
B
(i) (x
· Khoảng tin cậy 99% cho ((x - (y):
- 0,342 <
x -
y
< 1,892
Vì vậy, khoảng tin cậy 99% cho sự chênh lệch trọng lượng trung bình tổng thể
của mỗi kiện hàng được sản xuất từ hai phân xưởng nằm trong khoảng - 0,342 kg
đến 1,892 kg. Khoảng này chứa đựng giá trị 0, điều này cho ta đoán rằng có sự
bằng nhau về trọng lượng trung bình mỗi kiện hàng được sản xuất từ hai phân
xưởng.
2. Ước lượng khoảng tin cậy dựa vào mẫu độc lập có ph
ương sai khác nhau: (Independent
samples)
Giả sử có hai mẫu ngẫu nhiên độc lập có nx và ny quan sát từ những phân
phối chuẩn có trung bình (x và (y và phương sai (x2 và (y2 . Nếu trung bình
mẫu làĠ vàĠ thì khoảng tin cậy 100 (1 - () % cho ( (x - (y) được tính:
(2.5)
Trong đóĠ là một số sao cho P ( Z ľ) =Ġ
Ví dụ: Một mẫu ngẫu nhiên gồm 96 người hút thuốc lá, lượng giờ trung bình của
những người nghỉ việc không có lý do là 2,15 giờ trong tháng và độ lệch chuẩn là
2,09 giờ/ tháng. Một mẫu ngẫu nhiên độc lập khác gồm 206 người không hút
thuốc lá, lượng giờ trung bình của những người nghỉ việc là 1,69 giờ/tháng, độ
lệch chuẩn của mẫu là 1,91 giờ/ tháng. Tìm khoảng tin cậy 99% cho sự khác biệt
của hai trung bình tổng thể.
ÐặtĠ là tỉ lệ của mẫu có nx quan sát từ một tổng thể với tỉ lệ px;
vàĠ là tỉ lệ của
mẫu có ny quan sát từ một tổng thể với tỉ lệ py. Ta có khoảng tin cậy 100 ( 1 - (
)% của sự khác biệt giữa px và py:
Trong đó Z(/2 là một số sao cho P ( Z > Z(/2 ) =Ġ
Ví dụ: Một mẫu ngẫu nhiên gồm 98 kế toán viên, trong đó 48 người đồng ý rằng
Mỗi một chương trình kế toán nên có một phần mềm ứng dụng riêng biệt và đó
cũng là đòi hỏi của tất cả kế toán viên. Một mẫu ngẫu nhiên độc lập gồm 127 giáo
viên kế toán, 21 người đồng ý với điều này. Tìm khoảng tin cậy 95% cho sự khác
biệt giữa hai tỉ lệ của tổng thể những người sẽ đồng ý với luận điểm trên.
Kết luận: Sự thật rằng khoảng 20,7% đến 44,3% đồng ý với yêu cầu trên nhưng
những nhà kế toán thích có một phần mềm ứng dụng riêng biệt hơn là các giáo
viên.
VII. ƯỚC LƯỢNG CỞ MẪU (Estimating the sample size)
Chúng ta đã phát triển những phương pháp để tìm khoảng tin cậy cho một
tham số của tổng thể trên cơ sở thông tin của mẫu. Theo một tiến trình như vậy,
một nhà điều tra có thể tin rằng nếu khoảng tin cậy mang lại kết quả quá rộng thì
phản ánh một điều không mong muốn, bởi vì nó không chắc chắn cho tham số
đang được ước lượng. Một cách điển hình, chỉ có một hướng để đạt được khoảng
hẹp hơn với độ tin cậy cao hơn là tăng số quan sát hay tăng cỡ mẫu (n lớn hơn).
Trong một số trường hợp, các nhà điều tra có thể cố định trước độ rộng của
khoảng tin cậy, chọn n vừa đủ lớn để đảm bảo độ rộng đó. Vậy làm thế nào cỡ
mẫu có thể được chọn theo hướng này cho hai vấn đề ước lượng khoảng.
1. Cỡ mẫu cho những khoảng tin cậy của trung bình tổng thể có phân phối chuẩn khi biết
phương sai:
Xuất phát từ công thức (2.1):Ġ .
Giả sử rằng một mẫu ngẫu nhiên gồm n quan sát từ một phân phối chuẩn có trung
Nếu sau đó một nhà điều tra muốn chọn một cỡ mẫu lớn hơn có ý nghĩa cho việc
bảo đảm khoảng tin cậy không rộng hơn khoảng cách L* cho mỗi bên của tỉ lệ
mẫu.
Ví dụ: Trở lại ví dụ về những nhà lãnh đạo ngân hàng trả lời không về việc chấp
nhận những thực tế trong kinh doanh dựa trên 73 quan sát và chúng ta đã tính
khoảng tin cậy 95% cho tỉ lệ của tổng thể là:
0,42 < p < 0,648
Giả sử chúng ta muốn chắc chắn một khoảng tin cậy 95% cho tỉ lệ tổng thể không
lớn hơn 0,06 cho mỗi bên của tỉ lệ mẫu thì cỡ mẫu của chúng ta sẽ là bao nhiêu?
Vậy để chắc chắn đạt được khoảng tin cậy hẹp hơn, ít nhất chúng ta phải chọn n =
267.
BÀI TẬP
1. Một quá trình sản xuất gạch, trọng lượng những viên gạch nầy được giả sử có
phân phối chuẩn có độ lệch chuẩn 0,12kg. Một mẫu ngẫu nhiên gồm 16 viên gạch
vừa sản xuất ra trong ngày có trọng lượng trung bình 4,07kg.
a. Tìm khoảng tin cậy 99% của trọng lượng trung bình của tất cả các viên gạch
trong ngày?
b. Không cần tính toán, khoảng tin cậy 95% thì trung bình tổng thể sẽ rộng hơn,
hẹp hơn hay bằng với kết quả câu a?
c. Không cần tính toán, một mẫu ngẫu nhiên gồm 20 viên gạch sẽ được chọn ra
trong ngày mai. Khoảng tin cậy 99% thì trọng lượng trung bình tổng thể của tất cả
các viên gạch sản xuất ra trong ngày mai sẽ lớn hơn, nhỏ hơn hay bằng như trong
câu a?
d. Sự thật rằng, độ lệch chuẩn của các viên gạch sản xuất trong ngày mai là
0,15kg, không cần tính toán, khoảng tin cậy 99% thì trọng lượng trung bình tổng
thể của tất cả các viên gạch sản xuất ra trong ngày mai sẽ rộng hơn, hẹp hơn hay
bằng như trong câu a?
nhiều hơn cho khách hàng lớn tuổi. Họ đặt câu hỏi như sau: Những công ty và các
cửa hàng có thể làm gì để giúp quí ông, quí bà một cách tốt nhất. Một mẫu ngẫu
nhiên khác gồm 106 khách hàng khác, tuổi từ 55 - 64, 19,8% trong số nầy cũng
muốn được đáp ứng mong muốn của mình. Tìmû khoảng tin cậy 90% cho sự khác
biệt giữa hai tỉ lệ của hai tổng thể trên?