MỤC LỤC
Trang
Lời mở đầu
Phần I. Cơ sở lý thuyết
I. Ước lượng các tham số của ĐLNN
1.1) Ước lượng điểm.
1.2) Ước lượng bằng khoảng tin cậy.
1.2.1)Ước lượng lỳ vọng toán của ĐLNN
1.2.2)Ước lượng tỷ lệ.
1.2.3)Ước lượng phương sai của ĐLNN phân phối chuẩn
II. Kiểm định giả thuyết thống kê.
2.1) Khái niệm
2.2) Các sai lầm thường mắc phải khi làm kiểm định.
2.3) Kiểm định giả thuyết về kỳ vọng toán của một ĐLNN
2.4) Kiểm định giả thuyết về tỷ lệ đám đông.
2.5) Kiểm định giả thuyết về phương sai của ĐLNN phân phối chuẩn.
Phần II. Bài toán
Phần III. Ứng dụng và mở rộng đề tài
3.1) Ước lượng
3.2) Kiểm định
Tài liệu tham khảo
LỜI MỞ ĐẦU
Trong đời sống thực tế có rất nhiều biến cố xảy ra, và con người không thể nào
lường trước hết được. Vì vậy thường có những giả thuyết ước lượng hay những kiểm
định mang tính định tính kết quả đúng sai về các trường hợp xảy ra của các biến cố .
Chính vì lý do đó, việc nghiên cứu ước lượng các tham số của đại lượng ngẫu nhiên và
kiểm định giả thuyết thống kê là rất cần thiết.
Lý thuyết ước lượng, lý thuyết kiểm định các giả thuyết thống kê là những bộ phận quan
trọng của thống kê toán. Đây là phương tiện giúp ta giải quyết các bài toán nhìn từ góc độ
khác liên quan đến dấu hiệu cần nghiên cứu trong tổng thể.
Để ước lượng kỳ vọng toán của “đại lượng ngẫu nhiên” (ĐLNN) X, người ta giả sử trên
nên chiếm khoảng 60% với mức ý nghĩa 5% . hãy kiểm định lại khẳng định trên “.
1)Tầm quan trọng của việc nghiên cứu đề tài.
Trường ĐHTM là một ngôi trường có quy mô lớn với số lượng sinh viên theo học đông
đảo. Trong đó đa phần là các bạn sinh viên ngoại tỉnh theo học, trong đó chi một phần
nhỏ được sống trong lí túc xá của trường còn lại phải tự lo từ chỗ ở đến các vấn đề khác
trong cuộc sống ngoài nhiệm vụ chính là học tập. Cuộc sống học tập xa nhà, xa bố mẹ
khiến các bạn sinh viên phải tự lên kế hoạch chi tiêu hàng tháng cho bản thân sao cho
hợp lý. Trước thực trạng đó nhóm 4 đã chọn và nghiên cứu đề tài 2 nêu trên.
2) Mục tiêu nghiên cứu
Đế tài được thực hiện với mục tiêu :” tìm hiểu mức chi tiêu của sinh viên ngoại tỉnh
trường ĐHTM và so sánh với mức chi tiêu của sinh viên nói chung. Qua đó đưa ra một số
giải pháp giúp sinh viên cân bằng mức chi tiêu cho hợp lý”.
3) Phương pháp nghiên cứu
Nhóm đã tiến hành lấy mẫu ngẫu nhiên n=200 trên đám đông là toàn thể sinh viên ngoại
tinh trường ĐHTM. Mẫu được điều tra trên nhiều khoa, nhiều khoá sinh viên của trường
để có tính xác thực nhất. Từ đó kết luận được mức chi tiêu trung bình của sinh viên ngoại
tinh trường ĐHTM và kiểm định giả thuyết đề tài đưa ra.
PHẦN I: CƠ SỞ LÝ THUYẾT
I, Ước lượng các tham số của ĐLNN
1.1, Ước lượng điểm
Giả sử ta cần ước lượng tham số của ĐLNN trên một đám đông thì ta tiến hành theo
các bước sau:
- Bước 1: Lấy mẫu NN, kích thước N: W = ( x
1
,x
2
… x
n
)
- Bước 1: chọn mẫu ngẫu nhiên: W = ( x
1
,x
2
… x
n
)
- Bước 2: Từ ước lượng tốt nhất của xác định thống kê.:
G = f( x
1
,x
2
… x
n
, ). Sao cho hàm thống kê G có quy luật phân phối hoàn toàn
xác định không phụ thuộc vào tham số
- Bước 3: Với xác suất : = 1 - cho trước, xác định α
1
> 0 ; α
2
> 0 thỏa mãn α
1
+
α
2
= α
Đồng thời, tìm được : và thỏa mãn :
P( G > ) = 1 -
P ( G > ) =
P (< G < ) = ( - = 1 – () = 1 – α = ﻻ
P( ) = 1 – α =
Từ đó có khoảng tin cậy của : ()
Bài toán 1 : tìm sai số ƯL .tính theo (1)
Bài toán 2 : Tìm độ tin cậy
(1) => => tìm được => tìm = 1 – α
Bài toán 3: Tìm kích thước mẫu : n = ( )
2
Ví dụ :Chạy thử 9 lần 1 loại xe oto đua mới sản xuát tính được lượng xăng tiêu thụ trung
bình trên 100km là 13,2lit
a).Với độ tin cậy 99% hãy ước lượng lượng xăng tiêu thụ TB trên 100km của loại xe trên.
Biết lượng xăng tiêu thụ của xe trên 100km là 1 ĐLNN tuân theo quy luật phân phối
chuẩn với độ lệch tiêu chuẩn là 2,5lit
Giải
Gọi X là lượng xăng tiêu thụ trên 100km.
X
lượng xăng tiêu thụ trung bình trên 100km trên mẫu
là lượng xăng tiêu thụ trung bình trên 100km trên đám đông.
Ta có X ~ N(µ; σ
2
) nếu σ = (2,5) đã biết.
~ ( )
Thông kê: U = ~ N ( 0 ;1 )
Với độ tin cậy = 1 – α ta tìm được
P(- < U < ) = 1 – α =
Thay U ta có : P(- . < < + . ) =
Khoảng tin cậy của µ : - . ; + . )
Với n = 9; = 13,2 ; = 2,5 ; = 0,99 ; = u
0,005
= 2,58
Khoảng tin cậy của µ : - . ; + . )
P( - u
α
< U ) = 1 – α =
Khoảng tin cậy : ƯL µ
max
: ( - ; )
TH2) ĐLNN X phân phối theo quy luật phân phối chuẩn, Var(X)=
σ
2
chưa
biết, n<30:
T = ~ T
(n - 1)
• Khoảng tin cậy đối xứng : ( = = ).
Với độ tin cậy 1 – α ta tìm được phân vị sao cho:
P( < ) = 1 – α
P( ) = 1 – α =
Khoảng tin cậy của µ: ( ) Trong đó : = .
Chú ý:
Bài toán 1: Biết kích thước mẫu n; biết độ tin cậy, cần tìm sai số hoặc khoảng tin cậy :
= .
Bài toán 2: Biết kích thước mẫu, biết sai số, tìm độ tin cậy
= => tìm được => tìm được 1- α =
Bài toán 3: Biết kích thước mẫu n:
n = ( . )
2
Để
tìm được kích thước mẫu n, ta phải sử dụng phương pháp mẫu kép như sau:
Với độ tin cậy 1 – α ta tìm được phân vị sao cho:
P(- < T ) = 1 – α
P( µ < . ) = 1 – α
Từ đó ta có khoảng tin cậy trái : ( - ; .
Ví dụ: Theo dõi ngẫu nhiên doanh số bán hàng trong 9 ngày của một cửa hàng bán bia tại
Hà Nội thu được kết quả ( đơn vị triệu đồng)
130 150 140 180 100 120 110 120 90
Với độ tin cậy 90% hãy ước lượng doanh số trung bình một ngày cảu cửa hàng.
Biết doanh số bán ra một ngày của cửa hàng là một ĐLNN phân phối theo quy luật
chuẩn.
Lời giải:
Ta có bảng phân phối:
x
i
n
i
x
i.
n
i
n
i
.x
i
2
90 1 90 8100
100 1 100 10000
110 1 110 12100
120 1 240 2880
130 1 130 16900
Thời gian sản xuất một sản phẩm 9 10 11 12
Số công nhân 3 9 20 4
Với độ tin cậy 99% hãy ước lượng thời gian trung bình tối đa cần thiết để sản xuất ra
một sản phẩm loại trên.
Lời giải:
Ta có bảng phân phối:
n
i
x
i
n
i
x
i
N
i
x
i
2
3 9 27 243
9 10 90 900
20 11 220 2420
4 12 48 576
= =10,694
== 0,716; s’≈ 0,7863
Vì n>30 => ~ N, γ= 0,99
Gọi X là thời gian cần thiết sản xuất một sản phẩm.
μ là thời gian trung bình cần thiết sản xuất một sản phẩm trên đám đông.
là thời gian trung bình cần thiết sản xuất một sản phẩm trên mẫu.
Do n=36>30, X chưa biết quy luật:
trên đám đông thì ta phải tìm khoảng tin
cậy của p sau đó nhân với kích thước của đám đông N
2. Muốn ƯL số phần tử của đám đông N, ta phải ƯL khoảng tin cậy của T
p=; n=
Khoảng tin cậy: (
• Khoảng tin cậy phải:
Độ tin cậy 1-α, xác định phân vị sao cho P(U < ) ≈ 1-α
Thay biểu thức của U, biến đổi ta được: P≈ 1-α
Ta lấy khoảng tin cậy p ≈ f, khoảng tin cậy phải của p:
• Khoảng tin cậy trái:
Tương tự với độ tin cậy phải, (1-α) xác định phân vị sao cho:
P(-< U) = 1- α
Thay biểu thức U, biến đổi ta được P ≈ 1-α
p ≈ q khoảng tin cậy trái của p
Ví dụ: Điều tra 100 cửa hàng kinh doanh mặt thực phẩm có 85 cửa hàng đạt tiêu chuẩn
về VSATTP
a, với độ tin cậy 98% hãy ước lượng các cửa hàng đảm bảo VSATTP.
b, với độ tin cậy là bao nhiêu có thể nói rằng tỷ lệ các cửa hàng đảm bảo VSATTP nằm
trong khoảng từ 0,78 → 0,92
GIẢI:
Gọi p là tỷ lệ cửa hàng bảo đảm VSATTP .
f là tỷ lệ cửa hàng bảo đảm VSATTP trên mẫu.
n=100 lớn; f = N
U= ~ N(0,1)
Với độ tin cậy γ= 1- α ta tìm được sao cho:
P() = 1-α = γ
P= 1-α = γ
Do n lớn p≈ f ta có khoảng tin cậy của p
Với f= = 0,85; = = 1,96
Khoảng tin cậy của p: (0,78; 0,91998)
II. Kiểm định giả thuyết thống kê
2.1. Khái niệm:
Kiểm định giả thiết là một bài toán quan trọng trong đời sống cũng như trong thống kê,
kiểm toán. Ta thường gặp 1 cặp giả thiết đối nghịch nhau, bằng khả năng của mình, ta
phải xác định xem giả thiết nào đúng
- Giả thiết thống kê là các giả thiết về trung bình (μ), phương sai mẫu (σ
2
), tỉ lệ (f),… của
đám đông (mẫu ) đang xét.
- Nội dung của bài toán kiểm định: Cho hai giả thiết H
0
, H
1
(thường là đối nghịch
nhau). Dựa vào các số liệu thu được, ta phải quyết định xem giả thiết H
0
đúng hay sai.
Giả thiết H
1
đối nghịch với giả thiết H
0
gọi là đối thiết của H
0
. Việc đưa ra quyết định
chấp nhận hay bác bỏ một giả thiết thống kê gọi là làm kiểm định (hay kiểm định thống
kê).
Khi giả thiết H
0
có dạng: H
0
0
. Hoặc ta biết được khả năng a <a
0
thì đặt đối thiết H
1
: a < a
0
.
Nếu kiểm định giả thiết với giả thiết đối dạng H
1
: a > a
0
thì được gọi là kiểm định giả
thiết về phía bên phải. Nếu kiểm định giả thiết với giả thiết đối dạng H
1
: a < a
0
thì được
gọi là kiểm định giả thiết về phía bên trái
2.2. Các sai lầm mắc phải khi làm kiểm định:
Khi làm kiểm định, ta có thể mắc phải các sai lầm sau đây:
• Sai lầm loại 1: Bác bỏ 1 giả thiết đúng ( Bác bỏ H
0
khi H
0
đúng).
• Sai lầm loại 2: Chấp nhận 1 giả thiết sai (Nhận H
0
khi H
0
-miền bác bỏ: Giả sử đúng → G có quy luật xác định.
Với α nhỏ xác định miền ; P(G ) = α
⟹ biến cố (G) có xác suất nhỏ.
Ngược lại, nếu trong một lần thực thực thử:
: trái với nguyên lý xác suất nhỏ.
Nên bác bỏ chấp nhận .
thì chấp nhận
• Thủ tục kiểm định:
B1: Với mức ý nghĩa α xác định bài toán kiểm định
B2: Xây dựng thống kê kiểm định.
B3: Xác định miền bác bỏ.
B4:Tính và dựa vào quy tắc kiểm định để kết luận.
2.3, Kiểm định giả thuyết thống kê về kỳ vọng toán.
TH1.X~ N( μ, ) và đã biết:
• Bài toán 1: với α ta kiểm định
Xây dựng tiêu chuẩn kiểm định : U=
Giả sử đúng, khi đó U~N(0;1)
Với α cho trước xác định được
P(|U| > ) = α
Theo nguyên lý xác suất nhỏ ta có miền bác bỏ :
= { : | > } với =
• Bài toán 2:
Với sao cho P(U > ) = α
= { : > } với =
• Bài toán 3:
Với sao cho P(U <- ) = α
= { : <- } với =
Ví dụ: Trước khi thay đổi trang thiết bị,tiền lãi trung bình mỗi ngày của một cửa hàng là
20 triệu đồng. Sau khi thay đổi trang thiết bị, theo dõi 16 ngày liên tiếp thấy tiền lãi trung
bình của mỗi ngày là 20,3 triệu đồng.
Giả sử đúng => T ~
Với α ta tìm đươc sao cho P = α
= { : | > } với =
• bài toán 2:
Với α ta kiểm định
Miền bác bỏ : = { : > }
• bài toán 3:
Với α ta kiểm định
Miền bác bỏ = { : <- }
2.4. Kiểm định giả thuyết thống kê về tỷ lệ:
Xây dựng tiêu chuẩn kiểm định: U
• bài toán 1: với mức ý ngĩa α
Giả sử đúng tìm được sao cho:
P(|U| > ) = α = { : | > }với =
• bài toán 2:
Miền bác bỏ: = : > }
• bài toán 3
Miền bác bỏ: = : <- }
2.5, Kiểm định giả thuyết về phương sai:
Giả sử X~ N( μ, )
• bài tập 1: Xây dựng tiêu chuẩn kiểm định
Giả sử đúng ~
Với α cho trước xác định phân vị và sao cho:
P = α
= với =
• bài tập 2: với α:
Với mức ý nghĩa α ta xác định được sao cho:
P = α
Miền bác bỏ =
• bài tập 3: với α:
6 Nguyễn Thị Diệp K48F2 12D160066 Bắc Ninh 2.3
7 Vũ Ngọc Anh K48C4 12D120182 Nam Định 1.8
8 Nguyễn Thị Hiên K48C5 12D120254 Hải Phòng 2
9 Nguyễn Khác Hấn K48H3 11D180132 Bắc Ninh 2
10 Vũ Thị Chung K48B3 12D110125 Bắc Ninh 2.2
11 Nguyễn Thị Vân Anh K48B2 12D110061 Bắc Ninh 2
12 Nguyễn Thị Hậu K48C3 12D120133 Thanh Hoá 2
13 Lê thị Phương K48C4 12D120217 Thanh Hoá 1.9
14 Nguyễn Thanh Thuỷ K48C5 12D120285 thái Bình 2
15 Trần Văn Hoà K48C4 12D120198 Bắc Giang 2.5
16 Nguyễn Thị Huyền K48C4 12D120200 Vĩnh Phúc 1.5
17 Nguyễn Thị Thắm K48C4 12D12022 vĩnh Phúc 1.5
18 Nguyễn Thị Phương K48B6 12D110333 Hà nam 2.5
19 Nguyễn Duy Quảng K48B6 12d110336 Nam Định 2
20 Phạm Thị Thu K48B6 12D110347 Bắc Giang 1.5
21 Hoàng Thị Yến K48B6 12d110358 Bắc Ninh 2
22
Nguyễn Thị Hồng
Thơm K48B5 12D110288 Hà Tĩnh 1.8
23 Hoàng Thu Trang K48B5 12D110294 Thanh Hoá 2
24 Nguyễn Thị Tú K48B5 12d110296 Phú Thọ 2.5
25 Nguyễn Thị Trinh K48N5 12D170283 Bắc Ninh 1.6
26 Lại Thị Tươi K48H6 12D180356 Thái Bình 2
27 Hoàng Hải K48H6 12D180340 Nam Định 1.5
28 Đỗ Bích Diệp K48E2 12D130170 Hải Dương 2
ST
T Họ và tên Lớp MSV Quê quán
Mức chi
tiêu
29 Ngô Thị Trang K48H6 12D180320 Thanh Hoá 3
T Họ và tên Lớp MSV Quê quán
Mức chi
tiêu
57 Hoàng Thị Phương Anh k48e6 12d130329 Lạng Sơn 2.5
58 Trần Thị Xuân k48e2 12d130108 Phú Thọ 2.5
59 Đinh Hoàng Anh k48e2 12d130063 Yên Bái 1.5
60 Trần Văn Mạnh k47u 11d210026 Phú Thọ 2
61 Trần Thị Yến k48d5 12d150339 Nghệ An 1.5
62 Tống Thị Thanh Tuyết k49f5 13d160343 Nghệ An 1.5
63 Đặng Ngọc Hà k49e1 13d160010 Thái Bình 2
64 Bùi Thị Thu Lý k48d3 12d150173 Thái Bình 2.5
65 Đỗ Dương Ngân Hạnh k48e2 12d130073 Hải Dương 2
66 Trịnh Ngọc Huyền k48e1 12d130017 Hải Phòng 3.5
67 Tống Đức Thanh Hà k47e3 11d130192 Hải Phòng 3
68 Nguyễn Thu Hiền k48e1 12d130055 Ninh Bình 2
69 Đỗ Tiến Được k49h1 13d230024 Hà Tĩnh 2.5
70 Vũ Hoàng Hanh k49i2 13d21302 Quảng Ninh 2.5
71 Đồng Ngọc Hà k49e2 13d10023 Ninh Bình 1.8
72 Mai Ngọc Trang k47f1 11d24100 Thái Bình 1.6
73 Ngô Thùy Dương k49e2 13d23012
Thái
Nguyên 2.2
74 Bùi Văn Nam k49h3 13d12309 Hà Tây 2
75 Vũ Anh Kiệt k48s1 12d130678 Nam Định 1.8
76 Đỗ Thu Hương K48C4 12D120203 Hải Dương 1.8
77 Trần phi Long K48C4 12D120207 Nam Định 2
78 Nguyễn Thanh Lam K48B6 12D110257 Thái Bình 2.5
79 Vũ Thị Thu Lan K49K4 13D240234 Thái Bình 2.2
80 Đỗ Thị Hải Yến K46C2 10D120134 Thái bình 2.2
81 Đỗ Thị Hảo K48C4 12D120192 Thái Bình 1.5
104 Mai Thuý Hằng K48E2 12D130074 Hưng Yên 1.5
105 Nguyễn Thị Hà K48E3 12D130301 Bắc Ninh 1.8
106 Phạm THị Thu Hương K48E3 12D130139 Hưng Yên 3
107 Lê Thị Thu Hằng K48E3 12D130135 Thái BÌnh 3
108 Nguyễn Thị Hường K48E4 12D130199 Hà TĨnh 2.5
109 Nguyễn Thị Dinh K48E4 12D130232 Hưng Yên 2
110 Nguyễn Thu Hiền K48E1 12D130055 Phú Thọ 2
111 Vũ Thị Ly K48E3 12D130143 bắc Ninh 2
112 Nguyễn Thị Thanh K48E2 12D130094 Vĩnh Phúc 2