Một số quy luật phân phối xác suất và ứng dụng của nó trong bài toán kiểm định giả thiết thống kê đơn giản - Pdf 23

Mục lục
Lời cảm ơn 3
Mở đầu 4
1 Một số kiến thức chuẩn bị 7
1.1 Xác suất . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Phép thử và biến cố . . . . . . . . . . . . . . . . . 7
1.1.2 Quan hệ giữa các biến cố . . . . . . . . . . . . . . . 8
1.1.3 Không gian các biến cố sơ cấp . . . . . . . . . . . . 9
1.1.4 Các tính chất cơ bản của xác suất . . . . . . . . . . 10
1.2 Đại lượng ngẫu nhiên và hàm phân phối xác suất . . . . . 11
1.2.1 Đại lượng ngẫu nhiên . . . . . . . . . . . . . . . . . 11
1.2.2 Hàm phân phối xác suất . . . . . . . . . . . . . . . 12
1.2.3 Hàm mật độ xác suất . . . . . . . . . . . . . . . . . 13
1.3 Các tham số đặc trưng của đại lượng ngẫu nhiên . . . . . 15
1.3.1 Kì vọng toán . . . . . . . . . . . . . . . . . . . . . 15
1.3.2 Phương sai . . . . . . . . . . . . . . . . . . . . . . 17
1.3.3 Mốt . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3.4 Trung vị (Median) . . . . . . . . . . . . . . . . . . 20
2 Một số quy luật phân phối xác suất thông dụng 22
2.1 Quy luật nhị thức B(n,p) . . . . . . . . . . . . . . . . . . . 22
2.2 Quy luật phân phối chuẩn . . . . . . . . . . . . . . . . . . 24
2.2.1 Các tham số đặc trưng . . . . . . . . . . . . . . . . 27
1
2.2.2 Quy tắc 2σ và 3σ . . . . . . . . . . . . . . . . . . . 28
2.3 Quy luật khi bình phương (χ
2
(n)) . . . . . . . . . . . . . . 29
2.3.1 Tính chất của quy luật khi bình phương . . . . . . 30
2.3.2 Các tham số đặc trưng . . . . . . . . . . . . . . . . 30
2.4 Quy luật Student T (n) . . . . . . . . . . . . . . . . . . . . 31
3 Một số bài toán kiểm định giả thiết thống kê đơn giản 34

) . . 44
3.4 Kiểm định về xác suất của đại lượng ngẫu nhiên có phân
phối nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5 Kiểm định giả thiết về hai xác suất của hai đại lượng ngẫu
nhiên có phân phối nhị thức . . . . . . . . . . . . . . . . . 50
3.6 Kiểm định giả thiết về tính độc lập của hai dấu hiệu định
tính . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.7 So sánh nhiều tỉ lệ của đại lượng ngẫu nhiên có phân phối
nhị thức . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Kết luận 59
Tài liệu tham khảo 60
2
LỜI CẢM ƠN
Lời đầu tiên tôi xin bày tỏ lòng biết ơn sâu sắc tới: Ban chủ nhiệm khoa
Toán −Lý −Tin, phòng khảo thí và đảm bảo chất lượng, phòng đào tạo
đại học, các thầy cô trong tổ bộ môn Giải tích, đặc biệt là cô giáo Phạm
Thị Thái, người đã định hướng nghiên cứu, hướng dẫn, cũng như động
viên tôi có thêm nghị lực hoàn thành khóa luận này.
Nhân dịp này tôi xin cảm ơn tới người thân và các bạn sinh viên lớp
K51 ĐHSP Toán và K51 ĐHSP Toán − Lý.
Những ý kiến đóng góp, giúp đỡ, động viên của thầy cô và bạn bè đã
tạo điều kiện thuận lợi để tôi hoàn thành khóa luận.
Tôi xin chân thành cảm ơn!
Sơn la, tháng 5 năm 2014.
Người thực hiện
Sinh viên: Vũ Thị Huệ
3
MỞ ĐẦU
1. Lí do chọn đề tài
Một số quy luật phân phối xác suất và bài toán kiểm định giả thiết thống

bài toán kiểm định giả thiết thống kê đơn giản.
2.2. Đối tượng nghiên cứu
Đối tượng nghiên cứu của khóa luận là một số quy luật phân phối trong
xác suất thông dụng và bài toán kiểm định giả thiết thống kê đơn giản.
2.3. Nhiệm vụ nghiên cứu
Với mục đích như trên, tôi đã đặt nhiệm vụ tìm hiểu và trình bày lại
các vấn đề kiến thức có liên quan một cách có hệ thống và logic. Từ đó
xây dựng cơ sở để giải quyết các bài toán kiểm định tương ứng. Mỗi bài
toán đều có ví dụ áp dụng nó.
2.4. Phương pháp nghiên cứu
Do đặt ra nhiệm vụ như trên và do đặc thù bộ môn, tôi chọn phương
pháp sưu tầm tài liệu, hỏi ý kiến chuyên gia, giảng viên hướng dẫn, nhóm
nghiên cứu. Từ đó hệ thống lại kiến thức theo nội dung của khóa luận.
2.5. Giới hạn phạm vi nghiên cứu
Phạm vi nghiên cứu là nghiên cứu vấn đề về quy luật phân phối xác
suất thông dụng và một số bài toán kiểm định giả thiết thống kê theo cổ
điển.
3. Bố cục
Từ mục đích và nhiệm vụ đặt ra bố cục của đề tài được sắp xếp như
sau: Ngoài phần mở đầu, kết luận, mục lục, danh mục tài liệu tham khảo,
nội dung đề tài gồm ba chương:
Chương 1: Trình bày các kiến thức cơ sở về xác suất.
Chương đầu là một số nội dung kiến thức cơ bản nên chỉ dẫn nội dung.
Một số kết quả không chứng minh.
Chương 2: Trình bày về một số quy luật phân phối xác suất thông dụng.
Chương 3: Chương này trình bày cơ sở xây dựng tiêu chuẩn kiểm định
của một số bài toán kiểm định giả thiết thống kê.
4. Đóng góp của khóa luận
5
Khóa luận trình bày một cách có hệ thống kiến thức liên quan. Xây

= "Xuất hiện mặt có số chấm là số nguyên tố"
B
c
= "Xuất hiện mặt có số chấm là số chẵn"
B
l
= "Xuất hiện mặt có số chấm là số lẻ".
7
Ví dụ 1.2. Gieo một hạt đậu tương được xem như là một phép thử " Gieo
hạt đậu tương". Kết quả của phép thử này là hạt nảy mầm hoặc không
nảy mầm đó là biến cố. Như vậy biến cố của phép thử là: hạt nảy mầm,
hạt không nảy mầm.
Như vậy một biến cố chỉ có thể xảy ra khi một phép thử gắn liền với nó
được thực hiện.
Trong thực tế có thể xảy ra các loại biến cố sau:
• Biến cố chắc chắn là biến cố nhất định xảy ra khi thực hiện một phép
thử, kí hiệu là Ω.
• Biến cố không thể là biến cố nhất định không xảy ra khi thực hiện một
phép thử, kí hiệu .
• Biến cố ngẫu nhiên là biến cố có thể xảy ra hoặc không xảy ra khi thực
hiện phép thử.
Kí hiệu: A, B, C, hoặc Bi, i = 1, n.
1.1.2 Quan hệ giữa các biến cố
Định nghĩa 1.3. Hai biến cố A và B gọi là xung khắc với nhau nếu chúng
không thể đồng thời xảy ra trong một phép thử. Trường hợp ngược lại, nếu
hai biến cố có thể cùng xảy ra trong một phép thử thì được gọi là không
xung khắc.
Định nghĩa 1.4. Biến cố A được gọi là thuận lợi cho biến cố B nếu biến
cố A xảy ra kéo theo biến cố B cũng xảy ra và kí hiệu A ⊂ B.
Định nghĩa 1.5. Các biến cố A

l
là hai biến cố xung khắc với nhau
Biến cố B
2
thuận lợi cho biến cố B
c
, kí hiệu B
2
⊂ B
c
Biến cố B
1
, B
2
, B
3
, B
4
, B
5
, B
6
tạo nên một nhóm đầy đủ các biến cố.
Định nghĩa 1.7. Hai biến cố A và A gọi là đối lập với nhau nếu chúng
tạo nên một nhóm đầy đủ các biến cố.
Ví dụ 1.8. Bắn một viên đạn vào bia. Gọi A là biến cố "Đạn bắn trúng
bia", A là biến cố " Đạn bắn trượt bia". Khi đó A và A là hai biến cố đối
lập nhau.
1.1.3 Không gian các biến cố sơ cấp
Định nghĩa 1.9. Khi phép thử được thực hiện có thể xuất hiện nhiều biến

21
Do đó P (A) =
C
4
25
.4
21
5
25
.
b) Gọi B là biến cố "Mỗi toa có 5 hành khách"
Số cách phân ngẫu nhiên 25 hành khách lên 5 toa tàu mà mỗi toa có 5
hành khách là C
5
25
.C
5
20
.C
5
15
.C
5
10
.C
5
5
=
25!
(5!)

nhận giá trị trong không gian R được gọi là đại lượng ngẫu nhiên (ĐLNN)
nếu với x ∈ R tập hợp {w : X(w) < x} là biến cố ngẫu nhiên (w ∈ Ω).
Ta thường kí hiệu đại lượng ngẫu nhiên bằng chữ in hoa X, Y , Z, và
giá trị của nó nhận kí hiệu bằng chữ thường x, y, z,
Ví dụ 1.14. Gọi X là " Số sản phẩm tốt " trong 10 sản phẩm được chọn
ngẫu nhiên từ lô sản phẩm có 100 sản phẩm tốt và 50 phế phẩm. Khi đó
X là ĐLNN mà giá trị nó có thể nhận là: 0, 1, 2, , 10.
Ví dụ 1.15. Gọi Y là " Số con trai trong một lần sinh một con". Khi đó
Y là đại lượng ngẫu nhiên giá trị mà nó có thể nhận là: 0, 1.
Phân loại đại lượng ngẫu nhiên
Định nghĩa 1.16. Đại lượng ngẫu nhiên rời rạc là ĐLNN mà các giá trị
có thể nhận của nó là tập hợp hữu hạn hoặc vô hạn đếm được.
Ví dụ 1.17. Một phân xưởng có 5 máy hoạt động độc lập với nhau. Gọi
X là "Số máy hỏng trong một ca". Khi đó X là ĐLNN rời rạc nhận các
giá trị có thể có là: 0, 1, 2, 3, 4, 5.
Định nghĩa 1.18. ĐLNN được gọi là ĐLNN liên tục nếu các giá trị có
thể có của nó lấp đầy một khoảng nào đó trên trục số.
Ví dụ 1.19. Phép thử bắn một viên đạn vào bia. Nếu gọi X là "Khoảng
cách từ điểm chạm của viên đạn đến tâm bia" thì X là ĐLNN liên tục và
các giá trị có thể của X nằm trong khoảng (a, b) nào đó.
11
1.2.2 Hàm phân phối xác suất
Ta thay kí hiệu (w : X(w) < x) bởi kí hiệu (X < x)
Định nghĩa 1.20. Hàm phân phối xác suất của ĐLNN X, kí hiệu F (x)
là xác suất để ĐLNN X nhận giá trị nhỏ hơn x, với x là một số thực bất
kì, tức là
F (x) = P (X < x), ∀x ∈ R.
Nếu X là ĐLNN rời rạc nhận giá trị có thể x
1
, x

(X = 3)
F (x) = P (X = 1) + P (X = 3) = 0, 1 + 0, 5 = 0, 6.
Nếu x > 4 biến cố (X ≤ x) sẽ xảy ra hoặc khi (X = 1) hoặc khi (X = 3)
hoặc khi (X = 4), do đó
F (x) = P (X = 1) + P (X = 3) + P (X = 4) = 0, 1 + 0, 5 + 0, 4 = 1.
Vậy hàm phân phối xác suất của ĐLNN X là
12
F (X) =

















0 nếu x  1
0, 1 nếu 1 < x  3
0, 6 nếu 3 < x  4
1 nếu x > 4
Tính chất hàm phân phối xác suất

(x), ∀x ∈ R.
Tính chất hàm mật độ
• Hàm mật độ xác suất f(x)  0, ∀x ∈ R.
• Nếu X là ĐLNN có hàm mật độ là f(x) và a, b là hằng số thực thì
P (a < X < b) =
b

a
f(x)dx.
13
Chú ý 1.23. Nếu ĐLNN X liên tục thì
P (a ≤ X < b) = P (a < X ≤ b) = P (a < X < b),
với a, b là hằng số thực
• Hàm phân phối xác suất F (x) =
x

−∞
f(x)dx, ∀x ∈ R.

+∞

−∞
f(x)dx = 1.
Như vậy f(x) là hàm mật độ xác suất của ĐLNN X nào đó ⇔ hai điều
kiện sau thỏa mãn:
i) f(x) ≥ 0, ∀x ∈ R,
ii)
+∞

−∞

= 1.
Ví dụ 1.24. Hàm phân phối xác suất của ĐLNN liên tục X có dạng
F (x) =











0 nếu x  0
ax
2
nếu 0 < x  1
1 nếu x > 1
a) Tìm hệ số a.
b) Tìm hàm mật độ xác suất f(x) của ĐLNN X.
c) Tìm xác suất để ĐLNN X nhận giá trị trong khoảng (0, 25; 0, 75).
Giải.
a) Để F(x) là hàm phân phối xác suất của ĐLNN liên tục X ⇔ F (x) liên
tục trên R ⇔ F (x) liên tục tại x = 0 và x = 1.
14
Hiển nhiên F (x) liên tục tại x = 0.
Xét tại x = 1 ta có lim
x→1


2
= 0, 5.
1.3 Các tham số đặc trưng của đại lượng ngẫu nhiên
1.3.1 Kì vọng toán
Định nghĩa 1.25. Giả sử ĐLNN X nhận các giá trị có thể có x
1
, x
2
, , x
n
,
với xác suất tương ứng là p
1
, p
2
, , p
n
, Khi đó nếu


i=1
|x
i
|p
i
< +∞ thì


i=1
x

xác suất như sau:
X 1 3 4
P 0,1 0,5 0,4
Giải.
Theo định nghĩa kì vọng toán của ĐLNN rời rạc ta có
E(X) = 1.0, 1 + 3.0, 5 + 4.0, 4 = 3, 2.
Ví dụ 1.28. Tìm kì vọng toán của ĐLNN liên tục X có hàm mật độ xác
suất như sau
f(x) =





3
4
(x
2
+ 2x) với x ∈ (0; 1)
0 với x /∈ (0; 1)
Giải.
Theo định nghĩa kì vọng toán của ĐLNN liên tục ta có
E(X) =
+∞

−∞
xf(x)dx =
3
4
1

• Nếu X là ĐLNN có kì vọng E(X) và C là hằng số thì
E(CX) = CE(X).
• Nếu X, Y là hai ĐLNN có kì vọng tương ứng là E(X), E(Y ) thì
E(X + Y ) = E(X) + E(Y ).
• Mở rộng: Nếu X
1
, X
2
, , X
n
là các ĐLNN có các kì vọng tương ứng là
E(X
1
), , E(X
n
) thì
E(
n

i=1
X
i
) =
n

i=1
E(X
i
).
• Nếu X và Y là hai ĐLNN độc lập có các kì vọng tương ứng là E(X), E(Y )

2
+ 1
3
.
1
2
=
1
2
.
1.3.2 Phương sai
Định nghĩa 1.30. Giả sử X là ĐLNN có kì vọng là E(X). Khi đó người
ta gọi kì vọng của ĐLNN [X −E(X)]
2
là phương sai của ĐLNN X, kí hiệu
17
D(X), tức là
D(X) = E[X −E(X)]
2
.
Như vậy: Nếu X là ĐLNN rời rạc nhận giá trị có thể x
1
, x
2
, , x
n
, với
xác suất tương ứng p
1
, p

.
Tính chất của phương sai
• Phương sai của một hằng số C bằng 0, tức là
D(C) = 0.
• Nếu ĐLNN X có phương sai D(X) và C là hằng số thực thì
D(CX) = C
2
D(X).
• Giả sử X, Y là hai ĐLNN độc lập có phương sai tương ứng là D(X), D(Y )
thì
D(X + Y ) = D(X) + D(Y ).
• Mở rộng: Nếu X
1
, X
2
, , X
n
là các ĐLNN độc lập có phương sai tương
ứng là D(X
1
), D(X
2
), , D(X
n
) thì
D(
n

i=1
X

i
, (i = 1, n) độc lập với nhau, do đó theo tính chất của phương sai
ta có
D(X) = D(
n

i=1
X
i
) =
n

i=1
D(X
i
).
Ta tìm D(X
i
), i = 1, n theo công thức
D(X
i
) = E(X
i
)
2
− [E(X
i
)]
2
.

+ 5
2
+ 6
2
) =
91
6
, i = 1, n.
=⇒ D(X
i
) =
91
6


7
2

2
=
35
12
, i = 1, n.
19
Vậy D(X) =
n

i=1
D(X
i



1 với x ∈ [0; 1]
0 với x /∈ [0; 1]
Giải.
Do X là ĐLNN liên tục trên đoạn [0; 1] có f[0; 1] = 1 lớn nhất nên
X
mod
= [0; 1].
1.3.4 Trung vị (Median)
Định nghĩa 1.35. Trung vị của ĐLNN X kí hiệu X
me
là giá trị nằm ở
chính giữa tập hợp các giá trị có thể có của ĐLNN. Nói cách khác đó là
giá trị chia phân phối của ĐLNN thành hai phần bằng nhau.
20
• Nếu X là ĐLNN rời rạc nhận giá trị x
1
, x
2
, , x
n
, thì X
me
= x
i
nếu
thỏa mãn
F (x
i

1 nếu x > 1
Giải.
Do X là ĐLNN liên tục nên
F

1
2

=
1
2
⇒ X
me
=
1
2
.
21
Chương 2
Một số quy luật phân phối xác suất
thông dụng
Trong chương này ta sẽ nghiên cứu một số quy luật phân phối xác suất
thông dụng nhất với các ĐLNN rời rạc và liên tục. Điều đó làm cho việc
phân loại ĐLNN trong thực tế theo các quy luật phân phối xác suất được
dễ dàng hơn.
Giả sử trong bình có N quả cầu trong đó có M quả cầu trắng và N −M
quả cầu đen. Mỗi phép thử là việc lấy ngẫu nhiên từ bình ra một quả cầu.
Theo những cách lấy khác nhau sẽ dẫn đến những lược đồ khác nhau và
các quy luật phân phối xác suất khác nhau.
2.1 Quy luật nhị thức B(n,p)

C
k
n
p
k
q
n−k
C
n
n
p
n
q
0
Ví dụ 2.2. Trong một phân xưởng có 5 máy hoạt động độc lập. Xác suất
để trong một ngày mỗi máy bị hỏng đều bằng 0, 1. Tìm xác suất để
a) Trong một ngày có hai máy hỏng.
b) Trong một ngày có không quá hai máy hỏng.
Giải.
Gọi X là "Số máy hỏng trong một ngày". Khi đó X có phân phối nhị thức
nhận các giá trị có thể: 0, 1, 2, 3, 4, 5 với xác suất là
P (X = k) = C
k
5
.0, 1
k
.0, 9
5−k
, k = 0, 5.
a)Do đó xác suất để trong một ngày có 2 máy hỏng là


npq.
23
2.2 Quy luật phân phối chuẩn
Định nghĩa 2.3. ĐLNN liên tục X nhận giá trị trong khoảng (−∞; +∞)
gọi là phân phối theo quy luật chuẩn với các tham số a và σ
2
nếu hàm mật
độ xác suất của nó có dạng
f(x) =
1
σ


e
−(x − a)
2

2
.
Kí hiệu X  N(a; σ
2
).
Đồ thị của hàm mật độ xác suất f(x) của hàm phân phối chuẩn có dạng
như sau
Hình 2.1.Đồ thị hàm f(x) có phân phối chuẩn.
Qua đồ thị ta thấy khi a và σ thay đổi dạng đồ thị của hàm mật độ xác
suất f(x) cũng thay đổi như sau
Khi a thay đổi thì dạng của đường cong f(x) không thay đổi song nó sẽ
dịch chuyển sang trái hoặc sang phải theo trục Ox. Nếu σ tăng lên thì đồ

Φ(x) =
1

x

−∞
e

u
2
2
du, ∀u ∈ R.
Khi đó ĐLNN X gọi là phân phối chuẩn chính tắc, kí hiệu
X  N(0, 1).
Định lý 2.4. Nêú X  N(a, σ
2
) thì
• Y =
X −a
σ
có phân phối chuẩn dạng N(0, 1).
25


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status