1 | P a g e NGUYỄN VĂN ĐẮC
BÀI GIẢNG TOÁN 5
XÁC SUẤT & THỐNG KÊ
2 | P a g e Giới thiệu môn học
Lý thuyết xác suất ra vào nửa cuối thế kỷ thứ 17 ở nước Pháp, nó là bộ phận của toán học nghiên cứu
các quy luật của hiện tượng ngẫu nhiên. Hơn 300 năm tồn tại và phát triển, đến nay lý thuyết này đã có
nội dung vô cùng phong phú, được áp dụng trong nhiều ngành khoa học cũng như trong cuộc sống đời
thường. Thống kê toán học(TKTH) là khoa học về các phương pháp toán học để xử lí các kết quả thực
nghiệm hoặc các dữ liệu thống kê nhằm rút ra các kết luận khoa học và thực tiễn. Để có được những
3 | P a g e
Tài liệu tham khảo chính
[1] Ronald E. Walpole, Raymond H.Myers và Sharon L.Myers, Xác suất và thống kê
dành cho kỹ sư và nhà khoa học(Bản dịch lần 1 của Bộ môn ĐS-XS&TK ĐHTL).
[2] Morris H. DeGroot, Mark J. Schervish, Probability and Statistics(Third edition).
[3] Đặng Hùng Thắng, Mở đầu về lí thuyết xác suất và các ứng dụng,Nhà XBGD,1997.
[4] Trần Mạnh Tuấn, Xác suất & Thống kê lý thuyết và thực hành tính toán, Nhà xuất
bản ĐHQGHN, 2004.
5 | P a g e BIẾN CỐ
VÀ XÁC SUẤT CỦA BIẾN CỐ
1.1 Phép thử và không gian mẫu
Ta đã biết trong toán học có những khái niệm cơ bản không được định nghĩa, chẳng hạn như điểm,
đường thẳng, mặt phẳng, tập hợp. Phép thử ngẫu nhiên là một khái niệm kiểu như vậy, các hành động
mà các kết quả của nó không thể dự đoán trước đều được gọi chung là phép thử ngẫu nhiên, gọi tắt là
phép thử (do ta không quan tâm đến những hành động có thể dự đoán trước được kết quả).
Tuy không đoán được kết quả của phép thử nhưng ta có thể liệt kê được các kết quả của nó.
Định nghĩa 1.1
Tập hợp gồm tất cả các kết quả của phép thử được gọi là không gian mẫu(sample space) và ký
hiệu bởi S hoặc
.
Mỗi phần tử trong không gian mẫu được gọi là một kết quả của phép thử hoặc là một điểm mẫu. Do
định nghĩa như vậy nên khi trình bày không gian mẫu ta dùng cách trình bày của tập hợp.
Ví dụ 1.1 Tung một đồng xu. Không gian mẫu là
={S, N},
S biểu thị cho kết quả mặt sấp xuất hiện, N biểu thị cho kết quả mặt ngửa xuất hiện.
S NS
1 S 1
2 S 2
S 3 S 3
4 S 4
5 S 5
6 S 6
Như vậy không gian mẫu là
S = {NN, NS, S 1, S 2, S 3, S 4, S 5, S 6}.
1.2 Biến cố và các phép toán biến cố
Với mỗi phép thử cụ thể, ta có thể quan tâm đến một sự kiện nào đó gồm một hoặc một số kết quả.
Chẳng hạn, trong một trò chơi may rủi như sau: Gieo hai đồng xu, nếu hai mặt ngửa xuất hiện thì người
chơi được 5000 đồng ngược lại thì người chơi mất 1000 đồng. Lúc này, không gian mẫu là
={SS, NN, SN, NS}.
Sự kiện mà ta quan tâm gồm “hai mặt ngửa xuất hiện” = {NN}
và “không có hai mặt ngửa xuất hiện” ={NN, SN, NS}. Mỗi sự kiện trên
đã được đồng nhất với một tập con của không gian mẫu, người ta gọi là các biến cố. Tổng quát, ta có
định nghĩa sau
Định nghĩa 1.2
Mỗi tập con của không gian mẫu được gọi là một biến cố.
Dùng các chữ cái in hoa như A, B, C, A
1
, A
2
,… để ký hiệu cho biến cố.
Đặc biệt, sự kiện không bao giờ xảy ra khi thực hiện phép thử thì được đồng nhất với tập rỗng nên
ký hiệu bởi và gọi là biến cố không, còn sự kiện chắc chắn sẽ xảy ra khi thực hiện phép thử thì được
nhiều biến cố.
Ví dụ 1.5 Gieo một đồng xu hai lần.
Không gian mẫu là
= {SS, SN, NS, NN}.
Đặt A = {SS, SN, NS}, B = {NN}, C = {SN, NS, NN}.
a) Biến cố nào kéo theo biến cố nào? Biến cố nào tương đương với biến cố “có ít nhất một lần xuất
hiện mặt ngửa”?
b) Tìm biến cố đối của B?
c) Hãy phát biểu bằng lời biến cố giao của A và B. Hai biến cố A và B có xung khắc?
d) Xác định biến cố A
B.
Giải
a) Vì B
C nên B kéo theo C.
b) Do
\B = A nên biến cố B’ = A.
c) A
B ={SN, NS} = “một lần xấp và một lần ngửa xuất hiện”. Vì A
B ≠ nên A và B không
xung khắc.
d) A
8 | P a g e
Giải
i) ABC là biến cố “cả ba xạ thủ đều bắn trúng”.
A’B’C’ là biến cố “cả ba xạ thủ đều bắn trượt”.
A
B
C là biến cố “có ít nhất một xạ thủ bắn trúng”
ii) D = AB
BC
CA.
E = A’B’
B’C’
C’A’
F = AB’C’
A’BC’
A’B’C
G=A’B’C.
Từ các định nghĩa trên ta được các phép biến cố có những tích chất (tương ứng với tính chất của các
phép toán tập hợp) như sau:
a) Giao hoán A
(A
B)’ = A’
B’
(A
B)’=A’
B’.
Ngoài ra (A’)’ = A A
A’=S A
A’ = . I.3 Định nghĩa xác suất của một biến cố
Theo những tài liệu lịch sử thì có lẽ sự thèm khát khôn nguôi của con người đối với các trò cờ bạc đã
dẫn đến sự ra đời và phát triển của lý thuyết xác suất. Nhằm làm tăng các chiến thắng, các con bạc đã
nhờ các nhà toán học cung cấp chiến lược tốt nhất cho các trò chơi may rủi khác nhau. Một số nhà toán
học đã cung cấp các chiến lược là Pascal, Leibniz, Fermat, và James Bernuolli, những nhà toán học này
được coi là những người khai sinh ra lý thuyết xác suất. Sự phát triển của lý thuyết xác suất ở thời kỳ
đầu cùng với những suy diễn thống kê, các dự đoán và sự khái quát hoá của nó đã vượt ra khỏi những
trò chơi may rủi để bao hàm nhiều lĩnh vực khác có liên quan đến những sự xuất hiện ngẫu nhiên như
chính trị, kinh doanh, dự báo thời tiết, và nghiên cứu khoa học. Như vậy, để đưa ra những dự đoán và
suy diễn thống kê có cơ sở ta cần phải có hiểu biết cơ bản về lý thuyết xác suất.
Trong đời sống hàng ngày, ta có thể gặp những khẳng định như: “Tôi có 90% cơ hội thi qua môn xác
suất và thông kê” hoặc “Cơ hội chiến thắng chia đều cho hai đội” hoặc “Đội tuyển bóng đá Việt Nam
có rất ít cơ hội giành chiến thắng trước đội tuyển Brazil”…Trong mỗi trường hợp, ta đều thấy đề cập
là xác suất của s
i
. Tổng
xác suất của các điểm mẫu trong A được gọi là xác suất của A (the probability of A), ký hiệu P(A).
Định nghĩa
Cho phép thử với không gian mẫu S mà mỗi điểm mẫu đã được gán xác suất và A là một biến cố
của phép thử. Ta gọi tổng xác suất của các điểm mẫu trong A là xác suất của A.
Như vậy 0 ≤ P(A) ≤ 1 P(S) = 1 và P() = 0.
Ví dụ 1.7 Một con xúc xắc được đổ chì sao cho khả năng xuất hiện mặt chẵn chấm gấp đôi khả năng
xuất hiện mặt lẻ chấm. Gieo con xúc xắc đó một lần. Đặt A = “số chấm xuất hiện nhỏ hơn 4” B = “số
chấm xuất hiện là chẵn” C = “số chấm xuất hiện chia hết cho 3”.
a) Tính xác suất của biến cố A?
b) Tính P(A+B), P(AC)?
Giải
Không gian mẫu là S = { 1, 2, 3, 4, 5, 6}. Ta gán cho mỗi mặt lẻ chấm một xác suất là p, theo giả thiết
thì mỗi mặt chẵn chấm phải được gán cho xác suất là 2p và ta phải có:
3p + 3(2p) = 1 hay p = 1/9.
a) Do A = {1, 2, 3} nên P(A) =
1 2 1 4
9 9 9 9
.
b) Do B = {2, 4, 6} nên A + B = {1, 2, 3, 4, 6}, từ đó P(A + B) =
1 2 1 2 2 8
9 9 9 9 9 9
.
+ Đếm số biến cố sơ cấp của phép thử.
+ Đếm số biến cố sơ cấp nằm trong A, mỗi biến cố sơ cấp(b.c.s.c) nằm trong A còn được gọi là
b.c.s.c thuận lợi cho A.
Ví dụ 1.9 Một đống kẹo trộn lẫn 6 chiếc bạc hà, 4 chiếc kẹo bơ, và 3 chiếc chocolate. Nếu một
người chọn ngẫu nhiên một trong những chiếc kẹo này, hãy tìm xác suất để được
(a) một chiếc bạc hà; b)một chiếc kẹo bơ hoặc một chocolate.
Giải
Đặt M, T và C biểu thị các biến cố chọn được,tương ứng, một chiếc bạc hà, kẹo bơ, hoặc chocolate.
Tổng số kẹo bằng 13 và đều đồng khả năng được chọn.
(a) Do 6 trong 13 chiếc là bạc hà, suy ra P(M) =
13
6
.
(b) Do 7 trong 13 chiếc kẹo là bơ hoặc chocolate, suy ra P(TC) =
13
7
.
Việc đếm số lượng điểm mẫu đôi khi ta phải dùng “mẹo” , đó là dùng quy tắc cộng, quy tắc nhân,
hoán vị, chỉnh hợp, tổ hợp ta đã được học trong chương trình phổ thông. Xin xem thêm phần nhắc lại
và bổ xung về phép đếm ở cuối Mục này.
Ví dụ 1.10 Rút ngẫu nhiên 5 cây bài từ bộ bài 52 quân, hãy tìm xác suất để được 2 cây Át và 3 cây J.
Giải
Số cách lấy 2 cây từ 4 cây Át là
5
52
=
!47!5
!52
= 2598960.
Do đó, xác suất của biến cố C = “rút được 2 Át và 3 J”
P(C) =
2598960
24
= 0.910
-5
.
Lưu ý về ký hiệu:
3
4
trùng với ký hiệu
3
4
Số lần xuất hiện mặt sấp Tần suất
Buffon4040
2048
0.5080
Pearson12 000
6010
0.5016
Pearson24 000
12012
0.5005
1
n
2
= (6)(6) = 36 cách.
12 | P a g e
Quy tắc nhân ở trên có thể mở rộng đến một số bất kỳ các hành động. Quy tắc nhân tổng quát
có k hành động được khẳng định như sau:
Nếu một hành động có thể thực hiện theo n
1
cách, và nếu đối với mỗi cách này một hành động thứ hai
có thể thực hiện theo n
2
cách, và cứ với một cặp hành động một và hành động hai hành động ba có
thể thực hiện theo n
3
cách, vân vân, thì dãy k hành động có thể thực hiện theo n
1
n
2
n
k
cách.
Ví dụ Có bao nhiêu cách lựa chọn bữa ăn gồm có xúp, sandwich, món tráng miệng, và một đồ uống từ
4 món xúp, 3 kiểu sandwich, 5 món tráng miệng, và 4 đồ uống?
Giải
Do n
1
= 4, n
2
2
n
3
= (2)(4)(3) = 24
số chẵn có ba chữ số.
Ta thường quan tâm đến không gian mẫu mà các phần tử là tất cả những cách sắp thứ tự hoặc
sắp xếp có thể của một nhóm đối tượng. Chẳng hạn, có thể ta muốn biết có bao nhiêu sắp xếp khác
nhau cho 6 người ngồi quanh một cái bàn, hoặc có thể ta muốn tìm có bao nhiêu cách rút khác nhau về
thứ tự để lấy ra 2 trong 20 vé số. Những sắp xếp khác nhau được gọi là các hoán vị.
Định nghĩa
Một hoán vị là một sắp xếp của toàn bộ hoặc một bộ phận của một tập phần tử.
Xét ba chữ cái a, b, và c. Những hoán vị có thể là abc, acb, bac, bca, cab và cba. Như vậy, ta thấy rằng
có 6 sắp xếp khác nhau. Sử dụng Định lý 2.2 ta có thể trả lời là 6 mà không cần liệt kê ra các cách sắp
thứ tự khác nhau. Có n
1
= 3 cách chọn cho vị trí thứ nhất, tiếp theo có n
2
= 2 cách chọn cho vị trí thứ
hai, rốt cuộc có đúng n
3
= 1 cách chọn cho vị trí cuối cùng, cho tổng cộng gồm
n
1
n
2
n
3
= (3)(2)(1) = 6 hoán vị.
Nói chung, n đối tượng phân biệt có thể sắp xếp theo
n(n - 1)(n - 2) (3)(2)(1) cách.
r
n
A
.
Vậy là ta có
Số những hoán vị của n phần tử phân biệt được lấy r lần liên tiếp là
n
P
r
=
)!(
!
rn
n
.
Ví dụ Hai vé số được rút từ 20 vé dành cho giải nhất và nhì. Hãy tìm số điểm mẫu trong không gian S.
Giải
Tổng số điểm mẫu là
20
P
2
=
!18
!20
= (20)(19) = 380.
Ví dụ Một đề tài nhánh của Hội Hóa học Mỹ có bao nhiêu cách bố trí 3 báo cáo viên cho 3 cuộc họp
khác nhau nếu họ đều có thể thu xếp được bất kỳ một trong 5 ngày?
Giải
kiểu thứ hai, , n
k
phần tử thuộc kiểu thứ k là
!!!
!
21 k
nnn
n
.
Ví dụ Có bao nhiêu cách sắp khác nhau để tạo thành một xâu đèn của cây thông Noel có 3 bóng đèn
đỏ, 4 bóng đèn vàng, và 2 bóng đèn xanh với 9 ổ cắm?
Giải
Tổng số sắp xếp phân biệt là
!2!4!3
!9
= 1260.
Ta thường quan tâm đến số cách phân hoạch một tập gồm n phần tử thành r tập con được gọi là
các ngăn. Một phân hoạch được hoàn thành khi giao của mọi cặp trong r tập con là tập rỗng và hợp
của tất cả những tập con là tập ban đầu. Thứ tự của các phần tử bên trong một ngăn là không quan
trọng. Xét tập {a, e, i, o, u}. Tất cả những phân hoạch có hai ngăn mà ngăn đầu chứa 4 phần tử và ngăn
thứ hai chứa 1 phần tử là
{(a, e, i, o), (u)}, {(a, i, o, u), (e)},{(e, i, o, u), (a)},{(a, e, o, u), (i)}, {(a, e, i, u), (o)}.
Ta thấy rằng có 5 con đường như vậy để phân hoạch một tập gồm 5 phần tử thành hai tập con hay ngăn
chứa 4 phần tử trong ngăn đầu và 1 phần tử trong ngăn thứ hai.
Số những phân hoạch đối với ví dụ minh họa này được ký hiệu bởi
21
=
!!!
!
21 k
nnn
n
,
trong đó n
1
+ n
2
+ + n
r
= n.
Ví dụ Có bao nhiêu cách phân cho 7 nhà khoa học vào 1 buồng ba và hai buồng đôi của một khách
sạn?
Giải
Tổng số phân hoạch có thể có là
2,2,3
7
r
n
hoặc
r
n
C
,
do số phần tử trong ngăn thứ hai là n - r.
Số các tổ hợp của n phần tử phân biệt được tạo ra khi lấy r phần tử cùng một lúc là
r
n
=
)!(!
!
rnr
n
.
Ví dụ Hãy tìm số ủy ban gồm 2 nhà hóa học và 1 nhà vật lí mà có thể tạo được từ 4 nhà hóa học và 3
nhà vật lý.
Giải Số cách chọn 2 trong 4 nhà hóa học là
2
= 3, ta có thể tạo được
n
1
n
2
= (6)(3) = 18
ủy ban với 2 nhà hóa học và 1 nhà vật lí.
I.4 Quy tắc cộng xác suất
Với hai biến cố A, B của cùng một phép thử, ta có biến cố A + B. Vấn đề đặt ra là P(A + B) có thể
biểu diễn qua P(A) và P(B) hay không? Nếu giải quyết được vấn đề này, thì việc tính xác suất của một
biến cố có thể được giải quyết bằng cách biểu thị biến cố đó thành tổng của các biến cố với xác suất dễ
tính toán hơn. Mục này tập trung vào trình bày những kết quả có liên quan đến vấn đề này.
Trước tiên, hãy quan sát Biểu đồ Veen sau
Biểu đồ trên mô tả hai biến cố xung khắc, xác suất của A + B bằng tổng xác suất của các điểm mẫu
trong A và các điểm mẫu trong B do hai biến cố không có điểm mẫu chung nên P(A + B) = P(A) +P(B).
16 | P a g e Biểu đồ sau đây mô tả hai biến cố không xung khắc
Trong trường hợp này, nếu tính tổng xác suất tại các điểm mẫu nằm trong A , tổng các điểm mẫu
trong B rồi cộng lại thì các điểm mẫu nằm trong AB sẽ được tính hai lần nên
P(A+B) = P(A) + P(B) – P(AB).
Tóm lại ta được
Quy tắc cộng
Nếu A và B là hai biến cố bất kỳ của cùng một phép thử, thì
).
Nếu A
1
, A
2
, …, A
n
là các biến cố đôi một xung khắc và tổng bằng S(thường gọi là một phân
hoạch của S), thì
P(A
1
) +P( A
2
) +
+ P( A
n
) = 1.
Trên đây là những công thức quan trọng của xác suất tổng các biến cố. Ta thấy, chỉ khi các biến cố
xung khắc thì xác suất của tổng các biến cố bằng tổng các xác suất còn nói chung thì chỉ có thể biểu
diễn qua tổng các xác suất và xác suất tích các biến cố. Đặc biệt, việc tính xác suất của một biến cố có
thể chuyển qua tính xác suất của biến cố đối.
Ví dụ 1.11 Một lớp học có 100 sinh viên, trong đó có 54 sinh viên học toán, 69 sinh viên học lịch sử
và 35 sinh viên học cả lịch sử và toán. Chọn ngẫu nhiên một sinh viên. Tính xác suất để:
a) Sinh viên đó học cả toán và lịch sử.
b) Sinh viên đó không học môn toán và không học lịch sử.
Giải
17 | P a g e
c) Tính xác suất để có đúng một trong ba biến cố xảy ra.
Giải
a) Đặt K = “Cả ba biến cố đều không xảy ra”. Ta có K = A’B’C’ = (A + B + C)’ nên
P(K) = 1 – P(A + B + C).
P(A + B + C) = 0.5 + 0.7 + 0.6 - 0.3 -0.4 - 0.2 + 0.1 = 1.
Suy ra P(K) = 0.
b) Đặt L = “Đúng hai biến cố trong ba biến cố xảy ra”. Ta có L = ABC’ + AB’C + A’BC , mặt khác
ABC’, AB’C , A’BC là các biến cố đôi một xung khắc.
Nên P(L) = P( ABC’) + P(AB’C) + P( A’BC) .
Do ABC + ABC’ = AB suy ra P(ABC’) = 0.3 – 0.1 = 0.2. Tương tự P(AB’C) = 0.1 P( A’BC) =0.3.
Như vậy P(L) = 0.6.
c) Đặt M = “Chỉ có đúng một trong ba biến cố xảy ra”. Ta có K, M, L, ABC là một phân hoạch của S.
Nên P(M) = 1 – (0 + 0.6 + 0.1) = 0.3.
Những ý chính trong bài giảng tuần 1
Khái niệm phép thử, không gian mẫu và biến cố. Mối quan hệ giữa các biến cố và phép toán
biến cố.
Định nghĩa xác suất của một biến cố.
Quy tắc cộng xác suất P(A+B) = P(A) + P(B) – P(AB).
18 | P a g e
Bài tập tuần 1và đáp số
* Bài tập: 2.1 Không gian mẫu, 2.2 Biến cố
1.1 (1.t25) 1.2 (4.t26) 1.3 (6.t26) 1.4 (17.t28)
* Bài tập: 2.3 Đếm các điểm mẫu
1.5 (5.t35) (ĐS: 20) 1.6 (6.t35) (ĐS: (a) 21, (b) 15 1.7 (9.t35) (ĐS: 210)
* Bài tập: 2.4 Xác suất của một biến cố
1.8 (3.t43) (ĐS: 0,85) 1.9 (11.t44) (ĐS: 65/663) 1.10 (9.t44) (ĐS:10/117) 1.11 (10.t44) (ĐS: (a)
5/36 (b) 10/36) 1.12 (12.t44) (ĐS: (a) 1/3 (b) 5/42).
* Bài tập: 2.5 Quy tắc cộng