Phần 1 : LÍ THUYẾT
Lí thuyết xác suất
Câu 1: Phân biệt các khái niệm: Hoán vị, tổ hợp, chỉnh hợp (lặp và không lặp) của một tập con từ tập n phần tử.
Nêu các công thức xác định các số hoán vị, tổ hợp, chỉnh hợp. Thí dụ minh họa.
Nội
dung
Hoán vị Tổ hợp
Chỉnh hợp
Không lặp Lặp
Khái
niệm
Hoán vị của n
phần tử là một
nhóm có thứ tự
gồm đủ mặt n
phần tử đã cho
Tổ hợp chập k của n
phần tử (
k n≤
) là một
nhóm không phân biệt
thứ tự, gồm k phần tử
khác nhau chọn từ n phần
tử đã cho
Chỉnh hợp (không lặp)
chập k của n phần tử (
k n≤
) là một nhóm (bộ)
có thứ tự gồm k phần tử
khác nhau chọn từ n phần
tử đã cho
−
Số chỉnh hợp chập k của
n phần tử ký hiệu là
k
n
A
!
( )!
k
n
n
A
n k
=
−
Số chỉnh hợp lặp chập k của n
phần tử ký hiệu là
k
n
B
k k
n
B n=
Thí
dụ
Một bàn có 4 học
sinh. Mỗi cách
xếp chỗ 4 học
sinh vào 1 bàn là
1 hoán vị của 4
3
3 243B = =
cách
xếp
Câu 2 : Thế nào là một phép thử ? Một biến cố (sự kiện) ?
- Quan hệ giữa các biến cố. phép tính của các biến cố.
- Biến cố chắc chắn; không thể; xung khắc; đối lập biểu diễn qua sơ đồ Ven – Euler ?
Trả lời:
- Phép thử: là sự thể hiện một nhóm các điều kiện xác định (G) có tính lặp lại.
Kí hiệu: T
Sự kiện (biến cố) : là kết quả của phép thử. Kí hiệu: E, A, B, C, ….
Có 2 loại sự kiện là:
+ Sự kiện ngẫu nhiên (Random Effect) : có thể xuất hiện hoặc không xuất hiện khi thực hiện phép thử, không phụ
thuộc vào chủ quan. Sự kiện ngẫu nhiên là đối tượng nghiên cứu của khoa học ngẫu nhiên.
+ Sự kiện tất định (Definity Events) : luôn xuất hiện (Ω hoặc ) hoặc luôn không xuất hiện khi thực hiện phép thửƱ
(Ø)
* Quan hệ (relation) giữa các biến cố:
+ Quan hệ bao hàm:
A B⊂
+ quan hệ tương đương:
A B≡
* Phép tính (Calculus):
+ Hợp (tổng):
A B C
∪ =
+ Giao (tích):
A B D∩ =
+ Trừ (hiệu):
\A B E=
+ Hiệu đối xứng: F = A ∆ B = (A\B) (B\A)∪
- Ít nhất một trong 3 biến cố xảy ra: A∪B∪C
- Nhiều nhất một biến cố xảy ra:
(A ∩B ∩C) ∪ (A ∩B ∩C) ∪ (A ∩ B ∩C) ∪ (A ∩B ∩ C )
- Không có biến cố nào xảy ra: A∩B∩C
Câu 4 : Các định nghĩa xác suất một biến cố. Ý nghĩa của xác suất là gì?
- Gọi P(A) là tần suất được xuất hiện biến cố A trong định nghĩa xác suất theo tần suất. Có thể viết như sau được
không?
( ) lim ( )
n
P A P A
→∞
=
- Hai biến cố có xác suất bằng nhau thì có tương đương hay không?
- Một biến cố có xác suất 0, có thể xảy ra hay không?
Trả lời :
• Định nghĩa xác suất một biến cố:
-Giả sử phép thử có n biến cố đồng khả năng có thể xảy ra, trong đó có m biến cố đồng khả năng thuận lợi cho
biến cố A (A là tổng khả năng của m biến cố sơ cấp này). Khi đó xác suất của biến cố A, ký hiệu P(A) được định
nghĩa bởi công thức sau:
( )
m
P A
n
=
, trong đó m là số trường hợp thuận lợi cho A, n là số trường hợp đồng khả
năng.
- Có thể viết
( ) lim ( )
n
P A P A
A.
2
Câu 5 :
• Hai biến cố A và B là độc lập khi và chỉ khi P(A ∩ B) = P(A).P(B).
trong đó, A ∩ B là giao của A và B, nghĩa là, nó là biến cố rằng cả hai biến cố A và B đều xảy ra.
Tổng quát hơn, một tập hợp biến cố bất kỳ (có thể gồm nhiều hơn hai biến cố) là độc lập lẫn nhau khi và chỉ khi với
mọi tập con hữu hạn A1, , An của tập hợp trên, ta có
• Mối quan hệ giữa khái niệm độc lập và xung khắc
Công thức nhân xác suất:
1. P(A∩B) = P(A). P(B) ( Với A, B độc lập )
P(A∩B) = P(B/A). P(A) = P( A/B). P(B)
2. P(A∩B∩C) = P(A) . P(B) . P(C) ( Với A,B,C độc lập)
= P(A) . P(B/A) . P(C/AB)
3. P( A∪B) = P(A) + P(B) ( Với A∩ B = ∅)
P( A∪B) = P( A) + P(B) - P(A∩B) ( Với A, B bất kì)
4. P(A∪B∪C) = P(A) + P(B) + P(C) = P(A) + P(B) + P(C) - P(AB) - P(BC) - P(AC) + P(ABC)
• Chứng minh nếu A, B độc lập thì , B và , cũng độc lập
Hai biến cố độc lập là hai biến cố xảy ra nhưng không liên quan gì đến nhau cho nên biến cố đối của A tức và B cũng
độc lập với nhau tức là xảy ra không hề liên quan đến nhau. Tương tự như vậy thì và cũng độc lập với nhau
• Chứng minh nếu P(A/B)= P(A/) thì A B độc lập
ta có P(A/B)= P(A/) nghĩa là xác suất của biến cố A dưới điều kiện B xảy ra giống như xác suất của biến cố A dưới
điều kiện B không xảy ra=> cho nên hai biến cố AB việc xảy ra hay không xảy ra biến cố này thì không ảnh hưởng gì
đến việc xảy ra của biến cố kia tức là hai biến cố A, B độc lập.
Câu 6: Tại sao lại gọi là một hệ đầy đủ các biến cố? Ý nghĩa của công thức xác suất đầy đủ, công thức Bayes.
Trả lời:
-Gọi là 1 hệ đầy đủ các biến cố vì khi ta thực hiện phép thử ngẫu nhiên sẽ có nhiều khả năng xảy ra, có thể là đối
lập, xung khắc từng đôi….Trong các khả năng xảy ra đó lại xảy ra nhiều giai đoạn khác nhau nữa, những hoạt
động tiếp theo phụ thuộc vào hoạt động xảy ra trước đó =>Cần phải tính xác suất để thức hiện được công việc qua
nhiều giai đoạn nhưng tổng của chúng luôn là biến cố chắc chắn =>Hệ đầy đủ các biến cố.
-Ý nghĩa của công thức Bayes: Công thức Bayes còn được gọi là công thức xác suất hậu nghiệm khi và chỉ khi sự
3
{X<x
2
}
x
1
x
2
{ X<x
1
}
a { X<b } b
{X<a } {a ≤X<b}
- Phân phối nhị thức:
Xét n phép thử Bernoulli với biến cố A có P(A) = p.
Gọi X là số lần xuất hiện biến cố A. Khi đó phân phối của X được gọi là phân phối nhị thức, ký hiệu là B(n,p).
- Phân phối Poison:
Biến ngẫu nhiên X gọi là có phân phối Poison nếu
P{X=k} =e
-λ
. λ
k
/ k! (k = 0, 1, 2, 3…… )
λ là tham số, λ >0
- Phân phối chuẩn
Là phân phối của biến ngẫu nhiên liên tục với hàm mật độ
2
X
dF x
f x
dx
=
tại các điểm liên tục của f(x)
+
( ) 0,f x x≥ ∀
+
( ) 1f x dx
+∞
−∞
=
∫
+
( ) ( )
b
a
P a X b f x dx≤ < =
∫
Câu 9:
* Định nghĩa, ý nghĩa và tính chất của kì vọng:
- Định nghĩa:
Kì vọng của biến ngẫu nhiên X là một số, ký hiệu EX, được xác định như sau:
EX
i i
i
x p=
∑
nếu
∑
- Tính chất:
1. EC = C (C = const)
2. E(CX) = CEX
3. E(X
±
Y) = EX
±
EY
4. E(X.Y) = EX . EY ( Nếu X, Y độc lập)
→ Kì vọng bảo toàn tuyến tính.
5. E
( )
( ).
i i
i
f X f x p=
∑
nếu
( )
i i
P X x p= =
Hoặc E
( )
( ). ( )f X f x p x dx
+∞
−∞
=
∫
nếu p(x) là hàm mật độ
EX . ( )
EX . ( )
x p x dx
x p x dx
+∞
−∞
+∞
−∞
=
=
∫
∫
- Ý nghĩa :
Phương sai của biến ngẫu nhiên là số đo của mức độ tập trung, phân tán của các giá trị biến ngẫu nhiên xung quanh
giá trị trung bình của nó. DX càng lớn thì các giá trị của biến ngẫu nhiên càng phân tán. DX càng nhỏ thì các giá trị
của X càng tập trung quanh EX. Phương sai còn được gọi là bình phương độ lệch trung bình.
- Tính chất :
1. DC = 0 ; C = const
2. D(CX) = C
2
DX
3. D(-X) = DX
4. D(X
1 1
DX EX EX
n n
i i
i i
x x
n n
= =
= − = ⋅ − ⋅
∑ ∑
- Phân phối nhị thức:
( , )X B n p:
{ }
. .
m m n m
n
P X m C p q
−
= =
với
1q p= −
;
0,m n=
Khi đó: + Kì vọng:
1
EX EX
2
x
p x e
µ
σ
σ π
−
−
= ⋅
(
x−∞ < < +∞
)
Ta có: + Kì vọng:
EX
µ
=
+ Phương sai:
2
DX=
σ
Câu 10: * Các mô hình của xác suất thống kê cổ điển. Cho ví dụ
1/ Mô hình siêu hình học (Hyber Geometry)
Bài toán: 1 lô hàng có n sản phẩm trong đó có m phế phẩm. Rút ngẫu nhiên k sản phẩm. Tìm xác suất để:
a) Có đúng p phế phẩm
b) Xét trường hợp p=0, p=k
c) Có ít nhất 1 phế phẩm
d) Có nhiều nhất 1 phế phẩm
Giải:
a) Đặt A là sự kiện có p phế phẩm khi rút k sản phẩm
Công thức: P(A) : =
(p=0) => p(A
0
)
A
k
(p=k) => p(A
k
)
p=0 => P(A
0
) =
0
.
k k
m n m n m
k k
n n
C C C
C C
− −
=
p=k => P(A
k
) =
0
.
k k
m n m m
k k
n n
p k p
k
m n m
k
p
n
C C
C
−
−
=
∑
d) Gọi D là sự kiện có nhiều nhất 1 phế phẩm => p
≤
1 => Có 2 trường hợp là có 1 phế phẩm và không có phế
phẩm nào
Gọi D’ và D’’ lần lượt là sự kiện có 1 phế phẩm và không có phế phẩm nào
6
m
D’
=
1 1
.
k
m n m
C C
−
−
m
k
n
C C C
C
−
− −
+
2/ Mô hình đi tàu
Bài toán: 3 nữ sinh L, H, C đi tàu hỏa với 10 toa tàu. Tính xác suất trong các trường hợp sau đây:
a) Mỗi toa tàu không chứa quá 1 nữ sinh
b) 3 nữ sinh ngồi 3 toa khác nhau
c) 3 nữ sinh ngồi 3 toa liền kề nhau
d) 3 nữ sinh ngồi cùng 1 toa
e) L luôn ngồi toa đầu
f) H, C ngồi các toa đầu cuối
g) Toa 5 không có ai ngồi
Giải:
Số trường hợp đồng khả năng: n = 10.10.10 = 1000 10
3
a) Gọi A là sự kiện cần tính xác suất
m
A
= 10.9.8 = 720
1 cách chọn là 1 chỉnh hợp chập 3 của 10 nên số cách chọn là m
A
=
3
10
A
= 8.9.10
= 10%
f) Gọi F là sự kiện H, C ngồi các toa đầu cuối => m
F
= 2.10 = 20
P(F) =
20
1000
= 2%
g) Gọi G là sự kiện toa 5 không có ai ngồi
m
G
= 9.9.9 = 729 P(G) =
729
1000
= 72,9%
3/ Mô hình xếp chỗ ngồi
Bài toán 1: 3 người L, H, C ngồi trên 1 băng ghế trống 10 chỗ. Tìm xác suất:
a) 3 nữ sinh ngồi ở 3 vị trí liền kề
7
b) L luôn ngồi ở vị trí đầu
c) H, C luôn ngồi ở vị trí đầu cuối
Giải:
Số trường hợp đồng khả năng : n = 10.9.8 = 720
a) Gọi A là sự kiện 3 nữ sinh ngồi ở 3 vị trí liền kề
Có 3 ! = 6 cách xếp chỗ cho 3 người
Có 8 chỗ mà 3 người có thể ngồi liền kề
m
A
= 6.8 = 48 P(A) =
48
4/ Mô hình bắn súng:
Bài toán : 2 xạ thủ bắn vào bia 1 cách độc lập. Xác suất trúng tương ứng là 0,7 và 0,8. Tìm các xác suất:
a) Có đúng 1 xạ thủ trúng đích
b) Có ít nhất 1 xạ thủ trúng đích
Giải:
a) P(A)=0,7 => P(Ā)= 1 - 0,7 = 0,3
P(B)=0,8 => P(
B
)= 1 - 0,8 = 0,2
Gọi A
1
là biến cố có đúng 1 xạ thủ trúng đích.
Xạ thủ A trúng và xạ thủ B trượt hoặc ngược lại
A
1
= A.B đối lập ∪ Ā.B
(
A
,
B
) và (Ā, B) là các sự kiện đôi một xung khắc
=> P(A
1
)=P(A).P(
B
) + P(Ā).P(B)
= 0,7 . 0,2 + 0,3 .0,8 = 0,38
b) Có ít nhất 1 xạ thủ trúng đích =>
( ) ( ) ( ) ( )P A B P A P B P A B
∪ = + − ∩
tử cho vào mẫu cho đến khi đủ n phần tử.
Nhược điểm của phương pháp này là dễ mắc sai số hệ thống khi các phần tử của tổng thể không được sắp xếp một cách ngẫu
nhiên mà theo một trật tự chủ quan nào đó. Tuy vậy, do tính đơn giản, mẫu hệ thống thường được dùng ở cấp chọn mẫu cuối
cùng và khi tổng thể tương đối thuần nhất.
c) Mẫu phân tổ
Để chọn mẫu phân tổ, trước hết người ta phân chia tổng thể thành các tổ có độ thuần nhất cao để chọn ra các phần tử đại diện
cho từng tổ. Việc phân tổ có hiệu quả khi tổng thể nghiên cứu không thuần nhất theo dấu hiệu nghiên cứu. Sau khi đã phân tổ
thì kích thước mẫu được phân bổ cho mỗi tổ theo 1 quy tắc nào đó, chẳng hạn tỉ lệ thuận với kích thước mỗi tổ.
3. Ý nghĩa của mẫu
Trong ngành chọn mẫu, khảo sát không nhiều các đơn vị nghiên cứu nên thường được tiến hành trong thời gian ngắn. Dữ liệu
được xử lí, phân tích nhanh chóng nên thông tin thu được từ điều tra chọn mẫu có tính thời sự, cập nhật.
Chi phí cho công tác tổ chức nghiên cứu giảm. Do đó, nghiên cứu chọn mẫu tiết kiệm được nhân lực, vật lực, tài chính.
Có thể mở rộng nội dung nghiên cứu hoặc đi sâu tìm hiểu mặt nào đó của đối tượng.
Có thể tuyển chọn những điều tra viên tốt: Có trình độ, có kinh nghiệm, có điều kiện tập huấn thì thông tin thu được có tính
chính xác cao.
4. Các đặc trưng mẫu
Giả sử (X
1
, X
2
, …,X
n
) là mẫu ngẫu nhiên sinh ra từ X có EX=µ, DX =
2
a. Thống kê
Hàm T = T(X
1
, X
2
,…,X
Dùng các phép biến đổi, ta được:
Thống kê :
Gọi là phương sai mẫu điều chỉnh
d. Độ lệch tiêu chuẩn mẫu
- thống kê được gọi là độ lệch tiêu chuẩn mẫu
- thống kê S = được gọi là độ lệch tiêu chuẩn mẫu điều chỉnh
e. Phân bố của X và S
2
* Nếu (X
1
, X
2
,…, X
n
) là mẫu ngẫu nhiên được rút ra từ biến ngẫu nhiên chuẩn N(µ,
2
) thì:
n.X cũng có phân phối chuẩn
có phân phối
X có phân phối chuẩn
X và S
2
độc lập với nhau và ngược lại
có phân phối student với n-1 bậc tự do
* Nếu (X
1
, X
2
,…, X
n
, …, x
n
) sinh từ X. Ta xây dựng hàm:
Được gọi là hàm phân phối thực nghiệm
6. Định lí Glivenco.
Giả sử F(x) là hàm phân phối của biến ngẫu nhiên X mà ta cần tìm. F
n
(x) là hàm phân phối thực nghiệm nhận được từ
mẫu ngẫu nhiên cỡ n sinh ra từ X. Khi đó:
Như vậy, hàm phân phối thực nghiệm là 1 xấp xỉ của hàm phân phối lí thuyết. Với n cố định, hàm phân phối thực
nghiệm cho ta hình ảnh hình học về phân phối lí thuyết cần tìm.
Định lí Glivenco là cách tìm dạng của hàm phân phối thực nghiệm.
10
Câu 3 : Các loại ước lượng tham số (đặc trưng). Các phương pháp ước lượng. Nêu các công thức cơ bản.
Trả lời:
+) định nghĩa: là sử dụng 1 thống kê để đánh giá đối tượng
+) các loại ước lượng tham số( đặc trưng) là: ước lượng không chệch, ước lượng hiệu quả, ước lượng vững, ước lượng
tỉ lệ đám đông, ước lượng trung bình đám đông, ước lượng phương sai đám đông
+) Các phương pháp ước lượng là:
-ước lượng điểm cho kì vọng, phương sai và xác suất
-ước lượng khoảng cho kì vọng và xác suất
+) các công thức:
Tính trung bình mẫu: =
Tính phương sai đám đông: DX=VarX=
Tính phương sai mẫu:
= ;
Công thức T tính khoảng tin cậy đối với số trung bình μ trong phân phối chuẩn khi chưa biết phương sai:
−
n
đặc trưng của biến ngẫu nhiên
Câu 1: Bắn 3 phát vào mục tiêu. Xác suất trúng của mỗi phát là 0,7. Cứ mỗi phát trúng được 5 điểm. gọi x là số điểm
đat được sau 3 phát. Tìm hàm phân phối xác suất của x.
Giải:
Công thức:
k k n k
n
C p q
−
Có: p = 0,7.
q = 1 – p = 1 – 0,7 = 0,3.
Ta có luật phân phối:
X 0 5 10 15
11
P = P
k
0
3
C
. 0,7
0
. 0,3
3
=
0,027
1
3
C
. 0,7
1
Ta có đây là biến ngẫu nhiên rời rạc.
Ta có bảng phân phối xác suất.
X 0 1 2 3 … n
P 0 (1- )
(1- )
2
… (1- )
n-1
Nếu x 1 biến cố (X<x) là biến cố không thể có, do đó: F
(X)
=0.
Nếu 1< x 2 biến cố (X<x) chỉ xảy ra khi (X=1) , do đó: F
(X)
= P
1
=
Nếu 2< x 3 biến cố (X<x) chỉ xảy ra khi (X=1), do đó: F
(X)
=P
1
+ P
2
= + (1- )
Nếu x>x
n
: F
(x)
= P
1
+P
) = = =
F (1
+
) = = = = 0
Vậy: f(x) =
Xác suất để biến ngẫu nhiên X nhận giá trị trong khoảng là:
P = F – F = =
Câu 5:
{ }
.
!
k
e
P K
K
λ
λ
ξ
−
= =
, trong đó
M
λ ξ
=
Suy ra
( )
( )
2
2 2 2
0
= =
= − = ⋅ −
= ⋅ − = + ⋅ −
−
= + − =
∑
∑ ∑
Vậy
D
ξ λ
=
Một số bài tập thống kê dạng toán (dạng tổng hợp)
Câu 1:
a) Ta có: n = 111
γ = 1- α = 0,95 => α = 0,05
Tính: =
111
4*86*5,610*75,516*25,524*75,430*25,48*75,38*25,35*5,2
++++++++
= 4,7
Phương sai mẫu: = ( - ) =
110
1
* ( 238,375 - 22,09 ) = 1,96 => S = = 1,402
Tìm t: α = 0.05 => t110 ( 0,05/2 ) = 1,98
Vậy khoảng tin cậy là: ( −
n
Sxnt *)2/)(1(
α
−
60 12
65 10
70 6
a. Ước lượng doanh số bán trung bình trong 1 ngày của siêu thị với độ tin cậy 95%
b. Những ngày có doanh số trên 60 triệu là ngày đắt hàng. Ước lượng tỉ lệ ngày bán đắt hàng với độ tin cậy 90%
c. Ước lượng doanh số bán trung bình của 1 ngày bán đắt hàng với độ tin cậy 95%( giả thiết doanh số bán đắt hàng là đại lượng
ngẫu nhiên có phân phối chuẩn)
d. Trước đây doanh số bán trung bình của siêu thị là 35 triệu/ngày số liệu ở bảng trên thu được khi có 1 phương pháp bán hàng
mới. Hãy nhận xét về phương pháp bán hàng với mức ý nghĩa 5%
Giải:
a, Kích thước mẫu : n=144 >30
Doanh số trung bình x͞͞͞͞͞͞͞͞͞= 40.8 (triệu đồng/ngày)̄
Theo giả thiết ta có: γ=95% => Uα/2 =1.96
tính được S=15.4̂
ε=Uα/2.(S /căn n)=(1.96).(15.4/12)=2.5 =>P {40.8-2.5<= μ<= 40.8+2.5}= 0.95 ̂ P{38.3<=μ<=43.3}
Vậy với độ tin cậy 95% thì doanh thu bán hàng trung bình trong một ngày của siêu thị rơi vào khoảng từ 38.3 tới 43.3
b, Kích thước mẫu n= 3 < 30
Trung bình số ngày bán đắt hàng x= 9.3 ngàȳ
mà γ=90% => tα/22= 2.92 tính được S= 2.52̂
ε( khi n <30)=( 2.52).(2.92/căn 3)=4.25.
=>P{9.3 - 4.25<=μ<=9.3 +4.25} P{5.05 <=μ<= 13.55}
Vậy với độ tin cậy 90% thì tỉ lệ ngày bán đắt hàng rơi vào khoảng từ 5.05 ngày tới 13.55 ngày
c, Kích thước mẫu n= 28<30
Trung bình doanh thu của một ngày đắt hàng là: x = 65 triệu đồng/ngày mà γ = 95% =>tα/2= 2.052̄
tính được S = 3.93̂
ε (khi n< 30 chưa biết apxilon) =( 2.052) .( 3.93/5.3) = 1.52
P{65- 1.52 <=μ<= 65+ 1.52} P{ 63.48<=μ<=66.52}
Vậy với độ tin cậy 95% thì doanh thu trung bình của một ngày đắt hàng rơi vào khoảng từ 63.48 tới 66.52 triệu
đồng/ ngày
d. Mức ý nghĩa α= 5% =>γ=95%=> Uα/2=1.96 Kích thước mẫu n=144 x= 35 triệu đồng/ngày.̄