Giáo trình
Thống kê trong
kinh doanh
Chương mở đầu
GIỚI THIỆU VỀ THỐNG KÊ
1.1. Thống kê:
Ngành học nghiên cứu các
thông số đặc trưng của những tập hợp
dữ liệu lớn thông qua việc nghiên cứu các
mẫu rút ra từ những tập
hợp đó.
từ tập hợp thống kê
Ví dụ về mẫu thống kê:
• Các số liệu về tình trạng thất nghiệp của các công dân trong độ
tuổi lao động trong vòng 10 năm qua
• Lợi nhuận hàng tháng của một công ty trong 2 năm vừa qua
• Số liệu về lỗi khuyết tật của các sản phẩm sản xuất trong 3 ca
gần đây của một công ty
• Dữ liệu về 150 khách hàng được chọn ngẫu nhiên của công ty.
Thực tế khái niệm
mẫu thống kê và tập hợp đối tượng được dùng lẫn
nhau dù không chính xác.
3.
Kết luận thống kê (statistical inference): Một quyết đònh, một
sự phỏng đoán, một sự tổng quát hóa về tập hợp thống kê dựa
trên thông tin nhận được từ mẫu thống kê
Ví dụ về kết luận thống kê:
• Từ số liệu về tình trạng thất nghiệp của các công dân trong độ
tuổi lao động trong vòng 10 năm qua, dự báo mức thất nghiệp của
năm tới.
• Từ số liệu về lỗi khuyết tật của các sản phẩm sản xuất trong 3 ca
gần đây của một công ty, dự đoán tỷ lệ khuyết tật của toàn bộ các
sản phẩm.
⇒ Quan trọng của việc: Xác đònh tập hợp thống kê
Chọn lựa mẫu thống kê
Kết luận thống kê
Phân tích
thống kê
Lời giải cho bài
toán thống kê
Lời
g
iải sơ bộ cho
bài toán quản lý
nvquang
3
Chương Hai
SƠ LƯC VỀ LÝ THUYẾT XÁC SUẤT
1. Thí nghiệm ngẫu nhiên, không gian mẫu, biến cố:
1.1. Thí nghiệm ngẫu nhiên (Random experiment)
Một TN ngẫu nhiên thỏa 2 đặc tính:
• Không biết chắc kết quả nào sẽ xảy ra
• Nhưng biết được các kết quả sẽ xảy ra
1.2. Không gian mẫu (Sample space)
Tập hợp các kết quả có thể xảy ra trong thí nghiệm ngẫu nhiên, ký
hiệu là S
Ví dụ:
Tung một con xúc sắc:
Tung một đồng xu:
E
F
b. Biến cố giao (Intersection event)
Ký hiệu: E∩F hoặc EF
E ∩ F xảy ra ⇔ E xảy ra VÀ F xảy ra
S
E
F
Lưu ý: Các đònh nghóa về hội và giao của 2 biến cố có thể mở rộng
cho nhiều biến cố: E
1
, E
2
, E
3
…E
n
.
c. Phần bù của một biến cố (Complement)
• Sự xung khắc không có tính kéo theo
• Tập hợp các biến cố gọi là xung khắc nếu từng cặp
trong đó xung khắc nhau
e. Tập hợp đầy đủ các biến cố (Collectively exhaustive)
Tập hợp các biến cố F
1
, F
2
, F
3
, … F
k
được gọi là tập đầy đủ nếu:
• F1, F2, F3, … F
k
là các biến cố xung khắc
• F
1
∪F
2
∪F
3
∪…∪F
k
= S
Ví dụ:
2.1 Đònh nghóa
Gọi N
E
là số lần xuất hiện của biến cố E trong N phép thử lặp lại,
theo khái niệm tần suất tương đối của xác suất, xác suất để E xảy ra
là tỷ số N
E
/N khi số lần thử N lớn vô hạn.
Các đònh đề:
1. Nếu E là biến cố bất kỳ trong không gian mẫu S, và ký hiệu P(E)
là xác suất của biến cố E thì
0 ≤ P(E) ≤ 1
2. Gọi E là một biến cố trong không gian mẫu S, gọi O
i
là các biến
cố sơ đẳng
P(E) =
∑
E
i
)P(O
3. P(S) = 1
2.2 Các tính chất mang tính hệ quả
1. Nếu không gian mẫu S có n biến cố sơ đẳng O
, …, E
N
thì
P(
∑
=
=
=∪
N
1i
ii
N
1i
)P(E)E
4. P(E) + P(E
C
) = 1
5. P(∅) = 0
6. P(E∪F) = P(E) + P(F) – P(EF)
Trường hợp 3 biến cố:
P(E∪F∪G) = P(E) + P(F) + P(G) – P(EF) – P(EG) – P(FG) +
P(EFG)
Trường hợp n biến cố: Xem tài liệu
Ví dụ:
tính, xác suất đạt điểm A là 1/2. Ngược lại, nếu SV học hóa thì
xác suất này là 1/3. Tìm xác suất để SV đạt điểm A trong môn
hóa học.
2.3.2 Biến cố độc lập
Biến cố E và F là độc lập thống kê nếu
P(EF) = P(E)P(F)
• Nói khác đi, biến cố E được gọi là độc lập với biến cố F nếu P(E)
không thay đổi cho dù biến cố F đã xảy ra và ngược lại
P(E/F) = P(E)
P(F/E) = P(F)
• E và F không độc lập thì gọi là 2 biến cố phụ thuộc
GV. Nguyen Vu Quang
6
• Tổng quát, các biến cố E
1
, E
2
, , E
n
được gọi là các biến cố độc
lập nếu với mọi r≤ n, ta có:
P(E
1
E
2
E
r
i
F
2
F
1
F
n
S E
GV. Nguyen Vu Quang
7
E = EF
1
∪EF
2
∪ ∪EF
i
∪ ∪EF
n
P(E) = P(EF
=
Lưu ý: ở đây biết P(F
i
) và P(E/F
i
)
⇒
tìm P(E)
Ví dụ:
Một nhà máy có 4 phân xưởng sản xuất một loại sản phẩm
PX I sản xuất 1/3 tổng sản lượng của nhà máy
PX II sản xuất 1/4 tổng sản lượng của nhà máy
PX III sản xuất 1/4 tổng sản lượng của nhà máy
PX IV sản xuất 1/6 tổng sản lượng của nhà máy
Tỷ lệ phế phẩm của các phân xưởng I, II, III và IV lần lượt là 15%,
8%, 5% và 1%.
Nếu lấy ngẫu nhiên 1 sản phẩm trong kho của nhà máy, tính xác
suất để sản phẩm đó là phế phẩm. b. Công thức Bayes
Ta có: P(F
j
E) = P(F
j
/E)
Ví dụ:
Lấy ví dụ các phân xưởng sản xuất của một nhà máy.
Lấy ngẫu nhiên 1 sản phẩm trong kho của nhà máy và thấy nó là
phế phẩm, tìm xác suất để sản phẩm này thuộc phân xưởng I.
GV. Nguyen Vu Quang
9
Chương Ba
MÔ TẢ TẬP DỮ LIỆU
1. Các biểu đồ mô tả:
1.1. Các loại dữ liệu
Hai loại dữ liệu:
Đònh lượng: đo lường bằng số
Đònh tính: không đo lường được bằng số ⇒ có dạng phân loại
1.2. Các biểu đồ biểu diễn cho tập dữ liệu đònh tính
Biểu đồ thanh (Bar chart)
Ví dụ: Quan sát 30 khách hàng mua 4 kiểu sản phẩm
Kiểu loại Số quan sát Tần suất
(f
i
)
C
20.00%
D
26.67%
1.3. Các biểu đồ biểu diễn cho tập dữ liệu đònh lượng
1.3.1. Biểu đồ thân và lá (Stem and Leaf)
5,20 5,64 5,90 6,01 6,50
6,48 6,50 6,61 6,81 6,89
6,91 6,92 7,10 7,12 7,20
7,21 7,40 7,48 7,52 7,70
7,72 7,79 7,90 8,00 8,02
8,13 8,20 8,21 8,23 8,37
8,50 8,82 9,01 9,23 9,40
9,49 9,51 9,63 9,71 9,90
10,10 10,50 10,52 10,58 11,13
11,30 11,72 13,20 13,46 13,52
GV. Nguyen Vu Quang
2
Các bước thiết lập sơ đồ thân và lá:
Tập dữ liệu (có N phần tử) được chia thành các nhóm có khoảng giá
trò bằng nhau.
Tần suất: Số quan sát trong mỗi nhóm, ký hiệu f
i
Tần suất tích lũy: Tổng số quan sát của nhóm i và các nhóm trước
Tần suất tương đối: Tỷ số f
i
/N, ký hiệu f
i
r
Tần suất tương đối tích lũy:
GV. Nguyen Vu Quang
3
Các bước vẽ biểu đồ tần suất:
1. Sắp xếp các số liệu theo thứ tự tăng dần
2. Chia các số liệu thành các nhóm có độ lớn bằng nhau (từ 5 đến
20 nhóm) sao cho không có số liệu nào nằm trên vùng biên của
các nhóm.
Ví dụ:
5,2 5,6 5,9 6,0 6,5
6,5 6,5 6,6 6,8 6,9
6,9 6,9 7,1 7,1 7,2
7,2 7,4 7,5 7,5 7,7
7,7 7,8 7,9 8,0 8,0
1 5,15 – 6,25 4 0,08
2 6,25 – 7,35 12 0,24
3 7,35 – 8,45 14 0,28
4 8,45 – 9,55 7 0,14
5 9,55 – 10,65 7 0,14
6 10,65 – 11,75 3 0,06
7 11,75 – 12,85 0 0,00
8 12,85 – 13,95 3 0,06
Tổng N= 50 1
0
2
4
6
8
10
12
14
16
Giá trò
Tần suất nhóm
5,15 6,25 7,35 8,45 9,55 10,65 11,75 12,85 13,95
N
xf
N
x
i
ii
N
i
i
∑∑
==
==
l
11
µGiá trò trung bình của mẫu (Sample mean)
n
xf
n
x
i
ii
n
i
i
∑∑
Mẫu 2:
Điểm 1 5 5,5 6 6,5 7 7,5 8 8,5 9 9,5 10
Số SV 1 1 1 1 3 0 3 3 3 2 1 1
Mẫu 1:
Điểm TB = 7,55
Điểm trung vò = (số thứ 10 + số thứ 11)/2 = (7,5 + 8) / 2 = 7,75 Mẫu 2:
Điểm TB = 7,325
10.09.59.08.58.07.57.06.56.05.55.0
3
2
1
0
Mau 1
Frequency
Histogram of Mau 1, with Normal Curve
GV. Nguyen Vu Quang
i
lớn nhất)
Không thích hợp khi tập dữ liệu có nhiều giá trò mode → dùng lớp
mode (modal class)
Ví dụ:
Cho tập dữ liệu:
0 1 0 2 5 2 5 2 3 3 5 6 4
Tìm giá trò trung bình, số trung vò và yếu vò
x
i
0 1 2 3 4 5 6
f
i
2 1 3 2 1 3 1
2.2. Thông số đo lường khuynh hướng phân tán: (measure of
dispersion)
GV. Nguyen Vu Quang
8
Là thông số thể hiện sự khác biệt giữa các số trong tập dữ liệu so
với số đònh tâm (thường là giá trò trung bình)
2 số phân tán thường dùng là phương sai và độ lệch chuẩn
2.2.1. Phương sai: (variance)
2
i
2
∑
=
−
=
xx⎥
⎦
⎤
⎢
⎣
⎡
⎟
⎠
⎞
⎜
⎝
⎛
−
−
=
∑∑
==
2
n
1i
Độ lệch chuẩn của mẫu (sample SD)
GV. Nguyen Vu Quang
9
∑
=
−
−
==
n
i
i
xx
n
ss
1
22
)(
1
12.2.3. Ý nghóa của độ lệch chuẩn
a/ Quy tắc kinh nghiệm µ
µ-3σ µ-2σ µ-σ µ+σ µ+2σ µ+3σ
c/ Quy tắc đối với tập dữ liệu có phân bố hình chuông (đối xứng)
hay số phần tử của tập dữ liệu là rất lớn: (Rule of Thumb)
GV. Nguyen Vu Quang
10
Tần suất (
f
i
)
68%
95%
100%
µ-3σ µ-2σ µ-σ µ+3σµ+2σµ+σ
µ
x
i2.3. Thông số đo lường vò trí tương đối: (measure of dispersion)
2.3.1. Giá trò z (z – score)
Giá trò z của một giá trò quan sát x trong
tổng thể được xác đònh:
z =
x - µ
σ
)
68%
95%
100
%
-3 -2 -1 3 2 1
0
z
2.3.2. Khoảng (Range)GV. Nguyen Vu Quang
12