THỐNG KÊ TOÁN
CHƯƠNG 6
Tổng thể và mẫu
1. Tổng thể và các số đặc trưng
Một đợt thi tuyển sinh có 50.000 thí sinh tham
dự. Ta quan tâm đến điểm thi môn Toán của mỗi thí
sinh.
Trên đây là một ví dụ về tổng thể. Lượng thí
sinh gọi là kích thước tổng thể, ký hiệu N. Điểm
thi môn Toán là dấu hiệu quan tâm, ký hiệu X
*
.
Gọi X là giá trò của dấu hiệu X
*
(được đo hoặc
được lượng hoá) tại một phần tử của tổng thể được
chọn ngẫu nhiên thì X là ĐLNN. Kỳ vọng, phương
sai, độ lệch chuẩn của ĐLNN này gọi là trung bình
tổng thể (µ
µµ
µ), phương sai tổng thể (σ
σσ
σ
2
), độ lệch
chuẩn tổng thể (σ
σσ
σ).
Nếu quy đònh thêm một chỉ tiêu, chẳng hạn
Từ n ĐLNN X
1
, X
2
, , X
n
ta thành lập các
ĐLNN đặc trưng mẫu: Trung bình mẫu ngẫu nhiên:
X
=
n
i
i 1
1
X
n
=
∑Phương sai mẫu ngẫu nhiên (hiệu chỉnh)
:
S
2
=
i
i 1
1
Y
n
=
∑
Y
i
là ĐLNN bằng 1 nếu phần tử thứ i được chọn
vào mẫu đạt chỉ tiêu và bằng 0 nếu không đạt.
2.1.2 Mẫu cụ thể
Từ W
X
(X
1
, X
2
, , X
n
), lấy số đo cụ thể của X
1
, X
2
,
, X
n
là x
=
∑
Phương sai mẫu (hiệu chỉnh)
:
s
2
=
( )
n
2
i
i 1
1
x x
n 1
=
−
−
∑
Độ lệch chuẩn mẫu
: s
=
2
s
n
=
==
=
∑
∑∑
∑
s
2
=
==
=2
n n
2
i i
i 1 i 1
1 1
x x
n 1 n
= =
= == =
= =
Excel
n ≤ 30, x
1
, x
2
, ,x
n
ghi trong miền M thì:x
=AVERAGE(M)
s
2
=VAR(M)
s
=STDEV(M)Ghi chú
Có thể xem “điểm không tần số” là “điểm có tần
số bằng 1”.
Ví dụ
Chi phí hoạt động hàng tháng (triệu đồng) của
một doanh nghiệp trong năm 2012:
100,
ứng với các tần số n
1
,
n
2
, n
k
. Ta dùng công thức:
n
=
k
i
i 1
n
=
==
=
∑
∑∑
∑
x
=
==
=
k
= =
−
−−
−
−
−−
−
mẫu, phương
sai mẫu.
n
=
45
x
=
107/45
≈
2,38 s
2
≈
1,83
2.2.3 Số liệu dạng khoảng có tần số
Số liệu gồm k khoảng dạng [a
i
, b
i
) hoặc (a
Ví dụ
Điều tra về thu nhập năm 2005 (triệu đồng) của
một số nhân viên ngân hàng ta có bảng:
Thu
nhập
Số
NV
Thu nhập
Số
NV
Thu
nhập
Số
NV
80–85
9 95–100 36 110–115
16
85–90
12 100–105 25 115–120
10
90–95
24 105–110 20 120–130
8
i
, y
j
) trong mẫu cụ thể:
X Y
y
1
y
2y
h
x
1
n
11
n
12n
1h
x
2
n
21
j
(X
=
x
i
).
Từ các bảng phân phối theo thực nghiệm, ta
tính trung bình mẫu, phương sai mẫu theo công thức
số liệu dạng điểm có tần số. Các ký hiệu sau:
* Trung bình mẫu, phương sai mẫu của X:
x
,
2
X
s
.
* Trung bình mẫu, phương sai mẫu của Y:
y
,
2
Y
s
.
* Trung bình mẫu, phương sai mẫu của X với
điều kiện Y
=
Ví dụ
Khảo sát về tỷ lệ thu nhập chi cho giáo dục (%) và
thu nhập bình quân đầu người (triệu đồng/tháng) của
400 hộ gia đình ta có bảng:
Chi Giáo dục
Thu nhập
10
20
30
40
50
1–3 10
40
203–7 40
60
20
/30
x
=
7,79 2
X /30
s
=
12,76
X /30
s
=
3,57
Trung bình tỷ lệ thu
nhập chi cho GD là 7,45%, TN bình quân 1 người là
29,75 triệu/tháng, TN bình quân 1 người (30%) là
7,79 triệu/tháng, độ lệch chuẩn là 3,57.
a
i
−
b
i
1–3
3–7
50
Σ
n
j
10
100
190
90
10
400
a
i
− b
i
1–3
3–7
7–11