lý thuyết mẫu và ước lượng tham số - Pdf 22


GV. Dương Hoàng Kiệt

1

CHƯƠNG 5
LÝ THUYẾT MẪU VÀ ƯỚC LƯNG THAM SỐ

5.1. MẪU VÀ PHÂN PHỐI MẪU
5.1.1. Đám đông và mẫu
Hàng ngày ta vẫn hay dùng những thao tác cần thiết để chọn lựa
những đối tượng cần cho mục đích nghiên cứu, xem xét và đánh giá. Đơn
giản như nếm thử, hút thử, dùng thử, … Phức tạp hơn, ta đến một trường
Cao Đẳng để mượn sổ theo dõi quá trình thử nghiệm những phương pháp
giảng dạy và học tập mới hay cũng có thể đến các trung tâm lưu trữ số liệu
của một đòa phương để thu thập về những thông tin cần thiết cho các vấn đề
dân số, tỷ lệ sinh, sự phân bố dân cư, tình hình thu nhập, …
Tư tưởng chính ở đây là: Trong thực tế ta cần nghiên cứu một dấu
hiệu
X
nào đó trên một tập hợp
K
có số lượng lớn các phần tử. Tuy nhiên
có thể vì thời gian hạn hẹp, chi phí quá tốn kém hoặc làm hư hỏng các phần
tử của
K
mà ta không thể quan sát hết tất cả các phần tử của
K
, vì vậy
trong thực tế, chúng ta chỉ chọn ra một tập con hữu hạn
n

x
. Khi đó với
n
cá thể trong mẫu
sẽ cho ta một bộ
n
số
)
, ,
,
(
2
1
n
x
x
x

và ta gọi đó là một mẫu thống kê. Nếu các phần tử trong mẫu được chọn
ngẫu nhiên thì ta có mẫu thống kê ngẫu nhiên hay gọi tắt là mẫu ngẫu nhiên.

GV. Dương Hoàng Kiệt

2

Chẳng hạn ta nghiên cứu vấn đề
X
về chiều cao của sinh viên Việt Nam thì
ta có thể xác đònh một số yếu tố sau:


(
2
1
n
x
x
x

Ý nghóa
nghiên cứu
Ước lượng kích thước cho các mẫu
hàng hoá thiết yếu
Bảng 5.1. Các yếu tố liên quan đến chiều cao
X

Như vậy Khoa học Thống kê là sự điều tra, thu thập số liệu sau đó
nghiên cứu, phân tích những thông tin trên mẫu thống kê để rút ra những
dấu hiệu cần nghiên cứu trong đám đông. Chính vì vậy Thống kê có ý nghóa
thực tế to lớn trong đời sống kinh tế, xã hội và khoa học. Nó được ứng dụng
rộng rãi trong dự báo, kiểm tra chất lượng, điều khiển ngẫu nhiên, chẩn
đoán, thăm dò dư luận, …
5.1.2. Nghiên cứu chọn mẫu
Để nghiên cứu mẫu ta thường trải qua các bước theo sơ đồ sau:
Bước 1 Xác đònh mục đích nghiên cứu
Bước 2 Xác đònh đám đông
Bước 3 Xác đònh kích thước mẫu
Bước 4 Lựa chọn phương pháp chọn mẫu
Bước 5 Suy rộng kết luận của mẫu
Bước 6 Rút ra kết luận về đám đông
Bảng 5.2. Các bước nghiên cứu mẫu

cách bắt thăm, quay số hoặc theo bảng số ngẫu nhiên và có thể được chọn
một lần (chọn không hoàn lại) hoặc chọn nhiều lần (chọn có hoàn lại).
Nếu kích thước mẫu khá bé so với kích thước đám đông thì việc chọn
có hoàn lại và không hoàn lại là như nhau. Phương pháp này có thể cho kết
quả tốt nếu giữa các phần tử trong đám đông không có gì khác biệt nhiều.
Nếu đám đông có các kết cấu phức tạp thì phương pháp này sẽ khó đảm bảo
tính đại diện. Hơn nữa việc đánh số tất cả các phần tử của đám đông sẽ
hoàn toàn không thực tế nếu đám đông có qui mô quá lớn.
)
(
b
Chọn mẫu theo phân nhóm đại diện
Chia tập nền thành những nhóm thuần nhất, sau đó từ mỗi nhóm chọn
một mẫu con ngẫu nhiên. Tập hợp tất cả các mẫu đó cho ta một mẫu phân
nhóm ngẫu nhiên. Mỗi nhóm sẽ có vai trò khác nhau phụ thuộc vào độ quan
trọng của chúng trong đám đông, vì vậy kích thước của mẫu con từng nhóm
cũng được chọn khác nhau.

GV. Dương Hoàng Kiệt

4

Nếu tập nền được phân thành
k
nhóm, nhóm
i
sẽ có
i
n


(
c
Chọn mẫu phân theo chùm
Nếu đám đông quá lớn, ta chia thành các tập con, chọn ngẫu nhiên
một số tập con làm tập đại diện có kích thước
1
N
,
2
N
, và
k
N
. Khi đó
tổng số cá thể của đám đông mới là:
k
N
N
N
N
+
+
+
=

2
1
0

từ tập đại diện có kích thước

n
n
n
+
+
+
=

2
1

Phương pháp này có ưu điểm là không cần thiết phải xây dựng một
danh sách tất cả các phần tử trong đám đông như hai phương pháp trên.
Các phần tử được chọn đều nằm tập trung theo từng khu vực nên hạn chế
được thời gian và chi phí đi lại. Tuy nhiên nhược điểm của phương pháp là
có thể tính đại diện của mẫu không cao do sai số chọn mẫu có khả năng phát
sinh lớn hơn khi các cá thể tập trung không phân bố đều.
5.1.3. Bảng phân phối mẫu
)
(
a
Phân phối tần số
Giả sử đám đông có
N
phần tử, từ đó ta chọn được một mẫu có kích
thước
n
. Gọi
i
x

n
x
x
x

gọi là mẫu đơn.
Trường hợp trong mẫu có nhiều giá trò trùng nhau, nghóa là có
i
n
lần
xuất hiện giá trò
i
x

)
,
1
(
k
i
= thì ta phải có
k
n
n
n
n
+
+
+
=

a
a
a
a


Hoặc
12231
,, ,
kk
aaaaaa



trong đó có
i
n
giá trò của mẫu xuất hiện trong khoảng
)
,
(
1
i
i
a
a

với
k
i

TP.HCM, kết quả như sau:

1 2 5 5 4 6
5 6 3 4 6 7
6 2 5 4 7 6
3 5 7 9 7 4
3 6 3 6 8 7
8 10 8 9 8 9

Ta có bảng phân phối tần số theo mẫu đơn, mẫu lặp và mẫu phân lớp:

i
x
điểm,

i
n
số sinh viên đạt điểm
i
x
.

GV. Dương Hoàng Kiệt

6

Mẫu lặp Mẫu phân lớp
j
y


n
n
f
i
i
= ,
k
i
,
1
=
thì
i
f
được gọi là tần suất xuất hiện của
i
x

)
,
1
(
k
i
= . Khi đó ta có bảng
phân phối tần suất cho mẫu lặp:

X

1

7Nếu số liệu cho ở dạng mẫu đơn thì ta sử dụng bảng trên với
n
k
=

n
i
n
i
,
1
,
1
=

=
. Trường hợp mẫu phân lớp ta sử dụng
)
1
.
5
(
để đưa về mẫu
lặp.
Cụ thể, ta có bảng phân phối tần suất về điểm của
36
sinh viên:

2

3 – 5 4
36
8

3
36
4

5 – 7 6
36
12

4
36
4

7 – 9 8
36
9

5
36
5

9 – 10 9,5
36
4


Bảng 5.4. Phân phối tần số theo mẫu lặp và phân lớp
)
(
c
Đa giác đồ và tổ chức đồ
Để có được một hình dạng về phân phối mẫu, người ta thường dùng đồ
thò để biểu diễn bảng phân phối tần số hoặc tần suất.

GV. Dương Hoàng Kiệt

8

Trên hệ trục toạ độ vuông góc
Oxy
ta nối các điểm có toạ độ
(
)
i
i
n
x
,

hoặc







1
k
x
x
thành
m
khoảng đều nhau, mỗi khoảng có độ
dài
0
h
, trên mỗi khoảng
j
L
với
m
j
,
1
= ta tính tổng


=
j
j
Lx
jj
n
l

Tiến hành dựng các hình chữ nhật đáy

L

1 – 2,8 2,8 – 4,6 4,6 – 6,4 6,4 – 8,2 8,2 – 10
j
l

3 8 12 9 4
0
h
l
j

1,67 4,44 6,67 5,00 2,22
Tổ chức đồ về điểm có đồ thò như hình 5.2.
1.67
4.44
6.67
5
2.22
0
2
4
6
8

Hình 5.1. Tổ chức đồ cho bảng phân phối tần suất theo mẫu lặp
5.2. CÁC ĐẶC TRƯNG CỦA MẪU
Giả sử ta quan tâm đến dấu hiệu
X
của đám đông

X
độc lập trong toàn bộ và có cùng phân
phối với
X
.
Ta gọi mẫu ngẫu nhiên kích thước
n
từ đám đông là vector ngẫu nhiên
n
chiều
)
, ,
,
(
2
1
n
X
X
X
. Mỗi bộ số
)
, ,
,
(
2
1
n
x
x

ngẫu nhiên. Điều này có nghóa gieo con thứ nhất được mặt một chấm, con

GV. Dương Hoàng Kiệt

10

thứ hai được mặt hai chấm và gieo con thứ ba được mặt bốn chấm. Tập hợp
các giá trò có thể xảy ra của mẫu ngẫu nhiên là:
}6,1;6,1;6,1),,({
3
2
1
3
2
1
=== xxxxxx
Một hàm
)
, ,
,
(
2
1
n
x
x
x
g
g
=


n
i
n
i
,
1
,
1
=

=
. Trường hợp mẫu phân lớp ta sử dụng
)
1
.
5
(

để đưa về mẫu lặp.
)
(
a
Trung bình mẫu
Trung bình mẫu, ký hiệu
X
là thống kê được xác đònh bởi:

1
1

i
nn
1
.
Trung bình mẫu đặc trưng về vò trí và là một số mà các giá trò của
mẫu có xu hướng qui tụ quanh nó. Nếu
µ
=
)
(
X
E

2
)
(
σ=
X
D
thì ta có
kỳ vọng và phương sau của trung bình mẫu là:

GV. Dương Hoàng Kiệt

11

µ=
)
(
X

22
)(
1

(5.4)

với
i
n
là tần số xuất hiện
i
x

)
,
1
(
k
i
= trong mẫu thoả

=
=
k
i
i
nn
1
.
Phương sai mẫu đặc trưng về sự phân tán của giá trò mẫu quanh trung

2
2
1
X
s
n
n
S

=
(5.6)

thì
2
S
là thống kê được gọi là phương sai mẫu hiệu chỉnh, xác đònh bằng
công thức tổng quát:


=


=
k
i
ii
Xxn
n
S
1

E

(5.8)

Trong tính toán ta tính phương sai mẫu bằng công thức đơn giản hơn:
)(
2
2
XXs
X
−=
(5.9)

với

=
=
k
i
ii
xn
n
X
1
22
1

(5.10)
c
Tỷ lệ mẫu
Nếu
X
là biến ngẫu nhiên có phân phối nhò thức với xác suất gặp
phần tử trong mẫu có tính chất A
)
1
(
=
i
x
bằng
p
thì

n
p
n
m
X ==
(5.13)

được gọi là tỷ lệ mẫu với
n
là kích thước mẫu,
m
là số phần tử trong mẫu
có tính chất A.
Nếu

Ví dụ
5.1.
Đo chiều cao của 100 sinh viên năm nhất Trường Cao Đẳng Công
Nghiệp Thực Phẩm TP.HCM ta có bảng thống kê (tính bằng
cm
):
Chiều cao Số sinh viên
146 – 150 10
150 – 154 14
154 – 158 24
158 – 162 28
162 – 166 12
166 – 170 8
170 – 174 4
Tính
X
,
S


n
p
sinh viên có chiều cao thấp nhất là
cm
166
?

GV. Dương Hoàng Kiệt

13

ii
xn

2
ii
xn

148

10

1480

219040

152

14

2128

323456

156

24

3744

584064


118336

Tổng 100

15832

2510240Tính
X
ta dùng
(5.2)

1
115832
158,32
100
k
ii
i
Xxn
n




Tính
S

(5.13)GV. Dương Hoàng Kiệt

14

84
0,12
100
n
p


Cách 2. Ta dựa vào cách 1, nhưng số liệu sẽ đơn giản hơn bằng cách
đặt

160
4
i
i
x
y


(5.15)

Ta có bảng số liệu như sau:
i
x

2


28


56

156

24

1


24


24

160

28

0

0

0


Tổng 10042


250Tính toán tương tự như trên nhưng chú ý rằng biến ngẫu nhiên cần
tính là
Y
:
42
0,42
100
Y


2
250
2,5
100
Y

2222
()2,5(0,45)0,25
Y
sYY


2
100
.37,177637,5531
99
S 
37,55316,1281
S


Tính tỷ lệ, làm tương tự.
5.3. ƯỚC LƯNG
Khi chọn mẫu, điều quan trọng không phải nhằm nghiên cứu mẫu đại
diện được chọn ra từ đám đông, mà chính là quan mẫu đó có thể nghiên cứu
được qui luật và trạng thái của đám đông chứa mẫu. Nghóa là dựa vào sự
hiểu biết về thống kê θ (chẳng hạn
)
,
,
n
p
S
X
của mẫu đã tính toán được để
rút ra một số kết luận về thống kê
θ
(tương ứng
p
,
,
σ

θ
1
)
(
2
1
P

với
α
là số dương khá gần 0.
5.3.1. Ước lượng điểm
Giả sử cần ước lượng thống kê
θ
của biến ngẫu nhiên
X
từ đám đông
K
. Từ
X
ta chọn mẫu ngẫu nhiên
)
, ,
,
(
2
1
n
X
X

coi là tốt nhất nếu nó thỏa mãn các tiêu chuẩn sau:
)
(
a
Ước lượng không chệch
Thống kê θ được gọi là ước lượng không chệch của thống kê
θ
nếu
θ=θ
)
(
E

)
2
.
5
(

Từ đònh nghóa
)
2
.
5
(
kết hợp với (…) ta dễ dàng nhận thấy nếu θ là
ước lượng không chệch của
θ
thì
0

n
p
S
X
,
,
2
lần lượt là ước lượng
không chệch cho trung bình
)
(
µ
, phương sai
)
(
2
σ và tỷ lệ
)
(
p
của đám
đông. Trong tính toán khi có mẫu cụ thể, ta lấy
µ≈
X

2
2
σ≈
S


1))((
ε
θ
−≥ε<θ−θ
D
EP
Hay
2
)
(
1)))(()((
ε
θ
−≥ε<θ−θ−θ−θ
D
EP
Như vậy nếu θ là ước lượng không chệch của
θ

0
)
(
lim

∞→
D
n
thì
θ là ước lượng vững của
θ

µ
. Tương tự, nếu
)
;
(
p
n
B
X

thì
n
p
cũng là một ước lượng vững
của
p
.
)
(
c
Ước lượng hiệu quả
Thống kê θ được gọi là ước lượng hiệu quả của thống kê
θ
nếu θ là
ước lượng không chệch của
θ
và có phương sai bé nhất. Nghóa là:

GV. Dương Hoàng Kiệt


D
trong đó
)
(
θ
I
là tin lượng Fisher xác đònh bởi
2
),()(






θ
θ∂

=θ XfEI
ở đây
f
là hàm mật độ của
X
.
Từ đây dễ dàng kiểm chứng lại rằng nếu
)
,
(
σ
µ

,
(
)
,
(
1
θ
θ
θ
=
θ
n
n
x
f
x
f
x
f
x
L

Khi quan sát được mẫu, ta biết được
n
x
x
x
, ,
,
2






=
tốt phẩm sảnđược lấy nếu
hỏngphẩm sảnđược lấy nếu
X
0
1
1

Ta có bảng phân phối cho
1
X
:

GV. Dương Hoàng Kiệt

18

1
X

0 1
)
(
1
X

n
X
X
X
. Khi đó
hàm hợp lí là:
∑∑
==

−−−
−=
−−−=
=
n
i
i
n
i
i
nn
xnx
xxxxxx
n
pp
pppppp
p
x
f
p
x

pxnpxpxL
n
i
i
n
i
i








−+







=
==


( )
)
1



=



=









+







=


=
==












=


)1(
)
(
),(ln
2
2
pp
p
p
n
p
pxL
p
n22

[
]
22
2
)
1
(
)
2
1
)(
(
p
p
p
p
p
p
p
n
n

−−+−−
=22
2
)
1

<


=

−−
=


pp
n
p
p
p
p
n
pxL
p

Nghóa là
)
,
(
ln
p
x
L
đạt cực đại tại
p
p

n
p
1
1

suy ra
p
p
E
n
=
)
(

n
p
p
pD
n
)
1
(
)(

=
Tin lượng Fisher
)
(
p
I

−XX
pp
p
E

( )
2
)1ln()1(ln






−−+


= pXpX
p
E

2
1
1







22
)(
)
1
(
1
pXE
p
p


=

22
2
)
1
(
p
p
p
p


=)
1
(

.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status