Bµi gi¶ng ch¬ng 2
- - - -
2004
Bïi M¹nh Hng
Bµi gi¶ng ch¬ng 2
Lý thuyÕt: 7 tiÕt.
Bµi tËp: 3 tiÕt.
Ngêi so¹n: Bïi M¹nh Hng
Bài giảng chơng 2
- - - -
2004
Bùi Mạnh Hng
2 tiết
Chơng 2
).
Nắm đợc các quy luật phân bố còn là cơ sở để xác định các phơng pháp
thống kê ứng dụng, chẳng hạn: nếu tổng thể có phân bố chuẩn thì việc ớc lợng
trung bình tổng thể có thể dùng mẫu nhỏ theo tiêu chuẩn t của Student, còn nếu
tổng thể không tuân theo luật chuẩn thì phải dùng mẫu lớn để ớc lợng theo tiêu
chuẩn U của phân bố chuẩn tiêu chuẩn
2.2. Kiểm tra giả thuyết về luật phân bố
Bài giảng chơng 2
- - - -
2004
Bùi Mạnh Hng
Có nhiều tiêu chuẩn thống kê để kiểm tra giả thuyết về luật phân bố, tuy
nhiên trong chơng trình này chúng ta sử dụng tiêu chuẩn phù hợp
2
, đây là tiêu
chuẩn đơn giản dễ tính toán, có thể dùng cho phân bố liên tục hoặc đứt quãng.
Khi tiến hành mô hình hoá quy luật cấu trúc tần số theo một phân bố lý
thuyết nào đó, cần thiết phải kiểm tra giả thuyết về luật phân bố đợc tiến hành qua
các bớc chính nh sau:
Bớc 1: Đặt giả thuyết:
H
0
: F
x
(x)= F
0
(x)
có phân bố
2
với k=l-r-1 bậc tự do.
Trong đó: + f
l
=n.p
i
là tần số lý luận tơng ứng với từng tổ của đại lợng
điều tra, với p
i
là xác suất tơng ứng mỗi tổ tính theo phân bố
lý thuyết đã lựa chọn.
+ f
t
là tần số thực nghiệm.
+ l là số tổ sau khi gộp (đó là số tổ có tần số lý luận 5).
+ r là số tham số của phân bố lý thuyết.
Bớc 3: Kết luận về giả thuyết.
Nếu
n
2
tính theo (2.1) >
2
0.5(k)
thì giả thuyết H
0
bị bác bỏ ở mức ý nghĩa
=0.05, nghĩa là phân bố ta chọn không phù hợp với phân bố thực nghiệm.
Ngợc lại nếu
n
1
2
2
2b
ax
x
e
b
xP
Trong đó:
a: là kỳ vọng toán, đờng cong đồ thị đối xứng qua đờng x=a,
khi a thay đổi thì đỉnh đờng cong sẽ di chuyển trên đờng thẳng song
song với trục hoành có tung độ:
2
1
b
y
. (Hình 2.1)
b: là sai tiêu chuẩn, khi b thay đổi đỉnh đờng cong di chuyển
trên đờng thẳng song song với trục tung có hoành độ: x = a (Hình
2.2).
Trờng hợp đặc biệt, khi a = 0 và b = 1 thì ta có phân bố chuẩn tiêu chuẩn
hay phân bố chuẩn 0, 1, ký hiệu là X N(0,1). Đờng cong phân bố chuẩn tiêu
chuẩn đối xứng qua trục tung. Mật độ xác suất của phân bố chuẩn tiêu chuẩn đợc
viết nh sau:
)3.2(
2
1
2
2
u
x
eu
(Ngời ta lập bảng tra cho phân bố này còn các phân bố chuẩn khác không
lập đợc bảng tra).
2.3.1.2. Cách tính xác suất theo phân bố chuẩn tiêu chuẩn
Trong thực tế, ngời ta thờng tính xác suất để biến ngẫu nhiên X lấy giá trị
có độ chênh lệch so với kỳ vọng không quá t lần b lớn hơn và nhỏ hơn. Xác suất
này đợc tính toán nh sau: )4.2(
2.
1
u
t
b
abta
b
ax
u
.
.
2
2
1
1)5.2(
2
1
2
(t) là giá trị tra bảng của phân bố chuẩn.)
Trong đó:
t
ux
dut
0
.
(2.7)
Hàm (t) gọi là hàm số tích phân luôn luôn dơng và bằng 0,5 khi t=+.
Ngời ta đã lập sẵn phụ biểu để tính hàm (t) và 2(t) khi t có những giá trị khác
nhau (Phụ biểu số 2).
Bài giảng chơng 2
- - - -
2004
Bùi Mạnh Hng
Ví dụ: t = 1,96 thì (t) = 0,4750; 2(t) = 0,95
t = 2,58 thì (t) = 0,4959; 2(t) = 0,99
t = 3,29 thì (t) = 0,4995; 2(t) = 0,999
Các giá trị U
1
và U
2
x
2
) =
(t
1
)
(t
2
) (2.8)
với t
1
= |U
1
| và t
2
= |U
2
|
* Trờng hợp II: U
1
âm và U
2
dơng:
P(x
1
X
(t
2
)
(t
1
) (2.10)
2.3.1.3. Nắn phân bố thực nghiệm theo dạng chuẩn
Việc tính tần số lý thuyết cho từng tổ của các đại lợng điều tra nh trên gọi
là nắn phân bố thực nghiệm theo dạng chuẩn. Trình tự các bớc có thể tóm tắt nh
sau:
Chỉnh lý tài liệu quan sát, tính các đặc trng mẫu
x
, S.
Thay thế một cách gần đúng x và S
Tính xác suất để X lấy giá trị trong các tổ của đại lợng điều tra theo các
công thức đã trình bày.
Tính tần số lý thuyết: f
l
=n.p
i
.
Kiểm tra giả thuyết H
0
về luật phân bố theo tiêu chuẩn phù hợp
2
.
H
0
Bùi Mạnh Hng
Nếu
n
2
tính theo (2.1) >
2
0.5(k)
thì giả thuyết H
0
bị bác bỏ ở mức ý nghĩa
=0.05, nghĩa là phân bố chuẩn không phù hợp với phân bố thực nghiệm.
Ngợc lại, nếu
n
2
tính theo (2.1)
2
0.5(k)
thì giả thuyết H
0
tạm thời đợc
chấp nhận, có nghĩa phân bố chuẩn phù hợp với phân bố thực nghiệm.
Vẽ biểu đồ phân bố tần số thực nghiệm và lý thuyết.
Bài giảng chơng 2
- - - -
2004
Bùi Mạnh Hng
2 tiết
xP
b
ax
u
b
ax
u
Tổ thứ hai: x
1
=6.75 và x
2
=7.25 cm.
0408.065.138.225.775.6
4505.065.165.1
68.0
37.825.7
4913.038.238.2
68.0
37.875.6
2
1391.091.065.175.725.7
3186.091.091.0
68.0
37.875.7
4505.065.165.1
68.0
37.825.7
2
2
1
1
xP
b
ax
u
b
ax
u
xP
b
ax
u
b
ax
u
Tổ thứ t: x
1
=7.75 và x
2
=8.25 cm.
Bài giảng chơng 2
- - - -
2004
Bùi Mạnh Hng
0714.018.091.025.875.7
0714.018.018.0
68.0
37.825.8
3186.091.091.0
68.0
37.875.7
2
2837.056.018.075.825.8
2123.056.056.0
68.0
37.875.8
0714.018.018.0
68.0
37.825.8
2
2
1
1
xP
b
ax
u
b
ax
u
xP
b
ax
u
b
ax
u
Tổ thứ bảy: x
1
=9.25 và x
2
=9.75 cm.
0768.002.229.175.925.9
4783.002.202.2
68.0
37.875.9
4015.029.129.1
68.0
37.825.9
2
2
1
1
37.875.9
2
2
1
1
xP
b
ax
u
b
ax
u
- Bớc 4: Tính tần số lý luận cho từng tổ của đại lợng quan sát theo công
thức: f
l
=n.p
i
, trong đó n là dung lợng mẫu, p
f
l
gộp (f
t
-f
l
)
2
/f
l
--6.75
6.75-7.25
7.25-7.75
7.75-8.25
8.25-8.75
8.75-9.25
9.25-9.75
9.75-
1
2
5
11
18
9
3
1
0.0087
50
1.0072
50.35
n
2
=1.529
Phân bố chuẩn có 2 tham số cần ớc lợng là và
2
, vì vậy bậc tự do: k=l-r-
1=4-2-1=1 suy ra:
n
2
(k=1)
=3.84.
n
2
=1.529<
n
2
(k=1)
=3.84 nên giả thuyết H
0
về phân bố lý thuyết là phân bố chuẩn
độ:
P
x
(x)=
.e
-
x
(x>0) (2.11)
Trong đó là tham số của phân bố giảm.
Đờng cong phân bố giảm, giảm khi x tăng, càng lớn thì đờng cong càng
lõm và ngợc lại, càng bé thì đờng cong càng bẹt (hình 2.4).
Hình 2.4: Đờng cong phân bố giảm
2.3.2.2. Nắn phân bố thực nghiệm theo dạng hàm Meyer
Trong lâm nghiệp ngời ta thờng vận dụng phân bố giảm dạng hàm Meyer
để nắn các phân bố thực nghiệm của một số nhân tố điều tra.
Hàm Meyer có dạng: y=
.e
Để xác định các tham số a và b của phơng trình hồi quy tuyến tính 1 lớp
(2.13) có thể dùng các công thức sau:
P
x
(x)
x
Bài giảng chơng 2
- - - -
2004
Bùi Mạnh Hng
x
xy
Q
Q
b
và )14.2(xbya
Trong đó:
)15.2(
.
.
m
yx
yxQ
xy
x
m
x
1
(2.17)
Với m là số tổ đợc chia theo biến số x.
Sau khi xác định đợc a và b theo công thức (2.14), dễ dàng tìm đợc các
tham số và của hàm Meyer:
Vì:
a
lg nên =10
a
(2.18)
be
lg
nên
e
b
lg
(2.19)
Bài giảng chơng 2
- - - -
t
-f
l
)
2
/f
l
8
12
16
20
24
28
32
13
17
14
10
11
7
2
1.1139
1.2305
1.1461
1.0000
1.0414
0.8451
0.021
140 74 6.6780 3248 120.3041
74.83
n
2
=5.67
Từ bảng 2.2 tính đợc:
2567.13
7
678.6140
0341.120
.
.
m
yx
yxQ
xy
0.448
7
140
3248
6780.6
xbya
Phơng trình hồi quy tuyến tính 1 lớp lập đợc là: Vì: lg
=a mà a=1.5458 =10
a
=10
1.5458
=35.1419
Vì: -lge=b 06808.0
72.2lg
02959.0
lg
e
b
xy 02959.05458.1
Bài giảng chơng 2
- - - -
2004
n
2
=5.67<
05
2
(k=3)
=7.81 nên giả thuyết về luật phân bố giảm dạng hàm
Meyer đợc chấp nhận, nghĩa là phân bố số cây theo đờng kính (n/D
1.3
) trạng thái
rừng IIIA
1
tuân theo luật phân bố giảm dạng hàm Meyer. Trên hình 2.5 là biểu đồ
phân bố số cây theo đờng kính thực nghiệm và lý thuyết.
Hình 2.5: Phân bố n/D
1.3
thực nghiệm và lý thuyết
Phân bố giảm đóng một vai trò quan trọng trong lý thuyết bền vững (độ bền
của máy móc) và trong nhiều tính toán thực tế khác. Trong lâm nghiệp, phân bố
giảm thờng dùng để đặc trng cho quy luật phân bố số cây theo đờng kính của
những lâm phần hỗn loài khác tuổi qua khai thác chọn không quy tắc nhiều lần.
Trên cơ sở mô hình hoá quy luật cáu trúc tần số số cây theo cỡ kính này, có thể xác
định đợc tần suất, hay tần số (số cây) tơng ứng với từng cỡ kính phù hợp với mục
tiêu kinh doanh. Ngoài ra, nếu kết hợp với việc nghiên cứu quan hệ giữa đờng kính
và chiều cao cây rừng còn có thể xác định đợc tổng thể tích (trữ lợng) của từng cỡ
kính theo mục tiêu kinh doanh.
2.3.3. Phân bố khoảng cách
2.3.3.1. Khái niệm
Phân bố khoảng cách là phân bố xác suất của biến ngẫu nhiên đứt quãng,
hàm toán học có dạng:
Khi 1-= thì phân bố khoảng cách trở về dạng phân bố hình học:
F(x)=(1-
)
x
với x0 (2.21)
2.3.3.2. Ước lợng các tham số của phân bố khoảng cách
Bằng phơng pháp hàm tối đa hợp lý có thể xác định đợc các tham số của
phân bố khoảng cách nh sau:
)23.2(
)(
1
)22.2(
0
0
ii
Xf
fn
n
f
Nh vậy chính là tấn suất của tổ đầu tiên.
Ví dụ 2.3: Nắn phân bố số cây theo đờng kính (n/D
0
0
ii
Xf
fn
n
f
P
x
=(1-
)(1-
)
x-1
là xác suất để gặp 1 cây trong mỗi cỡ kính.
f
l
=n.P
11
19
32
17
0
1
2
0
32
34
0.157
0.266
0.182
19
32.23
22.05
0
0.00168
1.1555
Bài giảng chơng 2
- - - -
2004
Bùi Mạnh Hng
44
45
54
21
8
27
10
0.125
0.085
0.058
0.040
0.027
0.019
0.013
0.009
15.08
10.08
7.055
4.826
3.301
2.258
1.544
1.056
0.05608
0.04549
0.53594
n
2
=3.0326
05
2
(k=3)
=5.99
Vì
n
2
<
05
2
(k=3)
nên giả thuyết H
0
tam thời đợc chấp nhận, nghĩa là phân bố
số cây theo đờng kính lam phần hỗn giao khác tuổi tuân theo luật phân bố khoảng
cách. Hình 2.6: Phân bố n/D
1.3
theo phân bố khoảng cách
2.3.4. Phân bố Weibull
axf
n
il
Trong đó a là trị số quan sát bé nhất, x
i
là trị giữa tổ.
2.3.4.2. Nắn phân bố thực nghiệm theo hàm Weibull
Để nắn phân bố thực nghiệm theo hàm Weibull, trớc hết ngời làm công tác
thống kê phải căn cứ vào liệt số phân bố của một nhân tố điều tra nào đó để ớc
lợng tham số cho phù hợp. Theo kinh nghiệm tham số đợc chọn sao cho kết
quả tính trị số
n
2
theo công thức (2.1) là bé nhất và nhỏ hơn
05
2
tra bảng với bậc tự
do k=l-r-1.
ứng với mỗi giá trị của tham số ớc lợng, sau khi nắn phân bố thực
nghiệm theo hàm Weibull, đều phải tiến hành kiểm tra giả thuyết về luật phân bố.
Trờng hợp nếu giả thuyết không đợc chấp nhận thì phải tiến hành chọn tham số
khác phù hợp hơn.
Ví dụ 2.4: Nắn phân bố thực nghiệm n/D
1.3
u
e
-
u
P
i
f
l
(f
t
-
f
l
)
2
/f
l
(1)
(2)
(3)
(4)
(5)
4
6
8
1
27
125
343
2
189
1750
6517
0.014
0.112
0.377
0.895
0.9861
0.8941
0.6855
0.4085
0.0139
0.0920
0.2090
0.2770
0.19
12
14
16
729
1331
2197
3375
8019
7986
8788
3375
1.747
3.020
4.795
7.157
0.1740
0.0487
0.0082
0.0008
0.2340
0.1250
0.0400
0.0070
Cột (2) là tần số tơng ứng mỗi cỡ đờng kính.
Cột (3) là trị số giữa cỡ trừ đi trị số quan sát bé nhất (a).
Cột (4) là trị số giới hạn trên mỗi cỡ trừ đi trị số quan sát bé nhất.
Cột (5)=cột (3) lập phơng, trong ví dụ này chọn =3 vì phân bố thực
nghiệm có dạng đối xứng.
Cột (6)=cột (2) nhân với cột (5), tổng cột (6) là
n
i
it
axf
1
3
).( và bằng 36626,
từ đây có thể tính đợc tham số theo công thức (2.25):
001747.0
36626
64
).(
axf
n
il