ĐỀ CƯƠNG BÀI GIẢNG THỐNG KÊ TOÁN HỌC TRONG LÂM NGHIỆP - Pdf 25

ĐỀ CƯƠNG BÀI GIẢNG
THỐNG KÊ TOÁN HỌC TRONG LÂM NGHIỆP
1
Chương 1
PHÂN BỐ THỰC NGHIỆM VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG
CÁC THAM SỐ ĐẶC TRƯNG CỦA TỔNG THỂ
Số tiết: 7 tiết (Lý thuyết: 6 tiết; bài tập, thảo luận: 1 tiết; thực hành: 0 tiết)
*) Mục tiêu
- Kiến thức: Sinh viên hiểu được kiến thức về:
+ Các phương pháp chọn mẫu
+ Phân bố thực nghiệm
+ Ước lượng điểm, ước lượng khoảng
- Kỹ năng: Vận dụng được để tính toán các đặc trưng mẫu, lập các phân bố thực nghiệm
- Thái độ: Chủ động, tích cực trong việc tìm hiểu các đặc trưng mẫu và phân bố thực nghiệm
1.1. Một số khái niệm
1.1.1. Tổng thể và mẫu
1.1.1.1. Tổng thể
- Khái niệm: Tổng thể là toàn bộ đối tượng cần nghiên cứu, số lượng các phần tử của
tổng thể được gọi là dung lượng tổng thể.
- Ký hiệu: N là dung lượng của tổng thể. Dung lượng của tổng thể có thể là một số hữu
hạn hoặc vô hạn.
- Ví dụ: Tổng số dân trong tỉnh Phú Thọ. Hoặc tổng số cây rừng trong một lâm phần.
1.1.1.2. Mẫu
- Khái niệm: Mẫu là một bộ phận của tổng thể, mà trên đó người ta tiến hành điều tra, đo
đếm và thu thập tài liệu. Số lượng các phần tử của mẫu được gọi là dung lượng mẫu.
- Ký hiệu: n là dung lượng mẫu, dung lượng mẫu luôn là một số hữu hạn.
- Ví dụ: Số cây trong OTC đo đếm. Số người trong xã được phỏng vấn.
1.1.2. Các phương pháp chọn mẫu
1.1.2.1. Chọn mẫu ngẫu nhiên
Chúng ta đem đánh số các phần tử và sau đó bốc thăm tạo thành mẫu. Có thể dựa vào
Bảng số ngẫu nhiên, rút thăm hay trình lệnh T-D-S trong Excel.

đếm được.
- Ví dụ: Số quả có trên một cành, số sâu có trên một cây, số sản phẩm được sản xuất/1 ca
của một cỗ máy…
1.1.3.2. Dấu hiệu quan sát về chất
- Khái niệm: Đại lượng có các phần tử phân biệt nhau bởi 1 đặc điểm hay tính chất.
- Ví dụ: Hạt nảy mầm, không nảy mầm; cây bị bệnh, không bị bệnh; cây tốt, xấu,…
- Bằng cách gán cho các phần tử mang đặc điểm A giá trị 0 và các phần tử mang đặc
điểm khác A giá trị là 1, khi đó nhận được dấu hiệu quan sát về lượng 2 giá trị 0,1 – là đại lượng
đứt quãng.
1.2. Phân bố thực nghiệm
1.2.1. Khái niệm
Quy luật phân bố của những giá trị quan sát được ở mẫu có thể khái quát hoá thành phân
bố lý thuyết gọi là phân bố thực nghiệm.
Phân bố thực nghiệm được lập khi dung lượng mẫu đủ lớn (n≥30).
1.2.1.1. Lập phân bố thực nghiệm cho đại lượng đứt quãng
- Bước 1: Tìm giá trị lớn nhất, giá trị nhỏ nhất (X
max
, X
min
) trong dãy quan sát.
- Bước 2: Lập bảng phân bố tần số thực nghiệm.
- Bước 3: Thống kê các phần tử cùng giá trị theo kiểu kiểm phiếu bầu cử.
- Bước 4: Tính tần số, tần suất thực nghiệm.
- Bước 5: Vẽ biểu đồ phân bố thực nghiệm.
- Ví dụ 1.1: Lập phân bố thực nghiệm số ô theo số cây thông nhựa tái sinh tự nhiên có
trong 60 ô quan sát ở khu vực Uông Bí – Quảng Ninh
1.2.1.2. Lập phân bố thực nghiệm cho đại lượng liên tục
- Bước 1: Chia tổ ghép nhóm.
)lg(.5 nm =
(1.2)

, thì trị số:
=+++= ) (
1
21 n
xxx
n
x
n
1

=
n
i
i
x
1
(1.4)
được gọi là số trung bình mẫu giản đơn
- Chú ý: Số trung bình mẫu giản đơn thường tính với mẫu nhỏ (n<30), tài liệu chưa qua
chỉnh lý.
- Ví dụ 1.3: Tính trung bình về chiều cao cây rừng từ số liệu đo cao 10 cây
b. Trung bình gia quyền
Trong trường hợp mẫu lớn (n≥30), tài liệu đã qua chỉnh lý, số trung bình mẫu được tính
theo công thức sau:
=x
n
1

=
m

1
(1.6)
được gọi là số trung bình toàn phương.
Trong lâm nghiệp, đã vận dụng số trung bình toàn phương để tính đường kính bình quân
cây rừng theo công thức:

=
=
n
i
i
d
n
d
1
2
1
(1.7)
- Ví dụ 1.5: Tính đường kính bình quân toàn phương của 6 cây rừng sau: d
1
=8.2 cm;
d
2
=7.5 cm; d
3
=6.4 cm; d
4
=9.0 cm; d
5
=8.0 cm; d

x
với


=
=
−=
n
i
n
i
i
ix
n
x
xQ
1
1
2
2
)(
(1.9)
4
+ Ví dụ 1.6: Tính sai tiêu chuẩn về chiều cao từ số liệu đo chiều cao 10 cây rừng
+ Trong trường hợp mẫu lớn (n>30), tài liệu đã qua chỉnh lý:
1−
=
n
Q
S

- Khái niệm: Biểu thị mức độ biến động bình quân tương đối của dãy trị số quan sát.
100.%
x
S
S =
(1.11)
Nhờ chỉ tiêu này mà có thể so sánh mức độ biến động giữa các dãy trị số quan sát với
nhau trên cùng 1 dấu hiệu điều tra nào đó.
- Ví dụ 1.8: Khu rừng A có chiều cao bình quân là 8,5m và sai tiêu chuẩn về chiều cao là
1.2m, khu rừng B có chiều cao bình quân là 10,5m và sai tiêu chuẩn về chiều cao là 1,2m. Hỏi
khu rừng nào có mức độ phân hoá về chiều cao mạnh hơn?
1.2.2.5. Phạm vi biến động
- Khái niệm: Phạm vi biến động là khoảng chênh lệch giữa trị số quan sát lớn nhất và bé
nhất của dãy trị số quan sát.
R=X
max
-X
min
Trong đó: X
max
và X
min
là trị số quan sát lớn nhất và bé nhất của dãy quan sát.
1.2.2.6. Sai số của số trung bình mẫu
Là đại lượng xác định bởi công thức:
n
S
S
x
=


=
(1.13)
Nếu S
K
=0 thì phân bố là đối xứng.
S
K
>0 thì đỉnh đường cong lệch trái so với số trung bình.
S
K
<0 thì đỉnh đường cong lệch phải so với số trung bình.
1.2.2.9. Độ nhọn phân bố
- Khái niệm: Là đại lượng đặc trưng cho mức độ tập trung hay phân tán của các trị số
quan sát xung quanh trị số trung bình.
- Ký hiệu độ nhọn là E
X
:
5
3
.
)(
4
1
4


=

=

)(nT
Dt ±=
θ
(1.15)
+ θ là tham số của tổng thể cần ước lượng.
+ T
n
là hàm ước lượng của tham số θ.
+ t là trị số thực của hàm ước lượng T
n
.
+ D
T(n)
là phương sai của hàm ước lượng T
n
.
- Ví dụ 1.9: Để ước lượng số trung bình tổng thể µ, người ta đã chứng minh được rằng:
số trung bình mẫu (
x
) là hàm ước lượng tốt nhất thoả mãn cả 3 tính chất của 1 hàm ước lượng:
không chệch, hội tụ và hiệu nghiệm. Công thức ước lượng điểm như sau:
n
S
xSx
x
±=±=
µ
(1.16)
Trong đó
n


=∆
là sai số tương đối của ước lượng.
1.3.2.1. Ước lượng khoảng số trung bình tổng thể
6
a. Ước lượng khoảng số trung bình tổng thể trong trường hợp mẫu nhỏ (n<30), tài liệu chưa qua
chỉnh lý và tổng thể có phân bố chuẩn
- Người ta đã chứng minh được rằng, nếu tổng thể có phân bố chuẩn X∈N(µ,σ
2
) thì đại lượng:
n
S
x
T .
µ

=
có phân bố t với k=n-1 bậc tự do. Vì vậy, căn cứ vào luật phân bố t có thể viết:
αµ
αα
−=+≤≤− 1) (
)(2/)(2/
n
S
tx
n
S
txP
kk
(1.17)

=∆
- Nếu cho trước sai số tương đối thì dung lượng quan sát cần thiết được tính:
22
42
2/
2
%).()(
10
c
ct
x
St
n


α
(1.18)
- Ví dụ 1.11: Ước lượng chiều cao bình quân của 9 cây quế con trong vườn ươm dưới
công thức dàn che 50%, với α=0,05. Nếu muốn sai số không vượt quá 3% thì dung lượng quan
sát cần thiết bằng bao nhiêu? Biết rằng phân bố số cây theo chiều cao là tuân theo luật chuẩn.
b. Ước lượng khoảng số trung bình tổng thể trong trường hợp mẫu lớn (n≥30)
Để ước lượng số trung bình tổng thể µ, cần rút ngẫu nhiên một mẫu với dung lượng đủ
lớn (n≥30). Theo định luật số lớn thì phân bố xác suất của số trung bình mẫu tiệm cận luật
chuẩn, vì vậy công thức ước lượng khoảng số trung bình tổng thể sẽ là:
αµ
αα
−=+≤≤− 1) (
2/2/
n
S

n
S
UxG
tr
.
2/
α
+=
n
S
UGGL
dtr
2
2/
α
=−=
7
n
S
U
L
.
2
2/
α
±==∆
100
.
100%
2/

2
2
2/
2
%)(
%).(
c
ct
SU
n


α
(1.21)
Nếu dung lượng quan sát cần thiết được tính theo (1.20) hay (1.21) lớn hơn dung lượng
mẫu đã điều tra thì cần thiết phải điều tra bổ sung, dung lượng quan sát bổ sung là: n
bs
=n
ct
-n.
- Ví dụ 1.10: Từ kết quả điều tra bề dày 50 sản phẩm được sản xuất từ một cỗ máy chế
biến (ví dụ 1.2 – bảng 1.4), hãy ước lượng bề dày bình quân của lô phẩm với α=0,05. Nếu muốn
sai số tương đối của ước lượng không vượt quá 4% thì dung lượng quan sát cần thiết bằng bao
nhiêu?
1.3.2.2. Ước lượng khoảng phương sai tổng thể (
σ
2
)
Giả sử một tổng thể có phân bố chuẩn X∈N(µ,σ
2



1
).1().1(
(
2
)(2/1
2
2
2
)(2/
2
kk
SnSn
P
(1.23)
Trong đó χ
2
α
/2(k)
và χ
2
1-
α
/2(k)
được tra ở phụ biểu số 5 ứng với xác suất
2
α
và 1-
2

Từ tổng thể rút ngẫu nhiên 1 mẫu với dung lượng đủ lớn (n>30), trong đó có m phần tử
mang đặc điểm A và n-m phần tử mang đặc điểm khác A, thì tỷ số:
n
m
P
t
=
được gọi là thành số mẫu của những phần tử mang đặc điểm A.
n
mn
pq
mm

=−= 1
là thành số mẫu của những phần tử mang đặc điểm khác A.
Người ta đã chứng minh được rằng, khi n đủ lớn mà P
t
không gần 0 và 1 hoặc n. P
r
≥ 5 thì
phân bố xác suất của P
m
là tiệm cận chuẩn, vì vậy công thức ước lượng khoảng sẽ là:
( ) ( )
)26.1(1
1
.
1
.
22

mm

±=∆
1
.
2
α
Nếu cho trước sai số tuyệt đối của ước lượng (∆
c
) thì dung lượng quan sát cần thiết sẽ là:
( )
2
2
2
1.
c
mm
ct
ppU
n



α
(1.25)
- Ví dụ 1.13: Một khu rừng có diện tích rất lớn, người ta điều tra ngẫu nhiên một mẫu với
dung lượng n = 450 cây, trong đó có 120 cây bị bệnh sâu róm thông. Hãy ước lượng tỷ lệ cây bị
bệnh của cả khu rừng với α = 0,05. Nếu muốn sai số không vượt quá 0,04 thì dung lượng quan
sát cần thiết bằng bao nhiêu?
*) Bài tập

*) Tài liệu học tập
9
1. Ngô Kim Khôi (1998), Thống kê toán học trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
2. Nguyễn Hải Tuất (2006), Xử lý thống kê trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
*) Câu hỏi ôn tập
1. Thế nào là tổng thể, mẫu? Cho biết một số cách chọn mẫu trong lâm nghiệp?
2. Các phương pháp mô tả một phân bố thực nghiệm? Ý nghĩa và nội dung từng phương pháp?
3. Cho biết ý nghĩa và cách tính 5 đặc trưng mẫu: Trung bình, sai tiêu chuẩn, hệ số biến động, sai
số của số trung bình và hệ số chính xác?
10
Chương 2
MÔ HÌNH HÓA QUY LUẬT CẤU TRÚC TẦN SỐ
Số tiết: 8 tiết (Lý thuyết: 6 tiết; bài tập, thảo luận: 1 tiết; thực hành: 1 tiết )
*) Mục tiêu
- Kiến thức: Sinh viên hiểu được kiến thức về:
+ Kiểm định giả thuyết bằng tiêu chuẩn χ
2
+ Mô phỏng được phân bố theo các hàm phân bố Weibull, khoảng cách, Meyer
- Kỹ năng: Vận dụng được để mô phỏng các phân bố thực nghiệm bằng các hàm phân bố
- Thái độ: Chủ động, tích cực trong việc tính toán mô phỏng các phân bố thực nghiệm
2.1. Ý nghĩa của việc mô hình hoá quy luật cấu trúc tần số
- Tạo tiền đề để đề xuất các giải pháp kỹ thuật lâm sinh hợp lý, chẳng hạn: cần thiết phải
điều chỉnh mật độ lâm phần ứng với từng giai đoạn tuổi lâm phần để điều tiết không gian dinh
dưỡng thông qua biện pháp tỉa thưa (đối với rừng sản xuất) trên cơ sở nghiên cứu quy luật phân
bố số cây theo mặt phẳng nằm ngang (n/D
1.3
), hay điều tiết cấu trúc theo mặt phẳng đứng tạo
những lâm phần nhiều tầng tán, đa tác dụng (đối với rừng phòng hộ) trên cơ sở nghiên cứu quy
luật phân bố số cây theo mặt phẳng đứng (n/H
vn

i
l
lt
n
f
ff
1
2
2
)(
χ
(2.1)
có phân bố χ
2
với k=l-r-1 bậc tự do.
Trong đó:
+ f
l
=n.p
i
là tần số lý luận tương ứng với từng tổ của đại lượng điều tra, với p
i
là xác suất
tương ứng mỗi tổ tính theo phân bố lý thuyết đã lựa chọn.
+ f
t
là tần số thực nghiệm.
+ l là số tổ sau khi gộp (đó là số tổ có tần số lý luận ≥ 5).
+ r là số tham số của phân bố lý thuyết.
- Bước 3: Kết luận về giả thuyết.

đổi thì đỉnh đường cong sẽ di chuyển trên đường thẳng song song với trục hoành có tung độ:
π
2
1
b
y =
.
+ b: là sai tiêu chuẩn, khi b thay đổi đỉnh đường cong di chuyển trên đường thẳng song
song với trục tung có hoành độ: x = a
Trường hợp đặc biệt, khi a = 0 và b = 1 thì ta có phân bố chuẩn tiêu chuẩn hay phân bố
chuẩn 0, 1, ký hiệu là X ∈ N(0,1).
( )
)3.2(
2
1
2
2
u
x
eu

×=
π
ϕ
2.3.1.2. Cách tính xác suất theo phân bố chuẩn tiêu chuẩn
( )
( )
)4.2(
2.
1

u
t
b
abta
b
ax
u
+=
−+
=

=
−=
−−
=

=
.
.
2
2
1
1
( )
)5.2(
2
1

2
2



t
ux
dut
0
.
ϕ
(2.7)
Hàm Φ(t) gọi là hàm số tích phân luôn luôn dương và bằng 0,5 khi t=+∞. Người ta đã lập
sẵn phụ biểu để tính hàm Φ(t) và 2Φ(t) khi t có những giá trị khác nhau (Phụ biểu số 2).
Các giá trị U
1
và U
2
tính được có thể âm hoặc dương, nhưng do tính chất đối xứng nên ta
đặt |U| = t. Có thể xảy ra 3 trường hợp sau:
- Trường hợp I: Cả U
1
và U
2
đều âm, nhưng U
1
có giá trị tuyệt đối lớn hơn U
2
. Khi đó xác
suất sao cho X lấy giá trị trong khoảng x
1
và x
2

2
dương:
P(x
1


X

x
2
) =
Φ
(t
1
) +
Φ
(t
2
) (2.9)
- Trường hợp III: U
1
và U
2
đều dương và U
2
> U
1
:
P(x
1

0
về luật phân bố theo tiêu chuẩn phù hợp χ
2
.
H
0
: F
x
(x)= F
0
(x)
- Tính đại lượng:

=

=
l
i
l
lt
n
f
ff
1
2
2
)(
χ
(2.11)
có phân bố χ

-
β
x
(2.12)
Trong đó α và β là hai tham số của hàm Meyer. Để xác định α và β phải logarit hoá 2 vế
phương trình (2.12):
lny=lnα-β.x
Đặt:
b
a
yy
=−
=
=
β
α
ln
ˆ
ln
Nhận được phương trình hồi quy tuyến tính 1 lớp:
bxay +=
ˆ
(2.13)
Để xác định các tham số a và b của phương trình hồi quy tuyến tính 1 lớp (2.13) có thể
dùng các công thức sau:
x
xy
Q
Q
b =

2
2
2
)(
)16.2(
)(

= y
m
y
1


= x
m
x
1
(2.17)
Với m là số tổ được chia theo biến số x.
Sau khi xác định được a và b theo công thức (2.14), dễ dàng tìm được các tham số α và β
của hàm Meyer:
Vì:
a=
α
lg
nên α=10
a
(2.18)
be =− lg
β

Khi 1-γ=α thì phân bố khoảng cách trở về dạng phân bố hình học:
F(x)=(1-
α
)
α
x
với x≥0 (2.21)
2.3.3.2. Ước lượng các tham số của phân bố khoảng cách
)23.2(
)(
1
)22.2(
0
0


−=
=
ii
Xf
fn
n
f
α
γ
- Ví dụ 2.3: Nắn phân bố số cây theo đường kính (n/D
1.3
) trạng thái rừng IIIA
1
tại Tùng

axf
n
il
Trong đó a là trị số quan sát bé nhất, x
i
là trị giữa tổ.
2.3.4.2. Nắn phân bố thực nghiệm theo hàm Weibull
Tham số α được chọn sao cho kết quả tính trị số χ
n
2
theo công thức (2.1) là bé nhất và
nhỏ hơn χ
05
2
tra bảng với bậc tự do k=l-r-1.
Nếu giả thuyết không được chấp nhận thì tiến hành chọn tham số α khác phù hợp hơn.
- Ví dụ 2.4: Nắn phân bố thực nghiệm n/D
1.3
lâm phần mỡ trồng thuần loài đều tuổi theo
hàm Weibull theo kết quả điều tra sau đây (với α=3).
*) Bài tập
1. Nắn phân bố số cây theo đường kính (n/D
1.3
) của ô tiêu chuẩn 2000m
2
trạng thái rừng IIIA
1
theo tài liệu:
D
1.3

2.Đưa các biến kiểm định vào Variables trong Test distribution
3.Tiếp theo chọn phân bố lý thuyết cần mô phỏng như phân bố chuẩn (Normal) Weibull.…
Trong Distribution parameters chọn Estimation from data trong proportion Estimation
formula chọn Blom's
4.OK
2. Kiểm định theo dạng chuẩn chiều cao của 70 cây rừng
Quy trình:
1. Analyze\ Nonparametric Tests\ 1-Sample K- S
2. Trong hộp thoại Test variable lists, đưa biến kiểm tra (chẳng hạn h
vn
) vào và đánh dấu
dạng phân bố cần kiểm định: Normal, Poisson
3. Trong Options của hộp thoại One Sample Kolmogorov Smirnov Test, nếu muốn biết chi
tiết các đặc trưng mẫu, cần lựa chọn thêm Descriptive và nhấn Continue để trở về thực đơn
của hộp thoại One Sample Kolmogorov Smirnov Test
15
4. OK
*). Tài liệu học tập
1. Ngô Kim Khôi (1998), Thống kê toán học trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
2. Nguyễn Hải Tuất (2006), Xử lý thống kê trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
*) Câu hỏi ôn tập
1. Ý nghĩa của việc mô hình hóa cấu trúc tần số?
2. Trình tự các bước kiểm định giả thuyết bằng tiêu chuẩn χ
2
?
3. Vai trò, ý nghĩa của các hàm phân bố Weibull, khoảng cách, Meyer trong nghiên cứu lâm nghiệp?
16
Chương 3
PHƯƠNG PHÁP SO SÁNH CÁC MẪU QUAN SÁT
VÀ THÍ NGHIỆM TRONG LÂM NGHIỆP

+ So sánh 2 mẫu về lượng độc lập.
+ Hai tổng thể phải có phân bố chuẩn, phương sai của hai tổng thể bằng nhau (σ
1
2

2
2
).
+ Dung lượng mẫu: n
1
, n
2
< 30
- Các bước tiến hành:
+ Đặt giả thuyết: H
0
: µ
1

2

H
1
: µ
1
≠µ
2

+ Kiểm tra giả thuyết H
0

+ Kết luận: So sánh /t/ với t
05 (k)
tra bảng với bậc tự do k=n
1
+n
2
-2
- Ví dụ 3.1: Hãy so sánh sinh trưởng đường kính ngang ngực (D
1.3
) của hai lô rừng thông
trồng thuần loài đều tuổi dưới hai công thức mật độ trồng rừng khác nhau (1500 cây/ha và 2000
cây/ha)
Trường hợp: Nếu bài toán chưa cho trước về sự bằng nhau của 2 phương sai tổng thể thì
trước khi so sánh bằng tiêu chuẩn t phải kiểm tra sự bằng nhau của 2 phương sai (kiểm tra điều
kiện), bằng tiêu chuẩn F (Fisher).
- Đặt giả thuyết: H
0
: σ
1
2

2
2
17
H
1
: σ
1
2


05 (k1,k2)
với bậc tự do k
1
=n
1
-1, k
2
=n
2
-1
- Ví dụ 3.2: So sánh khối lượng thể tích của ván dăm (g/cm
3
) được sản xuất ra từ hai nhà
máy chế biến gỗ. Biết rằng khối lượng thể tích của ván dăm là tuân theo luật chuẩn, cho trước
α=0.05
3.2.2. Tiêu chuẩn U của phân bố chuẩn tiêu chuẩn
Điều kiện áp dụng: n
1
,n
2
≥30, hai mẫu độc lập về lượng, không cần biết trước về luật phân
bố của hai tổng thể thì ta sử dụng tiêu chuẩn U của phân bố chuẩn tiêu chuẩn.
- Đặt giả thuyết: H
0
: µ
1

2
H
1

3.2.3. Các tiêu chuẩn phi tham số
Cách xếp hạng các trị số quan sát:
- Sắp xếp các trị số quan sát của từng mẫu theo thứ tự từ bé đến lớn.
- Xếp hạng các trị số quan sát chung cho cả hai mẫu.
* Tiêu chuẩn U của Mann và Whiney
- Điều kiện áp dụng:
+ Không biết trước luật phân bố của đại lượng quan sát.
+ n
1
, n
2
≥4 và n
1
+n
2
≥20 (hoặc n
1
,n
2
≥10).
+ F(X) và F(Y) liên tục, hay X, Y liên tục. Trong đó F(X) và F(Y) là hàm phân bố của
đại lượng quan sát thuộc mẫu 1 và mẫu 2.
- Bước 1: Đặt giả thuyết: H
0
: F(X)=F(Y)
H
1
: F(X)≠F(Y)
- Bước 2: Sắp xếp các trị số quan sát theo thứ tự từ bé đến lớn chung cho cả hai mẫu.
- Bước 3: Xếp hạng các trị số quan sát.

nn
nnU
R
nn
nnU

+
+=

+
+=
2
)1(
.
2
)1(
.
Với:
xyxy
UnnU −=
- Bước 6: Dùng U
x
và U
y
để kiểm tra giả thuyết H
0
theo tiêu chuẩn U của Mann và
Whiney sau:
)1(
12

nn
U
U

=
hoặc
( )
11.3
2
σ
yx
y
nn
U
U

=
Trong đó:
( )
( )
12.3
121
3








>20.
- Ví dụ 3.4: Hãy so sánh sinh trưởng chiều cao cây rừng trồng thuần loài đề tuổi dưới 2
công thức mật độ trồng rừng khác nhau (1500c/ha và 2000c/ha).
3.2.4. Tiêu chuẩn Kruskal and Wallis
Tiêu chuẩn dùng so sánh k (nhiều) mẫu độc lập.
- Điều kiện áp dụng là:
+ Phân bố đại lượng quan sát phải liên tục.
+ Phải có từ 3 mẫu trở lên.
- Bước 1: Đặt giả thuyết: H
0
: F(X
1
)= F(X
2
)= = F(X
k
)
H
1
: F(X
1
)≠ F(X
2
)= = F(X
k
) (Chỉ cần có một sự sai khác.)
- Bước 2: Sắp xếp các trị số quan sát chung của các mẫu (k mẫu) theo thứ tự từ bé đến lớn.
- Bước 3: Xếp hạng các trị số quan sát chung cho K mẫu.
- Bước 4: Tính tổng hạng cho mỗi mẫu và kiểm tra việc xếp hạng
( )

1
12
1
2
+−
+
=

=
n
n
R
nn
H
K
i
i
i
- So sánh χ
2
với χ
05
2
tra bảng với k=n-1 bậc tự do
3.3 Trường hợp các mẫu liên hệ
Là các mẫu quan sát không độc lập với nhau mà có liên hệ với nhau ở một mức độ nào
đó, các mẫu như thế gọi là mẫu liên hệ. Các mẫu liên hệ luôn đi theo từng cặp.
Ví dụ: Trong đo cao cây rừng, người ta có thể dùng một trong hai loại thước đo cao:
Thước kẹp sào và thước Blumeleise.
3.3.1. Tiêu chuẩn t của Student để so sánh hai mẫu liên hệ

i
=x
i
-y
i
).
d là trung bình của hiệu sai d
i
.
( )


−=

=
n
d
dQ
n
Q
S
i
id
d
d
2
2
1
(n là số cặp mẫu liên hệ)
+ So sánh /t/ với t

tương ứng của đại lượng X và Y của hai mẫu.
- Bước 3: Xếp hạng các hiệu sai theo thứ tự từ bé đến lớn, khi xếp hạng bỏ qua những sai
dị bằng 0 (d
i
= x
i
-y
i
=0) và không để ý đến dấu của các sai dị là âm hay dương.
- Bước 4: Tính tổng hạng theo dấu âm (R
-
) và tổng hạng theo dấu dương (R
+
), kiểm tra
việc xếp hạng và tính tổng hạng theo công thức sau:
( )
( )
19.3
2
1
+
=+
−+
rr
RR
Trong đó r là số cặp có sai dị khác 0.
- Bước 5: Kiểm tra giả thuyết H
0
theo tiêu chuẩn U của Wilcoxon:
20

rr
R
U
- Bước 6: So sánh /U/ với 1.96
- Ví dụ 3.7: Người ta đo chiều cao của 26 cây trồng thuần loài đề tuổi được kết quả ở
bảng 3.8 bằng hai loại thước đo cao là thước Blumeleise và thước kẹp sào. Hỏi kết quả đo chiều
cao cây bằng hai loại thước khác nhau có thuần nhất với nhau không?
3.4. Kiểm tra thuần nhất các mẫu về chất
3.4.1. So sánh hai mẫu về chất bằng tiêu chuẩn U
- Đặt giả thuyết: H
0
: P
t1
=P
t2H
1
: P
t1
≠P
t2
Trong đó: H
1
: P
t1
, P
t2
là thành số mẫu 1 và thành số mẫu 2.

+=
nn
qp
m
P
σ
Với
21
21
21

nn
PnPn
p
mm
+
+
=

( )
24.31 pq −=
Hoặc ta có thể sử dụng công thức sau để kiểm tra giả thuyết H
0
:
m
p
mm
pp
U
σ

: Các mẫu về chất là thuần nhất.
H
1
: Các mẫu về chất là không thuần nhất.
Kết quả được sắp xếp vào bảng gồm các hàng và cột như sau:
Bảng 3.10: Sắp xếp kết quả nghiên cứu
21
B
A
1 2 j b

1
2

i

a
f
11
f
21

f
i1

f
a1
f
12
f

1b
f
2b

f
ib

f
ab
Ta
1
Ta
2

Ta
i

Ta
a

Tb
1
Tb
2
Tb
j
Tb
b
TS
f

sau đây:
( )
26.31
2
2









×
=

ji
ij
n
TbTa
f
TS
χ
- Kết luận: So sánh χ
n
2
với χ
05
2

3
) được sản xuất ra từ hai nhà máy chế biến
gỗ, kết quả được cho ở bảng sau:
Stt 1 2 3 4 5 6 7 8 9
X
i1
0.4 0.43 0.51 0.48 0.64 0.72 0.58 0.60 0.71
X
i2
0.43 0.44 0.50 0.46 0.70 0.58 0.71 0.67 0.69
Hỏi khối lượng thể tích của ván dăm được sản xuất ra từ hai nhà máy chế biến gỗ có như
nhau hay không? Biết rằng khối lượng thể tích của ván dăm là tuân theo luật chuẩn, cho trước
α=0.05.
3. Kết qủa đo đường kính ngang ngực cây rừng (D
1.3
) trồng thuần loài đều tuổi trên hai vị trí địa
hình (chân đồi và đỉnh đồi) và chỉnh lý tài liệu quan sát được kết quả như sau:
x
i
7 9 11 13 15 17 19

f
t
(1) 2 5 9 14 7 4 1 42
f
t
(2) 3 8 12 10 6 3 1 43
22
Hãy so sánh sinh trưởng đường kính của cây trồng trên hai vị trí địa hình với α=0.05.
Trong đó f

14
15
16
17
18
19
20
21
22
23
24
25
26
2.4
3.1
2.8
2.5
3.3
3.5
3.6
4.1
3.4
2.6
2.0
2.5
2.9
3.7
4.1
3.8
2.5

2.4
2.2
2.5
3.3
2.8
6. Hai khu rừng thông trồng thuần loài đều tuổi có diện tích rất lớn bị nhiễm bệnh rơm lá trông.
Từ mỗi khu rừng lập 1 ô tiêu chuẩn điển hình 2000 m
2
và thống kê số cây bị nhiễm bệnh. Kết
quả điều tra như sau:
- Khu rừng I: n
1
=70 cây, m
1
=24 cây bị bệnh
- Khu rừng II: n
2
=75 cây, m
2
=36 cây bị bệnh
23
Hỏi tỷ lệ cây bị bệnh của hai khu rừng có thuần nhất với nhau không?
7. Kết quả kiểm kê rừng trồng trên 3 khu vực trồng rừng khác nhau (I, II và III) được cho ở bảng
B
A
Tốt
Trung
bình
Xấu


vn
vào Test variable và Dhinh vào
Grouping variable
3. Nháy chuột trái vào Define groups và ghi: Group 1: 3 (địa hình 3), Group 2: 4 (địa hình 4)
4. Chọn Mann -Whitney
5. OK
3. So sánh nhiều mẫu độc lập bằng tiêu chuẩn Kruskal – Wallis
Quy trình
1. Analyze\ Nonparametric Tests\ K - Independent samples
2. Trong hộp thoại Tests for several Independent samples Test đưa H
vn
vào variable List
và Dhinh vào Grouping variable
3. Nháy chuột trái vào Define Range và ghi: minimum = 2, maximum = 4
4. Chọn Kruskal - Wallis - H
5. OK
4. So sánh 2 mẫu liên hệ bằng tiêu chuẩn t
Quy trình
1. Tools\ Data analysis\ T- Test Paired two sample for Mean
2. Input range:Variable 1 range: khai báo biến thứ nhất. Variable 2 range: khai báo biến 2
3. Hypothesied Mean Diffrence: ghi 0, Alfa =0.05.
4. Output range: Chọn một cell bất kỳ và Ok
5. So sánh 2 mẫu liên hệ bằng tiêu chuẩn Wilcoxon
Quy trình
1. Analyze\ Nonparametric Tests\ 2 Related samples
2. Trong hộp thoại Two Related samples chuyển cả 2 biến X và Y vào khung Test pair(s)
24
list
3. Chọn Wilcoxon
4. OK

*) Câu hỏi ôn tập
1. Khi so sánh 2 mẫu độc lập, chúng ta thường sử dụng tiêu chuẩn nào? Cho biết sự khác nhau
giữa các tiêu chuẩn đó?
2. Cho biết trình tự thực hiện so sánh 2 mẫu độc lập bằng tiêu chuẩn U của Mann Whitney và
mẫu liên hệ theo tiêu chuẩn tổng hạng theo dấu của Wincoxon?
3. Khi so sánh 2 mẫu độc lập về chất, chúng ta dùng tiêu chuẩn nào?
25


Nhờ tải bản gốc
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status