XỬ LÝ DỮ LIỆU THỐNG KÊ NÔNG NGHIỆP VỚI PHẦN MỀM EXCEL - Pdf 19


PGS. TS. Nguyễn Hải Thanh XỬ LÝ DỮ LIỆU THỐNG KÊ NÔNG NGHIỆP
với phần mềm Excel
(Bài giảng cho dự án CNTT 2008) HÀ NỘI, THÁNG 10 NĂM 2008
Xử lý dữ liệu thống kê nông nghiệp với phần mềm Excel

Phần mềm Excel cho phép phân tích dữ liệu nói chung, dữ liệu sinh học và nông
nghiệp nói riêng, một cách khá hiệu quả thông qua việc sử dụng menu Tools> Data
Analysis (nếu không có mục này thì chọn Tools> Add-in > Analysis ToolPak để cài đặt
thêm). Bài giảng này giới thiệu về phương pháp khảo sát mẫu và một số công cụ xử lý số

n
)
trong đó x
i
là giá trị đo được của X
i
thu được từ kết quả của thực nghiệm.
n
1
X =
(X
1
+X
2
+ hống kê
Đại lượng t
+ X
n
) được gọi là trung bình mẫu lý
thuyết và được lấy làm ước lượng cho kỳ vọng E(X) của X, E(X) được coi là số đặc trưng
cho trung bình chung của chỉ số X. Đây là một ước lượng rất tốt với các tính chất: không
chệch, vững và hiệu quả.
Lúc đó, (x
1
+ x
2
+ + x
n
) được gọi là trung bình mẫu thực
nghiệm, chính là giá trị trung bình của chỉ số X trên mẫu thực nghiệm. Nhờ có tính chất

i
)XX(

=

gọi là phương sai mẫu đã

2
n
1
n
2
i
i1
(x x)
=


2
s
ˆ
Lúc này, = được gọi là phương sai mẫu thực nghiệm chưa hiệu
chỉnh, còn s
2
=
1n
1

2
n

Ví dụ 1: Khảo sát về các đặc tính của lúa ta thu được bốn cột số liệu: dài bông
(cm), P1000 (trọng lượng 1000 hạt), số bông/một cây, năng suất. Số liệu được bố trí như
trong hình 1.
Chọn Tools>Data Analysis>Descriptive Statistics, sau đó khai báo hộp thoại.

3

Hình 1. Bảng số liệu khảo sát về lúa và khai báo hộp thoại.
Kết quả thu được cho trong hình 2.

Hình 2. Kết quả thống kê mô tả về các đặc tính của lúa
b. Phân tích các kết quả thu được
Một số nhận xét sơ bộ trên các thống kê thu được như sau:
- Mean cho ta giá trị trung bình của dãy số.

4
- Standard error cho ta biết tỷ số độ lệch chuẩn mẫu /căn bậc hai của n.
- Median cho giá trị điểm giữa của dãy số.
Nếu 2 giá trị Mean và Median xấp xỉ nhau ta thì số liệu là cân đối. Trong ví dụ 1
các cột số liệu là cân đối trừ cột “số bông” hơi bị lệch.
- Mode cho biết giá trị xảy ra nhiều nhất trên mẫu.
- Phương sai mẫu hay độ lệch chuẩn mẫu (đã hiệu chỉnh) cho ta biết độ phân tán
của số liệu quanh giá trị trung bình, nếu các giá trị này càng nhỏ chứng tỏ số liệu càng
tập trung.
- Kurtosis đánh giá đường mật độ phân phối của dãy số liệu có nhọn hơn hay
tù hơn đường mật độ chuẩn tắc. Nếu trong khoảng từ −2 đến 2 thì có thể coi số liệu xấp
xỉ chuẩn.
- Skewness đánh giá đường phân phối lệch trái hay lệch phải. Nếu trong khoảng
từ −2 đến 2 thì có thể coi số liệu cân đối gần như số liệu trong phân phối chuẩn tắc.
- Confidence Level được hiểu là nửa độ dài khoảng tin cậy. Giả sử Confidence

phân phối Student với bậc tự do n
−1.
II. Tổ chức đồ
Tần số xuất hiện của số liệu trong các khoảng cách đều nhau cho phép phác hoạ
biểu đồ tần số, còn gọi là tổ chức đồ. Để vẽ tổ chức đồ cần phải tiến hành phân tổ / nhóm
số liệu.
2.1. Tạo miền phân tổ
Để tiến hành phân tổ số liệu (tạo Bin), cần thực hiện các bước sau:
- Dùng các hàm Min, Max để xác định giá trị nhỏ nhất và giá trị lớn nhất.
- Định ra giá trị cận dưới và giá trị cận trên của miền phân tổ.
- Ghi giá trị cận dưới vào ô đầu của miền phân tổ và bôi đen toàn miền này.
- Chọn
Edit > Fill > Series để khai báo các mục:

5
+ Trong mục Series in chọn Columns (dữ liệu theo cột),
+ Trong mục Type chọn Linear (dữ liệu tăng theo cấp số cộng),
+ Trong Step value: nhập giá trị bước tăng,
+ Trong Stop value: nhập giá trị cận trên,
+ OK.
Ví dụ 2: Dựa trên 30 số liệu về chiều dài cá ta tạo miền phân tổ (Bin) như trên
hình 3 với miền phân tổ từ ô D2 tới ô D12 (kể cả nhãn), giá trị cận dưới là 10, cận trên là
55, giá trị bước tăng 5.

Hình 3. Tạo miền Bin cho các số liệu về chiều dài cá
2.2. Vẽ tổ chức đồ
a. Các bước thực hiện
Chọn Tools> Data Analysis> Histogram để khai báo các mục:
- Input range: miền dữ liệu.
- Input Bin: miền phân tổ.

- Input range: miền dữ liệu kể cả nhãn.
- Grouped by: Column (số liệu theo cột).
- Labels in first row : đánh dấu
√ vào ô này nếu có nhãn ở hàng đầu.
- Output range: miền xuất kết quả ra.
- OK.
Ví dụ 3: Để nghiên cứu mối tương quan giữa các đặc tính dài bông, số hạt, số
bông với năng suất lúa, cần thực hiện các bước sau:
- Chọn
Tools>Data analysis>Correlation.
- Khai báo các mục (xem hình 6).

Hình 6. Các bước khai báo khi tính hệ số tương quan

8
- Kết quả thu được trên bảng 1.
Bảng 1. Kết quả tính hệ số tương quan

D
ài bôn
g

P
1000 Số bông
N
ăng suất
Dài bông 1
P1000 0.233314 1
Số bông −0.22056 0.340772 1
N

Chọn Tools>Data Analysis>Regression và khai báo các mục:
- Input y range: miền dữ liệu biến y.
- Input x range: miền dữ liệu các biến x.
- Label: đánh dấu
√ vào ô này nếu có nhãn ở hàng đầu.
- Confidence level : 95% ( độ tin cậy 95%).
- Constant in zero: đánh dấu
√ nếu hệ số tự do a
0
= 0 .
- Output range: miền xuất kết quả.
- Residuals: đánh dấu
√ vào ô này để hiện phần dư hay sai lệch giữa y thực nghiệm
và y theo hồi quy.
- Standardized residuals: đánh dấu
√ để hiện phần dư đã chuẩn hoá.
- Residuals plot: đánh dấu
√ để hiện đồ thị phần dư.
- Line fit plots: đánh dấu √ để hiện đồ thị các đường dự báo.

9
- Normal probability plot: đánh dấu
√ để hiện đồ thị phần dư đã chuẩn hoá.
- OK.
Ví dụ 4: Tìm phương trình hồi qui y = a
0
+ a
1
x
1

3
gây nên. Hệ số Adjusted R square là 62.00% không sát gần
với R square chứng tỏ không phải tất cả các biến đưa vào là thực sự cần thiết.
- F thực nghiệm là 8.6142 ứng với xác suất 0.00316 nhỏ hơn mức xác suất ý
nghĩa 0.05 nên phương trình hồi quy tuyến tính được chấp nhận.
- Nhìn vào các hệ số của các biến ta viết được đường hồi quy dự báo. Trong ví dụ
4 phương trình hồi quy là: y =
− 3.61899 + 0.085345x
1
+ 0.081163x
2
+ 0.02083x
3
. Tuy
nhiên căn cứ vào các xác suất cho ở cột P-value thì hệ số của x
1
là không đáng tin cậy, vì
xác suất tương ứng > 0.05 (mức ý nghĩa đã chọn). Trong trường hợp này, cần tiến hành lọc
bớt biến x
1
để được đường hồi quy với các hệ số đều có ý nghĩa.

Hình 7. Khai báo để tìm phương trình hồi quy

10

Hình 8. Kết quả tìm phương trình hồi quy
IV. So sánh hai mẫu
Bài


).
4.1. So sánh hai mẫu độc lập khi biết phương sai σ
1
2
và σ
2
2

Rút mẫu độc lập từ hai tổng thể phân phối chuẩn, trong một số tình huống nào đó
chúng ta có thể ước lượng được các phương sai
σ
1
2

và σ
2
2
. Chẳng hạn, nếu điều tra lại hai
tổng thể sau một thời gian chưa lâu thì các phương sai được coi là chưa thay đổi, do đó lấy
phương sai của lần điều tra trước làm ước lượng cho
σ
1
2

và σ
2
2

(như khi xem xét các kết
quả phân tích của hai phòng thí nghiệm mà độ chính xác đã ổn định, từ đó có ước lượng về

- Variable 2 variance: phương sai của biến 2 (nhập
σ
2
2
).
- Output Range: chọn miền trống để đưa ra kết quả.
Ví dụ 5: Thực hiện thí nghiệm với mẫu 1 có 10 số liệu quan sát được, mẫu 2 có 12
quan sát ta có bảng số liệu sau, biết phương sai của biến 1 là 1.7, của biến 2 là 2.6.
x 3.4 3.4 3.5 3.5 3.5 3.7 3.7 3.7 3.7 3.9
y 3.2 3.2 3.4 3.4 3.6 3.6 3.6 3.6 3.6 3.6 3.6 3.6
Kết quả so sánh hai mẫu cho ở bảng 2.
Bảng 2. Kết quả so sánh hai mẫu độc lập
z-Test: Two Sample for Means

Mẫu 1 Mẫu 2
Mean 3.6 3.5
Known Variance 2.7 2.6
Observations 10 12
Hypothesized
Mean Difference
0
Z 0.14335
P(Z<=z) one-tail 0.44301
z Critical one-tail 1.64485
P(Z<=z) two-tail 0.88602
z Critical two-tail 1.95996
b. Phân tích kết quả
Bảng kết quả 2 có hai cột, một cột cho mẫu quan sát 1, cột kia cho mẫu 2 (tính tới
hàng thứ ba). Bảng này gồm có:
- Trung bình của mẫu a

2
)
- Giá trị P một phía và giá trị P hai phía.

12
- Giá trị z lý thuyết (tới hạn) một phía và hai phía.
Chú ý rằng, có thể dùng một số hàm trong Excel để tính một số kết quả:
- Giá trị P một phía tính bằng hàm (1
−Normsdist(z)).
- Giá trị P hai phía tính bằng hàm (1
− Normsdist(z))×2.
- Giá trị tới hạn của hàm phân phối chuẩn tắc z một phía tính bằng hàm
Normsinv(0.95).
- Giá trị z tới hạn hai phía tính bằng hàm Normsinv(0.975).
Trong ví dụ 5 ta thấy: giá trị z thực nghiệm 0.14335 nhỏ hơn z lý thuyết (tới hạn)
một phía 1.64485 cũng như z lý thuyết hai phía 1.95996 (giá trị P một phía và hai phía đều
lớn hơn mức ý nghĩa
α = 0.05). Kết luận: kỳ vọng của hai biến không khác nhau.
4.2. So sánh hai mẫu kiểu cặp đôi
Xét thí dụ: với mỗi một ổ chim cân trọng lượng chim cái, trọng lượng chim đực, lúc
đó với n ổ chim ta được hai mẫu quan sát kiểu cặp đôi của hai tổng thể chim cái và chim
đực. Nếu lấy một số chim đực ngẫu nhiên trong nhiều chim đực từ nhiều ổ và lấy một số
chim cái ngẫu nhiên trong nhiều chim cái từ nhiều ổ thì có hai mẫu quan sát độc lập.
Trường hợp khác, nếu ta đem 10 mẫu đất, mỗi mẫu chia đôi, một nửa giao cho
phòng phân tích A thực hiện, nửa kia giao cho phòng phân tích B thì thu được số liệu cặp
đôi để so sánh kết quả của hai phòng phân tích. Nếu ta đem hai giống lúa cấy trên một số
ruộng, mỗi ruộng chia đôi, một nửa cấy giống A, một nửa cấy giống B thì cũng có hai mẫu
cặp đôi để so sánh. Tương tự, nếu đo một chỉ số sinh lý hoặc sinh hoá của một bệnh nhân
khi mới nhập viện và đo lại chỉ số đó sau một thời gian điều trị thì có hai mẫu quan sát cặp
đôi để đánh giá hiệu quả điều trị.

x 39.6 32.4 33.1 27 36 32 25.9 32.4
y 39.2 33.1 32.4 25.2 33.1 29.5 24.1 29.2
Thực hiện phân tích trong Excel ta được kết quả như trên bảng 3.
Bảng 3. Kết quả so sánh hai mẫu cặp đôi

x y Giải thích
Mean 32.3 30.725 Trung bình mẫu
Variance 19.54 23.451 Phương sai mẫu
Observations 8 8 Số quan sát
Pearson Correlation 0.96187 Hệ số tương quan R
Hypothesized Mean
Difference
0 Giả thuyết về hiệu số
trung bình
df 7 Bậc tự do
t Stat 3.31055 Giá trị t thực nghiệm
P(T<=t) one-tail 0.00647 Giá trị P một phía
t Critical one-tail 1.89458 Giá trị t lý thuyết khi
kiểm định một phía
P(T<=t) two-tail 0.01293 Giá trị P hai phía
t Critical two-tail 2.36462 Giá trị t lý thuyết khi
kiểm định hai phía
b. Phân tích kết quả
Bảng kết quả có hai cột cho hai mẫu quan sát. Bảng này có các hàng:
- Trung bình mẫu a
1
, a
2
.
- Phương sai mẫu s

một cách độc lập thì chúng ta có hai mẫu độc lập. Nếu dung lượng của cả hai mẫu đều lớn
(thường quy ước là n
1
≥ 30, n
2
≥ 30) ta có thể tiến hành z-test nhưng thay hai phương sai
của tổng thể
σ
1
2

và σ
2
2

bằng phương sai mẫu s
1
2
và s
2
2
. Trường hợp mẫu bé (n
1
,n
2
nhỏ hơn
30) thì ta gặp bài toán khó, gọi tên là bài toán Berens – Fisher. Trong trường hợp này, nếu
coi hai phương sai của hai tổng thể bằng nhau (cần kiểm định giả thuyết phụ về sự bằng
nhau của hai phương sai) thì có thể tiếp tục tính toán như sau:
a. Các bước thực hiện:

nghĩa
α (ngầm định 0.05). Kết quả cho giá trị xác suất P một phía là là 0.164 (P hai phía là
0.328) lớn hơn 0.05. Vậy giả thuyết hai phương sai tổng thể bằng nhau được chấp nhận.

15
Bảng 4. Kết quả so sánh hai mẫu độc lập với phương sai bằng nhau
t-Test: Two-Sample Assuming Equal Variances

x y
Mean 27.44 27.05
Variance 0.093 0.26571
Observations 5 8
Pooled Variance 0.20291
Hypothesized Mean
Difference
0
df 11
t Stat 1.5187
P(T<=t) one-tail 0.07852
t Critical one-tail 1.79588
P(T<=t) two-tail 0.15704
t Critical two-tail 2.20099
Hình 9 minh hoạ các bước thực hiện so sánh hai mẫu trong Excel khi hai phương
sai bằng nhau. Kết quả so sánh hai mẫu cho ở bảng 4.

Hình 9. Các bước thực hiện trong Excel so sánh hai mẫu cùng phương sai

16
b. Phân tích kết quả
Bảng kết quả thu được có hai cột cho hai mẫu quan sát, và lần lựơt có các hàng sau:


1)s
2
2
)/(n
1
+ n
2
−2).
- Giả thuyết về hiệu hai trung bình của hai tổng thể (Hypothesized means
difference).
- Bậc tự do df để kiểm định giả thuyết H
0
, df bằng (n
1
+ n
2


2).
- Giá trị t thực nghiệm tính theo công thức:
t = (a
1
− a
2
)/Sqrt(s
2
×(1/n
1
+ 1/n

2
. Người sử dụng có thể tự thực hiện
tính toán bằng kiểm định Fisher như sau:
- Bước 1: Tính F thực nghiệm bằng tỷ số giữa hai phương sai mẫu (lấy phương sai
lớn chia cho phương sai bé).
- Bước 2: So F thực nghiệm với F lý thuyết ở mức alpha, với số bậc tự do df
1
của
phương sai tử số và bậc tự do df
2
của phương sai mẫu số, bằng hàm FINV(alpha, df
1
, df
2
)).

17
Nếu F thực nghiệm bé hơn F lý thuyết thì dùng mô hình này (
σ
1
2
= σ
2
2
). Nếu trái lại, cần
chuyển sang mô hình phương sai khác nhau (
σ
1
2
≠ σ

2
+d (d là 1 số
nào đó) thì ghi d.
- Output Range: Chọn miền trống để đưa kết quả ra.
Ví dụ 8: Chúng ta dùng lại ví dụ 7, giả sử rằng hai phương sai tổng thể không
bằng nhau. Kết quả so sánh hai mẫu cho trong bảng 5.
b. Phân tích kết quả
Bảng kết quả thu được gồm hai cột cho hai mẫu quan sát và lần lượt có các hàng:
- Trung bình (Mean) mẫu a
1
, a
2
.
- Phương sai (Variance) mẫu s
1
2
, s
2
2
.
- Số quan sát (Observations) n
1
và n
2
.
- Giả thuyết về hiệu hai trung bình của hai tổng thể (Hypothesized means
difference).

18
Bảng 5. Kết quả so sánh hai mẫu phương sai không bằng nhau.

- Giá trị P một phía và hai phía.
- Các giá trị t lý thuyết một phía và hai phía.
Trong ví dụ trên ta có:
- Giá trị t một phía: 1.79588.
- Giá trị t hai phía: 2.20099.
- Giá trị P một phía: 0.05733.
- Giá trị P hai phía: 0.11466.
- t thực nghiệm
= 1.713325.
Chú ý rằng kết quả bảng 4 và 5 khác nhau ở giá trị t thực nghiệm (vì dùng công
thức khác khi tính phương sai chung), điều này kéo theo giá trị P một phía và hai phía cũng
khác. Theo kết quả trên giả thuyết H
0
vẫn được chấp nhận ở mức ý nghĩ 0.05 do t thực
nghiệm nhỏ hơn t lý thuyết một phía cũng như hai phía (giá trị P một phía và hai phía đều
lớn hơn mức ý nghĩa
α = 0.05).
V. Phân tích phương sai
Phân tích phương sai là công cụ chủ yếu để phân tích các số liệu khi theo dõi
ảnh hưởng của các nhân tố (factor) trong thí nghiệm và ảnh hưởng tương tác của chúng
lên một (hay nhiều) chỉ số đầu ra. Để thu thập số liệu, thí nghiệm cần được thiết kế phù
hợp với mục đích nghiên cứu và điều kiện cụ thể nơi tiến hành thí nghiệm. Để phân tích

19
một nhân tố, thí nghiệm thường được thiết kế theo kiểu hoàn toàn ngẫu nhiên, kiểu khối
ngẫu nhiên đầy đủ, hay ô vuông La tinh. Để phân tích hai nhân tố, thí nghiệm được bố trí
theo kiểu trực giao, kiểu chia ô lớn, ô vừa, ô nhỏ, hoặc kết hợp vừa chia băng vừa chia ô.
Từ ba nhân tố trở lên thì cần bố trí thí nghiệm sao cho mỗi nhân tố có hai mức hay mỗi
nhân tố có ba mức.


thực hiện trên n
i
ô thí nghiệm, các kết quả thực nghiệm x
ij
được coi như một mẫu thực
nghiệm đối với biến ngẫu nhiên X
i
. Dựa vào kết quả thực nghiệm cần đưa ra suy đoán về
việc các trung bình m
i
của các biến X
i
là như nhau (tức là các công thức không ảnh hưởng
gì đáng kể tới chỉ số cần khảo sát) hay là khác nhau. Có nhiều kiểu thiết kế thí nghiệm để
giải quyết bài toán này. Giả sử nhân tố có k mức, mức i được lặp lại n
i
lần, như vậy tổng
số có n =
∑ n
i
quan sát, hay còn nói là có n ô thí nghiệm. Nếu bố trí n ô thí nghiệm hoàn
toàn ngẫu nhiên ta có
thiết kế thí nghiệm hoàn toàn ngẫu nhiên (completely randomized
design). Khi tiến hành thí nghiệm kiểu này phải dùng n phiếu ghi từ 1 đến n, rút thăm ngẫu
nhiên n
1
phiếu để có các ô thí nghiệm đối với công thức 1, rút tiếp n
2
phiếu để có các ô thí
nghiệm đối với công thức 2, , n

.
Các
α
i
được coi là thoả mãn điều kiện
k
i
i1=
α

= 0.

20
a. Các bước thực hiện
Số liệu được điền theo cột hoặc theo hàng (nếu vào theo hàng thì mỗi hàng ứng
với một mức của nhân tố), ô đầu tiên ghi tên mức, các ô tiếp theo ghi số liệu. Chọn
Tools>
Data Analysis > Anova: Single Factor và khai báo:
- Input range: khai báo miền dữ liệu vào (một chữ nhật bao trùm toàn bộ các ô
chứa tên mức và toàn bộ các số liệu).
- Grouped by: Columns (số liệu theo cột) hoặc Rows (số liệu theo hàng).
- Label in First column: nhãn hàng đầu.
- Alpha: 0.05 (mức ý nghĩa
α).
- Output range: miền xuất kết quả ra.
b. Phân tích kết quả
- Kết quả in ra gồm các thống kê cơ bản cho từng mức (trung bình, độ lệch
chuẩn ) và bảng phân tích phương sai.
- Nếu giá trị xác suất P-value < alpha (hoặc F thực nghiệm > F lý thuyết) thì các
công thức có tác động khác nhau tới kết quả, ngược lại các công thức không có khác biệt

T 5 3 7.703 2.567667 0.084065
T 6 3 7.694 2.564667 0.122321
T 7 4 9.934 2.4835 0.296198
T 8 3 6.6 2.2 0.044469
T 9 4 8.164 2.041 0.037706
T 10 4 11.192 2.798 0.184963
T 11 4 4.949 1.23725 0.081114 ANOVA
Source of
Variation
SS df MS F P-value F crit
Between
Groups
15.1039 10 1.51039 8.54171 2.66E-06 2.1768
Within
Groups
5.1279 29 0.17682
Total 20.2319 39

22
Từ bảng 7 ta kết luận các công thức có tác động khác nhau tới năng suất lúa.
Giải thích: Như đã nói ở trên, phân tích phương sai một nhân tố tách biệt các
phương sai theo hai nguồn biến động nhân tố và sai số. Theo bảng 7, ta có:
- Tổng sai lệch giữa các nhóm do các mức của nhân tố tạo nên là SST (sum of
squares treatment) =
()
k
2

k
2
ij
i1 j1
xx
==

∑∑
= = 5.1279. Do đó tổng sai lệch trung
bình trong từng nhóm là MSSE = SSE/ (n
−k) = 5.11279/ 29 = 0.12682.
ii
2
nn
kk
2
ij ij i
i=1 j=1 i 1 j 1
xx
==
⎛⎞⎛⎞

⎜⎟⎜⎟
⎝⎠⎝⎠
∑∑ ∑ ∑
/n
Với các giả thiết đã nêu, có thể chứng minh được đại lượng thống kê F =
MSST/MSSE (đối với mẫu lý thuyết) tuân theo phân phối Fisher với bậc tự do là (k
−1,
n

j
lần lặp) người dùng có thể tự tính thêm LSD (Least Significance
Difference) theo công thức LSD = t
α,df
× SQRT(s
2
(1/n
i
+ 1/n
j
)), trong đó s
2
là phương sai

23
chung được ước lượng bởi trung bình sai số bình phương trong nội bộ nhóm (MS within
groups),
α = 1 − p, và t
α , df
là giá trị t của bảng Student ứng với mức ý nghĩa α và df bậc tự
do. t
α , df
có thể tìm được bằng cách tra bảng số hay bằng hàm TINV trong Excel.
Trong ví dụ 9, để so sánh ảnh hưởng của thuốc T1, T2 đến năng suất lúa, trước hết
cần tính trị tuyệt đối | m
1
− m
2
| của hiệu các năng suất trung bình m
1

gần sát 0) và trường hợp A và B tương tác (nếu trái lại). Phân tích phương sai một nhân tố
bố trí kiểu khối ngẫu nhiên đầy đủ được coi là trường hợp riêng của phân tích phương sai
hai nhân tố không tương tác (nhân tố khối là nhân tố thứ hai không tương tác với nhân tố
thứ nhất).

Thiết kế thí nghiệm theo khối ngẫu nhiên đầy đủ RCBD.
Giả sử có k công thức,
mỗi công thức lặp lại r lần. Tất cả có n = k
×r ô thí nghiệm. Để tránh các tác động của một
số yếu tố ngoại cảnh lên kết quả đầu ra của một số công thức nào đó, chúng ta cần bố trí
các ô thí nghiệm một cách hợp lý. Trong điều kiện không có đủ n ô thí nghiệm đồng đều,
cần thiết kế thí nghiệm bằng cách chia thí nghiệm thành r khối với k ô trong mỗi khối
tương đối đồng đều về mọi mặt sao cho các tác động phụ không ảnh hưởng tới thí nghiệm.
Sau đó, xét khối thứ nhất và làm k phiếu để bắt thăm xem k công thức xếp vào k ô nào.
Tiếp tục bắt thăm cho khối thứ hai, thứ ba, . . . cho tới khối thứ r.
Việc chia khối thí nghiệm nói chung phụ thuộc vào địa điểm thí nghiệm. Chẳng
hạn, cần chia khối thẳng góc với một hướng biến động có ảnh hưởng đến kết quả thí
nghiệm như hướng gió, hướng chảy của nước ngầm, hướng nắng, hướng dốc, hướng thay
đổi của độ phì của đất sao cho mỗi công thức có mặt một lần ở một mức của biến động.
Việc chia khối thí nghiệm cũng có thể phụ thuộc vào thời gian tiến hành thí nghiệm với các
tác động của thời tiết. Nếu mỗi ngày chỉ làm được k thí nghiệm và ta chỉ có r ngày để làm

24
tất cả các thí nghiệm, thì cần phải phân chia việc thực hiện các thí nghiệm ra r ngày, như
vậy ở đây ngày là khối.
Một cái lợi nữa là trong thiết kế thí nghiệm RCBD có thể chọn khối khác nhau về
không gian hoặc khác nhau về thời gian (nhưng không được khác nhau quá xa đến mức có
sự thay đổi điều kiện thí nghiệm). Do đó, kết luận rút ra có tính khái quát cao hơn khi so
với kết luận đạt được trong thiết kế thí nghiệm hoàn toàn ngẫu nhiên (tập trung toàn bộ các
thí nghiệm vào một nơi hay cùng một thời gian).

j
được coi là thoả mãn điều kiện
k
i
i1=
α

=
r
j
j1=
β

= 0.
a. Các bước thực hiện
Khi phân tích phương sai hai nhân tố không tương tác, số liệu cần được sắp xếp
theo cách sau: hàng là các mức của nhân tố thứ nhất, cột là các mức của nhân tố thứ hai
(trong trường hợp cần phân tích phương sai một nhân tố bố trí kiểu khối ngẫu nhiên thì
hàng là các mức của nhân tố, cột là các khối ngẫu nhiên).
Chọn
Tools >Data Analysis >Anova: Two Factor Without Replication sau đó khai
báo tiếp các thông tin trong hình 11 và kích OK.

Hình 11. Hộp thoại khai báo để phân tích phương sai không tương tác
Ví dụ 10: Bố trí thí nghiệm phân tích nhân tố 1 (có bốn mức) theo khối ngẫu nhiên đầy đủ
(nhân tố 2 có bốn khối), ta thu được các số liệu như trong bảng 9.

25


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status