BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ NÔNG NGHIỆP VÀ PTNT
TRƯỜNG ĐẠI HỌC LÂM NGHIỆP
------------------------
NGUYỄN VIỆT HƯNG
Ph©n tÝch vµ xö lý sè liÖu
cho mét sè m« h×nh thÝ nghiÖm th«ng dông
trong l©m nghiÖp víi sù trî gióp cña phÇn
mÒm SPSS vµ phÇn mÒm R
LUẬN VĂN THẠC SỸ KHOA HỌC LÂM NGHIỆP
NGƯỜI HƯỚNG DẪN KHOA HỌC:
GS. TS. NGUYỄN HẢI TUẤT
Hà Nội - 2011
1
ĐẶT VẤN ĐỀ
Ứng dụng công nghệ tin học đóng vai trò quan trọng trong nghiên cứu, quản lý
tài nguyên thiên nhiên. Thông qua phân tích, thống kê dữ liệu trên các phần mềm
giúp chúng ta hệ thống hóa cơ sở dữ liệu, đánh giá các thí nghiệm, phân tích các
mối quan hệ phức tạp trong tự nhiên và với các nhân tố xã hội để tìm ra quy luật
nhằm quản lý bền vững hoặc đưa ra được những phát hiện mới.
phát triển (và ngay cả ở một số nước đã phát triển) không có khả năng tài chính để
sử dụng chúng một cách lâu dài. Do đó, các nhà nghiên cứu thống kê trên thế giới
đã hợp tác với nhau để phát triển một phần mềm mới, với chủ trương mã nguồn mở,
sao cho tất cả các thành viên trong ngành thống kê học và toán học trên thế giới có
thể sử dụng một cách thống nhất và hoàn toàn miễn phí.[17]. Phần mềm hoàn toàn
miễn phí được nói tới ở đây chính là phần mềm R.
Xuất phát từ những lý do trên, tôi đã tiến hành thực hiện đề tài: “Phân tích và
xử lý số liệu cho một số mô hình thí nghiệm thông dụng trong lâm nghiệp với sự
trợ giúp của phần mềm SPSS và phần mềm R” làm luận văn tốt nghiệp. Kết quả
nghiên cứu của đề tài sẽ giúp cho công tác xử lý, phân tích số liệu một số mô hình
thí nghiệm thông dụng trong lâm nghiệp được rút ngắn và có tính hoa học hơn.
3
Chương 1
TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU
1.1. Tổng quan về các nghiên cứu thí nghiệm trong lâm nghiệp
Theo nghĩa rộng của quan điểm triết học duy vật: “Thí nghiệm là một phần
của sự nghiệp sản xuất trong xã hội loài người, nhằm khám pháp ra các quy luật
khách quan của thế giới vật chất với mục đích nắm vững và bắt các điều bí mật của
thiên nhiên phục vụ cho cuộc sống con người”. [1]
Như chúng ta đã biết, từ cổ xưa loài người đã phải kiếm ăn để sinh sống, do
đó, con người phải biết lựa chọn, so sánh để tìm kiếm thức ăn. Song cũng chính từ
đó mà họ đã tạo ra một kho tàng các kinh nghiệm quý báu thúc đẩy xã hội phát
triển. Khi xã hội tiến lên đòi hỏi con người cũng phải nắm bắt, vận dụng các quy
luật khách quan của tự nhiên có hiệu quả hơn. Muốn làm được điều này cần phải có
phương pháp và từ đó phương pháp thí nghiệm ra đời. [1]
Nghiên cứu khoa học nói chung và khoa học lâm nghiệp nói riêng hay cụ thể
hơn là nghiên cứu khoa học trong lĩnh vực lâm học phụ thuộc rất mật thiết với điều
như: hóa chất, các máy móc phân tích, các bình, hộp, khay đựng. Nhóm các thí
nghiệm này hầu như độc lập với điều kiện tự nhiên của môi trường bên ngoài. Cho
nên các kết quả từ các thí nghiệm này được kiểm tra, điều khiển bằng các dụng cụ
có độ chính xác cao. Tuy nhiên, những số liệu này chưa được áp dụng vào thực tế.
Bởi vì, ở những môi trường nghiên cứu khác mà nhất là trên thực địa thì có rất
nhiều nhân tố sinh thái ảnh hưởng tới sinh vật (cây trồng). Hơn nữa, có nhiều nhân
tố khó có thể kiểm soát cụ thể và chính xác.
2. Nhóm thí nghiệm trong vườn ươm
Các thí nghiệm thuộc nhóm phương pháp nghiên cứu này có đối tượng
nghiên cứu là các cây trồng được gieo trồng trên bầu, túi, chậu... trong vườn ươm,
nhà lưới, nhà kính. Về điều kiện thì đối với nhóm này cây trồng đã được sống trong
một phần là điều kiện tự nhiên, còn một phần là điều kiện nhân tạo.
3. Nhóm thí nghiệm bố trí thực địa
Trong ngành nông nghiệp phương pháp này được gọi là nghiên cứu trên
“đồng ruộng”. Nhóm nghiên cứu này bao gồm những thí nghiệm mà cây trồng được
sống trong điều kiện tự nhiên. Do đó, nó chịu sự chi phối của nhiều nhân tố (gọi là
5
các nhân tố sinh thái) từ môi trường bên ngoài, những nhân tố đó là: Điều kiện thời
tiết, đất đai, các biện pháp kỹ thuật lâm sinh.... Loại thí nghiệm này có ưu điểm là:
- Số lượng cá thể lớn (dung lượng mẫu lớn)
- Gần với điều kiện sản xuấtCũng qua những kết quả thí nghiệm trên thực địa có
thể nhận định rõ thêm kết quả và kết luận của thí nghiệm trong phòng vàvườn ươm.
Những kết quả của thí nghiệm trên thực địa sẽ được coi là cơ sở xây dựng biện pháp kỹ
thuật cho quy trình sản xuất và thâm canh cây trồng, đối với các thí nghiệm về giống,
các sản phẩm từ các mô hình thí nghiệm có thể là nguyên liệu cho một thí nghiệm cải
tiến giống khác hoặc là nguyên liệu phục vụ cho sản xuất cây giống.
1.2. Một số kiểu thiết kế thí nghiệm và vận dụng mô hình thí nghiệm trong lâm nghiệp
6 (C)
7 (D)
8 (A)
9 (B)
10 (C)
11 (B)
12 (C)
13 (B)
14 (D)
15 (A)
16 (A)
17 (B)
18 (D)
19 (D)
20 (A)
Từ số liệu điều tra sinh trưởng của các xuất xứ tác giả đã sử dụng phần mềm SPSS
để lựa chọn ra xuất xứ tốt và từ đó dựa vào chỉ tiêu sinh trưởng và độ tuổi của cây
chọn ra những cây trội phục vụ công tác chọn giống. Trong nghiên cứu này tác giả
đã không áp dụng các biện pháp thống kê để chọn lọc cây trội mà chỉ sử dụng các
chỉ tiêu sinh trưởng để lựa chọn. Điều này đã làm cho kết quả nghiên cứu thiếu tính
thuyết phục.
Nghiên cứu về xuất xứ Mây nếp, tác giả Nguyễn Minh Thanh đã tiến hành
trồng thử nghiệm 5 xuất xứ mây nếp trên các vùng sinh thái khác nhau. Từ đó thu
thập và xử lý số liệu về đặc điểm sinh trưởng và phát triển của cây Mây nếp bằng
SPSS để tìm ra xuất xứ nào tốt nhất bằng cách so sánh sinh trưởng của các xuất xứ
với nhau tại hai khu vực nghiên cứu là Hà Giang và Hòa Bình. Kết quả xử lý cho
thấy xuất xứ Mây nếp từ Thái Bình là xuất xứ tốt nhất. Ngoài ra, dựa vào tính năng
xây dựng phương trình hồi quy tuyến tính nhiều lớp của phần mềm SPSS, tác giả đã
đưa ra phương pháp phân chia điều kiện lập địa thích hợp cho loài Mây nếp tại khu
vực nghiên cứu.[8]
1.2.2. Thiết kế thí nghiệm theo kiểu khối ngẫu nhiên đầy đủ (RCBD hay RCB).
Trong ngành lâm nghiệp rất ít gặp trường hợp bố trí thí nghiệm hai nhân tố
và có một lần quan sát ở mỗi tổ hợp cấp của nhân tố. Vì những thí nghiệm như vậy
thường không đủ thông tin để đánh giá kết quả của thí nghiệm. Muốn tăng thêm
lượng thông tin thường mỗi tổ hợp cấp của hai nhân tố phải có nhiều lần lặp lại thí
nghiệm. Người ta gọi cách bố trí thí nghiệm theo phương pháp này là thiết kế thí
nghiệm theo kiểu khối ngẫu nhiên đầy đủ. Trong bố trí thí nghiệm theo kiểu này,
nhân tố A là những công thức thí nghiệm cần theo dõi, nhân tố B là các khối. Việc
phân bố các công thức thí nghiệm trong mỗi khối thường theo nguyên tắc ngẫu
nhiên hay hệ thống.
Có thể mô tả kiểu thiết kế khối ngẫu nhiên đầy đủ như sơ đồ sau:
8
cây/hố và mức độ bón phân khác nhau. Tác giả đã bố trí thí nghiệm theo kiểu khối
ngẫu nhiên đầy đủ. Tuy nhiên, trong quá trình nghiên cứu, do nhiều nguyên nhân
khác nhau, tác giả đã chuyển công thức thí nghiệm hai nhân tố thành một nhân tố đó
là chỉ nghiên cứu công thức trồng mà không nghiên cứu tới chế độ bón phân. Công
thức thí nghiệm đã cho ra kết quả: Mây nếp sinh trưởng tốt nhất tại công thức trồng
3 cây/hố.[8].
1.2.3. Thiết kế thí nghiệm theo kiểu ô vuông la tinh
Đây là dạng thiết kế phục vụ cho phân tích phương sai 3 nhân tố. Trong
trường hợp bố trí theo khối thì số công thức có thể nhiều hoặc ít hơn số khối và khi
phân tích người ta có thể bỏ qua sự khác nhau giữa các nên đất mà trên đó tiến hành
làm các thí nghiệm khác nhau. Trong trường hợp số khối luôn luôn bằng số công
thức thí nghiệm (số lần lặp lại bằng số công thức thí nghiệm) ta gọi là bố trí theo ô
vuông la tinh. Chẳng hạn thí nghiệm có thể bố trí theo sơ đồ sau:
Khối
Khối 1
Khối 2
Khối 3
Khối 4
Khối 5
Khối 6
(1)
(2)
(3)
(4)
(5)
1
2
3
6
5
4
3
2
1
Ở sơ đồ trên ta có 6 khối: (1), (2), (3), (4), (5), (6) nằm ngang mà mỗi khối
chia làm 6 ô đều nhau. Trên mỗi ô này tiến hành một công thức khác nhau. Vị trí
của các thí nghiệm được bố trí trên các ô theo một cách nào đó sao cho trong một
hàng và trong một cột không có sự trùng lặp một công thức. Để xác định được sai
số của thí nghiệm khi phân tích người ta phải loại trừ những biến động do các khối
10
và các cột gây nên, chỉ còn biến động do các công thức khác nhau đưa lại (không có
ảnh hưởng qua lại).
Mô hình thiết kế thí nghiệm theo kiểu ô vuông la tinh thường được sử dụng
trong việc phân tích thí nghiệm có số lượng mẫu bị hạn chế và sự đồng đều không cao.
[2]. Trong các đề tài nghiên cứu tại Việt Nam hiện chưa có mô hình thí nghiệm theo
kiểu ô vuông la tinh một cách điển hình. Đây là một trong những khó khăn trong việc
tham khảo và xây dựng quy trình xử lý phân tích dữ liệu trong luận văn này.
Như vậy, có thể thấy rằng trong hầu hết các lĩnh vực của lâm nghiệp, bao
gồm từ trồng rừng, kỹ thuật lâm sinh, nhân giống đều có thể sử dụng biện pháp thí
nghiệm và cách bố trí thí nghiệm khác nhau. Với đặc điểm thí nghiệm có dung
lượng mẫu lớn, việc xây dựng quy trình xử lý hợp lý sẽ làm cho việc xử lý số liệu
đơn giản, nhanh chóng hơn, chính xác hơn. Xây dựng quy trình xử lý số liệu còn có
tác động ngược lại đối với việc bố trí và thiết kế thí nghiệm bởi dựa vào quy trình
xử lý này sẽ khiến cho việc lựa chọn bố trí thí nghiệm ngoài thực địa được chính
là chênh lệch do ảnh hưởng của mức j của nhân tố B (trên
-
là chênh lệch do ảnh hưởng của khối l;
ô nhỏ);
-
là tương tác giữa nhân tố A và khối được dùng làm sai
-
là tương tác của 2 nhân tố A và B
-
là sai số độc lập phân phối chuẩn N (0,
số ô lớn
)
Thí nghiệm hai nhân tố chia ô thích hợp để nghiên cứu ảnh hưởng của 2 nhân
tố bố trí theo cách sau:
Nguyên vật liệu thí nghiệm chia thành một số các ô lớn và các mức của yếu
tố thứ nhất được bố trí ngẫu nhiên vào các ô lớn. Sau đó, mỗi ô lớn lại được chia
thành các ô con và các mức của yếu tố thứ 2 được bố trí vào các ô con.
Mô hình thí nghiệm hai nhân tố chia ô được sử dụng khi một yếu tố cần
13
Kiểu thiết kế này giống như kiểu mô hình chia ô chính ô phụ, sự khác biệt
của thí nghiệm này đối với kiểu mô hình ô chính ô phụ đó là người ta tiến hành thiết
kế để một yếu tố được bố trí ngẫu nhiên trên các ô lớn. Ví dụ yếu tố thứ nhất (A) có
4 mức (A1, A2, A3, A4) được bố trí ngẫu nhiên trên 12 ô lớn. Mỗi mức của yếu tố A
được lặp lại 3 lần. Yếu tố thứ 2 (B) có 2 mức (B1, B2). Mỗi ô lớn được chia thành 2
ô con để bố trí ngẫu nhiên các mức của yếu tố B. Đây chính là mô hình thí nghiệm 2
nhân tố kiểu chia ô hoàn toàn ngẫu nhiên. Mô hình bố trí thí nghiệm có thể được mô
phỏng như hình vẽ sau:
Hình 1.6: Sơ đồ bố trí thí nghiệm theo kiểu chia khối ngẫu nhiên
Mô hình toán học của kiểu thí nghiệm này được mô phỏng như sau:
xijl = m + ai + ok(i) + bj + (ab)ij + eijl ; (i = 1, a; j = 1, b; k = 1, r)
Trong mô hình này hai nhân tố A và B coi như nhân tố cố định. Các tổng
bình phương của yếu tố A, B, tương tác AB, sai số ngẫu nhiên (sai số bé) và các bậc
tự do được tính tương tự như phương pháp ô chính ô phụ.
1.3. Tổng quan về ứng dụng phần mềm thống kê SPSS và R
1.3.1. Ứng dụng phần mềm SPSS
Trên thế giới, đã có rất nhiều phần mềm máy tính chuyên dụng về xử lý thống
kê các số liệu thực nghiệm, trong đó có SPSS (Statistical Package for Social Sciences).
Tuy là một phần mềm xử lý thống kê chuyên dụng nhưng SPSS lại khá dễ sử dụng và
đang được ứng dụng rộng rãi trên thế giới do có giao diện thân thiện với người dùng,
các thủ tục phân tích thống kê đơn giản, cho kết quả nhanh và đáp ứng được yêu cầu
phân tích thống kê cơ bản và cả những kết quả đáp ứng các yêu cầu phân tích chuyên
sâu về mặt thống kê. Ở Việt nam, việc sử dụng các phần mềm thống kê cũng như SPSS
trong xử lý số liệu đã được áp dụng trong những năm gần đây.
1. Về quản lý dữ liệu
15
SPSS có một bộ soạn thảo dữ liệu tương tự như excel, bộ soạn thảo cho phép vào
các dữ liệu và mô tả các thuộc tính của chúng, tuy nhiên SPSS không có những
công cụ quản lý dữ liệu thật mạnh (mặc dù SPSS phiên bản 11 có thêm các lệnh
chuyển cấu trúc dữ liệu theo chiều ngang thành cấu trúc dữ liệu theo chiều dọc và
ngược lại). SPSS xử lý mỗi file dữ liệu ở một thời điểm và không phải là rất mạnh
khi thực hiện các nhiệm vụ phân tích cần làm việc với nhiều file dữ liệu cùng một
lúc. Các file dữ liệu có thể có đến 4096 biến và số lượng bản ghi chỉ bị giới hạn
trong dung lượng của đĩa cứng.
Các báo cáo thống kê trên tập số liệu cở sở hết sức đa dạng và linh hoạt với
nhiều chiều phân tổ khác nhau và dễ dàng thực hiện không phải lập trình. Các bảng
biểu, các báo cáo được trình bày đẹp, chất lượng cao được thực hiện trên cửa sổ, có
thể tiếp tục hiệu chỉnh, in ra hoặc chuyển sang tài liệu khác.
2. Về phân tích thống kê
Một trong những công việc thường xuyên phải làm đối với cán bộ nghiệp vụ
thống kê là tổng hợp số liệu theo các biểu bảng đã thiết kế trước đối với số liệu thu
được. Nếu ai đã từng sử dụng SPSS và STATA, đều thấy rằng khả năng lập các
biểu bảng số liệu tổng hợp, các báo cáo thống kê trên tập số liệu cơ sở trong SPSS
là hết sức đa dạng và linh hoạt với nhiều chiều phân tổ khác nhau và dễ dàng thực
hiện không phải lập trình. Các bảng biểu, các báo cáo được trình bày đẹp, chất
lượng cao được hiện trên cửa sổ, có thể tiếp tục hiệu chỉnh, in ra hoặc chuyển sang
các tài liệu khác. Đây là một ưu điểm nổi bật của SPSS, vì để lập trình tạo ra một
biểu bảng như ý là một công việc hết sức tỉ mẩn và nặng nhọc.
Sức mạnh lớn nhất của SPSS là lĩnh vực phân tích phương sai (SPSS cho
phép thực hiện nhiều loại kiểm định tác động riêng biệt) và phân tích nhiều chiều
(thí dụ phân tích phương sai nhiều chiều, phân tích nhân tố, phân tích nhóm tổ).
học, nhất là ở các nước còn nghèo khó như nước ta, cần phải học cách sử dụng R
cho phân tích thống kê và đồ thị. [16,17,18]
* Những ưu điểm chính của R
- R là ngôn ngữ lập trình miễn phí: Để phân tích thống kê hay lập trình có
thể có sử dụng nhiều phần mềm hay ngôn ngữ khác nhau (như SAS, SPSS, Stata,
Fortran, C#,…) Tuy nhiên, phần lớn những phần mềm này không phải là miễn phí.
Do vậy nếu sử dụng R để giảng dạy cho sinh viên thì sau khi sinh viên ra trường,
sinh viên có thể tiếp tục tiếp cận với phần mềm và sử dụng trong công việc. Nếu
17
giảng dạy bằng một phần mềm giữ bản quyền như SAS (nếu nhà trường có mua
quyền sử dụng) thì sau khi sinh viên tốt nghiệp, không thể ứng dụng được nếu luật
bảo vệ sở hữu trí tuệ được thực thi. R hiện nay được coi là chuẩn trên thực tế (de
factor standard) để giảng dạy về thống kê.
- R là ngôn ngữ lập trình nguồn mở: R là một thành phần của GNU project
(dự án hợp tác đại trà và phần mềm miễn phí). Mã nguồn của R cung cấp miễn phí
cho tất cả mọi người tuân theo giấy phép công cộng chung GNU (GNU General
Public License), và phiên bản nhị phân trước khi biên dịch được cung cấp cho nhiều
hệ điều hành khác nhau. Do là phần mềm nguồn mở, có đến 2000 người đóng góp
vào việc xây dựng phần mềm và có đến 2 triệu người dùng. Là nguồn mở nên việc
phát triển R rất linh hoạt và cho phép tích hợp R với các hệ thống khác nhau và với
các phần mềm sử lí số liệu khác nhau. R được sử dụng bởi ngân hàng Hoa Kì (Bank
of America), New York Times, Face book và Google cũng như phần lớn các công
ty đứng hàng đầu của Mỹ. Dù một cá nhân sử dụng R cho bất kì mục đích gì luôn
luôn có ai đó có cùng mục đích sử dụng và có thể trao đổi, giúp đỡ nhau cùng thực
hiện mục tiêu của mình. Luôn luôn có những gói phần mềm, trao đổi, hướng dẫn sử
dụng R xuất hiện mới mỗi ngày hoặc mỗi tuần. Các diễn đàn của cộng đồng sử
dụng R phổ biến nhất là Crantastic, Stackoverflow, revolutions blog, R-bloggers...
chức đồ, phân tán đồ, mặt 3 chiều, bản đồ,…
R là ngôn ngữ lập trình chuyên dụng cho chuyên viên thống kê: R có thể tiến
hành các thuật toán thống kê chuẩn như tính toán trung bình, độ lệch chuẩn, phương
sai, hiệp phương sai, hồi quy, ANOVA, phân tích sống còn, GLM, GAM, mạng
thần kinh. Ngoài các phương pháp thống kê kinh điển, R vượt qua các phần mềm
khác để ứng dụng trong các phương pháp tính toán hiện đại nhất (thí dụ như để
phân tích hệ gen – genomics, xác định các biến dị của DNA người,…).
* Những nhược điểm chính của R
R cũng có một số nhược điểm hay có thể gọi là thiếu sót, tuy nhiên các
nhược điểm này có thể được khắc phục dễ dàng bởi chính R :
- R không phải là một cơ sở dữ liệu nhưng lại có thể kết nối với các hệ quản
trị cơ sở dữ liệu (DBMS)
19
- R không có giao diện đồ họa người dùng, nhưng nó có thể kết nối với Java,
TclTk.
- Việc diễn giải ngôn ngữ R có thể rất chậm, nhưng có thể cho phép gọi tới
các mã C hoặc C++.
- R không có các bảng tính quan sát dữ liệu, nhưng nó có thể kết nối với
Excel/MSOffice.
- Mỗi câu lệnh của R kết thúc bằng phím Enter, điều này gây ra sự bất tiện
trong khi lâp trình, đặt biệt là khi xây dựng một hàm, chỉ cần sai một dòng lệnh, ta
sẽ phải làm lại từ đầu.
- Một nhược điểm khác của R là nó không chuyên nghiệp và không hỗ trợ
thương mại .
1.4. Thảo luận về tổng quan vấn đề nghiên cứu
Có thể thấy rằng: hầu hết các nghiên cứu khoa học trong lâm nghiệp mà đặc
biệt là trong các lĩnh vực về chọn giống, trồng rừng và lâm sinh thường sử dụng thí
sau tiếp tục tiến hành nghiên cứu.
21
Chương 2
MỤC TIÊU, GIỚI HẠN, NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Mục tiêu nghiên cứu
2.1.1. Mục tiêu chung
- Góp phần đơn giản tính toán và xử lý, phân tích thống kê trong lâm nghiệp
2.1.2. Mục tiêu cụ thể
- Xây dựng được các quy trình xử lý và phân tích dữ liệu bằng SPSS trong
một số thí nghiệm điển hình, thông dụng trong lâm nghiệp.
- Đưa ra phương pháp bố trí thí nghiệm hợp lý cho một số thí nghiệm trong
lâm nghiệp.
2.2. Phạm vi và giới hạn của đề tài
2.2.1. Đối tượng nghiên cứu
Đối tượng nghiên cứu của đề tài chủ yếu là rừng trồng, các mô hình thí nghiệm
trong lâm nghiệp trong các lĩnh vực lâm sinh, trồng rừng, nghiên cứu giống...
2.2.2. Giới hạn mô hình nghiên cứu
Đề tài chỉ tập trung nghiên cứu phân tích số liệu sẵn có và đưa ra quy trình
phân tích số liệu bằng phần mềm SPSS cho các mô hình thí nghiệm mà không đi
sâu vào nghiên cứu và phân tích đặc điểm mô hình thí nghiệm và so sánh các mô
hình với nhau.
2.3. Nội dung nghiên cứu
Để thực hiện được mục tiêu nghiên cứu, đề tài tiến hành các nội dung nghiên
2.4.2.1. Thu thập số liệu phục vụ tính toán
- Thu thập dữ liệu thực tế phù hợp với các nội dung nghiên cứu trên
- Sử dụng, kế thừa các dữ liệu có sẵn thỏa mãn mục tiêu nghiên cứu, từ các
nguồn dữ liệu của Viện Điều tra Quy hoạch rừng, Viện Khoa học Lâm nghiệp, Viện
Sinh thái rừng và Môi trường - Trường Đại học Lâm nghiệp.
2.4.2.2. Nội nghiệp
- Đọc, tham khảo các tài liệu, nghiên cứu ứng dụng các phần mềm có liên quan.
- Tiến hành các hội thảo tư vấn chuyên môn, đặc biệt tư vấn về phần mềm
SPSS: Lựa chọn một số nội dung khó trong phần mềm SPSS đưa ra thảo luận dưới
dạng các hội thảo chuyên môn, với sự tham gia của các chuyên gia giỏi.
- Tham khảo các ý kiến chuyên gia trong lĩnh vực thống kê.
23
- Xây dựng các quy trình kỹ thuật trên phần mềm SPSS thực hiện các nội dung
nghiên cứu trên: Trong SPSS đã cung cấp nhiều thủ tục xử lý và phân tích dữ liệu. Tuy
nhiên trình tự logic thực hiện các thủ tục phân tích cho những vấn đề cụ thể lại do
người sử dụng lựa chọn. Do đó chất lượng xử lý và phân tích dữ liệu phụ thuộc rất
nhiều vào trình độ của người sử dụng, đặc biệt trình độ hiểu biết của người sử dụng về
cơ sở toán học thống kê, về tin học và các thuật ngữ chuyên môn sử dụng trong phần
mềm. Việc xây dựng các quy trình kỹ thuật thực hiện các bước xử lý và phân tích cho
những vấn đề nghiên cứu nêu trên chính là để khắc phục hạn chế này.
2.4.3. Phương pháp phân tích số liệu
2.4.3.1. Phân tích số liệu cho mô hình thí nghiệm ngẫu nhiên hoàn toàn
Việc phân tích số liệu cho mô hình thí nghiệm thiết kế ngẫu nghiên là phân
tích phương sai một nhân tố. Các bước phân tích số liệu được mô tả như sau:
Giả sử nhân tố A được chia a cấp khác nhau và trong mỗi cấp thí nghiệm
được lặp lại một cách ngẫu nhiên ni lần (
Xij =
Trong đó:
(1)
-
là số trung bình chung của tổng thể đối với tất cả các cấp
-
là tham số đặc trưng ảnh hưởng tới nhân tố A (
)
Nếu nhân tố A có tác động đồng đều (ngẫu nhiên) đến kết quả thí nghiệm thì
= 0 ở tất cả các cấp. Và giả thuyết H0 được cho là:
hoặc
H0 :
H1: Có ít nhất 1
Giả thuyết H1 nói lên rằng tác động của nhân tố A là không đồng đều tới tất
cả các cấp còn
là một biến ngẫu nhiên độc lập có phân bố chuẩn như điều kiện đã
ở trên đã nói. Nó đặc trưng cho sai số thí nghiệm.
Tiến hành phân tích phương sai cho thí nghiệm ta được bảng phân tích
phương sai. Kết quả phân tích phương sai được thể hiện như bảng sau:
2
F
(5)
S a/ S2N
Xác suất
của F (.Sig)
(6)
2
2.4.3.2. Phân tích số liệu cho mô hình thí nghiệm kiểu khối ngẫu nhiên đầy đủ
Trong mô hình thí nghiệm khối ngẫu nhiên đầy đủ, người ta thường coi khối
thí nghiệm (hay lần lặp) là một nhân tố. Chính vì vậy khi nói phân tích phương sai
hai nhân tố cần phải hiểu nhân tố ở đây bao gồm một nhân tố thí nghiệm và một
nhân tố là khối thí nghiệm. Trong trường hợp có 2 nhân tố thí nghiệm trong mô