bài giảng về ứng dụng tin học trong thiết kế thí nghiệm và xử lý số liệu - Pdf 16

TRƯỜNG ĐẠI HỌC NÔNG LÂM HUẾ
DỰ ÁN HỢP TÁC VIỆT NAM – HÀ LAN BÀI GIẢNG
NGHIÊN CỨU CHUYÊN SÂU Người biên soạn: PGS.TS Nguyễn Minh Hiếu

HUẾ, 2008

2

MỤC LỤC
MỞ ĐẦU 2
BÀI I: NHẬP SỐ LIỆU 4
1.1. Nguyên tắc của nhập số liệu 4
1.2. Nhập số liệu trong trường hợp số liệu không phân nhóm/tổ 4
1.3. Nhập số liệu trong trường hợp số liệu phân tổ bởi một nhân tố 5
1.4. Nhập số liệu trong trường hợp số liệu phân tổ bởi hai nhân tố 6
1.5. Nhập số liệu trong các kiểu thiết kế thí nghiệm có sự khống chế sự sai khác ban đầu
7
BÀI 2. KIỂM TRA SỐ LIỆU VÀ ĐỊNH HƯỚNG PHÂN TÍCH 10
2.1. Kiểm tra số liệu bằng trình ứng dụng filter trong EXCEL 11
2.2. Kiểm tra số liệu bằng trình ứng dụng Box-plot hoặc Scatter Plot trong SPSS 14
BÀI 3. PHÂN TÍCH THỐNG KÊ MÔ TẢ 19
3.1. Phân tích thống kê mô tả trong trường hợp tập hợp số liệu không phân nhóm 20
3.2. Phân tích thống kê mô tả trong trường hợp tập hợp số liệu phân nhóm 21
BÀI 4. PHÂN TÍCH PHƯƠNG SAI 23
BÀI 5. PHÂN TÍCH PHƯƠNG SAI CHO CÁC KIỂU THIẾT KẾ THÍ NGHIỆM
KHÁC NHAU 28
5.1. Nguyên tắc của phân tích số liệu của thiết kế thí nghiệm RCB và LSD 28
5.2. Phân tích số liệu từ thí nghiệm kiểu RCB 29
5.3. Phân tích số liệu từ thí nghiệm kiểu LSD 34
BÀI 6. ÁP DỤNG QUY TẮC NGẪU NHIÊN TRONG THIẾT KẾ THÍ NGHIỆM VỚI
MỘT NHÂN TỐ 39
6.1. Ngẫu nhiên hóa trong thiết kế thí nghiệm kiểu CRD và RCB 39

đúng khi làm việc với một tập hợp số liệu lớn, ví dụ số liệu điều tra. Hiểu bản chất của
thiết kế thí nghiệm và xử lý số liệu là đặc biệt quan trọng. Quá trình thiết kế thí nghiệm
và xử lý số liệu sẽ nhanh hơn, chính xác hơn và thú vị hơn nếu chúng ta có thể ứng
dụng tin học vào phân tích số liệu thay vì tính toán đơn thuần.
Hiện nay có rất nhiều phần mềm giúp cho quá trình xử lý số liệu. Nếu chúng ta
sử dụng các phần mềm để phân tích kết quả thì luôn luôn có kết quả. Vấn đề cơ bản là
kết quả đó đúng hay sai, kết quả đó nói lên điều gì. Quả là không thừa khi nhấn mạnh
rằng chúng ta phải hiểu được bản chất của thiết kế thí nghiệm và xử lý số liệu trước khi
ứng dụng công nghệ thông tin. Tất cả các kiến thức về bản chất của thiết kế thí nghiệm
và xử lý số liệu được đề cập trong học phần phương pháp thí nghiệm. Trong phạm vi
của học phần này chúng tôi đề cập đến việc vận dụng phầm mềm SPSS trong xử lý số
liệu.
Phầm mềm SPSS là một phần mềm rất thông dụng. Chúng ta có thể có được
phầm mềm này bất kỳ ở đâu. Việc xử dụng phần mềm này rất đơn giản, nhưng lại rất
có hiệu quả. Có thể nói rằng phần mềm SPSS giải quyết được gần như toàn bộ các yêu
cầu của xử lý số liệu trong các nghiên cứu trong nông nghiệp. Mặt khác phần mềm
SPSS cũng có ưu thế xử lý các tập hợp số liệu khá lớn như số liệu điều tra. Do vậy,
chúng ta có thể hoàn toàn sử dụng phần mềm SPSS cho xử lý số liệu thí nghiệm và số
liệu điều tra. Một ưu điểm khác nữa là kết quả đầu ra của xử lý số liệu bằng phần mềm
SPSS có thể được thao tác và chế bản một cách dễ dàng trên các phần mềm khác như
Microsoft Offices. Điều này rất thuận lợi khi chúng ta sử dụng kết quả xử lý số liệu cho
việc hoàn thành bài báo hay luận văn. Hơn thế nữa cách sử dụng phầm mềm SPSS
cũng tương tự như một số phầm mềm thông dụng khác như GENSTAT, MINITAB,
vv. Do vậy, quả là khiêm tốn để nói rằng nếu chúng ta có thể sử dụng được phần mềm
SPSS thì chúng ta có thể sử dụng các phần mềm tin học thống kê khác.
Với mục đích giúp cho đối tượng học bậc đại học có thể sử dụng phần mềm
SPSS trong xử lý số liệu nghiên cứu, chúng tôi biên soạn nội dung học phần này và
khi kết thúc chương này, hy vọng người đọc có thể thực hiện một số nội dung sau bằng
phần mềm SPSS:
 Nhập số liệu cho các loại thiết kế thí nghiệm khác nhau

 Hàng thứ nhất của worksheet excel là hàng tên biến (độc lập và phụ
thuộc).
 Mỗi biến độc lập hay biến phụ thuộc nằm trong một cột. Tất cả các thông
tin về một biến phải được nằm trong một cột.
Ngoài ra để mọi người đều có thể hiểu được tập hợp số liệu, nên dùng các chức
năng phụ trợ khác trong excel để giải thích thêm về tập hợp số liệu. Ví dụ ta có thể
dùng chức năng insert comment để chú thích các tên biến, đơn vị của biến cũng như
chú thích các số liệu cần thiết.

1.2. Nhập số liệu trong trường hợp số liệu không phân nhóm/tổ
Ví dụ 1. Một nhóm nghiên cứu đã tiến hành xác định năng suất lúa (kg/ha) tại
10 ô ruộng, kết quả thu được ở bảng 1. Hãy nhập số liệu để phân tích thống kê mô tả
năng suất lúa.

5

Bảng 1. Năng suất lúa (kg/ha) ở 10 ô ruộng khác nhau
STT Năng suất
(kg/ha)
STT

Năng suất
(kg/ha)
1 3.853 6 2.606
2 4.788 7 4.936
3 4.576 8 4.454
4 6.034 9 5.276
5 5.874 10 5.916

Chúng ta có thể nhập số liệu như sau:


Hình 2: Nhập số liệu trong trường hợp số liệu phân tổ bởi một nhân tố
1.4. Nhập số liệu trong trường hợp số liệu phân tổ bởi hai nhân tố
Ví dụ 3. Một nhóm nghiên cứu đã tiến hành nghiên cứu ảnh hưởng của các mức
đạm bón và giống lúa đến năng suất lúa (kg/ha) trong một thí nghiệm được thiết kế
theo kiểu CRD, kết quả thu được ở bảng 3. Hảy nhập số liệu để phân tích ảnh hưởng
của các mức phân bón và giống lúa đến năng suất lúa.

7

Bảng 3. Số liệu thu được từ thí nghiệm ảnh hưởng của mức đạm bón và giống
lúa đến năng suất lúa (kg/ha) trong thí nghiệm thiết kế theo kiểu CRD
Giống

Phân bón

Giống 1
(V1)
Giống 2
(V2)
Giống 3
(V3)
Giống 4
(V4)
N
0
3.853 2.606 3.144 2.894
N
1
4.788 4.936 4.562 4.608

N
2
4,576 4,454 4,884 3,924
N
3
6,034 5,276 5,906 5,652
N
4
5,874 5,916 5,984 5,518

Giống V
2

N
0
2,846 3,794 4,108 3,444
N
1
4,956 5,128 4,150 4,991
N
2
5,928 5,698 5,810 4,308
N
3
5,664 5,362 6,458 5,474
N
4
5,458 5,546 5,786 5,932

Giống V

liệu của 14 đơn vị thí nghiệm đầu.

9
Hình 4: Nhập số liệu trong trường hợp số liệu phân tổ bởi hai nhân tố theo kiểu
thiết kế RCB
Ví dụ 5. Một nhóm nghiên cứu đã tiến hành nghiên cứu năng suất (tấn/ha) của 3
giống ngô lai A, B, D và giống đối chứng C, trong một thiết kế thí nghiệm kiểu LS,
kết quả thu được ở bảng 5. Hãy nhập số liệu để so sánh năng suất của các giống ngô.
Bảng 5. Năng suất (tấn/ha) của các giống ngô A, B, D và C trong thí nghiệm
thiết kế theo kiểu LS
Năng suất hạt (tấn/ha)
Số hàng
Cột 1 Cột 2 Cột 3 Cột 4

10

1 1,640(B) 1,210(D) 1,425(C) 1,345(A)
2 1,457(C) 1,185(A) 1,400(D) 1,290(B)
3 1,670(A) 0,710(C) 1,665(B) 1,180(D)
4 1,565(D) 1,290(B) 1,655(A) 0,660(C)

Chúng ta có thể nhập như sau (hình 5).

Hình 5: Nhập số liệu trong trường hợp thiết kế thí nghiệm kiểu LS
Tóm lại, nguyên tắc cơ bản của nhập số liệu để xử lý số liệu bằng phần mềm
SPSS cũng như các phần mềm khác như GENSTAT và MINITAB là “mỗi đơn vị thí
nghiệm nằm trong một hàng, mỗi biến nằm trong một cột”.

 Bước 3: Chọn số liệu được cho là sai hoặc ngoại lệ để phát hiện bản ghi
(đơn vị thí nghiệm) nào chứa số liệu đó
Từ hình 6 không có sai sót nào được phát hiện trong nhập số liệu. Giả sử chúng
ta đã nhập sai số liệu của đơn vị thí nghiệm thứ nhất, thay vì nhập 3.853 chúng ta đã
nhập thành 38.533. Từ hình 7, chúng ta có thể đặt nghi ngờ về độ chính xác của bản
ghi có năng suất 38.533.

12 Hình 6. Kiểm tra số liệu bằng chức năng Filter
Như vậy nếu nhìn vào hình 7 thì chúng ta có thể phát hiện bản ghi (đơn vị thí
nghiệm) có năng suất 38.533. Chúng ta có thể di chuyển thẳng đến đơn vị thí nghiệm
có chứa số liệu 38.533. Khi đó các đơn vị thí nghiệm khác sẽ bị ẩn (8). Màu sắc của
filter bị thay đổi. Sự thay đổi màu sắc này báo hiệu tập hợp số liệu nghiên cứu đang bị
filter (lọc). Nếu chúng ta muốn thao tác với toàn bộ số liệu thì chú ý phải bỏ chức năng
filter. Điều này có thể thực hiện được bằng cách chọn ALL trong filter. Chức năng
filter còn có thể giúp ta lựa chọn được các số liệu theo một số tiêu chí nào đó do chúng
ta định ra. 13 Hình 7. Kiểm tra số liệu bằng chức năng Filter Hình 8. Kiểm tra số liệu bằng chức năng Filter

14

có thể kiểm tra số liệu bằng cách sử dụng hai loại đồ thị trên thì chúng ta cũng có thể
vẽ các đồ thị khác theo ý muốn. Thực chất là chúng ta lợi dụng chức năng vẽ đồ thị để
kiểm tra số liệu. Chúng tôi hy vọng rằng qua phần này người đọc có thể vẽ được các
loại đồ thị bằng phần mềm SPSS và kiểm tra số liệu.
Ví dụ 10. Hãy kiểm tra số liệu bằng đồ thị Box-plot trong SPSS bằng cách dùng
tập hợp số liệu ở ví dụ 2 (bảng 2.).
Chúng ta có thể làm theo các bước sau:
 Bước 1: Nạp số liệu vào SPSS
 Bước 2: Chọn Graph-Boxplot-Sinple (có thể chọn clustered trong trường
hợp số liệu phân nhóm)
 Bước 3: Chọn biến ở trục tung và biến ở trục hoành
 Bước 4: Xem xét các trường hợp ngoại lệ từ đồ thị Box-plot

16Hình 11. Đồ thị Box-Plot mô tả mối quan hệ giữa công thức phân bón và năng
suất của lúa
Qua đồ thị trên ta không thấy những giá trị ngoại lệ. Có thể hiểu một cách đơn
giản là các giá trị nằm ngoài các đuôi của đồ thị Box-Plot thì nên được xem xét về tính
chính xác cũng như có thể được xem xét như các trường hợp ngoại lệ.
Ví dụ 11. Một nhóm nghiên cứu điều tra ảnh hưởng của tuổi của chủ hộ đến
việc chấp nhận (Y) hay không chấp nhận (N) trồng giống ngô địa phương. Kết quả
được thể hiện ở bảng 6. Hãy kiểm tra kết quả nhập số liệu.
Bảng 6. Số liệu về ảnh hưởng của tuổi chủ hộ đến chấp nhận giống ngô địa
phương
Loại hộ

Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ Tuổi chủ hộ
Tuổi chủ hộ

5

36

14

N

24

36

24

32

92

N

17

48

36

12

12


7,5

24

8

Y

168

5

4

24

5

N0

N1

N2

N3

N4

C
ô
17

Y

40

30

60

36

36

N

6

5

48

24

8

Y


19

10

Y

46

12

72

36

7

Y

36

26

72

12

24

N


18

20

N

24

24

36

25

12

N

12

6

48

8

2

N


4

48

N

48

36

36

6

48

N

36

24

36

9

2

Y


24

12

N

84

6

8

32

15

N

9

36

7

92

10

Y


7

30

N

15

36

18

8

60Vẽ đồ thị kiểu Box-Plot, kết quả được trình bày ở hình 12.
Qua hình 12. có thể đặt nghi ngờ vào một số bản ghi hay đơn vị thí nghiệm thứ 9, 212,
58, 79, 76, 204, 64, 191 và 30 trong file số liệu. Các số liệu đó có thể do sai sót khi
nhập số liệu, cũng có thể là những trường hợp ngoại lệ, do vậy chúng ta cần kiểm tra
lại những số liệu này. Cần đặc biệt chú ý là không được loại bỏ các số liệu này khi
không có lý do chính đáng. Các trường hợp ngoại lệ thông thường làm cơ sở cho việc
đề xuất ý tưởng nghiên cứu mới.
Chúng ta có thể vừa kiểm tra số liệu vừa xem xét khuynh hướng của
phân bố số liệu hay xem xét mối quan hệ giữa các biến. Điều này có thể được thực hiện
thông qua đồ thị kiểu Scatter-Plot. Tiến trình vẽ đồ thị kiểu Scatter-Plot tuân theo các
bước như sau : Graphs - Scatter- Simple. Sau đó chọn biến x và biến y. Chỉ chọn
Simple khi ta muốn vẽ đồ thị đơn chỉ gồm một biến x và một biến y (Hình 13).



19

Qua hình 14 ta có thể vừa kiểm tra số liệu vừa suy đoán mối quan hệ giữa các
biến. Chúng ta có thể hoàn toàn nghi ngờ bản ghi/đơn vị thí nghiệm ở hàng 262 và 481
của file nhập số liệu là những trường hợp ngoại lệ, hoặc có thể chúng đã được nhập sai.
0 20 40 60 80 100 120 140
x
50
100
150
200
250
y1
262
481

Hình 14. Đồ thị Scatter-Plot biểu thị mối quan hệ giữa biến độc lập x và biến
phụ thuộc y
Mặt khác qua hình 14 ta thấy rằng khi x nhỏ thì khi x tăng thì y tăng, nhưng khi
tiếp tục tăng x thì y sẽ không tăng nữa. Như vậy khi xem xét mối quan hệ giữa y và x
chúng ta không thể dùng một hàm tuyến tính đơn thuần được.
Tóm lại, có nhiều cách khác nhau để kiểm tra số liệu đồng thời định hình mối
quan hệ giữa các biến nghiên cứu. Người làm nghiên cứu cần chú ý đến kiểm tra số
liệu thật kỹ trước khi phân tích số liệu.

BÀI 3. PHÂN TÍCH THỐNG KÊ MÔ TẢ
Trong các chương trước chúng ta đã biết một trong những nội dung quan trọng
nhất của thống kê mô tả là tính toán các tham số đặc trưng cho mức độ tập trung như
trung bình, trung vị, và yếu số và các tham số đặc trưng cho mức độ phân tán như


Min Max Sum Mean
Std.
Error
Std.
Deviation
Variance
20

35927

2606

38533

130069

6503,45

1701,501

7609,345

579021323.2. Phân tích thống kê mô tả trong trường hợp tập hợp số liệu phân nhóm
Có rất nhiều trình ứng dụng khác nhau có thể phân tích thống kê mô tả trong
trường hợp số liệu phân nhóm ví dụ chúng ta có thể sử dụng Compare means hay
General Linnear Model. Nói cách khác phân tích thống kê mô tả có thể được thực hiện

N
Std.
Deviation

Median

Std.
Error
of
Mean Sum

Min

Max

Range

Variance

Geo.
Mean

N0 3,1

4,0

0,5

3,0


0,4

0,0

4,7

N2 4,5

4,0

0,4

4,5

0,2

17,8

3,9

4,9

1,0

0,2

4,4

N3 5,7


23,3

5,5

6,0

0,5

0,0

5,8

Total

4,8

20,0

1,1

4,8

0,2

95,4

2,6

6,0

Hình 16. Phân tích thống kê mô tả từ General Linear Model

BÀI 4. PHÂN TÍCH PHƯƠNG SAI
Phân tích phương sai là một trong những cách để kiểm tra giả thuyết, ngoài các
cách khác như kiểm tra t, kiểm tra khi bình phương. Phân tích phương sai dựa trên hàm
phân bố F. Bản chất của phân tích phương sai dựa trên sự sai khác giữa phương sai do
yếu tố thí nghiệm gây nên và phưong sai do yếu tố ngẫu nhiên gây nên. Điều kiện để
phân tích phương sai là số liệu trong mỗi công thức phân bố chuẩn và số liệu của các


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status