Tài liệu hướng dẫn
thống kê y học sử dụng SPSS
ANOVA hỗn hợp
Lê Đông Nhật Nam
Lời nói đầu
Có lần BS. Lê Ngọc Khả Nhi nhận xét về sự giao thoa giữa âm nhạc và cuộc đời mình như sau: « Hoàn cảnh
quyết định sở thích, sở thích hình thành nhân cách, và nhân cách quyết định số phận »…
Nhi kể với tôi rằng từ nhỏ đến khi học trung học cô bé chỉ toàn nghe nhạc cổ điển, vì nhà nghèo nên không có
cassette, CD, đêm nào cô cũng chỉ làm bạn với chiếc radio và những bản giao hưởng trên đài FM. Năm 25 tuổi
cô ấy lần đầu tiên xa nhà và qua Paris du học. Tưởng rằng thành phố châu Âu lãng mạn với những phòng hòa
nhạc nổi tiếng và kho tàng những bản thu âm cổ điển khổng lồ sẽ chắp cánh cho sở thích âm nhạc cổ điển bay
cao hơn; nhưng Nhi tâm sự rằng khi sống xa quê hương cô ấy mới biết yêu thích âm nhạc Việt. Dù vẫn đi
Théâtre Champs-Ellysée để nghe concerto, giao hưởng; nhưng hằng ngày trên những chuyến metro Nhi chỉ
cắm tai nghe chìm đắm trong những bản tình ca của Lam Phương, Trịnh Công Sơn, Ngô Thụy Miên… Nhi kể
càng nghe những bài hát xưa cũ đó, càng thấy xót xa cho quê hương và yêu thương con người nhiều hơn. Có
sự tương tác nào đó giữa nhạc và lời đã đánh thức những hạt giống tâm hồn của người Việt tưởng chừng ngủ
quên từ rất lâu. Đến bây giờ cô ấy vẫn còn nghe cả 2 dòng nhạc và nhìn cuộc đời bằng đôi mắt lãng mạn, đa
cảm.
Thời gian, nơi chốn, những tác đông từ bên ngoài và thay đổi nội tại từ bên trong… tất cả điều khiển, dẫn dắt
chúng ta từng ngày, từng giờ trên con đường mà ta gọi là số phận, ít người cảm nhận được cho đến một thời
điểm nào đó ta chợt ngỡ ngàng nhìn lại mình, so với người và thấy mình tự thay đổi, thế gian thay đổi từ lúc
nào không hay…
Trong y học cũng thế, nếu ở thời kỳ sơ khai người ta nghiên cứu một căn bệnh theo những mô hình đơn lẻ về
cơ chế bệnh sinh nội tại do rối loạn chức năng, hay bên ngoài do nhiễm khuẩn, và tìm cách điều trị chúng, thì
ngày nay cùng một vấn đề được liên kết với rất nhiều yếu tố, bên trong con người thì khoa học đã đi sâu đến
cấp độ gene, phân tử và tế bào, bên ngoài thì có dịch tễ, kinh tế xã hội, môi trường… và những tương tác giữa
chúng, ví dụ ngành biểu sinh học.
nhanh và dễ dàng nhất.
Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên
cứu khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra
nhiều câu hỏi liên quan đến thống kê. Mặc dù những đế tài do Bảo
thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ
hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu.
3
1
1.1 Tình huống thí dụ
Y
F1
F2
F3
T1
T2
3 tháng đầu
F2: Cao huyết áp
F3: Tiền sản giật
Thai kỳ
3 tháng giữa
T3
3 tháng cuối
Bảo thân mến, đây là một thiết kế nghiên
cứu khá phức tạp, vì có khả năng 2 yếu tố
thời gian mang thai và bệnh lý tương tác
với nhau.
Chúng ta sẽ sử dụng phân tích phương sai
hỗn hợp, là sự kết hợp giữa ANOVA cho
hiệu ứng bên ngoài và bên trong đối
tượng.
1
1.2 Danh pháp ANOVA
Cách trình bày trong sách vở làm cho chúng ta dễ ngộ nhận là có nhiều phương pháp ANOVA khác nhau.
Thực ra chúng đều dựa trên nguyên tắc chung duy nhất đó là mô hình hồi quy tuyến tính. Người ta phân
chia ra nhiều kiểu ANOVA là dựa trên 2 yếu tố:
+ Số lượng biến số độc lập (hay yếu tố ảnh hưởng ) ?
+ Thiết kế nghiên cứu
2
Nhiều phân nhóm độc lập
ANOVA 3 yếu tố
3
Nhiều phân nhóm độc lập
ANOVA 2 yếu tố cho phép đo lặp lại
2
Phép đo lặp lại trên cùng đối tượng
ANOVA 2 yếu tố hỗn hợp
2
1 yếu tố được khảo sát trên đối tượng
độc lập Yếu tố còn lại khảo sát nhiều lần
trên cùng đối tượng
Phân nhóm
+
F
F1
T2
T3
ANOVA hỗn hợp
Lần đo (T)
1.3 ANOVA đơn biến : hiệu ứng bên ngoài và bên trong
1
Bài toán ta đang xét là sự kết hợp của 2 câu hỏi :
1° Khảo sát hiệu ứng của bệnh lý (phân nhóm F) lên giá trị Y (nồng độ Mg)
2° Khảo sát hiệu ứng của thời gian mang thai (phân nhóm T) lên giá trị Y (nồng độ Mg)
Hai câu hỏi này nếu được giải đáp riêng lẻ, sẽ dẫn tới 2 mô hình mà ta đã biết, là ANOVA đơn
biến (cho F) và ANOVA phép đo lặp lại, cho T.
F
Mô hình thí nghiệm bao gồm:
Y= bo+b1.F+ sai số
Y
R
MB
R
Bài toán ANOVA cho phép đo lặp lại nhằm mục đích chứng minh thời
gian mang thai gây ra hiệu ứng nội tại (Within subject) ý nghĩa làm thay
đổi giá trị Y giữa 3 thời điểm khảo sát, trên cùng đối tượng.
Nó có thể được biểu diễn bằng mô hình hồi quy có dạng:
Y
Y= bo+b2.T+ sai số
T
T1
T2
T3
Giá trị Y được xác định do hiệu ứng chính, nội tại do T gây ra và phần sai
số không rõ nguyên nhân. Mục tiêu của ta là chứng minh mô hình có ý
nghĩa, thông qua test F. Sau đó ta dùng post-hoc test hay Contrast để
so sánh giá trị trung bình Y giữa các phân nhóm T1,T2,T3.
M: hiệu ứng chính của mô hình thí nghiệm
MB: Hiệu ứng do yếu tố bên ngoài (B=between)
MW: Hiệu ứng biến thiên nội tại (W=Within)
Y: Đại lượng được khảo sát
T: Thời điểm khảo sát (thời gian)
Trường hợp thứ nhất là hiệu ứng của F và của T độc lập
với nhau (không có tương tác giữa T và F). Lúc này mô
hình sẽ có dạng:
MW
Y= bo+b1.T+b2.F + sai số.
Phân nhóm
Giá trị trung bình của Y
F1
Giá trị Y sẽ được xác định bởi 2 hiệu ứng chính riêng biệt
T,F và bởi sai số ngẫu nhiên. Đây là phân tích ANOVA
hỗn hợp mà ta đang bàn tới.
Mục tiêu của chúng ta trong trường hợp này là chứng tỏ
mô hình nói trên có ý nghĩa thống kê, điều này được làm
thông qua test F.
F2
F3
Sau đó, ta sử dụng test post-hoc hoặc phân tích tương
phản để so sánh giá trị Y giữa các điều kiện khác nhau
của F và của T.
T1
T2
F2-1
F2-2 F2-3
F3
F3-1
F3-2 F3-3
Ma trận đa biến F*T
1.5 ANOVA hỗn hợp và sự tương tác giữa 2 yếu tố
1
Trường hợp thứ 2 của thiết kế ANOVA hỗn hợp, đó là
khi có hiệu ứng tương tác giữa T và F, kí hiệu là T*F.
Như vậy mô hình sẽ có dạng: Y= bo+b1.T+b2.F+b3.(T*F)
+ sai số
Giá trị Y lúc này được xác định nhờ vào hiệu ứng riêng
phần của F, của T, hiệu ứng tương tác giữa F và T, và
phần sai số ngẫu nhiên.
Mô hình thí nghiệm bao gồm:
Y= bo+b1.T+b2.F+b3.(T*F) + sai số
Y
MB
F2
F3
T1
T2
T3
Lần đo (T)
3 lần ANOVA đơn biến.
Y=bo+b1*F+Er
M: hiệu ứng chính của mô hình thí nghiệm, bao gồm
MB: Hiệu ứng do yếu tố bên ngoài (B=between)
MW: Hiệu ứng biến thiên nội tại (W=Within)
Y: Đại lượng được khảo sát
T: Thời điểm khảo sát (thời gian)
F: Yếu tố phân nhóm
R: Sai số do yếu tố ngẫu nhiên, phần bất định
T*F: Hiệu ứng của tương tác giữa T và F
F2
F3
T1
T2
F2-2 F2-3
F3
F3-1
F3-2 F3-3
Ma trận đa biến F*T
3 lần ANOVA đơn biến.
Y=bo+b1*F+Er
3 lần ANOVA cho phép đo lặp lại.
Y=b’o+b2*T+Er
2.1 Quy trình ANOVA hỗn hợp
2
Quy trình ANOVA hỗn hợp gồm những bước sau đây
1.1 Kiểm tra giả định phân phối chuẩn bằng
Trực quan hay test Shapiro-Wilk
1
2
lệnh 3B, 4
3B.1 F test cho mô hình chứa T và F
3B.2 Phân tích sâu: test post hoc hoặc Contrast cho F
3B.3 Phân tích sâu: test post hoc hoặc Contrast cho T
3A.1 Thực hiện 3 lần ANOVA đơn biến cho T1,T2,T3
+ Phân tích sâu: test post hoc hoặc Contrast cho F
3A2 Thực hiện 3 lần ANOVA phép đo lặp lại cho F1,F2,F3
+ Phân tích sâu: test post hoc hoặc Contrast cho T
Khối lệnh 5
Khối lệnh 6
Trong tài liệu lần này, tác giả hoàn toàn dựa vào Syntax thay vì sử dụng giao diện của SPSS.
Ưu điểm của việc sử dụng Syntax đó là bạn sẽ tiết kiệm rất nhiều thời gian khi thực hiện các quy trình
phức tạp , nhất là khi bạn phải thử lại nhiều lần.
Nhược điểm của Syntax, dĩ nhiên là tính phổ quát, vì để dùng được Syntax, thiết kế nghiên cứu của
bạn phải tương đồng với thí dụ này; hoặc bạn phải thay đổi nội dung Syntax.
Dù sao thì ANOVA hỗn hợp cũng là 1 quy trình phức tạp, nên tác giả tập trung phân tích kỹ phần kết
quả để giúp bạn có thể diễn giải kết quả của chính mình. Về phần Syntax, bạn sẽ phải thay đổi 1 vài
điểm nhỏ trước khi thi hành, và phải chạy từng bước, tuy nhiên mọi thứ đều được hướng dẫn dụ thể.
Bạn có thể đọc thêm tài liệu về ANOVA đơn biến và ANOVA cho phép đo lặp lại của tác giả để hiểu
thêm về 1 số khái niệm như Post hoc test, phân tích tương phản, test F, hệ số ảnh hưởng v.v …
2
2.2 Tạo bảng số liệu
Tạo bảng số liệu
3) Mở nội dung Syntax: Bạn có thể mở file syntax bằng 2 cách: Trực tiếp click chuột vào icon của file
syntax, hoặc thông qua giao diện của SPSS
2.3 Cách sử dụng Syntax
2
3
1
2
1
2
Để thi hành 1 khối lệnh tùy chọn:
3
Trước hết bạn đánh dấu chọn khối lệnh này
Sau đó click chuột phải mở Menu
và chọn Run Selection.
Trạng thái của bộ xử lý ở góc dưới phải màn hình
Đang thi hành quy trình…
Đã thực hiện xong quy trình và xuất
kết quả
2
Y3
3
F1
F1-1
F1-2 F1-3
F2
F2-1
F2-2 F2-3
F3
F3-1
F3-2 F3-3
T (Thời điểm)
1)
Đặt tên cho những biến số Y chỉ thời điểm khảo sát, mỗi
nhóm.
Ví dụ: khảo sát tác dụng của 3 loại thuốc điều trị cao huyết áp
lên huyết áp bệnh nhân đo ở 4 thời điểm khác nhau trong
ngày, khối lệnh trên sẽ được đổi thành:
VARIABLE LABELS
Y1 ‘’HA khi vừa thức giấc"
Y2 ‘’HA sau khi vận động"
Y3 ‘’HA sau bữa ăn"
Y4 ‘’HA trước khi ngủ’’.
VALUE LABELS
F
0 « Nhóm Placebo"
1« Loại thuốc A"
2 « Loại thuốc B »
3 « Loại thuốc C ».
(Chú ý: phải có dấu . Ở hàng lệnh cuối cùng
3
Nội dung Syntax
3.2 Bước 2
Khối lệnh thứ 2 nhằm mục đích thăm dò số liệu, gồm
các quy trình như sau:
* Bước 2: Thăm dò số liệu :
Kiểm tra giả định phân phối chuẩn của
Y1,2,3 tùy theo F
cứu của bạn có bao nhiêu lần đo.
EXAMINE VARIABLES=Y1 Y2 Y3 Y4 Y5 BY F
Lưu ý: Cần thi hành riêng khối lệnh này, trước khi
làm những bước tiếp theo. Đây là các giả định
cần kiểm tra trước khi bạn làm ANOVA. Trong
trường hợp có vi phạm giả định bạn phải xử trí ,
kiểm tra lại nhiều lần.
Nếu có vi phạm giả định có thể không làm được
ANOVA, phải thay bằng test phi tham số, hoặc
phải làm ANOVA song song cho 2 mẫu số liệu. Vì
vậy không nên đi nhiều bước cùng lúc.
3
Nội dung Syntax
3.3 Bước 3A
* Bước 3: Chạy mô hình ANOVA hỗn hợp,
* Bước 3A: Kiểm tra trực quan sự tương tác
giữa lần đo và phân nhóm
*Biểu đồ cột
GGRAPH
/GRAPHDATASET NAME="graphdataset"
VARIABLES=MEAN(Y1) MEAN(Y2) MEAN(Y3)
F MISSING=LISTWISE
REPORTMISSING=NO
Công dụng của biểu đồ này để kiểm tra tương tác của T và F
(sẽ giải thích rõ hơn bên dưới).
Bạn có thể thêm bớt biến số Y tùy theo nghiên cứu của bạn
có bao nhiêu lần đo:
Ví dụ nếu có 4 lần đo: Y1 đến Y4
GGRAPH
/GRAPHDATASET NAME="graphdataset"
VARIABLES=MEAN(Y1) MEAN(Y2) MEAN(Y3)
MEAN(Y4) F MISSING=LISTWISE
3
Nội dung Syntax
3.3 Bước 3A
*Biểu đồ đoạn thẳng
GGRAPH
/GRAPHDATASET NAME="graphdataset"
VARIABLES=MEAN(Y1) MEAN(Y2) MEAN(Y3) F
MISSING=LISTWISE
REPORTMISSING=NO
TRANSFORM=VARSTOCASES(SUMMARY="#SU
MMARY" INDEX="#INDEX")
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: SUMMARY=col(source(s),
name("#SUMMARY"))
MISSING=LISTWISE
3
Nội dung Syntax
3.4 Bước 3B
* Bước 3B: Quy trình ANOVA hỗn hợp có sao lưu
sai số
GLM Y1 Y2 Y3 BY F
/WSFACTOR=Thaiky 3 Simple(1)
/MEASURE=Mg
/METHOD=SSTYPE(3)
/SAVE=SRESID
/POSTHOC=F(BONFERRONI GH)
/PLOT=PROFILE(Thaiky*F)
/EMMEANS=TABLES(Thaiky) COMPARE
ADJ(BONFERRONI)
/EMMEANS=TABLES(F*Thaiky)
/PRINT=DESCRIPTIVE ETASQ OPOWER
HOMOGENEITY
/CRITERIA=ALPHA(.05)
/WSDESIGN=Thaiky
/DESIGN=F.
Khối lệnh 3B có nội dung:
1) Thực hiện quy trình ANOVA hỗn hợp với 2 yếu tố :
biến số ảo T chỉ thời gian, và biến số phân nhóm F.
Đặt tên cho biến số ảo T chỉ thời điểm, ví dụ: Thaiky
Nội dung Syntax
3.5 Bước 4
3
•
Trước khi chạy bước 4, nhìn lại bảng số liệu để xem
giá trị sai số Z có cao hơn 3 ?
SORT CASES SRE_1.
…
* Bước 4: Kiểm tra giả định phân phối chuẩn của Sai số
Z
PPLOT
/VARIABLES=SRE_1 SRE_2 SRE_3
/NOLOG
/NOSTANDARDIZE
/TYPE=Q-Q
/FRACTION=BLOM
/TIES=MEAN
/DIST=NORMAL.
* Dọn dẹp và phục hồi bảng số liệu
SORT CASES F.
DELETE VARIABLES SRE_1, SRE_2, SRE_3.
Như ghi chú; trước khi thi hành bước 4, bạn nên nhìn lại
bảng số liệu, cột biến số SRE_n để phát hiện những giá trị
phân tán quá mức của sai số.
SRE_n chính là sai số chuẩn hóa (hay Z score của sai số),
F test cho mô hình chứa T và F
Phân tích sâu: test post hoc hoặc Contrast cho F
Phân tích sâu: test post hoc hoặc Contrast cho T
Thực hiện 3 lần ANOVA đơn biến cho T1,T2,T3
+ Phân tích sâu: test post hoc hoặc Contrast cho F
Khối lệnh 5
Thực hiện 3 lần ANOVA phép đo lặp lại cho F1,F2,F3 Khối lệnh 6
+ Phân tích sâu: test post hoc hoặc Contrast cho T
3
Nội dung Syntax
3.6 Bước 5
* Bước 5: ANOVA đơn biến khảo sát yếu tố F
cho mỗi thời điểm T1,T2,T3
Khối lệnh thứ 5 mới nhìn có vẻ dài, nhưng thực chất chỉ là
1 quy trình đơn giản lặp lại 3 lần.
BOOTSTRAP
/SAMPLING
METHOD=STRATIFIED(STRATA=F )
/VARIABLES TARGET=Y1 INPUT=F
/CRITERIA CILEVEL=95 CITYPE=BCA
NSAMPLES=1000
/PRINT=OPOWER ETASQ
/CRITERIA=ALPHA(.05)
/DESIGN=F.
T2
BOOTSTRAP
/SAMPLING
METHOD=STRATIFIED(STRATA=F )
/VARIABLES TARGET=Y3 INPUT=F
/CRITERIA CILEVEL=95 CITYPE=BCA
NSAMPLES=1000
/MISSING USERMISSING=EXCLUDE.
UNIANOVA Y3 BY F
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/POSTHOC=F(BONFERRONI GH)
/PRINT=OPOWER ETASQ
/CRITERIA=ALPHA(.05)
/DESIGN=F.
T3
BOOTSTRAP
/SAMPLING METHOD=STRATIFIED(STRATA=F )
/VARIABLES TARGET=Y4 INPUT=F
/CRITERIA
CILEVEL=95
CITYPE=BCA
NSAMPLES=1000
/MEASURE=Mg
/METHOD=SSTYPE(3)
/POSTHOC=F(BONFERRONI GH)
/PLOT=PROFILE(Thaiky*F)
/EMMEANS=TABLES(Thaiky) COMPARE
ADJ(BONFERRONI)
/EMMEANS=TABLES(F*Thaiky)
/PRINT=DESCRIPTIVE ETASQ OPOWER
HOMOGENEITY
/CRITERIA=ALPHA(.05)
/WSDESIGN=Thaiky
/DESIGN=F.
SPLIT FILE OFF.
Bạn có thể thay đổi nội dung gì ?
+ Tên của đại lượng cần khảo sát.
Ví dụ nghiên cứu của bạn đo đường huyết, thì lệnh
/MEASURE sẽ được thay đổi thành:
/MEASURE=Duonghuyet
+Tên của biến số ảo T
Ví dụ bạn có thể gọi T= thời gian, và nếu bạn có 4
lần đo thì đổi lại con số:
/WSFACTOR=Thoigian 4 Simple(1)
Chú ý: bạn cần thay đổi tất cả tên gọi của biến T
trong các hàng lệnh: /PLOT, /EMMEANS,
/WSDESIGN=
Chú ý: tên bạn chọn không được chứa khoảng
trắng, nên viết liền nhau.
+ Không nên thay đổi thứ tự các biến số Y, nếu
không sẽ gây nhầm lẫn trong quá trình bắt cặp Y và
Diễn giải kết quả thăm dò số liệu
4.1 Giả định phân phối chuẩn
Có 2 cách kiểm tra giả định phân phối chuẩn:
1) Phương pháp toán học - Sử dụng kiểm định Shapiro-Wilk hoặc Kolmogorov-Smirnov : tối ưu
cho trường hợp cỡ mẫu không quá lớn ( 50
trường hợp)
Tests of Normality
Kolmogorov-Smirnova
3 tháng đầu
3 tháng giữa
3 tháng cuối
Shapiro-Wilk
F
Statistic
df
Sig.
10
,668
Tiền sản giật
,139
10
,200*
,950
10
,668
Bình thường
,160
10
,200*
,964
10
Bình thường
,114
10
,200*
,985
10
,986
Cao huyết áp
,112
10
,200*
,963
10
,819
10
4
Diễn giải kết quả thăm dò số liệu
4.1 Giả định phân phối chuẩn
Nếu giả định phân phối
chuẩn bị vi phạm ta
phải xử trí thế nào ?
Bạn có nhiều lựa chọn
1) Chuyển dạng biến số (ví dụ thang đo Logarit), với hy vọng sẽ có phân phối
chuẩn
2) Sử dụng 2 phương pháp phi tham số riêng biệt cho 2 yếu tố độc lập
kiểm định Kruskal-Wallis, là giải pháp thay thế cho ANOVA đơn biến độc lập,
kiểm định Friedman, là giải pháp thay thế cho ANOVA trong phép đo lặp lại)
3) Bỏ qua vi phạm và vẫn làm phân tích ANOVA hỗn hợp (Thực ra điều kiện
phân phối không phải là tuyệt đối bắt buộc).
4) Làm ANOVA hỗn hợp song song cho 2 mẫu số liệu: nguyên thủy và đã
chuyển dạng (logarit hóa), so sánh kết quả của chúng với nhau.
Lời khuyên của BS Nhi:
Nếu bạn có bất thường về số liệu, bạn NÊN báo cáo điều đó cụ thể trong phần kết
quả, nhất là cách bạn xử lý những điểm giá trị cá biệt, lựa chọn test thống kê. Nếu
phân phối lệch trái hay phải, ngoài giá trị trung bình và SD bạn nên cung cấp thêm giá
trị của Skewness và Kurtosis (trong bảng kết quả Explore).
Hành động này sẽ đánh vào tâm lý của các nhà phê bình và giám khảo, loại bỏ nghi
ngờ về việc gian lận và ngụy tạo số liệu, nhất là khi kết quả của bạn quá hoàn hảo.
Người đọc sẽ nghĩ: Tác giả là một người thành thật và nắm vững phương pháp thống
kê.
Nếu có điểm giá trị ngoại
lai, ta phải xử trí thế nào
?
+ Đầu tiên, cần tìm hiểu nguyên nhân của giá trị cá biệt này: Có thể do nhập số liệu
sai ? Có thể do sai sót trong quá trình đo (đa số trường hợp). Sau khi đã loại trừ tất
cả nguyên nhân chủ quan, ta buộc phải kết luận rằng giá trị đó có thực và hoàn
toàn ngẫu nhiên (rất hiếm gặp, đồng nghĩa với việc đối tượng thực sự là một ngoại
lệ).
Nếu ta quyết định vẫn giữ điểm ngoại lai; ta có nhiều lựa chọn:
1) Sử dụng phương pháp phi tham số : kiểm định Kruskal-Wallis, là giải pháp thay
thế cho ANOVA đơn biến độc lập, kiểm định Friedman, là giải pháp thay thế cho
ANOVA trong phép đo lặp lại
2) Thay đổi giá trị cá biệt bằng 1 giá trị khác gần với nó nhất có thể (ví dụ: nếu giá
trị x = 10 được xem là quá khác biệt, ta có thể thử giá trị x=8 , vẫn là giá trị cao
nhất nhưng còn nằm trong giới hạn cho phép) (Lưu ý: giá trị thay thế có thể là giả
hay thật đều được)
3) Chuyển dạng biến số (ví dụ đổi sang thang đo logarit)
4) Cầu kì hơn: Ta tiến hành làm ANOVA song song cho 2 trường hợp: Có và không
có điểm giá trị ngoại lai, nếu kết quả tương tự nhau, ta giữ, ngược lại ta bỏ.
Loại bỏ giá trị luôn là lựa chọn cuối cùng:
Nếu ta quyết định bỏ điểm ngoại lai này, cỡ mẫu sẽ bị giảm đi một số trường hợp
tương ứng cho cả những lần đo khác và effect size sẽ bị ảnh hưởng.
23
5
Diễn giải kết quả bước 3:
5.1 Kiểm tra yếu tố tương tác (3A)
2
Cách thứ 2 để kiểm tra về quan hệ tương tác giữa T
và F là sử dụng biểu đồ hình cột
Biểu đồ hình cột, mô tả sự biến thiên của giá trị Y trung bình tại 3 thời
điểm khác nhau (trục hoành) và 3 phân nhóm khác nhau (màu sắc).
Công dụng của biều đồ này cũng à để phát hiện 1 cách trực quan sự
tương tác giữa biến số T (thời gian) và biến số phân nhóm (F: bệnh lý).
Bạn chỉ cần chú ý 2 đặc điểm:
+ Khuynh hướng biến thiên của giá trị Y theo thời gian : giống nhau hay
khác nhau giữa các phân nhóm (ví dụ F1,F2) ?
+Khoảng cách d giữa 2 đỉnh của cột kết quả: giống nhau hay khác nhau
giữa các thời điểm T1, T2, T3 ?
Trường hợp A: Không có quan hệ tương tác giữa T và F:
Khuynh hướng biến thiên là như nhau ở F1 và F2 (2 đường thẳng gần
như song song).
Khoảng cách d bằng nhau tại tất cả thời điểm: d1=d2=d3
Trường hợp B: Có quan hệ tương tác giữa T và F:
Khuynh hướng biến thiên của F1 và F2 khác nhau (những đường thẳng
cắt nhau).
Khoảng cách d khác nhau giữa 2 thời điểm
Trong trường hợp còn nghi ngờ, chúng ta sẽ dùng kết quả MANOVA và
within subject ANOVA để kiểm tra quan hệ tương tác này.