Tài liệu hướng dẫn thống kê y học sử dụng SPSS - ANOVA ĐƠN BIẾN - Pdf 34

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

SPSS
ANOVA đơn biến

BS. Lê Đông Nhật Nam


Lời mở đầu
Mùa hè năm 1995, tôi tốt nghiệp trung học cơ sở và chuẩn bị lên cấp 3. Khi đó Bộ Giáo dục qui định
mỗi học sinh chỉ được nộp đơn thi tuyển sinhvào 1 trường duy nhất (đề thi chung của Bộ). Việc lựa
chọn trường để nộp đơn (và theo học 3 năm sau đó) thực sự là một vấn đề khó khăn. Tôi có ít nhất là
5 lựa chọn, trường Hùng Vương gần nhà nhất, sau đó là 4 trường thuộc nhóm « cao giá » là Nguyễn
Thượng Hiền, Bùi thị Xuân, Minh Khai và Lê Quý Đôn. Gia đình tôi đã so sánh tỉ lệ học sinh đặu đại học
giữa 5 trường và khuyên tôi thi vào trường chuyên Nguyễn Thượng Hiền. Bản thân tôi vì có một chấn
thương tâm lý nặng do áp lực học hành tại trường chuyên, lớp chọn thời cấp 2, nên tôi quyết định sẽ
KHÔNG thi vào bất cứ trường chuyên nào nữa, cũng không muốn gặp lại bất kì người bạn cũ nào. Tôi
thuyết phục gia đình thi vào một trường gần chót bảng mà tôi nghĩ rằng không ai muốn chọn, đó là
Marie Curie. Cuối cùng tôi nhận ra là điểm thi của tôi rất cao và theo lý thuyết tôi có thể vào học tại
bất cứ trường cấp 3 nào, nhưng mọi chuyện đã muộn, tôi phải học tại Marie Curie. Hai năm sau Marie
Curie bị giáng cấp xuống thành một trường bán công. Thời gian sau này gia đình tôi trách tôi rất nhiều
vì lựa chọn đó.
Trước một quyết định lớn trong đời, chúng ta thường lựa chọn bằng cách SO SÁNH. Và thường ta
không bao giờ dừng lại ở 2 nhóm mà luôn so sánh NHIỀU nhóm với nhau (Nếu bạn từng mua smart
phone hay laptop chắc sẽ hiểu điều này). Và đa số trường hợp ta so sánh những giá trị đo, đếm
được. Ví dụ, quyết định hệ trọng của bác sĩ khi hành nghề thường là lựa chọn phương pháp điều trị
tối ưu cho bệnh nhân, giữa 4-5 loại thuốc khác nhau chẳng hạn, khi đó vấn đề so sánh nhiều nhóm
được đặt ra.
Để giải đáp bài toán này, trong thống kê người ta dùng phương pháp ANOVA (phân tích phương sai).
ANOVA là một trong những loại phân tích số liệu thường gặp nhất trong khi làm luận văn, nghiên cứu

hướng đơn giản hóa tối đa mọi vấn đề. Khả Nhi sẽ hướng
dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ
những mẹo vặt, thủ thuật để giúp các bạn đi đến kết quả
nhanh và dễ dàng nhất.

Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên
cứu khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra
nhiều câu hỏi liên quan đến thống kê. Mặc dù những đế tài do Bảo
thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ
hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu.

3


1

1.1 Tình huống thí dụ

Pregabalin là một loại thuốc giảm đau thần kinh, dựa vào tác dụng ức
chế việc tiết các chất dẫn truyền thần kinh phụ thuộc kênh Canxi.
Một bác sĩ nội trú muốn nghiên cứu hiệu quả điều trị giảm đau của
Pregabalin trên bệnh nhân sau phẫu thuật mở ống sống
(laminectomy).
Nghiên cứu được thực hiện trên 56 bệnh nhân chia thành 4 nhóm,
mỗi nhóm có 14 người. Điều trị giảm đau được thực hiện đồng thời
khi gây mê. Nhóm 1 được cung cấp Placebo, Nhóm 2 sử dụng một loại
thuốc giảm đau opioid là Tramadol liều 150 mg, Nhóm 3 sử dụng
Pregabalin liều thấp (75mg), nhóm 4 sử dụng Pregabalin liều cao (150

các nhóm độc lập

Trong giáo trình thống kê có rất nhiều kiểu ANOVA, em
không biết làm thế nào để phân biệt chúng ?

Đúng là cách trình bày trong sách vở làm cho chúng ta dễ ngộ nhận là có nhiều phương pháp
ANOVA khác nhau. Thực ra chúng đều dựa trên nguyên tắc chung duy nhất đó là mô hình
hồi quy tuyến tính. Người ta phân chia ra nhiều kiểu ANOVA là dựa trên 2 yếu tố:
+ Số lượng biến số độc lập (hay yếu tố ảnh hưởng ) ?
+ Thiết kế nghiên cứu
Danh pháp chung của ANOVA như sau:

Phân tích phương sai + [số lượng biến số độc lập] yếu tố + (loại thiết kế nghiên cứu)
1 biến số độc lập : ANOVA 1 yếu tố (hay ANOVA đơn biến, tiếng Anh: one way ANOVA)
2 biến số độc lập: ANOVA 2 yếu tố (two ways ANOVA)
Thiết kế nghiên cứu:
Nếu tất cả biến số được khảo sát trên cùng một đối tượng ở nhiều điều kiện khác nhau: Ta
có ANOVA cho phép đo lặp lại (repeated measure, within subject ANOVA)
Nếu tất cả biến số khảo sát ở nhiều đối tượng độc lập: Ta có ANOVA cho các nhóm độc lập
Nếu một vài biến số được khảo sát trên đối tượng độc lập, và những biến còn lại được khảo
sát trên cùng đối tượng: thiết kế hỗn hợp
Tên phương pháp

Số biến độc lập

Thiết kế nghiên cứu

ANOVA đơn biến (1 yếu tố)

1


1 yếu tố được khảo sát trên đối tượng
độc lập Yếu tố còn lại khảo sát nhiều lần
trên cùng đối tượng


1

1.2 Giới thiệu về ANOVA
Phân tích phương sai 1 yếu tố (One way ANOVA) cho phép bạn so sánh giá trị trung
bình của một biến số định lượng giữa nhiều nhóm không có liên hệ với nhau. Biến số
định lượng này được khảo sát 1 lần duy nhất và trên các đối tượng khác nhau giữa
các phân nhóm.
Giả thuyết 0 của ANOVA đơn biến: Giá trị trung bình của biến số khảo sát là như
nhau ở tất cả các phân nhóm. H0: µ1 = µ2 = µ3 = ... = µk (k= số nhóm so sánh)
Để kiểm tra giả thuyết 0 này, ANOVA sẽ tính tỉ số F = tỉ lệ sự sai biệt giữa các nhóm
(do thí nghiệm gây ra) so với sự sai biệt nội tại (ngẫu nhiên) trong cùng một nhóm. Tỉ
dựa vào phân phối Fisher cho phép ta xác định giá trị p = xác suất có được một giá trị
F cao như thế nếu giả thuyết H0 là đúng. Ta loại bỏ giả thuyết H0 nếu p

1

F for « Fisher »
Kiểm định F được GS. Ronald A. Fisher thiết kế
năm 1920. Test F không chỉ được dùng cho phân
tích phương sai mà còn dùng để kiểm tra giá trị của
các mô hình hồi quy.

Not this Fisher !

Giáo sư Ronald Aylmer Fisher
(1890-1962) Nhà di truyền học và
thống kê người Anh

Bạn có biết : Thực ra ANOVA có thể được hình dung như
1 mô hình hồi quy tuyến tính ?

𝑮𝒊á 𝒕𝒓ị 𝒀 = 𝒃𝒐 + (𝒃𝟏. 𝑿𝟏) + (𝒃𝟐 ∗ 𝑿𝟐) + (𝒃𝟑. 𝑿𝟑) + 𝒔𝒂𝒊 𝒔ố

Y

Mô hình này dự báo giá trị của biến số Y tùy
theo trường hợp X thuộc phân nhóm nào
X1, X2, X3 là những biến số giả chỉ phân nhóm,
chỉ nhận 1 trong 2 giá trị: =1 (đúng) hoặc =0 (sai)
Ví dụ khi bệnh nhân đưa vào nhóm 1 thì X1=1,
X2 và X3=0.

b3



1

1.3 Ứng dụng của ANOVA

ANOVA 1 yếu tố có thể dùng trong những trường hợp
nào ?

Phân tích phương sai (ANOVA) đơn biến cho các nhóm độc lập có thể ứng dụng cho nhiều câu hỏi
nghiên cứu như
1. Khảo sát ảnh hưởng của một nhân tố lên giá trị của biến số định lượng
- Khảo sát hiệu quả của các loại thuốc khác nhau, hoặc 1 loại thuốc ở các liều lượng khác nhau (bao
gồm nhóm chứng placebo)
- Đánh giá hiệu quả trị liệu: So sánh sự thay đổi của triệu chứng (định lượng) trước và sau khi điều trị
bằng 1 số phương pháp khác nhau (ví dụ phẫu thuật can thiệp, chế độ dinh dưỡng…).
2. So sánh giá trị 1 đại lượng giữa các quần thể khác nhau
- So sánh đặc điểm sinh lý, sinh hóa bình thường hay bệnh lý giữa các địa phương, chủng tộc… khác
nhau
- So sánh độ nặng của triệu chứng lâm sàng tại các giai đoạn diễn tiến khác nhau của một bệnh lý.
- So sánh đặc điểm lâm sàng của nhiều bệnh lý khác nhau
Bạn cần có:
1 biến số định lượng liên tục biểu thị cho đại lượng cần nghiên cứu ; ví dụ: 1 triệu chứng lâm sàng
1 biến số định tính để phân nhóm (≥3 giá trị). Ví dụ: Liều thuốc, phương pháp điều trị, độ nặng…

N
Hiệu quả

So sánh ?



Có giả thuyết rõ ràng
Phân tích sâu
Chưa có giả thuyết rõ ràng

Post hoc test

Tính hệ số ảnh
hưởng/tương phản

9

1.5 Nhập số liệu
1

Trong cửa sổ Variable View, bạn tạo 2 biến
số:

2
1 biến số định tính (Nominal) kiểu số
(numeric) dùng để phân nhóm điều trị.
Biến này được dán nhãn giá trị như sau:
1= Placebo
2= Tramadol 150 mg
3= Pregabalin 75mg
4= Pregabalin 150 mg
Cột Label cho phép bạn mô tả ý nghĩa của biến
số, điều này rất có ích nếu sau này bạn muốn
chuyển số liệu cho một đồng nghiệp khác sử
dụng.


2.1 Thăm dò số liệu

6
4
5

Trong hộp thoại Explore, bạn
kéo biến Nhóm điều trị vào
ô Factor list và biến Mức độ
đau vào ô Dependent list.

Nhấn nút « Statistic » để
chọn kiểu phân tích


2.1 Thăm dò số liệu

2

7
Tạo bảng mô tả (trình bày giá trị
trung bình, độ lệch chuẩn, Min,
max, vv) cho từng phân nhóm
Phát hiện điểm giá trị ngoại lai
(Sử dụng biểu đồ Blox-plot)

8
Nhấn Continue để trở ra


2.2 Kiểm tra các giả định

Có 2 cách kiểm tra giả định phân phối chuẩn:
1) Phương pháp toán học - Sử dụng kiểm định Shapiro-Wilk hoặc Kolmogorov-Smirnov :
tối ưu cho trường hợp cỡ mẫu không quá lớn ( 50 trường hợp)
Tests of Normality
Nhóm điều trị

Kolmogorov-Smirnova
Statistic

Mức độ đau

df

Shapiro-Wilk

Sig.

Statistic

df

Sig.

Placebo


,255

,224

14

,056

,876

14

,052

Pregabalin 75mg
Pregabalin 150
mg

,888

14

,075

*. This is a lower bound of the true significance.

Kết quả kiểm định Sapiro-Wilk

a. Lilliefors Significance Correction


52

,851

,263

3

48,614

,851

,221

3

52

,881

Based on Median and
with adjusted df
Based on trimmed mean

Kết quả kiểm định Levene
Tiếp theo, ta đọc bảng kết quả kiểm định Levene, để kiểm tra giả định về « Phương sai đồng
nhất ».
Nếu p0,05
Trong trường hợp cả 2 giả định đều được thỏa mãn, ta có thể yên tâm đi tiếp


2

2.2 Kiểm tra các giả định

Nếu có điểm giá trị ngoại
lai, ta phải xử trí thế nào
?

+ Đầu tiên, cần tìm hiểu nguyên nhân của giá trị cá biệt này: Có thể do nhập số liệu
sai ? Có thể do sai sót trong quá trình đo (đa số trường hợp). Sau khi đã loại trừ tất
cả nguyên nhân chủ quan, ta buộc phải kết luận rằng giá trị đó có thực và hoàn
toàn ngẫu nhiên (rất hiếm gặp, đồng nghĩa với việc đối tượng thực sự là một ngoại
lệ).
Nếu ta quyết định vẫn giữ điểm ngoại lai; ta có nhiều lựa chọn:
1) Sử dụng phương pháp phi tham số (kiểm định Kruskal Wallis là giải pháp thay
thế cho ANOVA đơn biến - độc lập
2) Thay đổi giá trị cá biệt bằng 1 giá trị khác gần với nó nhất có thể (ví dụ: nếu giá
trị x = 10 được xem là quá khác biệt, ta có thể thử giá trị x=8 , vẫn là giá trị cao nhất
nhưng còn nằm trong giới hạn cho phép) (Lưu ý: giá trị thay thế có thể là giả hay
thật đều được)
3) Chuyển dạng biến số (ví dụ đổi sang thang đo logarit)
4) Cầu kì hơn: Ta tiến hành làm ANOVA song song cho 2 trường hợp: Có và không
có điểm giá trị ngoại lai, nếu kết quả tương tự nhau, ta giữ, ngược lại ta bỏ.
Loại bỏ giá trị luôn là lựa chọn cuối cùng:
Nếu ta quyết định bỏ điểm ngoại lai này, effect size và giá trị phổ quát của mô hình
có thể sẽ bị ảnh hưởng.


2

không thể tin được.

Phải triệu hồi
chuyên viên thống
kê ra làm chứng

Nghiên cứu sinh


3

3.1 Thực hiện F test

1

2

3

4
5
Kéo biến số cần khảo sát
(Mức độ đau) vào ô
Dependent list, biến số
phân nhóm vào ô « Factor »

Nếu bạn chỉ cần làm
ANOVA tổng quát, không
cần phân tích sâu, bạn nhấn
nút « Option »


3

3.2 Diễn giải kết quả phân tích ANOVA tổng quát

Bảng đầu tiên: Descriptives trình bày kết quả thống kê mô tả, cho ta biết số case ở mỗi phân
nhóm, giá trị trung bình , độ lệch chuẩn , tối đa , tối thiểu và khoảng tin cậy 95% của biến số định
lượng (mức độ đau ) ở từng phân nhóm.

Nếu ta đã thực hiện test Levene ở bước 1, ta có thể bỏ qua bảng Test of Homogeneity of
Variances, nếu chưa, đây là cơ hội cuối để bạn kiểm tra lại giả định về phương sai đồng nhất. Ta
trông đợi giá trị p>0,05 của test levene, cho phép ta thực hiện ANOVA theo qui trình chuẩn, trong
trường hợp ngược lại, ta phải chuyển sang dùng PP của Welch và Brown-Forsythe.và test post hoc
của Games Howell.
Test of Homogeneity of Variances
Mức độ đau
Levene Statistic

df1

df2

Sig.

,200

3

52


67,286

52

1,294

Total

150,000

55

Bảng tiếp theo là ANOVA, trong bảng này, dĩ nhiên trước hết ta sẽ nhìn vào giá trị p
3

51,231

,000

a. Asymptotically F distributed.

Bước tiếp theo sẽ tùy thuộc vào ý định nghiên cứu của bạn. Nếu bạn chưa có bất cứ giả thuyết nào cụ
thể, và chỉ muốn thăm dò toàn bộ các khả năng có thể xảy ra , bạn sẽ sử dụng test post-hoc để so sánh
bắt cặp hàng loạt giữa các phân nhóm.

Có giả thuyết rõ ràng

Phân tích khuynh hướng
Phân tích tương phản

Phân tích sâu

Chưa có giả thuyết rõ ràng

Post hoc test

3B
3A


3

A.1 Lựa chọn test post-hoc

theo hoàn cảnh. Ví dụ nếu lo sợ bị
bắt bẻ về sai lầm type I, bạn nên
chọn loại test chặt chẽ và mạnh,
nếu bạn muốn tìm thấy giá trị
p4), Tukey trở nên mạnh hơn. Tukey cũng mạnh hơn Duncan, Sidak và Scheffe
REGWQ (Ryan Einot Gabriel Welsch) Q: Đây là phương pháp tối ưu vì vừa kiểm soát chặt chẽ sai lầm
type I, vừa đảm bảo sức mạnh thống kê. Tuy nhiên nó không thể sử dụng trong trường hợp cỡ mẫu trong
mỗi nhóm khác biệt với nhau.
Trong trường hợp giả định phương sai đồng nhất bị vi phạm (Test Levene p

(I-J)

Std. Error

Sig.

Lower Bound

Upper Bound

Tramadol 150mg

2,35714*

,42994

,000

1,2160

3,4983

Pregabalin 75mg

2,35714*

,42994

,000


,42994

1,000

-1,1411

1,1411

Pregabalin 75mg
Pregabalin 150 mg
Pregabalin 75mg

Pregabalin 150 mg

95% Confidence Interval

,92857

,42994

,148

-,2125

2,0697

-2,35714*

,42994


-3,28571*

,42994

,000

-4,4268

-2,1446

Tramadol 150mg

-,92857

,42994

,148

-2,0697

,2125

Pregabalin 75mg

-,92857

,42994

,148

3,1429

Pregabalin 75mg

14

3,1429

Placebo

14

Sig.

2

Trong bảng phân lớp giá trị mức độ đau,
kết quả cho thấy nhóm Placebo thuộc lớp
giá trị cao, tương phản với lớp giá trị thấp
là 3 nhóm có dùng thuốc; có thể kết luận
là sử dụng bất cứ loại thuốc giảm đau nào
cũng làm giảm mức độ đau trong cùng
phân lớp giá trị thấp) so với nhóm
Placebo.

5,5000
,148

1,000


Upper Bound

Tramadol 150mg

2,35714*

,42994

,000

1,2160

3,4983

Pregabalin 75mg

2,35714*

,42994

,000

1,2160

3,4983

Pregabalin 150 mg

3,28571*


Lower Bound

Upper Bound

Placebo

Tramadol 150mg

2,35714*

,42994

,000

1,1778

3,5365

Pregabalin 75mg

2,35714*

,42994

,000

1,1778

3,5365


1,000

-1,1793

1,1793

Pregabalin 150 mg

,92857

,42994

,213

-,2507

2,1079

-2,35714*

,42994

,000

-3,5365

-1,1778

Tramadol 150mg


-2,1064

Tramadol 150mg

-,92857

,42994

,213

-2,1079

,2507

Pregabalin 75mg

-,92857

,42994

,213

-2,1079

,2507

Tramadol 150mg

Pregabalin 75mg


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status