Tài liệu hướng dẫn thống kê y học sử dụng SPSS - HỒI QUI logistic CHO BIẾN SỐ NHỊ PHÂN - Pdf 34

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

SPSS
Hồi quy logistic cho biến số nhị phân

BS. Lê Đông Nhật Nam

1

Lời nói đầu
Có thể bạn không tin, nhưng số phận của mỗi người giống như một mô hình hồi quy…
Năm 1999 cũng như tất cả học sinh lớp 12 khác, tôi phải đối diện với một thử thách quan trọng là kì thi tuyển sinh vào đại học. Kết quả đậu
hay rớt thường phụ thuộc vào biến số 3 môn học ,tùy theo ngành nghề bạn chọn.
Vào thời gian đó Bộ Giáo Dục lại có quy định tuyển thẳng vào đại học những học sinh giỏi toàn diện trong năm lớp 12. Mùa hè năm 1998
khi nghe tin một nữ sinh hệ bán công (trình độ kém hơn nhiều so với hệ chính quy) được tuyển thẳng vào đại học, trong khi đàn anh đàn
chị lớp chuyên, trường chuyên thi rớt hàng loạt, tôi thực sự bị sốc. Sau nhiều đêm suy nghĩ tôi quyết định phải chọn con đường an toàn
nhất cho mình. Tôi xin ra khỏi lớp chuyên vào cuối hè và chuyển sang học một lớp trung bình. Trong 90 ngày sau đó tôi đã lập kế hoạch vừa
luyện thi khối A bên ngoài, vừa thỏa mãn giáo viên tất cả các môn học trong lớp , kể cả những môn mà tôi chán ghét nhất.
Tôi nhận ra tham vọng đưa quá nhiều tham số vào phương trình « tuyển thẳng đại học » của mình lại tạo ra áp lực còn cao hơn so với một
người chỉ luyện thi đơn giản. Nhiều lúc tôi gần như phát khùng khi phải theo dõi bảng điểm của mình mỗi ngày để mô phỏng bốn năm giả
thuyết khác nhau trước khi quyết định tập trung chữa cháy điểm số môn học A và hy sinh để cho 1 bài thi môn học B cháy rụi. Cuối cùng, tôi
cũng cân bằng được tất cả những biến số để cho ra kết quả tuyển thẳng, nhưng cái giá phải trả là ước mơ trở thành giáo viên môn Vật Lý
của tôi tan thành mây khói khi tôi phải chiều lòng gia đình chọn học Y khoa.
2 năm sau người ta hủy bỏ mô hình tuyển sinh này vì nó hoàn toàn sai lầm, nghiên cứu cho biết đa số học sinh được tuyển thẳng chỉ có kết
quả trung bình khá ở giảng đường. Mỗi năm họ lại thay đổi một mô hình mới, và học sinh chúng tôi buộc phải tự thích nghi với mô hình
này.
Trong tài liệu này chúng ta sẽ bàn về một vấn đề tương tự, khi phải dự báo liệu một biến cố sẽ xảy ra hay không, dựa trên quan sát về nhiều
yếu tố khác.
Phương pháp hồi quy logistic có nguyên tắc đơn giản, nhưng rất khó khi thực hiện cụ thể ; vì vậy ít tác giả ưa chuộng, áp dụng nó trong

Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên cứu
khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra nhiều câu hỏi
liên quan đến thống kê. Mặc dù những đế tài do Bảo thực hiện rất đơn
giản, nhưng đồng hành với cậu ta, các bạn có cơ hội tích lũy cho mình
nhiều kinh nghiệm trong công việc phân tích số liệu và thiết kế nghiên
cứu.

3

1

1.1 Tình huống thí dụ
Xuất huyết não là một loại tai biến nguy hiểm vì tỉ lệ tử vong
rất cao nếu không được cấp cứu kịp thời.
Một bác sĩ thực hiện đề tài khảo sát nguy cơ tử vong ở bệnh
nhân xuất huyết não, đây là một nghiên cứu phức tạp với
hơn 20 biến số định tính và định lượng được thu thập trên
109 trường hợp xuất huyết não do nhiều nguyên nhân.
Câu hỏi nghiên cứu chính đặt ra là làm sao dựa vào các yếu tố
dịch tễ, triệu chứng lâm sàng cũng như bệnh lý nền để dự báo
biến cố tử vong trong thời gian nằm viện.

Biến số định lượng liên tục
Biến số định tính
(nhị phân)

Tuổi

Lệch đường giữa
Phẫu thuật

Phương pháp đầu tiên hiện ra trong đầu tôi lúc này, đó là Hồi quy logistic.
Đây là một mô hình hồi quy đặc biệt cho phép dự báo xác suất xảy ra một sự kiện nào đó, ví
dụ như tử vong dựa vào nhiều yếu tố dự báo. Phương pháp này còn cho phép ta đánh giá vai
trò, mức độ ảnh hưởng của từng yếu tố dự báo nhờ vào tỉ số Odds-ratio.
Tuy nhiên cần cảnh báo trước: Hồi quy logistic là một phương pháp rất khó !

1

1.2 Giới thiệu phương pháp
Thưa thầy, nếu đã biết hồi quy logistic phức tạp, tại sao ta không thể
dùng test χ2 hay test chính xác Fisher dựa vào bảng 2x2 để khảo sát
từng yếu tố nguy cơ ? Những phương pháp này dễ hơn và cũng tính
được Odd-ratios mà ?

Bảo thân mến, nếu ở đây em chỉ có toàn biến định tính, ta sẽ cân nhắc dùng test χ2 hay test
Fisher như em nói. Tuy nhiên ta lại có quá nhiều loại biến số, như định tính, định lượng liên tục
và thứ hạng; nên test χ2 hay test chính xác Fisher không còn hữu dụng nữa.
Ta không nên lạm dụng hồi quy Logistic chỉ để tính Odds-ratio cho từng biến số đơn lẻ. Mục
đích thực sự của mô hình hồi quy là để dự báo. Chỉ dùng công cụ phức tạp này cho những vấn
đề thực sự phức tạp, như thí dụ trên.

Công dụng chính của mô hình hồi quy là dùng để dự báo. Vì vậy việc tìm ra mô hình có ý nghĩa
thống kê, phù hợp với dữ kiện quan sát hiện tại thôi chưa đủ, nó còn phải dự báo chính xác
trong quần thể chung, tức có giá trị phổ quát. Mô hình hiệu quả phải cho phép dự báo đúng
cho bất kì trường hợp nào trong tương lai.

được cho biến số định tính, hoặc thứ hạng. Trong khi đó, hồi quy logistic
cho phép khảo sát cùng lúc nhiều biến số, bao gồm biến số định lượng liên
tục, thứ hạng, biến nhị phân, và nhất là sự tương tác giữa chúng với nhau.

Bệnh nhân X

Bệnh nhân X

Xác suất tử vong của
bệnh nhân là 80 %

Dùng để dự báo xác suất xảy ra 1 sự kiện

2. Mô hình hồi quy logistic đo lường được độ mạnh của liên hệ đã chuẩn hóa
giữa các yếu tố dự báo và 1 sự kiện, vai trò cụ thể của từng biến số, cho
phép diễn giải kết quả dưới dạng tỉ số nguy cơ (odds ratio). Chỉ có hồi quy
cho phép tính Odds-ratio cho 1 biến số định lượng liên tục
3. Test χ2 có nguy cơ sai lầm cao, khi 2 biến số đang được khảo sát chịu ảnh
hưởng của một biến số thứ 3, vì vậy 1 biến số riêng lẻ có vai trò quan trọng
nhưng lại có thể cho ra kết quả yếu đối với test χ2 , trong khi mô hình hồi
quy logistic đa biến cho phép ta vô hiệu hóa các yếu tố gây nhầm lẫn và tìm
lại được vai trò thực sự của biến số này.

1

1.2 Giới thiệu phương pháp

Như ta biết, mô hình hồi quy tổng quát có dạng:
Giá trị dự báo = hằng số +

1

1.2 Giới thiệu phương pháp

Phương pháp khảo
sát cho từng nhóm:

Kết quả dự báo
(outcome) là 1 biến số nhị phân

Y

Test χ2

Định tính nhị phân
hệ số tau của Kendall
So sánh phi tham số
Hệ số tương quan Spearman

Khảo sát cùng lúc bằng
Mô hình hồi quy logistic đa biến

Thứ hạng

Tập hợp các yếu tố
dự báo (predictors)

So sánh bằng Test t

nhiều ngưỡng giá trị
(2) Có thể chuyển biến định lượng thành biến định tính nhị phân bằng
cách ấn định 1 ngưỡng giá trị
(3) Có thể chuyển từ biến thứ hạng sang biến định tính nhị phân bằng
cách cắt nhỏ nó ra thành nhiều dummy variable (biến số giả)

2

1.1 Tạo bảng số liệu

Trong công đoạn đầu tiên, các bạn sẽ tạo bảng số liệu,
bao gồm khai báo biến số, dán nhãn ý nghĩa, quy định
giá trị mã hóa, sau đó nhập số liệu.
Trong thí dụ này, chúng ta có tới 26 biến số. Việc sắp
xếp, khai báo và lập quy tắc mã hóa giá trị cho chúng
rất quan trọng. Một bảng số liệu rõ ràng, trật tự và
đồng nhất sẽ giúp cho công đoạn thăm dò và xây dựng
mô hình dễ dàng hơn rất nhiều.
Về cấu trúc: các bạn nên phân bố các biến số độc lập
theo từng nhóm, ví dụ: Dịch tễ, triệu chứng thực thể,
dấu hiệu hình ảnh học, xét nghiệm sinh hóa… Mỗi
nhóm có thể chứa nhiều biến số. Cùng một đại lượng
có thể được khảo sát bằng nhiều loại biến số: Định
lượng, định tính, thứ hạng
Về quy tắc mã hóa: Các biến định tính nhị phân nên
được mã hóa theo cùng 1 quy tắc thống nhất, ví dụ:
0=Không, 1=Có. Lý tưởng nhất là luôn cho nhóm chứng
= 0, và nhóm cần quan tâm = 1. Ví dụ: Bình thường = 0;
Có triệu chứng = 1. Bạn sẽ thấy việc này ích lợi thế nào

2

1.1 Tạo bảng số liệu
Biến định tính nhị phân
Tử vong
Cao huyết áp
Tiểu đường
Rối loạn đông máu

Tất cả biến số định tính nhị phân được gán giá trị
theo cùng một quy tắc: 0= Không, 1 = Có

Thuốc lá
Rượu
Đau đầu
Buồn nôn, nôn
Co giật
Rối loạn tri giác
Vị trí hạch nền
Vị trí não thùy
Vị trí thân não
Vị trí đồi thị
Vị trí não thất
Vị trí tiểu não
Lệch đường giữa

Biến số thứ hạng được mã hóa theo thứ tự từ thấp tới cao :
1,2,3…

Trong thí dụ này, ta muốn đặt ra ngưỡng giá trị để chia
mẫu khảo sát thành 2 phân nhóm; Tuổi cao > 60 và < 60.

6

Đầu tiên, chọn Range, nhập giá trị, ví dụ : 60
Sau đó gán giá trị mới : 1
Nhấn Add để xác nhận quy tắc mã hóa này.
Sau đó lại chọn: All Other values, nhập giá trị =0 rồi nhấn
Add để xác nhận

7

Cuối cùng nhấn Continue

6
8
Trở ra hộp thoại Recode, ta nhấn Change để lưu biến số
tuoicao với giá trị mới
Sau đó nhấn OK để thi hành lệnh Recode

9

Ngay sau khi nhấn OK, ta sẽ thấy trong data
editor có một biến số mới : Tuoicao với giá
trị = 0 hay =1.
Bước còn lại chỉ là khai báo định dạng cho
biến số và quy định nhãn giá trị : 0=không, 1
=Có; để có thể sử dụng như biến định tính

IV. Diễn giải kết quả sau cùng

IV. Diễn giải kết quả
Lõi cơ bản của mô hình
Các biến số mạnh nhất

I. Xây dựng mô hình tối ưu

Chọn lọc biến số

Xác định « lõi » cơ bản

Phân tích hồi quy logistic đơn biến
So sánh với mô hình M0
Sử dụng phương pháp Stepwise,
Thoái triển hoặc tiến triển
Chuyển dạng biến số (ví dụ: Định
lượng thành định tính)

Thăm dò từng nhóm biến số

Mô hình tối ưu

Loại bỏ dần những biến số không
quan trọng
Kiểm tra tương tác giữa các biến số

Các biến số phụ
cần kiểm tra

Hộp thoại logistic Regression sẽ mở ra như bên dưới

3

Biến số phụ thuộc (giá trị cần dự báo: Y)

4

Danh sách tất cả
biến số hiện có

Các tùy chỉnh thống kê

Các biến số độc lập
(yếu tố dự báo)
Hộp thoại tùy chỉnh
phương pháp hồi
quy

Vì Phân tích hồi quy logistic không có quy trình nào cụ thể, nó có thể thiên biến vạn hóa tùy vào hoàn cảnh và mục đích, nên
Nhi sẽ không đi theo quy trình như những tài liệu trước. Trước hết, Nhi sẽ mô tả tính năng của giao diện SPSS, sau đó chính
bạn sẽ áp dụng những tính năng này tùy theo hoàn cảnh và nhu cầu riêng.
Trong hộp thoại Logistic regression, có 3 thành phần cần quan tâm:
- Ô Dependent: đây là nơi bạn sẽ khai báo biến số cần dự báo (Y), trong thí dụ này là Tử vong, đây bắt buộc phải là một
biến định tính nhị phân. Một khi biến số này được khai báo xong, bạn mới có thể đi tiếp những bước tiếp theo.
- Ô Covariates là nơi nhập những biến số độc lập (hay yếu tố dự báo: X), lúc này bạn không cần quan tâm lắm đến thứ tự
các Block cũng như Method, tất cả mọi thứ sẽ được giải thích rõ ràng trong những trang tiếp theo.
- Danh mục các tùy chỉnh thống kê: Bao gồm 3 mục chính là: chức năng sao lưu và kiểm tra (Save), Các tùy chỉnh phụ
(Option), Bootstrap (phương pháp chọn mẫu ngẫu nhiên lặp lại, để mở rộng giá trị phổ quát cho mô hình).

Bắt buộc phải đi theo các bước này trước khi tiến hành phân tích hồi quy.
Trong trường hợp đưa nhiều biến số định tính vào mô hình cùng lúc, bạn cần khai báo
cho tất cả, không để sót biến nào.

4

5

3

3.2 Đưa biến số vào mô hình

Khi nhấn vào « Indicator », ta sẽ thấy 1 danh sách các kiểu tương phản được mở ra như hình bên.
Nếu biến định tính chỉ gồm 2 giá trị (ví dụ có/không), ta dùng Indicator.
Các kiểu tương phản đơn giản (Simple), Difference, Helmert, Polynomial… chỉ áp dụng cho những biến số định
tính nhiều giá trị hoặc biến thứ hạng.

Giá trị làm nhóm chứng thường là « không » . Nếu ta mã hóa nó bằng 1 con số nhỏ
hơn giá trị « Có » , ta sẽ chọn: First
Ví dụ: 1=Không, 2=Có hoặc 0=Không/1=Có
Ngược lại, nếu ta mã hóa nó bằng con số lớn, ta sẽ chọn Last
Ví dụ: 1=Có,2=không
Trong trường hợp có nhiều giá trị, ta cũng căn cứ vào vị trí của giá trị làm chứng để
chọn First hay Last
Ví dụ: 1=Không có triệu chứng, 2=Nhẹ, 3=trung bình, 4= nặng, ta chọn First
Nếu ta chọn giá trị cao nhất làm nhóm chứng (ví dụ cho một yếu tố bảo vệ thay vì yếu
tố nguy cơ), ta có thể chọn last.

Việc chọn kiểu tương phản và vị trí của giá trị làm nhóm chứng rất quan trọng, nó sẽ quyết định giá trị (dấu) của hệ số b

định nghĩa như 1 biến số mới X’ = X1*X2

3
1
2

Để làm việc này : Đầu tiên ta chọn cả 2 biến số
cần xét: ví dụ Lệch đường giữa và Thể tích xuất
huyết
Sau đó nhấn nút >a*b
Trong danh sách biến số của mô hình sẽ xuất
hiện biến số mới, là tương tác giữa 2 biến số
này : Lech duong giua*The tich

Lưu ý:
Muốn xét tương quan X1*X2 trong mô
hình logistic, cả 3 biến số phải cùng tồn tại
trong mô hình
X1, X2 và X1*X2
Không thể xét riêng X1*X2 mà không có X1
hoặc X2

3

3.2 Các quy trình phân tích tự động

Phương pháp cưỡng bức (Enter method)
Đây là cách làm khá thô bạo, ta sẽ đưa 1 loạt biến số vào cùng một lúc và ép buộc máy tính phải cho ra một
mô hình chứa tất cả những biến số này (mô hình bão hòa biến số).

với 2 loại: Tiến triển hoặc Thoái triển.

SPSS
Danh sách biến số
M0

0

bo
So sánh (dựa vào LR hay Z):
M1 tốt hơn M0

Tiến triển

M1

M2

M3

M4

1

2

3

4

3

3.2 Các quy trình phân tích tự động
Phương pháp Thoái triển

SPSS
Danh sách biến số

M0

0

M1

1

bo

So sánh (dựa vào LR hay
Z): M1 tốt hơn M0

Thoái triển

So sánh (dựa vào LR hay
Z): M2 tốt hơn M1
M2

2

Thoái triển là phương pháp hiệu quả và chính xác nhất trong 3 loại, ta thường dùng phương pháp thoái triển để thăm dò và lọc
bỏ những biến số xấu khỏi danh sách, hoặc để khảo sát sự tương tác, triệt tiêu lẫn nhau giữa 1 biến số mới và tập hợp biến số
cũ. Cách làm này còn giúp ta lựa chọn 1 biến số tối ưu trong số nhiều biến có vai trò tương tự nhau, giữa biến định tính và biến
định lượng mô tả cùng 1 hiện tượng, đại lượng (Ví dụ: Biến « Cao huyết áp » và biến « số đo Huyết áp » cùng khảo sát một vấn
đề. Phương pháp thoái triển sẽ loại bỏ giùm cho ta biến số kém hiệu quả hơn.

3

3.2 Các quy trình phân tích tự động

1

Trong SPSS, khi đưa 1 loạt biến số vào cùng 1 block, tức là ta muốn phân tích tự động
Ta có thể chọn phương pháp phân tích tự động bằng cách nhấn nút Method: Một danh
sách sẽ mở ra, cho phép ta chọn nhiều phương pháp

Method

Ý nghĩa

Enter

Phương pháp cưỡng bức

Foward Conditional

Phương pháp tiến triển, dựa theo điều kiện

Foward LR

ta chủ động.
Xóa đi 1 block (rút bớt biến số khỏi mô hình) tương đương với phương pháp thăm dò thoái triển, nhưng quyết định về mô hình tối ưu hoàn
toàn do ta chủ động.
Lưu ý:
-Block 0 do SPSS tự động thực hiện cho tất cả mô hình, Block 0 chỉ có hằng số bo và mô hình M0 được sử dụng như tiêu chuẩn để so sánh với
những bước tiếp theo.
-SPSS chỉ cho phép thực hiện tối đa 9 Blocktrong một lần phân tích, tuy nhiên mỗi Block lại có thể chứa 1 hay nhiều biến số
- Phương pháp mặc định cho từng Block là Enter khi phân tích nhiều Bloc, tuy nhiên bạn có thể kết hợp thủ công và tự động, khi bạn quy định
cho SPSS làm Foward hay Backward riêng cho 1 block nào đó chứa nhiều biến số.

Lời khuyên của Nhi:
1) Phân tích thủ công đáng tin cậy hơn quy trình tự động do máy tính thực hiện
2) Phương pháp thoái triển đáng tin cậy hơn tiến triển
3) Tiêu chuẩn so sánh dùng Likelihood ratio đáng tin cậy hơn test Z của Wald
4) Mô hình tối ưu là mô hình cân bằng giữa sự phức tạp và chính xác, tức là nó nên chứa càng ít biến số càng tốt
nhưng đảm bảo khả năng dự báo chính xác cao nhất có thể.

3

3.4 Tùy chỉnh thống kê

Sau khi khai báo xong các biến số, ta
có thể nhấn nút Option để mở hộp
thoại tùy chỉnh thống kê

Hộp thoại Options cho phép thiết lập thêm một số test thống kê hỗ trợ cho việc so sánh, đánh giá chất lượng mô hình
Classification plot: biểu đồ phân loại, đây là 1 histogram của giá trị thực/giá trị dự báo của Y, giúp đánh giá nhanh chóng mức độ phù
hợp giữa mô hình và dữ liệu thực tế
Hosmer Lemeshow goodness: of fit : Cho phép đánh giá mức độ phù hợp giữa mô hình được chọn và dữ liệu

Bạn đừng lo lắng vì điều này, đó là do chọn mẫu ngẫu nhiên.

Cách diễn giải kết quả hồi quy logistic

4

Case Processing Summary

1
Unweighted

Casesa

Selected Cases

Included in Analysis

N

Percent

109

100,0

0

,0

Không

0

Có

1

3

Bảng thứ 2 Dependent Variable Encoding
Xác nhận quy tắc mã hóa giá trị cho biến số định tính nhị phân cần dự báo, ở đây là Tử vong,
0=Không, 1=Có

Categorical Variables Codings

Bảng thứ 3: Categorical Variables Codings

Parameter
coding
Lệch đường giữa
Trên 80 tuổi

Frequency

(1)

Không

Block 0 tương ứng với mô hình chỉ chứa hằng số, không có bất cứ biến số nào cả. Hay nói cách khác, Block 0 đồng nghĩa với việc dự báo hoàn toàn
ngẫu nhiên không theo mô hình nào cả.

Classification Tablea,b

4

Predicted
Tử vong
Tử vong

Số trường hợp dự báo đúng = dương tính thật + âm tính thật (TN+TP)

Percentage

Không

Có

Correct

Không

70

0

100,0

Có

B

Step 0

Constant

-,585

S.E.
,200

Wald
8,569

df

Sig.
1

,003

Exp(B)
,557

Bảng variable cho Block 0 cho biết giá trị của hằng số bo = -0,585, có ý nghĩa thống kê
(p=0,003)

Cách diễn giải kết quả hồi quy logistic

và Nagelkerke.
Thông thường ta quan tâm đến R2 của Nagelkerke.

a. Estimation terminated at iteration number 7 because
parameter estimates changed by less than ,001.

Diễn giải giá trị R2: Mô hình cho phép giải thích 76,7% sự thay đổi về phân
phối của biến cố tử vong trong mẫu khảo sát

Classification Tablea

7

Trong bảng phân loại kết quả dự báo Block 1, ta chú ý vào ô cuối cùng của
cột Percentage correct, nó cho biết mô hình đang xét dự báo chính xác
trong bao nhiêu % trường hợp.

Predicted
Tử vong
Không

Có

Correct

Không

63

7

Variables in the Equation

8

95% C.I.for EXP(B)

Step

1a

B

S.E.

Wald

df

Sig.

Exp(B)

Lower

Upper

Glasgow

-,604

704,136

Lech_duong_giua(1)

1,858

,797

5,439

1

,020

6,413

1,345

30,565

HAttruong

,040

,022

3,286

1

Hệ số b

Sai số của b Trị số Z

Odds-ratio bà CI95% của
nó cho từng yếu tố dự báo

Đây là bảng kết quả quan trọng nhất, nó trình bày nội dung của mô hình hồi quy logistic, bao gồm những thông tin chính như sau:
Mỗi hàng tương ứng cho một biến số dự báo, bao gồm hằng số C, ở đây ta có mô hình gồm 4 biến số dự báo từ trên xuống: điểm Glasgow, Tuổi cao
>80, lệch đường giữa, Huyết áp tâm trương.
Những cột kết quả quan trọng nhất là : Hệ số B tương ứng mỗi biến số dự báo; Sig. cho biết ý nghĩa thống kê của kiểm định Wald cho mỗi biến số dự
báo; Exp(B) chính là odds-ratio cho từng yếu tố, kèm theo ngưỡng trên và dưới khoảng tin cậy 95% cho odds-ratio.
Cách diễn giải những thông số này sẽ được trình bày trong trang tiếp theo.

4

Cách diễn giải kết quả hồi quy logistic
Tỉ số nguy cơ (odds-ratio) cho từng yếu tố : Định nghĩa và cách diễn giải

Trên thực tế, người ta không thích diễn giải trực tiếp giá trị của hệ số b mà lại thích sử dụng giá trị Exp(b) với ý nghĩa như một tỉ số nguy cơ (Oddsratio) cho biến số mà đang xét. Như ta từng biết:
𝑶𝒅𝒅𝒔 =

𝑷(𝒙ả𝒚 𝒓𝒂 𝒔ự 𝒌𝒊ệ𝒏)
𝑷(𝒌𝒉ô𝒏𝒈 𝒙ả𝒚 𝒓𝒂 𝒔ự 𝒌𝒊ệ𝒏)

Odds-ratio = 𝑛𝑔𝑢𝑦 𝑐ơ 𝑥ả𝑦 𝑟𝑎 𝑠ự 𝑘𝑖ệ𝑛 𝑌 =
Trong mô hình hồi quy logistic ta lại có:

khi không có X.
Quy tắc thứ 4: Chú ý khoảng tin cậy95%
Cho dù kiểm định Wald có ý nghĩa, nhưng nếu CI95% của Exp(B) có chứa giá trị 1, biến số X cũng không có ý nghĩa phổ quát, vì trong quần thể
chung sẽ có trường hợp Odss-ratio = 1. Cả 2 ngưỡng CI95% đều phải <1 hay > 1. Nên sử dụng CI95% tính bởi Bootstrap vì kết quả này chính xác
hơn.
Variables in the Equation
95% C.I.for EXP(B)

Step 1a

B

S.E.

Wald

df

Sig.

Exp(B)

Lower

Upper

Glasgow

-,604

704,136

Lech_duong_giua(1)

1,858

,797

5,439

1

,020

6,413

1,345

30,565

HAttruong

,040

,022

3,286

1

HA tâm trương không phải là một yếu tố dự báo có ý nghĩa, Odds-ratio của nó gần với 1, và CI95% cũng chứa giá trị 1. Mô hình dự báo này chưa phải là
tối ưu, HA tâm trương có thể được loại bỏ khỏi mô hình.

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - HỒI QUI logistic CHO BIẾN SỐ NHỊ PHÂN - Pdf 34

Tài liệu, ebook tham khảo khác

Học thêm