Ứng dụng phân tích hồi quy - Pdf 13

VIỆN NGHIÊN CỨU Y XÃ HỘI HỌC
Ứng dụng phân tích hồi quy
Nguyễn Trương Nam

Copyright – Bản quyền thuộc về tác giả và thongke.info. Khi sử dụng một
phần hoặc toàn bộ bài giảng đề nghị mọi người trích dẫn: tên tác giả và
thongke.info. Ví dụ: Nguyễn Thị Linh – Thongke.info.

Nội dung

 Tại sao cần phân tích hồi quy?
 Các bước xây dựng mô hình hồi quy
 Hồi quy tuyến tính đa biến
 Hồi quy logic  Đây là ví dụ về hồi quy đa biến, chúng ta ước tính
Y=Điểm tổng kết năm đầu tiên đại học X1=xếp
hạng THPT, X2= Điểm thi vào đại học, X3=giới
tính.
Tại sao cần phân tích hồi quy?
 Trong nghiên cứu bán thử nghiệm (quasi-experiment), nghiên cứu viên
không thể có khả năng thay đổi (manipulate) các biến độc lập, do đó
thường có các biến nhiễu xuất hiện. Chúng ta cố gắng để khắc phục
tình huống này bằng phương pháp thống kê cụ thể là sử dụng hồi quy
đa biến.
 Trong hồi quy đa biến mối liên hệ của biến phụ thuộc (kết quả) và biến
độc lập (tác động) được đánh giá trong khi kiểm soát các biến nhiễu

%
Không
tiếp cận
dự án
%

Tiếp cận
dự án
%
Không
tiếp cận
dự án
%

Tiếp cận
dự án
%
Không
tiếp cận
dự án
%
Tổng
%
Có kiến thức
đúng về
HIV/AIDS
57.6*** 29.8 54.9** 28.9 56.9*** 29.5 39.7
Điểm TB về
kiến thức
HIV± SD

Không sử dụng (TC) - -
Sử dụng ma túy, không chích 1.61* (1.02, 2.53)
Chích ma túy 2.02** (1.19, 3.45)
Nghề kiếm sống
Bán hàng rong hoặc đánh giày (TC) - -
Làm việc phạm pháp 0.80 (0.46, 1.40)
Bán dâm 1.04 (0.57, 1.90)
Lao động phổ thông 0.78 (0.48, 1.26)
Thất nghiệp/không có thu nhập 0.42* (0.19, 0.92)
¥
Các biến kiểm soát: giới, tuổi, MSM và nghề kiếm sống.
* P < 0.05, ** P < 0.01, *** P < 0.001

Bảng: So sánh mức độ sử dụng BCS với PNMD trong vòng 6 tháng qua giữa nhóm tiếp
cận và không tiếp cận dự án Tiếp cận với dự
án
N=29
%
Không tiếp cận với
dự án
N=48
%
Tổng
N=77
%
Mức độ sử dụng BCS với
PNMD

Tiêm chích 0.13* (0.02, 0.91)
Mối quan hệ giữa tiếp cận dự án và sử dụng BCS trong phân tích đa biến không
còn ý nghĩa thống kê (P > 0.005). Kết quả này khác so với các phân tích đôi biến,
bởi vì mô hình đa biến kiểm soát các yếu tố nhiễu tiềm tàng
Hồi quy logic giữa sử dụng bao cao su với PNMD và tiếp cân với dự án NAM
*P < .05 **P<.01 ***P<.001 Xây dựng mô hình hồi quy: đa biến, logic
Hồi quy đa biến
 Y = Biến phụ thuộc, liên tục
 X1, X2,… Tất cả các biến độc lập là liên tục
hoặc
 X1, X2, … Các biến độc lập bao gồm cả
biến liên tục và biến nhị phân (dummy).
 X1, X2, … Tất cả các biến độc lập là biến
nhị phân (dummy).
Hồi quy Logic
 Y: Biến phụ thuộc là biến nhị phân (biến
đầu ra).
 X1, X2,… Tất cả các biến độc lập là biến
liên tục hoặc
 X1, X2, … Các biến độc lập bao gồm cả
biến liên tục và biến nhị phân (dummy).
 X1, X2, … Tất cả các biến độc lập là biến
nhị phân (dummy).
Ví dụ.
 Hồi quy đa biến (Multiple Regression)
◦ Số lần khám thai = b0 + b1(tuổi) + b2(dân tộc)+
b3(học vấn) + b4(tình trạng hôn nhân).

 X1, X2, X3: Biến độc lập (biến dự đoán).
 Mô hình hồi quy đa biến lý tưởng là mô hình có các biến độc lập có
mối liên quan lớn (tuyến tính) với Y (biến phụ thuộc) và biến độc lập
tương đối độc lập với nhau.
 Điều này đặt ra câu hỏi chung là làm thế nào để thiết kế mô hình hồi đa
biến tốt?. Trong trường hợp chúng ta đang sư dụng hồi quy đa biến để
kiểm định giả thuyết, tốt nhất là nên dựa vào chính giả thuyết đó để
quyết định những biến độc lập nào sẽ được sử dụng trong mô hình.
 Nhưng trong việc thiết kế mô hình tốt để kiểm định một giả thuyết,
chúng ta cũng cần phải dùng một số các tiêu chí thống kê đã được đề
cập để quyết định xây dựng mô hình.
James Cotter (2001) HUMD5122-Applied
Regression Analysis
Các nguyên tắc để thiết kế mô hình hồi quy đa
biến tốt.

 Cố gắng đưa tất cả các biến có liên quan quan trọng vào
mô hình hồi quy (nếu không thì tham số ước tính có thể bị
sai số). Trong nghiên cứu bán thử nghiệm, chúng ta cố
gắng đưa tất cả các biến nhiễu không kiểm soát được quan
trọng vào mô hình.
 Đảm bảo sự cân bằng giữa mô hình ít tham số“Parsimony”
và “Good fit” (có thể làm tăng lên bằng cách thêm các
tham số).
 Không nên sử dụng quá nhiều biến độc lập cho một số hạn
đinh đối tượng nghiên cứu. Một nguyên tắc là mỗi biến
độc lập được đưa vào mô hình phải có ít nhất 20 đối tượng
quan sát (Tốt nhất là 40-50 đối tượng cho 1 biến độc lập,
nhất là khi xây dựng luận thuyết).
Các nguyên tắc để thiết kế mô hình hồi quy đa

3. Học vấn (q10)
4. Tình trạng hôn nhân (q5)
5. Nghề nghiệp (Q8)

2/ Mô hình hồi quy logistic.
 Biến phụ thuộc: Đã từng nạo phá thai chưa? (Q40_recode).
 Các biến độc lập.
1. Tuổi (Q2)
2. Dân tộc (q3)
3. Học vấn (q10)
4. Tình trạng hôn nhân (q5)
5. Nghề nghiệp (Q8)
6. Tuổi quan hệ tình dục lần đầu (Q27).
Chuẩn bị các biến cho mô hình hồi quy
(Variable transformation for regression).
1/ Kiểm tra sự phân bố chuẩn của biến phụ thuộc.
2/ Kiểm tra tính độc lập-không tương quan của các biến độc
lập.
3/ tạo hoặc recode lại các biến độc lâp danh mục thành các
biến dummy.
◦ Với các biến có 2 lựa chọn trả lời, recode lại thành 1 và 0.
◦ Với những biến có từ 3 lựa chọn trả lời trở lên, thì sẽ tạo các biến
dummy (1-0) cho mỗi lựa chọn. Đưa (n-1) biến vào mô hình (biến
còn lại mà không được đưa vào mô hình sẽ là biến tham khảo -
reference cho các biến khác).
Ví dụ: Hồi quy đa biến.

 Hồi quy đa biến (Multiple Regression)
◦ Số lần đi khám thai = b0 + b1(tuổi) + b2(dân
tộc)+ b3(học vấn) + b4(tình trạng hôn nhân) +


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status