1
Hồi qui logistic
2
Các nội dung chính
Hồi qui của một biến lưỡng phân
Tỷ lệ (odds)
Mô hình logistic
Ước lượng của mô hình
Tỷ số tỉ lệ Odds ratio
3
Hồi qui của một biến lưỡng
phân
Xem xét mối liên hệ :
Thành công hoặc thất bại của một doanh
nghiệp mới (y)
với các đặc điểm của chủ doanh nghiệp :
Tuổi (x
1
)
Năm kinh nghiệm (x
2
)
Học vấn (x
3
)
4
Thiết lập mô hình thứ nhất
Mã hoá của y:
y=1 nếu thành công
y=0 nếu thất bại
Mô hình tuyến tính nói chung có dạng:
1
+ a
2
X
2
7
Tỉ lệ (Odds)
Tỷ tỉ lệ giữa xác suất quan sát một sự kiện trên
xác suất không quan sát nó
Ví dụ:
Nếu xác suất thành công của doanh nghiệp mới là
0,8, thì:
Cơ hội để doanh nghiệp thành công gấp 4 lần so
với thất bại
)E(P1
)E(P
odds
E
4
2,0
8,0
)S(P1
)S(P
odds
s
Chúng ta thiết lập mô hình logarít của tỉ lệ (odds) :
3322110
xxx
1
ln bbbb
3
3
2
2
1
0
1
3
3
2
2
1
10
xxxexp1
x
yPyE
bb
bb
10
10
exp1
exp
)1()(
x
1
0
E(y)
Xác suất, tỉ lệ (odds), logarít là 3 dạng khác nhau của
cùng một thứ
11
Mô hình logistic
0
x
1
E(y)
tiếp
x
1
E(y)
0
12
Hồi qui logistic
Giả sử rằng ta có một biến phụ thuộc y có các giá trị
là 0 và 1 mà ta cần giải thích bằng 3 biến độc lập liên
)
0
(
)
1
(
3322110
3322110
3322110
3322110
xxxFyP
xxxFyP
xxxPyP
x
x
x
P
y
P
bbbb
bbbb
bbbb
b
b
b
b
10
xxxexp1
xxxexp
)1y(P
bb
b
b
b
b
b
b
3
3
2
2
1
10
)1( xxxyP
b
b
b
b
phải là giá trị làm cực đại xác suất đạt được các giá
trị quan sát trên X.
Qui trình:
Xác định hàm của , FV(), được gọi là hàm hợp lý, nó cho
phép mô tả xác suất đạt được các giá trị quan sát của X
Cực đại hóa hàm này đối với
16
Cực đại hàm hợp lý
FV()=f(X
1
;)xf(X
2
;)x…xf(X
n
;)
Nếu X là một biến rời rạc, FV() là tích các xác suất
Nếu X là một biến liên tục, FV() là tích các hàm mật độ
xác suất
Cực đại hóa FV() hoặc hàm hợp lý
FV() đạt cực đại với giá trị của khi giá trị này bỏ đạo
hàm bậc nhất
tiếp
0
)(
FV
n
Hàm mật độ của một biến X phân phối chuẩn là:
tiếp
2
2
)(
2
1
.
2
1
)(
X
eXf
19
Cực đại hàm hợp lý
Đối với một giá cụ thể của X
i
Hàm hợp lý
tiếp
2
2
)(
2
X
n
n
i
i
eXfFV
1
2
2
)(
2
1
1
2
.
2
1
)(),(
20
Cực đại hàm hợp lý
Hàm logarit hợp lý
Lấy đạo hàm
tiếp
n
i
i
n
i
i
n
i
i
X
nnL
XXf
L
1
2
422
2
1
n
i
i
n
i
i
XX
n
XX
n
1
22
1
)(
1
ˆ
1
ˆ
22
Ví dụ
Trong 700 người vay tiền ngân hàng, ta có
thông tin sau :
Người (y) khó khăn khi hoàn trả (1) hoặc
không khó khăn (0)
Số năm làm việc với cùng một ông chủ
(employ)
Tỷ số nợ so với thu nhập (nợ).
23
Step
Block
Model
Step 1
Chi-square df Sig.