Đề tài thảo luận
HIỆN TƯỢNG ĐA CỘNG TUYẾN
1. Tìm bộ số liệu ở đó có chứa hiện tượng đa cộng tuyến, chỉ ra sự tồn tại của
đa cộng tuyến.
2. Khắc phục hiện tượng.
PHẦN I: LÝ THUYẾT
1. Định nghĩa
Giả sử ta phải ước lượng hàm hồi quy Y gồm k biến giải thích X1, X2, X3,
…, Xk :
Mô hình trên được gọi là có hiện tượng đa cộng tuyến, nếu các biến độc lập
X1, X2, X3,…, Xk
có quan hệ tuyến tính với nhau.
1.1 Đa cộng tuyến hoàn hảo
Đa cộng tuyến hoàn hảo xảy ra khi tồn tại bộ :
( ) sao cho:
1.2 Đa cộng tuyến không hoàn hảo.
Đa cộng tuyến không hoàn hảo xảy ra khi khi tồn tại bộ:
) và sai số ngẫu nhiên V sao cho:
Trong thực tế thì không xảy ra hiện tượng đa cộng tuyến hoàn hảo. Sau này,
khi xét đến hiện tượng đa cộng tuyến thì ta hiểu là hiện tượng đa cộng tuyến
không hoàn hảo.
2. Hệ quả của đa cộng tuyến
- Các ước lượng ,…, vẫn là các ước lượng không chệch của
. Tuy nhiên, do det ( nhỏ nên sẽ xảy ra các điều
sau:
+ Phương sai của các ước lượng sẽ lớn dẫn đến ước lượng điểm sẽ kém
chính xác.
+ Khoảng ước lượng sẽ rộng ra.
+ Tỉ số nhỏ dẫn đến mất ý nghĩa.
2
i
:
F=
)1/()1(
)2/(
2
2
+−−
−
knR
kR
i
i
F
i
tuân theo phân phối F với k – 2 và n-k +1 bậc tự do. Trong đó n là , k là
số biến giải thích kể cả hệ số chặn trong mô hình. R
2
i
là hệ số xác định trong
hồi quy của biến X
i
theo các biến X khác. Nếu F
i
tính được vượt điểm tới
hạn F
i
(k-2,n-k+1) ở mức ý nghĩa đã cho thì có nghĩa là X
i
Giả sử trong mô hình hồi quy của ta có Y là biến được giải thích còn
là các biến giải thích. Chúng ta thấy rằng tương quan
chặt chẽ với . Khi đó, nhiều thông tin về Y chứa ở thì cũng chứa ở
. Vậy nếu ta bỏ một trong hai biến hoặc khỏi mô hình hồi quy,
ta sẽ giải quyết được vấn đề đa cộng tuyến nhưng sẽ mất đi một số thông
tin về Y.
Bằng phép so sánh và trong các phép hồi quy khác nhau mà có và
không có một trong hai biến chúng ta có thể quyết định nên bỏ biến nào
trong hai biến và khỏi mô hình.
Ví dụ: đối với hồi quy của Y đối với tất cả các biến
; khi loại biến là 0,87 và khi loại biến
là 0,92. Như vậy, trong trường hợp này ta loại .
4.4 Sử dụng sai phân cấp môt.
Ví dụ: Chúng ta có số liệu chuỗi thời gian biểu thị lien hệ giữa biến Y và
các biến phụ thuộc và theo mô hình sau:
(1)
Trong đó, t là thời gian. Phương trình trên đúng với t thì cũng đúng với
t-1 nghĩa là:
(2)
Từ (1) và (2) ta có:
(3)
Đặt: ; ; ;
Ta được: (4)
Mô hình hồi quy dạng (4) thường làm giảm tính nghiêm trọng của đa
cộng tuyến vì dù và có thể tương quan cao nhưng không có lý
do tiên nghiệm nào chắc chắn rằng sai phân của chúng cũng tương
quan cao.
Tuy nhiên, biến đổi sai phân bậc nhất sinh ra một số vấn đề chẳng hạn
như số hạng sai số trong (4) có thể không thỏa mãn giả thiết của
mô hình hồi quy tuyến tính cổ điển là các nhiễu không tương quan.
1999 118040 14186 503564
2000 111997 14778 531982
Gọi Y là chi phí chăm sóc y tế cho người cao tuổi ( 100 triệu Yên)
Mức ý nghĩa
là số người được chăm sóc y tế dành cho người cao tuổi ( 1000
người)
là chi phí an sinh xã hội của Nhật Bản (100 triệu Yên)
2.2 Xử lí số liệu bằng eview
Hồi quy Y theo và :
2.3 Lập mô hình hàm hồi quy
Từ kết quả ước lượng bằng eview ta thu được hàm hồi quy mẫu sau:
Nhận xét các tham số:
● 8196,124: khi số người được chăm sóc y tế cho người
cao tuổi bằng 0 và tổng chi phí an sinh xã hội bằng 0 thì chi phí
chăm sóc y tế cho người cao tuổi trung bình là -816912400000
Yên.
● = 0,782672: với tổng chi phí an sinh xã hội không đổi thì khi
số người được chăm sóc y tế cho người cao tuổi tăng lên 1000
người thì chi phí chăm sóc y tế cho người cao tuổi tăng lên
78267200 Yên.
● 0,218021: với số người được chăm sóc y tế không đổi thì
khi tổng chi phí an sinh xã hội tăng lên 100 triệu Yên thì chi phí
chăm sóc y tế cho người cao tuổi tăng lên 21802100 Yên.
2.4 Phát hiện hiện tượng đa cộng tuyến
2.4.1.Hệ số xác định cao nhưng tỉ số thấp
Ta thấy: = 0,989526 , = = 2,921
Thống kê t của hệ số ứng với biến :
t =0,156335 < 2,921
Thống kê t của hệ số ứng với biến :
t = 2,283768 < 2,921
= 0,986512
Vậy:
Vậy ta nghi ngờ có hiện tượng đa cộng tuyến xảy ra.
2.5 Khắc phục hiện tượng đa cộng tuyến
2.5.1 Bỏ biến
Bước 1: Hồi quy Y theo và
Bước 2: Hồi quy Y theo thu được
Bước 3: Hồi quy Y theo thu được
Bước 4: So sánh , , và đưa ra kết luận.
Hồi quy Y theo và
Hồi quy Y theo
Hồi quy Y theo
Theo kết quả hồi quy ta có:
Khi hồi quy Y theo , : = 0,989526
Khi ta bỏ biến ra khỏi mô hình: = 0,985324
Khi ta bỏ biến ra khỏi mô hình: = 0,989506
Ta thấy > nên ta loại bỏ biến .
2.5.2 Sử dụng sai phân cấp một
Chúng ta có số liệu chuỗi thời gian biểu thị liên hệ giữa biến Y và các
biến phụ thuộc theo mô hình sau:
Trong đó t là thời gian. Phương trình trên đúng với t thì cũng đúng với t-
1 nghĩa là:
Trừ ( cho ( ta được:
Đặt:
Ta thu được bản số liệu mới:
y
3704 327 22753
3932 321 14957