i
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
PHÙNG THỊ THU
SỬ DỤNG MÔ HÌNH HỒI QUY DỮ LIỆU MẢNG
ĐÁNH GIÁ TÁC ĐỘNG CỦA CƠ CẤU NGUỒN VỐN
ĐẾN HIỆU QUẢ KINH DOANH CỦA DOANH NGHIỆP
NGÀNH NGÂN HÀNG TRÊN TTCK VIỆT NAM
LUẬN VĂN THẠC SĨ TOÁN HỌC
HÀ NỘI - 2017
ii
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
PHÙNG THỊ THU
SỬ DỤNG MÔ HÌNH HỒI QUY DỮ LIỆU MẢNG
ĐÁNH GIÁ TÁC ĐỘNG CỦA CƠ CẤU NGUỒN VỐN
ĐẾN HIỆU QUẢ KINH DOANH CỦA DOANH NGHIỆP
NGÀNH NGÂN HÀNG TRÊN TTCK VIỆT NAM
Chuyên ngành: Toán ứng dụng
Mã số: 60 46 01 12
LUẬN VĂN THẠC SĨ TOÁN HỌC
kết quả nghiên cứu trong luận văn là trung thực không trùng với bất kỳ luận
văn nào khác.
Tôi cũng xin cam đoan r ng mọi sự giúp đỡ cho việc thực hiện luận văn
này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ
nguồn gốc.
TÁC GIẢ
Phùng Thị Thu
v
MỤC LỤC
PHẦN MỞ ĐẦU .............................................................................................. 1
CHƢƠNG I ...................................................................................................... 3
MỘT SỐ KIẾN THỨC CHUẨN BỊ .............................................................. 3
1.1. Một số khái niệm ban đầu. ..................................................................................... 3
1.1.1. Quá trình ngẫu nhiên. ...................................................................... 3
1.1.2. Quá trình dừng ................................................................................ 3
1.1.3. Nhiễu trắng .................................................................................... 4
1.2. Một số phân phối thông dụng .................................................................... 4
1.2.1. Phân phối chuẩn .............................................................................. 4
1.2.2. Phân phối T – Student ..................................................................... 6
1.2.3. Phân phối Khi Bình phương ........................................................... 6
1.2.4. Phân phối Fisher.............................................................................. 7
1.3. Mô hình hồi quy tuyến tính.................................................................................... 8
1.3.1. Mô hình hồi quy tuyến tính bội và phương pháp OLS ................... 8
1.3.2. Mô hình hồi quy dữ liệu chuỗi thời gian ...................................... 14
1.3.2.1. Dữ liệu chuỗi thời gian .......................................................... 14
1.3.2.2. Mô hình hồi quy chuỗi thời gian ............................................ 14
KINH DOANH CỦA CÁC DOANH NGHIỆP NGÀNH NGÂN HÀNG
TRÊN TTCK VIỆT NAM ............................................................................ 55
3.1. Giới thiệu về ngành ngân hàng….. .....................................................................55
3.2. Xây dựng mô hình hồi quy các nhân tố tác động của cơ cấu nguồn vốn đến
hiệu quả kinh doanh của doanh nghiệp ngành ngân hàng........................................56
3.3. Giới thiệu phần mềm STATA .............................................................................57
3.4. Ứng dụng STATA phân tích mô hình hồi quy dữ liệu mảng đánh giá tác động
của cơ cấu nguồn vốn đến hiệu quả kinh doanh của các doanh nghiệp ngành ngân
hàng trên TTCK Việt Nam..........................................................................................58
3.5. Thảo luận kết quả mô hình hồi quy.......................................................... 68
III. Kết luận ................................................................................................... 70
IV. Danh mục các tài liệu tham khảo .......................................................... 71
vii
DANH MỤC ĐỒ THỊ VÀ BẢNG BIỂU
Hình 1.1: Đồ thị hàm mật độ của phân phối chuẩn......................................... . 5
Hình 1.2: Đồ thị hàm mật độ của phân phối T-Student. ................................... 6
Hình 1.3: Đồ thị hàm phân phối xác suất biến ngẫu nhiên của phân phối khi
bình phương. ..................................................................................................... 7
Hình 1.4: Minh hoạ đồ thị hàm phân phối F(1;2). ............................................ 8
Hình 1.5: Minh hoạ quan hệ Ut và Us. ............................................................ 16
Bảng 3.1: Danh sách các ngân hàng. .............................................................. 56
Bảng 3.2: Thống kê mô các biến nghiên cứu trong mô hình. ......................... 58
Bảng 3.3: Hệ số tương quan giữa các biến trong mô hình.............................. 59
Bảng 3.4: Hệ số VIF của các biến độc lập trong mô hình. ............................. 59
Bảng 3.5: Bảng kiểm định tính dừng của biến độc lập CCTS. ....................... 60
Bảng 3.6: Kết quả kiểm định tính dừng của các biến trong mô hình. ............ 61
Bảng 3.7: Kiểm tra tính dừng của phần dư. .................................................... 61
FEM
Mô hình các ảnh hưởng cố định (Fixed Effects Model)
KNTT
Hệ số khả năng thanh toán
LSDV
REM
(ECM)
Mô hình hồi quy biến giả bình phương nhỏ nhất (Least Square
Dummy Variable)
Mô hình ảnh hưởng ngẫu nhiên (Random Effects Model, REM)
hay mô hình các thành phần sai số (Error Components Model,
ECM)
ROA
Tỷ suất lợi nhuận sau thuế trên vốn kinh doanh
ROE
Tỷ suất lợi nhuận vốn chủ sở hữu
ROS
Tỷ suất lợi nhuận sau thuế trên doanh thu
ngành Ngân hàng trong thời gian từ năm 2008-2015, một nhóm ngành có
nhiều biến động nhưng vẫn được cho là trụ cột trên TTCK Việt Nam trong
thời gian qua để thực hiện đề tài.
2. Mục đích nghiên cứu
- Nghiên cứu và tìm hiểu kỹ mô hình hồi quy, trong đó đề tài tập trung
vào mô hình hồi quy tác động cố định và mô hình hồi quy tác động ngẫu nhiên
ứng dụng trên dữ liệu mảng. Đây là một trong những mô hình Kinh tế lượng
được ứng dụng rộng rãi trong nghiên cứu tài chính của các doanh nghiệp.
- Đề tài sẽ sử dụng phần mềm STATA (một trong ba phần mềm xử lý và
phân tích dữ liệu thông dụng nhất trên thế giới hiện nay và là phần mềm có ưu
thế vượt trội trong phân tích Hồi quy) để thực hiện phân tích và đánh giá kết
quả nghiên cứu. Đề tài tập trung làm rõ các bước thực hiện khi ứng dụng mô
2
hình hồi tác động cố định và mô hình hồi quy tác động ngẫu nhiên đánh giá
tác động của cơ cấu nguồn vốn đến hiệu quả kinh doanh của doanh nghiệp
ngành ngân hàng Việt Nam.
3. Nhiệm vụ nghiên cứu
- Trình bày và làm rõ được cơ sở toán học của mô hình hồi quy tác động
cố định và mô hình hồi quy tác động ngẫu nhiên.
- Sử dụng được phầm mềm STATA để thực hiện ước lượng, kiểm định,
đánh giá hình hồi quy tác động cố định và mô hình hồi quy tác động ngẫu
nhiên trên một số liệu cụ thể.
4. Đối tƣợng và phạm vi nghiên cứu
Đối tượng: Mô hình hồi quy tác động cố định và hồi quy tác động ngẫu
nhiên trên dữ liệu mảng cân b ng.
Phạm vi nghiên cứu: Sử dụng các dữ liệu trong báo cáo tài chính của
các ngân hàng có niêm yết trên thị trường chứng khoán Việt Nam trong thời
gian từ năm 2008 - 2015 để thực hiện và phân tích đánh giá.
thì ký hiệu Y Yt , t T và gọi Y là hàm ngẫu nhiên (với tham biến t T ).
• Nếu T là tập đếm được thì ta gọi Y Yt , t T là quá trình ngẫu
nhiên với tham số rời rạc.
• Nếu T là một khoảng của đường thẳng thực, tức là T là một trong các
tập sau: , ;a, ; ,b;a,b ; a,b; a,b; a,b thì ta gọi Y Yt , t T
là quá trình ngẫu nhiên với tham số liên tục, trong đó t đóng vai trò thời gian.
1.1.2. Quá trình dừng
Quá trình ngẫu nhiên Y Yt , t T được gọi là quá trình dừng nếu kỳ
vọng, phương sai và hiệp phương sai không đổi theo thời gian, nghĩa là:
E(Yt )= t
var(Yt)=E(Yt- ) 2 = 2 t
4
k =cov(Yt,Yt-k)=E[(Yt- )(Yt-k- )] , t
1.1.3. Nhiễu trắng
Quá trình u t
được gọi là nhiễu trắng nếu mỗi thành phần của
t
chuỗi có kỳ vọng b ng 0, phương sai không đổi, hiệp phương sai b ng 0 và
không tự tương quan, tức là:
E(ut)=0, t
(1.1.3.1)
( x )2
2 2
Đồ thị của hàm mật độ này có dạng:
, ( x )
5
Hình 1.1 Đồ thị hàm mật độ của phân phối chuẩn.
.
Do hình dáng của hàm mật độ như hình 1.1 nên quy luật chuẩn còn
được gọi là quy luật phân phối hình chuông.
Dễ thấy hàm phân phối xác suất của biến ngẫu nhiên có phân phối
chuẩn có dạng:
1
Fx ( x)
2
x
e
( t )2
2 2
dt , ( x )
Suy ra V ( X ) 2 12 2
Vậy hai tham số µ và σ2 của quy luật chuẩn cũng là hai số đặc trưng kỳ
vọng và phương sai.
6
• Hệ số bất đối xứng và hệ số nhọn
Hệ số bất đối xứng của phân phối chuẩn
S
3 0
0
3 3
Vậy phân phối chuẩn là một phân phối đối xứng. Điều này cũng có thể
nhận thấy qua đồ thị hình chuông của hàm mật độ.
Hệ số nhọn của phân phối chuẩn:
4
3 4
K
3 4 3 0
4
Do kết quả này nên độ nhọn của quy luật chuẩn được dùng làm chuẩn
để đánh giá độ nhọn của các quy luật khác.
1.2.2. Phân phối T - Student
Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là tuân theo quy luật
phân phối Student với n bậc tự do, ký hiệu là T (n) , nếu hàm mật độ xác suất của
Dễ thấy đồ thị này có dạng đồ thị hàm mật độ chuẩn hóa N (0;1) nhưng
nhọn hơn.
1.2.3. Phân phối Khi Bình phƣơng
7
Định nghĩa: Biến ngẫu nhiên liên tục X được gọi là tuân theo quy luật
"Khi - bình phương" nếu hàm mật độ xác suất của nó có dạng:
(x ≤ 0)
0
f ( x, n)
x
2
1
n
2
2
n
2
e x
n
1
2
0 1
3 5 7
9 11 13 15 17 19 21 23 25 27 29
Hình 1.3 Đồ thị hàm phân phối xác suất của biến ngẫu nhiên
1.2.4. Phân phối Fisher
Định nghĩa : Biến ngẫu nhiên liên tục X được gọi là tuân theo quy luật
Fisher với bậc tự do thứ nhất là m và bậc tự do thứ hai là n nếu hàm mật độ
xác suất của nó có dạng:
8
mn
m
mn
m
2 m 2 2 1 m 2
f ( x, m, n)
x 1 x ( x 0)
n
m n n
2 2
FDIST(x,m,n) với chú ý r ng: FDIST(x,m,n) = P(F(m,n))>x). Đồ thị của hàm
1-CHIDIST(x,1,2)
phân phối xác suất F(m,n) có dạng như sau:
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0 1
3 5 7
9 11 13 15 17 19 21 23 25 27 29
Hình 1.4 Minh họa đồ thị hàm phân phối F(1,2)
1.3. Mô hình hồi quy tuyến tính
1.3.1. Mô hình hồi quy tuyến tính bội và phƣơng pháp OLS
Mô hình được giới thiệu với dữ liệu chéo
Dữ liệu chéo: Là các số liệu về một hoặc nhiều biến được thu thập tại một
thời điểm ở nhiều địa phương, đơn vị khác nhau.
Mô hình hồi quy có k biến có dạng nhƣ sau:
Mô hình hồi quy tuyến tính k biến có thể viết dưới dạng sau:
Giả thiết 4: Giữa các biến độc lập Xj (j = 2,3,…., k) không có mối quan
hệ đa cộng tuyến hoàn hảo, nghĩa là không tồn tại h ng số ( 2 ,...., k không
đồng thời b ng 0) sao cho: 2 X 2 ... k X k 0; j 0 ,j=2,3,…,k.
10
Ta thấy r ng nếu giữa các biến Xj (j = 2,3,…., k) là có quan hệ đa cộng
tuyến hoàn hảo thì sẽ có ít nhất một biến trong các biến này suy ra được từ
các biến còn lại, hay nói cách khác, thông tin từ biến này đã được chứa đựng
thông tin của các biến còn lại. Giả thiết 4 loại trừ tình huống còn lại.
Hãy xem xét ví dụ sau đây để minh họa giả thiết 4. Giả sử để xem xét
tác động của các hình thức đầu tư lên GDP, sử dụng hàm hồi quy sau đây:
GDP 1 2GI 3 PI 4 FDI 5 I u
Trong đó GI, DI, FDI và I lần lượt là đầu tư của khu vực nhà nước, đầu
tư từ khu vực tư nhân, đầu tư trực tiếp nước ngoài và tổng đầu tư. Khi đó mô
hình này sẽ bị vi phạm giả thiết 4 do giữa các biến độc lập trong mô hình trên
có quan hệ đa cộng tuyến hoàn hảo:
GI + PI + FDI - I = 0
Tương tự, giả sử để đánh giá tác động của từng loại phân bón lên năng
suất lúa, chúng ta sử dụng mô hình hồi quy sau đây:
NS 1 2 HC 2VC u
Với NS, HC, VC lần lượt là năng suất lúa, lượng phân bón hữu cơ và
lượng phân bón vô cơ. Nếu lượng phân bón hữu cơ và vơ cơ là không có liên
hệ với nhau thì mô hình trên không vi phạm giả thiết về không có đa cộng
tuyến hoàn hảo. Tuy nhiên nếu với mỗi 10kg phân hữu cơ, người nông dân lại
sử dụng 1kg phân vô cơ, khi đó ta có mối quan hệ đa cộng tuyến hoàn hảo
giữa hai biến này.
ước lượng này có thể viết hàm hồi quy mẫu như sau:
Y 1 2 X 2 ... k X k
Tại mỗi quan sát i, hàm hồi quy mẫu này được viết thành:
Yi 1 2 X 2i ... k X kt
Trong đó Yi là giá trị ước lượng cho Yi và sai lệch giữa hai giá trị này
được gọi là phần dư: ei = Yi –Yi .
Tương tự như với mô hình hồi quy hai biến, phương pháp OLS nh m xác
định các giá trị j ( j 1, k ) sao cho tổng bình phương các phần dư là bé nhất:
12
n
e (Y
i 1
2
1
1
1
x X 2 ... k X k )2
(1.3.1.2)
~ ~
i 1
kt
(Y1 1 2 X 2 ... k X kt ) 0
Với điều kiện số quan sát trong mẫu lớn hơn số hệ số hồi quy cần ước
lượng và giả thiết 4 được thỏa mãn thì hệ phương trình trên sẽ có nghiệm duy
nhất. Việc giải hệ phương trình này có thể được thực hiện một cách dễ dàng,
các phần mềm kinh tế lượng và thống kê hiện có đều có thể giải trong vòng
vài giây nếu số biến không quá lớn.
Phƣơng pháp bình phƣơng nhỏ nhất là tìm các ƣớc lƣợng sao cho:
e
2
i
(Yi ˆ1 ˆ2 X 2i ... ˆk X ki ) 2 min
Định lý Gauss Markov:
Định lý Gauss - Markov: Khi các giả thiết 1 - giả thiết 4 thỏa mãn thì
các ước lượng thu được từ phương pháp OLS là các ước lượng tuyến tính
không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính
không chệch.
Nói một cách khác, khi các giả thiết 1 đến giả thiết 4 được thỏa mãn thì
ước lượng OLS là ước lượng tốn nhất trong lớp các ước lượng tuyến tính
không chệch và thường viết tắt là BLUE (Best linear unbiased estimator)
14
1.3.2. Mô hình hồi quy dữ liệu chuỗi thời gian
1.3.2.1. Dữ liệu chuỗi thời gian
• Dữ liệu chuỗi thời gian: Chuỗi các quan sát được thu thập trên cùng một
đối tượng tại các mốc thời gian cách đều nhau được gọi là chuỗi thời gian.
• Như vậy trong khi số liệu chéo cho thông tin về các đối tượng khác
nhau tại cùng một thời điểm thì số liệu chuỗi thời gian cho thông tin về cùng
một đối tượng tại các thời điểm khác nhau.
• Một số đặc trưng của số liệu chuỗi thời gian:
* Số liệu chuỗi thời gian và tính tự tương quan: chuỗi các quan sát
trong số liệu chéo thường được xem như là độc lập với nhau và do đó không
tương quan với nhau, tuy nhiên với số liệu chuỗi thời gian, người ta thường
thấy chúng có tính tự tương quan: corr (Yt , Yt-s) thường khác 0.
* Số liệu chuỗi thời gian và yếu tố mùa vụ: các số liệu kinh tế xã hội
thường chịu tác động của yếu tố thời vụ: doanh thu về máy lạnh thường cao
về mùa hè, thấp về mùa đông; giá thực phẩm thường cao trong các dịp Tết, số
người đến vui chơi trong các khu giải trí thường cao hơn vào các ngày nghỉ
cuối tuần... Yếu tố mùa vụ thường xuất hiện với các số liệu có tần suất xuất
hiện bé hơn một năm, như số liệu quý, số liệu tháng...
* Số liệu chuỗi thời gian và yếu tố xu thế: Đa phần chuỗi thời gian còn
có yếu tố xu thế, chỉ xu thế tăng (hay giảm) trong thời kỳ khá dài của chuỗi
số. Chẳng hạn GDP của một nền kinh tế thường có xu hướng gia tăng, do tác
động của sự cải thiện công nghệ, chất lượng nguồn nhân lực và sự gia tăng
các yếu tố đầu vào như vốn và lao động.
1.3.2.2. Mô hình hồi quy chuỗi thời gian
Xét mô hình hồi quy tuyến tính với số liệu chuỗi thời gian như sau:
Y1 1 2 X 2 ... k X kt u1
Từ đây chúng ta đưa ra một khái niệm tiếp theo:
Biến ngoại sinh chặt (strictly exogenous variable): biến độc lập Xj được
gọi là biến ngoại sinh chặt nếu cov( X t , us ) 0 t, s
17
Như vậy giả thiết TS2 yêu cầu r ng các biến độc lập phải là các biến
ngoại sinh chặt - là một khái niệm mạnh hơn yêu cầu trong giả thiết 2 trong
mô hình với số liệu chéo.
Ngoài ra chúng ta cũng có 3 giả thiết tương tự như trong mô hình hồi
quy với số liệu chéo sau đây:
Giả thiết TS3: Phương sai số là b ng nhau tại mọi thời điểm:
var(u t x2 ... xk ) 2
t
Giả thiết TS4: Giữa các biến độc lập không có quan hệ đa cộng tuyến
hoàn hảo.
Giả thiết TS5: Sai số ngẫu nhiên tuân theo quy luật chuẩn ut ~ N (0, 2 )
1.3.2.3. Mô hình hồi quy với chuỗi thời gian dừng:
1.3.2.3.1. Mô hình hồi quy tĩnh
Xét mô hình (1.3.2.2.1) trong đó ký hiệu Zt thể hiện giá trị của biến số
tại thời điểm t chứ không phải là các giá trị trễ của các biến số khác:
Yt t 2 X 2t ... k X kt ut
(1.3.2.3.1.1)
Mô hình này được gọi là tĩnh theo nghĩa r ng chúng ta chỉ xét đến quan
hệ giữa các biến số tính tại cùng một thời điểm, nó cho phép xem xét mối
quan hệ tức thời hoặc mối quan hệ cân b ng dài hạn giữa các biến số.