1
Tiết 1
Chơng 1
Đối tợng và phơng pháp của kinh tế lợng
I. Khái niệm về kinh tế lợng
Cho đến nay cha có một định nghĩa về kinh tế lợng đợc mọi ngời cùng
chấp nhận. Thuật ngữ tiếng Anh Econometric đợc ghép từ Economic có nghĩa
là kinh tế và Metrics có nghĩa là đo lờng. Thuật ngữ này đợc xuất hiện vào
những năm 1930, do hai giáo s là Ragnar Frisch và J.Tinbergen đa ra (1930).
Kinh tế lợng có nghĩa là đo lờng kinh tế. Mặc dù đo lờng kinh tế là một
nội dung quan trọng của kinh tế lợng nhng phạm vi của kinh tế lợng rộng hơn
nhiều. Điều này đợc thể hiện thông qua một số định nghĩa về kinh tế lợng nh
sau:
Kinh tế lợng là môn học chủ yếu trong các môn phân tích định lợng về
kinh tế, đơn giản có thể phát biểu kinh tế lợng là một công cụ trong nghiên cứu
các hiện tợng kinh tế.
Kinh tế lợng có thể đợc định nghĩa nh một môn khoa học xã hội trong đó
ngời ta dùng các công cụ của lý thuyết kinh tế, toán kinh tế và thống kê kinh tế để
phân tích các hiện tợng kinh tế.
Kinh tế lợng là một môn khoa học phân tích định lợng một cách tổng hợp.
Nó khắc phục đợc nhợc điểm của các môn khoa học nh lý thuyết kinh tế, thống
kê, toán kinh tế.
Mặc dù kinh tế lợng đi từ lý thuyết và đợc xây dựng chặt chẽ nh trong khoa
học tự nhiên nhng nó cũng quan tâm tới việc xây dựng về mặt thực nghiệm đối với
các quy luật kinh tế dựa trên thí nghiệm hay quan sát kinh tế.
Câu hỏi đặt ra là tại sao ta phải nghiên cứu kinh tế lợng? Những lý thuyết
hoặc giả thiết kinh tế thờng phát biểu dới dạng đặc tính. Ví dụ: trong kinh tế vĩ
mô ta biết rằng khi các yếu tố khác không đổi thì tăng giá một hàng hoá nào đó sẽ
làm giảm lợng cầu của hàng hoá đó. Nh vậy, lý thuyết kinh tế đa ra mối quan
kinh tế không đi xa hơn, không liên quan đến việc sử dụng số liệu để kiểm tra các
giả thuyết kinh tế. Kinh tế l
ợng luôn kiểm tra các lý thuyết kinh tế thông qua các
công cụ và phơng pháp của thống kê.
Các số liệu kinh tế là các số liệu không phải do các cuộc thí nghiệm đem lại,
chúng nằm ngoài sự kiểm soát của tất cả mọi ngời. Các số liệu về tiêu dùng, tiết
3
kiệm, giá cả do các cơ quan nhà nớc hoặc t nhân thu thập đều là các số liệu
phi thực nghiệm. Các số liệu này chứa sai số của phép đo. Kinh tế lợng phải sử
dụng các công cụ, phơng pháp của thống kê toán để tìm ra bản chất của các số
liệu thống kê.
III. Phơng pháp luận của kinh tế lợng
Phân tích kinh tế lợng bao gồm một số giai đoạn sau:
1. Đa ra lý thuyết hay giả thiết về các mối quan hệ giữa các biến số kinh tế.
Chẳng hạn kinh tế vĩ mô khẳng định rằng mức tiêu dùng của các hộ gia đình phụ
thuộc theo quan hệ cùng chiều với thu nhập khả dụng của họ.
2. Dựa vào mối quan hệ giữa các biến và mục tiêu nghiên cứu để xây dụng
mô hình toán học phản ánh đợc mối quan hệ này. Chẳng hạn:
C=C
0
+ bY (0<b<1; C
0
>0 ) ở đây C là tiêu dùng của hộ gia đình trong một
thời kỳ; Y là thu nhập của hộ gia đình.
3. Thu thập số liệu
4. Ước lợng các tham số của mô hình kinh tế lợng đã lựa chọn.
5. Kiểm định hay trắc nghiệm các giả thiết từ mô hình.
6. Dự đoán hay dự báo.
4
Trong mô hình toán học ta thấy rằng mối quan hệ giữa Q và P là hoàn
toán toán học hay chính xác. Tuy nhiên trong thực tế luật cầu không phải hoàn
toàn chính xác nh vậy. Lợng cầu còn chịu ảnh hởng rất nhiều của yếu tố
khác. Do đó ngời ta đa vào trong mô hình một sai số ngẫu nhiên u.
Q = B
1
+ B
2
P + u
Mô hình trên gọi là mô hình kinh tế lợng, cụ thể mà mô hình hồi quy tuyến
tính.
Bớc 3:
Lựa chọn và thu thập dữ liệu. Dữ liệu (số liệu) có 3 loại: theo dãy thời gian,
thời điểm và kết hợp. Tài liệu phải mang tính đại diện và chính xác, đủ lớn.
Bớc 4:
Ước lợng các tham số. Với số liệu điều tra, giả sử chúng ta tìm đợc mô
hình:
Q = 49,66667 - 2,15758P
Bớc 5:
Kiểm định các giả thiết về mô hình. Giả sử chúng ta cần kiểm định xem mô
hình vừa ớc lợng có tuân thủ luật cầu không (nghĩa là hệ số B
2
< 0). Quan sát mô
hình ta thấy đúng nh vậy. Còn trong trờng hợp muốn kiểm định xem B
2
Sử dụng mô hình cho
dự báo
Sử dụng mô hình đa
ra quyết định và gợi ý
chính sách
1
2
3
4
5
6
7
6
Tiết 2
Chơng 2
Phân tích hồi quy tuyến tính giản đơn
I. Giới thiệu mô hình hồi quy
1. Khái niệm về hồi quy (Regression)
Phân tích hồi quy là gì ? Hồi quy hay phân tích hồi quy liên quan đến việc
mô tả và đánh giá mối quan hệ giữa một biến đã cho (thông thờng gọi là biến phụ
thuộc (dependent variable) hoặc biến đợc giải thích (explained variable)) và một
hay nhiều biến khác (thông thờng gọi là biến độc lập (independent variables) hay
biến giải thích (explanatory variables). Trong lĩnh vực kinh tế có rất nhiều hiện
tợng đợc phản ánh bằng mô hình hồi quy.
Ví dụ: Khi nghiên cứu sự phụ thuộc của chi phí tiêu dùng cá nhân vào thu
nhập thực tế của cá nhân, ta có mô hình hồi quy sau:
i21i
thứ hai ở trên thì luật cầu đợc phát biểu nh sau nếu nh các yếu tố khác không
đổi thì lợng cầu của một hàng hoá nào đó phụ thuộc vào hay có quan hệ ngợc với
giá cả hàng hoá đó. Nghĩa là hệ số B
2
trong mô hình (2.1') sẽ mang dấu âm.
7
Mục tiêu của việc phân tích hồi quy là:
+ Ước lợng giá trị trung bình của biến phụ thuộc với những giá trị của biến
độc lập đã cho.
+ Phân tích ảnh hởng sự thay đổi của X
i
(thu nhập (mô hình 2.1) hay giá cả
hàng hoá (mô hình 2.1')) đến Y
i
(mức chi phí tiêu dùng cá nhân hay lợng cầu). Để
đạt đợc mục tiêu này, chúng ta cần phải ớc lợng hệ số B
2
. Hệ số B
2
chính là xu
hớng tiêu dùng cận biên, MPC (Marginal Propensity to Consume, mô hình 2.1)
hay sệ số góc của đờng cầu (Slope of Demand Curve, mô hình 2.1') tức là mức
thay đổi bình quân về chi phí tiêu dùng khi thu nhập thực tế thay đổi một đơn vị
(đồng Việt Nam hoặc đô la) hay mức thay đổi bình quân của lợng cầu khi giá cả
hàng hoá đó thay đổi một đơn vị với các yếu tố khác không đổi (ceteris paribus).
+ Dự báo giá trị của Y với sự thay đổi của X.
+ Kiểm định các giả thiết kinh tế. Ví dụ chúng ta kiểm định giả thiết đối với
mô hình (2.1') là độ co dãn giá của cầu là -1, hay là đờng cầu có độ co dãn đơn vị.
2500 4100 5000
Công thức (2.3) là quan hệ thống kê ngẫu nhiên, nghĩa là ứng với một giá trị
của X ta có một khoảng giá trị của Y. Giả sử sai số u = 500, ta có giá trị của X và
Y nh sau:
X
i
0 20 50
Y
i
2000 - 3000 3600 - 4600 4500 - 5500
Và chúng ta có thể chọn giá trị của Y là ít nhất 3 trong số 6 giá trị trên
X
i
0 20 50
Y
i
2000 4600 5500
Nếu sai số u là phân phối liên tục (phân phối chuẩn) với giá trị bình quân của
u bằng
(){}
0uE0 =
và phơng sai của nó bằng 1, thì với mỗi giá trị của X, chúng ta
có một phân phối chuẩn các giá trị của Y. Vì vậy công thức (2.3) thể hiện mối quan
hệ thống kê ngẫu nhiên giữa X và Y.
Trong phân tích hồi quy, chúng ta chỉ giải quyết mối quan hệ thống kê ngẫu
nhiên. Vì mối quan hệ chính xác (toán học) không phải lúc nào cũng có trong thực
tế, nhất là trong kinh tế. Sự xuất hiện sai số (u) trong các mô hình phản ánh mối
quan hệ kinh tế là do:
+ Số mẫu điều tra không đủ để miêu tả toàn bộ tổng thể cần nghiên cứu.
+ Mô hình hồi quy đợc chọn không bao gồm đầy đủ các biến (các yếu tố)
Trong phân tích hồi quy (regression analysis) chúng ta ớc lợng hoặc dự
đoán giá trị bình quân của một biến trên cơ sở biết giá trị cố định của các biến
khác. Trong phân tích hồi quy ngời ta phân biệt đợc biến độc lập và biến phụ
thuộc, trong đó biến phụ thuộc đợc giải thích là một biến thống kê ngẫu nhiên
(statistical or stochastic variable). Tức là có một phân phối thống kê. Mặt khác, các
biến giải thích đợc giả thiết là có giá trị cố định trong các cách chọn mẫu lặp lại.
Tóm lại: Hầu hết lý thuyết tơng quan đều dựa trên giả thiết ngẫu nhiên của
các biến, trong khi đó hầu hết các lý thuyết hồi quy lại dựa vào giả thiết là biến phụ
thuộc là biến ngẫu nhiên có đặc tính thống kê (có phân phối thống kê), còn các
biến độc lập lại là các biến cố định.
10
Tiết 3
Chơng 2 (tiếp)
Phân tích hồi quy tuyến tính giản đơn
I. Giới thiệu mô hình hồi quy
1. Khái niệm về hồi quy (Regression)
2. Phân biệt các mối quan hệ trong mô hình hồi quy
II. Số liệu trong phân tích hồi quy
* Số liệu sử dụng trong phân tích kinh tế thờng là số liệu thu thập từ các cơ
quan Nhà nớc, các tổ chức quốc tế, các tổ chức t nhân hoặc từ cá nhân thông qua
các phơng pháp điều tra khác nhau phục vụ cho các mục tiêu nghiên cứu khác
nhau.
* Số liệu thí nghiệm đợc thu thập thông qua các thí nghiệm khoa học tự
nhiên. Thông thờng các nhà nghiên cứu thu thập số liệu bằng cách giữ một số
nhân tố cố định để xem xét ảnh hởng của một yếu tố nào đó.
* Số liệu thu thập từ các hoạt động kinh tế xã hội (ngoài thí nghiệm). Số liệu
chọn mẫu.
- Tổ chức công tác điều tra tốt: chọn thời điểm điều tra, trình độ chuyên môn
của ngời làm công tác điều tra, đảm bảo tính khách quan và chính xác khi thu thập
số liệu.
- Kiểm tra và chỉnh lý số liệu điều tra: Số liệu điều tra phải đợc kiểm tra lại
để phát hiện những điều bất hợp lý trong quá trình điều tra để chỉnh lý kịp thời.
- Số liệu phải đợc tổng hợp tốt tránh sai sót khi tính toán.
III. Hàm hồi quy tổng thể và hàm hồi quy mẫu
1. Hàm hồi quy tổng thể (Population Regression Function, PRF)
Trở lại ví dụ về cầu một hàng hoá, ta thấy rằng luật cầu phản ánh quan hệ
ngợc chiều giữa lợng cầu và giá cả hàng hoá đó với điều kiện các yếu tố khác
(thu nhập của ngời tiêu dùng, sở thích của họ, giá cả của các hàng hoá liên
quan,...) không đổi. Giả sử chúng ta có 1 thị trấn nhỏ độc lập với 55 ngời tiêu
dùng (nghĩa là tổng thể chỉ có 55 đơn vị) và có số liêụ về cầu một loại sổ viết nh
bảng 2.1.
Qua bảng 2.1, ta có thể thấy tại mức giá X
i
= 1 (đơn vị là 1000đ/1 quyển) có 7
ngời tiêu dùng, số lợng họ mua dao động từ 45 đến 51 quyển và lợng cầu bình
quân của 7 ngời này là 48. Tại mức giá X
i
= 4, có 6 ngời tiêu dùng, lợng cầu Y
i
dao động từ 35 đến 47 quyển và lợng cầu bình quân của 6 ngời này là 42 quyển.
Tơng tự ta cũng có số liệu cho các mức giá khác. Tóm lại nếu với mỗi mức giá X
i
ta
sẽ có số lợng quyển vở đợc tiêu thụ sẽ là kỳ vọng có điều kiện của Y, hay ta viết
Lợng cầu, Y
i
(quyển)
Số ngời tiêu
dùng (ngời)
Lợng cầu Y trung
bình (quyển)
1 45,46, 47, 48, 49, 50, 51 7 48
2 44, 45, 46, 47, 48 5 46
3 40, 42, 44, 46, 48 5 44
4 35, 38, 42, 44, 46, 47 6 42
5 36, 39, 40, 42, 43 5 40
6 32, 35, 37, 38, 39, 42, 43 7 38
7 32, 34, 36, 38, 40 5 36
8 31, 32, 33, 34, 35, 36, 37 7 34
9 28, 30, 32, 34, 36 5 32
10 29, 30, 31 3 30
Tổng số: 55
Hàm f(X
i
) có dạng nh thế nào chúng ta cha biết. Để xác định dạng của PRF
chúng ta dựa vào đồ thị biểu diễn sự biến thiên của dãy các số liệu quan sát về X và
Y. Tuy nhiên, việc xác định dạng hàm còn phụ thuộc vào tổng thể và đây là vấn đề
thực nghiệm ta sẽ đề cập ở phần sau.
Nhìn vào đồ thị ta thấy rằng xu hớng chung là lợng cầu Y giảm khi X tăng và
ngợc lại. Xu hớng này sẽ thấy rõ hơn nếu ta chỉ tập trung vào trị trung bình hay kỳ
vọng của Y. Nếu chúng ta vẽ một đờng đi qua các trị này ta sẽ đợc đờng hồi quy tổng
thể (Population Regression Line - PRL). Nh vậy đờng PRL cho ta biết giá trị trung
bình của biến phụ thuộc (biến Y) tơng ứng với mỗi giá trị của biến độc lập (biến X) hay
nói cách khác đờng PRL cho ta biết mối quan hệ giữa trị trung bình của Y liên quan với
tơng ứng hay điều kiện một giá trị nào đó của X. Ví dụ:
( )
462X|YE
i
==
. Nh vậy
đờng PRL là đờng đi qua các giá trị trung bình có điều kiện của Y. Phơng trình
đợc biểu diễn nh phơng trình (2.5) ngời ta gọi là hàm hồi quy tổng thể (PRF).
1
và
2
đợc gọi là các tham số hay hệ số hồi quy.
1
là hằng số (Intercept) và
2
là hệ số góc (Slope Coefficient), nó là thớc đo sự thay đổi trung bình của Y khi X
thay đổi 1 đơn vị.
Với X = 1, thì trị trung bình của Y là 48, nếu ta chọn ngẫu nhiên 1 trong số 7
ngời tiêu dùng ở nhóm này, ta thấy rằng lợng cầu của ngời đó không chắc đã
bằng 48 (ngời đầu tiêu chỉ có 45, ngời cuối cùng lại là 51). Ta sẽ giải thích nh
thế nào về lợng cầu của từng ngời liên quan đến một mức giá nào đó ? Để trả lời
câu hỏi này và để phản ánh lợng cầu của từng ngời, ta sẽ cộng thêm hay bớt đi
một lợng từ lợng bình quân của nhóm đó. Mô hình toán học nh sau:
ii21i
uXY ++=
(2.6)
Trong đó: u
i
là chênh lệch giữa các giá trị Y
i
và trung bình
E(Y/X
i
) của chúng, ta có:
Y
i
=E(Y/X
i
) + u
i
hay Y
i
=f(X
i
) + u
i
, ta suy ra u
i
=Y
i
- E(Y/X
i
), và u
i
đợc gọi
là yếu tố ngẫu nhiên hay sai số.
Trong phân tích hồi quy ta có một số giả thiết đối với sai số u
của sai số u
i
có thể tóm tắt nh sau:
+ Sai số u
i
phản ánh ảnh hởng của những biến khác không đợc đa vào
trong mô hình. Trong ví dụ của chúng ta nó có thể là ảnh hởng thu nhập của ngời
tiêu dùng, giá cả của hàng hoá cạnh tranh,...
+ Trong trờng hợp chúng ta đã đa tất cả các biến hợp lý vào trong mô hình
thì một sai số ngẫu nhiên nào đó vẫn xảy ra và ta không giải thích đợc. ví dụ nh
hành vi của con ngời hay hành vi ngời tiêu dùng trong ví dụ trên.
+ Sai số có thể phản ánh sai sót trong đơn vị đo hay khi thu thập dữ liệu. Ví
dụ khi ta làm tròn số.
15
+ Khi xây dựng mô hình ta thờng cố gắng làm sao càng đơn giản càng tốt,
điều đó sẽ làm cho một biến nằm ngoài mô hình. Mặc dù ta đã phán đoán đợc ảnh
hởng của các biến này. Tuy nhiên ảnh hởng cộng hởng của chúng có thể rất nhỏ
và nó ở trong sai số.
3. Hàm hồi quy mẫu (Sample Regression Function - SRF)
Làm thế nào để ớc lợng đợc hàm hồi quy tổng thể PRF? Nghĩa là làm thế
nào chúng ta ớc lợng đợc các giá trị của
1
và
2
? Điều đó có thể đợc nếu
chúng ta có dữ liệu đầy đủ của toàn bộ tổng thể nh bảng 2.1. Trong thực tế ta
không thể nào thu thập đợc số liệu cho toàn bộ tổng thể mà chúng ta chỉ có thể có
số liệu của một mẫu đại diện cho tổng thể đó. Do đó nhiệm vụ của chúng ta là ớc
42 4
40 5
37 6
36 7
35 8
32 9
30 10
16
Hình 2.2. Các đờng hàm hồi quy mẫu đợc lấy ra từ tổng thể
ứng với mỗi mẫu (số liệu) ta có thể vẽ đợc một đờng hồi quy phản ánh xu
hớng hay quy luật của dữ liệu. Đờng này ngời ta gọi là đờng hồi quy mẫu
(Sample Regression Line - SRL). Nếu ta có k mẫu dữ liệu thì cũng có thể vẽ đợc k
đờng SRL. Chúng ta cha thể khẳng định chắc chắn là đờng SRL nào sẽ đại diện
hoàn hảo cho đờng PRL bởi vì các mẫu khác nhau thì có biến động và sai số khác
nhau. Biểu diễn bằng mô hình toán học các đờng SPL, ta có thể viết nh sau:
i
Y
=
i
X
thể xây dựng đợc hàm hồi quy mẫu ngẫu nhiên từ đờng SRL. Mô hình nh sau:
ii21i
eX
Y ++=
(2.8)
Trong đó: e
i
là ớc lợng của u
i
và đợc gọi là phần d (Ressidual Term), đôi
khi đơn giản ngời ta cũng gọi là sai số.
Y
X
Giá cả
Số lợng
SRL
2
SRL
1
17
Hình 2.3. Phơng trình Hồi quy của tổng thể và của mẫu
không hay nói cách khác có cách nào để hàm hồi quy mẫu càng gần với hàm hồi
quy tổng thể hay không. Cụ thể hơn chúng ta phải xây dựng SRF thế nào để các
tham số ớc lợng
1
và
2
càng gần với
1
và
2
càng tốt. Chúng ta sẽ xem xét
vấn đề này trong mục IV.
4. Hồi quy tuyến tính
Một câu hỏi đặt ra là tại sao ta lại gọi là hồi quy tuyến tính? Mô hình hồi quy
tuyến tính nh mô hình (2.6) có thể giải thích nghĩa "tuyến tính" bằng 2 cách sau:
+ Tuyến tính ở các biến
Trị trung bình của biến phụ thuộc là hàm tuyến tính của biến độc lập nh mô
hình (2.6) và (2.7). Những mô hình sau không phải là hàm tuyến tính:
E(Y) =
1
+
2
2
1
X
hoặc E(Y) =
Y
+=
PRF; E(X|X
i
) =
1
+
2
X
i
18
+ Tuyến tính ở các tham số:
Trị trung bình của biến phụ thuộc là hàm tuyến tính của các tham số,
j
nh
hô hình (2.6) và (2.7). Mô hình sau không phải là hàm tuyến tính:
()
i
2
21
XYE
+=
(2.12)
Trong chơng này và những chơng sau, khi nói đến hồi quy tuyến tính
với i = 1,2,..., n (2.14)
Trong đó:
1
và
2
là các lợng của
1
và
2
; e
i
là ớc lợng của u
i
.
Mô hình này phải gần với mô hình thực (2.13). Có nhiều phơng pháp có thể
ớc lợng đợc các tham số
1
và
2
(OLS, MLE). Tuy nhiên ta chỉ xem xét
phơng pháp bình phơng nhỏ nhất (OLS). Phơng pháp này dựa trên giả thiết là
tổng bình phơng các phần d là nhỏ nhất (cực tiểu)
- Điều đó cũng có nghĩa là giá trị trung bình (hoặc kỳ vọng) của hàm hồi quy
đợc ớc lợng Y là bằng với giá trị thực của nó.
Chứng minh:
()
() ( ) () ( ) ()
i21ii21ii21i
i21i
XuEXEEuXEYE
XYE
+=++=++=
+=
(2) Phơng sai của sai số là một hằng số (homoscedasticity)
Var (u
i
) =
2
với mọi i.
- Điều đó có nghĩa là sai số u
i
với i = 1, 2, ..., n.
(5) Biến độc lập X
i
là biến phi ngẫu nhiên, nghĩa là các giá trị của X
i
ta đã
biết trớc.
Năm giả thiết trên ngời ta gọi là giả thiết của phân tích hồi quy tuyến tính
cổ điển - CLRA (Classical Linear Regression Analysis).
Giá cả
Lợng cầu
u
1
E(Y/X
i
) =
1
+
2
X
i
u
2
u
3
u
4
u
5
u
; Nghĩa là sai số
u
i
không phụ thuộc vào độ lớn của biến X: u
i
f(X
i
) hay X
i
là biến độc lập và
không có quan hệ tơng quan (uncorrelated) với sai số u
i
.
Khi đó: Cov (X
i
, u
i
) = 0 với mọi i.
* Kết hợp giả thiết (1), (2) và (3) ta có:
( ) ( )
0uEuE
ii
==
; Nghĩa là giá trị
của tổng sai số của mọi mẫu đều bằng nhau.
() ()
[]
[]
()
i
) = 0. Từ mô hình tổng thể:
ii21i
uXY
++=
với i = 1, 2, ..., n
Ta cộng và trừ vế phải của phơng trình một lợng nh nhau là .
() ()
uXY
ii21i
+++=
với i = 1,2,...,n
Và
()()()
0EuEuE
ii
===
0
2
21
Nh vậy nếu giả thiết (1) không thoả mãn thì ta sẽ xây dựng đợc mô hình
mới với hằng số khác với mô hình cũ và có kỳ vọng của sai số bằng không (0).
Tit 6
2
i21ii
2
ii
==
(2.16)
Trong đó Q là tổng bình phơng các phần d hay sai số e
i
. Để (2.16) có cực
tiểu, thì điều kiện cần là đạo hàm riêng của nó theo
1
và
2
phải bằng không. Nh
vậy:
( )
( )
01X
Y2
Q/
i21ii1
==
X
X
XY
+=
(2.20)
Hệ phơng trình (2.19) và (2.20) đợc gọi là hệ phơng trình chuẩn tắc
Đặt:
iiii
Y
1
Y;X
1
X
nn
==
Phơng trình (2.19) và (2.20) sẽ đợc biến đổi thành:
X
n
nYn
21
+=
(2.21)
2
ii2ii2ii
X
XX
XY
+=()
ii
2
ii2iiiii
XXX
XYXY =
(2.23)
Giải phơng trình trên:
ii
2
ii
iiiii
2
XXX
XYYX
XXYY
=
(2.26)
Công thức (2.24) và (2.26) là nh nhau. Để đơn giản ta có thể viết
i
=
. Ta
có thể biến đổi bằng cách biến đổi (khai triển) công thức (2.26) sang (2.24) hoặc từ
công thức (2.24) , ta biến đổi tử số và mẫu số (cộng hoặc trừ đi một khối lợng Y
và cộng hoặc trừ đi một lợng X).
()()
()
2
ii
iii
2
XX
XXYY
=
()
ma trận nh sau:
=
2
1
2
2
2
12
2
12
22
1
2
22
22
2
44
XnXn
i
=
( )
2
4
XXn
i
=
D > 0
23
Ví dụ: Từ số liệu về cầu một loại sổ viết ở bảng 2.2 (số liệu của mẫu), ta có
thể tìm các tham số
1
và
2
nh sau:
X
i
Y
i
2
)
1 49 1 49 -4.5 11.2 20.25 -50.4
2 45 4 90 -3.5 7.2 12.25 -25.2
3 44 9 132 -2.5 6.2 6.25 -15.5
4 39 16 156 -1.5 1.2 2.25 -1.8
5 38 25 190 -0.5 0.2 0.25 -0.1
6 37 36 222 0.5 -0.8 0.25 -0.4
7 34 49 238 1.5 -3.8 2.25 -5.7
8 33 64 264 2.5 -4.8 6.25 -12
9 30 81 270 3.5 -7.8 12.25 -27.3
10 29 100 290 4.5 -8.8 20.25 -39.6
55 378 385 1901 0 0 82.5 -178
(hàng cuối cùng là tổng số)
Tính các số trung bình:
5.5
10
55
==X
;
8.37
10
378
==Y
2
= (1901 - 10 * 5,5 * 37,8)/(385 - 10 * 5,5
2
)
i
Y
)
cũng chính bằng giá trị bình quân của giá thị thực tế
Y
.
YY
=
(2.27a)
c. Giá trị bình quân của phần d hay sai số bằng không
0e
i
=
(2.27b)
24
d. Phần d (sai số) e
i
không có tơng quan với X
i
.
Nếu e
i
không có tơng quan với X
i
: Cov (X
ii
i
=
()
1n
eXeX
iii
=
Ta biết:
0eX0e
iii
==
e. Phần d (sai số) e
i
không có tơng quan với Y
i
ớc lợng
( )
0e,Y
Cov
ii
=
(2.28)
XYYX
=
=
Hay:
2
ii
iii
2
x
yx
=
với
()
XXx
ii
=
và
( )
YYy
i
=
25
E(
2
) =
2
Chứng minh: từ mô hình tổng thể
Y
i
=
1
+
2
X
i
+ u
i
và công thức (2.26):
()()
()
( ) ( )
()
2
ii
iiiii
XX
YXX
++
=
=
(){}(){}( )
()
2
ii
iiiiii2ii1
XX
uXXXXXXX
++
=
Ta biết rằng:
()
0XX
ii
=
(2.30)
Và:
() ()
2
là ớc lợng không chệch của
2
.
c. Tham số ớc lợng là tốt nhất hay phơng sai (Var (
2
)) là nhỏ nhất:
Phơng sai của các tham số là nhỏ nhất giữa các loại tham số hay tham số
đợc ớc lợng là tốt nhất.
Chứng minh: Theo phơng pháp bình phơng nhỏ nhất ta có :
() ()
[]
2
222
E
E
Var