Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở việt nam - Pdf 35

PHẦN MỞ ĐẦU

GIỚI THIỆU VẤN ĐỀ NGHIÊN CỨU
1.

Lý do chọn đề tài
Tiền lương là một trong những yếu tố tạo động lực quan trọng nhất trong lao

động. Có rất nhiều các yếu tố tác động đến tiền lương của người lao động như thị
trường lao động, môi trường làm việc, tính chất công việc và đặc điểm của người lao
động. Mỗi sự khác nhau ở các yếu tố này có thể sẽ dẫn đến kết quả trả lương khác
nhau. Điều này tạo sự chênh lệch về tiền lương. Bên cạnh đó, chênh lệch tiền lương
còn là hệ quả của việc phân công lao động. Tiền lương sẽ khác nhau khi mà mỗi
người lao động được phân công đảm trách những công đoạn, công việc khác nhau
trong cùng một quy trình sản xuất.
Như vậy, sự tồn tại của chênh lệch tiền lương là tất yếu. Tuy nhiên, các nhà kinh
tế học như Becker (1971), Cain (1986) phân biệt hai cách giải thích cho vấn đề
chênh lệch tiền lương: đó là chênh lệch tiền lương do phân biệt đối xử và chênh lệch
tiền lương do chênh lệch về vốn con người và/hoặc năng suất lao động. Sự chênh
lệch tiền lương do chênh lệch về vốn con người và/hoặc do chênh lệch về năng suất
lao động có thể xem là những chênh lệch “tích cực” tạo ra động lực để phát triển. Sự
chênh lệch tiền lương do trình độ học vấn sẽ khiến người ta cố gắng học hỏi để đạt
trình độ cao. Hay sự chênh lệch về tiền công do chênh lệch về năng suất lao động, về
hiệu quả công việc, về khả năng ngoại ngữ, về việc tích luỹ kinh nghiệm, về khả
năng sáng tạo v.v... sẽ tạo ra động lực để người lao động phấn đấu hoàn thiện chính
mình, từ đó kích thích sự phát triển chung của xã hội. Những chênh lệch tiền lương
“tiêu cực” thể hiện ở các bất bình đẳng nảy sinh trong xã hội mà chúng ta cần phải
điều chỉnh. Ví dụ như sự chênh lệch tiền lương do kỳ thị lao động nữ giới, ưu ái lao
động nam giới, chênh lệch tiền lương dẫn đến chênh lệch giàu nghèo, chênh lệch
mức sống giữa thành thị - nông thôn, v.v... Do vậy, có thể phân chia các nguyên
nhân của chênh lệch tiền lương thành hai nhóm. Nhóm thứ nhất có thể kể đến đó là

và 2012 để làm rõ sự thay đổi theo thời gian.

2

4) Xác định khoảng chênh lệch tiền lương theo khu vực (thành thị - nông thôn,
thành thị - nông thôn ở nam giới, thành thị - nông thôn ở nữ giới). Phân rã các
khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích
bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh
lệch về hệ số hồi quy. Đồng thời so sánh kết quả phân tích chênh lệch tiền
lương theo khu vực năm 2002 và 2012 để làm rõ sự thay đổi theo thời gian.
5) Xác định mức tăng lương theo thời gian từ năm 2002 đến năm 2012. Phân rã
sự tăng lương này thành hai phần: phần tăng lương là do thay đổi về đặc điểm
lao động và phần tăng lương là do thay đổi hệ số hồi quy.
3.

Đối tượng – phạm vi nghiên cứu
Đề tài này được thực hiện đựa trên bộ số liệu khảo sát mức sống hộ gia đình

(VHLSS) năm 2002 và 2012 do Tổng cục Thống kê công bố. Đối tượng nghiên cứu
của đề tài cũng chính là đối tượng được khảo sát về tiền lương và các yếu tố có liên
quan trong các cuộc khảo sát này. Phạm vi nghiên cứu của đề tài là nghiên cứu tiền
lương thực tế theo giờ của các đối tượng trong độ tuổi trên lãnh thổ Việt Nam.
4.

Ý nghĩa khoa học và ý nghĩa thực tiễn
Với mục tiêu nghiên cứu và phương pháp nghiên cứu được lựa chọn, đề tài của

luận án mang lại các ý nghĩa khoa học và thực tiễn sau đây:
(a) Đề tài áp dụng phương pháp hồi quy phân vị, một kỹ thuật hồi quy được

nghiên cứu là năm 2002 và 2012.
(h) Đề tài phân rã khoảng chênh lệch tiền lương giữa hai khu vực thành thị và
nông thôn nhằm xác định phần chênh lệch thể hiện qua khác nhau về đặc
điểm lao động và phần chênh lệch thể hiện thông qua khác nhau về hệ số
hồi quy (được xem như là dấu hiệu của sự khác nhau trong chính sách đãi
ngộ của khu vực thành thị - nông thôn)

4

CHƯƠNG 1

CƠ SỞ LÝ THUYẾT VỀ HÀM TIỀN LƯƠNG
VÀ VẤN ĐỀ PHÂN TÍCH CHÊNH LỆCH
TIỀN LƯƠNG BẰNG HỒI QUY PHÂN VỊ
Nhằm thực hiện các mục tiêu nghiên cứu đã nêu, đề tài áp dụng phương pháp
hồi quy phân vị có hiệu chỉnh tính chệch do vấn đề chọn mẫu và có xử lý nội sinh để
ước lượng hàm tiền lương dạng Mincer (1974) mở rộng. Biến phụ thuộc được lựa
chọn là logarit tiền lương thực tế dựa trên số liệu của VHLSS 2002 và VHLSS 2012.
Sau đó, phương pháp Machado - Mata (2005) được áp dụng để tiến hành phân rã
chênh lệch tiền lương và xác định các thành phần của khoảng chênh lệch này. Do
vậy, chương 1 sẽ bao gồm các nội dung sau đây:
-

Trình bày hàm tiền lương do Mincer (1974) đề xuất và một số các mở
rộng.

-

Trình bày phương pháp hồi quy phân vị do Koenker & Bassett (1978) đề

 t 1

Et   (1  rj k j )  E0 .
 j 0


Lấy logarit nepe hai vế, ta được
t 1

ln Et  ln E0   ln(1  rj k j ).
j 0

Giả sử rằng
-

Số năm đi học (s) là số năm được dành toàn thời gian cho việc học của người
lao động (trong thời gian đi học k0  k1  ...  ks 1  1 (năm)).

-

Hiệu quả mang lại của số năm đi học đối với tiền lương tiềm năng là không
đổi theo thời gian ( r0  r1  ...  rs 1   ).

-

Hiệu quả mang lại của việc đầu tư cho đi học sau khi tốt nghiệp đối với tiền
lương tiềm năng là không đổi theo thời gian ( rs  ...  rt 1   ).

Khi đó phương trình tiền lương được viết lại như sau
t 1

Khi đó, tiền lương thuần thu được do chi phí đầu tư vào học vấn sau khi tốt
nghiệp là:


z
      2


ln Et   1    ln E0       s   
 z 
z .
2T T   2T 
 T


  


Hoặc có thể viết lại theo một cách khác:
 z
ln Et   1       s   z   z 2 .
 T

  ln E0     .

Với

  

   

Trong đó, s : số năm đi học
z : Số năm kinh nghiệm tính đến thời điểm t với z  t  s

X : Các biến độc lập khác có tác động đến tiền lương như giới tính,

công việc, ngành nghề….
Sau công trình nghiên cứu của Card (1994), rất nhiều các nghiên cứu khác đã
mở rộng phương trình tiền lương của Mincer. Các công trình này không phải chỉ
nghiên cứu tiền lương trung bình và phân tích chênh lệch tiền lương trung bình, như
nghiên cứu của Oaxaca-Blinder (1973), mà còn mở rộng ra nghiên cứu các tham số
thống kê khác của hàm phân phối có điều kiện của tiền lương. Trong số đó,
Buchinsky (1994) thực hiện hồi quy phân vị trên hàm tiền lương của Mincer. Tiếp
theo đó là hàng loạt các nghiên cứu khác về tiền lương và chênh lệch tiền lương dựa
trên phương trình tiền lương của Mincer đã được công bố. Những nghiên cứu khác
nhau sử dụng những biến độc lập khác nhau trong hàm tiền lương Mincer (1974) mở
rộng.

1.2. PHƯƠNG PHÁP HỒI QUY PHÂN VỊ
Phương pháp hồi quy phân vị được Koenker & Bassett giới thiệu lần đầu tiên
năm 1978. Thay vì ước lượng các tham số của hàm hồi quy trung bình bằng phương
pháp OLS, Koenker & Bassett (1978) đề xuất việc ước lượng tham số hồi quy trên
từng phân vị của biến phụ thuộc để sao cho tổng chênh lệch tuyệt đối của hàm hồi
quy tại phân vị τ của biến phụ thuộc là nhỏ nhất. Nói một cách khác, thay vì xác định

8

tác động biên của biến độc lập đến giá trị trung bình của biến phụ thuộc, hồi quy
phân vị sẽ giúp xác định tác động biên của biến độc lập đến biến phụ thuộc trên từng
phân vị của biến phụ thuộc đó. Trong Mục 1.1.2, đề tài giới thiệu đầy đủ các định




( y   )2 dFY ( y ) đạt cực tiểu.

(1.5)

R

Trong khi giá trị trung bình của Y lời giải bài toán tìm cực tiểu (1.5) thì giá trị phân
vị Q của Y là lời giải của bài toán tìm cực tiểu hàm mục tiêu sau
L( )  

 | y   | dF ( y)  (1   )  | y   | dF ( y).
Y

y 

Y

y

9

(1.6)

Hay

 (u )  u.(  I{u 0} )  

với I(u
y

Nếu X và Y có hàm mật độ đồng thời là f ( x, y ) . Khi đó hàm mật độ xác suất biên
(marginal density function) của Y được xác định bởi

10



fY ( y ) 



f ( x, y )dx nếu Y là liên tục,



f Y ( y )   f ( x, y )

hoặc

nếu Y là rời rạc.

x

Tương tự, hàm mật độ xác suất biên (marginal density function) của X là


f X ( x) 

fY ( y )  0

nếu

Hàm phân phối xác suất có điều kiện của Y tại X  x là:
FY | X ( y | x)   f ( y | x)dy nếu Y liên tục,
y

và

FY | X ( y | x)   f ( y | x) nếu Y rời rạc.
y

Kỳ vọng có điều kiện của Y tại X = x là


E (Y | X  x) 

 y. f

Y|X

( y | x)dy nếu Y liên tục,



E (Y | X  x)   y. fY | X ( y | x)

nếu Y rời rạc.

Q (u i | X i )  0 .
Khi đó, ta cần tìm hàm phân vị có điều kiện Q (Yi | X i )  h( X i ,  ) để hàm số
n

   (Y  h( X ,  ) 
i 1

i

i

đạt giá trị nhỏ nhất. Tuy nhiên, việc tìm hàm phân vị Q (Yi | X i )

cũng chính là tìm hệ số hồi quy  . Bài toán trở thành tìm  để cực tiểu biểu thức
n

   (Y  h( X ,  ) . Khi xét bài toán này trên một mẫu số liệu cụ thể sẽ thu được
i 1

i

i

ước lượng của  , ký hiệu ˆ ,
n

Nghĩa là

1
ˆ  arg min   (Yi  h( X i ,  )).

và Q (Yi | X i )  h( X i , ˆ ) trở thành hàm hồi quy phân vị ở phân vị  .
Tương tự, hàm hồi quy phân vị tuyến tính ở phân vị  có dạng Q (Yi | X i )  X i .
Và hàm hồi quy phân vị tuyến tính mẫu ở phân vị  sẽ là
Q (Yi | X i )  X iˆ hay Yi  X iˆ  u i với Q (u i | X i )  0.

(1.14)

Giá trị ˆ trong (1.14) tìm được bằng cách chọn tham số hồi quy phân vị sao cho
1 n
hàm mục tiêu V (  )    (Yi  X i ) đạt giá trị nhỏ nhất. Khi đó, ước lượng đạt
n i 1

được khi xét trên một mẫu số liệu, cụ thể là
ˆ  arg min V (  ),

(1.15)

 Rk

với

V (  ) 

1 n
  (Yi  X i ).
n i 1

(1.16)

Hàm mục tiêu V ( ) có thể có nhiều cách biểu diễn khác nhau.

1 n 
1 1



   sgn Yi  X i   . Yi  X i  .

n i 1 
2 2



(1.19)

trong đó sgn(.) là hàm dấu, với sgn( z )  1  2 I{ z 0} với I (.) là hàm chỉ đã định nghĩa ở
(1.9).

13

1
2

Nếu   , hồi quy phân vị sẽ cho kết quả hàm hồi quy trung vị có điều kiện
Q0,5 (Yi | X i )  X i 0,5 . Đây cũng chính là lời giải của bài toán hồi quy theo phương

pháp LAD (Least Absolute Deviation – Độ lệch tuyệt đối nhỏ nhất) rất phổ biến
trong kinh tế lượng cổ điển
ˆ

q25

12

14

q10

6

8

10
x
y
q25
q75
OLS

12

14

q10
q50
q90

Nguồn: tác giả tính toán từ số liệu mô phỏng trên Stata

Hình 1. 1: Đồ thị biểu diễn các kết quả hồi quy phân vị của Y theo X

+

nếu   0 thì 1*   .

+

*
Trường hợp đặc biệt, khi   0,5 thì ˆ0,5
 ˆ0,5 .

(1.22)
(1.23)

Hàm hồi quy phân vị còn có tính chất đẳng biến khi thay đổi vị trí. Nghĩa là,
nếu yi*  yi  X i và * là tham số của hồi quy phân vị của yi* theo X i thì
ˆ*  ˆ   .

-

(1.24)

Một tính chất khác của hồi quy phân vị là đẳng biến khi thay đổi dạng biến
số. Cụ thể, nếu X *  X . A với A là ma trận không suy biến, thì ˆ*  A1ˆ  .
Tính đẳng biến của hồi quy phân vị đặc biệt hữu ích trong các tính toán biến

đổi để ước lượng tham số khi dùng phương pháp quy hoạch tuyến tính.
b.2.

1

   IYi  Xi 0 Yi  X i 
n i 1

(1.25)

Hàm mục tiêu này liên tục và khả vi tại Yi  X i . Tại những điểm Yi  X i ,
đạo hàm có hướng3 của V ( ) theo hướng vecto đơn vị w là
d
V (   X iwt  |t 0
dt
1 d n

   Yi  X i  X iwt    IYi  X i  X iwt 0 
n  dt i 1
 t 0

V (  , w) 



2
3

Xem trang 47 tài liệu Hao & Naiman (2007)
Xem trang 32 của Koenker (2005)

16



  Iv 0 khi u  0

Một điểm * sẽ được gọi là cực tiểu của V ( ) nếu tất cả các đạo hàm theo
hướng của V ( ) tại * đều không âm, nghĩa là V ( * , w)  0 với mọi w  R p có
w  1 . Ký hiệu ˆ là điểm cực tiểu của hàm V (  ) . Khi đó, phần dư của hàm hồi

quy phân vị tương ứng là: e i  Yi  X iˆ .
Xét trường hợp n = k và b  R n sao cho Yi  X ib  i  1, k  thì b sẽ làm cho

V ( ) đạt cực tiểu, vì các đạo hàm có hướng tại b là
1 k
 (  I Xiw0 ) X iw  0w
k i 1

Phương án này xảy ra ở k quan sát đầu tiên và phương án này cũng được coi là
nghiệm cơ bản của (1.19). Ký hiệu  là tập con gồm có k phần tử của 1, 2,..., n và
 là tập hợp tất cả các tập  . Đồng thời, gọi X ( ) là ma trận cấp k  k với các dòng

tương ứng là X i , i   (Nghĩa là từ n dòng của ma trận X chọn ra k dòng với các
dòng có chỉ số thuộc tập  ) và y ( ) là vectơ cột cấp k 1 với các phần tử tương ứng
là Yi , i  . Khi đó hệ nghiệm cơ bản là b( )  X ( )1. y( ) với    . Mỗi phương án
thỏa mãn miền ràng buộc đều chứa k trong số n quan sát của mẫu nghiên cứu,

17

phương án b được nêu ra trước đó cũng là một trong số các phương án b( ) với

16

Như vậy, phương án tối ưu của bài toán quy hoạch tuyến tính trong hồi quy
phân vị là một trong số các phương án b( ) nên chắc chắc cũng sẽ đi qua ít nhất k
quan sát của mẫu. Hay nói cách khác, có ít nhất k quan sát có phần dư bằng 0 trong
hàm hồi quy phân vị của mẫu.
Hình 1. 2 là một ví dụ minh họa bằng hình ảnh của tính chất trên đối với một

hàm hồi quy phân vị hai biến. Nhìn trên đồ thị, mỗi dấu chấm là biểu diễn của một
quan sát trong mẫu, ta nhận thấy mỗi hàm hồi quy phân vị trên hình đi qua ít nhất hai
quan sát của mẫu số liệu có được.
b.4. Số quan sát có phần dư âm của hàm hồi quy phân vị ứng với phân vị τ có thể
đạt tỷ lệ cao nhất là τ

18

Xét phần dư e i  Yi  X iˆ của hàm hồi quy phân vị có chứa hệ số tự do. Ký
hiệu P là số quan sát có phần dư dương; N là số quan sát có phần dư âm và Z là số
quan sát có phần dư bằng 0. Khi đó
N  n   N  Z

(1.27)

P  n(1   )  P  Z

(1.28)

Từ tính chất này có thể suy ra rằng với mỗi hàm hồi quy ứng với phân vị  thì
sẽ có không quá  .100% số quan sát của mẫu nằm phía dưới đường hồi quy phân vị
(có phần dư u i âm) và không quá (1   ).100% số quan sát nằm phía trên (có phần dư

q90

18

q75

16y

q50
q25

12

14

q10

6

8

10
y
q25
q75
X trung binh

12

14

lập và có cùng phân phối).

+

g () là một tập mở

20

 là một hàm liên tục theo g , kỳ vọng có điều kiện của  theo các giá trị

+

thực của ( X , y ) luôn tồn tại với mọi g
1 n
 ( yi , X i , g ) là hội tụ hầu chắc theo trên g () về EX Eo ( yi , X i , g )
n i 1

+

Lời giải duy nhất của bài toán cực trị là g0  g (0 ) trong đó 0 là tham số

+

của hàm phân phối “đúng”
Trong bài toán hồi quy phân vị, ước lượng ˆ là lời giải bài toán cực tiểu
(1.17), vì thế ˆ có thể coi là một M-estimator và khi mô hình hồi quy phân vị thỏa
mãn các điều kiện chính quy thì nó cũng hội tụ về giá trị đúng của tham số hồi quy
cần tìm.
b.7. Ước lượng của hồi quy phân vị có thể xem là xấp xỉ của ước lượng GMM

Xét hàm moment m( , Yi , X i )  X i   IYi  X i 0
Hàm kỳ vọng của (1.31) có dạng
21



(1.31)





E  m(  , yi , X i )   E  X i   IYi  X i 0 







 E  X i   E  IYi  X i 0 | X i  


 
 E  X i   FY | X ( X i )  

Khi phân vị hồi quy được thực hiện tại phân vị  , tham số  nhận giá trị cụ thể là

 , thì FY | X ( X i ) phải bằng  sao cho E  m( , yi , X i )  0

  E  m(  , Yi , X i )m(  , Yi , X i ) 


 E   X i   IYi  X i 0   X i   IYi  X i 0  


















2
 E  X i X i   IYi  X i 0 



Ta có IY  X  0 có phân phối Bernoulli với trung bình là  và phương sai  (1   ) .
i

(1.36)

Nếu không có hiện tượng phương sai thay đổi, hàm mật độ của sai số  i độc lập với
X , và do đó f i (0 | X i )  f (0) thì công thức (1.46) được viết lại thành

 

 (1   )
2

f (0)

 E[ X i X i]

1

(1.37)

Trong thực tế tính toán với số liệu mẫu, E[ X i X i] được ước lượng bằng

1 n
 X i X i
n i 1

Hendricks & Koenker (1991) ước lượng f (0 | X i ) và D bằng các công thức:
fˆi 

2h

d
n  ˆ    
 N  0, (1   ) D1D1 

6
7

Trang 75 sách “Quantile Regression” của Koenker (2005)
Trang 92 sách “Quantile Regression” của Koenker (2005)

23

Dưới giả thiết H 0
d
nR(ˆ   )  n ( R(ˆ )  r ) 
 N (0, (1   )(  ))

Trong đó (  )  RD1D1R
Wn ( ) 


n  R ( ˆ )  r  ˆ 1 (  )  R( ˆ )  r 

d

  2 (q)

 (1   )
ˆ   RD1ˆ D1R , với D1ˆ D1 là một ước lượng vững của D1D1


  2 (q )

d. Ưu điểm và nhược điểm của hồi quy phân vị
Sau khi Koenker và Bassett (1978) giới thiệu mô hình hồi quy phân vị đầu tiên,
rất nhiều các nghiên cứu được thực hiện sau đó nhằm khắc phục các nhược điểm,

24

đồng thời mở rộng hồi quy phân vị. Ngày càng có nhiều các bài nghiên cứu ứng
dụng hồi quy được thực hiện và công bố, cho thấy hồi quy phân vị đang ngày càng
được hoàn thiện và ngày càng trở thành công cụ đắc lực trong nghiên cứu kinh tế.
Theo Koenker (2005) và Hao & Naiman (2007), hồi quy phân vị có những ưu điểm
như sau.
Ưu điểm
-

Thứ nhất, phương pháp hồi quy phân vị cho phép thể hiện một cách chi tiết về
mối quan hệ giữa biến phụ thuộc và các biến độc lập trên từng phân vị của biến
phụ thuộc, không phải chỉ xét mối quan hệ này trên giá trị trung bình như hồi
quy OLS. Ưu điểm này thể hiện rõ trong Hình 1. 1. Trong đó, Hình 1. 1 thể hiện
nhiều hàm hồi quy cho nhiều phân vị, cho thấy tác động khác nhau của biến độc
lập X ứng với nhiều phân vị của biến phụ thuộc Y.

-

Thứ hai, mặc dù các tính toán thực hiện trong hồi quy phân vị là phức tạp và
khối lượng tính toán nhiều hơn trong OLS, nhưng với sự phát triển của toán
học, thống kê học cộng với sự hỗ trợ của công nghệ thông tin thì những tính

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở việt nam - Pdf 35

Tài liệu, ebook tham khảo khác

Học thêm