Chương trình Giảng dạy Kinh tế Fulbright
Niên khoá 2006-2007
Kinh tế vi mô
Bài đọc
Giải pháp thương lượng Nash 1 Biên dịch: Kim Chi
Hiệu đính: Vũ Thành Tự Anh
GIẢI PHÁP THƯƠNG LƯỢNG NASH
2.1 Dẫn nhập
Một giải pháp thương lượng có thể được diễn giải như một công thức xác định một
kết quả duy nhất cho từng tình huống thương lượng của một lớp các tình huống
thương lượng nào đó. Trong chương này, tôi sẽ nghiên cứu giải pháp thương lượng do
Nash đề xuất.
1
Giải pháp thương lượng Nash được định nghĩa bằng một công thức
tương đối đơn giản, và có thể được áp dụng cho một lớp tình huống thương lượng
rộng lớn – và những đặc điểm này tạo nên tính hấp dẫn cho giải pháp Nash trong các
ứng dụng. Tuy nhiên, lý do quan trọng nhất khiến chúng ta nghiên cứu và áp dụng
giải pháp thương lượng Nash là bởi nó có những nền tảng chiến lược vững chắc; một
số mô hình thương lượng trong lý thuyết trò chơi đã nghiêng về việc sử dụng giải
pháp này. Các mô hình thương lượng chiến lược này sẽ được nghiên cứu trong những
chương sau, trong đó tôi sẽ đề cập đến những lý do tại sao, khi nào, và làm thế nào sử
dụng giải pháp thương lượng Nash.
Mặt khác, mục đích chính của chương này là tìm hiểu thấu đáo về định nghĩa
giải pháp thương lượng Nash, mà trong bối cảnh cụ thể, sẽ giúp chúng ta có thể dễ
dàng mô tả đặc điểm và sử dụng giải pháp này trong các ứng dụng khác.
Trong phần kế tiếp, tôi sẽ định nghĩa và mô tả giải pháp thương lượng Nash
của một tình huống thương lượng cụ thể, trong đó có hai người tham gia thương
Giải pháp thương lượng Nash 2 Biên dịch: Kim Chi
Hiệu đính: Vũ Thành Tự Anh
thương lượng Nash có thể bị tác động bởi thái độ đối với rủi ro của những người tham
gia.
Trong phần 2.7, tôi chỉ ra rằng định nghĩa về giải pháp thương lượng Nash
trình bày trong phần 2.2 và phần 2.4 không thể mang lại một cách diễn giải tự nhiên
cho giải pháp này. Một định nghĩa khác (tương đương) sẽ được trình bày trong phần
2.7, cho thấy rằng giải pháp thương lượng Nash có thể được diễn giải như một thông
lệ thương lượng ổn định.
Phần 2.8 định nghĩa và mô tả các giải pháp thương lượng Nash bất cân xứng.
Các dạng khái quát hoá của giải pháp thương lượng Nash này tạo điều kiện thuận lợi
để chúng ta xem xét đến những yếu tố bổ sung của một tình huống thương lượng, có
thể được xem là phù hợp với kết quả thương lượng. (Các phần 2.6, 2.7, và 2.8 không
dịch – ND).
2.2 Thương lượng chia bánh
Hai người A và B thương lượng về việc phân chia một ổ bánh có độ lớn π, trong đó
π
> 0. Tập hợp các thỏa thuận có thể có là x = {(x
A
, x
B
) : 0 ≤ x
A
≤
π
và x
thuận, thì người tham gia i sẽ đạt được độ thoả dụng d
i
trong đó d
i
≥
U
i
(0). Có một
thỏa thuận x
∈
X sao cho U
A
(x) > d
A
và U
B
(x) > d
B
, điều này đảm bảo rằng có một
thỏa thuận giúp đôi bên cùng có lợi.
Cặp độ thỏa dụng d = (d
A
, d
B
) được gọi là điểm bất đồng (disagreement point).
Để định nghĩa giải pháp thương lượng Nash của tình huống thương lượng này, trước
tiên ta cần định nghĩa tập hợp Ω bao gồm những cặp độ thỏa dụng có thể có (possible
utility pairs) mà đôi bên có thể đạt được thông qua thỏa thuận. Ứng với tình huống
thương lượng vừa mô tả trên đây,
U
A
(
π
)]. Từ tính đơn điệu nghiêm ngặt của U
i
, có một phần bánh x
A
∈
[0,
π
] sao cho
U
A
(x
A
) = u
A
; nghĩa là, x
A
=
1−
A
U(u
A
), trong đó
1−
A
U là ký hiệu hàm nghịch đảo của
A
(
π
) và u
B
= g(u
A
)}; nghĩa là, Ω là đồ thị của hàm số g : [U
A
(0),
U
A
(
π
)]
→
ℜ
.
2
Ta nên lưu ý rằng hàm nghịch đảo
1−
A
U là một hàm số có tính tăng dần nghiêm ngặt và có dạng lõm,
miền xác định của hàm số này là đoạn [U
A
(0), U
A
, u
B
)
∈
Θ
trong đó,
Θ
≡
{(u
A
, u
B
)
∈
Ω
: u
A
≥
d
A
và u
B
≥
d
và u
B
≥
d
B
}.
Bài toán tối ưu vừa phát biểu trên đây có một nghiệm duy nhất, vì (u
A
– d
A
)(u
B
– d
B
), thường được gọi là tích số Nash (Nash product), thì liên tục và gần như có dạng
lồi nghiêm ngặt (lồi về phía gốc tọa độ - ND), hàm số g giảm dần nghiêm ngặt và có
dạng lồi (như được phát biểu dưới đây trong Bổ đề 2.1), và tập hợp Θ là một tập hợp
không rỗng.
3
Hình 2.1 minh họa giải pháp thương lượng Nash. Vì
N
A
u> d
A
và
N
B
u>
> d
A
và u
B
> d
B
.
Hằng số
Vuihoc24h.vn
Chương trình Giảng dạy Kinh tế Fulbright
Niên khoá 2006-2007
Kinh tế vi mô
Bài đọc
Giải pháp thương lượng Nash 4 Biên dịch: Kim Chi
Hiệu đính: Vũ Thành Tự Anh
Hình 2.1: u
N
là giải pháp thương lượng Nash của tình huống thương lượng mà trong
đó tập hợp Ω của các cặp độ thỏa dụng khả dĩ có thể đạt được thông qua thỏa thuận là
đồ thị của hàm số g, và d là điểm bất đồng.
2.2.1 Mô tả đặc điểm
Định đề 2.1. Trong tình huống thương lượng mô tả trên đây, nếu đạo hàm của hàm số
g tồn tại (differentiable), thì giải pháp thương lượng Nash là nghiệm duy nhất của hệ
phương trình sau:
AA
BB
A
)(g(u
A
) – d
B
) đạt giá trị tối đa. Định đề được suy ra ngay lập tức bằng đạo hàm bậc
nhất.
Hình 2.2: Khi đạo hàm của hàm số g tồn tại, giải pháp thương lượng Nash là điểm
duy nhất trên đồ thị g có độ dốc của đường thẳng L
N
bằng với giá trị tuyệt đối của độ
dốc của tiếp tuyến duy nhất T
N
.
Điều cần lưu ý trong một số ứng dụng là đặc điểm hình học sau đây của giải
pháp thương lượng Nash – đặc điểm này có giá trị khi hàm số g có thể lấy đạo hàm và
Vuihoc24h.vn
Chương trình Giảng dạy Kinh tế Fulbright
Niên khoá 2006-2007
Kinh tế vi mô
Bài đọc
Giải pháp thương lượng Nash 5 Biên dịch: Kim Chi
Hiệu đính: Vũ Thành Tự Anh
được suy ra từ Định đề 2.1. Giải pháp thương lượng Nash là điểm u
N
duy nhất trên đồ
thị có đặc điểm là độ dốc của đường thẳng nối giữa điểm u
N
BAB
AA
AAA
xU
dxU
xU
dxU
−
−−
=
−
π
π
,
và phần bánh của người tham gia B trong giải pháp thương lượng Nash là
N
A
N
B
xx −=
π
.
Chứng minh. Kết quả được suy ra ngay lập tức từ Định đề 2.1 sau khi lấy đạo hàm
của hàm số g (theo u
A
) và lưu ý rằng U
i
(x
i
) = u
A
+). Kết quả sau đây có thể dễ dàng được chứng minh, và được minh
họa trong hình 2.3.
Định đề 2.2. Trong tình huống thương lượng mô tả trên đây, nếu hàm số g không thể
lấy đạo hàm tại giải pháp thương lượng Nash, thì sẽ tồn tại một số k, trong đó,
g’
(
N
A
u-)
≥
k
≥
g’(
N
A
u +), sao cho giải pháp thương lượng Nash là nghiệm duy nhất
của hệ phương trình sau đây:
AA
BB
du
du
k
−
−
=−
và u
B
= g(u
A
N
bằng với giá trị tuyệt đối của độ
dốc tiếp tuyến T
N
nào đó.
Nhận xét 2.1 (So sánh tĩnh – comparative-statics). Ta có thể chứng minh được
những kết quả sau đây bằng cách sử dụng các đặc điểm hình học của giải pháp thương
lượng Nash, như minh họa trong hình 2.2 và 2.3. Vì giải pháp thương lượng Nash của
tình huống thương lượng mô tả trên đây phụ thuộc vào điểm bất đồng, tôi nhấn mạnh
điều này bằng cách viết giải pháp thương lượng Nash là
N
A
u(d),
N
B
u (d)). Gọi d và d’ là
hai điểm bất đồng khác nhau sao cho
d’
i
> d
i
và d’
j =
d
j
(j
≠
i). Nếu hàm số g có thể lấy
vi phân tại
N
N
j
u (d).
2.2.2 Các ví dụ
Ví dụ 2.1. (Qui tắc chia phần còn lại). Giả sử U
A
(x
A
) = x
A
đối với mọi x
A
∈
[0,
π
] và
U
B
(x
B
) = x
B
đối với mọi x
B
∈
[0,
π
B
ddu +−=
π
Như vậy,
Vuihoc24h.vn
Chương trình Giảng dạy Kinh tế Fulbright
Niên khoá 2006-2007
Kinh tế vi mô
Bài đọc
Giải pháp thương lượng Nash 7 Biên dịch: Kim Chi
Hiệu đính: Vũ Thành Tự Anh
)(
2
1
BAA
N
A
dddx −−+=
π
và )(
2
1
BAB
N
B
dddx −−+=
A
) =
γ
A
x đối với mọi x
A
∈
[0,
π
] , trong đó 0 <
γ
< 1, U
B
(x
B
) = x
B
đối với mọi x
B
∈
[0,
π
] và d
A
= d
B
= 0. Điều này có nghĩa là đối với
B
x.
Khi γ tăng dần,
N
A
x giảm dần và
N
B
x tăng dần. Ở mức giới hạn, khi γ → 0,
N
A
x
→
0 và
N
B
x
→
1. Người tham gia B có thể được xem là một người trung tính với rủi ro (vì
hàm thỏa dụng của B là hàm tuyến tính), trong khi người tham gia A là người ghét rủi
ro (vì hàm thỏa dụng của A có dạng lồi nghiêm ngặt), trong đó mức độ ghét rủi ro của
A giảm dần trong γ. Ứng với cách diễn giải theo hàm thỏa dụng này, ta thấy phần
bánh của người tham gia A giảm dần khi A trở nên ghét rủi ro hơn.
2.3 Các ứng dụng
2.3.1 Hối lộ và kiểm soát tội phạm
Một cá nhân C quyết định xem có nên đánh cắp một số tiền nhất định π hay không,
trong đó
π
> 0. Nếu C đánh cắp số tiền, thì xác suất xảy ra tình huống C bị viên cảnh
sát P bắt được là ζ. Viên cảnh sát này có thể bị mua chuộc, và thương lượng với tội
Tình huống thương lượng mô tả trên đây là một trường hợp đặc biệt của ví dụ
2.1, và như vậy, ngay lập tức ta suy ra rằng giải pháp thương lượng Nash là
N
C
u =
π
[1
– (v/2)],
và
N
P
u=
π
v/2. Số tiền hối lộ gắn liền với giải pháp thương lượng Nash là b
N
=
π
v/2. Lưu ý rằng, cho dù tiền phạt không bao giờ được nộp cho chính quyền, tỷ lệ
Vuihoc24h.vn
Chương trình Giảng dạy Kinh tế Fulbright
Niên khoá 2006-2007
Kinh tế vi mô
Bài đọc
Giải pháp thương lượng Nash 8 Biên dịch: Kim Chi
Hiệu đính: Vũ Thành Tự Anh
nộp phạt vẫn ảnh hưởng đến số tiền mua chuộc mà kẻ phạm tội trao cho viên cảnh sát
ăn hối lộ.
2. Vì
ζ
< 1 và 0 < v < 1 có nghĩa là
ζ
v < 1, ứng với
tỷ lệ nộp phạt bất kỳ
v
∈
(0, 1], và xác suất bị bắt bất kỳ
ζ
< 1, hành vi phạm tội sẽ
xảy ra. Vì vậy, phân tích này khẳng định nhận thức thông thường rằng
nếu người ta
trốn được khoản tiền phạt thông qua hành vi hối lộ, thì tiền phạt không có vai trò
gì trong việc ngăn ngừa tội phạm.
5
2.3.2 Sở hữu tài sản tối ưu (không dịch)
2.4 Định nghĩa tổng quát
Một vấn đề thương lượng là một cặp (
Ω
, d), trong đó
Ω
⊂
ℜ
2
và d
∈
∈
I
A
sao cho u
A
> d
A
và h(u
A
) > d
B
.
7
Giả định 2.2. Tập hợp Ω
w
của các cặp độ thỏa dụng có hiệu quả Pareto yếu là một
tập hợp đóng.
8
Lưu ý rằng (theo định nghĩa biên giới hiệu quả Pareto), h có tính giảm dần
nghiêm ngặt. Tập hợp tất cả những vấn đề thương lượng thỏa Giả định 2.1 và Giả
định 2.2 được ký hiệu là ∑. Nghĩa là, ∑ ≡ {(Ω, d) : Ω ⊂ ℜ
2
, d ∈ ℜ
2
, và cặp (Ω, d)
thỏa Giả định 2.1 và Giả định 2.2}.
Định nghĩa 2.1. Giải pháp thương lượng Nash (NBS) là một hàm số f
N
u
B
)
∈
Ω
e
nếu và chỉ nếu (u
A
,
u
B
)
∈
Ω
và không tồn tại một cặp độ thỏa
dụng khác (u’
A
,
u’
B
)
∈
Ω
sao cho u’
A
,
u
B
)
∈
Ω
và không tồn tại một cặp độ thỏa
dụng khác (u’
A
,
u’
B
)
∈
Ω
sao cho u’
A
> u
A
,
u’
B
> u
B
. Lưu ý rằng Ω
, d) là
nghiệm duy nhất của bài toán tối đa hoá sau đây:
max (u
A
– d
A
)(u
B
– d
B
)
(u
A
, u
B
)
∈
Θ
trong đó,
Θ
≡
{(u
A
, u
B
)
= h(u
A
), u
A
≥
d
A
và u
B
≥
d
B
}.
Bài toán tối đa hoá trên đây có một nghiệm duy nhất, vì (u
A
– d
A
)(u
B
– d
B
),
thường được gọi là tích số Nash, thì liên tục và gần như có dạng lồi nghiêm ngặt (về
phía gốc tọa độ - ND), và vì Giả định 2.1 ngụ ý rằng hàm số h có tính giảm dần
nghiêm ngặt và có dạng lồi, và tập hợp Θ là một tập hợp không rỗng. Ta cũng nên lưu
ý rằng giải pháp thương lượng Nash có đặc điểm là
N
i
ℜ
: có một u
A
∈
I
A
sao cho u
B
=
h(u
A
)}. Từ Giả định 2.1, ta suy ra rằng h(I
A
) = [
B
B
uu , ], trong đó, h(
A
u) =
B
u
≥
B
u
= h(
A
u ). Ngoài ra, Giả định 2.1 ngụ ý rằng d
i
≥
i
u (i = A, B) – thì giải pháp thương lượng Nash được minh họa trong hình 2.1 với g
được thay bằng
h.
9
Một cách cụ thể, giải pháp thương lượng Nash nằm bên trong của
đồ thị h; nghĩa là,
N
A
f(
Ω
, d)
∈
(
A
A
uu , ) và
N
B
f(
Ω
, d)
∈
(
B
B
h, nghĩa là u
N
= (
B
A
uu ,
).
Nhận xét 2.2. Vấn đề thương lượng (Ω, d), mà từ đó chúng ta định nghĩa giải pháp
thương lượng Nash, là một khái niệm trừu tượng. Dù vậy, vấn đề này có giá trị trong
một vài khía cạnh nhất định, nó giúp làm tăng khả năng ứng dụng của giải pháp
thương lượng Nash, và hữu ích trong việc diễn giải khái niệm về vấn đề thương
lượng theo những yếu tố cơ bản sau
đây của một tình huống thương lượng: (i) Tập
hợp X của các thỏa thuận vật chất có thể có, (ii) Kết quả “bất đồng” D, là kết quả hay 9
Ta nên lưu ý rằng trong tình huống thương lượng cụ thể được nghiên cứu trong phần 2.2, biên giới
Pareto Ω
e
= Ω, tập hợp các cặp độ thỏa dụng có thể đạt được thông qua thỏa thuận, và vì thế, Ω
e
là đồ
thị hàm số g. Ngược lại, trong một vấn đề thương lượng tuỳ ý (
Ω
, d)
∈
∑
, biên giới Pareto Ω
.
Khi đó, một vấn đề thương lượng (Ω, d) có thể được suy ra từ những yếu tố này như
sau: Ω = {(u
A
,
u
B
) : có một x
∈
X sao cho U
A
(x) = u
A
và U
B
(x) = u
B
} và d = (U
A
(D),
U
B
(D)).
2.5. Các ứng dụng
2.5.1. Thương lượng giữa công ty và công đoàn
Một công ty và công đoàn thương lượng về mức lương w và mức lao động L. Tập hợp
các thỏa thuận có thể có là tập hợp các cặp tiền lương và mức lao động (w, L) sao cho
w
≥
thuận có thể có là x = {(w, L) : w
≥
w
u
, L
≤
L
0
, và R(L) – wL
≥
0}. Nếu những người
tham gia không đạt được thỏa thuận, thì công ty phải đóng cửa và L
0
người lao động
sẽ trở nên thất nghiệp. Nếu những người tham gia đạt được thỏa thuận về (w, L)
∈
X,
thì lợi nhuận của công ty là
∏
(w, L) = R(L) – wL, và độ thỏa dụng của công đoàn là
U(w, L) = wL + (L
0
– L)w
u
, tạo thành tổng thu nhập mà các thành viên công đoàn sẽ
nhận được. Vì R(0) = 0, lợi nhuận của công ty nếu các bên không đạt được thỏa thuận
cũng bằng không. Độ thỏa dụng của công đoàn trong trường hợp này là w
u
L
0
Như vậy, một
cặp độ thỏa dụng (u, π) ∈ Ω
e
chỉ khi mức lao động L = L*. Do đó, biên giới Pareto Ω
e
là đồ thị của hàm số h được định nghĩa như sau: Đối với mỗi mức thỏa dụng của công
đoàn u ∈ [w
u
L
0
, s], h(u) = s – u, trong đó s ≡ R(L*) + (L
0
– L*)w
u
.
Áp dụng Hệ quả 2.2, ta suy ra rằng giải pháp thương lượng Nash là
π
N
= (s -
w
u
L
0
)/2 và u
N
= w
u
L
0
thu biên và doanh thu bình quân. 10
Ta giả định rằng L*
≤
L
0
và R(L*) – w
u
L* > 0.
Vuihoc24h.vn
Chương trình Giảng dạy Kinh tế Fulbright
Niên khoá 2006-2007
Kinh tế vi mô
Bài đọc
Giải pháp thương lượng Nash 11 Biên dịch: Kim Chi
Hiệu đính: Vũ Thành Tự Anh
2.5.2. Tâm lý ỷ lại trong tập thể (adverse selection in team) (không dịch)
2.5.3. Hối lộ và kiểm soát tội phạm: phần mở rộng
Một giả định ngầm ẩn của ứng dụng vừa được nghiên cứu trong phần 2.3.1 là: cá nhân
C (kẻ phạm tội) chỉ có một
trách nhiệm hữu hạn theo ý nghĩa là số tiền hối lộ tối đa
mà viên cảnh sát có thể thu được chỉ bằng với số tiền π đánh cắp được (nghĩa là b
≤
π
) =
π
- u
C
. Điểm bất đồng (d
C
, d
P
) = (
π
(1 – v), 0).
Áp dụng Bổ đề 2.2, lưu ý rằng
C
u = –
∞
và
P
u
= 0, ta suy ra rằng giải pháp
thương lượng Nash là
N
C
u
=
π
[1 – (v/2)] và
N
P
u=
π
π
v >
π
, thì khoản chênh lệch π(v – 1) có thể được diễn giải là một khoản tiền tương đương của một án
tù.
12
Phân tích ở đây xem ra tương đối có vẻ hợp lý hơn so với phân tích trong phần 2.3.1.
Vuihoc24h.vn