73 74
DO j=1, 13
t(j)= t(j)+(d(j)-t(j))/(n2-n1)*(n-n1)
ENDDO
ENDIF
IF (beta.LT.b(1)) THEN
j=1
ELSE IF (beta.GT.b(13)) THEN
j=12
ELSE
j=1
3 IF (beta.GE.b(j).AND.beta.LE.b(j+1)) GOTO 4
j=j+1
GOTO 3
ENDIF
4 TraB24 = t(j)+(t(j+1)-t(j))*(beta-b(j))
* /(b(j+1)-b(j))
RETURN
END
Chương 3
KHÁI NIỆM VỀ HỆ CÁC ĐẠI LƯỢNG NGẪU NHIÊN
VÀ ỨNG DỤNG
x
X
<
và
y
Y
< được
gọi là
hàm phân bố hệ hai đại lượng ngẫu nhiên ) ,( YX :
75 76
()
)( ),( ) ,( yYxXPyxF
<
<= . (3.1)
Về ý nghĩa hình học thì hàm phân bố
) ,( yxF
chính là xác suất
điểm ngẫu nhiên
) ,( YX rơi vào góc phần tư vô cùng có đỉnh ở điểm
) ,( yx , nằm ở bên trái và phía dưới điểm đó (hình 3.2).
Δ
y
RΔ
y
y
x
x
Chia xác suất này cho diện tích hình chữ nhật, ta sẽ được xác suất
trung bình mà điểm ngẫu nhiên rơi vào một đơn vị diện tích tại điểm
) ,( yx . Khi 0→
Δ
x
, 0→
Δ
y
, ta có
(
)
=
ΔΔ
+Δ+−Δ+−Δ+Δ+
=
ΔΔ
⊂
→Δ
→Δ
Δ
→Δ
→Δ
yx
yxFyyxFyxxFyyxxF
yx
RyX
y
x
y
x
Khi biết mật độ phân bố, có thể tìm hàm phân bố theo công thức
∫∫
∞−∞−
=
x
y
ydxdyxfyxF ) ,( ),( . (3.3)
Các đại lượng ngẫu nhiên
X
và
Y
gọi là độc lập nếu như quy luật
phân bố của từng đại lượng trong chúng không phụ thuộc vào việc đại
lượng kia nhận giá trị nào. Trong trường hợp ngược lại
X
và
Y
được
gọi là phụ thuộc.
Mật độ phân bố của hệ các đại lượng ngẫu nhiên độc lập bằng tích
của các mật độ phân bố của từng đại lượng trong hệ
)()(),( yfxfyxf
21
=
. (3.4)
Khái niệm “phụ thuộc” ở đây phải được hiểu là phụ thuộc “xác
suất”, hay phụ thuộc “ngẫu nhiên”. Nếu đại lượng
Y
liên hệ với đại
lượng
,
=
α
. (3.5)
Mô men tâm bậc
sk , :
[
]
sk
sk
YX
&&
M
,
=
μ
, (3.6)
ở đây
x
mXX −=
&
,
y
mYY −−
&
.
Những mô men gốc bậc một chính là những kỳ vọng toán học của
Y
X
, :
, :
[
]
[
]
][ D M M
,
XXYXD
x
====
202
02
&&&
μ
,
[
]
[
]
][ D M M
,
YYYXD
y
====
220
20
&&&
μ
.
Mô men tâm hỗn hợp bậc hai
)( )(
∑
∑
−
−
=
, (3.8)
− Đối với các đại lượng ngẫu nhiên liên tục:
∫∫
∞
∞−
∞
∞−
−−= ydxdyxfmymxK
yxyx
),()( )(
. (3.9)
Mô men tương quan là đặc trưng của hệ, ngoài mô tả sự tản mạn của
các đại lượng
Y
X
,
, nó còn đặc trưng cho sự liên hệ giữa các đại lượng.
Người ta chứng minh được rằng đối với những đại lượng ngẫu nhiên độc
lập mô men tương quan bằng không. Xét theo cấu trúc của công thức
(3.7), thấy rằng nếu mức độ tản mạn của một trong hai đại lượng
X
hay
Hệ số tương quan đặc trưng không phải cho sự phụ thuộc bất kỳ mà
chỉ cho sự phụ thuộc tuyến tính.
Công thức ước lượng các đặc trưng số của hệ hai đại lượng ngẫu
nhiên có dạng sau:
n
x
m
n
i
i
x
∑
=
=
1
~
;
n
y
m
n
i
i
y
∑
=
=
1
~
;
my
D
n
i
yi
y
)
~
(
~
;
1
1
−
−−
=
∑
=
n
mymx
K
n
i
yixi
yx
)
~
( )
~
(
m
x
1
11
x
21
x
1k
x
1m
x
2
12
x
22
x
2k
x
2m
x
i
i
x
1
số học:
) , , ,(
~
mk
n
x
m
n
i
ik
x
k
21
1
==
∑
=
.
Ước lượng không chệch của các phương sai:
1
1
2
−
−
=
∑
=
n
mx
)(
~
(
~.
Từ những giá trị của các mô men tương quan, xác định những giá trị
của các mô men tương quan chuẩn hóa:
lk
lk
lk
K
r
σσ
~~
~
~= ,
trong đó
llkk
DD
~
~
,
~
~
==
mm
m
m
ji
r
rr
rrr
r
222
11211
=
.
81 82
Do tính chất đối xứng, các ma trận chỉ cần điền một nửa. Ở đường
chéo chính của ma trận tương quan là các phương sai của các đại lượng
m
XXX , , ,
21
, tức
mmm
DKDKDK
~~
.; . . ;
~~
;
~~
===
222111
6 20,5 17,7 15,6 77 1020,5
7 19,0 15,3 11,4 66 1023,7
8 18,8 16,4 12,8 68 1020,4
9 19,1 17,0 15,2 78 1019,5
10 19,4 18,4 17,2 82 1015,3
. . . . . . . . . . . . . . . . . . . . . . .
366 . . . . . . . . . . . . . . . . . . . .
Kết quả tính các phần tử nửa trên bên phải của ma trận các mô men
tương quan chuẩn hóa được ghi thành bảng như sau: Tw Ta
H
Hr
Pa
Tw
1,00 0,96 0,88 0,04 -0,75
Ta
1,00 0,93 0,12 -0,80
H
1,00 0,42 -0,87
Hr
1,00 -0,41
Pa
1,00
Trong khí tượng thủy văn, bảng này thường được gọi là ma trận
= cho mối phụ thuộc giữa
y
và
x
. Hàm )( xy
ϕ
=
phụ
thuộc vào một số tham số
, , , cba Chính những tham số này cần được
xác định để sao cho tổng các bình phương độ lệch của
i
y
khỏi
)(
i
x
ϕ
cực tiểu.
Có thể viết hàm
)( xy
ϕ
= rõ hơn dưới dạng
) , , , ;( cbaxy
ϕ
= . (3.12)
Cần chọn , , , cba sao cho thỏa mãn điều kiện sau
min )] , , , ;( [
1
1
=
⎟
⎠
⎞
⎜
⎝
⎛
∂
∂
−
=
⎟
⎠
⎞
⎜
⎝
⎛
∂
∂
−
=
⎟
⎠
⎞
⎜
⎝
⎛
∂
ϕ
ϕ
(3.14)
Hệ (3.14) có số phương trình đúng bằng số tham số cần xác định.
Không thể giải hệ (3.14) ở dạng tổng quát, mà phải cho trước dạng cụ thể
của hàm
ϕ
.
1. Trường hợp bxabaxy
+
== ) , ;(
ϕ
(tức dạng phụ thuộc
tuyến tính)
ta có:
x
a
=
∂
∂ϕ
;
i
i
x
a
=
⎟
ϕ
.
Thế các biểu thức trên đây vào (3.14) ta được hệ hai phương trình để
xác định a và
b:
⎪
⎪
⎩
⎪
⎪
⎨
⎧
=+−
=+−
∑
∑
=
=
n
i
ii
n
i
iii
bxay
xbxay
1
nbxay
xbxayx
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
⇒
⇒
⎪
⎪
⎪
⎩
⎪
⎪
⎪
⎨
⎧
=−−
n
i
i
n
i
i
n
i
i
n
i
ii
Các tổng trong những phương trình trên chính là những
mô men
thống kê
khác nhau, do đó ta viết hệ thành:
⎪
⎩
⎪
⎨
⎧
=−−
=−−
0
0 ],[
**
**
2
*
***
1,1
)(][
],[
x
yx
x
yx
D
K
mX
mmYX
a =
−
−
=
α
α
.
Vậy
*
x
yx
D
K
a =
;
**
x
yx
y
x
yx
m
D
K
mx
D
K
y −+=
hay
)(
*
*
*
*
x
x
yx
y
mx
D
K
my −=− .
2. Trường hợp cxbxay ++=
2
(dạng phụ thuộc parabôn):
αααα
αααα
(3.17)
Lưu ý quy luật tạo thành những hệ số trong các phương trình (3.17)
như sau: ở vế trái chỉ có các mô men thống kê của đại lượng
X
theo thứ
tự bậc giảm dần; ở vế phải có các mô men của hệ
) ,( YX , trong đó bậc
của mô men theo
X
giảm từ phương trình này tới phương trình khác,
còn bậc theo
Y
luôn giữ nguyên là bậc một.
Các hệ số của parabôn bậc bất kỳ cũng được xác định bằng những
phương trình có cấu trúc tương tự.
3. Trường hợp
) , , , ;(
k
aaaxy
21
ϕ
=
là tổng của các hàm cho
trước bất kỳ
)( , ),( ),( xxx
k
ϕ
ϕ
=
hay
xxx
eaeaeaaaax
) , , ;(
γβα
ϕ
321321
++= .
Hệ phương trình để tính các hệ số
k
aaa , , ,
21
trong trường hợp
tổng quát (3.18) có dạng
87 88
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎩
⎪
i
iki
n
i
ikk
n
i
iki
n
i
iki
n
i
ii
n
i
iikk
n
i
i
n
i
ii
n
i
ii
n
i
iikk
n
1
1
122
1
2
11
).(
)]([ )( )()( )(
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
);(
)( )( )]
([)( )(
;)(
)( )( )( )()]([
ϕ
ϕϕϕϕϕ
ϕ
ϕϕϕϕϕ
ϕ
ϕϕϕϕϕ
(3.19)
4. Bài toán là trơn sẽ phức tạp hơn nếu trong các biểu thức của
hàm
) , , , ;( cbaxy
ϕ
= các tham số bằng số , , , cba nằm dưới dạng
phi tuyến. Trong trường hợp này thường người ta có được cách giải bằng
một phương pháp khá đơn giản qua thí dụ sau đây.
)],([)(
ϕ
.
Tổng này là một hàm phụ thuộc vào
a . Nếu biểu diễn sự biến thiên của
∑
)(a lên đồ thị, ta sẽ tìm được giá trị thích hợp của a ứng với giá trị
∑
)(a cực tiểu (hình 3.4).
),( axy
ϕ
=
a
0
0
∑
)(a
∑
)(a
a
1
b
2
b
3
b
4
b
a
sắp xếp trong bảng dưới đây:
Năm 1979 Năm 1980 Năm 1981
Tháng
w
T
a
T
w
T
a
T
w
T
a
T
1 19,9 18,2 19,7 18,0 19,6 18,2
2 20,2 19,2 17,0 15,2 19,7 18,2
3 20,6 19,6 21,3 20,7 21,6 20,9
4 23,4 22,6 23,6 22,7 25,7 25,4
5 27,9 26,4 27,9 26,9 27,9 26,2
6 29,6 28,1 30,1 28,3 30,2 28,6
7 31,0 29,8 29,8 28,7 29,8 28,8
8 29,3 28,1 29,9 28,7 30,7 29,5
9 28,9 27,4 28,8 27,3 29,8 28,3
10 27,5 25,8 28,1 25,7 26,9 24,7
11 23,7 21,9 25,7 23,9 23,6 21,5
12 21,1 20,4 21,9 19,3 19,4 17,4
Ta có tổng cộng 36 cặp giá trị nhiệt độ nước và nhiệt độ không khí
tương ứng,
36
*
===
∑
=j
jwwy
TTm ;
285,4)(
35
1
36
1
2
,
*
=−==
∑
=j
ajaTax
TT
σσ
;
91 92
253,4)(
35
1
36
1
2
,
*
y
xy
ra
σ
σ
;
775,1906,23985,0328,25
**
=×−=−=
xy
ammb .
Vậy phương trình liên hệ giữa nhiệt độ nước biển và nhiệt độ không
khí sẽ là:
aw
TT 985,0775,1 += .
Thí dụ 3.3: Xác định xu thế nước biển dâng tại trạm Hòn Dấu. Số
liệu độ cao mực nước trung bình năm (cm) tại trạm Hòn Dấu được sắp
xếp theo thứ tự năm trong bảng dưới đây:
1957 185 1966 189 1975 188 1984 204 1993 189 2002 193
1958 184 1967 186 1976 188 1985 201 1994 192 2003 197
1959 185 1968 183 1977 184 1986 189 1995 192 2004 191
1960 186 1969 187 1978 190 1987 186 1996 193 2005 190
1961 186 1970 181 1979 191 1988 186 1997 193 2006 194
1962 183 1971 189 1980 192 1989 190 1998 192 2007 190
1963 180 1972 187 1981 192 1990 187 1999 193 2008 194
1964 188 1973 192 1982 188 1991 191 2000 194
1965 196 1974 189 1983 191 1992 189 2001 197
Giả sử mực nước biển phụ thuộc tuyến tính vào thời gian, tức tăng
hoặc giảm tuyến tính theo năm. Áp dụng trường hợp 1 đã xét trên đây, ta
thiết lập một mối phụ thuộc tuyến tính
= xy .
Hình 3.6. Biến thiên của mực nước Hòn Dấu thời kỳ 1957-2008
5. Trường hợp bài toán hồi quy tuyến tính nhiều biến
Giả sử có n quan trắc đối với đại lượng phụ thuộc
y
và các đại
lượng độc lập
m
xxx , , ,
21
. Phương trình hồi quy được thiết lập như
sau
mm
xaxaxaay
+
+
+
+
=
22110
. (3.20)
Các hệ số
) , ,( mia
i
1
=
được chọn sao cho thoả mãn
93 94
[] [ ] [ ] [ ] [ ]
[] [ ] [ ] [ ] [ ]
mmmmmmm
mm
mm
mm
yxaxxaxxaxxax
yxaxxaxxaxxax
yxaxxaxxaxxax
yaxaxaxna
=++++
=++++
=++++
=++++ 22110
2222212102
1121211101
22110
Hệ phương trình này gọi là hệ phương trình chính tắc để xác định
các hệ số hồi quy
a
. Dưới dạng ma trận ta viết hệ này như sau
[
][]
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
mmmmmmm
m
m
m
b
b
(3.21)
hay dưới dạng vectơ
A x = b. (3.22)
Trong hệ phương trình (3.22), vectơ
A ký hiệu cho ma trận vuông hai
chiều các hệ số của hệ (3.21)
[
]
[
]
[
]
[] [ ] [ ] [ ]
[] [ ] [ ] [ ]
[] [ ][ ] [ ]
21
222212
112111
21
⎟
⎟
⎟
⎟
⎟
⎜
⎜
⎜
⎜
⎜
⎝
⎛
m
b
b
b
b2
1
0
và vectơ
x - ma trận một chiều các ẩn cần xác định
0
a
,
1
a
, ,
m
a
. Dấu
[
Tw Ta
H
Hr
Pa Ev Ra
Vk
Vv
Cd
Tw
1,00 0,74 0,84 0,27 -0,46 -0,36 0,28 0,52 0,40 -0,16
Ta
1,00 0.76 -0.19 -0.43 0.06 0.20 0.49 0.34 -0.02
H
1,00 0.48 -0.57 -0.50 0.16 0.52 0.45 0.07
Hr
1,00 -0.26 -0.84 -0.02 0.13 0.19 0.11
Pa
1,00 0.32 -0.05 -0.34 -0.54 -0.21
Ev
1,00 -0.02 -0.25 -0.29 -0.06
Ra
1,00 0.11 0.00 -0.27
Vk
1,00 0.35 -0.10
Vv
1,00 0.18
Cd
1,00
543210
−=++−−−−
=++−−−−
=
−−+++
=−−+++
=−−+++
=−−+++
aaaaaa
aaaaaa
aaaaaa
aaaaaa
aaaaaa
aaaaaa
Giải hệ phương trình này, ta được các hệ số hồi quy:
01,0
07,0
02,0
48,0
30,0
82,14
5
4
3
2
1
0
=
=
theo phương trình là trơn bằng 1,13
o
. Hình 3.7 là đồ thị so sánh giữa hai
chuỗi giá trị nhiệt độ nước quan trắc và tính theo phương trình hồi quy.
Bài toán thiết lập phương trình hồi quy nhiều biến như thí dụ vừa
xét hay được áp dụng để bổ khuyết số liệu quan trắc. Thí dụ, nếu trên cơ
sở lập luận hay kinh nghiệm, ta biết nhiệt độ nước liên hệ với các yếu tố
khí tượng khác bằng phương trình như trên, có thể
dùng phương trình
này để khôi phục giá trị của nhiệt độ nước nếu vì lý do nào đó nó không
được quan trắc.
Bài toán lập phương trình hồi quy, kể cả đơn biến và nhiều biến,
cũng thường dùng để lập các phương trình dự báo. Trong trường hợp
này, có thể thiết lập phương trình liên hệ giữa yếu tố cần dự báo với các
yếu tố mà nó phụ thuộc (gọi là các yếu tố tiên lượ
ng) nhưng với thời gian
trễ khác nhau, tức các giá trị của yếu tố dự báo (trong thí dụ vừa xét là
nhiệt độ nước biển) được lấy sau các giá trị của các yếu tố khí tượng một,
hai hay một số ngày. Những vấn đề về chọn các yếu tố tiên lượng phải
được xem xét kỹ hơn trên cơ sở các suy luận vật lý và kinh nghiệm của
người xử lý số liệu.
Trong phụ lục chương 3 có dẫn mã Fortran của các thủ tục tính các
hệ số hệ phương trình chuẩn tắc và giải hệ này bằng phương pháp Gauss. Phụ lục chương 3
A. Mã Fortran của thủ tục tính các ma trận A và b của phương trình
REAL Y (10000), X (10000, 50), A (0 : 50, 0 : 51)
A (0, 0) = N
DO J = 1, M
A (0, J) = 0.0
DO K = 1, N
A (0, J) = A (0, J) + X (K, J)
END DO
END DO
A (0, M + 1) = 0.0
DO K = 1, N
A (0, M + 1) = A (0, M + 1) + Y (K)
END DO
DO I = 1, M
A (I, M + 1) = 0.0
DO K = 1, N
END DO
END DO
RETURN
END
B. Mã Fortran của thủ tục Gauss giải hệ phương trình (3.21)
C
A
là mảng từ 0 đến m dòng và từ 0 đến 1
+
m cột
C
để lưu các giá trị của ma trận
A
C
Cột
1
+
m của mảng
A
lưu giá trị của hệ số b
C
X
là mảng một chiều để lưu nghiệm của hệ, tức các hệ số
i
a
DO J = I, M + 1
AMAX = A (I, J)
A (I, J) =A (K, J)
A (K, J) = AMAX
END DO
END IF
DO J = I + 1, M + 1
A (I, J) = A (I, J) / A (I, I)
END DO
DO J = I + 1, M
DO K = I + 1, M + 1
A (J, K) = A (J, K) - A (J, I) * A (I, K)
END DO
END DO
END DO
Chương 4
NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT HÀM
NGẪU NHIÊN VÀ ỨNG DỤNG
Hàm ngẫu nhiên là hàm mà trong kết quả thí nghiệm có thể nhận
dạng cụ thể nào đó không biết trước được.
Dạng cụ thể mà hàm ngẫu nhiên nhận trong kết quả thí nghiệm gọi
là hiện của hàm ngẫu nhiên. Nếu thực hiện một nhóm thí nghiệm với hàm
ngẫu nhiên, thì ta nhận được một nhóm hay một họ hiện của hàm đó. Rõ
ràng mỗi hiện là một hàm bình thường (không ng
ẫu nhiên). Nếu ta cố
định một giá trị nào đó của biến
t của hàm ngẫu nhiên