Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel
07/10/2008 1
TÍNH TOÁN TẦN SUẤT THEO PHÂN BỐ GUMBEL
Nghiêm Tiến Lam
Khoa Kỹ thuật Biển, Đại học Thuỷ lợi
1. Giới thiệu
Phân bố xác suất Gumbel (hay còn gọi là phân bố xác suất cực trị loại I (EV1 - Extreme
Value type I), phân bố xác suất Fisher-Tippett loại I hoặc phân bố xác suất log-Weibull)
thường được dùng để mô hình hoá thống kê các đại lượng cực trị như dòng chảy lũ, dòng
chảy kiệt, vận tốc gió lớn nhất và các thiên tai như động đất. Đường tần suấ
t theo phân bố
Gumbel có thể được vẽ bằng MS Excel hoặc các phần mềm phân tích tần suất như FFC
(
1.1. Hàm mật độ xác suất
Hàm mật độ xác suất biểu thị xác suất xuất hiện giá trị của đại lượng ngẫu nhiên X bằng với
một giá trị x cụ thể nào đó theo luật phân bố xác suất Gumbel như (1):
()
1
exp exp exp
xa xa
fx
bb b
⎧
⎫
⎡−⎤ ⎡−⎤
⎛⎞ ⎛⎞
=− −−
⎨
⎬
⎣
⎦
⎩⎭
∫
(2)
Trong thực tế ngành thuỷ lợi thường dùng tần suất vượt P (thường chỉ được gọi tắt là tần
suất) là xác suất xuất hiện các giá trị của đại lượng ngẫu nhiên X lớn hơn hoặc bằng một giá
trị x cụ thể nào đó.
{}() {} ()
11
x
PPX x fxdx PX x Fx
∞
=≥= =−≤=−
∫
(3)
1.3. Liên hệ với các phân bố thống kê khác
Phân bố xác suất Gumbel còn gọi là phân bố xác suất cực trị loại I (EV1), là trường hợp đặc
biệt của phân bố cực trị tổng quát (GEV) với thông số hình dạng c = 0. Phân bố Gumbel với
thông số vị trí a = 0 và thông số tỷ lệ b =1 được gọi là phân bố cực trị chuẩn.
Hàm phân bố xác suất Gumbel còn được gọi là phân bố xác suất log-Weibull và tiệm cận với
phân bố Weibull khi c lớn. N
ếu X là biến tuân theo phân bố Gumbel G(0,1) và Y là biến tuân
theo phân bố Weibull W(b,c) thì X ~ -c·ln(Y/b).
Nếu X là biến tuân theo phân bố Gumbel G(a,b) và Y là biến tuân theo phân bố hàm mũ E(b)
thì X = a – ln(Y).
Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel
07/10/2008 2
Nếu X
C
x
π
= (5)
1.139547
S
C
=
(6)
Do vậy
0.779
V
bxC
=
⋅⋅ (7)
(
)
10.450
V
ax C=− ⋅ (8)
1.5. Giá trị của hàm phân bố lý thuyết
Tuyến tính hoá phương trình (2) bằng cách lấy logarith vế của (2) như sau
()
ln exp
x
a
Fx
(
)
ln ln
x
ab Fx=−⋅ −
⎡
⎤
⎣
⎦
(11)
(11) là quan hệ tuyến tính giữa x và ln[-lnF(x)], dựa vào các giá trị quan sát của x và tần suất
kinh nghiệm của nó để xác định các hệ số a, b của tương quan tuyến tính này.
Nếu biểu thị qua tần suất vượt thì giá trị x
p
của hàm phân bố lý thuyết ứng với tần suất P
(
)
ln ln 1
P
x
ab P=−⋅ − −
⎡
⎤
⎣
⎦
(12)
2. Tính toán hàm phân bố Gumbel bằng MS Excel
Từ quan hệ tuyến tính (12), các thông số của phân bố Gumbell có thể được xác định bằng
phương pháp tương quan giữa x và ln[-ln(1-P)], với b là hệ số góc của quan hệ tương quan và
1
= 1/(N+1) ln(-ln(1-P
1
))
2 x
2
P
2
= 2/(N+1) ln(-ln(1-P
2
))
… … … …
i
x
i
P
i
= i/(N+1) ln(-ln(1-P
i
))
… … … …
N
x
N
P
N
= N/(N+1) ln(-ln(1-P
N
))
3.
Hệ số phân tán C
V
= STDEV(X)/
x
.
4.
Hệ số thiên lệch C
S
= SKEW(X).
2.3. Tính các đăc trưng thống kê của chuỗi số theo phương pháp đồ thị:
Có thể xác định các thông số theo phương pháp đồ thị theo 2 cách.
Cách 1: Vẽ đường hồi quy
1.
Vẽ đồ thị quan hệ giữa cột 4 và cột 2. Chọn cột 2 và cột 4, chọn trên trình đơn Insert
→
Chart. Chọn loại đồ thị là XY (Scatter), chọn Chart sub-type là chấm điểm theo
mặc định. Chú ý sửa lại tên các cột để cột 4 là các giá trị trên trục hoành và cột 2 là
các giá trị trên trục tung của đường quan hệ.
2.
Xác định các thông số của quan hệ. Chọn các điểm quan hệ trên đồ thị vừa vẽ, chọn
trên trình đơn
Chart → Add Trendline. Chọn dạng quan hệ trong Trend/Regression
Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel
07/10/2008 4
type là Linear, Đánh dấu các mục Display equation on chart và Display R-squared
value on chart
trong Options, cuối cùng bấm phím OK.
3.
3.1. Tính các thông số thống kê theo phương pháp moments
1. Ô C7: Độ dài chuỗi số (N) =COUNT(B16:B30).
2.
Ô C8: Trị trung bình (
x
) =AVERAGE(B16:B30).
3.
Ô C9: Hệ số phân tán tính theo phương pháp moments (C
V
) =STDEV(B16:B30)/C8.
4.
Ô C10: Hệ số thiên lệch tính theo phương pháp moments (C
S
) =SKEW(B16:B30).
5.
Ô C11: Thông số tỷ lệ tính theo phương pháp moments (b) =C9*C8*0.7796968.
6.
Ô C12: Thông số tỷ lệ tính theo phương pháp moments (a) =C8*(1-C9*0.45).
3.2. Tính bảng tần suất kinh nghiệm
1. Tính tần suất kinh nghiệm P
i
= i/(N+1) trong cột 3,
ví dụ ô C16: =100*A16/($C$7+1).
2.
Tính toán LN(-LN(1-P
i
)) trong cột 4, ví dụ ô D16: =LN(-LN(1-0.01*C16))
Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel
07/10/2008 5
2.
Đường tần suất vẽ quan hệ giữa cột (3) và cột (4) của bảng 2 như Hình 3.
Hình 3: Đường tần suất phân bố Gumbel vẽ bằng MS Excel
Hướng dẫn thực hành Kỹ thuật Bờ biển Tính toán tần suất theo phân bố Gumbel
07/10/2008 7
Mục lục
TÍNH TOÁN TẦN SUẤT THEO PHÂN BỐ GUMBEL 1
1. Giới thiệu 1
1.1. Hàm mật độ xác suất 1
1.2. Hàm phân bố tần suất luỹ tích 1
1.3. Liên hệ với các phân bố thống kê khác 1
1.4. Xác định các thông số theo phương pháp moments 2
1.5. Giá trị của hàm phân bố lý thuyết 2
2. Tính toán hàm phân bố Gumbel bằng MS Excel 2
2.1. Lập bảng phân bố tần suất thực nghiệm (Bảng 1) 3
2.2. Tính các đăc trưng thống kê của chuỗi số theo phương pháp moments: 3
2.3. Tính các đăc trưng thống kê của chuỗ
i số theo phương pháp đồ thị: 3
2.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) 4
2.5. Vẽ đường tần suất 4
3. Ví dụ tính toán 4
3.1. Tính các thông số thống kê theo phương pháp moments 4
3.2. Tính bảng tần suất kinh nghiệm 4
3.3. Tính các thông số thống kê theo phương pháp đồ thị 5
3.4. Lập bảng phân bố tần suất lý thuyết (Bảng 2) và đường tần suất 6
Mục lục 7