Khóa luận Tốt nghệp Nghiên cứu áp dụng phương pháp Tần suất – Nhận dạng trong giải đoán địa chất số liệu địa vật lý hàng không - Pdf 26

MỤC LỤC
LỜI MỞ ĐẦU 2
CHƯƠNG 1: LÝ THUYẾT NHẬN DẠNG 4
1.1 Lý thuyết xử lý tổ hợp số liệu 4
1.1.1 Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lý 4
1.1.2 Lựa chọn tổ hợp số liệu 5
1.2.1 Số liệu đo và mẫu ngẫu nhiên 7
1.2.2 Hàm mật độ xác suất 7
1.2.3 Một số hàm phân phối lý thuyết 8
1.3 Các thuật toán nhận dạng 10
1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận
dạng 10
1.3.2 Các thuật toán nhận dạng có mẫu chuẩn 12
1.3.3. Các thuật toán nhận dạng không có mẫu chuẩn 15
1.3.4 Quyết định sự tồn tại của đối tượng và đánh giá chất lượng xử lý 16
2.1 Phương pháp phân tích tần suất 18
2.2 Phương pháp Tần suất - Nhận dạng 20
2.2.1. Phương pháp xây dựng ma trận thông tin đối tượng mẫu 20
2.2.2. Phương pháp đánh giá lựa chọn tổ hợp thông tin 20
2.2.3. Phương pháp phân tích đối sánh xác định các đối tượng đồng dạng. .21
21
2.3. Xây dựng phần mềm ứng dụng phương pháp Tần suất – Nhận dạng 22
CHƯƠNG 3: ÁP DỤNG KẾT QUẢ NGHIÊN CỨU PHÂN TÍCH DỮ LIỆU
VÙNG ĐÔNG TUY HOÀ 25
3.1 Đặc điểm địa chất và địa vật lý vùng Đông Tuy Hoà 25
3.1.1. Đặc điểm địa lý, tự nhiên 25
3.1.2. Đặc điểm địa chất và địa vật lý 26
3.2. Ứng dụng chương trình phân tích tần suất trong số liệu thực tế 29
3.2.1. Xử lý số liệu cho trường hợp biết trước đối tượng đối sánh 29
3.2.2. Xử lý số liệu không dùng đối tượng đối sánh 32
TÀI LIỆU THAM KHẢO 36

- Trên cơ sở thuật toán lựa chọn thông tin đã nghiên cứu đề xuất một giải
pháp phân tích đối sánh từ đó xây dựng thành một phương pháp phân
tích, nhận dạng.
- Tiến hành phân tích thử nghiệm trên một tài liệu thực tế nhằm làm rõ ý
nghĩa thực tiễn và khả năng áp dụng thực tế của kết quả nghiên cứu.
2
Từ cơ sở những mục tiêu thực hiện, khoá luận được viết với cấu trúc như
sau:
- Mở đầu
- Chương 1: Lý thuyết nhận dạng
- Chương 2: Ứng dụng phương pháp Tần suất – Nhận dạng trong xử lý số
liệu địa vật lý
- Chương 3: Áp dụng kết quả nghiên cứu phân tích số liệu hàng không
vùng Đông Tuy Hoà
- Kết luận
Khoá luận có sử dụng tài liệu từ - phổ gamma hàng không, các tài liệu kiểm
tra mặt đất khu vực Đông Tuy Hoà của Đoàn Địa vậy lý máy bay, Đoàn Địa vật lý
mặt đất, Liên đoàn Vậy lý – Địa chất, Các kết quả của các đề tài nghiên cứu do
PGS.TS. Võ Thanh Quỳnh làm chủ biên.
Trong quá trình thực hiện khoá luận này, em đã nhận được sự quan tâm giúp
đỡ tận tình của các thầy giáo, cô giáo trong Khoa Địa chất, Trường Đại học Khoa
học Tự nhiên; sự giúp đỡ tạo điều kiện của ban lãnh đạo và các cán bộ kỹ thuật
Đoàn Địa vậy lý máy bay, Đoàn Địa vật lý mặt đất, Liên đoàn Vậy lý – Địa chất
trong việc tìm hiểu và thu thập tài liệu, đặc biệt là sự hướng đẫn, giúp đỡ tận tình
của thầy giáo hướng dẫn PGS.TS. Võ Thanh Quỳnh. Em xin bày tỏ lòng biết ơn
chân thành tới những sự giúp đỡ nhiệt tình đó!
Do những hạn chế về mặt thời gian và kinh nghiệm còn ít nên khoá luận
không thể tránh khỏi những thiếu sót, rất mong nhận được sự bổ xung, góp ý từ
thầy cô và các bạn.
Sinh viên thực hiện

được yêu cầu, mục tiêu đề ra. Ví dụ như thay vì dùng số liệu địa chấn có giá thành
khảo sát cao thì có thể sử dụng tổ hợp số liệu khảo sát trọng lực và số liệu điện trở
suất để tìm kiếm các hang động karst.
Mặt khác hiện nay các tổ hợp phương pháp địa vật lý đang ngày càng được
áp dụng rộng rãi do những đặc trưng về kỹ thuật như tổ hợp địa vật lý biển, tổ hợp
4
địa vật lý hàng không… Các tổ hợp phương pháp này với các phép ghi đo tự động
sẽ cung cấp một khối lượng dữ liệu rất lớn bao gồm nhiều chủng loại thông tin.
Ngoài dữ liệu khảo sát trực tiếp, hiện nay, với số lượng thông tin lưu trữ
ngày càng tăng thì việc sử dụng kết hợp các dữ liệu có sẵn này với các thông tin
khảo sát là một nhu cầu để nâng cao độ tin cậy cho kết quả xử lý.
Mỗi loại thông tin chỉ mang những đặc trưng nhất định của đối tượng và để
hoàn thành được nhiệm vụ đặt ra trong nhiều trường hợp người ta buộc phải xử
dụng tổ hợp các thông tin khác nhau.
Bản thân mỗi số liệu khảo sát đều mang những sai số, chúng đi kèm với số
liệu và nhiều lúc gây ra những sai lầm khi xử lý. Những sai số này do nhiều nguyên
nhân khác nhau như: sai số đo ghi của máy, sai số do kỹ thuật và phương pháp đo
ghi, sai số do ảnh hưởng của các đối tượng khác… Trong số liệu địa vật lý những
sai số mắc phải làm giảm độ tin cậy của thông tin được loại bỏ trong các bước xử lý
số liệu nhưng rất khó để tách hoàn toàn được chúng ra khỏi số liệu. Đặc biệt là các
nhiễu do nguồn gốc địa chất, chúng làm sai lệch mạnh các tín hiệu có ích và đôi khi
không loại bỏ được do không đủ thông tin. Những sai số này làm giảm đáng kể độ
tin cậy của thông tin, đặc biệt trong trường hợp loại thông tin đó được coi là loại
tính chất quan trọng đặc trưng cho đối tượng đang cần nghiên cứu. Một nguyên
nhân khác dẫn tới giảm độ tin cậy của một loại thông tin là tính đa trị của kết quả
xử lý. Điều này gây nhiều khó khăn và sai lầm trong xử lý. Để xác định đơn trị đối
tượng cần sử dụng kết hợp nhiều loại thông tin khác nhau một cách phù hợp.
Từ các nguyên nhân trên các phương pháp xử lý tổ hợp số liệu đã và đang
được áp dụng phổ biến trong nhiều lĩnh vực và mang lại kết quả cao.
1.1.2 Lựa chọn tổ hợp số liệu

Vì các thiết bị quan sát trường trong địa vật lý đều là các thiết bị số nên các
kết quả quan sát trường là những con số. Ở một điểm quan sát bất kỳ, kết quả quan
sát trường địa vật lý vì chứa nhiễu và sai số đo nên có thể là đại lượng này hay đại
lượng khác mà người đo không dự đoán trước được. Vì vậy để mô tả các giá trị
(bằng số) các trường địa vật lý đo được người ta sử dụng khái niệm đại lượng ngẫu
nhiên.
Các giá trị trường địa vật lý đo được là các số cụ thể nên đại lượng ngẫu
nhiên là mô hình nền tảng để mô tả các số liệu địa vật lý.
Đại lượng X được gọi là ngẫu nhiên nếu trong mỗi phép đo sẽ xuất hiện một
trong những giá trị cụ thể x
1
, x
2
, x
3
,… của đại lượng này với xác suất tương ứng p
1
,
p
2
, p
3
,…
Tất cả các giá trị có thể của X sẽ tạo thành nhóm đủ, vì bao giờ trong kết quả
của một phép đo cũng sẽ xuất hiện một giá trị x
i
nào đó (biểu hiện nào đó của X);
nghĩa là bao giờ cũng tồn tại đẳng thức:

=

)()(
21
x
x
dxxfxXxP
(1.4)
với P(x
1
<X<x
2
) là xác suất rơi vào khoảng (x
1
;x
2
) của đại lượng ngẫu nhiên
x.
7

∞−
=
1
)()(
1
x
dxxfxF
(1.5)
với F(x) là hàm phân bố của X; hàm mô tả xác suất để đại lượng ngẫu nhiên
X nhận các giá trị nhỏ hơn giá trị x
i
nào đó.


(1.7)
- Độ lệch trung bình phương
D±=
σ
(1.8)
1.2.3 Một số hàm phân phối lý thuyết
Để mô tả các đại lượng ngẫu nhiên, trong địa vật lý người ta sử dụng các
hàm phân phối lý thuyết như hàm phân phối chuẩn (phân phối Gauxơ), phân phối
chuẩn loga, phân phối Puasson…
Phần lớn các đại lượng ngẫu nhiên trong địa vật lý cũng như nhiều hiện
tượng địa chất khác chúng tuân theo luật phân phối chuẩn.
Đại lượng ngẫu nhiên X tuân theo luật phân phối chuẩn nếu hàm mật độ của
nó có dạng:
2
2
2
)(
2
1
)(
σ
µ
σ
−−
Π
=
x
exf
(1.9)

dần xuống xung quanh kỳ vọng.
Diện tích giới hạn bởi đường cong và trục hoành bằng 1, đó chính là xác suất
để đại lượng ngẫu nhiên X nhận giá trị trong khoảng
);( +∞−∞
(1.3). Xác suất để đại
8
lượng ngẫu nhiên X nhận giá trị trong khoảng từ x
1
tới x
2
chính là phần diện tích
được bao bởi đường cong, trục hoành và hai đường thẳng
1
xx =
;
2
xx =
. Xác suất
đó được tính theo công thức (1.4).
Nhiều giá trị trường địa vật lý như mật độ, tốc độ truyền sóng, phóng xạ…
tuân theo luật phân phối chuẩn và dựa trên các thuật toán thống kê theo luật phân
phối chuẩn người ta có thể xử lý số liệu để tìm ra các đặc trưng của đối tượng.
Ngoài luật phân phối chuẩn còn có các luật phân phối khác đang được áp
dụng phổ biến trong phân tích thống kê các số liệu địa vật lý. Ví dụ như luật phân
phối chuẩn loga được dùng để mô tả các giá trị điện trở xuất, độ từ cảm của đất đá.
9
1.3 Các thuật toán nhận dạng
Nhiệm vụ cơ bản nhất của công tác xử lý tổ hợp số liệu địa vật lý là phân
loại được các điểm quan sát thành các diện tích nhất định hay các nhóm, lớp diện
tích nhất định, ở đó các đặc trưng của trường địa vật lý giống với các đặc trưng của

Cần lưu ý để công tác phân tích nhận dạng đạt hiệu quả tốt thì cần lựa chọn
các đối tượng chuẩn sao cho các diện tích tồn tại các đối tượng chuẩn phải nằm xen
kẽ với các phần diện tích khảo sát cần nhận dạng.
Một đối tượng chuẩn nào đó có phạm vi ứng dụng là giới hạn và nó phụ
thuộc vào các yếu tố sau:
- Đối tượng chuẩn phải có giá trị thông tin tin cậy theo mục tiêu tìm kiếm.
- Đối tượng chuẩn phải phù hợp với diện tích nghiên cứu.
- Mật độ lưới khảo sát các loại thông tin phải tương ứng với đối tượng chuẩn
lựa chọn.
Đối tượng chuẩn mang các dấu hiệu nhận biết, phân biệt nó với môi trường
xung quanh, các dấu hiệu có khả năng phân biệt cao trong các loại thông tin thu
thập sẽ gúp quá trình xử lý số liệu cho kết quả tin cậy. Để đánh giá chất lượng của
dấu hiệu người ta sử dụng khái niệm lượng tin của dấu hiệu. Lượng tin của dấu
hiệu là khả năng mà dấu hiệu đó có thể phân biệt được các đối tượng khác nhau
với nhau. Khả năng này phụ thuộc vào việc các đối tượng của cùng một lớp có
thường xuyên cho những giá trị cố định của dấu hiệu đó hay không và các giá trị đó
có phân bố rộng ra ngoài giới hạn của các đối tượng của lớp đó hay không.
Trong quá trình nhận dạng không phải mọi dấu hiệu trường đều quan trọng
như nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứa
thông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ nhạt đi
các thông tin hữu ích. Khi đưa các dấu hiệu này vào sử dụng để nhận dạng không
làm tăng mà ngược lại lại làm giảm chất lượng nhận dạng đối tượng. Chính vì vậy,
trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đó
chọn ra những dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu
có lượng tin thấp.
Dựa vào các giá trị trường quan sát được trên các đối tượng chuẩn người ta
tiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng. Các
đặc trưng này được sử dụng tuỳ thuộc vào thuật toán nhận dạng áp dụng. Thường
các đặc trưng thống kê bao gồm:
- Đường cong biến phân (hàm phân bố mật độ xác xuất thực nghiệm).

Bằng cách trên toàn bộ các mẫu được mã hoá.
Tiếp theo, dựa vào các tổ hợp số “0” và “1” (từ thông tin) xác lập trên các
mẫu chuẩn người ta xác định các từ thông tin chuẩn cho từng lớp đối tượng. Từ
thông tin chuẩn cho một lớp (đối tượng) là từ thông tin gặp p lần ở các đối tượng
chuẩn của lớp đó và không gặp lần nào các đối tượng chuẩn thuộc lớp khác (giá trị
p được chọn theo kinh nghiệm). Đối với một lớp người ta có thể chọn khoảng giá trị
thông tin chuẩn. Các thông tin này được gọi là tổ hợp dấu hiệu phức hợp. Trong các
tổ hợp dấu hiệu phức hợp đặc trưng cho các đối tượng chuẩn của cùng một lớp thì
tổ hợp dấu hiệu nào đặc trưng cho số lượng mẫu chuẩn lớn hơn, tổ hợp dấu hiệu đó
sẽ có lượng tin lớn hơn.
Cuối cùng là nhận dạng các đối tượng nghiên cứu. Ở bước này người ta tiến
hành kiểm tra xem bao nhiêu tổ hợp dấu hiệu phức hợp của từng lớp gặp ở đối
tượng nghiên cứu. Nếu số lần gặp các tổ hợp dấu hiệu phức hợp của một lớp nào đó
nhiều hơn số lần gặp các tổ hợp phức hợp của lớp khác thì đối tượng nghiên cứu
12
được xếp vào lớp đó. Quá trình này được tiến hành cho tới khi đối tượng cuối cùng
được nhận dạng.
b. Phương pháp nhận dạng sử dụng phân tích hồi quy
Trong xử lý số liệu địa vật lý, thuật toán hồi quy đầu tiên được sử dụng để sử
lý các số liệu đo địa vật lý giếng khoan và phân tích định lượng các tài liệu trọng
lực. Thực chất của thuật toán này là xây dựng các hàm hồi quy xác định mối quan
hệ giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát được bằng
các phương pháp khác nhau. Ví dụ mối quan hệ giữa một bên là độ rỗng của đất đá
với bên kia là các số liệu đo điện trở, điện trường tự nhiên, gama… dọc thành giếng
khoan.
Thường quá trình xấp xỉ các hàm hồi quy giới hạn bởi các đa thức bậc 1, bậc
2 hoặc đặc biệt có thể xấp xỉ với đa thức bậc lớn hơn. Ví dụ: nếu chỉ có hai dấu hiệu
1 và 2 thì hàm hồi quy được xấp xỉ bằng đa thức bậc 2 có đạng:
y
k

k
, c
k
, d
k
, g
k
và h
k
trong biểu thức (1.12) được xác định bằng
phương pháp bình phương tối thiểu theo các giá trị địa chất của tham số y
k
xác định
được trên các đối tượng chuẩn và các số liệu đo trường địa vật lý của các dấu hiệu
x
1k
và x
2k
của chính đối tượng đó.
Phương trình hồi quy trên được xác định cho từng đối tượng chuẩn thứ k.
Ngoài phương pháp hồi quy người ta còn tiến hành xác định giá trị ngưỡng y
k
cho
từng lớp đối tượng chuẩn. Cuối cùng đưa các giá trị trường đo được trên các đối
tượng cần nghiên cứu vào các phương trình hồi quy tìm được trên đối tượng chuẩn
ta sẽ xác định được giá trị của tham số y
k
của đối tượng nghiên cứu.
Thuật toán phân tích hồi quy có ưu điểm là dễ dàng đưa vào xử lý bổ sung
các số liệu của dấu hiệu mới bằng cách đưa thêm vào phương trình của hàm hồi quy





=
)(
)(
log,2:1
2
1
xP
xp
xJ
(1.14)
Trong đó:
P
1
(x), P
2
(x) là các xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượng
tương ứng của lớp 1 và lớp 2 (ví dụ lớp quặng và lớp không quặng). Khi sử dụng
đối tượng chuẩn cho lớp 1 (lớp quặng) thì trong các biểu thức P
2
(x) được thay bằng
1.
x là vecto giá trị các dấu hiệu được sử dụng, x
1
, x
2
,…, x

k
xLxLxL
xPxPxP
xPxPxP
xL ==
(1.16)
),2:1( ),2:1(),2:1(),2:1(
21 k
xJxJxJxJ +++=
(1.17)
Nếu sự phụ thuộc của các dấu hiệu là rõ và sự phân bố của chúng tuân theo
luật chuẩn thì để nhận dạng các đối tượng thuộc lớp 1 và lớp 2 người ta thường sử
dụng các hàm phân giải bậc 1 (R
1
) hoặc bậc 2 (R
2
) đối với các tham số x
1
, x
2
,…, x
n
.
Các hàm này được biểu diễn như sau:

=
=
n
i
ii

, b
ij
, c
i
(trong
14
trường hợp các dấu hiệu phụ thuộc nhau). Sau đó tính giá trị L(x), J(1:2,x) hoặc R
1
,
R
2
, phổ các giá trị này lên khắp diện tích khảo sát và biểu diễn chúng lên bản đồ.
Đối sánh các giá trị này với các giá trị của đối tượng chuẩn có thể nhận biết và
khoanh định được các diện tích đồng dạng với đối tượng chuẩn. Các dấu hiệu được
lựa chọn thường là một tổ hợp nào đó trong số các tham số thu được.
1.3.3. Các thuật toán nhận dạng không có mẫu chuẩn
a, Thuật toán kiểm chứng thống kê
Thuật toán này tiến hành phân loại trường khi các dấu hiệu trường hoàn toàn
độc lập nhau. Ban đầu người ta sử dụng bộ lọc để tách các dị thường ra khỏi phông
nhiễu cho từng dấu hiệu trường. Kết quả lọc cho phép nhận được các số liệu trường
chủ yếu gồm các dị thường. Tiếp theo phân loại các dị thường thành các lớp dị
thường. Mỗi lớp dị thường gồm các dị thường có các đặc trưng thống kê giống
nhau. Để phân loại các dị thường đầu tiên người ta phân chia khu vực khảo sát
thành các diện tích cơ sở, sau đó dựa vào kết quả phân chia cá giá trị trường ở mỗi
cửa sổ người ta dựng các đường cong biến phân đặc trưng cho cửa sổ đó. Cuối cùng
để phân lớp các dị thường người ta sử dụng các chỉ tiêu χ
2
để so sánh và xếp loại
các đường cong biến phân. Các diện tích có ước lượng phân bố mật độ xác suất
giống nhau được xếp vào một lớp.

2
v
,… e
k
v
} với v = 0, 1, 2,
Với ký hiệu này mẫu chuẩn xuất phát là:
E
0

= { e
1
0
, e
2
0
,… e
k
0
}
Các mẫu chuẩn này chính là các mẫu được chọn ra ở vòng đầu tiên (vòng số
0) của quá trình lặp. Tiếp theo vòng số 0 thuật toán gọi tiếp số x
k+1
và tìm xem trong
k mẫu e
i
0
, mẫu chuẩn nào gần nhất với nó. Nếu tìm được, thì mẫu chuẩn thuộc tập
hợp E
0

Chất lượng của kết quả xử lý được đánh giá dựa vào sai số nhận dạng các đối
tượng kiểm chứng. Các đối tượng kiểm chứng là các đối tượng mà bản chất địa chất
của chúng đã được xác định rõ, song chúng không được chọn là mẫu chuẩn để nhận
dạng mà được dùng làm các đối tượng để kiểm tra các kết quả nhận dạng.
16
Sai số nhận dạng được tính bằng tỷ số các đối tượng kiểm chứng được nhận
đạng dúng so với tổng các đối tượng kiểm chứng được đem ra nhận dạng.
Đối với các thuật toán nhận dạng kiểm chứng thống kê người ta sử dụng xác
suất nhận dạng sai lầm để đánh giá chất lượng xử lý. Xác suất này được xác định
dựa vào việc tính tích phân hàm phân bố mật độ xác suất của hệ số tương thích λ.
Các hàm này được xác định riêng cho các đối tượng kiểm chứng của từng lớp một.
17
CHƯƠNG 2: ỨNG DỤNG PHƯƠNG PHÁP TẦN SUẤT – NHẬN DẠNG
TRONG XỬ LÝ SỐ LIỆU ĐỊA VẬT LÝ
2.1 Phương pháp phân tích tần suất
Phương pháp phân tích tần suất với việc sử dụng tần suất trung bình của sự
xuất hiện đồng thời các dấu hiệu do Griffths -Vinni đưa ra tiến hành trên một loại
đối tượng mẫu có nội dung tóm tắt như sau:
Giả sử ta có đối tượng nghiên cứu với k loại dấu hiệu, mỗi dấu hiệu có n số
liệu đã biết. Khi đó ta có ma trận thông tin các dấu hiệu của đối tượng mẫu như sau:
( )










của ma trận được biểu diễn bằng các khái niệm logic: “yes”
hoặc “no” hoặc bằng các số 1 hoặc 0.
Theo Griffths-Vinni, lượng thông tin tương đối của dấu hiệu thứ “i” được
xác định theo công thức:
2
11
∑ ∑
=






=
k
kj
n
h
hjhii
kn
I
ϕϕ
(2.2)
Nếu sắp xếp các dấu hiệu của đối tượng theo thứ tự giảm dần của lượng
thông tin tương đối, ta sẽ được tập mới là
{ }
*
i
I

trong k tính chất ban đầu. Theo như thuật toán này khi ta lựa chọn trước một giá trị
tỷ trọng thông tin thì tương ứng ta có thể tính toán được m thông tin tương ứng.
Như vậy thuật toán cho phép đánh giá chất lượng của từng loại thông tin và lựa
chọn tập hợp chủng loại thông tin có giá trị cao phục vụ các mục đích nghiên cứu.
19
2.2 Phương pháp Tần suất - Nhận dạng
Lý thuyết của phương pháp phân tích tần suất ở trên là một cơ sở để lựa chọn
các tính chất tốt một cách định lượng. Như đã trình bày trong chương 1, tổ hợp số
liệu địa vật lý là tập hợp của các tính chất có chất lượng khác nhau. Và khi ứng
dụng phương pháp phân tích tần suất trong việc tìm một tổ hợp tính chất tốt phục vụ
mục tiêu nhận dạng đối tượng là hiệu quả và có tính định lượng. Phương pháp Tần
suất – Nhận dạng là một phương pháp nhận dạng trong xử lý số liệu địa vật lý do
PGS. TS. Võ Thanh Quỳnh đề xuất trên cơ sở ứng dụng phương pháp phân tích tần
suất trong tổ hợp số liệu thống kê cũng như xây dựng thuật toán phân tích, đối
sánh, xác định đối tượng đồng dạng (kết quả đề tài QG06.16).
Các nội dung của phương pháp tần suất nhận dạng gồm có 3 nội dung chính
sau:
- Xây dựng ma trận thông tin của đối tượng mẫu.
- Đánh giá, lựa chọn tổ hợp thông tin.
- Phân tích, đối sánh, xác định các đối tượng đồng dạng.
2.2.1. Phương pháp xây dựng ma trận thông tin đối tượng mẫu
Đây là một nội dung rất quan trọng ảnh hưởng tới kết quả phân tích của thuật
toán Griffths –Vinni, trước hết cần có ma trận thông tin của đối tượng mẫu. Ma trận
thông tin của đối tượng mẫu trong phương pháp phân tích tần suất được xây dựng
như sau:
Từ tập hợp số liệu của các chủng loại thông tin của đối tượng mẫu xây dựng
các đường cong biến phân (đường cong mật độ phân bố). Từ các đường cong biến
phân xác định khoảng giá trị đặc trưng cho từng tham số. Sau khi có được các
khoảng giá trị đặc trưng, dùng nó làm “cửa sổ quét” để tạo ra các đơn vị thông tin
cho từng chủng loại thông tin của từng phần tử. Đối với mỗi phần tử của mỗi chủng

.
Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi P
*
m
có giá
trị đạt mức quy định nào đó. Ví dụ P
*
m
≥ 65%.

21
2.3. Xây dựng phần mềm ứng dụng phương pháp Tần suất – Nhận dạng
Theo nội dung phương pháp phân tích tần suất nhận dạng được trình bày ở
trên tôi đã thành lập một phần mềm tự động xử lý số liệu tương ứng trên máy tính
(phụ lục 1) . Về nguyên tắc chương trình này có thể xử lý mọi tổ hợp số liệu phức
tạp tương ứng như số liệu địa chất, địa vật lý, địa hoá…Các nội dung thực hiện tính
toán của chương trình được trình bày trên sơ đồ khối như sau:
Hình 2.1: Sơ đồ khối chương trình xử lý số liệu
Từ số liệu đầu vào bao gồm: số liệu của đối tượng mẫu và số liệu của vùng
nghiên cứu hoặc của các đối tượng cần đối sánh. Chương trình sẽ tính toán với 2
nội dung chính là thực hiện tính toán trên đối tượng mẫu và từ các kết quả phân tích
đối tượng mẫu tiến hành đối sánh hoặc phân vùng tuỳ thuộc vào dạng dữ liệu đầu
vào của những đối tượng cần xác định.
Phân tích, tính toán trên đối tượng mẫu:
Với thông tin đầu vào của đối tượng mẫu bao gồm toạ độ điểm và các chủng
loại thông tin của đối tượng chương trình tiến hành xây dựng ma trận thông tin cho
đối tượng mẫu theo thuật toán trình bày trong mục 2.2.1.
22
Từ ma trận thông tin thành lập được tiến hành lựa chọn tổ hợp thông tin mới
trong tổ hợp thông tin ban đầu với các loại thông tin được lựa chọn có chất lượng

liệu là toàn bộ các điểm số liệu của vùng nằm trong hình vông này. Tiến
hành phân tích trên các “đối tượng” đối sánh như ở trường hợp 1 và nhận
được giá trị P
*
m
của các “đối tượng” này.
- Bước 4: Gán giá trị P
*
m
tìm được về điểm trung tâm của hình vuông (các
điểm được thành lập ở bước 1)
Kết quả sau khi tính toán với trường hợp này bao gồm:
- Kết quả đánh giá và lựa chọn thông tin của đối tượng mẫu.
- File dữ liệu P
*
m
trên mạng lưới đều.
Từ file dữ liệu đầu ra (P
*
m
) ta có thể vẽ các bản đồ đồng mức bằng một số
phần mềm hỗ trợ thành lập bản đồ như MAPINFOR, Suffer for Win…
Dựa theo bản đồ này ta có thể xác định các đối tượng đồng dạng với đối
tượng mẫu đã dùng đối sánh.
Chương trình này được viết với ngôn ngữ lập trình C, mặc dù có những điểm
yếu trong trình bày dao diện nhưng các hỗ trợ toán học cao giúp cho các bước tính
và số lượng phép tính được tối ưu khi lập trình.
24
CHƯƠNG 3: ÁP DỤNG KẾT QUẢ NGHIÊN CỨU PHÂN TÍCH DỮ LIỆU
VÙNG ĐÔNG TUY HOÀ

Khu vực nghiên cứu đặc trưng bởi điều kiện nhiệt phong phú. Ở đây có đặc
trưng của vùng khí hậu nhiệt đới ẩm gió mùa và chịu ảnh hưởng của đại dương. Có
2 mùa rõ rệt: mùa mưa từ tháng 9 đến tháng 12 và mùa nắng từ tháng 1 đến tháng 8.
nhiệt độ trung bình hàng năm khoảng 27
o
C, lượng mưa trung bình hàng năm đạt
1600mm – 1700mm.
Mạng lưới sông suối của khu vực tương đối dày nhưng do đặc điểm địa hình
nên các sông thường ngắn và dốc. các sông lớn thường bắt nguồn từ dãy trường sơn
(sông Ba, sông Đà Nông, sông Krông H’Năng, sông Hinh…). Lớn nhất trong vùng
là sông Đà Rằng (sông Ba) đổ ra biển đông ở thị xã Tuy Hoà. Chế độ thuỷ văn ở
đây cũng hoàn toàn phụ thuộc theo mùa. Vào mùa mưa lượng dòng chảy chiếm hơn
80% tổng lượng dòng chảy năm. Hơn nữa, do đặc trưng địa hình dốc nên vào mùa
25
Hình 3.1: Vị trí khu vực nghiên cứu

Trích đoạn Xử lý số liệu không dùng đối tượng đối sánh
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status