ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------
Nguyễn Thị Thu Hiền
NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP KHOẢNG CÁCH –TẦN SUẤT –
NHẬN DẠNG MỚI TRONG XỬ LÝ- PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – 2016
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
---------------------
Nguyễn Thị Thu Hiền
NGHIÊN CỨU ÁP DỤNG PHƢƠNG PHÁP KHOẢNG CÁCH – TẦN SUẤT –
NHẬN DẠNG MỚI TRONG XỬ LÝ- PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ
Chuyên ngành: Vật lý địa cầu.
Mã số: 60440111
LUẬN VĂN THẠC SĨ KHOA HỌC
Người hướng dẫn khoa học
PGS.TS.VÕ THANH QUỲNH
Hà Nội - 2016
1.1.2. Ước lượng và đánh giá các đặc trưng của đối tượng chuẩn.......... 4
1.1.3. Chọn thuật toán xử lý ...................................................................... 6
1.1.4. Định nghiệm về sự tồn tại của đối tượng ....................................... 7
1.1.5. Đánh giá chất lượng xử lý ............................................................. 7
1.2. Lý thuyết các thuật toán nhận dạng ................................................... 7
1.2.1. Các thuật toán nhận dạng có mẫu chuẩn ....................................... 7
1.2.2. Các thuật toán nhận dạng không có mẫu chuẩn .......................... 11
CHƢƠNG 2.HỆ PHƢƠNG PHÁP PHÂN TÍCH TÀI LIỆU ĐỊA VẬT
LÝ MÁY BAY .............................................................................................. 13
2.1. Các phƣơng pháp phân tích tài liệu địa vật lý máy bay ................. 13
2.1.1. Các phương pháp tách trường ....................................................... 13
2.1.2. Nhóm các phương pháp thống kê nhận dạng ............................... 13
2.1.3. Các phương pháp thống kê thực nghiệm ....................................... 14
2.1.4. Một số phương pháp khác ............................................................. 14
2.2. Phƣơng pháp Tần suất - Nhận dạng ................................................ 15
2.2.1. Nội dung cơ bản của phương pháp phân tích tần suất ................. 15
2.2.2. Phương pháp Tần suất-Nhận dạng ............................................... 17
2.3. Phƣơng pháp Khoảng cách- Tần suất- Nhận dạng ........................ 20
2.3.1. Nội dung cơ bản của phương pháp phân tích khoảng cách khái
quát ........................................................................................................ 20
2.3.2. Phương pháp Khoảng cách – Tần suất – Nhận dạng ................... 22
CHƢƠNG 3: KẾT QUẢ PHÂN TÍCH THỰC NGHIỆM TRÊN TÀI
LIỆU THỰC TẾ VÙNG KHÁNH THƢỢNG........................................... 28
3.1. Thông tin về khu vực nghiên cứu .................................................... 28
3.2. Tài liệu thu thập, tính toán về khu vực nghiên cứu ........................ 30
3.2.1. Tài liệu thu thập về khu vực ........................................................... 30
3.2.2. Thực hiện phân tích thử nghiệm phương pháp Khoảng cách - tần
suất - nhận dạng. ...................................................................................... 34
DANH MỤC BẢNG
Bảng 3.1.Tổng hợp các tính chất thu thập và tính toán được của khu vực. ... 34
Bảng 3.2.Bảng kết quả ................................................................................... 35
Bảng 3.3.Bảng kết quả sắp xếp lại các tính chất theo thứ tự giảm dần ......... 36
Bảng 3.4.Kết quả xác định khoảng giá trị đặc trưng các tính chất của đối
tượng mẫu ....................................................................................................... 37
Bảng 3.5.Ma trận thông tin của đối tượng 1 được chuyển đổi bằng khoảng giá
trị đặc trung của đối tượng mẫu: .................................................................... 38
Bảng 3.6.Kết quả phân tích hệ số đồng dạng cho 8 đối tượng với đối tượng 6
là đối tượng mẫu............................................................................................. 40
Bảng 3.7.Bảng số liệu đối tượng mẫu 1 ......................................................... 44
Bảng 3.8.Bảng số liệu đối tượng mẫu 2 ......................................................... 46
Bảng 3.9.Bảng trích lược số liệu của lưới điểm............................................. 51
Bảng 3.10.Kết quả phân tích Khoảng cách – Tần suất – Nhận dạng cho vùng
diện tích đã chọn. ........................................................................................... 52
MỞ ĐẦU
Địa vật lý hàng không ( Airborne Geophysics) là một lĩnh vực của Địa Vật
lý thăm dò, dùng máy bay làm phương tiện để bay đo các trường Địa vật lý trên đất
liền hoặc thăm dò trên thềm lục địa, nhằm nghiên cứu thạch quyển – thủy quyển.
Những kết quả đạt được của công tác địa vật lý hàng không ở nước ta trong thời
gian qua đã và đang ngày càng phát huy vai trò và hiệu quả to lớn trong việc tìm
kiếm và dự báo các khoáng sản có ích.
Những kết quả đạt được của công tác địa vật lý máy bay ở nước ta trong
thời gian qua đã có hiệu quả to lớn trong việc tham gia giải quyết nhiều nhiệm vụ
địa chất quan trọng, đặc biệt là trong việc tìm kiếm và dự báo các khoáng sản có
Đề tài luận văn “Nghiên cứu áp dụng phương pháp Khoảng cách– Tần suất
– Nhận dạng mới trong phân tích- xử lý số liệu Địa vật lý” mà học viên lựa chọn
nhằm tìm hiểu, áp dụng phương pháp phân tích tổ hợp các tài liệu địa vật lý máy
bay góp phần đẩy nhanh và nâng cao chất lượng của công tác xử lí phân tích tài liệu
địa vật lý máy bay.
Luận văn được thực hiện với nhiệm vụ chính sau:
- Tìm hiểu về các thuật toán phân tích và đánh giá lựa chọn thông tin.
- Tìm hiểu về các phương pháp phân tích trong xử lý phân tích số liệu Địa vật lý
- Đánh giá, phân tích thử nghiệm phương pháp với tài liệu thực tế vùng Khánh
Thượng trên cơ sở áp dụng bổ sung phương pháp Khoảng cách– Tần suất – Nhận
dạng mới.
Từ những nhiệm vụ trên, luận văn được viết với cấu trúc gồm:
- Mở đầu
- Chương 1: Cơ sở lý thuyết phân tích- xử lý số liệu Địa vật lý
- Chương 2: Hệ phương pháp phân tích tài liệu Địa vật lý máy bay
- Chương 3: Kết quả phân tích thực nghiệm trên tài liệu thực tế vùng Khánh
Thượng.
- Kết luận
2
CHƢƠNG 1.CƠ SỞ LÝ THUYẾT XỬ LÝ TỔ HỢP SỐ LIỆU ĐỊA VẬT LÝ
1.1.
Lý thuyết xử lý tổ hợp số liệu Địa Vật lý
Xử lí số liệu về cơ bản là dựa trên nhiều loại thông tin khác nhau để giải
quyết được các nhiệm vụ đặt ra phù hợp với điều kiện kinh tế và kĩ thuật cho phép.
Không chỉ riêng trong địa vật lý mà nhiều lĩnh vực khác cũng sử dụng xử lí tổ hợp
phân loại các đối số liệu quan sát thành hai lớp hoặc với số lớp nhiều hơn 2 khi có
trước các đặc trưng thống kê của mỗi loại dấu hiệu ứng với các đối tượng chuẩn.Vấn
đề mang tính quyết định là lựa chọn đối tượng chuẩn, trên đó tiến hành nghiên cứu các
đặc trưng thông kê của các dấu hiệu (các trường địa vật lý). Điều này đặc biệt quan
trọng khi khảo sát các diện tích có cấu trúc địa chất phức tạp, ở đó các trường địa vật
lý quan sát được biến đổi mạnh ngay cả ở những diện tích nhỏ.
Nhóm các phương pháp nhận dạng không có đối tượng chuẩn được áp
dụng khi chúng ta không biết trước các đặc trưng thống kê của các dấu hiệu ứng
với các lớp đối tượng cần tìm. Khi đó quá trình nhận dạng đơn thuần chỉ thực hiện
nhiệm vụ phân loại trường.
Phương pháp xử lý số liệu bằng thuật toán nhận dạng không có đối tượng
chuẩn được thực hiện như sau: bằng thuật toán phân loại trường lựa chọn được,
tiến hành chia các điểm quan sát thành một số nhất định các diện tích đồng nhất về
dấu hiệu tổ hợp. Bản chất địa chất của từng diện tích phân ra được có thể không
xác định được; để xác định chúng đòi hỏi phải có các số liệu khoan hoặc nghiên
cứu bổ sung về tính chất vật lý của đá.
1.1.2. Ƣớc lƣợng và đánh giá các đặc trƣng của đối tƣợng chuẩn.[1] [10]
a. Ước lượng các đặc trưng thống kê
Để xử lý tổ hợp các số liệu bằng phương pháp nhận dạng có mẫu chuẩn thì
công việc mang tính quyết định là lựa chọn các mẫu chuẩn và xác định các đặc
trưng thống kê các trường địa vật lý của chúng.
Các mẫu hay đối tượng chuẩn là phần diện tích ở đó bằng các số liệu khoan
và các số liệu địa chất khác đã xác định được bản chất địa chất của các đối tượng
gây ra trường địa vật lý. Tùy thuộc vào các mục đích nghiên cứu khác nhau mà các
đối tượng chuẩn được lựa chọn khác nhau.
Dựa vào các giá trị trường quan sát được trên các đối tượng chuẩn người ta
tiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng. Các
đặc trưng này bao gồm:
4
như nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứa
thông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ nhạt đi
5
các thông tin hữu ích. Khi đưa các dấu hiệu này vào sử dụng để nhận dạng không
làm tăng mà ngược lại làm giảm chất lượng nhận dạng đối tượng. Chính vì vậy,
trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đó
chọn ra những dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu
có lượng tin thấp.
1.1.3. Chọn thuật toán xử lý [1] [10]
Các thuật toán được lựa chọn để xử lý sẽ ảnh hưởng tới chất lượng xử lý. Để
chất lượng xử lý cao khi lựa chọn các thuật toán người ta dựa vào các yếu tố sau:
a. Nhiệm vụ địa chất đặt ra
Nếu nhiệm vụ của khảo sát địa vật lý là tìm kiếm mỏ thì thuật toán phải có
khả năng nhận dạng hai lớp đối tượng: lớp quặng và lớp không quặng. Còn nếu
nhiệm vụ của khảo sát địa vật lý là phục vụ công tác đo vẽ bản đồ địa chất thì thuật
toán phải đảm bảo khả năng cùng một lúc nhận dạng được nhiều lớp đối tượng liên
quan với nhiều loại đất đá và các yếu tố kiến tạo khác nhau.
b. Đặc điểm chứa thông tin của số liệu gốc
Nếu các số liệu địa vật lý chứa thông tin ở hai mức: mức “có”- mức dị
thường và mức “không”- mức phông thì người ta sử dụng các thuật toán logic.
Trong trường hợp các số liệu địa vật lý chứa các thông tin định lượng thì người ta
sử dụng các thuật toán kiểm chứng thống kê.
c. Tính độc lập và không độc lập
Khi các dấu hiệu trường địa vật lý độc lập nhau thì có thể sử dụng các thuật
toán đơn giản. Còn trong trường hợp các dấu hiệu liên quan với nhau thì các thuật
toán được sử dụng phức tạp hơn.
d. Mức độ đầy đủ của các thông tin tiên nghiệm
Mức độ đầy đủ của các thông tin tiên nghiệm chính là mức độ hoàn chỉnh
Lý thuyết các thuật toán nhận dạng [1] [10]
Hiện nay, trong địa vật lý người ta sử dụng nhiều phương pháp nhận dạng
hiện đại, được tự động hóa bằng các phần mềm mạnh. Tuy nhiên có thể chia chúng
thành 2 nhóm: nhóm có phương pháp nhận dạng theo đối tượng chuẩn (có thông
tin tiên nghiệm) và nhóm có phương pháp nhận dạng không có đối tượng chuẩn
(không có thông tin tiên nghiệm).
1.2.1. Các thuật toán nhận dạng có mẫu chuẩn
Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác định
bản chất địa chất của các đối tượng dựa vào việc so sánh tập hợp các dấu hiệu địa
7
vật lý đặc trưng cho đối tượng chuẩn với tập hợp các dấu hiệu địa vật lý của đối
tượng nghiên cứu. Dưới đây là một số thuật toán điển hình.
a. Thuật toán logic
Trong các thuật toán logic, để nhận dạng đối tượng hoặc là người ta tính
lượng tin tổng, hoặc là xác định khoảng cách tổng.
Công việc đầu tiên, người ta tiến hành mã hóa các dấu hiệu trường bằng mã nhị
phân gồm tập số 0 và 1.
Nếu xkl là giá trị trường thứ l của mẫu thứ k thì:
-
xkl = 0 khi mẫu k không chứa giá trị thứ l
-
xkl = 1 khi mẫu k chứa giá trị thứ l
ixi
i
Với điều kiện:
n
k
j
1
i
2
L
(
Y
j
0
i
x
ji
)
đạt cực tiểu.
.
x
j
Với điều kiện:
2
k
kk
L
Y
l
a
b
i
x
l
i
c
ij
x
li
một tập hợp số liệu nhất định ứng với một giá trị sai số cho trước có thể xấp xỉ
được nhiều hàm hồi quy. Do vậy ta không thể đưa ra được các lý giải về ý nghĩa
vật lý của các hệ số của hàm hồi quy.
c. Thuật toán định nghiệm thống kê
Thuật toán nhận dạng trên cơ sở mô hình thống kê đối tượng chuẩn trong
phân tích số liệu địa vật lý thường sử dụng các thông số như: Tỉ số sự thật L(x) và
tổng lượng thông tin J(1:2,x).
9
Giá trị các thông số đó được tính theo công thức:
L(x) = P1(x)/ P2(x)
J(1:2,x) = log[P1(x)/ P2(x)]
Trong đó:
P1(x), P2(x): là xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượng
tương ứng của lớp 1 và lớp 2 (lớp quặng và lớp không quặng). Khi sử dụng đối
tượng chuẩn cho lớp 1 (lớp quặng) thì trong các biểu thức P2(x) được thay bằng 1.
x: là vectơ giá trị các dấu hiệu được sử dụng, x1,x2…xk (ví dụ các hàm
lượng qU, qTh, qK…).
Khi các dấu hiệu x1,x2…xk được xem là không phụ thuộc nhau thì xác suất
của đại lượng n chiều của tổ hợp n dấu hiệu được tính.
P(x) = P(x1). P(x2)…. P(xk)
P
1
(x
1
).
P
1
)
P
2
(x
1
).
P
2
(x
2
)
.
P
2
(x
k
)
J(1:2,x) = J(1:2,x1) + J(1:2,x2) +…+ J(1:2,xk)
Nếu sự phụ thuộc của các dấu hiệu là rõ và sự phân bố của chúng tuân theo
luật chuẩn thì để nhận dạng các đối tượng quặng và không quặng người ta thường
sử dụng các hàm phân giải bậc 1 (R1) hoặc bậc 2 (R2) đối với các tham số
x1,x2…xn. Các hàm này được biểu diễn như sau:
n
R1 aixi
i1
k k
và khoanh định được các diện tích đồng dạng với đối tượng chuẩn. Các dấu hiệu
được lựa chọn thường là một tổ hợp nào đó trong số các tham số thu được.
1.2.2. Các thuật toán nhận dạng không có mẫu chuẩn
a. Thuật toán kiểm chứng thống kê
Thuật toán này tiến hành phân loại trường khi các dấu hiệu trường hoàn toàn
độc lập nhau. Ban đầu người ta sử dụng các bộ lọc để tách các dị thường ra khỏi
phông nhiễu cho từng dấu hiệu trường. Kết quả lọc cho phép nhận được các số liệu
trường chủ yếu gồm các dị thường. Tiếp theo là phân loại các dị thường thành các
lớp dị thường. Mỗi lớp dị thường gồm các dị thường có các đặc trưng thống kê
giống nhau. Để phân loại các dị thường đầu tiên người ta phân chia khu vực khảo
sát thành các diện tích cơ sở, sau đó dựa vào kết quả phân cấp các giá trị trường ở
mỗi cửa sổ người ta dựng các đường cong biến phân đặc trưng cho cửa sổ đó. Cuối
2
cùng để phân lớp các dị thường người ta sử dụng chỉ tiêu để so sánh và xếp loại
các đường cong biến phân. Các diện tích có ước lượng phân bố mật độ xác suất
giống nhau được xếp vào một lớp.
Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn thuật toán tiến
hành xác định số hiệu của lớp tổng hợp.
Với mục đích này, dựa vào các đường cong biến thiên dựng được cho từng
dấu hiệu người ta xác định giá trị trung bình và phương sai rồi sắp xếp các giá trị
trung bình theo thứ tự tăng dần. Sau đó dựa vào chỉ tiêu xác suất hậu nghiệm cực
đại người ta quyết định xếp loại đối tượng khảo sát vào các lớp khác nhau. Bằng
cách trên, toàn bộ khu vực khảo sát được phân thành một số diện tích có hình dạng
bất kì, ở đó dị thường của các dấu hiệu khác nhau chồng lên nhau.
b. Thuật toán K trung bình
Nội dụng của thuật toán như sau: Giả sử tồn tại n đối tượng. Nhiệm vụ đặt
ra là phân chia toàn bộ n đối tượng thành M lớp với M
LÝ MÁY BAY
2.
2.1.
Các phƣơng pháp phân tích tài liệu địa vật lý máy bay
Công tác phân tích tài liệu địa vật lý máy bay nói riêng và phân tích tổ hợp
tài liệu nói chung để giải thích các vấn đề địa chất và dự báo triển vọng khoáng sản
người ta sử dụng rất nhiều phương pháp khác nhau tùy thuộc vào từng mục tiêu,
từng bước và từng điều kiện cụ thể, trong đó có các phương pháp thông kê - nhận
dạng được áp dụng rộng rãi có hiêu quả hơn cả. Một số nội dung cơ bản của các
phương pháp như sau:
2.1.1. Các phƣơng pháp tách trƣờng[10]
Các phương pháp tách trường là những phương pháp quen thuộc, được sử
dụng rất rộng rãi và có hiệu quả trong phân tích các tài liệu địa vật lý nói chung.
Sử dụng các phương pháp tách trường để phân chia các dị thường nhằm
khoanh định và dự đoán về diện phân bố của các đối tượng địa chất gây dị thường.
Việc quan trọng khi sử dụng phương pháp này là lựa chọn bán kính trung bình sao
cho phù hợp với kích thước của đối tượng gây dị thường.
2.1.2. Nhóm các phƣơng pháp thống kê nhận dạng[10]
a. Các phương pháp nhận dạng theo đối tượng chuẩn
Trong các phương pháp phân tích nhận dạng có đối tượng chuẩn thì việc
quan trọng nhất là chọn đối tượng chuẩn, tiếp đến là chọn tập hợp các dấu hiệu
dùng để phản ánh và nhận dạng các đối tượng. Tùy thuộc vào các mục đích nghiên
cứu khác nhau mà việc lựa chọn các đối tượng chuẩn sẽ khác nhau.
b. Các phương pháp nhận dạng không có đối tượng chuẩn .
Trong điều kiện khi diện tích khảo sát chưa được nghiên cứu kỹ và không
có được các đối tượng chuẩn tin cậy người ta có thể sử dụng các phương pháp nhận
dạng không có mẫu theo nguyên lý tự điều chỉnh để phát hiện và khoanh định các
diện tích trường dị thường dựa trên một số dấu hiệu đã được chọn trước theo
q
)
e
Th
K
Th
Các thông số Dominal : D
Trong đó:
q
(
q
q
)/
K
K
K
K
K - là độ lệch chuẩn của q
K
Các hàm tương quan.
Các hàm xác suất thống kê phản ánh xác suất bắt gặp của các đặc tính
phóng xạ nào đó (theo nguyên tắc xác suất nhỏ).
Các tỉ số hàm lượng các nguyên tố.
Các phương pháp thống kê thực nghiệm, thông qua các thông số nói trên
được áp dụng khá rỗng rãi và có hiệu quả trong phân tích tài liệu phổ gamma hàng
đăng trên TC Địa chất, A/302 : 76-80. Hà Nội. Và nhóm tác giả Võ Thanh Quỳnh,
Nguyễn Xuân Bình, Nguyễn Đức Vinh tiếp tục nghiên cứu hoàn thiện và mở rộng
khả năng ứng dụng của phương pháp vào những năm gần đây. Từ các kết quả công
bố cho thấy các thử nghiệm bước đầu của phương pháp cho kết quả tốt khi phân
tích tài liệu thực tế.
Phương pháp Tần suất – Nhận dạng dựa trên cơ sở là phương pháp phân
tích tần suất, một phương pháp có khả năng đánh giá chất lượng của mỗi loại thông
tin.
2.2.1. Nội dung cơ bản của phương pháp phân tích tần suất [6]
Phương pháp phân tích tần suất với việc sử dụng tần suất trung bình của sự
xuất hiện đồng thời các dấu hiệu do Griffths-Vinni đưa ra tiến hành trên một loại
đối tượng mẫu có nội dung tóm tắt như sau:
15
Giả sử ta có ma trận thông tin các tính chất của đối tượng nghiên cứu:
1112......1k
......
2k
21 22
..........
.........
n1 n 2 ...... nk
m dấu hiệu đầu tính theo tỉ lệ % trong tổng thông tin của tất cả k dấu hiệu được
tính bằng:
m
Pm
I
i 1
k
I
i 1
*2
i
100%
2
(2.2)
*
i
Pm là cơ sở để lựa chọn tập hợp các tính chất đủ chứa tải những thông tin cần thiết
theo yêu cầu nghiên cứu, nghĩa là khi cho Pm một giá trị tỉ lệ % nào đó ta sẽ tìm
được tập hợp m tính chất tương ứng.
16
17
Phân tích đối sánh, xác định các đối tượng đồng dạng
-
Xây dựng ma trận thông tin cho đối tượng đối sánh tương tự như đối với đối
tượng mẫu thông qua các khoảng giá trị đặc trưng của chính đối tượng mẫu.
-
Tiến hành đánh giá tỉ trọng thông tin cho tất cả các tính chất của đối tượng đối
sánh bằng phương pháp phân tích tần suất theo thuật toán Griffiths-Vinin.
-
Tính tỉ trọng thông tin của tổ hợp thông tin đã được lựa chọn của đối tượng mẫu
cho đối tượng đối sánh. Có thể xem giá trị này tương tự như hệ số đồng dạng, ta
gọi nó là chỉ số đồng dạng, kí hiệu P*m.
Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi P*m có
giá trị đạt mức giá trị ngưỡng nào đó.
Các bước phân tích của phương pháp Tần suất-Nhận dạng được thực hiện
theo sơ đồ hình 2.1.
Phương pháp được nhóm tác giả nhận định: “Phương pháp này hoàn toàn có
thể ứng dụng để giải quyết nhiệm vụ tìm kiếm và dự báo triển vọng khoáng sản
trong xử lý, phân tích tài liệu địa vật lý máy bay, một nguồn tài liệu hết sức phong
phú ở nước ta hiện nay. Về nguyên tắc, phương pháp này có thể mở rộng phân tích
cho các tài liệu địa vật lý khác nhau. Tuy nhiên, hiện chưa có kết quả phân tích trên