BỘ THÔNG TIN VÀ TRUYỀN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
NGUYỄN TU TRUNG
NGHIÊN CỨU NÂNG CAO CHẤT LƯỢNG VÀ GIẢI ĐOÁN
ẢNH VIỄN THÁM ĐA PHỔ DỰA TRÊN TÍNH TOÁN MỀM
LUẬN ÁN TIẾN SĨ KỸ THUẬT
HÀ NỘI – 2018
1
BỘ THÔNG TIN VÀ TRUYỀN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
NGUYỄN TU TRUNG
NGHIÊN CỨU NÂNG CAO CHẤT LƯỢNG VÀ GIẢI ĐOÁN
ẢNH VIỄN THÁM ĐA PHỔ DỰA TRÊN TÍNH TOÁN MỀM
Chuyên ngành: Hệ thống thông tin
Mã số: 9.48.01.04
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Người hướng dẫn khoa học:
1. TS. Vũ Văn Thoả
2. PGS.TS. Đặng Văn Đức
1.
Tính cấp thiết của luận án
17
2.
Mục tiêu, đối tượng và phương pháp nghiên cứu của luận án
19
3.
Đóng góp chính của luận án
20
4.
Bố cục của luận án
20
CHƯƠNG I - TỔNG QUAN VỀ VIỄN THÁM VÀ GIẢI ĐOÁN ẢNH VIỄN
THÁM ĐA PHỔ
22
1.1. Tổng quan về viễn thám
1.2.3. Hiệu chỉnh ảnh
29
1.2.4. Tăng cường chất lượng ảnh trực quan
32
1.2.5. Giải đoán thủ công
34
1.2.6. Giải đoán tự động theo phương pháp số
35
3
1.2.7. Hậu giải đoán, phân lớp
41
1.3. Tổng quan về tính toán mềm
42
1.3.1.
1.4.2. Giải đoán ảnh viễn thám
57
1.5. Phân tích, đánh giá về thành công, ưu điểm, hạn chế
71
1.6. Kết luận chương I
72
CHƯƠNG II: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN TĂNG CƯỜNG ĐỘ
TƯƠNG PHẢN ẢNH VIỄN THÁM ĐA PHỔ
73
2.1. Một số thuật toán tăng cường độ tương phản ảnh dựa trên logic mờ
73
2.1.1. Tăng cường ảnh mờ với toán tử tăng cường
73
2.1.2. Tăng cường ảnh mờ với toán tử Hyperbol
73
2.1.1. Tăng cường ảnh mờ dựa trên phân bố xác suất
74
4
2.5.5. Thử nghiệm và đánh giá
85
2.6. Tăng cường ảnh viễn thám sử dụng phân cụm KMeans
93
2.6.1. Thuật toán tăng cường ảnh viễn thám sử dụng thuật toán phân cụm
KMeans 93
2.6.2. Phát triển thuật toán cho ảnh đa phổ
96
2.6.3. Thử nghiệm và đánh giá
97
2.7. Kết luận chương II
101
CHƯƠNG III: PHÁT TRIỂN MỘT SỐ THUẬT TOÁN PHÂN LỚP ẢNH VIỄN
THÁM ĐA PHỔ
103
3.1. Phân cụm ảnh viễn thám với thuật toán KMeans
3.1.8. Đề xuất thuật toán KMeansCMN
119
3.2. Phân cụm ảnh viễn thám với thuật toán Fuzzy C-Means
127
3.2.1. Hạn chế của thuật toán Fuzzy C-Means
127
3.2.2. Đề xuất thuật toán lsiFCM
127
3.3. Phân lớp ảnh viễn thám
132
3.3.1. Phân lớp hợp lý tối đa
132
3.3.2. Một số độ đo phân lớp
134
3.3.3. Đề xuất tiếp cận lai cho phân lớp ảnh viễn thám
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các
kết quả nghiên cứu và các kết luận trong luận án này là trung thực, không sao chép
từ bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn
tài liệu đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng quy định.
Tác giả luận án
Nguyễn Tu Trung
7
LỜI CẢM ƠN
Luận án này báo cáo các kết quả nghiên cứu trong thời gian tôi làm nghiên
cứu sinh. Trong suốt thời gian này ngoài nỗ lực làm việc của bản thân tôi, phòng
Tin học Viễn thông và nhóm aSoftwareGroup, Viện Công nghệ Thông tin đã tạo
cho tôi một môi trường làm việc, điều kiện để thực hiện các nghiên cứu về chuyên
nghành xử lý ảnh nói chung và xử lý ảnh viễn thám nói riêng.
Tôi xin chân thành cảm ơn TS. Vũ Văn Thoả, PGS.TS Đặng Văn Đức đã tận
tình hướng dẫn tôi để hoàn thành được luận án này. Tôi cũng xin chân thành cảm ơn
thầy Ngô Hoàng Huy, phòng Nhận dạng và Công nghệ Tri thức, Viện Công nghệ
Thông tin. Thầy có ảnh hưởng rất lớn đến lĩnh vực nghiên cứu mà tôi quan tâm.
Xin cảm ơn các đồng nghiệp tại Tin học Viễn thông, Viện Công nghệ Thông
tin đã đóng góp những ý kiến thiết thực mỗi lần tôi seminar về vấn đề xử lý ảnh
viễn thám.
Đặc biệt tôi xin bày tỏ lòng biết ơn sâu sắc tới bố mẹ tôi, vợ tôi và đại gia
đình tôi mà thiếu họ chắc chắn tôi đã không đủ nghị lực để hoàn thành công trình
này.
8
2D-MKM
Two-Dimensional Moving Kmeans
FKM
Fuzzy Kmeans
CDFKM
Center Displacement FKM
CCEA
Cluster Center Estimation Algorithm
OSCAR
Open Source Cluster Application Resource
CUDA
Compute Unified Device Architecture
MR-FCM
Multi Resolution Fuzzy C-Means
GLCM
9
SVM
Support vector Machine
GRASS
Geographic Resources Analysis Support System
LoRSIE
Local based Remote Sensing Image Enhancement
DWT
Discrete Wavelet Transform
LaSRSIE
Large Size Remote Sensing Image Enhancement
wiKMeans
Wavelet init Kmeans
CIKMeans
Bảng 1.1. Ảnh phân loại cuối cùng (a) ảnh gốc và (b) đến (d) là các ảnh gốc được
áp watershed từ độ phân giải mức 2 đến mức 0 tương ứng [85]. .............................. 63
Bảng 2.1. Quy trình thuật toán tăng cường ảnh viễn thám dựa trên tiếp cận cục bộ. 78
Bảng 2.2. Các hàm biến đổi mức xám theo từng cụm. ............................................... 81
Bảng 2.3. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 86
Bảng 2.4. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 87
Bảng 2.5: Thời gian thực thi. ...................................................................................... 88
Bảng 2.6. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 88
Bảng 2.7. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 89
Bảng 2.8. Tăng cường ảnh với phương pháp mờ và cải tiến. ..................................... 89
Bảng 2.9. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải tiến. 90
Bảng 2.10. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 90
Bảng 2.11. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. .............................................................................................................................. 91
Bảng 2.12. Thời gian thực thi. .................................................................................... 91
Bảng 2.13. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 92
Bảng 2.14. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. .............................................................................................................................. 92
Bảng 2.15. Thời gian thực thi. .................................................................................... 93
Bảng 2.16. Các hàm biến đổi mức xám theo từng cụm. ............................................. 95
Bảng 2.17. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 98
Bảng 2.18. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
tiến. .............................................................................................................................. 98
Bảng 2.19. Tăng cường ảnh với phương pháp mờ và cải tiến. ................................... 99
11
Bảng 2.20. So sánh chỉ số mờ của ảnh tăng cường theo phương pháp mờ và cải
Hình 1.3. Tiến trình giải đoán tự động ảnh viễn thám đa phổ.................................... 28
Hình 1.4. Nắn chỉnh hình học. .................................................................................... 31
Hình 1.5. Cân bằng lược đồ màu. ............................................................................... 32
Hình 1.6. Nguyên tắc chính của tăng cường ảnh mờ [47]. ........................................ 33
Hình 1.7. Phân lớp có giám sát (trái) và không giám sát (phải). ............................... 36
Hình 1.8. Các bước cơ bản trong phương pháp phân lớp có giám sát. ..................... 38
Hình 1.9. Quy trình phân lớp ảnh đa phổ hướng điểm ảnh. ....................................... 39
Hình 1.10. Quy trình phân loại ảnh đa phổ hướng đối tượng. ................................... 40
Hình 1.11. Ví dụ của ảnh khử sương mù sử dụng dò tìm điểm tối; Trái: Ảnh sương
mù đầu vào, Phải: Kết quả của phương pháp trong [122]......................................... 48
Hình 1.12. So sánh kết quả của trong [70] với trong [48]. ........................................ 49
Hình 1.13. (a-f): So sánh kết quả xử lý với các hàm wavelet khác nhau và bộ lọc
đồng cấu [124]. ........................................................................................................... 50
Hình 1.14. So sánh với phương pháp nhanh của Tarel và Hautiere [105]. Phương
pháp trong [29] nhanh và cho kết quả chính xác hơn phương pháp của Tarel. ........ 51
Hình 1.15: thử nghiệm loại bỏ mây mù trong [120]................................................... 52
Hình 1.16. So sánh kết quả thuật toán của Cheng (c) với thuật toán ACE (b) [24]... 54
Hình 1.17. So sánh kết quả 2 kĩ thuật tăng cường: đầu vào, luật mờ, toán tử tăng
cường [99]................................................................................................................... 55
Hình 1.18. Kiến trúc phân lớp của Napoleon và cộng sự [77]................................... 59
Hình 1.19. Ảnh đầu vào Landsat và kết quả với 5 cụm [77]. ..................................... 60
Hình 1 20. Kết quả phân loại có kiểm soát ảnh World View 1, QuickBird [7]. ......... 68
Hình 1 21. Sơ đồ quá trình nhận dạng. ....................................................................... 70
13
Hình 1.22. Ảnh đầu vào, kết quả phân loại dựa trên tiếp cận điểm ảnh, tiếp cận đối
tượng. .......................................................................................................................... 70
Hình 2.1. Hàm phân bố xác suất cho việc tính toán các giá trị hàm thuộc. ............... 74
KMeansCMN (*1.0e+3). ........................................................................................... 122
Hình 3.17. Kết quả phân cụm bởi KMeans. .............................................................. 123
Hình 3.18. Kết quả phân cụm bởi KMeansCMN. ..................................................... 123
Hình 3.19. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
KMeansCMN (*1.0e+3). ........................................................................................... 124
Hình 3.20. Kết quả phân cụm bởi KMeans. .............................................................. 125
Hình 3.21. Kết quả phân cụm bởi KMeansCMN. ..................................................... 125
Hình 3.22. Biểu đồ so sánh chỉ số độ đồng nhất các cụm sinh ra bởi KMeans,
KMeansCMN (*1.0e+3). ........................................................................................... 126
Hình 3.23. Chi tiết từng cụm của FCM của thử nghiệm 1. ....................................... 129
Hình 3.24. Chi tiết từng cụm của lsiFCM của thử nghiệm 1. ................................... 129
Hình 3.25. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử
nghiệm 1 (*1.0e+3). .................................................................................................. 130
Hình 3.26. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của
thử nghiệm 1 (*1.0e-3). ............................................................................................. 130
Hình 3.27. Chi tiết từng cụm của FCM của thử nghiệm 2. ....................................... 131
Hình 3.28. Chi tiết từng cụm của lsiFCM của thử nghiệm 2. ................................... 131
Hình 3.29. Biểu đồ so sánh chỉ số F(I) các cụm sinh ra bởi FCM và lsiFCM của thử
nghiệm 2(*1.0e+3). ................................................................................................... 131
Hình 3.30. Biểu đồ so sánh chỉ số F’(I) các cụm sinh ra bởi FCM và lsiFCM của
thử nghiệm 2 (*1.0e-3). ............................................................................................. 131
Hình 3.31. Quy trình phân loại ảnh đa phổ theo tiếp cận lai. .................................. 135
Hình 3.32: Sơ đồ thử nghiệm quy trình thử nghiệm phân lớp theo tiếp cận lai. ...... 136
Hình 3.33: Lựa chọn và hiển thị vùng mẫu trên ảnh. ............................................... 137
Hình 3.34. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến. ........................... 138
Hình 3.35. So sánh độ chính xác. .............................................................................. 139
15
Hình 3.36. Ảnh đầu vào, kết phân loại thuật toán gốc và cải tiến. ........................... 140
bộ công nghệ trong cảm biến và quang học cũng được áp dụng nhằm tăng cường
chất lượng dữ liệu ảnh thu được, giảm nhẹ gánh nặng cho quá trình xử lý ảnh.
Ngày nay, một xu hướng mới của ứng dụng phần mềm ảnh viễn thám đó là
các dịch vụ bản đồ trực tuyến. Giá trị của dữ liệu viễn thám đã được nhiều nhà cung
cấp nặng ký trong các dịch vụ Web phát hiện. Microsoft và Google đã lần lượt phát
triển các dịch vụ bản đồ trực tuyến “MSN Virtual Earth” và “Google Earth”. Sự kết
hợp của dữ liệu viễn thám và các công cụ bản đồ thân thiện trên dịch vụ bản đồ trực
tuyến đã đem dữ liệu viễn thám tới đại chúng và mở ra những khả năng ứng dụng
mới cho viễn thám.
17
Quá trình xử lý và phân tích thông tin viễn thám được thực hiện bằng phần
mềm máy tính. Ảnh viễn thám ngày càng có những ứng dụng quan trọng trong
nhiều lĩnh vực, từ hỗ trợ quản lý đất đai phục vụ dân sinh, quản lý, giám sát chủ
quyền quốc gia, cho đến hỗ trợ giám sát tài nguyên, môi trường ... Ứng dụng ngày
càng phổ biến của ảnh viễn thám tất yếu dẫn đến nhu cầu ngày càng tăng của việc
sử dụng phần mềm xử lý ảnh viễn thám.
Ngày nay, có rất nhiều phần mềm cả thương mại lẫn mã nguồn mở phục vụ
công tác xử lý dữ liệu viễn thám. Theo nghiên cứu của hãng Global Marketing
Insights, những phần mềm liên quan tới xử lý dữ liệu viễn thám được ứng dụng
nhiều nhất tại các nhóm nghiên cứu châu Á là ESRI 30%; ERDAS 25%; RSI ENVI
17%; MapInfo 17%; ERMapper 11%. Trong khi đó, ở phương Tây, những con số
này là ESRI 39%, ERDAS 27%, MapInfo 9%, AutoDesk 7%, RSI ENVI 17% [42].
Còn ở Việt Nam, công nghệ xử lý ảnh viễn thám đã xâm nhập khá sớm, từ
năm 1983 (Viện Khoa học Việt Nam). Để nhanh chóng phát triển công nghệ vũ trụ
phục vụ cho phát triển kinh tế của đất nước, Nhà nước đã xây dựng đề án: “Kế
hoạch tổng thể về ứng dụng và phát triển công nghệ viễn thám ở Việt Nam” nhằm
hướng đến sự phát triển bền vững trên cơ sở sử dụng hợp lý tài nguyên thiên nhiên
và bảo vệ môi trường. Năm 2006, Viện Công nghệ Vũ trụ, thuộc Viện Hàn Lâm
cường ảnh viễn thám.
Nội dung thứ hai là so sánh, đánh giá các phương pháp, kĩ thuật phân lớp
ảnh viễn thám.
Nội dung thứ ba là đề xuất kĩ thuật mới tăng cường ảnh viễn thám đa phổ
và chứng minh phương pháp mới hiệu quả hơn các phương pháp đã có theo
các tiêu chuẩn đánh giá được chọn.
Nội dung thứ tư là đề xuất kĩ thuật mới phân loại ảnh viễn thám đa phổ và
chứng minh phương pháp mới hiệu quả hơn các phương pháp đã có theo
các tiêu chuẩn đánh giá được chọn.
Đối tượng nghiên cứu của luận án bao gồm:
Các kĩ thuật tiền xử lý, tăng cường ảnh viễn thám.
Các kĩ thuật phân lớp ảnh viễn thám.
Ảnh viễn thám bao gồm nhiều loại khác khau với các đặc trưng và phương
pháp xử lý khác nhau. Luận án tập trung vào ảnh viễn thám đa phổ và các kĩ thuật
xử lý tương ứng. Vì vậy, phạm vi nghiên cứu của luận án tập trung chủ yếu ở hai
vấn đề chính. Một là, nghiên cứu kĩ thuật tiền xử lý, tăng cường ảnh viễn thám đa
phổ. Hai là, nghiên cứu phương pháp phân lớp ảnh viễn thám đa phổ.
19
Phương pháp nghiên cứu của luận án là nghiên cứu lý thuyết và nghiên cứu
thực nghiệm. Về nghiên cứu lý thuyết: Tổng hợp các thông tin liên quan, lựa chọn
các cách tiếp cận đã được áp dụng thành công dựa vào các kiến thức cơ bản, các kết
quả nghiên cứu đã công bố; trao đổi thông qua seminar hoặc tham gia báo cáo tại
các hội thảo khoa học; trao đổi, làm việc và kết hợp chặt chẽ với các chuyên gia về
lĩnh vực viễn thám. Về nghiên cứu thực nghiệm: luận án thực hiện cài đặt các thuật
toán, chạy thử nghiệm thuật toán với các bộ số liệu ảnh viễn thám, so sánh và đánh
giá kết quả thực nghiệm so với kết quả nghiên cứu lý thuyết, từ đó kết luận tính
đúng đắn của kết quả nghiên cứu.
xuất cải tiến từ các thuật toán KMeans và Fuzzy CMeans. Đánh giá và so sánh với
các phương pháp đã có dựa trên chỉ số về độ đồng nhất cụm cũng như thời gian thực
thi của các các thuật toán phân cụm. Về phương pháp phân lớp giám sát là một tiếp
cận mới lai dựa trên hai tiếp cận hướng điểm ảnh và hướng đối tượng, thuật toán đề
xuất cải tiến từ thuật toán phân lớp hợp lý tối đa (Maximum likehood).
Cuối cùng, phần kết luận nêu những đóng góp của luận án, hướng phát triển
và những vấn đề quan tâm của nghiên cứu sinh.
21
CHƯƠNG I - TỔNG QUAN VỀ VIỄN THÁM VÀ GIẢI
ĐOÁN ẢNH VIỄN THÁM ĐA PHỔ
Trong chương 1, luận án trình bày tổng quan về viễn thám, giải đoán ảnh đa
phổ. Tiếp đó, luận án trình bày về tình hình nghiên cứu trên thế giới. Từ đó, luận án
phân tích kết quả đạt được và những vấn đề còn hạn chế. Những phân tích này làm
tiền đề để luận án đề xuất những cải tiến mới trong các chương tiếp theo.
1.1. Tổng quan về viễn thám
1.1.1. Tiến trình viễn thám
Theo các định nghĩa trong [22][62] thì viễn thám (Remote Sensing) được hiểu
như một khoa học, nghệ thuật thu nhận thông tin về đối tượng, khu vực hay hiện
tượng trên bề mặt Trái đất mà không tiếp xúc trực tiếp với chúng. Công việc này
được thực hiện bởi cảm nhận (sensing) và lưu trữ các năng lượng phản xạ hay được
phát ra từ các đối tượng nghiên cứu. Sau đó là thực hiện phân tích, xử lý và ứng
dụng các thông tin này vào nhiều lĩnh vực khác nhau.
Tiến trình viễn thám bao gồm nhiều công đoạn, trong đó có tương tác giữa bức
xạ và đối tượng nghiên cứu. Khái niệm đối tượng nghiên cứu trong tài liệu này
được hiểu là các đối tượng, khu vực hay hiện tượng nào đó trên bề mặt Trái đất mà
con người muốn thu thập thông tin về nó. Trên hình 1.1 là mô tả vắn tắt bảy thành
diễn giải dữ liệu viễn thám và ứng dụng chúng trong thực tế.
1.1.2. Đặc trưng viễn thám
Năng lượng điện từ có thể được nhận biết bằng phim ảnh hay điện tử. Có thể
ghi biến thiên năng lượng trên phim nhạy ánh sáng. Cần phân biệt hai khái niệm
ảnh (image) và ảnh chụp (photograph) trong viễn thám. Ảnh được hiểu là hình thức
biểu diễn “cảnh” bất kỳ, không quan tâm đến bước sóng hay thiết bị viễn thám nào
được sử dụng. Ảnh chụp đề cập đến ảnh được chụp trên phim ảnh. Thông thường,
ảnh được chụp tại bước sóng từ 0.3m đến 0.9m (vùng nhìn thấy và vùng hồng
ngoại phản xạ). Vậy, mọi ảnh chụp là ảnh, nhưng không phải mọi ảnh là ảnh chụp.
Ảnh chụp có thể được biểu diễn và hiển thị dưới dạng ảnh số bằng cách chia ảnh
23
thành các ô vuông nhỏ bằng nhau (theo cột và hàng), gọi là pixel. Biểu diễn độ sáng
của mỗi vùng bằng một giá trị số (DN- Digital Number).
Hình 1.2. Ảnh chụp và ảnh số.
Hình 1.2 thể hiện qui trình sinh ảnh số từ ảnh chụp. Ảnh chụp được quét và
được chia nhỏ thành các pixel. Mỗi pixel được gán một số biểu diễn độ chói. Máy
tính hiển thị mỗi giá trị số với mức độ chói khác nhau.
Các đặc trưng viễn thám bao gồm:
Kênh ảnh (Channel, Band): Thông thường, một dải hẹp bước sóng được
đo và tập dữ liệu được lưu trữ tách biệt, chúng được gọi là băng (Band) hay
kênh (Channel) ảnh. Có thể tổ hợp và hiển thị các kênh thông tin nhờ ba
màu cơ sở (red, green và blue).
Độ phân giải ảnh không gian: Đề cập đến vùng được đo, kích thước đặc
trưng nhỏ nhất trên mặt đất mà sensor có thể nhận biết.
Độ phân giải phổ: Đề cập đến bước sóng phổ mà sensor nhạy cảm với. Có
Nguồn năng lượng chính là bức xạ nhiệt của các vật thể.
Ảnh radar là loại ảnh được tạo ra bởi việc thu nhận các bước sóng trong
dải sóng cao tần (bước sóng từ 1mm – 1m). Nguồn năng lượng chính là
sóng rada phản xạ từ các vật thể do vệ tinh tự phát xuống theo những bước
sóng đã được xác định.
Một số hệ thống vệ tinh và loại ảnh viễn thám
Vệ tinh /Cảm biến thời tiết: TIROS-1, GOES, NOAA AVHRR…
Các cảm biến/ vệ tinh quan trắc mặt đất: Landsat, SPOT, IRS, ASTER,
MODIS
Các cảm biến/vệ tinh quan trắc hải dương: Nimbus-7, MOS, SeaWiFS
25