Luận án tiến sĩ nghiên cứu phát triển các thuật toán ước lượng mặt phẳng và dẫn đường cho hệ thống thị giác rô bốt trong nhà - Pdf 56

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

Đặng Khánh Hòa

NGHIÊN CỨU VÀ PHÁT TRIỂN CÁC THUẬT TOÁN
ƯỚC LƯỢNG MẶT PHẲNG VÀ DẪN ĐƯỜNG CHO HỆ THỐNG
THỊ GIÁC RÔ-BỐT TRONG NHÀ

LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỆN TỬ

Hà Nội – 2019

i


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

Đặng Khánh Hòa

NGHIÊN CỨU VÀ PHÁT TRIỂN CÁC THUẬT TOÁN
ƯỚC LƯỢNG MẶT PHẲNG VÀ DẪN ĐƯỜNG CHO HỆ THỐNG
THỊ GIÁC RÔ-BỐT TRONG NHÀ

Ngành: Kỹ thuật điện tử
Mã số: 9520203

LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỆN TỬ

NGƯỜI HƯỚNG DẪN KHOA HỌC:

Trước hết, tôi xin bày tỏ lời cảm ơn chân thành và sâu sắc đến tập thể hướng dẫn PGS.
TS. Nguyễn Tiến Dũng và TS. Lê Dũng đã trực tiếp định hướng khoa học trong quá trình nghiên
cứu. Các Thầy đã dành nhiều thời gian và tâm huyết, động viên về mọi mặt để tác giả hoàn
thành luận án.
Tác giả xin trân trọng cảm ơn Lãnh đạo trường Đại học Bách Khoa Hà Nội (HUST),
Phòng Đào tạo, Viện Điện tử Viễn thông (SET), Bộ môn Điện tử và Kỹ thuật máy tính và TT
Đào tạo thực hành đã tạo điều kiện thuận lợi cho nghiên cứu sinh trong suốt quá trình học tập
và nghiên cứu. Chân thành cảm ơn các cán bộ, giảng viên, các cộng sự cũng như các anh chị
NCS của Viện Điện tử Viễn thông đã động viên, hỗ trợ và tận tình giúp đỡ tác giả trong quá
trình thực hiện luận án.
Tác giả cảm ơn chương trình 911, Bộ Giáo dục và Đào tạo đã tài trợ cho nghiên cứu sinh.
Cảm ơn SET, HUST đã tài trợ thông qua đề tài nghiên cứu khoa học cấp cơ sở với mã T2016PC-108.
Cuối cùng, tôi xin bày tỏ lòng biết ơn đến song thân phụ mẫu, vợ và hai con vì những sự
thúc đẩy, khích lệ và hy sinh nhiều trong thời gian vừa qua. Đây chính là động lực to lớn giúp
tác giả vượt qua mọi trở ngại để hoàn thành luận án này.
Tác giả luận án

ĐẶNG KHÁNH HÒA

ii


MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................i
LỜI CẢM ƠN....................................................................................................... ii
MỤC LỤC ........................................................................................................... iii
DANH MỤC CÁC KÝ HIỆU .............................................................................vi
DANH MỤC CÁC CHỮ VIẾT TẮT .............................................................. viii
DANH MỤC CÁC BẢNG ...................................................................................xi
DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ ....................................................... xii



1.3.4.

Phương pháp dẫn đường cho rô-bốt trong nhà trong môi trường chưa

biết

............................................................................................................ 25

Tổng kết chương .......................................................................................... 29
CHƯƠNG 2. PHƯƠNG PHÁP TĂNG TỐC TÍNH TOÁN BẢN ĐỒ
CHÊNH LỆCH VÀ PHÁT TRIỂN THUẬT TOÁN TRÍCH XUẤT MẶT PHẲNG
.................................................................................................... 31
Giới thiệu chương ........................................................................................ 31
Hệ thống máy ảnh nổi.................................................................................. 31
2.2.1. Cảm biến hình ảnh .............................................................................. 31
2.2.2.

Cấu trúc hệ thống máy ảnh nổi ........................................................... 32

2.2.3.

Nguyên lý thị giác nổi ........................................................................ 33

2.2.4.

Bản đồ độ sâu ..................................................................................... 35

Phương pháp tăng tốc tính toán bản đồ chênh lệch/độ sâu ..................... 36


Phương pháp nhận dạng đối tượng mặt phẳng đất từ dữ liệu độ sâu thực
tế .................................................................................................................................... 72
3.4.1. Giới thiệu ............................................................................................ 72
3.4.2. Kiến trúc hệ thống trích mặt đất từ dữ liệu độ sâu thực tế ................. 73
3.4.3.

Kết quả thực nghiệm và thảo luận ...................................................... 74

3.4.4.

Kết luận .............................................................................................. 81

Tổng kết chương .......................................................................................... 81
CHƯƠNG 4. PHÁT TRIỂN PHƯƠNG PHÁP DẪN ĐƯỜNG CHO RÔBỐT DỰA TRÊN THUẬT TOÁN NHẬN DẠNG MẶT ĐẤT ............................... 83
Giới thiệu chương ........................................................................................ 83
Phương pháp dẫn đường sử dụng nhận dạng mặt đất............................. 83
4.2.1. Mô hình hoạt động của rô-bốt trong nhà ............................................ 83
4.2.2.
4.2.3.
sâu

Xác định kích thước 2D của điểm sâu................................................ 84
Phương pháp dẫn đường AMSD đề xuất dựa trên khai thác dữ liệu độ
............................................................................................................ 85

Kết quả thực nghiệm phương pháp dẫn đường AMSD dựa trên nhận
dạng mặt đất và thảo luận .......................................................................................... 89
4.3.1. Kết quả thực nghiệm của phương pháp tránh vật cản cơ bản ............ 90
4.3.2. Kết quả thực nghiệm của phương pháp tránh vật cản cải thiện ......... 92

Điểm liền kề dưới

C

Phép biến đổi ảnh

d

Độ chênh lệch

dmax

Độ chênh lệch tối đa

dmin

Độ chênh lệch tối thiểu

f

Tiêu cự máy ảnh

FN

Bộ đếm các điểm đất đúng không được phát hiện

FP

Bộ đếm các điểm phi đất bị phát hiện sai.


Véc tơ pháp tuyến mặt đất

OL

Vị trí máy ảnh trái

OR

Vị trí máy ảnh phải

p

Điểm ảnh

P

Tập điểm ảnh

PL

Điểm phản chiếu của điểm p trên ảnh trái

PR

Điểm phản chiếu của điểm p trên ảnh phải

q

Ngưỡng phân biệt khối đất và phi đất


Điểm liền kề trên

TP

Bộ đếm các điểm đất đúng được phát hiện

w

Kích thước cửa sổ

XG

Tập hợp điểm có sẵn trên mặt đất

xL

Hoành độ trên ảnh trái

xR

Hoành độ trên ảnh phải

z

Độ sâu

vii


DANH MỤC CÁC CHỮ VIẾT TẮT


Giao diện lập trình ứng dụng

ARA*

Anytime Repairing A*

BFS

Best First Seaching

BP

Belief Propagation

Thuật toán sửa chữa bất cứ lúc
nào*
Thuận toán tìm kiếm tốt nhất đầu
tiên
Thuật toán Lan truyền tin cậy

CCD

Charge Coupled Device

Linh kiện tích điện kép

CMOS
DSM


GPS

Global Positioning System

Hệ thống định vị toàn cầu

HSAD

Hybrid SAD

SAD lai

HSBSR
HT

Hierarchical Shape-Based Surface Thuật toán tái tạo bề mặt dự trên
Reconstruction
hình dạng phân cấp
Hough Transform
Thuật toán Biến đổi Hough

ICP

Iterative Closest Point

Thuật toán điểm gần nhất lặp lại

LRF

Laser Range Finder


NGaF

Neighbor Grouping and Filter

NMOS

N Metal Oxide Semiconductor

Thuật toán Độ tương quan chéo
chuẩn
Thuật toán Tạo nhóm hàng xóm và
lọc
Bán dẫn ôxit kim loại loại N

PPDFDM Planar Patch Detection for Disparity Thuật toán Phát hiện mảnh phẳng
Maps
dùng bản đồ chênh lệch
PROSAC Progressive Sample Consensus
Đồng thuận mẫu lũy tiến
PSO

Thuật toán tối ưu đám hạt

Particle Swarm Optimization

Thuật toán Đồng thuận lấy mẫu
ngẫu nhiên
Thuật toán phát triển vùng



Scale-invariant Feature Transform

Biến đổi đặc trưng tỷ lệ bất biến

SLAM
SP1

Simultaneous Localization
Mapping
Service Pack 1

SSD

Sum of Squared Differences

SUFT
VDEMs
VGA
vLRF
RHT
SAD
SCS

And Đồng thời định vị trí và lập bản đồ
Gói dịch vụ 1

Thuật toán Tổng bình phương độ
sai lệch
Speeded-Up Robust Features

SLAM

Gói dịch vụ 1

ix


VDEMs
VGA

Vectorized Digital Elevation Model Mô hình nâng cao kỹ thuật số véctơ hóa
Video Graphics Array
Chuẩn mảng đồ họa video độ phân
giải 640x480

x


DANH MỤC CÁC BẢNG
Bảng 1.1. Sai số của phương pháp [47] ........................................................................... 7
Bảng 1.2. Thông số đánh giá kết quả thực nghiệm [7].................................................. 15
Bảng 1.3. Kết quả phát hiện mặt đường với các kịch bản khác [26] ............................ 21
Bảng 3.1. Phân loại điểm đất và điểm phi đất ............................................................... 59
Bảng 4.1. So sánh hiệu năng các phương pháp dẫn đường cho rô-bốt trong nhà ......... 97
Bảng 4.2. So sánh tỷ lệ điều hướng thành công ............................................................ 97

xi


DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ

Hình 2.11. So sánh trong thời gian xử lý được thực hiện bởi các phương pháp SAD
thông thường và phương pháp tăng cường SAD đề xuất. ............................................. 42
Hình 2.12. Sơ đồ khối của hệ thống máy ảnh thị giác nổi [78] ..................................... 43
xii


Hình 2.13. Nguyên lý tính độ sâu của điểm ảnh ........................................................... 43
Hình 2.14. Khái niệm điểm lân cận của điểm p ............................................................ 45
Hình 2.15. Sơ đồ khối hệ thống phát hiện mặt phẳng ................................................... 46
Hình 2.16. Minh họa dữ liệu trong thư viện Middlebury. ............................................. 47
Hình 2.17. Minh họa dữ liệu độ sâu môi trường thực tế và dữ liệu cải thiện ............... 47
Hình 2.18. Thuật toán Tạo vùng hàng xóm ................................................................... 49
Hình 2.19. Hệ thống thử nghiệm trích mặt phẳng ......................................................... 50
Hình 2.20. Kết quả của các ảnh kiểm tra trong thư viện Middlebury ........................... 51
Hình 2.21. Kết quả của các ảnh kiểm tra thu thập bởi máy ảnh RGB-D ...................... 52
Hình 2.22. So sánh số lượng mặt phẳng được phát hiện theo một số ngưỡng tối thiểu
min khác nhau với phương pháp FPDIDM [7] ............................................................. 52
Hình 2.23. Số lượng mặt phẳng được phát hiện theo các ngưỡng tối thiểu min khác nhau
áp dụng với bản đồ độ sâu từ máy ảnh RGB-D............................................................. 53
Hình 2.24. Kết quả của các phương pháp HSBSR [6], PPDFDM [53], FPDIDM [7] và
thuật toán đề xuất trên bản đồ chênh lệch St-Michel Jail của Toulouse ....................... 54
Hình 2.25. So sánh ba thông số đánh giá giữa các phương pháp HSBSR, PPDFDM,
FPDIDM và Phương pháp NGaF đề xuất trên bản đồ chênh lệch nhà thờ St-Michel Jail
ở Toulouse. .................................................................................................................... 55
Hình 3.1. Mô hình toán học xác định độ chênh lệch độ sâu ......................................... 58
Hình 3.2. Kiến trúc hệ thống nhận dạng mặt đất đề xuất .............................................. 60
Hình 3.3. Thuật toán Lọc và gom nhóm ........................................................................ 61
Hình 3.4. Thuật toán Tinh chỉnh vùng mặt đất ............................................................. 64
Hình 3.5. Các bản đồ gradient của hình ảnh trong thư viện Middlebury được thử nghiệm.
....................................................................................................................................... 66

Hình 4.5. Mô hình toán học cơ bản lựa chọn hướng di chuyển của rô-bốt ................... 86
Hình 4.6. Mô hình toán học cải tiến lựa chọn hướng di chuyển của rô-bốt .................. 88
Hình 4.7. Thuật toán điều hướng cải thiện dựa trên bản đồ độ sâu cho rô-bốt trong nhà
....................................................................................................................................... 89
Hình 4.8. Hệ thống xe rô-bốt thử nghiệm ..................................................................... 90
Hình 4.9. Kết quả thử nghiệm chiến thuật dẫn đường cơ bản ....................................... 91
Hình 4.10. Theo dõi vị trí rô-bốt theo chiến thuật điều hướng cơ bản .......................... 92
Hình 4.11. Kết quả thuật toán điều hướng cải tiến ........................................................ 95
Hình 4.12. Theo dõi vị trí rô-bốt theo chiến thuật điều hướng cải tiến ......................... 96

xiv


MỞ ĐẦU

1. Tính cấp thiết của luận án
Một xã hội phát triển được đánh giá theo nhiều khía cạnh. Một trong những yếu tố
quan trọng là khả năng hỗ trợ, bảo vệ, nâng cao chất lượng sống những cá nhân bị tổn
thương như người già, người khiếm thị. Theo báo cáo của Tổ chức Y tế Thế giới, trên
toàn cầu, ước tính có khoảng 1,3 tỷ người sống với một số dạng suy giảm thị lực. Có
188,5 triệu người bị suy giảm thị lực nhẹ, 217 triệu người bị suy giảm thị lực từ trung
bình đến nặng và 36 triệu người bị mù [1]. Liên quan đến tầm nhìn gần, 826 triệu người
sống trong tình trạng suy giảm thị lực gần [2]. Trên toàn cầu, các nguyên nhân hàng đầu
gây suy giảm thị lực là các tật khúc xạ và đục thủy tinh thể không được điều trị. Khoảng
80% của tất cả các suy giảm thị lực trên toàn cầu được coi là có thể tránh được. Phần
lớn những người bị suy giảm thị lực là trên 50 tuổi. Như vậy nhu cầu về các thiết bị hỗ
trợ cho điều hướng và định hướng là rất cao và tăng lên khi mức sống ngày càng cao.
Có rất nhiều công cụ đang được sử dụng như gậy dò đường hoặc sử dụng chó được huấn
luyện dẫn đường. Mặc dù các công cụ này rất phổ biến, nhưng chúng không thể cung
cấp cho người khiếm thị tất cả thông tin và tính năng để di chuyển an toàn. Nhờ những

khích có nhiều nhà khoa học, các nghiên cứu sinh, kỹ sư … tham gia bởi tính ứng dụng
thiết thực đến nhiều lĩnh vực trong đời sống xã hội. Mặc dù xử lý tín hiệu máy ảnh là
một khoa học ứng dụng đóng vai trò đặc biệt quan trọng cho sự phát triển của các hệ
thống giám sát, cứu hộ, hỗ trợ bệnh nhân người già và người khiếm thị. Nhưng do đặc
thù của lĩnh vực nghiên cứu là đòi hỏi có những kiến thức cơ bản về toán học và logic
vững vàng, nên có nhiều khó khăn đối với nhiều nhà nghiên cứu. Cho nên số lượng các
bài báo, các công trình khoa học có liên quan được công bố trên các tạp chí khoa học,
báo khoa học ở trong nước còn hạn chế. Ngoài nhóm nghiên cứu của Viện Điện tử Viễn thông, trường Đại học Bách Khoa Hà Nội, ở trong các trường đại học, các viện
khoa học vẫn có những nhóm nghiên cứu thực hiện các đề tài, dự án nghiên cứu khoa
học như Khoa Điện tử - Viễn thông, Trường đại học Công nghệ, Đại học Quốc Gia Hà
Nội, Học viện kỹ thuật quân sự, Khoa Điện tử - Viễn thông, Trường Đại học Bách Khoa
thành phố Hồ Chí Minh và một số trường đại học, viện nghiên cứu khác.
Các nghiên cứu hiện nay hứa hẹn sẽ giải quyết được vấn đề hiệu năng và tính chính
xác hệ thống, có tính ứng dụng cao trong tương lai. Nhưng riêng đối với những nghiên
cứu phát triển thuật toán xử lý tín hiệu máy ảnh ứng dụng trong hệ thống thị giác rô-bốt
dẫn đường trong nhà còn tiềm năng. Nguyên nhân một phần do điều kiện nghiên cứu
thực nghiệm còn nhiều hạn chế nên cho đến nay số lượng các công trình nghiên cứu liên
quan được công bố trong các tạp chí, hội thảo khoa học trong nước còn khá hạn chế.
Sau đây là một số phân tích môi trường đặc trưng môi trường hoạt động trong nhà
của xe rô-bốt. Bằng cách quan sát thực tế, tính chất chung của chúng là được xây dựng
là phẳng hoặc gồm các mảng phẳng lớn ghép lại với nhau. Các đồ đạc trong phòng được
xvi


sắp xếp và có thể thay đổi vị trí tùy ý bất kỳ lúc nào. Các đồ đạc bị xê dịch hoặc xáo
trộn hoặc đổ xuống sàn. Nên khó có thể sử dụng được bản đồ xây dựng sẵn có của tòa
nhà hoặc có thể chúng chưa được số hóa theo chuẩn của hệ xe rô-bốt. Vậy trường hợp
phổ quát xe rô-bốt làm việc môi trường trong nhà không biết trước. Một điều hiển nhiên
xe rô-bốt với cơ cấu chấp hành bánh xe chỉ có thể di chuyển trên mặt sàn hoặc gọi là
mặt đất. Vậy vấn đề dẫn đường có thể được giải quyết bằng cách chỉ ra cho hệ xe rô-bốt

đề tìm kiếm mặt phẳng dựa trên thuật toán chuyển đổi 3D Hough áp dụng cho đám mây
điểm 3D. Sự đóng góp xuất sắc chính là cải thiện sự phức tạp của phép chuyển đổi
Hough trong hệ tọa độ của không gian ba chiều. Các kết quả trải nghiệm được đánh giá
là tích cực lạc quan nhưng rõ ràng là mục đích đáp ứng thời gian thực vẫn chưa đạt được.
Các nội dung trong [5] [6] [7] mang đến một cách tiếp cận mới để phát hiện các mặt
phẳng bằng cách cải thiện thuật toán Đồng thuận lấy mẫu ngẫu nhiên (RANSAC). Ngoài
ra giải pháp phối hợp với giải thuật khác như Độ dài mô tả tối thiểu (MDL) để cải thiện
độ tin cậy của các kết quả được thử nghiệm. [8] [9] giải quyết bài toán hẹp phát hiện
mặt bàn với thuật toán đề xuất PROSAC bằng cách cải thiện RANSAC. Nhìn chung,
các công trình đã có một số kết quả đáng khích lệ cho cả hai loại dữ liệu tổng hợp và dữ
liệu thu thập trong thực tế. Phương pháp này có thể tránh việc phát hiện mặt phẳng sai
do độ phức tạp hình học cao của dữ liệu 3D. Nhưng sau đó sự phức tạp của dữ liệu của
cấu trúc là không được quan tâm thích đáng. Trong công trình [10], mặt phẳng ngang
được phát hiện từ các điểm đầu mối của hình ảnh trực quan hoặc phát hiện từ biên trong
dữ liệu điểm 3D. Tuy nhiên, những phương pháp này không thích hợp cho hầu hết các
loại cấu trúc xây dựng trên thực tế. Giải pháp tìm mặt phẳng được trình bày trong [11]
căn cứ trên giải pháp Tối ưu hạt Swarm (PSO) kèm với thuật toán Phát triển vùng (RG)
để trích chọn các mặt phẳng nhỏ. Song trong nhận định kết quả của giải pháp này thì có
nhiều ý kiến là cần phải thảo luận thêm về khả năng giảm chi phí tính toán và cải thiện
độ chính xác. Tất cả các phương pháp tiếp cận được đề cập ở trên đều lựa chọn dữ liệu
đầu vào 3D phức tạp.
Gần đây, các bài viết [12] [13] [14] công bố phát hiện bất kỳ loại bề mặt nào mà
không cần hiệu chuẩn máy ảnh bằng cách giả định máy ảnh gắn trên xe tự hành luôn
chuyển động tuyến tính. Các bề mặt phẳng được tham số hóa bằng cách chuyển chúng
thành không gian vận tốc c có dạng pa-ra-bôn [12]. Tác giả đề xuất phương pháp phát
hiện mặt phẳng mà khai thác ràng buộc đường cong vận tốc ISO sau khi ước tính luồng
quang học và bỏ phiếu cho các bộ tích lũy. Hàm vận tốc c phụ thuộc vào hai biến x và y
với mối quan hệ gốc bình phương vì vậy nó có độ phức tạp quá cao. Bản thảo [14] đưa
ra một số kết quả lạc quan và cần được phát triển hoàn thiện hơn nữa.
Các phương pháp ứng dụng thú vị [15] [16] có thể nhanh chóng phát hiện nhiều

chứa các đối tượng với đặc điểm đặc biệt. Trong các trường hợp khác, mặt phẳng đất
chứa các mẫu phức tạp, độ chính xác phát hiện bị giảm rõ rệt. Đối với ứng dụng thời
gian thực, các tác giả trong [22] đã trình bày thuật toán tìm mặt bằng mặt phẳng đất bằng
cách xử lý dữ liệu đầu vào bản đồ chênh lệch 2D. Tuy nhiên những hình ảnh đầu vào
được thu thập và thử nghiệm trong môi trường trong nhà với nền tảng đơn giản. Điều
này giới hạn khả năng giải quyết vấn đề trong môi trường thực tế phức tạp hơn nhiều
[23], [24]. Việc kết hợp cả hai thuật toán Hough và RANSAC cổ điển đã mang lại kết
quả xác định các đối tượng rất hiệu quả bằng cách thúc đẩy lợi thế của mỗi thuật toán
cho mỗi trường hợp cụ thể khác nhau [25]. Tuy nhiên, khối lượng phép toán trong
xix


chương trình là một vấn đề chưa được giải quyết. Quá trình áp dụng phép biến đổi ảnh
cho nguồn dữ liệu ảnh xám đơn giản từ một hoặc hai máy ảnh [26] [27] [28] nhưng điều
hiển nhiên là giải pháp này không thể trích xuất các thông tin chiều sâu của các đối
tượng vật cản trong khung hình nên làm cho việc điều hướng rô-bốt chắc chắn khó khăn.
Vì vậy, với các ứng dụng thời gian thực của rô-bốt di động trong khi di chuyển,
các phương pháp được đề cập có thể phải đối mặt với tải tính toán lên cao và yêu cầu
hoạt động trên một nền tảng phần cứng với cấu hình cao.
1.3. Dẫn đường cho rô-bốt trong nhà
Trong những năm gần đây, vấn đề điều hướng cho rô-bốt trong môi trường trong
nhà được quan tâm rất đặc biệt. Nhiều nhà nghiên cứu đã cố gắng sử dụng một cảm biến
mạnh mẽ mà có thể thu thập thông tin phong phú như một máy ảnh. Nhiều loại cảm biến
hình ảnh RGB-D đã được bán trên thị trường như Kinect của Microsoft hoặc Bumblebee
bởi FLIR Systems, Inc, v.v... Những sản phẩm này cho phép rất cải thiện mạnh mẽ cách
thức con người tương tác với thế giới xung quanh, tăng cường an toàn công cộng, tăng
hiệu quả năng lượng, và kích hoạt các cộng đồng giải trí lành mạnh [29].
Phương pháp tiếp cận đã được trình bày thuật toán Đồng thời định vị trí và lập bản
đồ (SLAM) sử dụng hệ thống máy ảnh RGB-D [30] [31] [32]. Những phương pháp ứng
dụng này được tối ưu hóa cho các công việc dẫn đường trong một phạm vi nhỏ như một

video độ sâu để sau đó sẽ đưa vào một mạng nơ-ron nhân tạo (ANN). Mạng lưới này
nhận ra các loại đường dẫn khác nhau trong môi trường bao gồm con đường phía trước,
con đường bên trái, con đường bên phải và nút giao thông. Tuy nhiên, kết quả kinh
nghiệm không phải là toàn diện vì vấn đề chuyển hướng chỉ thích hợp cho môi trường
trong nhà hạn chế. Sự đổi mới của [37] chỉ kết hợp được lập bản đồ và đào tạo mạng
nơ-ron để xây dựng được một hệ thống định vị trong nhà. Các đóng góp chính của [38]
phương pháp là áp dụng kết hợp thuật toán dự đoán một phần chiều sâu và thuật toán
lọc hạt. Cụ thể, ước lượng độ sâu của các điểm tiêu biểu bằng phép toán xấp xỉ độ sâu
mà không tính toán chiều sâu của tất cả các điểm trong hình ảnh. Tiếp theo, thuật toán
lọc hạt đảm bảo nhiễu được lọc ra tối đa trong quá trình dự đoán vị trí của rô-bốt. Vì
vậy, các kết quả được đánh giá là rất lạc quan. Bên cạnh đó cần giải quyết thời gian tính
toán cần phải giảm nhiều hơn nữa, trừ phi kích thước của các thiết lập hạt không phải là
linh hoạt.

2. Mục tiêu, đối tượng, phương pháp và phạm vi nghiên cứu
2.1. Mục tiêu nghiên cứu
Mục tiêu thứ nhất là tăng cường thuật toán tính toán bản đồ chênh lệch/độ sâu về
mặt thời gian, hỗ trợ cho hệ thống máy ảnh nổi cung cấp dữ liệu độ sâu theo thời gian
thực cho các ứng dụng khai thác dữ liệu sâu hơn.

xxi


Mục tiêu thứ hai là nghiên cứu và đề xuất thuật toán các thuật toán trích xuất mặt
phẳng dựa trên dữ liệu độ sâu, đáp ứng yêu cầu xử lý theo thời gian thực, hỗ trợ cho bài
toán tái tạo đối tượng 3D.
Mục tiêu thứ ba là tập trung nghiên cứu và đề xuất thuật toán nhận dạng hiệu quả
mặt đất từ dữ liệu bản đồ độ sâu, đáp ứng yêu cầu xử lý theo thời gian thực để hỗ trợ
giải quyết bài toán dẫn đường cho rô-bốt.
Mục tiêu thứ tư là nghiên cứu phương pháp dẫn đường cho rô-bốt áp dụng thuần

thuần túy dữ liệu thu nhận bởi hệ thống máy ảnh nổi hoặc RGB-D.
Xây dựng mô hình rô-bốt dẫn đường bằng hệ thống máy ảnh nổi hoặc RGB-D với
các thuật toán đã phát triển đối với môi trường hoạt động trong nhà chưa biết trước.

3. Ý nghĩa khoa học và những đóng góp của luận án
3.1. Ý nghĩa khoa học
Việc nghiên cứu các thuật toán xử lý video bản đồ độ sâu cung cấp bởi hệ thống
máy ảnh nổi hoặc RGB-D của đề tài mang ý nghĩa khoa học bao gồm cả hai khía cạnh
lý luận và thực tiễn.
3.1.1. Về lý luận

Góp phần phát triển cơ sở khoa học các thuật toán xử lý tín hiệu video độ sâu thông
qua xây dựng các phương pháp tính toán nhanh, chính xác cao cho bài toán dẫn đường
cho xe rô-bốt khảo sát hiện trường - một định hướng nghiên cứu mang tính thời sự.
Các kết quả nghiên cứu của đề tài dự kiến sẽ đóng góp cho sự phát triển của nền
tảng lý thuyết xử lý tín hiệu video độ sâu. Thúc đẩy giải quyết bài toán nhận dạng đối
tượng mặt đất hỗ trợ dẫn đường sử dụng thị giác máy tính cho rô-bốt di động hoạt động
trong môi trường động trong nhà.
3.1.2. Về mặt thực tiễn

Thuật toán được nghiên cứu và đề xuất trong luận án có thể làm cơ sở cho các nhà
sản xuất thiết bị rô-bốt, hệ thống giám sát quan sát cảnh báo 3D thông minh. Do vậy, đề
tài có tính thực tiễn cao. Thuật toán đề xuất có thể được ứng dụng vào trong thiết kế và
chế tạo các rô-bốt khảo sát hiện trường, cứu hộ phù hợp với điều kiện môi trường tại
Việt Nam.
3.2. Các đóng góp khoa học của luận án gồm:
Luận án đã thực hiện được các đóng góp khoa học chính sau đây:
xxiii



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status