Phương pháp nhận dạng vật thể dựa trên thuật toán kth-law ECP-SDF - Pdf 98

LỜI GIỚI THIỆU
Trong những năm gần đây, xử lý hình ảnh (image processing) đã đạt được nhiều
thành tựu và tiến bộ vượt bậc. Trong đó, nhận dạng và phân loại hình ảnh là một trong
những lĩnh vực được theo đuổi một cách tích cực nhất. Ý tưởng cốt lõi của việc nhận
dạng và phân loại hình ảnh là phân tích ảnh từ các dữ liệu thu được bởi các cảm biến
hình ảnh như camera, Webcam,… Nhờ các hệ thống xử lý ảnh, con người đã giảm được
khối lượng công việc cũng như tăng sự chính xác trong việc đưa ra các quyết định liên
quan đến xử lý hình ảnh trên nhiều lĩnh vực: quân sự và quốc phòng, các hệ thống kỹ
nghệ hoá sinh, giải phẫu, các hệ thống giao thông thông minh, robotics, các hệ thống an
ninh…
Nhận dạng và phân tích ảnh là một lĩnh vực liên ngành. Để thực hiện tốt công việc
nhận dạng và phân tích này, đòi hỏi người nghiên cứu phải am hiểu nhiều lĩnh vực trong
đó đặc biệt là các lĩnh vực liên quan tới cảm biến, các hệ thống xử lý ảnh, các giải thuật
xử lý hình ảnh/tín hiệu, VLSI, phần cứng và phần mềm, các hệ thống tích hợp…
Mục đích của luận văn này là trình bầy một phương pháp nhận dạng vật thể dựa
trên thuật toán kth-law ECP-SDF. Theo đó, tôi sẽ lần lượt trình bày về cơ sở lý thuyết
của việc xử lý ảnh, nhận dạng vật thể,chương trình MATLAB với các hộp công cụ về
khảo sát và xử lý ảnh(image acquisition toolbox và image processing toolbox), các giải
thuật liên quan: FFT, Kth-law ECP-SDF và chương trình mô phỏng nhận dạng vật bất
biến theo tỉ lệ.
Bởi thời gian hạn hẹp cũng và nhiều hạn chế về kiến thức trong lĩnh vực hết sức
mới mẻ này, tôi mong luận văn này sẽ trình bày một sự hiểu biết tương đối về xử lý ảnh
nói chung và nhận dạng vật thể nói riêng. Đồng thời, hy vọng rằng trong một tương lai
không xa sẽ có điều kiện ứng dụng những nghiên cứu đã đạt được trong luận văn này
vào thực tế.
Trong quá trình hoàn thành luận văn, tôi xin đặc biệt cảm ơn tới Ths Nguyễn thị
Thanh Vân và PGS.TS Trần Quanh Vinh. Đồng thời tôi cũng xin cảm ơn tất cả các thầy
cô giáo đã dạy tôi trong suốt 4 năm học qua tại trường Đại học Công Nghệ, Đại học
Quốc gia Hà Nội.
CHƯƠNG 1
MỞ ĐẦU

khái niệm thường gặp và các giai đoạn trong xử lý ảnh nói chung và nhận dạng vật thể
nói riêng.
Chương 3 Nhận dạng vật bằng xử lý ảnh, tác giả giới thiệu về các phương pháp
chung nhất trong nhận dạng vật thể qua việc sử dụng các hàm: tương quan tuyến tính và
tương quan phi tuyến. Đồng thời trình bày về lý thuyết của biến đổi Fourier rời
rạc(DFT), biến đổi Fourier nhan (FFT) cũng như thuật toán của bộ lọc tổng hợp ECP-
SDF bậc k.
Chương 4 Xử lý ảnh với Matlab, tác giả giới thiệu về chương trình matlab và ứng
dụng Matlab trong xử lý ảnh. Đồng thời tác giả đã giới thiệu về các hộp công cụ xử lý
ảnh (image processing toolbox) và thu nhận ảnh (image acquisition toolbox) cùng các
lệnh thường dùng.
Chương 5 Thực nghiệm và kết quả, tác giả trình bày về các bộ lọc đơn, bộ lọc tổng
hợp ECP-SDF bậc k và thí nghiệm áp dụng các bộ lọc trong nhận dạng vật. Đồng thời,
trong chương này tác giả cũng đưa ra các ý kiến đánh giá về các khó khăn, giải pháp
khắc phục và các ứng dụng có thể dùng tới bộ lọc tổng hợp ECP-SDF bậc k.
CHƯƠNG 2
TỔNG QUAN VỀ XỬ LÝ ẢNH - NHẬN DẠNG VẬT THỂ
2.1 Xử lý ảnh (số) và các khái niệm liên quan:
2.1.1 Xử lý ảnh (số)
Xử lý ảnh (số) là một dạng của xử lý tín hiệu trong đó đầu vào là một hình ảnh
(các bức ảnh, các khung hình) và đầu ra của quá trình xử lý ảnh có thể là một hình ảnh
khác hoặc là một tập chứa các tính chất hoặc tham số liên quan tới hình ảnh đó. Phần
lớn các kỹ thuật xử lý ảnh thì thường qui về việc xử lý hình ảnh như là một tín hiệu 2
chiều rồi sử dụng các kỹ thuật xử lý tín hiệu để xử lý nó.
2.1.2 Các khái nịêm liên quan:
* Điểm ảnh(Picture Element)
Gốc của ảnh(ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý bằng
máy tính(số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng một ảnh
liên tục thành một tập điểm phù hợp với ảnh thật về vị trí(không gian) và độ sáng (mức
xám). Khoảng cách giữa điểm ảnh đó được thiết lập sao cho mắt người không phân biệt

giới màu được tạo nên từ 3 màu cơ bản: đỏ(red), lục(blue) và lơ(green)). Do đó có 2
8*3
=2
24
=16,7 triệu màu.
* Biểu diễn ảnh
Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là pixel.
Do đó ta có thể biểu diễn một ảnh bởi một hàm 2 biến chứac thông tin. Các mô hình
biểu diễn ảnh cho ta một mô tả lô gic hay định lượng các tính chất của hàm này. Chất
lượng ảnh hoặc tính hiệu quả của các kỹ thuật xử lý phụ thuộc vào nhiều yếu tố như: độ
phân giảI, nhiễu,...
Để xử lý được ảnh, thì ảnh đó phảI được lấy mẫu (sample) rôI lượng tử hoá
(quantization). Tức là đầu tiên chuyển từ ảnh tương tự sang ảnh số sau đó lưu giá trị của
từng điểm ảnh với một số hữu hạn các mức xám.
* Tăng cường và khôi phục ảnh
Tăng cường ảnh (image enhancement):
Khi ảnh được chuyển từ dạng này sang dạng khác bởi các quá trình như: truyền
ảnh, quét ảnh,… thì ảnh nhận được thường có chất lượng thấp hơn so với ảnh ban đầu.
Để giúp người ta có thể quan sát bức ảnh một cách chính xác hơn thì đòi hỏi phải có
biện pháp để nâng cao chất lượng ảnh. Qúa trình này được gọi là tăng cường ảnh (image
enhancement).
Tăng cường ảnh giúp loại bỏ các suy giảm (degradation) gây ra bởi hệ thống xử lý
hoặc kênh xử lý ảnh. Ngày nay, nhu cầu phát triển các hệ thống tự động cho việc xử lý
hình ảnh ngày càng phát triển, kéo theo nó là sự cần thiết trong việc loại bỏ sai số cũng
như các yếu tố nhiễu trong qúa trình xử lý. Do đó, tăng cường ảnh có thể được coi như
một tập hợp các kỹ thuật để nâng cao chất lượng hình ảnh đồng thời tập hợp này cũng
được ding để nâng cao độ chính xác trong quá trình tìm kiếm tự động và chuyển đổi
dạng của bức ảnh.
Các kỹ thuật tăng cường ảnh có thể kể đến: kỹ thuật tương phản (contrast), ánh xạ
(mapping- gán mỗi mức xám từ ảnh gốc với một mức xám khác của ảnh đã được biên

trình phân tích ảnh gồm các công đoạn: trích chọn các đặc tính (feature extraction), phân
đoạn ảnh (segmentation) thành các phần tử. Tuỳ theo mục đích của việc xử lý, các giai
đoạn tiếp theo của quá trình phân tích ảnh có thể là nhận dạng ảnh (phân thành các lớp
có miêu tả) hay là giảI thích và miêu tả ảnh. Hình 1. mô tả tóm lược các bước của quá
trình phân tích ảnh:
Hình vẽ trang 115
Hình 1. Các bước trong phân tích ảnh
Phân tích ảnh thường dựa trên việc phân tích các đặc trưng của ảnh: mật độ xám,
phân bố xác suất, phân bố không gian, biên ảnh,…
2.1.3.Nhận dạng và phân loại ảnh (recognition and classification of image
partterns)
* Nhận dạng ảnh (recognition of image partterns):
Khi một bức ảnh đã được phân đoạn, nhiệm vụ tiếp theo là nhận dạng vật thể hoặc
vùng đã được phân đoạn. Mỗi một vật thể là một thành phần ở trong ảnh và các giá trị
ảnh đầu ra của
quá trình tiền XL
Trích chọn
đặc tính
Phân
đoạn
Phân
loại
GiảI thích
đo được là các đặc tính của thành phần đó. Một tập các vật thể cùng có các đặc tính
giống nhau được gọi là một ‘lớp vật thể’(pattern class).
Theo đó có thể định nghĩa, nhận dạng là quá trình phân loại các đối tượng được
biểu diễn theo một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tượng
một tên gọi) dựa theo những quy luật và các mẫu chuẩn.
Sự nhận dạng ảnh thường dựa trên nhiều tính chất của vật và với mỗi tính chất đều
có các kỹ thuật nhận dạng khác nhau. VD: Mỗi chữ cáI trong tiếng Anh đều là một tập

trong thời gian lấy mẫu của phân loại có giám sát được coi như các biến Guass.
Các giải thuật không cần giám sát thường được sử dụng trong các bộ phân loại
theo khoảng cách nhỏ nhất (minimum distance classifer) và bộ phân loại tương đồng lớn
nhất (maximum likelihood classifier).
Ngược lại, một số thông số không được quan tâm trong phương pháp phân loại co
giám sát không cần tham số. Một số kỹ thuật của loại này là: K điểm lân cận gần nhất
(K-nearest neighbors), cửa sổ Parzen (Parzen window)…
Đối với các phương pháp phân loại không cần giám sát, bộ phân loại sẽ chia toàn
bộ tập thông tin dựa trên một số tiêu chuẩn tương đồng. Điều này cho kết quả là một tập
các thành phần trong đó mỗi thành phần thuộc về một lớp cụ thể nào đó.
CHƯƠNG 3
Vật cần Kết quả
kiểm tra đã phân
loại
Vật mẫu
Trích chọn
đặc tính
Trích chọn
đặc tính
Thu nhận
thông tin
Bộ phân loại
NHẬN DẠNG VẬT BẰNG XỬ LÝ ẢNH
3.1.Tương quan tuyến tính và tương quan phi tuyến
Một đại lượng tương quan cho phép tính tóa mức độ giống nhau giữa 2 vật. Biểu
thức toán học thể hiện sự tương quan giữa 2 hàm số s(x,y) và r(x,y) được định nghĩa
bởi:
( ) ( ){ ( ) }
yxryxTFyxc ,,,
*

Các hàm tương quan được mô tả bởi phương trình(3.1.1) cú rất nhiều hạn chế khi
cú thờm cỏc thành phần nhiễu nền. Thêm vào đó, các hàm tương quan này không còn
chính xác khi bức ảnh bị ‘méo’ do tỉ lệ thay đổi, vật bị di chuyển hay điều kiện ánh sáng
không ổn định. Áp dụng các kỹ thuật lọc trong không gian khác nhau trước khi thực
hiện biến hổi Fourier trong miền tần số cho phép khắc phục những vấn đề này. Ví dụ:
việc nhận dạng các vật bị ảnh hưởng bởi các biến đổi tỉ lệ cũng như góc quay là hoàn
toàn có thể thực hiện.
Một toán tử phi tuyến tác động đến các biến đổi Fourier của bức ánh và mẫu tham
chiếu được gọi là một hàm tương quan phi tuyến. Hàm tương quan phi tuyến thường
được sử dụng do các đặc tính ưu việt của nó so với hàm tương quan tuyến tính trên
nhiều khía cạnh như khử nhiễu, khả năng phân biệt... Với các bộ xử lý bậc k, toán tử phi
tuyến được áp dụng một cách đối xứng với bức ảnh cũng nhuew với biến đổi Fourier
tham chiếu:






=
^
exp||)sgn()(
^^^
f
k
ifffg
φ
, k≤1 (4.1.3)
Tham số k kiểm soát khả năng của hàm phi tuyến được áp dụng. VD: với k=1
tương ứng với một kỹ thuật lọc tuyến tính; với k=0 tương ứng với một kỹ thuật phi

Thông tin trong bộ lọc tổng hợp thường chứa các cách nhỡn khỏc nhau đối với đối
tượng ở trong các điều kiện khác nhau (điều kiện về góc nhỡn, tỉ lệ tương quan, độ
chói…) Việc tổng hợp tất cả những thông tin này trong một bộ lọc tổng hợp được thực
hiện trong một điều kiện với các giới hạn nhất định.
Ưu điểm lớn nhất của việc dung các bộ lọc tổng hợp so với các bộ lọc thông dải là
việc tiết kiệm được thời gian trong quá trỡnh xử lý. Chỉ với một phép tương quan đơn
giản có thể so sánh bức ảnh của đối tượng với tất cả các bức ảnh trong tập ảnh tham
chiếu. Mặc dù vậy, các bộ lọc tổng hợp thường thiếu tính chính xác và khả năng phân
biệt trong nhận dạng. Số lượng bức ảnh mẫu được dung để tham chiếu trong bộ lọc tổng
hợp được giới hạn nhằm đưa lại kết quả xử lý tốt nhất.
Trong khuôn khổ luận văn này, các bộ lọc phi tuyến sử dụng mặt phẳng Fourier
được sử dụng như các bộ lọc phi tuyến tổng hợp. Các kết quả thí nghiệm đó cho thấy
cỏc bộ lọc phi tuyến trên mặt phẳng Fourier có thể thực thi tốt công việc ngay cả trong
trường hợp có nhiều loại nhiễu khác nhau. Hàm ECP-SDF bậc k đó được sử dụng và
phát triển trong nhiều ứng dụng thực tế và đó đưa lại những kết quả đáng tin cậy. Vì
vậy, tụi xin phộp được sử dụng kết quả của thuật toán này đưa vào chương trình xử lý
ảnh của mạch nhằm đưa ra một giải pháp cho công việc xử lý ảnh.
3.3 Thuật toán Kth_law ECP-SDF (equal-correlation-peak synthetic
discriminant function) tạm dịch là hàm phân biệt và tổng hợp ảnh tuân theo tỉ lệ
tương quan.
Đặt s
1
(x,y),s
2
(x,y),...,s
N
(x,y) để biểu diễn cho N bức ảnh được chọn. Đặt P là tổng
số pixel của mỗi bức ảnh. Thay cho một ma trận biểu diễn một bức ảnh ta sử dụng một
khái niệm vector cú trật tự lexico*. Mỗi vector cột gồm p phần tử đại diện cho mỗi bức
ảnh bằng cách tái sắp xếp các hàng trong ma trận. Các phần tử của vector được sắp xếp









=
(3.3.2)
ký hiệu ^ biểu diễn cho biến đổi Fourier. Khi đó bộ lọc phi tuyến
tổng hợp h đạt được bằng cách thay
^
S
ở

(3.3.2) bởi
^
k
S
. Với
^
k
S
là một ma trận phi
tuyến đối với mỗi phần tử. Toán tử tuyến tính biểu diễn cho phần tử của hàng thứ r và
cột thứ l của ma trận
^
k
S



=
(3.3.3)
3.4 BIẾN ĐỔI FOURIER RỜI RẠC
Việc phân tích tín hiệu rời rạc theo thời gian trong miền tần số thường được thực
hiện rất hiệu quả và tiện lợi bằng bộ vi xử lý tín hiệu số. Bộ vi xử lý này có thể là máy
tính được sử dụng cho các mục đích chung hoặc là một thiết bị số chuyên dụng. Để thực
hiện việc phân tích này, tín hiệu rời rạc theo thời gian {x(n} cần được chuyển từ miền
thời gian sang miền tần số tương ứng thông qua biến đổi Fourier X (ω) của dãy. Tuy
vậy, do X (ω) là hàm liên tục của biến tần số nên có thể thấy việc xử lý bằng máy tính
của cách biểu diễn này là không thuận tiện.
Để tránh nhược điểm nêu trên có thể đưa ra một cách biểu diễn khác của {x(n} –
biểu diễn thông qua việc lấy mẫu phổ X (ω) của tín hiệu. Như vậy, từ biểu diễn của tín
hiệu trong miền tần số liên tục ta đã đưa đến biến đổi Fourier rời rạc (DFT). Biến đổi
này là một công cụ rất hiệu quả trong việc phân tích các tín hiệu rời rạc theo thời gian.
3.4.1. Lấy mẫu trong miền tần số và biến đổi Fourier rời rạc
Trước khi nghiên cứu DFT, ta hãy xét việc lấy mẫu của biến đổi Fourier đổi với
dãy tín hiệu rời rạc theo thời gian không tuần hoàn và qua đây có thể thiết lập được quan
hệ giữa biến đổi Fourier đã được lấy mẫu và DFT.
* Lấy mẫu trong miền tần số và khôi phục lại tín hiệu rời rạc theo thời
gian
Chúng ta đã biết rằng mọi tín hiệu không tuần hoàn có năng lượng hữu hạn đều
có phổ liên tục. Hãy xét một tín hiệu không tuần hoàn rời rạc theo thời gian x (n) với
biến đổi Fourier:
X (ω) =
∑
∞
∞−
− nj

, k = 0, 1, …, N-1 (3.4.2)
và đây chính là n mẫu được lấy của X (ω)
Ta hãy chia tổng trong (3.4.2) thành một số lượng vô hạn các tổng, trong đó mỗi
tổng có chứa N phần tử. Như vậy công thức (3.4.2) có thể được viết thành:
∑ ∑
−
=
−
=
−−
++=






1 1
0
/2/2
)()(...
2
Nn
N
n
NknjNknj
enxenxk
N
X
ππ






−=






1
0
/2
)(
2
N
n
Nknj
l
elNnxk
N
X
π
π
(3.4.3)
với k = 0, 1, 2, …, N-1.
Tín hiệu:
∑

−
=
1
0
/2
)(
1
N
n
Nknj
pk
enx
N
c
π
, k = 0, 1, …, N-1 (3.4.6)
Bằng cách so sánh (3.4.3) với (3.4.6) ta sẽ có:






= k
N
X
N
c
k
π

Quan hệ được đưa ra bởi (3.4.8) chính là công thức cho phép khôi phục lại tín
hiệu tuần hoàn x
p
(n) từ các mẫu của phổ X (ω). Quan hệ này, tuy vậy vẫn không đảm

Trích đoạn Thuật toán:

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Phương pháp nhận dạng vật thể dựa trên thuật toán kth-law ECP-SDF - Pdf 98

Tài liệu, ebook tham khảo khác

Học thêm