Một số kỹ thuật xử lý ảnh và xây dựng chương trình mô phỏng với ảnh JPG, - Pdf 30



TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN


PHẠM THỊ NGỌC THƯ
MỘT SỐ KỸ THUẬT XỬ LÝ ẢNH VÀ
XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG

VỚI ẢNH .JPG, .BMP KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Khoa học máy tính TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN


PHẠM THỊ NGỌC THƯ
MỘT SỐ KỸ THUẬT XỬ LÝ ẢNH VÀ
XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG

VỚI ẢNH .JPG, .BMP KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Khoa học máy tính Người hướng dẫn khoa học
PGS. TS. LÊ HUY THẬP LỜI CAM ĐOAN

Tên em là: PHẠM THỊ NGỌC THƯ
Sinh viên lớp: K37 – CNTT, khoa Công nghệ Thông tin, trường Đại học sư
phạm Hà Nội 2.
Em xin cam đoan:
1. Đề tài: “Một số kỹ thuật xử lý ảnh và xây dựng chương trình mô phỏng
với ảnh .JPG, .BMP” là nghiên cứu của riêng em, dưới sự hướng dẫn
của thầy giáo PGS. TS. Lê Huy Thập.
2. Khóa luận hoàn toàn không sao chép của tác giả nào khác.
Nếu sai em xin hoàn toàn chịu trách nhiệm.
Hà Nội, tháng 05 năm 2014
Người cam đoan Phạm Thị Ngọc Thư
2.3.1. Khái niệm 29
2.3.2. Kỹ thuật phát hiện biên Gradient 30 2.3.3. Kỹ thuật Laplace 35
2.3.4. Kỹ thuật dò biên gián tiếp 36
CHƯƠNG 3 CÀI ĐẶT CHƯƠNG TRÌNH MÔ PHỎNG 38
3.1. Phát biểu bài toán 38
3.2. Thiết kế chương trình 38
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 46
TÀI LIỆU THAM KHẢO 47
PHỤ LỤC 48

Hình 3.9. Form thay đổi màu sắc 42
Hình 3.10. Form chức năng làm mịn ảnh 42
Hình 3.11. Form chức năng tìm biên ảnh theo Sobell, Prewitt, Kirsh 43
Hình 3.12. Form chức năng tìm biên ảnh theo horizontal và vertical 43
Hình 3.13. Form chức năng zoom ảnh 44
Hình 3.14. Form chức năng xoay ảnh 44
Hình 3.15. Form chức năng xoay ảnh theo hình tròn 45
Hình 3.16. Form chức năng biến dạng ảnh theo hình cầu lồi 45
Hình 3.17. Form chức năng biến dạng ảnh theo hình sóng nước 45

1

MỞ ĐẦU
1. Lý do chọn đề tài
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát
triển của nó rất nhanh. Hiện nay, trong các trường đại học, cao đẳng xử lý ảnh
đã trở thành một môn học chuyên ngành của sinh viên các ngành công nghệ
thông tin, viễn thông.
Xử lý nâng cao chất lượng ảnh là một vấn đề trọng tâm của môn học xử lý
ảnh đồng thời nó cũng là bước tiền xử lý cho việc nhận dạng, trích chọn thông
tin trong xử lý ảnh số. Điều này cũng có ý nghĩa quan trọng trong nhiều ứng
dụng thực tế như tăng độ nét của một bức ảnh, làm biến dạng bức ảnh đó…
Trên thế giới đã có rất nhiều công trình nghiên cứu tại nhiều quốc gia
từ năm 1920 đến nay về xử lý ảnh đã góp phần thúc đẩy tiến bộ trong lĩnh vực
này lớn mạnh không ngừng. Xử lý ảnh là một trong những mảng quan trọng
nhất trong kỹ thuật thị giác máy tính là tiền đề cho nhiều nghiên cứu thuộc
lĩnh vực này. Hai nhiệm vụ cơ bản của quá trình xử lý ảnh là nâng cao chất
lượng hình ảnh và xử lý số liệu, cung cấp cho các quá trình khác trong đó có
việc ứng dụng thị giác và điều khiển.

thuyết xử lý ảnh số. Hiện nay, xử lý ảnh là một lĩnh vực đang được các
chuyên gia nghiên cứu và phát triển.
Ý nghĩa thực tiễn: Xây dựng chương trình thử nghiệm một số kỹ thuật
xử lý ảnh nếu thành công sẽ góp một phần nhỏ trong việc xử lý hình ảnh với
những thao tác cơ bản như làm biến đổi màu ảnh, làm mịn ảnh, tìm biên ảnh
và biến dạng hình ảnh.
6. Phương pháp nghiên cứu
- Phương pháp nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của khóa luận và các biện pháp cần thiết để giải quyết
các vấn đề của khóa luận.

3 - Phương pháp chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình
phù hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng được yêu cầu
ngày càng cao của người sử dụng.
- Phương pháp thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được
nghiên cứu và kết quả đạt được qua những phương pháp trên.
7. Cấu trúc khóa luận
Ngoài phần lời cảm ơn, mở đầu, kết luận và hướng phát triển, tài liệu
tham khảo, khóa luận có những nội dung sau:
Chương 1: Tổng quan về xử lý ảnh - Chương này trình bày một số kiến
thức cơ bản về xử lý ảnh: Khái niệm xử lý ảnh, các ứng dụng, các bước cơ
bản trong xử lý ảnh và trình bày một số định dạng ảnh cơ bản.
Chương 2: Một số kỹ thuật xử lý ảnh - Trong chương này, khóa luận
trình bày một số kỹ thuật xử lý ảnh. Ảnh Xử lý ảnh
Ảnh
“tốt hơn

Kết luận
5 Hình 1.2. Các giai đoạn chính trong xử lý ảnh
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR), nhưng cũng có thể là tín hiệu số hóa (loại CCD – Charge Coupled
Device).
Ngoài ra, ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng
(sensor) hay ảnh, tranh được quét trên scanner.
Tiếp theo là quá trình số hóa (digitalize) để biến đổi tín hiệu tương tự
sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi chuyển

a) Điểm ảnh (pixel element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng.
Để xử lý bằng máy tính (số), ảnh cần phải được số hóa. Số hóa ảnh là sự biến
đổi gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị
trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó
được thiết lập sao cho mắt người không phân biệt được ranh giới giữa chúng.
Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là
Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
b) Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định
trên một ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao
cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách
thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân
bố theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic
Adaptor) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc *
200 điểm ảnh (320*200). Rõ ràng, cùng màn hình CGA 12 “ta nhận thấy mịn
hơn màn hình CGA 17’’ độ phân giải 320*200. Lý do: cùng một mật độ (độ
phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các
điểm) kém hơn.
c) Mức xám của ảnh (Gray level)
Là kết quả của sự biến đổi tương ứng một giá trị độ sáng của một điểm
ảnh với một giá trị nguyên dương. Thông thường nó xác định trong khoảng
[0…255]. Tùy thuộc vào giá trị xám mà mỗi điểm ảnh được biểu diễn trên 1,
4, 8, 24 hay 32 bit.
7

Chỉnh số mức xám là nhằm khắc phục tính không đồng đều của hệ
thống xử lý ảnh, thông thường có 2 hướng tiếp cận:

một trong các màu chính.
Mỗi pixel ảnh màu ký hiệu Px, được viết:


=
[
,,
]

(1.1)

Hình 1.4. Ví dụ về ảnh màu
e) Các mối quan hệ cơ bản giữa các điểm ảnh
+ Lân cận của một điểm ảnh
Một điểm ảnh p tại tọa độ (x,y) có các lân cận theo chiều ngang và
chiều dọc là: (x+1,y), (x-1,y), (x,y+1), (x,y-1).
Tập hợp các điểm ảnh trên được gọi là lân cận 4 của p, kí hiệu N4(p).
Mỗi điểm ảnh có khoảng cách đơn vị đến (x,y), và nếu (x,y) nằm trên biên
của ảnh thì lân cận của nó có thể nằm ngoài ảnh
Các lân cận chéo của p có tọa độ: (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-
1,y-1)
9

Tập lân cận chéo được ký hiệu ND(p).
Tập lân cận chéo cùng với lân cận 4 tạo thành lân cân 8 của p, ký hiệu
N8(p).


Lược đồ mức xám của ảnh là một hàm cung cấp tần suất xuất hiện của
mỗi mức xám trong ảnh. Lược đồ mức xám được biểu diễn trong hệ tọa độ
Decac xOy, trong đó Ox biểu diễn các mức xám của ảnh (256 mức trong
10

trường hợp chúng ta xét), Oy biểu diễn số điểm ảnh cho một mức xám (số
điểm ảnh có cùng mức xám).
Lược đồ mức xám cung cấp rất nhiều thông tin về sự phân bố mức xám
của ảnh. Theo thuật ngữ của xử lý ảnh gọi là tính động của ảnh, tính động của
ảnh cho phép phân tích một khoảng nào đó phân bố phần lớn các mức xám
của ảnh: ảnh rất sáng hay rất đậm. Nếu ảnh sáng, lược đồ xám nằm bên phải
(mức xám cao), còn ảnh đậm thì lược đồ xám nằm bên trái (mức xám thấp).
1.2.2. Biểu diễn ảnh
Ảnh sau khi số hóa sẽ được lưu vào bộ nhớ, hoặc chuyển sang các khâu
tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô, đòi hỏi dung
lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng dụng và công
nghệ. Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại (hay đơn giản
là mã hóa) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh (Image
Features) như: biên ảnh (Bouundary), vùng ảnh (Region). Một số phương
pháp biểu diễn thường dùng.
+ Biểu diễn bằng mã chạy (Run-Length Code).
+ Biểu diễn bằng mã xích (Chanine-Code).
+ Biểu diễn bằng mã tứ phân (Quad-Tree Code).
a) Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh
nhị phân. Một vùng ảnh R có thể mã hóa đơn giản nhờ một ma trận nhị phân:

(
,
)

đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích
gồm các đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hóa
theo số thập phân hoặc số nhị phân thành mã của hướng. Hình 1.7. Minh họa biểu diễn bằng Mã xích.
Theo hình 1.7 thấy được hướng các điểm biên và mã tương ứng là:
A11070110764545432
c) Biểu diễn bằng mã tứ phân
Theo phương pháp mã tứ phân, một vùng của ảnh coi như bao kín bởi
một hình chữ nhật. Vùng này được chia làm 4 vùng con. Nếu vùng con gồm
toàn điểm đen (1) hay toàn điểm trắng (0) thì không cần chia tiếp. Trong
trường hợp ngược lại, vùng con gồm cả đen và trắng gọi là vùng xám lại tiếp
tục được chia làm 4 vùng con tiếp. Quá trình chia dừng lại khi không thể chia
tiếp được nữa, có nghĩa là vùng con chỉ chứa thuần nhất điểm đen hay trắng.
Như vậy, cây biểu diễn gồm một chuỗi các kí hiệu b (black), w (white) và g
12

(grey) kèm theo ký hiệu mã hóa 4 vùng con. Biểu diễn theo phương pháp này
ưu việt hơn so với các phương pháp trên, nhất là so với mã loạt dài. Tuy
nhiên, để tính toán số đo các hình như chu vi, momen là khá khó.
1.2.3. Tăng cường ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Tăng
cường ảnh nhằm hoàn thiện các đặc tính của ảnh như:
+ Lọc nhiễu, hay làm trơn ảnh.
+ Tăng độ tương phản, điều chỉnh mức xám của ảnh.
+ Làm nổi biên ảnh.

này có thể được trích chọn thông qua ảnh biên. Để thu được ảnh biên ta có thể
sử dụng toán tử gradient, toán tử la bàn, toán tử Laplace….
Việc trích chọn thông qua các đặc điểm giúp cho việc nhận dạng các
đối tượng ảnh chính xác, với tốc độ tính toán cao và giảm thiểu dung lượng
lưu trữ.
1.2.6. Nhận dạng ảnh
Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo
một mô hình nào đó và gán chúng một tên (gán cho đối tượng một tên gọi, tức
là một dạng) dựa theo những quy luật và mẫu chuẩn.
Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được phân
theo hai loại nhận dạng ảnh cơ bản:
+ Nhận dạng theo tham số.
+ Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,
nhận dạng mặt người…
Ngoài ra, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng
nơron đang được áp dụng và cho kết quả khả quan.
14

1.2.7. Nén ảnh
Nén ảnh là kỹ thuật nhằm giảm thiểu không gian lưu trữ của ảnh, nén
ảnh thường được tiến hành theo cả hai khuynh hướng là nén có bảo toàn và
không bảo toàn thông tin.
Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả
năng phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận
cơ bản trong nén ảnh:
+ Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất
xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa

Số liệu ảnh được mã hóa bởi kiểu mã hóa chỉ ra trong
phần Header

Bảng màu
Bảng màu không nhất thiết phải có, ví dụ khi ảnh là đen
trắng.
Nếu có, bảng màu cho biết số màu dùng trong ảnh và
bảng màu được sử dụng để hiển thị màu của ảnh.

Trong quá trình xử lý ảnh, đầu tiên phải tiến hành đọc tệp ảnh và
chuyển vào bộ nhớ của máy tính dưới dạng ma trận số liệu ảnh. Khi lưu trữ
dưới dạng tệp, ảnh là một khối gồm một số các byte. Để đọc đúng tệp ảnh ta
cần hiểu ý nghĩa các phần trong cấu trúc của tệp ảnh như đã nêu trên. Trước
tiên, ta cần đọc phần mào đầu để lấy các thông tin chung và thông tin điều
khiển. Việc đọc này sẽ dừng ngay khi ta không gặp được chữ ký (Chữ ký ở
đây thường được hiểu là một mã chỉ ra định dạng ảnh và đời (version) của nó)
mong muốn. Dựa vào thông tin điều khiển, ta xác đinh được vị trí bảng màu
và đọc nó vào bộ nhớ. Cuối cùng, ta đọc phần dữ liệu nén.
Sau khi đọc xong các khối dữ liệu ảnh vào bộ nhớ ta tiến hành nén dữ
liệu ảnh. Căn cứ vào phương pháp nén chỉ ra trong phần Header ta giải mã
được ảnh. Cuối cùng là khâu hiện ảnh. Dựa vào số liệu ảnh đã giải nén, vị trí
và kích thước ảnh, cùng sự trợ giúp của bảng màu ảnh được hiện lên trên màn
hình.
1.3.1. Ảnh BMP (Bitmap)
Trong đồ họa máy vi tính BMP là một định dạng tập tin hình ảnh khá
phổ biến. Các tập tin đồ họa lưu dưới dạng BMP thường có đuôi là .BMP
hoặc .DIB (Device Independent Bitmap). Nếu ta hình dung trong một tệp ảnh
16

xếp liên tiếp các byte từ đầu đến cuối và dồn chúng vào trong một hộp chữ

Data of image
54 bytes
Số màu x 4 (byte)
256 màu: 1 byte / 1 điểm ảnh
16 màu: 1 byte / 2 điểm ảnh
2 màu: 1 byte / 8 điểm ảnh
17

Header của tệp PCX có kích thước cố định gồm 128 byte và được phân bố
như sau:
+ 1 byte: Chỉ ra kiểu định dạng, nếu là kiểu PCX/PCC nó luôn có giá trị là
0Ah.
+ 1 byte: Chỉ ra version sử dụng để nén ảnh, có thể có các giá trị sau:
0: Version 2.5
2: Version 2.8 với bảng màu
3: Version 2.8 hay 3.0 không có bảng màu
5: Version 3.0 có bảng màu
+ 1 byte: Chỉ ra phương pháp mã hoá. Nếu là 0 thì mã hoá theo phương
pháp BYTE PACKED ngược lại là phương pháp RLE.
+ 1 byte: Số bit cho một điểm ảnh plane
+ 1 word: Tọa độ góc trái trên của ảnh. Với kiểu PCX nó có giá trị là
(0,0); còn PCC thì khác (0,0).
+ 1 word: Toạ độ góc phải dưới
+ 1 word: Kích thước bề rộng và bề cao ảnh
+ 1 word: Số điểm ảnh
+ 1 word: Độ phân giải màn hình
+ 48 byte: Chia thành 16 nhóm, mỗi nhóm 3 byte. Mỗi nhóm này chứa
thông tin về một thanh ghi màu. Như vậy ta có 16 thanh ghi màu.
+ 1 byte: Không dùng đến và luôn đặt là 0
+1 byte: Số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4,

Trích đoạn Khái niệm Kỹ thuật Laplace Thiết kế chương trình
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status