ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
LƢU THỊ LIỄU
NGHIÊN CỨU PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH VÀ ỨNG
DỤNG NÂNG CAO CHẤT LƢỢNG ẢNH NHỊ PHÂN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội – Năm 2015
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
LƢU THỊ LIỄU
NGHIÊN CỨU PHÉP TOÁN HÌNH THÁI TRONG XỬ LÝ ẢNH VÀ ỨNG
DỤNG NÂNG CAO CHẤT LƢỢNG ẢNH NHỊ PHÂN
Ngành: Công nghệ thông tin
Chuyên ngành: Truyền dữ liệu và mạng máy tính
Mã số: Chuyên ngành đào tạo thí điểm
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS NGÔ QUỐC TẠO
Hà Nội – Năm 2015
LỜI MỞ ĐẦU ................................................................................................................5
CHƢƠNG 1 ....................................................................................................................6
TỔNG QUAN VỀ PHƢƠNG PHÁP NÂNG CAO CHẤT LƢỢNG ẢNH ..............6
1.1 Giới thiệu chung về xử lý ảnh……………………………………………………6
1.2. Một số vấn đề trong xử lý ảnh………………………………………………….8
1.2.1 Điểm ảnh (Picture Element) ...........................................................................8
1.2.2 Độ phân giải của ảnh ...................................................................................... 9
1.2.3 Mức xám của ảnh ............................................................................................ 9
1.2.4. Quan hệ giữa các điểm ảnh ...........................................................................9
1.2.5. Lược đồ mức xám (Histogram) ....................................................................10
1.2.6. Biểu diễn ảnh.................................................. Error! Bookmark not defined.
1.2.7. Biến đổi ảnh (Image Transform) ................... Error! Bookmark not defined.
1.2.8 Tăng cường ảnh – khôi phục ảnh .................... Error! Bookmark not defined.
1.2.9. Nhận dạng ảnh ............................................... Error! Bookmark not defined.
1.2.10. Các loại định dạng tập tin ảnh cơ bản ......... Error! Bookmark not defined.
1.2.11. Hiệu chỉnh gamma ....................................... Error! Bookmark not defined.
1.2.12. Phân vùng ảnh.............................................. Error! Bookmark not defined.
1.3. Nâng cao chất lƣợng ảnh sử dụng các toán tử
điểm…………………………..Error! Bookmark not defined.
1.3.1. Điều chỉnh độ tương phản .............................. Error! Bookmark not defined.
1.3.2.Phân ngưỡng nhị phân .................................... Error! Bookmark not defined.
1.3.3. Biến đổi âm bản ............................................. Error! Bookmark not defined.
1.3.4. Hiệu chỉnh ánh sáng trong ảnh ...................... Error! Bookmark not defined.
1.3.5. Đổi ảnh RGB sang ảnh grayscale .................. Error! Bookmark not defined.
1.4.
Nâng
cao
chất
lƣợng
ảnh
2.3.3.2. Phép đóng ảnh............................................. Error! Bookmark not defined.
2.4. Các thao tác trên ảnh xám Error! Bookmark not defined.
2.4.1. Phép co ........................................................... Error! Bookmark not defined.
2.4.2. Phép dãn......................................................... Error! Bookmark not defined.
2.4.3 Phép toán đóng mở ảnh .................................. Error! Bookmark not defined.
2.5. Phép toán hình thái Gradient (Morphology Gradient
Operator)……………Error! Bookmark not defined.
2.6. Một số tính chất của phép toán hình
thái……………………………………...Error! Bookmark not defined.
2.7. Một số thuật toán dựa trên phép toán hình
thái………………………………Error! Bookmark not defined.
2.7.1. Trích biên ( Boundary Extraction) ................. Error! Bookmark not defined.
2.7.2. Làm đầy (Region Filling) ............................... Error! Bookmark not defined.
2.7.3. Làm mảnh(Thinning)...................................... Error! Bookmark not defined.
2.7.4. Làm dày đối tượng trong ảnh – Thickening ... Error! Bookmark not defined.
2.7.5. Tìm khung xương (Skeletonization) ............... Error! Bookmark not defined.
CHƢƠNG 3 .................................................. ERROR! BOOKMARK NOT DEFINED.
ỨNG DỤNG NÂNG CAO CHẤT LƢỢNG ẢNH VĂN BẢN ...................... ERROR!
BOOKMARK NOT DEFINED.
3.1. Đặt vấn
đề………………………………………………………………………Error!
Bookmark not defined.
3.2. Khắc phục sự đứt nét cho các tài liệu scan đen –
trắng……………………….Error! Bookmark not defined.
3.3. Khắc phục ảnh văn bản không rõ
nét…………………………………………Error! Bookmark not defined.
3.4. Giới thiệu chƣơng
trình………………………………………………………...Error! Bookmark not
defined.
3.5. Thực
................................................................................... Error! Bookmark not defined.
Hình 2.7. Quá trình lọc đối tượng sử dụng phép co nhị phân và phép giãn nhị phân
................................................................................... Error! Bookmark not defined.
Hình 2.8. Ứng dụng của phép co ảnh dưới dạng số nhị phân. Error! Bookmark not
defined.
Hình 2.9. Quá trình thực hiệp phép mở ảnh. ............. Error! Bookmark not defined.
Hình 2.10. Quá trình thực hiện phép đóng ảnh. ........ Error! Bookmark not defined.
Hình 2.11. Ví dụ về phép toán co ảnh trên ảnh xám với phần tử cấu trúc không
phẳng. ........................................................................ Error! Bookmark not defined.
Hình 2.12. Ví dụ về phép toán dãn ảnh trên ảnh xám với phần tử cấu trúc không
phẳng.. ....................................................................... Error! Bookmark not defined.
Hình 2.13. Ví dụ quá trình thực hiện phép dãn ảnh xám ........ Error! Bookmark not
defined.
Hình 2.14. Ví dụ về phép toán hình thái Gradient .... Error! Bookmark not defined.
Hình 2.15. Quá trình tìm biên của đối tượng trên ảnh nhị phân. ... Error! Bookmark
not defined.
Hình 2.16. Ví dụ trích lọc biên của đối tượng........... Error! Bookmark not defined.
Hình 2.17. Quá trình làm đầy đối tượng trong ảnh. .. Error! Bookmark not defined.
Hình 2.18. Kết quả làm mỏng đối tượng................... Error! Bookmark not defined.
Hình 2.19. Quá trình làm mảnh đối tượng trong hình ảnh. .... Error! Bookmark not
defined.
Hình 2.20. Kết quả làm dày đối tượng ...................... Error! Bookmark not defined.
Hình 2.21. Quá trình thực hiện thuật toán tìm xương. ............ Error! Bookmark not
defined.
Hình 2.22. Ví dụ ảnh tìm xương của các đối tượng .. Error! Bookmark not defined.
Hình 3.1. Hình ảnh văn bản bị xuống cấp…………………………………..Error!
Bookmark not defined.
Hình 3.2. Văn bản bị đứt nét theo chiêu ngang ......... Error! Bookmark not defined.
Hình 3.3. Văn bản bị đứt nét theo chiều dọc ............. Error! Bookmark not defined.
Chƣơng 2. Phép toán hình thái học trên ảnh: Chương này trình bày các
phép co – giãn-đóng – mở ảnh trên ảnh nhị phân, ảnh đa cấp xám và các thuật toán
ứng dụng dựa trên các phép toán hình thái.
Chƣơng 3. Ứng dụng nâng cao chất lƣợng ảnh văn bản: Chương này trình
bày các kỹ thuật được sử dụng trong việc nâng cao chất lượng ảnh scan đen – trắ ng
của văn bản kém chấ t lươ ̣ng (phép đóng ảnh , hiê ̣u chỉnh gamma , phân ngưỡng nhi ̣
phân), đồ ng thời tiế n hành cài đă ̣t các phép toán hình thái học, cài đặt chức năng
nâng cao chất lượng ảnh văn bản scan đen – trắng; trình bày những hình ảnh thực
nghiệm của chương trình.
8
CHƢƠNG 1
TỔNG QUAN VỀ PHƢƠNG PHÁP NÂNG CAO CHẤT LƢỢNG ẢNH
1.1 Giới thiệu chung về xử lý ảnh
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh là một lĩnh vực của tin học
ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này
được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các chương trình. Xử
lý ảnh bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải hoặc mã hóa
các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
Thứ nhất, biến đổi ảnh và làm đẹp ảnh.
Thứ hai, tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội dung
của ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính
chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc(nhận dạng theo cấu trúc).
Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản, tăng cường và
khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh
gần giống với trạng thái gốc- trạng thái trước khi ảnh bị biến dạng.
c) Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu
diễn phân tích, nhận dạng ảnh trên từng vùng.
d) Biểu diễn và mô tả
Tìm các vùng đặc trưng điểm ảnh như biên ảnh (Boundary), vùng ảnh
(Region),….và biểu diễn lại thông qua các điểm ảnh đặc trưng.
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
10
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng
cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán
theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên
phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh
khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được
phân theo hai loại nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong
khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),
nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt
người…
f) Cơ sở tri thức (Knowledge Base)
Tiếp nhận và xử lý theo phương pháp trí tuệ con người.
1.2. Một số vấn đề trong xử lý ảnh
1.2.1 Điểm ảnh (Picture Element)
17” độ phân giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
1.2.3 Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh và độ xám
của nó. Dưới đây chúng ta xem xét một số khái niệm và thuật ngữ thường dùng
trong xử lý ảnh.
a) Định nghĩa: Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá
trị số tại điểm đó.
b) Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức
phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám:
Mức xám dùng 1byte biểu diễn: 28=256 mức, tức là từ 0 đến 255).
c) Ảnh xám: là ảnh mà các điểm ảnh có mức xám nằm trong khoảng từ 0 đến 255.
d) Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 21 mức
khác nhau. Mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.
e) Ảnh màu: ảnh tổ hợp từ ba màu cơ bản (Red, Blue, Green) để tạo nên thế giới
màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:
28*3=224≈ 16,7 triệu màu.
1.2.4. Quan hệ giữa các điểm ảnh
Lân cận của điểm ảnh
Giả sử có điểm ảnh p tại tọa độ (x, y), p có các lân câ ̣n gầ n nhấ t theo chiề u
ngang và dọc là : (x+1,y), (x-1,y), (x,y+1), (x,y-1). Tập hợp các điểm ảnh này được
12
gọi là lân cận 4 của p, ký hiệu N4(p). Mỗi điểm ảnh có khoảng cách đơn vị đến
(x,y), và nếu (x,y) nằm trên biên của ảnh thì lân cận của nó có thể nằm ngoài ảnh.
Các lân cận chéo của p có tọa độ: (x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1).
Tập lân cận chéo được ký hiệu NP(p).
Tập lân cận chéo cùng với lân cận 4 tạo thành lân cận 8 của p, ký hiệu N8(p).
(ii) q thuô ̣c NP(p)
1.2.5. Lược đồ mức xám (Histogram)
Lược đồ mức xám (có thể gọi là lược đồ xám hay biểu đồ tần suất) của một
ảnh là một hàm cung cấp tần suất xuất hiện của mỗi mức xám.
Lược đồ xám được biểu diễn trong hệ tọa độ vuông góc Oxy. Trong hệ tọa độ này,
trục hoành biểu diễn cho số mức xám từ 0-> N (N là số mức xám). Trục tung biểu
diễn số điểm ảnh cho một cho một mức xám (số điểm ảnh có cùng mức xám hay tỉ
lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh.
13
TÀI LIỆU THAM KHẢO
[1]. Đỗ Năng Toàn, Phạm Việt Bình - Giáo Trình Môn Học Xử Lý Ảnh, trường ĐH
thái nguyên, khoa CNTT - 2008.
[2] PGS.TS Nguyễn Quang Hoan – Giáo trình môn học xử lý ảnh, học viện công
nghệ bưu chính viễn thông, 2006.
[3] Ths. Hồ Đức Lĩnh - Khoa Công nghệ Thông tin – Đại học Đông Á: Bài viết “Xử
lý hình thái học trên ảnh và ứng dụng”.
[4] Trần Đức Toàn – Luận văn thạc sỹ “ Nghiên cứu một số kỹ thuật nâng cao chất
lượng ảnh nhị phân và ứng dụng”.
[5]. J.R.Paker, Algorithms for Image processing and Computer Vision. John Wiley
& Sons, Inc, 1997.
[6] J.Kittler and J.Illingworth, “Threshold selection based on a simple image
statistic” computer vision, graphics and image processing 30,125-147 (1985)
[7] Mingli Zhang, Reza Farrahi Moghaddam and Mohamed Cheriet “Degraded
Document Images Enhancement and Reconstruction Based on Non-local Sparse
Representation”
[8] Er. Jagroop Kaur- Dr. Rajiv Mahajan, Improved Degraded Document Image
Binarization Using Guided Image Filter, Dept of Computer Science &