Tìm hiểu phương pháp phân form tài liệu - pdf 28

Download miễn phí Đồ án Tìm hiểu phương pháp phân form tài liệu

MỤC LỤC
LỜI CẢM ƠN 1
LỜI MỞ ĐẦU 3
CHƯƠNG 1 - Các vấn đề cơ bản trong xử lý ảnh 6
1.1 Tổng quan về một hệ thống xử lý ảnh 6
1.2 Các vấn đề cơ bản trong xử lý ảnh 7
1.3 Thu nhận ảnh 9
1.4 Các kỹ thuật xử lý ảnh cơ bản 12
CHƯƠNG 2 - Biểu mẫu động 19
2.1 Hệ thống xử lý biểu mẫu động 19
2.2 Các thuật toán xử lý ảnh áp dụng trong xử lý biểu mẫu động 27
2.3 Thực nghiệm 37
CHƯƠNG 3 – Kết luận 39
Các tài liệu tham khảo 41

Để tải tài liệu này, vui lòng Trả lời bài viết, Mods sẽ gửi Link download cho bạn ngay qua hòm tin nhắn.

Ket-noi - Kho tài liệu miễn phí lớn nhất của bạn

Ai cần tài liệu gì mà không tìm thấy ở Ket-noi, đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

nh hay các tiêu chuẩn “thông minh” để đo chất lượng ảnh hay tính hiệu quả của các kỹ thuật xử lý.
Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hóa và lượng tử hóa. Thí dụ một ảnh ma trận 512 dòng gòm khoảng 512 x 512 pixel. Việc lượng tử hóa ảnh là chuyển đổi tín hiệu tương tự sang tín hiệu số (Analog Digital Convert) của một ảnh đã lấy mẫu sang một số hữu hạn các mức xám.
1.2.3 Tăng cường ảnh – khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm một loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu, v.v
1.2.4 Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng. Có hai kiểu một tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái, chữ số, chữ có dấu).
Ngoài ra, hiện nay một kỹ thuật nhận dạng mới dựa vào kỹ thuật mạng nơron đang được áp dụng và cho kết quả khả quan.
1.3 Thu nhận ảnh
1.3.1 Thiết bị thu nhận ảnh
Các thiết bị thu ảnh thông thường gồm máy quay (camera) cộng với bộ chuyển đổi tương tự số AD(Analog to Digital) hay máy quét (scanner) chuyên dụng.
Thiết bị thu nhận ảnh có thể cho ảnh trắng đen B/W (Black & White) với mật độ từ 400 đến 1600 dpi (dot per inch) hay ảnh màu 600 dpi.Khi dùng scanner, một dòng photodiot sẽ quét ngang ảnh (quét theo hàng) và cho ảnh với độ phân giải ngang khá tốt. Đầu ra của scanner là ảnh ma trận số mà ta quen gọi là bản đồ ảnh (ảnh Bitmap), bộ số hóa (digitalizer) sẽ tạo ảnh vectơ có hướng.
Trong xử lý ảnh bằng máy tính, ta không thể không nói đến thiết bị monitor (màn hình) để hiện ảnh. Monitor có nhiều loại khác nhau: CGA, EGA, VGA, SVGA.
Với ảnh màu, có nhiều cách tổ hợp màu khác nhau. Theo lý thuyết màu do Thomas đưa ra từ năm 1802, mọi màu đều có thể tổ hợp từ 3 màu cơ bản: Red (đỏ), Green (lục) và Blue (lơ).
Thiết bị ra ảnh có thể là máy đen trắng, máy in màu hay máy vẽ (ploter). Máy vẽ cũng có nhiều loại: loại dùng bút, loại phun mực.
Nhìn chung, các hệ thống thu nhận ảnh thực hiện hai quá trình:
Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng lượng điện.
Tổng hợp năng lượng điện thành ảnh.
1.3.2 Biểu diễn màu
Ánh sáng màu là tổ hợp của ánh sáng đơn sắc. Mắt người chỉ có thể cảm nhận được vài chục màu, song lại có thể phân biệt được hàng ngàn màu. Có 3 thuộc tính chủ yếu trong cảm nhận màu:
Brighness: sắc màu, còn gọi là độ chói.
Hue: sắc lượng, còn gọi là sắc thái màu.
Saturation: độ bão hòa.
Với nguồn sáng đơn sắc, độ hue tương ứng với bước sóng l. Độ bão hòa thay đổi nhanh nếu ta thêm lượng ánh sáng trắng. Hình 1.3 mô tả mối liên quan giữa những các đại lượng trên và 3 màu chủ yếu R, G và B.
Một màu bất kỳ sẽ là một điểm trên vòng tròn.
Nếu White và Black là như nhau thì đường tròn là lớn nhất và R là điểm bão hòa.
S thay đổi theo bán kính
H thay đổi theo góc .
W* là sắc màu.
Hình 1.3. Hệ tọa độ màu RGB
1.3.3 Hệ tọa độ màu
Tổ chức y tế về chuẩn hóa màu CIE (Commision Internationalé d’Eclairage) đưa ra một số các chuẩn để biểu diễn màu. Các hệ này có các chuẩn riêng. Ở đây chỉ đề cập đến chuẩn mầu CIE-RGB (hệ tọa độ dùng 3 màu cơ bản). Như đã nêu trên, một màu là tổ hợp của các màu cơ bản theo một tỉ lệ nào đấy. Người ta dùng hệ tọa độ ba màu R-G-B (tương ứng với hệ tọa độ x-y-z) để biểu diễn màu như sau:
Hình 1.4. Hệ tọa độ 3 màu R-G-B
Trong cách biểu diễn này ta có công thức: đỏ + lục + lơ = 1. Công thức này gọi là công thức Maxwell. Ta cũng có thể chuyển từ hệ tọa độ 3 màu về hệ tọa độ x-y-z.
1.4 Các kỹ thuật xử lý ảnh cơ bản
Trên đây đã nói các khái niệm cơ bản trong xử lý ảnh, chúng ta sẽ tìm hiểu một số kỹ thuật xử lý ảnh sẽ được dùng trong nhận dạng phiếu điều tra.
1.4.1 Nhị phân hóa
Nhị phân hóa là thực hiện phép biến đổi ảnh từ ảnh đa cấp xám về ảnh nhị phân (có 2 cấp xám).Phương pháp đơn giản là dùng một hàm cắt với giá trị ngưỡng q.
Trong đó u là mức xám của một điểm ảnh.
Ngưỡng q có thể được chọn trước hay thực hiện chọn tự động bằng cách tính toán các đại lượng thống kê trên lược đồ tần xuất histogram của ảnh, của vùng ảnh.
1.4.2 Khử nhiễu
Khử nhiễu được tiến hành bằng cách sử dụng các bộ lọc tuyến tính (lọc trung bình) hay phi tuyến (lọc trung vị).
Khử nhiễu bằng các bộ lọc tuyến tính phổ biến là các bộ lọc sau:
Các bộ lọc trên được kết hợp với ảnh bằng phép nhân chập (phép cuộn) và cho ra ảnh kết quả có độ nhiễu nhỏ hơn ảnh ban đầu.
1.4.3 Làm trơn biên, lấp đầy chỗ trống
Trên thực tế, sau khi khử nhiễu, đường biên chữ không được trơn tru như ban đầu mà hình thành các đường cong có răng cưa. Khi đó ta phải tiến hành lấp đầy chỗ trống, xóa đi các điểm giả trên biên chữ. Hai kỹ thuật hay được sử dụng là Unger và Dineen.
Kỹ thuật Dineen dùng một mặt nạ n x n di chuyển trên tất cả các vị trí trong ảnh. Một ảnh mới được tạo ra trên đó mỗi phần tử tại tâm cửa sổ được tính lại theo các phần tử lân cận. Nếu tổng các phầntử trong cửa sổ lớn hơn một ngưỡng nào đó thì vị trí tương ứng trong ảnh mới sẽ là 1, ngược lại là 0. Kích thước cửa sổ thường chọn là 3 x 3 hay 4 x 4.
Kỹ thuật Unger dùng một tập luật để lấp đầy chỗ trống. Giả sử P là điểm đang xét, ta có các điểm lân cận của P như sau:
P3
P2
P9
P4
P
P8
P5
P6
P7
Điểm P trên ảnh mới là đen khi và chỉ khi thỏa mãn 1 trong 2 điều kiện sau:
1. P là điểm đen
2. Có ít nhất 3 trong 4 láng giềng P2, P4, P6, P8 là đen
Để loại bỏ các điểm cô lập sau khi lấp đầy chỗ trống, Unger lại dùng một tập luật khác:
1. Có ít nhất 1 trong 3 láng giềng P2, P3, P4 là đen
2. Có ít nhất 1 trong 3 láng giềng P6, P7, P8 là đen
hay
1. Có ít nhất 1 trong 3 láng giềng P4, P5, P6 là đen
2. Có ít nhất 1 trong 3 láng giềng P2, P8, P9 là đen
1.4.4 Thuật toán xác định góc nghiêng và chỉnh độ nghiêng
1.4.4.1 Xác định góc nghiêng dựa vào biến đổi Hough
Chúng ta sẽ dùng biến đổi Hough để tìm các đường thẳng trên ảnh. Kĩ thuật tìm đường thẳng theo biến đổi Hough sẽ được ứng dụng vào tìm góc nghiêng.
Mỗi đường thẳng trong toạ độ cực được xác định bởi cặp (r, ) với r là khoảng cách từ gốc đến đường thẳng, là góc giữa véc tơ pháp tuyến của đường thẳng và trục Ox như hình vẽ. Giả sử (x,y) là một điểm thuộc đường thẳng thì ta tìm công thức ràng buộc giữa x, y, r và.
Ta có: r = (m + y) . sin
Mặt khác ta có: tgθ = x/m
Û sin / cosθ = x/m
Û m.sinθ = x.cosθ
Do đó ta có mối liên hệ giữa ( x, y ) và (r, θ ) như sau :
r = x.cosθ + y.sinθ
Phương trình này được gọi là phương trình đường thẳng Hough.
Tư tưởng của nhận dạng đường thẳng Hough là: với mỗi giá trị của các tham số r và , ta tính số tọa độ (x, y) thỏa mãn phương trình đường thẳng Hough và là điểm đen. Nếu số này lớn hơn một ngưỡng thì tập hợp các điểm đó có thể tạo nên một đường thẳng.
x
y
m
θ
Hình 1.5. Đường thẳng Hough trên tọa độ cực
Ưu điểm của thuật toán này là có thể tìm được các đường thẳng không liền nét (các điểm trên đường thẳng rời rạc nhau) với độ chính xác cao. Điều này phù hợp với thực tế rằng, một ảnh khi quét vào có thể bị nhiễu hay đứt nét. Với thuật toán này, ta cũng có thể tính ngay được góc nghiêng của đường thẳng. Từ đó dễ dàng chuyển sang bước chỉnh độ nghiêng.
Dựa vào biến đổi Hough, hàng loạt các kỹ thuật xác định góc nghiêng được phát triển. Các kỹ thuật này dựa trên sự tìm kiếm những đặc tính khác biệt của văn bản như là hướng của các ký tự, các dòng văn bản thường song song với nhau. Từng điểm đen (x,y) của ảnh được ánh xạ vào trong không gian Hough (ρ, θ), sử dụng biến đổi ρ = x cos(θ) + y sin(θ). Các điểm ảnh thẳng hàng sẽ đem lại các đỉnh trong không gian Hough. Góc nghiêng của phương pháp này phụ thuộc vào góc nghiêng của trục. Độ phức tạp của thuật toán là tuyến tính đối với số lượng các điểm biến đổi và sự thay đổi góc quay.
1.4.4.2 Các thuật toán phát hiện góc nghiêng dựa vào biến đổi hough
Hệ thống xử lý ảnh văn bản thường phải giải quyết bài toán phát hiện góc nghiêng như một bước đầu tiên và tất yếu. Dựa vào tính chất mỗi đối tượng ảnh có duy nhất một chu tuyến ngoài và quan niệm con người nhận ra độ nghiêng của văn bản dựa vào cỡ chữ chiếm chủ đạo trong văn bản [3 ]. Việc xác định góc nghiêng văn bản được xác định nhờ phép biến đổi Hough cho những điểm giữa đáy của hình chữ nhật nhỏ nhất bao quanh đối tượng ảnh cho các đối tượng ảnh có kích thước chủ đạo.
Để xây dựng được thuật toán xác định góc nghiêng văn bản, trước hết phải dùng kỹ thuật dò biên để xác định chu tuyến cho các đối tượng ảnh. Các hình chữ nhật chứa các đối tượng này được lưu lại cho các qúa trình xử lý tiếp theo. Dựa vào sơ đồ phân bố các kích thước của các đối tượng, xác định các ngưỡng kích thước để phân loại các đối tượng và lựa chọn một số đối tượng có kích thước chủ đạo trong ảnh rồi dùng biến đổi hough để áp dụng cho các điểm thay mặt là điểm giữa đáy của hình chữ nhật ngoại tiếp các đối tượng này. Cuối cùng góc...

Yêu cầu Download

Tài liệu, ebook tham khảo khác

Tìm hiểu phương pháp phân form tài liệu - pdf 28

Tóm tắt nội dung tài liệu:

Tài liệu, ebook tham khảo khác

Học thêm