GIÁO TRÌNH
KỸ THUẬT SỐ
HÓA TÀI LIỆU
Mục lục
Kỹ thuật số hoá
Chương 1: Khái quát lý thuyết
Chương 2: Khái quát kỹ thuật
Chương 3: Nghiên cứu trường hợp
Chương 4: Tạo siêu dữ liệu: từ các ảnh số đến cơ sở dữ liệu của các tư li
ệu
Chương 5: Sử dụng các dịch vụ ảnh
Chương 6: Quét ảnh chụp
Chương 7: Quét phim
Chương 8: Giải pháp kết hợp
Chương 9: Duy trì khai thác và tiếp tục bổ sung kiến thức
chữ quang học (ORC). Độ chính xác của những chương trình như vậy vô
cùng khác nhau, tuỳ thuộc vào thuộc tính của nguyên bản và các ảnh số
được quét.
Tổng hợp các khả năng kỹ thuật
Mặc dù kỹ thuật ảnh số đã được biết đến từ khá lâu nhưng nó mới bắt
đầu được sử dụng rộng rãi từ thập niên 1990, khi những tiến bộ kỹ thuật
cho ra đời những hình ảnh rõ nét hơn, chi phí thấp hơn và khả năng truy
cập cao hơn. Các nhân tố đã tạo ra những điều kiện thuận lợi đó là:
- Sự phát triển kỳ diệu của máy tính cá nhân
- Các hệ thống mạng rộng lớn có tốc độ cao trở nên phổ biến
- Chi phí kỹ thuật giảm, đặc biệt là trong việc lưu trữ
- Sự ra đời của các máy quét có độ phân giải cao
- Sự xuất hiện của kiến trúc phục vụ khách hàng và mạng quốc tế
(World Wide Web)
Lợi ích của ảnh số
Ảnh số mang những đặc điểm ưu việt hơn hẳn ảnh analog về mặt độ nét,
độ chính xác, độ trung thực so với nguyên bản, chi phí bộ nhớ và khai
thác
Trong lưu trữ
+ trung thực so với nguyên bản
- tương đương với kỹ thuật ánh sáng thấu kính
- thay đổi được kích cỡ ảnh
- có thể chỉnh sửa ảnh
+ trung thực trong sao chép
- sản phẩm phong phú và có chất lượng
- truy cập thông tin liên tục mà không phải bảo quản phương tiện
Trong khai thác
- có thể nối mạng
- có thể truy cập nhiều ảnh cùng một lúc
- có thể tạo ra nhiều ảnh phái sinh
Các thuộc tính của tư liệu
Khi quét ảnh số phải tính toán đến các quy trình kỹ thuật liên quan đến
việc chuyển từ ảnh analog sang ảnh số cũng như các thuộc tính của
chính các văn bản gốc như: kích thước, mức độ chi tiết, thang màu. Các
văn bản có thể được định tính bằng các quy trình kỹ thuật được sử dụng
để tạo ra nó, bao gồm các phương pháp bằng tay, bằng máy, chụp ảnh
hay mới nhất là điện tử. Hoặc toàn bộ các văn bản bằng giấy hoặc bằng
phim có thể được chia thành 4 loại sau:
+ Bản văn/Dòng (Text/line art): Gồm những hình ảnh đồng màu có ranh
giới rõ ràng, thường đơn sắc, có thể được tạo ra bằng tay, máy chữ hoặc
máy in, bao gồm: bản văn, bản viết tay, đồ thị, bản khắc gỗ, văn bản
được đánh máy hay in laser, bản thiết kế, bản đồ và bản chép nhạc.
+ Tông màu chuyển tiếp (Continuous tone): Những văn bản gồm các
gam chuyển tiếp nhau, có thể đơn sắc hoặc đa sắc, bao gồm ảnh chụp,
một số loại tranh (như bản phác hoạ bằng chì, tranh màu nước) và các
tác phẩm đồ hoạ có các thuộc tính gam chuyển tiếp như bản khắc đồng,
in đá, in chụp.
+ Nửa tông hoặc kiểu nửa tông (Halftone or halftone-like): Những hình
ảnh tạo thành từ các điểm hoặc đường nằm cách đều, có thể đơn hoặc đa
sắc, bao gồm những ảnh đồ hoạ được tạo thành từ các nét hoặc đường kẻ
song song sít nhau nằm cách đều, ví dụ bản chạm khắc hoặc khắc axit.
+ Hỗn hợp (Mixed): Tổng hợp cả 3 loại văn bản trên, đơn hoặc đa sắc,
bao gồm báo, tạp chí, sách có tranh minh hoạ.
Ba loại kỹ thuật quét
+ "đen trắng" ("bitonal"): một pixel gồm một số nhị phân thể hiện màu
trắng hoặc đen, thích hợp với các loại bản văn và một số loại nửa tông.
+ "dải xám" ("grayscale"): một pixel gồm nhiều số nhị phân thể hiện các
gam màu xám khác nhau, thích hợp với các văn bản gam chuyển tiếp
đen trắng, nửa tông, hỗn hợp và một số bản viết tay.
+ "màu" ("color"): một pixel gồm nhiều số nhị phân thể hiện các màu
biến đổi các gam màu - được đo bằng mật độ kế- từ vùng sáng nhất đến
vùng tối nhất của văn bản. Các vật liệu trong suốt có dải biến động rộng
hơn, do đó thể hiện được nhiều gam màu hơn các vật liệu phản quang.
Khả năng bắt được tất cả các sắc màu của máy quét, bao gồm những chi
tiết trong vùng sáng và vùng tối, phụ thuộc vào dải biến động của máy và
số bit. Máy quét drum thường bắt màu tốt nhất và máy quét flatbed
thường bắt màu kém nhất (Xem chương 2 và chương 6). Số bit tăng lên
sẽ ảnh hưởng đến độ phân giải cần thiết, kích thước tệp và phương pháp
nén.
Chỉnh sửa ảnh (Image enhancement) là quá trình cải thiện chất lượng
ảnh. Tuy nhiên, việc chỉnh sửa rất có thể sẽ ảnh hưởng đến độ trung
thực của ảnh. Chỉnh sửa còn làm tăng chi phí quét ảnh. Các đặc điểm
chỉnh sửa điển hình có thể được thực hiện trong quá trình quét hoặc
trong phần mềm biên tập ảnh gồm lọc (filter), các đường cong tái tạo
tông màu (tonal reproduction curves) và quản lý màu (color
management). Dưới đây là ví dụ về sử dụng bộ lọc ở một bản viết tay
được quét với cùng một ngưỡng và độ phân giải, và một bức ảnh được
"hiệu chỉnh" bằng chương trình biên tập ảnh.
Nén (Compression) làm giảm kích thước tệp trong quá trình xử lý, lưu
trữ và chiếu ảnh. Chất lượng ảnh có thể bị ảnh hưởng bởi kỹ thuật nén
và mức độ nén.
Thiết bị sử dụng và hiệu suất của nó qua thời gian sẽ ảnh hưởng đến
chất lượng hình ảnh. Những công nghệ quét khác nhau có ảnh hưởng rõ
rệt đến sản phẩm và độ chính xác của kỹ thuật xác định chuẩn chất
lượng sẽ được trình bày ở phần sau. Vì vậy, những đòi hỏi của các nhà
sản xuất về các khả năng của hệ thống (độ phân giải, số bit, các kỹ thuật
chỉnh sửa, sản lượng đầu vào, tuổi thọ phần cứng, độ tin cậy) cần phải
được xem xét cẩn thận. Bạn hãy đảm bảo rằng những yêu cầu về chất
lượng ảnh đã được đáp ứng bằng cách kiểm tra các sản phẩm qua màn
hình và giấy, sử dụng kết hợp các vị trí kiểm tra kỹ thuật và các mẫu
Khai thác
Ảnh số là công cụ để thuận tiện hoá việc khai thác, nhưng trong mọi
trường hợp, một ảnh số không thể thoả mãn được tất cả các nhu cầu của
người sử dụng. Một tệp số chủ cần được tạo ra và sử dụng để nhân bản
hàng loạt hình ảnh vì các nguyên nhân sau:
- với những khả năng khác nhau của máy tính, tất cả các nhu cầu sử
dụng có thể được đáp ứng thông qua các bản phái sinh
- các yêu cầu và khả năng về in ấn, hiển thị và xử lý ảnh vô cùng đa dạng
- khó có thể cùng một lúc đáp ứng được tất cả các nhu cầu về sự hoàn
chỉnh, chi tiết của ảnh và tốc độ xử lý
- quá trình quét càng tốt thì chất lượng bản phái sinh càng tốt
- những đòi hỏi của người sử dụng ngày càng cao, phải có đủ các tệp số
chủ để cung cấp cho những ứng dụng trong tương lai
Chi phí
Chi phí sản xuất những ảnh số có chất lượng cao sẽ ít hơn chi phí dành
cho những ảnh chất lượng thấp và không đáp ứng được những yêu cầu
lâu dài. Tạo ảnh số là một công việc tốn kém; chi phí vào nhân lực và
việc tìm kiếm, chuẩn bị, kiểm tra và ghi kỹ hiệu thông tin số cao hơn
nhiều so với chính chi phí quét ảnh. Trong những năm tới, giá quét và
lưu ảnh sẽ hạ xuống và làm giảm bớt sự chênh lệch nói trên.
Chất lượng ảnh cao không đồng nghĩa với độ phân giải và số bit cao
nhất, mà chính là sự phù hợp giữa quá trình quét ảnh với nội dung của
nguyên bản và quét ở mức độ đảm bảo bắt được đúng những thông tin
đó, không nhiều hơn cũng không ít hơn. Bằng cách đó, có thể tránh được
khả năng phải quét lại ảnh sau này; chi phí cho lưu trữ và di nhập thông
tin không phải là nhỏ nhưng ở mức độ hợp lý và có thể được bù lại bằng
giá trị lâu dài của thông tin số. Giá trị đó nên được xác định bằng nội
dung tri thức chứa trong các ảnh số chứ không bị hạn chế bởi những
phán quyết về mặt kỹ thuật tại thời điểm quét.
Độ phân giải, kích thước tệp và chất lượng ảnh
tính này. Bạn có thể hình dung chúng như những hình chữ nhật gồm các
pixel xếp theo hàng và cột, trong đó:
- kích thước pixel tính = số pixel nằm theo hàng ngang x số pixel nằm
theo cột dọc (màn hình VGA có kích thước pixel 640 x 480).
- kích thước vật lý được đo bằng không gian tính bằng insơ theo chiều
ngang và chiều thẳng đứng mà các pixel đó chiếm (phần lớn các máy
quét flatbed đều thích hợp với các văn bản có kích thước 8,5" x 14").
- dpi thể hiện số lượng pixel trên 1 insơ.
Các máy quét flatbed quét ở một độ phân giải đặt sẵn với các tư liệu có
kích thước khác nhau nhưng không vượt quá 11" x 17". ở loại thiết bị
này, mảng quét (scanning array) được đặt ở kích thước cố định đó, và tất
cả các văn bản phù hợp với máy đều được quét ở cùng một độ phân giải
(dpi) được đặt sẵn đó. Độ phân giải sẽ chỉ thay đổi khi thiết định dpi
được thay đổi, ví dụ, chuyển từ 300 dpi lên 600 dpi.
Ví dụ: Máy quét được đặt ở độ phân giải 300 dpi trên mảng quét 11" x
17". Kích thước pixel của máy được xác định bằng cách nhân tích số của
độ phân giải và kích thước pixel thứ nhất (300 x 11) với tích số của độ
phân giải và kích thước pixel thứ hai (300 x 17), ta có kết quả là là 3300 x
5100. Nếu đặt lại độ phân giải ở mức 600 dpi, kích thước pixel của máy
quét sẽ là (600 x11) x (600 x 17) = 6600 x 10200.
Các máy quét khác, trong đó có camera số, không đặt sẵn độ phân giải.
Các camera số có kích thước pixel đặt sẵn (ví dụ 2000 x 3000) nhưng
không có tấm ép (platen) cố định. Về mặt lý thuyết thì loại máy này có
thể quét được văn bản ở mọi kích cỡ. Camera số hoạt động tương tự như
máy quay vi phim. Kích thước pixel của mảng quét được điều chỉnh theo
kích thước vật lý của nguyên bản bằng cách tăng hoặc giảm khoảng cách
giữa camera và tư liệu (hoặc sử dụng một thấu kính khác). Do đó, độ
phân giải sẽ thay đổi theo các kích thước khác nhau của các tư liệu. Nếu
tư liệu có kích thước nhỏ, độ phân giải có thể ở mức cao. Khi kích thước
tư liệu tăng lên, khoảng cách giữa camera và tư liệu đó cũng phải tăng
Xem các ví dụ 2 và 3)
Ví dụ 2: Xét trường hợp tư liệu có tỉ lệ cạnh nhỏ hơn tỉ lệ cạnh của mảng
quét. Một văn bản có kích thước giấy viết thư sẽ có tỉ lệ cạnh là 11/ 8,5 =
1,29. Nếu được quét bằng camera số có tỉ lệ cạnh 3072/ 2048 = 1,5 thì
kích thước của văn bản sẽ nhỏ hơn mảng quét. (Hình vuông có tỉ cạnh =
1) Nếu kích thước pixel thứ nhất của camera được đặt để quét chiều
rộng của văn bản thì chiều chiều dài của văn bản sẽ ngắn hơn cạnh thứ
hai của pixel. Toàn bộ văn bản sẽ được quét nhưng chỉ có một phần
mảng quét được sử dụng.
Ví dụ 3: Xét trường hợp tư liệu có tỉ lệ cạnh lớn hơn tỉ lệ cạnh của mảng
quét (ví dụ: văn bản có kích thước 7" x 14", tức là có tỉ lệ cạnh = 2),
được quét bằng camera số với mảng quét 2048 x 3072. Nếu kích thước
thứ nhất của pixel tương ứng với chiều rộng của văn bản và kích thước
pixel thứ hai đặt tương ứng với chiều dài (ví dụ 3a) thì văn bản sẽ dài
hơn mảng quét và chỉ có một phần văn bản được quét. Nhưng nếu xoay
lại thì xét về chiều rộng, văn bản vẫn ngắn hơn mảng quét và toàn bộ
văn bản sẽ được quét (ví dụ 3b).
Khi nào văn bản và mảng quét đã phù hợp với nhau thì độ phân giải để
quét toàn bộ văn bản có thể được xác định bằng cách chia kích thước
pixel của máy quét (xem công thức số 3). Công thức tương tự có thể được
sử dụng để tính độ phân giải hữu hiệu khi quét phim của một văn bản
bằng kỹ thuật quét trượt. Lưu ý là bạn phải sử dụng kích thước thật của
nguyên bản chứ không phải kích thước của phim (Xem chương 7).
Công thức 3: xác định độ phân giải từ kích thước pixel của máy quét:
Xác định độ phân giải cần thiết để bắt được đầy đủ thông tin
Chúng ta đã biết làm thế nào để xác định độ phân giải và kích thước tệp
từ kích thước pixel, song làm thế nào để biết liệu độ phân giải đó có phù
hợp để bắt được đầy đủ thông tin trong nguyên bản hay không? Tại
Cornell, chúng tôi đã xây dựng một phương pháp đặt chuẩn để tính toán
gồm các mức: thấp (3,6); trung bình (5,0) và cao (8,0).
Công thức 4: Chỉ số chất lượng cổ điển:
QI = h x p
p = QI/h
Sử dụng QI trong lĩnh vực số hoá
Trong báo cáo kỹ thuật AIIM TR26 - 1993 mang tên Resolution as it
relates to Photographic and Electronic Imaging, các tác giả đã đề xuất
rằng QI có thể được sử dụng để đặt chuẩn chất lượng cho các bản số hoá
và cho biết nhiều phân tích đã được tiến hành để tìm ra sự khác nhau
giữa các cách bắt chi tiết của máy quay vi phim và máy quét. Trường
Đại học Cornell đánh giá cao ý kiến trên và đã thực nghiệm sử dụng
phương pháp này trong vòng 5 năm để khẳng định các kết quả nghiên
cứu sau khi đã chuyển đổi hơn 1 triệu ảnh.
Để chuyển đổi giữa độ phân giải ảnh chụp và ảnh số, ta phải tiến hành
các bước sau:
- thiết lập các mức chất lượng ảnh tương ứng với nhau
- hợp lý hoá hệ thống đo ( chuyển từ U.S. sang hệ mét)
- tương ứng các điểm với các cặp đường
- điều chỉnh "sự đọc lệch"(trong kỹ thuật quét đen trắng)
1. Thiết lập các mức chất lượng ảnh tương đương
Việc đầu tiên là phải đặt ra các mức chất lượng có thể chấp nhận được
trong việc quét ảnh số dựa trên mô hình tiêu chuẩn được AIIM áp dụng
đối với vi phim. Các ảnh phóng đại ở các độ phân giải khác nhau của các
chữ được số hoá dưới đây được so sánh với các chữ được chụp bằng vi
phim với QI ở các mức thấp (3,6), trung bình (5,0) và cao (8,0). Theo
đánh giá của Cornell thì các ảnh trên có sự tương ứng về mức chất
lượng. Lưu ý rằng sự thay đổi các mức chất lượng trong kỹ thuật quét
đen trắng thể hiện ở các cấu trúc hình răng cưa - thường được gọi là
"aliasing" hay "jaggies". Còn trong kỹ thuật vi phim và quét xám, chất
lượng ảnh giảm thể hiện ở chỗ các nét chữ mờ.
Từ đó ta có công thức tính độ phân giải dpi=2QI/0,0039
4. Điều chỉnh sự đọc lệch trong kỹ thuật quét đen trắng
Trong công thức trên, dpi là độ phân giải ở đầu vào của máy tính. Ví dụ,
nếu QI = 8 cần cho một tư liệu gồm những ký tự có kích thước từ 1mm
trở lên, thì độ phân giải cần thiết là (2x8)/ (0,039x1) = 410. Tuy nhiên, do
các lỗi lấy mẫu cùng với sự không ăn khớp giữa bộ phận dò (detector)
của máy quét và chi tiết ảnh, được gọi là "sự đọc lệch"
("misregistration"), độ phân giải ở đầu vào của máy quét đen trắng
thường không nhất quán với độ phân giải ở đầu ra. Trường Đại học
Cornell đã áp dụng giải pháp được AIIM TR26- 1993 đưa ra: tăng độ
phân giải đầu vào lên ít nhất 50% để bù vào "sự đọc lệch". Trong ví dụ
trên, độ phân giải 410 có thể được tăng 50%, tức là lên 615 dpi. Phần
tăng này là cần thiết dù máy quét có hay không sử dụng độ phân giải
"thực" hay "nội suy". (Xem chương 2 về máy quét.) Sự đọc lệch là một
vấn đề đặc biệt khó giải quyết khi xử lý những hoạ tiết đều đặn như các
đối tượng phân giải chuẩn (standard resolution targets) (xem hình trang
sau) hay các văn bản nửa tông và kiểu nửa tông (xem bản khắc dưới). Vì
vậy, ANSI/ AIIM MS 44-1998 đã tuyên bố rằng các mô hình kiểm tra
tiêu chuẩn độ phân giải không nên áp dụng với những máy quét có độ
phân giải từ 600 dpi trở xuống.
Mô hình kiểm tra độ phân giải