BÁO CÁO "TÌM HIỀU THÔNG TIN VỀ BIỂU DIỄN ẢNH" doc - Pdf 16

BÁO CÁO TỐT NGHIỆP
BÁO CÁO
"TÌM HIỀU THÔNG TIN
VỀ BIỂU DIỄN ẢNH"
Mục Lục:
BÁO CÁO TỐT NGHIỆP 1
BÁO CÁO 1
"TÌM HIỀU THÔNG TIN VỀ BIỂU DIỄN ẢNH" 1
Mục Lục: 2
LỜI NÓI ĐẦU 4
Sinh viên thưc hiện 5
Giáo viên hướng dẫn 5
PHẦN I : MỘT SỐ KHÁI NIỆM CƠ BẢN 6
1.1 Khái Niệm về ảnh 6
1.2 Pixel (Picture Element): phần tử ảnh 6
1.3 Gray level: Mức xám 6
PHẦN II : CÁC ĐỊNH DẠNG ẢNH CƠ BẢN 7
2.1 Khái niệm chung 7
2.1.1 Mào đầu tệp(Header): 8
2.1.2 Dữ liệu ảnh(Data Image): 8
2.1.3 Bảng màu(Palette Color): 8
2.1.4 Quy trình đọc một tệp ảnh 8
2.2 Định dạng ảnh IMG 8
2.3 Định dạng ảnh PCX 9
2.4 Định dạng ảnh BMP(Bitmap) 11
2.4.1 Data of Image 11
2.4.2 Color Palette (Bảng màu) 12
2.4.3 Header 13
Windows 3 Bitmap Header 13
2.5 Định dạng ảnh GIF(Graphics Interchanger Format) 14
2.6 Định dạng ảnh JPEG (Joint Photographic Experts Group) 17

học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành Công nghệ thông tin
Với đề tài “Tìm hiểu thông tin về biểu diễn ảnh”, sau một thời gian nghiên cứu về đề
tài này, em đề cập đến một số vấn đề về biểu diễn, các loại file ảnh, thông tin định dạng
một số loại file ảnh thông dụng Tài liệu báo cáo gồm 4 chương:
Chương I: Một số khái niệm cơ bản.
Chương II: Các định dạng ảnh thông dụng.
Chương III: Phân loại ảnh.
Chương IV: Chương trình ứng dụng chuyển dổi ảnh màu  Ảnh đa mức
xám hoặc ảnh nhị
Mặc dù rất cố gắng nhưng do đây là lần đầu tiên em đi sâu vào nghiên cứu đề tài
này nên tài liệu chắc chắn không tránh khỏi những sai sót. Vì vậy em rất mong nhận được
sự đóng góp ý kiến của thầy và các bạn để nhóm hoàn thiện hơn nữa về để tài này tốt
hơn.
Em xin chân thành cảm ơn!
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN ĐÁNH GIÁ VÀ CHO ĐIỂM

nhầm lẫn ta tạm gọi khái niệm pixel này là pixel thiết bị. Khái niệm pixel thiết bị có thể
xem xét như sau: khi ta quan sát màn hình (trong chế độ đồ hoạ), màn hình không liên tục
mà gồm nhiều điểm nhỏ, gọi là pixel. Mỗi pixel gồm một cặp toạ độ x, y và màu.
- Cặp toạ độ x, y tạo nên độ phân giải (resolution). Như màn hình máy tính có nhiều
loại với độ phân giải khác nhau: màn hình CGA có độ phân giải là 320 x 200; màn hình
VGA là 640 x 350,
- Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi được số hoá, nó thường được
biểu diễn bởi bảng hai chiều I(n,p): n dòng và p cột. Ta nói ảnh gồm n x p pixels. Người
ta thường kí hiệu I(x,y) để chỉ một pixel. Thường giá trị của n chọn bằng p và bằng 256.
Một pixel có thể lưu trữ trên 1, 4, 8 hay 24 bit.
1.3 Gray level: Mức xám
- Mức xám là kết quả sự mã hoá tương ứng một cường độ sáng của mỗi điểm ảnh
với một giá trị số - kết quả của quá trình lượng hoá. Cách mã hoá kinh điển thường dùng
16, 32 hay 64 mức. Mã hoá 256 mức là phổ dụng nhất do lý do kỹ thuật. Vì 28 = 256 (0,
1, , 255), nên với 256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit.
1.4 Biểu diễn ảnh
- Trong biểu diễn ảnh, người ta thường dùng các phần tử đặc trưng của ảnh là pixel.
Nhìn chung có thể xem một hàm hai biến chứa các thông tin như biểu diễn của một ảnh.
Các mô hình biểu diễn ảnh cho ta một mô tả lô gic hay định lượng các tính chất của hàm
này. Trong biểu diễn ảnh cần chú ý đến tính trung thực của ảnh hoặc các tiêu chuẩn
“thông minh” để đo chất lượng ảnh hoặc tính hiệu quả của các kỹ thuật xử lý.
- Việc xử lý ảnh số yêu cầu ảnh phải được mẫu hoá và lượng tử hoá. Thí dụ một ảnh
ma trận 512 dòng gồm khoảng 512 x 512 pixel. Việc lượng tử hoá ảnh là chuyển đổi tín
hiệu tương tự sang tín hiệu số (Analog Digital Convert) của một ảnh để lấy mẫu sang một
số hữu hạn mức xám.
- Một số mô hình thường được dùng trong biểu diễn ảnh: Mô hình toán, mô hình
thống kê. Trong mô hình toán, ảnh hai chiều được biểu diễn nhờ các hàm hai biến trực
giao gọi là các hàm cơ sở. Với mô hình thống kê, một ảnh được coi như một phần tử của
một tập hợp đặc trưng bởi các đại lượng như: kỳ vọng toán học, hiệp biến, phương sai,
moment…

- Sau khi c xong cỏc khi d liu nh vo b nh ta tin hnh nộn d liu nh.
Cn c vo phng phỏp nộn ch ra trong phn Header ta gii mó c nh.Cui cựng l
khõu hin nh. Da vo s liu nh ó gii nộn, v trớ v kớch thc nh, cựng s tr giỳp
ca bng mu nh c hin lờn trờn mn hỡnh.
2.2 nh dng nh IMG
- nh IMG là ảnh đen trắng. Phần đầu của ảnh IMG có 16 bytes chứa các thông tin
cần thiết :
+ 6 bytes đầu: dùng để đánh dấu định dạng ảnh IMG. Giá trị của 6 bytes này viết
dới dạng Hexa:
0x0001 0x0008 0x0001.
+ 2 bytes tiếp theo: chứa độ dài mẫu tin. Đó là độ dài của dãy các bytes kề liền
nhau mà dãy này sẽ đợc lặp lại một số lần nào đó. Số lần lặp này sẽ đợc lu trong byte
đếm. Nhiều dãy giống nhau đợc lu trong một byte.
+ 4 bytes tiếp: mô tả kích cỡ pixel
+ 2 bytes tiếp : số pixel trên một dòng ảnh
+ 2 bytes cuối: số dòng ảnh trong ảnh.
- nh IMG đợc nén theo từng dòng. Mỗi dòng bao gồm các gói(pack). Các dòng
giống nhau cũng đợc nén thành một gói. Có 4 loại gói sau:
- Loại 1: Gói các dòng giống nhau
Quy cách gói tin này nh sau: 0x00 0x00 0xFF Count. Ba byte đầu cho biết
số các dãy giống nhau; byte cuối cho biết số các dòng giống nhau.
- Loại 2: Gói các dãy giống nhau
Quy cách gói tin này nh sau: 0x00 Count. Byte thứ hai cho biết số các dãy
giống nhau đợc nén trong gói. Độ dài của dãy ghi ở đầu tệp.
- Loại 3: Dãy các pixel không giống nhau, không lặp lại và không nén đợc.
Qui cách nh sau: 0x80 Count. Byte thứ hai cho biết độ dài dãy các pixel
không giống nhau không nén đợc.
- Loại 4: Dãy các pixel giống nhau
Tuỳ theo các bit cao của byte đầu đợc bật hay tắt. Nếu bit cao đợc bật (giá
trị 1) thì đây là gói nén các bytes chỉ gồm bit 0, số các byte đợc nén đợc tính bởi 7 bit

về một thanh ghi màu. Nh vậy ta có 16 thanh ghi màu.
+ 1 byte: không dùng đến và luôn đặt là 0.
+1 byte: số bit plane mà ảnh sử dụng. Với ảnh 16 màu, giá trị này là 4, với ảnh
256 màu (1 pixel/8 bit) thì số bit plane lại là 1.
+ 1 byte: số bytes cho một dòng quét ảnh.
+ 1 word: kiểu bảng màu.
+ 58 byte: không dùng.
- Tóm lại, định dạng ảnh PCX thờng đợc dùng để lu trữ ảnh vì thao tác đơn giản,
cho phép nén và giải nén nhanh. Tuy nhiên vì cấu trúc của nó cố định, nên trong một số
trờng hợp nó làm tăng kích thớc lu trữ. Và cũng vì nhợc điểm này mà một số ứng dụng lại
sử dụng một kiểu định dạng khác mềm dẻo hơn: định dạng TIFF (Targed Image File
Format) sẽ mô tả dới đây.
2.4 nh dng nh BMP(Bitmap)
- Trong ha mỏy vi tớnh, BMP, cũn c bit n vi tờn ting Anh khỏc l
Windows bitmap, l mt nh dng tp tin hỡnh nh khỏ ph bin. Cỏc tp tin ha lu
di dng BMP thng cú uụi l .BMP hoc .DIB (Device Independent Bitmap).
Nếu ta hình dung trong một tệp ảnh xếp liên tiếp các byte từ đầu đến cuối và dồn
chúng vào trong một hộp chữ nhật, thì có thể hình dung tệp ảnh BMP nh hình vẽ sau:
Hình 1. Cấu trúc file ảnh BMP
2.4.1 Data of Image
- nh 24 bit:
Mỗi điểm ảnh chiếm 3 byte mô tả ba thành phần: Red, Green, Blue.
- nh 256 mu:
Mỗi điểm ảnh chiếm 1 byte, chỉ số hiệu màu của điểm ảnh này.
Số hiệu màu của các điểm ảnh: 0, 1, , 255
Màu của điểm ảnh đợc mô tả trong bảng màu. Giả sử byte mô tả điểm
ảnh có giá trị là b và bảng màu đợc chứa trong mảng P, thì thành
phần các màu của điểm ảnh này là P[b].R, P[b].G, P[b].B. Chẳng hạn,
một điểm ảnh có số hiệu màu 20, các thành phần của màu 20 là
P[20].R, P[20].G, P[20].B

2.4.3 Header
Header của các tệp ảnh BMP gồm 54 byte, đợc mô tả chi tiết trong bảng
sau:
File Header
Số bytes ý nghĩa Nội dung
2 Tên, Kí hiệu BM
4 Kích thớc file ảnh
4 Dự trữ (Không dùng) 0
4 Byte offset in file where image begin (Kích thớc
vùng Information và Header)
54
Windows 3 Bitmap Header
4 Size of this Header 40
4 Image width in pixels
4 Image height in pixels
2 Number of iImage planes, must be 1
2 Bits per pixel 1, 4, 8, 24
4 Compression type (run-length) 0,1,2
4 Size in byte of compressed image, or 0
4 Horizontal resolution, in pixels/meter
4 Vertical resolution, in pixels/meter
4 Number of colors used
4 Number of important colors
4*n Colors palette
2.5 nh dng nh GIF(G

raphics I

nterchanger F


+ Độ rộng hình raster theo pixel: 2 byte;
+ Độ cao hình raster theo pixel: 2 byte;
+ Các thông tin về bản đồ màu, hình hiển thị,
+ Thông tin màu nền: 1 byte;
+ Phần cha dùng: 1 byte.
- Bản đồ màu tổng thể: mô tả bộ màu tối u đòi hỏi khi bit M = 1. Khi bộ màu tổng
thể đợc thể hiện, nó sẽ xác lập ngay bộ mô tả hình hiển thị. Số lợng thực thể bản đồ
màu lấy theo bộ mô tả hình hiển thị ở trên và bằng 2
m
, với m là lợng bit trên một
pixel khi mỗi thực thể chứa đựng 3 byte (biểu diễn cờng độ màu của ba màu cơ bản
Red-Green-Blue). Cấu trúc của khối này nh sau: - Bộ mô tả ảnh: định nghĩa vị trí thực tế và phần mở rộng của ảnh trong phạm vi
không gian ảnh đã có trong phần mô tả hình hiển thị. Nếu ảnh biểu diễn theo ánh xạ bản
đồ màu cục bộ thì cờ định nghĩa phải đợc thiết lập. Mỗi bộ mô tả ảnh đợc chỉ ra bởi ký tự
kết nối ảnh. Ký tự này chỉ đợc dùng khi định dạng GIF có từ 2 ảnh trở lên. Ký tự này có
giá trị 0x2c (ký tự dấu phảy). Khi ký tự này đợc đọc qua, bộ mô tả ảnh sẽ đợc kích hoạt.
Bộ mô tả ảnh gồm 10 byte và có cấu trúc nh sau:
Bit Thứ thự
byte
Mô tả
Màu Red 1 Giá trị màu đỏ theo index 0
Màu Green 2 Giá trị màu xanh lục theo index 0
Màu Blue 3 Giá trị màu xanh lơ theo index 0
Màu Red 4 Giá trị màu đỏ theo index 1

I = 1 : định dạng ảnh theo thứ tự xen kẽ
pixel +1: số bit/pixel của ảnh này.

2.6 Định dạng ảnh JPEG (Joint Photographic Experts Group)
- Phương pháp nén ảnh JPEG (tiếng Anh, viết tắt cho Joint Photographic
-Experts Group) là một trong những phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới
vài chục lần. Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu. Chất lượng ảnh bị
suy giảm sau khi giải nén. Sự suy giảm này tăng dần theo hệ số nén. Tuy nhiên sự mất
mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần
thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người.
Phần mở rộng của các file JPEG thường có dạng .jpeg, .jfif, .jpg, .JPG, hay .JPE; dạng
.jpg là dạng được dùng phổ biến nhất.
2.6.1 Mức độ nhạy cảm của mắt người
- Trong không gian màu YUV, nhãn thị của con người rất nhạy cảm với thành
phần Y và kém nhạy cảm với hai loại U và V. Phương pháp nén JPEG đã nắm bắt phát
hiện này để tách những thông tin thừa của ảnh. Hệ thống nén thành phần Y của ảnh với
mức độ suy giảm ít hơn so với U, V, bởi người ta ít nhận thấy sự thay đổi của U và V so
với Y.
2.6.2 Mã hóa
- Công đoạn chính là chia nhỏ bức ảnh thành nhiều vùng nhỏ (thông thường là
những vùng 8x8 pixel) rồi sử dụng biến đổi cosin rời rạc để biến đổi những vùng thể hiện
này thành dạng ma trận có 64 hệ số thể hiện "thực trạng" các pixel. Điều quan trọng là ở
đây hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khả năng đó giảm rất
nhanh với các hệ số khác. Nói cách khác thì lượng thông tin của 64 pixels tập trung chủ
yếu ở một số hệ số ma trận theo biến đổi trên. Trong giai đoạn này có sự mất mát thông
tin, bởi không có biến đổi ngược chính xác. Nhưng lượng thông tin bị mất này chưa đáng
kể so với giai đoạn tiếp theo. Ma trận nhận được sau biến đổi cosin rời rạc được lược bớt
sự khác nhau giữa các hệ số. Đây chính là lúc mất nhiều thông tin vì người ta sẽ vứt bỏ
những thay đổi nhỏ của các hệ số. Như thế khi bung ảnh đã nén ta sẽ có được những
tham số khác của các pixel. Các biến đổi trên áp dụng cho thành phần U và V của ảnh với

hạn của nó là 256 màu trong thời điểm máy tính có khả năng hiển thị nhiều hơn 256 màu
đang trở nên phổ biến. Mặc dù định dạng GIF có thể thể hiện các hình ảnh động, song
PNG vẫn được quyết định là định dạng hình ảnh đơn (chỉ có một hình duy nhất). Một
người "anh em" của nó là MNG đã được tạo ra để giải quyết vấn đề ảnh động. PNG lại
tăng thêm sự phổ biến của nó vào tháng 8 năm 1999, sau khi hãng Unisys huỷ bỏ giấy
phép của họ đối với các lập trình viên phần mềm miễn phí, và phi thương mại.
* Phiên bản 1.0 của đặc tả PNG được phát hành vào ngày 1 tháng 7 năm 1996, và sau
đó xuất hiện vơi tư cách RFC 2083. Nó được tổ chức W3C khuyến nghị vào ngày 1 tháng
10 năm 1996.
* Phiên bản 1.1, với một số thay đổi nhỏ và thêm vào 3 thành phần mới, được phát
hành vào ngày 31 tháng 12 năm 1998.
* Phiên bản 1.2, thêm vào một thành phần mở rộng, được phát hành vào ngày 11 tháng
8 năm 1999.
* PNG giờ đây là một chuẩn quốc tế (ISO/IEC 15948:2003), và cũng được công bố
như một khuyến nghị của W3C vào ngày 10 tháng 11 năm 2003. Phiên bản hiện tại của
PNG chỉ khác chút ít so với phiên bản 1.2 và không có thêm thành phần mới nào.
2.7.2 Thông tin kỹ thuật
- Một tập tin PNG bao gồm 8-byte kí hiệu (89 50 4E 47 0D 0A 1A 0A được viết
trong hệ thống có cơ số 16, chứa các chữ "PNG" và 2 dấu xuống dòng [1], ở giữa là sắp
xếp theo số lượng của các thành phần, mỗi thành phần đều chứa thông tin về hình ảnh.
Cấu trúc dựa trên các thành phần được thiết kế cho phép định dạng PNG có thể tương
thích với các phiên bản cũ khi sử dụng.
Các "thành phần" trong tập tin
- PNG là cấu trúc như một chuỗi các thành phần, mỗi thành phần chứa kích thước,
kiểu, dữ liệu, và mã sửa lỗi CRC ngay trong nó.
- Chuỗi được gán tên bằng 4 chữ cái phân biệt chữ hoa chữ thường. Sự phân biệt này
giúp bộ giải mã phát hiện bản chất của chuỗi khi nó không nhận dạng được.
- Với chữ cái đầu, viết hoa thể hiện chuỗi này là thiết yếu, nếu không thì ít cần thiết
hơn ancillary. Chuỗi thiết yếu chứa thông tin cần thiết để đọc được tệp và nếu bộ giải mã
không nhận dạng được chuỗi thiết yếu, việc đọc tệp phải được hủy.

0: Biểu diễn nền ảnh (phông ảnh) và được gọi là điểm trắng
 Đặc điểm
- Mỗi điểm ảnh đựoc lưu trữ bởi 1 bit nên dung lượng lưu trữ rất nhỏ và dễ dàng để
xử lý.
- Ảnh nhị phân thích hợp để biểu diễn đối tượng.đừơng nét nhiều nét, chữ số.
- Ảnh nhị phân phù hợp để biểu diễn các biên, vùng ảnh của ảnh số.
- Tập tin của ảnh nhị phân là tập hợp các điểm đen
3.2.2 Ảnh đa mức xám.
 Khái niệm.
- Ảnh đa mức xám là ảnh đc biểu diễn bởi L lớn hơn 2 mức (L= 4 , 8 , 16 , 32 , 64 ,
128 , 256) thông thường người ta hay sử dụng L = 256 mức để biểu thị mức độ
đậm nhạt của các điểm ảnh.
 Đặc điểm.
- Ảnh đa mức xám sử dụng lớn hơn 1bit để biểu thị mức độ đậm nhạt của các điểm
ảnh lên ảnh đa mức xám cho độ sắc nét hơn ảnh nhị phân.
- Ta có thể chuyển đổi thừ ảnh đa mức xám về ảnh nhị phân theo công thức sau:
Y (m, n) = 1 nếu X (m, n) ≥ θ
Y (m, n) = 0 nếu X (m, n) < θ
Với θ là ngưỡng tự chọn
- Ảnh đa mức xám đc ứng dụng nhiêu trong các lĩnh vực như sinh học, công nghiệp,
y học
3.3 Ảnh màu
 Khái niệm
- Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ (R), lục (G),
lơ (B) và thường thu nhận trên các dải băng tần khác nhau. Với ảnh màu, cách biểu diễn
cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu
diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue).
 Đặc điểm
- Để biểu diễn cho một điểm ảnh màu cần 24 bit. 24 bit này được chia thành ba
khoảng 8 bit. Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256). Mỗi

- Ta có thể làm việc riêng biệt với từng đối tượng, ta có thể gộp chúng lại để
tạo ra 1 raster image trên 1 vector image. Ví dụ: Word không phải là 1 chương
trình Vẽ, nhưng phần mềm này cũng sử dụng vector, bởi vì nó dùng fonts, và fonts
chữ cũng là vectors.
PHẦN IV : CHƯƠNG TRÌNH ỨNG DỤNG CHUYỂN ĐỔI
ẢNH MÀU  ẢNH ĐA MỨC XÁM HOẶC ẢNH NHỊ
PHÂN
4.1 Xác định vào – ra.
• Vào (Input): 1 file ảnh màu.
• Ra (Output): File ảnh nhị phân hoặc đa mức xám(.bmp).
4.2 Thiết kế form.
 Form :
 ConvertGrayImageToBinaryImage
 Button :
 BtnBowse : Mở 1 file ảnh.
 BtnGray : Chuyển đồi ảnh từ ảnh màu  ảnh đa mức xám.
 BtnBinary : Chuyển đổi ảnh từ ảnh màu(đa mức xám)  ảnh nhị
phân.
 BtnExit : Thoát khỏi ứng dụng.
 GroupBox :
 Groupbox1 : Input File.
 Groupbox2 : Output File.
 TextBox :
 TxtPatch : Đường dẫn File ảnh input.
 TxtThresholdValue : Giá trị phân ngưỡng(Mặc định bằng 127).
 PictureBox :
 PicInputImage : Box hiển thị ảnh input.
 PicOutputImage : Box hiển thị ảnh output.
 Lable :
 Lable1 : “Open Input File”


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status