Tài liệu MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh - Pdf 10

MPEG 4: Bước đột phá trong kỹ thuật nén hình ảnh
Theo AG Tổng hợp

12:56 -
Thứ sáu,
05/01/2007
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của
internet, thì việc tìm ra một phương pháp nén ảnh nhằm giảm bớt
không gian lưu trữ thông tin và truyền thông trên mạng là yêu cầu
cấp thiết.
Các kỹ thuật nén Video đều cố gắng giảm lượng thông tin cần thiết cho một chuỗi
các bức ảnh, mà không làm giảm chất lượng ảnh. Mục đích của nén video là giảm bớt
số bít khi lưu trữ và truyền bằng cách loại bỏ lượng thông tin dư thừa trong từng
frame và dùng kỹ thuật mã hoá để tối thiểu hoá lượng thông tin quan trọng cần lưu
giữ.
Công nghệ nén hình phổ biến hiện nay
Với một thiết bị lưu hình kỹ thuật số thông thường, ảnh sau khi được số hoá sẽ được
nén lại. Quá trình nén sẽ xử lý các dữ liệu trong ảnh để đưa hình ảnh vào một không
gian hẹp hơn như trong thiết bị nhớ kỹ thuật số hoặc qua đường dây điện thoại,
Với thị trường lưu hình kỹ thuật số hiện nay, các chuẩn nén phổ biến là Motion JPEG
(MJPEG), Wavelet, H.261/ H.263/ H.263+/ H.263++ và MPGE1/ MPGE2/ MPGE4.
Nhìn chung, có hai nhóm tiêu chuẩn chủ yếu: nhóm một gồm định dạng nén MJPEG
và Wavelet; và nhóm hai gồm các định dạng chuẩn còn lại.
Sơ lược nguyên tắc nén ảnh áp dụng ở MJPEG và Wavelet
Tính chất chung của các ảnh số là tương quan giữa các pixel ở cạnh nhau lớn, điều
này dẫn tới dư thừa thông tin để biểu diễn ảnh. Việc dư thừa thông tin dẫn tới việc
mã hoá không tối ưu. Do vậy, ta cần tìm phương án biểu diễn ảnh với tương quan
nhỏ nhất, để giảm thiểu độ dư thừa thông tin của ảnh. Có 2 kiểu dư thừa thông tin
như sau:
- Dư thừa trong miền không gian: là tương quan giữa không gian pixel của ảnh (các
pixel lân cận của ảnh có giá trị gần giống nhau, trừ những pixel ở giáp đường biên

lý chung của nén tín hiệu video là loại bỏ sự dư thừa về không gian (spatial
redunancy) và sự dư thừa về thời gian (temporal redunancy). Trong MPEG, việc loại
bỏ sự dư thừa về thời gian (nén liên ảnh), được thực hiện trước hết nhờ sử dụng tính
chất giữa các ảnh liên tiếp. Chúng ta dùng tính chất này để tạo ra các bức ảnh mới
nhờ vào thông tin từ những bức ảnh gửi trước đó. Do vậy ở phía bộ mã hoá ta chỉ
cần giữ lại những ảnh có sự thay đổi so với ảnh trước, sau đó ta dùng phương pháp
nén về không gian trong những bức ảnh sai khác này. Nói một cách cụ thể, nguyên
lý chung của các chuẩn nén là phỏng đoán trước chuyển động của các frame ở bộ mã
hoá. Mỗi frame ở tại một thời điểm nhất định sẽ có nhiều khả năng giống với các
frame đứng ngay trước và sau đó. Các bộ mã hoá sẽ tiến hành quét lần lượt những
phần nhỏ trong mỗi frame (marco blocks) và phát hiện ra marco block nào không
thay đổi từ frame này tới frame khác. Phía bên thu, tức bộ giải mã đã lưu trữ sẵn
những thông tin không thay đổi từ frame này tới frame khác, chúng được dùng để
điền thêm vào vị trí trống trong ảnh được khôi phục.
Tuy nhiên, do sự tương đồng giữa các frame là rất lớn, nên sự phát hiện ra các sai
lệch là rất khó. Do vậy ảnh khôi phục khó đạt được như ảnh gốc. Điều này đồng
nghĩa với việc chất lượng ảnh cũng tương tự như khi dùng chuẩn Wavelet và MJPEG,
nhưng dung lượng kênh truyền và không gian lưu trữ của các chuẩn nén H.26x và
MPEGx là nhỏ hơn (ví dụ như không gian lưu trữ của chuẩn H.263 nhỏ hơn Motion
JPEG từ 3 tới 5 lần). Sự khác biệt giữa các chuẩn nén này (như ở H.26x và MPEGx)
chủ yếu nằm ở khâu tiên đoán các frame mới và cách thức tính toán sai lệch giữa các
frame hiện tại và frame phỏng đoán. Chuẩn nén H.26x (gồm các thế hệ H.261,
H.262 và H.263 ), thường có tốc độ mã hoá tín hiệu thấp hơn MPEGx (khoảng 1.5
Mbit/s với độ phân giải hình 352 x 288) do dùng chủ yếu trong viễn thông. Trong khi
đó, chuẩn MPEG2 dùng cho thị trường giải trí có độ phân giải hình cao hơn, và mang
lại chất lượng hình ảnh tốt (cao hơn 1,5Mb/s với độ phân giải 352x288 hoặc 6Mb/s
cho phân giải hoàn chỉnh).
Sơ lược định dạng nén ảnh MPEG4
So với các chuẩn nén đã nêu ở trên, chuẩn MPEG4 là định dạng nén hình ảnh tiên
tiến nhất, đáp ứng những đòi hỏi về kỹ thuật cũng như phù hợp với nhiều loại thị

phân giải tinh. Bộ phận giải mã có thể đạt được độ phân giải hình mong muốn, tuỳ
theo những thông số như giải thông tần hiện có, hiệu su t máy và theo mong muốn
của người dùng.
Có hai loại VOL, loại thứ nhất mang đầy đủ chức năng của định dạng nén MPEG4,
loại còn lại với những chức năng được giảm bớt (VOL với header dạng ngăn). Loại
VOL này giúp bitstream tương thích với đường biên ở H.263.
VOP (video object plane)- ảnh đựoc mã hoá độc lập hoặc mã hoá trên cơ sở tham
khảo các ảnh khác qua khâu bù chuyển động ở bộ giải mã. Mỗi frame ảnh thông
thường có thể được biểu diễn bởi một VOP dạng chữ nhật.
Với chuẩn nén MPEG4, có 3 kiểu khác nhau để mã hoá cho khối ảnh.
1 . VOP được mã hoá độc lập. Trong trường hợp này VOP được mã hoá gọi là Intra
VOP (I-VOP).
2. VOP được tiên đoán qua kỹ thuật bù chuyển động nhờ một VOP khác đã được tiên
đoán trước đó. Đó là loại P-VOP (Predicted VOP).
3. VOP được tiên đoán dựa trên các VOP trước và sau nó thuộc dạng B-VOP ( Bi -
directiional Interpolated VOP).
B-VOP được thêm vào dựa trên I-VOP và P-VOP. Ngoài việc có thể nâng cao chất
lượng hình ảnh khi dùng, một ưu điểm khác của B-VOP là dùng kỹ thuật đa lớp thời
gian. Với kỹ thuật này, Frame dữ liệu hiển thị được tăng cường. Những lớp tăng
cường đưa thông tin vào giữa các lớp frame.
Định dạng nén ảnh MPEG4 hỗ trợ quá trình lượng tử hoá, do vậy cũng giúp đáp ứng
những đòi hỏi khác nhau về tốc độ bít. Lượng tử hoá đã có ở các chuẩn nén như
H263 và MPEG1, MPEG2. Bộ phận mã hoá ở định dạng nén mà Daicat tư vấn tương
thích với những bộ mã hóa trước đây trong các chuẩn nén


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status