Tìm hiểu kỹ thuật nén trong truyền hình số luận văn tốt nghiệp đại học - Pdf 32

Trờng đại học vinh

Khoa điện tử viễn thông

đồ án

tốt nghiệp đại học
Đề tài:

Tìm hiểu kỹ thuật nén trong
truyền hình số

Giảng viên hớng dẫn : Th.S. Đặng thái sơn
Sinh viên thực hiện
: Trần Hữu thắng
Lớp
: 47K - ĐTVT
Niên khóa
: 2006 - 2011

Vinh, 2011

LỜI NÓI ĐẦU
Ngày nay, chương trình truyền hình ngày càng giữ vai trò không thể
thiếu trong đời sống xã hội. Sự phát triển của khoa học kỹ thuật đã trải qua
nhiều bước chuyển biến lớn, hệ thống truyền hình cũng thay đổi theo từng
giai đoạn phát triển.
Trong những năm gần đây công nghệ truyền hình đang chuyển sang
một bước ngoặt - quá trình chuyển đổi từ công nghệ Analog sang công nghệ
Digital. Quá trình đó là một cuộc cách mạng, nó làm thay đổi cách suy nghĩ,

Chương 2 : Tổng quan về nén
Trong chương này, chúng ta đã tìm hiểu sâu hơn về các kỹ thuật được
sử dụng để nén tín hiệu, các mã được dùng trong các thuật toán nén. Qua đó,
rút ra nén ảnh là quá trình sử dụng các phép biến đổi để loại bỏ đi các loại dư
thừa và loại bỏ tính có nhớ của nguồn dữ liệu, tạo ra nguồn dữ liệu mới có
lượng thông tin nhỏ hơn. Đồng thời sử dụng các dạng mã hoá có khả năng tận
dụng xác suất xuất hiện của các mẫu sao cho số lượng bít sử dụng để mã hoá
một lượng thông tin nhất định là nhỏ nhất mà vẫn đảm bảo được chất lượng
theo yêu cầu.
Chương 3: Nén video theo chuẩn MPEG
Trong chương này, chúng ta đã tìm hiểu về các chuẩn nén MPEG sử
dụng để nén video. Đó là chuẩn nén MPEG - 1, MPEG – 2, MPEG – 4. Qua
đó ta thấy, MPEG không phải là một công cụ nén đơn lẻ mà ưu điểm của nén
ảnh dùng MPEG chính là ở chỗ MPEG có một tập hợp các công cụ mã hoá
chuẩn, chúng có thể được kết hợp với nhau một cách linh động để phục vụ
cho một loạt các ứng dụng khác nhau.

2

MỤC LỤC
LỜI NÓI ĐẦU...................................................................................................1
TÓM TẮT ĐỒ ÁN............................................................................................2
MỤC LỤC.........................................................................................................3
DANH SÁCH HÌNH VẼ..................................................................................5
DANH SÁCH BẢNG BIỂU.............................................................................7
CÁC THUẬT NGỮ VIẾT TẮT.......................................................................8
Chương 1. GIỚI THIỆU VỀ TRUYỀN HÌNH SỐ...........................................9
1.1. Mở đầu....................................................................................................9
1.2. Hệ thống truyền hình số.........................................................................9

3.4. Ghép kênh Audio – Video số theo tiêu chuẩn MPEG – 2....................64
3.4.1. Hệ thống truyền tín hiệu MPEG – 2..............................................64
3.4.2. Dòng dữ liệu đóng gói, dòng chương trình và dòng truyền tải.....66
3.4.3. Dòng truyền tải MPEG – 2............................................................70
3.4.4. Định thời và đồng bộ sử dụng dòng truyền tải MPEG – 2............77
KẾT LUẬN.....................................................................................................80
TÀI LIỆU THAM KHẢO...............................................................................81

4

DANH SÁCH CÁC HÌNH VẼ
Hình 1.1. Sơ đồ khối hệ thống truyền hình số.................................................10
Hình 2.1. Sơ đồ nén và giải nén......................................................................14
Hình 2.2. Bộ mã hóa DPCM...........................................................................18
Hình 2.3. Bộ giải mã DPCM...........................................................................19
Hình 2.4. Quá trình mã hoá chuyển đổi hai chiều...........................................20
Hình 2.5. Quá trình giải mã chuyển đổi hai chiều...........................................20
Hình 2.6. Véc tơ chuyển động giữa hai khung kế tiếp....................................25
Hình 2.7. Mã hoá, giải mã DPCM...................................................................28
Hình 2.8. Đặc tuyến của bộ đệm dữ liệu.........................................................34
Hình 2.9. Quét các hệ số DCT.........................................................................35
Hình 2.10. Nén ảnh theo công nghệ Transform Coding.................................38
Hình 2.11. Giải mã DCT.................................................................................39
Hình 2.12. Mã hóa DCT dự báo có bù chuyển động (Bộ mã hóa MPEG -2). 40
Hình 3.1. Cấu trúc Macroblock của các dạng lấy mẫu....................................46
Hình 3.2. Cấu trúc các nhóm ảnh....................................................................47
Hình 3.3. Cấu trúc dòng dữ liệu Video MPEG...............................................48
Hình 3.4. Bộ đệm dữ liệu................................................................................48
Hình 3.5. Cấu trúc lớp dữ liệu trong MPEG...................................................50

Bảng 3.1. Chuẩn nén MPEG...........................................................................43
Bảng 3.2. Dạng thức cơ bản của CSIF............................................................53
Bảng 3.3. Các tham số mặc định trong chuẩn MPEG – 1...............................54
Bảng 3.4. Dạng lớp của cú pháp dóng bít MPEG – 2.....................................60
Bảng 3.5. Các mức của kích cỡ ảnh................................................................63
Bảng 3.6. Các giá trị của số PID.....................................................................69

7

CÁC THUẬT NGỮ VIẾT TẮT
DVB-T Digital Video Broadcasting

Truyền hình số mặt đất

Terrestrial
Effective Radiater Power

Công suất phát xạ hiệu

Ultra High Frequency
Large Scale Integration
Very Large Scale Integration
Variable Length Coding
Run Length Coding
Linear Predictive Transfrom

dụng
Sieu cao tần
Mạch tích hợp cỡ lớn

ISO

Hoa Kỳ
Internationnal Standards Organization Tổ chức tiêu chuẩn quốc

ITU

tế
Telecommuniccation Liên minh Viễn thông

ERP
UHF
LSI
VLSI
VLC
RLC
LPT
DPCM
DCT
KL
MAD
MSD

Internationnal
Union

Quốc tế

Chương 1.

hình
tương tự

Biến
đổi
A/D

T/h
Truyền

Mã
hoá
nguồn

hình
số

Mã
hoá
kênh

Điều
chế số

Thiết bị thu
T/h
Truyền
hình
tương tự

phân hệ tương ứng để thực hiện mã hoá và nén tín hiệu.
- Dòng tín hiệu số sau đó được ghép kênh với tín hiệu điều khiển phụ
tại bộ ghép kênh thành một dòng truyền. Dòng tín hiệu này được
ghép mã truyền dẫn, mã kênh và điều chế trước khi đưa ra Anten
phát.
+ Phía thu:
- Quá trình xử lý của hệ thống thu ngược lại với quá trình xử lý của
hệ thống phát. Tín hiệu cao tần thu qua bộ tunenr được giải điều chế
cao tần. Tín hiệu tần số thấp được giải mã hoá kênh, giải mã truyền
dẫn rồi đưa đến bộ giải mã ghép kênh. Tín hiệu được đưa đến bộ
10

giải mã ghép kênh được đến bộ chuyển đổi D/A của Audio và Video
và đưa đến máy thu phát tương tự.
1.2.2. Đặc điểm của truyền hình số
a. Yêu cầu về băng tần
Yêu cầu về băng tần là một sự khác nhau rõ nhất giữa truyền hình số và
truyền hình tương tự. Truyền hình số yêu cầu băng tần rộng hơn
b. Tỷ lệ công suất/ Công suất tạp âm (Signal/Noise )
Một trong những ưu điểm lớn nhất của tín hiệu số là khả năng chống
nhiễm trong quá trình xử lý tại các khâu truyền dẫn và ghi.
Với truyền hình số, nhiễu là các bít lỗi. (VD. Xung “on” chuyển
thành “off”).
Nhiễu trong truyền hình số được khắc phục nhờ các mạch và các mã
sửa lỗi. Bằng các mạch này có thể khôi phục lại các dòng bít như ban đầu.
Khi có quá nhiều bít lỗi, sự ảnh hưởng của nhiễu được làm giảm bằng cách
che lỗi.
Tuy nhiên, trong truyền hình quảng bá, truyền hình số gặp phải vấn đề
khó khăn khi thực hiện kiểm tra chất lượng ở các điểm trên kênh truyền. Tại

g. Hiệu ứng bóng ma (Ghost)
Hiện tượng này xảy ra trong hệ thống tương tự do tín hiệu truyền đến
máy thu theo nhiều đường. Việc tránh nhiễu đồng kênh của hệ thống số cũng
làm giảm đi hiện tượng này trong truyền hình quảng bá.
1.2.3. Ưu điểm của truyền hình số
Những năm gần đây các hãng và các tổ chức đang tập trung nghiên
cứu, thiết kế để đưa ra hệ thống truyền hình số. Truyền hình số đang dần trở
thành hiện thực và sẽ dần thay thế hệ thống truyền hình tương tự với các ưu
điểm nổi trội như sau:
- Tín hiệu số ít nhạy với các dạng méo xảy ra trên đường truyền.
12

- Ít bị tác động của các nhiễu so với truyền hình tương tự.
- Có khả năng phát hiện lỗi và sửa sai.
- Tính linh hoạt, đa dạng trong quá trình xử lý tín hiệu (Có hệ số nén rất
lớn so với tín hiệu tương tự).
- Tính phân cấp (Kênh có thể được sử dụng chỉ phát một chương trình
độ phân dải cao hoặc một vài chương trình truyền hình tiêu chuẩn).
- Có thể truyền được nhiều loại hình thông tin khác nhau với cách xử lý
giống nhau.
- Tiết kiệm được năng lượng, cùng với một công suất phát sóng , diện
tích phủ sóng rộng hơn so với công nghệ truyền hình tương tự.
- Có thể khoá mã dễ dàng.
- Dễ dàng thích nghi với các bước chuyển tiếp sang tín hiệu độ phân
giải cao hoặc phát thanh với chất lượng CD.
- Thị trường đa dạng, có khả năng cung cấp nhiều loại hình dịch vụ cho
đông đảo khán giả hoặc từng cá nhân.
- Tính tương tác hai chiều.
- Cho phép thu di động.

nguồn)

Phát

Kênh truyền
dẫn
lưu trữ

Truyền dấn hay lưu trữ

Giải nén (giải
mã nguồn)

Thu

Hình 2.1. Sơ đồ nén và giải nén
c. Các thông số về nén
Tỉ số nén: Ví dụ 100Mbit/s nén 20Mbit/s (tỷ số nén 5:1)
Phần trăm nén: Ví dụ 100Mb/s nén 20Mb/s (tương đương nén 80%).
Số bít /Symbol: Ví dụ cần 8 bit/pixel nén 2 bit/pixel (tỷ số nén 4:1 %)

14

d. Bản chất của nén
Khác với nguồn dữ liệu một chiều như nguồn âm, đặc tuyến đa chiều
của nguồn ảnh cho thấy: Nguồn ảnh chứa nhiều sự dư thừa hơn các nguồn
thông tin khác. Đó là:
Sự dư thừa về mặt không gian (Spatial redundancy): các điểm ảnh kề
nhau trong một mành có nội dung gần giống nhau.

Thuật toán nén không tổn hao không làm suy giảm, tổn hao dữ liệu, do
đó ảnh được khôi phục hoàn toàn chính xác so với ảnh nguồn. Tỷ lệ nén
thông thường khoảng 2:1. Không thể đảm bảo cố định tỷ lệ nén do đó tốc độ
dữ liệu đầu ra thay đổi sẽ gây khó khăn cho việc lưu trữ và truyền thông.
Thuật toán nén có tổn hao chấp nhận loại bỏ một số thông tin không
quan trọng như các thông tin không quá nhạy cảm với cảm nhận của mắt
người để đạt hiệu quả nén cao hơn, do vậy ảnh khôi phục lại gần giống với
ảnh gốc. Thuật toán nén có tổn hao cho ta tỷ lệ nén cao hơn (có thể lên tới
100:1) có thể có một tỷ lệ nén cố định thích hợp cho việc truyền thông.
2.2. Một số dạng mã hóa sử dụng
2.2.1. Mã hoá VLC (Variable Length Coding) - Mã hoá Huffman
Trong các dạng mã hoá thì mã hoá Huffman là dạng được sử dụng phổ
biến nhất. Bảng mã Huffman có thể cho độ dài mã trung bình để mã hoá cho
một mẫu là nhỏ nhất do tận dụng được xác suất xuất hiện cao nhất sẽ được
gắn với một từ mã có độ dài ngắn nhất. Mặc dù có độ dài mã thay đổi song
mã Huffman vẫn có khả năng giải mã đúng do có thuộc tính tiền tố duy nhất
(không có bất cứ từ mã nào là phần đầu của từ mã tiếp theo).
Phương pháp mã hoá Huffman trở nên nặng nề khi số tin của nguồn
quá lớn. Trong trường hợp này, người ta dùng một biện pháp phụ để giảm nhẹ
công việc mã hoá. Trước tiên, liệt kê các tin của nguồn theo thứ tự xác suất
giảm dần. Sau đó ghép thành từng tin có tổng xác suất gần bằng nhau. Dùng

16

một mã để mã hoá các tin trong cùng một nhóm. Sau đó xem nhóm tin như
một khối tin và dùng phương pháp Huffman để mã hoá các khối tin. Từ mã
cuối cùng tương ứng với mỗi tin của nguồn gồm hai phần: Một phần là mã
Huffman và một phần là mã đều. Mã Huffman chỉ tối ưu khi đã biết trước xác
xuất của mã nguồn và mỗi biểu trưng của mã nguồn được mã hoá bằng số bit

hiện hành. Giá trị này gọi là giá “dự báo”.
- Loại bỏ đi tính “có nhớ” của nguồn tín hiệu bằng một bộ lọc đặc biệt
có đáp ứng đầu ra là hiệu giữa tín hiệu vào s (n) và giá trị dự báo cho nó.
- Thay vì lượng tử hóa trực tiếp các mẫu điểm ảnh, mã hóa dự đoán
lượng tử và mã hóa các “sai số dự báo” tại đầu ra bộ lọc.
“Sai số dự báo” là sự chênh lệch giữa trị dự báo và giá trị thực sự của
mẫu hiện hành. Do nguồn “sai số dự báo” là nguồn không có nhớ và chứa
đựng lượng thông tin thấp, nên số bít cần mã hóa sẽ giảm đi rất nhiều.
Phương pháp tạo điểm ảnh dựa trên tổng giá trị của các điểm dự đoán
và sai số dự báo gọi là “Điều xung mã vi sai - DPCM”.
e(k)
Lượng tử hoá

i(k)

i’(k)
i(k)

Bộ dự đoán

Hình 2.2. Bộ mã hóa DPCM

18

e(k)

i’(k)

+

Bởi vậy, có thể sử dụng bước lượng tử thô cho các hệ số ứng với tần số cao
mà không làm giảm sút chất lượng ảnh khôi phục.

q
p

Bpxq

Biến đổi
hai chiều

Lượng tử, mã
hoá entropy

Hình 2.4. Quá trình mã hoá chuyển đổi hai chiều

q

Giải mã
entropy

Biến đổi ngược
hai chiều

BpXq
p

Hình 2.5. Quá trình giải mã chuyển đổi hai chiều
Ảnh số được chia thành các khối cỡ pxq. Các khối này sẽ được chuyển

nghệ nén cần loại bỏ đi tính có nhớ của nguồn tín hiệu tức là thực hiện “giải
tương hỗ” (decorelation) giữa các điểm lân cận nhau.
Trong công nghệ nén “Điều xung mã vi sai” DPCM, quá trình giải
tương hỗ được thực hiện bằng một bộ lọc có đáp ứng đầu ra là một hiệu số
giữa các mẫu điểm liên tiếp đầu vào và một giá trị “dự báo” của mẫu điểm đó
tạo được dựa trên các giá trị mẫu lân cận theo một quy tắc nhất định.
+ Sai số dự báo (Prediction error):
Sai số dự báo: Là sự chênh lệch giữa giá trị dự báo và giá trị thực. Nó
không làm tổn thất thông tin dẫn đến suy giảm chất lượng ảnh. Giá trị sai số
này quyết định đến tốc độ bít giảm đi nhiều hay ít, tức ảnh hưởng đến hiệu
suất nén.
21

Bộ tạo dự báo có nhiệm vụ tạo ra giá trị điểm tiếp theo từ giá trị các
điểm đã truyền tải trước đó có được lưu trữ. Quá trình tạo dự báo càng tốt thì
sự sai khác giữa giá trị thực của mẫu hiện hành và trị dự báo cho nó (sai số dự
báo - yếu tố đánh giá chất lượng dự báo) càng nhỏ. Khi đó tốc độ dòng bít
càng được giảm nhiều.
Chất lượng tạo dự báo bằng màn hiển thị tín hiệu sai số dự báo, ảnh
tạo được càng đen tức giá trị tín hiệu này càng nhỏ và việc tạo dự báo
càng chính xác.
+ Tạo dự báo cho ảnh truyền hình - các phương thức thực hiện:
Dự báo cho ảnh truyền hình được thực hiện với dòng dữ liệu ảnh đơn
thuần (không chứa đựng tín hiệu âm thanh). Phương pháp quét điển hình
trong truyền hình là quét các dòng, các dòng không được quét liên tiếp nhau
mà chia làm hai mành: mành chẵn chứa thông tin của dòng chẵn, mành lẻ
gồm các dòng lẻ xuất hiện giữa hai mành chẵn liên tiếp nhau. Một khung
(frame) tương ứng với một ảnh sẽ gồm một mành chẵn và một mành lẻ kề
nhau. Từ phương pháp quét đó các phương pháp tạo dự báo sau:

Tương tự, tốc độ dòng bit của DPCM cùng với giá trị trung bình bình
phương sai số (MSE - mean square error) δ 2 (q) cho phép là:
R DPCM = (1/6)*10*log {δ 2DPCM / δ 2(q) }+C 2.
δ2DPCM là năng lượng một chiều tín hiệu sai số dự báo.
C 2 là hằng số phụ thuộc quá trình lượng tử hóa các biên độ vi sai.
Như vậy, RPCM - RRPCM = (1/6)*10*log {δ2DPCM / δ 2(q)}+C 1 - C 2.
Trong công nghệ DPCM do sử dụng mã hóa Entropy (mã hóa
Huffman) nên giá trị hằng số C 2 < C 1. Mặt khác, năng lượng tín hiệu ảnh δ2
PCM

là rất lớn hơn hăng lượng tín hiệu vi sai δ2 DPCM cho nên tốc độ dòng bít

giảm dần đi nhiều nếu sử dụng điều xung mã vi sai. Đó là hiệu suất nén của
công nghệ DPCM.

23

b. Lượng tử hóa sai số dự báo
Giá trị biên độ vi sai phụ thuộc vào tính chất ảnh. Trong vùng ảnh
thuần nhất, giá trị này thường nhỏ. Đối với các rìa ảnh và ảnh có nhiều chi
tiết, giá trị dự báo kém chính xác đi dẫn đến sai số dự báo sẽ tăng lên. Do
những đặc điểm này, nếu sử dụng bộ lượng tử hóa tuyến tính với một bước
lượng tử, sẽ gây nhiều lỗi:
- Tại vùng ảnh thuần nhất, giá trị dự báo vi sai xấp xỉ bằng 0, bước
lượng tử gây ra nhiễu hạt.
- Tại vùng ảnh có rìa hoặc nhiều chi tiết, bậc độ tương bản giữa các
điểm ảnh cao dẫn tới một số giá trị sai số dự báo lớn làm quá tải thang lượng
tử. Độ dốc tín hiệu giải mã không theo kịp độ dốc tín hiệu thực tế tại các rìa.
Bởi vậy các nét ảnh không rõ ràng.

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Tìm hiểu kỹ thuật nén trong truyền hình số luận văn tốt nghiệp đại học - Pdf 32

Tài liệu, ebook tham khảo khác

Học thêm