Đề cương ôn tập có đáp án
môn học Truyền Thông
Chuyên ngành báo chí
Hà nội, tháng 2/2014
Phần I: CÂU HỎI
Câu 1: Truyền thông đa phương tiện là gì? Lấy ví dụ về các ứng dụng trong truyền thông
đa phương tiện.
Câu 2: Vẽ sơ đồ, trình bày các thành phần của một mạng truyền thông đa phương tiện.
Nêu các đặc điểm của mạng truyền thông đa phương tiện. Các vấn đề chính trong truyền
thông đa phương tiện là gì?
Câu 3: Vẽ sơ đồ và trình bày quy trình nén và giải nén ảnh JPEG.
Câu 4: Trình bày thuật toán nén không mất thông tin Shannon-Fano. Lấy ví dụ minh họa
Câu 5: Trình bày thuật toán nén không mất thông tin Huffman. Lấy ví dụ minh họa?
Câu 6: Trình bày thuật toán mã hóa Run Length Encoding (RLE). Lấy ví dụ minh họa?
Câu 7: Trình bày sơ đồ và quá trình nén Video theo chuẩn MPEG-1
Câu 8: Trình bày các kỹ thuật mã hoá nguồn(có tổn thất thông tin) (gợi ý: gồm 3 loại cơ
bản là mã hoá chuyển đổi, mã hoá sai phân và lượng tử hoá vectơ).
Câu 9: Trình bày các giai đoạn chính trong xử lý ảnh
Câu 10: Trình bày nguyên tắc nén dữ liệu video
Câu 11: QoS trong truyền thông đa phương tiện là gì? Nêu các thông số, cách xác định
các thông số dùng để đánh giá QoS.
Câu 12: Kỹ thuật mã hóa video MPEG sử dụng những loại khung hình cơ bản nào? Nêu
đặc điểm của từng loại
Câu 13: Kỹ thuật mã hóa Entropy (không tổn thất thông tin) là gì, trình bày các kỹ thuật
thường dùng trong hệ thống xử lý video?
PHẦN II. ĐÁP ÁN
Câu 1: Truyền thông đa phương tiện là gì?
a. Khái niệm
Thuật ngữ đa phương tiện dùng để chỉ các thông tin như dữ liệu, tiếng nói, đồ họa,
hình ảnh tĩnh, âm thanh và phim ảnh được các mạng truyền đi cùng thời điểm.
Video cameraso
Các hệ thống giám sát video
Câu 2: Vẽ sơ đồ, trình bày các thành phần của một mạng truyền thông đa phương
tiện.
SƠ ĐỒ
CÁC THÀNH PHẦN
Các thành phần của một mạng truyền thông đa phương tiện bao gồm: Nguồn, Thiết bị
nguồn, Mạng truy cập, Các mạng xương sống, Mạng phân phối và Thiết bị cuối.
-Nguồn:
+Là bất cứ thông tin đa phương tiện nào
+ Nguồn là thông tin truyền đi thường được thể hiện dưới dạng số, mạng được
dùng để truyền thông tin số này là mạng truyền thông số
+Nó nén thông tin nguồn sao cho tỉ lệ truyền các bít dữ liệu tới kết nối mạng giữa
thiết bị nguồn và thiết bị cuối ở mức độ tối thiểu phù hợp nhất.
-Thiết bị nguồn:
+ Thiết bị nguần có nhiệm vụ đóng gói dữ liệu nhằm ngăn chặn việc mất gói dữ
liệu hoặc dấu thông báo lỗi ở thiết bị cuối.
-Thiết bị đích
+ Thiết bị đích có nhiệm vụ hiển thị hình ảnh hoặc âm thanh. Nó có khả năng thay
đổi, linh động các cách thức hiển thị hình ảnh hoặc âm thanh tới người dùng
-Thiết bị đầu cuối
+ Thiết bị đầu cuối như máy tính cá nhân, điện thoại, hoặc các phương tiện hỗ trợ
cá nhân kỹ thuật số cũng có ảnh hưởng khá lớn đến truyền thông đa phương tiện
+ Thiết bị đầu cuối sẽ có các hình dạng và kích cỡ và được yêu cầu để chứa đầy đủ
các nhiệm vụ có khả năng hiển thị hình ảnh, âm thanh, đóng gói, giải nén dữ liệu . Do
đó thiết bị đầu cuối sẽ được phân loại theo đặc điểm như: nguồn xử lý (Nhắn tin, thoại,
dữ liệu, hình ảnh video), kích thước, trọng lượng, pin điện và pin, thiết bị đầu, thiết bị
đầu ra và tốc độ xử lý, đặc biệt khả năng xử lý tín hiệu, di động, và dễ di chuyển
-Mạng truy cập
+ Mạng truy cập có thể mô phỏng bằng một kết nối đơn như các loại Modem hay
giữa các điểm ảnh gần nhau nhỏ hơn
Quá trình nén ảnh
Bước 1: Qui tắc hóa (regularizing stage) làm cho ảnh có nhiều đoạn giống nhau
hơn thực tế
• Ảnh màu được chuyển sang dạng YUV (có thể bỏ qua bước này nhưng
sẽ làm giảm hiệu quả nén)
• Thông tin về độ sáng (Y-luminance) được tách rời với thông tin về độ
màu (U,V-chrominance) .Do mắt người nhạy cảm với Y hơn U, V (thực
hiện biến đổi làm mất nhiều thông tin của U, V hơn Y)
• Do thực tế là ảnh thường có nhiều vùng lớn có các điểm kề nhau rất
giống nhau về kênh màu
Bước 2: Lấy mẫu (subsampling) cho các kênh màu
• Loại bỏ có hệ thống các thông tin màu sắc đối với các hàng hoặc cột
điểm ở tỉ lệ cho trước
Ví dụ: cứ hai hàng loại bỏ một hàng và hai cột loại bỏ một cột, sẽ giảm được dữ
liệu màu đi 75%
Bước 3: sắp xếp lại dữ liệu bằng hàm toán học DCT
• Chia nhỏ ảnh thành các vùng 8x8 pixel (=64 pixel)
• Dùng DCT biến đổi 64 pixel thành ma trận có 64 hệ số thể hiện “thực
trạng” các pixel
• Hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khả năng đó
giảm rất nhanh với các hệ số khác (lượng thông tin của 64 pixel tập
trung chủ yếu ở một số hệ số).
• Biến đổi này có làm mất mát thông tin nhưng chưa đáng kể
Lược bớt (lượng tử hóa) sự khác nhau giữa các hệ số của ma trận nhận
được sau biến đổi DCT (mất nhiều thông tin) (chia cho giá trị k trong bảng
lượng tử)
Áp dụng phương pháp mã hóa của Huffman: Phân tích dãy số, các phần tử
lặp lại nhiều được mã hóa bằng ký hiệu ngắn (marker)
Quy trình giải mã (decompression): thực hiện ngược lại các bước trên
Gán cho mỗi nhóm ký hiệu mã 0 hoặc 1.
Tiếp tục phân chia cho tới khi trong các nhóm chỉ chứa một ký hiệu.
Từ mã cho ký hiệu là tổ hợp của các ký hiệu của các nhóm chứa ký hiệu
tính theo thứ tự từ lần tạo nhóm đầu tiên.
Ví dụ:
Ví dụ: Cho thông điệp “BBCAACADBDCADAEEEABAC
DBACADCBADABEABEAAA”
Tần suất xuất hiện của các ký tự trong thông điệp lần lượt bằng:
A: 15; B: 8; C: 6; D: 6; E: 5.
A: 00; B: 01; C: 10; D: 110; E: 111.
Số lượng bit dùng để chứa chuỗi mã:
2x15+2x8+2x6+3x6+3x5=91bit.
Nếudùng mã ASCII: 40x8=320bit
Tỷ lệ nén: 91/320 = 28%
Nhận xét chung:
1. Việc sắp xếp nguồn theo xác suất giảm dần cũng nhằm mục đích dẫn tới độ dài
trung bình của bộ mã là nhỏ.
2. Độ phức tạp của thuật toán phụ thuộc vào việc sử dụng thuật toán sắp xếp. Nếu sử
dụng thuật toán sắp xếp đệ quy thì độ phức tạp sẽ là
( log )O n n
.
3. Xuất phát từ thuật toán Shanon, ta có thể mở rộng cho việc tạo bộ mã với cơ số
m
bất kỳ bằng cách xác định lại độ dài
i
n
cũng như đổi các xác suất phụ sang dạng
m
phân.
4. Trong trường hợp khi có nhiều tin với xác suất bằng nhau thì bộ mã thu được có
o Cho phép thực hiện tốt với hình ảnh cũng như text.
o Tỷ lệ nén trung bình: 50%.
o Tốc độ nén nhanh.
Nhược điểm
o Trong một số tình huống khi tần suất là rất thấp, ta có thể không được
lợi một chút nào, thậm chí còn bị thiệt một ít bit.
o Bên nhận muốn giải mã được thông điệp thì phải có một bảng mã giống
như bảng mã ở bên gửi, do đó khi nén các tập tin bé hệ số nén không
được cao.
Ví dụ: cho thông điệp
“BCAACADBDCADAEEEABACDBACADCBADABEABEAAA”
o Tần suất xuất hiện A: 15; B: 7; C: 6; D: 6; E: 5.
o Từ mã gán cho các kí tự bởi mã Huffman: A: 0; B:100; C: 101; D:
110; E: 111
o Số lượng bit dùng để chứa chuỗi mã: 1x15+3x7+3x6+3x6+3x5=87
o Tỷ lệ nén: 87/320=27%
Câu 6: Phương pháp mã hóa loạt dài RLE (Run Length Encoding):
a) Thuật toán mã hóa Run Length Encoding (RLE).
Loại dư thừa đơn giản nhất trong một tập tin là các đường chạy dài gồm các
kí tự lặp lại, điều này thường thấy trong các tập tin đồ hoạ bitmap, các vùng dữ liệu
hằng của các tập tin chương trình, một số tập tin văn bản
Nguyên lý:
• Tối ưu hoá mã bằng cách thay thế các chuỗi ký tự giống nhau liên tiếp.
• Ứng dụng trong các loại ảnh BMP, TIFF. Các điểm ảnh liên tiếp có giá trị
như nhau sẽ được thay thế bằng một điểm ảnh và chỉ rõ số lượng điểm.
Các bước thuật toán:
• Tìm trong thông điệp những ký tự liên tiếp lặp lại.
• Thay thế chuỗi ký tự đó bằng:
o Một ký tự đặc biệt chỉ việc nén.
o Số lần lặp lại của ký tự.
liên ảnh. Trong thuật nén MPEG, quá trình xác định Vector chuyển động được thực
hiện bằng cách chia hình ảnh thành các Macro-Block, mỗi Macro-Block có 16 x 16
phần tử ảnh (tương đương với 4 Block, mỗi Block có 8 x 8 phần tử ảnh). Để xác định
chiều chuyển động, người ta tìm kiếm vị trí của Macro-Block trong ảnh tiếp theo, kết
quả của sự tìm kiếm sẽ cho ta Vector chuyển động của Macro-Block .
Nguyên lý nén MPEG:
Dạng thức đầu vào là Rec- 601 4:2:2 hoặc 4:2:0. Ảnh hiện tại được so sánh với
ảnh trước tạo ra ảnh khác biệt.
Ảnh này sau đó lại được nén trong ảnh qua các bước: biến đổi DCT, lượng tử hóa,
mã hoá. Dữ liệu của ảnh khác biệt và vector chuyển động (được xác định như trên) mang
thông tin về ảnh sau nén liên ảnh được đưa đến bộ đệm ở đầu ra.
Tốc độ bít của tín hiệu video được nén không cố định, phụ thuộc vào nội dung
ảnh đang xét (ví dụ một phần nén ít hơn hoặc nhiều hơn), nhưng tại đầu ra bộ mã hoá
dòng bít phải cố định để xác định tốc độ cho dung lượng kênh truyền.
Câu 7: Trình bày sơ đồ và quá trình nén Video theo chuẩn MPEG-
1(Ngọc)
MPEG-1
MPEG-1 là một chuẩn nén video và audio có suy hao. Nó được thiết kết để nén VHS
(Video Home System) – video số thô chất lượng tốt và audio CD xuống chỉ còn 1.5 Mbps (các tỷ
số nén lần lượt là 26:1 và 6:1) nhưng chất lượng giảm đi rất ít, có thể làm các VCD, TV số qua
đường cáp hoặc vệ tinh và quảng bá audio số.
Hiện nay, MPEG-1 đã trở thành định dạng audio/video suy hao có tính tương thích rộng
nhất trên thế giới, được ứng dụng trong rất nhiều sản phẩm và công nghệ. Có lẽ bộ phận nổi
tiếng nhất của chuẩn MPEG-1 chính là định dạng MP3.
MPEG-1 audio sử dụng psychoacoustics để giảm đáng kể tốc độ dữ liệu mà một chuỗi
audio yêu cầu. Nó giảm bớt hoặc loại bỏ hoàn toàn một vài phần của audio mà tai người không
thể nghe được, hoặc vì chúng nằm trong vùng tần số mà độ nhạy tai người bị giới hạn, hoặc bị
che khuất bởi các âm thanh khác (thường là âm to hơn).
Mã hóa kênh thì có 4 kiểu:
- Mono
512(Tầng I) hoặc 1024(Tầng II) điểm biến đổi Fouries nhanh(FFT- fast Fourier transform)
song song với sự phân tích subband. Đơn vị định vị bit(bit-allovation) quyết định việc lượng
tử hóa theo tốc độ truyền bit và các thông tin cảm nhận được từ mô hình psychoacoustic .
Tầng II giới thiệu thêm về nén so với tầng I thông qua ba sự cải biến. Đầu tiên, làm giảm các
thông tin tổng thể bằng cách loại bỏ sự dư thừa và không thích hợp giữa các hệ số co giãn của
3 khối liền kề với 12 mẫu. Thứ hai, cung cấp một bảng lượng tử hóa với độ chính xác được cải
thiện. Thứ 3, việc phân tích psychoacoustic sẽ giúp ích cho phép phân giải tần số tốt hơn bởi
vì kích thước FFT tăng.
II.2.1.2 MPEG-1 lớp III
Mã hóa âm thanh MPEG-1 lớp III được giới thiệu với nhiều tính năng mới, đặc biệt là lai
một dãy lọc(Filter-bank) đó là một tầng của hai filterbank. Để thuận tiện, ban đầu filterbank
được gán nhãn mức lai đầu tiên tầng III và sau đó là mức lai thứ hai tầng III. Sơ đồ khối của bộ
mã hóa Layer III được đưa ra trong Hình 2
Hình 1: Mã hóa âm thanh MPEG-I tầng 1 và II
Hình 2: Mã hóa âm thanh MPEG-1 lớp III
Tầng III cung cấp một sự phân giải tần số cao bằng cách phân chia 32 tín hiệu phân giải
cùng với 18 điểm biến đổi cosine rời rạc(MDCT). Hơn nữa, kích thước khối biến đổi sẻ giúp
thích nghi với tín hiệu đảm bảo sự cân bằng giữa thời gian và độ phân giải tần số. Sự lượng tử
hóa không đồng dạng phối hợp với sự thay đổi chiều dài mã giúp tiết kiệm hơn tốc độ truyền bít.
Một tính năng đặc biệt của lớp III gọi là “hồ chứa bit”(bit reservoir); nó cung cấp các phương
tiện truyền tải tốt phù hợp hơn với yêu cầu về thời gian khác nhau của bộ mã hóa trên tầng bit
mã. Việc mã hóa có thể cho các bit tới một hồ chứa khi nó cần ít hơn trung bình số của các bit để
mã hóa các mẫu trong một khung. Nhưng trong trường hợp các tín hiệu âm thanh rất khó để nén,
bộ mã hóa có thể mượn bit từ hồ chứa để nâng cao độ trung thực.