bài giảng truyền thông đa phương tiện - Pdf 26

Truyền thông đa phương tiện Hoàng Tuấn Hảo
BÀI GIẢNG
TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
MỤC LỤC
Chương 1 Tổng quan về truyền thông đa phương tiện 4
1.1 Truyền thông đa phương tiện 4
1.1.1 Các thành phần của hệ thống truyền thông đa phương tiện 4
1.2 Dữ liệu đa phương tiện 5
1.3 Truyền dữ liệu đa phương tiện 6
1.4 Các phương pháp truyền dữ liệu đa phương tiện 8
1.4.1 Mô hình download 8
1.4.2 Mô hình Streaming 9
1.4.3 So sánh các phương pháp truyền dữ liệu đa phương tiện 11
1.5 Các thách thức khi xây dựng một hệ thống truyền thông đa phương tiện 12
Chương 2 Các phương pháp nén dữ liệu đa phương tiện 13
2.1 Phương pháp nén ảnh 13
2.1.1 Phương pháp nén ảnh JPEG 13
2.1.1.1 Quá trình nén JPEG 14
2.1.1.2 Giải nén JPEG 20
2.2 Phương pháp nén Audio 22
2.3 Phương pháp nén Video 22
2.3.1 Khái quát về H264 23
2.3.1.1 H264 hoạt động như thế nào? 23
2.3.1.2 H264 trong thực tế 26
Chương 3 Công nghệ lưu trữ và thu hồi dữ liệu đa phương tiện 26
3.1 Cấu trúc và mô hình đĩa cứng 27
3.2 Sự lập lịch trình trên đĩa 27
3.3 Cải thiện thông lượng đĩa 28
3.4 Lưu trữ và thu nhận dữ liệu trên nhiều đĩa 28
3.4.1 Phân vùng và replication 28
3.4.2 Disk striping 28

4.4 Các giao thức truyền thông đa phương tiện sử dụng trong thiết lập cuộc gọi 43
4.4.1 Giới thiệu về SIP 43
4.4.2 Các thực thể trong SIP 48
4.4.2.1 SIP User agents 49
4.4.2.2 Proxy Server 49
4.4.2.3 Redirect Server 49
2 Bộ môn An Ninh Mạng - HVKTQS
Truyền thông đa phương tiện Hoàng Tuấn Hảo
4.4.2.4 Registrar Server 49
4.4.3 Các tin nhắn tạo phiên 50
4.4.3.1 Các kiểu tin nhắn (Message Type) 50
4.4.3.2 Cấu trúc của tin nhắn 51
4.4.3.3 Ví dụ một số message 52
4.4.4 Tương tác giữa các thực thể SIP 55
4.4.4.1 Tạo và ngắt phiên 55
4.4.4.2 Chuyển hướng gọi. Call Redirection 56
4.4.4.3 Call Proxying 57
4.4.5 Giao thức mô tả phiên SDP 58
4.4.6 Hệ thống máy phục vụ của SIP (SIP Servers) 59
4.4.6.1 SIP server là gì? 59
4.4.6.2 Registrar Server 59
4.4.6.3 Redirect Server 59
4.4.6.4 Proxy Server 59
Chương 5 Một số ứng dụng truyền thông đa phương tiện 64
5.1 Voice over IP 64
5.2 Video over IP 64
5.3 Video conferrencing 64
5.4 Television over IP 64
5.5 Video on demand 64
5.6 Interactive TV 64

Truyền thông đa phương tiện Hoàng Tuấn Hảo
Hình 1.1 Sơ đồ khối cơ bản của 1 hệ thống đa phương tiện
Đặc trưng duy nhất của mô hình hệ thống này là: Các thành phần của hệ thống sẽ thực
hiện công việc một cách tuần tự theo các bước trong quá trình truyền dữ liệu. Do đó, nếu 1 thành
phần hoạt động không tốt sẽ ảnh hưởng tới toàn bộ hệ thống.
Tóm lại, các thành phần của hệ thống truyền thông đa phương tiện bao gồm:
• Dữ liệu đa phương tiện
• Hệ thống lưu trữ
• Bộ đệm
• Mạng truyền thông
• Thiết bị xử lý, hiển thị
1.2 Dữ liệu đa phương tiện
Dữ liệu đa phương tiện cần được hiểu là nhiều loại dữ liệu sẽ được thu thập, gửi đi và hiển
thị một cách đồng thời. Có rất nhiều loại dữ liệu: đơn giản nhất là dữ liệu văn bản thô, văn bản
đã định dạng, và các dạng dữ liệu khác như ảnh đồ họa, âm thanh, video…
Ta có thể phân loại các loại dữ liệu trên ra thành 2 loại, theo ngữ cảnh của việc truyền dữ
liệu đa phương tiện.
- Loại thứ nhất: dữ liệu rời rạc (discrete media) gồm các loại dữ liệu mà khi hiển thị không
bị bó buộc chặt chẽ về thời gian. Ví dụ ta có thể nhận 1 bức ảnh từ web server để hiển thị
5 Bộ môn An Ninh Mạng - HVKTQS
Truyền thông đa phương tiện Hoàng Tuấn Hảo
trong web browser. Tùy theo thông lượng mạng mà thời gian nhận bức ảnh có thể nhanh
hay chậm trước khi nó được giải mã và hiển thị.
- Loại thứ 2: dữ liệu liên tục. Dữ liệu này có một yêu cầu chặt chẽ về thời gian hiển thị và
các thông tin này được nhúng bên trong dữ liệu. Ta có thể thấy ngay ví dụ đó là dữ liệu
video, audio. Dữ liệu video thường được mã hóa theo các frame được hiển thị tuần tự với
một tần số nào đó, ví dụ 25 hình/giây (frame per second fps). Do đó để hiển thị các đối
tượng video một cách đúng đắn, thì không chỉ cần nhận dữ liệu video một cách chính xác
mà còn cần phải giải mã và hiển thị chúng theo đúng trình tự và thời điểm. Nếu không
làm được điều đó thì video hiển thị sẽ bị hỏng, chất lượng thấp. Do đó lưu lượng mạng

Mô hình download được mô tả trong hình 1.4: Client gửi 1 yêu cầu tới server để chỉ ra đối
tượng dữ liệu cần download; server sẽ lấy đối tượng dữ liệu đó (có thể từ hệ thống file nội bộ)
và truyền nó tới client qua mạng dùng một số giao thức application/transport. Có thể lấy ví dụ
trong WWW.
Hình 1.4Tương tác giữa client và server trong mô hình download.
Đặc điểm của phương pháp: Trước tiên đối tượng dữ liệu phải được nhận về toàn bộ và
lưu trong bộ đệm hoặc file trước khi được giải mã và hiển thị. Khi đối tượng dữ liệu đã được
client nhận đầy đủ thì việc giải mã và trình diễn dữ liệu đó sẽ được thực hiện như trên hệ thống
file nội bộ của client. Mô hình này hoạt động tốt trong một số ứng dụng nhưng lại không phù
hợp với dữ liệu liên tục.
Giả sử quá trình download như trong hình 1.5 , bỏ qua thời gian xử lý, thời gian từ khi bắt
đầu yêu cầu đến khi có thể hiển thị được dữ liệu được tính theo kích thước của đối tượng dữ liệu
và tốc độ truyền. Với những ứng dụng như WWW thì dữ liệu thường là văn bản HTML, hoặc
ảnh nhỏ thì độ trễ này tương đối nhỏ.
Tuy nhiên, với đối tượng dữ liệu liên tục thì độ trễ có thể sẽ rất lớn, đến mức không chấp
nhận được. Ví dụ, một dữ liệu video thời lượng 2 giờ được nén MPEG2 với tần só bit trung bình
6Mbps sẽ có kích thước khoảng 5.4GB. Và truyền đi trong mạng với tốc độ 8Mbps thì người
dùng sẽ phải chờ khoảng 1.5 giờ trước khi có thể xem video.
8 Bộ môn An Ninh Mạng - HVKTQS
Truyền thông đa phương tiện Hoàng Tuấn Hảo
Hình 1.5Thời gian bắt đầu trễ trong mô hình download
Nhược điểm cơ bản của mô hình download (được thể hiện trên hình 1.6) là nó yêu cầu
phải download toàn bộ đối tượng video về thì mới bắt đầu xem được. Trong khi đối với nhiều
loại dữ liệu rời rạc thì yêu cầu này là cần thiết, thì dữ liệu liên tục như video có đặc trưng là một
phần dữ liệu của nó có thể được giải mã(decoded) và hiển thị (play back). Dữ liệu video được
cấu thành từ các frame, và ta có thể xem khi toàn bộ dữ liệu của 1 frame được client nhận về.
Hình 1.6 Thời gian trễ để download 5.4 GB video
Từ đặc điểm này mà người ta có thể cải tiến mô hình download thành mô hình Streaming
như sau:
1.4.2 Mô hình Streaming

clients một cách tuần tự hoặc phục vụ đồng thời. Nếu phục vụ tuần tự thì các client thứ 2 trở đi
trong hàng đợi sẽ phải chờ rất lâu mặc dù thông lượng mạng có thể rất lớn. Nếu phục vụ đồng
thời thì thông lượng mạng dành cho từng client sẽ giảm do đó sẽ kéo dài thời gian download.
Ngược lại, mô hình streaming sẽ không mắc phải vấn đề này, quá trình playback sẽ được
thực hiện ngay khi một đoạn dữ liệu đa phương tiện có thể giải mã (decodable) được nhận về
(Hình 1.8). Hơn nữa, dữ liệu truyền qua mạng chỉ cần với tốc độ dữ liệu của quá trình playback
(play-rate), nên thời gian chờ để bắt đầu play độc lập với số lượng client yêu cầu đồng thời miễn
sao media server và mạng không bị quá tải.
Hình 1.8 Multistream pipelining trong mô hình streaming
1.5 Các thách thức khi xây dựng một hệ thống truyền thông đa
phương tiện.
• Tính liên tục
• Các tham số biết và chưa biết
• Tương tác thời gian thực
• Hiệu quả
• Có thể mở rộng
12 Bộ môn An Ninh Mạng - HVKTQS
Truyền thông đa phương tiện Hoàng Tuấn Hảo
• Tính tin cậy
Chương 2 Các phương pháp nén dữ liệu đa phương tiện
Tổng quan về nén dữ liệu đa phương tiện.
2.1 Phương pháp nén ảnh
Giới thiệu phương pháp nén ảnh JPEG.
Phương pháp nén ảnh JPEG được dùng phổ biến nhất để nén dữ liệu ảnh số. Với các hình
đồ họa đơn giản thì thường được nén phương pháp GIF, PNG.
2.1.1 Phương pháp nén ảnh JPEG
(Joint Photographic Expert Group) – Nhóm thành lập năm 1986 – phát hành chuẩn năm
1992 và năm 1994 là 1 chuẩn ISO 19018-1
Chuẩn mã hóa và giải mã JPEG
13 Bộ môn An Ninh Mạng - HVKTQS

Truyền thông đa phương tiện Hoàng Tuấn Hảo
trung tâm, ta cần trừ mỗi điểm ảnh đi 1 giá trị là 128. Các điểm ảnh sẽ nằm trong khoảng [-128,
127].
Bước tiếp theo, thực hiện biến đổi DCT theo công thức:
Trong đó :
• u là tần số không gian ngang , là số nguyên 0<=u <8
• v là tần số không gian dọc.

• g
x,y
là giá trị điểm ảnh ở tọa độ x, y
• G
u,v
là hệ số DCT tại tọa độ (u,v)
Nếu ta thực hiện phép biến đổi với ma trận trên và làm tròn các kết quả về số nguyên gần
nhất ta sẽ thu được:
16 Bộ môn An Ninh Mạng - HVKTQS
Truyền thông đa phương tiện Hoàng Tuấn Hảo
Giá trị lớn nhất tập trung ở góc trái trên . Đây gọi là hệ số DC (thành phần 1 chiều). 63 hệ
số còn lại gọi là các hệ số AC.
DCT biến đổi 64 điểm ảnh thành tổ hợp tuyến tính của 64 khối với chiều ngang là u, chiều
dọc là v.
DCT tạm thời làm tăng số bit của ảnh (16bit / hệ số). Tuy nhiên, ưu điểm của DCT là nó
có xu hướng tập trung các tín hiệu vào 1 góc trong ma trận kết quả. (như thấy ở trên). Đặc điểm
này được tận dụng triệt để ở giai đoạn lượng hóa (trình bày sau) nhằm giảm số bit cho 1 hệ số
xuống 8bit hoặc nhỏ hơn. Kết quả là
2.1.1.1.4 Lượng hóa
Mắt người nhìn có thể phân biệt sự biến đổi nhỏ của độ sáng trong một khoảng rộng,
nhưng không phân biệt tốt cường độ sáng khi độ sáng dao động với tần số lớn. Đặc điểm này
cho phép ta có thể giảm lượng thông tin của các thành phần tân số cao. Việc này có thể làm đơn

Trong chuẩn JPEG, tỷ lệ nén có thể thay đổi tùy theo yêu cầu bằng cách thay đổi số chia
trong quá trình lượng hóa. Với tỷ lệ nén 10:1 , ảnh sau nén và ảnh trước nén khó có thể phân
biệt bằng mắt thường. Với tỷ lệ nén 100:1 thì ảnh sau nén và anh trước nén có thể phân biệt rõ
ràng. Một tỷ lệ nén thích hợp sẽ tùy thuộc vào mục đích sử dụng bức ảnh.
2.1.1.2 Giải nén JPEG
Quá trình giải nén thực hiện ngược lại các bước ở quá trình nén.
20 Bộ môn An Ninh Mạng - HVKTQS
Truyền thông đa phương tiện Hoàng Tuấn Hảo
• Giải mã huffman , thu được ma trận hệ số của từng khối:
• Nhân từng phần tử với phần tử tương ứng trong ma trận lượng hóa ta thu được:
• Biến đổi ngược cosin rời rạc IDCT thu được ảnh

Cộng thêm 128 vào giá trị của từng điểm trong khối thu được khối giải nén:
21 Bộ môn An Ninh Mạng - HVKTQS
Truyền thông đa phương tiện Hoàng Tuấn Hảo
So sánh ảnh giải nén với ảnh gốc:
Lấy ảnh giải nén trừ đi ảnh gốc thu được ma trận lỗi:
Trong trường hợp này, trung bình lỗi của 1 pixel là:
2.2 Phương pháp nén Audio
Các phương pháp nén: PCM, LPC, GSM, acc (facc)
2.3 Phương pháp nén Video
Chuẩn nén mới: H264 (AVC – advance video coding hay MPEG4 – part 10), các ưu điểm
so với các chuẩn nén trước đó.
22 Bộ môn An Ninh Mạng - HVKTQS
Truyền thông đa phương tiện Hoàng Tuấn Hảo
2.3.1 Khái quát về H264.
H264 là chuẩn công nghiệp trong nén video – một quá trình biến đổi dữ liệu video số về 1
định dạng chiếm ít dung lượng hơn để lưu trữ hoặc truyền đi. H264 được công bố đầu tiên năm
2003, xây dựng dựa trên các chuẩn trước đó như MPEG2, MPEG4 với mục đích tăng hiệu quả
nén, tăng tính mềm dẻo trong nén video, truyền video và lưu trữ video

nén. Các giá trị đó gồm:
+ Các hệ số đã lượng hóa
+ Thông tin cho phép bộ giải mã có thể tái tạo quá trình dự đoán.
+ Thông tin về cấu trúc của dữ liệu đã nén và công cụ dùng trong quá trình mã hóa.
+ Thông tin về thứ tự đầy đủ của các frame.
Các giá trị và tham số này (gọi là các thành phần cú pháp H264) được chuyển thành dữ
liệu nhị phân và dùng phương pháp nén “variable length coding” và /hoặc “arithmetic coding”.
Dòng bit nén này có thể được lưu trữ lại hoặc truyền đi.
- Quá trình giải mã
Giải mã dòng bit
Giải lượng hóa và biến đổi ngược
Tái tạo các frame.
25 Bộ môn An Ninh Mạng - HVKTQS

Trích đoạn Giới thiệu về SIP Cấu trúc của tin nhắn
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status