Nghiên cứu khả năng ứng dụng mã hóa video SVC h 264 cho truyền tải video trên hệ thống thông tin di động LTE - Pdf 10


HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Nguyễn Quốc Chính
NGHIÊN CỨU KHẢ NĂNG ỨNG DỤNG
MÃ HÓA VIDEO SVC/H.264 CHO TRUYỀN TẢI
VIDEO TRÊN HỆ THỐNG THÔNG TIN DI ĐỘNG LTE
Chuyên ngành: KỸ THUẬT ĐIỆN TỬ
Mã số: 60.52.70

TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI – NĂM 2013


TẢI VIDEO TRÊN MẠNG 4G
Sự phát triển vượt bậc về công nghệ đã thúc đẩy xu hướng hội tụ công nghệ cố
định và di động, dịch vụ viễn thông và công nghệ thông tin, tích hợp các thiết bị đầu
cuối trở thành hiện thực. Nhu cầu sử dụng các dịch vụ đa phương tiện trên các thiết
bị đầu cuối di động đã và đang bùng nổ trong những năm gần đây, điều này thúc
đẩy việc nghiên cứu phát triển các hệ thống thông tin di động tế bào băng rộng như :
LTE, WiMAX,…Trong đó, công nghệ LTE được các nhà khai thác di động ở Việt
Nam (Viettel, VNPT,…) khá quan tâm và đã triển khai thử nghiệm do khả năng
tương thích ngược với các hệ thống di động hiện có GSM và WCDMA/UMTS.
Có rất nhiều nghiên cứu xảy ra trong truyền video trực tuyến (streaming
video) không dây từ góc độ khác nhau. Hiện nay, bộ mã hóa H.264/AVC được sử
dụng cho các dịch vụ video di động khác nhau. Tuy nhiên, xét tính chất không đồng
nhất của màn hình hiển thị, khả năng tính toán khác nhau của thiết bị di động, và
các điều kiện mạng không đồng nhất, SVC mở rộng của H.264 là một cách tiếp cận
đầy hứa hẹn để cung cấp những nội dung khả năng điều chỉnh cho các ứng dụng di
động trong tương lai.
1.1. Các công nghệ không dây thế hệ thứ 4
1.2. LTE và OFDMA
Mạng LTE bao gồm mạng truy nhập và mạng lõi, được biết đến như mạng
truy cập vô tuyến mặt đất UMTS phát triển (E-UTRAN) và lõi gói phát triển
(Evolved Packet Core - EPC
Hệ thống truy nhập vô tuyến mặt đất UMTS phát triển (E-UTRA) của LTE
sử dụng OFDMA cho đường xuống và FDMA sóng mang đơn (SCFDMA) cho
đường lên.

2

1.3. Các giao thức trên giao diện vô tuyến LTE
1.4. Phân phối video qua mạng LTE


để cung cấp khả năng điều chỉnh của mã hóa video. Trong lớp truyền tải, khả năng
phục hồi lỗi bit là một kỹ thuật chỉnh sửa và truyền các gói với lỗi bít tới các lớp
cao hơn thay vì loại bỏ chúng. Đối với các lớp mạng, các vấn đề chính là tạo ra
tuyến truyền tải video, lựa chọn nút chuyển tiếp và cấp phát tài nguyên để phân
phối các dòng H.264/AVC cho các nhóm người sử dụng trong mạng chuyển tiếp
với nguồn lực tối thiểu hoặc để phục vụ người dùng tối đa với một quỹ tài nguyên
hạn chế. Trong thiết kế cross-layer, thông tin từ lớp ứng dụng, lớp MAC và lớp vật
lý được cùng xem xét để cải thiện hiệu quả phân phối video qua mạng. Cuối cùng,
khả năng thiết bị đầu cuối cũng là một vấn đề quan trọng trong thông tin liên lạc
không dây vì giải mã video đòi hỏi khả năng tính toán mạnh mẽ. Kiến trúc phần
cứng nâng cao của thiết kế SoC được đề xuất với công nghệ VLSI để tăng cường
phân phối video đến người dùng cuối.
Với khuôn khổ hạn hẹp của luận văn này, tôi đi vào nghiên cứu về chuẩn mã
hóa video H.264/SVC và tìm hiểu được ưu điểm của phương pháp mã hóa này để
truyền video qua mạng di động 4G LTE. Từ đó, đề xuất áp dụng khi triển khai 4G
tại Việt Nam.4

CHƯƠNG II: TÌNH HÌNH TIÊU CHUẨN MÃ HÓA
VIDEO TIÊN TIẾN
2.1. Kỹ thuật nén video số
2.1.1. Khái niệm
2.1.2. Mô hình nén ảnh
2.2. Các đặc điểm của nén tín hiệu số
2.2.1. Xác định hiệu quả của quá trình nén ảnh số
2.2.2. Độ dư thừa số liệu
2.2.3. Sai lệch bình phương trung bình
2.3. Các phương pháp nén

Có lẽ lợi thế lớn nhất của H.264 hơn tiêu chuẩn trước đó là hiệu quả nén của
nó. So sánh với các tiêu chuẩn như MPEG-2 và MPEG-4 Visual, H.264 có thể cung
cấp:
Chất lượng hình ảnh tốt hơn ở cùng một bitrate nén, hoặc một bitrate nén
thấp hơn cho cùng một chất lượng hình ảnh.
2.9. Tổng kết
Nén video tiên tiến H.264/AVC là một tiêu chuẩn công nghiệp cho mã hóa
video mà nó định nghĩa một định dạng hoặc cú pháp nén video và một phương pháp
giải mã cú pháp này. Nó cung cấp một tập hợp các công cụ hoặc các thuật toán có
thể được sử dụng để cung cấp nén video hiệu quả, linh hoạt và mạnh mẽ cho một
phạm vi rộng các ứng dụng, từ các ứng dụng có độ phức tạp thấp, các ứng dụng
video di động bitrare thấp tới các dịch vụ truyền hình quảng bá độ nét cao.
2.10. Tiêu chuẩn mã hóa SVC
Sự phát triển của mã hóa video có khả năng điều chỉnh (Scalable Video
Coding - SVC) mở rộng cho H.264, chuẩn hóa theo tiêu chuẩn H.264/SVC. SVC hỗ
trợ mã hóa cho video theo một cách mà nhiều phiên bản của các tín hiệu video có

6

thể được giải mã ở một loạt các bitrate, độ phân giải không gian và / hoặc độ phân
giải thời gian và tốc độ khung hình có hiệu quả. Bằng cách kết hợp nhiều phiên bản
mã hóa, nó có thể được phân phối theo cách hiệu quả hơn so với phương án mã hóa
và truyền mỗi phiên bản riêng biệt.
H.264/SVC được đưa ra trong Phụ lục G của H.264/AVC và H.264/SVC có
05 profiles trong tổng số 21 profiles của AVC.
2.10.1. Truyền tải Simucast (Simucast transmission)
2.10.2. Truyền tải có khả năng điều chỉnh (Scalable transmission)

Hình 2.14. Các luồng có khả năng điều chỉnh
2.10.3. Ứng dụng của mã hóa video có khả năng điều chỉnh

2.10.7.1. Tổng quan về khả năng điều chỉnh không gian
2.10.7.2. Chi tiết khả năng điều chỉnh không gian

8

2.10.8. Chi tiết khả năng điều chỉnh chất lượng
2.10.9. Kết hợp các khả năng điều chỉnh (Combined scalability)
2.11.Kết luận
Sự khác biệt cơ bản giữa SVC và AVC là việc mã hóa các tín hiệu video
được thực hiện như là một tập các lớp. Các lớp khác nhau phụ thuộc vào nhau, tạo
thành một hệ thống phân cấp. Một lớp đặc biệt, cùng với các lớp mà nó phụ thuộc
vào cung cấp các thông tin cần thiết để giải mã tín hiệu video ở một độ trung thực
cụ thể (particular fidelity). Độ trung thực ở đây liên quan đến một hoặc nhiều độ
phân giải không gian, độ phân giải thời gian, hoặc tỉ lệ tín hiệu trên nhiễu (SNR).
Các lớp thấp nhất, tức là, lớp mà không phụ thuộc vào bất kỳ lớp nào khác, được
gọi là lớp cơ sở và cung cấp các mức chất lượng thấp nhất. Mỗi lớp bổ sung cải
thiện chất lượng của tín hiệu trong bất kỳ một trong ba chiều (không gian, thời gian,
hoặc SNR).
Theo thiết kế, một khía cạnh rất quan trọng của SVC là lớp cơ sở phù hợp
với AVC. Nói cách khác, lớp cơ sở của một tín hiệu SVC được giải mã bởi một bộ
giải mã AVC. Điều này đảm bảo một tín hiệu SVC là tương thích ngược với AVC,
mặc dù ở mức thấp hơn của độ trung thực so với tín hiệu đầy đủ nếu có liên quan
đến nhiều hơn một lớp. Lưu ý rằng một bộ mã hóa SVC không cần phải luôn luôn
tạo ra các luồng bít được mã hóa theo lớp - nếu nó hoạt động trong một môi trường
mà không cần thiết hoặc không yêu cầu phải có khả năng điều chỉnh thì nó có thể
tạo ra các luồng bít AVC truyền thống.

9

CHƯƠNG III: NGHIÊN CỨU ỨNG DỤNG SVC/H.264

lớp MAC làm rớt trong trạm cơ gốc để giảm nghẽn trong cả hai môi trường có dây
trong mạng lõi và môi trường không dây tới UE. Hầu hết các tài liệu hiện có thảo
luận về khả năng thích nghi xảy ra trong lớp MAC của trạm gốc. Tuy nhiên, làm rớt
các gói tin trong eNodeB không phải là một giải pháp chung cho nghẽn trong môi
trường không dây và các tuyến truyền dẫn trong một hệ thống LTE. Các gói tin bị
rớt trong eNodeB là sự lãng phí tài nguyên trong backhaul LTE và mạng lõi. Rớt
các khung hình video trong lớp truyền tải thời gian thực (RTP) của máy chủ video
làm giảm sự tắc nghẽn trong cả eNodeB và tuyến backhaul.
SVC là đặc biệt thích hợp cho multicast bởi vì nó tạo điều kiện cho việc cung
cấp các dòng phương tiện truyền thông (streaming media) tới một tập hợp các máy
thu với dung lượng kênh không đồng nhất. Khi một dòng video không khả năng
điều chỉnh cần phải được phân phối đến tất cả người dùng trong một nhóm
multicast, nó phải được truyền tại tốc độ của người sử dụng kém nhất (weakest)
trong nhóm.
Multicast/Broadcast đóng một vai trò rất quan trọng trong các dịch vụ giải
trí và các ứng dụng. Trong chế độ điểm - đa điểm của MBMS, một nhóm các thuê
bao MBMS dùng một kênh chung. Chúng chia sẻ tài nguyên thời gian và tần số
giống nhau cũng như sơ đồ điều chế và mã hóa giống nhau (MCS). Điều này nhấn
mạnh rằng để thực hiện đầy đủ các yêu cầu QoS, MCS đã được điều chỉnh tới thiết
bị đầu cuối yếu nhất của một nhóm thuê bao. Vì vậy, thích ứng với các sơ đồ MCS
tới các thiết bị đầu cuối yếu nhất là rất quan trọng để đáp ứng người sử dụng ở cạnh
tế bào. SVC cung cấp một lựa chọn hấp dẫn cho việc gửi cùng một đoạn video trong
nhiều lớp như lớp cơ sở và các lớp nâng cao. Tiếp nhận các lớp cơ sở là đủ cho chất
lượng cơ bản của video, và lớp tăng cường thêm vào để cung cấp chất lượng video
nâng cao. Điều này có thể được sử dụng trong dịch vụ MBMS cell đơn (single-cell
MBMS) để cung cấp chất lượng cơ bản cho người sử dụng ở cạnh tế bào hoặc
người sử dụng có chất lượng kênh thấp và để cung cấp video chất lượng cao cho
người sử dụng chất lượng kênh cao. Trong đặc tả kỹ thuật 3GPP phiên bản 8, truyền
dẫn MBMS được phân loại thành truyền dẫn cell đơn và truyền dẫn mạng tần số


tập thời gian thông qua truyền lại. Mặc dù các sơ đồ ARQ và HARQ đã được sử
dụng rộng rãi để cung cấp truyền tải đáng tin cậy trong các mạng không dây, nhưng
chúng có những điểm yếu sau đây: Đầu tiên, các sơ đồ ARQ và HARQ không đảm
bảo chất lượng phương tiện truyền thông cho dịch vụ trực tuyến đa phương tiện
bằng cách sử dụng chương trình mã hóa SVC, bởi vì chúng không xem xét các đặc
điểm truyền thông cơ bản như mức độ ưu tiên của các khung hình phương tiện. Thứ
hai, các sơ đồ ARQ và HARQ gây ra kết quả trễ cao trong việc phân phối dữ liệu và
thông lượng hệ thống thấp, bởi vì chúng hoạt động độc lập. Các tiêu chuẩn LTE xác
định các thông số có liên quan đến các bộ định thời phát lại ARQ và phản hồi
HARQ.
Để khắc phục được hai hạn chế trên, trong tài liệu [11], các tác giả đã giới
thiệu sơ đồ điều khiển dữ liệu nhận thức mạng và ưu tiên PNDC (Priority and
Network-aware Data Control) để tăng cường chất lượng của luồng dịch vụ sử dụng
công nghệ mã hóa SVC truyền tải qua mạng không dây LTE. Sơ đồ này thực hiện
điều khiển số truyền dẫn lại HARQ trong lớp MAC thấp hơn trên cơ sở ưu tiên của
các khung SVC. Đồng thời, nó cũng điều chỉnh động bộ định thời truyền dẫn lại
ARQ trong lớp điều khiển liên kết vô tuyến RLC (Radio Link Control) theo sự
tương tác giữa HARQ và ARQ thích ứng.
Còn trong luận văn [9], tác giả đã đề xuất một sơ đồ truyền tải lại HARQ
thích ứng nhận thức nội dung để tăng chất lượng video tại máy thu của người sử
dụng. Điều này đạt được bằng cách đếm việc truyền tải lại theo sự quan trọng của
các gói video. Hơn nữa, việc đếm truyền tải lại chỉ thực hiện cho các khung video
quan trọng để tăng tỷ lệ thành công của các khung đó. Đối với những người sử dụng
ở điều kiện kênh không thuận lợi, sơ đồ đề xuất tăng cường chất lượng video nhận
được thêm 8%. Ưu điểm chính của sơ đồ này là các lợi ích của nó là sự gia tăng
không đáng kể của trễ và không đòi hỏi tính toán mở rộng tại thiết bị người sử

13

dụng. Đồng thời, tác giả cũng đề xuất một chế độ hoạt động của RLC là chế độ lai

14

và nhiều người sử dụng của hệ thống OFDM được sử dụng cho các phương pháp
được đề xuất. Tác giả của [18] giới thiệu sơ đồ luồng video có khả năng điều chỉnh
đa người sử dụng bị ràng buộc bởi lưu lượng và trễ mà nó cải thiện méo đầu cuối –
tới – đầu cuối (end-to-end) trung bình của luồng video được truyền so với các chiến
thuật trực tuyến truyền thống (traditional streaming strategies). Lưu lượng luồng
video khả năng điều chỉnh phân phối trong môi trường mạng IP / UMTS được thảo
luận trong [40]. Dựa trên nội dung của mỗi gói tin, các ưu tiên được gán dựa vào tác
động tổn thất suy giảm của mỗi gói tin trên chất lượng video đầu cuối – tới – đầu
cuối (end-to-end) trong bài báo này. Mỗi lớp có một phạm vi ưu tiên, và mỗi gói có
ưu tiên khác nhau theo tải trọng của nó. Các gói tin có chứa dữ liệu của một khung-I
được đánh dấu với xác suất rớt thấp nhất, các gói tin có chứa dữ liệu của một
khung-P được đánh dấu với xác suất rớt trung bình và những gói tin chứa dữ liệu
của một khung-B được đánh dấu với xác suất rớt cao .
Việc phân tích và thiết kế của các bộ lập biểu nhận biết kênh (channel-aware
schedulers) cho unicast đã nhận được quan tâm đáng kể trong cộng đồng nghiên
cứu. Tuy nhiên, với sự gia tăng của các dịch vụ truyền hình di động, video multicast
được dự kiến sẽ tăng thị phần của mình trong tải lưu lượng truy cập của mạng di
động. Các thuật toán lập biểu mới cho việc phân phối video multicast của dòng
video SVC trong các mạng không dây đã được nghiên cứu trong [44]. Nếu phân bổ
tài nguyên trong một nhóm Multicast là tĩnh, các tài nguyên sẽ bị lãng phí hoặc
cuộc gọi sẽ bị chặn dẫn đến chất lượng thấp hơn. Sơ đồ phân bổ băng thông động
cho các mạng WiMAX di động dựa trên SVC được thảo luận trong [21]. Thuật toán
này mới đề xuất các phương pháp để giải quyết vấn đề này. Cuộc gọi mới, chuyển
giao cuộc gọi, và các cuộc gọi chuyển động được đưa vào tài khoản cho chiến lược
phát thanh quản lý tài nguyên để đạt được kết quả tối ưu. Dựa trên các SNR nhận
được của mỗi trạm thuê bao (SS), các trạm gốc điều chỉnh profiles burst (lý lịch
burst) bằng cách sử dụng bộ giải mã SVC để cải thiện chất lượng hình ảnh và thông
lượng hệ thống. Lưu lượng được xử lý bởi một thuật toán lập biểu vòng robin được

16 Hình 3.4. So sánh thông lượng trung bình SVC và H.264
Kết quả được tổng hợp trong bảng 3.3.
Bảng 3.3. So sánh các video H.264 và SVC
Parameters H.264 CIF H.264 QCIF SVC CIF + QCIF

PSNR (dB) 50,37 32,11 50,81
Throughput 3.8 Mbps 1.2 Mbps 4.1 Mbps
Delay 4.3 ms 6.5 ms 7 ms
Jitter 27 µs 22 µs 34 µs
Từ kết quả mô phỏng đưa ra ở trên, chúng ta có thể thấy rằng multicast SVC
yêu cầu tốc độ dữ liệu ít hơn đáng kể (4,1 Mbps) so với simulcasting của hai H.264

Hình 3.5. So sánh rung pha SVC và H.264

17

video (5 Mbps). Hầu như bị giảm 18% trong tốc độ bit đạt được với video nhiều
lớp SVC trong trường hợp này. Có một gia tăng nhỏ trong trễ và rung pha vì mã
hóa SVC của video. Tuy nhiên, ảnh hưởng của sự gia tăng nhỏ trong trễ và rung
pha có thể được điều khiển dễ dàng bằng cách sử dụng bộ đệm bộ giải mã và bộ
đệm rung pha trong máy thu.
3.3.2.2. Suy giảm nhẹ trong Multicast (Graceful Degradation in
Multicast)

Hình 3.6. Tổn hao gói của các video H.264 đối với các UE cách trạm gốc 5km và
10km
Các kết quả từ Hình 3.6, 3.7 và 3.8 được tóm tắt trong Bảng 3.4. Kết quả cho

19

3.1.2.3. Luồng video nhận thức mạng và UE trong Unicast (UE and
Network Aware Streaming in Unicast)
3.3.3. Kết luận
Những ưu điểm của việc sử dụng SVC so với H.264/AVC trong các kịch bản
Multicast LTE và Unicast trong các mạng LTE là thể hiện rõ ràng từ những phân
tích ở trên. Các kết quả cho thấy rằng giảm mất gói đáng kể và tiết kiệm giảm thông
(18 đến 30%) với chất lượng video chấp nhận là đạt được với sơ đồ đề xuất dựa trên
SVC so với H.264
3.4. Các kết quả thử nghiệm truyền tải video mã hóa SVC phát
quảng bá qua mạng LTE trong thực tế
3.4.1. Kịch bản đo ngoài trời
3.4.2. Kết quả
Hình 3.12 mô tả bản đồ vùng phủ thể hiện khả năng có thể giải mã lớp
truyền tải H.264/SVC tốt nhất dọc theo đường đo kiểm. Người ta đã quan sát thấy
rằng các lớp cơ bản, lớp truyền tải 1, có thể được nhận được với một xác suất 97%
tại tất cả các điểm trên đường đo đạc. 3% trải nghiệm thiết bị đầu cuối di động bị
rớt tại khoảng cách 2km đến trạm gốc phục vụ. Ở đây, công suất nhận bị rớt khi
dưới -92 dBm, đó là dưới độ nhạy thu của mẫu di động thử nghiệm, và các thiết bị
đầu cuối di động bị mất đồng bộ hóa đến trạm gốc. Nói chung, hình 3.12 cho thấy
H.264/SVC trên LTE hỗ trợ hầu hết 2 hoặc 3 lớp truyền tải SVC trong lúc di
chuyển thông qua sector phục vụ. Trong khu vực gần các trạm gốc, hệ thống sử
dụng hầu hết thời gian lớp truyền tải SVC cao nhất để cung cấp chất lượng video tốt
nhất. Trong trường hợp chất lượng kênh xấu tạm thời, có thể dễ dàng gây ra bởi các
hiệu ứng di động hoặc che khuất tạm thời gây ra bởi các loại xe khác, các bộ giải
mã SVC có thể chỉ có thể giải mã thành công 2 lớp. Trong một môi trường di động,
một tình huống như thế này có thể chỉ kéo dài trong một vài mili giây đến hàng
giây. Do đó, rớt đột ngột đến lớp 2 và sau đó trở lại 3 hoặc 4 lớp SVC thậm chí có
thể không gây chú ý cho một người dùng cụ thể.

3.5. Tình hình ứng dụng SVC cho truyền tải trên mạng LTE
Đối với công nghệ 3G UMTS hiện nay thì người ta đang sử dụng kỹ thuật
mã hóa AVC/H.264 để truyền tải video. Và việc triển khai các thiết bị phần cứng
thực hiện hỗ trợ việc truyền tải video mã hóa SVC/H.264 đã được ứng dụng trong
lĩnh vực hội nghị truyền hình, ví dụ như một số hãng công nghệ lớn đã có sản phẩm
riêng của mình như hãng Vidyo, Polycom…Còn việc sử dụng SVC cho truyền tải
trên mạng LTE đang ở trong quá trình thử nghiệm trong thực tế để đánh giá hiệu
quả. Các kết quả thử nghiệm đã được trình bày trong mục 3.3 và 3.4 của chương
này.
3.6. Dự báo triển khai LTE tại Việt Nam
Theo [10], đến cuối năm 2011 thì có khoảng 9 triệu thuê bao LTE trên toàn
thế giới. Người ta dự báo đến cuối năm 2016, dự báo sẽ có khoảng 830 triệu thuê
bao LTE trên toàn thế giới, trong đó khu vực Châu Á – Thái Bình Dương sẽ có
khoảng 309 triệu thuê bao.

Bảng 3.7 : Dự báo thị trường LTE
Đồng thời, lưu lượng di động sẽ lớn hơn 127 exabyte (EB) vào năm 2020,
trong đó Châu Á sẽ chiếm khoảng 34,3% tổng số lưu lượng di động, tiếp theo là
Châu Âu với 22% và Châu Mỹ là 21,4%.

22 Hình 3.13. Lưu lượng dữ liệu và thoại di động giai đoạn 2010 – 2020 (EB hàng năm)
Ngày 01 tháng 9 năm 2010, Bộ Thông tin và Truyền thông đã cấp phép cho
05 doanh nghiệp được thử nghiệm mạng và dịch vụ LTE, bao gồm: VNPT; Viettel;
VTC; FPT Telecom; CMCTI.
Theo [1] thì tác giả đã đề xuất nên cấp phép triển khai thương mại mạng 4G
LTE/SEA tại Việt Nam là vào cuối năm 2017, các doanh nghiệp sẽ lắp đặt mạng
trong năm 2018 và chính thức cung cấp dịch vụ vào đầu năm 2019.

tiên PNDC (Priority and Network-aware Data Control) (Hỗ trợ lập biểu
và thích ứng đường truyền trong lớp MAC…phù hợp đặc thù mạng dựa
trên các thông tin CQI và dựa trên chính nội dung video); thuật toán điều
khiển thích ứng giữa các lớp cross-layer;
4. Mấy đầu cuối hỗ trợ công nghệ video SVC/H.264.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status