BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-----------------------------------------------
NGUYỄN TUÂN ANH
ĐỀ TÀI:
NGHIÊN CỨU VÀ ỨNG DỤNG KỸ THUẬT NÉN VÀ
TRUYỀN ẢNH QUA MẠNG INTERNET
LUẬN VĂN THẠC SỸ
NGÀNH: ĐIỆN TỬ VIỄN THÔNG
NGƯỜI HƯỚNG DẪN KHOA HỌC:
NGUYỄN VĂN KHANG
HÀ NỘI – 2010
MỤC LỤC
MỞ ĐẦU...............................................................................................................................1
CHƯƠNG I: TỔNG QUAN................................................................................................5
1.1 Giới thiệu ....................................................................................................................5
1.2 Nội dung nghiên cứu..................................................................................................9
1.3 Mục tiêu của đề tài...................................................................................................15
CHƯƠNG II: KỸ THUẬT VIDEO SỐ ...........................................................................17
2.1 Kỹ thuật nén Video số .............................................................................................17
2.1.1 Khái niệm............................................................................................................17
2.1.2 Mô hình nén ảnh .................................................................................................17
2.2 Các đặc điểm của nén tín hiệu số............................................................................18
CHƯƠNG IV: THỬ NGHIỆM NÉN ẢNH VÀ TRUYỀN ẢNH ..................................83
4.1 Đặt vấn đề .................................................................................................................85
4.2 Thử nghiệm nén ảnh................................................................................................85
4.3. Truyền ảnh và đánh giá đường truyền qua mạng ...............................................88
4.3.1. Cách thiết lập mạng vô tuyến giữa hai máy tính ...............................................89
4.3.2. Truyền ảnh qua mạng Peer to Peer ....................................................................92
KẾT LUẬN.......................................................................................................................102
TÀI LIỆU THAM KHẢO...............................................................................................105
DANH MỤC HÌNH VÀ BẢNG
Hình 1.1: Hội tụ truyền thông ................................................................................................6
Hình 1.2: Truyền tải các chương trình trên IP .....................................................................10
Hình 1.3: Mạng ngang hàng.................................................................................................14
Hình 2.1: Mô hình hệ thống nén Video. ..............................................................................17
Hình 2.2: Sự phối hợp các kỹ thuật trong JPEG và MPEG .................................................20
Hình 2.3: Dự đoán bù chuyển động một chiều và hai chiều................................................23
Hình 2.4: Kiến trúc dòng Video MPEG...............................................................................24
Hình 2.5: Cấu trúc số liệu nén ảnh MPEG...........................................................................24
Hình 2. 6: Sơ đồ bộ mã hoá .................................................................................................28
Hình 2.7: Sơ đồ bộ mã hoá cụ thể........................................................................................29
Hình 2.8: Sơ đồ bộ giải mã ..................................................................................................30
Hình 2.9: cấu trúc mã hoá dữ liệu của H.264 ......................................................................30
Hình 2.10: Chuỗi đơn vị NAL .............................................................................................31
Hình 2. 11: Slices.................................................................................................................31
Hình 2.12: Cấu trúc của slice...............................................................................................33
Hình 2.13: MacroBlock .......................................................................................................33
Hình 2.14: Ảnh tham chiếu và bù chuyển động...................................................................34
Hình 2.15: Các profile..........................................................................................................35
Hình 2.16: Dự đoán nội suy .................................................................................................36
Hình 3.18: Cấu trúc header của IPv6 ..................................................................................78
Hình 4.1: Mô hình đo PSNR................................................................................................85
Hình 4.2. Một picture của news_rev.mp4 ứng với PSNR >20(dB)..................................100
Hình 4.3. Một picture của news_rev.mp4 ứng với PSNR
Kết luận
Qua quá trình nghiên cứu chuẩn nén và thực nghiệm truyền ảnh qua mạng vô
tuyến, chương này xây dựng mô hình mã hóa một file video thô YUV, sau đó tiến
hành nén ảnh sang chuẩn MPEG và truyền hình ảnh nén này qua mạng vô tuyến. Từ
đó đưa ra những đánh giá quá trình nén và giải nén thông qua việc tính toán PSNR,
tỉ số nén và xem đoạn video sau khi nén và truyền ảnh. Cuối cùng là đưa ra những
kiến nghị, kết luận và hướng phát triển trong tương lai.
Tôi xin gửi lời cảm ơn chân thành tới TS. Nguyễn Văn Khang người đã
hướng dẫn và giúp đỡ tôi hoàn thành luận văn này. Tôi cũng xin gửi lời cảm ơn tới
những thầy cô giáo người đã trang bị những kiến thức để tôi làm luận văn này. Mặc
dù tôi đã cố gắng nhưng chắc chắn luận văn vẫn còn rất nhiều thiếu sót, tôi mong
các thầy cô và các bạn đồng nghiệp chỉ bảo để tôi ngày càng hoàn thiện hơn vốn
kiến thức của mình
Hà Nội, tháng 10 năm 2010
4
CHƯƠNG I: TỔNG QUAN
1.1 Giới thiệu
Liệu trong thế kỷ tới, truyền hình có còn như hiện nay không? Trả lời được câu
hỏi này là chúng ta đã biết được tương lai của truyền hình trong kĩ nguyên số hoá.
Kể từ khi tín hiệu radio đầu tiên được phát sóng vào thế kỷ 18, con người
vẫn luôn luôn theo đuổi một mục đích duy nhất là phủ sóng cho nhiều người trên
một diện tích rộng. Từ xa xưa đến nay vẫn luôn tồn tại ước mơ cháy bỏng của con
người là vượt qua khoảng cách về thời gian và không gian bị giới hạn bằng mắt và
tai. Bởi vậy, người ta đã xây dựng rất nhiều trạm phát trên núi, nối liền các thành
phố và thị trấn với nhau bằng những đường dây cáp như một tấm màng nhện khổng
lồ, rồi sau đó đã tiến hành phóng vệ tinh vào quỹ đạo trái đất nhằm thực hiện ước
lạc. Sự ghép nối có tổ chức tạo nên sự linh hoạt, công nghệ mạng đang tạo ra một hệ
thống liên lạc mới cho phép vượt qua mọi trở ngại trong việc liên lạc giữa cá nhân
với cộng đồng. Hệ thống mới này đồng thời cũng hợp nhất các phương tiện đã phát
triển một cách độc lập với nhau trong quá khứ như: video, audio, text, liên lạc vô
tuyến, hữu tuyến thành một phương tiện duy nhất. Chúng ta hãy xét xem môi trường
mới với tên gọi là công nghệ truyền thông tương lai, sẽ thay đổi môi trường phương
tiện hiện đại như thế nào?
Thứ nhất, thông tin liên lạc giữa cá nhân, tổ chức và quảng đại dân cư trước
đây được thiết lập theo nhiều cách khác nhau nay sẽ được hợp nhất bằng hình thức
liên lạc hợp nhất. Chúng ta đã vượt qua giai đoạn khởi đầu và giờ đây đang tiến dần
tới hình thức liên lạc hợp nhất khi mà chức năng xử lý và lưu giữ thông tin do máy
tính đảm nhiệm, khả năng nối mạng do Internet đảm nhiệm, khả năng dịch vụ video
do truyền hình đảm nhiệm và chức năng liên lạc do điện thoại đảm nhiệm. Ngày
nay người ta có thể nối máy thu hình hoặc máy tính của mình vào mạng Internet và
6
liên lạc với những người khác bằng lời thoại hoặc thông điệp audio, video. Không
chỉ có vậy, ngày nay chúng ta còn có thể đọc báo, tạp chí hoặc xem truyền hình qua
Internet.
Thứ hai, khả năng hợp nhất truyền thông giữa mạng truyền dẫn có dây và
không dây chỉ có thể thực hiện được qua mạng hợp nhất. Trên cơ sở công nghệ số,
mạng có dây và không dây sẽ thiết lập và duy trì mạng hợp nhất có chức năng ghép
nối mạnh và trở thành mạng hạ tầng. Ðến lượt mình, mạng hạ tầng này sẽ cung cấp
một môi trường hợp nhất có khả năng cung cấp đa dịch vụ cho người sử dụng.
Thứ ba, mục tiêu tương lai của dịch vụ truyền thông là các cá nhân trong
quảng đại dân cư. Người ta sẽ tiêu nhiều thời gian hơn cho những dịch vụ cung cấp
thông tin cho họ vào thời gian và địa điểm mà họ đã định. Bởi vậy các phương tiện
phải cung cấp nhiều và lựa chọn khác nhau và điều kiện phải phù hợp với thị hiếu
chóng bắt kịp với công bố rằng năm 2007 người mỹ đã xem khoảng 9,5 tỉ đoạn
video Internet có độ dài trung bình 2,8 phút.
Trên đây là con số thống kê về lượng người sử dụng truyền hình internet sử
dụng tại các nước phát triển mạnh trên thế gới như Anh, Mỹ…, ta thấy rằng con số
này tăng lên hàng năm. Vậy tình hình ở Việt Nam ra sao? Đánh giá được đưa ra
trong Hội thảo Cơ hội kinh doanh trong ngành vô tuyến và di động tại Việt Nam
thời hội nhập, một hoạt động của VietnamComm 2007. Truyền hình trên Internet
(IPTV) là dịch vụ được đánh giá sẽ phát triển bùng nổ bởi hội tụ nhiều điều kiện cần
thiết. Ông Weijun Lee, Phó Giám đốc tập đoàn ZTE - nhà cung cấp dịch vụ IPTV
hàng đầu tại Trung Quốc, nêu ra 3 yếu tố căn bản để phát triển một dịch vụ IPTV,
gồm: đường truyền băng rộng, nội dung đa dạng và thị trường phát triển năng động.
Tại Việt Nam, nền tảng cơ sở hạ tầng của VNPT đảm bảo được những chương trình
IPTV hấp dẫn như Karaoke trên truyền hình, tương tác trực tiếp với những gì nhìn
thấy trên màn hình TV.
"Lấy ví dụ để các bạn thấy IPTV thay đổi quan niệm về truyền hình như thế
nào. Hãy tưởng tượng các bạn đang xem chương trình Vietnam Idol rất hấp dẫn.
Các bạn không cần soạn tin hay vào web để bình chọn mà có thể thao tác ngay trên
máy thu hình", ông Weijun Lee nói. "Thực tế tại những nơi đã triển khai IPTV, tỷ lệ
bình chọn như vậy cao hơn hẳn so với qua tin nhắn hoặc các hình thức khác". Cơ
hội kiếm tiền từ IPTV gần như được chia đều cho các bên tham gia. Theo đó, nhà
cung cấp dịch vụ được khoảng 30%, nhà cung cấp nội dung 40% và 30% còn lại
thuộc về các nhà cung cấp dịch vụ gia tăng trên IPTV.
Ông Trần Minh Tuấn, Phó viện trưởng Viện chiến lược Bộ TT-TT, cho biết
những dự án truyền hình analog sẽ dần được hạn chế trong thời gian tới. Thay vào
8
đó, truyền hình KTS sẽ được mở rộng. Đặc biệt khi vệ tinh Vinasat được phóng lên
quỹ đạo trong năm 2008, truyền hình kỹ thuật số sẽ được mở rộng đến vùng sâu,
dữ liệu chuyển đến, theo kiểu "nhận tới đâu, xem tới đó". Tuy nhiên, do sử dụng
đường truyền mạng như một kênh truyền nội dung, nên độ rộng của đường truyền
sẽ là yếu tố quyết định chất lượng truyền tải nội dung có được liền mạch và trôi
chảy hay không. Tính tới thời điểm này, đã xuất hiện khá nhiều trang web cung cấp
dịch vụ video streaming (các video streamer), cùng với nhiều công nghệ và giải
pháp "truyền hình Internet" đầy tiềm năng. Song thường thì các giải pháp video
streaming hiện tại mới chỉ phát huy được hiệu quả trong các mạng intranet khép kín,
còn khi đưa ra cung cấp đại trà trên toàn mạng Internet, chúng bỗng trở nên chuệch
choạc và "tậm tịt". Tuy vậy, người ta vẫn tin rằng một ngày nào đó, những cải tiến
và sáng chế mới trong giao thức đường truyền sẽ giúp biến "ước muốn" này trở
thành hiện thực thực tiễn. Trong mô hình client/server thì một máy khách (client) sẽ
kết nối với một máy chủ thông qua một giao thức nhất định, nên mọi xử lý sẽ nằm
trên server và do đó sẽ tránh cho clients những tính toán nặng nề. Tuy nhiên, mô
hình client/server bộc lộ một nhược điểm quan trọng: khi số lượng clients tăng đến
một mức độ nào đó thì nhu cầu về tải và băng thông tăng lên dẫn đến việc máy chủ
không có khả năng cung cấp dịch vụ cho các máy khách thêm vào. Để giải quyết
vấn đề trên, công nghệ mạng ngang hàng P2P (peer to peer technology) được tin
tưởng sẽ là lời giải cho các vấn đề trên. Mạng đồng đẳng (peer-to-peer network),
10
còn gọi là mạng ngang hàng, là một mạng máy tính trong đó hoạt động của mạng
chủ yếu dựa vào khả năng tính toán và băng thông của các máy tham gia chứ không
tập trung vào một số nhỏ các máy chủ trung tâm như các mạng thông thường. Mạng
đồng đẳng thường được sử dụng để kết nối các máy thông qua một lượng kết nối
dạng Ad hoc. Ứng dụng thường xuyên gặp nhất là chia sẻ tệp tin, tất cả các dạng
như âm thanh, hình ảnh, dữ liệu,... hoặc để truyền dữ liệu thời gian thực như điện
thoại VoIP. Một mạng đồng đẳng đúng nghĩa không có khái niệm máy chủ và máy
khách, nói cách khác, tất cả các máy tham gia đều bình đẳng và được gọi là peer, là
một nút mạng đóng vai trò đồng thời là máy khách và máy chủ đối với các máy
sự khuyến khích chia xẻ file và truyền thông giữa các nhóm làm việc. Ví dụ, người
sử dụng có thể kết nối với các đồng sự trong các môi trường ảo để cùng hợp tác
trong công việc, giải quyết các vấn đề phức tạp và thậm chí lập kế hoạch chia xẻ tài
liệu và cùng lướt trên Internet. Quan trọng hơn cả đối với giới doanh nghiệp là dịch
vụ tạo ra một không gian an toàn cho người dùng cho dù họ ở trên Internet hay
trong Intranet sau tường lửa. Không cần phải có các kỹ sư của công ty, không cần
phải thiết lập hình thức tổ chức trung tâm và không phải lo đến những vị khách lạ
truy nhập vào mạng công ty. Một số công ty khác nhấn mạnh việc xây dựng hạ tầng
P2P, trên cơ sở đó các nhà phát triển có thể xây dựng các ứng dụng khác. Một trong
các cách làm này là sử dụng sức mạnh của giao thức XML, cho phép các nhà phát
triển không những chỉ định rõ cách bố trí của các trang web mà còn có thể hiện các
nội dung. Mặc dù mọi sự chú ý đều tập trung vào vấn đề cộng tác, các hệ thống P2P
cho phép các ứng dụng phần mềm tương tác với nhau đem lại nhiều hứa hẹn nhất
cho các ứng dụng kết hợp các dữ liệu phân tán cho thương mại điện tử, thiêt kế sản
phẩm hoặc quản lý tri thức. Các chương trình đó dùng P2P như một phương thức
gửi dữ liệu vào và ra từ trình ứng dụng này tới trình ứng dụng khác hoặc liên kết
một số lượng vô hạn các máy tính thành một cơ sở dữ liệu khổng lồ. Công nghệ
tương tác phần mềm cho phép các công ty chia nhỏ các vấn đề phức tạp cho dễ
quản lý hơn. Các hệ thống cho phép đối chiếu dữ liệu và đảm bảo rằng chúng đang
được điều khiển bởi chính những người tạo ra chúng, đảm bảo rằng hoạt động chính
xác và kịp thời rất lý tưởng cho các ứng dụng trực tuyến và kinh doanh chứng
khoán. Một số các hang máy tính đang tiếp tục phát triển thế hệ tiếp theo của các
máy tìm kiếm trên công nghệ P2P để phân phối thông tin đúng lúc và toàn diện hơn
cho các công ty truyền thông lớn. Một loạt các hãng mới thành lập đang tạo ra
những chương trình tận dụng tài nguyên triển khai khả nǎng của P2P để lưu trữ các
file, phân phối nội dung và chia sẻ sức mạnh xử lý của các máy khác. Mục đích ở
đây một phần là cắt giảm giá thành phần cứng chẳng hạn như thiết bị lưu trữ, server
12
kiến những thay đổi lớn về cung cách làm việc. Biên giới của các công ty đã trở lên
rộng lớn hơn và mối quan hệ giữa khách hàng và nhà cung cấp đã trở lên gần gũi
13
hơn đồng thời sự tin tưởng của công ty vào những người lao động tạm thời và các
chuyên gia tǎng lên, trong khi đó các tổ chức lại dựa nhiều hơn vào các nhóm làm
việc đặc biệt. Những nơi làm việc như vậy sẽ không có một cấu trúc làm việc cố
định và một vai trò nghề nghiệp được xác định rõ ràng. P2P rất phù hợp với cách
thức hợp tác này. Việc sử dụng các hệ thống mạng đã làm thay đổi một cách đáng
kể lực lượng lao động trong những nǎm gần đây. Những nhóm làm việc tự phát qua
mạng là sự phát triển có ý nghĩa quan trọng về cách thức làm việc của các công ty.
Hình 1.3: Mạng ngang hàng
Lần lượt các hệ thống nhắn tin như ICQ và các công cụ P2P khác dùng để
giao tiếp sẽ trở thành trung tâm của các mạng như thế và cho phép người sử dụng
liên kết với nhau một cách tự do và dễ dàng. Những bước nghiên cứu ban đầu về
các ứng dụng P2P đã công nhận những xu hướng như vậy trong thế giới kinh doanh.
Các hệ thống giao tiếp tương tác được ứng dụng liên kết các hệ thống lập trình và
thiết kế lại với nhau, tích hợp các kho dữ liệu khổng lồ và cho phép những nhóm
phát triển và thiết kế độc lập liên kết với nhau tốt hơn. Trong quá trình xử lý này hệ
thống giảm các luồng thông tin sai hay lỗi thời giữa các nhóm thiết kế dẫn đến tiết
kiệm nhiều triệu đô la. Các nhà tin học cho rằng trong thương mại, P2P chỉ thích
hợp cho những ứng dụng có trao đổi thông tin trực tiếp. Như vậy, server sẽ tiếp tục
duy trì vị trí của mình trong việc quản lý nhân sự và chi tiêu, kế hoạch kinh doanh
và nhiều ứng dụng khác. Tuy nhiên, trong tương lai, server sẽ cung cấp các dịch vụ
cao cấp hơn thay vì những việc lặt vặt đơn giản như lưu trữ và phân phát các tệp.
14
-
Chỉ ra lý do tại sao phải tiến hành nén ảnh trước khi truyền dẫn và một số
nguyên lý nén ảnh.
-
Cách hình thành cấu trúc gói dữ liệu để truyền qua mạng IP
15
-
Phương pháp đánh giá chất lượng hình ảnh sau nén
-
Phương pháp đánh giá chất lượng ảnh sau khi truyền qua mạng P2P.
Thông qua những kiến thức các thầy cô giáo đã chỉ dạy tiến hành một số thử
nghiệm thực tiễn về nén ảnh và truyền dẫn ảnh theo phương thức mạng ngang hang
(P2P). Những thử nghiệm này giúp cho em minh họa thêm, hiểu rõ hơn những kiến
thức thu được trong quá trình học tập tại trường Đại Học Bách Khoa Hà Nội.
16
CHƯƠNG II: KỸ THUẬT VIDEO SỐ
2.1 Kỹ thuật nén Video số
Giải
L.T.H
Biểu diễn
thuận lợi
Hình 2.1: Mô hình hệ thống nén Video.
Ở tầng đầu tiên của bộ mã hoá video, tín hiệu video được trình bày dưới
dạng thuận tiện để nén có hiệu quả nhất. Điểm cốt yếu là chỉ xác định cái gì được
mã hoá. Sự biểu diễn có thể chứa nhiều mẩu thông tin để mô tả tín hiệu hơn là chính
tín hiệu, nhưng hầu hết thông tin quan trọng chỉ tập trung trong một phần nhỏ của
sự mô tả này. Trong cách biểu diễn có hiệu quả, chỉ có phần nhỏ dữ liệu cần thiết để
truyền cho việc tái tạo tín hiệu video.
17
- Hoạt động thứ hai của bộ mã hoá là lượng tử hoá, giúp rời rạc hoá thông tin
được biểu diễn. Để truyền tín hiệu video qua một kênh số, những thông tin biểu
diễn được lượng tử hoá thành một số hữu hạn các mức.
- Hoạt động thứ 3 là gán các từ mã. Các từ mã này là một chuỗi bit dùng để
biểu diễn các mức lượng tử hoá.
Các quá trình sẽ ngược lại trong bộ giải mã video.
Mỗi hoạt động cố gắng loại bỏ phần dư thừa trong tín hiệu video và tận dụng
sự giới hạn của khả năng nhìn của mắt người. Nhờ bỏ đi các phần dư thừa, các
thông tin giống nhau hoặc có liên quan đến nhau sẽ không được truyền đi. Những
thông tin bỏ đi mà không ảnh hưởng đến việc nhìn cũng không được truyền đi.
2.2 Các đặc điểm của nén tín hiệu số
2.2.1 Xác định hiệu quả của quá trình nén tín hiệu số
cho trước thì độ độ dư thừa số liệu tương đối RD của tập hợp số liệu thứ nhất với tập
hợp số liệu thứ hai có thể được định nghĩa như sau:
RD =1-1/ CN
Trong đó: CN =N1/N2
Trong trường hợp N1=N2 thì CN =1 và RD=0, có nghĩa là so với tập số liệu
thứ hai thì tập số liệu thứ nhất không chứa số liệu dư thừa. Khi N2