Nghiên cứu ứng dụng kỹ thuật Fractal vào nén trong ảnh video (Luận án tiến sĩ) - Pdf 45

MỤC LỤC

LỜI MỞ ĐẦU

............................................................................................... 3

DANH MỤC CÁC TỪ VIẾT TẮT ............................................................................ 7
DANH MỤC CÁC BẢNG ......................................................................................... 8
DANH MỤC CÁC HÌNH VẼ .................................................................................. 10
CHƯƠNG 1 - TỔNG QUAN ................................................................................... 12
1.1 Một số phương pháp nén video phổ biến .......................................................... 12
1.1.1 Nén dư thừa về không gian.................................................................................. 12
1.1.2 Nén dư thừa thời gian........................................................................................... 13
1.2 Một số chuẩn lấy mẫu tín hiệu video................................................................. 13
1.3 Các tiêu chuẩn nén video với bitrate thấp ......................................................... 14
1.3.1 Chuẩn H.263......................................................................................................... 14
1.3.2 Chuẩn H.265/HEVC ............................................................................................ 15
1.3.3 Chuẩn H.264/AVC............................................................................................... 15
1.4 Hình học Fractal ................................................................................................ 19
1.4.1 Giới thiệu hình học Fractal .................................................................................. 19
1.4.2 Các ứng dụng của hình học Fractal..................................................................... 21
1.5 Các công trình nghiên cứu liên quan đến Fractal .............................................. 23
1.5.1 Các công trình nghiên cứu ứng dụng Fractal cho nén hình ảnh........................ 23
1.5.2 Các công trình nghiên cứu ứng dụng Fractal cho nén video ............................. 24
1.6 Kết luận chương ................................................................................................ 25
CHƯƠNG 2 - NÉN HÌNH ẢNH SỬ DỤNG FRACTAL ....................................... 26
2.1 Nén hình ảnh sử dụng Fractal Coding ............................................................... 26
2.1.1 Cơ sở lý thuyết nén ảnh sử dụng Fractal Coding ............................................... 26
2.1.2 Nén ảnh xám sử dụng Fractal Coding ................................................................ 39
2.1.3 Nén ảnh màu sử dụng Fractal .............................................................................. 44
2.1.4 Kết quả nén ảnh xám và ảnh màu sử dụng Fractal Coding............................... 47


Nén dữ liệu (data compression) là phương pháp mã hóa kỹ thuật số nhằm giảm
dung lượng của dữ liệu. Tùy theo lượng dữ liệu trước và sau giải nén, người ta chia
nén thành hai dạng: nén không mất dữ liệu (lossless) và nén bị mất dữ liệu (lossy)
[23].
Các thuật toán nén không mất dữ liệu thường dựa trên giả thuyết dư thừa trong
dữ liệu, từ đó thể hiện dữ liệu một cách chính xác mà không mất thông tin. Điển hình
cho nén không mất dữ liệu có thể kể đến mã hóa RLE (Run-length Encoding), thay
thế một loạt dữ liệu liền nhau lặp lại thành một dữ liệu đại diện khác.
Nén mất dữ liệu làm giảm số lượng bit bằng cách xác định các thông tin không
cần thiết và loại bỏ chúng.
Một trong những dạng nén mất dữ liệu phổ biến nhất là nén video. Một tín hiệu
video số thường chứa một lượng lớn dữ liệu âm thanh và hình ảnh, do đó sẽ gặp rất
nhiều khó khăn trong việc lưu trữ và truyền đi trong một băng thông kênh truyền thực
tế. Với sự phát triển của khoa học công nghệ hiện nay, bộ cảm biến màu có 16 triệu
màu với độ phân giải rất cao lên đến 4096 x 4096 pixels đã được sản xuất. Tuy nhiên,
ứng dụng thực tế cần độ phân giải cao hiện nay cũng chỉ dừng lại ở mức 1920 x 1080
pixels. Nguyên nhân của vấn đề này là những video có độ phân giải rất cao như 2K
và 4K sẽ tiêu tốn nhiều không gian lưu trữ và chiếm dụng nhiều băng thông trên kênh
truyền dẫn. Trước nhu cầu sử dụng thông tin và hình ảnh đòi hỏi ngày càng cao về
mặt chất lượng trong khi vẫn bị giới hạn bởi không gian lưu trữ và băng thông kênh
truyền đòi hỏi cần có một giải pháp có thể giải quyết được vấn đề này. Do đó, để có
thể tiết kiệm không gian lưu trữ và băng thông kênh truyền thì cần thiết phải nén tín
hiệu video. Quá trình nén video thực hiện được là do thông tin trong các video thường
có trật tự, có tổ chức, vì thế nếu xem kỹ cấu trúc video có thể phát hiện được nhiều
loại thông tin dư thừa khác nhau. Các thông tin dư thừa nằm trong video có thể chia
thành năm loại.

3


điểm ảnh giống nhau giữa các khung hình của một video. Việc giảm trừ tối đa các
điểm ảnh giống nhau này cho phép tăng tỷ lệ nén video. Có nhiều tiêu chuẩn nén
4


video theo phương pháp nén dư thừa về thời gian, trong đó, MPEG là tiêu chuẩn tiêu
biểu.
Từ năm 2003, một tiêu chuẩn nén mới đã được đề xuất, đó là tiêu chuẩn H.264.
H.264 là một tiêu chuẩn nén sử dụng phương pháp nén dư thừa về thời gian. Bản chất
của tiêu chuẩn H.264 là sự phát triển của tiêu chuẩn MPEG, trong đó áp dụng thêm
các kỹ thuật nhằm nâng cao hơn nữa tỷ lệ nén và cố gắng cải thiện chất lượng hình
ảnh của video tương ứng với tỷ lệ nén đạt được.
Năm 2013, một tiêu chuẩn phát triển dựa trên tiêu chuẩn H.264 được đề xuất.
H.265 có tỷ lệ nén gấp đôi so với tiêu chuẩn H.264 ở cùng một mức độ chất lượng
hình ảnh video. Mục tiêu của tiêu chuẩn H.265 là chuẩn nén hỗ trợ cho các video độ
phân giải cực cao 8K UHD và kỳ vọng hỗ trợ lên đến độ phân giải 4320P ( 8192 x
4320).
Như vậy, hướng phát triển của các tiêu chuẩn nén video là sự kế thừa và phát
triển của các tiêu chuẩn trước đó để hướng tới hai mục đích chính. Đó là nâng cao tỷ
lệ nén và cải thiện chất lượng hình ảnh sau giải nén tương đương với tỷ lệ nén đã đạt
được.
Hình học Fractal là nguồn cảm hứng cho thuật toán nén mà điển hình hơn là
thuật toán nén hình ảnh. Lĩnh vực này hiện đang chiếm được sự quan tâm của rất
nhiều nhà khoa học trên thế giới cũng như ở Việt Nam. Nén hình ảnh sử dụng Fractal
mang đến tỉ lệ nén vượt trội so với bất kỳ phương pháp mã hóa nén nào trước đây mà
vẫn đảm bảo được chất lượng tốt nhất có thể cho hình ảnh. Ưu điểm của nén hình ảnh
sử dụng Fractal là tỷ lệ nén cao vượt trội và quá trình giải nén rất nhanh. Tuy nhiên,
khối lượng tính toán rất lớn trong quá trình nén ảnh làm cho thời gian nén ảnh cũng
rất lớn.
Từ đó, ý tưởng kết hợp Fractal và tiêu chuẩn H.264 được hình thành nhằm áp

VIẾT TẮT

TIẾNG ANH

TIẾNG VIỆT

AVC

Advanced Video Coding

Tiêu chuẩn nén video tiên tiến

CNN

Celular Neural Network

Mạng nơ-ron tế bào

CPU

Central Processing Unit

Bộ xử lý trung tâm

CR

Compression Ratio

Tỷ số nén


trường

GOP

Group of Picture

Nhóm các ảnh

H.264

H.264/MPEG-4 Part 10 or AVC

Một tiêu chuẩn nén video

HEVC

High Efficiency Video Coding

Tiêu chuẩn nén video hiệu năng cao

HV

Horizontal vertical Partition

Phân hoạch theo không gian

IFS

Iterated Function System


Run-length Encoding

Thuật toán nén dữ liệu lossless

RMS

Root mean square

Giá trị trung bình bình phương

SDK

Services Development Kit

Bộ phát triển dịch vụ

SFC

Seperated Fractal Coding

Mã hóa Fractal thành phần

SoC

System on Chip

Hệ thống tích hợp trên một chip

UHD


46

2.4

So sánh hiệu suất hoạt động trên nền tảng FPGA và DSP theo phương pháp
Fisher ………………………………………………………………………..

47

2.5

Hiệu suất PSNR và thời gian mã hóa ………………………………………..

48

2.6

Các thông số nén Fractal của hình Lena ……………………………………...

50

2.7

Kết quả FCIC hình ảnh của Lena ……………………………………………

50

2.8

Các ảnh gốc được lựa chọn và tính chất ảnh …………………………………


54

2.14

So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Lena ………..

55

2.15

So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Fruit …………

55

2.16

So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Leaves ………

56

2.17

So sánh tỷ số nén và PSNR giữa Fractal và JPEG đối với ảnh Natural ………

57

2.18

Bảng kết quả so sánh giữa thực hiện nén ảnh bằng Fractal và JPEG ……….


67

2.24

Nén ảnh màu Fractal ảnh Parrot …………………………………………….

68

2.25

Nén ảnh màu Fractal ảnh One Tiger ………………………………………...

69

2.26

Nén ảnh màu Fractal ảnh Two Tiger ………………………………………...

69

2.27

Nén ảnh màu Fractal ảnh Flower ……………………………………………

70

2.28

Nén ảnh màu Fractal ảnh Fruit ………………………………………………

2.33

Kết quả FCIC với hai luồng xử lý …………………………………………..

84

2.34

Kết quả FCIC với bốn luồng xử lý ………………………………………….

85

2.35

So sánh theo tỷ lệ phần trăm giữa 4 luồng, 2 luồng và 1 luồng …………….

85

2.36

Kết quả FCIC với 1 luồng, 2 luồng, 4 luồng xử lý của các ảnh Parrot, Flower,
Natural, One-tiger, Two-tiger, Red-tree và Roses …………………………..

86

3.1

So sánh về chất lượng giữa video H.264 và H.264F ………………………..

94


3.7

Tỷ số nén của H.264 và H.264F đối với video Highway ……………………

98

3.8

So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video Foreman ………..

98

3.9

So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video Bridge …………..

99

3.10

So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video Bridge Far ………

99

3.11

So sánh PSNR giữa ảnh chuẩn và ảnh fractal trong video Grandma …………

100

1.1

Quy trình nén dư thừa không gian …………………………………………..

12

1.2

Nén dư thừa thời gian ……………………………………………………….

13

1.3

Quy trình mã hóa và giải mã video chuẩn H.264 ……………………………

16

1.4

Phân chia Macroblock trong video ………………………………………….

16

1.5

Cấu trúc dòng bit trong H.264 ………………………………………………

17


2.3

Sơ đồ khối quá trình mã hóa của FIC ………………………………………

36

2.4

Sơ đồ khối quá trình giải mã của FIC ………………………………………

37

2.5

Hình ảnh Lena theo phân hoạch Quadtree …………………………………

38

2.6

Hình ảnh lena với phân hoạch HV …………………………………………

39

2.7

Xử lý hoạt động nén ảnh Fractal ……………………………………………

43


2.13

Ảnh chuẩn và ảnh giải nén Lena với ET = 6, RET = 20 ………………………

49

2.14

Định dạng ảnh PPM ………………………………………………………….

76

2.15

Phân phối trật tự hình ảnh vào vùng 16x16 …………………………………..

76

2.16

Thuật toán FCIC được đề xuất ……………………………………………….

77

2.17

Trình tự các bộ nhớ stack được đề xuất ………………………………………

78


Xác định offset của miền …………………………………………………….

81

2.23

Phân chia section …………………………………………………………….

82

2.24

Phân chia section của OPENMP ……………………………………………..

83

3.1

Các bước chính để mã hóa một frame trong X264 …………………………..

93

3.2

Sơ đồ nhúng mã hóa fractal vào intra-block trong H.264 ……………………

94

3.3


100

3.8

Ảnh chuẩn và ảnh giải mã Fracal của video Brigde Far ……………………. 100

3.9

Ảnh chuẩn và ảnh giải mã Fracal của video Grandma ………………………. 101

3.10

Ảnh chuẩn và ảnh giải mã Fractal của video Highway ……………………..

101

3.11

Quá trình giải mã H.264 trên FFMPEG ……………………………………

103

3.12

Quá trình giải mã đơn vị NAL trên FFMPEG ………………………………. 104

3.13

Giải mã các thành phần trong FFMPEG ……………………………………. 104



Một số phương pháp nén video phổ biến
Như đã trình bày trong phần mở đầu, hai phương pháp nén video phổ biến đang

được áp dụng hiện nay là phương pháp nén dư thừa về không gian và phương pháp
nén dư thừa về thời gian.

1.1.1 Nén dư thừa về không gian
Quy trình nén dư thừa về không gian được thể hiện qua hình Hình 1.1: Quy trình
nén dư thừa không gian, trong đó khối nén dư thừa không gian tính đến sự tương tự
của các pixel lân cận ngay trong một khung hình.

Hình 1.1: Quy trình nén dư thừa không gian

Nén dư thừa không gian bao gồm các bước sau:
Chuyển qua không gian màu YUV: Quy trình này sẽ được đề cập đến trong
Luận án.
Chia khung hình thành các vùng nhỏ có kích thước 8x8 pixels.
Biến đổi DCT đối với từng vùng nhằm giữ lại thông tin chính.
12


Luận án đầy đủ ở file: Luận án full








Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status