TTNT. p.1
BÁO CÁO
BÁO CÁO
TRUYỀN THÔNG ĐA PHƯƠNG
TIỆN
Đề tài:
Tìm hiểu và xây dựng chương trình nén, giải nén audio theo
chuẩn nén AAC.
GVHD: Nguyễn Trung Thành
Nhóm 6: Lê Thanh Sơn
Bùi Tuấn Huy
TTNT. p.2
I. Mã hóa âm thanh tiên tiến hay Advanced Audio Coding
(AAC):
1.Giới thiệu chung về AAC:
- AAC là là một định dạng âm thanh đa năng nén kiểu lossy
được định nghĩa theo tiêu chuẩn MPEG-2 và được phát
triển bởi liên minh Fraunhofer, Dolby, Sony và AT&T.
- AAC được phát triển nhằm thay thế cho định dạng âm
thanh đã quá nổi tiếng MP3 để tích hợp trong container
MP4-một container của MPEG-4 tiêu chuẩn hỗ trợ đầy
đủ các tính năng phụ.
TTNT. p.3
- Dạng định này được phát triển để xóa đi những chỗ yếu
của MP3 và nâng cao phương pháp mã hóa đã có. Do vậy
những tín hiệu thu của âm thanh hay tiếng động sẽ được
nhận biết và mã hóa 1 cách hiệu quả hơn hoặc những vấn
đề của Pre-Echo sẽ giảm thấp xuống nhiều.
2.Chuẩn MPEG.
- Chuẩn MPEG là chuỗi các chuẩn nén với mục đích là
Đầu tiên tín hiệu audio được chuyển về miền tần số, và
toàn bộ giải phổ của nó được chia thành 32 băng con thông
qua bộ lọc băng con.
Lọc băng con: Phổ tín hiệu được chia thành các băng
con có độ rộng dải thông bằng nhau. Nó tương tự như quá
trình phân tích tần số của HAS, chia phổ tín hiệu audio thành
các băng tới hạn. Độ rộng của các băng tới hạn có thể thay
đổi. Dưới 500Hz, độ rộng dải băng là 100Hz, và nó tăng tới
vài KHz khi tần số trên 10KHz. Dưới 500Hz, một băng con
có tới vài băng tới hạn.
TTNT. p.8
Các bộ lọc băng con có một phần nhỏ gối lên nhau và thông
thường sử dụng cho các mẫu kề nhau trong miền thời gian.
Mỗi tín hiệu băng con sau đó được lượng tử hoá đều với các
bit chỉ định đặc trưng nhằm bảo vệ dải băng con bằng tỉ số
tích cực masking trên tạp âm (MNR). Tỉ số này có tính tích
cực khi đường cong các mức chặn ở trên mức tạp âm.
Băng chuyển đổi: Thuật toán chuyển đổi DCT (MDCT)
thường được sử dụng để biến đổi tín hiệu audio từ miền thời
gian sang miền tần số thành một số lượng lớn các băng con
(từ 256 đến 1024). Giống như lọc băng con, trong các băng
chuyển đổi nằm kề nhau.
TTNT. p.9
Lọc băng ghép: Đây là sự kết hợp giữa các bộ lọc băng con và các
bộ lọc băng chuyển đổi. Đầu tiên tín hiệu được chia thành 32 băng
con bởi bộ lọc băng, sau đó thuật toán MDCT được áp dụng cho
lọc x 20,83ms. Một mẫu tồn tại trong khoảng thời gian
20,83ms với tần số lấy mẫu là 48KHz. Thông số này cho mét
ý tưởng làm việc của bộ mã hoá trong thời gian xuất hiện
của tín hiệu tức thời.
Độ phân tích tần sè = độ rộng phổ lớn nhất/ Tổng số các
băng tần con. Độ rộng phổ lớn nhất là 24KHz cho tần số lấy
mẫu 48KHz.
+Độ dài của khung = Số tần con x Số mẫu trong khối x
20,83ms. Giá trị này được tính tại tần số lấy mẫu là 48KHz.
TTNT. p.12
Với mỗi băng con người ta xác định mức biên độ tín hiệu và
mức nhiễu bằng “Mô hình tâm sinh lý nghe - Psychoacoustic
model”
Cuối cùng là mỗi băng con đó được lượng tử hoá thông qua
lượng tử các thành phần nghe thấy trong mỗi băng. Nó đi
kèm với mã Huffman để mã hoá các giá trị phổ tín hiệu và
cho nén số liệu tốt hơn và định dạng số liệu.
TTNT. p.13
2. Quá trình giải mã.
Quá trình giải mã dùa trên cơ sở thực hiện thuật toán ngược
với quá trình mã hoá.
TTNT. p.14
Tín hiệu nhận được là các dòng bit đã mã hoá, được đưa tới
bộ giải khung số liệu để giải mã entropy từ đó lấy ra các số
liệu phụ, phát hiện lối sửa sai, tách kênh tín hiệu để đưa tới
bộ tái tạo.