Luận văn Phân tích và ứng dụng chuẩn MPEG - Pdf 10

Phân tích và ứng dụng chuẩn MP3 Trang 1 Luận văn Phân tích và ứng dụng
chuẩn MPEG
3. Âm thanh MPEG 12
4. Hoạt động: 13
II. CÁC KHÁI NIỆM CƠ BẢN VỀ MPEG. 14
1. Lược đồ mã hóa Perceptual Subband. 14
2. Giải thích về hiệu qủa che (masking effect). 14
a. Nén âm thanh MPEG. 15
b. Hiệu quả che. 16
3. Các lớp âm thanh MPEG. 17
a. Lớp I (Layer I) 18
b. Lớp II (Layer II) 18
c. Lớp III (Layer III). 19
III. CÁC THÔNG SỐ DÙNG TRONG MPEG 20
1. Mode. 20
2. Sampling Frequency (tốc độ lấy mẫu). 21
3. Bit Rate. 21

CHƯƠNG III: MÃ HÓA THỤ CẢM 23

I. CƠ SỞ ÂM TÂM LÝ. 23
1. Ngưỡng nghe tuyệt đối (absolute threshold of hearing) . 23
2. Các băng tới hạn(critical bands) . 23
3. Hiện tượng che (masking) . 24
Phân tích và ứng dụng chuẩn MP3 Trang 3
II. MÃ HÓA BĂNG PHỤ . 26
III. MÃ HOÁ BIẾN ĐỔI 26
IV. MÃ HOÁ MP3 ( MP3 ENCODING) . 27
1. Phân tích phép biến đổi Fourier nhanh (FFT analysis) . 27

4. Băng lọc đa pha ( Polyphase Filterbank) . 53

PHẦN 2: XÂY DỰNG PHẦN MỀM 57

CHƯƠNG I:GIAO DIỆN VÀ THUYẾT MINH CHƯƠNG TRÌNH 57

1. Thanh SkinProgress 58
2. Nút Minimize 58
3. Nút Colse 58
4. Timer 58
5. Tổng thời gian 58
6 .Nút Open 58
Phân tích và ứng dụng chuẩn MP3 Trang 4
7 .Nút Play 58
8. Nút Pause 59
9. Nút Stop 59
10. Thanh tiến trình 59
11. Nút Volume 59 CHƯƠNG II : LƯU ĐỒ GIẢI THUẬT VÀ CẤU TRÚC DỮ LIỆU 60

I. SƠ ĐỒ KHỐI 60
II. LƯU ĐỒ GIẢI THUẬT 61
III. CẤU TRÚC DỮ LIỆU 63
1. File Agrs.h 63
a. Lớp MPArgs 63

cầu cần thiết. Đặc biệt là việc gởi dữ liệu theo đường Internet, vì chất lượng
đường truyền thấp nên cần phải nén dữ liệu nhỏ gọn để thuận lợi cho việc
upload hay download. Đối với lĩnh vực âm nhạc cũng vậy, nhu cầu gởi tặng bài
hát cho nhau , nghe nhạc trực tuyến trên mạng rất phổ biến vì vậy việc nén file
nhạc vô cùng cần thiết để tiết kiệm đường truyền, thời gian và tiền bạc.

Để giải quyết vấn đề này MPEG có rất nhiều chuẩn để nén như MPEG 1,
MPEG 2,… dùng để nén file theo nhiều cách khác nhau. Một trong những
chuẩn phổ biến là chuẩn MPEG 1, trong khuôn khổ đề tài này chúng em chỉ
tìm hiểu về chuẩn MPEG 1 Layer 3 hay còn gọi là mp3 và minh hoạ bằng một
chương trình giải mã file mp3, sau đó phát ra loa.
Phân tích và ứng dụng chuẩn MP3 Trang 6
CÁC THUẬT NGỮ THƯỜNG DÙNG

MDCT Modified Discrete Cosine Transform.
IMDCT Inverse Modified Discrete Cosine Transform.
Sample rate Tốc độ lấy mẫu.
FFT Fast Fourier Transform.
DFT Discrete Fourier Transform.
Signal-to-noise (S/N) Tỉ số giữa tín hiệu và nhiễu.
CRC Cyclic Redundancy Check .
ADC Analog to Digital Converter.
CODEC CODer/DECoder.
CPU Central Processing Unit.
DCT Discrete Cosine Transform .
DSP Digital Signal Processor.
FS Sampling Frequency, e.g. 44100 Hz for CD audio.

I. CÁC ĐẶC TÍNH CƠ BẢN CỦA ÂM THANH

Bất kỳ âm thanh đơn giản nào chẳng hạn như một nốt nhạc đều có thể hoàn
toàn được mô tả bởi 3 đặc tính cảm nhận sau: cao độ (pitch ), cường độ
(intensity), âm sắc (timbre).

Những đặc tính này lần lượt tương ứng với các đặc tính vật lý sau của âm
thanh: tần số (frequency), biên độ (amplitude), sự cấu thành của các hài
(harmonic constitution).

1. Tần số sóng âm

Âm thanh được truyền đi dưới dạng sóng âm. Khi sóng âm truyền đi sự
truyền dao động của các phần tử dao động theo hướng truyền sóng. Sự dịch
chuyển của các phần tử của môi trường tạo ra các vùng có mật độ phần tử
cao thấp khác nhau. Các vùng có mật độ phần tử cao được gọi là các vùng
đậm đặc (compression). Các vùng có mật độ phần tử thấp được gọi là vùng
loãng (rarefaction).

Các vùng loãng và vùng đậm đặc lan truyền theo hướng truyền của sóng.
Các phần tử dao động không lan truyền theo hứơng truyền sóng, chúng dao
động xung quanh vị trí cân bằng của chúng. Mỗi một dao động hoàn chỉnh
được gọi là chu kỳ dao động (từ điểm bắt đầu của nó, tới một khoảng cách
tối đa theo một hứơng, sau đó trở về vị trí ban đầu, tới một khoảng cách
theo hướng ngược lại, và cuối cùng là trở về vị trí ban đầu ).

Số chu kỳ dao động được thực hiện trong một giây được gọi là tần số dao
động, đây cũng chính là tần số của âm thanh. Một trong những khác biệt
Phân tích và ứng dụng chuẩn MP3


0
: áp suất chuẩn qui chiếu, P
o
=2* 10
-5
N/m
2
Aâm thanh SPL(dB)

Ngưỡng im lặng 0
Tiếng thì thầm 10
Phòng thu âm 20
Nói bình thường 60
Tiếng la hét 80
Tiếng xe tải 90
Nhạc rock 100
Ngưỡng cảm nhậ
n
120
Ngưỡng đau 140

Một số mức SPL của vài dạng âm thanh.

II. KHÁI QUÁT VỀ ÂM THANH SỐ

0 -> 25,5 V như sau:

V1=0 thì word= 0000 0000 ( mức 0)
V2=0,1 thì word= 0000 0001 ( mức 1)
V3 = 0,2 thì word= 0000 0010 ( mức 2)
…………………………………………………………………….
V255= 25,5 thì word =1111 1111 (mức 255)
Giả sử ta có V
a
=0,15 V thì word ở mức 1 (0000 0001 ) hoặc mức 2 (0000
0010) tuỳ thuộc vào sự lựa chọn của chúng ta. Nhưng nếu V
a
=0.12 thì nó
thuộc mức 1 vì gần giá trị ở mức 1 hơn.

Các giá trị lượng tử hoá chỉ là xấp xỉ gần bằng giá trị thực tế của các mẫu. Độ
sai biệt giữa giá trị lượng tử hoá và giá trị thực được gọi là sai số lượng tử hoá (
quantization error).

3. Tỉ số tín hiệu trên sai số (Signal-to-error ratio)

Để đánh giá chất lượng của hệ thống lượng tử hóa, một thông số quan trọng
được định nghĩa là tỉ số của biên độ tín hiệu cực đại trên sai số lượng tử hóa
cực đại, tỉ số này được gọi là tỉ số tỉ hiệu trên sai số (S/E).

ISO : International Organization for Standardization
(Tổ chức chuẩn quốc tế)
IEC : International Electro-technical Commission
(Hội đồng kỹ thuật điện tử quốc tế )
JTC1 : Joint Technical Committee 1
(Hội đồng kỹ thuật liên hợp 1)
SC29 : Sub-committee 29
(Hội đồng phụ 29)
Phân tích và ứng dụng chuẩn MP3 Trang 11
WG11: Work Group 11 (moving picture with audio).
(Nhóm làm việc 11)
2. So sánh các chuẩn MPEG
MPEG-1 định nghĩa một tiêu chuẩn cho việc lưu trữ và phục hồi các hình
ảnh động và âm thanh trên các thiết bị lưu trữ. Tiêu chuẩn này định nghĩa
rằng hình ảnh được phát lại ở tốc độ 30 frames một giây và âm thanh được
phát lại ở chất lượng như CD-audio, độ phân giải hình ảnh là 352 x 240.
Chuẩn MPEG-1 được dùng điển hình trong các phần mềm huấn luyện bằng
máy tính, các game hành động trong máy tính, video chất lượng VHS,
Karaoke
MPEG-2 định nghĩa cho một tiêu chuẩn kỹ thuật truyền hình số. Chuẩn
MPEG-2 khắc phục một vài nhược điểm của chuẩn MPEG-1. Ví dụ,
MPEG-2 có thể tạo hình ảnh lớn gấp 4 lần MPEG-1 với độ nét cao hơn và
rõ hơn (720 x 480 và 1280 x 720). Các đặc tính của MPEG-2 bao gồm hình
ảnh chất lượng cao và âm thanh nổi
MPEG-3 định nghĩa một tiêu chuẩn cho High Difinition Television
(HDTV), là thế hệ tiếp theo của công nghệ truyền hình theo định dạng số
đầu đủ. Tiêu chuẩn này đã không được phát triển hoàn thiện và cuối cùng

kHz = 22.000 mẫu / 1giây.
Phương pháp cổ điển để giảm kích thước lưu trữ là giảm lượng thông tin.
Nếu đổi cách lưu trữ âm thanh từ 16 bit sang 8 bit chúng ta có thể giảm kích
thước lưu trữ đi 1 nửa, tuy nhiên như thế chất lượng âm thanh cũng sẽ giảm
đi 1 nửa.
4. Hoạt động
Khi đưa ra phương pháp mã hóa âm thanh, nền tảng vẫn là yếu tố “hệ
thống nghe” của con người. Thật không may đó không phải 1 thiết bị
hoàn hảo để nhận biết âm thanh nhưng là thiết bị duy nhất chúng ta có
được. Nhưng chúng ta có thể chuyển những khuyết điểm của nó thành
ưu điểm : đó là đặc tính phi tuyến của ngưỡng nghe và khả năng thích
hợp của nó.
MPEG hoạt động dựa trên hệ thống nghe của con người, đó là cảm giác
về âm mang đặc tính sinh lý và tâm lý.
Âm thanh CD ghi lại tất cả tần số, kể cả những tần số bị ‘che’.
Âm thanh MPEG chỉ ghi lại những tần số mà tai người có thể nghe.
Phân tích và ứng dụng chuẩn MP3 Trang 13
Như vậy, MPEG sẽ bỏ qua những thông tin không quan trọng. Dựa trên
nghiên cứu về nhận thức âm thanh của con người, bộ mã hóa sẽ quyết
định những thông tin nào là căn bản và những thông tin nào có thể bỏ
qua.
Hiệu quả này đặc biệt quan trọng trong âm nhạc. Nếu trong một dàn
nhạc có một nhạc cụ chơi cực mạnh, làm át tiếng của các nhạc cụ khác
ta không thể nghe được. Nhưng máy thâu âm vẫn ghi lại đầy đủ tất cả
tần số của tất cả nhạc cụ, nghĩa là thiết bị thâu âm hoàn toàn không có
khả năng thích nghi động như con người. Nhưng khi phát lại, ta vẫn
không nghe được âm thanh của những nhạc cụ bị át. Vì vậy việc lưu trữ

thông tin này. Điều này cho phép bộ mã hóa hoạt động với những mức độ
khác nhau về chất lượng và độ phức tạp, và cũng cho phép sự phát triển
trong tương lai của bộ mã hóa.
2. Giải thích về hiệu quả che (masking effect)
a. Nén âm thanh MPEG
MPEG có thể nén 1 dòng bit 32 kbit/s đến 384 kbit/s. Một dòng bit âm
thanh PCM thô thì khoảng 705 kbit/s, do đó tỉ số nén tối đa có thể là 22.
Tỉ số nén bình thường là 1:6 hay 1:7. 96 kbit/s là xem như trong suốt
cho hầu hết các mục đích thực tế. Có nghĩa rằng ta không cần phải lưu
Phân tích và ứng dụng chuẩn MP3 Trang 15
tâm đến bất kỳ sự khác biệt nào giữa tín hiệu gốc và tín hiệu nén đối với
nhạc pop hay nhạc rock’n roll. Đối với một số ứng dụng khác như là hòa
tấu piano, tốc độ bit có thể lên tới 128 kbit/s.
Để đạt được tỉ số nén này, đối với âm thanh, về cơ bản ta có hai chọn
lựa: hoặc giảm số lần lấy mẫu, hoặc giảm số bit để lượng tử hoá. Con
người có thể nghe âm thanh với tần số từ 20 Hz đến 20 kHz. Theo
thuyết của Nyquist, ta phải lấy mẫu âm thanh ở tần số tối thiểu là hai lần
tần số cao nhất mà ta muốn phát lại. Tần số lấy mẫu 44,1 kHz là thích
hợp. Vấn đề còn lại là phải chọn số bit cho một mẫu mã hóa là bao
nhiêu. Thông thường là 16 bit.
Lý do để chọn con số 16 bit bắt nguồn từ tỉ số tín hiệu và nhiễu (S/N).
Nhiễu nói ở đây sinh ra do qúa trình số hóa. Cứ mỗi bit thêm vào, ta có
tỉ số S/N tốt hơn 6dB (đối với tai người, 6 dB tương ứng với mức to gấp
đôi). Âm thanh CD đạt tới khoảng 90 dB S/N. Mức này phù hợp với
phạm vi động của tai người còn tốt. Nghĩa là ta không thể nghe được bất
kỳ nhiễu nào đến từ bản thân hệ thống. Điều gì xảy ra nếu ta lấy mẫu với
8 bit? Ta sẽ nghe thấy rất nhiều tiếng sôi trong bản ghi. Dễ dàng nghe

người.
Các sub-band nên phù hợp với tai người, nghĩa là mỗi sub-band cần có
các tần số có cùng các tính chất âm học tâm lý. Trong MPEG layer II,
mỗi sub-band có độ rộng 625Hz, do đó cần phải có những bộ lọc băng
thông phức tạp. Để các bộ lọc đỡ phức tạp, người ta thêm FFT (Fast
Fourier Transform) vào song song với bộ lọc và sử dụng các thành phần
phổ từ FFT như là các thông tin thêm vào bộ mã hóa. Bằng cách này ta
sẽ lấy mật độ bit cao hơn đối với các tần số thấp mà tai người nhạy cảm
hơn.
Còn nhiều vấn đề cần phải bàn tới. Chúng ta chỉ mới giải thích sự che
đồng bộ, hiệu qủa che còn xảy ra trước và sau một âm mạnh.
3. Các lớp âm thanh MPEG

Có nhiều sự nhầm lẫn về lớp âm thanh MPEG. Tất cả các lớp đều dựa
trên cùng một lược đồ mã hóa (mã hóa theo nhận thức). Mức độ phức
tạp của bộ mã hóa và giải mã tuỳ thuộc vào mỗi lớp. Sau đây là hình ảnh
cho thấy tỉ số nén mà ta cần phải đạt tới 100% chất lượng CD với các bộ
mã hóa và giải mã khác nhau.

Sau đây là chi tiết về các lớp.
a. Lớp I (Layer I)
Phân tích và ứng dụng chuẩn MP3 Trang 17
Đây là lớp đơn giản nhất phù hợp cho ứng dụng của người dùng. Mô
hình âm học tâm lý của lớp này chỉ sử dụng các tần số che. Điều này có
nghĩa rằng nó sẽ bỏ qua các tần số bị khuất sau các tần số khác. Phạm vi
tốc độ bit từ 32 kbit/s (mono) đến 448 kbit/s (stereo). Tùy thuộc vào
mức độ phức tạp của bộ mã hóa, một âm thanh chất lượng cao (gần với

Những cải thiện của lớp 3 so với lớp 1 và lớp 2 :
Phân tích và ứng dụng chuẩn MP3 Trang 18
 Giảm sự chồng phổ :Lớp 3 cung cấp phương pháp xử lý các giá
trị MDCT để loại bỏ sự dư thừa do sự chồng lấp giữa các băng.
 Lượng tử hóa phi tuyến :Bộ lượng tử hóa lớp 3 nâng các lối vào
của nó lên ¾ năng lượng trứơc khi lượng tử hóa để cung cấp tỉ
số tín hiệu trên nhiễu (SNR) cao hơn.
 Mã hóa entropy các giá trị dữ liệu : Lớp 3 sử dụng mã Huffman
để mã hóa các mẫu lượng tử hóa cho việc nén dữ liệu tốt hơn .
 Sử dụng một bộ dữ trữ bit (bit reservoir): Dòng bit lớp 3 phù hợp
hơn với độ dài thay đổi của dữ liệu được nén. Cũng giống như
lớp 2, khung dữ liệu lớp 3 có 1152 mẫu. Lớp 3 không giống lớp 2
ở chỗ dữ liệu mã hóa không nhất thiết phải vừa vặn trong một
khung cố định. Bộ mã hóa có thể lấy hoặc mượn các bit từ bộ dự
trữ bit nếu cần thiết .
 Sự phân bố nhiễu hay sự phân bố bit : Quá trình phân bố bit trong
lớp 1 và lớp 2 chỉ xấp xỉ lượng nhiễu gây bởi lượng tử hóa theo
số bit cho trước. Bộ mã hóa lớp 3 sử dụng một vòng lặp phân bố
nhiễu. Theo cách này , các bộ lượng tử hóa được thay đổi theo
thứ tự , và lượng tử hóa có được là do tính toán và được phân bố
cho mỗi băng phụ.
III. CÁC THÔNG SỐ DÙNG TRONG MPEG
Chuẩn MPEG cho phép ta chọn lựa các thông số cho việc nén âm thanh
tốt nhất phù hợp với ứng dụng mà ta sử dụng. Lược đồ mã hóa cho các
loại là tổng quát. Các thông số có thể chọn lựa trong bộ mã hóa MPEG
bao gồm : Mode, Sampling frequency, bitrate, và Layer.
1. Mode

Tần số lấy mẫu càng lớn thì càng nghe thuận tai (độ dài frame nhỏ hơn).
Băng thông tín hiệu giới hạn ở mức 15 kHz khi lấy mẫu ở tốc độ 32 kHz
và 8 kHz ở tốc độ 16 kHz.
Tần số lấy mẫu (kHz) và tốc độ của âm thanh mã hóa (kbps) có thể chọn
độc lập.
Tần số lấy mẫu 44.1 kHz hay 22.05 kHz là không thiết thực cho việc
chọn lọc vì độ dài frame (byte) là thay đổi.
Những file được lấy mẫu ở những tần số khác nhau thì rất khó khăn khi
hòa trộn.
Khi dùng ngõ nhập số AES/EBU, tần số lấy mẫu bị cố định bởi tín hiệu
nhập.
Nếu không bắt buộc, Digigram yêu cầu lấy mẫu ở 48 kHz hoặc 44.1 kHz
cho phát thanh hay ứng dụng multimedia. Nếu ta phải sử dụng tốc độ bit
thấp cho sự truyền có hiệu quả, tốc độ 24 kHz là thích hợp.
3. Bit Rate
Phân tích và ứng dụng chuẩn MP3 Trang 20
Mỗi Layer và chế độ có nhiều cách chọn lựa tốc độ bit (bit rate). Việc
chọn tốc độ bit tùy thuộc trước tiên vào chất lượng âm yêu cầu. Băng
thông tín hiệu là hẹp hơn nếu tốc độ bit thấp, khiến cho nó không thực
tế đối với một số ứng dụng. Tốc độ bit được đo theo kilobits /
sec(kbps).
Khi chọn lựa tốc độ bit cần xem xét các vấn đề:
Tại 128 kbps trên mỗi kênh (hay 256 kbps stereo), chất lượng âm thanh
CD sẽ đạt được với Layer I hay Layer II.
Tại 192 kbps trên mỗi kênh, chất lượng âm thanh là hoàn toàn trong
suốt.
Tốc độ 128 kbps / kênh được dùng phổ biến nhất trong phát thanh. Nó

ồn.
2. Các băng tới hạn (critical bands)
Các nghiên cứu thực tế cho thấy tai người có thể cảm nhận được các nguồn âm
có tần số từ 20 Hz đến 20KHz. Ngoài ra , tai người còn được coi là bộ phân
tích phổ đối với phổ tần nghe được. Tai người được coi là 1 băng lọc (filter
bank) gồm nhiều mạch lọc thông dãi với các băng thông có độ rộng khác
nhau, nó đặc trưng cho khả năng phân giải âm thanh của tai người. Các băng
này được gọi là băng tới hạn, chúng có độ rộng thay đổi theo tần số từ thấp
đến cao. Trên thực tế có 25 băng tới hạn được qui ước theo bảng các băng tới
hạn dưới , mỗi băng có một tần số trung tâm. Độ rộng của mỗi băng có thể
được tính xấp xỉ như sau :
BW
c
(f)=25+75[1+1.4(f/1000)
2
]
0.69
(HZ)
Một băng tới hạn có độ rộng là một Bark(đặt theo tên của nhà khoa học
Barkhausen). Hàm sau đây cho phép chuyển từ giai tần số sang giai Bark:
Z(f) = 13arctan(0.00076f) + 3.5arctan[(f/75000)
2
] (Bark)
Tai người có khả năng phân tích thời gian tần số, khả năng này tạo ra các hiện
tượng che đồng thời và không đồng thời. Các hiện tượng này được sử dụng
bởi các bộ mã hóa để xác định các thành phần dư thừa nhằm loại bỏ, không
mã hóa chúng.

Băng tới
hạn

19
20
21
22
23
24
25
50
150
250
350
450
570
700
840
1000
1170
1370
1600
1850
2150
2500
2900
3400
4000
4800
5800
7000
8500
10500

300
400
510
630
770
920
1080
1270
1470
1720
2000
2320
2700
3150
3700
4400
5300
6400
7700
9500
12000
15500
100
200
300
400
510
630
770
920

thời phức tạp, vì mục tiêu định dạng sái dạng mã hóa, ta chỉ cần quan tâm
đến 3 loại che đồng thời : nhiễu che tone , tone che nhiễu, nhiễu che nhiễu.
Phân tích và ứng dụng chuẩn MP3 Trang 23
 Nhiễu che tone (Noise-Masking-Tone, NMT) : ví dụ như 1 nhiễu băng
thông hẹp (có băng thông là 1 Bark) che một tone với điều kiện là tone
bị che có mức SPL nhỏ hơn ngưỡng do nhiễu che quyết định.
 Tone che nhiễu (Tone – Masking - Noise, TMN): Ví dụ như 1 tone ở
tần số trung tâm của 1 băng nhiễu (băng thông là 1 Bark) che băng
nhiễu đó khi mức SPL của băng nhiễu thấp hơn mức ngưỡng do tone
che quyết định .
 Nhiễu che nhiễu (Noise - Masking – Noise, NMN): Đây là trường hợp
mà 1 nhiễu băng thông hẹp bị che bởi 1 băng nhiễu khác.
 Hiện tượng che không đồng thời :xảy ra khi các tone (hoặc nhiễu) được
phát lên đồng thời nhưng gần nhau theo thời gian. Hiện tượng tiền che xảy
ra khi một tone (hoặc nhiễu) bị che bởi một tone (hoặc nhiễu) xảy ra sau.
Tương tự, hiện tượng hậu che khi một tone xảy ra trước che một tone xảy ra
sau đó.
Bộ mã hoá thụ cảm phân tích thành phần tần số và biên độ của tín hiệu audio
vào và so sánh với mô hình âm sinh lý của tai người. Bộ mã hoá loại bỏ các
thành phần dư thừa không cần thiết ( phần tai người không cảm nhận được) vì
vậy giảm 1 lượng đáng kể dữ liệu cần mã hoá. Về mặt lý thuyết, phương pháp
này làm hao hụt thông tin nhưng tai người vẫn không cảm thấy được sự suy
giảm chất lượng tín hiệu audio. Phân tích và ứng dụng chuẩn MP3


chuyển sang miền tần số nhờ các phép biến đổi toán học. Các bộ mã hoá có thể
sử dụng các phép biến đổi như phép biến đổi Fourier rời rạc DFT (Discrete
Fourier Transform) hoặc MDCT. Các hệ số có được từ các phép biến đổi được
lượng tử hoá và mã hoá dựa trên mô hình âm tâm lý, các thành phần bị che
được loại bỏ. Đứng trên quan điểm thông tin, sự biến đổi làm giảm Entropy của
tín hiệu cho phép mã hoá hiệu quả hơn.

Trong các bộ mã hoá biến đổi thích nghi, một mô hình được sử dụng để lượng
tử hoá thích nghi mỗi băng phụ, nhưng các hệ số trong mỗi băng được lượng tử
hoá vời cùng số bit. Thuật toán phân phối bit tính toán nhiễu lượng tử hoá trong
mỗi băng để có được tỉ số S/N cần thiết cho việc che. Trong vài trường hợp tốc
độ bit lối ra có thể thay đổi. Trước khi truyền đi , dữ liệu thường được nén với
phương pháp mã hoá Entropy, chẳng hạn như mã hoá Huffman. Mô hình mã
hóa thích nghi được minh họa như hình sau: Audio_vào Audio ra
Phân tích và ứng dụng chuẩn MP3 Trang 25
Tính toán
ngưỡng che
FFT và mô


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status