z
Luận văn
Mã hóa tín hiệu số
âm thanh
a. Định nghĩa:
Các môi trường chất khí, chất lỏng, chất rắn là môi trường đàn hồi.
Môi trường đàn hồi có thể coi là những môi trường liên tục gồm những
phân tử liên kết chặt chẽ với nhau, lúc bình thường mỗi phân tử có một vị
trí cân bằng bền.
b. Sự hình thành sóng trong môi trường đàn hồi:
• Do tính chất của môi trường đàn hồi, cho nên nếu tác dụng lên phân tử
nào đó của môi trường thì phân tử này rời khỏi vị trí cân bằng bền.
• Do tương tác, các phân tử lân cận một mặt kéo phân tử A về vị trí cân
bằng, mặt khác nhận một phần năng lượng do phân tử A truyền sang, do
đó cũng dao động theo, hiện tượng này xảy ra liên tiếp tạo thành sóng.
Sóng đàn hồi (sóng cơ) là sự
lan truyền dao động trong môi trường đàn
hồi. Sóng cơ không thể truyền được trong chân không, vì chân không
không phải là môi trường đàn hồi.
• Cần lưu ý trong khi truyền dao động, các phân tử của môi trường
không di chuyển theo các dao động được lan truyền mà chỉ dao động
quanh vị trí cân bằng của nó.
c. Một số khái niệm về sóng
:
• Nguồn sóng: là ngoại vật gây ra kích động sóng.
• Tia sóng: là phương truyền sóng.
• Môi trường sóng: là không gian mà sóng truyền qua.
• Mặt sóng: là mặt chứa những điểm (phân tử) có cùng trạng thái dao
động tại một thời điểm nào đó. Tia sóng luôn vuông góc với mặt sóng.
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang 2
• Sóng cầu: mặt sóng là những mặt cầu phân bố đều trong không gian,
trong chất rắn có thể truyền được cả hai loại sóng.
1.2. Các đặc trưng của sóng
.
a. Vận tốc truyền sóng (C)
:
Là quãng đường mà sóng truyền được trong một đơn vị thời gian.
b. Bước sóng λ:
Là quãng đường mà sóng truyền được sau một thời gian bằng 1 chu kỳ T.
Như vậy λ là khoảng cách bé nhất giữa các phân tử dao động cùng pha.
Theo định nghĩa ta có : λ = CT.
c. Chu kỳ và tần số
:
• Chu kỳ T là thời gian cần thiết để sóng truyền được 1 bước sóng λ.
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang 3
• Tần số f là số chu kỳ thực hiện được trong 1 giây :
F = 1/T (Hz)
1.3. Phương trình sóng
.
• Sóng phẳng truyền dọc theo phương OY với vận tốc C thì phương trình
sóng biểu thị mối quan hệ giữa độ chuyển dời X của phân tử dao động kể
từ vị trí cân bằng với thời gian t và khoảng cách y đến các vị trí cân bằng
các phân tử dao động trên phương truyền sóng như sau :
X = asinω(t – y/c)
• Nếu sóng phẳng truyền theo hướng ngược với hướng tính khoảng cách
y thì :
X = asinω(t + y/c)
•
• Các dao động âm phát ra từ nguồn lan truyền trong môi trường đàn hồi
như không khí dưới dạng sóng đàn hồi gọi là sóng âm. Sóng âm đến kích
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang 4
động màng nhĩ tai gây cảm giác về âm, do đó cần phân biệt hai loại đại
lượng về âm:
- Đại lượng âm khách quan: những đại lượng thuần túy vật lý, không phụ
thuộc vào tai người.
- Đại lượng âm chủ quan: những đại lượng tâm lý vật lý phụ thuộc vào tai
người.
2.2.1. Đơn vị âm khách quan:
a. Aùp suất âm:
Khi sóng âm tới một mặt nào đó, do các phân tử môi trường dao
động tác dụng lên mặt đó một lực gây ra áp suất. Aùp suất ở đây là áp suất
dư do sóng âm gây ra ngồi áp suất khí quyển.
Trong phạm vi nghe được, áp suất âm trong khoảng từ 2.10
-4
đến
2.10
2
μbar, chênh lệch 10
6
lần, đó là một phạm vi rất rộng.
b. Cường độ âm (I):
- Cường độ âm ở một điểm nào đó trên phương đã cho trong trường âm là
số năng lượng âm đi qua đơn vị diện tích của mặt S vuông góc với phương
= 2.10
-4
μbar
C ường độ âm nhỏ nhất I
min
= 10
-16
W/cm
2
.
- Aùp suất âm và cường độ âm lớn nhất mà tai người có thể chịu được là:
P
max
= 2.10
2
μbar
I
max
= 10
-4
W/cm
2
.
- Công suất âm nhỏ nhất có thể nghe thấy được W
min
= 10
-12
Watt.
2.2.2. Đơn vị âm chủ quan:
.
• Do cảm giác âm thanh phụ thuộc vào đặc tính sinh lý của tai người, cho
nên phải có một số đại lượng đặc trưng cho cảm giác âm thanh phụ thuộc
vào tai người, những đại lượng như vậy gọi là đại lượng âm chủ quan.
a. Bel và decibel (db):
Theo định lý sinh lý của Vebe-Fécne, cảm giác nghe to đối với một âm
không tỉ lệ thuận với cường độ âm của âm đó. Khi cường độ âm tăng từ I
o
tới I thì cảm giác nghe to tăng tỉ lệ với lg(I/I
o
). Do đó người ta dùng thang
lô-ga-rít cơ số 10 để đo mức cảm giác so với mức ngưỡng.
Mức ngưỡng gọi là mức zero qui ước :
lg(I/I
o
) = lg(10
-12
/ 10
-12
) = 0 bel.
Đơn vị là Bel hay db. 10db = 1 bel.
b. Mức cường độ âm (L
I
):
N ếu gọi I là cường độ âm của âm đang xét và I
o
là cường độ âm của mức
zero qui ước của âm chuẩn thì mức cường độ âm L
I
• Quãng tần số của hai âm là khoảng cách tần số của hai âm đó. Nếu một
âm tần số là f
1
, một âm khác tần số là f
2
(f
2
> f
1
) thì f
2
/ f
1
= 2
x
.
Khi x=1 tức f
2
/ f
1
= 2 gọi là 1 quãng tần số (hay 1 ốc-ta).
Khi x=1/2 t ức f
2
/ f
1
= 1.41 gọi là nửa ốc-ta.
Khi x=1/3 t ức f
2
/ f
1
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang 7
• Mức to, độ to của một âm là sức mạnh cảm giác do âm thanh gây nên
trong tai người, nó không những phụ thuộc vào áp suất âm mà còn phụ
thuộc vào tần số của âm đó. Thí dụ 2 âm có tần số 100 Hz và 1000 Hz áp
suất âm đều bằng 0,02 μbar nhưng nghe to nhỏ khác nhau, âm 1000 Hz
nghe to hơn âm 100 Hz. Muốn nghe to bằng âm 1000 Hz thì âm 100 Hz
phải có áp suất bằng 0,25 μbar. Như vậy tai người không nhạy đối với âm
100 Hz bằng âm 1000 Hz. Tần số càng thấp tai người càng kém nhạy.
a. Mức to:
- Để biểu thị mức to trên cảm giác chủ quan, ta dùng đại lượng “mức to”,
đơn vị là “Fôn” với định nghĩa như sau :
Fôn là mức to của âm chuẩn, về giá trị bằng mức áp suất âm của âm chuẩn
tức là :
L = 20lg P/Po (Fôn).
- Vậy mức to của một âm bất kỳ đo bằng Fôn, về giá trị bằng mức áp suất
âm của âm chuẩn đo bằng db có cùng mức to với âm đó. Thí dụ: âm có t
ần
số 500 Hz mức áp suất âm bằng 25 db và âm có tần số 50 Hz mức áp suất
âm bằng 64 db sẽ có cùng mức to bằng 20 Fôn, bằng mức to của âm 1000
Hz mức áp suất bằng 20 db.
- Muốn biết mức to của một âm bất kỳ phải so sánh với âm chuẩn.
- Đối với âm chuẩn, mức to ở ngưỡng nghe là 0 Fôn, ngưỡng chói tai là
120 Fôn.
- Cùng một giá trị áp suất, âm tần số càng cao, mức to càng lớn.
b. Độ to:
- Khi so sánh âm này to hơn âm kia bao nhiêu lần, dùng khái niệm “độ to”
đơn vị là “Sôn” với định nghĩa như sau:
• Âm có tần số f1 gọi là âm cơ b
ản hay họa âm thứ nhất, các âm có tần
số f2 , f3 gọi là các họa âm thứ hai, thứ ba Âm cơ bản bao giờ cũng
mạnh nhất, các họa âm có tác dụng quyết định âm sắc của âm cơ bản, giúp
ta phân biệt các nguồn âm khác nhau. Chẳng hạn tiếng đàn Pi-a-nô và
tiếng sáo tuy cùng một âm cơ bản nhưng lại rất dễ phân biệt, nguyên nhân
là do số lượng, cấu trúc những họa âm quanh âm cơ bản của chúng khác
nhau. Họ
a âm càng nhiều âm nghe càng du dương phong phú.
3. Thính giác định vị (hiệu ứng Stereo):
• Khi nghe âm tuy mắt không nhìn thấy nguồn âm nhưng có thể xác định
chính xác vị trí của nguồn âm. Đặc điểm này là kết qủa của hai tác dụng:
- Do cường độ, độ to, âm sắc của âm đến hai tai không giống nhau.
- Do âm đến hai tai lệch pha nhau, vì thời gian đến hai tai không giống
nhau.
• Cường độ, độ to của âm đến hai tai chênh lệch nhau là do nhiễu xạ gây
ra. Âm có tần số f < 1000 Hz sự chênh lệch cường độ do nhiễu xạ gây ra
r
ất bé nhưng ở những tần số cao, sự chênh lệch này có thể đạt tới 20 - 30
db.
• Do khả năng định vị của tai như vậy cho nên khi nghe âm có thể tập
trung chú ý vào nguồn âm cần nghe, bỏ qua một cách tự nhiên những âm
không cần nghe. Nhờ hiệu qủa này mà tiếng ồn bị phủ lấp hoặc giảm nhỏ
một cách tự nhiên. Nếu chỉ nghe âm một tai thì hiệu qủa này mất.
4. Nghe âm và chênh lệ
ch thời gian:
• Tương tự như tác dụng lưu ảnh của mắt, tai người cũng có tác dụng lưu
âm.
• Thí nghiệm với nhiều thính giác bình thường cho thấy rằng, nếu hai âm
• Microsoft đưa ra công cụ phát triển Multimedia Development Kit
(MDK). Lập trình viên kết hợp công cụ trên với bộ Windows Software
Development Kit (SDK) để viết các ứng dụng về Multimedia.
• Có hai dạng xử lý âm thanh số hóa trên Windows. Loại thứ nhất
microsoft gọi là “Wave Form Audio” (Aâm thanh dạng sóng), dựa trên
nguyên tắc số hóa sóng âm, MPC lưu chúng trên bộ nhớ hay tập tin .WAV
trên đĩa. Các dữ liệ
u số này có thể thông qua phần cứng biến đổi lại thành
âm thanh.
• Dạng thứ hai là MIDI. Khác với âm thanh dạng sóng, MIDI chỉ lưu lại
những thông điệp điều khiển bộ tổng hợp phát ra âm thanh. Do đó kích
thước của tập tin .MID nhỏ hơn nhiều so với tập tin.WAV.
II. CẤU TRÚC WAVE FILE.
1. RIFF file
.
Wave File là tập tin chứa các dữ liệu của mẫu âm thanh đã được số
hóa. Phương pháp số hóa âm thanh hiện nay là phương pháp PCM.
Phương pháp này sẽ lấy mẫu âm thanh với tần số khoảng 11.025 kHz cho
đến 44.1 kHz. Mỗi lần lấy mẫu, số liệu này lại được lượng tử hóa bằng
một hay hai byte cho một mẫu âm thanh. Như vậy tần số lấy mẫu càng
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
10
cao, số byte dùng lượng tử hóa càng nhiều thì âm thanh phát lại càng trung
thực, nhưng lại tăng số byte cần lưu trữ. Với một mẫu âm thanh phát ra
trong một phút cần phải lưu trữ ít nhất 660 kB. Đó là lý do tại sao các File
Wave luôn có kích thước khá lớn so với MIDI File.
Cấu trúc của Wave File thuộc vào lớp file được sử dụng bởi các
hàm Multimedia của Windows: đó là RIFF FILE. RIFF là chũ viết tắt của
Dữ liệu của “fmt” chunk là đối tượng WAVEFORMAT có cấu trúc như
sau:
Typedef struct waveformat_tag
{
WORD wFormatTag;
WORD nChannels;
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
11
DWORD nSamplesPerSec;
DWORD nAvgBytesPerSec;
WORD nBlockAlign;
} WAVEFORMAT;
- wFormatTag thường có giá trị là WAVE_FORMAT_PCM được định
nghĩa trong tập tin MMSYSTEM.H như sau :
#define WAVE_FORMAT_PCM 1
Giá trị này báo cho phần mềm đang đọc Wave File biết kiểu mã hóa
dữ liệu âm thanh sang dữ liệu số là kiểu mã hóa PCM. Hiện nay đây là
kiểu mã hóa duy nhất của Wave file.
- nChannels: có hai giá trị bằng 1 cho âm thanh mono và bằng 2 cho âm
thanh stereo.
- nSamplesPerSec: cho biết tốc độ lấy mẫu, có các giá trị:
11025 11.025 kHz
22050 22.050 kHz
44100 44.100 kHz
- nAvgBytesPerSec: cho biết số bytes yêu cầu trung bình trong một giây để
phát lại mẫu dữ liệ
u của sóng âm.
- nBlockAlign: cho biết số byte dùng để chứa một mẫu âm thanh. Như vậy
Trong mẫu mono 8 bits, dữ liệu của subchunk “data” gồm chuỗi các
giá trị 1 byte. Với stereo 8 bits, mỗi mẫu gồm 2 bytes, dữ liệu sẽ được sắp
xếp xen kẽ (interleave), với byte đầu (byte chẵn) là mẫu âm thanh của
kênh bên trái, byte sau (byte lẻ) là của kênh bên phải. Tóm laị cấu trúc của Wave File như sau:
Kích thước
(số byte)
Giá trị Tên trường
4 “RIFF”
4 Kích thước file RIFF
4 “WAVE”
4 “fmt”
4 Kích thước subchunk “fmt”
2 Kiểu mã hóa dữ liệu của file
wave (thường là PCM)
WORD nFormatTag
2 Số kênh : 1 - mono
2 - stereo
WORD nChannels
4 Số mẫu/1giây DWORD
nSamplesPerSec
4 Số bytes/1giây DWORD
nAvgBytesPerSec
2 Số byte/1mẫu DWORD
nBlockAlign
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
{
mmioClose(h,0);
/* báo lỗi */
return(0);
}
Cấu trúc của MMCKINFO chứa các thông tin về chunk. Nó được
định nghĩa trong MMSYSTEM.H như sau:
Type def st ruct
{
FOURCC ckid;
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
14
DWORD cksize;
FOURCC fcct ype;
DWORD dwDataOffset;
DWORD dwFlags;
} MMC KINFO;
Để “đi vào” một chunk, ta cho trường ckid của MMCKINFO ở loại
chunk mà ta muốn định vị. Có một macro thực hiện việc này là
mmioFOURCC. Sau đó gọi hàm mmioDescend để định vị chunk. Nếu
định vị thành công, hàm này trả về zero và đối tượng MMCKINFO truyền
cho hàm sẽ được điền vào các thông tin về chunk.
Trường cksize định nghĩa kích thước tính bằng byte của chunk.
Đối số thứ ba của mmioDescend là cờ MMIO_FINDRIFF. Cờ này
chỉ thị
cho mmioDescend tìm một file có ID là RIFF với loại chunk được
xác định bởi ckid. Nếu muốn tìm một chunk trong Wave file ta cho cờ này
là MMIO_FINDCHUNK.
mmioClose(h,0);
return(0L);
}
Đối số đầu tiên của mmioRead là handle của file đang đọc. Đối số
thứ hai là con trỏ xa trỏ tới vùng đệm để chứa dữ liệu. Đối số thứ ba là số
byte cần đọc. Hàm này sẽ trả về số byte thực sự đọc được.
• Sau khi đã đọc nội dung của chunk, ta đi ra khỏi chunk để chuẩn bị đọc
chunk kế tiếp:
MmAscend(h,(LPMMCKINFO)&mmSub,0);
Đối số
thứ hai của mmAscend là đối tượng MMCKINFO của chunk mà ta
“đi ra”. Đối số thứ ba là đối số giả.
• Công việc còn lại là đọc dữ liệu mã hóa mẫu âm thanh của Wave file
vào bộ nhớ. Chú ý rằng giá trị cksize trả về bởi mmioDescend được sử
dụng để xác định kích thước vùng đệm cần cấp phát để chứa dữ liệu.
GLOBALHANDLE wavehandle;
HPSTR wavepointer;
MmSub.ckid=mmioFOURCC(‘d’,’a’,’t’,’a’);
If(mmioDescend(h,(LPMMCKINFO)&mmSub,
(LPMMCKINFO)&mmParent,MMIO_FINDCHUNK))
{
mmioClose(h,0);
/* báo lỗi */
return(0);
}
if((wavehandle=GlobalAlloc(GMEM_MOVEBLEIGMEM_
SHARE, mmSub.cksize))==NULL)
{
mmioClose(h,0);
/* báo lỗi */
CHƯƠNG 3. LÝ THUYẾT XỬ LÝ TÍN HIỆU SỐ.
I. TÍN HIỆU VÀ HỆ THỐNG RỜI RẠC
1. Giới thiệu
Tín hiệu là biểu hiện vật lý của thông tin, thường là thông tin về
trạng thái hay hành vi của một hệ vật lý nào đó. Về mặt tốn học, tín hiệu
được coi là hàm của của một hay vài biến độc lập. Ví dụ: tín hiệu âm thanh
là sự thay đổi áp suất không khí theo thời gian; tín hiệu hình ảnh là hàm độ
sáng theo hai biến không gian
Theo qui ước chung, tín hiệu được coi là hàm theo một biến độc lập
và là biến thời gian.
Tín hiệu số (Digital signal) là tín hiệ
u rời rạc (theo biến độc lập thời
gian) đồng thời có biên độ cũng rời rạc hóa (lượng tử hóa).
2. Đáp ứng xung trong hệ tuyến tính bất biến
.
Tín hiệu vào x(n) được gọi là tác động, tín hiệu ra y(n) được gọi là
đáp ứng của hệ xử lý. Ta có quan hệ:
[
]
)()( nxTny
=
T : phép biến đổi
)()( nynx →
Một hệ thống là tuyến tính nếu thỏa nguyên lý xếp chồng: giả sử
y
1
∑
∞
−∞=
=
k
k
nhkxny )().()(
h
k
(n) gọi là đáp ứng xung của hệ đối với tác động là xung δ(n-k)
Theo công thức trên, hệ tuyến tính vẫn còn tùy thuộc vào thời điểm
tác động k. Một hệ tuyến tính là bất biến(theo thời gian) nếu tín hiệu vào bị
dịch đi một đoạn thời gian là k thì tín hiệu ra cũng chỉ dịch một đoạn k,
tức mọi h
k
(n) trở thành h(n-k).
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
18
Như vậy mọi hệ tuyến tính bất biến đều được đặc trưng hồn tồn
bằng đáp ứng h(n), biết h(n) ta hồn tồn tính được đáp ứng y(n) của tín hiệu
vào x(n).
∑
∞
−∞=
−=
−=
k
knxkh )().(
• Tính phân phối:
[
]
)(*)()(*)()()(*)(
2121
nhnxnhnxnhnhnx
+
=
+
Như vậy, từ tính chất giao hốn, ta thấy rằng: hai hệ TTBB có đáp
ứng xung là h
1
(n) và h
2
(n) được mắc nối tiếp nhau sẽ tương đương với một
hệ có đáp ứng xung:
)(*)()(
21
nhnhnh
=
và thứ tự mắc nối tiếp không quan trọng.
Từ tính chất phân phối, hai hệ TTBB mắc song song nhau sẽ tương
nhân) thì mới có tác động ra (kết quả).
• Định lý
: Hệ tuyến tính bất biến (TTBB) là nhân quả nếu đáp ứng xung
h(n) = 0 với mọi n<0.
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
19
Đối với một hệ TTBB và nhân quả, dạng chung của công thức tổng chậ
p
∑
∞
−∞=
−=
k
knhkxny )().()(
hoặc viết cách khác:
∑
∞
=
−=
0
)().()(
k
khknxny
Nếu đáp ứng xung h(n) có độ dài hữu hạn N thì:
∑
∞
−∞=
∞<=
n
nhS |)(|
6. Phương trình sai phân tuyến tính hệ số hằng
Ta chỉ khảo sát các hệ thống tuyến tính bất biến và có thể đặc trưng bởi các
phương trình sai phân có hệ số hằng. Mối liên hệ giữa tín hiệu vào x(n) và
tín hiệu ra y(n) có dạng như sau:
∑∑
==
−=−
N
k
M
r
rk
rnxbknya
00
)()(
Trong đó tập các hệ số a
k
và b
r
đặc trưng cho hệ TTBB.
x(n)
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
20
Hàm H(e
jω
) gọi là đáp ứng tần số của hệ, biểu diễn đáp ứng của hệ thống
theo hàm của tần số đối với dãy tác động e
jωn
, nó cho biết sự thay đổi về
biên độ và pha theo tần số khi tín hiệu đi qua hệ.
H(e
jω
) là một hàm số phức và có thể biểu diễn theo phần thực và ảo:
H(e
jω
)= H
r
(e
jω
)+ jH
i
(e
jω
). (r: real; i: image)
Hoặc theo biên độ và pha:
H(e
jω
)= | H(e
∞
−∞=
−
=
n
njj
enheH
ωω
).()(
Biến đổi Fourier của dãy rời rạc:
∑
∞
−∞=
=
k
tTjk
k
eAtS
)2(
.)(
π
Đối với tín hiệu tuần hồn
∫
+
=
Tt
−
=
π
π
ωω
ωπ
deeXnx
njj
).(2/1)(
7.4. Phổ biên độ, phổ pha và phổ năng lượng
Do X(f) là một hàm phức nên ta có thể biểu diễn dưới dạng modul và
argument:
[
]
)(arg
|)(|)(
fXj
efXfX =
Hàm modul X(f) theo f được gọi là phổ biên độ của tín hiệu x(n), còn hàm
θ(f)=arg[X(f)] được gọi là phổ pha.
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
21
Cuối cùng φ(f)=|X(f)|2 được gọi là phổ năng lượng, biểu diễn sự phân bố
theo tần số của năng lượng tín hiệu x(n).
Ta có thể khôi phục lại tín hiệu x
a
(t) bằng cách cho tín hiệu lấy mẫu đi qua
một mạch lọc (tương tự) thông thấp lý tưởng (low-pass filter) có đáp ứng
tần số H
lp
(f) với tần số cắt là f
c
= F
s
/2. Phổ của tín hiệu x
a
(t) sẽ được lọc lại
chính xác chỉ với điều kiện :
F
s
≥ 2F
max
Nghĩa là thỏa mãn định lý lấy mẫu. Khi đó trong không gian tần số:
X
a
(f) = X(f).H
lp
(f)
Còn trong không gian thời gian:
X
a
(t) = x(nT
s
(n) = ξ
k±N
(n) = ξ
k±2N
(n) = e
j(2πk/N)n
Đối với tín hiệu tuần hồn và rời rạc x
p
(n), ta có chuỗi Fourier rời rạc
(DFS):
∑
=
nNkj
kp
eanX
)/2(
.)(
π
k=N
Trong đó các hệ số a
k
là các hệ số khai triển chuỗi Fourier rời rạc hay còn
được gọi là các vạch phổ của tín hiệu tuần hồn.
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
22
2. Biến đổi Fourier rời rạc của tín hiệu có độ dài hữu hạn(DFT:Discrete Fourier
Nếu N ≥ M thì không xảy ra hiện tượng trùm thời gian giữa các phần của
x
p
(n).
Do x
p
(n) chỉ có duy nhất một cách biểu diễn chuỗi Fourier rời rạc nên x(n)
cũng vậy. Từ chuỗi Fourier ta tính ra được 1 chu kỳ tín hiệu của x
p
(n),
trong đó có x(n):
x
p
(n) 0 ≤ n ≤ N-1
x(n)=
0 n còn lại.
3. Phép biến đổi nhanh fourier
Fast Fourier Transform (FFT) là một giải thuật rất hiệu quả để tính DFT.
Công thức biến đổi DFT:
∑
−
=
=
1
0
/)2(
).()(
−
=
−
=
+
++=
12/
0
12/
0
)12(2
).12().2()(
N
n
N
n
kn
N
nk
N
WnxWnxkX
Ký hiệu thành phần chẵn là x
ev
và lẻ là x
od
, ta viết lại:
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
Nev
+=
, k = 0 N-1
Để tính X(k) chỉ cần tính trong nửa chu kỳ N/2.
X
ev
(k) và X
od
(k) tuần hồn với chu kỳ N/2: X
ev
(k) = X
ev
(k - N/2),
N/2 ≤ k ≤ N-1.
Khoa CNTT – ĐHBKHN
SVTH: Đỗ Văn Tuấn Trang
24
CHƯƠNG 4. GIỚI THIỆU VỀ MPEG.
I. GIỚI THIỆU.
1. MPEG là gì?
MPEG, viết tắt của cụm từ “Moving Picture Experts Group”, là một nhóm
chuyên nghiên cứu phát triển các tiêu chuẩn về hình ảnh số và nén âm
thanh theo chuẩn ISO/IEC. Ngày nay, nhóm làm việc MPEG đã phát triển
và phát hành các tiêu chuẩn MPEG-1, MPEG-2 và MPEG-4. Chuẩn
MPEG-3 được kết hợp vào MPEG-2 và không còn tách riêng nữa. Nhóm
MPEG hiện nay đã phát triển đến chuẩn MPEG-7. MPEG chỉ là một tên
riêng, tên chính thức của nó là : ISO
/IEC JTC1 SC29 WG11.
biệt nó định nghĩa tiêu chuẩn truyền cho dòng phức tạp các hình ảnh, âm
thanh và dữ liệu đồ hoạ và việc tái hợp chúng trên thiết bị thu. MPEG-4