HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
SÁCH HƯỚNG DẪN HỌC TẬP XỬ LÝ ÂM THANH VÀ HÌNH ẢNH
(DÙNG CHO SINH VIÊN HỆ ĐÀO TẠO ĐẠI HỌC TỪ XA)
Biên soạn: TS Nguyễn Thanh Bình
ThS Võ Nguyễn Quốc Bảo
Biên soạn phần xử lý âm thanh: ThS Võ Nguyễn Quốc Bảo
Biên soạn phần xử lý hình ảnh: TS Nguyễn Thanh Bình Chương 1 Giới thiệu chung về xử lý tín hiệu
3
CHƯƠNG 1 GIỚI THIỆU CHUNG VỀ XỬ LÝ TÍN HIỆU
1.1 CÁC KHÁI NIỆM VÀ LÝ THUYẾT CƠ BẢN
Xử lý tín hiệu là lĩnh vực khoa học được nghiên cứu và phát triển trong một thời gian dài.
Hệ thống xử lý tín hiệu tương tự cũng như xử lý tín hiệu số được ứng dụng rất rộng rãi trong
ngành viễn thông cũng như trong nhiều ngành khoa học khác. Trong những năm gần đây, các
phương pháp xử lý tín hiệu số đang dần chiếm ưu thế, cho dù, về mặt bản chất, tín hiệ
u nguyên
thủy được truyền đi và tín hiệu mà người nhận tin có thể tiếp thu được vẫn là tín hiệu tương tự.
Xu hướng phát triển trên hình thành do hệ thống số có nhiều tính năng nổi trội của so với các hệ
thống analog cổ điển:
1. Các hệ thống xử lý số có độ linh hoạt cao: có thể nhanh chóng thay đổi cơ chế hoạt
động của phần cứng thông qua phần mềm
điều khiển.
2. Độ ổn định cao, ít chịu ảnh hưởng của môi trường xung quanh, tính chất của hệ thống
số hầu như không thay đổi theo thời gian.
3. Khả năng xử lý tín hiệu với độ chính xác cao. Tín hiệu số cho phép lưu trữ và sao chép
nhiều lần với mức độ tin cậy cao. Khả năng chống nhiễu của tín hiệu số cao hơn so với
tín hiệu tươ
ng tự.
4. Thời gian thiết kế và thi công các hệ thống số nhanh, kích thước nhỏ gọn, mức tiêu hao
năng lượng thấp v.v.
Trước đây, do tốc độ xử lý của máy tính còn chậm, việc xử lý các tín hiệu "phức tạp" như
vẫn được mô tả dựa trên nền tảng lý thuyết xử lý tín hiệu tổng quát. Sau đây chúng ta nhắc lại một
số những khái niệm cơ bản về tín hiệu và hệ thống xử lý tín hiệu.
1.1.1 Tín hiệu và phân loại tín hiệu
Tín hiệu do một thiết bị đầu cuối tạo ra, tín hiệu là biểu diễn vật lý (dòng điện, điện áp )
của tin tức, được truyền đi từ đầu phát đến đầu thu. Tín hiệu có thể được biểu diễn bằng một hàm
của nhiều biến số:
() ( )
ϕ
,,,
f
vt
f
tm =
, f - tần số, t - thời gian, v - biên độ, ϕ - trạng thái pha.
Khi phân loại tín hiệu ta có thể dựa trên các cơ sở khác nhau như phân loại theo năng lượng,
hình thái, theo tính chất của phổ của tín hiệu v.v.
Trong lý thuyết tín hiệu có hai lớp tín hiệu quan trọng đó là tín hiệu xác định và ngẫu nhiên.
Tín hiệu xác định là tín hiệu có quá trình biến đổi biểu diễn bằng một hàm thời gian, và có thể xác
định chính xác ở mọi thời đi
ểm. Các tín hiệu xác định có vai trò rất quan trọng trong lý thuyết tín
hiệu cổ điển. Tín hiệu xác định còn chia ra thành tín hiệu tuần hoàn (theo chu kỳ T) và không
tuần hoàn (phi chu kỳ).Tín hiệu tuần hoàn là những tín hiệu có thể biểu diễn bằng công thức như
sau:
() ( )
nguyeânkk
T
t
x
t
là biến độc lập, rời rạc, n là số nguyên,
s
T
là chu kỳ lấy mẫu.
Tín hiệu có biên độ và thời gian đều rời rạc được gọi là tín hiệu số, ký hiệu là
()
d
x
n
.
Ngoài ra, dựa trên tính chất của tin tức truyền đi, người ta còn phân loại các tín hiệu sau:
- Tín hiệu thoại (tiếng nói con người).
- Tín hiệu hình ảnh tĩnh hay ảnh động (tín hiệu video)
- Tín hiệu dữ liệu (data) dùng trong hệ thống máy tính, bộ vi xử lý.
Một số tín hiệu khác, phân biệt theo bề rộng phổ và tần số (tín hiệu dải rộng, dải hẹp, cao
tần v.v.) cũng sẽ được định nghĩa và sử dụng trong những phần tiếp theo.
1.1.2 Tín hiệu rời rạc
Tín hiệu x(t) có biến thời gian t rời rạc được gọi là tín hiệu rời rạc, chúng ta có thể ký hiệu
là {x
n
} với n là số nguyên (n = 0, ±1, ±2, … ).
Chương 1 Giới thiệu chung về xử lý tín hiệu
5
1.1.2.1 Biểu diễn tín hiệu rời rạc
a- Biểu diễn tốn học
Xét hàm x(n) với n là phần tử ngun.
Ký hiệu tín hiệu rời rạc :
0, ,
4
1
,
2
1
,
4
3
1, 0
, },{ ,)n(x
↑ : chỉ mẫu tại n = 0.
1.1.2.2 Các phép biến đổi tín hiệu rời rạc
a- Phép nhân hai tín hiệu rời rạc :
)}().({. nynxyx =
(1.1.1)
b- Phép nhân tín hiệu rời rạc với hằng số :
)}(.{. nyy
α
α
=
(1.1.2)
c- Phép cộng hai tín hiệu rời rạc :
)}()({ nynxyx +=+
(1.1.3)
d- Phép dịch (trễ) :
Dãy x được dịch sang phải n
0
(
x
Hình 1.1.1 Tín hiệu rời rạc
Chương 1 Giới thiệu chung về xử lý tín hiệu
6
e- Tín hiệu rời rạc tuần hoàn với chu kỳ là N nếu thoả mãn :
)()( Nnxnx += , ∀ n. (1.1.7)
Tín hiệu tuần hoàn có thể được ký hiệu với chỉ số p (period) : x
p
(n). Tín hiệu chỉ được xác
định trong một khoảng hữu hạn N mẫu được gọi là tín hiệu có độ dài hữu hạn N.
f- Tín hiệu năng lượng và tín hiệu công suất:
* Năng lượng của tín hiệu được định nghĩa bằng tổng bình phương các modul :
2
()
xN
n
Exn
∞
=−∞
=
∑
(1.1.8)
* Công suất trung bình của tín hiệu rời rạc được định nghĩa như sau:
2
1
lim ( )
n
thay vì
(
)
x
n
−
. Phép biến đổi này thực hiện
bằng cách lấy đối xứng tín hiệu
(
)
x
n
qua gốc thời gian.
1.1.3 Phân loại hệ thống
1.1.3.1 Hệ thống tương tự
Quá trình biến đổi tín hiệu được thực hiện trong hệ thống xử lý tín hiệu. Các hệ thống xử lý
tín hiệu được phân loại dựa vào đặc trưng của tín hiệu mà nó xử lý. Từ cách phân loại tín hiệu trên
đây, ta có các hệ thống xử lý tín hiệu tương ứng như sau:
Hệ thống tương tự: các mạch lọc tương tự, mạch khuyếch đại, nhân tầ
n số, điều chế tín hiệu
v.v.
Hệ thống rời rạc: mạch tạo xung, điều chế xung v.v
Hệ thống số: mạch lọc số
Chương 1 Giới thiệu chung về xử lý tín hiệu
7
Ngoài ra cũng còn các hệ thống hỗn hợp khác như hệ thống biến đổi tương tự- số hay
ngược lại.
Hệ thống được gọi là bất biến nếu
(
)
(
)
y
tTxt=
⎡⎤
⎣⎦
thì
(
)
(
)
00
yt t T xt t−= −
⎡
⎤
⎣
⎦
(1.1.15)
c) Tính nhân quả
Hệ thống được gọi là nhân quả nếu đáp ứng của nó tại thời điểm bất kỳ chỉ phụ thuộc vào
các giá trị của tín hiệu vào ở thời điểm hiện tại và quá khứ.
d) Tính ổn định: Một hệ thống được gọi là ổn định nếu tín hiệu ra giới hạn với tất cả các
tín hiệ
u vào giới hạn.
Dựa trên các tính chất đã nêu của hệ thống, chúng ta có thể phân loại các hệ thống như sau:
hệ thống tuyến tính, hệ thống bất biến, hệ thống nhân quả, hệ thống tuyến tính bất biến.
1.1.3.1.2 Các hệ thống tuyến tính bất biến (LTI)
với t
∀
và ngược lại
nếu
(
)
0ht =
với
t∀
thì hệ thống là nhân quả.
Chương 1 Giới thiệu chung về xử lý tín hiệu
8
Tính ổn định của hệ thống LTI
Cho tín hiệu vào hệ thống được giới hạn biên độ:
(
)
x
xt M
≤
<∞
,
x
M
là hằng số.
Trong trường hợp này, hệ thống sẽ là ổn định nếu đáp ứng xung của nó thỏa mãn điều
kiện:
()
()
00
NM
kr
kr
kr
ay t bx t
==
=
∑∑
(1.1.17)
N, M là số nguyên dương, N là bậc của phương trình.
Nghiệm đầy đủ của phương trình bằng tổng nghiệm riêng
(
)
r
yt
và nghiệm thuần nhất
()
0
y
t
:
(
)
(
)
(
)
(
)
yn
. Toán tử T cho chúng ta thấy quan hệ vào ra của hệ thống.
Chúng ta có hai cách để biểu diễn toán tử T:
(
)
(
)
(
)
(
)
T
Txt yt hay xt yt=⎯⎯→
⎡⎤
⎣⎦
(1.1.19)
Dãy vào còn được gọi là kích thích, còn dãy ra là đáp ứng của hệ thống đối với kích thích
đang khảo sát.
1.1.3.2.1 Hệ thống rời rạc tuyến tính bất biến (LTI)
a. Hệ thống tuyến tính
Hệ thống tuyến tính là hệ thống mà quan hệ vào ra của hệ thống thoả mãn nguyên lý xếp chồng.
Với
(
)
1
x
(1.1.20)
trong đó a
1
, a
2
là các hằng số.
Chương 1 Giới thiệu chung về xử lý tín hiệu
9
b. Hệ thống tuyến tính bất biến
Nếu
(
)
yn
là đáp ứng của kích thích
(
)
x
n
thì hệ thống tuyến tính gọi là bất biến khi
()
yn k−
là đáp ứng của hệ thống đối với kích thích
(
)
x
nk
−
(
)
x
xt M≤<∞
,
x
M
là hằng số thì
()
y
yt M≤<∞
,
y
M
là hằng số.
1.1.3.2.2 Đáp ứng xung của hệ thống tuyến tính bất biến
Nếu hệ thống là tuyến tính và bất biến ta có:
Khi hệ thống là tuyến tính và bất biến, thì ta có quan hệ sau :
() ()( )
k
yn xkhn k
∞
=−∞
=−
∑
(1.1.21)
(
)
∞
−∞=n
nhS )(
(1.1.23)
1.1.3.2.4 Phương trình sai phân tuyến tính hệ số hằng
a.
Phương trình sai phân tuyến tính
Về mặt toán học, kích thích vào x(n) và đáp ứng ra y(n) của hầu hết các hệ thống tuyến tính
thoả mãn một phương trình sai phân tuyến tính sau đây :
∑∑
==
−=−
N
k
M
r
rk
rnxnbknyna
00
)()()()( (1.1.24)
ở đây N và M là các số nguyên dương, N gọi là bậc của phương trình sai phân.
Trong phương trình này, tập hợp các hệ số a
k
(n) và b
r
(n) sẽ quyết định toàn bộ hành vi của
hệ thống. Phương trình này chính là ảnh rời rạc của phương trình vi phân tuyến tính đối với các hệ
số liên tục, phương trình vi phân tuyến tính có dạng sau :
00
00
() ()
NM
kr
kr
a
y
nk bxnr
==
−= −
∑∑
(1.1.26)
trong đó tập các hệ số a
k
và b
r
đặc trưng cho hệ tuyến tính bất biến.
Hệ tuyến tính bất biến mô tả bằng PT-SP-TT-HSH đóng vai trò đặc biệt trong xử lý tín
hiệu số. Trong tài liệu này, chúng ta chỉ sử dụng các hệ thống xử lý tín hiệu được mô tả bằng
phương trình tuyến tính bất biến hệ số hằng nói trên.
1.1.3.2.5 Các hệ thống đệ quy và không đệ quy
a. Hệ thống không đệ quy
Một hệ thống tuyến tính bất biến được đặc trưng bởi PT-SP-HSH bậc N như sau :
00
.( ) .( )
NM
kr
kr
a
() .( )
M
r
r
yn b xn r
=
=−
∑
a
0
= 1 (1.1.28)
Định nghĩa :
Hệ thống được đặc trưng bởi phương trình sai phân tuyến tính bậc không (N = 0) được gọi
là hệ thống không đệ qui.
b.
Hệ thống đệ quy
Trong trường hợp nếu N > 0, ta có phương trình SP-TT-HSH bậc N như sau :
01
00
() .( ) .( )
MN
k
r
rk
b
b
y
nxnrynk
aa
Nhìn chung, dữ liệu multimedia có dung lượng rất lớn và có đặc tính nhạy cảm với trễ cũng
như mất mát dữ liệu.
Để truyền các dạng dữ liệu trên mạng điện thoại, Internet hay mạng truyền hình, các đặc
tính kỹ thuật của từng loại dữ liệu phải được biến đổi cho phù hợp với đường truyền. Việc điều
chỉnh này bao gồm việ
c nén dữ liệu, định thời trong truyền dẫn và lưu trữ multimedia.
1.2.2 Nén tín hiệu trong mạng đa dịch vụ
Các kỹ thuật và giải thuật nén quyết định đến sự sống còn của các mạng đa dịch vụ. Ví dụ
như một kênh truyền hình số không nén có thể yêu cầu băng thông lên đến 216 Mbps. Nếu chúng
ta không dùng kỹ thuật nén, hệ thống chỉ có thể phục vụ đồng thời cho một số ít người. Nén là
giải pháp cứu cánh cho phép việc truyền bá rộng rãi video số và multimedia. Kỹ thuật nén phụ
thuộc vào giải thu
ật được cài đặt trên phần cứng hoặc phần mềm của máy phát và máy thu. Khi
ứng dụng yêu cầu tốc độ nén và giải nén cao, giải thuật phải được cài đặt trên phần cứng (card âm
thanh hay card đồ họa trên máy tính).
Nén dữ liệu là giải pháp để giảm bớt áp lực về băng thông trên mạng và giảm bớt không
gian lưu trữ, tuy nhiên nó cũng tạo ra một số nhược điểm đáng kể. Một số k
ỹ thuật nén hoạt động
dựa trên ý tưởng lược bớt các thông tin kém quan trọng trong tín hiệu vì thế sẽ tạo ra sự mất mát
độ phân giải trong tín hiệu nén. Nhưng bên cạnh đó, việc nén dữ liệu sẽ làm tăng tính bảo mật của
thông tin khi được truyền qua mạng công cộng. Khi tiến hành nén dữ liệu chúng ta phải quan tâm
đến các yếu tố sau: độ phức tạp của phần cứng và phần mềm, thời gian trễ
gây nên bởi quá trình
xử lý nén và giải nén và cũng như các yếu tố quan trọng khác.
Trong các ứng dụng khác nhau người ta sử dụng các phương pháp mã hóa khác nhau để tận
dụng tối đa tài nguyên sẵn có, đồng thời đạt chất lượng dịch vụ cao nhất. Ví dụ như hội nghị video
phải được thực hiện và xử lý trong thời gian thực, vì thế các phương pháp má hóa và giải mã được
phải thỏa mãn các tiêu chuẩn xử lý trong thờ
có khả năng phân phối video và audio trực tuyến với chất lượng thấp, tuy nhiên lưu trữ cục bộ vẫn
cho phép người dùng nghe nhạc hoặc xem video chất lượng cao. Hệ thống lưu trữ ngày càng được
cải tiến để đáp ứng nhu cầu này.
Các thiết bị lưu trữ như CDROM và DVD cũng được cải tiến để cung cấp luồng dữ liệ
u tốc
độ cao. Công nghệ CDROM hiện tại có thể truyền tải dữ liệu khoảng 64 Mbps hay cao hơn, lưu
trữ khoảng 700MB dữ liệu và có thời gian truy cập khoảng 300 ms. Đĩa DVD một mặt có dung
lượng ~4.7 GB. Với các thông số như vậy, công nghệ CD ROM là tạm chấp nhận được cho một
số ứng dụng. Hiện tại công nghệ đĩa cứng vẫn được cải tiến liên tục để phụ
c vụ cho nhu cầu lưu
trữ đa dạng của dữ liệu multimedia ngày càng đòi hỏi những tiêu chuẩn khắt khe về không gian
lưu trữ, thời gian trễ…
1.2.4 Băng thông
Các ứng dụng multimedia, đặc biệt các ứng dụng liên quan đến video và hình ảnh yêu cầu
băng thông rất lớn. Tuy nhiên băng thông là nguồn tài nguyên giới hạn. Tăng băng thông đồng
nghĩa với việc tăng chi phí để nâng cấp, cài đặt các thiết bị truyền dẫn quang, các thiết bị đầu cuối
phức tạp, các bộ chuyển mạch tốc độ cao….
Mặc dù hiện này công nghệ chuyển mạch đã phát triển m
ạnh mẽ cũng với mạng cáp quang
cho phép cung cấp nhiều băng thông hơn, nhưng kinh nghiệm cho thấy việc phát triển của mạng
luôn luôn thấp hơn nhu cầu thực tế. Do đó, cần có cơ chế phân phối và quản lý băng thông cho
các ứng dụng tại thiết bị đầu cuối để băng thông được sử dụng một cách hợp lý và hiệu quả.
1.2.5 Chất lượng dịch vụ (Quality of Service)
Hiện này nhu cầu trao đổi dữ liệu multimedia qua mạng là rất lớn. Để đảm bảo chất lượng
dịch vụ ở đầu cuối, các thông số quan trọng sau phải được đánh giá và điều khiển: tỷ lệ lỗi bit (Bit
Error Ratio), tỷ lệ mất gói, thời gian trễ và sự biến thiên của thời gian trễ…Ở một số dịch vụ tài
nguyên của mạng sẽ được dành sẵ
n để đảm bảo các thông số trên. Ví dụ như trong mạng ATM,
người dùng đầu cuối sẽ được phân định các mức băng thông và chất lượng dịch vụ khác nhau phụ
thuộc vào ứng dụng cụ thể. Với các ứng dụng liên quan đến thoại, tài nguyên của mạng được phân
• Apple/SGI AIFF files
Với dữ liệu ảnh màu cũng tồn tại rất nhiều định dạng khác nhau. Các định dạng ảnh màu
cho phép hiển thị từ 16 đến hàng triệu màu. Các định dạng ảnh tĩnh tiêu biểu đang được sử dụng
rộng rãi là:
• Windows Bitmap .BMP
• Graphic Interchange Format .GIF
• Joint Picture Experts Group .JPEG or JPG
• TIFF
• PCX
• PhotoCD .PCD
Hiện nay trên toàn thế giới có tổng cộng khoảng 15 loại đị
nh dạng video cho truyền hình
tương tự và truyền hình chất lượng cao (High Definition TV) đã được thực hiện và đưa ra thị
trường. Một số định dạng tiêu biểu của video:
• Motion JPEG
• Video conferencing H.261
• Microsoft AVI Video for Windows
• Apple Quicktime
• Intel Indeo DVI
Chương 1 Giới thiệu chung về xử lý tín hiệu
15
• ISO MPEG-1, MPEG-2, MPEG-4
TÓM TẮT CHƯƠNG 1
Trong chương một chúng ta đã nhắc lại một số khái niệm cơ bản về tín hiệu và hệ thống xử
lý tín hiệu nói chung. Những kiến thức này sẽ được sử dụng và mở rộng để phục vụ cho quá trình
nghiên cứu xử lý tín hiệu âm thanh và hình ảnh ở những chương sau.
14. Thế nào là Multimedia? Phân tích tầm quan trọng của kỹ thuật nén tín hiệu trong lĩnh
vực truyền dẫn dữ liệu Multimedia.
15. Nêu ra các phương tiện thường được dùng để lưu trữ dữ liệu số? Những thông số nào
đặc trưng cho hệ thống lưu trữ dữ liệu?
16. Cho biết các định dạng ảnh tĩnh và ảnh động thông dụng được sử dụ
ng trong hệ thống
truyền phát multimedia hiện nay?
Chương 2 Kỹ thuật xử lý âm thanh
16 CHƯƠNG 2 KỸ THUẬT XỬ LÝ ÂM THANH
2.1 TỔNG QUAN VỀ XỬ LÝ ÂM THANH
2.1.1 Giới thiệu sơlược về âm thanh và hệ thống xử lý âm thanh
2.1.1.1 Đặc tính của âm thanh tương tự
Mục đích của lời nói là dùng để truyền đạt thông tin. Có rất nhiều cách mô tả đặc điểm
của việc truyền đạt thông tin. Dựa vào lý thuyết thông tin, lời nói có thể được đại diện bởi
thuật ngữ là nội dung thông điệp, hoặc là thông tin. Một cách khác
để biểu thị lời nói là tín
hiệu mang nội dung thông điệp, như là dạng sóng âm thanh.
Hình 2.1.1 Dạng sóng của tín hiệu ghi nhận được từ âm thanh của người
Kỹ thuật đầu tiên dùng trong việc ghi âm sử dụng các thông số về cơ, điện cũng như
trường có thể làm nên nhiều cách thức ghi âm ứng với các loại áp suất không khí khác nhau.
Điện áp đến từ một microphone là tín hiệu tương tự
của áp suất không khí (hoặc đôi khi là
vận tốc). Dù được phân tích bằng cách thức nào, thì các phương pháp khi so sánh với nhau
phải dùng một tỉ lệ thời gian.
Trong khi các thiết bị tương tự hiện đại trông có vẻ xử lý âm thanh tốt hơn những thiết
bị cổ điển, các tiêu chuẩn xử lý thì hầu như không có gì thay đổi, mặc dù công nghệ có vẻ xử
quan tâm chung là:
1. Việc duy trì nội dung của thông điệp trong tín hiệu thoại
2. Việc biểu diễn tín hiệu thoại phải đạt được mục tiêu tiện lợi cho việc truyền tin hoặc
lưu trữ, hoặc ở dạng linh động cho việc hiệu chỉnh tín hiệu thoại sao cho không làm
giảm nghiêm trọng nội dung của thông điệp thoại.
Việ
c biểu diễn tín hiệu thoại phải đảm bảo việc các nội dung thông tin có thể được dễ
dàng trích ra bởi người nghe, hoặc bởi các thiết bị phân tích một cách tự động.
2.1.1.2 Khái niệm tín hiệu
Là đại lượng vật lý biến thiên theo thời gian, theo không gian, theo một hoặc nhiều
biến độc lập khác, ví dụ như:
¾ Âm thanh, tiếng nói: dao động sóng theo thời gian (t)
¾ Hình ảnh: cường độ sáng theo không gian (x, y, z)
¾ Địa ch
ấn: chấn động địa lý theo thời gian
Biểu diễn toán học của tín hiệu: hàm theo biến độc lập
Ví dụ:
¾
52)(
2
−= ttu
¾
22
62),( yxyxyxf −−=
Thông thường các tín hiệu tự nhiên không biểu diễn được bởi một hàm sơ cấp, cho
nên trong tính toán, người ta thường dùng hàm xấp xỉ cho các tín hiệu tự nhiên.
Hệ thống: là thiết bị vật lý, thiết bị sinh học, hoặc chương trình thực hiện các phép
toán trên tín hiệu nhằm biến đổi tín hiệu, rút trích thông tin, … Việc thực hiện phép toán còn
Tín hiệu r
ờ
n
hau, ký hiệ
u
Hì
n
Tín hiệu li
ệ
u tương tự
(
Hì
n
Tín hiệu r
ờ
ố
).
u
ật xử lý âm
n
h 2.1.1 Tí
n
ờ
i rạc thời
g
u
)(nx
.
n
ị: tín hiệu
c
ụ
c theo thời
g
h
iệu chỉ đượ
c
c
theo thời
g
u
có thể nhậ
n
ụ
c giá trị
c
hỉ nhận trị
g
ian
c
định ngh
ĩa
g
ian
n
trị bất kỳ
t
trong một t
ậ
Hình 2.1.4 Tín hiệu rời rạc giá trị
Tín hiệu analog: là tín hiệu liên tục về thời gian, liên tục về giá trị.
Hình 2.1.5 Tín hiệu analog
Tín hiệu số: là tín hiệu rời rạc về thời gian, rời rạc về giá trị.
Hình 2.1.6 Tín hiệu số
Tín hiệu ngẫu nhiên: giá trị của tín hiệu trong tương lai không thể biết trước được. Các
tín hiệu trong tự nhiên thường thuộc nhóm này
Tín hiệu tất định: giá trị tín hiệ
u ở quá khứ, hiện tại và tương lại đều được xác định rõ,
thông thường có công thức xác định rõ ràng
2.1.1.4 Phân loại hệ thống xử lý
Gồm hai loại hệ thống là hệ thống tương tự và hệ thống số. Trong đó hệ thống xử lý
số: là hệ thống có thể lập trình được, dễ mô phỏng, cấu hình, sản xuất hàng loạt với độ chính
xác cao, giá thành hạ, tín hiệ
u số dễ lưu trữ, vận chuyển và sao lưu, nhược điểm là khó thực
hiện với các tín hiệu có tần số cao
Chương 2 Kỹ thuật xử lý âm thanh
20
2.1.1.5 Hệ thống số xử lý âm thanh
Độ nhạy của tai người rất cao, nó có thể phân biệt được số lượng nhiễu rất nhỏ cũng
như chấp nhận tầm biên độ âm thanh rất lớn. Các đặc tính của một tín hiệu tai người nghe
được có thể được đo đạc bằng các công cụ phù hợp. Thông thường, tai người nhạy nhất ở tầm
tần số 2kHz và 5kHz, mặc dù cũ
ng có người có thể nhận dạng được tín hiệu trên 20kHz. Tầm
động nghe được của tai người được phân tích và người ta nhận được kết quả là có dạng đáp
P
là bậc của mô hình AR:
[] [ ] []
∑
=
+−=
P
i
i
neainsus
1
(2.1.1)
Mô hình AR đại diện cho các quá trình tuyến tính tĩnh, chấp nhận tín hiệu tương tự
nhiễu và tín hiệu tương tự điều hòa. Một mô hình khác phù hợp hơn đối với nhiều tình huống
phân tích là mô hình auto regressive moving-average (ARMA) cho phép các điểm cực cũng
như điểm 0. Tuy nhiên mô hình AR có tính linh động hơn trong phân tích hơn mô hình
ARMA, ví dụ một tín hiệu nhạc phức tạp cần mô hình có bậc
100>
P
để biểu diễn dạng sóng
của tín hiệu, trong khi các tín hiệu đơn giản hơn chỉ cần biểu diễn bằng bậc 30. Trong nhiều
ứng dụng, việc lựa chọn bậc của mô hình phù hợp để đảm bảo việc biểu diễn tín hiệu để
không làm mất đi thông tin ban đầu là tương đối phức tạp. Có rất nhiều phương pháp dùng để
ước lượng bậc của mô hình AR như ph
ương pháp trong các phương pháp dùng để giảm nhiễu.
Tín hiệu được cho bởi công thức (2.1.2):
[] []
()
chế xung (Pulse Code Modulation - PCM). Dạng sóng âm thanh được chuyển sang dãy số
PCM như sau, xét tín hiệu hình sin làm ví dụ:
Tín hiệu gốc là tín hiệu âm thanh lan truyền trong không khí như hình 2.1.8 Air Displacement
Time
Tín hiệu âm thanh dịch
lan truyền trong không khí
Hình 2.1.8 Dạng sóng âm thanh nguyên thủy
Kế đến, sử dụng một microphone để thu tín hiệu âm thanh và chuyển đổi thành tín
hiệu điện, biên độ điện áp ngõ ra của microphone (sau khi được khuếch đại) nằm trong
khoảng ±1 volt như hình 2.1.9.
Chương 2 Kỹ thuật xử lý âm thanh
22
Voltage
Time
+1.
0
+0.5
0
-0.5
Hình 2.1.11 Ngõ ra của bộ chuyển đổi tín hiệu tương tự sang tín hiệu số
Kết quả của việc lấy mẫu và lượng tử được biến đổi thành một chuỗi gồm 43 chữ số
biểu diễn các mẫu của dạng sóng ứng thời gian (hình 2.1.12).
Recorded Value
+32,767
+16,383
0
-16,384
-32,768
1
43
Hình 2.1.12 Kết quả của việc lấy mẫu các giá trị
Chương 2 Kỹ thuật xử lý âm thanh
23
Tín hiệu số có thể được chuyển đổi ngược thành tín hiệu tương tự bằng việc kết nối
các điểm dữ liệu rời rạc lại với nhau. Dạng sóng kết quả được mô tả ở hình 2.1.13.
Recorded Value
+32,76
7
+16,383
0
-16,38
4
-32,76
8
1
∞
−∞=
−
=
n
n
znxzX )(
(2.1.3a)
∫
−
=
C
n
dzzzX
j
nx
1
)(
2
1
)(
π
(2.1.3b)
Biến đổi Z của
)(nx
được định nghĩa bởi biểu thức (2.1.3a).
)(zX
còn được gọi là
dãy công suất vô hạn theo biến
<
(2.1.5)
Ví dụ: Cho
)()(
0
nnnx −=
δ
. Theo công thức (2.1.3a), ta có
0
)(
n
zzX
−
=
Ví dụ: Cho
)()()( Nnununx
−
−=
. Theo công thức (2.1.3a), ta có
1
1
0
1
1
).1()(
−
−
−
∞
=
∑
,
1
1
)(
1
0
Ví dụ: Cho
)1()( −−−= nubnx
n
. Then
1
1
1
1
)(
−
−
−
−∞=
−
==
∑
bz
zbzX
n
n
nxa
n
)(
1
zaX
−
4. Hàm tuyến tính
nx(n)
dz
zdX
z
)(
−
5. Đảo thời gian
x(-n)
)(
1−
zX
6. Tương quan
x(n)*h(n) X(z)H(z)
7. Nhân chuỗi
x(n)w(n)
νννν
π
dzWX
j
2
1
)(
(2.1.6b)
Biến đổi Fourier là trường hợp đặc biệt của phép biến đổi z bằng cách thay thế
iw
ez =
. Như mô tả trong hình 2.1.14, trong mặt phẳng z, tần số w là góc quay. Điều kiện đủ
để tồn tại biến đổi Fourier là
1
=
z
, như vậy
∞<
∑
∞
)(nx
(2.1.7)
Chương 2 Kỹ thuật xử lý âm thanh
25 Hình 2.1.2 Vòng tròn đơn vị thuộc mặt phẳng z
Một đặc tính quan trọng của biến đổi Fourier của một chuỗi là
)(
iw
eX
là hàm điều hòa
∑
−
=
−
=
1
0
2
)(
~
)(
~
N
n
kn
N
j
enxkX
π
(2.1.9a)
∑
−
=
=
1
0
2
)(
~
n
n
znxzX
(2.1.10)
Nếu chia
)(zX
thành N điểm trên vòng tròn đơn vị,
Nkj
k
ez
π
2
=
,
1, ,1,0
−
= Nk
, ta
có:
∑
−
=
−
=
1
0
22
)()(
N
2
k
N
j
eX
π
từ phương trình (2.1.9a) và (2.1.11) chính là các
hệ số Fourier của chuỗi tuần hoàn
)(
~
nx
trong phương trình (2.1.12). Như vậy, một chuỗi có
chiều dài N có thể được biểu diễn bởi phép biến đổi Fourier rời rạc (DFT) như sau:
∑
−
=
−
=
1
0
2
)()(
N
n
kn
N
j
enxkX
π