Giáo trình Xử lý âm thanh và hình ảnh - Kỹ thuật xử lý âm thanh - pdf 20

Download miễn phí Giáo trình Xử lý âm thanh và hình ảnh - Kỹ thuật xử lý âm thanh



Bộmã hóa điều chếxung mã vi sai thích nghi (ADPCM) là bộmã hóa dạng sóng
thay vì lượng tửhoá trực tiếp tín hiệu thoại, giống nhưphương pháp PCM, nó lượng tử
hóa sựkhác nhau giữa tín hiệu thoại và tín hiệu dự đoán.
Nếu sựdự đoán là chính xác thì sựkhác nhau giữa các mẫu thật và mẫu dự đoán
sẽnhỏhơn, ít khác biệt hơn so với giữa các mẫu thoại thực, và sựkhác biệt này nếu được
lượng tửhoá chính xác thì sẽcần sốbit ít hơn so với việc phải lượng tửhoá các mẫu
thoại gốc.
Tại bộgiải mã, tín hiệu khác biệt mà đã được lượng tửhóa được cộng với tín hiệu
dự đoán đểkhôi phục lại tín hiệu thoại ban đầu. Hiệu năng của bộmã hóa được cải thiện
thông qua việc sửdụng bộdự đoán và lượng tửthích nghi sao cho bộdự đoán và bộ
lượng tửphải thích ứng với những đặc tính thay đổi của thoại đang được mã hoá



Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

à một sóng âm từ các hốc mũi và miệng khi không khí bị bật
ra từ các lá phổi với kết quả là luồng không khí bị xáo trộn bởi sự co thắt ở bên trong cơ
thể con người. Sẽ rất là hữu ích khi thể hiện quá trình tạo âm thoại ở dạng bộ lọc âm
thanh. Có ba hốc quan trọng trong hệ thống tạo âm thoại là hốc mũi, miệng và hầu để
hình thành nên một bộ lọc âm thanh. Bộ lọc được kích thích bởi không khí từ các lá phổi
và gánh tải tại đầu ra chính của nó bởi trở kháng bức xạ gắn kết với môi.
Cuống họng (vocal tract) liên quan tới hầu và các hốc miệng được nhóm lại với
nhau. Cuống khứu giác (nasal tract) bắt đầu tại vòm miệng và kết thúc tại các hốc mũi.
Khi vòm miệng thấp xuống, cuống khứu giác được ghép nối về mặt âm thanh với cuống
họng để hình thành nên các âm thoại giọng mũi.
Sự hình thành và khuôn dạng của cuống họng, cuống khứu giác thay đổi liên tục
theo thời gian để tạo ra một bộ lọc âm thanh với đáp ứng tần số biến đổi theo thời gian.
Xử lý âm thanh và hình ảnh Chương 2:Kỹ thuật xử lý âm thanh
21
Khi mà không khí từ các lá phổi chuyển động qua các cuống họng, khứu giác, phổ tần số
được định dạng bởi sự lựa chọn tần số của những cuống họng và khứu giác này
Hình 2.7: Bộ phận phát âm của con người
Thoại được tạo ra khi không khí đi từ phổi, qua các dây thanh âm (bộ phận phát ra
tiếng của thanh quản) và dọc theo cuống họng. Cuống họng bắt đầu từ vị trí mở các dây
thanh âm cho tới miệng với chiều dài trung bình khoảng 16cm. Dây thanh âm của người
có cấu trúc gồm hai sợi cơ, mỗi sợi cơ được giữ bởi một màng cơ – một khối cơ đủ mạnh.
Bình thường hai dây cơ khép lại, không khí từ buồng phổi bị đóng kín không ra
được. Khi phổi đầy khí, dưới sự điều khiển của hệ dây thần kinh, khi cần nói, không khí
ép vào cơ cấu dây thanh âm, hai dây thanh âm có thể mở ra hay không mở.
Khi các dây thanh âm mở, không khí được đẩy ra từ phổi từng lớp một theo một
chu kỳ nhất định T0 tạo ra các nguyên âm.
Nếu các dây thanh âm không mở, nó sẽ bị tách bật ra để không khí có thể lọt qua
tạo ra các phụ âm nổ hay không khí có thể lách xuyên qua khe hẹp giữa hai dây để tạo ra
các phụ âm xát - rít.
Chúng ta có thể xem cơ quan phát âm như là một bộ lọc với nhiều tần số cộng
hưởng khác nhau và được gọi là những tần số formant hay đơn giản là formant. Các tần
Xử lý âm thanh và hình ảnh Chương 2:Kỹ thuật xử lý âm thanh
22
số formant được điều khiển bởi việc thay đổi hình dạng của cuống họng, chẳng hạn thông
qua sự chuyển động của lưỡi.
Formant là dải tần số được tăng cường do hiện tượng cộng hưởng trong ống dẫn
thanh, đặc trưng cho âm sắc của mỗi nguyên âm. Trong mỗi dải tần như thế có một tần số
được tăng cường hơn cả gọi là đỉnh formant. Một nguyên âm do một người phát ra có
nhiều formant:
• F1: ứng với cộng hưởng vùng yết hầu
• F2: ứng với cộng hưởng khoang miệng
Khi ta nói, các âm mũi sẽ có sự xuất hiện của formant F3, các formant khác F4,
F5,…liên quan đến các đặc trưng giọng nói riêng của mỗi cá nhân. Mỗi lần môi, lưỡi,
hàm ở những vị trí khác nhau là một lần hộp cộng hưởng miệng và yết hầu thay đổi hình
dáng, thể tích, lối thoát của không khí làm biến đổi âm sắc của âm thanh đi qua chúng.
Chính vì vậy, hai khoang miệng và yết hầu là hai hộp cộng hưởng quan trọng nhất, chúng
tạo nên hai formant chính formant F1 và F2 đặc trưng của mỗi nguyên âm.
Bộ lọc cuống họng bị kích thích bởi luồng không khí tác động vào nó từ các dây
thanh âm. Theo đó các âm thanh thoại phát ra được phân chia thành ba loại phụ thuộc vào
cách kích thích.
• Các âm hữu thanh (voiced sound): được tạo ra khi các dây thanh âm rung động mở
hay đóng, do vậy mà làm gián đoạn (ngắt) luồng không khí được tạo ra từ phổi
tới cuống họng và tạo ra các các xung không khí có chu kỳ (quasi-periodic) khi bị
kích thích. Tốc độ của việc đóng hay mở các dây thanh âm xác định độ cao thấp
của âm thanh (pitch). Pitch có thể được điều chỉnh qua việc thay đổi hình dạng, độ
căng của các dây thanh âm cũng như áp suất của luồng không khí tác động lên
chúng từ phổi. -> nguyên âm. Các âm hữu thanh thường có tính chu kỳ cao, điển
hình trong khoảng 2 đến 20 ms như được minh họa ở hình 2.8. của một đoạn âm
hữu thanh lấy mẫu tại tần số 8KHz. Hàm mật độ phổ công suất – PSD (Power
Spectral Density) của đoạn âm hữu thanh này được minh họa ở hình 2.9.
• Các âm vô thanh (unvoiced sound): được tạo ra khi kích thích là một nhiễu loạn từ
việc ép luồng không khí ở tốc độ cao qua khe hẹp ở cuống họng trong khi các dây
thanh âm ở trạng thái mở. Lưu ý âm vô thanh là các tín hiệu không có chu kỳ, nó
có thể ở dạng tạp âm, nhiễu… Tính chu kỳ của những âm vô thanh cũng được thể
hiện ở các hình vẽ 2.10 và 2.11.
• Các âm bật - nổ (plosive sound): được tạo ra khi có sự đóng hoàn toàn ở cuống
họng, và áp suất không khí được hình thành ở phía sau được giải phóng đột ngột.-
> phụ âm.
Xử lý âm thanh và hình ảnh Chương 2:Kỹ thuật xử lý âm thanh
23
Hình 2.8: Một đoạn điển hình của các âm hữu thanh
Hình 2.9: Mật độ phổ công suất cho đoạn thoại hữu thanh
Xử lý âm thanh và hình ảnh Chương 2:Kỹ thuật xử lý âm thanh
24
Hình 2.10: Một đoạn điển hình của các âm vô thanh
Hình 2.11: Mật độ phổ công suất cho đoạn thoại vô thanh
Một số âm thanh không được xem như thuộc vào một trong ba loại âm thanh nói
trên, tuy nhiên chúng là sự hỗn hợp. Ví dụ như các âm xát (phụ âm xát hay rít – cọ xát)
được hình thành khi các có sự rung động của dây thanh âm và khe hẹp trong cuống họng
được hình thành.
Dựa vào cách cấu âm, người ta chia phụ âm làm 3 loại chính: âm tắc, xát
và rung. Phụ âm tiếng Việt gồm có 22 âm và người ta có thể chia theo bảng sau:
Xử lý âm thanh và hình ảnh Chương 2:Kỹ thuật xử lý âm thanh
25
Bảng 2.1: Các loại phụ âm trong tiếng Việt
Mặc dầu rất nhiều âm thanh thoại có thể được tạo ra, nhưng hình dạng của cuống
họng và cách kích thích lên nó thay đổi tương đối chậm. Do vậy, thoại - tiếng nói
có thể xem như là quá trình dừng (quasi-stationary) qua những chu kỳ thời gian ngắn
(khoảng chừng 20ms). Trên cơ sở các hình vẽ (2.8 – 2.11), chúng ta có thể thấy được các
tín hiệu thoại có tính đoán trước cao do những sự rung động có tính chu kỳ của các
dây thanh âm và do những sự cộng hưởng âm trong cuống họng. Các bộ mã hóa thoại
đang cố gắng khai thác những đặc tính đoán trước này của tín hiệu thoại để giảm tốc
độ truyền dẫn thoại ở mức cần thiết cho đảm bảo chất lượng truyền dẫn thoại.
2.2.2. Tổng quan về mã hóa tín hiệu thoại
Từ những năm 1930, mã hoá tiếng nói được phát triển trở thành một đặc tính quan
trọng của những nhà vận hành hệ thống điện thoại ngày ngày. Sự mã hóa tiếng nói bây
giờ được ứng dụng trong truyền thông tế bào, những hệ thống máy tính, tự động hóa,
truyền thô...
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status