Bài giải và bài tập xử lý tiếng nói - pdf 26

Link tải miễn phí Bài tập và giải bài tập Xử Lý Tiếng Nói - Thầy Loan
1. Một số khái niệm cơ bản
2. Xử lý tín hiệu tiếng nói
3. Mã hoá tiếng nói
4. Tổng hợp tiếng nói
5. Nhận dạng tiếng nói
∗ Xử lý thông tin chứa trong tín hiệu tiếng nói
nhằm truyền, lưu trữ tín hiệu này hay tổng
hợp, nhận dạng tiếng nói.
∗ Các nghiên cứu được tiến hành để xử lý tiếng
nói yêu cầu những hiểu biết trên nhiều lĩnh
vực ngày càng đa dạng: từ ngữ âm và ngôn
ngữ học cho đến xử lý tín hiệu...
1. Một số khái niệm cơ bản
∗ Mã hoá một cách có hiệu quả tín hiệu tiếng nói để
truyền và lưu trữ tiếng nói.
∗ Tổng hợp và nhận dạng tiếng nói tiến tới giao tiếp
người-máy bằng tiếng nói.
∗ Tất cả các ứng dụng của xử lý tiếng nói đều cần
dựa trên các kết quả của phân tích tiếng nói
Mục đích
Bách khoa Hà Nội 1 BÀI TẬP XỬ LÝ TIẾNG NÓI 1. Hàm truyền ñạt của một bộ lọc số ở tần số formant F k ñược cho bởi: 2 2 1 2 1 2 cos ( ) 1 2 cos k k k k k k k z z H z z z z z θ θ − − − + = − + trong ñó k T k z e σ − = , 2 k k F T θ π = , T: chu kỳ lấy mẫu, 2 k σ : dải thông. (a) Vẽ các ñiểm cực của H k (z) trong mặt phẳng Z (b) Viết phương trình sai phân mô tả quan hệ giữa tín hiệu ra y k (n) và tín hiệu vào x k (n) (c) Vẽ sơ ñồ khối của bộ lọc số này với 3 bộ nhân. (d) Bằng cách sắp xếp lại các số hạng của phương trình sai phân, vẽ sơ ñồ khối của bộ lọc số chỉ có 2 bộ nhân 2. Hệ số phản xạ r k ñược ñịnh nghĩa: k1k k1k k AA AA r + − = + + . Chứng minh rằng r k thoả mãn : −1 ≤ r k ≤ 1 3. Một hệ thống phát hiện tần số cơ bản gồm có M bộ lọc thông dải giả thiết là lý tưởng có tần số cắt về phía tần số thấp của bộ lọc thứ k cho bởi: F k = 2 k -1 F 1 với k = 1, 2, M. và tần số cắt về phía tần số cao cho bởi: F k +1 = 2 k F 1 với k = 1, 2, M. Các tần số cắt này ñược lựa chọn sao cho nếu ñưa một tín hiệu tuần hoàn có tần số cơ bản F 0 tới ñầu vào của bộ lọc với F k < F 0 < F k+1 thì ñầu ra của các bộ lọc thứ 1 ñến k−1 sẽ có năng lượng rất yếu, ñầu ra bộ lọc thứ k sẽ cho tần số cơ bản còn các bộ lọc từ thứ k+1 ñến M sẽ cho ra 1 hay nhiều hài của tần số cơ bản. Ở ñầu ra của mỗi bộ lọc người ta sẽ có các bộ phát hiện và xác ñịnh tần số cơ bản. (a) Hãy xác ñịnh và giải thích cách lựa chọn F 1 và M sao cho hệ thống này có thể ñánh giá ñược các tần số cơ bản trong khoảng 50 Hz < F 0 < 800 Hz (b) Vẽ sơ ñồ khối của hệ thống này và giải thích nguyên lý làm việc của nó. 4. Mô hình thực tế của trở kháng bức xạ của tuyến âm cho bởi ( , ) ( ) ( , ) P Z U Ω = Ω Ω ℓ ℓ ℓ ℓ với ( ) r r r r j L R Z R j L Ω Ω = + Ω ℓ trong ñó ( , ) P Ω ℓ ℓ và ( , ) U Ω ℓ lần lượt là áp suất và thông lượng tại môi. Giả thiết rằng tiết diện của ống âm cơ bản ở ñầu cuối của tuyến âm (về phía môi) là A n . Ta có thể biểu diễn ñầu cuối của tuyến âm theo sơ ñồ như sau Hãy thiết lập quan hệ giữa các biến ñổi Fourier của ( ) n n u t τ − + và ( ) n n u t τ + − TrÔ τ n TrÔ τ n ( ) n u t + ( ) n u t − ( ) n n u t τ − + ( ) n n u t τ + − 1 r + ℓ r − ℓ ( , ) n n u t ℓ Trịnh Văn Loan – ðại học Bách khoa Hà Nội 2 5. (a) Hình vẽ a) là dạng tín hiệu tiếng nói. Hãy cho biết ñây là tín hiệu ứng với âm hữu thanh hay vô thanh. Vì sao ? (b) Trước khi phân tích phổ, dạng tín hiệu a) có thể ñược biến ñổi thành b). Cách biến ñổi như thế nào và biến ñổi như vậy ñể làm gì ? (c) Hình c) ñược tính toán xuất phát từ hình b). Hình c) gồm ñường nét mảnh và ñường nét ñậm. ðường nét mảnh là gì và ñường nét ñậm là gì ? Những thông tin có ñược từ hình vẽ c) là gì ? Từ tín hiệu hình b) có thể thực hiện biến ñổi thế nào ñể có ñường nét mảnh ? Cũng từ tín hiệu hình b) có bao nhiêu phương pháp ñể có ñường nét ñậm ? Trình bày các phương pháp ñó. (d) So sánh 2 hình vẽ c) và d) có thể thấy rằng ñường nét mảnh của 2 hình là như nhau nhưng ñường nét ñậm của hình c) trơn hơn ñường nét ñậm của hình d). Từ các phương pháp ñã nói ở mục 3), thay ñổi tham số nào sẽ dẫn ñến sự khác nhau này ? 6. Hàm truyền ñạt của bộ lọc hiệu chỉnh dùng trong xử lý tiếng nói có dạng H(z) = 1− az − 1 với a là hằng số. (a) Xác ñịnh biểu thức ñáp ứng tần số của bộ lọc hiệu chỉnh (b) Xác ñịnh và vẽ dạng ñáp ứng biên ñộ của bộ lọc hiệu chỉnh với a = 0,98. (c) Viết phương trình sai phân cho quan hệ vào−ra của bộ lọc này. 7. Tín hiệu tại thanh môn thường ñược mô phỏng dựa trên biểu thức sau: 0 ( ) 0 0 n na n g n n ≥ = <    trong ñó a là hằng số. (a) Hãy xác ñịnh biến ñổi Z của g(n). (b) Xác ñịnh biên ñộ biến ñổi Fourier của g(n),


/file/d/0Bz7Zv9 ... sp=sharing
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status