i
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
------------
VŨ THANH HUẾ
NGHIÊN CỨU PHƢƠNG PHÁP NÉN TIẾNG NÓI
TỐC ĐỘ BÍT THẤP BẰNG KỸ THUẬT PHÂN RÃ TIẾNG
NÓI
THEO THỜI GIAN
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
ii
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2015
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
iii
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
v
LỜI CAM ĐOAN
Tên tôi là: Vũ Thanh Huế
Sinh ngày: 25/03/1985
Học viên lớp cao học K12I - Trƣờng Đại học Công nghệ thông tin và
Truyền thông - Thái Nguyên.
Tôi xin cam đoan, toàn bộ nội dung liên quan tới đề tài đƣợc trình bày
trong luận văn là bản thân tôi tìm hiểu và nghiên cứu, dƣới sự hƣớng dẫn
khoa học của Thầy giáo Tiến sĩ Phùng Trung Nghĩa.
Các nội dung trong luận văn đúng nhƣ nội dung trong đề cƣơng và yêu
cầu của thầy giáo hƣớng dẫn. Tất cả tài liệu tham khảo đều có nguồn gốc,
xuất xứ rõ ràng. Nếu sai tôi hoàn toàn chịu trách nhiệm trƣớc hội đồng khoa
học và trƣớc pháp luật.
Tác giả luận văn
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
vi
LỜI CẢM ƠN
Sau một thời gian nghiên cứu và làm việc nghiêm túc, đƣợc sự động
viên, giúp đỡ và hƣớng dẫn tận tình của Thầy giáo hƣớng dẫn Tiến sĩ Phùng
4. Phƣơng pháp nghiên cứu ................................................................................3
5. Ý nghĩa khoa học và thực tiễn ........................................................................3
CHƢƠNG 1: TỔNG QUAN VỀ MÃ HÓA TIẾNG NÓI .....................................4
1.1. Thông tin và tín hiệu tiếng nói ....................................................................4
1.2. Quá trình tạo tiếng nói .................................................................................5
1.3. Khả năng cảm thụ tiếng nói của con ngƣời .................................................9
1.4. Mô hình hóa tiếng nói ...............................................................................13
1.5. Mã hóa tiếng nói ........................................................................................16
1.6. Kỹ thuật phân rã tiếng nói theo thời gian TD và ứng dụng trong mã hóa
tiếng nói ............................................................................................................20
CHƢƠNG 2: PHƢƠNG PHÁP MÃ HÓA TIẾNG NÓI DÙNG KỸ THUẬT
PHÂN RÃ TIẾNG NÓI THEO THỜI GIAN .......................................................23
2.1. Phƣơng pháp của Atal ...............................................................................23
2.2. Phƣơng pháp phân rã tiếng nói theo thời gian giới hạn RTD ...................26
2.3. Phƣơng pháp MRTD .................................................................................29
2.4. Mã hóa tiếng nói với TD kết hợp sử dụng STRAIGHT...........................34
2.4.1. Sơ lƣợc về phƣơng pháp mã hóa TD-STRAIGHT ........................34
2.4.2. Tính tham số phổ đƣờng LSF từ phổ STRAIGHT ........................36
2.4.3. Lƣợng tử hóa vector LSF ...............................................................37
2.4.4. Lƣợng tử hóa vector sự kiện ..........................................................37
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
viii
2.4.5. Lƣợng tử hóa hàm sự kiện .............................................................37
2.4.6. Lƣợng tử hóa tham số tần số cơ bản F0.........................................38
2.4.7. Lƣợng tử hóa tham số độ lợi..........................................................38
Mã hóa theo dạng xung
LPC
Linear Predictive Coding
Mã hóa dự đoán tuyến tính
Code-Excited Linear Prediction
Mã hóa dự đoán tuyến tính
coder
kích thích mã
CELP
Kỹ thuật phân rã theo thời
TD
Temporal Decomposition
LSF
Line Spectral Frequency
Đặc trƣng phổ đƣờng
Số hóa bởi Trung tâm Học liệu - ĐHTN
gian
/>
x
DANH MỤC CÁC BẢNG
Bảng 3.1. Cấu trúc âm tiết tiếng Việt .............................................................. 42
Bảng 3.2. Sáu thanh điệu tiếng Việt................................................................ 42
Bảng 3.3. Thang điểm Scheffe ........................................................................ 47
Bảng 3.4. Thang điểm PESQ .......................................................................... 49
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
Luận văn đầy đủ ở file: Luận văn full