Nghiên cứu các phương pháp tổng hợp tiếng
Việt cho các hệ thống có tài nguyên hạn chế
Nguyễn Tu Trung
Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Công nghệ phần mềm; Mã số: 60 48 10
Người hướng dẫn: PGS.TS. Lương Chi Mai
Năm bảo vệ: 2011
Abstract: Tổng quan về tổng hợp tiếng nói và hệ thống hạn chế tài nguyên. Trình bày
khái quát về tổng hợp tiếng nói và lịch sử phát triển cũng như ứng dụng của nó và một
số phương pháp tổng hợp tiếng nói. Một số đặc điểm của ngữ âm, ngôn điệu tiếng
Việt. Giới thiệu sơ lược về các hệ thống hạn chế tài nguyên. Tổng hợp tiếng nói từ văn
bản và yêu cầu trên hệ thống tài nguyên hạn chế. Trình bày thành phần cơ bản của hệ
tổng hợp tiếng nói từ văn bản. Phân tích về vấn đề tổng hợp tiếng nói trên hệ thống tài
nguyên hạn chế và đưa ra những yêu cầu, điều kiện cần thiết để một hệ tổng hợp trên
máy tính có thể chuyển xuống hệ thống này. Giới thiệu và phân tích về hai hệ tổng
hợp tiếng Việt có khả năng chuyển vào hệ thống tài nguyên hạn chế. Tối ưu hóa lưu
trữ và tính toán tín hiệu tiếng nói cho hệ tổng hợp VnVoice. Khả năng áp dụng biểu
diễn số dấu chấm tĩnh để giảm thiểu bộ nhớ và tăng tốc độ tính toán. Phân tích cách
thức tối ưu hóa lưu trữ và một số thao tác tính toán của hệ tổng hợp VnVoice để thực
sự đáp ứng các yêu cầu trên hệ thống hạn chế tài nguyên. Xây dựng thử nghiệm hệ
thống tổng hợp tiếng Việt trên hệ thống tài nguyên bộ nhớ hạn chế. Phân tích, thiết kế
thử nghiệm hệ tổng hợp tiếng Việt trên hệ thống hạn chế tài nguyên bộ nhớ. Tổng
quan về việc tích hợp lõi thư viện của chương trình thử nghiệm vào chương trình bản
đồ (tích hợp trong phần mềm ArcPad) chạy trên nền WinCE. Trình bày một thử
nghiệm so sánh chất lượng giọng tổng hợp tiếng Việt giữa chương trình demo với
phiên bản VnSpeech trên WinCE và với chính hệ tổng hợp VnVoice.
Keywords: Xử lý tín hiệu; Âm thanh; Tiếng Việt; Công nghệ phần mềm
Chương 2: Tổng hợp tiếng nói từ văn bản và yêu cầu trên hệ thống tài nguyên
hạn chế. Chương này giúp người đọc nắm được về các thành phần cơ bản của hệ tổng hợp
tiếng nói từ văn bản. Tiếp theo, chương 2 phân tích về vấn đề tổng hợp tiếng nói trên hệ thống
tài nguyên hạn chế và đưa ra những yêu cầu, điều kiện cần thiết để một hệ tổng hợp trên máy
tính có thể chuyển xuống hệ thống này. Cuối cùng, chương 2 giới thiệu và phân tích về hai hệ
tổng hợp tiếng Việt có khả năng chuyển vào hệ thống tài nguyên hạn chế.
Chương 3: Tối ưu hóa lưu trữ và tính toán tín hiệu tiếng nói cho hệ tổng hợp
VnVoice. Chương này chỉ ra khả năng áp dụng biểu diễn số dấu chấm tĩnh để giảm thiểu bộ
nhớ và tăng tốc độ tính toán. Chương 3 còn phân tích cách thức tối ưu hóa lưu trữ và một số
thao tác tính toán của hệ tổng hợp VnVoice để thực sự đáp ứng các yêu cầu trên hệ thống hạn
chế tài nguyên.
Chương 4: Xây dựng thử nghiệm hệ thống tổng hợp tiếng Việt trên hệ thống tài
nguyên bộ nhớ hạn chế. Chương này trình bày việc phân tích, thiết kế thử nghiệm hệ tổng
hợp tiếng Việt trên hệ thống hạn chế tài nguyên bộ nhớ. Sau đó, chương 4 trình bày sơ lược
về việc tích hợp lõi thư viện của chương trình thử nghiệm vào chương trình bản đồ (tích hợp
trong phần mềm ArcPad) chạy trên nền WinCE. Sau đó, chương 4 cũng trình bày một thử
nghiệm so sánh chất lượng giọng tổng hợp tiếng Việt giữa chương trình demo với phiên bản
VnSpeech trên WinCE và với chính hệ tổng hợp VnVoice.
Trong luận văn, các trích dẫn của các tác giả khác liên quan đến lĩnh vực nghiên cứu đặt trong
dấu ngoặc vuông [].
References
Tiếng Việt
1. Ngô Hoàng Huy, Nguyễn Thị Thanh Mai, Bùi Quang Trung (2002), “Chuẩn hóa và phân
tích tiếng Việt cho tổng hợp tiếng Việt”, Kỷ yếu Hội thảo quốc gia về công nghệ thông tin,
Nha Trang.
3
2. Nguyễn Thị Thanh Mai, Nghiên cứu các phương pháp nâng cao chất lượng tổng hợp tiếng
Việt và thử nghiệm cho phần mềm VnVoice, Luận văn Thạc sĩ, Trường Đại học Công nghệ,
the International Conference on Acoustics, Speech, and Signal Processing ICASSP 2002.
15. Styger, T., Keller, E., Formant synthesis. In E.keller (ed.), Fundamental of Speech
Synthesis and Speech Recognition: Basic concepts, State of the Art, and Future
Challenges, (pp. 109-128), Chichester: Jonh Wiley. (from Internet).
16. Xuedong H. (1997), Recent Improvement on Microsoft’s Trainable Text-to-Speech
Systems, ICASSP.
17. J. Yu, Meng Zhang, Jianhua Tao, Xia Wang (2007), A Novel HMM-Based TTS System
Using Both Continuous HMMs and Discrete HMMs, Proceedings of the International
Conference on Acoustics, Speech, and Signal Processing ICASSP 2007.
4
18. H. Zen, Takashi Nose, Junichi Yamagishi, Shinji Sako, Takashi Masuko, AlanW. Black,
Keiichi Tokuda (2007), The HMM-basedSpeech Synthesis System (HTS) Version 2.0, 6th
ISCA Workshop on Speech Synthesis, Bonn, Germany.
19.
/>_an.pdf
20.
21.
22.