International Research Center MICA
Multimedia, Information, Communication & Applications
UMI 2954
Hanoi University of Technology
1 Dai Co Viet - Hanoi - Vietnam
Cơ sở dữ liệu audio
Le Thi Lan
MICA
MICA
2010
2
Ngữ cảnh
Cơ sở dữ liệu tiếng nói
2
Broadcast News Podcasts Academic Lectures
Nhận dạng tiếng nói
Tìm kiếm văn bản tiếng nói
MICA
2010
3
Nhận dạng tiếng nói
Đưa ra câu gần giống nhất với đầu vào
O
O được xem như một dãy quan sát
O = o
1
,o
WPWOP
W
LW∈
=
Luật Bayes
Luật vàng
MICA
2010
4
Kiến trúc của hệ thống nhận dạng tiếng
nói
Feature
Extraction
Decoding
Acoustic
Model
Pronunciation
Model
Language
Model
Speech Signals
Word Sequence
Network
Construction
Speech
DB
Text
Corpora
HMM
Estimation
Transform)
MFCC
(12-Dimension)
X(n)
25 ms
10ms
. . .
a1
a2
a3