Đồ án Xác minh người qua giọng nói - pdf 14

Download miễn phí Luận văn Xác minh người qua giọng nói



MỤC LỤC
Bảng liệt kê các từviết tắt và các thuật ngữdùng trong luận văn
Danh mục các bảng
Danh mục các hình vẽ, đồthị
MỞ ĐẦU Trang
CHƯƠNG 1 - TỔNG QUAN---------------------------------------------------------- 1
1.1 Tổng quan vềsinh trắc học --------------------------------------------------------- 1
1.1.1 Giới thiệu ------------------------------------------------------------------------ 1
1.1.2 Hệthống nhận dạng tự động dựa trên sinh trắc học ------------------------ 2
1.2 Sơlược vềhệthống nhận dạng tự động người qua giọng nói ----------------- 3
1.2.1 Hai loại ứng dụng của lĩnh vực nhận dạng người qua giọng nói --------- 4
1.2.2 Tính đa dạng của hệthống nhận dạng người qua giọng nói. -------------- 5
CHƯƠNG 2 - PHƯƠNG PHÁP XÁC MINH NGƯỜI NÓI ------------------- 7
2.1 Dẫn nhập ------------------------------------------------------------------------------ 7
2.2 Rút trích đặc trưng ------------------------------------------------------------------ 7
2.2.1 Phân đoạn, pre-emphasis và hàm cửa sổ------------------------------------- 8
2.2.2 Biến đổi Fourier rời rạc -------------------------------------------------------- 9
2.2.3 Dải bộlọc tần sốmel ----------------------------------------------------------- 13
2.2.4 Biến đổi cosin rời rạc ---------------------------------------------------------- 15
2.2.5 Các hệsốmel-cepstrum và các đạo hàm của nó ---------------------------- 16
2.2.6 Năng lượng ---------------------------------------------------------------------- 16
2.2.7 Kết luận--------------------------------------------------------------------------- 16
2.3 Dò tìm năng lượng ------------------------------------------------------------------ 17
2.4 Chuẩn hoá đặc trưng ------------------------------------------------------------- 17
2.5 Huấn luyện mô hình nền và mô hình người nói --------------------------------- 17
2.5.1 Giới thiệu ------------------------------------------------------------------------- 17
2.5.2 Mô hình nền phổquát ---------------------------------------------------------- 18
2.5.3 Định lý Bayes-------------------------------------------------------------------- 19
2.5.4 Giải thuật Expectation Maximization (EM) --------------------------------- 20
2.5.5 Giải thuật Expectation Maximization trong ứng dụng -------------------- 22
2.6 Tính điểm cho một đoạn âm thanh ------------------------------------------------ 24
2.7 Chuẩn hoá điểm ---------------------------------------------------------------------- 26
2.7.1 T-norm (Test Normalization)-------------------------------------------------- 27
2.7.2 Z-norm (Zero Normaliztion)--------------------------------------------------- 28
2.8 Quyết định ----------------------------------------------------------------------------28
2.8.1 Các loại lỗi ---------------------------------------------------------------------- 28
2.8.2 Các phương pháp đánh giá hiệu năng --------------------------------------- 29
2.8.3 Điểm EER ----------------------------------------------------------------------- 29
2.8.4 Chọn ngưỡng -------------------------------------------------------------------- 30
CHƯƠNG 3 - GIỚI THIỆU TÓM TẮT PHẦN MỀM MÃ NGUỒN MỞ
ALIZE & LIA – RAL ------------------------------------------------------------------ 31
3.1 Nguồn gốc----------------------------------------------------------------------------- 31
3.2 Giới thiệu thưviện Alize ------------------------------------------------------------ 32
3.2.1 Bộphân tích cấu hình ---------------------------------------------------------- 32
3.2.2 Tập tin I/O------------------------------------------------------------------------ 32
3.2.3 Các tập tin đặc trưng ----------------------------------------------------------- 32
3.2.4 Các hàm thống kê -------------------------------------------------------------- 32
3.2.5 Các phân bốGaussian --------------------------------------------------------- 33
3.2.6 Tập các Gaussians -------------------------------------------------------------- 33
3.2.7 Phân đoạn đặc trưng ----------------------------------------------------------- 33
3.2.8 Xửlý các tập tin vào/ra dựa trên dòng --------------------------------------- 33
3.2.9 Các véc tơvà ma trận----------------------------------------------------------- 33
3.2.10 Bộquản lý ---------------------------------------------------------------------- 33
3.3 Giới thiệu gói Lia-ral ---------------------------------------------------------------- 34
3.3.1 Dò tìm năng lượng ------------------------------------------------------------- 34
3.3.2 Chuẩn hoá đặc trưng ----------------------------------------------------------- 36
3.3.3 Huấn luyện mô hình nền ------------------------------------------------------ 37
3.3.4 Huấn luyện mô hình người nói ----------------------------------------------- 37
3.3.5 Kiểm tra -------------------------------------------------------------------------- 38
3.3.6 Chuẩn hoá điểm ----------------------------------------------------------------- 39
3.3.7 Quyết định------------------------------------------------------------------------ 39
CHƯƠNG 4 - CHI TIẾT THỰC NGHIỆM --------------------------------------- 40
4.1 Chuẩn bịdữliệu ---------------------------------------------------------------------- 40
4.2 Chi tiết quá trình tiến hành thực nghiệm ------------------------------------------ 41
4.2.1 Khám phá tham số-------------------------------------------------------------- 41
4.2.2 Tìm hiệu năng ------------------------------------------------------------------- 42
4.3 Kết quảthửnghiệm ------------------------------------------------------------------ 43
4.3.1 Khám phá tham số-------------------------------------------------------------- 43
4.3.2 Tìm hiệu năng ------------------------------------------------------------------- 46
CHƯƠNG 5 – ĐÁNH GIÁ VÀ HƯỚNG PHÁT TRIỂN ----------------------- 48
5.1 Đánh giá kết quả--------------------------------------------------------------------- 48
5.2 Hướng phát triển luận văn ---------------------------------------------------------- 48
TÀI LIỆU THAM KHẢO --------------------------------------------------------------- 49
PHỤLỤC A ------------------------------------------------------------------------------- 52
PHỤLỤC B ------------------------------------------------------------------------------- 57
PHỤLỤC C ------------------------------------------------------------------------------- 61
PHỤLỤC D ------------------------------------------------------------------------------- 62

1. Tổng quan
Luận văn mô tả các bước thực hiện của một hệ thống xác minh người qua giọng nói
(Automatic Speaker Verification − ASV), chủ yếu dựa trên công cụ Alize của trường đại học
Avignon, Pháp. Đây là một hệ mã nguồn mở được phát triển trong khuôn khổ các dự án nhận
dạng bằng sinh trắc học. Tuy nhiên, Alize chỉ là một thư viện và Lia-ral là những gói rời rạc,
quá tổng quát để trở thành một hệ thống xác minh người qua giọng nói hoàn chỉnh. Trong
luận văn này, ngoài việc giới thiệu hệ thống, chúng tui tập trung vào các kết quả của vài thí
nghiệm trên cơ sở dữ liệu người Việt Nam. Mặc dù nguồn dữ liệu thu thập cho các thí nghiệm
chưa đủ lớn, chỉ khoảng 70 người nói từ các miền Bắc, Trung, Nam và kết quả chỉ đạt khoảng
83% nhưng cũng là bước khởi đầu cho lĩnh vực nhận dạng người qua giọng nói được phát
triển ở Việt Nam về sau. Ngoài ra, nó cũng giúp cho các thí nghiệm đi đến kết quả cuối cùng.
2. Các bước cho hệ thống xác minh người qua giọng nói
Hình 1 bên dưới mô tả các bước thực hiện của hệ thống xác minh tự động người qua giọng
nói theo hướng độc lập văn bản (text-independent).
Bạn download tại đây nhé
https://www.mediafire.com/?0zlc5d3rg439a2g
pass giải nén là Ket-noi.com
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status