1BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG TRƯƠNG LÊ PHƯƠNG ANH
NÂNG CAO CHẤT LƯỢNG THOẠI
TRÊN MẠNG IP BẰNG KỸ THUẬT BÙ
MẤT GÓI Chuyên ngành : Kỹ thuật ñiện tử
Mã số : 60.52.70
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
3
MỞ ĐẦU
1. TÍNH CẤP THIẾT CỦA ĐỀ TÀI
Ngày nay, khi xã hội phát triển, nhu cầu liên lạc của con người càng
trở nên bùng nổ và cấp thiết, các yêu cầu về loại hình dịch vụ thông tin
ngày càng phong phú. Tuy nhiên các dịch vụ này lại chiếm rất nhiều
băng thông ñường truyền.
Để sử dụng tài nguyên viễn thông một cách hiệu quả nhất, kỹ thuật
chuyển mạch gói ñã ra ñời. Công nghệ này chia dữ liệu cần vận chuyển
thành các gói (hay các khung) có kích thước và ñịnh dạng xác ñịnh. Mỗi
gói như vậy sẽ ñược vận chuyển riêng rẽ và ñến nơi nhận bằng các ñường
truyền khác nhau. Khi toàn bộ các gói dữ liệu ñã ñến nơi nhận thì chúng
sẽ ñược hợp lại thành dữ liệu ban ñầu.
Tiết kiệm băng thông ñường truyền và nâng cao chất lượng cuộc gọi
là ñiều quan trọng mà nhà cung cấp dịch vụ cần phải quan tâm. Tuy
nhiên, khi truyền thoại trên mạng chuyển mạch gói, do thoại là dịch vụ
thời gian thực nên nó chỉ cho phép thời gian trễ và tỷ lệ mất gói thấp.
Mất gói lớn xảy ra làm chất lượng cuộc gọi kém ñi, gây khó chịu cho
khách hàng. Vì vậy, việc nghiên cứu và áp dụng các biện pháp ñể nâng
cao chất lượng cuộc gọi trong mạng IP là ñiều rất cần thiết.
2. MỤC ĐÍCH NGHIÊN CỨU
Đề tài tiến hành nghiên cứu tổng quan VoIP; các yếu tố ảnh hưởng
chất lượng thoại, các nguyên nhân dẫn ñến việc mất gói thoại; tìm hiểu
mô hình tạo tiếng nói, phân tích và áp dụng phương pháp bù mất gói
thoại ñể nâng cao ñược chất lượng dịch vụ.
3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng nghiên cứu :
mã, sau ñó ñược chuyển ñổi thành tín hiệu tương tự ñể phục hồi âm
thanh.
1.2. LỢI ÍCH CỦA VoIP
1.3. H.323 – TIÊU CHUẨN VẬN CHUYỂN TIẾNG NÓI TRÊN
MẠNG IP
1.3.1. Khái niệm H.323
1.3.2. Kiến trúc H.323 51.3.3. Các giao thức ñiều khiển, thiết lập cuộc gọi trong H.323
1.4. CHẤT LƯỢNG TRUYỀN DẪN THOẠI TRONG MẠNG IP
Gateway là thiết bị trung gian giữa các mạng, thực hiện chức năng
“phiên dịch”, thực hiện xử lý DSP và gói hóa thoại. Các gói thoại ñược
truyền linh hoạt trong mạng IP nhờ cơ chế hoạt ñộng hiệu quả của các bộ
ñịnh tuyến (Router). Router nhận các gói thoại trên ñường truyền, lần
lượt bóc tách các header và ñọc ñịa chỉ IP mạng ñể xác ñịnh ñường ñi tối
ưu nhất tới ñích.
Vì ñược thực hiện nhiều quá trình xử lý tại Gateway (DSP, ñóng
gói ) và phải qua nhiều Router trên ñường truyền ñể ñến ñích nên thời
gian trễ của gói thoại lớn, ñiều này ảnh hưởng rất nhiều ñến chất lượng
thoại. Về bản chất, mạng IP lại là mạng best-effort, nó không ñảm bảo tin
cậy hoàn toàn, do vậy, mất gói luôn luôn có thể xảy ra…
Để cung cấp thoại có chất lượng tốt nhất, ta cần quan tâm ñến các
yếu tố ảnh hưởng chất lượng như: trễ, mất gói hay echo; từ ñó ñề ra các
phương thức giảm thiểu những ảnh hưởng này.
1.4.1. Trễ
Trễ trong hệ thống VoIP cơ bản từ hai nguồn: trễ do bản thân
• Trễ giao diện mạng
• Trễ trong quá trình xử lý tín hiệu số
Xử lý tín hiệu số ñược thực hiện bằng phần cứng DSP chuyên dụng
hay kết hợp thuật toán phần mềm ñể thực hiện: nén/ giải nén tiếng nói,
phát hiện tone, phát hiện im lặng, tạo tone, tạo nhiễu dễ chịu và triệt echo
trên từng khung tiếng nói. Quá trình DSP thực hiện xử lý toàn bộ các
khung dữ liệu cùng một lúc.
Thời gian trễ của quá trình xử lý số tùy thuộc vào kích thước khung
(frame) ñối với từng phương pháp mã hóa thoại.
• Trễ xử lý gói
Sau khi thực hiện xử lý số, hệ thống VoIP ñặt vào bộ ñệm các khung
dữ liệu tiếng nói ñã ñược mã hóa trước khi gói hóa ñể truyền ñi.
Mỗi gói dữ liệu VoIP bắt ñầu với 40 byte header của giao thức IP,
UDP và RTP. Header chứa ñịa chỉ IP nguồn/ñích, số cổng UDP, số thứ
Giao diện mạng
IP
Giao diện mạng
T1, E1
Xử lý gói Xử lý tín hiệu số
DSP coding
Bộ ñệm và ñóng
gói
Bộ ñệm
Jitter
TCP/IP
Ngăn x
ếp giao thức
- Mất gói xảy ra do gói trải qua một thời gian trễ trên mạng quá lớn
và ñến ñích quá trễ.
Đối với các ứng dụng không phải thời gian thực như truyền file hay
email , mất gói không quan trọng vì nó dùng cơ cấu phát lại. Tuy nhiên,
trong trường hợp thông tin thoại thời gian thực, các gói ñến phải nằm
trong cửa sổ thời gian thực tương ñối hẹp ñể tái tạo tín hiệu tiếng nói. Do
vậy cơ cấu phát lại thực sự không phù hợp. 8 Sau ñây là các kỹ thuật ñược sử dụng ñể hiệu chỉnh và khôi phục sự
mất gói. Các kỹ thuật này sẽ ñược trình bày kỹ hơn trong chương 3 phía
sau.
• Khôi phục các gói bị mất ở phía phát
- Media-independent FEC
- Media-dependent FEC: các gói thoại dự phòng ñược ñi kèm với
các gói thoại khác ñể có thể thực hiện khôi phục gói bị mất.
- Một gói thoại ñược chia ra thành các unit nhỏ hơn và xếp xen kẻ
nhau trong các gói khác nhau.
• Khôi phục các gói bị mất ở phía thu
- Bên thu bù mất gói bằng cách thay thế nhiễu nền vào vị trí các gói
bị mất hay lặp lại gói cuối cùng nhận ñược trong suốt khoảng thời gian
khi gói bị mất.
- Thực hiện ngoại suy hay nội suy gói bị mất từ các gói ñược nhận
trước hay gói nhận sau.[12]
- Thực hiện tái tạo gói bị mất theo mô hình huấn luyện.
1.5. KẾT LUẬN CHƯƠNG
Chương 1 ñã trình bày một cách tổng quan về VoIP và các vấn ñề
Mối quan hệ giữa mô hình vật lý và mô hình toán học:
Bộ máy phát âm <=> H(z) ( Bộ lọc LPC)
Không khí <=> u(n) (Kích thích)
Sự rung của dây thanh âm <=> V (Voiced)
Chu kỳ rung của dây thanh âm <=> T (Chu kỳ pitch)
Phụ âm sát và phụ âm bật <=> UV (Unvoiced)
Độ lớn không khí <=> G (Độ lợi)
2.3. FRAMING, OVERLAP-ADDING TRONG XỬ LÝ TÍN HIỆU
TIẾNG NÓI
N : kích thước của frame
m : số lượng frame 10
Hình 2.7. Phân tích tín hiệu thành frame
2.4. PHƯƠNG PHÁP PHÂN TÍCH MÃ HÓA DỰ ĐOÁN TUYẾN
TÍNH
Tín hiệu tiếng nói thay ñổi theo thời gian. Ứng với một ñoạn tiếng nói
ngắn (gọi là segment hay frame), tiếng nói ñược xem là tín hiệu dừng. Nói
∑
=
−
M
k
k
knsa
1
)(
(2.3)
Như vậy, sai lệch e(n) giữa mẫu tiếng nói thực và mẫu dự ñoán:
∑
=
≈
−−=−=
M
k
k
knsansnsnsne
1
)()()()()(
(2.4)
Do vậy, tổng của sai lệch dự ñoán bình phương của cả frame:
(2.5)
∑ ∑∑
=
−−==
n
Trong b ộ mã hóa LPC-10, tín hiệu tiếng nói ñược chia thành khung
có chiều dài 20ms hay 160 mẫu với tần số lấy m ẫu l à 8kHz. B ậc c ủa
bộ lọc LPC là 10. Thông thường, 10 thông số bộ lọc dự ñoán tuyến tính
ñược chuyển sang thông số cặp phổ vạch LSP tương ñương vì LSP có ñộ
ổn ñịnh cao hơn.
Quá trình mã hóa LPC sẽ tính toán và truyền ñi các thông số bộ lọc,
dấu hiệu xác ñịnh voiced/unvoiced và chu kỳ pitch của khung tiếng nói
ñó.
Vì tốc ñộ của bộ mã hóa LPC-10 là 2.4kbps, do vậy, số bit cần dùng
ñể mã hóa 1 khung là: 2400*0.02 = 48 bit.
2.5. PHƯƠNG PHÁP MÃ HÓA CELP
0=
∂
∂
k
a
E
ACB-gain
ACB-index
Spectral parameters
10110
LPC spectral
analysis
Spectral
Hình 2.9. Thuật toán CELP
2.5.1. Quá trình mã hóa CELP
Hình 2.10. Bộ mã hóa CELP
2.5.2. Quá trình giải mã CELP
Decoded
samples
Gp
Gc
LSP
Pitch delay
Synthesis filter
Fixed codebook
search
Adaptive
codebook
+
Pitch analysis
Fixed codebook
search
Perceptual
weighting
Gain quantization
Encoded bit stream of payload bytes
Gp
LPC info
+
LPC info
13Hình 2.11. Bộ giải mã CELP
Redundacy
(Media dependent)
Bị ñộng Chủ ñộng
Truyền lại
gói
Sửa lỗi FEC
(Media independent)
Xen kẻ gói 14Hình 3.2. Cơ chế phục hồi FEC Hình 3.3. Ví dụ cơ chế phục hồi gói Redundancy
11 12 13 14 15 Nhiễu Nhiễu
18 19 20
20
(b) Khôi phục bằng thay thế nhiễu nền
11 12 13 14 15 15 15 18 19 20
(c) Khôi phục bằng lặp lại gói trước ñó
Hình 3.5. Kỹ thuật phục hồi mất gói từ phía thu theo cơ chế chèn
3.1.2.2. Bù mất gói dựa vào mô hình LP
Kỹ thuật này dùng mô hình dự ñoán tuyến tính LP (Linear
Prediction) của quá trình tạo tiếng nói. Hình 3.6. Sơ ñồ khối thuật toán bù mất gói dựa vào mô hình LP
Theo mô hình LP, tín hiệu tiếng nói x(n) gồm hai thành phần:
- Thông số dự ñoán chứa thông tin bộ máy phát âm.
16
17
Voice packets
generator
Synthesis
filter 16 - Tín hiệu dư thừa (sai lệch) chứa thông tin về tín hiệu kích thích.
∑
=
+−=
N
i
neinxianx
1
)()()()(
(3.1)
Tiếng nói ñược tạo ra bằng cách cho tín hiệu kích thích ñi qua một bộ
lọc tổng hợp (bộ máy phát âm)
Phương pháp bù này ñược thực hiện hoàn toàn từ bên thu ñối với tín
hiệu PCM. Nguyên tắc cơ bản của thuật toán này là ước tính hệ số LP
{a(i)} và tín hiệu kích thích {e(n)} của gói (frame) tiếng nói bị mất dựa
vào thông tin ñược trích ra từ frame tiếng nói nhận tốt trước ñó. Hai
thông số này ñược kết hợp ñể tạo ra xấp xỉ cho gói bị mất.
• Bộ phân tích LP
Khối này dùng ñể tìm các hệ số LP {a(i)}, mô phỏng hình dạng bộ
máy phát âm của một frame tiếng nói.
Frame tiếng nói nhận tốt trước ñó ñược ñưa vào bộ phân tích LP bậc
e
(n)/r
e
(0) trong khoảng thời gian tương ứng 3 ñến
15ms trong frame tiếng nói 20ms theo công thức sau:
∑
=
−=
10
1
)()()(
i
ae
inrirnr
(3.3)
Với r
a
(i), r(n-i) lần lượt là chuỗi tự tương quan của các hệ số dự ñoán
và của các mẫu trong 1 frame.
∑
=
+=
10
1
)()()(
i
kka
niaianr
thích.
Hình 3.7. Cách tạo tín hiệu kích thích của frame bị mất từ frame
trước ñó
• Bộ lọc tổng hợp
P
P
P P
P
Hình 3.8. Sơ ñồ khối thuật toán bù mất gói dùng dự ñoán tuyến tính
ñệ quy
Bù mất gói ñơn dùng cả dự ñoán trước và dự ñoán sau.
Công thức dự ñoán trước (forward prediction) một mẫu từ các mẫu
nhận ñược trước ñó:
∑
=
−
∧
−=
N
i
ini
nf
xax
1
,
*1
(3.7) 19
x
,
∧
và
i
x
với i=n-1, n-2,…., n-N+1 ñược dùng ñể dự ñoán mẫu
1, +
∧
nf
x .
Hình 3.9. Sơ ñồ khối thuật toán dự ñoán các mẫu LPC
Trong quá trình dự ñoán các mẫu của gói bị mất, hệ số LPC của frame
bị mất vẫn dùng nguyên lại hệ số LPC của frame nhận tốt trước ñó. Quá
trình dự ñoán mẫu ñược lặp lại cho toàn bộ frame bị mất.
∑
=
−+
∧
+
∧
−=
N
j
i
Nini
nb
xbx
1
1
,
*1
(3.9)
Với
nb
x
,
∧
là mẫu ñược dự ñoán sau thuộc frame bị mất,
1++− Nin
x là các mẫu tiếng nói thuộc frame nhận ñược sau ñó;
i
b là hệ số LPC ñược tính từ M mẫu thuộc frame nhận ñược sau frame bị
mất. Hệ số LPC cũng ñược tính bằng công thức Levinson-Durbin. Vì
thực hiện dự ñoán sau nên cần nhận ñược frame phía sau frame bị mất,
do vậy, thời gian trễ xử lý tăng lên. Quá trình dự ñoán mẫu ñược lặp lại
cho toàn bộ frame bị mất với trật tự thời gian ngược.
Độ lợi thích ứng
b
G ñược áp dụng theo cách tương tự.
b
G
bắt
ñầu bằng 1 tại cuối frame bị mất và bằng 1.8 tại ñầu frame bị mất. Độ lợi
inbinfin
xxx
+
∧
+
∧
+
∧
+−=
,,
.).1(
αα
(3.10)
Với α là trọng số tăng tuyến tính, α=0 tại ñầu frame bị mất và bằng 1
tại cuối frame bị mất.
Theo phương pháp dự ñoán ñệ quy, bù mất gói ñơn thực hiện nội suy
từ gói trước và gói sau của gói bị mất. Nội suy gói bị mất từ gói ở hai
chiều cải thiện tốt hơn chất lượng tiếng nói, tuy nhiên, nó làm tăng ñộ trễ
xử lý vì phải ñợi thêm gói thoại.
3.2.
CÁC PHƯƠNG PHÁP ĐÁNH GIÁ CHẤT LƯỢNG TIẾNG NÓI
3.2.1. Phương pháp ñánh giá chủ quan
3.2.1.1. Phương pháp ñánh giá tuyệt ñối ACR
Đánh giá chất lượng tiếng nói theo thang ñiểm MOS từ 1 -> 5 213.2.1.2. Phương pháp ñánh giá tương ñối
22Bước 3: Thực hiện các phương pháp bù mất gói dựa trên cơ sở dữ liệu
Bước 4: Thực hiện ñánh giá chất lượng thoại sau khi ñược bù mất gói
Bước 5: Nhận xét & ñánh giá
4.3. LƯU ĐỒ CÁC PHƯƠNG PHÁP BÙ MẤT GÓI
- Hệ số dự ñoán tuyến tính LPC
- Tín hiệu residual
- Voiced/Unvoiced
- Chu kỳ pitch P
- Độ lợi Gain
Thực hiện tạo gói bị mất:
- Nếu gói trước là Unvoiced, gói bị mất có:
+ Tín hiệu kích thích là nhiễu
+ Hệ số LPC & Gain là các hệ số của gói trước ñó.
- Nếu gói trước là Voiced, gói bị mất có:
+ Tín hiệu kích thích ñược tạo ra bằng cách lấy P giá trị
cuối cùng trong tín hiệu residual và lặp lại nhiều lần cho
ñến hết chiều dài gói
+ Hệ số LPC & Gain là các hệ số của gói trước ñó.
- Thực hiện giải mã LPC cho gói bị mất i = 1;
(xét chỉ số thứ i của V)
i = i+1;
Ghép các gói lại theo tỷ lệ chồng lấp overlap là 50%
i
≤ length(V)
Y
Bắt ñầu N
K
ết thúc
Ứng với mỗi chỉ số chỉ gói bị mất:
- Lấy gói trước ñó và gói sau ñể thực hiện bù cho gói bị mất.
- Nếu mất gói ñầu tiên thì bù bằng backward prediction
- Nếu mất gói cuối cùng thì bù bằng forward prediction
V = Vector m
ất gói
Forward prediction:
- Từ gói nhận ñược trước ñó, xác ñịnh: N hệ số dự ñoán tuyến tính LPC
i
a
(i=1 N).
- Dự ñoán các mẫu của gói bị mất từ các mẫu của gói trước ñó:
∑
=
−
∧
−=
N
i
ini
nf
i
Nini
nb
xbx
1
1
,
*1
-
b
G
tăng tuyến tính,
b
G
= 1 tại cuối frame bị mất và bằng 1.8 tại ñầu frame bị mất.
Nội suy gói bị mất từ 2 gói: phía trước và phía sau:
inbinfin
xxx
+
∧
+
∧
+
∧
+−=
,,
.).1(
αα
Hình 4.5. Đánh giá khách quan theo FWSEG-MARS
Hình 4.10. Đánh giá khách quan theo CEP
Hình 4.12. ánh giá khách quan theo PESQ
Hình 4.3. Lưu ñồ bù mất gói dùng dự
ñoán tuyến tính ñệ quy 25 Hình 4.12. Đánh giá khách quan theo PESQ
4.5. ĐÁNH GIÁ CHỦ QUAN CHẤT LƯỢNG TIẾNG NÓI SAU
KHI ĐƯỢC BÙ MẤT GÓI
4.5.1. Phân chia cơ sở dữ liệu cho từng người tham gia ñánh giá
4.5.2. Hoạt ñộng của công cụ ñánh giá
4.5.3. Kết quả
Mặc dù sử dụng 3 phương pháp ñánh giá chủ quan (MOS, CCR,
DCR) ñể ñánh giá chất lượng tiếng nói sau khi bù mất gói, tuy nhiên,
MOS vẫn là phương pháp cho thang ñiểm ñánh giá hợp lý nhất, bởi nó
phản ánh trực tiếp nhận xét của người nghe ñối với chính chất lượng câu
ñã ñược xử lý ñấy mà không phải tuân theo thang ñiểm tham chiếu khi so
4.5.3. KẾT LUẬN CHƯƠNG
KẾT LUẬN VÀ KIẾN NGHỊ
Mất gói trong VoIP là một yếu tố làm chất lượng thoại suy giảm, do
vậy việc xem xét và giải quyết vấn ñề này rất quan trọng.
Đồ án ñã thực hiện ñược các vấn ñề :
- Tìm hiểu cơ chế truyền gói thoại trong mạng IP.
- Tìm hiểu các yếu tố ảnh hưởng ñến chất lượng truyền dẫn thoại.
- Tìm hiểu mô hình tạo tiếng nói và hai loại mã hóa tiếng nói thường
ñược dùng trong mạng IP: LPC và CELP.
- Tìm hiểu phương pháp sửa mất gói ñối với bên phát và phương
pháp bù mất gói ñối với bên nhận: thay gói bị mất bằng nhiễu, lặp lại gói
trước ñó nhận ñược, dùng mô hình lọc nguồn LP hay dùng tuyến tính ñệ
quy.
- Tìm hiểu các phương pháp ñánh giá chất lượng tiếng nói chủ quan
và khách quan.
- Mô phỏng bù mất gói ñơn bằng ngôn ngữ Matlab; thực hiện ñánh
giá hiệu quả các thuật toán bù bằng phương pháp ñánh giá khách quan và
kiểm nghiệm lại bằng phương pháp ñánh giá chủ quan.
Tuy nhiên, việc thực hiện bù mất gói mới chỉ thực hiện giải quyết ñối
với mất gói ñơn; thực hiện ñược một số phương pháp bù ñiển hình: kỹ
thuật chèn, ngoại suy và nội suy cho gói bị mất. Bù mất gói chỉ mới thực
hiện ñối với miền PCM và miền LPC. Do vậy, hướng phát triển của ñề
tài trong tương lai sẽ là:
- Thực hiện các phương pháp bù mất gói ñối với mất gói chùm.
- Tìm hiểu thêm các phương pháp bù mất gói khác như: thay ñổi
thang thời gian hay tái tạo gói bị mất dựa theo mô hình huấn luyện. 27