Tín hiệu tiếng nói và các phương pháp mã hoá - pdf 14

Download miễn phí Tín hiệu tiếng nói và các phương pháp mã hoá
Lời nói đầu
Chương I. Tín hiệu tiếng nói
1. Quá trình phát âm của con người
2. Đặc tính thống kê của tín hiệu tiếng nói
3. Các mô hình biểu diễn
Chương II. Mã hoá vùng thời gian
1. Công nghệ PCM
2. Các phương pháp mã hoá khác
3. Phương pháp mã hoá ADPCM (Điều chế xung mã vi sai thích ứng)
Chương III. Mã hoá vùng tần số
1. Mã hoá dải nhỏ (SBC)
2. Mã hoá biến đổi thích nghi (ATC)
Chương IV. Phương pháp mã hoá tham số nguồn (Resourd Parameters Method)
1. Bộ mã hoá nguồn theo kênh
2. Bộ mã nguồn tiếng nói formant
3. Bộ mã nguồn tiếng nói phổ tách
4 Phương pháp đoán tuyến tính LPC
5. Bộ mã hoá nguồn tiếng nói âm thanh được kích thích
Chương V. Phương pháp đánh giá
I. Kiểm tra định lượng
II. Phương pháp đánh giá định tính
Kết luận
Giáo viên HD: Trần Quốc Thịnh


Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

}: §¸p øng tuÇn hoµn trong bé läc th¸c.
Nh− vËy mét phÇn tö ®−îc x¸c ®Þnh bëi c¸c chØ sè i vµ j.
TÝn hiÖu qua bé läc H(z) cã thÓ ®−îc biÓu diÔn:
x`Þj= Hδ(n)giyj.
Trong ®ã H lµ ma trËn sau:
)()1()2()3()4(
0)()1()2()3(
00)()1()2(
000)()1(
0000)(
ohhhhh
ohhhh
ohhh
ohh
oh
H =
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 87
Gi¸ trÞ tèi −u t×m ®−îc b»ng ph−¬ng ph¸p cùc tiÓu ho¸, møc sai sè b×nh
ph−¬ng trung b×nh:
D=|| x(n)-x`ij || = σ2(n)||x`(n)-giHyi||2
Trong ®ã x`(n)=x(n)/ σ(n gäi lµ vÐc t¬ ®Ých biªn ®é chuÈn ho¸, suy ra
D=σ2(n) ( ||x`(n)||2-2gix`T(n)Hyi|| + gi 2Hyi||2)
Trong ®ã x`(n)||2 vµ σ2(n) lµ h»ng sè trong chu tr×nh t×m kiÕm do ®ã cùc
tiÓu ho¸ D t−¬ng ®−¬ng víi cùc tiÓu ho¸ D`
D`=-2gip
T(n)yi + g
2
iEj
víi p(n)= HTx`(n) vµ Ej=||Hyj||
2
Víi Ej lµ n¨ng l−îng thùc tÕ cña vÐct¬ m« h×nh ®· ®−îc läc nã kh«ng phô
thuéc vµo vÐct¬ môc ®Ých x(n).
Còng chó ý r»ng vÐct¬ m· h×nh d¹ng lµ cè ®Þnh vµ ma trËn H chØ phô
thuéc vµo bé läc tæng hîp vµ bé läc träng sè. Do ®ã Ej còngkh«ng ®æi trong
chu kú 4 vÐct¬ . Trªn c¬ së quan s¸t nµy khi hai bé läc ®−îc cËp nhËt ta cã thÓ
tÝnh vµ l−u gi¸ trÞ n¨ng l−îng cña 128 gi¸ trÞ Ej (0-127) (t−¬ng øng 128 vÐct¬
m· h×nh) vµ sau ®ã sö dông c¸c gi¸ trÞ nµy lËp l¹i cho qu¸ tr×nh t×m kiÕm víi 4
vÐct¬ tiÕp theo. Gi¶i thuËt nµy lµm gi¶m ®é phøc t¹p còng nh− thuËt to¸n t×m
kiÕm ®i rÊt nhiÒu.
Ta cã thÓ tÝnh tr−íc vµ l−u hai d·y sè:
bi=2gi vµ cj = gj
2.
Vµ ta cã thÓ biÓu diÔn
D`=-biPj +ciEj = -biP
T(n)yi +ciEj
Ej , bi , ci ®−îc ®−îc tÝnh vµ l−u tr÷ d−íi d¹ng b¶ng. Thñ tôc t×m kiÕm sæ
m· thùc hiÖn tõng b−íc qua sæ m· h×nh yj.vµ chØ sè biªn ®é i t−¬ng øng yj.
C¸c c¸ch t×m chØ sè biªn ®é i tèi −u nhÊt víi mçi vÐct¬ m· yi.
a. C¸ch thø nhÊt: −íc l−îng 8 gi¸ trÞ cã thÓ D t−¬ng øng víi 8 gi¸ trÞ cã
thÓ cña i, vµ sau ®ã lÊy chØ sè i cã D nhá nhÊt .
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 88
b. C¸ch thø hai: TÝnh to¸n tèi −u gi¸ trÞ biªn ®é g`=Pj/Ej sau ®ã l−îng tö
ho¸ biªn ®é nµy thµnh mét trong 8 møc ë 3 bit sæ m· biªn ®é. ChØ sè i tèt nhÊt
lµ chØ sè cña møc biªn ®é gi gÇn nhÊt.
c. C¸ch thø ba: Thùc hiÖn phæ biÕn ë c¸c IC DSP g` l−îng tö cã thÓ xem
nh− so s¸nh hai chuçi g` vµ biªn ®é l−îng tö ho¸ mµ ®iÓm gi÷a cña nã ®iÒu
chØnh møc khuyÕch ®¹i.
§Æt di lµ ®iÓm gi÷a gi vµ gi+1 sao cho hai gi¸ trÞ nµy cïng dÊu, sau ®ã
kiÓm tra g`<di . bëi vËy b»ng viÖc sö dông ph−¬ng thøc nµy ta cã thÓ tr¸nh
®−îc ph¶i thùc hiÖn c¸c c©u lÖnh chia rÊt tr¸nh trong c¸c vi xö lý dÊu phÈy cè
®Þnh. Sau khi t×m ®−îc ta tiÕn hµnh nèi c¸c gi¸ trÞ nµy sÏ ®−îc tõ m· 10 bÝt.
Gi¶i m·:
VÒ ph−¬ng thøc còng nh− c¸c khèi chøc n¨ng khèi gi¶i m·, gi¶ thuËt tÝnh
to¸n gi¶i m· LD-CELP còng gÇn gièng víi c¸c modul m· ho¸ ®· nghiªn cøu.
ThÝch
øng
läc
th«ng


läc th«ng
Bé läc
tæng hîp
Khèi thÝch
øng biªn ®é
ph¶n håi
Sæ m· VQ
kÝch thÝch
BiÕn ®æi vÒ
PCM ban ®Çu
Khèi
thÝch
øng
biªn ®é
ph¶n
håi
29 31 32 34 28
30 33 35
hÖ sè bé läc bËc 10
vµ hÖ sè ph¶n x¹ ®Çu tiªn
S¬ ®å chi tiÕt khèi gi¶i m· LD-CELP.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 89
Bao gåm sæ m· kÝch thÝch VQ, khèi ph©n kho¶ng biªn ®é, bé läc tæng
hîp, khèi t−¬ng thÝch biªn ®é vÐc t¬ ph¶n håi, khèi t−¬ng thÝch bé läc tæng
ph¶n håi gi«ng nh− phÝa m· ho¸ chØ cã bé läc th«ng vµ t−¬ng thÝch bé läc
th«ng lµ kh¸c ®«i chót.
¾ Bé läc th«ng:
Bao gåm ba phÇn :
- Bé läc dµi h¹n(hay cßn gäi lµ bé läc cao ®é) cã hµm truyÒn:
Hl(z)=gl(1+bZ
-P)
T−¬ng tù phÝa m· ho¸ c¸c hÖ sè trªn ®−îc cËp nhËt theo khung tÝn
hiÖu bé 4 vect[ mét lÇn.
- Bé läc ng¾n h¹n:
Hµm truyÒn:
)1(
`1
1
)( 110
1
10
1
`

=

=

+


=


z
za
zb
zH
i
i
i
i
i
i
μ
Trong ®ã bi`=a`(0,65)
i vµ a`i=a`(0,75)
i μ=0,15k1
i=1,...,10
k1 lµ hÖ sè ph¶n x¹ ®Çu tiªn, c¸c hÖ s« a`, b` gi¶i m· ®−îc.
¾ Bé t−¬ng thÝch bé läc th«ng, môc ®Ých ®Ó tÝnh to¸n vµ cËp nhËt
c¸c hÖ sè cña bé läc th«ng theo tõng khung tÝn hiÖu, nã bao gåm
c¸c khèi: läc ®¶o LPC bËc 10, modul ph¸t hiÖn chu kú cao ®é,
tÝnh to¸n kiÓm tra cao ®é pháng ®o¸n , bé tÝnh hÖ sè bé läc dµi
h¹n, tÝnh hÖ sè bé lä ng¾n h¹n.
¾ Bé biÕn ®æi vÒ PCM ®Ó tÝn hiÖu gi¶i m· gièng víi tÝn hiÖu vµo th×
ta ph¶i tÝn hµnh biÕn ®æi vÒ c¸c d¹ng PCM ®Þnh d¹ng ban ®Çu
theo luËn nÐn d·n t−¬ng øng.
NhËn xÐt chung:
C¶ phÝa m· ho¸ vµ gi¶i m· ®Òu cã c¸c thñ tôc gièng nhau v× vËy ta cã thÓ
x©y dùng c¸c modul thµnh c¸c ch−¬ng tr×nh con, vµ sö dông chung ®Ó gäi mçi
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 90
cÇn ®iÒu nµy ®Æc biÖt cã ý nghÜa khi dïng thuËt to¸n nµy ®Ó l−u tiÕng nãi d−íi
d¹ng c¬ së d÷ liÖu th× thuËt to¸n thùc hiÖn cµng dÔ dµng vµ gän nhÑ h¬n.
D. Ph−¬ng ph¸p CS-ACELP
1. Giíi thiÖu:
CS-ACELP lµ ph−¬ng ph¸p m· hãa tèc ®é thÊp dùa trªn c«ng nghÖ
CELP, ®· ®−îc ITU-T giíi thiÖu trong khuyÕn nghÞ G729, víi tèc ®é bit lµ
8kbps. TÝn hiÖu 8 Khz , tèc ®é 64 Kbps phÝa ®Çu vµo vµ ®−îc biÕn ®æi thµnh
tÝn hiÖu PCM víi sè bÝt m· hãa lµ 16 bit. C¸c modul phÇn thu vµ phÇn ph¸t lµ
c¬ b¶n gièng nhau nªn em chØ xin phÐp tr×nh bµy c¸c modul gi¶ thuËt chÝnh.
2. Tæng quan:
M· ho¸ CS- ACELP dùa trªn ph−¬ng ph¸p m· ho¸ dù ®o¸n tuyÕn tÝnh
kÝch thÝch, mçi khung tÝn hiÖu xö lý cã chiÒu dµi lµ 10ms, tøc lµ 80 mÉu øng
víi tÝn hiÖu sè cã tÇn sè lÊy mÉu lµ 8 Khz. ë mçi khung nµy tÝn hiÖu sÏ ®−îc
ph©n tÝch vµ tÝnh to¸n (c¸c th«ng sè vÒ bé läc, th«ng sè vÒ biªn ®é, ©m kªu
kh«ng kªu... ) sau ®ã ®−îc m· ho¸ vµ truyÒn ®i.
PhÝa thu c¸c th«ng sè trªn sau khi nhËn ®−îc thùc hiÖn c¸c chøc n¨ng
biÕn ®æi ng−îc l¹i(kÝch thÝch c¸c bé läc tæng hîp thêi h¹n vµ mét sè c¸c biÕn
®æi kh¸c) sÏ nhËn ®−îc tÝn hiÖu analogue phÝa ra.
Th«ng sè Tõ m· Khung
con 1
Khung
con 2
Toµn
khung
CÆp phæ ®−êng L0,L1,L2 ,L3 18
§é trÔ sæ m· ®éng P1 , P2 8 5 13
TrÔ cao ®é P0 1 1
ChØ sè sæ m· ®éng C1 ,C2 13 13 16
DÊu sæ m· ®éng S1 ,S1 4 8
Biªn ®é sæ m· b1 GA1 ,GA2 3 3 6
Biªn ®é sæ m· b1 Gb1 ,GB2 4 4 8
Tæng sè 80
Ph©n bè bÝt m· ho¸ trong CS - ACELP.
TÝn hiÖu tiÕng nãi vµ c¸c ph−¬ng ph¸p m∙ ho¸
Tr−êng §HGTVT - Hµ Néi 91
Tõ b¶ng ta tÝnh ®−îc tèc ®é m· ho¸ nh− sau:
C= 80/10.10-3=8.000 bps = 8 Kbps
3. Bé m· ho¸
TÝn hiÖu ®Çu vµo ®−îc ®−a qua bé läc th«ng cao vµ ®−îc chia thang t¹i
bé tiÒn xö lý, TÝn hiÖu nµy sÏ ®−îc dïng cho c¸c qu¸ tr×nh gia c«ng ë c¸c
b−íc tiÕp theo.
Vai trß cña khèi nµy lµ t¹o ra tÝn hiÖu PCM cã sè bÝt m· ho¸ lµ 16 bÝt(
t−¬ng øng víi 216 = 65536 møc ) nh− ®· nãi ë trªn, Khèi nµy thùc hiÖn hai
chøc n¨ng :
• §o tÝn hiÖu (®Ó chia thang).
• Läc th«ng cao.
Thùc hiÖn cña viÖc chia tÝn hiÖu lµ v× thuËt to¸n ®−îc thùc hiÖn víi dÊu
phÈy tÜnh(thùc hiÖn b»ng vi xö lý hu¹c phÇn mÒm- xem phô lôc) cho nªn ®Ó
tr¸nh viÖc trµn phÐp tÝnh ph¶i chia thµnh hai phÇn : phÇn d−¬ng vµ phÇn ©m.
Bé läc th«ng cao thùc hiÖn vai trß läc bá c¸c thµnh phÇn tÇn sè thÊp kh«ng
mong muèn, tÇn sè c¾t lµ 140hz , cã hµm truyÒn :
Hh1(z) = 21
21
Z9114024,0Z9059465,11
Z4636378,0Z92724705,046363718,0
−−
−−
+−
+− (pt.1)
Ph©n tÝch LP (Linear Predictor- tiªn ®o¸n t−¬ng thÝch) ph©n tÝch tÝn hiÖu
cã thêi gian 10 ms ®Ó t¹o ra c¸c hÖ sè cña bé läc LP, HÖ sè nµy biÕn ®æi thµnh
nh÷ng cÆp phæ ®−êng (LSP) vµ ®−îc l−îng tö ho¸ sö dông bé l−îng tö vÐc t
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status