Mô hình rút trích cm t c trng ng ngha trong ting Vit 54 Chng 4
MÔ HÌNH XÁC NH CM T
C TRNG NG NGHA TRONG
TING VIT (ViKEa)
PHNG PHÁP SO TRÙNG MU DA TRÊN
ONTOLOGY
Phn còn li ca chng c t chc thành ba phn: Phn 4.2 trình bày công
on rút trích cm danh t d tuyn b ng phng pháp so trùng mu da trên tp
mu nhn dng các cm danh t c s; Phn 4.3 mô t công on xác nh cm
danh t c trng ng ngha (CDTTNN); Phn cui cùng là kt chng.
4.2 Rút trích cm danh t d tuyn
Trong phn này, lun án trình bày hng gii quyt cho công on rút trích
cm danh t c s. Các phng pháp tip cn c!ng nh các thc nghim ánh giá
ã c trình bày trong công trình (Chau Q. Nguyen và Tuoi T. Phan, 2007), và
(Nguy"n Quang Châu và Phan Th Ti, 2008).
Hình 4.1 Mô hình rút trích cm danh t c trng theo hng xác nh.
Ti#n x$ lý
Câu ting Vit
Gán nhãn t loi
Phân on t
Các cm danh t c trng
ng ngha
- Ph t ch toàn th (t1): nh tt c, ht thy, toàn b, toàn th,…
- Ph t ch s lng (t2): nh mi, các, tng, nhng, mi; hai, ba, bn,
nm, …
b. Phn ph sau:
- Tính t (s1)
- Ch nh t (s2)
c. Phn trung tâm:
B phn ghép g&m hai t:
- n v tính toán, chng loi khái quát (T1)
- i tng em ra tính toán, i tng c th (T2)
Ví d: + em hc sinh (này)
+ em (này)
+ hc sinh (này)
Mô hình rút trích cm t c trng ng ngha trong ting Vit 57
Da trên các cu trúc ca cm danh t, xây dng tp mu phc v cho vic
xác nh cm danh t nh sau:
1. t
1
t
2
T
1
T
2
s
1
1
s
1
s
2
5. t
1
T
1
s
1
s
2
6. t
2
T
1
s
1
s
2
7. t
1
t
2
T
2
2
s
1
11. t
1
T
1
T
2
s
1
12. t
2
T
1
T
2
s
1
13. t
1
t
2
T
1
s
1
18. t
2
T
2
s
1
19. t
1
t
2
T
1
T
2
s
2
20. t
1
T
1
T
2
s
2
21. t
2
25. t
1
t
2
T
2
s
2
26. t
1
T
2
s
2
27. t
2
T
2
s
2Các nhãn trong b nhãn 48 t loi ca t c mô t bng 4.1.
Bng 4.1: B nhãn t loi ca t.
Nhãn
t loi
Loi t
Nhãn
Nl
danh t v trí
Vitm
ng t ni ng chuyn ng
Vt
ng t ngoi ng
Aa
tính t hàm cht
Vit
ng t ni ng
An
tính t hàm lng
Vim
ng t cm ngh
Pp
i t xng hô
Vo
ng t ch hng
Pd
i t không gian, thi gian
Vs
ng t tn ti
Pn
i t s lng
Vb
ng t bin hoá
Pa
i t hot ng, tính cht
Vv
ng t ý chí
Vtb
ng t ngoi ng bin hoá
E
cm t
Vto
ng t ngoi ng ch hng
I
tr t
Mô hình rút trích cm t c trng ng ngha trong ting Vit 58
Ta có các tr'ng hp tng ng:
a. Phn ph trc:
Ph t ch toàn th (t1): Ng hoc Nt
Ph t ch s lng (t2): Nu hoc Nn
b. Phn ph sau:
Tính t (s1): Aa hoc An
Ch nh t (s2): Nl hoc Pd
c. Phn trung tâm: B phn ghép g&m hai t
n v tính toán, chng loi khái quát (T1): Nu hoc Nn, Ng hoc Nt
i tng em ra tính toán, i tng c th (T2): Np hoc Nc hoc
Na
(<Np>|<Nc>|<Na>)
(<Aa>|<An>)
(<Nl>|<Pd>))
- Lut 5:
<KNP> -> ((<Ng>|<Nt>|<Pp>) *
(<Nu> |<Nn>)*
(<Nu>|<Nn>|<Ng>|<Nt>)
(<Np>|<Nc>|<Na>)
(<Aa>|<An>))
- Lut 6:
<KNP> → ((<Ng>|<Nt>|<Pp>)*
(<Nu> |<Nn>)*
(<Nu>|<Nn>|<Ng>|<Nt>)
(<Np>|<Nc>|<Na>)
(<Nl>|<Pd>))
Trong ó: | - hoc
* - 0 hoc nhi#u.
4.2.2.
Bài toán rút trích cm danh t bng phng pháp so trùng mu
V# phng pháp, mô hình rút trích cm danh t b ng phng pháp so trùng
mu, da vào tp mu cu trúc các cm danh t và các t có gán nhãn t loi
nhn c t công on trc, nhn din các cm danh t trong câu n ting
Vit ang xét.
Ý tng ca phng pháp là da vào cu trúc vn phm ting Vit xây
dng mt tp các mu, c x$ lý bi máy trng thái hu hn. Kt qu, lun án
ã xây dng c 434 mu nhn din các cm danh t bao g&m c các mu nhn
Mô hình rút trích cm t c trng ng ngha trong ting Vit
5. while (not over) do
6. for m+i Fi active instance ca FSM do
7. if instance này mt trng thái kt thúc then ct mt bn sao
ca nó vào tp accepting FSMs (instances ca FSM mà chúng t
trng thái kt thúc);
8. c tt c các annotations b,t u t nút hin hành;
9. Chn tt c các tp annotation mà c dùng trong bc trc
ca & th chuyn trng thái FSM;
10. for m+i tp nh vy to mt new instance ca FSM, t nó vào
danh sách active list và loi b- tp annotation này;
Mô hình rút trích cm t c trng ng ngha trong ting Vit 61
11. loi b- Fi;
12. end for;
13. if tp active instances ca FSM là r+ng then over = true;
14. end while;
15. if tp accepting FSMs là r+ng then
16. T tt c accepting FSMs chn
*
là mu có chi#u dài cc i; nu có
nhi#u mu có cùng chi#u dài thì lúc ó gii pháp là chn mu so
trùng u tiên;
17. Thc hin a v# trng thái kt thúc cho FSM instance ã c
chn;
18. StartNode =selectedFSMInstance.getLastNode.getNextNode();
20. else //s so trùng tht bi b,t u li t nút k tip // StartNode =
StartNode.getNextNode();
21. end while;