Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt 05 - Pdf 78

Mô hình rút trích cm t c trng ng ngha trong ting Vit 54 Chng 4

MÔ HÌNH XÁC NH CM T
C TRNG NG NGHA TRONG
TING VIT (ViKEa)

PHNG PHÁP SO TRÙNG MU DA TRÊN
ONTOLOGY
Phn còn li ca chng c t chc thành ba phn: Phn 4.2 trình bày công
on rút trích cm danh t d tuyn b ng phng pháp so trùng mu da trên tp
mu nhn dng các cm danh t c s; Phn 4.3 mô t công on xác nh cm
danh t c trng ng ngha (CDTTNN); Phn cui cùng là kt chng.
4.2 Rút trích cm danh t d tuyn
Trong phn này, lun án trình bày hng gii quyt cho công on rút trích
cm danh t c s. Các phng pháp tip cn c!ng nh các thc nghim ánh giá
ã c trình bày trong công trình (Chau Q. Nguyen và Tuoi T. Phan, 2007), và
(Nguy"n Quang Châu và Phan Th Ti, 2008).

Hình 4.1 Mô hình rút trích cm danh t c trng theo hng xác nh.

Ti#n x$ lý
Câu ting Vit
Gán nhãn t loi
Phân on t
Các cm danh t c trng
ng ngha

- Ph t ch toàn th (t1): nh tt c, ht thy, toàn b, toàn th,…
- Ph t ch s lng (t2): nh mi, các, tng, nhng, mi; hai, ba, bn,
nm, …
b. Phn ph sau:
- Tính t (s1)
- Ch nh t (s2)
c. Phn trung tâm:
B phn ghép g&m hai t:
- n v tính toán, chng loi khái quát (T1)
- i tng em ra tính toán, i tng c th (T2)
Ví d: + em hc sinh (này)
+ em (này)
+ hc sinh (này)
Mô hình rút trích cm t c trng ng ngha trong ting Vit 57
Da trên các cu trúc ca cm danh t, xây dng tp mu phc v cho vic
xác nh cm danh t nh sau:

1. t
1
t
2
T
1
T
2
s
1

1
s
1
s
2

5. t
1
T
1
s
1
s
2

6. t
2
T
1
s
1
s
2

7. t
1
t
2
T
2

2
s
1

11. t
1
T
1
T
2
s
1

12. t
2
T
1
T
2
s
1

13. t
1
t
2
T
1
s
1


18. t
2
T
2
s
1

19. t
1
t
2
T
1
T
2
s
2

20. t
1
T
1
T
2
s
2

21. t
2

25. t
1
t
2
T
2
s
2

26. t
1
T
2
s
2

27. t
2
T
2
s
2Các nhãn trong b nhãn 48 t loi ca t c mô t  bng 4.1.
Bng 4.1: B nhãn t loi ca t.
Nhãn
t loi
Loi t
Nhãn

Nl
danh t v trí
Vitm
ng t ni ng chuyn ng
Vt
ng t ngoi ng
Aa
tính t hàm cht
Vit
ng t ni ng
An
tính t hàm lng
Vim
ng t cm ngh
Pp
i t xng hô
Vo
ng t ch hng
Pd
i t không gian, thi gian
Vs
ng t tn ti
Pn
i t s lng
Vb
ng t bin hoá
Pa
i t hot ng, tính cht
Vv
ng t ý chí

Vtb
ng t ngoi ng bin hoá
E
cm t
Vto
ng t ngoi ng ch hng
I
tr t
Mô hình rút trích cm t c trng ng ngha trong ting Vit 58

Ta có các tr'ng hp tng ng:
a. Phn ph trc:

Ph t ch toàn th (t1): Ng hoc Nt

Ph t ch s lng (t2): Nu hoc Nn
b. Phn ph sau:

Tính t (s1): Aa hoc An

Ch nh t (s2): Nl hoc Pd
c. Phn trung tâm: B phn ghép g&m hai t

n v tính toán, chng loi khái quát (T1): Nu hoc Nn, Ng hoc Nt

i tng em ra tính toán, i tng c th (T2): Np hoc Nc hoc
Na

(<Np>|<Nc>|<Na>)
(<Aa>|<An>)
(<Nl>|<Pd>))
- Lut 5:
<KNP> -> ((<Ng>|<Nt>|<Pp>) *
(<Nu> |<Nn>)*
(<Nu>|<Nn>|<Ng>|<Nt>)
(<Np>|<Nc>|<Na>)
(<Aa>|<An>))
- Lut 6:
<KNP> → ((<Ng>|<Nt>|<Pp>)*
(<Nu> |<Nn>)*
(<Nu>|<Nn>|<Ng>|<Nt>)
(<Np>|<Nc>|<Na>)
(<Nl>|<Pd>))
Trong ó: | - hoc
* - 0 hoc nhi#u.
4.2.2.

Bài toán rút trích cm danh t bng phng pháp so trùng mu
V# phng pháp, mô hình rút trích cm danh t b ng phng pháp so trùng
mu, da vào tp mu cu trúc các cm danh t và các t có gán nhãn t loi
nhn c t công on trc,  nhn din các cm danh t trong câu n ting
Vit ang xét.
Ý tng ca phng pháp là da vào cu trúc vn phm ting Vit  xây
dng mt tp các mu, c x$ lý bi máy trng thái hu hn. Kt qu, lun án
ã xây dng c 434 mu nhn din các cm danh t bao g&m c các mu nhn
Mô hình rút trích cm t c trng ng ngha trong ting Vit
5. while (not over) do
6. for m+i Fi active instance ca FSM do
7. if instance này  mt trng thái kt thúc then ct mt bn sao
ca nó vào tp accepting FSMs (instances ca FSM mà chúng t
trng thái kt thúc);
8. c tt c các annotations b,t u t nút hin hành;
9. Chn tt c các tp annotation mà c dùng trong bc trc
ca & th chuyn trng thái FSM;
10. for m+i tp nh vy to mt new instance ca FSM, t nó vào
danh sách active list và loi b- tp annotation này;
Mô hình rút trích cm t c trng ng ngha trong ting Vit 61
11. loi b- Fi;
12. end for;
13. if tp active instances ca FSM là r+ng then over = true;
14. end while;
15. if tp accepting FSMs là r+ng then
16. T tt c accepting FSMs chn
*
là mu có chi#u dài cc i; nu có
nhi#u mu có cùng chi#u dài thì lúc ó gii pháp là chn mu so
trùng u tiên;
17. Thc hin a v# trng thái kt thúc cho FSM instance ã c
chn;
18. StartNode =selectedFSMInstance.getLastNode.getNextNode();
20. else //s so trùng tht bi b,t u li t nút k tip // StartNode =
StartNode.getNextNode();
21. end while;


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status