Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt 07 - Pdf 78

Mô hình rút trích cm t c trng ng ngha trong ting Vit 102

Chng 6

MÔ HÌNH RÚT TRÍCH CM T
C TRNG NG NGHA TRONG
TING VIT (ViKE)
KT HP HNG TIP CN RÚT TRÍCH VÀ
HNG TIP CN XÁC NH


trích CDTTNN trong ting Vit, cng nh mô hình kin trúc ba lp ca h
thng; Phn 6.4 phân tích và ánh giá hiu sut rút trích CDTTNN ca h thng
ViKE; Phn cui cùng là kt chng.
6.2 Mô hình rút trích CDTTNN trong ting Vit

Mô hình tng quát ViKE là s kt hp hai mô hình ViKEa và ViKEe c
trình bày  Hình 6.1. Trong mô hình tng quát rút trích cm danh t c trng ng ngha trong
ting Vit, quy trình c thc hin ln lt qua các công on sau:
Hình 6.1 Mô hình tng quát rút trích cm danh t c trng ng ngha
ViKE.

Tin x lý

tr"ng hp các câu mà không cha các t, hay cm t quan h gia các
cm danh t d tuyn, nhng các cm danh t d tuyn có khái nim
trong ViO).
o Bc 3: Nu các cm danh t d tuyn cha t!n ti trong c s tri thc
hay các cm danh t d tuyn không có khái nim trong ViO , thì vic
xác nh cm danh t d tuyn nào là CDTTNN s# da vào phng
pháp hc máy thông qua mô hình ViKEe (ng vi tr"ng hp các câu
mà không cha các t, hay cm t quan h gia các cm danh t d
tuyn và các cm danh t d tuyn không có khái nim trong ViO).
V ý tng, gii thut xác nh các cm danh t c trng ng ngha trong mô
hình ViKE c trình bày tng quát nh sau:
GII THUT 6.1 Xác nh cm danh t c trng ng ngha trong ViKE
- Nhp: Tp các câu {S
1
, ..., S
K
},ViO
- Xut: Cm danh t c trng ng ngha (CDTTNN) cho m$i câu
- Phng pháp:
1. for i = 1 to K do Word_Segmentation(S
i
); /* phân on t */
2. for i = 1 to K do POS_Tagger(S
i
); /* gán nhãn t loi cho m$i t */
Mô hình rút trích cm t c trng ng ngha trong ting Vit 105
3. for i = 1 to K do Candidate_Identification(S

cm danh t d tuyn, và cng không cha các cm danh t d tuyn có
khái nim trong ViO.
Các khi này c thit k trong môi tr"ng Java thành bn công c %c lp
Mô hình rút trích cm t c trng ng ngha trong ting Vit 106
là vnWordSegmentation, vnPOSTagger, ViKEa, ViKEe mà chúng d& dàng tích
hp vào các h thng khác.

ViDic
Tp lut
quan h
Kho ng liu
hun luyn 2
Kho ng liu
hun luyn 1
Tp lut kt
hp
Tp lut cu
trúc cm
danh t
Các
CDTTNN


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status