Mô hình rút trích cụm từ đặc trưng ngữ nghĩa trong tiếng việt 08 - Pdf 78

Mô hình rút trích cm t c trng ng ngha trong ting Vit 114 Chng 7 TNG KT


Vi mc tiêu ca  tài là nghiên cu và phát trin mô hình rút trích cm danh
t c trng ng ngha trong ting Vit, lun án ã t c các kt qu sau:
- Lun án ã kho sát các u im và hn ch trong các mô hình rút trích cm
t c trng. T ó, lun án ã  xut mt mô hình kt hp hng tip cn xác
nh và hng tip cn rút trích cm danh t c trng ng ngha trong ting Vit.
Mô hình này ã óng góp vào vic x lý ng ngha vn bn và các ng dng x lý
ngôn ng t nhiên.
- Nghiên cu và phát trin mô hình theo hng tip cn xác nh cm danh t
c trng ng ngha trong ting Vit.  khc phc vn  cn thit phi có kho
ng liu ting Vit có chú gii ln khi xác nh cm danh t c trng ng ngha,
lun án khai thác mt bách khoa toàn th trc tuyn vi ni dung m Wikipedia
 xây dng Ontology ting Vit ViO và t in ViDic. T ó lun án ã  xut
mô hình ViKEa. ây là mô hình s dng phng pháp so trùng m u da trên c
s tri thc và Ontology.
- Nghiên cu và phát trin mô hình theo hng tip cn rút trích cm danh t
c trng ng ngha trong ting Vit,  cp vn  xác nh các tính cht c
trng cho nhn din các CDTTNN trong câu n ting Vit, trong ó có các câu
truy vn, t ó  xut mô hình ViKEe. ây là mô hình s dng máy h!c vect
h" tr, c th là gii thut SMO  gii quyt bài toán thiu kho ng liu  ln
có chú gii trong quá trình hun luyn. Mô hình h!c máy có giám sát ViKEe da
theo bn tính cht c trng: (1) v trí t trong câu; (2) nhãn t loi; (3) cu trúc
cm t; (4) các t quan h gia các cm danh t ca các cm danh t d tuyn 
rút trích các CDTTNN.
- Phát trin mô hình kt hp gia hng tip cn xác nh và hng tip cn
rút trích cm danh t c trng ng ngha trong ting Vit da trên các mô hình
ã phát trin là hai mô hình ViKEa và ViKEe. T ó lun án  xut mô hình
ViKE. ây là mô hình kt hp hai mô hình ViKEa và ViKEe vi mc tiêu khai
thác ti a  chính xác ca vic rút trích CDTTNN ca tng mô hình.
Mô hình rút trích cm t c trng ng ngha trong ting Vit

hun luyn m u cho mô hình h!c máy cn c m rng cho tng lnh vc c th,
c(ng nh cp nht thêm các kho ng liu hun luyn nh#m nâng cao  chính xác
ca h thng.
Mô hình rút trích cm t c trng ng ngha trong ting Vit 117
- Mt hng phát trin khác c(ng rt quan tr!ng là vic áp dng các mô hình này
cho các ngôn ng khác, vì các mô hình c phát trin, kho sát, c(ng nh thc
nghim trong lun án này u trên ting Vit. Thông qua vic phát trin mô hình
cho các ngôn ng khác (nh ting Anh)  so sánh ánh giá phng pháp c 
xut trong lun án vi các phng pháp khác, c(ng nh ánh giá quá trình ti u
chi phí trong mô hình kt hp ViKE.
7.4 Kt lun
Lun án ã trình bày các hng tip cn  gii quyt bài toán rút trích các
cm danh t c trng ng ngha ca câu n ting Vit. T phân tích và ánh giá
tng hng tip cn, lun án ã  xut mt mô hình ViKE cho bài toán rút trích
CDTTNN trong các câu ting Vit. Mô hình ViKE là s kt hp ca hai mô
hình theo hng tip cn ngôn ng và h!c máy (mô hình ViKEa và ViKEe).
u tiên là mô hình ViKEa, theo hng tip cn ngôn ng da trên Ontology
ViO (c khai thác t Vi.Wiki) vi k) thut so trùng m u và các quan h ng
ngha gia các th loi trên Ontology, c(ng nh các khâu tin x lý phân on t
và gán nhãn t loi. Kt qu t c ca mô hình ViKEa khá cao trong tr&ng
hp các cm danh t ca các câu có các t quan h, hoc có các khái nim tng
ng trong ontology ViO. Ngc li, các CDTTNN c nhn dng sai u
thuc vào tr&ng hp khái nim cha t%n ti trong Ontology ViO. ây là mt hn
ch ca mô hình ViKEa và c(ng là ng c nghiên cu ca lun án cho mô hình
theo hng tip cn h!c máy  xây dng các  tng t ng ngha gia các
cm danh t. T vic ánh giá và so sánh kt qu thu c t mô hình ViKEa,
lun án rút ra c các tính cht c trng v ngôn ng ca CDTTNN. Các tính

hng gii quyt cho vn  thiu kho ng liu h" tr x lý ngôn ng ting Vit.

Mô hình rút trích cm t c trng ng ngha trong ting Vit 119
CÁC BÀI BÁO CA TÁC GI
LIÊN QUAN N LUN ÁN

Tp chí Khoa hc
[1] Chau Q. Nguyen, Tuoi T. Phan, 2009. Hng tip cn xác nh cm t c
trng ng ngha trong ting Vit da trên Wikipedia, Tp chí Công ngh
thông tin & truyn thông, ISSN 0866-7039, Tp V-1, s 2(22): 30-37.
[2] Nguy,n Quang Châu, Phan Th Ti, 2008. Nhn din cm t c trng ng
ngha trong Ting Vit, Tp chí Công ngh thông tin & truyn thông, ISSN
0866-17093, s 19: 64-73.
[3] Nguy,n Quang Châu, H%ng Thanh Lun, Phan Th Ti, 2008. Mt hng
tip cn h!c máy cho bài toán rút trích cm t c trng ng ngha trong ting

912590-4-0, Studia Informatica Universalis, pp.41-46.
[9] Chau Q. Nguyen, Tuoi T. Phan, 2006. A Hybrid Approach to Vietnamese
Part-Of-Speech Tagging, In Proceedings of The 9th International Oriental
COCOSDA 2006 Conference - O-COCOSDA’06, 12/2006, Malaysia, pp.157-
160.
[10] Chau Q. Nguyen, Thanh C. Nguyen, Tuoi T. Phan, 2006. Vietnamese Key
Phrase Extraction for Information Retrieval, In Proceedings of The 9th
International Oriental COCOSDA 2006 Conference - O-COCOSDA’06,
12/2006, Malaysia, pp.169-172.
[11] Chau Q. Nguyen, Tuoi T. Phan, Tru H. Cao, 2006. Vietnamese Proper Noun
Recognition, In Proceedings of The 4th International IEEE Conference on
Computer Sciences- RIVF’06, ISSN 1621-0065, IEEE Press, pp.144-151.
Hi ngh Khoa hc Quc gia
[12] Nguy,n Quang Châu, Phan Th Ti, Cao Hoàng Tr, 2005. Gán nhãn t
loi cho ting Vit da trên vn phong, trong k yu ca hi tho khoa hc
quc gia ln th II, Nghiên cu c bn và ng dng công ngh thông tin-
FAIR’05, 9-2005, pp.106-116.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status