Mô hình rút trích cm t c trng ng ngha trong ting Vit 1
LI CAM OAN
Tôi cam oan rng ni dung ca lun án này là kt qu nghiên cu ca
bn thân. Tt c nhng tham kho t các nghiên cu liên quan iu c nêu
rõ ngun gc mt cách rõ ràng t danh mc tài liu tham kho c cp
phn sau ca lun án. Nhng óng góp trong lun án là kt qu nghiên cu
ca tác gi ã c công b trong các bài báo ca tác gi phn sau ca lun
án và cha c công b trong bt k công trình khoa hc nào khác. Tác gi lun án
Minh, &c bit khoa CNTT, ã h% tr và to mi iu kin thun li cho
tôi trong quá trình hoàn thành khóa hc NCS.
Cui cùng, tôi cm n tt c bn bè và ngi thân ã góp nhiu ý
kin thit thc và có nhng li ng viên khích l quý báu giúp tôi hoàn
thành tt lun án.
Tác gi lun án
Nguyn Quang Châu
Mô hình rút trích cm t c trng ng ngha trong ting Vit 3
TÓM TT World Wide Web (WWW) phát trin nhanh chóng cùng vi ngun tài
nguyên thông tin ngày càng phong phú, nhu cu khai thác ngun thông tin
này ca ngi s' dng ngày càng tr nên cp thit i vi i sng ca con
ngi. Vic khai thác này c thc hin thông qua các phng thc nh
truy hi thông tin (Information Retrieval), tóm lc vn bn (Text
Summarization), và rút trích thông tin (Information Extraction), ...
nghim trên tp câu c chn lc t các ngun ng liu TREC07,
TREC06, TREC02 ( và www.lexxe.com (Qiao,
2010). Tp câu ting Anh c Hi Nghiên Cu D ch Thut Tp. H Chí
Minh d ch sang tp câu ting Vit tng ng và c bn chuyên gia ngôn
ng nhn din cm danh t &c trng ng ngh(a bng phng pháp th
công. Kt qu mô hình ViKE t chính xác, bao ph và trung bình
iu hòa ln lt là 89,52% , 87,63% và 88,57%. Nh vy vi chính
xác, y và trung bình iu hòa ca mô hình ViKE ã ci thin
hiu sut ca hai mô hình thành phn (mô hình theo hng tip cn rút trích
và mô hình theo hng tip cn xác nh CDT$TNN) và áp ng c
mc tiêu ra ca lun án.
2.1 Gii thiu .................................................................................................19
2.2 C s lý thuyt .........................................................................................20
2.3 Kt chng...............................................................................................29
Chng 3. TNG QUAN CÁC MÔ HÌNH RÚT TRÍCH CM T C
TRNG..............................................................................................................31
3.1 Gii thiu .................................................................................................31
3.2 Các nghiên cu liên quan..........................................................................32
3.3 S tng quan gia hng tip cn rút trích và xác nh CT$T ...............37
3.4 Phng pháp tip cn ca lun án.............................................................38
3.5 Kt chng...............................................................................................52
Chng 4. MÔ HÌNH XÁC NH CM T C TRNG NG NGHA
TRONG TING VIT (ViKEa) -PHNG PHÁP SO TRÙNG MU DA
TRÊN ONTOLOGY..........................................................................................54
4.1 Gii thiu ................................................................................................54
4.2 Rút trích cm danh t d tuyn
……………………...………………………...............
55
4.3 Công on xác nh cm danh t &c trng ng ngh(a da trên
ontology
………………………………………………………………………………………………………..
62
4.4
Kt chng
………………………………………………………………..………………………….
73
Chng 5. MÔ HÌNH RÚT TRÍCH CM T C TRNG NG NGHA
TRONG TING VIT (ViKEe) – PHNG PHÁP HC MÁY...................75
5.1 Gii thiu .................................................................................................75
5.2 Phng pháp Support Vector Machines....................................................77