Nghiên cứu phát triển công nghệ nhận dạng, tổng hợp và xử lý ngôn ngữ tiếng Việt - pdf 16

Download miễn phí Đề tài Nghiên cứu phát triển công nghệ nhận dạng, tổng hợp và xử lý ngôn ngữ tiếng Việt



MỤC LỤC
1. Lời mở đầu . 7
2. Nội dung chính của báo cáo. 7
2.1 Tổng quan tình hình nghiên cứu trong và ngoài nước . 7
2.2 Những nội dung đã thực hiện .10
2.2.1 Kết quảnghiên cứu vềTổng hợp và Nhận dạng tiếng Việt .10
2.2.1.1 Các kết quảnghiên cứu .10
Khảo sát vềngữâm tiếng Việt.10
Tổng hợp tiếng Việt .11
Nhận dạng tiếng Việt .12
2.2.1.2 Sản phẩm phần mềm .17
Hệthống Tổng hợp tiếng nói VnVoice 2.0 .17
Chương trình nhận dạng lệnh VnCommand.18
Chương trình đọc chính tảVnDictator .18
Chương trình xây dựng công nghệcoding
ngữnghĩa của âm thanh .19
2.2.1.3 Vềtriển khai ứng dụng .20
Ứng dụng của tổng hợp tiếng nói .20
2.2.2 Nghiên cứu phát triển kỹthuật nhận dạng chữin và
viết tay tiếng Việt.20
Nhận dạng chữViệt in VnDOCR 3.0 .22
Nhận dạng chữviết tay có hạn chế.22
2.2.3 Nghiên cứu phát triển các kỹthuật xửlý ngôn ngữ
tựnhiên tiếng Việt .24
2.2.3.1 Dịch tự độngViệt – Anh .24
2.2.3.2 Dóng hàng văn bản song ngữPháp-Việt.26
2.2.3.2 Mô hình từ điển điện tử.28
2.3 Tổng quát hoá và đánh giá kết quảthu được.28
2.4 Kết luận và kiến nghị.29
2.5 Tài liệu tham khảo .31



Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

arkov Models and Level Building”, IEEE Transaction on Acoustic,
Speech and Signal Processing, Vol ASSP-33, N. 3, June 1985, pp 561-573.
4. M. Ibnkahla, “Application of neural networks to digital communications - a
survey”, Signal Procesing 80(2000), pp.1185-1215.
5. Lawrence Rabiner, “Fundamental of speech recognition”, 1995.
6. A.Samouelian - “Knowledge based approach to consonant recognition”,
Department of electrical and Computer Engineering, University of
Wollongong, Northfields Avennue, Wollongong, NSW 2522, Australia.
7. Tan Lee and P.C. Ching- “A Neural Network Based Speech Recognition
System for Isolated Cantonese Syllables”, Department of electronic
Engineering, The Chinese University of Hong Kong, N.T., Hong Kong,
ICASSP - 1997, pp.3269-3272.
8. TungHui Chiang, CCLMDS’96 “Towards a Speaker-Independent Large-
Vocabulary Mandarin Dictation System”, ICASSP 1997, pp 1799-1802.
9. Vũ Kim Bảng, “Khái niệm ngữ âm học”, Tạp chí ngôn ngữ số 5 – 1999.
50
10. Vũ Kim Bảng, “Hệ Phooc mang của 9 nguyên âm đơn tiếng Hà Nội”- Tạp
chí ngôn ngữ số 15-2002.
B. Nhận dạng chữ Việt in
11. René Sennhauser, Improving the recognition accuracy of text recognition
systems using typographical constraints, Elẻctonec PublishingUBLISHING,
VOL 6(3), 273-282, September 1993.
12. [Fletcher et al.] L.A. Fletcher, R.Kasturi. A robust algorithm for text string
separation from mixed text/graphics images. In IEEE Trans.Pattern. Ana.
Machine Intell. 10, Vol.6, 1998, 910-918.
13. Luong Chi Mai, Nguyen Duc Dzung, Ngo Quoc Tao. A new method of
OCR based on a structure of character. Proceeding of AMPST 96, Bradford,
UK, 1996.
14. Giovanni Seni, V Kripasundar and Rohini K. Srihari, Generalizing edit
distance to incorporate domain information: Hand written text recognition
as a case study
C. Nhận dạng phiếu điều tra và chữ viết tay có hạn chế
15. Ng« Quèc T¹o, §ç N¨ng Toµn, NguyÔn ThÞ Thanh T©n, "PhiÕu ®iÒu tra
vµ hÖ thèng nhËp phiÕu ®iÒu tra tù ®éng", Mét sè vÊn ®Ò chän läc cña
c«ng nghÖ th«ng tin, NXB KHKT Hµ Néi 2002.
16. L-¬ng Chi Mai, §ç N¨ng Toµn, Ng« Thµnh Trung, VÒ mét ph-¬ng ph¸p x¸c
®Þnh ng-ìng tù ®éng trong ph©n tÝch trang v¨n b¶n, Kû yÕu héi th¶o
Quèc gia lÇn thø 5, "Mét sè vÊn ®Ò chän läc cña c«ng nghÖ th«ng tin",
NXBKHKT, Hµ Néi 2003.
17. Ngô Quốc Tạo, Phạm Văn Hùng, “Nhận dạng chữ viết tay hạn chế sử dụng
các đặc trưng về cấu trúc chữ”, Kỷ yếu hội thảo Quốc gia lần thứ 5 "Một số
vấn đề chọn lọc của Công nghệ thông tin", NXBKHKT, Hà Nội 2003.
18. Ngô Quốc Tạo, Phạm Văn Hùng, "Một số phương pháp Nhận dạng chữ viết
tay hận chế", Kỷ yếu Héi th¶o khoa häc quèc gia lÇn thø nhÊt Nghiªn
cøu ph¸t triÓn vµ øng dông C«ng nghÖ th«ng tin vµ TruyÒn th«ng, 2/2003.
19. Ng« Quèc T¹o, §ç N¨ng Toµn vµ céng sù, "ThiÕt kÕ vµ cµi ®Æt thö
nghiÖm hÖ nhËp phiÕu ®iÒu tra d¹ng dÊu MarkRead", Héi th¶o khoa häc
quèc gia lÇn thø nhÊt Nghiªn cøu ph¸t triÓn vµ øng dông C«ng nghÖ
th«ng tin vµ TruyÒn th«ng, 2/2003.
D. Dịch Việt – Anh
20. Noam Chomsky, On certain formal properties of grammars, Inform Control,
vol 2, p.137-167, 1959.
21. Christian Boitet (2002) A rationale for using UNL as an Interlingua and
more in various domains, Geta, Clips, Imag, 385, av. de la bibliothèque, BP
53, F-38041 Grenoble cedex 9, France, Christian.Boitet@ imag.fr, LREC-
51
02 First International Workshop on UNL, other Interlinguas and their
Applications, 1 June 2002
22. Bonnie Dorr and Nizar Habash (2002) Interlingua Approximation: A
Generation-Heavy Approach, University of Maryland, Institute for
Advanced Computer Studies, {bonnie,habash} @umiacs.umd.edu
(UNITRAN)
23. John Hutchins W. (2003) Machine translation: half a century of research
and use, UNED summer school at Ávila, Spain, July 2003],
homepages/
24. Stephen D. Richardson (2002) Achieving commercial-quality translation
with example-based methods, Stephen D. Richardson, William B. Dolan,
Arul Menezes, Jessie Pinkham, Microsoft Research, One Microsoft Way,
Redmond, WA 98052, {steveri, billdol, arulm, jessiep}@ microsoft. com
25. Arturo Trujillo (1999) Translation Engines: techniques for Machine
Translation. Springer-Verlag, Berlin, 1999.
26. Kevin Knight (1995) Integrating Knowledge Bases and Statistics in MT,
Kevin Knight, Ishwar Chander, Matthew Haines, Vasileios
Hatzivassiloglou, Eduard Hovy, Masayo Iida, Steve K. Luk, Akitoshi
Okumura, Richard Whitney, Kenji Yamada, USC Information Science
Institute, 4676 Admiralty Way, Marina del Rey, CA 90292
27. DeryleW. Lonsdale, Alexander M. Franz, and John R. R. Leavitt (1994)
Large-Scale Machine Translation: An Interlingua Approach, Center for
Machine Translation, Carnegie Mellon University, Pittsburgh, Pa., USA,
15213, Email: [email protected], [email protected], [email protected]. edu
(KANT)
28. Michele Banko and Eric Brill (2002) Scaling to Very Very Large Corpora
for Natural Language Disambiguation, Microsoft Research, 1 Microsoft
Way, Redmond, WA 98052 USA, {mbanko, brill}@ microsoft.com
29. Unification and Some New Grammatical Formalisms, Aravind K. Joshi,
Department of Computer and Information Science, University of
Pennsylvania (Nguồn : Internet)
30. ISHIZAKI Shun, UCHIDA Hiroshi, (1998) On Interlingua for Multilingual
Machine Translation, 1998, IPSJ SIGNotes Natural Language Abstract
No.070 – 003
31. Lê Khánh Hùng (2003) Văn phạm cảm ngữ đoạn, Báo cáo khoa học tại hội
thảo quốc gia lần thứ sáu “Một số vấn đề chọn lọc của CNTT và TT”, Thái
nguyên, 8-2003.
32. Lê Khánh Hùng, Trần Cảnh (2003) Về một số hạn chế của mô hình văn
phạm Chomsky, Tạp chí Bưu chính Viễn thông, Chuyên san, 10, 2003.
33. Lê Khánh Hùng (2003) Một Phương pháp Dịch máy Liên ngữ. Kỷ yếu Hội
thảo Khoa học Quốc gia lần thứ nhất về Nghiên cứu, Phát triển và Ứng
dụng CNTT&TT, Hà nội, 2003.
E. Dóng hàng các văn bản song ngữ Pháp - Việt / Việt – Pháp
52
34. Abney S., "Part-of-Speech Tagging and Partial Parsing", in Young S. and
Bloothooft (Eds), Corpus-Based Methods in Language and Speech
processing, Kluwer Academic Publishers, Dodreht (The Netherlands),
1997.
35. Brill E., "Transformation-Based Error-Driven Learning and Natural
Language Processing: A Case Study in Part of Speech Tagging",
Computational Linguistics, 21(4), December 199, p.543-565.
36. Cao Xuân Hạo, Tiếng Việt - mấy vấn đề ngữ âm, ngữ pháp, ngữ nghĩa,
NXB Giáo dục, 2000.
37. Dermatas E., Kokkinakis G., "Automatic Stochastic Tagging of Natural
Language Texts", Computational Linguistics 21.2, 1995, p. 137 - 163.
38. Diệp Quang Ban, Hoàng Văn Thung, Ngữ pháp tiếng Việt (2 tập), NXB
Giáo dục, 1999.
39. El-Bèze M, Spriet T., "Etiquetage probabiliste et contraintes syntaxiques",
Actes de la conférence sur le Traitement Automatique du Langage Naturel
(TALN95), Marseille, France,14-16/6/1995.
40. Hoàng Phê (chủ biên), Từ điển tiếng Việt 2002, Nhà xuất bản Đà Nẵng -
Trung Tâm Từ Điển Học.
41. Hữu Đạt, Trần Trí Dõi, Đào Thanh Lan, Cơ sở tiếng Việt, NXB Giáo dục,
1998.
42. Kuipec J., "Robust Part-of-Speech Tagging Using a Hidden Markov
Model", Computer Speech and Language, vol. 6, 1992, p. 225-242.
43. Levinger M., Ornan U., Itai A., "Learning morpho-lexical probabilities
from an untagged corpus with an application to Hebrew", Comutational
Linguistics, 21(3), 1995, p. 383-404.
44. MacMahon J.G., Smith F.J., "Improving statistical language model
performance with automatically generated word hierarchies",
Computational Linguistics, 19(2), 1993, p. 313-330.
45. Mason O., Tufis D., "Tagging Romanian Texts: a Case Study for QTAG, a
Language Independent Probabilistic Tagger", 1st International Conference
on Language Ressources and Evaluation (LREC98), Granada (Spain), 28-
30 May 1998, p. 589-596.
F. Mô hình từ điển điện tử
46. Cheng-Ming Guo. Machine Tractable Dictionaries, Design and
Construction, Ablex Publishing Corporation, Northwood, New Jersey 1995.
47. Donald E. Walker, Antonio Zampolli, Nicoletta Calzolari. Automation the
lexicon, Oxford University Press 1995.
48. Douglas B. Lenat, R.V. Guha. Building large knowledge-based systems:
representation and inference in the CYC project, Addison-Wesley Pub. Co...
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status