Giải quyết một số vấn đề nền tảng trong xử lý ngôn ngữ tiếng Việt với các mô hình học máy thống kê hiện đại - pdf 27

Link tải miễn phí Luận văn:Giải quyết một số vấn đề nền tảng trong xử lý ngôn ngữ tiếng Việt với các mô hình học máy thống kê hiện đại : Đề tài NCKH QC.06.07
Nhà xuất bản:ĐHCN
Ngày:2006
Chủ đề:Công nghệ thông tin
Mô hình máy
Thống kê
Tiếng Việt
Xử lý ngôn ngữ
Miêu tả:21 tr.
Tổng quan các vấn đề nghiên cứu về ngôn ngữ trong tiếng Việt và các phương pháp học máy, đồng thời nghiên cứu ứng dụng các phương pháp đó trong việc xử lý các bài toán ngôn ngữ cơ bản một cách tự động bằng máy tính. Tập trung nghiên cứu về cấu trúc âm tiết, các loại từ tiếng Việt, cấu trúc cụm danh từ và tên riêng trong tiếng Việt. Tìm hiểu về các phương pháp học máy thống kê, trong đó tập trung vào hai mô hình mới và mạnh trong việc phân lớp và phân đoạn văn bản là Conditional Random Fields (CRFs) và Support Vector Machines(SVMs) để giải quyết các bài toán xử lý tiếng Việt ở mức cao. Thu thập và xây dựng một bộ dữ liệu trung bình (khoảng 8000 câu) cho bài toán tách câu, tách từ tiếng Việt và một phần bài toán nhận thực thể định danh trong tiếng Việt. Giới thiệu chi tiết về các thực nghiệm và phương pháp tách từ tiếng Việt với CRFs và SVMs. Xây dựng công cụ tách từ tiếng Việt trong Java dựa trên CRFs
Thư mục CSDL công trình NCKH Đại Học Quốc GiaHN 2006 - 2010
02 báo cáo khoa học và 1 báo cáo tổng hợp đề tài
02 khóa luận tốt nghiệp của sinh viên được hoàn thành
Một phần của kho ngữ liệu cho tách câu, tách từ và nhận dạng thực thể cho tiếng Việt. Một module phần mềm cho việc tách từ tiếng Việt
Trường Đại học Công nghệ

Ngôn ngữ:vie
Kiểu:Text
Định dạng:Text/pdf
Bảo hiểm:Thư viện nhà C1T - 144 Xuân Thủy – Cầu Giấy – Hà Nội
Quyền:Access limited to members
Link tải Free download cho anh em kết nối:
Tài liệu đang trong kho của Ket-noi, ai cần thì trả lời để mods up lên cho

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status