NGHIÊN CỨU CÁC PHƯƠNG PHÁP
PHÂN LỚP DỮ LIỆU VÀ ỨNG DỤNG
PHÂN LỚP DỊCH VỤ WEB
Người hướng dẫn khoa học: PGS.TS Trần Đình Quế
Thực hiện: Phùng Thị Anh
Đề cương luận văn thạc sĩ kỹ thuật
Chuyên ngành: Khoa học máy tính
1
Lý do chọn đề tài
-
Số lượng của các dịch vụ web trên mạng tăng trưởng mạnh
mẽ , việc tìm kiếm trên khối lượng dữ liệu khổng lồ này ngày
càng trở nên phức tạp
-
Trước đây, việc phân loại thường được thực hiện thủ công
theo cách chỉ định cho một dịch vụ vào một thể loại nào đó đã
được phân loại (hay còn gọi là được gán nhãn) theo các quy
tắc đã được đặt ra. Cách này có nhiều bất cập khi khối lượng
dịch vụ trở nên khổng lồ, kéo theo các quy tắc phân loại cũng
gia tăng, có nhiều người tham gia duy trì hoặc chia sẻ dịch vụ
trong một kho dữ liệu chung.
-
=> việc cần thiết có một cơ chế tự động phân loại các dịch vụ
web trở nên quan trọng.
2
Mục đích nghiên cứu
•
Nghiên cứu các thuật toán phân lớp theo hướng khai phá văn
bản để phân loại các tài liệu WSDL (Web Service Description
Language) => phân tích mức độ phụ thuộc giữa các nội dung
của WSDL và các thể loại của dịch vụ Web:
Cơ sở lý thuyết về các thuật toán phân lớp dữ liệu điển hình.
- SVM
- Bayes
- Luật kết hợp
•
Cơ sở lý thuyết về dịch vụ Web (khái niệm, mô tả, cấu trúc,
…).
•
Các nội dung về sự cần thiết của việc khai phá dịch vụ Web.
5
Chương 2
•
Khảo sát các công trình đã đăng tải liên quan đến phân lớp
dịch vụ Web nêu những vấn đề còn tồn tại, chỉ ra những vấn
đề mà bài toán phân lớp dịch vụ Web cần quan tâm.
•
Diễn giải cơ sở lý thuyết, lý luận, giả thiết khoa học và
phương pháp nghiên cứu sử dụng;
•
Tổng hợp, thu thập, phân tích, đánh giá các số liệu trên cơ sở
lý thuyết, giả thiết khoa học để giải quyết bài toán phân lớp
dịch vụ Web.
•
Chi tiết:
- Phân lớp dịch vụ web dựa trên SVM
- Phân lớp dịch vụ web dựa trên Bayes
- Phân lớp dịch vụ web dựa trên Luật kết hợp
6
Chương 3
•