Luận văn thạc sĩ nghiên cứu, xây dựng hệ thống lập kế hoạch du lịch dựa trên hệ gợi ý - Pdf 41

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ QUỐC PHÒNG

HỌC VIỆN KỸ THUẬT QUÂN SỰ

NGUYỄN ĐÌNH GIỚI

NGHIÊN CỨU, XÂY DỰNG HỆ THỐNG LẬP KẾ HOẠCH DU LỊCH
DỰA TRÊN HỆ GỢI Ý

LUẬN VĂN THẠC SĨ
Chuyên ngành: Khoa học máy tính

Hà Nội - Năm 2016


BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ QUỐC PHÒNG

HỌC VIỆN KỸ THUẬT QUÂN SỰ

NGUYỄN ĐÌNH GIỚI

NGHIÊN CỨU, XÂY DỰNG HỆ THỐNG LẬP KẾ HOẠCH DU LỊCH
DỰA TRÊN HỆ GỢI Ý
Chuyên ngành: Khoa học máy tính
Mã số: 60480101

CÁN BỘ HƯỚNG DẪN KHOA HỌC

.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
.............................................................................................................................
Ngày ..... tháng .... năm 2016
Cán bộ hướng dẫn

Tác giả luận văn


Nguyễn Thị Hiền

Nguyễn Đình Giới

CHỦ TỊCH HOẶC THƯ KÝ HỘI ĐỒNG


Tôi xin cam đoan:
Những kết quả nghiên cứu được trình bày trong luận văn là hoàn toàn
trung thực, của tôi, không vi phạm bất cứ điều gì trong luật sở hữu trí tuệ và
pháp luật Việt Nam. Nếu sai, tôi hoàn toàn chịu trách nhiệm trước pháp luật.
TÁC GIẢ LUẬN VĂN

Nguyễn Đình Giới


MỤC LỤC
Trang
Trang phụ bìa:.....................................................................................................
Bản xác nhận chỉnh sửa luận văn:.......................................................................

DANH MỤC BẢNG BIỂU
Bảng 1. Bảng dữ liệu Khách sạn
Bảng 2. Bảng dữ liệu thắng cảnh
Bảng 3. Bảng dữ liệu đặc điểm, loại hình du lịch
Bảng 4. Bảng dữ liệu các thành phố
Bảng 5. Bảng dữ liệu các điểm đến
Bảng 6. Bảng dữ liệu sự kiện, lễ hội
Bảng 7. Bảng dữ liệu cơ sở vật chất
Bảng 8. Bảng dữ liệu giá phòng các khách sạn
Bảng 9. Bảng dữ liệu các loại sản phẩm
Bảng 10. Bảng dữ liệu các khu vực
Bảng 11. Bảng dữ liệu các loại phòng
Bảng 12. Bảng dữ liệu các dịch vụ của khách sạn
Bảng 13. Bảng dữ liệu case base
Bảng 14. Bảng dữ liệu điểm số các thành phần của case
Bảng 15. Lớp SimilityObject
Bảng 16. Lớp BaseConstraint
Bảng 17. Lớp Location
Bảng 18. Lớp Accommodation
Bảng 19. Lớp TravelInformation
Bảng 20. Lớp Case
Bảng 21. Lớp CBRConfig
Bảng 22. Lớp DBAdapter
Bảng 23. Lớp CBR


DANH MỤC HÌNH VẼ
Hình 1.1. Minh họa về Collaborative filtering
Hình 1.2. Qui trình giải thuật CBR
Hình 2.1. Mô hình logic CBR

2. Mục tiêu của đề tài
- Tìm hiểu kỹ thuật kỹ thuật xây dựng hệ gợi ý
- Xây dựng cổng thông tin du lịch
- Tích hợp kỹ thuật gợi ý vào cổng thông tin du lịch
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Giải thuật CBR
- Phạm vi nghiên cứu:
4. Nội dung nghiên cứu


13

Chương 1. HỆ THỐNG GỢI Ý VÀ GIẢI THUẬT CBR
1.1. Giới thiệu hệ thống gợi ý
1.2. Giải thuật CBR
CHƯƠNG 2: BÀI TOÁN GỢI Ý TOUR DU LỊCH
2.1. Mô hình lô-gic và các hàm chức năng
2.2. Biểu diễn thành phần tour
Chương 3. PHÂN TÍCH THIẾT KẾ HỆ THỐNG CỔNG THÔNG TIN DU LỊCH
3.1. Thiết kế cơ sở dữ liệu
3.2. Thiết kế chương trình
Chương 4. XÂY DỰNG HỆ THỐNG
4.1. Xây dựng hệ thống
4.2. Kết quả thực hiện
KẾT LUẬN VÀ HƯỚNG MỞ RỘNG


14

Chương 1. HỆ THỐNG GỢI Ý VÀ GIẢI THUẬT CBR


Hình 1.1. Minh họa về lọc cộng tác (Collaborative filtering) [3]


16

Việc xây dựng một mô hình mẫu từ hồ sơ của người dùng thường được
thực hiện giữa hai phương pháp thu thập dữ liệu tường mình và không tường
minh.
Một vài ví dụ về việc thu thập dữ liệu tường minh:
- Yêu cầu người dùng bầu chọn một item theo một thang điểm nào đó
- Yêu cầu người dùng xếp hạng một hoặc một nhóm các item mà người
đó yêu thích nhất
- Đưa ra cho người sử dụng hai item, yêu cầu họ chọn một item tốt hơn
- Yêu cầu người dụng tạo ra danh mục sản phẩm yêu thích của riêng họ
Một vài ví dụ về việc thu thập dữ liệu không tường minh:
- Theo dõi những item mà người dùng đã xem
- Phân tích thời gian mà người dùng xem một item
- Lưu giữ thông tin về những sản phẩm mà người dùng đã mua trực
tuyến
- Thu thập danh sách những item mà người dùng đã xem trên máy tính
của họ
- Phân tích người dùng trên mạng xã hội để biết họ thích, không thích
điều gì
Nhược điểm:
- Phụ thuộc nhiều vào lượng lớn thông tin từ phía người dùng, khó khăn
với một hệ thống mới, gặp khó khăn với những item mới
1.1.2.2. Lọc dựa trên nội dung (Content-based filtering)
Lọc dựa trên nội dung (Content-based filtering) [1] là phương pháp dựa
trên những đặc điểm của chính item. Nói cách khác, thuật toán cho phương

phương pháp luận hoạt động dựa trên sự tái sử dụng những kinh nghiệm,
được mô hình hóa như một tình huống (case). Bên cạnh đó, CBR có thể được


18

hiểu như một mô hình bậc cao mô hình hóa quá trình nhận thức, hay một
dạng thức tính toán để giải quyết một bài toán phát sinh. Giải thuật CBR áp
dụng trong hệ tư vấn được tập trung chủ yếu theo cách hiểu thứ hai. Trong đó,
như Amoodt và Plaza [3] đã khẳng định, CBR được coi như một qui trình tìm
lời giải cho một vấn đề, qui trình này sử dụng một nguồn tri thức cụ thể được
thu thập qua những tình huống cố định đã phát sinh. Điều này đối nghịch với
những phương pháp luận truyền thống chỉ dựa trên những nguồn tri thức phổ
quát thuộc về một miền vấn đề nhất định. Những tri thức này được thể hiện
bằng cách sử dụng một trong những ngôn ngữ biểu diễn tri thức như những
qui tắc, dạng logic (first-order logic), hay các mạng ngữ nghĩa (semantic
networks),..
1.2.2. Giải thuật CBR
Để có thể áp dụng qui trình giải lập luận tình huống CBR, vấn đề căn
bản đầu tiên liên quan đến việc sử dụng ngôn ngữ mô tả tình huống (case
representation language) và phạm vi sử dụng của những khái niệm trong mô
tả tình huống. Những khái niệm xuất hiện trong một ứng dụng CBR bao gồm
nội dung tình huống, cấu trúc thích hợp mô tả một tình huống, cách thức sắp
xếp các tri thức về tình huống đã diễn ra. Trong đó, nội dung tình huống phụ
thuộc vào lĩnh vực mà tình huống đó diễn ra. Một tình huống có thể được biểu
diễn bằng cách sử dụng véc-tơ đặc điểm tuyến tính (linear featured vector),
văn bản bán cấu trúc (semi-structured text), hay các đối tượng có cấu trúc
phức tạp như đồ thị (graph), mẫu đối tượng (object pattern) trong ngôn ngữ
hướng đối tượng.
Trong phương pháp sử dụng véc-tơ đặc điểm tuyến tính, một tình huống

huống phát sinh, mô tả này biểu thị khả năng tái sử dụng dữ liệu của những
tình huống đã xảy ra để giải quyết vấn đề mới. Nếu coi quá trình tìm lời giải
cho một tình huống vấn đề mới như một hàm ước đoán thì phần mô tả dữ liệu


20

được xem như miền xác định của hàm, trong khi giải pháp và kết quả xác
định các miền giới hạn tương đồng (codomain). Giải pháp biểu thị lượng
thông tin cần thiết để giải quyết vấn đề, ví dụ như xây dựng một kế hoạch hợp
lý để có thể đưa du khách đến địa điểm đúng thời điểm. Cuối cùng, kết quả
được coi như một đánh giá tổng kết mức độ hữu ích của giải pháp được áp
dụng giải quyết vấn đề phát sinh. Trong trường hợp giải thuật CBR của hệ tư
vấn du lịch được trình bày trong chương này, tình huống tour sẽ được mô tả
với những thành phần phức tạp, đồng nghĩa với không có sự khác biệt rõ ràng
giữa những thành phần mô tả vấn đề với những thành phần biểu thị giải pháp.
Trong quá trình xử lý, giải pháp giải quyết vấn đề tìm kiếm, gợi ý điểm đến
(destination) có thể được dùng như mô tả của vấn đề gợi ý địa điểm thắng
cảnh (attraction) du khách nên đến.
Về cơ bản, qui trình giải quyết vấn đề theo phương pháp lập luận tình
huống CBR có thể được diễn tả bởi hình 1.2:

Input

New problem

Learned Case

5. Retain


đồng cao nhất và được lưu vào CSDL tình huống.
Trong đó:
Bước 1. Tiếp nhận vấn đề: Trong bước đầu tiên của qui trình, mô tả về
vấn đề mới được tiếp nhận. Bằng cách sử dụng những phương pháp tính
khoảng cách (distance metric) với miền xác định là dữ liệu mô tả vấn đề đầu
vào, những tình huống tương đồng với tình huống đại diện cho vấn đề phát
sinh được lọc ra từ cơ sở dữ liệu chứa những tình huống đã được giải. Các kỹ
thuật phân vùng (case partition), phân cụm (case cluster) tình huống có thể
được dùng để đẩy nhanh tốc độ phân lọc dữ liệu tình huống.
Bước 2. Tái sử dụng giải pháp: Những tình huống tương đồng được tiếp
nhận sau quá trình tính toán mức độ tương đồng ở bước đầu tiên sẽ được dùng
để xây dựng giải pháp cho tình huống mới. Việc xây dựng giải pháp có thể
chỉ đơn giản là trích chọn những giải pháp từ những tình huống tương đồng
áp dụng để giải quyết tình huống mới, cũng có thể phức tạp khi những giải
pháp từ những tình huống tương đồng được trích chọn và tích hợp với nhau
thành một giải pháp mới chung nhất cho vấn đề mới.
Bước 3. Sửa đổi giải pháp: Giải pháp mới sau khi được xây dựng sẽ
được xem xét sửa đổi để đáp ứng đúng những yêu cầu cụ thể của tình huống
hiện tại. Ví dụ trong điều trị y học, bác sĩ có thể tái sử dụng một pháp đồ điều
trị cho cùng một bệnh nhưng cần cân nhắc sự khác nhau về đặc điểm (tuổi tác,
cân nặng) giữa các bệnh nhân.
Bước 4. Xét duyệt giải pháp: Giải pháp sau khi được sửa đổi hoàn chỉnh
sẽ được xét duyệt, đánh giá khi áp dụng vào giải quyết tình huống hiện tại.


22

Trong trường hợp giải pháp thất bại trong giải quyết vấn đề, tình huống sẽ
được đưa về trạng thái trước đó trong bước 2, 3. Các bước 2, 3, 4 trong lập
luận CBR có thể được coi như các giai đoạn tìm kiếm giải pháp thích ứng với


Hình 2.1. Mô hình logic CBR [2]
Hình 2.1 là lược đồ biểu diễn mối quan hệ giữa các lớp đối tượng được
sử dụng trong giải thuật CBR của hệ tư vấn. Các thành phần gồm có: case,
base constraint, location, attraction, accommodation, item, user profile,
reward, travel wish, travel bag, travel information


Case: Được hiểu như một tình huống biểu thị một phiên (session) hoàn chỉnh
tương tác giữa người dùng và hệ thống. Tình huống (phiên) này được khởi tạo
và kết thúc bởi người dùng. Trong biểu đồ 2, một tình huống (case) được hợp
thành bởi các thành phần travel information (bao gồm travel wish và travel
bag), user profile và reward. Những thành phần này sẽ lần lượt được trình bày
chi tiết dưới đây.



UserProfile: Là lớp chứa những thông tin về người dùng. Thông tin này bao
gồm tên, tuổi, giới tính và được dùng trong tính toán độ tương đồng giữa hai
người dùng. Đối với người dùng không đăng ký, thông tin được lưu trữ dưới
dạng dữ liệu null.


25



TravelInformation: Là lớp chứa thông tin về giới hạn yêu cầu (base
constraint) từ người dùng, đồng thời bao gồm những thành phần cơ bản của
một tour như điểm đến (location), thắng cảnh (attraction) và chỗ ở


Item: Là sản phẩm của hệ tư vấn. Không gian sản phẩm (item space) có thể
bao gồm toàn bộ một tình huống case hay từng thành phần trong một tour như
điểm đến, thắng cảnh hay chỗ ở.



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status