Nghiên cứu kỹ thuật phân tích ma trận trong các hệ thống khuyến nghị - pdf 25

Link tải luận văn miễn phí cho ae

Mở đầu
Cùng với nhu cầu tìm kiếm thông tin trên Internet ngày càng trở nên phổ biến với
một lượng lớn thông tin được đưa lên hằng ngày; một nhu cầu mới đặt ra là một thông
tin nên hay không nên được đọc, được chia sẻ cho một đối tượng người sử dụng khác trên
Internet? Thông tin nào sẽ có khả năng được đánh giá cao bởi một đối tượng người sử
dụng? Và làm thế nào để xác định được thông tin đó có khả năng được người dùng đánh
giá cao hay thấp?
Để giải quyết vấn đề này đã có rất nhiều nghiên cứu thực hiện trên các lĩnh vực khác
nhau, với những đối tượng thông tin khác nhau. Kết quả của các bài nghiên cứu đó nhằm
hỗ trợ đưa ra một Hệ thống khuyến nghị (Recommender Systems - RS) phù hợp nhất.
Hệ thống khuyến nghị có thể là một chương trình, một tập hợp các kỹ thuật nhằm đưa ra
các khuyến nghị về các đối tượng cho người dùng khi nó có khả năng được sử dụng nhiều
nhất. Quá trình đưa ra các khuyến nghị là một chuỗi các quá trình đưa ra các quyết định
cho nhiều loại đối tượng.
Trong những năm gần đây, hệ thống khuyến nghị đã hỗ trợ rất nhiều cho người dùng
lựa chọn các thông tin thích hợp. Hệ thống này đã được ứng dụng trong nhiều lĩnh vực như:
thương mại điện tử (Amazon, Netflic, Ebay); giải trí (MovieLens, Last.fm, Film-Conseil);
tin tức trực tuyến (NetNews, Yahoo, Google); . . .
Hệ thống khuyến nghị được phát triển dựa vào cách dự đoán, ước lượng xếp hạng
(rating) cho các dữ liệu bằng cách sử dụng học máy, lý thuyết xấp xỉ, các thuật toán
trong xác suất thống kê, . . . Từ đó, nó có thể đưa ra các thông tin phù hợp trong số
những thông tin lớn chưa có trật tự nào. Hệ thống này sử dụng các kỹ thuật lọc
để chọn ra những loại thông tin đặc trưng nhằm hiển thị các phần tử thích hợp với sở
thích của người dùng. Nhìn chung, các kỹ thuật lọc trong hệ khuyến nghị được phát triển
bởi một trong hai cách tiếp cận là lọc nội dung (content filtering) và lọc cộng tác
(collaborative filtering).
Hiện nay, phần lớn các hệ thống khuyến nghị phát triển dựa vào lọc cộng tác dựa
trên những hành vi quá khứ của người dùng như: lịch sử giao dịch, đánh giá sản phẩm,
thời gian xem một mục tin,. . . ; đặc biệt nó không cần tạo các hồ sơ tường minh cho
người dùng. Có hai nhánh nghiên cứu về lọc cộng tác là: tiếp cận láng giềng (neighborhood
approach) và mô hình nhân tố ẩn (latent factor models).
Mô hình nhân tố ẩn có dạng tương tự phương pháp phân tích giá trị đơn nhằm chuyển
đổi các sản phẩm (items) và người dùng (users) vào cùng một không gian ẩn, do đó chúng
có khả năng so sánh dữ liệu trực tiếp với nhau. Chính vì nhờ vào khả năng biểu diễn và
so sánh, tiếp cận này có xu hướng cung cấp kết quả đoán cao hơn các mô hình láng giềng.
Vì vậy trong luận văn này, tui xin được trình bày về mô hình nhân tố ẩn cho hệ thống
khuyến nghị. Cụ thể hơn, tui tập trung nghiên cứu về kĩ thuật phân tích ma trận (một
trong những phương pháp hiệu quả cho mô hình nhân tố ẩn) và ứng dụng trong hệ thống
khuyến nghị. Trong phạm vi của luận văn, chúng ta nghiên cứu và phân tích các mô hình
đang tồn tại, cụ thể là mô hình xác suất kết hợp với ma trận nhân tố cho hệ khuyến nghị
sử dụng đoán học máy. Nội dung chính của bản luận văn này được chia làm 4 chương:
Chương 1: Tổng quan về hệ khuyến nghị (Recommender System).
Chương 2: Phương pháp lọc cộng tác.
Chương 3: Kĩ thuật phân tích ma trận trong hệ khuyến nghị.
Chương 4: Thực nghiệm và demo
Cụ thể, trước khi đi vào xem xét trực tiếp mô hình, trong chương 1, chúng ta đi tìm
hiểu chung về hệ khuyến nghị, phân tích một số chức năng của các hệ khuyến nghị, các
phương pháp khai phá dữ liệu được sử dụng, các hướng tiếp cận như lọc dựa vào nội dung,
lọc cộng tác. Trong chương 2, chúng ta nghiên cứu sâu hơn về lọc cộng tác, các phương
pháp tiếp cận trong lọc cộng tác. Chương 3 giới thiệu kĩ thuật phân tích ma trận cho hệ
khuyến nghị. Chương 4 đưa ra một số ví dụ tính toán và những đánh giá cụ thể để so
sánh những kết quả thực nghiệm với mô hình lý thuyết đã nêu trong chương 3.


K2F40ytC4Zp5phM
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status