Một số kỹ thuật khai phá luật kết hợp có bảo đảm tính riêng tư trong các tập giao dịch phân tán ngang - pdf 23

Tải miễn phí luận án

MỞ ĐẦU
Khai phá luật kết hợp là một trong các phương pháp quan trọng trong
khai phá dữ liệu. Việc khai phá luật kết hợp thường được thực hiện trên các
cơ sở dữ liệu giao dịch của người dùng được giữ trong các tổ chức, ví dụ các
giao dịch mua hàng tại siêu thị, các giao dịch tài chính tại ngân hàng ….
Các ngân hàng rất muốn tìm kiếm khả năng thanh toán nợ của khách
hàng, họ cần hợp tác với nhau để tìm ra khả năng này thông qua một số đặc
tính nào đó của khách hàng của họ tuy nhiên họ không thể giao dữ liệu khách
hàng của họ cho các ngân hàng khác được có thể vì lí do cạnh tranh khách
hàng, của luật bảo vệ thông tin người dùng. Do đó nhu cầu tìm kiếm các luật
kết hợp trên dữ liệu phân tán có đảm bảo tính riêng tư là một nhu cầu thiết
yếu và cấp bách.
Các giải pháp khai phá luật kết hợp có đảm bảo tính riêng tư ra đời là
hết sức cần thiết, để cho phép thực hiện việc khai phá luật kết hợp trong khi
vẫn bảo vệ được thông tin riêng tư. Do đó việc nghiên cứu, tìm hiểu các thuật
toán khai phá luật kết hợp có đảm bảo tính riêng tư để tích hợp cho các ứng
dụng là có tính thực tiễn cao.
Xuất phát từ thực tiễn trên, mục đích của đề tài là nghiên cứu đánh giá
“Một số kỹ thuật khai phá luật kết hợp có bảo đảm tính riêng tƣ trong
các tập giao dịch phân tán ngang”.
Nội dung bao gồm 3 chương và phần mở đầu, phần kết luận với nội
dung cụ thể như sau:
Chương 1: Tổng quan về khai phá luật kết hợp có đảm bảo tính riêng tư.
Trong chương 1 sẽ trình bày khái quát chung về vấn đề khai phá dữ liệu
có đảm bảo tính riêng tư, vấn đề khai phát luật kết hợp có đám bảo tính riêng
tư với dữ liệu tập trung và trên các hệ thống phân tán, một số tiêu chí đánh
giá.
Chương 2: Một số phương pháp khai phá luật kết hợp.
Ở chương 2 chúng ta sẽ tìm hiểu về một số phương pháp tìm luật kết
hợp, khai phá luật kết hợp trong dữ liệu phân tán.
Chương 3: Một số thuật toán khai phá luật kết hợp có đảm bảo tính riêng tư
trong môi trường phân tán ngang.
Chương này sẽ tập chung nghiên cứu về một số thuật toán khai phá luật
kết hợp có đảm bảo tính riêng tư trong môi trường phân tán ngang. Trong đó
tập trung vào 2 thuật toán chính là: Phương pháp dựa trên tổng bảo mật chống
lại sự thông đồng và phương pháp tiếp cận theo hướng FI. Đồng thời trình bày
đề mô thuật toán Secure Sum và cải tiến thuật toán.


Chƣơng 1
TỔNG QUAN VỀ KHAI PHÁ LUẬT KẾT HỢP
CÓ ĐẢM BẢO TÍNH RIÊNG TƢ
1.1. Một số khái niệm cơ bản
1.1.1. Khai phá dữ liệu
Khai phá dữ liệu (KPDL) là các kỹ thuật để rút trích tri thức từ lượng
dữ liệu lớn và được xem là giai đoạn chính trong quá trình khám phá tri thức.
KPDL được ứng dụng trong nhiều lĩnh vực như tiếp thị, kinh doanh, khám
phá khoa học, công nghệ sinh học, tìm kiếm trên Internet, giải trí đa phương
tiện, …
Với lượng dữ liệu gia tăng nhanh chóng thì KPDL là một công cụ hữu
ích để rút trích những thông tin có ích từ dữ liệu, tuy nhiên trong các lĩnh vực
đặc thù như y khoa, bảo hiểm, ngân hàng… có chứa dữ liệu và thông tin nhạy
cảm, không cho phép tiết lộ dữ liệu và thông tin nhạy cảm này do đó gây khó
khăn cho quá trình khai thác, từ đó đòi hỏi cần có các nghiên cứu để có thể
khai phá dữ liệu nhưng không ảnh hưởng đến tính riêng tư của dữ liệu.
1.1.2. Tính riêng tư
Tính riêng tư là tính chất của các dữ liệu nhạy cảm như: định danh, tên,
địa chỉ, điện thoại, thu nhập,… của các cá nhân, một số số liệu thống kê các tổ
chức, doanh nghiệp… Các thông tin này là bí mật kinh doanh, mà nếu để lộ ra
sẽ gây bất lợi cho cá nhân, tổ chức,... hay những thông tin do quy định của
pháp luật nên không thể tiết lộ ra như bảo hiểm y tế, số tài khoản ngân hàng,...
Những loại thông tin như trên gọi là những thông tin có tính riêng tư hay là tri
thức nhạy cảm.
1.1.3. Khai phá dữ liệu đảm bảo tính riêng tư


1jw5aRY255DQZEr
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status