Một số thuật toán khai phá luật dãy và ứng dụng thử nghiệm vào hệ thống quản lý khách hàng và tính hóa đơn nước - Pdf 30

Một số thuật toán khai phá luật dãy và ứng dụng
thử nghiệm vào hệ thống quản lý khách hàng và
tính hóa đơn nước

Nguyễn Đình Văn

Trường Đại học Công nghệ
Luận văn ThS. Chuyên ngành: Công nghệ thông tin; Mã số: 60 48 05
Người hướng dẫn: PGS.TS. Hà Quang Thụy
Năm bảo vệ: 2011

Abstract: Khái quát chung về luật dãy và khái phá luật dãy: trình bày khái quát về luật kết hợp,
một số đối sánh giữa luật dãy và luật kết hợp, đồng thời giới thiệu sơ bộ các phương pháp tiếp
cận khai phá luật dãy và các thuật toán điển hình tương ứng. Các phương pháp khai phá luật dãy:
tập trung giới thiệu các thuật toán khai phá luật dãy như AprioriAll, AprioriSome, GSP là những
thuật toán khởi thủy khai phá luật dãy và giới thiệu hai phương pháp khai phá luật dãy được công
bố thời gian gần đây là “Khai phá luật dãy sử dụng kỹ thuật phân vùng” và “Khai phá luật dãy
bằng mã hóa khối cơ bản”. Tổng quan về Hệ thống Quản lý khách hàng và tính hóa đơn nước,
đồng thời đề xuất ứng dụng khai phá luật dãy với thuật toán AprioriAll trong Hệ thống Quản lý
khách hàng và tính hóa đơn nước.
Keywords: Khai phá dữ liệu; Thuật toán; Hệ thống quản lý.
Content: MỞ ĐẦU
Khai phá luật dãy là một trong những lĩnh vực rất quan trọng trong nghiên cứu khai phá dữ
liệu của thập kỷ gần đây và ngày càng được áp dụng rộng rãi trong nhiều lĩnh vực khác nhau. Vì
trong thực tế, dữ liệu dãy tồn tại rất phổ biến, như dãy dữ liệu mua sắm của khách hàng, dữ liệu
điều trị y tế, các dữ liệu liên quan đến các thảm họa tự nhiên, dữ liệu xử lý khoa học và kỹ thuật,
dữ liệu chứng khoán và phân tích thị trường, dữ liệu các cuộc gọi điện thoại, nhật ký truy cập
web, dãy ADN biểu thị gen Mục đích chính của khai phá luật dãy là tìm kiếm và phát hiện tất
cả các dãy con lặp đi lặp lại trong một CSDL theo yếu tố thời gian.
Hiện nay, trên thế giới đã có rất nhiều nhóm tác giả nghiên cứu đề xuất các thuật toán với
các phương pháp tiếp cận khai phá luật dãy khác nhau [1,2,5-12,14-16] nhằm giải quyết sự đa

Luận văn được hỗ trợ một phần từ Đề tài QG.10-38.
Luận văn được thực hiện dưới sự hướng dẫn của PGS. TS. Hà Quang Thụy – trường Đại
học Công Nghệ. Em xin bày tỏ lòng biết ơn sâu sắc tới Thầy đã hướng dẫn và có ý kiến chỉ dẫn
quý báu trong quá trình em thực hiện luận văn. Xin chân thành cảm ơn Thạc sĩ Đặng Tiểu Hùng
– Công ty CSE đã đóng góp nhiều ý kiến bổ ích để bản luận văn được hoàn thiện hơn. Cuối cùng
xin bày tỏ lòng biết ơn tới những người thân trong gia đình, bạn bè đã động viên và giúp đỡ để
tác giả hoàn thành bản luận văn này.
TÀI LIỆU THAM KHẢO
[1]. Agrawal R., Srikant R. (1995), Mining sequential patterns. In Proceedings of the
International Conference on Data Engineering (ICDE): 3–14, IEEE Computer Society.
[2]. Srikant R., Agrawal R. (1996), Mining sequential patterns: generalizations and
performance improvements. Proceedings of the International Conference on Extending
Data Base Technology (EDBT), Lecture Notes in Computer Science, 1057: 3–17.
[3]. Masseglia F., Teisseire M., Poncelet P. (2005), Sequential pattern mining: A survey on
issues and approaches. http://citeseerx.ist.psu.edu/viewdoc/summary?
doi=10.1.1.106.5130.
[4]. Jiawei Han and Micheline Kamber, (2006), Data Mining: Concepts and Techniques 2nd
ed, University of Illinois at Urbana-Champaign
[5]. Zhuo Zhang, Lu Zhang, Shaochun Zhong, Jiwen Guan (2008), A New Algorithm for
Mining Sequential Patterns, FSKD (2) 2008: 625-629.
[6]. Floriana Esposito, Nicola Di Mauro, Teresa Maria Altomare Basile, Stefano Ferilli (2008),
Multi-Dimensional Relational Sequence Mining, Fundam. Inform., 89(1): 23-43.
[7]. Yu Ning, Hongbin Yang (2008), Sequence Mining for User Behavior Patterns in Mobile
Commerce, CMECG '08 Proceedings of the 2008 International Conference on
Management of e-Commerce and e-Government: 61-64.
[8]. Chun-Sheng Wang, Anthony J.T. Lee (2009), Mining inter-sequence patterns, Expert
Systems with Applications, 36 (2009): 8649–8658.
[9]. D. Vasumathi, Dr. A. Govardhan, K.Venkateswara Rao (2009), Performance improvement
and efficient approach for mining periodic sequential acess patterns, International
Journal of Computer Science and Security (IJCSS),2009, 3 (5):358-370.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status