Xây dựng công cụ hỗ trợ kinh doanh tại siêu thị miễn thuế thế kỷ vàng - Pdf 40

1

Tóm tắt luận văn thạc só CNTT
Tên đề tài:
Xây dựng công cụ hỗ trợ kinh doanh tại siêu thò miễn thuế Thế Kỷ Vàng
Học viên: Phan Mạnh Thường

khóa:1

Người hướng dẫn: TS.Trần Hành
Nội dung:
1. Tổng quan:
Khám phá dữ liệu hay còn được gọi là khám phá tri thức từ dữ liệu đã thu
hút sự quan tâm trong giới khoa học máy tính và công nghệ tri thức. Nhiều kết
quả nghiên cứu được áp dụng hiệu quả vào thực tế cho thấy đây là một việc làm
thiết thực chứ không đơn thuần là lý thuyết. Có thể nói sự thành công của khám
phá dữ liệu chính là sự kết hợp các kỹ thuật từ những lónh vực khác như trí tuệ
nhân tạo, học máy, xác xuất thống kê, lý thuyết thông tin, cơ sở dữ liệu và tính
toán hiệu xuất cao. Nhiệm vụ của khám phá dữ liệu rất rộng lớn bao gồm việc
phân lớp, dự báo, gom nhóm, khám phá những quy luật kết hợp, khám phá mẫu
tuần tự. Những lónh vực được áp dụng khám phá dữ liệu thì rất nhiều bao gồm
các ứng dụng trong thương mại, tài chính, ngân hàng, sinh học, y khoa, giáo dục,
truyền thông và cả quân sự…
Bên cạnh yếu tố về con người thì những thông tin, quy luật rút ra được từ
việc phân tích và xử lý dữ liệu trong kinh doanh đóng vai trò rất quan trọng liên
quan đến thành công hoặc thất bại của một doanh nghiệp. Việc nắm bắt kòp thời
những thông tin thò trường sẽ giúp cho doanh nghiệp chủ động trong việc tìm ra
những chiến lược, kế hoạch kinh doanh phù hợp và đem lại hiệu quả cao. Siêu
thò miễn thuế Thế Kỷ Vàng là một trong các siêu thò trực thuộc của Cty TNHH
Thương mại Duy Anh, trụ sở chính đặt tại 202 Hoàng Văn Thụ, Q.Phú Nhuận,

được có thể không chính xác do vấn đề rời rạc hoá dữ liệu gây nên. Thêm

2

3

vào đó, các luật này quá cụ thể và không hàm chứa ý nghóa giải thích (dễ
hình dung, dễ hiểu với người dùng)
Khai phá luật kết hợp: như vấn đề đã nêu, do khối lượng dữ liệu lớn và
bao gồm các thuộc tính số, phân loại nên việc chọn một thuật toán khai phá
phù hợp và hiệu quả là vấn đề cần quan tâm khi ứng dụng vào thực tế. Đối
với các thuộc tính phân loại, ta có thể dùng kỹ thuật tổng quát hoá để xử lý,
tuy nhiên việc này có thể dẫn đến gia tăng kích thước dữ liệu và khó khăn
khi chọn phân loại để tổng quát. Đối với các thuộc tính số, nếu áp dụng các
phương pháp rời rạc hoá dữ liệu sẽ dẫn đến một số vấn đề như: kích thước dữ
liệu gia tăng do số item gia tăng theo các khoảng chia rời rạc của thuộc tính
số, các luật tìm được có độ chính xác không cao và quan trọng hơn là nó
không mang yếu tố ngữ nghóa, khó hiểu với người dùng không chuyên. Vấn
đề này có thể được giải quyết khi sử dụng kỹ thuật khai phá luật kết hợp mờ,
kỹ thuật này sẽ cho ra các luật có độ chính xác tương đối, dễ hiểu, dễ giải
thích do việc sử dụng các nhãn để rời rạc hoá dữ liệu và chứa đựng thông tin
thú vò, hữu ích.

3. Cách giải quyết:

Khai phá luật kết hợp tổng quát mờ
o Ứng dụng lý thuyết tập mờ trong việc rời rạc hoá dữ liệu số có giá
trò liên tục
o Trình bày thuật toán khai phá luật kết hợp tổng quát mờ với cải

4

5

5. Phần cài đặt:
Một số thông tin kỹ thuật liên quan đến chương trình cài đặt được liệt kê
trong bảng 1 bên dưới.
Bảng 1 : Thông tin chương trình cài đặt
Thơng tin chương trình cài đặt
Ngơn ngữ

Visual Basic

Cơng cụ phát triển

MS Visual Studio IDE 6.0

Kiểu ứng dụng

Ứng dụng Windows 32 bit

Hệ điều hành

Microsoft Windows 2000, XP

Mơi trường hoạt động

Độc lập

6

7

Giao diện khai phá luật kết hợp

Giao diện kết quả

7

8

6. Tài liệu tham khảo:

Tiếng việt
[1] Hồng Kiếm, Đỗ Văn Nhơn, Đỗ Phúc (2002), Các Hệ Cơ sở tri thức.
[2] Đỗ Phúc (2004), Giáo trình Data warehouse – Data mining, TTCNTTĐHQG TPHCM
[3] Phạm Thị Bạch Huệ (2001), Khai khống dữ liệu- Tìm luật có hiệu quả
ứng dụng cao từ tập luật kết hợp, Luận văn Thạc sĩ Tin Học, Trường Đại
học KHTN, TP.HCM
[4] Nguyễn Hà Giang (2004), Khám phá luật kết hợp mờ và ứng dụng, Luận
văn Thạc sĩ Tin học, Trường Đại học Khoa học Tự Nhiên.
[5] Lê Thanh Minh (2002), Khai khống dữ liệu phục vụ giáo dục và đào tạo
tại Kiên Giang, Luận văn Thạc sĩ Tin học, Trường Đại học KHTN,
TP.HCM
[6] Nguyễn Quốc Thơng (2002), Phát triển một số ứng dụng khai thác dữ
liệu vào giáo dục đào tạo, Luận văn Thạc sĩ Tin học, trường Đại học

[16] R. Agrawal and R. Srikant (June 1994), “Fast algrorithms for mining
association rules in large database’. Research Report RJ 9839, IBM
Almaden Research center, San Jose, California.
[17] Keith C.C. Chan and W.H.Au (1997), “Mining Fuzzy Association
Rules”, in Proc. Of the 6th Int’l Conf. on Information and Knowledge
Management, Las Vegas, Nevada, pp. 209-215
[18] Fu, A.et al.(1998), “Finding fuzzy sets for the mining of association rules
for numerical attributes”, in Proceeding of 1st Intl. Symposium on
Intelligent Data Engineering and Learning (IDEAL’98), pp. 263-268

9

10

[19] Attila Gyenesei (2000), “A fuzzy approach for mining quantitative
association rules”, TUCS technical report 336, University of Turku,
Department of Computer Science, Lemminkisenkatu 14, Finland
[20] Tzung-Pei Hong, K.Y.L., S.L.W.(2003), “Fuzzy data mining for
interesting generalized association rules”, Fuzzy Sets and Systems 138,
pp.255-269
[21] J. Han, J. Pei, and Y. Yin: “Mining frequent patterns without candidate
generation”. In Proc. ACM-SIGMOD’2000, pp. 1-12, Dallas, TX, May
2000
[22] Cheung, W., and Osmar, R.Z. Incremental mining of frequent patterns
without candidate generation or support constraint. In proc. of 7 th
IDEAS’03, Hong Kong, 2003, pp. 111-116
[23] Wang, J., Han, J., Lu, Y. and Tzvetkov, P. TFP: An efficient algorithm
for mining top-k frequent closed itemsets. In proc. of IEEE Knowledge
an Data Engineering, vol 17, no.5, 2005, pp. 652-663

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Xây dựng công cụ hỗ trợ kinh doanh tại siêu thị miễn thuế thế kỷ vàng - Pdf 40

Tài liệu, ebook tham khảo khác

Học thêm