Nghiên cứu thử nghiệm kỹ thuật luật kết hợp và khai phá mẫu tuần tự trong xây dựng hệ thống quản trị khách hàng thông minh - Pdf 43

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

TẠ HUY VŨ

NGHIÊN CỨU THỬ NGHIỆM KỸ THUẬT LUẬT KẾT HỢP VÀ
KHAI PHÁ MẪU TUẦN TỰ TRONG XÂY DỰNG
HỆ THỐNG QUẢN TRỊ KHÁCH HÀNG THÔNG MINH

LUẬN VĂN THẠC SĨ KỸ THUẬT
CÔNG NGHỆ THÔNG TIN

Hà Nội - 2016


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
--------------------------------------TẠ HUY VŨ

NGHIÊN CỨU THỬ NGHIỆM KỸ THUẬT LUẬT KẾT HỢP VÀ
KHAI PHÁ MẪU TUẦN TỰ TRONG XÂY DỰNG
HỆ THỐNG QUẢN TRỊ KHÁCH HÀNG THÔNG MINH

Chuyên ngành : Công nghệ thông tin

LUẬN VĂN THẠC SĨ KỸ THUẬT
CÔNG NGHỆ THÔNG TIN

NGƢỜI HƢỚNG DẪN KHOA HỌC:
PGS. TS. HUỲNH QUYẾT THẮNG

2.1.1. Lý thuyết về luật kết hợp ..........................................................................20
2.1.1.1. Các khái niệm ....................................................................................20
2.1.1.2. Một số tính chất .................................................................................21
3


2.1.2. Kỹ thuật khai phá luật kết hợp với Apriori ..............................................23
2.1.2.1. Thuật toán Apriori..............................................................................23
2.1.2.2. Ví dụ thuật toán Apriori .....................................................................25
2.2. Kỹ thuật khai phá mẫu tuần tự ........................................................................27
2.2.1. Tổng quan về khai phá mẫu tuần tự .........................................................27
2.2.1.1. Các khái niệm ....................................................................................27
2.2.1.2. Khai phá luật tuần tự ..........................................................................28
2.2.2. Kỹ thuật khai phá mẫu tuần tự với GSP ...................................................29
2.2.2.1. Thuật toán GSP ..................................................................................29
2.2.2.2. Ví dụ thuật toán GSP .........................................................................32
KẾT CHƢƠNG II ..............................................................................................36
CHƢƠNG 3. THỬ NGHIỆM KỸ THUẬT KHAI PHÁ LUẬT KẾT HỢP VÀ
MẪU TUẦN TỰ TRONG HỆ THỐNG QUẢN TRỊ KHÁCH HÀNG THÔNG
MINH CỦA NGÂN HÀNG TMCP CÔNG THƢƠNG VIỆT NAM.......................37
3.1. Tổng quan về khách hàng và giao dịch của khách hàng trong ngân hàng
TMCP Công Thƣơng Việt Nam ............................................................................37
3.2. Thử nghiệm áp dụng khai phá luật kết hợp ....................................................37
3.2.1. Phát biểu bài toán .....................................................................................37
3.2.2. Mô tả tập dữ liệu ......................................................................................37
3.2.3. Áp dụng khai khá luật kết hợp với thuật toán Apriori .............................39
3.2.3.1. Cách thức xây dựng chƣơng trình thử nghiệm ..................................39
3.2.3.2. Kết quả thử nghiệm ............................................................................39
3.3. Thử nghiệm áp dụng khai phá mẫu tuần tự ....................................................49
3.3.1. Phát biểu bài toán .....................................................................................49

6


MỤC LỤC BẢNG BIỂU, SƠ ĐỒ, HÌNH
Bảng 3.1: Mô tả dữ liệu các sản phẩm dịch vụ và ký hiệu .......................................38
Bảng 3.2: Dữ liệu của 7 giao dịch sử dụng dịch vụ ..................................................38
Bảng 3.2: Tập dữ liệu mô phỏng sau khi sắp xếp theo khách hàng và thời gian ......50
Bảng 3.3: CSDL chuỗi ..............................................................................................50
Hình 1.1: Sơ đồ các dịch vụ đƣợc cung cấp bởi ngân hàng ......................................16
Hình 2.1: Giả mã thuật toán Apriori .........................................................................24
Hình 2.2: Dữ liệu giao dịch ví dụ thuật toán Apriori ................................................25
Hình 2.3: Quá trình thực hiện thuật toán Apriori ......................................................26
Hình 2.4: Kết quả thực hiện thuật toán Apriori ........................................................26
Hình 2.5: Giả mã thuật toán GSP ..............................................................................31
Hình 2.6: Mô phỏng các bƣớc thuật toán GSP .........................................................36
Hình 3.1: Kết quả thử nghiệm thuật toán Apriori .....................................................47
(min_supp = 40%, min_conf = 80%) ........................................................................47
Hình 3.2: Kết quả thử nghiệm thuật toán Apriori .....................................................48
(min_supp = 60%, min_conf = 90%) ........................................................................48
Hình 3.3: Kết quả thử nghiệm thuật toán GSP (min_sup = 50%) ............................55
Hình 3.4: Kết quả thử nghiệm thuật toán GSP (min_sup = 50%) ............................56

7


DANH MỤC TỪ VIẾT TẮT VÀ THUẬT NGỮ

STT

TỪ VIẾT TẮT


VCRM

Cổng thông tin tín dụng và quan hệ khách hàng

6

Candidate

Ứng viên

7

CSDL

Cơ sở dữ liệu

8

Element

Thành phần dãy

9

Frequent item

Phần tử thƣờng xuyên

10


Sequence

Dãy

16

Support

Độ hỗ trợ

17

Supsequence

Dãy con

18

Min_supp

Độ hỗ trợ tối thiểu

19

Min_conf

Độ tin cậy tối thiểu

20

2. Mục tiêu của đề tài
- Nghiên cứu kỹ thuật khai phá luật kết hợp và khai phá mẫu tuần tự trên tập
dữ liệu giao dịch của khách hàng.
- Thử nghiệm áp dụng hai kỹ thuật đã nghiên cứu áp dụng trong xây dựng hệ
thống quản trị khách hàng thông minh.

9


- Cung cấp một giải pháp dựa trên các kỹ thuật công nghệ thông tin ứng
dụng trong ngân hàng, cụ thể là ngân hàng TMCP Công Thƣơng Việt Nam giúp
đƣa ra các dự báo, xu hƣớng sử dụng sản phẩm của khách hàng.
3. Đối tƣợng, phạm vi nghiên cứu
Đề tài nghiên cứu về kỹ thuật khai phá luật kết hợp và khai phá mẫu tuần tự
áp dụng cho hệ thống quản trị khách hàng thông minh với đầu vào là tập dữ liệu
giao dịch của khách hàng, lấy số liệu mô phỏng từ ngân hàng TMCP Công Thƣơng
Việt Nam trong năm 2015.
4. Phƣơng pháp nghiên cứu
Phƣơng pháp nghiên cứu tài liệu: Nghiên cứu các tài liệu liên quan đến kỹ
thuật khai phá luật kết hợp và khai phá mẫu tuần tự từ lý thuyết đến ví dụ, qua đó
lựa chọn thuật toán sẽ áp dụng cho mỗi kỹ thuật.
Phƣơng pháp thử nghiệm: Mô tả tập dữ liệu ví dụ về giao dịch khách hàng.
Áp dụng thử hai kỹ thuật với các thuật toán tƣơng ứng trên tập dữ liệu mẫu, qua đó
rút ra đánh giá, kết luận.
5. Bố cục luận văn
Luận văn đƣợc chia làm 03 chƣơng, nội dung nhƣ sau:
Mở đầu.
Chƣơng I: Hệ thống quản trị khách hàng thông minh.
Chƣơng II: Kỹ thuật khai phá luật kết hợp và khai phá mẫu tuần tự.
Chƣơng III: Thử nghiệm kỹ thuật khai phá luật kết hợp và mẫu tuần tự trong hệ

Ngân hàng đƣợc dùng vốn điều lệ và quỹ dự trữ để góp vốn, mua cổ phần,
tham gia thị trƣờng tiền tệ, kinh doanh ngoại hối và vàng, nghiệp vụ ủy thác và đại
lý, dịch vụ tƣ vấn…
Thực tế cho thấy các ngân hàng đang trải qua những thay đổi trong chức
năng và hình thức. Những khuynh hƣớng ngày nay làm thay đổi ngân hàng:

11


- Sự gia tăng nhanh chóng của các danh mục dịch vụ: Các ngân hàng ngày
nay đang mở rộng danh mục dịch vụ tài chính mà họ đã cung cấp cho khách hàng.
Quá trình mở rộng danh mục dịch vụ đã tăng tốc trong những năm gần đây dƣới áp
lực cạnh tranh gia tăng từ các tổ chức tài chính khác, từ sự hiểu biết và đòi hỏi cao
hơn của khách hàng và từ sự thay đổi công nghệ. Nó làm tăng chi phí của ngân
hàng và dẫn đến rủi ro phá sản cao hơn. Bên cạnh đó nó cũng tạo ra nguồn thu mới
cho ngân hàng.
- Sự gia tăng cạnh tranh: Sự cạnh tranh trong lĩnh vực dịch vụ tài chính đang
ngày càng trở lên quyết liệt khi ngân hàng và các đối thủ cạnh tranh mở rộng danh
mục dịch vụ. Các ngân hàng địa phƣơng cung cấp tín dụng, kế hoạch tiết kiệm, kế
hoạch hƣu trí, dịch vụ tƣ vấn tài chính cho các doanh nghiệp và ngƣời tiêu dùng.
Đây là những dịch vụ đang phải đối mặt với sự cạnh tranh trực tiếp từ các ngân
hàng khác, các hiệp hội tín dụng, các công ty kinh doanh chứng khoán. Áp lực cạnh
tranh đóng vai trò nhƣ một lực đẩy tạo ra sự phát triển dịch vụ cho tƣơng lai.
- Phi quản lý hóa: Cạnh tranh và quá trình mở rộng dịch vụ ngân hàng đƣợc
thúc đẩy bởi sự nới lỏng các quy định – giảm bớt sức mạnh kiểm soát của chính
phủ, cụ thể chính phủ nâng lãi suất trần đối với tền gửi tiết kiệm nhằm cố gắng giúp
công chúng có đƣợc mức thu nhập khá hơn từ khoản tiết kiệm của mình.
- Sự gia tăng chi phí vốn: Sự nới lỏng luật lệ kết hợp sự gia tăng cạnh tranh
làm tăng chi phí trung bình thực tế của tài khoản tiền gửi – nguồn vốn cơ bản của
ngân hàng. Với sự nới lỏng các luật lệ, ngân hàng buộc phải trả lãi suất do thị

nhau trên tất cả các lục địa.
- Rủi ro trong vỡ nợ gia tăng và sự yếu kém của hệ thống bảo hiểm tiền gửi:
Trong khi xu hƣớng hợp nhất và bành trƣớng về mặt địa lý đã giúp nhiều ngân hàng
ít tổn thƣơng trƣớc điều kiện kinh tế trong nƣớc thì sự đẩy mạnh cạnh tranh giữa
các ngân hàng và các tổ chức phi ngân hàng kèm theo các khoản tín dụng có vấn đề
của một nền kinh tế luôn biến động đã dẫn tới sự phá sản ngân hàng ở nhiều quốc
gia trên thế giới. Xu hƣớng phi quản lý hóa trong lĩnh vực tài chính xảo trá hơn, nơi
mà sự phá sản, thôn tính và thanh lý ngân hàng dễ xảy ra hơn.

13


1.1.2. Phân loại khách hàng ngành ngân hàng
Ngân hàng cần phải thu thập các thông tin về khách hàng tiềm năng, phân
loại và phân tích các thông tin để đƣa ra danh sách các khách hàng mà ngân hàng
hƣớng tới. Việc phân loại khách hàng theo các nhóm nhằm mục tiêu quản lý, khai
thác khách hàng có hiệu quả [1].
Các ngân hàng phân khách hàng thành hai nhóm đó là khách hàng tổ chức,
doanh nghiệp và khách hàng cá nhân, yêu cầu về dịch vụ của các tổ chức thƣờng
phức tạp hơn dịch vụ cá nhân; cách định giá đối với các tổ chức thƣờng linh hoạt và
có ƣu đãi do giao dịch với số lƣợng lớn trong khi giá bán dịch vụ đối với cá nhân
khá đồng đều và cố định. Khách hàng là tổ chức có số lƣợng giao dịch lớn nên
không có sự chăm sóc tốt sẽ bị đối thủ cạnh tranh thu hút.
Đối với mỗi nhóm khách hàng có thể chia thành các nhóm nhỏ hơn đó là:
khách hàng gửi tiền, khách hàng vay tiền và khách hàng sử dụng dịch vụ khác, cụ
thể [1]:
- Thứ nhất, nhóm khách hàng có quan hệ gửi tiền: Đây là nhóm khách hàng
quan hệ với ngân hàng để đƣợc hƣởng một mức thu nhập danh nghĩa qua lãi suất.
Qua công tác huy động vốn vay, ngân hàng phát triển đƣợc các dịch vụ thanh toán,
chuyển tiền trong và ngoài nƣớc, mua bán ngoại tệ.

Có thể liệt kê các sản phẩm dịch vụ ngân hàng đang đƣợc cung cấp nhƣ: Tín
dụng; dịch vụ tiền mặt; thanh toán chuyển khoản: UNC, Cheque, thẻ; chuyển tiền,
T/T, Bankdraft; khấu trừ tự động, ủy nhiệm chi định kỳ; Cho thuê két sắt; Ngân
hàng tại nhà (Home Banking), mobile banking, internet banking, thanh toán điện tử;
kiều hối; thanh lý tài sản theo di chúc của khách hàng; dịch vụ ủy thác; tƣ vấn; bảo
hiểm; dịch vụ bất động sản; thiết lập và thẩm định dự án; dịch vụ ngân hàng trên thị
trƣờng chứng khoán; môi giới tiền tệ; mua bán ngoại tệ; thanh toán quốc tế; …
đƣợc tóm tắt thông qua sơ đồ sau:

15


Nguồn: Ngân hàng TMCP Công thương Việt Nam

Hình 1.1: Sơ đồ các dịch vụ được cung cấp bởi ngân hàng
1.2. Hệ thống quản trị khách hàng thông minh.
1.2.1. Thực trạng quản trị khách hàng trong ngân hàng TMCP Công Thƣơng
Việt Nam
Ý thức đƣợc tầm quan trọng của các hoạt động hƣớng tới khách hàng, ngày
càng có nhiều ngân hàng thƣơng mại quan tâm hơn đến các ứng dụng quản trị
khách hàng. Đây là một giải pháp toàn diện nhằm thiết lập, duy trì và phát triển mối
quan hệ khách hàng. Trƣớc sự cạnh tranh gay gắt giữa các ngân hàng thƣơng mại,
để hƣớng tới phát triển lâu dài và bền vững, VietinBank đã triển khai và áp dụng
các chính sách về mặt công nghệ để quản trị khách hàng và đã đạt đƣợc những
thành công ban đầu.
Vietinbank đã ứng dụng hệ thống Contact-Center vào trong các hoạt động
quan hệ khách hàng của mình. Đây là giải pháp kỹ thuật và công nghệ thông tin
trong quản trị khách hàng thông qua trung tâm chăm sóc, hỗ trợ khách hàng.
Contact center giúp khách hàng đƣợc tƣ vấn từ xa và cũng là công cụ để ngân hàng
thu thập thông tin khách hàng, từ đó có thể chăm sóc khách hàng tốt nhất nhƣ: giới

- Dữ liệu nhật ký sử dụng dịch vụ của khách hàng: Đây là dữ liệu hàng ngày
hàng tháng thể hiện việc khách hàng đến ngân hàng và sử dụng những dịch vụ nào
của ngân hàng trong một lần giao dịch (một lần đến ngân hàng).
17


1.2.2.2. Lợi ích của quản trị khách hàng thông minh.
Với việc phân tích các dữ liệu liên quan đến giao dịch khách hàng, qua đó
đƣa ra các dự báo, xu hƣớng sử dụng dịch vụ của khách hàng, ngân hàng sẽ thu
đƣợc các lợi ích nhƣ sau từ hệ thống quản trị khách hàng thông minh:
- Giúp phân loại khách hàng: Ngày nay, các ngân hàng đã chuyển định
hƣớng kinh doanh từ dịch vụ sang định hƣớng khách hàng một cách có chọn lọc. Vì
vậy, chiến lƣợc phân loại khách hàng hiệu quả nhất mà hệ thống quản trị khách
hàng thông minh hỗ trợ là dựa trên giá trị kinh doanh, hay đo lƣờng khả năng sinh
lợi của khách hàng. hệ thống quản trị khách hàng thông minh giúp ngân hàng phân
chia khách hàng thành 4 nhóm: nhóm khách hàng giá trị nhất; nhóm khách hàng có
khả năng tăng trƣởng cao nhất; nhóm khách hàng có giá trị âm và nhóm khách hàng
cần dịch chuyển. Từ đó có thể hoạch định các chiến lƣợc marketing phù hợp với
từng đối tƣợng khách hàng.
- Cá biệt hoá dịch vụ khách hàng: Dựa trên các thông tin về lịch sử giao
dịch, đặc điểm, thói quen của khách hàng, hệ thống quản trị khách hàng thông minh
hỗ trợ ngân hàng tuỳ biến các phƣơng thức phục vụ nhằm thoả mãn tối đa nhu cầu
của từng khách hàng và tạo ra sự khác biệt so với các đối thủ cạnh tranh.
- Hỗ trợ bán chéo sản phẩm: Nhờ khả năng phân tích và mô hình dự báo
hành vi khách hàng, hệ thống quản trị khách hàng thông minh đề xuất chiến lƣợc
bán chéo bằng cách lọc ra danh sách các nhóm khách hàng tiềm năng có khả năng
sử dụng các sản phẩm, dịch vụ ngân hàng liên quan và khuyến nghị áp dụng chiến
lƣợc marketing phù hợp.
- Tăng khả năng tương tác giữa ngân hàng và khách hàng: Giải pháp hệ
thống quản trị khách hàng thông minh hỗ trợ tƣơng tác đa kênh, trong đó web và

minh họa tƣơng ứng.

19


CHƢƠNG 2. KỸ THUẬT KHAI PHÁ LUẬT KẾT HỢP VÀ KHAI PHÁ
MẪU TUẦN TỰ
2.1. Kỹ thuật khai phá luật kết hợp
2.1.1. Lý thuyết về luật kết hợp
2.1.1.1. Các khái niệm
a. Tập mục: Là một tập hợp các mục hay đối tƣợng đƣợc xét đƣợc ký hiệu
là: I = {I1, I2, ..., Im}[3].
b. Giao dịch: một giao dịch T đƣợc định nghĩa nhƣ một tập con của các
khoản mục trong I (TI) [3].
c. Cơ sở dữ liệu giao dịch: Gọi D là CSDL của n giao dịch
d. Độ hỗ trợ: Một giao dịch T  D hỗ trợ một tập X  I nếu nó chứa tất cả
các item của X. Điều này nghĩa là X  T, trong một số trƣờng hợp ngƣời ta dùng ký
hiệu T(X) để chỉ tập các giao dịch hỗ trợ cho X. Kí hiệu support(X) (hoặc sup(X),
s(X)) là tỷ lệ phần trăm của các giao dịch hỗ trợ X trên tổng các giao dịch trong D,
nghĩa là [3]:
sup(X ) 

T  D | X  T 
D

(2.1)

e. Độ hỗ trợ tối thiểu (minsup): là một giá trị cho trƣớc bởi ngƣời sử dụng.
Nếu tập mục X có sup(X)  minsup thì ta nói X là một tập các mục phổ biến.
f. Luật kết hợp: Một luật kết hợp có dạng R: X => Y, trong đó X, Y là tập các

Nếu conf ≥ minconf thì luật đƣợc giữ lại (luật này sẽ thoả mãn độ hỗ trợ tối
thiểu vì ABCD là phổ biến).
2.1.1.2. Một số tính chất
a. Tập mục phổ biến:
Tính chất 1 (Độ hỗ trợ của tập con)[3]:
Với A và B là tập các mục, nếu A  B thì sup(A)  sup(B)
Điều này là rõ ràng vì tất cả các giao tác của D hỗ trợ B thì cũng hỗ trợ A.
Tính chất 2[3]:
Một tập chứa một tập không phổ biến thì cũng là tập không phổ biến.
Nếu một mục trong B không có độ hỗ trợ tối thiểu trên D nghĩa là sup(B)
minsup.
b. Luật kết hợp:
Tính chất 1:( Không hợp các luật kết hợp)[3]
Nếu có XZ và YZ trong D thì không nhất thiết XYZ là đúng
Xét trƣờng hợp X Z = và các tác vụ trong D hỗ trợ Z nếu và chỉ nếu
chúng hỗ trợ mỗi X hoặc Y, khi đó luật XYZ có độ hỗ trợ 0%.
21


Tƣơng tự : XY  XZ  XYZ
Tính chất 2:(Không tách luật)[3]
Nếu XYZ thì XZ và YZ chƣa chắc xảy ra
Ví dụ trƣờng hợp Z có mặt trong một giao tác chỉ khi cả hai X và Y cũng có
mặt, tức là sup(XY)= sup(Z), nếu độ hỗ trợ của X và Y đủ lớn hơn sup(XY), tức
là sup(X) > sup(XY) và sup(Y) > sup(XY) thì hai luật riêng biệt sẽ không đủ độ
tin cậy


(2.5)

22


2.1.2. Kỹ thuật khai phá luật kết hợp với Apriori
2.1.2.1. Thuật toán Apriori
a. Giới thiệu về thuật toán:
Apriori là một thuật giải đƣợc do Rakesh Agrawal, Tomasz Imielinski, Arun
Swami đề xuất lần đầu vào năm 1993. Thuật toán tìm giao dịch t có độ hỗ trợ và độ
tin cậy thoả mãn lớn hơn một giá trị ngƣỡng nào đó. Thuật toán đƣợc lƣợc bỏ
những tập ứng cử viên có tập con không phổ biến trƣớc khi tính độ hỗ trợ.[3]
Ký hiệu: Giả sử các mục trong mỗi giao dịch đƣợc lƣu trữ theo thứ tự. Gọi số
các mục trong một tập mục là kích thƣớc của nó và gọi tập mục có kích thƣớc k là
tập k-mục (tập k mục). Các mục trong mỗi tập mục cũng đƣợc sắp xếp theo thứ tự .
Ta sử dụng các ký hiệu sau:
Lk: Tập các tập k-mục phổ biến (với độ hỗ trợ cực tiểu minsup nào đó)
Ck : Tập các tập k-mục ứng cử (các tập mục phổ biến tiềm năng)
Tƣ tƣởng của thuật toán Apriori là:
- Tìm tất cả các tập thƣờng xuyên (frequent itemsets): k-itemset (itemsets gồm k
items) đƣợc dùng để tìm (k+1)-itemset.
- Đầu tiên tìm 1-itemset (ký hiệu L1); L1 đƣợc dùng để tìm L2 (2-itemsets); L2 đƣợc
dùng để tìm L3 (3-itemset) và tiếp tục cho đến khi không có k-itemset đƣợc tìm
thấy.
- Từ các tập thƣờng xuyên (frequent itemsets) sinh ra các luật kết hợp mạnh (các
luật kết hợp thỏa mãn 2 tham số min_sup và min_conf)
b. Trình bày thuật toán:
- Tên thuật toán: Apriori [3]
- Kí hiệu:

Bƣớc này tƣơng ứng với thủ tục apriori_gen đƣợc mô tả nhƣ sau[3]:
Input: Lk
Output: Lk+1
Các bƣớc: Gồm hai bƣớc là kết và loại bỏ
Bước 2.1: Hai tập chỉ mục của tập phổ biến Lk đƣợc kết với nhau khi (k-1)
chỉ mục đầu giống nhau và chỉ khác nhau ở chỉ mục thứ k và chỉ mục thứ k này
đƣợc sắp xếp theo thứ tự.
Bước 2.2: Loại bỏ các ứng viên không có lợi, nếu các ứng viên đƣợc sinh ra
từ bƣớc 2.1 không thỏa mãn điều kiện “các tập con có k thành viên của nó không
nằm trong Lk” thì ta sẽ loại bỏ ứng viên này.
Bước 3: Duyệt CSDL để có đƣợc độ hỗ trợ của mỗi tập ứng viên k-itemset, so sánh
giá trị này với min_sup để loại bỏ các ứng viên không thỏa mãn (có độ hỗ trợ
(Lk - s) nếu độ tin cậy (confidence) của nó > =
min_conf
2.1.2.2. Ví dụ thuật toán Apriori
Chẳng hạn với I= {A1,A2,A5},các tập con của I:
{A1}, {A2}, {A5}, {A1,A2},{A1,A5},{A2,A5}
sẽ có các luật sau
{A1} => {A2,A5},{A2} =>{A1,A5},{A5} =>{A1,A2}
{A1,A2} =>{A5},{A1,A5} =>{A2},{A2,A5} => {A1}
Ví dụ: Giả sử ta có có sở dữ liệu giao dịch nhƣ sau, độ hỗ trợ tối thiểu = 50%, độ tin
cậy tối thiểu bằng 80% :


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status