Dự báo qua hành vi mua sắm của người tiêu dùng trong hoạt động kinh doanh hàng tiêu dùng: luận văn thạc sĩ - Pdf 51

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG

ĐẶNG HOÀNG LAM

DỰ BÁO QUA HÀNH VI MUA SẮM CỦA NGƯỜI TIÊU
DÙNG TRONG HOẠT ĐỘNG KINH DOANH HÀNG TIÊU
DÙNG

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Đồng Nai, năm 2017


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG

ĐẶNG HOÀNG LAM

DỰ BÁO QUA HÀNH VI MUA SẮM CỦA NGƯỜI TIÊU
DÙNG TRONG HOẠT ĐỘNG KINH DOANH HÀNG TIÊU
DÙNG
Chuyên ngành: Công nghệ thông tin
Mã số: 60480201
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Người hướng dẫn khoa học:
PGS. TS. ĐỖ PHÚC
Đồng Nai, năm 2017


LỜI CÁM ƠN

trung thực tên tác giả, tên công trình, thời gian, địa điểm công bố.
c. Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá,
tôi xin chịu hoàn toàn trách nhiệm.

NGƢỜI CAM ĐOAN

Đặng Hoàng Lam


DANH MỤC CHỮ VIẾT TẮT
CSDL: Cơ sở dữ liệu
DPB: Độ phổ biến
ĐLNN: Đại lƣợng ngẫu nhiên
GSP: Generalized Sequential Pattern
I/O: Input/ Output
MaKH: Mã khách hàng


DANH MỤC HÌNH ẢNH
Hình 2.1: Sinh các ứng viên và mẫu dãy trong GSP .......................................... 12
Hình 3.1: Phần mềm Weka ................................................................................. 21
Hình 3.2: Phần mềm dự đoán theo mô hình Markov.......................................... 25
Hình 3.3 Giao diện biểu diễn các chuỗi .............................................................. 27
Hình 3.4: Phần mềm dự báo mặt hàng ............................................................... 29
Hình 4.1: Giao diện phần mềm Weka................................................................. 32
Hình 4.2: Thiết lập giá trị tham số cho minSupport ......................................... 33
Hình 4.3: Các mặt hàng phát hiện qua Weka ..................................................... 34
Hình 4.4: Các cặp mặt hàng tìm thấy qua Weka ................................................ 35
Hình 4.5: Các bộ 3 mặt hàng tìm đƣợc bằng Weka ............................................ 37
Hình 4.6: Giao diện chƣơng trình dự đoán ......................................................... 38

LỜI CAM ĐOAN
DANH MỤC CHỮ VIẾT TẮT
DANH MỤC HÌNH
DANH MỤC BẢNG
MỤC LỤC
CHƢƠNG 1 TỔNG QUAN ....................................................................... 1
1.1 MỞ ĐẦU ........................................................................................... 1
1.2 Mục tiêu nghiên cứu của luận văn

................................................... 4

1.3 Phạm vi và đối tƣợng nghiên cứu ...................................................... 4
1.4 Nội dung thực hiện

...................................................................... 5

1.5 Phƣơng pháp thực hiện ..................................................................... 5
1.6 Kết quả dự kiến

.............................................................................. 5

1.7 Cấu trúc luận văn ............................................................................... 5
CHƢƠNG 2 CƠ SỞ LÝ THUYẾT
2.1 Khai phá mẫu dãy

....................................................... 6

......................................................................... 6

2.1.1 Bài toán khai phá mẫu dãy

CHƢƠNG 5 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ................................... 61
5.1 Kết luận ......................................................................................................... 61
5.2 Hƣớng phát triển ........................................................................................... 61
TÀI LIỆU THAM KHẢO
PHỤ LỤC
Danh sách mặt hàng
Một số dữ liệu thực tế từ dữ liệu đầu vào
Giấy xác nhận


1

CHƢƠNG 1
TỔNG QUAN
1.1.MỞ ĐẦU
Bán hàng là hoạt động quan trọng nhất của các doanh nghiệp. Sự thành công hay
thất bại của doanh nghiệp luôn sẽ được quyết định nằm trong hoạt động bán hàng.
Nhất là các doanh nghiệp hoạt động trong lĩnh vực kinh doanh hàng tiêu dùng, thì
bán hàng là miêu tả đặc trưng nhất cho sự sống còn của doanh nghiệp. Để hỗ trợ
hoạt động kinh doanh trong mua bán hàng tiêu dùng, cần dự báo trước được các
hành vi mua sắm của khách hàng, nhằm đáp ứng nhu cầu thuận tiện và hiệu quả
cũng như nhanh chóng cho khách hàng, qua đó để nâng cao hiệu quả kinh doanh
lên mức tốt hơn. Cách mạng công nghiệp lần thứ 4 đang mở cửa, tới cuộc cách
mạng công nghiệp lần thứ 3 máy móc đã thay con người thực hiện những công
việc nặng nhọc, phức tạp, tinh vi. Trong thời kỳ thứ 4 sự kết nối tuyệt vời qua
mạng giữa các thiết bị và máy móc với nhau, với khả năng chia sẽ kết nối dữ liệu
cùng tính toán, máy tính sẽ cho những kết quả dự báo chính xác cao rất thực tế.
Hoạt động kinh doanh là một hoạt động quan trọng cần thiết đối với con người.
Nếu tạo cho máy tính một khả năng dự báo, và qua đó có thể tạo ra những quyết
định lựa chọn như cách suy luận của con người trong hoạt động kinh doanh, thì

nhân viên bán hàng cần phải được đào tạo trong việc bán hàng. Qua khảo sát từ
hoạt động bán hàng tiêu dùng thực tế trong công ty Gevie, nhân viên bán hàng
được chia ra 3 loại sau:
- Loại 3: là loại thuộc nhân viên trung bình, Loại nhân viên này bán hàng, chỉ phục
vụ theo nhu cầu mua hàng của khách hàng. Nhân viên loại này doanh số bán hàng
đạt dưới 5 triệu/1 ca làm việc.


3

- Loại 2: là loại nhân viên bán hàng khá có doanh số bán hàng đạt từ 5 đến 9 triệu/1
ca làm việc. Loại nhân viên này ngoài việc phục vụ nhu cầu của khách hàng, còn
có khả năng tạo ra nhu cầu mua hàng của khách thông qua việc giới thiệu hàng hóa
để tìm thấy nhu cầu của khách hàng.
- Loai 1: Là loại nhân viên bán hàng ưu tú, doanh số bán hàng trên 10 triệu/1 ca.
Loại nhân viên này không chỉ bán hàng phục vụ nhu cầu khách hàng, tạo ra nhu
cầu mua hàng cho khách hàng, mà còn có thể bán được các mặt hàng không thuộc
trong nhu cầu của khách. Nhân viên loại này thường có thời gian qua đào tạo và
kinh nghiệm trên 10 năm. Đây là loại nhân viên tốn công đào tạo, nhưng lại rất khó
giữ khi thành tài. Vậy làm thế nào để đào tạo được nhân viên bán hàng loại 1 mà
không bị mất đi?. Nếu đưa được nhân viên bán hàng loại 2 lên loại 1 và giữ chân
được nhân viên, thì doanh số sẽ tăng mạnh. Từ nhu cầu phát sinh thực tế cùng với
những bức xúc, đã đi đến việc lựa chọn đề tài dự báo hành vi mua sắm của người
tiêu dùng trong hoạt động kinh doanh. Để ứng dụng chương trình phục vụ cho việc
hổ trợ huấn luyện nhân viên bán hàng từ loại 2 lên loại 1. Cũng như với sự hổ trợ
của chương trình dự báo, sẽ rút ngắn thời gian rất đáng kể để đào tạo nhân viên
loại 1 trong 2 năm, và giữ được loại nhân viên này, do công việc dự báo sẽ do
chương trình dự báo cung cấp chứ không phải do kỹ năng kinh nghiệm của nhân
viên mà có được. Nên không thể mang những kỹ năng và kinh nghiệm sang làm
việc tại các đối thủ cạnh tranh.

- Phân tích ,đánh giá.
1.3 PHẠM VI VÀ ĐỐI TƢỢNG
Khảo sát nguồn dữ liệu của hoạt động mua bán từ doanh nghiệp hoạt động trong
lĩnh vực mua bán hàng tiêu dùng trong thành phố.


5

1.4 NỘI DUNG THỰC HIỆN
Sử dụng chuỗi Markov để tạo chương trình dự đoán các hành vi mua hàng của
khách hàng, giúp đưa ra các dự báo cần thiết trong hoạt động kinh doanh. Sử dụng
khai thác dãy tuần tự để tạo các dãy phổ biến trong hoạt động kinh doanh.
1.5 PHƢƠNG PHÁP THỰC HIỆN
-Tìm hiểu hoạt động, thu thập các số liệu từ cửa hàng của doanh nghiệp bán hàng
tiêu dùng.
- Sử dụng thuật toán GSP để tìm dãy thể hiện hành vi mua sắm hàng hóa và chuỗi
Markov để dự đoán hành vi mua sắm của khách hàng.
1.6. KẾT QUẢ DỰ KIẾN
Chương trình ứng dụng dự báo các hành vi mua sắm của ngừơi tiêu dùng, đưa ra
các dự báo cần thiết trong hoạt động kinh doanh.
1.7. CẤU TRÚC LUẬN VĂN
Chương 1: Trình bày tổng quan về vấn đề nghiên cứu
Chương 2: Trình bày cơ sở lý thuyết về luật dãy và dự báo theo chuỗi Markov
Chương 3: Phân tích thiết kế hệ thống dự đoán theo chuỗi Markov
Chương 4: Hiện thực và thử nghiệm hệ thống
Chương 5: Kết luận và hướng phát triển


6




j

. Dãy có chiều dài k còn gọi là k-sequence,

ví dụ: S=<(b)(ac)> là một 3-sequence có kích thước là 2.
Chuỗi β=<b1,b2,…,bm> được gọi là dãy con của dãy ∝=<a1,a2,…,an> hay chuỗi ∝
là dãy cha của dãy β, kí hiệu là β⊆∝, nếu tồn tại những số nguyên
1≤j1

Dãy dữ liệu ứng với từng khách hàng:
Bảng 2.2 Bảng dãy dữ liệu của khách hàng
[3] MaKH

Dãy dữ liệu của khách
hàng

1

(30) (90)

2

(10 20) (30) (40 60 70)

3

(30 50 70)

4

(30) (40 70) (90)

5

(90)

Với ngưỡng minsupp = 0,4 , (ứng với 2 khách hàng)
Các mặt hàng phổ biến:


{70}

2

{90}

2

Các mặt hàng thỏa nguỡng phổ biến minsupp là {30}, {40},{70},{90}. Chúng
cũng chính là các DPB_1. Các ứng viên của DPB_2 được xây dựng bằng cách ghép
cặp các DPB_1, ta có các ứng viên của DPB_2 là: <(30) (40)>, <(30) (70)>,


9

<(30)(90)>, <(40)(70)>, <(40)(90)>, <(70) (90) >, <(30 40)>, <(30 70)>, <(30 90)>,
<(40 70)>, < (40 90)>, <(70 90) >
Kết các dãy lại với nhau ta có:
Bảng 2.4 Bảng ứng viên có độ phổ biến 2
Ƣng viên của
DPB_2
<(30) (40)>

[1] Độ phổ
biến
2

<(30) (70)>


<(40 70)>

2

<(40 90)>

0

<(70 90) >

0

Các dãy DPB_2 là :
<(30),(40)> <(30)(70)> < ( 30 90)> <(40 70)>
Tiếp tục với các ứng viên của DPB_3, ta có:
Kết <(30),(40)> và <(40 70)> ta có các ứng viên của DPB_2 là: <(30) (40 70) > hay
<(30) (40) (70) >
Ta có:


10

Bảng 2.5 Bảng ứng viên độ phổ biến 3
Ƣng viên
DPB_3

của [2] Độ phổ biến

<(30) (40 70) >


thì mọi dãy cha của S cũng không phải là dãy phổ biến. Các thuật toán này dựa vào
nguyên lý Apriori để sinh và kiểm tra các dãy ứng viên, trong đó nếu một dãy được
kiểm tra không thỏa mãn ngưỡng tối thiểu thì các dãy chứa nó cũng sẽ bị loại. Có
một số thuật toán theo phương pháp tiếp cận dựa trên Apriori như AprioriAll, GSP,
SPADE, SPAM... và các biến thể của chúng.
2.1.4. Thuật toán GSP(Generalized Sequential Pattern):
Cấu trúc cơ bản của thuật toán GSP là thuật toán duyệt dữ liệu nhiều lần,
lần duyệt đầu tiên xác định độ hỗ trợ của từng mặt hàng(item). Kết thúc lần duyệt
đầu tiên, thuật toán đưa ra được tập các 1-sequence phổ biến gọi là tập khởi đầu.
Tập khởi đầu được sử dụng để sinh ra các dãy ứng viên mới với mỗi dãy ứng viên
có ít nhất một item thuộc dãy khởi đầu, vì thế tất cả các dãy ứng viên trong một lần
duyệt sẽ có cùng số item. Độ hỗ trợ của các dãy ứng viên này được tìm thấy trong
quá trình duyệt dữ liệu. Kết thúc lần duyệt, thuật toán xác định các dãy ứng viên
phổ biến và những dãy ứng viên phổ biến này trở thành tập khởi đầu cho lần duyệt
tiếp theo. Thuật toán kết thúc khi không tìm được dãy ứng viên nào cuối lần duyệt,
hoặc khi không có dãy ứng viên nào được sinh ra. Thuật toán này được dùng trong
Weka, và trong luận văn Weka sẽ được dùng để tìm dãy phổ biến, nhằm tiến hành
dự báo hành vi mua hàng của khách hàng.
Mô tả sinh các ứng viên và mẫu dãy trong GSP(Generalized Sequential Pattern)


12

Hình 2.1. Sinh các ứng viên và mẫu dẫy trong GSP
Trong hình 2.1: Kết thúc lần duyệt đầu tiên (lần 1), chuỗi 8 mặt hàng (item) được
xác định có 6 mẫu, thuật toán đưa ra được tập các 1-sequence phổ biến gọi là tập
khởi đầu. Trong lần duyệt tiếp theo (lần 2), có 51 bộ đạt ngưỡng tối thiểu với
min_sup = 2, và duyệt được 19 mẫu, có 10 bộ không có trong CSDL. Các sinh mẫu
không phổ biến sẽ không được ghép vào lần duyệt tiếp. Tương tự lần 3 chọn được
19 mẫu, lần 4 sinh chọn được 6 mẫu ...

xác suất có điều kiện của Xn+1 khi cho biết các trạng thái quá khứ là một hàm chỉ
phụ thuộc Xn thì:
(
Trong đó
thái S)

|

)

(

|

)

(2.1)

là một trạng thái nào đó của quá trình sinh (x thuộc không gian trạng


14

Ta nói dãy các ĐLNN (Xn) là một chuỗi Markov nếu với mọi n1
bằng công thức:
(

)

∫ (

|

) (

)

Đây là một phiên bản của phương trình Frobenius-Perron

(2.5)


15

3) Phân bố ổn định: sau một một khoảng thời gian chuyển dịch, trạng thái
hiện tại độc lập với trạng thái ban đầu. Khi đó, chuỗi này đã đạt tới phân
bố ổn định hoặc phân bố có trạng thái ổn định. Xích Markov có thể đạt
tới phân bố ổn định

. Phân bố ổn định nếu thỏa mãn điều kiện:
(2.6)

Nói một cách khác, Một phân bố ổn định là một hàm riêng của hàm phân
bố điều kiện, gắn với trị riêng là 1.

( ) (

)

(2.8)

2.2.3.Ví dụ minh họa về chuỗi Markov để dự báo
Giả sử không gian trạng thái của thời tiết là (mưa, nắng, mây) và thời tiết tuân theo
xử lý Markov. Do đó, xác suất thời tiết của ngày mai sẽ dựa theo xác suất thời tiết
của ngày hôm nay, và không cần quan tâm tới những ngày trước đó. Giả sử rằng,
các chuyển đổi xác suất dựa theo ngày hôm nay trời mưa là



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status