ứng dụng kho dữ liệu và mối quan hệ khách hàng nhằm phân tích tình hình kinh doanh của doanh nghiệp - Pdf 24

 GIÁO DC VÀ ÀO TO
TRNG I HC LC HNG
***

PHM NGC THCH NG DNG KHO D LIU VÀ
I QUAN H KHÁCH HÀNG
NHM PHÂN TÍCH TÌNH HÌNH KINH DOANH
A DOANH NGHIP
Chuyên ngành : Công ngh thông tin
Mã s : 60.48.02.01 Lun vn thc s Công ngh thông tin

NGI HNG DN KHOA HC
PGS. TS  PHÚC
ng Nai, Nm 2013
- i - I CM N

- iii -

C LC

I CM N i
I CAM OAN ii
C LC iii
DANH MC CÁC T VIT TT iv
DANH MC BNG v
DANH MC HÌNH NH vi
GII THIU 1
CHNG 1: MU 3
1.1 Lý do thc hin  tài 3

- iv -

DANH MC CÁC T VIT TT

4GL : Fourth-Generation Languages / Ngôn ng th h th t
ASP : Application Support Provider / Nhà cung cp dch v h trng dng
BI : Business Intelligence / Qun tr thông minh
CET : Current Extraction Time / Thi m trích xut d liu hin thi
CRM : Customer Relationship Management / Qun lý quan h khách hàng
CSDL : C s d liu
DASD : Direct Access Storage Device / Thit b lu tr truy cp trc tip
DBMS : Database Management System / H thng qun tr CSDL
DDS : Dimentional Data Store / Lu tr d liu chiu
DIS : Data Item Set / Mô hình quan h cp trung
DN : Doanh nghip
DSS : Decision Support System / H thng h tr ra quyt nh
DW : Data Warehouse / Kho d liu
ETL : Extract, Transform, Load / Trích xut, chuyn i và np d liu
ER : Entity Relationship / Quan h thc th
ERD : Entity Relationship Level / Mc  quan h thc th
ERP : Enterprise Resource Planning / Hoch nh ngun lc DN
IT : Information Technology / Công ngh thông tin (CNTT)
LSET : Last Successful Extraction Time / Thi m trích xut d liu thành công
cui cùng
MIS : Management Information Systems / H thng thông tin qun lý
NF : Normal Form / Chun hóa d liu
ODS : Operational Data Store / Lu tr d liu u hành
OLAP : Online Analytical Processing / X lý phân tích trc tuyn
OLTP : Online Transaction Processing / X lý giao dch trc tuyn
PC : Personal Computer / Máy tính cá nhân

- vi -

DANH MC HÌNH NH

Hình 2.1 Các thành phn ca kho d liu 12
Hình 2.2 Bng s kin 15
Hình 2.3 Bng chiu d liu 15
Hình 2.4 Chuyn d liu t h thng u hành sang môi trng kho d liu
không chn thun là vic trích xut d liu 17
Hình 2.5 D liu t các ng dng khác nhau cc k ri rc 18
Hình 2.6 Chuyn i d liu t các h thng hin ti sang môi trng kho d
liu mt cách hp lý thì nó sc tích hp 19
Hình 2.7 Các thc th và các mi quan h 20
Hình 2.8 Mi thc th trong mô hình ERD sc xác nh bng mô hình
DIS 20
Hình 2.9 Các quan h trong ERD sc phn ánh bng các kt ni trong
DIS 21
Hình 2.10 Các u vào ca bng c trình bày bng hai giao tác 21
Hình 2.11 Các yu t thit k liên quan n hiu sut 22
Hình 2.12 Môi trng c ghi d liu 22
Hình 2.13 Mô hình d liu hai chiu n gin - các thc th là ngang hàng 24
Hình 2.14 Mô hình d liu ba chiu cho thy rng các thc th là không ngang
hàng vi nhau 24
Hình 2.15 Mô hình kt ni hình sao n gin vi thc thN HÀNG c

Hình 4.1 Màn hình chính ca ng dng nhp liu cho h thng ngun 58
Hình 4.2 Màn hình ng nhp ng dng nhp liu 59
Hình 4.3 Màn hình nhp liu cho danh mc khách hàng 59
Hình 4.4 Màn hình nhp liu cho danh mc sn phm 60
Hình 4.5 Màn hình nhp liu cho danh mc kho 60
Hình 4.6 Khi to d án xây dng khi d liu OLAP 61
Hình 4.7 Kt ni hình sao trong khi d liu OLAP 62
Hình 4.8 Tin trình to khi d liu t bng s kin và bng chiu d liu 63
Hình 4.9 Trin khai thành công khi d liu OLAP 63
Hình 4.10 Khi to d án khai thác kho d liu 64
Hình 4.11 Báo cáo li nhun bán hàng theo khách hàng và thi gian 64
Hình 4.12 Doanh thu bán hàng theo thi gian 65
Hình 4.13 Báo cáo chi phí và s lng mua theo vùng, quc gia 66
- viii -

Hình 4.14 Báo cáo li nhun theo khách hàng và thông tin giao tip vi khách
hàng 66
Hình 4.15 Báo cáo doanh thu theo sn phm, khách hàng và thi gian 67
Hình 4.16 Báo cáo doanh thu theo sn phm, khách hàng và thi gian bng
MS Excel 68
Hình 4.17 Danh sách các trng d liu sc chn cho vic phân tích d
liu 69
Hình 4.18 Biu  v ch tiêu li nhun 69
Hình 4.19 Biu  v ch tiêu doanh thu 70
Hình 4.20 Báo cáo doanh thu ca tt c khách hàng 70
Hình 4.21 Báo cáo li nhun ca tt c khách hàng nm 2013 71
Hình 4.22 Báo cáo li nhun theo thi gian 72
Hình 4.23 Báo cáo li nhun theo v trí a lý 72
Hình 4.24 Báo cáo doanh thu da trên kênh giao tip 73


trong các gii pháp qun lý kho d liu, doanh nghip có th khai thác toàn b d
liu ca doanh nghip mình thay vì trc ây thng mt rt nhiu công sc.
BI là gii pháp s dng các k nng, qui trình, công ngh, ng dng  h tr
ra quyt nh, các công c BI nâng cao kh nng tr giúp a ra các quyt nh
mang tính chin lc, chin thut và em li hiu qu trong kinh doanh. BI cho
phép doanh nghip hiu bit v quá kh và doán tng lai thông qua ng dng
CNTT  có th d dàng kim soát khi lng d liu khng l, khai phá tri thc
n có theo nhiu góc nhìn y  ca mt doanh nghip. Mc ích chính ca BI là
 tr cho doanh nghip ra quyt nh tt hn.
 thng BI cung cp các kh nng  tr li nhng câu hi quan trng bng
cách chuyn mt lng ln d liu t các h thng ang hot ng sang mt nh
ng hin hành, có th s dng và d hiu. Chúng cung cp thông tin là  sn sàng
ra quyt nh. BI cho phép phân tích xu hng hin ti và tng lai, cnh báo ngay
p tc các c hi và các vn  và cung cp thông tin phn hi liên tc v tính hiu
qu ca vic ra quyt nh.
Bên cnh s kt hp gia DW và các ng dng BI, còn có mt yu t có nh
ng không nh ti thành công ca doanh nhip, ó là CRM. CRM cam kt mang
i li nhun áng k cho các t chc trin khai nó c v doanh thu và hiu qu cao
- 2 -

trong hot ng sn xut. Chuyn sang nh hng khách hàng trng tâm có th dn
n hiu qu kinh doanh tng cao và t giá n nh, tng trng doanh thu, gia tng
doanh s bán hàng vi chi phí gim, ci thin t sut li nhun t khách hàng, gia
ng s tha mãn khách hàng và gn kt lâu dài vi khách hàng. Cui cùng, mi t
chc u mun khách hàng trung thành hn, li nhun nhiu hn. Bi vì nó thng
òi hi mt su táng k thu hút khách hàng mi nên chúng ta không th có
 kh nng  có nhng khon u t này. Do vy, mt trong nhng mc tiêu ca
CRM là  chuyn i nhng khách hàng không mang li li nhun thành nhng
khách hàng mang li li nhun [11].
i dung ca lun vn bao gm các phn sau:

Giám c a ra nhng quyt nh nhanh chóng, chính xác cho hot ng sn xut
kinh doanh ca doanh nghip mình.
Theo kt qu nghiên cu ca 2 chuyên gia là Paul Gray và Jongbok Byun,
trng Claremont Graduate School, khi trin khai DW và CRM thành công, doanh
nghip sc hng rt nhiu li ích nh:
 Có th tit kim chi phí tip cn khách hàng mi (thng cao hn gp 5-10
n) nh duy trì c mi quan h tt vi khách hàng hin ti.
 t c s tha mãn và trung thành ca khách hàng. u này rt có li vì
khách hàng trung thành thng có xu hng quay tr li mua và ít quan tâm
i giá c hn khách hàng mi.
 ng li nhun: Mt công ty c tng thêm 5% khách hàng trung thành thì
có th tng 25% n hn 100% li nhun tùy theo các ngành ngh kinh
doanh.
 ng cng hiu qu hot ng qun lý công ty nh h thng quy trình rõ
ràng trong CRM bt buc các nhân viên (NV) phi tuân th quy nh v báo
cáo tình hình ca tng b phn.
Sau ây là các li ích ca vic trin khai CRM thành công c thu thp và
ng kt t mt cuc kho sát rng rãi ca các nghiên cu CRM gn ây [2]:
 i thin kh nng hng mc tiêu khách hàng có li nhun.
 Tích hp các dch v qua các kênh.
 i thin lc lng bán hàng hiu qu và t nng sut cao.
- 4 -

 c thù hóa các thông p marketing.
 Tùy bin các sn phm và dch v.
 i thin dch v khách hàng hiu qu và t nng sut cao.
 i thin v giá c.
i lý do ó,  tài này s nghiên cu sâu hn v vic ng dng kho d liu
và mi quan h khách hàng nhm giúp doanh nghip có cái nhìn rõ hn v tình hình
kinh doanh ca doanh nghip mình và có nhng phân tích kt qu kinh doanh thông

  dng công c OLAP trên b công c Visual Studio 2005  khai
thác d liu trên kho d liu.
  dng d án báo cáo ca b công c Visual Studio 2005  phân tích
 liu t kho d liu.
1.5. Tóm tt kt qut c:
 Lý thuyt:
  lý thuyt v kho d liu và mi quan h khách hàng.
 n phm:
 t CSDL kho d liu v doanh thu ca doanh nghip.
 t chng trình khai thác d liu ca kho d liu da trên k thut
OLAP.
 t d án báo cáo  phân tích tình hình kinh doanh ca doanh nghip.

- 6 -

CHNG 2
 S LÝ THUYT
2.1. Lý thuyt kho d liu:
2.1.1. nh ngha và các c m ca kho d liu:
Vic tin hc hoá các quy trình kinh doanh; công ngh tiên tin trong truyn ti
và lu tr d liu; công c qun lý c s d liu mnh mã m ra nhng kh nng
i trong các thao tác và phân tích d liu. Các nhà qun lý doanh nghip ang háo
c  khám phá nhng kho d liu hin ti và quá kh xác nh xu hng phát
trin và các hình mu trong vic kinh doanh. H hy vng vic khai thác d liu và

ngi qun tr và nhà qun lý doanh nghip v vic quyt nh cách lu tr
 liu trong kho d liu trong bao lâu. Ví d: 1 nm, 3 nm, 5 nm,…
 n nh (Non-Volatile): có ngha là s không có vic cp nht d liu c
u tr trong kho d liu mà thay vào ó là các thông tin c t chc 
hin th các thay i ca d liu ó. D liu trong kho d liu c s dng
cho vic phân tích nên các thao tác cp nht hay xóa d liu có th làm nh
ng ti vic phân tích này. Vì vy, nói chung là d liu trong DW không
bao gic cp nht hay xóa b. Bt c khi nào mt thuc tính c th
hoc mc d liu c cp nht ti ngun thì phiên bn mi ca nó c
u tr trong DW  vô hiu phiên bn d liu c.
Trc tiên, chúng ta s tp trung vào các mc tiêu c bn ca DW. Các mc
tiêu này c phát trin da trên các yêu cu và vic qun lý kinh doanh.
 DW phi làm sao  d liu ca DN c truy cp mt cách d dàng.
i dung ca DW phi d hiu. D liu phi trc quan và rõ ràng i vi
ngi kinh doanh ch không n thun ch cho các nhà phát trin. D hiu
ng ý là mc  dc, ni dung ca DW cn c xác nh là có ý ngha.
Doanh nhân mun tách ra và kt hp li d liu trong kho theo cách kt hp
vô tn, quá trình thng c gi là chiu và chn. Các công c truy cp
vào DW phi n gin và d s dng. Chúng cng phi tr li kt qu truy
n cho ngi s dng vi thi gian chi là ti thiu.
 DW phi trình bày thông tin ca DN mt cách nht quán. D liu trong
kho phi áng tin cy. D liu phi c thu thp mt cách cn thn t
nhiu ngun khác nhau ngoài DN, c làm sch, m bo cht lng và
- 8 -

c s dng ch khi nó phù hp vi tiêu chí ca ngi s dng. Thông tin
 mt quá trình kinh doanh phi phù hp vi thông tin t ni khác. Nu hai
bin pháp thc hin có cùng tên thì chúng phi có ngha là cùng mt th.
Ngc li, nu hai bin pháp này không ging nhau thì chúng phi c
dán nhãn khác nhau. Thông tin nht quán có ngha là thông tin cht lng

phân tích tr nên d dàng và trc quan cho ngi qun tr doanh nghip và giúp h
thc hin công vic da trên các quyt nh kinh doanh. Hay nói cách khác, mc
tiêu chính ca DW là  cung cp mt kho lu tr d liu hp nht, linh hot, có ý
ngha cho ngi dùng trong vic phân tích, báo cáo và h tr ra quyt nh. Tt c
các mc tiêu khác ca DW u có ngun gc t mc tiêu chính này. Tuy nhiên, v
phía ngi s dng hoc doanh nghip vn có khó khn trong vic phân tích, khai
thác, t chc kho d liu, các khó khn thng gp là:
 Không th tìm thy d liu cn thit: D liu ri rác  rt nhiu h thng
i các giao din và công c khác nhau, khin tn nhiu thi gian chuyn t
 thng này sang h thng khác. Có th có nhiu ngun thông tin áp ng
c òi hi, nhng chúng li có nhng khác bit và khó phát hin thông
tin nào là úng.
 Không th ly ra c d liu cn thit: Thng xuyên phi có chuyên gia
tr giúp, dn n công vic b dn ng. Có nhng loi thông tin không
th ly ra c nu không m rng kh nng làm vic ca h thng có
n.
 Không th hiu d liu tìm thy: Mô t d liu nghèo nàn và thng xa ri
i các thut ng nghip v quen thuc.
 Không th s dng c d liu tìm thy: Kt qu thng không áp ng
 bn cht d liu và thi gian tìm kim. D liu phi chuyn i bng tay
vào môi trng làm vic ca ngi s dng [12].
2.1.2. Mc tiêu ca kho d liu:
Trc khi i vào chi tit ca các thành phn kho d liu, chúng ta s tìm hiu
 các mc tiêu c bn ca kho d liu. Các ch ny sinh có th xy ra là:
 Chúng ta có c núi d liu nhng không th truy cp c.
 Chúng ta cn ct và chia nh d liu bng mi cách.
 i ngi có th d dàng ly d liu mt cách trc tip.
 Cho bit ch nhng thành phn quan trng.
- 10 -



hoc d liu mi c thêm vào kho. Nu d liu mô t trong kho d liu c
thay i thì chúng ta phi gii thích cho nhng thay i mt cách thích hp.
Kho d liu phi là mt phng tin an toàn  bo v tài sn thông tin
a DN. Viên ngc thông tin quý giá ca mt t chc c lu tr trong kho d
liu.  mc  ti thiu, kho d liu ging nh ni cha thông tin v nhng gì
chúng ta ang bán cho ai ó vi mt mc giá nào ó – mt mi nguy hi tim n
trong tay nhng ngi xu. Kho d liu phi kim soát vic truy cp vào thông tin
bí mt ca t chc mt cách hiu qu.
Kho d liu phi phc v nh là nn tng cho s ci thin vic ra quyt
nh. Kho d liu phi có d liu chính xác  h tr quá trình ra quyt nh. Ch
có mt s tht u ra duy nht t mt kho d liu: các quyt nh c a ra sau
khi kho d liu ã a ra bng chng ca nó.
ng ng doanh nghip phi chp nhn kho d liu nu nó là c coi
là thành công. Vic chúng ta ã xây dng mt gii pháp p mt s dng các sn
phm và nn tng tt là u không quan trng. Nu cng ng doanh nghip không
chp nhn kho d liu và tip tc s dng nó tích cc 6 tháng sau khi ào to thì
vic nghim thu là tht bi. Không ging nh vic vit li mt h thng, ni ngi
dùng không có s la chn nào khác là phi s dng h thng mi, nhng  s
ng h thng mi, vic s dng kho d liu ôi khi là tùy chn. Sn gin hóa
 d dàng c ngi s dng chp nhn hn.

- 12 -



a kho d


li

u(Ngu

n: [11])

- 13 -

 nhiên, có ít u t cho vic chia s d liu chung nh sn phm, khách
hàng, a lý. Nu h thng ngun d liu ang c tái cu trúc li  có cái
nhìn nht quán thì s là u tuyt vi. Vic n lc tích hp các ng dng ca
doanh nghip nh th s làm cho vic thit k kho d liu d dàng hn nhiu.
 Khu vc tng d liu (Data Staging Area): khu vc tng d liu ca kho d
liu là  cp ti c vic lu tr và các qui trình x lí ph bin nh là trích
xut-chuyn i-np d liu. Khu vc tng d liu là tt c mi th gia các
 thng ngun d liu và khu vc trình bày d liu. Trong kho d liu, d
liu làm vic thô c chuyn i vào kho d liu  chuyn giao cho ngi
 dng có yêu cu truy vn và s dng. Do ó, ngi dùng s không c
phép truy cp vào khu vc tng d liu này. Khu vc tng d liu b chi phi
i các hot ng n gin là phân loi và x lý tun t. Trong nhiu trng
p, khu vc tng d liu không da trên công ngh liên quan mà thay vào ó
là bao gm mt h thng các tp tin. Sau khi xác nhn d liu cho phù hp vi
nhng quy tc công vic c nh ngha là mt-mt và mt-nhiu, thì bc

thông. Vic s dng các mô hình chun hóa trong khu vc trình bày d liu
a kho d liu s phá toàn b mc ích ca kho d liu, c th là, truy vn
 liu trc quan và hiu sut cao.
Thay vào ó, mô hình chiu gii quyt các vn  v lc  phc tp trong
khu vc trình bày d liu. Mt mô hình chiu cha các thông tin ging nh
t mô hình chun hóa, nhng gói d liu trong nh dng thit k vi mc
c tiêu là làm cho ngi dùng d hiu, tng hiu sut truy vn và thay i
linh hot.
Trong mô hình chiu, có hai thut ng hay c s dng, ó là: bng s kin
(fact tables) và bng chiu d liu (dimension tables).
ng s kin (fact tables): mt bng s kin là mt bng chính trong mô
hình chiu có chc nng lu tr các d liu tng hp cho quá trình hot
ng. Ngi dùng c gng  lu tr d liu tng hp t kt qu ca mt
quá trình công vic trong mt data mart n l. Bi vì d liu tng hp a
phn là ln nht trong bt k data mart nào nên cn tránh vic lp li  nhiu
i khác.

- 15 - Vic s dng thut ng  kin là  trình bày  ln ca d liu. Chúng ta
có th tng tng là t mt th trng bit c sn phm ang c bán ra
i s lng bao nhiêu và doanh s mi ngày cho mi sn phm trong mi
a hàng nh th nào.  ln d liu c thc hin ti các giao m ca
t c các chiu (ngày, sn phm và ca hàng). Danh sách các chiu s xác
nh c tính ca bng s kin tng hp và cho ta bit phm vi ca công vic
là gì.
Hình 2.3 B

ng chi

u d


li

u(Ngun: tác gi)

- 16 -

Thuc tính ca bng chiu d liu óng vai trò quan trng trong kho d liu.
i vì chúng là ngun gc ca hu ht tt c các ràng buc và d liu báo
cáo, nên chúng là chìa khóa làm cho kho d liu d hiu và d s dng. Sc
nh ca kho d liu là t l thun vi cht lng và chiu sâu ca các thuc
tính ca bng chiu d liu. Thi gian dành cho vic cung cp các thuc tính
i mô t k thut rõ ràng càng nhiu thì kho d liu càng tt. Thi gian
dành cho vic tính toán giá tr trong mt ct thuc tính càng nhiu thì kho d
liu càng tt. Thi gian dành cho vic m bo cht lng giá tr trong mt
t thuc tính càng nhiu thì kho d liu càng tt.
 Công c truy cp d liu (Data Access Tools): thành phn chính cui cùng
trong môi trng kho d liu là các công c truy cp d liu. Vic s dng
thut ng công c là  cp n sa dng v kh nng có thc cung


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status