GIÁO DC VÀ ÀO TO
TRNG I HC LC HNG
***
PHM NGC THCH NG DNG KHO D LIU VÀ
I QUAN H KHÁCH HÀNG
NHM PHÂN TÍCH TÌNH HÌNH KINH DOANH
A DOANH NGHIP
Chuyên ngành : Công ngh thông tin
Mã s : 60.48.02.01 Lun vn thc s Công ngh thông tin
NGI HNG DN KHOA HC
PGS. TS PHÚC
ng Nai, Nm 2013
- i - I CM N
- iii -
C LC
I CM N i
I CAM OAN ii
C LC iii
DANH MC CÁC T VIT TT iv
DANH MC BNG v
DANH MC HÌNH NH vi
GII THIU 1
CHNG 1: MU 3
1.1 Lý do thc hin tài 3
- iv -
DANH MC CÁC T VIT TT
4GL : Fourth-Generation Languages / Ngôn ng th h th t
ASP : Application Support Provider / Nhà cung cp dch v h trng dng
BI : Business Intelligence / Qun tr thông minh
CET : Current Extraction Time / Thi m trích xut d liu hin thi
CRM : Customer Relationship Management / Qun lý quan h khách hàng
CSDL : C s d liu
DASD : Direct Access Storage Device / Thit b lu tr truy cp trc tip
DBMS : Database Management System / H thng qun tr CSDL
DDS : Dimentional Data Store / Lu tr d liu chiu
DIS : Data Item Set / Mô hình quan h cp trung
DN : Doanh nghip
DSS : Decision Support System / H thng h tr ra quyt nh
DW : Data Warehouse / Kho d liu
ETL : Extract, Transform, Load / Trích xut, chuyn i và np d liu
ER : Entity Relationship / Quan h thc th
ERD : Entity Relationship Level / Mc quan h thc th
ERP : Enterprise Resource Planning / Hoch nh ngun lc DN
IT : Information Technology / Công ngh thông tin (CNTT)
LSET : Last Successful Extraction Time / Thi m trích xut d liu thành công
cui cùng
MIS : Management Information Systems / H thng thông tin qun lý
NF : Normal Form / Chun hóa d liu
ODS : Operational Data Store / Lu tr d liu u hành
OLAP : Online Analytical Processing / X lý phân tích trc tuyn
OLTP : Online Transaction Processing / X lý giao dch trc tuyn
PC : Personal Computer / Máy tính cá nhân
- vi -
DANH MC HÌNH NH
Hình 2.1 Các thành phn ca kho d liu 12
Hình 2.2 Bng s kin 15
Hình 2.3 Bng chiu d liu 15
Hình 2.4 Chuyn d liu t h thng u hành sang môi trng kho d liu
không chn thun là vic trích xut d liu 17
Hình 2.5 D liu t các ng dng khác nhau cc k ri rc 18
Hình 2.6 Chuyn i d liu t các h thng hin ti sang môi trng kho d
liu mt cách hp lý thì nó sc tích hp 19
Hình 2.7 Các thc th và các mi quan h 20
Hình 2.8 Mi thc th trong mô hình ERD sc xác nh bng mô hình
DIS 20
Hình 2.9 Các quan h trong ERD sc phn ánh bng các kt ni trong
DIS 21
Hình 2.10 Các u vào ca bng c trình bày bng hai giao tác 21
Hình 2.11 Các yu t thit k liên quan n hiu sut 22
Hình 2.12 Môi trng c ghi d liu 22
Hình 2.13 Mô hình d liu hai chiu n gin - các thc th là ngang hàng 24
Hình 2.14 Mô hình d liu ba chiu cho thy rng các thc th là không ngang
hàng vi nhau 24
Hình 2.15 Mô hình kt ni hình sao n gin vi thc thN HÀNG c
Hình 4.1 Màn hình chính ca ng dng nhp liu cho h thng ngun 58
Hình 4.2 Màn hình ng nhp ng dng nhp liu 59
Hình 4.3 Màn hình nhp liu cho danh mc khách hàng 59
Hình 4.4 Màn hình nhp liu cho danh mc sn phm 60
Hình 4.5 Màn hình nhp liu cho danh mc kho 60
Hình 4.6 Khi to d án xây dng khi d liu OLAP 61
Hình 4.7 Kt ni hình sao trong khi d liu OLAP 62
Hình 4.8 Tin trình to khi d liu t bng s kin và bng chiu d liu 63
Hình 4.9 Trin khai thành công khi d liu OLAP 63
Hình 4.10 Khi to d án khai thác kho d liu 64
Hình 4.11 Báo cáo li nhun bán hàng theo khách hàng và thi gian 64
Hình 4.12 Doanh thu bán hàng theo thi gian 65
Hình 4.13 Báo cáo chi phí và s lng mua theo vùng, quc gia 66
- viii -
Hình 4.14 Báo cáo li nhun theo khách hàng và thông tin giao tip vi khách
hàng 66
Hình 4.15 Báo cáo doanh thu theo sn phm, khách hàng và thi gian 67
Hình 4.16 Báo cáo doanh thu theo sn phm, khách hàng và thi gian bng
MS Excel 68
Hình 4.17 Danh sách các trng d liu sc chn cho vic phân tích d
liu 69
Hình 4.18 Biu v ch tiêu li nhun 69
Hình 4.19 Biu v ch tiêu doanh thu 70
Hình 4.20 Báo cáo doanh thu ca tt c khách hàng 70
Hình 4.21 Báo cáo li nhun ca tt c khách hàng nm 2013 71
Hình 4.22 Báo cáo li nhun theo thi gian 72
Hình 4.23 Báo cáo li nhun theo v trí a lý 72
Hình 4.24 Báo cáo doanh thu da trên kênh giao tip 73
trong các gii pháp qun lý kho d liu, doanh nghip có th khai thác toàn b d
liu ca doanh nghip mình thay vì trc ây thng mt rt nhiu công sc.
BI là gii pháp s dng các k nng, qui trình, công ngh, ng dng h tr
ra quyt nh, các công c BI nâng cao kh nng tr giúp a ra các quyt nh
mang tính chin lc, chin thut và em li hiu qu trong kinh doanh. BI cho
phép doanh nghip hiu bit v quá kh và doán tng lai thông qua ng dng
CNTT có th d dàng kim soát khi lng d liu khng l, khai phá tri thc
n có theo nhiu góc nhìn y ca mt doanh nghip. Mc ích chính ca BI là
tr cho doanh nghip ra quyt nh tt hn.
thng BI cung cp các kh nng tr li nhng câu hi quan trng bng
cách chuyn mt lng ln d liu t các h thng ang hot ng sang mt nh
ng hin hành, có th s dng và d hiu. Chúng cung cp thông tin là sn sàng
ra quyt nh. BI cho phép phân tích xu hng hin ti và tng lai, cnh báo ngay
p tc các c hi và các vn và cung cp thông tin phn hi liên tc v tính hiu
qu ca vic ra quyt nh.
Bên cnh s kt hp gia DW và các ng dng BI, còn có mt yu t có nh
ng không nh ti thành công ca doanh nhip, ó là CRM. CRM cam kt mang
i li nhun áng k cho các t chc trin khai nó c v doanh thu và hiu qu cao
- 2 -
trong hot ng sn xut. Chuyn sang nh hng khách hàng trng tâm có th dn
n hiu qu kinh doanh tng cao và t giá n nh, tng trng doanh thu, gia tng
doanh s bán hàng vi chi phí gim, ci thin t sut li nhun t khách hàng, gia
ng s tha mãn khách hàng và gn kt lâu dài vi khách hàng. Cui cùng, mi t
chc u mun khách hàng trung thành hn, li nhun nhiu hn. Bi vì nó thng
òi hi mt su táng k thu hút khách hàng mi nên chúng ta không th có
kh nng có nhng khon u t này. Do vy, mt trong nhng mc tiêu ca
CRM là chuyn i nhng khách hàng không mang li li nhun thành nhng
khách hàng mang li li nhun [11].
i dung ca lun vn bao gm các phn sau:
Giám c a ra nhng quyt nh nhanh chóng, chính xác cho hot ng sn xut
kinh doanh ca doanh nghip mình.
Theo kt qu nghiên cu ca 2 chuyên gia là Paul Gray và Jongbok Byun,
trng Claremont Graduate School, khi trin khai DW và CRM thành công, doanh
nghip sc hng rt nhiu li ích nh:
Có th tit kim chi phí tip cn khách hàng mi (thng cao hn gp 5-10
n) nh duy trì c mi quan h tt vi khách hàng hin ti.
t c s tha mãn và trung thành ca khách hàng. u này rt có li vì
khách hàng trung thành thng có xu hng quay tr li mua và ít quan tâm
i giá c hn khách hàng mi.
ng li nhun: Mt công ty c tng thêm 5% khách hàng trung thành thì
có th tng 25% n hn 100% li nhun tùy theo các ngành ngh kinh
doanh.
ng cng hiu qu hot ng qun lý công ty nh h thng quy trình rõ
ràng trong CRM bt buc các nhân viên (NV) phi tuân th quy nh v báo
cáo tình hình ca tng b phn.
Sau ây là các li ích ca vic trin khai CRM thành công c thu thp và
ng kt t mt cuc kho sát rng rãi ca các nghiên cu CRM gn ây [2]:
i thin kh nng hng mc tiêu khách hàng có li nhun.
Tích hp các dch v qua các kênh.
i thin lc lng bán hàng hiu qu và t nng sut cao.
- 4 -
c thù hóa các thông p marketing.
Tùy bin các sn phm và dch v.
i thin dch v khách hàng hiu qu và t nng sut cao.
i thin v giá c.
i lý do ó, tài này s nghiên cu sâu hn v vic ng dng kho d liu
và mi quan h khách hàng nhm giúp doanh nghip có cái nhìn rõ hn v tình hình
kinh doanh ca doanh nghip mình và có nhng phân tích kt qu kinh doanh thông
dng công c OLAP trên b công c Visual Studio 2005 khai
thác d liu trên kho d liu.
dng d án báo cáo ca b công c Visual Studio 2005 phân tích
liu t kho d liu.
1.5. Tóm tt kt qut c:
Lý thuyt:
lý thuyt v kho d liu và mi quan h khách hàng.
n phm:
t CSDL kho d liu v doanh thu ca doanh nghip.
t chng trình khai thác d liu ca kho d liu da trên k thut
OLAP.
t d án báo cáo phân tích tình hình kinh doanh ca doanh nghip.
- 6 -
CHNG 2
S LÝ THUYT
2.1. Lý thuyt kho d liu:
2.1.1. nh ngha và các c m ca kho d liu:
Vic tin hc hoá các quy trình kinh doanh; công ngh tiên tin trong truyn ti
và lu tr d liu; công c qun lý c s d liu mnh mã m ra nhng kh nng
i trong các thao tác và phân tích d liu. Các nhà qun lý doanh nghip ang háo
c khám phá nhng kho d liu hin ti và quá kh xác nh xu hng phát
trin và các hình mu trong vic kinh doanh. H hy vng vic khai thác d liu và
ngi qun tr và nhà qun lý doanh nghip v vic quyt nh cách lu tr
liu trong kho d liu trong bao lâu. Ví d: 1 nm, 3 nm, 5 nm,…
n nh (Non-Volatile): có ngha là s không có vic cp nht d liu c
u tr trong kho d liu mà thay vào ó là các thông tin c t chc
hin th các thay i ca d liu ó. D liu trong kho d liu c s dng
cho vic phân tích nên các thao tác cp nht hay xóa d liu có th làm nh
ng ti vic phân tích này. Vì vy, nói chung là d liu trong DW không
bao gic cp nht hay xóa b. Bt c khi nào mt thuc tính c th
hoc mc d liu c cp nht ti ngun thì phiên bn mi ca nó c
u tr trong DW vô hiu phiên bn d liu c.
Trc tiên, chúng ta s tp trung vào các mc tiêu c bn ca DW. Các mc
tiêu này c phát trin da trên các yêu cu và vic qun lý kinh doanh.
DW phi làm sao d liu ca DN c truy cp mt cách d dàng.
i dung ca DW phi d hiu. D liu phi trc quan và rõ ràng i vi
ngi kinh doanh ch không n thun ch cho các nhà phát trin. D hiu
ng ý là mc dc, ni dung ca DW cn c xác nh là có ý ngha.
Doanh nhân mun tách ra và kt hp li d liu trong kho theo cách kt hp
vô tn, quá trình thng c gi là chiu và chn. Các công c truy cp
vào DW phi n gin và d s dng. Chúng cng phi tr li kt qu truy
n cho ngi s dng vi thi gian chi là ti thiu.
DW phi trình bày thông tin ca DN mt cách nht quán. D liu trong
kho phi áng tin cy. D liu phi c thu thp mt cách cn thn t
nhiu ngun khác nhau ngoài DN, c làm sch, m bo cht lng và
- 8 -
c s dng ch khi nó phù hp vi tiêu chí ca ngi s dng. Thông tin
mt quá trình kinh doanh phi phù hp vi thông tin t ni khác. Nu hai
bin pháp thc hin có cùng tên thì chúng phi có ngha là cùng mt th.
Ngc li, nu hai bin pháp này không ging nhau thì chúng phi c
dán nhãn khác nhau. Thông tin nht quán có ngha là thông tin cht lng
phân tích tr nên d dàng và trc quan cho ngi qun tr doanh nghip và giúp h
thc hin công vic da trên các quyt nh kinh doanh. Hay nói cách khác, mc
tiêu chính ca DW là cung cp mt kho lu tr d liu hp nht, linh hot, có ý
ngha cho ngi dùng trong vic phân tích, báo cáo và h tr ra quyt nh. Tt c
các mc tiêu khác ca DW u có ngun gc t mc tiêu chính này. Tuy nhiên, v
phía ngi s dng hoc doanh nghip vn có khó khn trong vic phân tích, khai
thác, t chc kho d liu, các khó khn thng gp là:
Không th tìm thy d liu cn thit: D liu ri rác rt nhiu h thng
i các giao din và công c khác nhau, khin tn nhiu thi gian chuyn t
thng này sang h thng khác. Có th có nhiu ngun thông tin áp ng
c òi hi, nhng chúng li có nhng khác bit và khó phát hin thông
tin nào là úng.
Không th ly ra c d liu cn thit: Thng xuyên phi có chuyên gia
tr giúp, dn n công vic b dn ng. Có nhng loi thông tin không
th ly ra c nu không m rng kh nng làm vic ca h thng có
n.
Không th hiu d liu tìm thy: Mô t d liu nghèo nàn và thng xa ri
i các thut ng nghip v quen thuc.
Không th s dng c d liu tìm thy: Kt qu thng không áp ng
bn cht d liu và thi gian tìm kim. D liu phi chuyn i bng tay
vào môi trng làm vic ca ngi s dng [12].
2.1.2. Mc tiêu ca kho d liu:
Trc khi i vào chi tit ca các thành phn kho d liu, chúng ta s tìm hiu
các mc tiêu c bn ca kho d liu. Các ch ny sinh có th xy ra là:
Chúng ta có c núi d liu nhng không th truy cp c.
Chúng ta cn ct và chia nh d liu bng mi cách.
i ngi có th d dàng ly d liu mt cách trc tip.
Cho bit ch nhng thành phn quan trng.
- 10 -
hoc d liu mi c thêm vào kho. Nu d liu mô t trong kho d liu c
thay i thì chúng ta phi gii thích cho nhng thay i mt cách thích hp.
Kho d liu phi là mt phng tin an toàn bo v tài sn thông tin
a DN. Viên ngc thông tin quý giá ca mt t chc c lu tr trong kho d
liu. mc ti thiu, kho d liu ging nh ni cha thông tin v nhng gì
chúng ta ang bán cho ai ó vi mt mc giá nào ó – mt mi nguy hi tim n
trong tay nhng ngi xu. Kho d liu phi kim soát vic truy cp vào thông tin
bí mt ca t chc mt cách hiu qu.
Kho d liu phi phc v nh là nn tng cho s ci thin vic ra quyt
nh. Kho d liu phi có d liu chính xác h tr quá trình ra quyt nh. Ch
có mt s tht u ra duy nht t mt kho d liu: các quyt nh c a ra sau
khi kho d liu ã a ra bng chng ca nó.
ng ng doanh nghip phi chp nhn kho d liu nu nó là c coi
là thành công. Vic chúng ta ã xây dng mt gii pháp p mt s dng các sn
phm và nn tng tt là u không quan trng. Nu cng ng doanh nghip không
chp nhn kho d liu và tip tc s dng nó tích cc 6 tháng sau khi ào to thì
vic nghim thu là tht bi. Không ging nh vic vit li mt h thng, ni ngi
dùng không có s la chn nào khác là phi s dng h thng mi, nhng s
ng h thng mi, vic s dng kho d liu ôi khi là tùy chn. Sn gin hóa
d dàng c ngi s dng chp nhn hn.
- 12 -
a kho d
li
u(Ngu
n: [11])
- 13 -
nhiên, có ít u t cho vic chia s d liu chung nh sn phm, khách
hàng, a lý. Nu h thng ngun d liu ang c tái cu trúc li có cái
nhìn nht quán thì s là u tuyt vi. Vic n lc tích hp các ng dng ca
doanh nghip nh th s làm cho vic thit k kho d liu d dàng hn nhiu.
Khu vc tng d liu (Data Staging Area): khu vc tng d liu ca kho d
liu là cp ti c vic lu tr và các qui trình x lí ph bin nh là trích
xut-chuyn i-np d liu. Khu vc tng d liu là tt c mi th gia các
thng ngun d liu và khu vc trình bày d liu. Trong kho d liu, d
liu làm vic thô c chuyn i vào kho d liu chuyn giao cho ngi
dng có yêu cu truy vn và s dng. Do ó, ngi dùng s không c
phép truy cp vào khu vc tng d liu này. Khu vc tng d liu b chi phi
i các hot ng n gin là phân loi và x lý tun t. Trong nhiu trng
p, khu vc tng d liu không da trên công ngh liên quan mà thay vào ó
là bao gm mt h thng các tp tin. Sau khi xác nhn d liu cho phù hp vi
nhng quy tc công vic c nh ngha là mt-mt và mt-nhiu, thì bc
thông. Vic s dng các mô hình chun hóa trong khu vc trình bày d liu
a kho d liu s phá toàn b mc ích ca kho d liu, c th là, truy vn
liu trc quan và hiu sut cao.
Thay vào ó, mô hình chiu gii quyt các vn v lc phc tp trong
khu vc trình bày d liu. Mt mô hình chiu cha các thông tin ging nh
t mô hình chun hóa, nhng gói d liu trong nh dng thit k vi mc
c tiêu là làm cho ngi dùng d hiu, tng hiu sut truy vn và thay i
linh hot.
Trong mô hình chiu, có hai thut ng hay c s dng, ó là: bng s kin
(fact tables) và bng chiu d liu (dimension tables).
ng s kin (fact tables): mt bng s kin là mt bng chính trong mô
hình chiu có chc nng lu tr các d liu tng hp cho quá trình hot
ng. Ngi dùng c gng lu tr d liu tng hp t kt qu ca mt
quá trình công vic trong mt data mart n l. Bi vì d liu tng hp a
phn là ln nht trong bt k data mart nào nên cn tránh vic lp li nhiu
i khác.
- 15 - Vic s dng thut ng kin là trình bày ln ca d liu. Chúng ta
có th tng tng là t mt th trng bit c sn phm ang c bán ra
i s lng bao nhiêu và doanh s mi ngày cho mi sn phm trong mi
a hàng nh th nào. ln d liu c thc hin ti các giao m ca
t c các chiu (ngày, sn phm và ca hàng). Danh sách các chiu s xác
nh c tính ca bng s kin tng hp và cho ta bit phm vi ca công vic
là gì.
Hình 2.3 B
ng chi
u d
li
u(Ngun: tác gi)
- 16 -
Thuc tính ca bng chiu d liu óng vai trò quan trng trong kho d liu.
i vì chúng là ngun gc ca hu ht tt c các ràng buc và d liu báo
cáo, nên chúng là chìa khóa làm cho kho d liu d hiu và d s dng. Sc
nh ca kho d liu là t l thun vi cht lng và chiu sâu ca các thuc
tính ca bng chiu d liu. Thi gian dành cho vic cung cp các thuc tính
i mô t k thut rõ ràng càng nhiu thì kho d liu càng tt. Thi gian
dành cho vic tính toán giá tr trong mt ct thuc tính càng nhiu thì kho d
liu càng tt. Thi gian dành cho vic m bo cht lng giá tr trong mt
t thuc tính càng nhiu thì kho d liu càng tt.
Công c truy cp d liu (Data Access Tools): thành phn chính cui cùng
trong môi trng kho d liu là các công c truy cp d liu. Vic s dng
thut ng công c là cp n sa dng v kh nng có thc cung