ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
Đại học Thái Nguyên đã tạo điều kiện thuận lợi để em hoàn thành tốt khóa luận.
Học viên
Nguyễn Đông Huy
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
LỜI CAM ĐOAN
Em xin cam đoan những kiến thức trình bày trong luận văn này là do em
tìm hiểu, nghiên cứu và trình bày lại theo cách hiểu của em. Trong quá trình làm
luận văn em có tham khảo các tài liệu liên quan và đã ghi rõ nguồn tài liệu tham
khảo đó. Phần lớn những kiến thức do em trình bày trong luận văn này chƣa đƣợc
LỜI CẢM ƠN 2
LỜI CAM ĐOAN 3
MỤC LỤC 4
DANH SÁCH HÌNH VẼ 6
DANH SÁCH BẢNG BIỂU 8
DANH MỤC CÁC TỪ VIẾT TẮT 9
LỜIMỞ ĐẦU 10
CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 10
1.1. Khai phá dữ liệu và phát hiện tri thức 11
1.1.1. Khai phá dữ liệu 11
1.1.2. Quá trình khám phá tri thức 12
1.1.3. Khai phá dữ liệu và các lĩnh vực liên quan 13
1.1.4. Các kỹ thuật áp dụng trong khai phá dữ liệu 13
1.1.5. Ứng dụng khai phá dữ liệu 15
1.2. Kỹ thuật phân cụm trong khai phá dữ liệu 16
1.2.1. Tổng quan về kỹ thuật phân cụm 16
1.2.2. Ứng dụng của phân cụm dữ liệu 18
1.2.3. Các yêu cầu kỹ thuật đối với phân cụm dữ liệu 19
1.3. Tổng kết chƣơng 1 20
CHƢƠNG 2: MỘT SỐ KỸ THUẬT PHÂN CỤM DỮ LIỆU 21
2.1. Phâncụmphânhoạch 21
2.1.1 Thuật toán k-means 22
2.1.2 Thuật toán PAM 24
2.1.3 Thuật toán CLARA 28
2.1.4 Thuật toán CLARANS 29
2.2. Phân cụm phân cấp 31
2.2.1. Thuật toán BIRCH 32
2.2.2. Thuật toán CURE 35
2.3. Phân cụm dựa trên mật độ 37
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
DANH SÁCH HÌNH VẼ
Hình 1.1.Quátrìnhkhámphátri thức 11
Hình 1.2.Cáclĩnh vựcliênquan đến khámphátri thứctrongCSDL 13
Hình 1.3.Trựcquanhóakết quảKPDLtrongOracle 15
Hình 1.4.Môphỏngsự PCDL 16
Hình 2.1.Thuậttoánk-means 22
Hình 2.2.Hìnhdạngcụmdữ liệu đƣợc khámphábởi k-means 23
Hình2.3.Trƣờnghợp C
jmp
=d(O
j
,O
m,2
) –d(O
j
,O
m
) khôngâm 25
Hình2.4.Trƣờng hợp C
jmp
=(O
j
,O
Hình 2.17.LâncậncủaP với ngƣỡngEps 39
Hình 2.18.Mật độ-đến đƣợctrựctiếp 40
Hình 2.19.Mật độ đến đƣợc 40
Hình 2.20.Mật độ liênthông 41
Hình 2.21.Cụmvà nhiễu 41
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình 2.22.ThuậttoánDBSCAN 42
Hình 2.23.Thứ tự phâncụmcácđối tƣợngtheoOPTICS 43
Hình 2.24.DENCLUEvới hàmphân phối Gaussian 45
Hình2.25.Môhìnhcấutrúcdữliệulƣới 46
Hình2.26.ThuậttoánCLIQUE 48
Hình2.27.QuátrìnhnhậndạngcácôcủaCLIQUE 48 DANH SÁCH BẢNG BIỂU
Hình 3.1. Các trƣờng khai báo dữ liệu 54
Hình 3.2.Dữ liệu khách hàng 55
Hình 3.3.Dữ liệu khách hàng trong SQL Server 56
Hình 3.4.Giao diện chính của chƣơng trình nhập dữ liệu 57
Hình 3.5.Giao diện chọn các tham số cho thuật toán 58
Hình 3.6.Giao diện phân cụm theo thời lƣợng cuộc gọi 58
Hình 3.7.Danh sách các khách hàng thuộc cụm 1 theo thời lƣợng cuộc
gọi 59
Hình 3.8.Danh sách các khách hàng thuộc cụm 2 theo thời lƣợng cuộc
gọi 59
Hình 3.9.Danh sách các khách hàng thuộc cụm 3 theo thời lƣợng cuộc
gọi 59
Hình 3.10.Giao diện phân cụm theo tiền dịch vụ 60
KDD
KnowledgeDiscovery
inDatabase
Khámphá trithứctrongcơ
sởdữliệu
4
KPDL
Datamining
Khaiphá dữliệu
5
KPVB
TextMining
Khaiphávănbản
6
PCDL
DataClustering
Phâncụmdữ liệu
thông.
Phần kết luận của luận văn tổng kết lại những vấn đề đã nghiên cứu, đánh
giá kết quả nghiên cứu, hƣớng phát triển của đề tài.
CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU
11
1.1. Khai phá dữ liệu và phát hiện tri thức
1.1.1. Khai phá dữ liệu
Cuốithậpkỷ80củathếkỷ20,sựpháttriểnrộngkhắpcủacácCSDLđãtạorasựbùngn
ổthôngtintrêntoàncầu,vàothờigiannàyngƣờitabắtđầuđềcậpđếnkháiniệmkhủnghoản
gtrongviệcphântíchdữliệutácnghiệpđểcungcấpthôngtinvớiyêucầuchấtlƣợngngàyc
àngcaochongƣờilàmquyếtđịnhtrongcáctổchứcchínhphủ, tàichính,
thƣơngmại,khoahọc,…
ĐúngnhƣJohnNaisbettđãcảnhbáo“Chúngtađangchìmngậptrongdữliệumàvẫn
đóitrithức”.Lƣợngdữliệukhổnglồnàythựcsựlàmộtnguồntàinguyêncónhiềugiátrịbởi
thôngtinlàyếutốthenchốtphụcvụchomọihoạtđộngquảnlý,kinhdoanh,pháttriểnsảnxu
ấtvàdịchvụ,…nógiúpngƣờiđiềuhànhvàquảnlýcónhữnghiểubiếtvềmôitrƣờngvàtiếnt
rìnhhoạtđộngcủatổchứcmìnhtrƣớckhiraquyếtđịnhđểtác
độngđếnquátrìnhhoạtđộngnhằm đạtđƣợc các mục tiêu mộtcáchhiệuquả
vàbềnvững.
KPDLlàmộtlĩnhvựcmớiđƣợcnghiêncứu,nhằm
tựđộngkhaithácthôngtin,trithứcmớihữuích,tiềmẩntừnhữngCSDLlớnchocácđơnvị,
tổchức,doanhnghiệp,….từđólàmthúcđẩykhảnăngsảnxuất,kinhdoanh,cạnhtranhch
ocácđơnvị,tổchứcnày.Cáckếtquảnghiêncứukhoahọccùngnhữngứngdụngthànhcôn
gtrongKDDchothấyKPDLlàmộtlĩnhvựcpháttriểnbềnvững,manglạinhiềulợiíchvàc
ónhiềutriểnvọng, đồngthờicóƣuthế
hơnhẵnsovớicáccôngcụtìmkiếmphântíchdữliệutruyềnthống.Hiệnnay,KPDLđãứng
dụngngàycàngrộngrãitrongcáclĩnhvựcnhƣthƣơngmại,tàichính,yhọc,
viễnthông,tin–
sinh,….CáckỹthuậtchínhđƣợcápdụngtronglĩnhvựcKPDLphầnlớnđƣợcthừakếtừlĩn
ƣợckhámpháởbƣớctrênđƣợcbiếnđổivàbiểudiễnởmộtdạnggầngũivớingƣờisửdụngn
hƣđồthị,cây,bảngbiểu,luật, Đồngthờibƣớcnàycũng
đánhgiánhữngtrithứckhámphá đƣợc theonhữngtiêuchínhấtđịnh.
1.1.3. Khai phá dữ liệu và các lĩnh vực liên quan
KPDLlàmộtlĩnhvựcliênquantớithốngkê,họcmáy,CSDL,thuậttoán,tínhtoáns
ongsong,thunhậntrithứctừhệchuyêngiavàdữliệutrừutƣợng.Đặctrƣngcủahệthốngkh
ámphátrithứclànhờvàocácphƣơngpháp,thuậttoánvà
kỹthuậttừnhữnglĩnhvựckhácnhauđểKPDL.
LĩnhvựchọcmáyvànhậndạngmẫutrongKDDnghiêncứucáclýthuyếtvàthuậtto
áncủahệthốngđểtríchracácmẫuvàmôhìnhtừdữliệulớn.KDDtậptrungvàoviệcmởrộn
gcáclýthuyếtvàthuậttoánchocácvấnđềtìmracácmẫuđặcbiệt(hữuích hoặc cóthểrútra
trithứcquantrọng)trongCSDL lớn.
Ngoàira,KDDcónhiềuđiểmchungvớithốngkê,đặcbiệtlàphântíchdữliệuthăm
dò(ExploratoryDataAnalysis-
EDA).HệthốngKDDthƣờnggắnnhữngthủtụcthốngkêchomôhìnhdữliệuvàtiếntrìnhn
hiễutrongkhámphátrithứcnóichung.
Mộtlĩnhvựcliênquankháclàphântíchkhodữliệu.Phƣơngphápphổbiếnđểphânt
íchkhodữliệulàOLAP(On-LineAnalyticalProcessing).CáccôngcụOLAP
tậptrungvàophântíchdữ liệuđa chiều.
1.1.4. Các kỹ thuật áp dụng trong khai phá dữ liệu
KDDlàmộtlĩnhvựcliênngành,baogồm:Tổchứcdữliệu,họcmáy,trítuệnhântạo
vàcác khoahọckhác. Sựkếthợpnàycó thểđƣợcdiễntả nhƣsau:
14 Hình 1.2 Các lĩnh vực liên quan đến khám phá tri thức
Đứngtrênquanđiểmcủahọc máy,thìcáckỹthuậttrongKPDL,baogồm:
Họccógiámsát:LàquátrìnhgánnhãnlớpchocácphầntửtrongCSDLdựatrênmột
tậpcácvídụhuấn luyệnvà cácthôngtinvề nhãnlớpđãbiết.
Họckhôngcógiámsát:Làquátrìnhphânchiamộttậpdữliệuthànhcáclớphaycụm
1.1.5. Ứng dụng khai phá dữ liệu
KPDLlàmộtlĩnhvựcđƣợcquantâmvàứngdụngrộngrãi.Mộtsốứngdụngđiểnhì
nhtrongKPDLcóthểliệtkênhƣ sau:Phântíchdữliệuvàhỗtrợraquyếtđịnh,điềutrịy
học,KPVB,khaipháWeb,tin-sinh,tàichínhvàthịtrƣờngchứngkhoán, bảohiểm,
Thƣơngmại:Nhƣphântíchdữliệubánhàngvàthịtrƣờng,phântíchđầutƣ,
pháthiệngianlận,chứngthựchóakháchhàng, dự báoxuhƣớngpháttriển,
Thôngtinsảnxuất:Điềukhiển,lậpkếhoạch,hệthốngquảnlý,phântíchthửnghiệ
m,
Thôngtinkhoahọc:Dự báothờitiết, bảolụt,
độngđất,tinsinhhọc, HiệnnaycáchệquảntrịCSDLđãtíchhợpnhữngmodulđểKPDL
nhƣSQLServer,Oracle,đếnnăm2007MicrosoftđãcungcấpsẵncôngcụKPDLtíchhợp
trongcả MS-Word, MS-Excel,
16 Hình 1.3 Trực quan hóa kết quả KPDL trong Oracle
1.2. Kỹ thuật phân cụm trong khai phá dữ liệu
1.2.1. Tổng quan về kỹ thuật phân cụm
MụcđíchchínhcủaPCDLnhằmkhámphácấutrúccủamẫudữliệuđểthànhlậpcá
cnhómdữliệutừtậpdữliệulớn,theođónóchophépngƣờitađisâuvàophântíchvànghiên
cứuchotừngcụmdữliệunàynhằmkhámphávàtìmkiếmcácthôngtintiềmẩn,hữuíchph
ụcvụchoviệcraquyếtđịnh.Vídụ“nhómcáckháchhàngtrongCSDLngânhàngcóvốnc
ácđầutưvàobấtđộngsảncao”…Nhƣvậy,PCDLlàmộtphƣơngphápxửlýthôngtinqua
ntrọngvàphổbiến,nónhằmkhámphámốiliênhệgiữacácmẫudữliệubằngcáchtổchức
chúngthànhcáccụm.
TacóthểkháiquáthóakháiniệmPCDL
[6][10]:PCDLlàmộtkỹthuậttrongKPDL,nhằmtìmkiếm,pháthiệncáccụm,cácmẫud
ữliệutựnhiên,tiềmẩn,quantrọngtrongtậpdữliệulớntừđócungcấpthôngtin,trithứchữ
uíchchoviệc raquyếtđịnh.
Nhƣvậy,PCDLlàquátrìnhphânchiamộttậpdữliệubanđầuthànhcáccụmdữ
àviệcthaythếgiátrịcủacácthuộctínhcủađốitƣợng"nhiễu"bằnggiátrịthuộctínhtƣơng
ứngcủađốitƣợngdữ liệugầnnhất.
Ngoàira,dòtìmphầntửngoạilailàmộttrongnhữnghƣớngnghiêncứuquantrọngt
rongPCDL,chứcnăngcủanólàxácđịnhmộtnhómnhỏcácđốitƣợngdữ
liệu"khácthường"sovớicác dữliệukháctrongCSDL-tứclàcác
đốitƣợngdữliệukhôngtuântheocáchànhvihoặcmôhìnhdữ liệu-nhằm
tránhsựảnhhƣởngcủachúngtớiquátrìnhvàkếtquảcủaPCDL.Khámphácácphầntửngo
ạilaiđãđƣợcpháttriểnvàứngdụngtrongviễnthông,dòtìmgianlậnthƣơngmại…
Tómlại,PCDLlàmộtvấnđềkhóvìngƣờitaphảiđigiảiquyếtcácvấnđềconcơ
bảnnhƣsau:
- Biểudiễndữ liệu.
- Xây dựnghàmtínhđộtƣơngtự.
- Xây dựngcáctiêuchuẩnphâncụm.
- Xây dựngmôhìnhchocấutrúccụmdữliệu.
- Xây dựngthuậttoán phâncụmvà xác lậpcác điềukiệnkhởitạo.
- Xây dựngcácthủtục biểudiễnvà đánhgiákếtquảphâncụm.
Theocácnghiêncứuthìđếnnaychƣacómộtphƣơngphápphâncụmtổngquátnàoc
óthểgiảiquyếttrọnvẹnchotấtcảcácdạngcấutrúccụmdữliệu.Hơnnữa,cácphƣơngpháp
phâncụmcầncócáchthứcbiểudiễncấutrúccáccụmdữliệukhácnhau,vớimỗicáchthứcb
iểudiễnkhácnhausẽcómộtthuậttoánphâncụmphùhợp.PCDLđanglà
vấnđềmởvàkhóvìngƣờita cần
phảiđigiảiquyếtnhiềuvấnđềcơbảnnhƣđãđềcậpởtrênmộtcáchtrọnvẹnvàphùhợpvớin
hiềudạngdữliệukhácnhau.Đặcbiệtđốivớidữliệuhỗnhợp,đangngàycàngtăngtrƣởngk
hôngngừngtrongcáchệquảntrịdữliệu,đâycũnglàmộttrongnhữngtháchthứclớntrongl
ĩnhvựcKPDLtrongnhữngthậpkỷtiếptheo.
1.2.2. Ứng dụng của phân cụm dữ liệu
PCDLlàmộttrongnhữngcôngcụchínhcủaKPDLđƣợcứngdụngtrongnhiềulĩnh
vựcnhƣthƣơngmạivàkhoahọc.CáckỹthuậtPCDLđãđƣợcápdụngchomộtsốứngdụng
điểnhìnhtrongcác lĩnhvựcsau[10][19]:
ubảnghi).
20
Thíchnghivớicáckiểudữliệukhácnhau:Thuậttoáncóthểápdụnghiệuquảchoviệ
cphâncụmcáctậpdữliệuvớinhiềukiểudữliệukhácnhaunhƣdữliệukiểusố,kiểunhịphâ
n,dữliệuđịnhdanh,hạngmục, vàthíchnghivớikiểudữliệuhỗnhợp.
Khámpháracáccụmvớihìnhthùbấtkỳ:DohầuhếtcácCSDLcóchứanhiềucụmd
ữliệuvớicáchìnhthùkhácnhaunhƣ:hìnhlõm,hìnhcầu,hìnhque,…Vìvậy,đểkhámphá
đƣợccáccụmcótínhtựnhiênthìcácthuậttoánphâncụmcần phảicókhảnăngkhámphá
racác cụmdữ liệucóhìnhthùbấtkỳ.
Tốithiểulượngtrithứccầnchoxácđịnhcácthamsốvào:Docácgiátrịđầuvàothƣờ
ngảnhhƣởngrấtlớnđếnthuậttoánphâncụmvàrấtphứctạpđểxácđịnhcác
giátrịvàothíchhợpđốivớicácCSDL lớn.
Ítnhạycảmvớithứtựcủadữliệuvào:Cùngmộttậpdữliệu,khiđƣavàoxửlýchothu
ậttoánPCDLvớicácthứtựvàocủacácđốitƣợngdữliệuởcáclầnthựchiệnkhácnhauthìkh
ôngảnhhƣởnglớnđếnkếtquảphâncụm.
Khảnăngthíchnghivớidữliệunhiễucao:HầuhếtcácdữliệuphâncụmtrongKPD
Lđềuchứađựngcácdữliệulỗi,dữliệukhôngđầyđủ,dữliệurác.Thuậttoánphâncụmkhôn
gnhữnghiệuquảđốivớicácdữliệunhiễumàcòntránh
dẫnđếnchấtlƣợngphâncụmthấpdonhạycảmvớinhiễu.
Ítnhạycảmvớicácthamsốđầuvào:Nghĩalàgiátrịcủacácthamsốđầuvàokhácnh
auítgâyra các thayđổi lớnđốivớikếtquảphâncụm.
Thíchnghivớidữliệuđachiều:Thuậttoáncókhảnăngápdụnghiệuquảchodữliệu
cósốchiềukhácnhau.
Dễhiểu, dễ càiđặtvàkhảthi.
CácyêucầunàyđồngthờilàcáctiêuchíđểđánhgiáhiệuquảcủacácphƣơngphápP
CDL,đâylànhữngtháchthứcchocácnhànghiêncứutronglĩnhvựcPCDL.
1.3. Tổng kết chƣơng 1
Trong
chƣơng1trìnhbàynhữngkiếnthứccơbảnvềkhaiphádữliệuvàkhámphátrithứctrongCS
chcóthểđƣợc.Chínhvìvậy,trênthựctế ngƣờita thƣờng đi tìmgiải pháptốiƣucục
bộchovấnđềnàybằngcáchsửdụngmộthàmtiêuchuẩnđểđánhgiáchấtlƣợngcủacáccụ
mcũngnhƣđểhƣớngdẫnchoquátrìnhtìmkiếmphânhoạchdữliệu.Vớichiếnlƣợcnày,th
ôngthƣờngngƣờitabắtđầukhởitạomộtphânhoạchbanđầuchotậpdữliệutheophépngẫu
22
nhiênhoặctheoheuristicvàliêntụctinhchỉnhnóchođếnkhithuđƣợcmộtphânhoạchmo
ngmuốn,thoảmãncácđiềukiệnràngbuộcchotrƣớc.Cácthuậttoánphâncụmphânhoạch
cốgắngcảitiếntiêuchuẩnphâncụmbằngcáchtínhcácgiátrịđođộtƣơng
tựgiữacácđốitƣợngdữliệuvàsắpxếpcácgiátrịnày,sauđóthuậttoánlựachọnmộtgiátrịtr
ongdãysắpxếpsaochohàmtiêuchuẩnđạtgiátrịtốithiểu.Nhƣvậy,ýtƣởngchínhcủathuậ
ttoánphâncụmphânhoạchtốiƣucụcbộlàsửdụngchiếnlƣợcănthamđểtìmkiếmnghiệm.
Lớpcácthuậttoánphâncụmphânhoạchbaogồmcácthuậttoánđềxuấtđầutiêntro
nglĩnhvựcKPDLcũnglàcácthuậttoánđƣợcápdụngnhiềutrongthựctếnhƣk-
means,PAM,CLARA,CLARANS.Sauđâylàmộtsốthuậttoánkinhđiểnđƣợckế thừa
sử dụngrộngrãi.
2.1.1 Thuật toán k-means
Thuật toán phân cụm k-means do MacQueen đề xuất trong lĩnh vực thống
kê năm 1967, mục đích của thuật toán k-means là sinh ra k cụm dữ liệu {C
1
,
C
2
, , C
k
) từ một tập dữ liệu ban đầu gồm n đối tƣợng trong không gian d chiều
X
i
=(x
i1,
dùng. Thuật toán k-means bao gồm các bƣớc cơ bản nhƣ sau: INPUT: Một CSDL gồm n đối tƣợng và số các cụm k.
OUTPUT: Các cụm C
i
(i=l, ,k) sao cho hàm tiêu chuẩn E đạt giá trị tối thiểu.
Bƣớc 1: Khởi tạo
Chọn k đối tƣợng mj (j=1 k
) là trọng tâm ban đầu của k cụm từ tập dữ liệu
(việc lựa chọn này có thể là ngẫu nhiên hoặc theo kinh nghiệm).
Bƣớc 2: Tính toán khoảng cách
23 Hình 2.1 Thuật toán k- means
Thuật toán k-means đƣợc chứng minh là hội tụ và có độ phức tạp tính
toán là: 0((n k d) T
fl o p
). Trong đó: n là số đối tƣợng dữ liệu, k là số cụm dữ
medoid để biểu diễn cho các cụm dữ liệu, một đối tƣợng medoid là đối tƣợng
đặt tại vị trí trung tâm nhất bên trong của mỗi cụm. Vì vậy, các đối tƣợng
medoid ít bị ảnh hƣởng của các đối tƣợng ở rất xa trung tâm, trong khi đó các
trọng tâm của thuật toán k -means lại rất bị tác động bởi các điểm xa trung tâm
này. Ban đầu, PAM khởi tạo k đối tƣợng medoid và phân phối các đối tƣợng còn
lại vào các cụm với các đối tƣợng medoid đại diện tƣơng ứng sao cho chúng
tƣơng tự với đối tƣợng medoid trong cụm nhất.
Để xác định các medoid, PAM bắt đầu bằng cách lựa chọn k đối tƣợng
medoid bất kỳ. Sau mỗi bƣớc thực hiện, PAM cố gắng hoán chuyển giữa đối
tƣợng medoid O
m
và một đối tƣợng Op không phải là medoid, miễn là sự hoán
chuyển này nhằm cải tiến chất lƣợng của phân cụm, quá trình này kết thúc khi
25
chất lƣợng phân cụm không thay đổi. Chất lƣợng phân cụm đƣợc đánh giá thông
qua hàm tiêu chuẩn, chất lƣợng phân cụm tốt nhất khi hàm tiêu chuẩn đạt giá trị
tối thiểu.
Để quyết định hoán chuyển hai đối tƣợng O
m
và Op hay không, thuật toán
PAM sử dụng giá trị tồng chi phí hoán chuyển c
jmp
làm căn cứ:
- O
m
: Là đốitƣợng medoid hiện thời cần đƣợc thay thế
- Op : Là đối tƣợng medoid mới thay thế cho O
m
- O
hơn Op (d(O
j
;O
p
)≥ d(Oj, O
m,2
)). Trong khi đó, O
m,2
là đối
tƣợng medoid tƣơng tự xếp thứ 2 tới O
J
trong số các medoid. Trong trƣờng hợp
này, ta thay thế O
m
bởi đối tƣợng medoid mới O
p
và O
j
sẽ thuộc về cụm có đối
tƣợng đại diện là O
m2
. Vì vậy, giá trị hoán chuyển C
jmp
đƣợc xác định nhƣ sau:
C
jmp
= d(O
j
, O
m,2