Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 1
MC LC
MC LC 1
LI M U 3
PHN 1: TNG QUAN BIU DIN TRI THC VÀ C S D LIU A
PHNG TIN 4
1
Biu din tri thc 4
2
C s d liu a phng tin 5
PHN 2: MÔ HÌNH NG NGHA VÀ BIU DIN TRI THC TRONG C
S D LIU HÌNH NH 7
Phân on và phân tích video 23
3
Duyt và phân nhóm d a trên biu tng 25
4
Nhn dng i tng 26
5
Phát hin chuyn d!ng 26
6
Mô hình s kin d a trên tri thc 27
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 2
7
Kt lun 33
PHN 4: MÔ HÌNH TÀI LIU A PHNG TIN 36
1
Theo r&t nhi∋u (nh ngh)a, tri thc (knowledge) là kin thc mà con ng∗i
hiu và bit. Nhng gì mà con ng∗i c+m nhn qua th c t khách quan là nhng
d liu dng thô. Qua x, lý, d liu này chuyn thành thông tin. Tuy nhiên,
thông tin v−n t.n ti !c lp vi t duy c#a con ng∗i. Ph+i sau khi con ng∗i
tip nhn thông tin, x, lý thông tin, n/m b/t và nghiên cu thì thông tin mi tr
thành tri thc c#a riêng mình. i∋u ó lý gi+i vì sao cùng m!t lng thông tin
nhng m0i cá nhân li có nhng tri thc khác nhau. D a vào tri thc, vn d1ng
tri thc mà tính sáng to mi n+y sinh mang li nhng kt qu+ c1 th ph1c v1
cu!c sng con ng∗i.
a tri thc c#a con ng∗i vào máy tính thì chúng ta c2n ph+i biu din
tri thc di dng mà máy tính có th hiu c. M0i loi tri thc có m!t cách
biu din khác nhau.
Trong th∗i i bùng n∀ thông tin, d liu a phng tin ngày càng tr nên
ph∀ bin và vic biu din tri thc cho c s d liu a phng tin tr nên c&p
thit hn bao gi∗ ht. ây c3ng là lý do chính em th c hin ∋ tài này.
Tuy ã có nhi∋u c g/ng nhng do hn ch v∋ kinh nghim, kin thc, th∗i
gian và ngu.n tài liu tham kh+o nên các v&n ∋ tìm hiu trong bài thu hoch
ch/c ch/n còn nhi∋u thiu sót. Kính mong Th4y xem xét và góp ý thêm.
Em xin chân thành cám n Thy!
Trng Lê Minh Ngc
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 4
• Frames, Class: Là c&u trúc d liu th hin tri thc a dng v∋
khái nim hay i tng nào ó.
2 C s d liu a phng tin
C s d liu multimedia là ∋ tài nghiên cu sâu r!ng trong sut nhi∋u
nm qua. S quan tâm n l)nh v c này tng lên nhanh chóng vi s phát trin
liên t1c c#a công ngh vin thông và tin h5c. M!t s ng d1ng trong y h5c t: xa,
th vin k9 thut s, h5c t: xa, du l(ch, phân phi CAD/CAM, GIS d kin s7
s, d1ng h thng c s d liu a phng tin. Vi s phát trin nhanh chóng
c#a các trang web, các ng d1ng này ang nhanh chóng n∀i lên. Không ging
nh các c s d liu truy∋n thng alphanu Meric, c s d liu a phng tin
òi h;i thao tác vi các i tng phc tp bao g.m vn b+n, hình +nh, . h5a,
âm thanh, âm nhc và d liu video full-motion.
D liu tr:u tng là thành ph4n thit yu c#a quá trình mô hình hóa, và
yêu c4u s, d1ng biu din tri thc và ng ngh)a không gian th∗i gian. Biu din
này có th khác nhau v∋ ! chính xác và mp m∗ trong x, lý truy v&n khác nhau,
t: r&t c1 th cho n r&t chung chung.
Ngoài vic qu+n lý phng tin truy∋n thông riêng bit, c4n ph+i phát
trin mô hình to ra các i tng phc tp và tài liu a phng tin. Các mô
hình này òi h;i liên kt ch8t ch7 vi h thng qu+n lý c s d liu c b+n nh:
hình +nh, âm thanh, vn b+n và video. Mô hình không gian – th∗i gian có hai
m1c tiêu. Th nh&t, nó d−n n vic thit k thut toán ph1c h.i hiu qu+ cho các
loi d liu a phng tin khác nhau. Th hai, nó cung c&p c s cho phát trin
lp ch< m1c và tìm kim. Tích hp các mô hình tr:u tng hóa thông tin c&p !
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 6
cao hn nh hypermedia, ho8c các mô hình hng i tng là c4n thit cho
phép ng∗i dùng tìm kim và duyt kho lu tr d liu ln này.
trong mô hình yêu c4u c#a ng∗i s, d1ng c4n ph+i c xác (nh phù hp i
vi các tính nng c lu tr trong c s d liu. Nói cách khác, mô hình kt
hp c4n ph+i c s, d1ng tìm các ph4n c#a hình +nh tng t nh m!t
khuôn m−u nh&t (nh ho8c vi các phiên b+n bin dng c#a mô hình nh&t (nh.
Trong bi c+nh này, s bin dng c#a các mô hình bao g.m m r!ng quy mô,
luân chuyn, xoay chuyn và kéo dài c#a mô hình ã cho.
Các v&n ∋ c#a mô hình kt hp trong c s d liu hình +nh ã c tích
c c nghiên cu trong nhi∋u nm. M!t cách tip cn in hình là trích xu&t m!t
tp hp các tính nng súc tích mô t+ các mô hình ã cho, và sau ó tìm kim các
tính nng này trong hình +nh. Khai thác tính nng c#a các vector c3ng ã c
nghiên cu trong m!t s thit lp chuyên ngành ch6ng hn nh nhn dng khuôn
m8t và nhn dng ký t . Tuy nhiên, ch< g4n ây các nhà nghiên cu b/t 4u gi+i
quyt các v&n ∋ khai thác tính nng t !ng cho c s d liu a phng tin
cho nhi∋u i tng. Tính nng hình +nh bao g.m các màu s/c, kt c&u, hình
dng, cnh Nhng tính nng này c ánh x vào m!t không gian 8c trng a
chi∋u có th cho phép nhn dng tng t d a trên hình +nh. Các tính nng trong
m!t hình +nh có th c phân loi nh global hay local. Các tính nng global
nói chung nh&n mnh k9 thut m−u phù hp "coarse-grained". Các k9 thut khai
thác tính nng global bin ∀i hình +nh thành " functional representation". Trong
tr∗ng hp này, chi tit tt hn trong t:ng ph4n c#a hình +nh c b; qua. Màu
biu ., Fast Fourier Transform, Hough transform và giá tr( riêng là nhng k9
thut n∀i ting. Hình sau là ví d1 v∋ biu . in hình c#a m!t hình +nh. Biu .
nh vy có th c lu tr nh là m!t ch ký g4n úng cho hình +nh, và c
s, d1ng trong mô hình kt hp tip theo.
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 9
màu xám quy mô c#a im +nh, màu s/c, hình dng và kt c&u. S kt hp c#a
các tính nng khác nhau có th c quy (nh ti th∗i im xây d ng các truy
v&n c s d liu. Vùng phân on c tip t1c phân tích bi các lp nhn dng
i tng xác (nh các i tng vi mc ! ng ngh)a cao hn.
Kt hp kin thc v∋ i tng vi các tính nng local có th tng !
chính xác lp ch< m1c và c ch tìm kim. Các bin pháp nh kho+ng cách
Minkowski, kho+ng cách tr5ng s, màu s/c giao im biu ., và kho+ng cách
trung bình có th c s, d1ng ánh giá tính mnh m7 c#a c ch. Vic th c
hin tìm kim tng t ph1 thu!c vào mc ! c#a s thiu chính xác và mp m∗
c gii thiu bi các loi tính nng s, d1ng và 8c im tính toán c#a thut
toán tìm kim. Các thut toán nhanh hn yêu c4u có thêm các tính nng hình +nh
và do ó cung c&p kt qu+ kém chính xác. S l a ch5n tính nng, c ch khai
thác và quá trình tìm kim ph1 thu!c t:ng domain c1 th. Ví d1, các ng d1ng a
phng tin cho X-quang, GIS… òi h;i tính nng không gian, ch6ng hn nh
hình dng và kích thc. M8t khác, 8c im màu s/c phù hp hn trong các ng
d1ng liên quan n hình +nh MMR, tranh v7…
Các h thng khác nhau ã c khai báo s, d1ng lp khai thác tính
nng tng t hình 1. Ví d1, trong Query By Image Content (QBIC), tính nng
màu s/c, hình dng và kt c&u c s, d1ng ph1c h.i hình +nh. Phng pháp
phân m+nh t !ng hình +nh c s, d1ng xác (nh các i tng trong hình
+nh vi vài i tng cn c+nh trên n∋n tách r∗i. H thng QBIC cho phép truy
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 11
v&n c s d liu b=ng cách phác th+o các tính nng và màu s/c cung c&p thông
tin v∋ các i tng mong mun.
Chabot là m!t h thng s, d1ng kt hp màu s/c và các thu!c tính chú
thích vn b+n cho truy xu&t hình +nh. Chabot s, d1ng khái nim "concept query",
tng quan c s, d1ng trong k9 thut m−u c (nh phù hp. Trong k9 thut
subtraction hình +nh, s khác bit v∋ c∗ng ! gia các hình +nh và m−u c s,
d1ng trong nhn dng i tng. Các v( trí m−u c xác (nh kho+ng cách gia
các m−u và các v( trí khác nhau trong hình +nh. M8c dù k9 thut subtraction hình
+nh òi h;i th∗i gian tính toán ít hn k9 thut tng quan, nhng k9 thut này
th c hin tt trong môi tr∗ng hn ch ch6ng hn nh c∗ng ! hình +nh gia
m−u và hình +nh có cha m−u này ∋u ging nhau. M!t ng d1ng minh h5a s,
d1ng k9 thut subtraction là c s d liu hình +nh X-ray, vì hình +nh m1c tiêu
có góc nhìn c (nh và c∗ng ! hình +nh không thay ∀i áng k.
Phng pháp tip cn m−u bin dng phù hp thích hp cho các tr∗ng
hp mà các i tng trong c s d liu có th thay ∀i do bin dng cng nh/c
và nonrigid. Trong phng pháp này, m!t m−u c biu din nh là m!t bitmap
mô t+ các ∗ng vi∋n 8c trng ho8c cnh c#a hình dng i tng. Bin ∀i trên
các ∗ng vi∋n nguyên m−u c áp d1ng cho bin dng m−u phù hp vi các
cnh n∀i bt trong hình +nh 4u vào. M!t hàm i tng vi các thông s chuyn
∀i và thay ∀i hình dng c#a các m−u c xây d ng ph+n ánh chi phí bin ∀i.
Hàm i tng c gi+m thiu b=ng cách l8p i l8p li cp nht các thông s
bin ∀i phù hp tt nh&t vi i tng. Các ng d1ng c#a k9 thut phù hp
vi m−u bin dng bao g.m nhn dng ký t vit tay và phát hin chuyn !ng
c#a các i tng trong khung hình video.
Mc ! mp m∗ và thiu chính xác trong nhn dng i tng là không
th tránh kh;i và c4n c b∀ xung các bin pháp tng t tng t> l thành
công c#a các truy v&n và không loi tr: các ng viên tt. Vì vy, kim tra các
hình +nh 4u ra nói chung là không th tránh kh;i. Ví d1, các i tng y t ch<
thu!c v∋ bnh nhân trong m!t nhóm tu∀i nh;, c xác (nh t !ng trong
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 13
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 14
m!t s các nguyên m−u. Tuy nhiên do thiu các mô hình chính xác i din cho
i tng và s phc tp c#a các thut toán x, lý hình +nh làm cho vic phát
trin qu+n lý hình +nh t !ng và h thng tìm kim d a trên n!i dung là m!t
nhim v1 4y th, thách.
4 Mô hình không gian và lp biu din tri thc
Các chc nng chính c#a lp này là duy trì domain kin thc cho biu
din ng ngh)a không gian liên kt vi c s d liu hình +nh. Truy v&n c&p !
này th∗ng mô t+ trong t nhiên, và tp trung ch# yu trên ng ngh)a và khái
nim xu&t hin trong c s d liu hình +nh. i vi h4u ht các ng d1ng, ng
ngh)a c&p ! này d a trên "s kin không gian" mô t+ v( trí tng i c#a
nhi∋u i tng. Ng ngh)a này c s, d1ng cho lp ch< m1c c&p cao và tìm
kim d a trên n!i dung c#a hình +nh. Các ng d1ng ph∀ bin nh&t s, d1ng ng
ngh)a không gian và ph1c h.i d a trên n!i dung là c s d liu b+n . và h
thng thông tin (a lý (GIS). ây là loi h thng c s, d1ng r!ng rãi trong
các k(ch b+n quy hoch ô th( và qu+n lý tài nguyên. Trong các ng d1ng X-
quang lâm sàng, kích thc và v( trí tng i c#a các i tng là r&t quan tr5ng
ch2n oán và i∋u tr( bnh. M!t s ví d1 truy v&n trong ng d1ng này bao
g.m:
• “L&y t&t c+ hình +nh cha m!t khi u ln trong não”
• "Tìm hình +nh mà các !ng mch chính b( ch8n 40%"
K9 thut này nh=m m1c ích suy lun thông tin mi liên quan n b+n
ch&t tin hóa c#a d liu.
Cách tip cn chung mô hình hóa ng ngh)a không gian cho các ng
d1ng d a vào vic xác (nh mi quan h không gian gia các i tng khi
chúng c nhn dng và c ánh d&u bi các lp th&p hn b=ng cách s, d1ng
khung gii hn ho8c khi lng. Mi quan h không gian có th becoded b=ng
th(. Kin thc biu din bi v( t: c b∀ sung các thông tin th# t1c. Ràng bu!c
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 16
là mi quan h gia hai hay nhi∋u i tng c4n ph+i c th;a mãn. M!t ví d1
c#a phng pháp này là h thng PICTION. Kin trúc c#a nó bao g.m m!t
module s, lý ngôn ng t nhiên (NLP), module tìm hiu hình +nh (IU) và m!t
module i∋u khin. Kin trúc này có chc nng tng t nh trong hình 1. H
thng s, d1ng s kt hp chú thích vn b+n và k9 thut x, lý hình +nh nhn din
khuôn m8t và xác (nh v( trí tng i c#a ng∗i trong hình +nh. Trong phng
pháp này, m!t tp các ràng bu!c b/t ngu.n bi các module NLP t: chú thích
hình +nh. Module i∋u khin duy trì các gii hn c to ra bi module NLP và
hành vi nh là c s kin thc cho các module IU th c hin các chc nng
nhn din khuôn m8t. Hình 3a cho th&y m!t hình +nh ví d1 vi chú thích: "
phía trc c#a tòa nhà k9 thut in, Francis Day ang ng bên ph+i Jaehyung
Yang". Kt qu+ c#a vic s, d1ng k9 thut x, lý hình +nh xác (nh v( trí ng c,
viên có th cho khuôn m8t c th hin trong hình 3b. ng d1ng x, lý ngôn
ng t nhiên chú thích to ra các . th( gii hn c hin th( trong hình 3c.
Hình 3d cho th&y kt qu+ c#a vic áp d1ng các ràng bu!c i vi nhng khuôn
m8t ng c, viên. M!t h thng nh vy phù hp cho nhng ng d1ng c s d
liu hình +nh, thông tin mô t+ 4y # các hình +nh có s?n. M!t ng d1ng quan
tr5ng c#a phng pháp này là qu+n lý c s d liu tiêu ∋ tin tc hình
+nh/video.
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 17
Hình 4
4.4 H thng phân cp
M!t loi biu din tri thc khác là phân c&p bao g.m nhóm các i tng
có liên quan v∋ ng ngh)a. Cách tip cn này là (nh hng và s, d1ng các lp
khái nim và các thu!c tính i din cho kin thc domain. Nhng khái nim này
có th biu din cho các tính nng hình +nh, ng ngh)a c&p cao, phng thc khai
thác ng ngh)a và i∋u kin. Các phng thc và i∋u kin c s, d1ng xây
d ng các truy v&n mô t+ liên quan n tính nng và phm vi c#a các giá tr( cho
các i tng. Là m!t hình thc phân c&p, phng pháp này khin nó tr thành
mô hình hng i tng !c áo.
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 19
4.5 Frame
Frame c s, d1ng biu din tri thc có liên quan n i tng c1
th, tình hung, ho8c các khái nim. Frame th∗ng bao g.m tên và danh sách các
c8p giá tr( thu!c tính. Frame có th c kt hp vi m!t lp các i tng ho8c
m!t lp khái nim. Cách tip cn d a trên frame biu din tri thc thông qua các
phng tin truy∋n thông tr:u tng c ∋ xu&t. Tr:u tng hóa frame cho
phép óng gói tên tp tin, tính nng, và các thu!c tính có liên quan c#a các i
tng hình +nh.
5 Kt lun
B+ng 1 tóm t/t các 8c im c#a m!t s h thng c s d liu hình +nh
prototyped. H thng c s d liu hình +nh t !ng có kh+ nng h0 tr các l)nh
v c b&t k≅ là m!t nhim v1 4y thách thc do nhng hn ch c#a mô hình x, lý
hình +nh biu din tri thc hin có.
Tiu lun: Biu din tri thc và ng dng
PHN 3: MÔ HÌNH NG NGHA VÀ BIU DIN TRI
THC TRONG C S D LIU VIDEO
1 Gii thiu
Các 8c tính quan tr5ng c#a d liu video khác vi c s d liu
isochronous nh vn b+n, hình +nh và b+n . là chi∋u th∗i gian c#a nó. Bên cnh
ng ngh)a không gian, các s kin video th∗ng có mc ! cao c#a n!i dung th∗i
gian. M!t ví d1 v∋ truy v&n video liên quan n ng ngh)a không gian – th∗i gian
là:
• "Tìm video clip vi s kin bàn th/ng."
Cân nh/c quan tr5ng trong mô hình d liu video là 8c im c#a ng
ngh)a, phát trin các c ch lp ch< m1c. M!t v&n ∋ quan tr5ng là gi+i quyt tính
không .ng nh&t ng ngh)a có th phát sinh do s khác bit trong cách din gi+i
thông tin trong m!t video clip c#a các b! khác nhau c#a ng∗i s, d1ng. Tính
không .ng nh&t ng ngh)a ã c chng minh là m!t v&n ∋ khó khn trong c
s d liu thông th∗ng, vi s .ng thun ít ho8c không có cách nào gi+i
quyt nó trong th c t. Trong bi c+nh c s d liu video, v&n ∋ tr nên khó
khn hn.
Nói chung, ng ngh)a và các s kin trong d liu video có th c th
hin di dng tác !ng qua li l−n nhau gia các i tng vt lý trong không
gian và th∗i gian. i vi m1c ích mô hình hóa d liu, quan h không gian –
th∗i gian gia các i tng có th c biu din trong m!t c&u trúc ch< m1c
phù hp, sau ó có th c s, d1ng x, lý truy v&n.
Ta xem xét hai tiêu chí phân loi các phng pháp tip cn hin có c#a
mô hình d liu video. D a trên hai tiêu chí này, ta xác (nh nm lp chính c#a
phng pháp ang c s, d1ng trong vic mô hình hóa d liu video nh hình
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 23
Trong cách tip cn so sánh mc pixel, giá tr( màu xám c#a im +nh
các v( trí tng ng trong hai khung riêng bit, liên tip ho8c m!t kho+ng cách
c (nh c s, d1ng nh m!t phng tin o l∗ng s khác nhau gia các giá
tr( pixel. Nu giá tr( này vt quá m!t ngΑng nh&t (nh, thì quy mô màu xám
pixel c gi+ (nh ã thay ∀i. T> l ph4n trm c#a các im +nh có thay ∀i là
s o l∗ng không giôΒng nhau gia các khung hình.
Phng pháp so sánh mc pixel nhy c+m vi m!t s yu t, bao g.m c+
noise c a vào bi quá trình s hóa, chuyn !ng c#a i tng và hiu ng
máy +nh. M!t thay ∀i có th c s, d1ng hn ch +nh hng c#a v&n ∋ này
là chia nh; các khung hình thành các vùng và ch< ch5n m!t s vùng x, lý.
Phng pháp này c g5i là phng pháp t> l kh+ nng, khung c chia
thành các khi. Các khi c#a hai khung hình liên tip c so sánh d a trên m!t
s 8c tính thng kê các giá tr( c∗ng ! c#a chúng, ch6ng hn nh giá tr( trung
bình c#a c∗ng !. Cách tip cn này mnh m7 hn so vi phng pháp tip cn
so sánh mc pixel vi s hin din c#a noise và s di chuyn i tng.
Trong cách tip cn biu . màu, m!t khung c phân tích b=ng cách
phân chia không gian màu thành các màu riêng bit c g5i là thùng và m s
lng im +nh ri vào trong m0i thùng. M!t biu . riêng bit c to cho R,
G, và các thành ph4n màu s/c B hin din trong khung. M!t bin th c#a k9 thut
biu . s, d1ng cách tip cn bình th∗ng hóa mà kt qu+ là s khác bit ln.
Trong vùng nén, phng pháp bin ∀i cosin r∗i rc (DCT) g4n ây ã c ∋
ngh( mang li th là ít tn kém hn trong tính toán. B+ng 2 tóm t/t các phng
pháp tip cn v∋ li th tng i và hn ch c#a chúng.
Tiu lun: Biu din tri thc và ng dng
HVTH: Trng Lê Minh Ngc - CH1101024 Trang: 25
B ng 2