Luận văn Thạc sỹ Công nghệ thông tin: Tìm hiểu phương pháp phân tích bằng bên trong tài liệu ảnh - Pdf 23

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
   Nguyễn Thị Hiếu

TÌM HIỂU PHƢƠNG PHÁP PHÂN TÍCH BẰNG
BÊN TRONG TÀI LIỆU ẢNH

Luận văn Thạc sỹ Công nghệ thông tin
Thái Nguyên, tháng 11 năm 2009 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

MỤC LỤC

Trang phụ bìa
Lời cảm ơn
MỤC LỤC i
THUẬT NGỮ TIẾNG ANH: iii
DANH MỤ C CÁ C HÌ NH VẼ iv
CHƢƠNG I: MỞ ĐẦU 1
1.1. Cơ sở nghiên cứu và mục đích của luận văn 3
1.2. Tổ chức của luận văn: 4
CHƢƠNG II: TỔNG QUAN VỀ HỆ PHÂN TÍCH TÀI LIỆU ẢNH 5
2.1. Tài liệu ảnh 5
2.2. Hệ phân tích trang tài liệu 5
2.3. Thu thập dữ liệu ảnh 6
2.4. Tiền xử lý điểm ảnh 9
2.4.1. Xử lý nhị phân 10
2.4.2. Giảm nhiễu 11
2.4.3. Phân đoạn ảnh 12
2.4.4. Làm mảnh và xác định vùng 12
2.4.5. M ha CC và vctơ ha 13

4.2.4. Những mặt hạn chế của thuật toán khởi tạo 47
4.3. Các bƣớc xử lý khối sau khi phân đoạn 48
4.3.1. Trộn các khối phân đoạn sai 48
4.3.2. Phân tách các cột bị trộn vào một khối 49
4.3.3. Nhm các từ bị phân tách 52
4.4. Phân tích khối 53
4.5. Xác định cấu trúc các cột, hàng 54
CHƢƠNG 5 CHƢƠNG TRÌ NH THƢ̉ NGHIỆM VÀ MINH HỌ A THUẬ T
TOÁN T-RECS++ 56
5.1. Mô tả chƣơng trình 56
5.2. Mộ t số kế t quả 58
KẾ T LUẬ N VÀ ĐỀ XUẤ T 61
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

THUẬT NGỮ TIẾNG ANH

3 – D
3 Dimensions
CAD
Computer Aided Design
CAM
Computer Aided Manufacturing
CC
Chain Code
CCs
Connected Components
CPU
Control Processing Unit
DP
Dynamic Programming


Hnh 2.1
Sơ đồ quá trì nh xử lý tà i liệ u
Hnh 2.2
Sơ đồ quá trì nh phân tích trang tà i liệ u
Hnh 2.3
Phương pháp nhị phân ảnh. (a) Histogram của ảnh đa cấp xám nguyên
bản, (b) chọn ngưỡng thấp, (c) chọn ngưỡng hợp lý, (d) chọn ngưỡng
quá cao.
Hnh 2.4
Ảnh nguyên bản(Vân tay) bên trái và ảnh sau khi làm mảnh bên phải.
Hnh 2.5
Tài liệu ảnh trưc và sau các bưc tin x lý. Ảnh (a) gốc, ảnh (b) ảnh
sau khi chuyển v ảnh nhị phân, ảnh (c) ảnh sau khi chỉnh nghiêng, ảnh
(d) ảnh sau khi lọc nhiễu.
Hnh 2.6
văn bả n bị nghiêng sau khi đượ c qué t qua má y qué t.
Hnh 2.7
V d minh họa kt quả phân tch bố cc của trang tài liệu ảnh
Hnh 2.8
Chữ viế t tay có thể gây nhầ m lẫ n
Hnh 3.1
V d v các đối tượng văn bản và đối tượng ảnh
Hnh 3.2
Biểu diễn các điểm ảnh giao nhau
Hnh 3.3
Một số trường hợp ngoại lệ
Hnh 3.4
Sơ đồ thuậ t toá n phân tá ch văn bả n
Hnh 3.5

Nhậ n dạ ng khố i văn bả n vớ i T-Recc++
Hnh 5.3
Nhậ n dạ ng tà i liệ u ả nh là bả ng quy chế vớ i T-Recs++
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

Lêi c¶m ¬n
Trong quá trình là m luậ n văn vừ a qua , dướ i sự giú p đỡ và chỉ bả o
nhiệ t tình ca PGS. TS Ngô Quố c Tạ o – Việ n Công nghệ Thông tin – Việ n
khoa họ c Việ t Nam , luậ n văn củ a tôi đã đượ c hoà n thà nh . Mặ c dù đã cố gắ ng
không ngừ ng cng vi s tn tâm ca thy hưng dn song do thi gian v
kh năng vn cn nhiu hn ch nên lun vă n kh trnh khi nhng thiu st
trong quá trình là m luậ n văn .
Để hoà n thà nh đượ c luậ n văn ny. Em xin bà y t lng bit ơn sâu sc
tớ i PGS. TS Ngô Quố c Tạ o - ngườ i thầ y đã tậ n tình giú p đỡ em trong suố t
qu trnh tm hiu , xây dự ng và phá t triể n luậ n văn nà y .
Em xin chân thà nh cả m ơn cá c thầ y , cô giá o trong Việ n Công nghệ
Thông tin – Việ n khoa họ c Việ t N am đã giả ng dạ y và hướ ng dẫ n em trong
suố t 2 năm hc qua. Em cũ ng xin cả m ơn ban lã nh đạ o khoa và toà n thể thầ y
cô giá o trong khoa Công Nghệ thông tin – Đạ i Họ c Thá i Nguyên đã tạ o điề u
kiệ n tố t nhấ t giú p em họ c tậ p và hoà n thà nh luậ n văn nà y . V cui cng tôi
cng xin cm ơn gia đnh , cc bn trong nhm luậ n văn và toà n thể cá c họ c
viên lớ p Cao họ c K 6 đã độ ng viên , quan tâm và giú p đỡ tôi trong thờ i gian
qua.
Cuố i cù ng tôi rấ t mong nhậ n đượ c sự chỉ dẫ n , gp  ca cc thy cô
v cc bn đ lun văn ca tôi đưc hon thin hơn .
d liu nh.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

2

Một ti liu nh l một cch biu diễn trc quan ca cc trang ti liu
đưc in như một bi tp ch, một l thư, một trang bo, một mẩu thư hay một
bn vẽ kỹ thut, .v.v Một ti liu nh c th bao gồm cc chuỗi k t, cc
hnh vẽ, cc bc nh, .v.v Bên cnh vic chuyn ton bộ nội dung ca ti
liu sang ti liu đin tử cng cn phi bo ton cấu trc v định dng ca ti
liu. Mục tiêu cơ bn ca một h phân tch ti liu nh hon chỉnh đ l
chuyn một ti liu lưu tr bằng giấy sang dng biu diễn c th t cấu trc
v nội dung ca n. Ti liu đưc chuyn sang phi c kh năng thay đi,
son tho v lưu tr bởi v nội dung ca ti liu c th truy cp bởi cấu trc
ca n thay v phi truy cp dưi dng nhng mu nh. C một s lưng ln
ng dụng ca h phân tch ti liu nh đưc ng dụng trong cc lĩnh vc như:
dịch vụ bưu chnh, Chnh ph, chăm sc y t, thư vin, v.v.
Mục đch ca lun văn là nghiên cứ u kỹ thuậ t nhậ n dạ ng bả ng và trích
chn ra đi tưng ca ti liu nh. Kỹ thut “Phân tích bng – T-Recs” l
nghiên cứ u chính .
Vi tư tưởng chnh ca “Phương php phân tch bng” đ l không
xem xét đn bất c một loi đưng phân cch no đ xc định cấu trc bng.
Thay vào đ phương php sẽ tp trung vào vic nhn bit cc từ trong cng
một khi logic (chẳng hn cc từ trong cng một cột d liu sẽ đưc cho vo
trong cng một khi). Phương php sẽ không đi tm nhng đặc trưng đ phân
bit hai vng d liu (hai cột) khc nhau m tm nhng đặc trưng đ tm ra
cc từ trong cng một khi logic v từ đ xây dng cấu trc riêng theo
phương php tip cn bottom - up.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

4

1.2. Tổ chức của luận văn
Lun văn đưc trình bày thành 5 chương và 1 phụ lục.
Chương 1 Trình bày tóm tt cơ sở nghiên cu và mục đch cng như
cách t chc ca lun văn.
Chương 2 Tổ ng quan về hệ phân tích tà i liệ u ả nh và cá c thà nh phầ n
chnh trong hệ phân tí ch tà i liệ u ả nh : Lấ y dữ liệ u , xử lý ả nh , trch chn đặc
trưng, nhậ n dạ ng đố i tượ ng ả nh và nhậ n dạ ng văn bả n .
Chương 3 trnh by bi ton phân tch văn bn v nh một cch riêng
rẽ. Trong chương ny một thut ton phân tch văn bn v nh cng sẽ đưc
trnh by da vo vic phân tch cc thnh phn liên thông (CCs).
Chương 4 trình bày phương php phân tch bng ( T-Recs) da trên
nhng hnh ch nht bao quanh một từ v đu ra l cấu trc logic ca khi
văn bn, cụ th vi nhng bng nhn dng đưc sẽ l cấu trc cc cột v cc ô
ca bng d liu. Phân tch nhng mặt hn ch ca thut toán - trưng hp
nhn dng chưa chnh xc cc cột d liu trong bng lun văn đưa ra thut
toán khc phục nhng mặt hn ch đ.
Chương 5 Chương trnh thử nghim v minh ha phân tch bng trong
trang ti liu nh.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

5

CHƢƠNG 2: TỔNG QUAN VỀ HỆ PHÂN TÍ CH TÀ I LIỆ U Ả NH


nhn dng văn bn (có th thêm các thuộc tính như loi phông ch, kích
thưc ca phông ch) bởi phương pháp nhn dng ký t quang hc (OCR).
Phn th hai là xử lý các đi tưng nh là các đi tưng to ra từ các đưng
kẻ trong sơ đồ, các đưng kẻ phân tách gia các đon văn bn, các hình vẽ,
các lôgô ca công ty… Sau khi áp dụng các kỹ thut phân tích nh và văn
bn, các đi tưng cn nhn dng trong tài liu nh đưc trích ra và đưc biu
diễn dưi dng một tài liu định dng khác, chẳng hn như word, html…
Ta có thể tm tt qu trnh xử lý ca h phân tch ti liu theo sơ đồ
Hnh 2.1 [8]: Hnh 2.1 Sơ đồ quá trì nh xử lý tà i liệ u

Ti sao li phi phân tch ti liu ? Nhữ ng bà i toá n trong phầ n giớ i
thiệ u đã đề cậ p , ta hã y xem xé t kỹ hơn về bà i toá n điể n hình để thấ y đượ c sự
cầ n thiế t củ a việ c phân tích tà i liệ u .
- Lượ ng tri thứ c vô giá củ a nhân loạ i vớ i số lượ ng lớ n đượ c lưu trữ
trong cá c thư việ n cổ điể n dướ i cá c chấ t liệ u như giấ y , vi, gỗ vẫ n cò n tồ n tạ i
rấ t nhiề u, việ c cá c tà i liệ u bị mất cc thông tin , thiu thông tin, s lưng bn
Xử l ti liu

đ ph bin. V vy chng cn phi đưc khôi phục v chỉnh sửa bằmg nhng
kỹ thut phân tch ti liu.
- Ngy nay cc văn phng hin đi cc công vic đu đưc gii quyt
dự a và o má y tính . Cc ti liu văn bn vi nhiu đi tưng (chữ , hnh nh ,
cc sơ đồ ) đượ c tạ o ra trên nhiề u m y tnh khc nhau , phầ n mề m khá c nhau
do đó có thể là cá c đị nh dạ ng củ a cá c tà i liệ u đó là không tương thích vớ i
nhau, kch thưc cng khc nhau . Như vậ y cầ n mộ t hệ phân tích tà i liệ u giúp
nhn dng cc loi ti liu, trch chn ra đưc cc phn chc năng v c thể
chuyn từ một định dng my tnh ny sang một định dng khc.
- Mộ t bi ton khc đượ c đề cậ p l cc my phân loi thư t động
dng đ phân loi, sp xp thư v nhn dng địa chỉ thư. Nhng my ny đã
có từ nhng thp kỷ trưc, nhưng ngy nay yêu cu cao hơn đ l xử l nhiu
thư hơn, nhanh hơn v yêu cu chnh độ xc cao hơn.
Nhng bi ton trên đã to ra thch thc v động lc cho s pht trin
nhng gii php trong tương lai ca một h phân tch ti liu.
Hnh 2.2 mô tả cá c bướ c xử lý cho mộ t hệ phân tí ch tà i liệ u [8]. Sau
khi dữ liệ u (ti liu nh ) đượ c đưa và o , ti liu nh tri qua cc bưc xử lý
đim nh v phân tch đặc trưng v sau đ phn nhn dng văn bn và phầ n
nhậ n dạ ng nh đượ c tá ch ra hai chứ c năng riêng rẽ. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

8

Trang tà i liệ u
Xử lý điể m ả nh
Phân tí ch đặ c trưng
Phân tích và nhn
dng đi tưng văn
bn
Phân tích và nhn
dng đi tưng nh
Mô tà i liệ u

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

9

liu giấy l phương tin làm vic hiu qu và chc chn rằng tài liu giấy vn
sẽ l phương tin làm vic vi chúng ta trong một vài thp kỷ na. Vấn đ ở
đây l làm sao chúng ta tích hp nhng tài liu giấy vào trong máy tính xử lý.
Sau đây ta sẽ tm hiu ngn gn cc bưc xử lý ca một h phân tch
ti liu nh.
2.3. Thu nhậ n dƣ̃ liệ u ảnh
Cc d liu trên cc trang ti liu giấy thưng đưc quét qua máy quét
v đưa vo my tnh dưi dng file nh , chng bao gồm cc đim nh (pixels)
v đượ c lưu trữ . Vớ i ả nh nhị phân g i trị đim nh c th l 0 hoặ c 1 ,vớ i nh
đa cấp xm v nh mu giá trị điể m ả nh nằ m trong khoả ng 0 đn 255 vi 3
gi trị R, G, B từ 0 đn 255. Ở độ phân gii thông thưng th c 120 đim nh
trên 1 centimet v vi 1 trang c kch thưc 20 x 30 cm th to ra một nh vi
2400 x 3600 đim nh. Do đ c th thấy rằng một ti liu nh chỉ bao bồm
cc d liu thô (gi trị cc đim nh) v chng sẽ đưc sử dụng nhng kỹ
thut phân tch thch hp đ lấy ra đưc cc thông tin cn thit.
2.4. Tiề n xử l đim ảnh

11

Qu trnh xử l ny sẽ gặ p khó khăn trong các trưng hp khi: độ
tương phn gia giá trị các đim nh văn bn và nn là thấp (chẳng hn như
văn bn đưc son tho trên một nn xám thun nhất), nét ca văn bn mng
hoặc d liu không đưc chiu sáng tt khi thc hin quét tài liu giấy. Rất
nhiu phương pháp đã đưc phát trin đ khc phục nhng hn ch trên,
chẳng hn như phương pháp tách ngưỡng t động tìm ra giá trị θ thích hp đ
chia nh thành hai phn.
2.4.2. Giảm nhiu
Nhiễu trong tài liu nh là do nhiu nguyên nhân bao gồm: s thoái
hoá theo thi gian, qu trnh sao ch ép, quá trình quét tài liu. Một s kỹ thut
xử lý nh sẽ đưc áp dụng đ loi b nhiễu. Sau khi đưc nhị phân hoá, tài
liu nh sẽ đưc lc đ gim nhiễu. Trên thc t tồn ti nhiu loi nhiễu, tuy
nhiên ngưi ta thưng xem xét 3 loi nhiễu chính: nhiễu cộng, nhiễu nhân và
nhiễu xung. Chúng xuất hin như nhng đim nh khác bit so vi vùng xung
quanh, chẳng hn các đim nh nhiễu ON (đim mang thông tin nh) trong
vùng nn OFF (đim mang thông tin nn) hay ngưc li các đim nh OFF
trong vùng nn ON và các cnh gồ gh ca ký t hay các đi tưng nh.
Bn chất ca nhiễu là thưng tương ng vi tn s cao và cơ sở lý
thuyt ca các bộ lc là chỉ cho nhng tín hiu có tn s nào đ thông qua, do
đ đ lc nhiễu ngưi ta thưng sử dụng bộ lc thông thấp hay lc trung bình.
Vi nhiễu cộng v nhiễu nhân ta dng cc bộ lc thông thấp, trung bnh
;
vi nhiễu xung ta dng lc trung vị, gi trung vị.
Trong lc trung bnh, thưng ngưi ta ưu tiên cho cc hưng đ bo v
biên ca nh khi bị m khi lm trơn nh. Cc kiu mặt n đưc sử dụng ty
theo cc trưng hp khc nhau. Cc bộ lc trên l bộ lc tuyn tnh theo nghĩa
l đim nh ở tâm cửa s sẽ đưc thay bởi t hp cc đim lân cn chp vi mặt
n. Lc thông thấp thưng đưc sử dụng đ lm trơn nhiễu.

yu phục vụ cho vic phân tch v nhn dng sau ny thun tin hơn. Chẳng
hn như một đưng kẻ thẳng c th vẽ bằng tay vi độ đm ca nét bt l

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

13

khc nhau nhưng c th biu diễn chng ging nhau. Trong Hnh 2.4 đưa ra ví
dụ nh đưc phân tch bằng phương php lm mnh.

Hnh 2.4 Ảnh nguyên bản(Vân tay) bên trái và ảnh sau khi làm mảnh bên phải.
Lưu  rằng nu một hnh trn hay một hnh vuông m đưc tô kn bởi
cc đim đen th kt qu lm mnh nhng đi tưng trên sẽ l một đim nh
nằm ti tâm ca hnh vẽ bất k kch thưc ca đi tưng l như th no. Do
đ c th thấy rõ rng rằng vic xc định đưc vng biên ca đi tưng l rất
quan trng.
Nói chung vi cc đi tưng c kch thưc ln, d biên l phương
php la chn thch hp đ biu diễn đi tưng, cn đi vi nhng đi tưng
đưc to thnh bởi nhng nét kt ni di th lm mnh l phương php thch
hp hơn. Lm mnh thưng đưc sử dụng như l một qu trnh tin xử l đi
vi nhng ng dụng phân tch ti liu như xử l sơ đồ hay bn đồ. Vi nhng
đi tưng nh ln m vng nh đưc tô đy chẳng hn như nhng lôgô th
phương php d biên đi tưng thch hp hơn. Nhưng vi nhng vng nh,
chẳng hn từng k t riêng bit th cng không phi phương php lm mnh

Sau bưc xử l đim nh, d liu thô ca nh đã đưc biu diễn ở cấp
độ trừu tưng cao hơn: đã khoanh đưc vng bao ca chuỗi k t, biu diễn
CC v véctơ ca cc đưng cong v đưng thẳng, hay đã xc định đưc vng
biên ca cc đi tưng.
Ti liu nh qua cc qu trnh tin xử l sẽ l ti liu cơ sở cho qu
trnh phân tch cấu trc ca ti liu đ . Hnh 2.5 minh ha một ti liu trưc
v sau khi thc hin qu trnh tin xử l. Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

15

Hnh 2.5 Tài liệu ảnh trưc và sau các bưc tin xử lý . Ảnh (a) gốc, ảnh (b)
ảnh sau khi chuyển v ảnh nhị phân, ảnh (c) ảnh sau khi chỉnh nghiêng, ảnh
(d) ảnh sau khi lọc nhiễu.
2.5. Phân tích đặ c trƣng củ a tà i liệ u ả nh
Sau quá xử l trên cc đim nh , cc đặc trưng ca cc đi tưng trên
ti liu nh sẽ đưc trch chn v phân tch đ gip ch cho nhng bưc nhn
dng sau ny. Ti bưc phân tch đặc trưng nh, d liu nh lm mnh v biu
diễn dưi dng CC sẽ đưc phân tch đ xc định cc đưng thẳng, cc đưng

dng k t vit tay hay cc k t trong ti liu in. Kỹ thut phân tch sơ đồ
trnh by đưc p dụng đ phân tch định dng ca trang, một loi ng dụng
phân tch sơ đồ trnh by đ l nhn dng biu mu, gip phân tch v nhn
dng cấu trc biu mu v cc văn bn c trong biu mu. Trong một s
trưng hp ngưi ta cn phi xc định độ nghiêng ca ti liu bởi v ti liu
đưc quét c th bị nghiêng so vi b ngang ca trang giấy trong trưng hp
ti liu đ không đưc đặt đng khi quét vo từ my quét. Ưc lưng độ
nghiêng v phân tch sơ đồ trnh by ca văn bn sẽ đưc mô t ngn gn
trong phn dưi đây. Phương php nhn dng k t quang hc sẽ đưc đ cp
đn ở phn sau.
2.6.1. Xác đnh gc nghiêng của văn bản
Một dng văn bn bao gồm một nhm cc k t, biu tưng v cc từ
nằm lin k nhau, kh gn nhau v đu nằm trên cng một đưng thẳng (c
th theo chiu thẳng đng hay chiu dc). Thông thưng hưng ca cc dng
văn bn sẽ xc định độ nghiêng ca ti liu. Bnh thưng một trang ti liu sẽ
c độ nghiêng l 0 khi m cc dng văn bn theo chiu ngang hay chiu dc
sẽ song song vi cc cnh tương ng ca trang ti liu, tuy nhiên trong một s
trưng hp khi một trang ti liu đưc quét hay sao chụp bằng tay, độ
nghiêng ca ti liu khi đ sẽ khc 0.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn

17 Hnh 2.6 Văn bả n bị nghiêng sau khi đượ c qué t qua má y qué t.
Hnh 2.6 cho ví dụ về mộ t văn bả n nghiêng sau khi qué t ả nh gố c qua
mộ t má y scan.
V cc bưc phân tch như OCR hay phân tch sơ đồ trnh by phụ
thuộc vo trang ti liu đu vo vi độ nghiêng l 0 do đ xc định độ

thc hin phân tch cc từ, cc dng văn bn hay cấu trc cc khi (nhm cc
dng văn bn, chẳng hn cc đon văn bn hay cc bng danh mục). Thông
thưng ngưi ta da vo quy tc sp xp thông tin trong trang ti liu đ nhn
dng từng khi v gn nhãn cho chng. Một th dụ đưa ra kt qu sau khi
phân tch trang đu tiên ca một ti liu kỹ thut bao gồm: tên ti liu, tc gi,
tm tt, từ kho, cc đon trong thân văn bn v.v. Hnh 2.7 đưa ra một th
dụ vi kt qu sau khi đã thc hin phân tch cấu trc v gn nhãn cho cc
khi trên một trang ti liu nh. Phân tch cấu trc ca trang c th sử dụng
phương php tip cn trên - xung [11] hay tip cn dưi – lên[10]. Vi
phương php tip cn từ trên - xung, một trang ti liu đưc phân tch từ cc
thnh phn ln xung cc thnh phn nh hơn, chẳng hn trang ti liu c th
phân tch thnh cc cột, sau đ cc cột đưc phân tch thnh cc đon văn
bn, từ cc đon văn bn li tch ra thnh cc dng văn bn, sau đ tch cc
từ .v.v Vi phương php tip cn từ dưi – lên, cc thnh phn liên thông
đưc trộn vi cc k t đ nhn dng từ, cc từ li đưc trộn vi nhau đ to
thnh cc dng văn bn, từ cc dng văn bn xây dng thnh cc đon văn
bn.v.v Một cch ln lưt, hai phương php trên c th kt hp cng nhau
đ phân tch cấu trc ca ti liu.

Trích đoạn Cải tiến các bƣớc của thuật toán phân đoạn khởi tạo T-Recs++ Trộn các khối phân đoạn sai Phân tích khối Mô tả chƣơng trình
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status