Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
LỜI CAM ĐOAN
Tên tôi là: Đỗ Thị Tần
Học viên: Lớp 10BVLDM- KH
Khóa học: 2010- 2012
Tôi xin cam đoan toàn bộ nội dung Luận văn thạc sỹ khoa học được
trình bày dưới đây là do cá nhân tôi thực hiện dưới sợ giúp đỡ, chỉ bảo tận
tình chu đáo của TS. Nguyễn Thị Lệ và các thầy cô trong Viện Dệt may da
giầy & Thời trang. Các số liệu và kết quả trong luận văn là những số liệu
thực tế thu được sau khi tiến hành thí nghiệm và phân tích các kết quả. Đảm
bảo chính xác và không sao chép.
Tôi xin hoàn toàn chịu trách nhiệm về những nội dung tôi đã trình
bày trong luận văn.
Xin trân trọng cảm ơn!
Đỗ Thị Tần
1
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
MỤC LỤC
LỜI CAM ĐOAN .................................................................................................. 1
LỜI CẢM ƠN ........................................................................................................ 2
CÁC CHỮ VIẾT TẮT VÀ KÝ HIỆU ĐƢỢC DÙNG TRONG LUẬN VĂN ..... 5
DANH MỤC CÁC BẢNG BIỂU .......................................................................... 7
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ TRONG LUẬN VĂN ...................... 8
MỞ ĐẦU ............................................................................................................. 10
CHƢƠNG 1. TỔNG QUAN VỀ DỰ BÁO NHĂN ĐƢỜNG MAY VÀ
PHƢƠNG PHÁP HỌC MÁY ............................................................ 12
1.1. Nhăn đƣờng may ........................................................................................ 12
1.2. Các nghiên cứu về dự báo nhăn đƣờng may ............................................... 13
1.3. Phƣơng pháp học máy ................................................................................ 21
1.3.1. Khái quát chung về phƣơng pháp học máy .......................................... 21
1.3.2. Giải thuật kNN .................................................................................... 22
1.4. Kết luận Chƣơng 1 ..................................................................................... 33
CHƢƠNG 2. ĐỐI TƢỢNG, NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU
............................................................................................................. 34
2.1 Đối tƣợng và phạm vi nghiên cứu ................................................................ 34
2.1.1. Vật liệu................................................................................................ 34
2.1.2. Đƣờng may.......................................................................................... 36
2.2. Nội dung và phƣơng pháp nghiên cứu ........................................................ 37
2.2.1. Ứng dụng giải thuật kNN để dự báo nhăn đƣờng may dựa trên các thông
số vải ............................................................................................................ 38
2.2.2. Xác định các thông số cấu trúc của vải: ............................................... 43
2.2.3. Xác định các đặc trƣng cơ học vải: ...................................................... 44
2.2.4. Cấp độ SS của đƣờng may ................................................................... 48
Đỗ Thị Tần
4
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
CÁC CHỮ VIẾT TẮT VÀ KÝ HIỆU ĐƢỢC DÙNG TRONG LUẬN VĂN
Các chữ viết tắt
ANN
Artificial Neural Network (Mạng nơron nhân tạo)
ASTM
American Society for Testing and Materials
(Hội thử nghiệm và vật liệu Hoa Kỳ)
BS
British Standard (Tiêu chuẩn Anh)
ISO
Độ cứng uốn
g.cm2 /cm
e
Tỷ số giữa độ giãn ngang và giãn dọc của vải
*
EM
Độ giãn tƣơng đối
%
G
Độ cứng trƣợt
g/cm.deg
k1, k2
Độ chứa đầy dọc, ngang của vải
*
kc
Cấp độ nhăn đƣờng may 301 theo hƣớng sợi dọc
*
SS2
Cấp độ nhăn đƣờng may 301 theo hƣớng sợi ngang
*
SMD
Độ nhám hình học
m
Đỗ Thị Tần
5
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
RC
Ngƣỡng trên của tổng hạng
*
T1
Tổng hạng của các mẫu n1
*
T2
Tổng hạng của các mẫu n2
*
W
Khối lƣợng vải
g/m2
WC
Công nén
g.cm/cm2
WT
Đỗ Thị Tần
6
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1. Phân loại các phƣơng pháp tìm kiếm bộ trọng số cho các thuộc tính ...... 23
Bảng 1.2. So sánh phƣơng pháp Lazy learning và Eager learning .......................... 30
Bảng 2.1. Thông số kỹ thuật của vải dùng để thực nghiệm .................................... 34
Bảng 2.2. Chỉ tiêu kỹ thuật của chỉ thí nghiệm....................................................... 36
Bảng 2.3. Các thông số cơ học vải đo trên hệ thống KESF ................................... 46
Bảng 2.4. Các điều kiện may mẫu.......................................................................... 48
Bảng 3.1. Các trọng số của hệ dự báo thu đƣợc khi áp dụng 4 phƣơng pháp tìm
kiếm bộ trọng số: kNN đơn giản, Greedy Forward Search, Backward
Emilination và Gradient Descent .......................................................... 56
Bảng 3.2. Kết quả dự báo trên tập mẫu kiểm thử khi áp dụng 4 phƣơng pháp tìm
kiếm bộ trọng số: kNN đơn giản, Greedy Forward Search, Greedy
Backward Emilination và Gradient Descent .......................................... 58
Bảng 3.3. Kết quả kiểm định giả thiết thống kê với trắc nghiệm Wilcoxon: cỡ mẫu
n1= n2 = 8; Td = 52; Tt = 84; α = 0,05 ..................................................... 62
Bảng phụ lục1. Cấp độ đánh giá SS của mẫu theo tiêu chuẩn 88B- AATCC
Bảng phụ lục2. Kết quả xác định các thông số cấu trúc vải
Hình 1.8. Minh họa về giải thuật kNN cho bài toán phân loại ................................ 31
Hình 2.1. Hệ thống thiết bị KESF ......................................................................... 45
Hình 2.2. Biểu đồ kéo giãn ................................................................................... 47
Hình 2.3. Biểu đồ trƣợt ......................................................................................... 47
Hình 2.4. Biểu đồ uốn ........................................................................................... 47
Hình 2.5. Biểu đồ nén ........................................................................................... 47
Hình 3.2. Giao diện nhập dữ liệu của mẫu vải cần dự báo độ nhăn đƣờng may ...... 53
Hình 3.3. Menu Item File ...................................................................................... 53
Hình 3.4 Menu Item Option ................................................................................... 53
Hình 3.5. Menu Item View .................................................................................... 54
Hình 3.6. Ma trận đầu vào của hệ dự báo độ nhăn đƣờng may ............................... 54
Hình 3.7. Mẫu học của mạng dự báo nhăn đƣờng may .......................................... 55
Hình 3.8. Đồ thị cấp độ SS1 dự báo và thực tế với đƣờng may dọc trên tập mẫu
kiểm thử ............................................................................................. 59
Hình 3.9. Đồ thị cấp độ SS2 dự báo và thực tế với đƣờng may ngang trên tập mẫu
kiểm thử ............................................................................................. 60
Hình 3.10. Tƣơng quan giữa cấp độ SS1 thực tế và dự báo .................................... 60
Hình 3.11. Tƣơng quan giữa cấp độ SS2 thực tế và dự báo .................................... 61
Đỗ Thị Tần
8
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
Học máy là phƣơng pháp đƣợc áp dụng khá rộng rãi để giải quyết các bài
toán dự báo phức tạp với các giải thuật khác nhau. Trong đó, kNN là giải thuật đƣợc
áp dụng phổ biến nhất cho bài toán dự báo với các biến không tuyến tính. Vì vậy,
việc nghiên cứu ứng dụng phƣơng pháp học máy để dự báo nhăn đƣờng may là cần
thiết để xem xét khả năng ứng dụng của các giải thuật khác nhau vào bài toán dự
báo nhăn đƣờng may, góp phần thiết lập mô hình dự báo độ nhăn đƣờng may dựa
trên các đặc trƣng cơ học và thông số cấu trúc của vải.
Đề tài “nghiên cứu dự báo nhăn đƣờng may ứng dụng phƣơng pháp học
máy” đƣợc thực hiện trong luận văn này với mục tiêu thiết lập mô hình dự báo nhăn
đƣờng may ứng dụng giải thuật kNN.
Đề tài đƣợc giới hạn trong phạm vi dự báo độ nhăn đƣờng may 301 theo
hƣớng sợi dọc và ngang trên vải vải dệt thoi có khối lƣợng nhẹ và trung bình dệt từ
sợi bông, Pe/Co, bông pha Spandex.
Nội dung chính của đề tài là thiết lập mô hình dự báo nhăn đƣờng may đơn
301 ứng dụng giải thuật kNN dựa trên các thông số cấu trúc và đặc trƣng cơ học của
vải dệt thoi dệt, sử dụng cho các sản phẩm may mặc thông dụng, nhằm phát hiện sớm
vấn đề nhăn đƣờng may trong sản xuất may mặc, góp phần xây dựng cơ sở cho việc
Đỗ Thị Tần
10
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
1.1. Nhăn đƣờng may
“Nhăn đường may” (Seam pucker) là những đƣờng gợn, nếp nhăn
hoặc sự nhăn lại của vải hoặc một số các đƣờng nhăn nhỏ chạy qua chạy lại xuất
hiện trong quá trình may các mảnh vải” [2], [27].
Hình 1.1. Ảnh chụp đường may nhăn
Nhăn đƣờng may là khái niệ m đ ƣợc dùng để chỉ đặc điểm bề mặt
hình dạng vải sau khi may, biểu hiện qua trạng thái không bằng phẳng, nhấp
nhô và gợn sóng của bề mặt vải. Nhăn đƣờng may có ảnh hƣởng đ án g kể đến
tính thẩm mỹ của sản phẩ m may mặc và có thể quan sát đƣợc bằng mắt.
Cảm giác của con ngƣời qua các thông tin quan sát đƣợc và quá trình xử lý của
não cho phép cảm nhận và đánh giá ảnh hƣởng của nhăn đƣờng may lên chất
lƣợng sản phẩm. Xác định độ nhăn đƣờng may là một trong những công việc
quan trọng trong việc kiểm tra chất lƣợng sản phẩm trong ngành sản
xuất may công nghiệp [2].
Hiện tƣợng xuất hiện nhăn đƣờng may sau khi may đã đƣợc sự quan tâm
của các nhà nghiên cứu trong lĩnh vực dệt may. Hiện tƣợng này thƣờng xảy ra khi
may trên nhiều loại vải, ở các đƣờng may theo chiều sợi dọc nhƣ đƣờng mép
nẹp, đƣờng sƣờn áo, thậm chí trên cả các đƣờng may theo hƣớng sợi ngang và
xiên, cong nhƣ đƣờng may tay vào thân áo…. Trên thực tế, ở một số sản phẩm,
nhăn không chỉ xuất hiện trên bề mặt vải tại vùng lân cận đƣờng may sau khi may
Đỗ Thị Tần
12
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Dự báo là nêu lên trạng thái của đối tƣợng trong tƣơng lai dựa trên sự suy
luận từ một tập các yếu tố có tính chất định tính cũng nhƣ định lƣợng. Trong đó
Đỗ Thị Tần
13
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
hệ thống dự báo bao gồm hệ toán học, logic học và kinh nghiệm. Đầu vào của hệ
thống là thông tin hiện tại, đầu ra là các số liệu về trạng thái của đối tƣợng trong
tƣơng lai [2].
Vải:
- Thành phần, kiểu dệt,
độ dầy, mật độ, độ chứa
đầy, hoàn tất vải...
- Các đặc tính cơ học
vải: Giãn, uốn, trƣợt,...
Điều kiện may:
- Mật độ mũi may
- Sức căng chỉ may
- Vận tốc may
- Áp lực chân vịt
hành sản xuất để có biện pháp phòng ngừa. Ta không biết trƣớc mức độ ảnh hƣởng
của vải khi hình thành đƣờng may nhƣng lại chắc chắn rằng ảnh hƣởng này cần
đƣợc quan tâm khi lựa chọn vải để sản xuất sản phẩm may. Việc đặt mẫu vải, thử
nghiệm chất lƣợng ngoại quan đƣờng may rồi mới quyết định lựa chọn loại vải mất
Đỗ Thị Tần
14
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
nhiều thời gian và gây tốn kém. Vì vậy, việc dự báo chính xác nhăn đƣờng may
còn mang lại hiệu quả kinh tế đáng kể trong việc tạo ra các sản phẩm may với chất
lƣợng cao và góp phần sử dụng hiệu quả nguồn nguyên liệu quí từ tự nhiên. Đây là
một trong những yêu cầu của phát triển bền vững mà các ngành công nghiệp cần
quan tâm trong xu thế chung của thời đại.
Yêu cầu đối với một hệ thống dự báo thƣờng là phải có độ chính xác cao, có khả
năng phản ứng linh hoạt đối với các biến đổi xảy ra của đối tƣợng đƣợc dự báo, thời
gian và dữ liệu dự báo thích hợp, đơn giản, giá thành của hệ dự báo thấp [21].
Có nhiều phƣơng pháp đƣợc ứng dụng trong các bài toán dự báo. Dự báo theo
kinh nghiệm là phƣơng pháp cổ điển nhất. Phƣơng pháp này dựa trên cơ sở tham
khảo ý kiến, dự báo của các chuyên gia nhiều kinh nghiệm trong lĩnh vực cần dự
báo. D o d ự a và o ý ki ế n c h u y ê n gi a n ê n p hƣơng pháp này có tính chủ
quan, định tính, thƣờng đƣợc dùng để xác định xu hƣớng mới và tiềm năng của các
Để đảm bảo hiệu quả cao cho quá trình sản xuất, nhiều công ty may tại các
nƣớc phát triển đã thành lập phòng thí nghiệm nghiên cứu về vật liệu để kiểm soát chất
lƣợng vải, nhằm dự báo, phát hiện sớm các vấn đề trong sản xuất để đảm bảo chất
lƣợng sản phẩm may [10]. Nhiều nghiên cứu đã đƣợc thực hiện nhằm xem xét quan
hệ giữa các đặc tính cơ học và tác động của vải trong quá trình sản xuất để dự báo
các vấn đề có thể nảy sinh (do vải) trong sản xuất dựa trên các đặc trƣng của vải, đặc
biệt là các đặc trƣng cơ học đƣợc đo dƣới tác dụng của ứng suất thấp và đo trên hệ thống
thiết bị KESF hoặc FAST [10], [21],.
Nghiên cứu dự báo nhăn đƣờng may sớm nhất đƣợc thực hiện bởi G. Stylios và
D.W. Lloyd [26], tác giả đã dựa trên tƣơng quan thực nghiệm của cấp độ SS của
đƣờng may xác định theo tiêu chuẩn 88B - AATCC và các thông số vải xác định
theo các tiêu chuẩn Anh. Các biểu đồ tƣơng quan giữa các cặp đặc trƣng cấu trúc và
thông số cơ học vải với cấp độ SS của đƣờng may đã đƣợc thiết lập. Các biểu đồ
n à y cho thấy sự phân biệt khá rõ ràng các l oại vải nghiên cứu ở 3 nhóm đƣờng
may nhăn trầm trọng (SS <3), mức tới hạn (SS = 3) và ít nhăn (SS >3).
Kết quả của nghiên cứu này bƣớc đầu cho thấy có thể dự báo nhăn đƣờng may
dựa trên các thông số vải. Tuy nhiên, cần kiểm chứng kết quả dự báo so với kết quả
cấp độ nhăn thực tế của đƣờng may.
Tác giả cũng kết luận rằng cần xác định các đặc trƣng cơ học vải bằng phƣơng
pháp khác thích hợp hơn, cho kết quả đầy đủ và toàn diện hơn với các thông số vải mà
các tiêu chuẩn Anh đã đƣợc sử dụng chƣa đáp ứng đƣợc yêu cầu này. Việc ứng dụng
kết quả dự báo này cho thực tế còn nhiều điểm hạn chế nên vẫn chƣa đáp ứng đƣợc
nhu cầu về dự báo nhăn đƣờng may của quá trình sản xuất may công nghiệp.
Đỗ Thị Tần
16
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
0.4
góc hồi nhàu ngang và độ nhăn đường [17]
0.3
may[108].
0.1
0.2
0.0
0
2
4
6
Ít nhăn
8
10
12
14
Trong đó, độ định dạng dọc F1(mm2), góc hồi nhàu ngang CA2 (độ) của vải
đƣợc đo trên hệ thống FAST. Kết quả của nghiên cứu cho thấy nếu vải có F-1 0,5 thì
đƣờng may nhăn không đáng kể; Nếu vải có F-1 0,5, nếu góc hồi nhàu nhỏ đƣờng
may ít nhăn, nếu góc hồi nhàu lớn thì đƣờng may sẽ nhăn nhiều. Để thiết lập phƣơng
trình thực nghiệm (1-1), tác giả đánh giá độ nhăn đƣờng may bằng cách cho điểm.
Phƣơng pháp này làm giảm độ tin cậy của kết quả thu đƣợc. Mặt khác, nhiều nghiên cứu
cho thấy khi đã kiểm soát tốt các yếu tố về công nghệ, máy và chỉ may thì độ nhăn đƣờng
Đỗ Thị Tần
17
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
may không chỉ phụ thuộc vào độ định dạng và góc hồi nhàu của vải mà còn phụ thuộc vào
cả các thông số khác nhƣ độ cứng uốn, độ cứng trƣợt, độ giãn hay tính chất bề mặt của
vải [2], [5], [7]. Tất cả những điều đó dẫn đến độ chính xác của kết quả dự báo theo nghiên
cứu này chƣa cao.
Tác giả Jelka Gersak thiết lập biểu đồ dự báo nhăn đƣờng may dựa trên các
thông số cơ học vải trong vùng tải trọng thấp (đo trên hệ thống KESF) [10]. Dựa
trên biểu đồ này, tác giả đã chỉ ra các thông số cơ học của vải có khả năng liên quan
đến sự nhăn đƣờng may nhƣ độ giãn, độ trƣợt, độ cứng uốn... các giá trị nào có sự
khác biệt quá mức với những vải ít nhăn. Tuy nhiên, kết quả dự báo không đƣa ra
Trường Đại học Bách Khoa Hà Nội
và loại bỏ những thông số ít ảnh hƣởng. Nghiên cứu cũng đi đến kết luận rằng, ANN
là công cụ rất hiệu quả để dự báo các vấn đề có thể xảy ra trong sản xuất sản phẩm
may mặc từ loại vải nào đó.
Qua nghiên cứu này cho thấy rằng ƣu điểm đáng kể của ANN so với kỹ thuật
phân tích và hồi quy truyền thống là độ chính xác của dự báo đƣợc nâng cao vì mạng có
khả năng xây dựng trong quá trình học. Tuy nhiên, không chỉ các đặc trƣng cơ học mà
các thông số cấu trúc vải cũng tác động đến trong quá trình sản xuất. Điều này đã cho
thấy trong nhiều nghiên cứu có liên quan đến nhăn đƣờng may [2], [5], [7], [9]. Hơn nữa
mô hình mà tác giả đã thiết lập đƣa ra, kết quả dự báo là một giá trị độ nhăn nói chung,
trong khi đó nhăn đƣờng may trên vải theo hƣớng sợi dọc, sợi ngang thƣờng có nhiều
khác biệt [2]. Đầu vào của mô hình dự báo là giá trị trung bình của các thông số cơ học
vải nên không thấy đƣợc tác động tƣơng ứng của thông số cơ học vải lên nhăn đƣờng
may thể hiện theo hƣớng cùng chiều hay vuông góc. Do đó, các giải pháp nhằm giảm
nhăn đƣờng may bằng cách cải thiện các thông số vải sẽ không cụ thể theo hƣớng sợi
dọc hay sợi ngang.
Mạng nơron nhân tạo cũng đã đƣợc ứng dụng để dự báo độ nhăn đƣờng may
[18]. Các tác giả đã thiết lập mạng nơron nhân tạo với hàm kích hoạt Sigmoid đơn
cực và áp dụng giải thuật lan truyền ngƣợc lỗi để xác định bộ trọng số của các thuộc
tính. Mạng dự báo đƣợc thiết lập với 36 đầu vào là các thông số cấu trúc và đặc
trƣng cơ học vải đo trên hệ thống KESF. 2 Đầu ra là giá trị cấp độ nhăn đƣờng may
301 theo hƣớng sợi dọc và ngang. Kết quả nghiên cứu cho thấy, cấp độ SS dự báo
có tƣơng quan khá chặt chẽ với cấp độ SS thực tế của đƣờng may 301. Điều đó cho
thấy khả năng giải quyết bài toán dự báo nhăn đƣờng may ứng dụng ANN là rất khả
quan. Tuy nhiên, với nghiên cứu này, thời gian để huấn luyện mạng là khá lâu và
đòi hỏi sự chuẩn bị tập mẫu học phải rất phù hợp để tránh các điểm yên ngựa do
phƣơng pháp Gradient Descent đƣợc áp dụng trong giải thuật lan truyền ngƣợc lỗi.
Đỗ Thị Tần
5
4
SS2 khách quan
3
2
SS2 chủ quan
Z2
1
0
16
17
18
19 20
Mẫu
21
22
16
23
5
y = 0.8132x + 0.477
R 2 = 0.8741
4
y = 0.9564x + 0.1219
R 2 = 0.9403
3
y = 0.9171x + 0.2578
R 2 = 0.9303
2
S S 1 khá c h qua n-Z1
1
S S 1 c hủ quan-Z1
0
S S 2 khá c h qua n-Z2
0
20
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
cấp độ SS của đƣờng may theo hƣớng sợi dọc còn lớn. Điều đó đƣợc giải thích là do
số biến đầu vào quá lớn, nên cần cấu trúc hệ dự báo thành 2 lớp hệ mờ, điều này
ảnh hƣởng đến tính chính xác của kết quả dự báo.
Tóm lại, các nghiên cứu dự báo nhăn đƣờng may đã đ ƣ ợ c t h ự c h i ệ n v à
đƣa ra c á c biểu đồ, phƣơng trình hồi qui hoặc thể hiện xu hƣớng nhăn đƣờng may
trên đồ thị nhƣng chỉ cung cấp một số thông tin có tính định hƣớng mà không chỉ ra
độ nhăn đƣờng may dọc, ngang có giá trị bằng bao nhiêu. Nếu chỉ xem xét những
thông số cấu trúc vải cơ bản nhƣ khối lƣợng (g/m2), độ dày vải (mm) thì chƣa đủ để
cho phép dự báo nhăn đƣờng may. Mối quan hệ giữa các thông số của vải và nhăn
cấp độ nhăn đƣờng may lại rất phức tạp bởi chúng đều là các đại lƣợng không
tuyến tính và số biến lớn [2]. Các ứng dụng trí tuệ nhân tạo để dự báo nhăn
đƣờng may bƣớc đầu đã cho thấy những kết quả khả quan. Mỗi hệ thống đã
đƣợc thiết lập với cấu trúc giải thuật khác nhau có những ƣu điểm và hạn chế
riêng. Việc nghiên cứu tiếp tục ứng dụng trong lĩnh vực này là rất cần thiết
nhằm tìm ra các giải thuật có nhiều ƣu điểm, ít hạn chế hơn trong việc giải
quyết bài toán dự báo nhăn đƣờng may.
Vì vậy, việc tiếp tục nghiên cứu để thiết lập hệ thống dự báo nhăn đƣờng may
một cách đầy đủ, cho kết quả dự báo đảm bảo độ chính xác cần thiết, hoàn chỉnh và dễ
dàng sử dụng trong thực tế là rất cần thiết đối với sản xuất may công nghiệp
của phƣơng pháp này là thay vì xây dựng hàm mục tiêu chung cho toàn bộ không
gian của tập mẫu học bằng việc đánh giá một hàm mục tiêu riêng biệt cho mỗi mẫu
cần đƣợc phân loại.
1.3.2. Giải thuật kNN
kNN là phƣơng pháp học máy dựa trên tập mẫu cơ bản nhất thƣờng đƣợc ứng
dụng. Tƣ tƣởng cơ bản của giải thuật này có thể đƣợc mô tả nhƣ sau: giả sử rằng
mỗi một thể hiện (mẫu đầu vào) tƣơng ứng với một điểm trong không gian n chiều
Rn. Những mẫu hàng xóm gần nhất của một mẫu đƣợc xác định bởi một hàm
khoảng cách đƣợc thể hiện bởi một vectơ n chiều:
(X1,X2,….Xn), trong đó Xi ( R) là một số thực [28].
Tùy theo đầu ra của mô hình là các giá trị rời rạc hay liên tục mà có thể phân
chia các bài toán áp dụng giải thuật kNN thành 2 loại: Bài toán phân loại và bài toán
dự báo.
Nhiều giải thuật lazy learning là dẫn xuất của giải thuật kNN, tức là sử dụng
hàm tính khoảng cách để đƣa ra kết quả dự báo từ những mẫu đã có. Một số nghiên
cứu cho thấy hiệu năng của giải thuật kNN có liên quan mật thiết đến hàm tính
khoảng cách [28]. Nhiều biến thể của kNN đã đƣợc đƣa ra nhằm giảm mức độ phụ
thuộc vào hàm khoảng cách bằng cách thêm vào hàm này bộ tham số đặc trƣng cho
mức độ phụ thuộc của các thuộc tính. Tuy nhiên, các phƣơng pháp này cần đƣợc
xem xét và kiểm nghiệm trong thực tế.
Đỗ Thị Tần
22
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Giữ nguyên hoặc phải thay đổi dạng biểu
diễn dữ liệu (Given or transformed)
Xác định trọng số theo độ lệch:
Các phƣơng pháp xác định trọng số theo độ lệch đƣợc chia thành 2 loại là tùy
theo biến hiệu năng của hệ thống hoặc cố định trƣớc (performance và preset hay
wrapper và filter). Phƣơng pháp có trọng số sử dụng hiệu năng của mô hình nhƣ là
một tham số cho quá trình huấn luyện nhằm tìm ra bộ tham số tối ƣu cho hệ thống
thuộc nhóm performance (hay wrapper method). Nếu phƣơng pháp không sử dụng
hiệu năng của mô hình nhƣ là tham số huấn luyện thì thuộc nhóm preset (hay filter
method).
Đỗ Thị Tần
23
Ngành CN Vật liệu Dệt May
Khóa 2010 - 2012
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
Hình 1.7. Sự khác nhau giữa 2 loại phương pháp filter và wrapper[28]
Độ lệch tùy theo biến hiệu năng (Performance bias):
Hệ thống sử dụng phƣơng pháp performance bias có ƣu điểm nổi bật so với
phƣơng pháp khác là mức độ hiệu quả của dự báo trên bộ tham số của mô hình mà
bộ tham số đó đƣợc áp dụng. Vì vậy, sẽ không xảy ra sự bất tƣơng xứng giữa bộ
Luận văn cao học
Trường Đại học Bách Khoa Hà Nội
tối ƣu bộ tham số trong một số pha của quá trình xử lý. Ví dụ nhƣ giải
thuật di truyền.
Độ lệch cố định trước (Preset bias):
Trong nhóm các phƣơng pháp này không dùng phản hồi của mô hình để tối
ƣu bộ tham số mà sử dụng những thông tin có sẵn trong dữ liệu học để đƣa ra bộ
tham số. Những phƣơng pháp này thƣờng dựa trên xác xuất có điều kiện của các lớp
trong bộ dữ liệu để đƣa ra cách tối ƣu bộ tham số.
Không gian trọng số (Weight space):
Cách tiếp cận này tập trung vào giá trị của trọng số đƣợc gán là liên tục hay
là nhị phân. Features selection là giải thuật gán trọng số nhị phân cho các thuộc
tính. Vì vậy, nó đƣợc đề cập nhƣ là một tập con của các phƣơng pháp mà trọng số
của các thuộc tính là số thực. Về cơ bản, sự khác nhau giữa các giải thuật feature
selection là giải thuật tìm kiếm đƣợc áp dụng trong không gian các bộ trọng số có
thể có. Các nghiên cứu gần đây sử dụng nhiều cách tìm kiếm khác nhau nhằm tìm ra
bộ trọng số áp dụng cho các phƣơng pháp lazy learning. Các giải thuật feature
selection giúp loại bỏ hoàn toàn những thuộc tính không cần thiết, nhờ đó nâng cao
đáng kể hiệu năng của mô hình.
Tóm lại, các giải thuật features selection tỏ ra rất hiệu quả nếu các thuộc tính
dùng để biểu diễn hoặc là liên kết chặt chẽ hoặc hoàn toàn không liên quan gì với
đặc tính của các lớp hay kết quả đầu ra của hệ thống. Các giải thuật features
weighting thích hợp hơn với những bài toán mà mức độ phụ thuộc của các thuộc
tính với đặc tính của các lớp là một khoảng. Tuy nhiên, những giải thuật feature
weighting có không gian các trọng số lớn hơn nhiều so với các giải thuật features
selection.
Tìm kiếm bộ trọng số theo cách biểu diễn (representation):
Các phƣơng pháp tìm bộ trọng số cho mô hình thuộc nhóm thứ ba là các