ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
LỚP CAO HỌC QUA MẠNG – KHÓA 6
BÀI THU HOẠCH
MÔN HỌC: KHAI PHÁ DỮ LIỆU
ỨNG DỤNG CỦA TẬP THÔ TOLERANT
TRONG PHÂN LỚP DỮ LIỆU
Giảng viên: PGS TS Đỗ Phúc
Sinh viên thực hiện: Nguyễn Hoàng Hạc
MSHV: CH1101081
TP. HCM, NĂM 2012
LỜI CÁM ƠN!
Tôi xin trân trọng dành nhưng lời cảm ơn đầu tiên tới PGS TS Đỗ
Phúc, người trực tiếp hướng dẫn và giảng dạy môn Khai phá dữ liệu này.
Xin chân thành cám ơn các thầy cô khác trong trường Đại Học Công
nghệ Thông tin Thành phố Hồ Chí Minh.
Xin gởi lời cảm tới các bạn và những người đã hổ trợ và tạo điều kiện
cho tôi hoàn thành đề tài này.
Một lần nữa, xin chân thành cảm ơn mọi người bằng cả tấm lòng!.
Học viên thực hiện:
Nguyễn Hoàng Hạc
2
MỤC LỤC
MỞ ĐẦU 4
Chương 1 TẬP THÔ TOLERANT 5
1.1 Giới thiệu 5
1.2 Tập thô tolerant 7
1.3 Quan hệ tương tự 8
1.4 Tập xấp xỉ trên và tập xấp xỉ dưới 9
1.5 Độ đo tương tự và ngưỡng tương tự 9
4.3 Thử nghiệm với bộ dữ liệu gồm 25 ký tự 39
4.3.1 Bộ dữ liệu của 25 ký tự 39
4.3.2 Các tham số cho chương trình 42
4.3.3 Kết quả thực hiện 42
4.4 Đánh giá 43
3
MỞ ĐẦU
Ngày nay, cùng với sự phát triển không ngừng của Công nghệ thông tin kèm
theo đó là dữ liệu về thế giới thực được lưu trữ nhiều hơn. Với nguồn dữ liệu được
lưu trữ ngày càng lớn làm cho việc phân lớp dữ liệu trở nên hết sức khó khăn, đôi
khi là bất khả thi.
Để thực hiện việc phân lớp dữ liệu, các nhà Trí tuệ nhân tạo đã đưa ra các
phương pháp phân lớp như: thuật toán Quinland, cây định danh, thuật toán Apriori,
thuật toán Apriori Tid…. Nhưng các phương pháp này có nhược điểm không phân
lớp được phần dữ liệu mơ hồ (không chắn chắn, không xác định). Sau này, các
phương pháp mới hơn được đưa ra như: Back-propagation neural networks
(BPNN), the Object function-based unsupervised neural networks (OFUNN),
Fuzzy C-means (FCM),…giải quyết vấn đề phân lớp dữ liệu mơ hồ nhưng với độ
chính xác không cao và thời gian xử lý khá lâu.
Đề tài “Ứng dụng của tập thô tolerant trong phân lớp dữ liệu” tập trung chủ
yếu vào lý thuyết tập thô, tập thô tolerant, các bài toán sử dụng tập thô phân lớp dữ
liệu và ứng dụng của tập thô tolerant trong phân lớp dữ liệu. Đây là phương pháp
thực hiện phân lớp dữ liệu chính xác hơn và thời gian xử lý nhanh hơn so với các
phương pháp đã đưa ra trước đó.
4
Chương 1 TẬP THÔ TOLERANT
1.1 Giới thiệu
Vấn đề của việc phân lớp dữ liệu đó là phân chia một không gian dữ liệu ℜ
n
vào trong các lớp và sau khi xác định một điểm x∈ℜ
Chương trình phân lớp dữ liệu nên có càng nhiều tham số điều chỉnh
hệ thống càng tốt.
8. Sự phân lớp không giới hạn (Nonparametric classification):
Chương trình phân lớp dữ liệu sẽ hoạt động tối ưu mà không cần biết
đến sự phân phối dữ liệu bên dưới.
Như đã đề cập ở trên, nhiều nhà nghiên cứu đã từng thực hiện bằng nhiều
cách khác nhau. Carpenter và Grossberg đã phát triển nhanh chóng và đáng tin cậy
các bộ mẫu tuần tự của hệ thống gọi là lý thuyết Fuzzy Adaptive Resonance (ART)
nó liên kết logic mờ với ART1, Lin và Lee giới thiệu tổng quát mạng nơron cho
việc điều khiển logich mờ và các hệ thống ra quyết định nó có thể thành lập các
luật logich mờ và tối ưu chức năng nhập / xuất của các thành viên. Simpson đã phát
triển sự phân lớp min_max không rõ ràng của mạng nơron nó sử dụng các tập mờ
như là những lớp mẫu, việc học trong mạng nơron được thực hiện tại một nơi nhất
định và sự điều chỉnh hyberboxes trong không gian mẫu.
Bởi vì, các lý thuyết phân lớp trên có một cấu trúc kết nối giữa logic mờ và
mạng nơron nên họ dự tính sẽ gặp những khó khăn giống như mạng nơron như sau:
Khả năng có giải pháp không hội tụ bởi vì sự chọn lựa sai các giá trị
trọng số ban đầu.
Có liên quan đến thời gian học dài.
Khả năng có những giải pháp không tối ưu vì những vấn đề cục bộ.
Gần đây Banzan đề xuất hai ứng dụng của logich cho việc phân lớp các đối
tượng bằng cách sử dụng multi-modal logics cho việc tự động lấy các đặc trưng ban
đầu và sử dụng sự phương pháp qui nạp của tập thô để khám phá các tập đặc trưng
tối ưu nhất đối với chất lượng của việc phân lớp. Phương pháp của họ nhấn mạnh sự
tối ưu các lựa chọn của những thuộc tính liên quan từ việc linh động thu nhỏ.
Nhưng số lượng những đối tượng không thể phân biệt được thì quá hạn chế để xác
6
định sự tương tự của nó, bởi vì sự giao nhau không luôn luôn đúng trong trường
hợp của vấn đề phân lớp mẫu. Nguyễn đề xuất việc sử dụng số lượng mối quan hệ
tolerant của các đối tượng cho việc phân lớp mẫu. Nhưng phương pháp này không
1
2
3
Rõ ràng, điểm 1 gần điểm 2 và điểm 2 gầ điểm 3, nhưng điểm 1 không gần
điểm 3. Trong trường hợp này tính chất bắc cầu không còn đúng.
Bởi vì 2 đối tượng dữ liệu x và z không thể được bảo đảm trong cùng một lớp
thậm chí khi một cặp dữ liệu x và y được chứa trong cùng một lớp và cặp dữ liệu y
và z cũng được chứa trong cùng một lớp thì chưa hẳn x và z thuộc về cùng một lớp
(tính chất bắc cầu không thoả mãn). Vì vậy, tập thô Tolerant mở rộng quan hệ
không phân biệt thành quan hệ tolerant (quan hệ tương tự) cho phù hợp với các bài
toán phân lớp mà quan hệ giữa các đối tượng chỉ thoả mãn hai tính chất: phản xạ và
đối xứng.
1.3 Quan hệ tương tự
Cho A = (U, A
∪
d) là một bảng quyết định.
U là một tập gồm các yếu tố (các đối tượng, các mẫu).
A là tập những thuộc tính điều kiện, ∀a
∈
A tập những giá trị của thuộc tính a
là V
a
, và {d} là một tập quyết định với d = {1, 2, …, r(d)}, r(d) là số các lớp quyết
định.
Cho
ℜ
A
= {R
a
: R
v
2
→
v
2
R
a
v
1
Với v
1
và v
2
là các thuộc tính giá trị trong V
a
.
Hai đối tượng x và y là tương tự nhau đối với thuộc tính a. Khi giá trị a(x) và
a(y) thoả mãn a(x)R
a
a(y). Hơn nữa, chúng ta nói hai đối tượng x và y là tương tự đối
với trong toàn bộ thuộc tính A khi nó thoả mãn mối quan hệ tolerant với việc thừa
nhận tất cả các thuộc tính nghĩa là:
∀
a
∈
A, a(x)R
a
a(y)
8
(Y) =
U
Ux∈
{TS(x) | TS(x)
∩
Y
≠
∅
}
Ý nghĩa của 2 tập xấp xỉ trong mối quan hệ tolerant là như nhau đó là mối
quan hệ tương tự.
Để thành lập một mối quan hệ tolerant giữa dữ liệu với nhau chúng ta cần xác
định một độ đo tương tự, nó xác định số lượng tính chặt chẽ giữa những giá trị
thuộc tính của các đối tượng.
1.5 Độ đo tương tự và ngưỡng tương tự
Để xác định độ đo tương tự S
a
(x,y) đối với thuộc tính a giữa hai đối tượng x
và y. Hai đối tượng là tương tự với thuộc tính a khi S
a
(x,y)
≥
t(a), với t(a) là một
ngưỡng tương tự khởi tạo của thuộc tính a, giá trị của a nằm trong khoảng
t(a)
∈
[0,1]. Vì vậy, chúng ta có thể liên hệ mối quan hệ tolerant với độ đo tương tự
như sau:
a(x)R
tự của tất cả các thuộc tính:
S
A
(x,y) =
∑
∈∀ A
),(
1
a
a
yxS
A
Với |A| là số các thuộc tính trong A.
Trong trường hợp xét tất cả các thuộc tính của A cùng lúc, chúng ta có thể
liên hệ mối quan hệ tolerant với độ đo tượng tự như sau:
x
τ
A
y
⇔
S
A
(x,y)
≥
t(A)
Với t(A)
∈
[0,1] là một ngưỡng tương tự khởi tạo cho sự phân lớp dữ liệu dựa
trên tất cả các thuộc tính A. Vấn đề ở đây là làm thế nào để xác định ngưỡng một
cách tối ưu có thể. Bởi lẻ ngưỡng tương tự ảnh hưởng trực tiếp đến quan hệ tolerant
một vấn đề chi tiết trên một cấu trúc dữ liệu đơn giản giống nhiễm sắc thể và các
phép toán liên kết.
2.1 Giải thuật chung cho thuật giải di truyền
Thuật giải di truyền làm việc như sau:
- Cho P là một quần thể của các nhiễm sắc thể |P|.
11
- P(0) là quần thể khởi tạo được phát sinh ngẫu nhiên.
- P(t) là quần thể tại thời điểm t.
- Quần thể mới P(t+1) được tạo ra bằng cách sử dụng một tập các toán tử
phát sinh (tái sinh, lai ghép, đột biến) trên P(t).
- Mỗi nhiễm sắc thể trong P(t+1) được tái sinh theo tỷ lệ giá trị thích nghi
của nó tại thời điểm t.
- Lai ghép là tổ hợp lại 2 nhiễm sắc thể từ việc cắt chúng ở những vị trí ngẫu
nhiên và sự thay đổi những thông tin di truyền bằng cách ghép một hay nhiều đoạn
gien của hai (hay nhiều) nhiễm sắc thể cha-mẹ với nhau.
- Đột biến là hiện tượng cá thể con mang một (số) tính trạng không có trong
mã di truền của cha-mẹ.
Nói chung, hiệu quả của thuật giải di truyền là một quần thể mới được tạo và
cho ra các giải pháp tốt hơn với các giá trị cao hơn của hàm thích nghi. Hình 3-1 là
mã giả thể hiện cách làm việc của thuật giải di truyền.
Khi chúng ta sử dụng thuật giải di truyền để tìm một ngưỡng tương tự khởi
tạo tốt nhất cho vấn đề phân lớp dữ liệu. Chúng ta cần phải xem xét 5 vấn đề chính
sau:
1. Lược đồ trình bày mối kết hợp của các nhiễm sắc thể cho việc phân lớp.
2. Phương pháp tạo ra quần thể khởi tạo.
12
Begin
t=0
Initialize P(t);
Evaluate fitness functions in P(t);
A}}.
Như vậy, khi một đối tượng được thể hiện bằng n thuộc tính thì nhiễm sắc thể
cho thuật giải di truyền bao gồm n+1 số thực liên tiếp của các điểm tương tự khởi
tạo {t(a
1
), t(a
2
), …, t(a
n
), t(A)}, với t(a
i
) / (i=1,2,…,n) thể hiện ngưỡng tương tự khởi
tạo cho thuộc tính i và giá trị cuối cùng t(A) là ngưỡng tương tự khởi tạo xác định
mối quan hệ tolerant khi tất cả các thuộc tính A được xem xét cùng lúc.
Chúng ta chấp nhận một sự trình bày dạng số thực của các nhiễm sắc thể vì
mỗi giá trị của gien trong nhiễm sắc thể là một số thực.
2.3 Khởi tạo quần thể ban đầu
Các giá trị của gien khởi tạo trong nhiễm sắc thể có được bởi sự phát sinh
n+1 số giá trị thực ngẫu nhiên trong khoảng [0.5, 1.0]. Lý do cho việc chọn khoảng
[0.5,1.0] để khởi tạo các ngưỡng tương tự khởi tạo là hai đối tượng được xem là
tương tự nhau khi giá trị tương tự khởi tạo giữa hai đối tượng tối thiểu lớn hơn 0.5.
Chúng ta hoàn thành khởi tạo quần thể bằng cách lặp lại phép toán |P| ở trên
nhiều lần. Khi đó |P| là kích thước của quần thể.
2.4 Hàm thích nghi
1
Trước khi xem xét hàm thích nghi cho việc xác định tốt nhất những ngưỡng
tương tự khởi tạo, chúng ta xem xét một khái niệm của các mối kết hợp để diễn tả
sự không phân biệt của các đối tượng. Khái niệm mối liên kết dựa trên một quan sát
rất đơn giản đó là nếu x
∈
Khi chúng ta chọn hàm thích nghi cho việc xác định ngưỡng tương tự khởi
tạo tối ưu chúng ta cần xem xét hai yêu cầu sau:
Nếu hai đối tượng x, y
∈
U có quan hệ tolerant thì chúng nằm trong
cùng một lớp càng nhiều càng tốt.
Nếu hai đối tượng cùng nằm trong cùng một lớp thí chúng có quan hệ
tolerant càng nhiều càng tốt.
Đề cập yêu cầu thứ nhất, chúng ta cần xác định một đặc trưng xấp xỉ của sự
phân lớp
{ }
d,
A
τ
γ
nó biểu diễn tỷ lệ của tất cả quan hệ tolerant chính xác (
τ
A
-correctly)
phân lớp đối tượng.
14
d
1
d
2
d
3
Mối liên kết tốt
Mối liên kết xấu
Cho một tập của những đối tượng được chứa trong cùng một lớp Y
iAid
YYTixTSPO
∈ =
=⊆∃=
)(
1
,
)(S(x)/)(S
A
τ
τ
Chất lượng xấp xỉ của sự phân lớp
{ }
d,
A
τ
γ
được xác định bởi tỷ số của tất cả
τ
A
-corectly phân lớp đối tượng từ U như sau:
{ }
{ }
Ucard
POScard
d
A
A
)(
,
một lớp có quan hệ tolerant càng nhiều càng tốt. Với yêu cầu này chúng ta xác định
tỷ lệ mối liên kết tốt là
{ }
d
A
,
τ
α
, xác định tỷ lệ các đối tượng nằm trong cùng một lớp
có quan hệ với nhau trên tổng số các đối tượng trong cùng một lớp:
{ }
( ){ }( )
( ){ }( )
)()(/,
)()(/,
,
ydxdyxcard
ydxdyxcard
A
d
A
=
=∧
=
τ
α
τ
15
Bởi vì, giá trị ngưỡng tương tự khởi tạo tăng lên, tỉ lệ của các mối liên kết tốt
{ }
hàm thích nghi chỉ dựa trên một tỷ lệ
{ }
d
A
,
τ
α
thì ngược lại ta sẽ được kết quả phân
lớp chỉ tập trung vào một số các lớp nào đó.
Do đó, vấn đề đặt ra là cần phải kết hợp hài hoà hai tỷ lệ này. Hàm thích nghi
dựa trên việc kết hợp hai tỷ lệ này sẽ có dạng như sau:
{ }
( )
{ }
dd
AA
xF
ττ
αωγω
++×= 1
Với
ω
và (
ω
- 1) là các hằng số trọng lượng có thể được thay đổi theo mục
đích phân lớp. Ở đây, giới hạn thứ nhất là tạo một vài đối tượng có quan hệ tolerant
được chứa trong cùng một lớp và giới hạn thứ hai là tạo các đối tượng trong cùng
một lớp trở nên có quan hệ tolerant.
2.5 Các phép toán di truyền
2
Cuối cùng, phần còn lại của tập quần thể mới được làm đầy bằng cách
phát sinh ngẫu nhiên các nhiễm sắc thể. Hình 3-3 cho thấy một phương pháp lai
ghép tái sinh dựa trên một hổn hợp của ba phương pháp tái sinh khác nhau.
Hình 3-3: Lược đồ phương pháp chọn lọc tái sinh.
17
2.5.2 Phép lai ghép
4
Lai ghép giữa hai nhiễm sắc thể đã chọn C
1
và C
2
được thực hiện như sau:
Cho các ngưỡng tương tự khởi tạo thứ i của 2 nhiễm sắc thể đã chọn C
1
và C
2
là
t
1
(a
i
) và t
2
(a
i
). Hàm thích nghi của 2 nhiễm sắc thể đã chọn C
1
và C
2
là F
’
được
chọn ngẫu nhiên từ quần thể với xác suất của sự đột biến P
m
. Tiếp theo, giá trị
ngưỡng tương tự khởi tạo t
’
(a
i
) của nhiễm sắc thể C
’
được chọn ngẫu nhiên và nó
được đột biến theo cách sau:
t
m
(a
i
)
= 1.5 - t
’
(a
i
)
Với t
’
(a
i
) và t
m
¬
(stop_condition)
{
Reproduction();
Crossover();
Mutation();
Đánh giá hàm thích nghi của quần thể mới;
(Evalute fitness function of new population)
{ }
( )
{ }
dd
AA
,1,1
1
ττ
αωγω
×−+×
}
3. Xác định ngưỡng tối ưu
19
Chương 3 PHÂN LỚP DỮ LIỆU DỰA TRÊN TẬP THÔ
TOLERANT
Cho rằng, đó là một tập của những mẫu huấn luyện được chuẩn bị cho việc
phân lớp dữ liệu. Chúng ta xác định tối ưu các giá trị của các ngưỡng tương tự khởi
tạo bằng phương pháp tiến hoá dựa trên thuật toán di truyền sử dụng tập của những
mẫu huấn luyện. Sau khi xác định những ngưỡng tương tự khởi tạo tối ưu, chúng ta
cần phải thu được tập xấp xỉ dưới và tập xấp xỉ trên của các mẫu huấn luyện. Một
thủ tục xác định hai tập xấp xỉ được đưa ra như sau:
Sử dụng các ngưỡng khởi tạo ta có được một tập tolerant TS(x) của mỗi mẫu
i
(i=1, 2, …, r(d)), với r(d) là số các lớp quyết định.
Chúng ta cần xác định một hàm thành viên thô
µ
di(x)
biểu diễn mức độ phổ biến của
mẫu x trong lớp quyết định d
i
như sau:
( )
( ) ( ) ( ){ }( )
( )( )
xTScard
idydxTSycard
xdi
=∈∀
=
|
µ
Chúng ta đưa ra một phương pháp phân lớp hai giai đoạn dựa trên tập xấp xỉ
dưới và tập xấp xỉ trên được trích từ tập các mẫu huấn luyện . Về cơ bản, phương
pháp được thực hiện theo một cách đó là các mẫu thử sẽ được phân lớp bằng cách
sử dụng tập xấp xỉ dưới ở giai đoạn đầu và sau đó những mẫu thử này không thể
20
được phân lớp trong giai đoạn 1 sẽ được phân lớp bằng cách sử dụng tập xấp xỉ trên
trong giai đoạn 2. Giải thích chi tiết của mỗi giai đoạn sẽ được đưa ra dưới đây.
3.1 Giai đoạn 1: dùng xấp xỉ dưới
Chúng ta thu được một tập tolerant TS
l
(x) của mẫu thử x, với chỉ số dưới
drfreq
freqfreq
≤
−
Với freq
1
= card({
∀
y
∈
TS
l
(x )| d(y)=d(x)})
freq
1
= card({
∀
y
∈
TS
l
(x )| d(y)=d(i), i
∈
{1, 2, …, r(d)})
r(d) là số các lớp quyết định.
Chúng ta cũng chuyển sự phân lớp của mẫu thử như vậy sang giai đoạn 2 bởi
vì lớp bao phủ là không chắc chắn (mờ) căn cứ vào tập xấp xỉ dưới.
3.2 Giai đoạn 2: dùng xấp xỉ trên
Bởi vì tập xấp xỉ trên bao gồm tất cả các mẫu thử trong tập xấp xỉ dưới và các
mẫu thử trong tập xấp xỉ dưới đã được xem xét trong giai đoạn 1. Chúng ta sử dụng
,
γ
2
,…,
γ
M
}, với M là số các mẫu thử
trong vùng biên có quan hệ tolerant đối với mẫu thử x và thừa nhận mỗi mẫu
γ
j
có
hàm thành viên thô {
µ
di
(
γ
i
)|i=1,2,…,r(d)}. Ta có công thức tính hàm thành viên thô
trung bình của mẫu thử x đối với mỗi lớp quyết định như sau:
( )
( )
∑
=
==
M
j
jdidi
dri
M
x
Phân lóp theo
kiểu bỏ phiếu
chiếm số
đông
Sai
Không tồn tại
Thành
công
Tồn tại
Bộ mẫu huấn luyện
Xác định ngưỡng
tương tự tối ưu
Tính giá trị trung bình
hàm thành viên thô của
mỗi lớp
Gán mẫu vào lớp
có hàm thành viên
thô lớn nhất
Dùng
xấp xỉ
dưới
Dùng xấp
xỉ trên
Định
lượng
mờ
Mẫu kiểm chứng
GA
Không
tồn tại
9 5.1 3.7 1.5 0.4 5.9 3.0 4.2 1.5 5.7 2.5 5.0 2.0
10 5.1 3.8 1.5 0.3 6.9 3.1 4.9 1.5 6.8 3.0 5.5 2.1
11 4.6 3.4 1.4 0.3 6.0 2.7 5.1 1.6 7.7 3.0 6.1 2.3
12 5.4 3.4 1.7 0.2 5.2 2.7 3.9 1.4 6.9 3.2 5.7 2.3
13 5.8 4.0 1.2 0.2 7.0 3.2 4.7 1.4 7.2 3.0 5.8 1.6
14 4.9 3.0 1.4 0.2 5.7 2.6 3.5 1.0 7.4 2.8 6.1 1.9
15 5.0 3.2 1.2 0.2 6.6 2.9 4.6 1.3 7.2 3.2 6.0 1.8
16 5.0 3.0 1.6 0.2 6.0 2.9 4.5 1.5 6.4 2.7 5.3 1.9
17 5.1 3.8 1.6 0.2 6.6 3.0 4.4 1.4 6.0 3.0 4.8 1.8
18 4.7 3.2 1.3 0.2 6.1 2.8 4.0 1.3 7.9 3.8 6.4 2.0
19 5.4 3.4 1.5 0.4 6.4 3.2 4.5 1.5 6.2 2.8 4.8 1.8
20 4.6 3.2 1.4 0.2 5.5 2.5 4.0 1.3 6.4 3.2 5.3 2.3
21 4.9 3.1 1.5 0.2 5.0 2.3 3.3 1.0 6.7 3.3 5.7 2.5
22 5.0 3.4 1.6 0.4 5.8 2.7 4.1 1.0 6.9 3.1 5.4 2.1
23 4.4 2.9 1.4 0.2 5.8 2.6 4.0 1.2 5.8 2.7 5.1 1.9
24 4.6 3.6 1.0 0.2 5.9 3.2 4.8 1.8 6.4 2.8 5.6 2.1
25 5.1 3.3 1.7 0.5 6.4 2.9 4.3 1.3 6.5 3.0 5.8 2.2
Bảng 4-1: Bộ dữ liệu huấn luện IRIS
Bảng 4-2 trình bày các tham số cho thuật giải di truyền được dùng xác định
ngưỡng tương tự khởi tạo tối ưu cho tất cả các thuộc tính.
24
Tham số thực hiện Giá trị
Kích thước quần thể (|P|) 100
Hệ số tái sinh (P
Select
) 0.3
Hệ số đấu loại k (k-tournament) 8
Xác suất lai ghép (P
c
) 0.3
α
τ
A,{d}
(weigh 1-ω=0.4). Từ hình này chỉ ra đó là giá trị thích nghi được chuyển đổi
(đồng qui) trong phàm vi lặp lại 10 lần, Vì vậy, nó chỉ cần một số lượng nhỏ thời
gian tính toán để xác định ngưỡng tối ưu.
25