Tuyển tập công trình Hội nghị Cơ điện tử toàn quốc lần thứ 6 19
Mã bài: 06
Điều khiển thích nghi dùng mạng nơ-ron mờ hồi qui
áp dụng để điều chỉnh áp suất không khí
Adaptive Control Using Recurrent Fuzzy Neural Network
Applied To Air Pressure Regulation
Nguyễn Chí Ngôn
1
và Đỗ Chí Tâm
2
1
Trường Đại học Cần Thơ,
2
Trường Đại học Tây Đô
e-Mail:
Tóm tắt
Nghiên cứu này nhằm xây dựng một bộ điều khiển thích nghi dùng mạng nơ-ron mờ hồi qui làm bộ nhận dạng
mô hình không tham số của đối tượng phi tuyến. Bộ điều khiển được tổ chức dưới dạng một nơ-ron tuyến tính
mà ở đó ba trọng số kết nối của ba ngõ vào tương ứng là bộ ba thông số của bộ điều khiển PID. Việc áp dụng
giải thuật huấn luyện trực tuyến nơ-ron này cho phép tự điều chỉnh thông số bộ điều khiển PID thích nghi theo
sự biến đổi đặc tính động của đối tượng. Giải thuật huấn luyện bộ điều khiển PID một nơ-ron cần thông tin về
độ nhạy của đối tượng, gọi là thông tin Jacobian, để tính toán các giá trị cập nhật các trọng số kết nối của nơ-
ron PID. Thông tin Jacobian này được xác định bằng một bộ nhận dạng không tham số mô hình đối tượng
thông qua một mạng nơ-ron mờ hồi qui, cũng được huấn luyện trực tuyến. Kết quả thực nghiệm trên hệ ổn
định áp suất RT030 của hãng Gunt-Hamburg cho thấy đáp ứng của đối tượng thỏa mãn các yêu cầu về chất
lượng điều khiển, không vọt lố, triệt tiêu được sai số xác lập với thời gian tăng đạt 8±0.2 giây.
Từ khóa: Điều khiển thích nghi, mạng nơ-ron mờ hồi qui, huấn luyện trực tuyến
Abstract
Ngoài ra, với khả năng tự học trực tuyến mạng nơ-
ron hoàn toàn phù hợp trong việc ứng dụng để tự
chỉnh các thông số của bộ điều khiển PID[6-7].
Nghiên cứu này kết hợp bộ nhận dạng RFNN và
bộ điều khiển PID thích nghi một nơ-ron nhằm tạo
ra một công cụ hữu ích trong việc thiết kế bộ điều
khiển áp dụng cho các đối tượng phi tuyến. Mô
hình của đối tượng sẽ được nhận dạng bằng một
bộ nhận dạng RFNN. Từ đó độ nhạy của đáp ứng
của đối tượng đối với tín hiệu điều khiển, còn gọi
là thông tin Jacobian, sẽ được ước lượng thông
qua bộ nhận dạng. Thông tin Jacobian là cơ sở để
tính toán các gradient của giải thuật cập nhật trực
tuyến bộ trọng số của một nơ-ron tuyến tính, cấu
20 Nguyễn Chí Ngôn và Đỗ Chí Tâm
VCM2012
hình theo nguyên tắc của một bộ điều khiển PID.
Thông số của bộ điều khiển PID một nơ-ron sẽ
được điều chỉnh thích nghi trong quá trình điều
khiển nhờ giải thuật huấn luyện trực tuyến.
2. Thiết kế bộ điều khiển
2.1 Nguyên tắc điều khiển
Sơ đồ điều khiển vòng kín của hệ thống được xác
lập như hình H.1. Trong đó, đối tượng điều khiển
là phi tuyến và không biết trước cấu trúc cũng như
tham số của nó. Bộ nhận dạng không tham số mô
hình đối tượng dùng mạng nơ-ron mờ hồi qui được
xây dựng và huấn luyện trực tuyến trong quá trình
ổn định mà người vận hành đặt trước bù trừ được
với sự thất thoát khí do valve xả 3 và/hoặc 4 tác
động.
a) Giao tiếp giữa máy tính và thiết bị RT030
b) Mô tả RT030 - 1: máy nén khí, 2: bảng hiển thị
và điều khiển,
3: valve xả bằng tay, 4: valve xả có kiểm soát, 5:
cảm biến áp suất, 6: áp kế, 7: bình chứa
H. 2 Hệ ổn định áp suất RT030
RT030 là một hệ MISO có 2 ngõ vào, 1 ngõ ra có
thể giao tiếp với MATLAB/Simulimk nhờ công cụ
do nhóm nghiên cứu tự phát triển[9], được mô tả
trên hình H.3.
H. 3 Ngõ vào, ngõ ra của đối tượng điều khiển
Với ngõ vào Y là công suất máy nén khí, có giá trị
trong [0, 100%]. Z là tín hiệu điều khiển valve xả
4. Khi Z > 0 valve được mở, khi Z 0 valve đóng.
Công suất valve xả 3 và 4 phụ thuộc vào việc điều
chỉnh thủ công độ mở của các valve cơ khí. X là
áp suất không khí trong bình, có giá trị trong [0, 1
bar].
Nguyên tắc điều khiển trong nghiên cứu này
không cần quan tâm đến mô hình toán của đối
tượng, do vậy, việc giao tiếp được ngõ vào, ngõ ra
của RT030 đủ để kiểm nghiệm giải thuật.
Tuyển tập công trình Hội nghị Cơ điện tử toàn quốc lần thứ 6 21
trong đó, e(k) là sai biệt giữa tín hiệu tham khảo và
đáp ứng của hệ thống.
Với cấu trúc bộ điều khiển PID một nơ-ron hình
H.4, ngõ ra của nơ-ron cũng chính là ngõ ra của bộ
điều khiển PID, được biểu diễn lại như (3).
nnfkY
ewewewn
321
131211
(3)
Ở đó, w
1i
|
i=1,2,3
là các trọng số của nơ-ron, chính là
bộ thông số (K
p
, K
i
, K
d
) của bộ điều khiển PID và
chúng được cập nhật trực tuyến trong quá trình
điều khiển.
2.3.2 Huấn luyện trực tuyến bộ điều khiển
Mục tiêu của quá trình huấn luyện bộ điều khiển
kwkwkwK
kwkwkwK
kwkwkwK
d
i
p
131313
121212
111111
1
1
1
(5)
với
w
1,i
(k) |
i=1,2,3
là các gradient xác định bởi (6),
(7) và (8), được kiểm chứng thành công bởi [6].
(6)
(7)
(8)
với
dip
KKKk
k
,,|
VCM2012
thứ k, ta có thể mô tả cấu trúc bộ nhận dạng RFNN
như sau:
Lớp 1 – Lớp vào: Lớp này gồm 2 nút có nhiệm vụ
chuyển tải các giá trị ngõ vào đến lớp kế tiếp. Ở
đây các kết nối hồi tiếp được thêm vào để tăng khả
năng đáp ứng của mạng. Ngõ ra của nút thứ i ở lớp
vào được mô tả như (9):
2,1,1
111
ikOkxkO
k
iiii
(9)
với
1
i
là trọng số kết nối tại thời điểm hiện tại k.
Ngõ vào của bộ nhận dạng RFNN tương ứng là tín
hiệu điều khiển hiện tại và ngõ ra quá khứ của đáp
ứng:
2
1
2
ji
mkO
kO
ij
iji
ij
(11)
Ở mỗi nút trên lớp mờ hóa có 2 tham số được tự
động điều chỉnh trong quá trình huấn luyện trực
tuyến bộ nhận dạng RFNN, đó là m
ij
và σ
ij
.
Trong đó
4
ij
w là trọng số kết nối từ lớp luật lên lớp
ra. Ngõ ra của lớp thứ tư cũng là ngõ ra của bộ
nhận dạng RFNN:
1,
ˆ
,
ˆ
21
4
1
kykufkxkxfkOkX
W
kE
kWkWkWkW
1 (16)
Trong đó,
là hằng số tốc độ học và W là tham số
cần điều chỉnh trong quá trình huấn luyện bộ nhận
dạng RFNN. Gọi e(k)=X(k)-X
m
(k) và W=[
, m, σ,
w]
T
là sai số huấn luyện và véc-tơ trọng số kết nối
của bộ nhận dạng RFNN, thì gradient của E(.)
trong (16) theo W được xác định như sau:
34
4
44
1
i
w
ij
ij
w
ijij
Okekw
w
kE
kwkw
mkO
Owkekm
m
kE
kmkm
2
1
34
2
1
(19)
k
ij
ijijij
kiki
i
ii
kOmkO
Owkek
kE
kk
s
ij
ijij
qs
q
q
ij
s
qs
qs
q
q
ij
q
q
ij
q
q
q
mkO
O
4
25
1
3
3
44
1
2.
.
(22)
3. Kết quả và thảo luận
Kết quả thực nghiệm trên thiết bị RT030 theo sơ
đồ điều khiển hình H.6 cho ngõ ra nhận dạng và
thông tin Jacobian trên hình H.7, các thông số của
Tuyển tập công trình Hội nghị Cơ điện tử toàn quốc lần thứ 6 23
Mã bài: 06
bộ điều khiển PID biến thiên trong quá trình điều
khiển trên hình H.8 và đáp ứng của hệ thống trên
hình H.9.
H. 6 Sơ đồ điều khiển trên thiết bị RT030
Trong thực nghiệm này, các hằng số tốc độ học
của bộ nhận dạng RFNN được chọn bằng nhau
giữa các lớp, tức
1.0
Để minh chứng điều này, trong quá trình điều
khiển áp suất trên thiết bị RT030, thực nghiệm đã
điều chỉnh valve xả ở nhiều mức khác nhau, kết
quả cho thấy bộ điều khiển đã thích nghi tốt hơn
so với bộ PID kinh điển – hình H.10.
H. 10 So sánh đáp ứng của hệ RT030 với bộ điều khiển
thích nghi và với bộ điều khiển PID kinh điển.
Kết quả thực nghiệm cho thấy đáp ứng của hệ ổn
định áp suất không khí RT030 dưới tác động của
bộ điều khiển thích nghi đã xây dựng thỏa mãn các
yêu cầu về chất lượng điều khiển, cụ thể là không
xuất hiện vọt lố và triệt tiêu được sai số xác lập
với thời gian tăng đạt 8±0.2 giây, phù hợp với thực
tế.
4. Kết luận và đề nghị
Nghiên cứu này đã đề xuất một bộ điều khiển
thích nghi mà ở đó mô hình của đối tượng được
nhận dạng trực tuyến bởi một mạng nơ-ron mờ hồi
24 Nguyễn Chí Ngôn và Đỗ Chí Tâm
VCM2012
qui RFNN. Từ bộ nhận dạng RFNN, thông tin
Jacobian được tính toán để cung cấp cho giải thuật
gradient descent áp dụng để huấn luyện trực tuyến
bộ điều khiển PID một nơ-ron. Các tham số của bộ
điều khiển PID được tổ chức dưới dạng bộ trọng
số của một nơ-ron tuyến tính ba ngõ vào và được
điều chỉnh thích nghi trong quá trình điều khiển.
Kết quả thực nghiệm trên hệ ổn định áp suất
Publ. No. 414, 12-14 Sep 1995, pp. 141-145.
[3] Nguyễn Chí Ngôn: Bộ điều khiển PI mờ: Từ
thiết kế đến ứng dụng. Tạp chí Khoa học, ĐH
Cần Thơ, Số18a-2011, trang 82-92. ISSN:
1859-2333.
[4] Lee C.H. and C.C. Teng: Identification and
Control of Dynamic Systems using Recurrent
Fuzzy Neural Networks. IEEE Trans. Fuzzy
Systems. Vol.8, No.4, pp.349-366, 2000.
[5] Wei, S.; Z.Lujin; Z.Jinhai and M. Siyi:
Adaptive Control based on Neural Network.
Adaptive Control, Kwanho You (Ed.), ISBN:
978-953-7619-47-3, InTech., 2009.
[6] Zhang,M.;X.Wang;M.Liu: Adaptive PID
control Based on RBF Neural Network
Identification. Proc. 17
th
IEEE Inter. Conf. on
Tools with Artif. Intell., ICTAI'05, pp. 681-
683., 2005.
[7] Cong,S. and Y.Liang, PID-Like Neural
Network Nonlinear Adaptive Control For
Uncertain Multivariable Motion Montrol
Systems. IEEE Trans. Industrial Electronics,
Vol.56, No.10, pp. 3872-3879, 2009.
[8] G.u.n.t. Gerätebau GmbH: Experiment
Instruc-tions RT010-RT060 Principles of
Control Engi-neering. Barsbüttel Germany,
2004. Publication no.: 918.000 00 A 0X0 02
(A).