ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TR
ƯỜNG ĐẠI HỌC BÁCH KHOA
NGUY
ỄN ĐỨC MINH
ĐIỀU KHIỂN TRƯỢT THÍCH NGHI
H
Ệ THỐNG ĐỘNG PHI TUYẾN LU
ẬN ÁN TIẾN SĨ KỸ THUẬT TP. H
Ồ CHÍ MINH NĂM 2012
NGƯỜI HƯỚNG DẪN KHOA HỌC
1. PGS. TS DƯƠNG HOÀI NGHĨA
2. TS NGUYỄN ĐỨC THÀNH
i
LỜI CAM ĐOAN
Tác giả xin cam đoan đây là công trình nghiên cứu của bản thân tác giả. Các kết
quả nghiên cứu và các kết luận trong luận án này là trung thực, và không sao chép từ
bất kỳ một nguồn nào và dưới bất kỳ hình thức nào. Việc tham khảo các nguồn tài liệu
(nếu có) đã được thực hiện trích dẫn và ghi nguồn tài liệu tham khảo đúng theo yêu
cầu.
Tác giả luận án
__________________________________
Nguyễn Đức Minh
ii
TÓM TẮT LUẬN ÁN
Điều khiển có cấu trúc thay đổi VSC (Variable Structure Control) với chế độ
trượt, hay điều khiển trượt SMC (Sliding Mode Control) được biết đến như là một
phương pháp điều khiển phi tuyến bền vững đơn giản, hiệu quả. Phương pháp điều
khiển này có nhiều ưu điểm như: (i) ít nhạy với sự biến thiên của các thông số của hệ
thống; (ii) có khả năng chống nhiễu tốt; (iii) đ áp ứng động học nhanh. Tuy nhiên do tín
hiệu điều khiển trượt cổ điển có dạng chuyển mạch nên tồn tại hiện tượng dao động có
tần số cao (chattering) của các quỹ đạo pha xung quanh mặt trượt. Hơn nữa, khi thiết
kế điều khiển SMC yêu cầu phải biết trước giá trị chặn trên của các thành phần bất
định của hệ thống. Các thành phần bất định thường bao gồm các thành phần động học
không chỉ học được các phương pháp nghiên cứu khoa học mà còn học được nhiều
điều về tư cách, đạo đức trong cuộc sống
Xin chân thành cảm ơn các thầy cô Bộ môn Tự Động ĐHBK TPHCM vì đã
truyền đạt cho tôi những kiến thức nền tảng hết sức quý báu trong thời gian tôi còn học
cao học, cũng như những góp ý khoa học và những phản biện thẳng thắn trong khi tôi
thực hiện các chuyên đề tiến sĩ là những cơ sở hết sức có giá trị giúp tôi hoàn chỉnh
luận án của mình.
Xin cảm ơn vợ, và các con tôi đã cùng chia xẻ trong những ngày khó khăn nhất
cả về vật chất và tinh thần để tôi có thể yên tâm thực hiện luận án này.
Xin gửi lời cảm ơn đến các đồng nghiệp là các giảng viên của Khoa tin học
trường Đại học Yersin và bạn bè thân hữu, những người luôn giúp đỡ và động viên tôi
trong những năm tháng làm luận án.
Mặc dù đã cố gắng hết sức nhưng luận án không tránh khỏi những thiếu xót.
Tác giả rất mong được sự góp ý của quý thầy cô và các bạn đồng nghiệp.
iv
MỤC LỤC
1
TỔNG QUAN 1
1.1
Đặt vấn đề 1
1.2
Mục tiêu và phương pháp nghiên cứu của luận án 4
Xấp xỉ hàm của mạng nơ-ron truyền thẳng 15
2.3
Một số mô hình điều khiển trượt dùng mạng nơ ron 18
2.3.1
Mô hình sử dụng mạng nơ ron làm thành phần điều khiển tương đương 19
2.3.2
Mô hình điều khiển trượt phân ly dùng mạng nơ ron 20
3
ĐIỀU KHIỂN TRƯỢT THÍCH NGHI PHÂN LY DÙNG MẠNG NƠ RON 28
3.1
Điều khiển trượt thích nghi dùng mạng nơ ron 28
3.1.1
Mô tả bộ điều khiển 28
3.1.2
Luật cập nhật thích nghi để huấn luyện mạng 29
Điều khiển trượt thích nghi phân ly con lắc hai chiều 66
5
KẾT LUẬN 73
6
CÁC TÀI LIỆU CÔNG BỐ CỦA TÁC GIẢ 77
7
Tài liệu tham khảo 78v DANH MỤC CÁC HÌNH ẢNH
Hình 2-1 Tín hiệu điều khiển trượt có dạng chuyển mạch 14
Hình 2-2 Mô phỏng quỹ đạo pha và hiện tượng chattering 15
Hình 2-3 Mạng nơ-ron một lớp ẩn trong bộ điều khiển DNNSMC 23
Hình 2-4 Hệ thống DNNSMC của Lon-Chen Hung và Hung Yuan Chung 24
Hình 2-5 Mô hình điều khiển trượt phân ly dùng thuật toán SPSA 25
Hình 4-11 Đáp ứng của điều khiển DANSMC 52
Hình 4-12 Đáp ứng của tín hiệu mặt trượtcủa điều khiển DASMC 53
Hình 4-13 Quỹ đạo pha các biến trạng thái của điều khiển DANSMC 54
Hình 4-14 So sánh đáp ứng của điều khiển DNNSMC và DANSMC 55
Hình 4-15 Kết cấu phần cứng mô hình thực nghiệm để điều khiển trượt thích nghi
phân ly con lắc ngược xoay dùng mạng nơ ron 57
Hình 4-16 Mô hình thực con lắc ngược trong phòng thí nghiệm 58
Hình 4-17 Sơ đồ khối chip vi điều khiển TMS320 2812 59
Hình 4-18 Đáp ứng của trong 30 giây.(lật lên và ổn định) 62
Hình 4-19 Đáp ứng của trong 30 giây 62
Hình 4-20 Tín hiệu điều khiển u trong 30 giây 63
Hình 4-21 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc 64
Hình 4-22 Đáp ứng của góc khi thay đổi khối lượng và chiều dài con lắc 65
Hình 4-23 Con lắc ngược hai chiều 66
Hình 4-24 Biểu diễn hệ tọa độ con lắc ngược hai chiều 67
Hình 4-25 Mô hình điều khiển DANSMC cho con lắc ngược hai chiều 69
Chattering: Hiện tượng dao động xung quanh mặt trượt
DANSMC (Decoupled Adaptive Neural Sliding Mode Control): Điều khiển trượt
thích nghi phân ly dùng mạng nơ ron
DNNSMC (Decoupled Neural Network Sliding Mode Control): Điều khiển trượt phân
ly dùng mạng nơ ron
DSP ( Digital Signal Processing): Xử lý tín hiệu số
Lyapunov: Lý thuyết ổn định được phát biểu bởi Lyapunov
NN (Neural Network): Mạng nơ ron
SMC (Sliding Mode Control): Điều khiển trượt
SHL (Single Hidden Layer): Mạng nơ ron một lớp ẩn
RBFN (Radial Basic Funtion Network): Mạng hàm cơ sở xuyên tâm
MLP (Multiple Layer Perceptron): Mạng nơ ron nhiều lớp
Perceptron: Một đơn vị trong mạng nơ ron
Swinging up: Điều khiển lật lên (cho con lắc ngược)
Sliding surface : mặt trượt
VSC (Variable Structure Control): điều khiển có cấu trúc thay đổi
1
1 TỔNG QUAN
1.1 Đặt vấn đề
Giới thiệu về điều khiển trượt
Điều khiển trượt là một phương pháp điều khiển phi tuyến đơn giản hiệu quả,
dựa vào hồi tiếp các biến trạng thái của hệ thống. Bộ điều khiển được thiết kế sao cho
các trạng thái của hệ thống luôn luôn hướng về một mặt phẳng Hurwitz của các trạng
thái, một khi các trạng thái đã nằm trên mặt trượt thì chúng sẽ tiến về gốc tọa độ. Vì
vậy mục đích điều khiển ổn định trạng thái trở thành điều khiển ổn định tiệm cận các
trạng thái bám trên mặt trượt.
Điều khiển trượt có hai thành phần là thành phần điều khiển tương đương và
thành phần điều khiển bền vững. Thành phần điều khiển bền vững mà trong nhiều tài
liệu còn gọi là thành phần điều khiển hiệu chỉnh có nhiệm vụ chính là điều khiển quỹ
khá phức tạp. Trong tài liệu [1] được giới thiệu năm 2000 dựa trên nhiều nghiên cứu
trước đó, Utkin đã giới thiệu một số các phương pháp thiết kế các bộ điều khiển trượt
phân ly áp dụng được cho các hệ thống phi tuyến bậc bốn. Các phương trình vi phân
biểu diễn mô hình động học của đối tượng được đề nghị biến đổi để đưa về dạng hệ
phương trình chuẩn đã được định nghĩa trước đó. Sau đó bài toán phân ly biến số được
giải quyết dựa trên việc xét từng trường hợp riêng với một loạt các phép biến đổi toán
học và chỉ có thể áp dụng lên từng đối tượng cụ thể chứ không có phương pháp biến
đổi tổng quát. Các nghiên cứu đã được thực hiện phân tích mô hình động học và thiết
kế bộ điều khiển phân ly các đối tượng phi tuyến có độ bất ổn cao như hệ xe con lắc
Thành phần ñiều
khiển tương ñương
Thành phần ñiều
khiển bền vững
Luật ñiều khiển
trượt cổ ñiển
Thông số ñối tượng
phi tuyến thông qua
nhận dạng
Thông số, mô hình
nhiễu và các chặn
trên của các thành
phần bất ñịnh
Hình 1-1 Các thành phần của điều khiển trượt cổ điển
3
đơn, hệ xe con lắc đôi và hệ con lắc xoay hai bậc tự do. Tuy nhiên, các bài toán cho
thấy độ phức tạp cao và không dễ dàng thành công nếu áp dụng lên những đối tượng
phi tuyến khác.
Điều khiển trượt thích nghi dùng mạng nơ-rôn
thế bằng hàm bảo hòa để hạn chế hiện tượng chattering. Tuy nhiên các chặn trên dùng
trong thiết kế thành phần điều khiển bền vững vẫn là các giá trị hằng được chọn trước,
vì vậy chất lượng điều khiển vẫn phụ thuộc vào việc lựa chọn các giá trị hằng khi thiết
kế thành phần điều khiển bền vững.
Vì bài toán điều khiển trượt dùng mạng nơ-rôn hay nơ-rôn mờ không có mô hình
toán học rõ ràng nên không thể áp dụng các phương pháp điều khiển trượt phân ly cổ
điển [1], nên trong các tài liệu [7], [8], [9], [10] các tác giả đã đề nghị một mô hình
điều khiển trượt phân ly đơn giản nhưng rất hiệu quả để kết hợp với bộ điều khiển
trượt dùng mạng nơ-rôn thành bộ điều khiển trượt phân ly dùng mạng nơ-rôn áp dụng
để điều khiển cho các hệ thống đa biến.
Các kết quả nghiên cứu bằng lý thuyết cũng như mô phỏng và thực nghiệm trên
nhiều đối tượng con lắc ngược, hệ cầu banh, cánh tay máy…, đã cho thấy các bộ điều
khiển phân ly dùng mạng nơ-rôn có khả năng điều khiển thích nghi trong những điều
kiện không biết trước các hàm phi tuyến của đối tượng và có khả năng hạn chế được
hiện tượng chattering.
Tuy nhiên việc tách thành phần điều khiển bền vững với thành phần điều khiển
tương đương hoặc việc thay thế hàm dấu bằng hàm bão hòa trong thành phần điều
khiển bền vững đã làm giảm tính bền vững của hệ thống trước nhiễu ở vùng sát mặt
trượt.
1.2 Mục tiêu và phương pháp nghiên cứu của luận án
Mục tiêu nghiên cứu của luận án
Mục tiêu luận án là phát triển các nghiên cứu về điều khiển trượt cổ điển và điều
khiển trượt dùng mạng nơ-rôn để thiết kế bộ điều khiển trượt thích nghi phân ly
DANSMC áp dụng cho hệ phi tuyến đa biến sử dụng mạng truyền thẳng làm bộ điều
khiển trực tiếp kết hợp được cả hai thành phần điều khiển tương đương và điều khiển
bền vững trong điều kiện không biết trước các thông số mô hình của đối tượng và các
chặn trên của các thành phần bất định hoặc hơn nữa các thông số của mô hình và các
giá trị chặn trên có thể bị thay đổi trong quá trình điều khiển. Luật điều khiển trượt
được nghiên cứu thiết kế theo hướng sao cho nó không chứa hàm có dấu nhằm khắc
5
khiển Lyapunov.
6
Các kết quả mô phỏng trên hệ thống con lắc ngược hai bậc xoay tự do và con lắc
ngược hai chiều với đầy đủ các quy trình từ huấn luyện ban đầu nhằm kiểm chứng tính
hội tụ của luật cập nhật thích nghi, đến các kết quả điều khiển bám theo quỹ đạo và các
kết quả thực nghiệm trên hệ thực con lắc ngược xoay nhằm kiểm tra chất lượng của bộ
điều khiển trong điều kiện các thông số mô hình thay đổi liên tục và ảnh hưởng mạnh
của nhiễu từ bên ngoài. Các mô phỏng dựa trên phần mềm matlab và simulink, còn
thực nghiệm dựa trên nền của board xử lý tín hiệu số DSP TMS320-2812 kết hợp với
phần mềm CCS (Code Composer Studio).
Nội dung của luận án
Luận án được chia thành bốn chương chính với các nội dung như sau:
Chương một là chương tổng quan về điều khiển trượt, điều khiển trượt dùng
mạng nơ-rôn, mục đích cũng như phương pháp nghiên cứu của luận án.
Chương hai giới thiệu các kiến thức cơ sở về mạng nơ-ron và lý thuyết điều
khiển trượt, và một số mô hình điều khiển trượt dùng mạng nơ-ron. Phần đầu của
chương này giới thiệu mạng truyền thẳng với đầy đủ các cấu trúc cơ bản, khả năng xấp
xỉ các hàm phi tuyến và các phương pháp huấn luyện mạng. Phần tiếp theo giới thiệu
lý thuyết điều khiển trượt cổ điển được đưa ra cùng một số phân tích về ưu nhược
điểm. Phần cuối của chương này giới thiệu một số mô hình điều khiển trượt phân ly
dùng mạng nơ-ron đã được phát triển trong những năm gần đây.
Chương ba bao hàm nội dung chính của luận án. Trong chương này một bộ điều
khiển trượt thích nghi phân ly dùng mạng nơ-ron DANSMC được đề nghị với luật điều
khiển trượt mới không có các thành phần chuyển mạch nhằm khắc phục hiện tượng
chattering. Hơn nữa, khác với các phương pháp điều khiển trượt dùng mạng nơ-ron
khác được trình bày ở chương hai, mạng nơ-ron ở đây được dùng để thay thế cả hai
thành phần điều khiển tương đương và điều khiển bền vững với tín hiệu hồi tiếp huấn
luyện mạng bao gồm cả tín hiệu mặt trượt và đạo hàm của nó (trong khi các phương
pháp khác chỉ sử dụng tín hiệu mặt trượt), có khả năng học được luật điều khiển mới
tạp dưới các điều kiện bất định của hệ thống.
Các nghiên cứu lý thuyết và thực hành điển hình về điều khiển trượt cổ điển đã
được trình bày đầy đủ trong các tài liệu [1], [11], [12], [13], [14].
Trong những năm gần đây nhiều công trình nghiên cứu kết hợp giữa điều khiển
trượt cổ điển và điều khiển thông minh đã được công bố nhằm khắc phục một số
nhược điểm còn tồn tại của điều khiển trượt cổ điển về tính tối ưu của tín hiệu điều
khiển, hiện tượng chattering của các biến trạng thái xung quanh mặt trượt…, cũng như
phát triển các luật điều khiển trượt mà không cần biết chính xác các thông số của đối
tượng.
Tổng hợp từ các nghiên cứu trên, chương này và trình bày lại một số nội dung
chính, làm cơ sở để phát triển cho mô hình điều khiển trượt phân ly DANSMC sẽ được
trình bày trong chương ba:
- Mô hình toán học của điều khiển trượt cổ điển dưới dạng tổng quát và phát triển
mô hình toán học của bộ điều khiển nhằm áp dụng cho các hệ thống phi tuyến bậc cao
MIMO.
- Mô hình toán học và các công thức để huấn luyện của mạng nơ-ron truyền
thẳng nhiều lớp làm cơ sở để phát triển cho các mô hình điều khiển trượt dùng mạng
nơ-ron và mô hình điều khiển trượt ANSMC được trình bày trong chương ba.
- Một số nghiên cứu về điều khiển trượt thích nghi ứng dụng mạng nơ-rôn đã
được công bố trong và ngoài nước được trình bày lại theo thứ tự phát triển từ những ý
tưởng nghiên cứu ban đầu tới các công trình lý thuyết và thực tiễn đã được công bố
trong những năm gần đây.
9
2.1 Lý thuyết điều khiển trượt
2.1.1 Đối tượng điều khiển
Xét hệ thống phi tuyến biểu diễn bởi phương trình vi phân
duyygyyfy
nnn
++=
++=
=
=
=
−
duxgxfx
xx
xx
xx
n
nx
).()(
1
32
21
&
&
M
&
&
1
xy
(2.5)
Trong đó c
1
, , c
n-1
, là các hệ số được chọn trước sao cho đa thức đặc trưng của
phương trình vi phân sau Hurwitz (có tất cả các nghiệm với phần thực âm)
0
12
)2(
1
)1(
=++++
−
−
−
ececece
n
n
n
&
(2.6)
Nếu thực hiện được luật điều khiển sao cho s = 0, tín hiệu sai lệch e là nghiệm
của phương trình (2.6). Do các nghiệm của phương trình đặc trưng của (2.6) đều nằm
bên trái mặt phẳng phức, nên e(t) sẽ tiến tới 0 khi t tiến tới ∞. Phương trình s=0 xác
định một mặt cong S trong không gian n chiều gọi là mặt trượt (sliding surface) S.
e
c
&
Hurwitz, ta chỉ cần chọn c>0.
Giả sử, ta đã tìm được các luật điều khiển sao cho s đạt tới giá trị không. Khi đó
phương trình (2.7) có thể viết lại :
e
c
e
.
−
=
&
(2.8)
(2.8) cho thấy e(t) có dạng hàm mũ và đạt tới giá trị lân cận 0, sau khoảng thời
gian
c
t
/
3
.
3
=
≈
τ
.
Một cách tổng quát, để chọn các giá trị cho các hệ số của s, cần phải chọn trước
đáp ứng của sai số trạng thái theo mong muốn, chọn các cực tương ứng nằm bên trái
)1(
1
)(
12
)1(
1
)(
&&&
&&&
&&&&
(2.9)
Nếu chọn luật điều khiển sao cho
)(. ssignks
−
=
&
,
0
>
k(2.10)
Lúc đó
0.
<
ss
&&&
(2.11)
Luật điều khiển trượt có tính đến các thành phần bất định
Trong thực tế luật điều khiển trượt cần tính tới các thành phần bất định như nhiễu
hệ thống cũng như sự biến thiên theo thời gian của
)(xf
và
)(xg
.
Gọi
),( txf
∆
,
),( txg
∆
là các thành phần bất định của
),( txf
và
),( txg
của hệ
thống
),()(),(
0
txfxftxf ∆+=
(2.12)
Và
, và
Dtd ≤
)(
(2.14)
Định nghĩa hàm V
2
1
2
V s
=
(2.15)
Điều kiện của luật điều khiển trượt là
0<V
&
(2.16)
Ta có :
( ) ( )( )
usgxgxgxgs
ustxgdecececrtxfsssV
n
n
)(.)(.
.).,() ),(.(.
min0min0
1
)(
0
min0
0
ecececrxf
gxg
x
n
n
n
&&&
++++−
∆+
=
−
−
δ
(2.19)
Và
( )
( )
Df
gxg
tx +∆
∆+
=
max
u u u
x sign g x sign s x t sign g x sign s
δ δ
= + =
− −
(2.21)
Trong đó
)()).(().(
0
ssignxgsignxu
equivalent
δ
−=
là thành phần điều khiển phụ thuộc
vào mô hình danh định của hệ thống còn gọi là thành phần điều khiển tương đương.
)()).((),.(
max
ssignxgsigntxu
corrective
δ
−=
là thành phần điều khiển bền vững, còn gọi
là thành phần điều khiển hiệu chỉnh có tác dụng bù cho các thành phần bất định của hệ
thống và có giá trị phụ thuộc vào các chặn trên của các thành phần bất định của hệ
thống. Thường thì
max
δ
được chọn bằng một hệ số dương k với
[
]
1
, ,
T
n
x x x
=
[
]
1
( ) ( ) . . ( )
T
n
f x f x f x
=
11
22
( 1)( 1)
( ) 0 0 0
0 ( ) 0 0
( )
0 0 ( ) 0
0 0 0 ( )
n m
nm
g x
g x
h x h x h x
=
Hệ thống có bậc tương đối
13
.
f g f
h
y x L h L h.u L h
x
∂
= = + =
∂
& &
( )
2 2
.
f
f g f f
L h
y f g u L h L L h L h
x
∂
= + = + =
∂
&&
M
s e c e c e
− −
−
= + + +
(2.28)
Trong đó
1
c
, …
1
m
c
−
là các ma trận (
p p
×
) được chọn sao cho (2.28) Hurwitz
Định nghĩa
1
2
T
V s s
=
(2.29)
Luật điều khiển trượt được xác định sao cho
( )
= − = + + +
= + − + + +
& &
&
(2.31)
Rút u ra ta có:
(
)
( )
(
)
1
( 1) ( ) ( 1)
1 1
. ( )
m m m
g f f m
u L L h L h c e c e k diag sign s
−
− −
−
= − + + + +
&
(2.32)
(2.32) thực hiện được khi số ngõ vào bằng số ngõ ra và bằng bậc của hệ thống
(
thời hiện tượng chattering xuất hiện càng mạnh. Hiện tượng chattering gây ra một số
hiệu ứng không mong muốn như : phát sinh sai số điều khiển; làm phát nóng mạch
điện tử; mài mòn các bộ phận cơ khí; kích động các mode tần số cao không mô hình
hóa làm giảm chất lượng điều khiển hoặc mất ổn định.
Bài toán điều khiển trượt áp dụng cho các hệ thống đa biến cần kết hợp giữa điều
khiển trượt và điều khiển phân ly. Các phương pháp này dựa trên việc phân tích mô
hình toán học cụ thể của từng đối tượng và rất phức tạp.
2.2 Xấp xỉ hàm của mạng nơ-ron truyền thẳng
Ánh xạ vào ra của mạng hai lớp được biểu diễn như sau:
0 0
1 1
l n
i o ik h kj j k i
k j
u w v x v w
σ σ
= =
= + +
∑ ∑
;
mi , 2,1
=
(2.33)
= =
= + +
∑ ∑
(2.35)
Mạng một lớp ẩn SHL và mạng hàm cơ sở xuyên tâm RBF là hai loại mạng nơ
ron căn bản thường được dùng để nhận dạng các hàm phi tuyến hoặc được sử dụng
như bộ điều khiển trực tiếp
Gọi x, u
r
là cặp tín hiệu vào ra mong muốn của một hàm phi tuyến f . Giả sử ta
muốn xấp xỉ f bởi mạng
(
)
(
)
ˆ
,
f N= =
u x x w
.
Định nghĩa hàm mục tiêu J như sau:
1
.
2
T
J e
= J e e e w
w
(2.37)Vì
0
J >
điều kiện để
min
− >
J
khi
∞
>
−
t
là
0
<
&
J
nên có thể chọn
. .
T
e
µ
∂
∆ = −
∂
e
w e
(2.39)
τ
µ
η
.
=
được gọi là hệ số học.
Áp dụng cụ thể vào mạng một lớp ẩn SHL
Xét một mạng SHL như đã mô tả ở mục (2.1.2), hàm tích hợp của các nơ ron ở
lớp ẩn là hàm tuyến tính
Định nghĩa: