1
MỞ ĐẦU
Tính cấp thiết của đề tài luận án
Các ứng dụng hiện nay của điều khiển dự báo thường yêu cầu các quá trình vận hành trong
một dải làm việc lớn và gần với các điều kiện biên, đồng thời phải thỏa mãn các ràng buộc cũng
như phải đạt được chất lượng gần tối ưu. Đây là những lí do mà điều khiển dự báo phi tuyến được
quan tâm đặc biệt trong những năm gần đ
ây với rất nhiều bước tiến ở cả lĩnh vực lý thuyết và ứng
dụng. Ngoài ra, năng lực ngày càng tăng của các máy tính hiện có cũng như sự phát triển không
ngừng của các phương pháp giải số dành riêng cho điều khiển dự báo phi tuyến đã mang đến khả
năng ứng dụng của nó cả cho các hệ động học biến đổi nhanh. Điều này dẫn đến mộ
t loạt các sự
phát triển mới đầy hấp dẫn, bên cạnh các thách thức mới trong lĩnh vực điều khiển dự báo hệ phi
tuyến trong đó phải tính tới cả việc đưa ra được lời chứng minh tính thỏa mãn nguyên lý tách của
hệ kín phản hồi đầu ra khi ghép chung bộ điều khiển dự báo phản hồi trạng thái phi tuyến với bộ
quan sát trạng thái, cũng như phải xây d
ựng được thuật toán để giải bài toán tối ưu khi có ràng
buộc về tín hiệu điều khiển, …. Các thách thức này cũng chính là động cơ thúc đẩy đề tài nghiên
cứu của luận án.
Mục tiêu và nhiệm vụ của luận án
Mục tiêu của luận án là giải quyết bài toán "Điều khiển dự báo phản hồi đầu ra theo nguyên
lý tách cho hệ phi tuyến", với hai nhiệm vụ chính, bao gồm:
− Sử dụng hàm mục tiêu có cấu trúc biến đổi trong việc xây dựng bộ điều khiển dự báo phản
hồi trạng thái nhằm mở rộng tính linh hoạt của bộ điều khiển và hơn nữa là có thể chuyển
được bài toán điều khiển có điều kiện ràng buộc cho tín hiệu điều khiển cũng như trạng thái
về thành bài toán không ràng buộc.
− Xây dựng bộ điều khiển dự báo phản hồi đầu ra cho hệ phi tuyến trên cơ sở sử dụng bộ
quan sát trạng thái và khảo sát tính ổn định của hệ thu được.
Phạm vi và đối tượng nghiên cứu của luận án
Phạm vi của luận án là nghiên cứu và đưa ra các kết quả cho điều khiển dự báo hệ phi tuyến
tách, làm hệ phi tuyến nói chung và hệ song tuyến nói riêng là ổn định tiệm cận (với bộ
quan sát FTO) và ổn định ISS (khi luôn tồ
n tại sai lệch quan sát).
CHƯƠNG 1: GIỚI THIỆU CHUNG
1.1 Động cơ thúc đẩy đề tài
1.1.1 Hệ điều khiển dự báo
Điều khiển dự báo dựa theo mô hình (Model Predictive Control - MPC), hay gọi tắt là điều
khiển dự báo, đề cập đến một họ các phương pháp điều khiển sử dụng một mô hình toán học để
dự báo tín hiệu ra của đối tượng (quá trình) trong tương lai. Tại mỗi thời điểm trích mẫu, thuật
toán điều khiển dự báo sẽ tối ưu đáp ứng của h
ệ bằng cách tính toán ra dãy tín hiệu điều khiển
tương lai. Chỉ có thành phần đầu tiên của dãy tín hiệu điều khiển tối ưu này được đưa tới đối
tượng và toàn bộ chu trình tính toán sẽ được lặp lại tại các thời điểm trích mẫu tiếp theo
[12,33,48].
Như vậy bộ điều khiển dự báo gồm có ba khâu chính:
− Khâu mô hình dự báo. Khâu này có nhiệm vụ xác định được dãy các giá trị
đầu ra tương lai
thuộc cửa sổ dự báo hiện tại, tức là cửa sổ dự báo
[
)
,kk N
+
tính từ thời điểm hiện tại k .
Kết quả đầu ra của khâu dự báo này là giá trị đầu ra tương lai
, 0,1, , 1
ki
iN
+
=−…y dưới
dạng các hàm phụ thuộc tín hiệu đầu vào tương lai trong cùng cửa sổ dự báo
11
,, ,
kk kN
col
++−
=U …uu u
thì chỉ có phần tử đầu tiên của nó:
()
**
,, ,
k
I= ΘΘ
U
…u
được sử dụng, trong đó I là ký hiệu của ma trận đơn vị và
Θ
là ma trận có tất cả các phần
tử bằng 0. Tại thời điểm
1k + tiếp theo, chu trình trên được thực hiện lặp lại.
Với ưu điểm nổi trội là điều khiển được những hệ thống (quá trình) có các ràng buộc về tín
hiệu điều khiển (và còn có thể cả về trạng thái) nên điều khiển dự báo đã được nghiên cứu, phát
triển rất nhanh. Một tổng quan tương đối đầy đủ về các phương pháp điều khiể
n dự báo tuyến
tính này đã được nghiên cứu sinh trình bày trong tài liệu [3].
Tuy nhiên, có thể thấy các phương pháp điều khiển dự báo nêu trên đều tập trung chủ yếu
cho bài toán điều khiển dự báo tuyến tính, trong khi các đối tượng trong thực tế đều ít nhiều mang
tính phi tuyến và hàm mục tiêu thường không ở dạng toàn phương cũng như các ràng buộc
thường gặp là phi tuyến. Bởi vậy, điều khiển dự báo hệ phi tuyế
Hơn thế nữa, các phương pháp điều khiển phản hồi đầu ra dựa trên quan sát trạng thái cho
các hệ phi tuyến nói chung và các hệ điều khiển dự báo nói riêng đều phải chỉ ra tính ổn định của
hệ kín dựa trên nguyên lý tách. Thậm chí, các phương pháp điều khiển dự báo hệ tuyến tính cũng
không đương nhiên thỏa mãn nguyên lý tách do sự có mặt của các điều kiện ràng buộc [18]. Theo
các tài liệu [17,46] thì tính thỏa mãn nguyên lý tách có thể
được chứng minh dựa trên ba xu
hướng thiết kế sau:
1. Tách (
separation)
2. Bộ điều khiển tách (
controller separation)
3. Bộ quan sát tách (
observer separation)
Việc lựa chọn một trong ba xu hướng thiết kế nêu trên nhằm tạo ra
tính ổn định cho hệ
thống điều khiển dự báo phản hồi đầu ra theo nguyên lý tách
cũng chính là một trong những
động cơ thúc đẩy đề tài.
B) Về hàm mục tiêu có cấu trúc biến đổi
Thứ hai là về khả năng chuyển bài toán điều khiển có ràng buộc thành bài toán điều khiển
không ràng buộc thành bài toán điều khiển dự báo không ràng buộc nhờ sử dụng hàm mục tiêu có
cấu trúc biến đổi.
Xét lại hàm mục tiêu (1.3), nay được viết lại thành:
()
TT
J =+UEEUUQR (1.4)
với
(
)
−
Càng tăng R , điều kiện ràng buộc:
4
maxk
u≤u
(1.5)
càng dễ được thỏa mãn.
−
Nhưng càng tăng R chất lượng bám tín hiệu mẫu
k
w đặt ở đầu vào càng xấu.
Bởi vậy một ý tưởng dung hòa xuất hiện ở đây là ngay ban đầu (khi
k nhỏ) ta chọn R đủ
lớn để có
U
đủ nhỏ sao cho với nó có được điều kiện ràng buộc (1.5). Khi điều kiện ràng buộc
(1.5) đã được thỏa mãn, ta sẽ giảm
R để thông qua đó làm tăng thêm sự tham gia của thành
phần sai lệch bám
T
EEQ trong
()J
U
nhằm làm giảm sai lệch bám sau này. Tương tự ta cũng có
thể chọn
Q
đủ nhỏ ban đầu, sau đó tăng dần
Q
theo k .
(, )
ki ki ki
g
+
++
eu dưới dấu tổng thay đổi theo k một cách
thích hợp, nghiệm bài toán tối ưu không ràng buộc:
*
arg min ( )J=
U
U
được tìm nhờ các phương pháp điều khiển tối ưu (chẳng hạn nhờ các công thức nghiệm tường
minh của biến phân hay quy hoạch động) cũng sẽ vẫn thỏa mãn điều kiện (1.5) của bài toán điều
khiển dự báo.
1.2 Cơ sở lý thuyết
1.2.1 Tính ổn định Lyapunov
Định nghĩa 1.1: Xét hệ phi tuyến tự trị (không bị kích thích), không dừng, cân bằng tại gốc tọa độ
và có mô hình không bị kích thích
:
1
(,)
kk
k
+
=xfx với (, ) ,k =00
f
0k∀≥. (1.9)
<x
⇒
k
ε
<x
,
0
kk∀≥ .
b)
Ổn định tiệm cận tại
0
k , nếu nó ổn định và còn có lim
k
k
→∞
=
0x .
1.2.2 Tính ổn định ISS
Khái niệm ổn định ISS liên quan tới hệ bất định, có mô hình không bị kích thích:
1
(,,)
kkk
k
+
=xfxd (1.10)
trong đó
k
d là tín hiệu bất định, tác động không mong muốn vào hệ. Khái niệm này được hiểu
như sau:
0
kk
=
, luôn có:
(
)
(
)
(
)
000
,, ,
kk k
kkk
βγ
∞
≤−+xxd x d
.
1.2.3 Quy hoạch động của Bellman
Định lý 1.3 [23]: Xét bài toán quy hoạch động dạng chuẩn:
()
01
1
1
, ,
0
(, )
,(,,) min
N
N
BJ
−
=
…uu
x
ta có với mọi N ∈N và 1, KN= … :
()
()()
0
00
, ,
0
inf , , ,
K
K
kk NK K
k
BgkBK
−
=
∑
⎡
⎤
=+
⎢
⎥
⎣
⎦
0
,, ,
K
kk NK K
k
BgkBK
∗∗
−
=
∑
=+xxu x.
Hệ quả sau đây của định lý 1.3 khẳng định rằng đoạn cuối của dãy giá trị tín hiệu điều khiển
tối ưu cũng là tối ưu với trạng thái đầu và cửa sổ dự báo thích hợp.
Hệ quả 1.1 [23]: Nếu
01
, ,
N
∗∗
−
…uu là dãy giá trị tín hiệu điều khiển tối ưu ứng với trạng thái đầu
0
x và cửa sổ dự báo 2N ≥ , thì ứng với mỗi 1, KN
=
… , dãy
1
, ,
KN
∗∗
−
…uu cũng là dãy
⎩
…uu
xfxu
xu
(1.13)
ta có định lý về tính ổn định của hệ kín như sau.
Định lý 1.4 [23]: Xét bài toán điều khiển tối ưu (1.13) cho hệ thống được mô tả bởi:
()
1
,,
kkk+
=xfxu (,)=00 0
f
.
Giả sử tồn tại các hàm
123
, ,
α
αα
∞
∈
K sao cho:
()
()
()
12
,
kk k
Vk
αα
()
1
,
kkkk
∗
+
=xfxux
ổn định tiệm cận theo nghĩa ở định nghĩa 1.1.
6
CHƯƠNG 2: TỔNG QUAN VỀ ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA
DỰA TRÊN QUAN SÁT TRẠNG THÁI
2.1 Điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái cho hệ
tuyến tính
2.1.1 Điều khiển dự báo bền vững hệ tuyến tính sử dụng bộ quan sát tựa Luenberger
Thuật toán này được đưa ra bởi Wan và Kothare [50] để làm ổn định các đối tượng (quá
trình) được mô tả bởi mô hình tuyến tính bất định có các tham số nằm trong một siêu diện hoặc
mô hình tuyến tính bất định có cấu trúc.
2.1.2 Điều khiển dự báo bền vững hệ tuyến tính sử dụng bộ quan sát Moving Horizon
Khác với xu hướng thiết kế độc lập bộ điều khiển phản hồi trạng thái và bộ quan sát trạng
thái như ở [50] thì các kết quả được công bố trong [36,49] lại đại diện cho nhóm phương pháp
thiết kế bộ quan sát trạng thái trước rồi đưa sai lệch quan sát vào bài toán thiết kế bộ điều khiển
dự báo.
2.2 Điều khiển dự báo phản hồi đầu ra dựa trên quan sát trạng thái cho hệ
phi tuyến
2.2.1 Điều khiển dự báo hệ phi tuyến sử dụng bộ quan sát High Gain
Tư tưởng cơ bản của phương pháp thiết kế bộ điều khiển dự báo phản hồi đầu ra cho hệ
nêu trong [19] là thiết kế bộ điều khiển phản hồi trạng thái không liên tục có tính bền vững với
nhiễu, sau đó thiết kế bộ quan sát trạng thái với sai lệch quan sát đủ nhỏ để có thể coi nó là nhiễu
tác động lên hệ kín.
sử dụng hàm mục tiêu có cấu trúc biến đổi sẽ được khảo sát. Tiếp theo, một điều kiện đủ cho tính
ổn định của hệ ghép bộ điều khiển dự báo phản hồi trạng thái này với bộ quan sát trạng thái tối ưu
theo nguyên lý tách s
ẽ được chứng minh.
Hơn nữa, luận án cũng sẽ chỉ ra các điều kiện đủ để bộ quan sát tối ưu trở thành bộ quan
sát FTO, là bộ quan sát rất ít được đề cập đến trong điều khiển dự báo.
Tất cả các kết quả trên sẽ được áp dụng cho riêng hệ song tuyến.
CHƯƠNG 3: ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA VỚI BỘ QUAN
SÁT TRẠNG THÁI TỐI ƯU CHO HỆ PHI TUYẾN
3.1 Điều khiển dự báo phản hồi trạng thái hệ phi tuyến
3.1.1 Phản hồi trạng thái với hàm mục tiêu có cấu trúc biến đổi
Xét các đối tượng (quá trình) phi tuyến được mô tả bởi mô hình trạng thái không liên tục:
1
(, )
kkk+
=xfxu (3.1)
trong đó
(,)⋅⋅
f
là vector hàm phi tuyến khả vi hai lần và
(,) .
=
00 0
f
Xét hệ (3.1) ở thời điểm
k hiện tại. Độ rộng của cửa sổ dự báo N là cố định và cho trước.
Ký hiệu
k
++
=+ + −=efewvuwfev (3.3)
Mô hình mô tả sai lệch bám (3.3) này cũng sẽ được sử dụng để dự báo các giá trị sai lệch bám
ki+
e trong khoảng cửa sổ dự báo
[
)
,kk N
+
.
Như vậy với mô hình (3.3), bài toán điều khiển bám ổn định đã được chuyển về bài toán
điều khiển ổn định. Để tránh việc sử dụng quá nhiều ký hiệu, từ nay về sau, ta vẫn sử dụng ký
hiệu
k
u thay vì
k
v cho tín hiệu vào ở bài toán điều khiển bám. Khi đó, tương ứng với bài toán
điều khiển bám, hàm mục tiêu cho việc xây dựng bộ điều khiển dự báo phản hồi trạng thái cũng
có cấu trúc phụ thuộc theo sai lệch
k
e tức là:
()
1
0
(, )
N
kkN kikiki
i
ki
g
+
⋅
⋅
có cấu trúc thay đổi theo i chứ không cố
định như được giả thiết ở các công trình trước [23,47]. Chính vì lý do đó nên ta gọi
k
J là hàm
mục tiêu có cấu trúc biến đổi.
Ghép chung mô hình sai lệch (3.3) trên với hàm đo tổng các giá trị sai lệch thuộc khoảng dự
báo
[, )+kk N
vừa có, ta sẽ được bài toán tối ưu động có cấu trúc giống với bài toán quy hoạch
động dạng chuẩn, phục vụ việc xác định tín hiệu điều khiển tối ưu
*
k
u
tại thời điểm
k
, như sau:
()
1
/
1
1
, ,
0
J
không bắt buộc ở dạng (3.4) mà tổng quát hơn sẽ là hàm nhiều biến:
8
()
11 1 1
(, , , , , , )
kkN kkkk kNkN
Jf F
++++−+−
=+ …eeueueu
(3.8)
mà ở đó khi sử dụng ký hiệu:
11
(, , , , ), 0,, 1
i i ki ki kN kN
FF i N
+ + +− +−
==−……eu e u
(3.9)
là thành phần hàm con trong
0
FF= ,
k
J
có cấu trúc biến đổi. Cụ thể hơn, khi ký
hiệu hàm Bellman tại
i
là:1
, ,
() min
kNki
iki i
BF
++−
+
=
…uu
e
(3.12)
thì vẫn phải có được:
[]
11
()min (, ) ( )
ki
J
dạng tổng quát
(3.8) được định nghĩa trong toàn bộ khoảng dự báo
[, )kk N+
. Ký hiệu
i
F
là thành phần của
k
J
xác định trong khoảng con
[, )kikN++
cho bởi
(3.9). Nếu hàm
i
F
đó tách được theo một trong hai dạng (3.10) hoặc (3.11) và
(, )0
ki ki ki
g
++ +
≥eu
thì hàm Bellman (3.12) tại
i
=
∑
⎧
=
⎪
⎨
=+→
⎪
⎩
…uu
efeu
eu e
(3.15)
trong đó
()
NkN
B
+
e
được giả định là hàm Bellman tại bước
N
trong cửa sổ dự báo vô hạn
[, ]k
∞
:
,
()min (,).
0i
=
:
0,min
(,) () .
kkk
VkB J==ee
9
Hệ quả 3.2: Nếu hàm Bellman giả định ()
NkN
B
+
e trong (3.15) được chọn tương ứng với khoảng
thời gian còn lại
[]
,N ∞
sao cho ở tất cả các vòng lặp k luôn có:
() ()
12
(,)
kk k
Vk
αα
≤≤ee e
(3.16)
()
kk
ue
của bộ điều khiển dự báo sẽ làm hệ sai lệch (3.3) ổn
định tiệm cận.
3.2 Quan sát trạng thái hệ phi tuyến
Để sử dụng được bộ điều khiển dự báo phản hồi trạng thái ở mục 3.1 thì rõ ràng phải có
điều kiện là tất cả các biến trạng thái nằm bên trong hệ là đo được. Tuy nhiên trong nhiều ứng
dụng thực tế, thông tin về trạng thái của hệ không thể đo được đầy đủ mà chỉ có tín hiệu ra của hệ
là đo được:
(, ).
kkk
=yhxu
(3.19)
Do đó để áp dụng được các phương pháp điều khiển dự báo phản hồi trạng thái đã có, vector
trạng thái
k
x
của hệ phải được ước lượng từ vector tín hiệu ra
k
y
đo được và vector tín hiệu vào
k
u
đã biết nhờ sử dụng một bộ quan sát trạng thái thích hợp.
Để làm rõ hơn nữa định nghĩa trên, ta ký hiệu:
0
(,), 0,1, , 1
k
kk M=Φ = −
U
…
f
xx
(3.21)là nghiệm phương trình sai phân trong mô hình (3.22)
của hệ (phương trình thứ nhất), ứng với
dãy giá trị tín hiệu vào:
01 1
{,, , }
M −
= …uu uU
(3.22)và
0
x
là trạng thái đầu.
−…
cũng như thay
0
x
bởi
x
thành:
10
()
()
()
/
/
/
(,0)
(,1)
()
(, 1)
T
M
⎛⎞
Φ
⎜⎟
⎜⎟
Φ
⎜⎟
=
⎜⎟
U
cho bởi
(3.25)
là nội xạ (injective).
Nếu
()T x
U
còn có thêm tính chất là ánh xạ trơn, thì nó sẽ là nội xạ khi và chỉ khi (theo
[29]):
rank ,
T
n.
∂
=∀
∂
x
x
U
(3.26)
Bởi vậy ta suy ra được các tiêu chuẩn sau:
1) Hệ (3.20)
với các vector hàm trơn
(,), (,)
⋅
⋅⋅⋅
f
h
trong cửa sổ quan sát
[, )kk M+
. Có thể thấy khi đã có
k
x thì dựa vào mô hình (3.20) của hệ ta
cũng có
kM+
x .
Sau khi đã có
k
x
ở thời điểm
k
và hệ chuyển sang thời điểm tiếp theo
1k +
, chu trình quan
sát trên sẽ được lặp lại để có
1k +
x với cửa sổ quan sát
[1, )kkM
+
+
. Như vậy, bộ quan sát này sẽ
dịch chuyển tương ứng từng bước từ
[, )kk M
+
tới
[1, 1)kkM
+
++
(
(
)) )
11
11
11
(, )
(, ), , ,
(,, , , ) (,)
ki ki ki
kk k ki
ii
kkk ki ki
++−+−
++−
++−
=
=
==
…
xfxu
ff fxu u u
f
xuu u fxU
(3.27)
iiki
εγ
γ
γ
+++
++
+
=−
=−
=
yhxu
yhfx u
hx
U
U
(3.28)
với
i
γ
∈K là hàm tùy chọn và
1
(, ) ((,), )
i
iki ki ki ki
+
++
xhx
U
(3.29)
Sai lệch quan sát
i
ε
cũng như hàm mục tiêu
()
k
Q
x
trong các công thức (3.28) và (3.29)
được viết ở dạng tổng quát. Tuy nhiên, trong ứng dụng, sẽ là đủ nếu ta sử dụng
()
i
γ
⋅∈K
dạng
đơn giản:
()
()
(
)
11 1
(, ) (, ) (, )
T
1
1
0
11
11
00
() (, )
(, ) (, ).
M
kiiki
i
MM
T
T
ii iki iki
ii
Q
PP
γ
−
+
=
−−
++
==
∑
∑∑
=
==
k
Q
x là lồi theo
k
x .
Định lý 3.1: Nếu bài toán tối ưu (3.33) có nghiệm
*
k
x thỏa mãn với ít nhất một chỉ số
0 lM
≤
<
:
a)
()
*
((,)) 0,
l
lkl kl
γ
+
−=
yhfxU
(3.35)
liên tục và quan sát đều, chuỗi (3.29) ứng với
M =∞
có
min
Q
hữu hạn, thì ở đó sẽ có
*
kk
=
xx
.
3.2.3 Cài đặt thuật toán quan sát tối ưu
Dựa vào nguyên tắc làm việc của bộ quan sát trạng thái tối ưu được trình bày ở mục 3.2.2,
thuật toán quan sát trạng thái tối ưu tổng quát sẽ có dạng cài đặt cụ thể như sau:
Thuật toán 3.1: (Quan sát trạng thái tối ưu)
1) Chọn cửa sổ quan sát
M
và khai báo hai mảng dữ liệu đầu vào
,uy
có độ dài
M
với các
phần tử được ký hiệu là
[] , [] , 0,1, , 1.
mp
iiiM∈∈= −RR…uy
2) Xây dựng hàm mục tiêu (3.29) có sử dụng (3.27), (3.28) cho bài toán tối ưu (3.33).
3) Gán
0k = và đo 1M − giá trị vào ra đầu tiên của hệ (3.20) gồm
M
M
+−
+−
−=
−=
uu
yy
b) Giải bài toán tối ưu (3.33) để tìm
*
k
x . Nếu sử dụng các phương pháp lặp để tìm nghiệm
*
k
x
thì giá trị khởi phát sẽ là
*
1
k −
x trong đó
*
1
−
x là tùy chọn.
c) Dồn lại mảng dữ liệu bằng cách thực hiện
. Cửa sổ điều khiển này chứa thời điểm hiện tại
1.kM
+
−
Nó chia cửa sổ điều khiển thành hai đoạn, đoạn thứ nhất
[
)
,kk M
+
thuộc về quá khứ, được sử
dụng để quan sát trạng thái
*
k
x
ở thời điểm
k
từ các giá trị vào ra đo được là
1
, ,
kkM
+
−
…uu
và
1
, ,
kkM+−
…yy
Bây giờ ta sẽ ký hiệu dãy giá trị
*1
0
{}
MN
ki
+
−
+
u là nghiệm của bài toán tối ưu trong khoảng
cửa sổ điều khiển hiện tại (xem hình 3.7):
1
1
0
(, )
(, ) ( )min
ki ki ki
MN
kkikikiMNkMN
i
Jg B
++ + +
+−
+++ + ++
=
∑
=
⎧
⎪
ki
+
−
+
u
sẽ là tín hiệu điều khiển dự báo phản hồi trạng thái của
bộ điều khiển dự báo ở thời điểm
k
. Khi đó hệ (3.20) cùng với bộ điều khiển dự báo phản hồi
trạng thái
*
()
kk
ux
lấy từ bài toán tối ưu (3.45) tạo thành hệ kín:
*
1
( , ( )).
kkkk+
=xfxux
(3.46)
Song vấn đề đặt ra ở đây là cửa sổ dự báo thật sự chỉ là khoảng con
[, )kMkNM+++
của
cửa sổ điều khiển, tức là tín hiệu điều khiển phản hồi về không phải là
*
()
kk
u
cũng sẽ là nghiệm tối ưu
tương ứng với khoảng con
[, )kMkNM+++
trong đó.
Hệ quả 3.3: Nếu
*1
0
{}
MN
ki
+−
+
u
là nghiệm tối ưu trong toàn bộ cửa sổ điều khiển thì
*1
{}
MN
kiM
+
−
+
u
sẽ là nghiệm tối ưu của đoạn cửa sổ dự báo trong cửa sổ điều khiển
.
Hệ quả 3.3 trên đây thực chất là sự mở rộng của hệ quả 1.1 cho trường hợp hàm mục tiêu có
cấu trúc biến đổi. Với nội dung hệ quả 3.3 ở trên thì việc kiểm tra tính thỏa mãn nguyên lý tách
của bộ điều khiển dự báo phản hồi đầu ra ở hình 3.7 sẽ thay được bằng việc kiểm tra tính ổn định
của hệ (3.46) khi bộ điều khiển
−
+
=
∑
=
=−
xx
yhfx
U
(3.48)
có
1
{, , }
ik ki+−
= …uuU
,
1
{, , }
kkM
+
−
…yy
là các tham số đã biết.
Từ hệ quả 3.2 của lý thuyết điều khiển dự báo bằng phản hồi trạng thái cho hệ (3.45) với
12
() (,) ()
kk k
Vk
α
α
≤≤xx x với
12
,
α
α
∈
K (3.50)
thì bộ điều khiển tối ưu
*
()
kk
ux
của (3.46) sẽ làm hệ kín:
*
1
(, ())
kkkk+
=xfxux
ổn định tiệm cận. Khi đó
(,)
k
ux , trong đó
*
k
x là nghiệm
của bộ quan sát tối ưu (3.48). Nói cách khác ta phải kiểm tra tính ổn định của hệ:
()
()
**
1
1
*
0
,(),
arg min ( )( , ) .
k
kkkk
M
i
kikiki
i
γ
+
−
+
=
∑
⎧
=
cũng sẽ làm hệ ổn định với mọi bộ quan
sát trạng thái thỏa mãn
:
()()
** *
21
(, ()) (, ()).
kkk kkk
αα
≤
fx u x fx u x
(3.52)
Có thể thấy ngay là những bộ quan sát FTO đều thỏa mãn điều kiện (3.52), ở đó dấu ""
≤
được thay cụ thể bằng dấu
""=
.
Mặc dù đã đưa ra được điều kiện đủ (3.52) cho tính ổn định theo nguyên lý tách của hệ kín,
song ta có thể thấy đây là điều kiện khá chặt. Bởi vậy để nới lỏng khả năng ứng dụng cho nó,
luận án đã đưa ra thêm một phát biểu bổ sung như sau.
Định lý 3.4: Nếu bộ điều khiển dự báo phản hồi trạng thái
*
()
kk
ux
≤O e ,
γ
∈K
trong đó
∞
e là ký hiệu chuẩn vô cùng của vector hàm và
,
() max(,), ,dd
=
∀∈OO
xy
xy xy
có
(,)d xy
là ký hiệu khoảng cách của hai phần tử ,xy.
CHƯƠNG 4: ĐIỀU KHIỂN DỰ BÁO PHẢN HỒI ĐẦU RA VỚI BỘ QUAN
SÁT TRẠNG THÁI TỐI ƯU CHO HỆ SONG TUYẾN
Phần lớn tính phi tuyến của các quá trình công nghiệp, khi được biểu diễn dưới dạng không
liên tục, đều xấp xỉ về được một trong hai dạng sau:
1
() ()
kkkkk
AB
+
=+xxxxu
(4.1)
hoặc:
1
Ta sẽ sử dụng hàm mục tiêu dạng toàn phương có tham số
biến đổi:
()
1
0
N
TT T
ki ki ki ki ki ki kN kN kN
i
JQ R Q
−
+++ +++ + + +
=
∑
=++xxuux x
(4.5)
với
ki
Q
+
,
0, 1, , 1iN=−…
là các ma trận đối xứng bán xác định dương,
ki
R
+
,
ma trận đối xứng xác định dương
i
L
với
1, ,1, 0iN=−…
là nghiệm của các phương trình:
(
)
1
11 11
TT TT
i ki ki i ki ki i ki ki ki i ki ki i ki
LQ L L R L L
−
+ +++ +++ + +++ +++
=+ − +AAAB BBBA
(4.7)
và ở bước đầu tiên có
NkN
LQ
+
= , thì dãy giá trị tín hiệu điều khiển:
, 0,1, , 1
ki i ki
Ki N
()
1
TTT
ki ki ki ki ki i ki ki i
ii ki
LQ LI R L L
−
++ ++++ +
+
=+ − +
⎡⎤
⎢⎥
⎣⎦
AB BBBA (4.10)
thì dãy giá trị tín hiệu điều khiển:
, 0
ki i ki
Ki
++
=≥ux
(4.11)
với
()
1
TT
ikikiikikiiki
:1kk
=
+
và quay lại bước 2.
16
0 5 10 15 20 25 30 35 40 45 50
0
0.5
1
1.5
k
state x
1R decreasing
R constant
0 5 10 15 20 25 30 35 40 45 50
-0.5
0
0.5
1
k
state x
2R decreasing
R constant
⎜⎟⎜ ⎟
⎝⎠⎝ ⎠
=+AB
xx
x
có
11
1() 0.25()
, .
01 0.5
kk
xk xk
⎛⎞⎛ ⎞
==
⎜⎟⎜ ⎟
⎝⎠⎝ ⎠
AB
Hình 4.1 mô phỏng đáp ứng thời gian của hai biến trạng thái của hệ với:
0.2
k
QQ I== và
()
14 .
k
k
R =
Việc chọn
k
không thay đổi (đường nét đứt). Tuy nhiên,
tín hiệu điều khiển trên hình 4.2 cho thấy giảm
k
R đồng nghĩa với việc cần nhiều nỗ lực điều
khiển hơn để đưa hệ nhanh về ổn định so với khi giữ nguyên
.
k
R
Bài toán mở: Xét bài toán điều khiển hệ song tuyến (4.1) với bộ điều khiển nêu ở thuật toán 4.1.
Cho trước điều kiện ràng buộc
maxk
u≤u
, hãy xác định hai ma trận ,
kk
QR tương ứng cho hàm
mục tiêu
(4.5).
Hình 4.1: Đáp ứng thời gian của các biến trạng
thái
1
x và
2
x cho ví dụ 4.1.
Hình 4.2: Tín hiệu điều khiển
u cho ví dụ 4.1.
0 5 10 15 20 25 30 35 40 45 50
-1.2
-1
-0.8
-0.6
k
R
đối xứng xác định dương. Đồng
thời chọn
μ
và
η
thỏa mãn
01
μ
<
<
,
1
η
>
.
2) C ập nhật trạng thái
k
x
.
3) Giải phương trình (4.10) với 0i
=
và tính
(
)
1
000
TT
kk k k k
1
() (),
().
kkkkk
kkk
AB
C
+
=+
=
xuxuu
yux
(4.20)
Để đơn giản về mặt ký hiệu, ta viết lại mô hình (4.20) thành:
1
,
,
kkkkk
kkk
+
=+
=
AB
C
xxu
yx
(4.21)
⎜⎟
⎜⎟
⎜⎟
=∀=
⎜⎟
⎜⎟
⎜⎟
⎝⎠
C
CA
CAA
CA A
…
…
uu u
U
. (4.23)
4.2.2 Thiết kế bộ quan sát trạng thái tối ưu cho hệ song tuyến
Hệ (4.20) hay (4.21) có các hàm
(,)
i
ki
f
x U
tính theo (3.27) như sau:
()( )
(
ikikiki
ki ki ki k k ki ki k k k
ki ki k k k ki ki ki
+++
+++− ++− +
++− +++ ++−+−
=−
=− + +
+++
C
CA A CA AB
CA AB CB
ey x
yx u
uu
(4.26)
Vậy ta có tổng bình phương các sai lệch quan sát trong toàn bộ cửa sổ quan sát là:
18
1
0
()
M
TT
kiikk
1
22
1
3
12
2
00
0
00
00
00
0
k
kk
k
kkk kk
kk
kk
kM j k kM j k
kM
jkM jkM
k
k
k
kM j k
jkM
+
+
++ ++
⎝⎠ ⎝⎠
⎝
⎞
⎟
⎟
⎟
⎟
⎟
⎟
⎛⎞
⎟
⎜⎟
⎝⎠
⎠
CB
CAB CB
CABCAB
CAB
y
y
by
y
u
+− +−
⎛⎞
⎜⎟
⎜⎟
⎜⎟
=
⎜⎟
⎜⎟
⎜⎟
⎝⎠
C
CA
CAA
CA A
…
Nói cách khác:
()
() 2
TT T T
kkkkkkkkkk
QGG G=−+PPP
xx xb xbb
. (4.28)
Do hàm mục tiêu (4.28) có dạng toàn phương nên nghiệm tối ưu của nó sẽ là:
kk
∗
=
xx với mọi cửa sổ quan sát. Nói cách khác, bộ quan sát tối ưu cho hệ song
tuyến với giá trị trạng thái quan sát được xác định theo (4.29) là bộ quan sát FTO.
Thuật toán 4.3: (Quan sát trạng thái tối ưu hệ song tuyến)
1) Chọn cửa sổ quan sát
M và khai báo hai mảng dữ liệu đầu vào
,uy
có độ dài M với các
phần tử được ký hiệu là
[] , [] , 0,1, , 1.
mr
iiiM∈∈= −RR…uy
2) Gán
0k =
và đo
1M −
giá trị vào ra đầu tiên của hệ (4.20) gồm , ,
ki ki
+
+
uy
0,1, , 2.iM=−…
Đưa những giá trị đo được này vào hai mảng đã khai báo theo thứ tự:
[] , [] .
ki ki
rồi gán vào mảng:
1
1
[1] ,
[1] .
kM
kM
M
M
+−
+−
−=
−=
uu
yy
b) Xác định các ma trận
()()
1
[1], [1]
Mi
AM BM
−
=−=−ABuu
,
(
)
1
[1]
M
∏∏∏
⎛⎞
⎜⎟
⎜⎟
⎜⎟
=−
⎜⎟
⎜⎟
⎜⎟
−
⎝⎠
⎛⎞
⎛⎞
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎜⎟
−
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎛⎞ ⎛⎞ ⎛⎞
⎜⎟
⎜⎟
−
⎝⎠
G
−−
⎛⎞
⎜⎟
⎜⎟
⎜⎟
=
⎜⎟
⎜⎟
⎜⎟
⎝⎠
C
CA
CAA
CA A
…
c) Tính
()
1
TT
k
GGG
−
∗
= PP
xb
.
,
0.5
0.5
1 , 1 .
kk
kk
k
k
kk
ax k u x k a u
ux k x k
u
yxkxk
+
⎧
+
⎛⎞
⎛⎞
==
⎪
⎜⎟
⎜⎟
−
−
⎨
⎝⎠
⎝⎠
⎪
=+ =
⎩
true x
1
estimated x
1
0 5 10 15 20 25 30 35 40 45 50
-2
-1
0
1
2
k
x
2
true x
2
estimated x
2
Hình 4.4: Trạng thái quan sát được so với trạng thái thực của hệ khi không có nhiễu đo.
Cho
0.25,a =
hệ (4.31) thỏa mãn tính quan sát đều và hơn nữa, hệ là ổn định. Để khảo sát
các đặc tính của bộ quan sát, các mô phỏng cho trường hợp này được thực hiện cho cả trường hợp
tín hiệu ra đo được không bị lẫn nhiễu và tín hiệu ra đo được bị lẫn nhiễu. Ngoài ra, sai lệch giữa
trạng thái thực với trạng thái quan sát được sẽ được ký hiệu là
()
12
() , ()
T
k
Q =
x
x
nên ta thấy giá trị quan sát được trùng hoàn toàn với giá trị thực của biến trạng
thái, thậm chí còn không phụ thuộc vào độ rộng của cửa sổ quan sát
M . Điều này là phù hợp với
điều kiện đủ đã được nêu trong định lý 3.1. Khi này bộ quan sát tối ưu trở thành bộ quan sát FTO.
4.3 Tính ổn định của hệ song tuyến phản hồi đầu ra theo nguyên lý tách
Để khẳng định được tính ổn định của hệ điều khiển dự báo phản hồi đầu ra cho hệ song
tuyến bằng lý thuyết và thực nghiệm, ta xét hệ song tuyến mô tả được dưới cả hai dạng sau:
1
() (),
(),
kkkkk
kkk
AB
C
+
=+
⎧
⎨
=
⎩
xxxxu
yux
(4.33)
và
iiiM∈∈= −RR…uy
2) Gán
0k = và đo
1M −
giá trị vào ra đầu tiên của hệ (4.20) gồm ,
ki ki
+
+
uy
0,1, , 2iM=−… . Đưa những giá trị đo được này vào hai mảng đã khai báo theo thứ tự:
[] , []
ki ki
ii
++
==uuyy.
3) Xây dựng các ma trận
()
//
[],
i
Ai=A u và
(
)
[]
i
Ci
=
C u
với 0,1, , 1.iM
⎜⎟⎜⎟
−
⎝⎠⎝⎠
y
b
y
b) Tính
()
1
TT
k
GGG
−
∗
= PP
xb
.
c) Tính
kM+
x
dựa vào mô hình (4.34) và các số liệu đo
, , 0,1, , 2
ki ki
iM
++
=
uu yy
f) Gán:
() ()
11
[1]: , [1]: ,
:[1], :[1].
kM kM
MM
MM
MM
∗
++
−−
−= −=
=− =−
AA CC
uuyy
uu
g) Gán
:1
kk=+
rồi quay lại bước a).
Định lý 4.4: Trong hệ điều khiển dự báo cho đối tượng song tuyến (4.33) và (4.34) bằng bộ điều
khiển dự báo phản hồi đầu ra thiết kế theo thuật toán
4.3, nếu tại mọi thời điểm k có:
a) Ma trận
0
()
k
k
xk ux k
ux k x k
+
+
⎛⎞
=
⎜⎟
−
⎝⎠
x
và
(
)
(
)
(
)
12
1 , 1
kk
yxkxk
=
+=x (4.38)
trong đó
() ()
()
12
,
)
0.5
k
k
k
u
A
u
⎛⎞
=
⎜⎟
−
⎝⎠
u .
Chọn cửa sổ quan sát
5M = . Ngoài ra hàm mục tiêu của bộ điều khiển có dạng (4.35) với
22k
QQI
×
== và 1.
k
RR== Hàm mục tiêu của bộ quan sát là (4.36) với
55
.PI
×
= Hình 4.8 và
4.9 biểu diễn đáp ứng thời gian của các biến trạng thái thực của hệ kín khi không có nhiễu đầu ra
(đường nét liền) và khi có nhiễu đầu ra với phân bố đều trong khoảng [ 0.1 , 0.1]− và có trung
bình bằng 0 (đường nét đứt). Các đáp ứng trạng thái của hệ khi có nhiễu sai khác không đáng kể
4.4.2 Các mở rộng
Ràng buộc theo từng thành phần của tín hiệu điều khiển
Việc thay đổi
k
R để đảm bảo điều kiện ràng buộc cho độ lớn của vector tín hiệu điều khiển
()
1
(), , ()
T
km
uk u k= …u còn có thể mở rộng cho các ràng buộc của từng thành phần của
k
u :
()
,maxjj
uk u≤ , 1, 2, ,jm= … . (4.39)
Khi đó, với ma trận
()
1, 2, ,
,,,
kkkmk
Rdiagrr r= … , ta có thể thay đổi từng giá trị của
,
,
jk
r
1, 2, ,jm= … để có được (4.38).
Hình 4.8: Đáp ứng thời gian của biến trạng
thái
10
20
30
40
50
k
x
2without noise
with noise
23
Ràng buộc theo số gia của tín hiệu điều khiển
Trong nhiều bài toán điều khiển, ngoài ràng buộc của tín hiệu điều khiển, người ta còn
mong muốn số gia của tín hiệu điều khiển,
1kkk
−
=
−uuu
Δ
, phải nằm trong một giới hạn cho
trước:
maxk
u≤ΔuΔ
. (4.40)
Phương pháp thiết kế bộ điều khiển dự báo với hàm mục tiêu có tham số biến đổi ở mục 4.1 vẫn
được áp dụng nếu ta chuyển mô hình trạng thái (4.3) về dạng thích hợp với sai lệch
=+XAXB
uΔ
trong đó
1
,
k
k
k
−
⎛⎞
=
⎜⎟
⎝⎠
X
x
u
0
kk
k
⎛⎞
=
⎜⎟
⎝⎠
AB
A
ki+
Q
,
ki+
R
sẽ được lựa chọn để thỏa mãn (4.40).
Điều khiển bám ổn định theo quỹ đạo trạng thái mẫu
Với bài toán điều khiển mà ở đó yêu cầu chất lượng lại là trạng thái
k
x của hệ song tuyến
(4.1) bám ổn định theo được quỹ đạo mẫu là hằng số
ref
k
x cho trước, ta hoàn toàn vẫn sử dụng
được bộ điều khiển dự báo làm hệ ổn định đã phát biểu trong định lý 4.1 cũng như ở thuật toán
4.1 (không bị ràng buộc) và thuật toán 4.2 (khi có ràng buộc) như sau.
Giả thiết ma trận
()
k
B x
luôn có hạng là
m , trong đó
mn
≤
là số các tín hiệu đầu vào, tức
là số các phần tử của
k
u và
n
là bậc của hệ. Khi đó ở hệ tương đương (4.3) sẽ có
kk
→xx cho hệ (4.3) là tương đương với bài toán điều
khiển ổn định cho hệ sai lệch:
1
eeeee
kkkkk
+
=+ABxxu (4.42)
tức là tương đương với bài toán điều khiển sao cho
0
e
k
→x . Hiển nhiên cho bài toán điều khiển
ổn định này ta hoàn toàn sử dụng lại được nội dung định lý 4.1 cũng như thuật toán 4.1 (khi
không có điều kiện ràng buộc) hoặc thuật toán 4.2 (khi có điều kiện ràng buộc).
Điều khiển bám ổn định theo tín hiệu đầu ra mẫu
Nội dung định lý 4.1 và thuật toán 4.1 (cho trường hợp bài toán không có ràng buộc), thuật
toán 4.2 (khi bài toán có thêm ràng buộc (4.6)) cũng hoàn toàn áp dụng được cho bài toán điều
khiển bám hệ song tuyến (4.1) để tín hiệu ra
k
y của bám ổn định theo được tín hiệu ra mẫu
ref
k
y
cho trước, nhờ một sửa đổi nhỏ như sau.
Trước tiên ta giả thiết rằng
mr=
, tức là hệ có số đầu vào bằng số đầu ra. Thêm nữa ta giả
thiết rằng ở chế độ xác lập, khi đã có
kk
I
⎛⎞ ⎛⎞
⎛⎞
−
⎛⎞
==
⎜⎟ ⎜⎟
⎜⎟
⎜⎟
⎜⎟
⎜⎟ ⎜⎟
Θ
⎝⎠
⎝⎠
⎝⎠ ⎝⎠
AB
A
C
xx
y
uu
thì ma trận
kk
k
k
I−
⎜⎟
⎜⎟ ⎜⎟
⎜⎟
⎜⎟ ⎜⎟
⎜⎟
Θ
⎝⎠
⎝⎠ ⎝⎠
⎝⎠
00
AB
A
C
x
yy
u
. (4.43)
Lại sử dụng ký hiệu mô tả sai lệch:
eref
kkk
=−uuu và
eref
kkk
=−xxx
trong đó
,
ref ref
kk
− Thuật toán quan sát trạng thái tối ưu cho hệ phi tuyến và điều kiện đủ để bộ quan sát đó trở
thành bộ quan sát FTO (định lý 3.1 và 3.2).
− Điều kiện cần và đủ để hệ song tuyến là quan sát đều và xây dựng thuật toán quan sát trạng
thái tối ưu cho hệ song tuyến (định lý 4.3).
− Điều kiện đủ để bộ điều khiển dự báo phản hồi đầu ra, xây dựng trên nền nguyên lý tách,
làm hệ phi tuyến nói chung và hệ song tuyến nói riêng là ổn định tiệm cận với bộ quan sát
FTO (hệ quả 3.3, định lý 3.3 và 4.4) và ổn định ISS (định lý 3.4).
Kiến nghị
Như đã được đề cập ở chương 4, luận án đã nêu lên một bài toán mở cần được nghiên cứu
tiếp theo là xác định tham số hàm mục tiêu cho bộ điều khiển dự báo phản hồi trạng thái hệ song
tuyến để bộ điều khiển đó thỏa mãn được các điều kiện bị chặn của tín hiệu điều khiển.
Ngoài ra, ở chương 3, mặ
c dù định lý 3.3 đã đưa ra điều kiện đủ (3.52) để hệ kín phản hồi
đầu ra là ổn định tiệm cận, song có thể thấy đây là một điều kiện khá chặt, khó thực thi trong ứng
dụng. Để mềm dẻo hơn, nghiên cứu sinh đã đưa ý tưởng kết hợp thêm phần chỉnh định thích nghi
để có bộ điều khiển dự báo thích nghi. Đây cũng sẽ là hướ
ng nghiên cứu sau này của nghiên cứu
sinh.