Số hóa bởi Trung tâm Học liệu – ĐHTN ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
o0o
LUẬN VĂN THẠC SỸ KỸ THUẬT
NGÀNH: TỰ ĐỘNG HÓA
NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƢU HOÁ
THAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN HỆ
CHUYỂN ĐỘNG
KHƢƠNG TRỌNG NGHĨA
THÁI NGUYÊN 2011
Số hóa bởi Trung tâm Học liệu – ĐHTN
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
***
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập - Tƣ Do - Hạnh Phúc
o0o
THUYẾT MINH
LUẬN VĂN THẠC SỸ KỸ THUẬT
ĐỀ TÀI: NGHIÊN CỨU GIẢI THUẬT DI TRUYỀN ĐỂ TỐI ƢU
HOÁ THAM SỐ BỘ ĐIỀU KHIỂN LQR TRONG ĐIỀU KHIỂN
HỆ CHUYỂN ĐỘNG
Học viên
: Khƣơng Trọng Nghĩa
Lớp
: CH-K12
Chuyên ngành
: Tự động hoá
Ngƣời hƣớng dẫn
: TS Đỗ Trung Hải
Số hóa bởi Trung tâm Học liệu – ĐHTN
LỜI CẢM ƠN
Trong quá trình làm luận văn, tôi đã nhận đƣợc nhiều ý kiến đóng góp từ các
thầy, cô giáo, các anh chị và các bạn đồng nghiệp.
Tôi xin bày tỏ lòng biết ơn đến TS Đỗ Trung Hải, Ngƣời đã tận tình
hƣớng dẫn tôi hoàn thành luận văn này, đến Khoa Sau Đại học - Trƣờng Đại
học Kỹ thuật công nghiệp đã tạo điều kiện để tôi hoàn thành khóa học.
Tôi xin chân thành cảm ơn Trƣờng Đại học Kỹ thuật Công nghiệp,
Phòng Hành chính Tài vụ, Trung tâm thí nghiệm đã tạo những điều kiện để
tôi hoàn thành khóa học.
Tôi xin chân thành cảm ơn các thầy hiệu trƣởng, ban giám hiệu, cùng
với các đồng nghiệp nhà trƣờng TCN Hermann Gmainer Việt Trì, cùng với
gia đình, các bạn bè, đã giúp đỡ và tạo những điều kiện thuận lợi nhất về mọi
mặt để tôi hoàn thành khóa học.
Tác giả luận văn Khương Trọng Nghĩa Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
7
1.1.1.2. Điều kiện thành lập bài toán tối ƣu ……………………………
9
1.1.1.3. Tối ƣu hoá tĩnh và động……………………………………………
9
1.1.2.Xây dụng bài toán tối ƣu………………………………………………
10
1.1.2.1. Tối ƣu hóa không có điều kiện ràng buộc………………………
10
1.1.2.2. Tối ƣu hóa với các điều kiện ràng buộc…………………………
11
1.2 CÁC PHƢƠNG PHÁP ĐIỀU KHIỂN TỐI ƢU……………………….
16
1.2.1. Phƣơng pháp biến phân cổ điển Euler_Lagrange…………………
16
1.2.1.1. Giới thiệu ………………………………………………………………
16
1.2.2. Phƣơng pháp quy hoạch động Bellman……………………………….
21
1.2.2.1. Giới thiệu…………………………………………………………………
21
1.2.2.2. Hệ rời rạc…………………………………………………………………
21
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
2
1.2.2.3. Phƣơng pháp điều khiển số…………………………………………
22
1.2.3. Nguyên lý cực tiểu Pontryagin _ Hamilton………………………….
2.2.1 Nguyên lý về xác định cấu trúc dữ liệu. ……………………………
41
2.2.1.1. Mảng byte………………………………………………………………
42
2.2.1.2 Mảng byte nén…………………………………………………………
43
2.2.1.3. Mảng INTEGER nén để tối ƣu truy xuất………………………
47
2.2.1.4. Biểu diễn số thực bằng chuỗi nhị phân…………………………
48
2.2.2. Biễu diễn gen bằng chuỗi số thực ………………………………………
49
2.2.3. Cấu trúc cây………………………………………………………………
50
2.2.4. Độ thích nghi tiêu chuẩn………………………………………………
51
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
3
2.2.5. Độ thích nghi xếp hạng (rank method) ……………………………
51
2.3. CÁC PHÉP TOÁN CỦA THUẬT TOÁN DI TRUYỀN……………
52
2.3.1. Tái sinh (Reproduction) ………………………………………………
52
2.3.2. Lai ghép (Crossover) ……………………………………………………
53
2.3.3. Đột biến (Mutation) ……………………………………………………
54
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
4
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
LQR
Tuyến tính bậc hai
(Linear quadratic legulator)
GA
Giải thuật di truyền
(Gentic Algorithm)
IPS
Hệ thống con lắc ngƣợc
(Inverted Pendulum system)
CTDL
Cấu trúc dữ liệu
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1 Sơ đồ hệ thống điều khiển
8
Hình 1.2 Tối ƣu cục bộ và tối ƣu toàn cục
9
Hình 1.3 Hàm chuyển đổi mẫu và bộ điều khiển tối ƣu
30
Hình 2.1 Sơ đồ tổng quát của thuật giải di truyền
42
Hình 2.2 Thông số có trong gen trong hệ nhiễm sắc thể
56
2. Mục đích nghiên cứu
Việc điều khiển hệ chuyển động theo mong muốn là vấn đề tồn tại thực
tế cần nghiên cứu giải quyết. Hiện nay phƣơng tiện lý thuyết và thực nghiệm
cho phép thực hiện đƣợc các bài toán phức tạp để tìm đƣợc thông số điều
khiển tối ƣu nhằm nâng cao đƣợc các các chỉ tiêu chất lƣợng của hệ.
Mục tiêu của luận văn là nghiên cứu điều khiển tối ƣu, điều khiển
LQR, thuật toán di truyền và ứng dụng để xác định tham số tối ƣu của bộ điều
khiển LQR trong điều khiển hệ chuyển động.
3. Đối tƣợng và phạm vi nghiên cứu
Đối tƣợng nghiên cứu:
- Xây dựng đƣợc thuật toán di truyền để xác định tham số tối ƣu của bộ
điều khiển LQR. Ứng dụng kết quả cho một hệ chuyển động thực tế.
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
6
Phạm vi nghiên cứu:
- Khai thác các nghiên cứu lý thuyết về điều khiển tối ƣu, giải thuật di
truyền, điều khiển LQR từ đó tìm đƣợc tham số tối ƣu để điều khiển hệ
chuyển động.
- Xây dựng mô hình mô phỏng bằng phần mềm Matlab – Simulink.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Đây là vấn đề khoa học, đang đƣợc các nhà khoa học trên thế giới và
trong nƣớc quan tâm nghiên cứu.
Vấn đề nghiên cứu có tính ứng dụng thực tiễn vì điều khiển hệ chuyển
động là hệ phổ biến hiện nay. Đồng thời, với sự phát triển về mặt công nghệ
đã tạo ra các thiết bị kỹ thuật cho phép tính toán các thuật toán phức tạp với
khối lƣợng tính toán lớn mà trƣớc đây khó thực hiện đƣợc.
5. Nội dung nghiên cứu
Mở đầu
Hệ thống điều khiển nhƣ hình trên bao gồm các phần tử chủ yếu: đối
tƣợng điều khiển ( ĐTĐK ), cơ cấu điều khiển ( CCĐK ) và vòng hồi tiếp
( K ). Với các ký hiệu:
x
0
: tín hiệu đầu vào
u: tín hiệu điều khiển
x: tín hiệu đầu ra
= x
0
– x: tín hiệu sai lệch
f: tín hiệu nhiễu
Chỉ tiêu chất lƣợng J của một hệ thống có thể đƣợc đánh giá theo sai
lệch của đại lƣợng đƣợc điều khiển x so với trị số mong muốn x
0
, lƣợng quá
điều khiển ( trị số cực đại x
max
so với trị số xác lập
x
tính theo phần trăm ),
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
8
thời gian quá độ … hay theo một chỉ tiêu hỗn hợp trong điều kiện làm việc
nhất định nhƣ hạn chế về công suất, tốc độ, gia tốc … Do đó việc chọn một
luật điều khiển và cơ cấu điều khiển để đạt đƣợc chế độ làm việc tối ƣu còn
u
. Nhƣ vậy giá trị tối ƣu thực sự bây
giờ là
2
J
.
Tổng quát hơn, khi ta xét bài toán trong một miền
,
mn
uu
nào đó và tìm
đƣợc giá trị tối ƣu
i
J
thì đó là giá trị tối ƣu cục bộ. Nhƣng khi bài toán không
có điều kiện ràng buộc đối với u thì giá trị tối ƣu là
()
i
J extremum J
với
i
J
là
u
J
: điểm cực trị là cực đại
1.1.1.2. Điều kiện thành lập bài toán tối ƣu
Để thành lập bài toán tối ƣu thì yêu cầu đầu tiên là hệ thống phải có đặc
tính phi tuyến có cực trị.
Bƣớc quan trọng trong việc thành lập một hệ tối ƣu là xác định chỉ tiêu
chất lƣợng J. Nhiệm vụ cơ bản ở đây là bảo đảm cực trị của chỉ tiêu chất
lƣợng J. Ví dụ nhƣ khi xây dựng hệ tối ƣu tác động nhanh thì yêu cầu đối với
hệ là nhanh chóng chuyển từ trạng thái này sang trạng thái khác với thời gian
quá độ nhỏ nhất, nghĩa là cực tiểu hóa thời gian quá độ. Hay khi tính toán
động cơ tên lửa thì chỉ tiêu chất lƣợng là vƣợt đƣợc khoảng cách lớn nhất với
lƣợng nhiên liệu đã cho.
Chỉ tiêu chất lƣợng J phụ thuộc vào tín hiệu ra x(t), tín hiệu điều khiển
u(t) và thời gian t. Bài toán điều khiển tối ƣu là xác định tín hiệu điều khiển
u(t) làm cho chỉ tiêu chất lƣợng J đạt cực trị với những điều kiện hạn chế nhất
định của u và x.
Chỉ tiêu chất lƣợng J thƣờng có dạng sau:
0
[ ( ), ( ), ]
T
J L x t u t t dt
Trong đó L là một phiếm hàm đối với tín hiệu x, tín hiệu điều khiển u
và thời gian t.
1.1.1.3. Tối ƣu hoá tĩnh và động
Chúng ta cần phân biệt hai dạng bài toán tối ƣu hoá tĩnh và tối ƣu hóa
(1.1)
Với O(3) có thể coi là số hạng thứ 3. Grad của L theo u là một vector m
cột:
m
u
uL
uL
uL
u
L
L
2
2
2
(1.3)
L
uu
đƣợc gọi là ma trận uốn.
Một điểm cực trị hoặc điểm dừng xuất hiện khi sự biến thiên dL với
thành phần thứ nhất tiến về 0 với mọi biến thiên du trong quá trình điều
khiển. Vì vậy, để có điểm cực trị thì:
0
u
L
(1.4)
Giả sử đang ở tại điểm cực trị, có L
u
= 0 nhƣ (1.4). Để điểm cực trị trở
thành điểm cực tiểu, chúng ta cần có:
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
11
)3(
2
1
OduLdudL
uu
T
(1.5)
Cho hàm chỉ tiêu chất lƣợng vô hƣớng
uxL ,
, với vector điều khiển
m
Ru
và vector trạng thái
n
Rx
. Bài toán đƣa ra là chọn u sao cho hàm chỉ
tiêu chất lƣợng L(x,u) đạt giá trị nhỏ nhất và thỏa mãn đồng thời các phƣơng
trình điều kiện ràng buộc.
0, uxf
(1.7)
Vector trạng thái x đƣợc xác định từ một giá trị u cho trƣớc bằng mối
quan hệ (1.7), vì thế f là một hệ gồm n phƣơng trình vô hƣớng,
n
Rf
.
Để tìm điều kiện cần và đủ của giá trị cực tiểu, đồng thời thỏa mãn
0, uxf
, ta cần làm chính xác nhƣ trong phần trƣớc. Đầu tiên ta khai triển
dL dƣới dạng chuỗi Taylo, sau đó xác định số hạng thứ nhất và thứ hai.
Thừa số Lagrange và hàm Hamilton.
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
)(
1
(1.11)
Đạo hàm riêng của L theo u chứa hằng số f đƣợc cho bởi phƣơng trình:
x
T
x
T
uu
T
ux
T
x
T
u
df
LffLffLL
u
L
1
0
(1.12)
với
(1.14)
Đây là điều kiện cần để có giá trị cực tiểu. Trƣớc khi đi tìm điều kiện
đủ, chúng ta hãy xem xét thêm một vài phƣơng pháp để có đƣợc (1.14).
Viết (1.8) và (1.9) dƣới dạng:
0
du
dx
ff
LL
df
dL
ux
T
u
T
x
T
ff
LL
(1.16)
Hay:
0
x
TT
x
fL
(1.17)
0
u
TT
u
fL
(1.18)
Giải (1.17) ta đƣợc
:
T
x
T
x
du
fL
f
L
1
0
(1.21)
Do đó -
là đạo hàm riêng của L với biến điều khiển u là hằng số. Điều
này nói lên tác dụng của hàm chỉ tiêu chất lƣợng với biến điều khiển không
đổi khi điều kiện thay đổi.
Nhƣ là một cách thứ ba để tìm đƣợc (1.14), ta phát triển thêm để sử
dụng cho các phân tích trong những phần sau. Kết hợp điều kiện và hàm chỉ
tiêu chất lƣợng để tìm ra hàm Hamilton.
uxfuxLuxH
T
,,,,
(1.22)
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
(1.24)
Giả sử chúng ta chọn các giá trị của u thỏa mãn:
0
H
(1.25)
Sau đó ta xác định x với giá trị của u đã có bằng phƣơng trình điều kiện
ràng buộc
0, uxf
. Trong trƣờng hợp này hàm Hamilton tƣơng đƣơng với
hàm chỉ tiêu chất lƣợng:
LH
f
0
(1.26)
Nhắc lại: nếu f = 0, ta sẽ tìm đƣợc dx theo du từ (1.10). Ta không nên
xét mối quan hệ giữa du và dx để thuận tiện trong việc chọn
sao cho:
0
x
H
(1.27)
Sau đó, từ (1.23), độ biến thiên dH không chứa thành phần dx. Điều
này mang lại kết quả
H
(1.30)
Nghiên cứu giải thuật di truyền để tối ưu hoá tham số bộ điều khiển LQR trong hệ chuyển động
Số hóa bởi Trung tâm Học liệu – ĐHTN
15
Tóm lại, điều kiện cần để có được điểm cực tiểu của L(x,u) thỏa mãn
điều kiện ràng buộc f(x,u) = 0 gồm có:
0
f
H
(1.31a)
0
T
xx
fL
x
H
(1.31b)
0
T
Khi đưa ra thừa số Lagrange, chúng ta có thể thay thế bài toán tìm giá
trị nhỏ nhất của L(x,u) với điều kiện ràng buộc f(x,u) = 0, thành bài toán tìm
giá trị nhỏ nhất của hàm Hamilton H(x,u,
) không có điều kiện ràng buộc.
Điều kiện đã (1.31) xác định một điểm dừng. Ta sẽ tiếp tục chứng minh
đây là điểm cực tiểu nhƣ đã thực hiện trong phần trƣớc.
Viết chuỗi Taylor mở rộng cho độ biến thiên của L và f nhƣ sau:
)3(
2
1
O
du
dx
LL
LL
dudx
du
dx
LLdL
uuux
xuxx
TTT
u
T
x
dx
ff
ff
dudx
du
dx
ffdf
uuux
xuxx
TT
ux
uuux
xuxx
TTT
u
T
x
T
0
u
H
và
0df
. Sau đó, từ (1.33)
ta có:
)2(
1
Oduffdx
ux
(1.35)
Thay vào (1.34) ta đƣợc:
)3(
2
1
1
Odu
I
ff
HH
HH
IffdudL
ux
uuux
xuxx
T
uuxuxxu
T
x
T
uuu
ux
uuux
xuxx
T
x
T
u
f
uu
f
uu
ffHffffHHffH
I
ff
HH
HH
IffLL
11
1
Nhiệm vụ của điều khiển tối ƣu là giải bài toán tìm cực trị của phiếm
hàm
[ ( ), ( )]L x t u t
bằng cách chọn tín hiệu điều khiển u(t) với những điều kiện
hạn chế của đại lƣợng điều khiển và tọa độ pha. Một trong những công cụ
toán học để xác định cực trị là phƣơng pháp biến phân cổ điển
Euler_Lagrange.
Đƣờng cực trị là những hàm trơn còn phiếm hàm cùng các điều kiện
hạn chế là những hàm phi tuyến. Do đó phƣơng pháp này không thể áp dụng
cho những trƣờng hợp mà tín hiệu điều khiển có thể là các hàm gián đoạn.
Trƣờng hợp không có điều kiện ràng buộc
Cho u(t) là hàm thuộc lớp hàm có đạo hàm bậc nhất liên tục. Trong mặt
phẳng (u,t) cho hai điểm (t
0
,u
0
) và (t
1
,u
1
). Cần tìm quỹ đạo nối hai điểm này
sao cho tích phân theo quỹ đạo
)(tuu
cho bởi:
1
0
( ) ( , , )
t
18
dttuuLtuuuuL
T
0
)],,(),,([
(1.39)
Phân tích (1.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một
của J ta đƣợc:
dtu
u
tuuL
u
u
tuuL
uuJ
T
])
),,(
()
),,(
([),(
0
u bằng cách lấy tích phân những thành phần chứa
u
:
]
),,(),,(
[
),,(
),(
0
0
udt
u
tuuL
dt
d
u
tuuL
u
u
tuuL
uuJ
T
T
Từ các biểu thức (1.41), (1.42) ta có:
0]
),,(),,(
[),(
****
0
*
udt
u
tuuL
dt
d
u
tuuL
uuJ
T
(1.43)
Từ đó có thể rút ra phƣơng trình Euler_Lagrange:
( , , ) ( , , )
[0, ]tT
,
1,in
(1.45)
thì chỉ tiêu chất lƣợng J có dạng:
T
i
n
i
iia
dttuuttuuLuJ
0
1
)],,()(),,([),(
(1.46)
mà
i
(t) với i = 1,2,…,n là hàm Lagrange.Vì giới hạn thỏa mãn với mọi
t nên hàm Lagrange phụ thuộc thời gian.
Tƣơng tự nhƣ trên ta có phƣơng trình Euler_Lagrange tổng quát:
( , , , ) ( , , , )
0
aa
0
),,(
(1.49)
thì phƣơng trình Euler_Lagrange tổng quát (1.47) có phiếm hàm:
1
( , , , ) ( , , ) ( , , )
n
ai
i
L u u t L u u t u u t
(1.50)
Trong trƣờng hợp này,
i
là các hệ số không phụ thuộc thời gian.
Khi có điều kiện ràng buộc dạng (1.45) hoặc (1.49) phải giải (n+1)
phƣơng trình để xác định y*(t) và
i
*(t) với i=1,2,…,n.
Phƣơng trình Euler_Lagrange với tín hiệu điều khiển bị hạn chế
Trong phần trên ta chỉ đề cập tới bài toán mà trong đó tín hiệu điều
khiển không có giới hạn nào ràng buộc. Trong thực tế, thƣờng gặp tín hiệu
Ví dụ, nếu
1u
, điều kiện
)(tu
nghĩa là
1)( t
. Đổi biến ta có:
2
zu
(1.52)
thì biến mới z sẽ không có điều kiện hạn chế và biên giới của biến u
tƣơng đƣơng với z = 0. Bây giờ chỉ tiêu chất lƣợng
T
dttuuLuJ
0
),,()(
có biến
mới u = z
2
+
, từ đó:
d
z
L
(1.54)
Ở đây
z
u
L
z
u
L
z
u
u
L
z
u
u
L
z
L
22
2
z
u
L
u
L
dt
d