ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
ĐỐ ÁN TỐT NGHIỆP
ThiÕt kÕ bé ®iÒu khiÓn Learning FeedForward cho c¸c hÖ thèng chuyÓn ®éng
®iÖn
c¬
Học viên: Lâm Hoàng Bình
Giáo viên hướng dẫn: Ts. Nguyễn Duy Cương
Chuyên ngành: Tự Động Hoá
Khoá:K10
Thái Nguyên, tháng 10 năm 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC
Chương 1: Giới thiệu
1.1. Tổng quan về Learning Control (LC) …………………………… ………………1
1.2. Learning Control (LC) là gì……………………………………………… ………2
1.3. Phản hồi sai số tự học………………………………………………… …. ……… 7
1.3.1. Một số ví dụ về ma sát độc lập 8
1.4. Điều khiển truyền thẳng tự học………………………………………… .…
13
1.4.1. Đầu vào của mạng BSN………………… ………………… ………14
1.4.2. Sự phân bố B-Spline trên đầu vào của mạng BSN 14
1.4.3. Sự lựa chọn các cơ cấu học 15
1.4.4. Sự lựa chọn tốc độ học
15
1.5. Ứng dụng minh hoạ: Hệ thống động cơ chyển động tuyến tính………….… … 18
1.6.
3.3.2. LFFC khi có ViscouNeural………………………………………………….…65
3.3.3. LFFC khi có CoulombNeural và ViscouNeural……………………………….66
3.3.4. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural……………… 68
3.3.5. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural, InertialNeural 69
Chương 4: Kết luận……………………………………………………….………….71
Tài liệu tham khảo
[1] Learning feed – Forward Control Theory, Design and Applications Wubbe Jan
Roelf Velthuis - 1970
[2] Function Approximation for Learning Control, a key sample based approach
B.J. de Kruif - 1976
[3] Intelligent Control part 1 – MRAS Author prof. Dr.ir Job van Amerongen –
March 2004
[4] Advanced Controllers for Electromechanical Motion Systems Dr. Nguyen Duy
Cuong. University of Twente, March, 2008
Li núi u
Điều khiển chuyển động (motion control) liên quan việc sử dụng lực để điều khiển sự
di chuyển của đối tợng điều khiển trong một hệ thống cơ và đợc sử dụng rộng rãi trong
các ứng dụng công nghiệp nh đóng gói, in, dệt, hàn, cũng nh nhiều ứng dụng khác.
Hiện nay, phần lớn các loại hình điều khiển chuyển động đợc thực hiện bằng cách sử
dụng các động cơ điện, và đây chính là điều quan tâm chính của chúng tôi trong thiết kế.
Các hệ điều khiển chuyển động có thể là phức tạp vì có nhiều vấn đề khác nhau cần đợc
xem xét, ví dụ nh:
- Giảm thiểu ảnh hởng của nhiễu hệ thống.
- Suy yếu tác động xấu của nhiễu đo
- Sự thay đổi thông số và cấu trúc không rõ của đối tợng điều khiển.
Rất khó để tìm ra các phơng pháp thiết kế mà có thể giải quyết đồng thời tất cả các vấn
Sau thời gian thực hiện, đến nay bản luận văn của tôi đã hoàn thành. Trước thành công
này tôi xin gửi lời cảm ơn chân thành tới thầy TS. Nguyễn Duy Cương, người đã trực tiếp
hướng dẫn, giúp đỡ tôi hoàn thành đề tài này, tôi cũng xin được bày tỏ lòng biết ơn tới
các anh các chị trong trường đại học Kỹ Thuật Công Nghiệp cũng như gia đình, bạn bè
đã
tạo điều kiện giúp đỡ tôi trong quá trình làm luận văn.
Ngày 30 .tháng 10 năm 2009
Học viên
Lâm Hoàng Bình
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
Chương 2: PHÂN TÍCH ĐỘ ỔN ĐỊNH CỦA HỆ THỐNG LFFC PHỤ
THUỘC
THỜI GIAN
2.1. Giới thiệu
Trong chương này đề cập đến bộ điều khiển LFFC phụ thuộc thời gian và phân tích
tính ổn định của hệ thống phụ thuộc vào thời gian. Xác định giá trị nhỏ nhất của độ
rộng mạng B-Spline.
2.2. Các giả
định
Để có thể phân tích tính ổn định của các thông số trong LFFC chúng ta giả thiết như
sau:
1. Đối tượng cần điều khiển là đối tượng (single input - single output ) SISO LTI.
2. Bộ điều khiển phản hồi, C, là tuyến tính, các hằng số thời gian và các thông số
ω
i
=
γ
C
T
p
∫
µ
i
(
t
)
u
C
(
t
)
dt
0
T
p
∫
µ
i
(
t
)
dt
0
2T
p
N − 1
(s)
(2.3)
thành phần B-spline thứ i được định nghĩa như sau:
2t
−
d
(
i
−
2
)
d d
for i − 2 ≤ t ≤ (i − 1)
d 2 2
µ
(t ) =
di
− 2t
for
d
(i − 1) ≤ t
≤
d
−
d (
i
−
2 )
C
(t
)dt
(2.5)
∆ =
2
2
2t −d
(
i
−2
)
∫
d
2
2
dt
+
∫
di −2t
dt
d
Mẫu số của (2.5):
d
( i
−1)
2
∫
d
−
2
)
2
dt +
∫
d
(i −1)
2
di
−
2
t dt
d
d
(
−
d (
2
i −
(i −2
)
2
2
u
C
t
dt
d
γ
C
2
d
d
(i −1)
2
u
C
t
dt
(2.7)
điều này ngụ ý rằng việc học là tuyến tính trong u
C
(t) và kể từ đây ta sẽ coi vòng lặp
thích nghi feed-forward là tuyến tính. khi vòng phản hồi cũng là tuyến tính, phần tín
hiệu chủ đạo có thể đạt tới giá trị bằng 0 trong khi phân tích tính ổn định (xem hình
2.1). giá trị mong đợi khi đó là u
F
= 0.
i
≤ 0
for
ω
i
≤ 0
for
ω
i
> 0
(2.8)
2. Các trọng số không thích nghi quá mạnh:
∆
ω
i
≤ −2
ω
i
∆
ω
i
≥ −2
ω
i
for
ω
i
≤ 0
for
ω
phù hợp với (2.10). Để giải quyết vấn đề
này, ta giả thiết rằng hình dạng của tín hiệu feed-forward u
F
(t) là dạng tam giác. Sự
lựa chọn này được thúc đẩy bởi thực tế là các kinh nghiệm đã chỉ ra rằng khi xảy ra
hoạt động không ổn định đầu ra của BSN sẽ có dạng tam giác. Ánh xạ vào/ra này có
thể thực hiện bằng cách chọn trọng số như w
i
= g với i = 1, 3, 5… và w
i
= -g với i =
2,4 6 với g ∈ R
+
. xem hình 2.2
g
u
F
t
-g
1
μ
1
2 3 4
5
0
d
Hình 2.2: Tín hiệu phản hồi đầu vào
Tín hiệu u
F
[rads
−
1
]
n
d
(2.12)
∞
2
2
Trong miền tần số quan hệ giữa đầu ra của bộ điều khiển feed-forward U
F
và tín
hiệu học U
C
được cho bởi:
U
C
= -T U
F
(2.13)
Với T là hàm bù nhạy :
T
=
CP
1 + CP
(2.14)
T khuếch đại biên độ của mỗi thành phần tần số (2.11) bởi 1 hệ số
a
cos
(
ω
n
t +
ϕ
n
)
n
2
(2.15)
Thay (2.15) vào (2.5) và viết lại công thức:
−
32
γ
g
∞
cos(
ϕ
)
∆
ω
i
=
c
a
)
for
i = 1,3,5
Có thể thấy là tất cả các trọng số có cùng giá trị đầu (w
i
= g với i = 1,3,5 và
w
i
= -g với i = 2,4,6…) là có tính thích nghi như nhau. Do đó việc học không làm
thay đổi về hình dáng của tín hiệu feed-forward. Kể từ đây, với mỗi bước lặp của tín
hiệu feed-forward có thể khuếch đại như trong công thức (2.11) và trọng số thích
nghi trong (2.16). Trong công thức dưới đây, ta sẽ xét sự thích nghi của các trọng số
có giá trị đầu dương w
i
= a: Với mỗi trường hợp, ta sẽ phân tích dạng tương tự của
nó. Thay vào công thức (2.16) với điều kiện ổn định (2.10) được kết quả:
− 2g
≤
32
γ
c
g
π
4
∞
∑
a
n
n=1,3,5
cos
(2.18)
16
γ
C
n=1,3,5
n
bất đẳng thức vế trái của (2.18):
−
π
4
≤
16
γ
∞
∑
a
n
cos(
ϕ
n
)
n
4
(2.19)
C
n=1,3,5
chứa đựng γ
n
và ϕ
n
. Điều này có nghĩa là chỉ vâng chọn d xác định thì (2.20) là thỏa
mãn. Tiếp theo, sử dụng d vừa thu được (và w
n
) ta có thể tính được γ
C
từ (2.19).
Theo đó ta sẽ cố gắng tìm ra giá trị nhỏ nhất của d mà vẫn thoả mãn yêu cầu của
công thức (2.20)
2.3. Độ rộng của B-Spline.
Với một mô hình chính xác của hệ thống P và bộ điều khiển C là sẵn có, giá trị
của a
n
và
ϕ
n
có thể được tính toán cho tất cả các tần số. Điều này sẽ cho phép lựa
chọn giá tri tối thiểu d sao cho (2.20) thỏa mãn nhờ quá trình tìm kiếm lặp lại đơn
giản như sau:
Thuật toán 2.3.1. (Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình
chi tiết của hệ thống điều khiển)
1. Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N=3 trong hình
1.13. Bởi vì theo (2.3) trong trường hợp này d=T
p
[s], đây là số B-Spline tối
n
đã tìm được trong bước trước có thảo mãn (2.20)
không.Nếu thỏa mãn,chuyển sang bước 4, nếu không chuyển sang bước 6
4. Tăng số lương B-Spline trong phân bố lên 1 đơn vị N =N+1.
5. Chuyển tới bước 2
6. Giá trị N hiện tại là giá trị nhỏ nhất của B-Spline mà cho kết quả hoạt động
không ổn định. Do đó, số lương lớn nhất B-Spline là N-1 và theo (2.3) ta có:
2T
d
=
N
−
2
(2.21)
Tuy nhiên, nhìn chung chỉ phần động lực học của hệ thống ở tần số thấp thỏa
mãn. Do đó, thuật toán 2.1 có thể không tin cậy. Để giải quyết vấn đề này chúng ta
sẽ tiếp cận theo hướng truyền thống. Đầu tiên, chúng ta viết lại (2.20) dưới dạng:
a
1
cos(
ϕ
1
) +
∞
cos(
ϕ
)
∑
a
n
Với các giá trị
ϕ
là pha của –T. Đồ thị tương ứng của
2.4
cos(
ϕ
)
được chỉ ra trong hình
Cos[φ]
1
0
-1
10
-1
10
-2
10
-3
ω[rad s
-1
]
Hình 2.4: Đồ thị của cos(
ϕ
)
Khi chúng ta chọn một giá trị d lớn
ω
1
≈ 0 sẽ cho kết quả
ϕ
1
m=3,5
a
cos
(
ϕ
n
)
n
n
4
Khi
∞
cos(
ϕ
)
∑
a
n
n
4
≤ 0
chúng ta có thể tăng thêm giá trị của
ω
1
mà không vi phạm
m=3,5
ph
as
e
. Vì thế tình huống xấu nhất (xem xét theo độ ổn định) xảy
cos (
ϕ
n
)
4
∞
=
max
∑
c
o
s
(
ϕ
ϕ
n
)
n
4
≤
∞
∑
max(
a
max(cos(
ϕ
))
)
n
=
n
m=3,5
∞
∑
m=3,5
max
(
≤
∑
m=3,5
− T ( j
ω
n
)
n
4
∞
Do vậy, 2.22 được thỏa mãn nếu:
a
1
cos(
ϕ
1
)+
∞
∑
m=3,5
− T ( j
ω
n
)
n
4
∞ (2.25)
Bây giờ, giá trị lớn nhất của
ω
4. Sử dụng mô hình để xác định a
1
và
ϕ
1
5. Kiểm tra xem a
n
và
ϕ
n có thảo mãn phương trình (2.25) sử dụng kết quả của bước
1. Nếu thỏa mãn chuyển tới bước 6, ngược lại chuyển tới bước 8.
6. Tạo một khuôn dạng phân bố B-Spline bao gồm N+1 B-Spline (hay N:=N+1)
7. Chuyển tới bước 3
8. Giá trị nhỏ nhất d được cho bởi:
d
=
2T
p
N − 2
Để đạt được mục đích xây dựng một chương trình tìm kiếm lặp lại, chúng ta có thể
thêm một số giả thiết với a
1
. Đầu tiên ta viết lại (2.25) dưới dạng:
cos(
ϕ
1
)+
∞
∑
n
)
∞
4
= max
∑
4
=
∑
4
(2.27)
m=3,5
a
1
n
m=3,5
a
1
n
m=3,5
min
(
a
1
)
n
cách tính toán − T
(
j
ω
n
)
cho tất cả các gái trị có thể của
ω
1
mà thảo mãn (2.26). Giới
hạn trên của các giá trị của
ω
1
có thể được xác định dưới đây sử dụng kết quả:
∞
∑
m=3,5
− T ( j
ω
n
)∞
a n
4
≥ 0
(2.29)
ϕ
1
sẽ phải thỏa mãn phương trình (sử dụng
(2.26)):
cos(
Trong hình 2.5 giới thiệu một ví dụ về đồ thị Bode của –T. Trong đó tất cả các giá
trị
ω
mà theo đó
cos(
ϕ
) < 0
được đánh bóng.
Hình 2.5: Ví dụ về đồ thị Bode của –T
Thay thế (2.31) trong (2.28) đạt được:
∞
− T ( j
ω
n
)∞
1
∞
− T
(
j
ω
n
)
∞
cos(
ϕ
1
) ≤ −
∑
min
∈R cos (
ϕ
)<0
}
n
Phương trình trên có thể được sử dụng để hình thành nên một thuật toán theo đó có
thể tìm được giá trị tối thiểu của d:
Thuật toán 2.3 ( Tính toán giá trị ổn định của d với các giả thiết nghiêm ngặt hơn về
mô hình động học của hệ thống)
1.
Xác định
− T
(
j
ω
n
)
từ mô hình vòng lặp kín
2. Sử dụng đồ thị Bode của mô hình xác
định
min − T
(
j
ω
)
{
ω
∈R cos (
min − T
(
{
ω
∈R cos(
ϕ
)<0}
j
ω
n
)
4. Giá trị nhỏ nhất của độ rộng của mạng B-Spline, d
min
được cho bởi:
d
min
=
2
π
[rads
−
1
]
ω
1
3.1.Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
25