ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
TRẦN QUẾ SƠN
NGHIÊN CỨU, THIẾT KẾ THAY THẾ BỘ ĐIỀU KHIỂN
MÔ HÌNH CÁNH TAY ROBOT TẠI PHÕNG THÍ NGHIỆM CỦA
TRƢỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP THÁI
NGUYÊN
LUẬN VĂN THẠC SĨ KỸ THUẬT
CHUYÊN NGÀNH KỸ THUẬT ĐIỆN TỬ
Thái Nguyên - 2015
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
LỜI CAM ĐOAN
Tên tôi là: Trần Quế Sơn
Sinh ngày07 tháng05 năm 1986
Học viên lớp cao học khoá 14–Kỹ thuật điện tử - Trường đại học kỹ thuật
Công nghiệp Thái Nguyên.
Hiện đang công tác tại Trường đại học kỹ thuật Công nghiệp Thái Nguyên.
Xin cam đoan luận văn “Nghiên cứu, thiết kế thay thế bộ điều khiển mô
hình cánh tay robot tại phòng thí nghiệm của trường ĐH KTCN ” do thầy giáo
PGS.TS. Nguyễn Thanh Hà hướng dẫn là công trình nghiên cứu của riêng tôi. Tất cả
các tài liệu tham khảo đều có nguồn gốc, xuất xứ rõ ràng.
Tác giả xin cam đoan tất cả những nội dung trong luận văn đúng như nội
tác giả mong nhận được sự đóng góp ý kiến của các thầy giáo, cô giáo và các bạn bè
đồng nghiệp.
Tôi xin chân thành cảm ơn!
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
MỤC LỤC
LỜI CAM ĐOAN ................................................................................................................... i
LỜI CẢM ƠN .......................................................................................................................iii
DANH MỤC CÁC KÝ HIỆU VIẾT TẮT ........................................................................... vi
DANH MỤC HÌNH VẼ ......................................................................................................vii
LỜI NÓI ĐẦU ...................................................................................................................... ix
CHƢƠNG 1 ........................................................................................................................ 10
TỔNG QUAN VỀ PID, LEARNING FEED FORWARD CONTROL (LFFC) VÀ
MODEL REFERENCE ADAPTIVE SYSTEMS (MRAS), BỘ ĐIỀU KHIỂN PID
CHO MÔ HÌNH CÁNH TAY ROBOT RD5NT ............................................................. 10
1.1. Tổng quan về PID ...........................................................................................10
1.2. Tổng quan về Learning Feed-forward Control (LFFC) .................................12
1.2.1. Điều khiển học (Learning Control - LC) .....................................................12
1.2.2. Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning FEL) .......................................................................................................................16
1.2.3. Learning Feed forward Control (LFFC) ......................................................21
1.3. Lý thuyết điều khiển thích nghi theo mô hình mẫu (MRAS).........................21
1.3.1 Lịch sử phát triển của hệ điều khiển thích nghi .................................................. 21
1.3.2. Khái quát về hệ điều khiển thích nghi ............................................................... 23
1.3.3 Cơ chế thích nghi – thiết kế bộ điều khiển thích nghi dựa vào luật MIT ........... 28
1.3.4. Phương pháp độ nhạy ........................................................................................ 30
1.3.5. Phương pháp ổn định của Liapunov .................................................................. 32
3.1. Sơ đồ khối hệ thống: .......................................................................................60
3.2. Sơ đồ kết nối phần cứng .................................................................................61
3.2.1. Giới thiệu tổng quan các khối trong hệ thống thực nghiệm............................... 62
3.3. Kết quả thực nghiệm ......................................................................................67
Kết quả thực nghiệm được tiến hành trên robot RD5NT tại Phòng thí nghiệm Điện – Điện
tử của Khoa điện tử - Trường ĐH Kỹ thuật công nghiệp Thái Nguyên. ............................. 67
3.4. Kết luận và hướng phát triển của đề tài ..........................................................70
TÀI LIỆU THAM KHẢO ................................................................................................. 71
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
DANH MỤC CÁC KÝ HIỆU VIẾT TẮT
LFFC: Learning FeedForward Control
MRAS: Model Reference Adaptive System
am: Tham số của bộ điều khiển thích nghi
bm: Tham số của bộ điều khiển thích nghi
cm: Tham số của bộ điều khiển thích nghi
dm: Tham số của bộ điều khiển thích nghi
: Vecto góc của khớp nối
M(): ma trận mô men quán tính
C():mô hình lực coriolis và quán tính ly tâm
D:hệ số ma trận đường chéo ma sát nhớt
S: hệ số ma trận đường chéo ma sát Coulomb
G(): Trọng lực
Hình 1.9a: MRAS cho sự thích nghi của các tham số bộ điều khiển
Hình 1.9b: MRAS với mô hình có thể hiệu chỉnh cho nhận dạng tham số
Hình 1.9c: Cấu trúc MRAS với khâu khởi tạo tín hiệu đặt
Hình 1.10: Nhận dạng mô hình ngược của đối tượng
Hình 1.11: Bộ điều khiển LFFC
Hình 2.1. Các thành phần chính của một robot công nghiệp
Hình 2.2 : Mô hình robot 2 bậc tự do
Hình 2.3: Cấu trúc bộ điều khiển phần feed forward
Hình 2.4: Sơ đồ mô phỏng hệ thống điều khiển
Hình 2.5a: Đáp ứng của khớp 1
Hình 2.5b: Đáp ứng của khớp 2
Hình 3.1: Sơ đồ khối hệ thống điều khiển 1 khớp của mô hình
Hình 3.2: Sơ đồ kết nối tổng thể hệ thống thực nghiệm
Hình 3.3: Mô hình robot RD5NT
Hình 3.4: Bộ điều khiển Dspace 1103
Hình 3.5: Giao diện của phần mềm giám sát điều khiển Control Desk
Hình 3.6: Sơ đồ nguyên lý của mạch cầu H sử dụng IC L298
Hình 3.7: Mạch in mạch cầu H điều khiển động cơ
Hình 3.8: Bản vẽ nguyên lý mạch nguồn
Hình 3.9: Sơ đồ mạch in mạch nguồn
Hình 3.10: Hệ thống thực nghiệm được lắp đặt tại Phòng thí nghiệm Điện – Điện tử
Hình 3.11a: Đáp ứng thực nghiệm của khớp 1
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
Hình 3.11b: Đáp ứng thực nghiệm của khớp 2
các hoạt động nghiên cứu, phát triển về Robot vẫn không ngừng phát triển và có rất
nhiều công trình nghiên đưa các phương pháp để điều khiển cánh tay robot. Có thể
kể đến ở đây như:
- Nguyễn Văn Minh Trí, Lê Văn Mạnh, “Thiết kế bộ điều khiển PID bền
vững cho hệ thống phi tuyến bậc hai nhiều đầu vào – Nhiều đầu ra và ứng dụng
trong điều khiển tay máy công nghiệp”, Tạp chí Khoa học và Công nghệ, Đại học
Đà Nẵng , số 4(39).2010.
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
- Nguyễn Manh Hùng, Ngô Thanh Quyền, “Thiết kế bộ điều khiển mờ một
đầu vào cho cánh tay robot”, Tạp Chí Đại Học Công Nghiệp, số 9(06).2011.
- Nguyễn Manh Hùng, Ngô Thanh Quyền, “Điều khiển bám đuổi mạng
neural thích nghi cho cánh tay robot bao gồm động lực học cơ cấu truyền động”
Tạp Chí Đại Học Công Nghiệp, số 9(06).2011.
- Asgari, Pouya, Zarafshan, Payam ; Moosavian, S.Ali A.“Dynamics
modelling and stable motion control of a Ballbot equipped with a manipulator”,
IEEE Conference Publications - Publication Year: 2013 , Page(s): 259 – 264.
- YaoNan Wang, ThanhQuyen Ngo, ThangLong Mai, ChengZhong Wu
“Adaptive Recurrent Wavelet Fuzzy CMAC Tracking Control for De-icing Robot
Manipulator”, Proceedings of World Congress on Engineering and Computer
Science 2012 Vol I WCECS 2012, October 24-26, 2012, San Francisco, USA.
Các phương pháp này ít nhiều cũng đã giải quyết được những khó khăn khi
điều khiển robot như hệ có cấu trúc phi tuyến, tham số bất định, thay đổi, ảnh
hưởng bởi nhiễu…Với luận văn này tác giả dự định sẽ áp dụng thuật toán LFFC
(Leaning Feedforward Control) dựa trên MRAS (Model Reference Adaptive
System) để điều khiển tay máy robto RD5NT với mong muốn bộ điều khiển LFFC
có khả năng tự học sẽ giải quyết được sự ảnh hưởng của tham số bất định và nhiễu
cho các nghiên cứu về sau có thể xây dựng một bộ điều khiển mà có thể điều khiển
phối hợp toàn bộ 5 khớp của mô hình.
Thái Nguyên, ngày tháng
năm 2015
Học viên
Trần Quế Sơn
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
10
CHƢƠNG 1
TỔNG QUAN VỀPID, LEARNING FEED FORWARD
CONTROL(LFFC)VÀ MODEL REFERENCE ADAPTIVE
SYSTEMS (MRAS), BỘ ĐIỀU KHIỂN PID CHO MÔ HÌNH
CÁNH TAY ROBOT RD5NT
Như chúng ta đã biết, robot là đối tượng có tính phi tuyến mạnh vì vậy cần
có phương pháp để nâng cao độ chính xác về vị trí khi điều khiển cánh tay
robot.Trong nội dung chương này, tác giảđề cậpvà phân tích hiệu suất của bộ điều
khiển sử dụng thuật toán PID cho mô hình cánh tay robot, đồngthời đề xuất một
phương pháp điều khiển mới nhằm cải thiện khả năng bám quỹ đạo của cánh tay
robot.
1.1. Tổng quan về PID
Thuật toán PID đưa ra tín hiệu điều khiển dựa trên sự tổng hơp của cả ba
thành phần: tỉ lệ (P), tích phân (I) và vi phân (D). Chúng có cấu trúc và nguyên lý
làm việc đơn giản, có nhiệm vụ đưa sai lệch e(t) của hệ thống về 0 sao cho quá trình
quá độ thỏa mãn các yêu cầu cơ bản về chất lượng. Do đó bộ điều khiển PID được
Hàm truyền đạt của bộ điều khiển PID cùng với bộ lọc bậc nhất được biểu
diễn như sau:
Trong đó:
E: Sai lệch (vị trí hoặc tốc độc)
V: Điện áp
: Hằng số thời gian bộ lọc
Hình 1.1: Sơ đồ khối của bộ điều khiển PID với bộ lọc bậc nhất
Từ sơ đồ khối trên, ta rút ra được các phương trình sau:
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
12
Từ các phương trình trên ta có không gian trạng thái của bộ điều khiển PID:
Hệ phương trình này được viết gọn lại như sau:
Trong đó:
;
;
;
;
một hàm xấp xỉ các ánh xạ đầu vào – đầu ra tương ứng trong suốt quá trình điều
khiển sao cho hoạt động mong muốn của hệ thống điều khiển đạt được.
Định nghĩa 1.2 (Hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được
xác định bởi một hàm được lựa chọn F ., , với các véc tơ thông số được lựa
chọn để hàm F . được xấp xỉ tốt nhất.
Lưu ý: (Điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều
khiển thích nghi có thể được xem xét giống như là một dạng của LC trong đó một
bộ xấp xỉ hàm được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của hàm mục tiêu.
Thông thường, một bộ LC sẽ bao gồm một bộ xấp xỉ hàm cho một đối tượng có
nhiều hàm mục tiêu hơn.
Ta có thể sử dụng nhiều kiểu xấp xỉ hàm như mạng neural, mạng neuro –
fuzzy v..v.. Nói chung một cách sơ bộ, các bộ xấp xỉ hàm có thể được sử dụng theo
2 cách:
Trước hết, bộ xấp xỉ hàm có thể được sử dụng để tạo (một phần) tín hiệu
điều khiển. Việc học được tổ chức bằng cách thích nghi véc tơ thông số của bộ xấp
xỉ hàm theo cách cực tiểu một số hàm chi phí. Bộ điều khiển này được gọi là LC
trực tiếp.
Thứ hai, bộ xấp xỉ hàm có thể được sử dụng để học một mô hình đối tượng.
Dựa trên cơ sở của mô hình đã được học, bộ điều khiển được xây dựng, bộ điều
khiển này được gọi là LC gián tiếp.
Từ khi bộ LC đầu tiên được phát triển vào năm 1963 cho tới nay, lĩnh vực
LC đã và đang phát triển rất rộng rãi. Rất nhiều các cấu trúc của bộ điều khiển khác
nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ
đã được phân tích cả trong thực tế và lý thuyết). Tuy nhiên, mặc dù tất cả chúng đều
được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong sản phẩm mang
tính thương mại. Có thể vì những lý do sau đây:
Việc chứng minh sự ổn định được đánh giá cao. Phần lớn các nghiên cứu lý
thuyết của bộ LC được tập trung vào tính ổn định. Tuy nhiên, một bộ LC ổn định
cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt….Hoạt động của bộ
LC đối với một con robot đã được quan sát bằng mô phỏng. Sau khi thực hiện với
tượng. Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ
điều khiển, để chọn các thông số của bộ điều khiển hợp lý và để tốc độ lệ học.
Bộ xấp xỉ hàm nên phù hợp cho việc điều khiển. Điều này có nghĩa rằng:
Cần sử dụng dung lượng nhớ nhỏ. Trong thực tế, bộ điều khiển được thực
hiện bằng phần mềm được gắn vào máy tính. Dung lượng bộ nhớ là có hạn, do đó
số lượng các thông số của bộ xấp xỉ hàm mà yêu cầu phải xấp xỉ tín hiệu điều khiển
không thể quá rộng.
Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ
vào/ra phải được thực hiện một cách nhanh chóng. Trong môi trường thời gian thực,
trong một khoảng thời gian lấy mẫu, các thông số của hàm xấp xỉ phải tương ứng
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
15
và đầu ra tính được. Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian
mẫu nhỏ và cho phép thời gian tính toán là rất ít. Các hàm xấp xỉ mà bao gồm một
lượng lớn các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển.
Cơ chế học cần hội tụ nhanh. Để giữ được lượng thời gian trong đó quá
trình vận hành của hệ thống được điều khiển tối ưu từng phần, tiến tới mức cực
tiểu, cơ chế học cần hội tụ nhanh.
Cơ chế học không nên bị cực tiểu cục bộ, khi bị lưu giữ trong mức cực
tiểu cục bộ, thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm
xấp xỉ, được biểu thị bởi loc , sinh ra sai số xấp xỉ cực tiểu, được biểu thị bởi
E ( loc ) . Mặc dù glob loc tồn tại, làm cho E ( glob ) E (loc ) .
E
Cực tiểu cục bộ
thích một cách cục bộ. Trong trường hợp này, việc học một chuyển động mới sẽ
không làm thay đổi các tín hiệu đã được học trước đó.
Hàm xấp xỉ có khả năng tự khái quát hoá tốt. Khả năng tự khái quát hoá
là khả năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong
quá trình huấn luyện nhưng nó tương tự như các huấn luyện mẫu. Khi hàm xấp xỉ
có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho
các chuyển động tương tự các chuyển động được huấn luyện. Vì vậy nó đủ để
huấn luyện LC với một lượng nhỏ các đặc tính chuyển động huấn luyện. Khi bộ
xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho
mỗi chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng .
Sự mềm mại của giá trị xấp xỉ cần điều khiển được. Như nói ở phần trước
đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín
hiệu điều khiển có tần số cao sẽ không thỏa mãn theo mong muốn. Người sử
dụng phải có khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ.
Đáp ứng ngắn hạn là học tốt. Đáp ứng ngắn hạn của bộ LC nên là loại đáp
ứng mà có sai số bám dần hội tụ về giá trị mong muốn. Việc tăng sai số bám trong
pha trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là
trường hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều
khiển được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn.
Sự ổn định lâu dài cần phải được bảo đảm. Việc tự học có thể được thực
hiện một cách liên tục hoặc được thực hiện trước khi vận hành. Việc học liên
tục được yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình
vận hành. Ví dụ, do hao mòn hay chịu ảnh hưởng của môi trường. Trong trường
hợp này, một bộ điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các
điều kiện vận hành thay đổi như thế nào.
1.2.2. Bộ điều khiển học sử dụng sai lệch phản hồi (Feedback Error Learning FEL)
Cấu trúc bộ điều khiển này được trình bày ở hình 1.3
Hệ thống LC bao gồm 2 phần:
- Bộ điều khiển Feef-forward: Được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ
u F F r . Một bộ điều khiển Feed - forward thông thường có thể được sử dụng để
Cách hoạt động của một bộ FEL được so sánh với cách hoạt động của hệ
thống điều khiển thích nghi. Kết luận rằng, trong trường hợp mô hình đối tượng
chính xác được sử dụng trong các hệ thống điều khiển thích nghi, quá trình
bám của bộ điều khiển thích nghi và của bộ điều khiển FEL là tương tự như nhau.
Khi FEL hội tụ chậm hơn bộ điều khiển thích nghi, trong tình huống này bộ
điều khiển thích nghi được ưa chuộng hơn. Tuy nhiên khi chưa có một mô hình
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
18
đối tượng chính xác, thì bộ điều khiển thích nghi sẽ không thể thu được hiệu
suất bám như mong muốn. Bộ điều khiển FEL không phải trải qua điều này và nó
vẫn đem lại hệ số bám chính xác. Khả năng này nâng cao giả thiết rằng bộ FEL có
phù hợp cho hang loạt các ứng dụng mở rộng khi trong thực tế các đối tượng
thường khó có một mô hình chính xác. Câu hỏi đặt ra là nếu xét về mặt thương
mại thì nên sử dụng bộ điều khiển nào? Để trả lời cho câu hỏi này chúng ra sẽ đi
đánh giá xem bộ điều khiển FEL có đáp ứng được đầy đủ các chỉ tiêu chất lượng mà
ta đã đưa ra trong mục Learning Control hay không
- Dễ dàng sử dụng trên hệ thống điều khiển có sẵn: Sự mở rộng duy nhất đối
với hệ thống điều khiển có sẵn là hàm xấp xỉ. Khi hệ thống điều khiển được thực
hiện bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực
hiện.
- Sự hợp nhất các kiến thức quan trọng trong thiết kế: Khi cấu trúc của đối
tượng động học được xác định, thì mạng MLP trong bộ điều khiển feedforward có thể tách ra thành một vài mạng MLP nhỏ hơn. Mỗi một mạng con
này sẽ bù cho một phần riêng biệt của đối tượng động học. Những thí nghiệm đã
chỉ ra rằng mạng này đã nâng tốc độ học lên đáng kể
- Sự ổn định được xác lập: Điều này đã được chứng minh bằng lý thuyết
huấn luyện được thực hiện một cách tổng thể. Khi một hệ thống chuyển động phải
vận hành ở tốc độ thấp, bộ điều khiển FEL có khuynh hướng đưa ra hiệu suất kém.
Điều này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương
quan với nhau ở mức cao. Khi các dữ liệu có tương quan với nhau ở mức cao, mạng
có khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là đưa ra khả
năng khái quát hoá kém.
Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn điều khiển được. Số
lượng các thông số của một bộ MLP quyết định tính chính xác cực đại của giá trị
xấp xỉ. Nó không đảm bảo được độ trơn tru nhất định. Nhờ việc học, mạng MLP có
thể xấp xỉ rất gần các hàm mục tiêu trong phạm vi đầu vào và rất chính xác ở phần
còn lại.
Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà
cách học tốt, bộ điều khiển FEL có khả năng đáp ứng rất tốt. Các nghiên cứu khác
nhau nhằm mục đích khắc phục các vấn đề tồn tại của bộ điều khiển FEL. Theo đó
ta sẽ giới thiệu tóm lược 3 phương pháp: 2 phương pháp đầu thay đổi cấu trúc của
bộ điều khiển học. Trong khi ở phương pháp còn lại sử dụng hàm xấp xỉ.
Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn
các đầu vào khác nhau cho hàm xấp xỉ. Sai số tín hiệu được thêm vào như một đầu
vào của bộ xấp xỉ, điều này sẽ làm thay đổi bộ điều khiển LC từ chỗ hoàn toàn là 1
bộ điều khiển feed-forward nguyên bản chuyển sang bộ điều khiển feed-forward
dưới đây. Các thí nghiệm đã chỉ ra rằng bộ LC này khắc phục được một số lỗi của
bộ điều khiển FEL gốc.
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
20
r n
Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của điều khiển
FEL, một phương pháp rõ ràng ở đây là phải tìm ra những hàm xấp xỉ khác nhau.
Mạng MLP được thay thế bởi mạng (Cerebellar Model Articulation Controller
CMAC). Mạng CMAC phụ thuộc vào các lớp mạng nơ ron mà làm việc với hàm cơ
sở. Trong trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm đa thức thông
minh mà có giá trị khác không trên phần không gian đầu vào. Ở mỗi điểm trong
không gian đầu vào p các hàm cơ sở chồng chéo lên nhau. Thông số của p được biết
đến như là một thông số khái quát hoá và có thể được lựa chọn bởi nhà thiết kế. Đầu
ra của CMAC là tổng các trọng số của hàm ước lượng cơ sở. Việc học được tiến
hành bằng cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản
thân các hàm cơ sở. Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:
- Độ hội tụ nhanh hơn. Khi việc học diễn ra một cách cục bộ, chỉ có 1 số
nhỏ các hàm trọng được thích nghi tạo ra độ hội tụ nhanh.
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
21
- Có thể học các dữ liệu tương quan: Các vùng của hàm cơ sở đã được trộn
lẫn, điều này có ích cho quá trình học các dữ liệu tương quan.
- Không có cực tiểu địa phương: Cơ cấu học không trải qua vùng cực tiểu
cục bộ.
Tuy nhiên một bất lợi là người thiết kế bộ điều khiển phải lựa chọn sự phân
phối của các hàm cơ sở. Điều này yêu cầu phải có một số kiến thức nền tảng về ánh
xạ vào/ra theo mong muốn và việc điều chỉnh sự phân phối của hàm cơ sở là cần
thiết trước khi đạt được hiệu suất có thể chấp nhận được. Các thínghiệm đã chỉ ra
rằng việc thay thế mạng MLP bởi mạng CMAC đem lại một quá trình học tốt hơn
và độ bám chính xác hơn
được Whitaker đề xuất khi giải quyết vấn đề điều khiển lái tự động máy bay năm
1958. Phương pháp độ nhậy và luật MIT đã được dùng để thiết kế luật thích nghi
với mục đích đánh giá các thông số không biết trước trong sơ đồ MRAC
Thời gian đó việc điều khiển các chuyến bay do còn tồn tại nhiều hạn chế
như: thiếu phương tiện tính toán, xử lý tín hiệu và lý thuyết cũng chưa thật hoàn
thiện. Đồng thời những chuyến bay thí nghiệm bị tai nạn là cho việc nghiên cứu về
lý thuyết điều khiển thích nghi) bị lắng xuống vào cuối thập kỷ 50 và đầu năm
1960.
Thập kỷ 60 là thời kỳ quan trọng nhất trong việc phát triển các lý thuyết
tựđộng, đặc biệt là lý thuyết ĐKTN. Kỹ thuật không gian trạng thái và lý thuyết
ổnđịnh dựa theo luật Liapunov đã được phát triển. Một loạt các thuyết như:
Điềukhiển đối ngẫu, điều khiển ngẫu nhiên, nhận dạng hệ thống, đánh giá thông số
… rađời cho phép tiếp tục (nghiên cứu lại) phát triển và hoàn thiện lý thuyết
ĐKTN. Vàonăm 1966 Park và các đồng nghiệp đã tìm được phương pháp mới để
tính toán lạiluật thích nghi sử dụng luật MIT ứng dụng vào các sơ đồ MRAC của
những năm 50 bằng cách ứng dụng lý thuyết của Liapunov.
Tiến bộ của các lý thuyết điều khiển những năm 50 cho phép nâng cao hiểu
biết về ĐKTN và đóng góp nhiều vào đổi mới lĩnh vực này. Những năm 70 nhờ sự
phát triển của kỹ thuật điện tử và máy tính đã tạo ra khả năng ứng dụng lý thuyết
này vào điều khiển các hệ thống phức tạp trong thức tế.
Tuy nhiên những thành công của thập kỷ 70 còn gây nhiều tranh luận trong
ứng dụng ĐKTN. Đầu năm 1979 người ta chỉ ra rằng những sơ đồ MRAC của thập
kỷ 70 dễ mất ổn định do nhiễu tác động. Tính bền vững trong ĐKTN trở thành mục
tiêu tập trung nghiên cứu của các nhà khoa học vào năm 1980.
Những năm 80 nhiều thiết kế đã được cải tiến, dẫn đến ra đời lý thuyết
ĐKTN bền vững. Một hệ ĐKTN được gọi là bền vững nếu như nó đảm bảo chất
lượng ra cho một lớp đối tượng trong đó có đối tượng đang xét. Nội dung của bài
toán bễn vững trong ĐKTN là điều khiển những đối tượng có thông số không biết
trước và biến đổi theo thời gian. Cuối thập kỷ 80 có các công trình nghiên cứu về hệ
thống ĐKTN bền vững, đặc biệt là MRAC cho các đối tượng có thông số biến thiên
* Giới thiệu:
Có một vài cấu trúc mà có thể đưa ra một hệ thống điều khiển có khả năng
phản ứng với sự biến đổi những tham số của bản thân nó hoặc phản ứng với những
biến đổi đặc tính của nhiễu (hệ thống). Một hệ thống phản hồi thông thường mặc
dù có mục đích là giảm nhỏ sự nhạy cảm đối với những loại thay đổi này. Tuy
nhiên, khi những biến đổi thậm chí với cả một hệ thống có phản hồi mà hệ số
khuếch đại tốt vẫn không thỏa mãn. Lúc đó một cấu trúc điều khiển phức tạp hơn
được cần đến và tính chất thích nghi chắc chắn phải được đưa vào (giới thiệu). Một
hệ thống thích nghi có thể được định nghĩa như sau.
“Một hệ thống thích nghi là một hệ thống mà trong bản thân nó đã bổ sung
vào cấu trúc (phản hồi) cơ bản, kết quả đo chính xác được đưa vào để bù lại một
cách tự động đối với những thay đổi trong mọi điều kiện hoạt động, với những thay
đổi trong những quá trình động học, hoặc với những biến đổi do nhiễu hệ thống,
nhằm để duy trì một quá trình thực hiện tối ưu cho hệ thống”.
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>