Tài liệu Đồ án Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ: Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn
ĐẠI HỌC THÁI NGUYấN
TRƯỜNG ĐẠI HỌC KỸ THUẬT CễNG NGHIỆP
------------ ------------
ĐỐ ÁN TỐT NGHIỆP
Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện
cơ
Học viờn: Lõm Hoàng Bỡnh
Giỏo viờn hướng dẫn: Ts. Nguyễn Duy Cương
Chuyờn ngành: Tự Động Hoỏ
Khoỏ:K10
Thỏi Nguyờn, thỏng 10 năm 2009
Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn
MỤC LỤC
Chương 1: Giới thiệu
1.1. Tổng quan về Learning Control (LC) ……………………………..………………1
1.2. Learning Control (LC) là gỡ………………………………………………..………2
1.3. Phản hồi sai số tự học………………………………………………… …. ……… 7
1.3.1. Một số vớ dụ về ma sỏt độc lập......................................................................8
1.4. Điều khiển truyền thẳng tự học…………………………………………... .…......13
1.4.1. Đầu vào của mạng BSN………………….......…………………...………14
1.4.2. Sự phõn bố B-Spline trờn đầu vào của mạng BSN..............................................
82 trang |
Chia sẻ: haohao | Lượt xem: 1189 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Đồ án Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP
------------ ------------
ĐỐ ÁN TỐT NGHIỆP
ThiÕt kÕ bé ®iÒu khiÓn Learning FeedForward cho c¸c hÖ thèng chuyÓn ®éng ®iÖn
c¬
Học viên: Lâm Hoàng Bình
Giáo viên hướng dẫn: Ts. Nguyễn Duy Cương
Chuyên ngành: Tự Động Hoá
Khoá:K10
Thái Nguyên, tháng 10 năm 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC
Chương 1: Giới thiệu
1.1. Tổng quan về Learning Control (LC) ……………………………..………………1
1.2. Learning Control (LC) là gì………………………………………………..………2
1.3. Phản hồi sai số tự học………………………………………………… …. ……… 7
1.3.1. Một số ví dụ về ma sát độc lập......................................................................8
1.4. Điều khiển truyền thẳng tự học…………………………………………... .…......13
1.4.1. Đầu vào của mạng BSN………………….......…………………...………14
1.4.2. Sự phân bố B-Spline trên đầu vào của mạng BSN..............................................14
1.4.3. Sự lựa chọn các cơ cấu học. ................................................................................15
1.4.4. Sự lựa chọn tốc độ học. ......................................................................................15
1.5. Ứng dụng minh hoạ: Hệ thống động cơ chyển động tuyến tính………….…..…..18
1.6. Bố cục luận văn…………………………………………….…………………..…21
Chương 2: Các chuyển động lặp……………....……………………......….……..…22
2.1. Giới thiệu ...………………………………………………………….....…………22
2.2. Các giả định …………………………………………………..…………....…….22
2..3. Độ rộng của nội suy B-Spline …………………………….…….……….……....27
Thuật toán 2.2.1. (Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình chi tiết của
hệ thống điều khiển).......................................................................................................27
Chương 3: Thiết kế ứng dụng……………...………………..………………...…….34
3.1. Giới thiệu ...………………………………………………………….....…………34
3.1.1. Bộ điều khiển phản hồi .......................................................................................34
3.1.2.Các đầu vào của khâu truyền thẳng......................................................................34
3.1.3.Cấu trúc của khâu truyền thẳng.............................................................................35
3.1.4. Phân bố B-Spline …………………………………………………..….....……..35
3.1.5. Tỷ lệ học......................................................................................... ......................35
3.1.6. Luyện các chuyển động………………………………..………….….….….…..36
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
3.2. LiMMS ……………………..……………………………………….…......….….36
3.2.1. Thiết lập…………………………………………………………….………..…36
3.2.2. Thủ tụ thiết kế một hệ thống Time-indexed LFFC ………………….……..…..37
3.2.3. Các thí nghiệm kiểm chứng cho hệ thống Time-indexed LFFC……..…….…...40
3.2.4. Thiết kế một LFFC tối giản……………………………………………….….....48
3.2.5. Kết luận……………………………………………………………......………..62
3.3. Kết quả mô phỏng bằng phần mềm 20-sim………………………………………63
3.3.1. Mạng FeedBack………………………………………………………………...64
3.3.2. LFFC khi có ViscouNeural………………………………………………….…65
3.3.3. LFFC khi có CoulombNeural và ViscouNeural……………………………….66
3.3.4. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural………………..68
3.3.5. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural, InertialNeural..69
Chương 4: Kết luận……………………………………………………….………….71
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Tài liệu tham khảo
[1] Learning feed – Forward Control Theory, Design and Applications Wubbe Jan
Roelf Velthuis - 1970
[2] Function Approximation for Learning Control, a key sample based approach
B.J. de Kruif - 1976
[3] Intelligent Control part 1 – MRAS Author prof. Dr.ir Job van Amerongen –
March 2004
[4] Advanced Controllers for Electromechanical Motion Systems Dr. Nguyen Duy
Cuong. University of Twente, March, 2008
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Lời nói đầu
§iÒu khiÓn chuyÓn ®éng (motion control) liªn quan viÖc sö dông lùc ®Ó ®iÒu khiÓn sù
di chuyÓn cña ®èi t•îng ®iÒu khiÓn trong mét hÖ thèng c¬ vµ ®•îc sö dông réng r·i trong
c¸c øng dông c«ng nghiÖp nh• ®ãng gãi, in, dÖt, hµn, còng nh• nhiÒu øng dông kh¸c.
HiÖn nay, phÇn lín c¸c lo¹i h×nh ®iÒu khiÓn chuyÓn ®éng ®•îc thùc hiÖn b»ng c¸ch sö
dông c¸c ®éng c¬ ®iÖn, vµ ®©y chÝnh lµ ®iÒu quan t©m chÝnh cña chóng t«i trong thiÕt kÕ.
C¸c hÖ ®iÒu khiÓn chuyÓn ®éng cã thÓ lµ phøc t¹p v× cã nhiÒu vÊn ®Ò kh¸c nhau cÇn ®•îc
xem xÐt, vÝ dô nh•:
- Gi¶m thiÓu ¶nh h•ëng cña nhiÔu hÖ thèng.
- Suy yÕu t¸c ®éng xÊu cña nhiÔu ®o
- Sù thay ®æi th«ng sè vµ cÊu tróc kh«ng râ cña ®èi t•îng ®iÒu khiÓn.
RÊt khã ®Ó t×m ra c¸c ph•¬ng ph¸p thiÕt kÕ mµ cã thÓ gi¶i quyÕt ®ång thêi tÊt c¶ c¸c vÊn
®Ò nªu trªn, ®Æc biÖt ®èi víi c¸c ph•¬ng ph¸p ®iÒu khiÓn truyÒn thèng mµ ë ®ã c¸c thiÕt
kÕ ®iÒu khiÓn liªn quan tíi sù th•¬ng th¶o gi÷a c¸c môc tiªu mang tÝnh ®èi ng•îc. §Ó
kh¾c phôc khã kh¨n ®· nªu, bé ®iÒu khiÓn Learning FeedForward (LFF) sÏ ®•îc giíi
thiÖu trong nghiªn cøu nµy.
Thực hiện luận văn tốt nghiệp trong khuôn khổ chương trình đào tạo Thạc sỹ ngành tự
động hóa của trường Đại học Kỹ thuật Công nghiệp Thái Nguyên, Tôi được giao đề tài:
’’ ThiÕt kÕ bé ®iÒu khiÓn Learning FeedForward cho c¸c hÖ thèng chuyÓn ®éng ®iÖn
c¬”
Luận văn phân tích các quá trình động học đối tượng thông qua mô hình toán học
từ đó đưa ra và chứng minh tính phù hợp của các phương án điều khiển, cuối cùng là tiến
kiểm chứng trên phần mềm mô phỏng 20-sim.
Luận văn được trình bày trong 4 chương:
Chương 1: GIỚI THIỆU
Tổng quan về Learning control
Chương 2: PHÂN TÍCH ĐỘ ỔN ĐỊNH CỦA HỆ THỐNG LFFC PHỤ THUỘC
THỜI GIAN
Trong chương này đề cập đến bộ điều khiển LFFC phụ thuộc thời gian và phân tích tính
ổn định của hệ thống phụ thuộc vào thời gian. Từ đó tìm ra công thức tính giá trị nhỏ nhất
của độ rộng mạng B-Spline
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
Chương 3: THIẾT KẾ ỨNG DỤNG
Trong các chương trước, một số vấn đề về LFFC đã được đề cập đến. Ở chương
này sẽ sử dụng các kiến thức có được nhằm thực hiện thiết kế một bộ LFFC thực tế.
Chương 4: KẾT LUẬN
Sau thời gian thực hiện, đến nay bản luận văn của tôi đã hoàn thành. Trước thành công
này tôi xin gửi lời cảm ơn chân thành tới thầy TS. Nguyễn Duy Cương, người đã trực tiếp
hướng dẫn, giúp đỡ tôi hoàn thành đề tài này, tôi cũng xin được bày tỏ lòng biết ơn tới
các anh các chị trong trường đại học Kỹ Thuật Công Nghiệp cũng như gia đình, bạn bè đã
tạo điều kiện giúp đỡ tôi trong quá trình làm luận văn.
Ngày 30 .tháng 10 năm 2009
Học viên
Lâm Hoàng Bình
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 22
Chương 2: PHÂN TÍCH ĐỘ ỔN ĐỊNH CỦA HỆ THỐNG LFFC PHỤ THUỘC
THỜI GIAN
2.1. Giới thiệu
Trong chương này đề cập đến bộ điều khiển LFFC phụ thuộc thời gian và phân tích
tính ổn định của hệ thống phụ thuộc vào thời gian. Xác định giá trị nhỏ nhất của độ
rộng mạng B-Spline.
2.2. Các giả định
Để có thể phân tích tính ổn định của các thông số trong LFFC chúng ta giả thiết như
sau:
1. Đối tượng cần điều khiển là đối tượng (single input - single output ) SISO LTI.
2. Bộ điều khiển phản hồi, C, là tuyến tính, các hằng số thời gian và các thông số
được chọn cho vòng phản hồi là ổn định.
3. Luật học rời rạc.
h
T
k
i
h
T
k
Ci
i
p
p
kh
khukh
0
0
(2.1)
(với h là thời gian mẫu) được thay thế bởi 1 công thức tương đương dưới dạng liên
tục :
pT
i
pT
Ci
dtt
dttut
Ci
0
0
(2.2)
4. Phân bố B-spline giả thiết là đồng dạng.
Giả thiết có N B-pline có phân bố đồng bộ trên phạm vi đầu vào, [0, Tp] (s), như trên
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 23
hình. băng thông (độ rộng) d(s) của các công thức cơ sở cho các tín hiệu từ 2 tới N–1
được cho bởi quan hệ sau:
s
N
T
d
p
1
2
(2.3)
thành phần B-spline thứ i được định nghĩa như sau:
0
2
1
2
2
)1(
2
2
2
22
i
d
ti
d
for
d
tdi
i
d
ti
d
for
d
idt
ti
(2.4)
Thành phần thay thế (2.4) trong luật học (2.2) được cho bởi trọng số thích nghi sau:
)1(
2
2
2
2
1
2
)1(
2
2
2
2
1
2
222
222
i
d
i
d
i
d
i
d
i
d
i
d
i
d
i
d
CC
dt
d
tdi
dt
d
idt
dttu
d
tdi
dttu
d
idt
Ci
(2.5)
Mẫu số của (2.5):
)1(
2
2
2
2
1
2
222
i
d
i
d
i
d
i
d
dt
d
tdi
dt
d
idt (2.6)
Sử dụng (2.6), khi đó có thể đơn giản hoá công thức của trọng số trong (2.5) :
)1(
2
2
2
2
1
2
22
42424
i
d
i
d
i
d
i
d
CCC dttu
d
tdi
dttu
d
idt
Ci (2.7)
điều này ngụ ý rằng việc học là tuyến tính trong uC(t) và kể từ đây ta sẽ coi vòng lặp
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 24
thích nghi feed-forward là tuyến tính. khi vòng phản hồi cũng là tuyến tính, phần tín
hiệu chủ đạo có thể đạt tới giá trị bằng 0 trong khi phân tích tính ổn định (xem hình
2.1). giá trị mong đợi khi đó là uF = 0.
Hệ thống này là ổn định nếu một tín hiệu feed-forward ban đầu được lựa
chọn là duy nhất thì sẽ không có kết quả ở đầu ra không giới hạn của đối tượng. tín
hiệu feed-forward (ban đầu) được xác định bởi các giá trị (đầu) của trọng số trong
Hình 2-1: Chỉ số thời gian của LFFC khi r = 0
mạng B-spline. Khi hệ thống được điều khiển phản hồi ổn định đầu ra chỉ có thể
vượt quá giới hạn khi tín hiệu feed-forward uF(t) trở nên quá giới hạn. điều này
muốn nói rằng ít nhất 1 trọng số đã đạt tới giá trị vô cùng lớn. Do đó, nếu các trọng
số đã được thích nghi theo cách giữ nguyên giá trị chặn, hệ thống là ổn định, nếu
không hệ thống là không ổn định. Giá trị của các trọng số còn lại bị chặn nếu:
1. Mỗi trọng số thích nghi theo 1 hướng đúng (về phía uF(t) = 0), có nghĩa là:
0 i
for
0i
0 i
for
0i
(2.8)
2. Các trọng số không thích nghi quá mạnh:
ii 2
for
0i
ii 2
for
0i
(2.9)
-
BSN
C
+
+
UF
P
y
t
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 25
Kết hợp (2.8) và (2.9) ta thu được:
ii 20
for
0i
02 ii
for
0i
(2.10)
Lưu ý rằng (2.10) là điều kiện đủ chứ không phải là điều kiện cần. Vấn đề là chọn
băng thông (độ rộng) d và tốc độ học C phù hợp với (2.10). Để giải quyết vấn đề
này, ta giả thiết rằng hình dạng của tín hiệu feed-forward uF(t) là dạng tam giác. Sự
lựa chọn này được thúc đẩy bởi thực tế là các kinh nghiệm đã chỉ ra rằng khi xảy ra
hoạt động không ổn định đầu ra của BSN sẽ có dạng tam giác. Ánh xạ vào/ra này có
thể thực hiện bằng cách chọn trọng số như wi = g với i = 1, 3, 5… và wi = -g với i =
2,4 6 với g R+. xem hình 2.2
Hình 2.2: Tín hiệu phản hồi đầu vào
Tín hiệu uF(t) có thể được viết dưới dạng chuỗi Furiê:
.....5,3,1
22
cos8
n
n
F
n
tg
tu
(2.11)
với
12 rads
d
n
n
(2.12)
d
1 2 3 4 5
t
g
-g
uF
1
0
μ
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 26
Trong miền tần số quan hệ giữa đầu ra của bộ điều khiển feed-forward UF và tín
hiệu học UC được cho bởi:
UC = -T UF (2.13)
Với T là hàm bù nhạy :
CP
CP
T
1
(2.14)
T khuếch đại biên độ của mỗi thành phần tần số (2.11) bởi 1 hệ số
nn jTa
và
góc chuyển pha
nn jT arg
, do đó uC(t) có thể được viết như sau:
...5.3.1
22
cos8
n
nnn
C
n
tag
tu
(2.15)
Thay (2.15) vào (2.5) và viết lại công thức:
...5,3,1
cos32
...6,4,2
cos32
...5,3,1
44
...5,3,1
44
ifor
n
a
g
ifor
n
a
g
n
n
n
c
n
n
n
c
i
(2.16)
Có thể thấy là tất cả các trọng số có cùng giá trị đầu (wi = g với i = 1,3,5.. và
wi = -g với i = 2,4,6…) là có tính thích nghi như nhau. Do đó việc học không làm
thay đổi về hình dáng của tín hiệu feed-forward. Kể từ đây, với mỗi bước lặp của tín
hiệu feed-forward có thể khuếch đại như trong công thức (2.11) và trọng số thích
nghi trong (2.16). Trong công thức dưới đây, ta sẽ xét sự thích nghi của các trọng số
có giá trị đầu dương wi = a: Với mỗi trường hợp, ta sẽ phân tích dạng tương tự của
nó. Thay vào công thức (2.16) với điều kiện ổn định (2.10) được kết quả:
0
cos32
2
...5,3,1
44
n
n
n
c
n
a
g
g
(2.17)
0
cos
16 ...5,3,1
4
4
n
n
n
C n
a
(2.18)
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 27
bất đẳng thức vế trái của (2.18):
...5,3,1
4
4 cos
16 n
n
n
C n
a
(2.19)
chứa đựng C , an , n. Các giá trị của an và n phụ thuộc vào giá trị của wn, với wn
được xác định bởi cách chọn lựa băng thông B-spline, d xem (2.12). Dù (2.19) có
thoả mãn hay không thì nó vẫn phụ thuộc vào sự chọn lựa tỉ lệ học và độ rộng B-
spline. Bất đẳng thức vế phải của (2.18):
0
cos
...5,3,1
4
n
n
n
n
a
(2.20)
chỉ chứa an và n. Điều này có nghĩa là chỉ vâng chọn d xác định thì (2.20) là thỏa
mãn. Tiếp theo, sử dụng d vừa thu được (và wn) ta có thể tính được C từ (2.19).
Theo đó ta sẽ cố gắng tìm ra giá trị nhỏ nhất của d mà vẫn thoả mãn yêu cầu của
công thức (2.20)
2.3. Độ rộng của B-Spline.
Với một mô hình chính xác của hệ thống P và bộ điều khiển C là sẵn có, giá trị
của an và
n
có thể được tính toán cho tất cả các tần số. Điều này sẽ cho phép lựa
chọn giá tri tối thiểu d sao cho (2.20) thỏa mãn nhờ quá trình tìm kiếm lặp lại đơn
giản như sau:
Thuật toán 2.3.1. (Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình
chi tiết của hệ thống điều khiển)
1. Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N=3 trong hình
1.13. Bởi vì theo (2.3) trong trường hợp này d=Tp[s], đây là số B-Spline tối
thiểu có thể lựa chọn .
2. Xác định an và
n
. Điều này được thực hiện theo cách thức sau:
Chọn n=1
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 28
Tính toán
n
theo (2.12). Sử dụng mô hình của hệ thống và
n
để xác định an và
n
Nếu
0na
tiến hành bước 3. Nếu không, tăng n thêm 1 đơn vị và chuyển sang
bước 2.2
3. Kiểm ta xem an và
n
đã tìm được trong bước trước có thảo mãn (2.20)
không.Nếu thỏa mãn,chuyển sang bước 4, nếu không chuyển sang bước 6
4. Tăng số lương B-Spline trong phân bố lên 1 đơn vị N =N+1.
5. Chuyển tới bước 2
6. Giá trị N hiện tại là giá trị nhỏ nhất của B-Spline mà cho kết quả hoạt động
không ổn định. Do đó, số lương lớn nhất B-Spline là N-1 và theo (2.3) ta có:
2
2
N
T
d
p (2.21)
Tuy nhiên, nhìn chung chỉ phần động lực học của hệ thống ở tần số thấp thỏa
mãn. Do đó, thuật toán 2.1 có thể không tin cậy. Để giải quyết vấn đề này chúng ta
sẽ tiếp cận theo hướng truyền thống. Đầu tiên, chúng ta viết lại (2.20) dưới dạng:
0
cos
)cos(
....5,3
411
m
n
n
n
aa
(2.22)
Tiếp theo, chúng ta xác định giá trị nhỏ nhất của d ( đồng nghĩa với giá trị lớn
nhất của
1
) thỏa mãn phương trình (2.22). Với giả thiết là an và
n
có các giá trị
xấu nhất. Để xem xét trong trường hợp các giá trị xấu nhất này, chúng ta sử dụng
một phần giản đồ pha tiêu biểu của -T (hình 2.3)
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 29
Hình 2.3: Đồ thị pha của –T tiêu biểu
Với các giá trị
là pha của –T. Đồ thị tương ứng của
os( )c
được chỉ ra trong hình
2.4
Hình 2.4: Đồ thị của
os( )c
Khi chúng ta chọn một giá trị d lớn
1 0
sẽ cho kết quả
1 180[deg]
và do đó
1 1os( ) 1a c
. Khi chúng ta tăng
1
(tăng d) chúng ta sẽ tiến đến một giá trị mà tại đó
1 90[deg]
hoặc
1 270[deg]
và làm cho
1 1os( ) 0a c
do đó a1>0. Phương trình
(2.22) có thể không đúng tại điểm này tùy thuộc vào giá trị của
....5,3
4
cos
m
n
n
n
a
Khi
0
cos
....5,3
4
m
n
n
n
a
chúng ta có thể tăng thêm giá trị của
1
mà không vi phạm
Freuency (rad/sec)
-20
-180
0 0.1
Freuency (rad/sec)
-80
-140
-100
-60
p
h
as
e
(d
eg
)
Cos[φ]
1
0
-1
10-1 10-2 10-3
ω[rad s-1]
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 30
(2.22). Nói cách khác khi
0
cos
)cos(
....5,3
411
m
n
n
n
aa
chúng ta
phải giảm giá trị của
1
. Vì thế tình huống xấu nhất (xem xét theo độ ổn định) xảy
ra khi:
....5,3
4
cos
m
n
n
n
a
max
....5,3
4
cos
m
n
n
n
a
(2.23)
Theo đó giới hạn trên được cho bởi:
max
....5,3
4
cos
m
n
n
n
a
....5,3
4
cosmax
)max(
m
n
n
n
a
....5,3
4
max
m
n
n
a
....5,3
4
max
m
n
n
jT (2.24)
....5,3
4
m
n
n
jT
Do vậy, 2.22 được thỏa mãn nếu:
11 cosa
....5,3
4
m
n
n
jT (2.25)
Bây giờ, giá trị lớn nhất của
1
mà theo đó (2.25) thỏa mãn có thể tìm được nhờ quá
trình tìm kiếm lặp lại sử dụng mô hình hệ thống động học với tần số thấp:
Thuật toán 2.2. (Tính toán giá trị ổn định nhỏ nhất của d với các giả thiết trên mô
hình động học của hệ thống điều khiển)
1. Sử dụng mô hình tần số thấp của hệ thống để tính toán
....5,3
4
m
n
n
jT
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 31
2. Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N=3 trong hình
2.13
3. Tính toán
1
theo (2.12) với N=1
4. Sử dụng mô hình để xác định a1 và
1
5. Kiểm tra xem an và
n
có thảo mãn phương trình (2.25) sử dụng kết quả của bước
1. Nếu thỏa mãn chuyển tới bước 6, ngược lại chuyển tới bước 8.
6. Tạo một khuôn dạng phân bố B-Spline bao gồm N+1 B-Spline (hay N:=N+1)
7. Chuyển tới bước 3
8. Giá trị nhỏ nhất d được cho bởi:
2
2
N
T
d
p
Để đạt được mục đích xây dựng một chương trình tìm kiếm lặp lại, chúng ta có thể
thêm một số giả thiết với a1. Đầu tiên ta viết lại (2.25) dưới dạng:
1cos
....5,3
4
1m
n
na
jT
0
(2.26)
Như đã trình bày trong phần trước, tình huống xấu nhất đạt được khi phần thứ 2 bên
trái của phương trình 2.26 đạt giá trị lớn nhất :
....5,3
4
1m
n
na
jT = max
....5,3
4
1m
n
na
jT =
....5,3
4
1minm
n
na
jT (2.27)
Sử dụng(2.27) ta có thể diễn tả (2.26) dưới dạng:
1cos
....5,3
4
1minm
n
na
jT 0 (2.28)
Bây giờ chúng ta phải xác định giá trị của min(a1). Điều này được thực hiện bằng
cách tính toán
njT
cho tất cả các gái trị có thể của
1
mà thảo mãn (2.26). Giới
hạn trên của các giá trị của
1
có thể được xác định dưới đây sử dụng kết quả:
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 32
....5,3
4
1m
n
na
jT
0
(2.29)
1
sẽ phải thỏa mãn phương trình (sử dụng (2.26)):
0cos 1
(2.30)
Giới hạn trên của các giá trị của
1
là các giá trị tần số
tại đó
os( ) 0c
. Các kết
quả này được thể hiện trong:
min(a1)
0cos
min
Rl
njT
(2.31)
Trong hình 2.5 giới thiệu một ví dụ về đồ thị Bode của –T. Trong đó tất cả các giá
trị
mà theo đó
os( ) 0c
được đánh bóng.
Hình 2.5: Ví dụ về đồ thị Bode của –T
Thay thế (2.31) trong (2.28) đạt được:
....5,3
0cos
min
0147.0
m n
R
n
jT
jT
....5,3
4
0cos
1
min
cos
m
R
n
njT
jT
(2.32)
Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 33
Phương trình trên có thể được sử dụng để hình thành nên một thuật toán theo đó có
thể tìm được giá trị tối thiểu của d:
Thuật toán 2.3 ( Tính toán giá trị ổn định của d với các giả thiết nghiêm ngặt hơn về
mô hình động học của hệ thống)
1. Xác định
njT
từ mô hình vòng lặp kín
2. Sử dụng đồ thị Bode của mô hình xác định
n
R
jT
0cos
min
3. Tìm giá trị nhỏ nhất của
1
mà tại đó
1arg1 jT
thỏa mãn
....5,3
0cos
1
min
0147.0arccos
m n
R
n
jT
jT
(2.33)
4. Giá trị nhỏ nhất của độ rộng của mạng B-Spline, dmin được cho bởi:
1
1
min
2 radsd
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
34
Chương 3: THIẾT KẾ ỨNG DỤNG
3.1.Giới thiệu
Trong các chương trước, một số vấn đề về LFFC đã được đề cập đến. Ở
chương này sẽ sử dụng các kiến thức có được nhằm thực hiện thiết kế một bộ LFFC
thực tế.
3.1.1. Bộ điều khiển phản hồi.
Bộ điều khiển có phản hồi bù nhiễu ngẫu nhiên và tạo ra một tín hiệu học
cho khâu phản hồi. Trong chương 2 đã chỉ ra rằng độ rộng tối thiểu của B-Spline và
do đó độ chính xác cực đại đạt được phụ thuộc vào đáp ứng tần số của vòng phản
hồi kín. Do đáp ứng tần số của vòng phản hồi kín này phụ thuộc vào bộ điều khiển
phản hồi nên nó quyết định trực tiếp đến khả năng hoạt động tối đa có thể đạt được.
Khi độ rộng tối thiểu của B-Spline quá lớn để đạt được một tỷ lệ lỗi hoạt động chấp
nhận được thì thiết kế lại bộ điều khiển phản hồi là một giải pháp. Tuy nhiên, điều
này yêu cầu bộ điều khiển phản hồi phải được thiết kế sao cho băng thông của vòng
phản hồi kín tăng và điều này có nghĩa là độ ổn định bền vững đối với các thay đổi
của các thiết bị giảm. Chúng ta sẽ giải quyết vấn đề này theo cách khác. Bộ điều
khiển phản hồi sẽ được thiết kế sao cho ổn định và bền vững. Nếu độ rộng tối thiểu
đạt được của B-Spline không phù hợp với hoạt động bám điều khiển mong muốn,
một bộ lọc được thêm vào LFFC. Khi bộ lọc này được thiết kế theo Chương 2, độ
rộng tối thiểu cho phép của B-Spline sẽ giảm.
3.1.2.Các đầu vào của khâu truyền thẳng.
Các đầu vào của khâu truyền thẳng phụ thuộc vào loại chuyển động cần phải
thực hiện. Trong trường hợp các chuyển động lặp lại thì cho kỳ chuyển động được
ưu tiên hơn đầu vào. Khi thực hiện các chuyển động ngãu nhiên, các đầu vào sẽ bao
gồm các vị trí liên quan và thậm chí cả đạo hàm, tích phân của nó. Qua phân tích
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
35
cho thấy các đầu vào được lựa chọn thế nào dựa trên cơ sở mô tả không gian trạng
thái của thiết bị.
3.1.3.Cấu trúc của khâu truyền thẳng.
Nhìn chung, kết quả của các lựa chọn thiết kế trước đây chỉ ra rằng khâu
truyền thẳng sẽ có nhiều đầu vào. Khi thực hiện khâu truyền thẳng nhờ một mạng
BSN đa chiều, chúng ta phải đương đầu với vấn đề liên quan đến bậc của hệ thống.
Vấn đề này có thể được giải quyết bằng cách thay thế mạng BSN bằng một cấu trúc
mạng tinh giảm bao gồm một vài mạng BSN có số chiều thấp hơn. Chương 2 chỉ ra
rằng việc này có thể thực hiện được hoặc là dựa trên các hiểu biết cơ bản về động
học của hệ thống và nhiễu hay theo cách thức tự động bằng cách sử dụng kỹ thuật
mô hình theo kinh nghiệm.
3.1.4. Phân bố B-Spline .
Qua phân tích cho thấy rằng độ rộng của B-Spline quá nhỏ sẽ làm cho quá
trình học không hội tụ. Đối với một hệ thống LFFC phụ thuộc thời gian, độ rộng tối
thiểu của B-Spline sao cho quá trình học hội tụ có thể được xác định dựa trên cơ sở
của đáp ứng tần số của vòng phản hồi kín. Qua phân tích cho thấy rằng trong trường
hợp một LFFC, độ rộng của B-Spline , khi xem xét theo thời gian nên ở mức phù
hợp để bảo đảm rằng quá trình học là hội tụ. Trong trường hợp một mạng BSN
nhiều chiều có thể khó khăn khi thiết kế sự phân bố B-Spline thỏa mãn được điều
này. Qua phân tích cho thấy rằng làm theo quy tắc có thể giải quyết được vấn đề .
3.1.5. Tỷ lệ học.
Tỷ lệ học sẽ xác định các trọng số của mạng BSN thích nghi mạnh đến mức
độ nào. Trong Chương 2, giá trị lớn nhất của tỷ lệ học mà làm cho quá trình học hội
tụ được xác định nhờ đáp ứng tần số của khâu phản hồi kín. Tỷ lệ học nên được lựa
chọn nhỏ (gần 0) khi hệ thống có nhiễu đáng kể. Trường hợp khác có thể lựa chọn tỷ
lệ học lớn.
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
36
3.1.6. Luyện các chuyển động.
Quá trình luyện một hệ thống LFFC phụ thuộc thời gian và một hệ thống LFFC
chỉ bao gồm một mạng BSN có thể được thực hiện theo cách truyền thẳng. Sự quan
tâm đặc biệt được thực hiện khi luyện một mạng LFFC tinh giảm. Qua phân tích chỉ
ra quá trình luyện đồng thời tất cả các mạng BSN nhìn chung sẽ ảnh hưởng đến tín
hiệu học truyền thẳng của tất cả các mạng thay vì chỉ ảnh hưởng đến một mạng BSN
mong muốn. Để giải quyết vấn đề này, Các mạng BSN chỉ được luyện một lần vào
thời điểm phù hợp. các chuyển động liên quan sẽ được lựa chọn sao cho tín hiệu
truyền thẳng mong muốn của một mạng BSN chưa luyện trở nên nổi bật. Chỉ mạng
BSN tương ứng được luyện, trọng số của các mạng BSN khác được giữ nguyên.
Trong các phần sau đây, các thủ tục thiết kế cho cả hệ thống LFFC phụ thuộc
thời gian và LFFC sẽ được trình bày một cách chi tiết hơn. Điều này sẽ được thực
hiện trong mô hình LiMMS.
3.2. LiMMS
3.2.1. Thiết lập.
LiMMS đã được mô tả trong chương 1. Một mô hình xấp xỉ sử dụng cho mô
phỏng được chỉ ra trong hình 3.1.
Hình 3.1 Mô hình mô phỏng của LiMMS
u y
+
-
y
..
y
.
.
FV
FC
dL
coogging
+ +
mL
1
s
1
s
1
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
37
Khối cogging được mô hình hóa theo phương trình:
xxFC 210.6.1sin10
(3.1)
Các thí nghiệm cho thấy rằng (3.1) chỉ là một hàm xấp xỉ đơn giản của đặc tính khối
cogging thực tế. Điều này là do các nam châm giá rẻ liên quan đã được sử dụng có
độ từ tính đáng kể và các nam châm này không được lắp đặt với độ chính xác cao
nhất có thể. Đặc tính của khối cogging có dạng hình sin mà cả chu kì và biên độ đều
phụ thuộc vào vị trí của bộ chuyển đổi LiMMS. Thêm vào đó, đặc tính của khối
cogging cho thấy nó phụ thuộc vào chiều chuyển động. Trong mô hình mô phỏng
chỉ quan tâm đến ma sát nhớt. Giả thiết rằng đặc tính của ma sát trong qua trình thiết
lập thực tế có thể được mô tả theo đường cong Stribeck. Chúng ta đi tới kết luận
rằng LFFC phải thể hiện được:
- Quán tính của LiMMS
- Ma sát phi tuyến
- Các lực cogging (Lực ăn khớp)
3.2.2. Thủ tụ thiết kế một hệ thống Time-indexed LFFC
Trong một số ứng dụng LiMMS phải thực hiện các chuyển động lặp lại. Do đó,
đầu tiên chúng ta quan tâm đến một hệ thống Time-indexed LFFC. Thủ tục thiết kế
cho một Time-indexed LFFC được đưa ra dưới đây.
Bước 1: Thiết kế khâu điều khiển phản hồi
Trong các thí nghiệm này, khâu điều khiển phản hồi được thiết kế nhờ một cơ
chế tự động điều chỉnh giới thiệu trong phần thiết lập LiMMS. Khâu điều khiển
phản hồi là một khâu PD được đặt nối tiếp với một bộ lọc thông thấp:
22
2
400100
400
2752805538
ss
ssC
(3.2)
Bước 2: Xác định độ rộng tối thiểu của miền xác định của các B-Spline và tỷ lệ học
lớn nhất.
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
38
Để xác định độ rộng tối thiểu của các B-Spline sao cho quá trình học hội tụ. cần
phải có một đồ thị Bode cho hàm độ nhạy bổ xung âm. Đồ thị Bode này thể hiện
trong hình 3.2 nhờ một số phân tích tần số thực nghiệm.
Nếu bỏ qua lỗi đo lường có thể xác đinh được biên độ đỉnh đạt được tại tần số
xấp xỉ 20 Hz. Để tính toán được độ rộng tối thiểu của B-Spline chúng ta cần xác
định.
....5,3
0cos
1
min
0147.0arccos
m n
R
n
jT
jT
(3.3)
Từ hình 3.2 ta có:
dBjT n 5.35.1
(3.4)
dBjT n
R
5.184.0min
0cos
(3.5)
Sử dụng (3.4) và (3.5),(3.3) thu được:
49.10263.0arccos1
(3.6)
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
39
Hình 3.2: Đồ thị Bode của –T
Tần số mà tại đó độ dịch pha bằng -1,49
là:
11 1042.52 radsrads (3.7)
Điều này cho phép xác định được độ rộng tối thiểu của miền xác định của các
B-Spline :
ssd 0192.0
104
2
min
(3.8)
Tiếp theo, tỷ lệ học lớn nhất được xác định. Để cho quá trình học hội tụ, tỷ lệ học
phải thỏa mãn:
iT
2 (3.9)
Sử dụng (3.10) cho ta kết quả:
55.1
5.1
22
iT
(3.10)
Bước 4: Lựa chọn phân bố B-Spline
-п
101 102 52(Hz)
-40
102
0
-20
10
T
-10
-30
101
Frequency log (Hz)
Frequency log (Hz)
-1.5п
-2п
-2.5п
-3п
-3.5п
P
h
a
se
[r
ad
]
m
a
g
[d
B
]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
40
Phân bố B-Spline phải được lựa chọn sao cho độ rộng của miền xác định của
các B-Spline lớn hơn dmin
Bước 5: Lựa chọn một tỷ lệ học
Như đã thảo luận trong các phần trước, tỷ lệ học
sẽ được chọn nhỏ (gần bằng
0) nếu hệ thống chịu ảnh hưởng lớn của nhiễu. Nếu không một tỷ lệ học
lớn
hơn sẽ được lựa chọn. Khi
iT
1
0
sai số bám sẽ giảm từ từ.
Khi
iTiT
21
Sẽ làm cho sai số bám giảm theo cách thức dao
động. Do chúng ta xem như tỷ lệ học vừa rồi là không mong muốn , chúng tôi
khuyến nghị sử dụng
67.0
1
iT
Bước 6: Huấn luyện hệ thống Time-indexed LFFC
Luyện hệ thống Time-indexed LFFC theo phương thức luyện mạng truyền
thẳng.
3.2.3. Các thí nghiệm kiểm chứng cho hệ thống Time-indexed LFFC
Trong phần sau đây, hai chuỗi thí nghiệm sẽ được thực hiện. Mục đích của một
số thí nghiệm đầu tiên là kiểm chứng độ rộng tối thiểu của miền xác định của các
B-Spline và tỷ lệ học lớn nhất. sau đó, khả năng của kỹ thuật phân cụm mờ xác
định một phân bố B-Spline sẽ được kiểm tra.
Để khiểm chứng độ rộng tối thiểu của miền xác định của các B-Spline và tỷ lệ
học lớn nhất, các giá trị này sẽ được xác định nhờ các thí nghiệm. Vị trí tham
chiếu mà LiMMS phải bám được đưa ra trong hình 3.3.
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
41
Hình 3.3: Vị trí tham chiếu
Thí nghiệm 3.1 (Độ rộng và tỷ lệ học theo các quy luật)
Trong thí nghiệm đầu tiên, miền xác định của B-Spline được chọn lớn hơn một
chút so với miền xác định tối thiểu do đó d=0,0197[s]. Để đảm bảo rằng hoạt
động không ổn định xảy ra trong thực tế là do độ rộng quá nhỏ của miền xác
định của các B-Spline chứ không phải do tỷ lệ học quá lớn, giá trị của tỷ lệ học
được chọn nhỏ hơn nhiều so với giá trị lớn nhất
=0,6. Các giá trị này sẽ cho kết
quả là một hệ thống LFFC hoạt động tốt và ổn định. Sai số bám trước quá trình
học được cho ở hình 3.4.
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
42
Hình 3.4: Sai số bám khi chưa luyện
Sau 10 chu kỳ lặp lại, Time-indexed LFFC đã hội tụ. Để kiểm tra xem liệu
LFFC còn ổn định không qúa trình học được tiếp tục. Trong hình 3.5 cho thấy
sai số bám sau 400 chu kỳ chạy. Nhờ quá trình học, sai số bám dã giảm đáng kể.
Bộ điều khiển vẫn ổn định và cơ chế học đã hội tụ, điều này có nghĩa là sai số
bám không giảm hơn nữa.
Hình 3.5 Các thí nghiệm với d > dmin và
maxdd
Thí nghiệm 3.2 (Độ rộng không tuân thủ các quy tắc)
Trong thí nghiệm thứ 2 miền xác định của các B-Spline được lựa chọn nhỏ hơn
dmin d =0,0183[s]. Tỷ lệ học vẫn được lựa chọn lại như thi nghiệm 1
=0,6. Khi
các giá trị này được sử dụng, LFFC sẽ trở nên không ổn định. Hình 3.6 cho thấy
sai số bám sau 200 chu kỳ. Sau khi sai số giảm trong một số chu kỳ đầu, nó bắt
đầu tăng khi quá trình học được tiếp tục.
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
43
Hình 3.6 Các thí nghiệm với d <dmin và
maxdd
Sử dụng kết quả này và kết quả trong thí nghiệm 3.1, ta có thể đi đến kết luận
rằng giá trị của dmin là không bảo toàn. Khi miền xác định của các B-Spline được
chọn chỉ cần nhỏ hơn một chút so với dmin sẽ cho kết quả là một hệ thống LFFC
không ổn định.
Thí nghiệm 3.3 (Xác định tỷ lệ học cực đại)
Tiếp theo, tỷ lệ học cực đại
như đã tính toán theo (3.10) được kiểm chứng.
Điều này được thực hiện nhờ tìm kiếm giá trị thực nghiệm lớn nhất của
theo
cách thức lặp lại. Độ rộng tối thiểu của miền xác định của các B-Spline được
chọn là d=0,035[s]. Kết quả của các thí nghiệm này cho thấy tỷ lệ học lớn nhất
bằng 2. Điều này có thể được thấy rõ qua 2 thí nghiệm sau đây. Đầu tiên, tỷ lệ
học được chọn là
=1,98. Trong hình 3.7
thể hiện sai số bám trong chu kỳ đầu
tiên, chu kỳ thứ 15 và 50 . sai số bám hội tụ chậm và vẫn còn nhỏ khi quá trình
học tiếp tục.
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
44
Hình 3.7: Thí nghiệm về tỷ lệ học d > dmin và
=1,98
Tiếp theo, tỷ lệ học được chọn là
=2,01. Hình 3.8 cho thấy sai số bám trong chu kỳ
đầu và chu kỳ thứ 6. Thấy rõ rằng sai số bám tăng lên.
Hình 3.8: Thí nghiệm về tỷ lệ học d > dmin và
=2,01
Khi quá trình học tiếp tục. Sai số bám thậm chí còn tăng hơn. Giá trị lớn nhất của
được xác định trong 3.10 và do đó là một giá trị xác định.
Tiếp theo, kỹ thuật phân cụm mờ được sử dụng để xây dựng nên một phân bố
B-Spline cho Time-indexed LFFC. Tuy nhiên, một LFFC như vậy liên quan đến
các tập dữ liệu nhiều chiều. Độ phức tạp khi tính toán của phân cụm mờ sẽ làm
Learning feed-forward control
36.9 37 37.1 37.2 37.3 37.4 37.5 37.6
time {s}
-0.0004
-0.0003
-0.0002
-0.0001
0
0.0001
0.0002
0.0003
0.0004
PositionError [m]
Run
50
Run
15
Run 1
Learning feed-forward control
44.85 44.9 44.95 45 45.05 45.1 45.15
time {s}
-0.0002
-0.00015
-0.0001
-5e-005
0
5e-005
0.0001
PositionError [m]
run 1
run 6
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
45
cho thời gian tính toán lớn. Do vậy, chúng ta lựa chọn chứng minh phân cụm
mờ sử dụng cho một hệ Time-indexed LFFC. Vị trí tham chiếu mà LiMMS phải
bám được chỉ ra trong hình 3.9.
Hình 3.9: Vị trí tham chiếu cho thí nghiệm phân cụm mờ
Thí nghiệm 3.4 (Bước đầu tiên của thuật toán phân cụm)
Ý tưởng cơ bản của việc sử dụng kỹ thuật mô hình kinh nghiệm cho LFFC như
sau. Sau khi quá trình học hội tụ. Một sai số bám (và uc) vẫn còn tồn tại. Khi sử
dụng phân bố B-Spline hiện tại, BSN không thể xấp xỉ tốt hơn tín hiệu truyền
thằng mong muốn. Nói cách khác, không thể xấp xỉ uF+uc. Để khắc phục vấn đề
này, các kỹ thuật mô hình kinh nghiệm được sử dụng để tìm ra một phân bố B-
Spline tốt hơn có khả năng xấp xỉ uF+uc. Do tại lục bắt đầu thuật toán uf=0. Do
đó phân bố B-Spline ban đầu phụ thuộc vào uc. Phân bố B-Spline ban đầu có thể
được xây dựng hoặc nhờ phân cụm mờ hoặc bằng tay ( sau đó phân cụm mờ sẽ
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
46
tối ưu phân bố B-Spline này). Đầu ra của bộ điều khiển phản hồi và sai số bám
kết quả được đưa ra trong hình 3.10 và 3.11.
Hình 3.10: Đầu ra của bộ điều khiển phản hồi
Hình 3.11: Sai số bám của bộ điều khiển phản hồi
Learning feed-forward control
6 6.2 6.4 6.6 6.8 7 7.2 7.4 7.6
time {s}
0
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
ProcessOutput [m]
Learning feed-forward control
9 9.1 9.2 9.3 9.4
time {s}
0
2e-005
4e-005
6e-005
8 -005
0.0001
0.00012
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
47
Một phân bố B-Spline được lựa chọn là phân bố có số lượng B-Spline nhỏ nhất.
Theo cáh này, vị trí của các B-Spline quyết định lớn đến khả năng của LFFC
trong việc bù nhiễu ngẫu nhiên một cách chính xác như cogging. Trong nghiên
cứu này, chúng ta chọn phân bố B-Spline ban đầu thực hiện bằng tay, dựa trên
hình dạng của uc (hình 3.10). Mạng BSN xấp xỉ uc nhờ một số hàm đa thức bậc
nhất. Khoảng 75 hàm đa thức bậc nhất được lựa chọn để tạp nên một xấp xỉ thô
cho tín hiệu uc. Do đó, tổng cộng 75 B-Spline được lựa chọn. Tỷ lệ học được
chọn nhỏ
0,4
. Sai số bám còn lại sau quá trình luyện mạng có thể được thấy
trên hình 3.12 (chú ý rằng tỷ lệ ở đây khác so với hình 3.11).
Hình 3.12: Sai số bám sử dụng phân bố B-Spline ban đầu
Sau 8 lần thực hiện quãng đường tham chiếu quá trình học hội tụ và sau đó
không cải thiện được thêm nữa. Sai số bám đã giảm 10 lần so với sai số bám của
bộ điều khiển phản hồi.
Thí nghiệm 3.5 (Kết quả của thuật giải phân cụm)
Để thu được hoạt động hiệu quả hơn, kỹ thuật phân cụm mờ được sử dụng để tối
được phân bố B-Spline. Sau khi thuật toán phân cụm mờ (được mô tả trong
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
48
chương 2) được thực hiện hai lần, sai số bám không cải thiện thêm nữa. trong
hình 3.13 cho thấy kết quả của sai số bám sau quá trình tối ưu.
Hình 3.13: Sai số bám sử dụng phân bố cải tiến
Có thể thấy rằng phân cụm mờ có thể cho phép thu được phân bố B-Spline cho
sai số bám nhỏ hơn phân bố B-Spline khởi tạo.
3.2.4. Thiết kế một LFFC tối giản.
Bước thiết kế 1: Thiết kế khâu điều khiển phản hồi
Bộ điều khiển phản hồi tương tự được sử dụng như trong trường hợp Time-
indexed LFFC
22
2
400100
400
2752805538
ss
ssC
(3.11)
Bước 2: Xác định các đầu vào cho khâu truyền thẳng
Có thể xác định các đầu vào yêu cầu của khâu truyền thẳng nhờ mô tả động học
của hệ thống theo khuôn dạng đã được giới thiệu. Đối với LiMMS, từ các kết
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
49
quả này đưa tới các mô tả trong không gian trạng thái sau đây
u
mm
xF
m
xxF
x
x
m
d
x
x
LL
f
L
C
L
L
1
0
.
0
0
10
(3.12)
x
x
v
01
Trong đó đại diện cho ma sát Coulomb... .
( )CF x
mô tả lực ăn khớp (lực cogging)
và dL chính là ma sát nhớt, tùy thuộc vào từng loại hệ thống mà LiMMS có thể
được điều khiển bởi LFFC. Từ 3.12 chúng ta thu được tín hiệu truyền thẳng
mong muốn như sau:
Do vậy, khâu truyền thẳng sẽ có các đầu vào sau đây:
rrr ,,
Bước 3: Chọn cấu trúc của khâu truyền thẳng
Từ 3.13 có thể thấy rõ rằng ud bao gồm 3 thành phần độc lập lẫn nhau
-Thành phần bù ma sát:
rFrd fL
yêu cầu một BSN có
r
là đầu vào
-Thành phần bù cogging:
rrFcog ,
. Trong phần đầu của chương này có tranh
luận rằng các đặc tính của cogging có sự khác biệt đối với vận tốc dương và âm.
Chúng ta có thể thay thế cogging bằng một BSN với hai đầu vào là r và
r
. Do
các đặc tính cogging chỉ phụ thuộc vào chiều chuyển động nên cũng có thể thay
thế cogging nhờ 2 BSN. Mỗi BSN cho một chiều chuyển động. Xuất phát từ Từ
quan điểm tối giản, lựa chọn sau là hấp dẫn hơn cả.
-Thành phàn bù quán tính . Yêu cầu một BSN có đầu vào là
r
Bằng cách tạo ra mỗi BSN cho các thành phần trên, ta thu được các kết quả cho
LFFC tối giản như sau:
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
50
Hình 3.14: LFFC tối giản cho LiMMS
Bước 4: Chọn phân bố B-Spline
Mỗi khi một cấu trúc mạng được tạo thành. Một phân bố B-Spline phải được lựa
chọn. Các B-Spline được xác định dựa trên chuyển động tham chiếu cần được
mở rộng một cách hiệu quả khi xem xét trên quan điểm thời gian (xem phần
trước). Do vậy, phân tích được thực hiện ở bước 2 trong thủ tục thiết kế một
Time-indexed LFFC sẽ được tiến hành cho LFFC. Xuất phát từ thủ tục thiết kế
trước đó, chúng ta biết rằng các B-Spline tối thiểu phải rộng 0,0192 [s]. Cùng với
vấn đề này, chúng ta thiết kế một phân bố B-Spline dựa trên cơ sở các kiến thức
có được trước đó về động học hệ thống và nhiễu:
- Các BSN cogging. Chu kỳ của cogging là 1.6 [cm]. Để có thể xấp xỉ chính xác
tín hiệu truyền thẳng mong muốn sao cho có thể mô tả xấp xỉ bằng phương trình
r210.6.1sin10
, chúng ta lựa chọn định nghĩa 500 B-Spline trên miền không
gian đầu vào
mm 11.0.61.0
. Điều này có nghĩa là có 21 B-Spline sẽ được
-
r
C P
BSN
BSN
BSN
r
..
r
.
+ e
UC + +
+
+
+
+
UF
y
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
51
định nghĩa cho một chu kỳ của cogging. Độ rộng của các B-Spline là 0,00144
[m]. Hình 3.15 mô tả một phần của phân bố B-Spline và tín hiệu truyền thẳng
mong muốn (dựa vào cogging trong mô hình mô phỏng). Độ rộng của các
B-Spline là đủ nhỏ sao cho xấp xỉ chính xác tín hiệu truyền thẳng mong muốn.
Hình 3.15; Phân bố B-Spline của BSN ma sát
Để bảo đảm rằng theo thời gian, độ rộng của các B-Spline tối thiểu là 0,0192 [s] ,
BSN này phải được luyện ở vận tốc tham chiếu thỏa mãn điều kiện sau đây:
1075.0
0192.0
00144.0 ms
s
m
tr
(3.14)
- BSN ma sát: Do đặc tính của ma sát là phi tuyến nên chúng ta lựa chọn định
nghĩa 10 B-Spline trên miền không gian đầu vào
11 1,1 msms
.
Chú ý rằng phân bố B-Spline này không đủ mật độ phân bố để bù cho lực ma sát.
0.14 [cm]
0
1
0.5
μ
1.6 [cm] u
d
cogging 10
r
-10
r
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
52
Hình 3.16 Phân bố B-Spline của BSN ma sát
Độ rộng của các BSN là 0,2 [ms-1]. Do vậy, BSN này phải được luyện tại một
gia tốc tham chiếu thỏa mãn:
2
1
4.10
0192.0
2.0
ms
s
ms
tr
(3.15)
- BSN quán tính: BSN này phải học một hàm tuyến tính đơn giản
rmL .
Tín hiệu truyền thẳng này có thể được tạo ra bằng cách chỉ sử dụng 3
B-Spline được định nghĩa trong khoảng
22 5,5 msms
Hình 3.17: Phân bố B-Spline của BSN quán tính
Bước 5: Chọn tỷ lệ học
Trong các thí nghiệm này, tỷ lệ học được chọn khá nhỏ ví dụ 0,1
Bước 6: Luyện hệ thống LFFC
Do LFFC bao gồm nhiều BSN nên một loạt các thí nghiệm luyện mạng cần phải
được lựa chọn trong đó mỗi một BSN được luyện một cách riêng biệt. Các
chuyển động tham chiếu phải được lựa chọn sao cho tín hiệu truyền thẳng mong
0.14 [cm]
0
1
0.5
μ
r[ms-1]
.
-5
0
1
0.5
μ
5 0
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
53
muốn của một trong các BSN chưa luyện (được gay ra bởi một hiện tượng vật
lý) trở thành nổi bật. Áp dụng cho LiMMS, BSN đầu tiên dược luyện là cogging
BSN. Nhờ lựa chọn một chuyển động tham chiếu sao cho có một vận tốc thấp và
gia tốc thấp làm cho ảnh hưởng của ma sát nhớt và quán tính trở nên nhỏ. Đối
với chuyển động tham chiếu này, ảnh hưởng vật lý quan trọng là cogging, ma sát
coulomb và stiction. Do vậy tồn tại hai BSN cogging, một cho vận tốc dương và
một cho vận tốc âm, chúng cũng có thể học để bù ma sát coulomb.
Hình 3.18: Luyện chuyển động cho các cogging BSN
Sau khi áp dụng cho các thực nghiệm luyện mạng kể trên, các kết quả cảu ánh xạ
đầu vào đầu ra cho các BSN riêng biệt được thể hiện trong hình vẽ 3.19 sau đây.
Có thể thấy rõ rằng ánh xạ này bao gồm các thành phần hình sin thay thế cho
cogging và song song thây thế cho ma sát coulomb. Xuất phát từ sự thực rằng
r[m] r[ms-1]
.
0.015
0
-0.015
0 40 80
t[s]
0 40 80
t[s]
0 40 80
t[s]
r[ms-2]
. . 0.04
0
-0.04
0
-0.3
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
54
các phần hình sin của tín hiệu truyền thẳng là khác nhau, chúng ta đi đến kết luận
là các đặc tính cogging thực sự phụ thuộc vào chiều chuyển động.
Hình 3.19 a, Ánh xạ vào ra của cogging BSN với vận tốc dương
b. Ánh xạ vào ra của cogging BSN với vận tốc âm
Tiếp theo, các BSN gia tốc được luyện. Do cogging và ma sát colum đã được bù
bởi các cogging BSN, chuyển động tham chiếu sẽ được chọn sao cho ảnh hưởng
của ma sát nhớt là nhỏ. Điều này có thể được thực hiện bằng cách lựa chọn
chuyển động tham chiếu bao gồm một loạt các thay đổi gia tốc dương và âm
(xem hình 3.20)
Hình 3.20 Luyện chuyển động cho BSN quán tính
0.05
UF
0.015
0
-0.015
-0.3 0
r[m]
UF
0.015
0
-0.015
-0.3 0
r[m]
r[10 -3m] r[ms
-1]
. 0.03
0
-0.03
0 0.1 0.2
t[s]
0 0.1 0.2
t[s]
0 0.1 0.2
t[s]
r[ms-2]
. . 2
0
-2
-1
0
-0.5
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
55
Hình 3.21 chỉ ra các kết quả của quan hệ vào ra của BSN. Nó giống như quan hệ
vào ra mong muốn có nghĩa là một hàm tuyến tính đi qua gốc tọa độ.
Hình 3.21: ánh xạ vào ra của BSN quán tính
Cuối cùng, BSN ma sát được luyện. Do tất cả các hiện tượng khác đã được thay
thế cho bất kỳ loại chuyển động tham chiếu nào có thể áp dụng. Để thay thế ma
sát một cách chính xác, chúng ta chọn luyện BSN ma sát qua hai gian đoạn.
Chuyển động tham chiếu trong thí nghiệm đầu tiên sẽ bao gồm một dải rộng tốc
độ, xem hình 3.22
Hình 3.22 Chuyển động luyện đầu tiên cho BSN vận tốc
UF
0.1
0
-0.1
-2 2 0
r[ms-2]
..
t[s]
r[m] r[ms
-1]
. 0.8
0
-0.8
0 1 2
t[s]
0 1 2
0 1 2
t[s]
r[ms-2]
. . 1.5
0
-1.5
-0.3
0
-0.15
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
56
Trong chuyển động tham chiếu trên, vận tốc tham chiếu chỉ là nhỏ trong một thời
gian ngắn. LFFC có thể sẽ không học để thay thế một cách chính xác cho ma sát
ở vận tốc thấp. Do vậy, chuyển động tham chiếu thứ 2 được sử dụng trong đó
vận tốc tham chiếu là nhỏ.
Hình 3.23: Huấn luyện BSN cho velocity
Khi nhìn vào ánh xạ vào ra của BSN ma sát (Hình 3.24a), ta có thể thấy rằng. Hệ
thống không thay thế ma sát một cách chính xác ở các vận tốc cao. Tại các vận
tốc trung bình, ma sát nhớt xuất hiện có dạng tuyến tính. Hình 3.24b cho thấy
ánh xạ vào ra của BSN quán tính
Hình 3.24: Ánh xạ vào ra của BSN ma sát
t[s]
r[m] r[ms
-1]
.
0.15
0
-0.15
0 5 10
t[s]
0 5 10
0 5 10
t[s]
r[ms-2]
. . 1.5
0
-1.5
-0.3
0
-0.15
UF
0.04
0
-0.04
-0.8 0.8 0 .
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
57
3.2.5. Các thực nghiệm kiểm chứng
Trong phần này,hoạt động của LFFC tối giản được kiểm chứng. Điều này được
thực hiện bằng cách đưa ra 3 chuyển động tham chiếu mà LFFC chưa được
luyện. Chúng ta sẽ so sánh hoạt động bám điều khiển của LFFC tối giản với hoạt
động bám của bộ điều khiển phản hồi và một hệ thống Time-indexed LFFC.
Thí nghiệm 3.6 (Chuyển động kiểm chứng 1)
Chuyển động kiểm chứng đầu tiên là chuyển động với vận tốc thấp (hình 3.25).
Hình 3.25: Chuyển động kiểm chứng 1: vận tốc thấp
Chuyển động đánh giá này được thực hiện bởi một Time-indexed LFFC trong đó
độ rộng của các B-Spline là 0,04 [s]. Trong hình 3.26 chi thấy hoạt động bám
của bộ điều khiển (chú ý các tỷ lệ khác).
r[ms-1]
r[m] r[ms
-1]
.
0.075
0
-0.075
0 5 10
t[s]
0 5 10
0 5 10
t[s]
r[ms-2]
. . 1.5
0
-1.5
-0.2
0
-0.1
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
58
Hình 3.26 a, Sai số bám của bộ điều khiển phản hồi
b , Sai số bám của bộ điều khiển tối giản
c, Sai số bám của bộ điều khiển Time-indexed LFFC (d=0,04 s)
Bộ LFFC tối giản đạt được một sai số bám nhỏ hơn 10 lần so với sai số bám
của bộ điều khiển phản hồi. Hình 3.26b cho thấy sai số bám có thành phần song
song dạng tương tự như vận tốc tham chiếu . Điều này là do ma sát. Rõ ràng,
BSN ma sát không bù đắp hết được ma sát. Thêm vào đó, một thành phần hình
sin xuất hiện trong sai số bám có thể là do cogging BSN không được luyện đúng
hoặc có một hiện tượng khác, một số lỗi có thể trong quá trình thay thế cũng dẫn
đến một sai số bám tương tự.
Hệ thống Time-indexed LFFC cho thấy có sai số bám nhỏ hơn so với LFFC tối
giản do tín hiệu truyền thẳng của Time-indexed LFFC đã hội tụ. Chúng ta giả sử
rằng các hiện tượng được bù đắp có thể tái sinh. Chúng ta kết luận rằng hoặc các
BSN của LFFC tối giản không được luyên đủ chính xác hoặc có một hiện tượng
tồn tại mà không được thay thế bởi tập BSN này. Do sai số bám là khá nhỏ hơn
e[10 -4m]
0 5 10 t[s]
-4
4
0
e[10 -5m]
0 5 10 t[s]
-4
4
0
e[10 -5m]
0 5 10 t[s]
-4
4
0
a, b,
c,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
59
so với biên độ của phần hình sin trong sai số bám sau quá trình luyện cogging
BSN (hình minh họa không được đưa vào luận văn này) nên kết luận sau có độ
chính xác cao hơn.
Thí nghiệm 3.7 (Chuyển động kiểm chứng 2)
Vị trí tham chiếu, vận tốc và gia tốc của chuyển động tham chiếu thứ 2 được
trình bày trong hình 3.27.
Hình3.27: Chuyển động đánh giá 2: Tốc độ trung bình
Kết quả của sai số bám được chỉ ra trong hình dưới đây.
r[m] r[ms-1]
. 0.03
0
-0.03
0 1 2
t[s]
0 0.2
t[s]
0 1
2 t[s]
r[ms-2]
. . 2
0
-2
-0.1
0
-0.05
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
60
Hình 3.28 a, Sai số bám của khâu điều khiển chỉ sử dụng phản hồi
b, Sai số bám của LFFC tối giản
c, Sai số bám của Time-indexed LFFC (d=0,04s)
Trong trường hợp này sai số của LFFC tối giản cũng lại nhỏ hơn 10 lần so với
sai số bám của bộ điều khiển phản hồi. Kết luận rằng có một hiện tượng khác
ngoài cogging làm cho sai số bám vẫn còn gợn sóng được khẳng định trong hình
3.28b. Biên độ trung bình của phần gợn sóng trong sai số bám tăng có nghĩa là
nhiễu phụ thuộc vào tốc độ của LiMMS. Sai số bám nhỏ nhất có thể đạt được khi
sử dụng Time-indexed LFFC
Thí nghiệm 3.8 (Chuyển động kiểm chứng 3)
Chuyển động đáng giá cuối cùng được giới thiệu trong hình 3.29
e[10 -4m]
0 1 2
t[s]
-4
4
0
e[10 -5m]
0 1 2
t[s]
-4
4
0
e[10 -5m]
0 1 2
t[s]
-4
4
0
a, b,
c,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
61
Hình 3.29: Chuyển động kiểm chứng 3: tốc độ nhanh
Hình 3.30 cho thấy các kết quả của sai số bám
Hình 3.30: a, Sai số bám của khâu điều khiển chỉ sử dụng phản hồi
b, Sai số bám của LFFC tối giản
c, Sai số bám của Time-indexed LFFC (d=0,03s)
r[m] r[ms-1]
.
0.5
0
-0.5
0 1 2
t[s]
0 0.2
t[s]
0 1
2 t[s]
r[ms-2]
. . 2
0
-2
-0.15
0
-0.075
a,
b,
c,
e[10 -4m]
0 1 2 t[s]
-4
4
0
e[10 -5m]
0 1 2 t[s]
-4
4
0
e[10 -5m]
0 1 2 t[s]
-4
4
0
a, b,
c,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
62
Hình 3.30 chỉ ra rằng sai số bám lớn tại các điểm theo thời gian mà vận tốc bằng
0. chúng ta kết luận rằng LFFC tối giản không thể bù đắp được stiction được
phát sinh trên cơ sở của quan hệ vào ra của BSN vận tốc (3.24). Như các trường
hợp trước, sai số bám của Time-indexed LFFC là nhỏ nhất.
3.2.6. Kết luận
Các thí nghiệm sử dụng Time-indexed LFFC đã được thực hiện nhằm kiểm
chứng các điều kiện ổn định được thực hiện ở chương 2. Các kết quả của các thí
nghiệm này tương tự như kết quả của các quá trình mô phỏng. Điều này có nghĩa
là giá trị của dmin là chính xác trong khi tỷ lệ học cực đại là một giá trị khá thấp.
Bất chấp giá trị thấp của tỷ lệ học cực đại, quá trình học hội tụ sau một số chu kỳ
hoạt động giới hạn (thông thường từ 10 đến 15) .
Một LFFC tối giản đã được thiết kế cho LiMMS. Để luyện LFFC tối giản, một
số các thí nghiệm luyện được lựa chọn. Các thí nghiệm mà không được đề cập
trong luận văn này cho thấy rằng qua trình luyện LFFC tối giản cần được thực
hiện một cách cẩn thận. Lựa chọn một chuyển động luyện không phù hợp sẽ làm
cho BSN xấp xỉ đến tín hiệu truyền thẳng sai. Tất cả các BSN được luyện sau đó
cũng cho một tín hiệu truyền thẳng co lỗi. Sau quá trình luyện quan hệ vào ra của
BSN phải được kiểm tra để đảm bảo rằng nó không xấp xỉ (một phần) một tín
hiệu truyền thẳng của một BSN khác trong LFFC tối giản. Các chuyển động
luyện mạng được thực hiện trong chương này cho kết quả là một LFFC tối giản
có thể đạt được sai số nhỏ hơn 10 lần so với bộ điều khiển phản hồi. Time-
indexed LFFC cho thấy còn đem lại sai số bám thậm chí nhỏ hơn so với LFFC
tối giản. Điều này là do một hiện tượng khác ngoài các hiện tượng quan tâm rong
phần lựa chọn cấu trúc của BSN.
3.3. Kết quả mô phỏng bằng phần mềm 20-sim.
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
63
3.3.1. Bộ điều khiển feedback.
a. Sơ đồ mô phỏng :
Hình 3.31: Sơ đồ mô phỏng hệ thống khi chỉ có FeedBack.
b.Kết quả mô phỏng:
Learning feed-forward control
-0.05
0
0.05
0.1
Reference [m]
-0.05
0
0.05
0.1
ProcessOutput [m]
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
64
Hình 3.32: Kết quả mô phỏng hệ thống khi chỉ có Feedback tham gia
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
65
3.3.2. LFFC khi có ViscouNeural.
a. Sơ đồ mô phỏng :
Hình 3.33: Sơ đồ mô phỏng
b, So sánh kết quả mô phỏng.
Hình 3.34: So sánh kết quả mô phỏng lực Viscou tạo ra và lực Viscou thật.
a, Lực Viscou được tạo ra
a,
b,
Learning feed-forward control
-0.6
-0.4
-0.2
0
0.2
0.4
Estimated viscous force [N]
50 55 60 65 70
time {s}
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
True viscous force [N] {m/s}
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
66
b, Lực Viscou thật
Vai trò của bù lực Viscou được thể hiện rõ ràng bằng cách so sánh kết quả mô
phỏng như được chỉ ra trong Hình 3.35a và Hình 3.35b. Khi BSN Viscou được
sử dụng, tín hiệu error được giảm đáng kể.
Hình 3.35: So sánh kết quả mô phỏng error trước và sau khi có bù lực Viscou.
a, Khi chỉ có Feedback
b, Khi có thêm bù lực Viscou
3.3.3. LFFC khi có CoulombNeural và ViscouNeural.
a. Sơ đồ mô phỏng :
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Le ning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
a, b,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
67
Hình 3.36: Sơ đồ mô phỏng
b. So sánh kết qủa mô phỏng:
Hình 3.37: So sánh kết quả mô phỏng lực Coulomb được tạo ra và lực Coulomb
thật.
a, Lực Coulomb thực
b, Lực Coulomb được tạo ra
Vai trò của CoulombNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô
phỏng của tín hiệu error như được chỉ ra trong Hình 3.38a và Hình 3.38b.
Hình 3.38: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù
lực Coulomb.
a, Khi chỉ có Feedback và NeuralViscou
0
Learning feed-forward control
-0.25
-0.15
-0.05
0.05
0.15 True coulomb force [N]
16 17 18 19 20 21 22
time {s}
-2
-1
0
1
2 Estimated coulomb force [N] {N}
0.
4
0.2
0
-0.2
0 -0.4
-0.4
-0.2
0
0.2
0.4
a,
b,
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Le ning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
68
b, Khi có thêm bù lực Coulomb
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
69
3.3.4. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural.
a. Sơ đồ mô phỏng :
Hình 3.39: Sơ đồ mô phỏng
b. So sánh kết quá mô phỏng:
Hình 3.40: So sánh kết quả mô phỏng tín hiệu lực Cogging được tạo ra và lực
Cogging thật.
a, Lực Cogging thật
b, Lực Cogging được tạo ra
Learning feed-forward control
-0.3
-0.2
-0.1
0
0.1
0.2
True cogging force [N]
93 94 95 96 97 98 99 100
time {s}
-0.2
-0.1
0
0.1
0.2 Estimated cogging force [N]
a,
b,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
70
Vai trò của CoggingNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô
phỏng của tín hiệu error như được chỉ ra trong Hình 3.41a và Hình 3.41b.
Hình 3.41: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù
lực Cogging.
a, Khi chỉ có Feedback và ViscouNeural, CoulombNeural.
b, Khi có thêm tín hiệu bù lực Cogging.
3.3.5. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural,
InertialNeural.
a. Sơ đồ mô phỏng :
Hình 3.42: Sơ đồ mô phỏng
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Le ning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
a, b,
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
71
b. So sánh kết quá mô phỏng:
Hình 3.43: So sánh kết quả mô phỏng lực Inertia được tạo ra và lực Inertia
thật.
a, Lực Inertia được tạo ra.
b, Lực Inertia thật.
Vai trò của InertiaNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô
phỏng của tín hiệu error như được chỉ ra trong Hình 3.43a và Hình 3.43b.
Hình 3.44: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù lực
Inertia.
a, Khi chỉ có Feedback và ViscouNeural, CoulombNeural, CoggingNeural
b, Khi có thêm tín hiệu bù lực Inertia.
Learning feed-forward control
-0.6
-0.4
-0.2
0
0.2
0.4 Estimated inertia force [N]
10 15 20 25 30
time {s}
-0.4
-0.2
0
0.2
0.4
0.6 True inertia force [N] {m/s}
a,
b,
Le rning fe d-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Chương 3: Thiết kế ứng dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
72
So sánh kết quả mô phỏng tín hiệu error khi bộ điều khiển chỉ có Feedback và
khi có LFFC tham gia.
Hình 3.45: So sánh kết quả mô phỏng tín hiệu error khi bộ điều khiển chỉ có
Feedback và khi có LFFC tham gia
a, Khi chỉ có Feedback
b, Khi có thêm tín hiệu bù lực Viscou, lực Coulomb, lực Cogging lực Inertia
Learning feed-forward control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
Learning feed-forw rd control
0 10 20 30 40 50 60 70 80 90 100
time {s}
-0.001
-0.0005
0
0.0005
0.001
PositionError [m]
a, b,
Chương 4: Kết luận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
71
Chương 4: KẾT LUẬN
Trong Chương 1, đưa ra khái niệm của LFFC, đó là một bộ điều khiển học
có phản hồi sai số trong đó phần truyền thẳng là một mạng B-Spline (BSN). Vấn
đề quan trọng là phải thiết kế phần truyền thẳng của LFFC sao cho quá trình học
là hội tụ và cùng với đó là phải làm sao cho bậc của hệ thống phải được giữ ở
mức tối thiểu. Đây là hai chủ đề chính được đề cập đến trong luận văn.
Trong Chương 2 và 3, đề cập đến bộ điều khiển LFFC phụ thuộc thời
gian, là bộ điều khiển mà thời gian chuyển động theo chu kỳ là đầu vào duy nhất
của BSN. Trong trường hợp này, LFFC tương tự như điều khiển học lặp lại và
điều khiển lặp lại. Do vậy, em đưa ra ý tưởng sử dụng các kết quả hội tụ của điều
khiển học lặp lại và điều khiển lặp lại trong quá trình thiết lập LFFC.
Trong điều khiển học lặp lại và điều khiển lặp lại phần truyền thẳng được
thiết kế như một vòng lặp có nhớ. Thay vì luyện phần truyền thẳng bởi đầu ra của
bộ điều khiển phản hồi, tín hiệu học có thể nhận được bằng cách lọc sai số bám
nhờ một bộ lọc có khả năng học. Bộ lọc này được thiết kế dựa trên một mô hình
gần đúng của hệ thống bị điều khiển. Phân tích về độ ổn định cho thấy rằng các
yếu tố động học tần số cao không mô hình hóa được sẽ làm cho tín hiệu truyền
thẳng của điều khiển học lặp lại và RC không hội tụ. Quá trình hội tụ có thể đạt
được bằng việc điều chỉnh vòng lặp có nhớ theo cách thức sao cho các thành
phần tần số làm cho mô hình của hệ thống bị điều khiển (kéo theo bộ lọc có khả
năng học) trở nên không chính xác sẽ bị loại bỏ.
LFFC phụ thuộc thời gian có thể được xem như là một loại điều khiển học
lặp lại / điều khiển lặp lại trong đó quá trình học được ổn định hóa nhờ thay thế
vòng lặp có nhớ bởi một BSN và phần điều khiển phản hồi được sử dụng như là
một bộ lọc có học. Các thành phần tần số trong quan hệ vào ra của một BSN phụ
thuộc vào độ rộng của miền xác định của B-Spline. Chọn độ rộng lớn sẽ ảnh
hưởng đến tín hiệu truyền thẳng tần số thấp, trong khi đó độ rộng nhỏ sẽ tác động
đến tín hiệu truyền thẳng tần số cao. Do vậy, các kết quả thu được từ điều khiển
Chương 4: Kết luận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
72
học lặp lại và điều khiển lặp lại cho ta thấy rằng quá trình học có thể được ổn
định bằng cách chọn độ rộng của miền xác định của B-spline sao cho BSN không
thể xấp xỉ thành phần tần số cao của tín hiệu học. Nhờ các giả định nghiêm ngặt
(một trong số đó là hệ thống điều khiển phải là SISO LTI-Hệ thống tuyến tính
bất biến một đầu vào một đầu ra) , chúng ta có thể mô tả một cách định lượng :
chúng ta đưa ra các điều kiện ổn định cho độ rộng tối thiểu của miền xác định
của các B-Spline, dmin, và cho tỷ lệ học tối đa. Các yếu tố ổn định này được kiểm
chứng nhờ các quá trình mô phỏng. Trong luận văn này, LFFC phụ thuộc thời
gian được áp dụng cho LiMMS. Do LiMMS là hệ thống phi tuyến, nó không thỏa
mãn giả thiết cho việc phân tích sự ổn định. Bất chấp điều này, các kết quả trong
quá trình mô phỏng cho thấy giá trị dmin là chính xác và tỷ lệ học tối đa cũng ổn
định.
Đối với các chuyển động đặt trước ngẫu nhiên, LFFC phụ thời gian không
thể áp dụng được. Thay vào đó phải sử dụng hệ thống LFFC phụ thuộc quỹ đạo,
có nghĩa là tín hiệu đặt trước cùng với đạo hàm hoặc tích phân của nó được sử
dụng như là các đầu vào của phần truyền thẳng.
Chúng ta không thể đưa ra các điều kiện ổn định cho quá trình thiết kế các
tham số của một BSN trong LFFC phụ thuộc quỹ đạo. Trong một số trường hợp
(ví dụ như khi vận tốc đặt trước là không đổi), các điều kiện ổn định của LFFC
phụ thuộc thời gian có thể được chuyển thành các điều kiện ổn định cho LFFC
phụ thuộc quỹ đạo. Về bản chất có thể nói rằng miền xác định của các B-Spline
(đa chiều) pahỉ chứ tối thiểu dmin [s] của chuyển động đặt trước. Thiết kế một
phân bố B-Spline thỏa mãn điều kiện này là rất khó và sẽ dần đến độ rộng B-
Spline lớn, điều này làm cho vấn đề trở nên không hấp dẫn.
Do vậy, một cách tiếp cận khác được xem xét. Chúng ta giả sử chọn một
phân bố B-Spline mà không quan tâm đến các điều kiện ổn định và thêm một tiêu
chuẩn ổn định hóa vào LFFC để làm cho quá trình học hội tụ. Một trong những
sự lựa chọn để thực hiện vấn để này là tối thiểu hóa hàm lượng giá nhờ cơ chế
Chương 4: Kết luận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
73
học. Đây là một kỹ thuật nổi tiếng trong mô hình mạng mờ nơron và được gọi là
kỹ thuật tối giản. Tuy nhiên, thực tế cho thấy rất khó để chọn các tham số của cơ
chế học tối giản sao cho LFFC hội tụ. Do đó, một sự lựa chọn khác được đưa ra,
lại bắt nguồn từ điều khiển học lặp lại. Việc tối giản được thực hiện nhờ việc lọc
tín hiệu học của LFFC thay vì thay đổi cơ chế học. Ý tưởng chủ đạo là quá trình
học hội tụ khi tín hiệu học được đảm bảo sao cho tất cả các thành phần tần số cao
trên dmin
-1[Hz] bị loại bỏ. Điều này (ví dụ) có thể đạt được nhờ kỹ thuật lọc với
một BSN phụ thuộc thời gian phù hợp. Các kết quả mô phỏng xác nhận rằng
bằng cách thêm một bộ lọc như vậy, sự hội tụ của LFFC phụ thuộc quỹ đạo có
thể đạt được. Tuy nhiên, vẫn chưa có các phân tích khoa học nhằm giải thích
được các kết quả quan sát.
Các đầu vào đặc biệt nào sẽ được lựa chọn trong trường hợp một LFFC
phụ thuộc quỹ đạo được xây dựng dựa trên cơ sở biểu diễn không gian trạng thái
(chính xác về cấu trúc) của một hệ động học. chúng ta đã chỉ ra rằng một đối
tượng chỉ có thể được điều khiển nhờ một LFFC phụ thuộc quỹ đạo khi biểu diễn
không gian trang thái thảo mãn một số điều kiện. Do vậy, LiMMS có thể được
điều khiển bởi LFFC phụ thuộc quỹ đạo.
Khi các đầu vào của BSN được chọn thẳng dựa trên cơ sở của mô hình đối
tượng sẽ cho ta một BSN đa chiều. Điều này dẫn đến vấn đề liên quan đến bậc
của hệ thống. Mô hình mờ nơron cho thấy vấn đề này có thể được giải quyết
bằng cách chia BSN đa chiều thành vài BSN có số chiều nhỏ hơn. Điều này được
thực hiện dựa trên một cơ sở được gọi là biểu diễn phân ly các biến của một hàm
số. Các kết quả lựa chọ BSN được biết đến như là một cấu trúc mạng suy biến.
Cùng với vấn đề này, một LFFC phụ thuộc quỹ đạo được gọi là suy biến khi nó
bao gồm nhiều khâu truyền thẳng thay vì một. Một cách thứ 2 (kém hiệu quả
hơn) nhằm giảm thiểu bậc cảu hệ thống là chọn các phân bố B-Spline với càng ít
B-Spline càng tốt. Có một vài phương pháp được xem xét khi thiết kế một LFFC
suy biến.
Chương 4: Kết luận
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
74
Luyện một LFFC suy biến không pahỉ là quá trình truyền thẳng. Khi tất cả
các BSN được luyện đồng thời, không có gì đảm bảo rằng mỗi BSN sẽ học được
đúng tín hiệu truyền thẳng của nó. Do vậy, chúng ta đưa ra một phương pháp
luyện một LFFC hiệu quả, có nghĩa là bằng cách chọn một chuỗi các chuyển
động luyện mạng nhờ đó các BSN được luyện một cách chính xác. Tuy nhiên,
phương pháp này trong thực tế được gọi là phương pháp luyện mạng có chiến
lược vẫn khá chủ quan, dựa trên kinh nghiệm.
Các thủ tục thiết kế cho LFFC được tính toán và áp dụng trong các thí
nghiệm thực tế cho điều khiển LiMMS. Trong đó, LiMMS được điều khiển bởi
một LFFC phụ thuộc thời gian cũng như bởi một LFFC. Trong một loạt các thí
nghiệm ban đầu sử dụng LFFC phụ thuộc thời gian, các điều kiện ổn định được
kiểm chứng. Kết quả của các thí nghiệm này tương tự như kết quả trong phần mô
phỏng điều này có nghĩa là giá trị của dmin là chính xác trong khi tỷ lệ học cực đại
khá ổn định. Tiếp đó, phân bố B-Spline của LFFC phụ thuộc thời gian được tối
ưu. Cuối cùng một LFFC suy biến được thiết kế và kiểm chứng. Phần truyền
thẳng bao gồm 3 BSN bù quán tính, ma sát và cogging. Sau khi tiến hành các thí
nghiệm luyện mạng có chiến lược, LFFC suy biến đạt được một sai số bám nhỏ
đối với một dải lớn các chuyển động tham chiếu. Tuy nhiên, đối với các chuyển
động lặp lại thì LFFC phụ thuộc thời gian là ưu việt hơn cả.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 1
Chương 1: GIỚI THIỆU
1.1. Tổng quan về Learning control (LC).
Một trong số các công cụ cạnh tranh mà các hãng sản xuất tuỳ ý sử dụng đó là
chất lượng của sản phẩm. Đặc biệt là trong các thị trường có liên quan đến các sản
phẩm công nghệ cao. Đó là một trong những nhân tố quan trọng mang tính sống còn
để tạo ra các sản phẩm có chất lượng tốt hơn. Điều này được nhìn nhận trong thị
trường đối với các sản phẩm mà chúng ta sẽ xem xét trong luận văn này, ví dụ như
các hệ thống chuyển động cơ điện tử. Theo quan điểm cơ điện tử, chất lượng của các
hệ thống cơ điện tử có thể được cải tiến bằng việc thay đổi thiết kế cơ khí và bộ điều
khiển. Ví dụ như khi nghiên cứu các cánh tay robot, nơi mà chuyển động chính xác
phụ thuộc vào độ cứng và quán tính của hệ thống. Nếu cánh tay không đạt được các
yêu cầu nhất định, độ cứng của nó có thể được tăng lên hoặc quán tính của nó có thể
được giảm bớt bằng cách thay đổi kết cấu cơ khí hoặc bằng việc ứng dụng vật liệu
mới.
Việc thay đổi bộ điều khiển có thể được thực hiện hoặc bằng cách thay đổi
thông số của bộ điều khiển đang tồn tại hoặc bằng cách thiết kế bộ điều khiển mới.
Khi một bộ điều khiển được cải tiến, chỉ đơn thuần là yêu cầu thay đổi phần mềm và
trong một số trường hợp là thêm các sensor cách đánh giá này tương đối dễ dàng
thực hiện được, khi đem so sánh với các cấu trúc tương ứng. Trong luận văn này
chúng ta sẽ tập trung vào việc nâng cao chất lượng của hệ thống bằng bộ điều khiển.
Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình của
một đối tượng. Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ điều
khiển càng hiệu quả bấy nhiêu. Khi mô hình hoá đối tượng, các vấn đề sau có thể
gặp phải:
1. Hệ thống quá phức tạp để có thể hiểu hoặc trình bày một cách đơn giản.
2. Mô hình quá khó hoặc quá đắt để đánh giá. Một số đặc tính của một số hiệu ứng
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 2
(phi tuyến) khó có thể đạt được, ví dụ như ma sát…
3. Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điều này
khó dự đoán trước được.
4. Các thông số của đối tượng có thể biến đổi theo thời gian.
Bộ điều khiển thích nghi có thể là một giải pháp khi cấu trúc của mô hình
động học của đối tượng và nhiễu mô hình tác động lên nó được biết trước trong khi
các giá trị của các thông số thì không thể xác định được. Khi mô hình không có giá
trị hoặc có nhiều thông số không xác định được thì lúc đó điều khiển học sẽ được xét
đến.
1,2 Learning Control (LC) là gì ?
Các bộ LC thường được hình dung gần giống như là hệ thống điều khiển của
con người và do đó nó có các thuộc tính giống với con người. Trong luận văn này
không nghiên cứu các bộ LC theo quan điểm sinh học, nhưng đồng ý với một số
định nghĩa sau:
Định nghĩa 1.1 (LC) Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1 hàm
xấp xỉ các ánh xạ đầu vào - đầu ra tương ứng trong suốt quá trình điều khiển mà một
hoạt động mong muốn của hệ thống điều khiển đạt được.
Định nghĩa 1.2 (Hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác định
bởi một hàm đươc lựa chọn
.,F
, với các véc tơ thông số
được lựa chọn để hàm
.F
được xấp xỉ “tốt nhất”.
Lưu ý 1.1 (Điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều khiển
thích nghi có thể được xem xét giống như là một dạng của LC trong đó một hàm
xấp xỉ được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của các hàm mục tiêu. Nói
chung, một bộ LC sẽ bao gồm một hàm xấp xỉ cho một lớp đối tượng có nhiều hàm
mục tiêu hơn.
Một biến mở rộng của các hàm xấp xỉ có thể được sử dụng như mạng nơron, mạng
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 3
mờ-nơron (cũng được biết đến với tên các bộ điều khiển logic mờ thích nghi)..v..v..
Nói một cách sơ bộ, các bộ hàm xấp xỉ có thể được sử dụng theo 2 cách:
Trước hết, hàm xấp xỉ có thể được sử dụng để tạo (một phần) tín hiệu điều
khiển. Việc học được thay thế bởi việc thích nghi vectơ thông số của hàm xấp xỉ
theo cách mà một số các hàm giá trị chứa đựng sai lệch điều khiển là cực tiểu. Bộ
điều khiển này được gọi là LC trực tiếp.
Thứ hai, Hàm xấp xỉ có thể được sử dụng để học một mô hình đối tượng tương
ứng được kiểm soát ví dụ như là để làm giảm hàm giá trị của sai số dự báo. Dựa trên
cơ sở của mô hình đã được học một bộ điều khiển được xây dựng, Bộ điều khiển này
được gọi là LC gián tiếp.
Từ khi bộ LC đầu tiên được phát triển vào năm (1963) cho tới nay, lĩnh vực LC
đã và đang phát triển rất rộng rãi. Rất nhiều các cấu trúc của bộ điều khiển khác
nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ
đã được phân tích cả trong thực tế và lý thuyết. Tuy nhiên, mặc dù tất cả chúng đều
được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong các sản phẩm
mang tính thương mại. Có thể vì những lí do sau đây:
Việc chứng minh sự ổn định được đánh giá cao. Phần lớn các nghiên cứu lý
thuyết của các bộ LC được tập trung vào tính ổn định. Tuy nhiên, một bộ LC ổn
định cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt …….Hoạt động
của bộ LC đối với một con robot đã được quan sát bằng cách mô phỏng. Sau khi
thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8. Khi
tiếp tục tự học, sai số hiệu chỉnh đã tăng lên đến hệ số 1051 tại bước lặp thứ 62.000
và cuối cùng giảm xuống hệ số 10-18 tại bước lặp thứ 250.000. Như vậy, mặc dù thực
tế cuối cùng sai số hiệu chỉnh nhỏ đã đạt được nhưng bộ LC không có giá trị thực
nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa.
Không nên quá quan tâm tới sai số hiệu chỉnh điểm 0. Một số LC cố gắng đạt
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 4
được sai số hiệu chỉnh điểm 0. Tuy nhiên, điều này yêu cầu có những tín hiệu điều
khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây nguy
hiểm cho các cơ cấu chấp hành và nói chung là không đạt được như mong muốn.
Loại sai số của hàm xấp xỉ. Trong đại đa số các bộ LC, hàm xấp xỉ được thực hiện
với vai trò như một mạng nơron (Multi Layer Perceptron MLP). Như chúng tôi sẽ
bàn tới ở dưới đây, loại mạng nơron này không tương thích một cách đặc biệt cho
việc điều khiển.
Trên cơ sở những suy xét này, chúng ta có thể đưa ra một số các thuộc tính sau
mà một bộ LC nên có để để trở thành một mặt hàng được ưa chuộng về mặt thương
mại:
Dễ dàng sử dụng trong một hệ thống điều khiển có sẵn. Điều này có nghĩa là
khi có một đáp ứng ngắn hạn học tốt, thì hiệu suất cực tiểu được bảo đảm. Ví dụ như
là trong một bộ điều khiển hiện nay. Thậm chí trong suốt quá trình huấn luyện đối
tượng vẫn có thể được duy trì trong quá trình vận hành, mà không gây ra những tổn
thất của quá trình sản suất.
Có khả năng sử dụng những kiến thức dự đoán của đối tượng. Nói chung các
nhà thiết kế và/hoặc người vận hành có một số kiến thức về đối tượng ví dụ như
trong cấu trúc của mô hình toán học (đơn giản) dưới dạng các hàm, một giản đồ
Bode của đối tượng hoặc một mô tả dưới dạng biến ngôn ngữ của hành vi đối tượng.
Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ điều
khiển, để chọn các thông số của bộ điều khiển hợp lý và để tăng tốc độ học.
Hàm xấp xỉ nên phù hợp cho việc điều khiển. Điều này có nghĩa rằng:
Không gian nhớ cần thiết cho việc thực hiên nên nhỏ. Trong thực tế, bộ điều
khiển được thực hiên bằng phần mềm được gắn vào máy tính. Dung lượng bộ nhớ là
có hạn. Do đó, số lượng các thông số của hàm xấp xỉ mà yêu cầu phải xấp xỉ tín hiệu
điều khiển không thể quá rộng.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 5
Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào / ra
phải được thực hiện một cách nhanh chóng. Trong môi trường thời gian thực, trong
một khoảng thời gian mẫu, các thông số của hàm xấp xỉ phải tương ứng và đầu ra
được tính. Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và
cho phép thời gian tính toán là rất ít. Các hàm xấp xỉ mà bao gồm một lượng lớn các
tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển.
Cơ chế học nên hội tụ nhanh. Để giữ được lượng thời gian trong đó quá trình
vận hành của hệ thống được điều khiển là cận tối ưu tới mức tối thiểu, cơ chế học
nên hội tụ nhanh.
Cơ chế học không nên bị tối thiểu cục bộ, khi bị lưu giữ trong mức tối thiểu
cục bộ, Thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm xấp
xỉ, được biểu thị bởi
loc
, sinh ra sai số xấp xỉ cực tiểu, được biểu thị bởi E(
loc
).
Mặc dù
locglob
tồn tại, làm cho
)()( locglob EE
. Trong ảnh 1.1 một ví dụ một
chiều của hiện tường như vậy được giới thiệu. Ở mức tối thiểu cục bộ,
loc
, độ
dốc của sai số xấp xỉ bằng 0. Cơ cấu học mà sử chỉ sử dụng độ dốc của sai số xấp xỉ
thì không thể thoát khỏi mức tối thiểu cục bộ.
Hình 1.1 Cực tiểu cục bộ trong kỹ thuật học
Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó để huấn luyện
LC để thu được hiệu quả cao.
E(ω)
Cùc tiÓu côc bé
Cùc tiÓu toµn bé
ωloc ωglob
w
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 6
Quan hệ vào/ ra phải tương thích một cách cục bộ. Trong một số hàm xấp xỉ,
quan hệ vào/ ra này là tương thích toàn cục. Điều này có nghĩa là nếu giá trị của một
trong các thông số của hàm xấp xỉ được tương thích, thì quan hệ vào /ra trên toàn bộ
phạm vi đầu vào bị thay đổi. Xét một bộ LC được huấn luyện để thực hiện một số
chuyển động. Khi bộ LC được huấn luyện để thực hiện một chuyển động mới, điều
này liên quan tới việc tương ứng các thông số của hàm xấp xỉ. Bởi vì mối quan hệ
vào ra được tương thích toàn cục nên các tín hiệu điều khiển học trước đó bị thay đổi
có thể gây ra nhưng tổn thất trong quá trình làm việc. Do đó điều mong đợi ở đây là
mối quan hệ vào ra của hàm xấp xỉ được tương thích một cách cục bộ. Trong trường
hợp này, việc học 1 chuyển động mới sẽ không làm thay đổi các tín hiệu đã được
học trước đó.
Hàm xấp xỉ có khả năng tự khái quát hoá tốt. Khả năng tự khái quát hoá là khả
năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong quá trình
huấn luyện nhưng nó tương tự như các huấn luyện mẫu. Khi hàm xấp xỉ có khả năng
khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho các chuyển
động tương tự các chuyển động được huấn luyện. Vì vậy nó đủ để huấn luyện LC
với một lượng nhỏ các đặc tính chuyển động huấn luyện. Khi bộ xấp xỉ không có
khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho mỗi chuyển động
quan trọng, nó tạo ra một quá trình huấn luyện mở rộng .
Sự mềm mại của giá trị xấp xỉ nên dễ dàng điều khiển. Như nói ở phần trước
đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín hiệu
điều khiển có tần số cao sẽ không mong muốn. Người sử dụng phải có khả năng
quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ.
Đáp ứng ngắn hạn là học tốt. Đáp ứng ngắn hạn của bộ LC nên là loại đáp ứng
mà có sai số bám dần hội tụ về giá trị mong muốn. Việc tăng sai số bám trong pha
trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là trường
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 7
hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều khiển
được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn.
Sự ổn định lâu dài cần phải được bảo đảm. Việc tự học có thể được thực hiện
một cách liên tục hoặc được thực hiện trước khi vận hành. Việc học liên tục được
yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình vận hành. Ví
dụ, do hao mòn hay chịu ảnh hưởng của môi trường. Trong trường hợp này, một bộ
điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các điều kiện vận
hành thay đổi như thế nào.
1.3. Bộ điều khiển học sai số phản hồi
Một bộ LC thú vị cho các cánh tay robot mà phải bám một cách ngẫu nhiên theo các
đường dẫn. Nói chung bộ điều khiển này được biết đến với cái tên là bộ điều khiển
học sai số phản hồi: Bộ điều khiển (Feedback Error Learning FEL).
Hệ thống LC bao gồm 2 phần:
Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ
uF = F(r). Một bộ điều khiển Feed-forward thông thường có thể được sử dụng để bù
thêm cho các hệ thống động học và theo cách này sẽ thu được độ bám chính xác
cao. Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo F = P-1, thì đầu
ra của đối tượng, y, sẽ bằng tín hiệu đặt , r.
Hình 1.2 Bộ điều khiển FEL
r
-
Hµm xÊp xØ
C
+ +
+
UF
P
y
r (n)
r
.
. .
.
.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 8
Đối tượng P, luôn chịu sự tác động của nhiễu. Các loại nhiễu ở bao gồm cả
nhiễu ngẫu nhiên và nhiễu có bản chất tái sinh. Những nhiễu tái sinh tái diễn giống
nhau khi một chuyển động cụ thể được lặp lại. Điều này có nghĩa rằng chúng có thể
được xem xét như một hàm trạng thái của đối tượng, x, xem hình 1.3.
Hình 1.3 đối tượng và nhiễu phát sinh
1.3.1. Một ví dụ về vị trí ma sát độc lập.
Giống như đối tượng động học, các nhiễu tái sinh có thể được bù bởi một bộ điều
khiển feed-forward.
Để bù chính xác cho hệ thống động học và nhiễu tái sinh, yêu cầu cần phải có
một mô hình chi tiết. Sự không chính xác về mô hình có thể làm cho bộ điều khiển
feed-forward vận hành kém. Khi một mô hình chính xác khó có thể xác định được,
thì một phương pháp thay thế có thể được thực hiện.
Thay vì đi thiết kế một bộ điều khiển feed-forward dựa trên những đặc điểm cơ
bản của mô hình thực hiện bộ điều khiển feed-forward giống như là một hàm xấp xỉ,
ví dụ như là
,F rFU
. Trong suốt quá trình điều khiển, quan hệ vào/ra của hàm
xấp xỉ được tự thích ứng để học các đối tượng nghịch đảo và để bù các nhiễu phát
sinh. Khó khăn chính ở đây là lựa chọn tín hiệu học mà chỉ ra được mối quan hệ
vào/ra của hàm xấp xỉ phải được tương thích như thế nào. Tín hiệu học có thể thu
được theo rất nhiều cách. Theo lý thuyết đã chứng minh chỉ ra rằng khi đầu ra của
u +
+
P
y
x
d(x)
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 9
F
bộ điều khiển phản hồi được sử dụng làm tín hiệu học (hình 1.2) thì quan hệ vào/ra
của hàm xấp xỉ hội tụ tới đối tượng nghịch đảo và giá trị bù của nhiễu tái sinh.
Loại hàm xấp xỉ mà chúng ta sử dụng ở đây là mạng nơron MLP.
93,3,3,2,2,2,1,1,1, Rr
T
ddddddddd
(1.1)
Trong trường hợp cánh tay 3 bậc tự do (Degrees Of Freedom DOF) sử dụng kinh
nghiệm, đầu vào của MLP bao gồm góc khớp đặt θd và đạo hàm bậc 1 bậc 2 của
chúng:
Trong khi đầu ra uF được xét dưới dạng lực xoắn động cơ; (công thức 1.2)
3321 Ru
T
F
(1.2)
Bộ điều khiển phản phản hồi. Như đã được nói tới, bộ điều khiển phản hồi
trạng thái, đem lại các tín hiệu học cho bộ điều khiển feed-forward. Hơn thế, nó xác
định quá trình bám cực tiểu tại thời điểm bắt đầu học. Cuối cùng, bộ điều khiển phản
hồi bù các nhiễu ngẫu nhiên.
Bộ điều khiển FEL đã được thực hiện trong nhiều ứng dụng của nhiều tác giả; ví dụ
như là:
- Hệ thống phanh tự động cho ôtô.
- Điều khiển hệ thống camera.
- Điều khiển cánh tay robot.
- Máy hàn.
Các ứng dụng chỉ ra rằng bộ điều khiển FEL đã cải thiện một cách rõ ràng dựa
trên quá trình vận hành của bộ điều khiển phản hồi và các ứng dụng này cũng chỉ ra
có thể thu được chất lượng bám cao mà không cần mô hình mở rộng. Cách hoạt
động của một bộ FEL được so sánh với cách hoạt động của hệ thống điều khiển
thích nghi. Kết luận rằng, trong trường hợp mô hình đối tượng chính xác được sử
dụng trong các hệ thống điều khiển thích nghi, quá trình bám của bộ điều khiển
thích nghi và của bộ điều khiển FEL là tương tự như nhau. Khi FEL hội tụ chậm hơn
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 10
bộ điều khiển thích nghi, trong tình huống này bộ điều khiển thích nghi được ưa
chuộng hơn. Tuy nhiên khi chưa có một mô hình đối tượng chính xác, thì bộ điều
khiển thích nghi sẽ không thể thu được hiệu suất bám như mong muốn. Bộ điều
khiển FEL không phải trải qua điều này và nó vẫn đem lại hệ số bám chính xác. Khả
năng này nâng cao giả thiết rằng bộ FEL có phù hợp cho hang loạt các ứng dụng mở
rộng khi trong thực tế các đối tượng thường khó có một mô hình chính xác. Câu hỏi
đặt ra là nếu xét về mặt thương mại thì nên sử dụng bộ điều khiển nào? Để trả lời
cho câu hỏi này chúng ra sẽ đi đánh giá xem bộ điều khiển FEL có đáp ứng được
đầy đủ các chỉ tiêu chất lượng mà ta đã đưa ra trong mục 1.2 hay không.
Dễ dàng sử dụng trên hệ thống điều khiển có sẵn. Sự mở rộng duy nhất đối với
hệ thống điều khiển có sẵn là hàm xấp xỉ. Khi hệ thống điều khiển được thực hiện
bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực hiện.
Sự hợp nhất các kiến thức quan trọng trong thiết kế. Khi cấu trúc của đối tượng
động học được xác định, thì mạng MLP trong bộ điều khiển feed-forward có thể
tách ra thành một vài mạng MLP nhỏ hơn. Mỗi một mạng con này sẽ bù cho một
phần riêng biệt của đối tượng động học. Những thí nghiệm đã chỉ ra rằng mạng này
đã nâng tốc độ học lên đáng kể.
Sự ổn định được xác lập. Điều này đã được chứng minh bằng lý thuyết rằng bộ
điều khiển FEL sử dụng cho điều khiển cánh tay robot cho kết quả hội tụ. Với các hệ
thống khác, sự ổn định chưa được xét đến trên phương diện lý thuyết.
Đáp ứng ngắn hạn tốt. Trong quá trình học, sai số bám sẽ dần hội tụ đến giá trị
cực tiểu của nó. Giống như sự ổn định, đáp ứng ngắn hạn cũng chưa được xét tới
trên phương diện lý thuyết.
Hàm xấp xỉ phù hợp cho việc điều khiển. Rất nhiều các giá trị thực của bộ một
LC phụ thuộc vào loại hàm xấp xỉ được sử dụng. Mặc dù thực tế là bộ điều khiển
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 11
FEL cũng đạt được chất lượng bám cao nhưng cách học không phải là tối ưu cho
mạng MLP.
Yêu cầu bộ nhớ nhỏ. Một trong số những thuộc tính tốt của MLP là nó có thể
xấp xỉ các hàm mục tiêu đa chiều với một số ít các thông số. Do đó tổng dung lượng
bộ nhớ của máy tính yêu cầu cho việc thực hiện là rất nhỏ.
Tốn kém cho việc tính toán giá trị. Việc tính toán đầu ra của mạng MLP và
trọng số của bộ thích nghi bao gồm một số lượng lớn các tính toán phức tạp. Do đó,
với một số ứng dụng điều khiển thời gian thực thì loại mạng mạng nơron này có thể
không phù hợp.
Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ. Cơ chế học dễ
dàng đạt được tại vùng giá trị cực tiểu cục bộ. Hàm trọng lượng của mạng kết thúc ở
vùng cực tiểu nào phụ thuộc vào hàm trọng lượng ban đầu của mạng. Do đó nó cần
phải thực hiện nhiều thử nghiệm huấn luyện mạng với các cài đặt hàm trọng lượng
ban đầu khác nhau, để thu được độ bám chính xác có thể chấp nhận được.
Có khả năng tổng quát hoá tốt. Một thuận lợi thực tế là mối quan hệ vào ra chỉ
có thể thích ứng toàn bộ đó là khi MLP có khả năng tổng quát tốt khi quá trình huấn
luyện được thực hiện một cách tổng thể. Khi một hệ thống chuyển động phải vận
hành ở tốc độ thấp, bộ điều khiển FEL có khuynh hướng đưa ra hiệu suất kém. Điều
này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương quan
với nhau ở mức cao. Khi các dữ liệu có tương quan với nhau ở mức cao, mạng có
khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là đưa ra khả năng
khái quát hoá kém.
Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn điều khiển được. Số lượng
các thông số của một bộ MLP quyết định tính chính xác cực đại của giá trị xấp xỉ.
Nó không đảm bảo được độ trơn tru nhất định. Nhờ việc học, mạng MLP có thể xấp
xỉ rất gần các hàm mục tiên trong phạm vi đầu vào và rất chính xác ở phần còn lại.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 12
Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà cách
học tốt, bộ điều khiển FEL có khả năng đáp ứng rất tốt. Các nghiên cứu khác nhau
nhằm mục đích khắc phục các vấn đề tồn tại của bộ điều khiển FEL. Theo đó ta sẽ
giới thiệu tóm lược 3 phương pháp: 2 phương pháp đầu thay đổi cấu trúc của bộ điều
khiển học. Trong khi ở phương pháp còn lại loại hàm xấp xỉ khác đựơc sử dụng.
Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn các
đầu vào khác nhau cho hàm xấp xỉ. Sai số tín hiệu được thêm vào như một đầu vào
của bộ xấp xỉ, điều này sẽ làm thay đổi bộ điều khiển LC từ chỗ hoàn toàn là 1 bộ
điều khiển feed-forward nguyên bản chuyển sang bộ điều khiển feed-forward (hình
1.4). Các thí nghiệm đã chỉ ra rằng bộ LC này khắc phục được một số lỗi của bộ
điều khiển FEL gốc.
Hình 1.4 Học theo sai số phản hồi.
Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một bộ
được huấn luyện để thực hiện một nhiệm vụ cụ thể. Một mạng neural giám sát học
xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào. Bộ LC này đã được
kiểm tra trên tay máy mà phải thực hiện các chuyển động với các đối tượng có trọng
lượng khác nhau. Sau khi học, mỗi bộ điều khiển feed-forward đã học sẽ phải đảm
r
-
Hµm xÊp xØ
C
+ +
+
UF
P
y
r (n)
r
.
. .
.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 13
nhiệm cho một đối tượng xác định. Mạng giám sát đã học từ bộ điều khiển feed-
forward nào được áp dụng cho đối tượng đó.
Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của điều khiển FEL,
một phương pháp rõ ràng ở đây là phải tìm ra những hàm xấp xỉ khác nhau. Mạng
MLP được thay thế bởi mạng (Cerebellar Model Articulation Controller CMAC).
Mạng CMAC phụ thuộc vào các lớp mạng nơron mà làm việc với hàm cơ sở. Trong
trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm đa thức thông minh mà có
giá trị khác không trên phần không gian đầu vào. Ở mỗi điểm trong không gian đầu
vào p các hàm cơ sở chồng chéo lên nhau. Thông số của p được biết đến như là một
thông số khái quát hoá và có thể được lựa chọn bởi nhà thiết kế. Đầu ra của mạng
CMAC là tổng các trọng số của hàm ước lượng cơ sở. Việc học được tiến hành bằng
cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản thân các
hàm cơ sở. Tất cả điều này nhằm mục đích cải thiện những vấn đề sau:
Độ hội tụ nhanh hơn. Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ các
hàm trọng lượng được thích nghi, gây ra độ hội tụ nhanh.
Có thể học các dữ liệu tương quan. Các vùng của hàm cơ sở đã được trộn lẫn,
điều này có ích cho quá trình học các dữ liệu tương quan.
Không có cực tiểu cục bộ. Cơ cấu học không trải qua vùng cực tiểu cục bộ.
Tuy nhiên một bất lợi là người thiết kế bộ điều khiển phải lựa chọn sự phân
phối của các hàm cơ sở. Điều này yêu cầu phải có một số kiến thức nền tảng về ánh
xạ vào/ra theo mong muốn và việc điều chỉnh sự phân phối của hàm cơ sở là cần
thiết trước khi đạt được hiệu suất có thể chấp nhận được. Các nghiệm thí đã chỉ ra
rằng việc thay thế mạng MLP bởi mạng CMAC đem lại một quá trình học tốt hơn và
độ bám chính xác hơn.
1.4. Điều khiển truyền thẳng tự học.
Trong luận văn này một hệ thống LC được xét có cấu trúc tương tự như cấu
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 14
trúc của bộ điều khiển FEL (hình 1.2). Tuy nhiên, phần feed-forward của bộ điều
khiển LC được thực hiện giống như mạng B-Spline (BSN) thay vì mạng MLP. Loại
điều khiển FEL được gọi là LFFC. Phương pháp BSN cũng tương tự như phương
pháp CMAC. Giống như mạng CMAC, mạng BSN sử dụng các hàm cơ bản còn gọi
là B-Spline để xấp xỉ hoá.
Trong thiết kế LFFC các thông số sau của BSN phải được lựa chọn :
1.4.1. Đầu vào của mạng BSN.
Đối với các hệ thống chuyển động, các đầu vào của BSN bao gồm các vị trí
đặt, r, và các đạo hàm của nó (xem hình 1.2).
1.4.2. Sự phân bố B-Spline trên đầu vào của mạng BSN.
Đầu ra của BSN là tổng trọng lượng của các B- spline ước lượng . Do đó, số
lượng của các B-Spline và các vị trí của chúng quyết định tính chính xác của giá trị
xấp xỉ. Các tín hiệu đích có dạng trơn có thể được xấp xỉ một cách chính xác với
một số lượng thấp các B-Spline “rộng”. Các tín hiệu có độ dao động lớn yêu cầu
một số lượng lớn các B-Spline “hẹp” (xem hình 1.5)
Hình 1.5 ánh xạ BSN
B-splines
μ
uF
0
1
--==Hàm mục tiêu --==Hàm xấp xỉ
r[m]
r[m]
Hàm xấp xỉ
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 15
Một khả năng riêng biệt của việc phân bố các B-Spline có thể được tạo ra trên cơ sở
kiến thức của đối tượng nghịch đảo và của các nhiễu, hoặc nhờ một tiến trình lặp đi
lặp lại sử dụng các dữ liệu thực nghiệm.
1.4.3. Sự lựa chọn các cơ cấu học.
Tự học ví dụ như là sự thích nghi của các trọng số mạng có thể được tiến
hành sau mỗi một mẫu - được biết tới gọi là học trực tuyến hoặc sau mỗi chuyển
động đã được thực hiện xong - được gọi là off-line learning.
Luật online learning như sau:
)()( rerw ii
(1.3)
Và luật offline learning như sau:
s
s
N
i
ji
N
i
jji
i
r
rer
w
1
1
)(
)()(
(1.4)
với:
rj: đầu vào của BSN. Trong LFFC đầu vào bao gồm cả vị trí đặt và đạo hàm
của nó
,....,, jjj rrrf
)( ji r
: thành phần của B-Spline thứ I
1.0)( ji r
i
: sự thích nghi của trọng số B-Spline thứ i
: tỷ lệ học 0 <
1
)( jre
: Sai số xấp xỉ được tạo bởi mạng, trong LFFC e(rj) là đầu ra của bộ điều
khiển phản hồi uC;
Ns: Số lượng các mẫu đầu vào.
1.4.4. Sự lựa chọn tốc độ học.
Tốc độ học càng lớn thì độ hội tụ của kỹ thuật học càng nhanh. Tuy nhiên
một tốc độ học mà lớn thì sẽ làm cho giá trị xấp xỉ thêm nhạy cảm với nhiễu và có
thể là nguyên nhân gây mất ổn định.
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 16
Bằng việc sử dụng BSN, ta đã có các ưu điểm sau:
Không có cực tiểu cục bộ. Đầu ra của BSN là một hàm trọng số tuyến tính.
Điều này có nghĩa là các kỹ thuật học được đưa ra trong (1.3) và (1.4) không trải
qua vùng cực tiểu cục bộ. Điều này nhấn mạnh rằng các trọng số đầu của BSN
không ảnh hưởng đến độ chính xác tự hiệu chỉnh cuối cùng.
Học cục bộ. Khi B-Spline có một nền tảng chắc chắn, ánh xạ vào/ra của
BSN có thể thích nghi một cách cục bộ. Việc huấn luyện một chuyển động mới
không nhất thiết phải ảnh hưởng tới khả năng hiệu chỉnh các chuyển động đã học
trước đó. Hơn thế nữa, do nền tảng chắc chắn của B-Spline chỉ có một số lượng
nhỏ các trọng số góp phần cho đầu ra, trong quá trình huấn luyện, chỉ có các
trọng số cần cần được đáp ứng. Điều này trái ngược với MLP nơi mà tất cả các
trọng số của mạng bị thay đổi trong suốt quá trình học. Do đó, BSN hội tụ nhanh
hơn nhiều so với MLP.
Sự chính xác trong điều chỉnh. Độ trơn của quan hệ vào/ra là xác định
được bằng cách chọn phân bố B-spline. Việc chọn B-spline mà có nền tảng vững
chắc hơn, làm cho BSN có được giá trị xấp xỉ dữ liệu ở miền cao tần chính xác
hơn. Khi mà, do sự giới hạn của cơ cấu chấp hành, ví dụ, với một giá trị xấp xỉ
trơn hơn của dữ liệu được yêu cầu ở một phần xác định của không gian đầu vào,
B-spline nên được sử dụng để có một nền tảng rộng hơn hoặc thức bậc cao hơn.
Trong trường hợp của MLP, người dùng không thể xác định được độ trơn của
các phần khác nhau trong không gian đầu vào, thay vào đó MLP xác định rõ vị
trí nguồn của nó.
Cho tới nay mạng CMAC cũng đã nắm bắt được những thuận lợi đã được liệt kê
ở trên của mạng BSN. Chúng ta chọn BSN bởi vì nó đơn giản. Trong mạng
CMAC các hàm phân bố cơ bản là các hàm mà ở mỗi giá trị đầu vào hàm cơ sở
chính xác p có một định lượng lớn hơn 0. Một số hàm phân bố thoả mãn điều
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 17
này và mỗi hàm như vậy dẫn đến một giá trị xấp xỉ khác nhau. Người sử dụng
phải chọn hàm phân bố nào là có khả năng xấp xỉ tốt nhất. Hơn thế, việc chọn
lọc một giá trị xấp xỉ bằng cách thêm một số ràng buộc (thêm một hàm cơ sở),
kết quả sẽ có được hàm phân bố cơ sở khác. Điều này có thể là không được như
mong muốn cho lắm. Sự phân bố của các hàm cơ bản trong BSN là không phức
tạp lắm.
Hạn chế chính của các BSN (và của các NN với các hàm cơ bản) đó là số lượng
các trọng số mạng tăng theo hàm mũ với kích thước của không gian đầu vào. Số
lượng các trọng số trong một BSN - N chiều được cho bởi:
N
j
jt NN
1
(1.5)
Với Nj là số lượng của B-Spline được định nghĩa ở đầu vào thứ j. Khi xét tới độ
chính xác có thể sẽ yêu cầu nhiều B-Spline và vì vậy giá trị của Nj sẽ lớn hơn, ví
dụ khi một hàm phi tuyến ở mức độ cao được xấp xỉ hoá, các mạng này là không
thực tế khi số lượng đầu vào quá lớn. Điều này được gọi là sai lệch về kích
thước và nó mang lại một số các vấn đề sau:
Số lượng lớn các trọng số mạng. Nếu các đối tượng động học có thành
phần phi tuyến ở mức độ cao, một hàm phi tuyến ở mức độ cao có thể bị ánh xạ
bởi mạng B-Spline. Một mạng mà có khả năng ánh xạ những phi tuyến này một
cách chính xác sẽ chiếm một phần lớn dung lượng lớn của bộ nhớ máy tính.
Trong thực tế, các nguồn bộ nhớ là có giới hạn, do đó mạng phức hợp và ánh xạ
chính xác của nó phải được cân bằng với nhau.
Các bộ huấn luyện rộng. Khi thực thi một sự chuyển động định trước, chỉ
có các trọng số mạng được lập bởi các đầu vào của mạng là được cập nhật. Để
thích ứng một số lượng lớn các trọng số mạng, yêu cầu cần phải có một số lượng
lớn các huấn luyện chuyển động. Điều này sẽ dẫn tới nhiều lần huấn luyện nếu
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 18
mạng được huấn luyện trực tuyến ví dụ trong suốt quá trình điều khiển.
Khả năng khái quát kém. Việc bù của bộ phi tuyến có thể yêu cầu các
B-Spline hẹp để thoả mãn các yêu cầu về độ chính xác. Tuy nhiên, với các B-
Spline hẹp, các tín hiệu đầu ra của mạng rất khác nhau có thể xảy ra với các
đường cong quỹ đạo mà “gần với nhau”. Vì lý do đó, mà các bộ huấn luyện rộng
được đề cập ở trên đáp ứng được tất cả những gì cần thiết mà phải đưa ra trước
khi đề cập tới hiệu quả lợi ích thu được.
Có thể thấy rằng sai lệch về kích thước có thể gây hại nghiêm trọng tới
giá trị thương mại của LFFC. Do đó, nên cố gắng để vượt qua sự sai lệch về kích
thước.
1.5. Ứng dụng minh hoạ: Hệ thống chuyển động động cơ tuyến tính.
Một ứng dụng thú vị của LC là động cơ tuyến tính đồng bộ dùng nam châm
vĩnh cửu. Các động cơ tuyến tính thường được thiết kế để thực hiện các chuyển
động tuyến tính với độ chính xác nhỏ hơn mm ví dụ như cắt lazer, máy quét, hoặc
các máy thực hiện nhiệm vụ gắp - đặt. Động cơ tuyến tính được xét ở đây còn được
gọi là Hệ thống chuyển động động cơ tuyến tính (Linear Motor Motion System
LiMMS) được chế tạo bởi Philips. Cấu trúc động cơ bao gồm phần tĩnh bao phủ bởi
đế kim loại và một phần động. Phần động này chứa cuộn điện và lõi sắt xem hình
1.6. Bằng cách cung cấp dòng điện 3 pha vào trong mỗi cuộn dây của phần động sẽ
tạo ra một chuỗi lực hút và đẩy giữa các cực và đế kim loại. Kết quả là gây ra sự
chuyển động giữa phần động và phần tĩnh . Các hoạt động cơ bản của động cơ là
chuyển động gia trọng: trọng lượng của phần động với một tải (tải giả định), mL, có
giá trị là 37(kg).
Chương 1: Giới thiệu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 19
Hình 1.6: Nguyên lý làm việc của động cơ tuyến tính LiMMS
Các đường chỉ thị là các đường cong từ hoá với A B C là các pha của dòng động
cơ 3 pha.
Trong quá trình
Các file đính kèm theo tài liệu này:
- Luận văn- Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ.pdf