Đồ án Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ

Tài liệu Đồ án Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ: Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn ĐẠI HỌC THÁI NGUYấN TRƯỜNG ĐẠI HỌC KỸ THUẬT CễNG NGHIỆP ------------    ------------ ĐỐ ÁN TỐT NGHIỆP Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ Học viờn: Lõm Hoàng Bỡnh Giỏo viờn hướng dẫn: Ts. Nguyễn Duy Cương Chuyờn ngành: Tự Động Hoỏ Khoỏ:K10 Thỏi Nguyờn, thỏng 10 năm 2009 Số húa bởi Trung tõm Học liệu – Đại học Thỏi Nguyờn MỤC LỤC Chương 1: Giới thiệu 1.1. Tổng quan về Learning Control (LC) ……………………………..………………1 1.2. Learning Control (LC) là gỡ………………………………………………..………2 1.3. Phản hồi sai số tự học………………………………………………… …. ……… 7 1.3.1. Một số vớ dụ về ma sỏt độc lập......................................................................8 1.4. Điều khiển truyền thẳng tự học…………………………………………... .…......13 1.4.1. Đầu vào của mạng BSN………………….......…………………...………14 1.4.2. Sự phõn bố B-Spline trờn đầu vào của mạng BSN..............................................

pdf82 trang | Chia sẻ: haohao | Lượt xem: 1199 | Lượt tải: 0download
Bạn đang xem trước 20 trang mẫu tài liệu Đồ án Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC KỸ THUẬT CÔNG NGHIỆP ------------    ------------ ĐỐ ÁN TỐT NGHIỆP ThiÕt kÕ bé ®iÒu khiÓn Learning FeedForward cho c¸c hÖ thèng chuyÓn ®éng ®iÖn c¬ Học viên: Lâm Hoàng Bình Giáo viên hướng dẫn: Ts. Nguyễn Duy Cương Chuyên ngành: Tự Động Hoá Khoá:K10 Thái Nguyên, tháng 10 năm 2009 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên MỤC LỤC Chương 1: Giới thiệu 1.1. Tổng quan về Learning Control (LC) ……………………………..………………1 1.2. Learning Control (LC) là gì………………………………………………..………2 1.3. Phản hồi sai số tự học………………………………………………… …. ……… 7 1.3.1. Một số ví dụ về ma sát độc lập......................................................................8 1.4. Điều khiển truyền thẳng tự học…………………………………………... .…......13 1.4.1. Đầu vào của mạng BSN………………….......…………………...………14 1.4.2. Sự phân bố B-Spline trên đầu vào của mạng BSN..............................................14 1.4.3. Sự lựa chọn các cơ cấu học. ................................................................................15 1.4.4. Sự lựa chọn tốc độ học. ......................................................................................15 1.5. Ứng dụng minh hoạ: Hệ thống động cơ chyển động tuyến tính………….…..…..18 1.6. Bố cục luận văn…………………………………………….…………………..…21 Chương 2: Các chuyển động lặp……………....……………………......….……..…22 2.1. Giới thiệu ...………………………………………………………….....…………22 2.2. Các giả định …………………………………………………..…………....…….22 2..3. Độ rộng của nội suy B-Spline …………………………….…….……….……....27 Thuật toán 2.2.1. (Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình chi tiết của hệ thống điều khiển).......................................................................................................27 Chương 3: Thiết kế ứng dụng……………...………………..………………...…….34 3.1. Giới thiệu ...………………………………………………………….....…………34 3.1.1. Bộ điều khiển phản hồi .......................................................................................34 3.1.2.Các đầu vào của khâu truyền thẳng......................................................................34 3.1.3.Cấu trúc của khâu truyền thẳng.............................................................................35 3.1.4. Phân bố B-Spline …………………………………………………..….....……..35 3.1.5. Tỷ lệ học......................................................................................... ......................35 3.1.6. Luyện các chuyển động………………………………..………….….….….…..36 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 3.2. LiMMS ……………………..……………………………………….…......….….36 3.2.1. Thiết lập…………………………………………………………….………..…36 3.2.2. Thủ tụ thiết kế một hệ thống Time-indexed LFFC ………………….……..…..37 3.2.3. Các thí nghiệm kiểm chứng cho hệ thống Time-indexed LFFC……..…….…...40 3.2.4. Thiết kế một LFFC tối giản……………………………………………….….....48 3.2.5. Kết luận……………………………………………………………......………..62 3.3. Kết quả mô phỏng bằng phần mềm 20-sim………………………………………63 3.3.1. Mạng FeedBack………………………………………………………………...64 3.3.2. LFFC khi có ViscouNeural………………………………………………….…65 3.3.3. LFFC khi có CoulombNeural và ViscouNeural……………………………….66 3.3.4. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural………………..68 3.3.5. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural, InertialNeural..69 Chương 4: Kết luận……………………………………………………….………….71 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên Tài liệu tham khảo [1] Learning feed – Forward Control Theory, Design and Applications Wubbe Jan Roelf Velthuis - 1970 [2] Function Approximation for Learning Control, a key sample based approach B.J. de Kruif - 1976 [3] Intelligent Control part 1 – MRAS Author prof. Dr.ir Job van Amerongen – March 2004 [4] Advanced Controllers for Electromechanical Motion Systems Dr. Nguyen Duy Cuong. University of Twente, March, 2008 Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên Lời nói đầu §iÒu khiÓn chuyÓn ®éng (motion control) liªn quan viÖc sö dông lùc ®Ó ®iÒu khiÓn sù di chuyÓn cña ®èi t•îng ®iÒu khiÓn trong mét hÖ thèng c¬ vµ ®•îc sö dông réng r·i trong c¸c øng dông c«ng nghiÖp nh• ®ãng gãi, in, dÖt, hµn, còng nh• nhiÒu øng dông kh¸c. HiÖn nay, phÇn lín c¸c lo¹i h×nh ®iÒu khiÓn chuyÓn ®éng ®•îc thùc hiÖn b»ng c¸ch sö dông c¸c ®éng c¬ ®iÖn, vµ ®©y chÝnh lµ ®iÒu quan t©m chÝnh cña chóng t«i trong thiÕt kÕ. C¸c hÖ ®iÒu khiÓn chuyÓn ®éng cã thÓ lµ phøc t¹p v× cã nhiÒu vÊn ®Ò kh¸c nhau cÇn ®•îc xem xÐt, vÝ dô nh•: - Gi¶m thiÓu ¶nh h•ëng cña nhiÔu hÖ thèng. - Suy yÕu t¸c ®éng xÊu cña nhiÔu ®o - Sù thay ®æi th«ng sè vµ cÊu tróc kh«ng râ cña ®èi t•îng ®iÒu khiÓn. RÊt khã ®Ó t×m ra c¸c ph•¬ng ph¸p thiÕt kÕ mµ cã thÓ gi¶i quyÕt ®ång thêi tÊt c¶ c¸c vÊn ®Ò nªu trªn, ®Æc biÖt ®èi víi c¸c ph•¬ng ph¸p ®iÒu khiÓn truyÒn thèng mµ ë ®ã c¸c thiÕt kÕ ®iÒu khiÓn liªn quan tíi sù th•¬ng th¶o gi÷a c¸c môc tiªu mang tÝnh ®èi ng•îc. §Ó kh¾c phôc khã kh¨n ®· nªu, bé ®iÒu khiÓn Learning FeedForward (LFF) sÏ ®•îc giíi thiÖu trong nghiªn cøu nµy. Thực hiện luận văn tốt nghiệp trong khuôn khổ chương trình đào tạo Thạc sỹ ngành tự động hóa của trường Đại học Kỹ thuật Công nghiệp Thái Nguyên, Tôi được giao đề tài: ’’ ThiÕt kÕ bé ®iÒu khiÓn Learning FeedForward cho c¸c hÖ thèng chuyÓn ®éng ®iÖn c¬” Luận văn phân tích các quá trình động học đối tượng thông qua mô hình toán học từ đó đưa ra và chứng minh tính phù hợp của các phương án điều khiển, cuối cùng là tiến kiểm chứng trên phần mềm mô phỏng 20-sim. Luận văn được trình bày trong 4 chương: Chương 1: GIỚI THIỆU Tổng quan về Learning control Chương 2: PHÂN TÍCH ĐỘ ỔN ĐỊNH CỦA HỆ THỐNG LFFC PHỤ THUỘC THỜI GIAN Trong chương này đề cập đến bộ điều khiển LFFC phụ thuộc thời gian và phân tích tính ổn định của hệ thống phụ thuộc vào thời gian. Từ đó tìm ra công thức tính giá trị nhỏ nhất của độ rộng mạng B-Spline Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 2 Chương 3: THIẾT KẾ ỨNG DỤNG Trong các chương trước, một số vấn đề về LFFC đã được đề cập đến. Ở chương này sẽ sử dụng các kiến thức có được nhằm thực hiện thiết kế một bộ LFFC thực tế. Chương 4: KẾT LUẬN Sau thời gian thực hiện, đến nay bản luận văn của tôi đã hoàn thành. Trước thành công này tôi xin gửi lời cảm ơn chân thành tới thầy TS. Nguyễn Duy Cương, người đã trực tiếp hướng dẫn, giúp đỡ tôi hoàn thành đề tài này, tôi cũng xin được bày tỏ lòng biết ơn tới các anh các chị trong trường đại học Kỹ Thuật Công Nghiệp cũng như gia đình, bạn bè đã tạo điều kiện giúp đỡ tôi trong quá trình làm luận văn. Ngày 30 .tháng 10 năm 2009 Học viên Lâm Hoàng Bình Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 22 Chương 2: PHÂN TÍCH ĐỘ ỔN ĐỊNH CỦA HỆ THỐNG LFFC PHỤ THUỘC THỜI GIAN 2.1. Giới thiệu Trong chương này đề cập đến bộ điều khiển LFFC phụ thuộc thời gian và phân tích tính ổn định của hệ thống phụ thuộc vào thời gian. Xác định giá trị nhỏ nhất của độ rộng mạng B-Spline. 2.2. Các giả định Để có thể phân tích tính ổn định của các thông số trong LFFC chúng ta giả thiết như sau: 1. Đối tượng cần điều khiển là đối tượng (single input - single output ) SISO LTI. 2. Bộ điều khiển phản hồi, C, là tuyến tính, các hằng số thời gian và các thông số được chọn cho vòng phản hồi là ổn định. 3. Luật học rời rạc.          h T k i h T k Ci i p p kh khukh 0 0    (2.1) (với h là thời gian mẫu) được thay thế bởi 1 công thức tương đương dưới dạng liên tục :         pT i pT Ci dtt dttut Ci 0 0    (2.2) 4. Phân bố B-spline giả thiết là đồng dạng. Giả thiết có N B-pline có phân bố đồng bộ trên phạm vi đầu vào, [0, Tp] (s), như trên Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 23 hình. băng thông (độ rộng) d(s) của các công thức cơ sở cho các tín hiệu từ 2 tới N–1 được cho bởi quan hệ sau:  s N T d p 1 2   (2.3) thành phần B-spline thứ i được định nghĩa như sau:                      0 2 1 2 2 )1( 2 2 2 22 i d ti d for d tdi i d ti d for d idt ti (2.4) Thành phần thay thế (2.4) trong luật học (2.2) được cho bởi trọng số thích nghi sau:                                )1( 2 2 2 2 1 2 )1( 2 2 2 2 1 2 222 222 i d i d i d i d i d i d i d i d CC dt d tdi dt d idt dttu d tdi dttu d idt Ci  (2.5) Mẫu số của (2.5):              )1( 2 2 2 2 1 2 222 i d i d i d i d dt d tdi dt d idt (2.6) Sử dụng (2.6), khi đó có thể đơn giản hoá công thức của trọng số trong (2.5) :                  )1( 2 2 2 2 1 2 22 42424 i d i d i d i d CCC dttu d tdi dttu d idt Ci  (2.7) điều này ngụ ý rằng việc học là tuyến tính trong uC(t) và kể từ đây ta sẽ coi vòng lặp Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 24 thích nghi feed-forward là tuyến tính. khi vòng phản hồi cũng là tuyến tính, phần tín hiệu chủ đạo có thể đạt tới giá trị bằng 0 trong khi phân tích tính ổn định (xem hình 2.1). giá trị mong đợi khi đó là uF = 0. Hệ thống này là ổn định nếu một tín hiệu feed-forward ban đầu được lựa chọn là duy nhất thì sẽ không có kết quả ở đầu ra không giới hạn của đối tượng. tín hiệu feed-forward (ban đầu) được xác định bởi các giá trị (đầu) của trọng số trong Hình 2-1: Chỉ số thời gian của LFFC khi r = 0 mạng B-spline. Khi hệ thống được điều khiển phản hồi ổn định đầu ra chỉ có thể vượt quá giới hạn khi tín hiệu feed-forward uF(t) trở nên quá giới hạn. điều này muốn nói rằng ít nhất 1 trọng số đã đạt tới giá trị vô cùng lớn. Do đó, nếu các trọng số đã được thích nghi theo cách giữ nguyên giá trị chặn, hệ thống là ổn định, nếu không hệ thống là không ổn định. Giá trị của các trọng số còn lại bị chặn nếu: 1. Mỗi trọng số thích nghi theo 1 hướng đúng (về phía uF(t) = 0), có nghĩa là: 0 i for 0i 0 i for 0i (2.8) 2. Các trọng số không thích nghi quá mạnh: ii  2 for 0i ii  2 for 0i (2.9) - BSN C + + UF P y t Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 25 Kết hợp (2.8) và (2.9) ta thu được: ii  20  for 0i 02  ii  for 0i (2.10) Lưu ý rằng (2.10) là điều kiện đủ chứ không phải là điều kiện cần. Vấn đề là chọn băng thông (độ rộng) d và tốc độ học C phù hợp với (2.10). Để giải quyết vấn đề này, ta giả thiết rằng hình dạng của tín hiệu feed-forward uF(t) là dạng tam giác. Sự lựa chọn này được thúc đẩy bởi thực tế là các kinh nghiệm đã chỉ ra rằng khi xảy ra hoạt động không ổn định đầu ra của BSN sẽ có dạng tam giác. Ánh xạ vào/ra này có thể thực hiện bằng cách chọn trọng số như wi = g với i = 1, 3, 5… và wi = -g với i = 2,4 6 với g  R+. xem hình 2.2 Hình 2.2: Tín hiệu phản hồi đầu vào Tín hiệu uF(t) có thể được viết dưới dạng chuỗi Furiê:         .....5,3,1 22 cos8 n n F n tg tu   (2.11) với  12  rads d n n  (2.12) d 1 2 3 4 5 t g -g uF 1 0 μ Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 26 Trong miền tần số quan hệ giữa đầu ra của bộ điều khiển feed-forward UF và tín hiệu học UC được cho bởi: UC = -T UF (2.13) Với T là hàm bù nhạy : CP CP T   1 (2.14) T khuếch đại biên độ của mỗi thành phần tần số (2.11) bởi 1 hệ số  nn jTa  và góc chuyển pha   nn jT   arg , do đó uC(t) có thể được viết như sau:          ...5.3.1 22 cos8 n nnn C n tag tu   (2.15) Thay (2.15) vào (2.5) và viết lại công thức:                     ...5,3,1 cos32 ...6,4,2 cos32 ...5,3,1 44 ...5,3,1 44 ifor n a g ifor n a g n n n c n n n c i        (2.16) Có thể thấy là tất cả các trọng số có cùng giá trị đầu (wi = g với i = 1,3,5.. và wi = -g với i = 2,4,6…) là có tính thích nghi như nhau. Do đó việc học không làm thay đổi về hình dáng của tín hiệu feed-forward. Kể từ đây, với mỗi bước lặp của tín hiệu feed-forward có thể khuếch đại như trong công thức (2.11) và trọng số thích nghi trong (2.16). Trong công thức dưới đây, ta sẽ xét sự thích nghi của các trọng số có giá trị đầu dương wi = a: Với mỗi trường hợp, ta sẽ phân tích dạng tương tự của nó. Thay vào công thức (2.16) với điều kiện ổn định (2.10) được kết quả:   0 cos32 2 ...5,3,1 44    n n n c n a g g    (2.17)   0 cos 16 ...5,3,1 4 4      n n n C n a    (2.18) Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 27 bất đẳng thức vế trái của (2.18):        ...5,3,1 4 4 cos 16 n n n C n a    (2.19) chứa đựng C , an , n. Các giá trị của an và n phụ thuộc vào giá trị của wn, với wn được xác định bởi cách chọn lựa băng thông B-spline, d xem (2.12). Dù (2.19) có thoả mãn hay không thì nó vẫn phụ thuộc vào sự chọn lựa tỉ lệ học và độ rộng B- spline. Bất đẳng thức vế phải của (2.18):   0 cos ...5,3,1 4   n n n n a  (2.20) chỉ chứa an và n. Điều này có nghĩa là chỉ vâng chọn d xác định thì (2.20) là thỏa mãn. Tiếp theo, sử dụng d vừa thu được (và wn) ta có thể tính được C từ (2.19). Theo đó ta sẽ cố gắng tìm ra giá trị nhỏ nhất của d mà vẫn thoả mãn yêu cầu của công thức (2.20) 2.3. Độ rộng của B-Spline. Với một mô hình chính xác của hệ thống P và bộ điều khiển C là sẵn có, giá trị của an và n có thể được tính toán cho tất cả các tần số. Điều này sẽ cho phép lựa chọn giá tri tối thiểu d sao cho (2.20) thỏa mãn nhờ quá trình tìm kiếm lặp lại đơn giản như sau: Thuật toán 2.3.1. (Tính toán giá trị ổn định nhỏ nhất của d dựa trên mô hình chi tiết của hệ thống điều khiển) 1. Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N=3 trong hình 1.13. Bởi vì theo (2.3) trong trường hợp này d=Tp[s], đây là số B-Spline tối thiểu có thể lựa chọn . 2. Xác định an và n . Điều này được thực hiện theo cách thức sau: Chọn n=1 Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 28 Tính toán n theo (2.12). Sử dụng mô hình của hệ thống và n để xác định an và n Nếu 0na  tiến hành bước 3. Nếu không, tăng n thêm 1 đơn vị và chuyển sang bước 2.2 3. Kiểm ta xem an và n đã tìm được trong bước trước có thảo mãn (2.20) không.Nếu thỏa mãn,chuyển sang bước 4, nếu không chuyển sang bước 6 4. Tăng số lương B-Spline trong phân bố lên 1 đơn vị N =N+1. 5. Chuyển tới bước 2 6. Giá trị N hiện tại là giá trị nhỏ nhất của B-Spline mà cho kết quả hoạt động không ổn định. Do đó, số lương lớn nhất B-Spline là N-1 và theo (2.3) ta có: 2 2   N T d p (2.21) Tuy nhiên, nhìn chung chỉ phần động lực học của hệ thống ở tần số thấp thỏa mãn. Do đó, thuật toán 2.1 có thể không tin cậy. Để giải quyết vấn đề này chúng ta sẽ tiếp cận theo hướng truyền thống. Đầu tiên, chúng ta viết lại (2.20) dưới dạng:   0 cos )cos( ....5,3 411    m n n n aa  (2.22) Tiếp theo, chúng ta xác định giá trị nhỏ nhất của d ( đồng nghĩa với giá trị lớn nhất của 1 ) thỏa mãn phương trình (2.22). Với giả thiết là an và n có các giá trị xấu nhất. Để xem xét trong trường hợp các giá trị xấu nhất này, chúng ta sử dụng một phần giản đồ pha tiêu biểu của -T (hình 2.3) Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 29 Hình 2.3: Đồ thị pha của –T tiêu biểu Với các giá trị  là pha của –T. Đồ thị tương ứng của os( )c  được chỉ ra trong hình 2.4 Hình 2.4: Đồ thị của os( )c  Khi chúng ta chọn một giá trị d lớn 1 0  sẽ cho kết quả 1 180[deg]   và do đó 1 1os( ) 1a c   . Khi chúng ta tăng 1 (tăng d) chúng ta sẽ tiến đến một giá trị mà tại đó 1 90[deg]   hoặc 1 270[deg]   và làm cho 1 1os( ) 0a c   do đó a1>0. Phương trình (2.22) có thể không đúng tại điểm này tùy thuộc vào giá trị của      ....5,3 4 cos m n n n a  Khi   0 cos ....5,3 4   m n n n a  chúng ta có thể tăng thêm giá trị của 1 mà không vi phạm Freuency (rad/sec) -20 -180 0 0.1 Freuency (rad/sec) -80 -140 -100 -60 p h as e (d eg ) Cos[φ] 1 0 -1 10-1 10-2 10-3 ω[rad s-1] Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 30 (2.22). Nói cách khác khi   0 cos )cos( ....5,3 411    m n n n aa  chúng ta phải giảm giá trị của 1 . Vì thế tình huống xấu nhất (xem xét theo độ ổn định) xảy ra khi:      ....5,3 4 cos m n n n a  max            ....5,3 4 cos m n n n a  (2.23) Theo đó giới hạn trên được cho bởi: max      ....5,3 4 cos m n n n a         ....5,3 4 cosmax )max( m n n n a       ....5,3 4 max m n n a        ....5,3 4 max m n n jT  (2.24)        ....5,3 4 m n n jT   Do vậy, 2.22 được thỏa mãn nếu:  11 cosa       ....5,3 4 m n n jT   (2.25) Bây giờ, giá trị lớn nhất của 1 mà theo đó (2.25) thỏa mãn có thể tìm được nhờ quá trình tìm kiếm lặp lại sử dụng mô hình hệ thống động học với tần số thấp: Thuật toán 2.2. (Tính toán giá trị ổn định nhỏ nhất của d với các giả thiết trên mô hình động học của hệ thống điều khiển) 1. Sử dụng mô hình tần số thấp của hệ thống để tính toán       ....5,3 4 m n n jT  Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 31 2. Chọn một khuôn dạng phân bố B-Spline bao gồm 3 B-Spline: N=3 trong hình 2.13 3. Tính toán 1 theo (2.12) với N=1 4. Sử dụng mô hình để xác định a1 và 1 5. Kiểm tra xem an và n có thảo mãn phương trình (2.25) sử dụng kết quả của bước 1. Nếu thỏa mãn chuyển tới bước 6, ngược lại chuyển tới bước 8. 6. Tạo một khuôn dạng phân bố B-Spline bao gồm N+1 B-Spline (hay N:=N+1) 7. Chuyển tới bước 3 8. Giá trị nhỏ nhất d được cho bởi: 2 2   N T d p Để đạt được mục đích xây dựng một chương trình tìm kiếm lặp lại, chúng ta có thể thêm một số giả thiết với a1. Đầu tiên ta viết lại (2.25) dưới dạng:  1cos       ....5,3 4 1m n na jT  0 (2.26) Như đã trình bày trong phần trước, tình huống xấu nhất đạt được khi phần thứ 2 bên trái của phương trình 2.26 đạt giá trị lớn nhất :       ....5,3 4 1m n na jT  = max             ....5,3 4 1m n na jT  =        ....5,3 4 1minm n na jT  (2.27) Sử dụng(2.27) ta có thể diễn tả (2.26) dưới dạng:  1cos        ....5,3 4 1minm n na jT  0 (2.28) Bây giờ chúng ta phải xác định giá trị của min(a1). Điều này được thực hiện bằng cách tính toán  njT  cho tất cả các gái trị có thể của 1 mà thảo mãn (2.26). Giới hạn trên của các giá trị của 1 có thể được xác định dưới đây sử dụng kết quả: Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 32       ....5,3 4 1m n na jT  0 (2.29) 1 sẽ phải thỏa mãn phương trình (sử dụng (2.26)):   0cos 1  (2.30) Giới hạn trên của các giá trị của 1 là các giá trị tần số  tại đó os( ) 0c   . Các kết quả này được thể hiện trong: min(a1)    0cos min   Rl  njT  (2.31) Trong hình 2.5 giới thiệu một ví dụ về đồ thị Bode của –T. Trong đó tất cả các giá trị  mà theo đó os( ) 0c   được đánh bóng. Hình 2.5: Ví dụ về đồ thị Bode của –T Thay thế (2.31) trong (2.28) đạt được:              ....5,3 0cos min 0147.0 m n R n jT jT                   ....5,3 4 0cos 1 min cos m R n njT jT    (2.32) Chương 2: Phân tích độ ổn định của hệ thống LFFC phụ thuộc thời gian Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 33 Phương trình trên có thể được sử dụng để hình thành nên một thuật toán theo đó có thể tìm được giá trị tối thiểu của d: Thuật toán 2.3 ( Tính toán giá trị ổn định của d với các giả thiết nghiêm ngặt hơn về mô hình động học của hệ thống) 1. Xác định  njT  từ mô hình vòng lặp kín 2. Sử dụng đồ thị Bode của mô hình xác định     n R jT     0cos min 3. Tìm giá trị nhỏ nhất của 1 mà tại đó   1arg1  jT thỏa mãn                       ....5,3 0cos 1 min 0147.0arccos m n R n jT jT    (2.33) 4. Giá trị nhỏ nhất của độ rộng của mạng B-Spline, dmin được cho bởi:  1 1 min 2  radsd   Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 34 Chương 3: THIẾT KẾ ỨNG DỤNG 3.1.Giới thiệu Trong các chương trước, một số vấn đề về LFFC đã được đề cập đến. Ở chương này sẽ sử dụng các kiến thức có được nhằm thực hiện thiết kế một bộ LFFC thực tế. 3.1.1. Bộ điều khiển phản hồi. Bộ điều khiển có phản hồi bù nhiễu ngẫu nhiên và tạo ra một tín hiệu học cho khâu phản hồi. Trong chương 2 đã chỉ ra rằng độ rộng tối thiểu của B-Spline và do đó độ chính xác cực đại đạt được phụ thuộc vào đáp ứng tần số của vòng phản hồi kín. Do đáp ứng tần số của vòng phản hồi kín này phụ thuộc vào bộ điều khiển phản hồi nên nó quyết định trực tiếp đến khả năng hoạt động tối đa có thể đạt được. Khi độ rộng tối thiểu của B-Spline quá lớn để đạt được một tỷ lệ lỗi hoạt động chấp nhận được thì thiết kế lại bộ điều khiển phản hồi là một giải pháp. Tuy nhiên, điều này yêu cầu bộ điều khiển phản hồi phải được thiết kế sao cho băng thông của vòng phản hồi kín tăng và điều này có nghĩa là độ ổn định bền vững đối với các thay đổi của các thiết bị giảm. Chúng ta sẽ giải quyết vấn đề này theo cách khác. Bộ điều khiển phản hồi sẽ được thiết kế sao cho ổn định và bền vững. Nếu độ rộng tối thiểu đạt được của B-Spline không phù hợp với hoạt động bám điều khiển mong muốn, một bộ lọc được thêm vào LFFC. Khi bộ lọc này được thiết kế theo Chương 2, độ rộng tối thiểu cho phép của B-Spline sẽ giảm. 3.1.2.Các đầu vào của khâu truyền thẳng. Các đầu vào của khâu truyền thẳng phụ thuộc vào loại chuyển động cần phải thực hiện. Trong trường hợp các chuyển động lặp lại thì cho kỳ chuyển động được ưu tiên hơn đầu vào. Khi thực hiện các chuyển động ngãu nhiên, các đầu vào sẽ bao gồm các vị trí liên quan và thậm chí cả đạo hàm, tích phân của nó. Qua phân tích Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 35 cho thấy các đầu vào được lựa chọn thế nào dựa trên cơ sở mô tả không gian trạng thái của thiết bị. 3.1.3.Cấu trúc của khâu truyền thẳng. Nhìn chung, kết quả của các lựa chọn thiết kế trước đây chỉ ra rằng khâu truyền thẳng sẽ có nhiều đầu vào. Khi thực hiện khâu truyền thẳng nhờ một mạng BSN đa chiều, chúng ta phải đương đầu với vấn đề liên quan đến bậc của hệ thống. Vấn đề này có thể được giải quyết bằng cách thay thế mạng BSN bằng một cấu trúc mạng tinh giảm bao gồm một vài mạng BSN có số chiều thấp hơn. Chương 2 chỉ ra rằng việc này có thể thực hiện được hoặc là dựa trên các hiểu biết cơ bản về động học của hệ thống và nhiễu hay theo cách thức tự động bằng cách sử dụng kỹ thuật mô hình theo kinh nghiệm. 3.1.4. Phân bố B-Spline . Qua phân tích cho thấy rằng độ rộng của B-Spline quá nhỏ sẽ làm cho quá trình học không hội tụ. Đối với một hệ thống LFFC phụ thuộc thời gian, độ rộng tối thiểu của B-Spline sao cho quá trình học hội tụ có thể được xác định dựa trên cơ sở của đáp ứng tần số của vòng phản hồi kín. Qua phân tích cho thấy rằng trong trường hợp một LFFC, độ rộng của B-Spline , khi xem xét theo thời gian nên ở mức phù hợp để bảo đảm rằng quá trình học là hội tụ. Trong trường hợp một mạng BSN nhiều chiều có thể khó khăn khi thiết kế sự phân bố B-Spline thỏa mãn được điều này. Qua phân tích cho thấy rằng làm theo quy tắc có thể giải quyết được vấn đề . 3.1.5. Tỷ lệ học. Tỷ lệ học sẽ xác định các trọng số của mạng BSN thích nghi mạnh đến mức độ nào. Trong Chương 2, giá trị lớn nhất của tỷ lệ học mà làm cho quá trình học hội tụ được xác định nhờ đáp ứng tần số của khâu phản hồi kín. Tỷ lệ học nên được lựa chọn nhỏ (gần 0) khi hệ thống có nhiễu đáng kể. Trường hợp khác có thể lựa chọn tỷ lệ học lớn. Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 36 3.1.6. Luyện các chuyển động. Quá trình luyện một hệ thống LFFC phụ thuộc thời gian và một hệ thống LFFC chỉ bao gồm một mạng BSN có thể được thực hiện theo cách truyền thẳng. Sự quan tâm đặc biệt được thực hiện khi luyện một mạng LFFC tinh giảm. Qua phân tích chỉ ra quá trình luyện đồng thời tất cả các mạng BSN nhìn chung sẽ ảnh hưởng đến tín hiệu học truyền thẳng của tất cả các mạng thay vì chỉ ảnh hưởng đến một mạng BSN mong muốn. Để giải quyết vấn đề này, Các mạng BSN chỉ được luyện một lần vào thời điểm phù hợp. các chuyển động liên quan sẽ được lựa chọn sao cho tín hiệu truyền thẳng mong muốn của một mạng BSN chưa luyện trở nên nổi bật. Chỉ mạng BSN tương ứng được luyện, trọng số của các mạng BSN khác được giữ nguyên. Trong các phần sau đây, các thủ tục thiết kế cho cả hệ thống LFFC phụ thuộc thời gian và LFFC sẽ được trình bày một cách chi tiết hơn. Điều này sẽ được thực hiện trong mô hình LiMMS. 3.2. LiMMS 3.2.1. Thiết lập. LiMMS đã được mô tả trong chương 1. Một mô hình xấp xỉ sử dụng cho mô phỏng được chỉ ra trong hình 3.1. Hình 3.1 Mô hình mô phỏng của LiMMS u y + - y .. y . . FV FC dL coogging + + mL 1 s 1 s 1 Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 37 Khối cogging được mô hình hóa theo phương trình:    xxFC 210.6.1sin10  (3.1) Các thí nghiệm cho thấy rằng (3.1) chỉ là một hàm xấp xỉ đơn giản của đặc tính khối cogging thực tế. Điều này là do các nam châm giá rẻ liên quan đã được sử dụng có độ từ tính đáng kể và các nam châm này không được lắp đặt với độ chính xác cao nhất có thể. Đặc tính của khối cogging có dạng hình sin mà cả chu kì và biên độ đều phụ thuộc vào vị trí của bộ chuyển đổi LiMMS. Thêm vào đó, đặc tính của khối cogging cho thấy nó phụ thuộc vào chiều chuyển động. Trong mô hình mô phỏng chỉ quan tâm đến ma sát nhớt. Giả thiết rằng đặc tính của ma sát trong qua trình thiết lập thực tế có thể được mô tả theo đường cong Stribeck. Chúng ta đi tới kết luận rằng LFFC phải thể hiện được: - Quán tính của LiMMS - Ma sát phi tuyến - Các lực cogging (Lực ăn khớp) 3.2.2. Thủ tụ thiết kế một hệ thống Time-indexed LFFC Trong một số ứng dụng LiMMS phải thực hiện các chuyển động lặp lại. Do đó, đầu tiên chúng ta quan tâm đến một hệ thống Time-indexed LFFC. Thủ tục thiết kế cho một Time-indexed LFFC được đưa ra dưới đây. Bước 1: Thiết kế khâu điều khiển phản hồi Trong các thí nghiệm này, khâu điều khiển phản hồi được thiết kế nhờ một cơ chế tự động điều chỉnh giới thiệu trong phần thiết lập LiMMS. Khâu điều khiển phản hồi là một khâu PD được đặt nối tiếp với một bộ lọc thông thấp:        22 2 400100 400 2752805538     ss ssC (3.2) Bước 2: Xác định độ rộng tối thiểu của miền xác định của các B-Spline và tỷ lệ học lớn nhất. Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 38 Để xác định độ rộng tối thiểu của các B-Spline sao cho quá trình học hội tụ. cần phải có một đồ thị Bode cho hàm độ nhạy bổ xung âm. Đồ thị Bode này thể hiện trong hình 3.2 nhờ một số phân tích tần số thực nghiệm. Nếu bỏ qua lỗi đo lường có thể xác đinh được biên độ đỉnh đạt được tại tần số xấp xỉ 20 Hz. Để tính toán được độ rộng tối thiểu của B-Spline chúng ta cần xác định.                       ....5,3 0cos 1 min 0147.0arccos m n R n jT jT    (3.3) Từ hình 3.2 ta có:    dBjT n 5.35.1  (3.4)       dBjT n R 5.184.0min 0cos    (3.5) Sử dụng (3.4) và (3.5),(3.3) thu được:    49.10263.0arccos1  (3.6) Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 39 Hình 3.2: Đồ thị Bode của –T Tần số mà tại đó độ dịch pha bằng -1,49  là:    11 1042.52   radsrads  (3.7) Điều này cho phép xác định được độ rộng tối thiểu của miền xác định của các B-Spline :    ssd 0192.0 104 2 min    (3.8) Tiếp theo, tỷ lệ học lớn nhất được xác định. Để cho quá trình học hội tụ, tỷ lệ học phải thỏa mãn:      iT 2 (3.9) Sử dụng (3.10) cho ta kết quả:   55.1 5.1 22      iT (3.10) Bước 4: Lựa chọn phân bố B-Spline -п 101 102 52(Hz) -40 102 0 -20 10   T -10 -30 101 Frequency log (Hz) Frequency log (Hz) -1.5п -2п -2.5п -3п -3.5п P h a se [r ad ] m a g [d B ] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 40 Phân bố B-Spline phải được lựa chọn sao cho độ rộng của miền xác định của các B-Spline lớn hơn dmin Bước 5: Lựa chọn một tỷ lệ học Như đã thảo luận trong các phần trước, tỷ lệ học  sẽ được chọn nhỏ (gần bằng 0) nếu hệ thống chịu ảnh hưởng lớn của nhiễu. Nếu không một tỷ lệ học  lớn hơn sẽ được lựa chọn. Khi      iT 1 0 sai số bám sẽ giảm từ từ. Khi           iTiT 21 Sẽ làm cho sai số bám giảm theo cách thức dao động. Do chúng ta xem như tỷ lệ học vừa rồi là không mong muốn , chúng tôi khuyến nghị sử dụng   67.0 1      iT Bước 6: Huấn luyện hệ thống Time-indexed LFFC Luyện hệ thống Time-indexed LFFC theo phương thức luyện mạng truyền thẳng. 3.2.3. Các thí nghiệm kiểm chứng cho hệ thống Time-indexed LFFC Trong phần sau đây, hai chuỗi thí nghiệm sẽ được thực hiện. Mục đích của một số thí nghiệm đầu tiên là kiểm chứng độ rộng tối thiểu của miền xác định của các B-Spline và tỷ lệ học lớn nhất. sau đó, khả năng của kỹ thuật phân cụm mờ xác định một phân bố B-Spline sẽ được kiểm tra. Để khiểm chứng độ rộng tối thiểu của miền xác định của các B-Spline và tỷ lệ học lớn nhất, các giá trị này sẽ được xác định nhờ các thí nghiệm. Vị trí tham chiếu mà LiMMS phải bám được đưa ra trong hình 3.3. Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 41 Hình 3.3: Vị trí tham chiếu Thí nghiệm 3.1 (Độ rộng và tỷ lệ học theo các quy luật) Trong thí nghiệm đầu tiên, miền xác định của B-Spline được chọn lớn hơn một chút so với miền xác định tối thiểu do đó d=0,0197[s]. Để đảm bảo rằng hoạt động không ổn định xảy ra trong thực tế là do độ rộng quá nhỏ của miền xác định của các B-Spline chứ không phải do tỷ lệ học quá lớn, giá trị của tỷ lệ học được chọn nhỏ hơn nhiều so với giá trị lớn nhất  =0,6. Các giá trị này sẽ cho kết quả là một hệ thống LFFC hoạt động tốt và ổn định. Sai số bám trước quá trình học được cho ở hình 3.4. Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 42 Hình 3.4: Sai số bám khi chưa luyện Sau 10 chu kỳ lặp lại, Time-indexed LFFC đã hội tụ. Để kiểm tra xem liệu LFFC còn ổn định không qúa trình học được tiếp tục. Trong hình 3.5 cho thấy sai số bám sau 400 chu kỳ chạy. Nhờ quá trình học, sai số bám dã giảm đáng kể. Bộ điều khiển vẫn ổn định và cơ chế học đã hội tụ, điều này có nghĩa là sai số bám không giảm hơn nữa. Hình 3.5 Các thí nghiệm với d > dmin và maxdd   Thí nghiệm 3.2 (Độ rộng không tuân thủ các quy tắc) Trong thí nghiệm thứ 2 miền xác định của các B-Spline được lựa chọn nhỏ hơn dmin d =0,0183[s]. Tỷ lệ học vẫn được lựa chọn lại như thi nghiệm 1  =0,6. Khi các giá trị này được sử dụng, LFFC sẽ trở nên không ổn định. Hình 3.6 cho thấy sai số bám sau 200 chu kỳ. Sau khi sai số giảm trong một số chu kỳ đầu, nó bắt đầu tăng khi quá trình học được tiếp tục. Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 43 Hình 3.6 Các thí nghiệm với d <dmin và maxdd   Sử dụng kết quả này và kết quả trong thí nghiệm 3.1, ta có thể đi đến kết luận rằng giá trị của dmin là không bảo toàn. Khi miền xác định của các B-Spline được chọn chỉ cần nhỏ hơn một chút so với dmin sẽ cho kết quả là một hệ thống LFFC không ổn định. Thí nghiệm 3.3 (Xác định tỷ lệ học cực đại) Tiếp theo, tỷ lệ học cực đại  như đã tính toán theo (3.10) được kiểm chứng. Điều này được thực hiện nhờ tìm kiếm giá trị thực nghiệm lớn nhất của  theo cách thức lặp lại. Độ rộng tối thiểu của miền xác định của các B-Spline được chọn là d=0,035[s]. Kết quả của các thí nghiệm này cho thấy tỷ lệ học lớn nhất bằng 2. Điều này có thể được thấy rõ qua 2 thí nghiệm sau đây. Đầu tiên, tỷ lệ học được chọn là  =1,98. Trong hình 3.7 thể hiện sai số bám trong chu kỳ đầu tiên, chu kỳ thứ 15 và 50 . sai số bám hội tụ chậm và vẫn còn nhỏ khi quá trình học tiếp tục. Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 44 Hình 3.7: Thí nghiệm về tỷ lệ học d > dmin và  =1,98 Tiếp theo, tỷ lệ học được chọn là  =2,01. Hình 3.8 cho thấy sai số bám trong chu kỳ đầu và chu kỳ thứ 6. Thấy rõ rằng sai số bám tăng lên. Hình 3.8: Thí nghiệm về tỷ lệ học d > dmin và  =2,01 Khi quá trình học tiếp tục. Sai số bám thậm chí còn tăng hơn. Giá trị lớn nhất của  được xác định trong 3.10 và do đó là một giá trị xác định. Tiếp theo, kỹ thuật phân cụm mờ được sử dụng để xây dựng nên một phân bố B-Spline cho Time-indexed LFFC. Tuy nhiên, một LFFC như vậy liên quan đến các tập dữ liệu nhiều chiều. Độ phức tạp khi tính toán của phân cụm mờ sẽ làm Learning feed-forward control 36.9 37 37.1 37.2 37.3 37.4 37.5 37.6 time {s} -0.0004 -0.0003 -0.0002 -0.0001 0 0.0001 0.0002 0.0003 0.0004 PositionError [m] Run 50 Run 15 Run 1 Learning feed-forward control 44.85 44.9 44.95 45 45.05 45.1 45.15 time {s} -0.0002 -0.00015 -0.0001 -5e-005 0 5e-005 0.0001 PositionError [m] run 1 run 6 Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 45 cho thời gian tính toán lớn. Do vậy, chúng ta lựa chọn chứng minh phân cụm mờ sử dụng cho một hệ Time-indexed LFFC. Vị trí tham chiếu mà LiMMS phải bám được chỉ ra trong hình 3.9. Hình 3.9: Vị trí tham chiếu cho thí nghiệm phân cụm mờ Thí nghiệm 3.4 (Bước đầu tiên của thuật toán phân cụm) Ý tưởng cơ bản của việc sử dụng kỹ thuật mô hình kinh nghiệm cho LFFC như sau. Sau khi quá trình học hội tụ. Một sai số bám (và uc) vẫn còn tồn tại. Khi sử dụng phân bố B-Spline hiện tại, BSN không thể xấp xỉ tốt hơn tín hiệu truyền thằng mong muốn. Nói cách khác, không thể xấp xỉ uF+uc. Để khắc phục vấn đề này, các kỹ thuật mô hình kinh nghiệm được sử dụng để tìm ra một phân bố B- Spline tốt hơn có khả năng xấp xỉ uF+uc. Do tại lục bắt đầu thuật toán uf=0. Do đó phân bố B-Spline ban đầu phụ thuộc vào uc. Phân bố B-Spline ban đầu có thể được xây dựng hoặc nhờ phân cụm mờ hoặc bằng tay ( sau đó phân cụm mờ sẽ Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 46 tối ưu phân bố B-Spline này). Đầu ra của bộ điều khiển phản hồi và sai số bám kết quả được đưa ra trong hình 3.10 và 3.11. Hình 3.10: Đầu ra của bộ điều khiển phản hồi Hình 3.11: Sai số bám của bộ điều khiển phản hồi Learning feed-forward control 6 6.2 6.4 6.6 6.8 7 7.2 7.4 7.6 time {s} 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 ProcessOutput [m] Learning feed-forward control 9 9.1 9.2 9.3 9.4 time {s} 0 2e-005 4e-005 6e-005 8 -005 0.0001 0.00012 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 47 Một phân bố B-Spline được lựa chọn là phân bố có số lượng B-Spline nhỏ nhất. Theo cáh này, vị trí của các B-Spline quyết định lớn đến khả năng của LFFC trong việc bù nhiễu ngẫu nhiên một cách chính xác như cogging. Trong nghiên cứu này, chúng ta chọn phân bố B-Spline ban đầu thực hiện bằng tay, dựa trên hình dạng của uc (hình 3.10). Mạng BSN xấp xỉ uc nhờ một số hàm đa thức bậc nhất. Khoảng 75 hàm đa thức bậc nhất được lựa chọn để tạp nên một xấp xỉ thô cho tín hiệu uc. Do đó, tổng cộng 75 B-Spline được lựa chọn. Tỷ lệ học được chọn nhỏ 0,4  . Sai số bám còn lại sau quá trình luyện mạng có thể được thấy trên hình 3.12 (chú ý rằng tỷ lệ ở đây khác so với hình 3.11). Hình 3.12: Sai số bám sử dụng phân bố B-Spline ban đầu Sau 8 lần thực hiện quãng đường tham chiếu quá trình học hội tụ và sau đó không cải thiện được thêm nữa. Sai số bám đã giảm 10 lần so với sai số bám của bộ điều khiển phản hồi. Thí nghiệm 3.5 (Kết quả của thuật giải phân cụm) Để thu được hoạt động hiệu quả hơn, kỹ thuật phân cụm mờ được sử dụng để tối được phân bố B-Spline. Sau khi thuật toán phân cụm mờ (được mô tả trong Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 48 chương 2) được thực hiện hai lần, sai số bám không cải thiện thêm nữa. trong hình 3.13 cho thấy kết quả của sai số bám sau quá trình tối ưu. Hình 3.13: Sai số bám sử dụng phân bố cải tiến Có thể thấy rằng phân cụm mờ có thể cho phép thu được phân bố B-Spline cho sai số bám nhỏ hơn phân bố B-Spline khởi tạo. 3.2.4. Thiết kế một LFFC tối giản. Bước thiết kế 1: Thiết kế khâu điều khiển phản hồi Bộ điều khiển phản hồi tương tự được sử dụng như trong trường hợp Time- indexed LFFC        22 2 400100 400 2752805538     ss ssC (3.11) Bước 2: Xác định các đầu vào cho khâu truyền thẳng Có thể xác định các đầu vào yêu cầu của khâu truyền thẳng nhờ mô tả động học của hệ thống theo khuôn dạng đã được giới thiệu. Đối với LiMMS, từ các kết Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 49 quả này đưa tới các mô tả trong không gian trạng thái sau đây     u mm xF m xxF x x m d x x LL f L C L L                                         1 0 . 0 0 10    (3.12)          x x v  01 Trong đó đại diện cho ma sát Coulomb... . ( )CF x mô tả lực ăn khớp (lực cogging) và dL chính là ma sát nhớt, tùy thuộc vào từng loại hệ thống mà LiMMS có thể được điều khiển bởi LFFC. Từ 3.12 chúng ta thu được tín hiệu truyền thẳng mong muốn như sau: Do vậy, khâu truyền thẳng sẽ có các đầu vào sau đây:  rrr ,,  Bước 3: Chọn cấu trúc của khâu truyền thẳng Từ 3.13 có thể thấy rõ rằng ud bao gồm 3 thành phần độc lập lẫn nhau -Thành phần bù ma sát:  rFrd fL  yêu cầu một BSN có r là đầu vào -Thành phần bù cogging:  rrFcog , . Trong phần đầu của chương này có tranh luận rằng các đặc tính của cogging có sự khác biệt đối với vận tốc dương và âm. Chúng ta có thể thay thế cogging bằng một BSN với hai đầu vào là r và r . Do các đặc tính cogging chỉ phụ thuộc vào chiều chuyển động nên cũng có thể thay thế cogging nhờ 2 BSN. Mỗi BSN cho một chiều chuyển động. Xuất phát từ Từ quan điểm tối giản, lựa chọn sau là hấp dẫn hơn cả. -Thành phàn bù quán tính . Yêu cầu một BSN có đầu vào là r Bằng cách tạo ra mỗi BSN cho các thành phần trên, ta thu được các kết quả cho LFFC tối giản như sau: Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 50 Hình 3.14: LFFC tối giản cho LiMMS Bước 4: Chọn phân bố B-Spline Mỗi khi một cấu trúc mạng được tạo thành. Một phân bố B-Spline phải được lựa chọn. Các B-Spline được xác định dựa trên chuyển động tham chiếu cần được mở rộng một cách hiệu quả khi xem xét trên quan điểm thời gian (xem phần trước). Do vậy, phân tích được thực hiện ở bước 2 trong thủ tục thiết kế một Time-indexed LFFC sẽ được tiến hành cho LFFC. Xuất phát từ thủ tục thiết kế trước đó, chúng ta biết rằng các B-Spline tối thiểu phải rộng 0,0192 [s]. Cùng với vấn đề này, chúng ta thiết kế một phân bố B-Spline dựa trên cơ sở các kiến thức có được trước đó về động học hệ thống và nhiễu: - Các BSN cogging. Chu kỳ của cogging là 1.6 [cm]. Để có thể xấp xỉ chính xác tín hiệu truyền thẳng mong muốn sao cho có thể mô tả xấp xỉ bằng phương trình  r210.6.1sin10  , chúng ta lựa chọn định nghĩa 500 B-Spline trên miền không gian đầu vào     mm 11.0.61.0 . Điều này có nghĩa là có 21 B-Spline sẽ được - r C P BSN BSN BSN r .. r . + e UC + + + + + + UF y Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 51 định nghĩa cho một chu kỳ của cogging. Độ rộng của các B-Spline là 0,00144 [m]. Hình 3.15 mô tả một phần của phân bố B-Spline và tín hiệu truyền thẳng mong muốn (dựa vào cogging trong mô hình mô phỏng). Độ rộng của các B-Spline là đủ nhỏ sao cho xấp xỉ chính xác tín hiệu truyền thẳng mong muốn. Hình 3.15; Phân bố B-Spline của BSN ma sát Để bảo đảm rằng theo thời gian, độ rộng của các B-Spline tối thiểu là 0,0192 [s] , BSN này phải được luyện ở vận tốc tham chiếu thỏa mãn điều kiện sau đây:        1075.0 0192.0 00144.0  ms s m tr (3.14) - BSN ma sát: Do đặc tính của ma sát là phi tuyến nên chúng ta lựa chọn định nghĩa 10 B-Spline trên miền không gian đầu vào     11 1,1  msms . Chú ý rằng phân bố B-Spline này không đủ mật độ phân bố để bù cho lực ma sát. 0.14 [cm] 0 1 0.5 μ 1.6 [cm] u d cogging 10 r -10 r Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 52 Hình 3.16 Phân bố B-Spline của BSN ma sát Độ rộng của các BSN là 0,2 [ms-1]. Do vậy, BSN này phải được luyện tại một gia tốc tham chiếu thỏa mãn:        2 1 4.10 0192.0 2.0    ms s ms tr (3.15) - BSN quán tính: BSN này phải học một hàm tuyến tính đơn giản rmL . Tín hiệu truyền thẳng này có thể được tạo ra bằng cách chỉ sử dụng 3 B-Spline được định nghĩa trong khoảng     22 5,5  msms Hình 3.17: Phân bố B-Spline của BSN quán tính Bước 5: Chọn tỷ lệ học Trong các thí nghiệm này, tỷ lệ học được chọn khá nhỏ ví dụ 0,1 Bước 6: Luyện hệ thống LFFC Do LFFC bao gồm nhiều BSN nên một loạt các thí nghiệm luyện mạng cần phải được lựa chọn trong đó mỗi một BSN được luyện một cách riêng biệt. Các chuyển động tham chiếu phải được lựa chọn sao cho tín hiệu truyền thẳng mong 0.14 [cm] 0 1 0.5 μ r[ms-1] . -5 0 1 0.5 μ 5 0 Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 53 muốn của một trong các BSN chưa luyện (được gay ra bởi một hiện tượng vật lý) trở thành nổi bật. Áp dụng cho LiMMS, BSN đầu tiên dược luyện là cogging BSN. Nhờ lựa chọn một chuyển động tham chiếu sao cho có một vận tốc thấp và gia tốc thấp làm cho ảnh hưởng của ma sát nhớt và quán tính trở nên nhỏ. Đối với chuyển động tham chiếu này, ảnh hưởng vật lý quan trọng là cogging, ma sát coulomb và stiction. Do vậy tồn tại hai BSN cogging, một cho vận tốc dương và một cho vận tốc âm, chúng cũng có thể học để bù ma sát coulomb. Hình 3.18: Luyện chuyển động cho các cogging BSN Sau khi áp dụng cho các thực nghiệm luyện mạng kể trên, các kết quả cảu ánh xạ đầu vào đầu ra cho các BSN riêng biệt được thể hiện trong hình vẽ 3.19 sau đây. Có thể thấy rõ rằng ánh xạ này bao gồm các thành phần hình sin thay thế cho cogging và song song thây thế cho ma sát coulomb. Xuất phát từ sự thực rằng r[m] r[ms-1] . 0.015 0 -0.015 0 40 80 t[s] 0 40 80 t[s] 0 40 80 t[s] r[ms-2] . . 0.04 0 -0.04 0 -0.3 Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 54 các phần hình sin của tín hiệu truyền thẳng là khác nhau, chúng ta đi đến kết luận là các đặc tính cogging thực sự phụ thuộc vào chiều chuyển động. Hình 3.19 a, Ánh xạ vào ra của cogging BSN với vận tốc dương b. Ánh xạ vào ra của cogging BSN với vận tốc âm Tiếp theo, các BSN gia tốc được luyện. Do cogging và ma sát colum đã được bù bởi các cogging BSN, chuyển động tham chiếu sẽ được chọn sao cho ảnh hưởng của ma sát nhớt là nhỏ. Điều này có thể được thực hiện bằng cách lựa chọn chuyển động tham chiếu bao gồm một loạt các thay đổi gia tốc dương và âm (xem hình 3.20) Hình 3.20 Luyện chuyển động cho BSN quán tính 0.05 UF 0.015 0 -0.015 -0.3 0 r[m] UF 0.015 0 -0.015 -0.3 0 r[m] r[10 -3m] r[ms -1] . 0.03 0 -0.03 0 0.1 0.2 t[s] 0 0.1 0.2 t[s] 0 0.1 0.2 t[s] r[ms-2] . . 2 0 -2 -1 0 -0.5 Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 55 Hình 3.21 chỉ ra các kết quả của quan hệ vào ra của BSN. Nó giống như quan hệ vào ra mong muốn có nghĩa là một hàm tuyến tính đi qua gốc tọa độ. Hình 3.21: ánh xạ vào ra của BSN quán tính Cuối cùng, BSN ma sát được luyện. Do tất cả các hiện tượng khác đã được thay thế cho bất kỳ loại chuyển động tham chiếu nào có thể áp dụng. Để thay thế ma sát một cách chính xác, chúng ta chọn luyện BSN ma sát qua hai gian đoạn. Chuyển động tham chiếu trong thí nghiệm đầu tiên sẽ bao gồm một dải rộng tốc độ, xem hình 3.22 Hình 3.22 Chuyển động luyện đầu tiên cho BSN vận tốc UF 0.1 0 -0.1 -2 2 0 r[ms-2] .. t[s] r[m] r[ms -1] . 0.8 0 -0.8 0 1 2 t[s] 0 1 2 0 1 2 t[s] r[ms-2] . . 1.5 0 -1.5 -0.3 0 -0.15 Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 56 Trong chuyển động tham chiếu trên, vận tốc tham chiếu chỉ là nhỏ trong một thời gian ngắn. LFFC có thể sẽ không học để thay thế một cách chính xác cho ma sát ở vận tốc thấp. Do vậy, chuyển động tham chiếu thứ 2 được sử dụng trong đó vận tốc tham chiếu là nhỏ. Hình 3.23: Huấn luyện BSN cho velocity Khi nhìn vào ánh xạ vào ra của BSN ma sát (Hình 3.24a), ta có thể thấy rằng. Hệ thống không thay thế ma sát một cách chính xác ở các vận tốc cao. Tại các vận tốc trung bình, ma sát nhớt xuất hiện có dạng tuyến tính. Hình 3.24b cho thấy ánh xạ vào ra của BSN quán tính Hình 3.24: Ánh xạ vào ra của BSN ma sát t[s] r[m] r[ms -1] . 0.15 0 -0.15 0 5 10 t[s] 0 5 10 0 5 10 t[s] r[ms-2] . . 1.5 0 -1.5 -0.3 0 -0.15 UF 0.04 0 -0.04 -0.8 0.8 0 . Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 57 3.2.5. Các thực nghiệm kiểm chứng Trong phần này,hoạt động của LFFC tối giản được kiểm chứng. Điều này được thực hiện bằng cách đưa ra 3 chuyển động tham chiếu mà LFFC chưa được luyện. Chúng ta sẽ so sánh hoạt động bám điều khiển của LFFC tối giản với hoạt động bám của bộ điều khiển phản hồi và một hệ thống Time-indexed LFFC. Thí nghiệm 3.6 (Chuyển động kiểm chứng 1) Chuyển động kiểm chứng đầu tiên là chuyển động với vận tốc thấp (hình 3.25). Hình 3.25: Chuyển động kiểm chứng 1: vận tốc thấp Chuyển động đánh giá này được thực hiện bởi một Time-indexed LFFC trong đó độ rộng của các B-Spline là 0,04 [s]. Trong hình 3.26 chi thấy hoạt động bám của bộ điều khiển (chú ý các tỷ lệ khác). r[ms-1] r[m] r[ms -1] . 0.075 0 -0.075 0 5 10 t[s] 0 5 10 0 5 10 t[s] r[ms-2] . . 1.5 0 -1.5 -0.2 0 -0.1 Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 58 Hình 3.26 a, Sai số bám của bộ điều khiển phản hồi b , Sai số bám của bộ điều khiển tối giản c, Sai số bám của bộ điều khiển Time-indexed LFFC (d=0,04 s) Bộ LFFC tối giản đạt được một sai số bám nhỏ hơn 10 lần so với sai số bám của bộ điều khiển phản hồi. Hình 3.26b cho thấy sai số bám có thành phần song song dạng tương tự như vận tốc tham chiếu . Điều này là do ma sát. Rõ ràng, BSN ma sát không bù đắp hết được ma sát. Thêm vào đó, một thành phần hình sin xuất hiện trong sai số bám có thể là do cogging BSN không được luyện đúng hoặc có một hiện tượng khác, một số lỗi có thể trong quá trình thay thế cũng dẫn đến một sai số bám tương tự. Hệ thống Time-indexed LFFC cho thấy có sai số bám nhỏ hơn so với LFFC tối giản do tín hiệu truyền thẳng của Time-indexed LFFC đã hội tụ. Chúng ta giả sử rằng các hiện tượng được bù đắp có thể tái sinh. Chúng ta kết luận rằng hoặc các BSN của LFFC tối giản không được luyên đủ chính xác hoặc có một hiện tượng tồn tại mà không được thay thế bởi tập BSN này. Do sai số bám là khá nhỏ hơn e[10 -4m] 0 5 10 t[s] -4 4 0 e[10 -5m] 0 5 10 t[s] -4 4 0 e[10 -5m] 0 5 10 t[s] -4 4 0 a, b, c, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 59 so với biên độ của phần hình sin trong sai số bám sau quá trình luyện cogging BSN (hình minh họa không được đưa vào luận văn này) nên kết luận sau có độ chính xác cao hơn. Thí nghiệm 3.7 (Chuyển động kiểm chứng 2) Vị trí tham chiếu, vận tốc và gia tốc của chuyển động tham chiếu thứ 2 được trình bày trong hình 3.27. Hình3.27: Chuyển động đánh giá 2: Tốc độ trung bình Kết quả của sai số bám được chỉ ra trong hình dưới đây. r[m] r[ms-1] . 0.03 0 -0.03 0 1 2 t[s] 0 0.2 t[s] 0 1 2 t[s] r[ms-2] . . 2 0 -2 -0.1 0 -0.05 Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 60 Hình 3.28 a, Sai số bám của khâu điều khiển chỉ sử dụng phản hồi b, Sai số bám của LFFC tối giản c, Sai số bám của Time-indexed LFFC (d=0,04s) Trong trường hợp này sai số của LFFC tối giản cũng lại nhỏ hơn 10 lần so với sai số bám của bộ điều khiển phản hồi. Kết luận rằng có một hiện tượng khác ngoài cogging làm cho sai số bám vẫn còn gợn sóng được khẳng định trong hình 3.28b. Biên độ trung bình của phần gợn sóng trong sai số bám tăng có nghĩa là nhiễu phụ thuộc vào tốc độ của LiMMS. Sai số bám nhỏ nhất có thể đạt được khi sử dụng Time-indexed LFFC Thí nghiệm 3.8 (Chuyển động kiểm chứng 3) Chuyển động đáng giá cuối cùng được giới thiệu trong hình 3.29 e[10 -4m] 0 1 2 t[s] -4 4 0 e[10 -5m] 0 1 2 t[s] -4 4 0 e[10 -5m] 0 1 2 t[s] -4 4 0 a, b, c, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 61 Hình 3.29: Chuyển động kiểm chứng 3: tốc độ nhanh Hình 3.30 cho thấy các kết quả của sai số bám Hình 3.30: a, Sai số bám của khâu điều khiển chỉ sử dụng phản hồi b, Sai số bám của LFFC tối giản c, Sai số bám của Time-indexed LFFC (d=0,03s) r[m] r[ms-1] . 0.5 0 -0.5 0 1 2 t[s] 0 0.2 t[s] 0 1 2 t[s] r[ms-2] . . 2 0 -2 -0.15 0 -0.075 a, b, c, e[10 -4m] 0 1 2 t[s] -4 4 0 e[10 -5m] 0 1 2 t[s] -4 4 0 e[10 -5m] 0 1 2 t[s] -4 4 0 a, b, c, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 62 Hình 3.30 chỉ ra rằng sai số bám lớn tại các điểm theo thời gian mà vận tốc bằng 0. chúng ta kết luận rằng LFFC tối giản không thể bù đắp được stiction được phát sinh trên cơ sở của quan hệ vào ra của BSN vận tốc (3.24). Như các trường hợp trước, sai số bám của Time-indexed LFFC là nhỏ nhất. 3.2.6. Kết luận Các thí nghiệm sử dụng Time-indexed LFFC đã được thực hiện nhằm kiểm chứng các điều kiện ổn định được thực hiện ở chương 2. Các kết quả của các thí nghiệm này tương tự như kết quả của các quá trình mô phỏng. Điều này có nghĩa là giá trị của dmin là chính xác trong khi tỷ lệ học cực đại là một giá trị khá thấp. Bất chấp giá trị thấp của tỷ lệ học cực đại, quá trình học hội tụ sau một số chu kỳ hoạt động giới hạn (thông thường từ 10 đến 15) . Một LFFC tối giản đã được thiết kế cho LiMMS. Để luyện LFFC tối giản, một số các thí nghiệm luyện được lựa chọn. Các thí nghiệm mà không được đề cập trong luận văn này cho thấy rằng qua trình luyện LFFC tối giản cần được thực hiện một cách cẩn thận. Lựa chọn một chuyển động luyện không phù hợp sẽ làm cho BSN xấp xỉ đến tín hiệu truyền thẳng sai. Tất cả các BSN được luyện sau đó cũng cho một tín hiệu truyền thẳng co lỗi. Sau quá trình luyện quan hệ vào ra của BSN phải được kiểm tra để đảm bảo rằng nó không xấp xỉ (một phần) một tín hiệu truyền thẳng của một BSN khác trong LFFC tối giản. Các chuyển động luyện mạng được thực hiện trong chương này cho kết quả là một LFFC tối giản có thể đạt được sai số nhỏ hơn 10 lần so với bộ điều khiển phản hồi. Time- indexed LFFC cho thấy còn đem lại sai số bám thậm chí nhỏ hơn so với LFFC tối giản. Điều này là do một hiện tượng khác ngoài các hiện tượng quan tâm rong phần lựa chọn cấu trúc của BSN. 3.3. Kết quả mô phỏng bằng phần mềm 20-sim. Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 63 3.3.1. Bộ điều khiển feedback. a. Sơ đồ mô phỏng : Hình 3.31: Sơ đồ mô phỏng hệ thống khi chỉ có FeedBack. b.Kết quả mô phỏng: Learning feed-forward control -0.05 0 0.05 0.1 Reference [m] -0.05 0 0.05 0.1 ProcessOutput [m] 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 64 Hình 3.32: Kết quả mô phỏng hệ thống khi chỉ có Feedback tham gia Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 65 3.3.2. LFFC khi có ViscouNeural. a. Sơ đồ mô phỏng : Hình 3.33: Sơ đồ mô phỏng b, So sánh kết quả mô phỏng. Hình 3.34: So sánh kết quả mô phỏng lực Viscou tạo ra và lực Viscou thật. a, Lực Viscou được tạo ra a, b, Learning feed-forward control -0.6 -0.4 -0.2 0 0.2 0.4 Estimated viscous force [N] 50 55 60 65 70 time {s} -0.6 -0.4 -0.2 0 0.2 0.4 0.6 True viscous force [N] {m/s} Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 66 b, Lực Viscou thật Vai trò của bù lực Viscou được thể hiện rõ ràng bằng cách so sánh kết quả mô phỏng như được chỉ ra trong Hình 3.35a và Hình 3.35b. Khi BSN Viscou được sử dụng, tín hiệu error được giảm đáng kể. Hình 3.35: So sánh kết quả mô phỏng error trước và sau khi có bù lực Viscou. a, Khi chỉ có Feedback b, Khi có thêm bù lực Viscou 3.3.3. LFFC khi có CoulombNeural và ViscouNeural. a. Sơ đồ mô phỏng : Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Le ning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] a, b, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 67 Hình 3.36: Sơ đồ mô phỏng b. So sánh kết qủa mô phỏng: Hình 3.37: So sánh kết quả mô phỏng lực Coulomb được tạo ra và lực Coulomb thật. a, Lực Coulomb thực b, Lực Coulomb được tạo ra Vai trò của CoulombNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô phỏng của tín hiệu error như được chỉ ra trong Hình 3.38a và Hình 3.38b. Hình 3.38: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù lực Coulomb. a, Khi chỉ có Feedback và NeuralViscou 0 Learning feed-forward control -0.25 -0.15 -0.05 0.05 0.15 True coulomb force [N] 16 17 18 19 20 21 22 time {s} -2 -1 0 1 2 Estimated coulomb force [N] {N} 0. 4 0.2 0 -0.2 0 -0.4 -0.4 -0.2 0 0.2 0.4 a, b, Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Le ning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 68 b, Khi có thêm bù lực Coulomb Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 69 3.3.4. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural. a. Sơ đồ mô phỏng : Hình 3.39: Sơ đồ mô phỏng b. So sánh kết quá mô phỏng: Hình 3.40: So sánh kết quả mô phỏng tín hiệu lực Cogging được tạo ra và lực Cogging thật. a, Lực Cogging thật b, Lực Cogging được tạo ra Learning feed-forward control -0.3 -0.2 -0.1 0 0.1 0.2 True cogging force [N] 93 94 95 96 97 98 99 100 time {s} -0.2 -0.1 0 0.1 0.2 Estimated cogging force [N] a, b, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 70 Vai trò của CoggingNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô phỏng của tín hiệu error như được chỉ ra trong Hình 3.41a và Hình 3.41b. Hình 3.41: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù lực Cogging. a, Khi chỉ có Feedback và ViscouNeural, CoulombNeural. b, Khi có thêm tín hiệu bù lực Cogging. 3.3.5. LFFC khi có CoulombNeural, ViscouNeural, CoggingNeural, InertialNeural. a. Sơ đồ mô phỏng : Hình 3.42: Sơ đồ mô phỏng Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Le ning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] a, b, Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 71 b. So sánh kết quá mô phỏng: Hình 3.43: So sánh kết quả mô phỏng lực Inertia được tạo ra và lực Inertia thật. a, Lực Inertia được tạo ra. b, Lực Inertia thật. Vai trò của InertiaNeural được thể hiện rõ ràng bằng cách so sánh kết quả mô phỏng của tín hiệu error như được chỉ ra trong Hình 3.43a và Hình 3.43b. Hình 3.44: So sánh kết quả mô phỏng tín hiệu error trước và sau khi có bù lực Inertia. a, Khi chỉ có Feedback và ViscouNeural, CoulombNeural, CoggingNeural b, Khi có thêm tín hiệu bù lực Inertia. Learning feed-forward control -0.6 -0.4 -0.2 0 0.2 0.4 Estimated inertia force [N] 10 15 20 25 30 time {s} -0.4 -0.2 0 0.2 0.4 0.6 True inertia force [N] {m/s} a, b, Le rning fe d-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Chương 3: Thiết kế ứng dụng Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 72 So sánh kết quả mô phỏng tín hiệu error khi bộ điều khiển chỉ có Feedback và khi có LFFC tham gia. Hình 3.45: So sánh kết quả mô phỏng tín hiệu error khi bộ điều khiển chỉ có Feedback và khi có LFFC tham gia a, Khi chỉ có Feedback b, Khi có thêm tín hiệu bù lực Viscou, lực Coulomb, lực Cogging lực Inertia Learning feed-forward control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] Learning feed-forw rd control 0 10 20 30 40 50 60 70 80 90 100 time {s} -0.001 -0.0005 0 0.0005 0.001 PositionError [m] a, b, Chương 4: Kết luận Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 71 Chương 4: KẾT LUẬN Trong Chương 1, đưa ra khái niệm của LFFC, đó là một bộ điều khiển học có phản hồi sai số trong đó phần truyền thẳng là một mạng B-Spline (BSN). Vấn đề quan trọng là phải thiết kế phần truyền thẳng của LFFC sao cho quá trình học là hội tụ và cùng với đó là phải làm sao cho bậc của hệ thống phải được giữ ở mức tối thiểu. Đây là hai chủ đề chính được đề cập đến trong luận văn. Trong Chương 2 và 3, đề cập đến bộ điều khiển LFFC phụ thuộc thời gian, là bộ điều khiển mà thời gian chuyển động theo chu kỳ là đầu vào duy nhất của BSN. Trong trường hợp này, LFFC tương tự như điều khiển học lặp lại và điều khiển lặp lại. Do vậy, em đưa ra ý tưởng sử dụng các kết quả hội tụ của điều khiển học lặp lại và điều khiển lặp lại trong quá trình thiết lập LFFC. Trong điều khiển học lặp lại và điều khiển lặp lại phần truyền thẳng được thiết kế như một vòng lặp có nhớ. Thay vì luyện phần truyền thẳng bởi đầu ra của bộ điều khiển phản hồi, tín hiệu học có thể nhận được bằng cách lọc sai số bám nhờ một bộ lọc có khả năng học. Bộ lọc này được thiết kế dựa trên một mô hình gần đúng của hệ thống bị điều khiển. Phân tích về độ ổn định cho thấy rằng các yếu tố động học tần số cao không mô hình hóa được sẽ làm cho tín hiệu truyền thẳng của điều khiển học lặp lại và RC không hội tụ. Quá trình hội tụ có thể đạt được bằng việc điều chỉnh vòng lặp có nhớ theo cách thức sao cho các thành phần tần số làm cho mô hình của hệ thống bị điều khiển (kéo theo bộ lọc có khả năng học) trở nên không chính xác sẽ bị loại bỏ. LFFC phụ thuộc thời gian có thể được xem như là một loại điều khiển học lặp lại / điều khiển lặp lại trong đó quá trình học được ổn định hóa nhờ thay thế vòng lặp có nhớ bởi một BSN và phần điều khiển phản hồi được sử dụng như là một bộ lọc có học. Các thành phần tần số trong quan hệ vào ra của một BSN phụ thuộc vào độ rộng của miền xác định của B-Spline. Chọn độ rộng lớn sẽ ảnh hưởng đến tín hiệu truyền thẳng tần số thấp, trong khi đó độ rộng nhỏ sẽ tác động đến tín hiệu truyền thẳng tần số cao. Do vậy, các kết quả thu được từ điều khiển Chương 4: Kết luận Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 72 học lặp lại và điều khiển lặp lại cho ta thấy rằng quá trình học có thể được ổn định bằng cách chọn độ rộng của miền xác định của B-spline sao cho BSN không thể xấp xỉ thành phần tần số cao của tín hiệu học. Nhờ các giả định nghiêm ngặt (một trong số đó là hệ thống điều khiển phải là SISO LTI-Hệ thống tuyến tính bất biến một đầu vào một đầu ra) , chúng ta có thể mô tả một cách định lượng : chúng ta đưa ra các điều kiện ổn định cho độ rộng tối thiểu của miền xác định của các B-Spline, dmin, và cho tỷ lệ học tối đa. Các yếu tố ổn định này được kiểm chứng nhờ các quá trình mô phỏng. Trong luận văn này, LFFC phụ thuộc thời gian được áp dụng cho LiMMS. Do LiMMS là hệ thống phi tuyến, nó không thỏa mãn giả thiết cho việc phân tích sự ổn định. Bất chấp điều này, các kết quả trong quá trình mô phỏng cho thấy giá trị dmin là chính xác và tỷ lệ học tối đa cũng ổn định. Đối với các chuyển động đặt trước ngẫu nhiên, LFFC phụ thời gian không thể áp dụng được. Thay vào đó phải sử dụng hệ thống LFFC phụ thuộc quỹ đạo, có nghĩa là tín hiệu đặt trước cùng với đạo hàm hoặc tích phân của nó được sử dụng như là các đầu vào của phần truyền thẳng. Chúng ta không thể đưa ra các điều kiện ổn định cho quá trình thiết kế các tham số của một BSN trong LFFC phụ thuộc quỹ đạo. Trong một số trường hợp (ví dụ như khi vận tốc đặt trước là không đổi), các điều kiện ổn định của LFFC phụ thuộc thời gian có thể được chuyển thành các điều kiện ổn định cho LFFC phụ thuộc quỹ đạo. Về bản chất có thể nói rằng miền xác định của các B-Spline (đa chiều) pahỉ chứ tối thiểu dmin [s] của chuyển động đặt trước. Thiết kế một phân bố B-Spline thỏa mãn điều kiện này là rất khó và sẽ dần đến độ rộng B- Spline lớn, điều này làm cho vấn đề trở nên không hấp dẫn. Do vậy, một cách tiếp cận khác được xem xét. Chúng ta giả sử chọn một phân bố B-Spline mà không quan tâm đến các điều kiện ổn định và thêm một tiêu chuẩn ổn định hóa vào LFFC để làm cho quá trình học hội tụ. Một trong những sự lựa chọn để thực hiện vấn để này là tối thiểu hóa hàm lượng giá nhờ cơ chế Chương 4: Kết luận Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 73 học. Đây là một kỹ thuật nổi tiếng trong mô hình mạng mờ nơron và được gọi là kỹ thuật tối giản. Tuy nhiên, thực tế cho thấy rất khó để chọn các tham số của cơ chế học tối giản sao cho LFFC hội tụ. Do đó, một sự lựa chọn khác được đưa ra, lại bắt nguồn từ điều khiển học lặp lại. Việc tối giản được thực hiện nhờ việc lọc tín hiệu học của LFFC thay vì thay đổi cơ chế học. Ý tưởng chủ đạo là quá trình học hội tụ khi tín hiệu học được đảm bảo sao cho tất cả các thành phần tần số cao trên dmin -1[Hz] bị loại bỏ. Điều này (ví dụ) có thể đạt được nhờ kỹ thuật lọc với một BSN phụ thuộc thời gian phù hợp. Các kết quả mô phỏng xác nhận rằng bằng cách thêm một bộ lọc như vậy, sự hội tụ của LFFC phụ thuộc quỹ đạo có thể đạt được. Tuy nhiên, vẫn chưa có các phân tích khoa học nhằm giải thích được các kết quả quan sát. Các đầu vào đặc biệt nào sẽ được lựa chọn trong trường hợp một LFFC phụ thuộc quỹ đạo được xây dựng dựa trên cơ sở biểu diễn không gian trạng thái (chính xác về cấu trúc) của một hệ động học. chúng ta đã chỉ ra rằng một đối tượng chỉ có thể được điều khiển nhờ một LFFC phụ thuộc quỹ đạo khi biểu diễn không gian trang thái thảo mãn một số điều kiện. Do vậy, LiMMS có thể được điều khiển bởi LFFC phụ thuộc quỹ đạo. Khi các đầu vào của BSN được chọn thẳng dựa trên cơ sở của mô hình đối tượng sẽ cho ta một BSN đa chiều. Điều này dẫn đến vấn đề liên quan đến bậc của hệ thống. Mô hình mờ nơron cho thấy vấn đề này có thể được giải quyết bằng cách chia BSN đa chiều thành vài BSN có số chiều nhỏ hơn. Điều này được thực hiện dựa trên một cơ sở được gọi là biểu diễn phân ly các biến của một hàm số. Các kết quả lựa chọ BSN được biết đến như là một cấu trúc mạng suy biến. Cùng với vấn đề này, một LFFC phụ thuộc quỹ đạo được gọi là suy biến khi nó bao gồm nhiều khâu truyền thẳng thay vì một. Một cách thứ 2 (kém hiệu quả hơn) nhằm giảm thiểu bậc cảu hệ thống là chọn các phân bố B-Spline với càng ít B-Spline càng tốt. Có một vài phương pháp được xem xét khi thiết kế một LFFC suy biến. Chương 4: Kết luận Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 74 Luyện một LFFC suy biến không pahỉ là quá trình truyền thẳng. Khi tất cả các BSN được luyện đồng thời, không có gì đảm bảo rằng mỗi BSN sẽ học được đúng tín hiệu truyền thẳng của nó. Do vậy, chúng ta đưa ra một phương pháp luyện một LFFC hiệu quả, có nghĩa là bằng cách chọn một chuỗi các chuyển động luyện mạng nhờ đó các BSN được luyện một cách chính xác. Tuy nhiên, phương pháp này trong thực tế được gọi là phương pháp luyện mạng có chiến lược vẫn khá chủ quan, dựa trên kinh nghiệm. Các thủ tục thiết kế cho LFFC được tính toán và áp dụng trong các thí nghiệm thực tế cho điều khiển LiMMS. Trong đó, LiMMS được điều khiển bởi một LFFC phụ thuộc thời gian cũng như bởi một LFFC. Trong một loạt các thí nghiệm ban đầu sử dụng LFFC phụ thuộc thời gian, các điều kiện ổn định được kiểm chứng. Kết quả của các thí nghiệm này tương tự như kết quả trong phần mô phỏng điều này có nghĩa là giá trị của dmin là chính xác trong khi tỷ lệ học cực đại khá ổn định. Tiếp đó, phân bố B-Spline của LFFC phụ thuộc thời gian được tối ưu. Cuối cùng một LFFC suy biến được thiết kế và kiểm chứng. Phần truyền thẳng bao gồm 3 BSN bù quán tính, ma sát và cogging. Sau khi tiến hành các thí nghiệm luyện mạng có chiến lược, LFFC suy biến đạt được một sai số bám nhỏ đối với một dải lớn các chuyển động tham chiếu. Tuy nhiên, đối với các chuyển động lặp lại thì LFFC phụ thuộc thời gian là ưu việt hơn cả. Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 1 Chương 1: GIỚI THIỆU 1.1. Tổng quan về Learning control (LC). Một trong số các công cụ cạnh tranh mà các hãng sản xuất tuỳ ý sử dụng đó là chất lượng của sản phẩm. Đặc biệt là trong các thị trường có liên quan đến các sản phẩm công nghệ cao. Đó là một trong những nhân tố quan trọng mang tính sống còn để tạo ra các sản phẩm có chất lượng tốt hơn. Điều này được nhìn nhận trong thị trường đối với các sản phẩm mà chúng ta sẽ xem xét trong luận văn này, ví dụ như các hệ thống chuyển động cơ điện tử. Theo quan điểm cơ điện tử, chất lượng của các hệ thống cơ điện tử có thể được cải tiến bằng việc thay đổi thiết kế cơ khí và bộ điều khiển. Ví dụ như khi nghiên cứu các cánh tay robot, nơi mà chuyển động chính xác phụ thuộc vào độ cứng và quán tính của hệ thống. Nếu cánh tay không đạt được các yêu cầu nhất định, độ cứng của nó có thể được tăng lên hoặc quán tính của nó có thể được giảm bớt bằng cách thay đổi kết cấu cơ khí hoặc bằng việc ứng dụng vật liệu mới. Việc thay đổi bộ điều khiển có thể được thực hiện hoặc bằng cách thay đổi thông số của bộ điều khiển đang tồn tại hoặc bằng cách thiết kế bộ điều khiển mới. Khi một bộ điều khiển được cải tiến, chỉ đơn thuần là yêu cầu thay đổi phần mềm và trong một số trường hợp là thêm các sensor cách đánh giá này tương đối dễ dàng thực hiện được, khi đem so sánh với các cấu trúc tương ứng. Trong luận văn này chúng ta sẽ tập trung vào việc nâng cao chất lượng của hệ thống bằng bộ điều khiển. Việc thiết kế một bộ điều khiển nói chung thường dựa trên một mô hình của một đối tượng. Mô hình đối tượng càng chính xác bao nhiêu thì việc thiết kế bộ điều khiển càng hiệu quả bấy nhiêu. Khi mô hình hoá đối tượng, các vấn đề sau có thể gặp phải: 1. Hệ thống quá phức tạp để có thể hiểu hoặc trình bày một cách đơn giản. 2. Mô hình quá khó hoặc quá đắt để đánh giá. Một số đặc tính của một số hiệu ứng Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 2 (phi tuyến) khó có thể đạt được, ví dụ như ma sát… 3. Đối tượng có thể chịu ảnh hưởng lớn của nhiễu tác động từ môi trường, điều này khó dự đoán trước được. 4. Các thông số của đối tượng có thể biến đổi theo thời gian. Bộ điều khiển thích nghi có thể là một giải pháp khi cấu trúc của mô hình động học của đối tượng và nhiễu mô hình tác động lên nó được biết trước trong khi các giá trị của các thông số thì không thể xác định được. Khi mô hình không có giá trị hoặc có nhiều thông số không xác định được thì lúc đó điều khiển học sẽ được xét đến. 1,2 Learning Control (LC) là gì ? Các bộ LC thường được hình dung gần giống như là hệ thống điều khiển của con người và do đó nó có các thuộc tính giống với con người. Trong luận văn này không nghiên cứu các bộ LC theo quan điểm sinh học, nhưng đồng ý với một số định nghĩa sau: Định nghĩa 1.1 (LC) Một bộ LC là một hệ thống điều khiển bao gồm trong đó 1 hàm xấp xỉ các ánh xạ đầu vào - đầu ra tương ứng trong suốt quá trình điều khiển mà một hoạt động mong muốn của hệ thống điều khiển đạt được. Định nghĩa 1.2 (Hàm xấp xỉ): Một hàm xấp xỉ là một ánh xạ vào/ra được xác định bởi một hàm đươc lựa chọn  .,F , với các véc tơ thông số  được lựa chọn để hàm  .F được xấp xỉ “tốt nhất”. Lưu ý 1.1 (Điều khiển tự học và điều khiển thích nghi): Theo hướng này, điều khiển thích nghi có thể được xem xét giống như là một dạng của LC trong đó một hàm xấp xỉ được sử dụng có thể chỉ xấp xỉ một lớp giới hạn của các hàm mục tiêu. Nói chung, một bộ LC sẽ bao gồm một hàm xấp xỉ cho một lớp đối tượng có nhiều hàm mục tiêu hơn. Một biến mở rộng của các hàm xấp xỉ có thể được sử dụng như mạng nơron, mạng Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 3 mờ-nơron (cũng được biết đến với tên các bộ điều khiển logic mờ thích nghi)..v..v.. Nói một cách sơ bộ, các bộ hàm xấp xỉ có thể được sử dụng theo 2 cách: Trước hết, hàm xấp xỉ có thể được sử dụng để tạo (một phần) tín hiệu điều khiển. Việc học được thay thế bởi việc thích nghi vectơ thông số của hàm xấp xỉ theo cách mà một số các hàm giá trị chứa đựng sai lệch điều khiển là cực tiểu. Bộ điều khiển này được gọi là LC trực tiếp. Thứ hai, Hàm xấp xỉ có thể được sử dụng để học một mô hình đối tượng tương ứng được kiểm soát ví dụ như là để làm giảm hàm giá trị của sai số dự báo. Dựa trên cơ sở của mô hình đã được học một bộ điều khiển được xây dựng, Bộ điều khiển này được gọi là LC gián tiếp. Từ khi bộ LC đầu tiên được phát triển vào năm (1963) cho tới nay, lĩnh vực LC đã và đang phát triển rất rộng rãi. Rất nhiều các cấu trúc của bộ điều khiển khác nhau đã được đề xuất và các thuộc tính của chúng (như tính ổn định và tốc độ hội tụ đã được phân tích cả trong thực tế và lý thuyết. Tuy nhiên, mặc dù tất cả chúng đều được nghiên cứu nhưng chỉ có một số bộ LC được ứng dụng trong các sản phẩm mang tính thương mại. Có thể vì những lí do sau đây: Việc chứng minh sự ổn định được đánh giá cao. Phần lớn các nghiên cứu lý thuyết của các bộ LC được tập trung vào tính ổn định. Tuy nhiên, một bộ LC ổn định cũng không cần thiết mang lại một đáp ứng ngắn hạn học tốt …….Hoạt động của bộ LC đối với một con robot đã được quan sát bằng cách mô phỏng. Sau khi thực hiện với chuyển động 6 bậc tự do, sai số hiệu chỉnh giảm xuống hệ số 2.8. Khi tiếp tục tự học, sai số hiệu chỉnh đã tăng lên đến hệ số 1051 tại bước lặp thứ 62.000 và cuối cùng giảm xuống hệ số 10-18 tại bước lặp thứ 250.000. Như vậy, mặc dù thực tế cuối cùng sai số hiệu chỉnh nhỏ đã đạt được nhưng bộ LC không có giá trị thực nghiệm vì nó có dải sai số hiệu chỉnh rất rộng ở giữa. Không nên quá quan tâm tới sai số hiệu chỉnh điểm 0. Một số LC cố gắng đạt Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 4 được sai số hiệu chỉnh điểm 0. Tuy nhiên, điều này yêu cầu có những tín hiệu điều khiển lớn ở những tần số trên băng thông hệ thống, các tần số này có thể gây nguy hiểm cho các cơ cấu chấp hành và nói chung là không đạt được như mong muốn. Loại sai số của hàm xấp xỉ. Trong đại đa số các bộ LC, hàm xấp xỉ được thực hiện với vai trò như một mạng nơron (Multi Layer Perceptron MLP). Như chúng tôi sẽ bàn tới ở dưới đây, loại mạng nơron này không tương thích một cách đặc biệt cho việc điều khiển. Trên cơ sở những suy xét này, chúng ta có thể đưa ra một số các thuộc tính sau mà một bộ LC nên có để để trở thành một mặt hàng được ưa chuộng về mặt thương mại: Dễ dàng sử dụng trong một hệ thống điều khiển có sẵn. Điều này có nghĩa là khi có một đáp ứng ngắn hạn học tốt, thì hiệu suất cực tiểu được bảo đảm. Ví dụ như là trong một bộ điều khiển hiện nay. Thậm chí trong suốt quá trình huấn luyện đối tượng vẫn có thể được duy trì trong quá trình vận hành, mà không gây ra những tổn thất của quá trình sản suất. Có khả năng sử dụng những kiến thức dự đoán của đối tượng. Nói chung các nhà thiết kế và/hoặc người vận hành có một số kiến thức về đối tượng ví dụ như trong cấu trúc của mô hình toán học (đơn giản) dưới dạng các hàm, một giản đồ Bode của đối tượng hoặc một mô tả dưới dạng biến ngôn ngữ của hành vi đối tượng. Bộ LC nên cho phép loại kiến thức này được kết hợp vào trong thiết kế bộ điều khiển, để chọn các thông số của bộ điều khiển hợp lý và để tăng tốc độ học. Hàm xấp xỉ nên phù hợp cho việc điều khiển. Điều này có nghĩa rằng: Không gian nhớ cần thiết cho việc thực hiên nên nhỏ. Trong thực tế, bộ điều khiển được thực hiên bằng phần mềm được gắn vào máy tính. Dung lượng bộ nhớ là có hạn. Do đó, số lượng các thông số của hàm xấp xỉ mà yêu cầu phải xấp xỉ tín hiệu điều khiển không thể quá rộng. Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 5 Việc tính toán đầu ra của hàm xấp xỉ và sự tương thích của quan hệ vào / ra phải được thực hiện một cách nhanh chóng. Trong môi trường thời gian thực, trong một khoảng thời gian mẫu, các thông số của hàm xấp xỉ phải tương ứng và đầu ra được tính. Rất nhiều hệ thống chuyển động cơ điện tử yêu cầu thời gian mẫu nhỏ và cho phép thời gian tính toán là rất ít. Các hàm xấp xỉ mà bao gồm một lượng lớn các tính toán phức tạp do đó chúng không phù hợp cho việc điều khiển. Cơ chế học nên hội tụ nhanh. Để giữ được lượng thời gian trong đó quá trình vận hành của hệ thống được điều khiển là cận tối ưu tới mức tối thiểu, cơ chế học nên hội tụ nhanh. Cơ chế học không nên bị tối thiểu cục bộ, khi bị lưu giữ trong mức tối thiểu cục bộ, Thì cơ chế học cho rằng các giá trị đạt được của các thông số của hàm xấp xỉ, được biểu thị bởi loc , sinh ra sai số xấp xỉ cực tiểu, được biểu thị bởi E( loc ). Mặc dù locglob   tồn tại, làm cho )()( locglob EE   . Trong ảnh 1.1 một ví dụ một chiều của hiện tường như vậy được giới thiệu. Ở mức tối thiểu cục bộ, loc  , độ dốc của sai số xấp xỉ bằng 0. Cơ cấu học mà sử chỉ sử dụng độ dốc của sai số xấp xỉ thì không thể thoát khỏi mức tối thiểu cục bộ. Hình 1.1 Cực tiểu cục bộ trong kỹ thuật học Khi cơ chế học dễ dàng lưu lại ở mức tối thiểu cục bộ, rất khó để huấn luyện LC để thu được hiệu quả cao. E(ω) Cùc tiÓu côc bé Cùc tiÓu toµn bé ωloc ωglob w Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 6 Quan hệ vào/ ra phải tương thích một cách cục bộ. Trong một số hàm xấp xỉ, quan hệ vào/ ra này là tương thích toàn cục. Điều này có nghĩa là nếu giá trị của một trong các thông số của hàm xấp xỉ được tương thích, thì quan hệ vào /ra trên toàn bộ phạm vi đầu vào bị thay đổi. Xét một bộ LC được huấn luyện để thực hiện một số chuyển động. Khi bộ LC được huấn luyện để thực hiện một chuyển động mới, điều này liên quan tới việc tương ứng các thông số của hàm xấp xỉ. Bởi vì mối quan hệ vào ra được tương thích toàn cục nên các tín hiệu điều khiển học trước đó bị thay đổi có thể gây ra nhưng tổn thất trong quá trình làm việc. Do đó điều mong đợi ở đây là mối quan hệ vào ra của hàm xấp xỉ được tương thích một cách cục bộ. Trong trường hợp này, việc học 1 chuyển động mới sẽ không làm thay đổi các tín hiệu đã được học trước đó. Hàm xấp xỉ có khả năng tự khái quát hoá tốt. Khả năng tự khái quát hoá là khả năng tạo ra một đầu ra nhạy cho một đầu vào không được thể hiện trong quá trình huấn luyện nhưng nó tương tự như các huấn luyện mẫu. Khi hàm xấp xỉ có khả năng khái quát hoá tốt, bộ LC cũng sẽ thu được một hiệu quả bám cao cho các chuyển động tương tự các chuyển động được huấn luyện. Vì vậy nó đủ để huấn luyện LC với một lượng nhỏ các đặc tính chuyển động huấn luyện. Khi bộ xấp xỉ không có khả năng tự khái quát hoá tốt, bộ LC phải được huấn luyện cho mỗi chuyển động quan trọng, nó tạo ra một quá trình huấn luyện mở rộng . Sự mềm mại của giá trị xấp xỉ nên dễ dàng điều khiển. Như nói ở phần trước đây, bộ LC không chỉ thu được sai số bằng không đối với một vài tần số, khi tín hiệu điều khiển có tần số cao sẽ không mong muốn. Người sử dụng phải có khả năng quyết định tần số lớn nhất của đầu ra của hàm xấp xỉ. Đáp ứng ngắn hạn là học tốt. Đáp ứng ngắn hạn của bộ LC nên là loại đáp ứng mà có sai số bám dần hội tụ về giá trị mong muốn. Việc tăng sai số bám trong pha trung gian của quá trình học có thể làm hỏng đối tượng, hơn thế nữa, đây là trường Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 7 hợp quá trình làm việc tối thiểu có thể không còn được bảo đảm khi bộ điều khiển được sử dụng như một thiết bị ghép thêm cho một bộ điều khiển đã có sẵn. Sự ổn định lâu dài cần phải được bảo đảm. Việc tự học có thể được thực hiện một cách liên tục hoặc được thực hiện trước khi vận hành. Việc học liên tục được yêu cầu khi các thông số của đối tượng thay đổi trong suốt quá trình vận hành. Ví dụ, do hao mòn hay chịu ảnh hưởng của môi trường. Trong trường hợp này, một bộ điều khiển phải có khả năng đảm bảo việc học ổn định bất chấp các điều kiện vận hành thay đổi như thế nào. 1.3. Bộ điều khiển học sai số phản hồi Một bộ LC thú vị cho các cánh tay robot mà phải bám một cách ngẫu nhiên theo các đường dẫn. Nói chung bộ điều khiển này được biết đến với cái tên là bộ điều khiển học sai số phản hồi: Bộ điều khiển (Feedback Error Learning FEL). Hệ thống LC bao gồm 2 phần: Bộ điều khiển Feef-forward được biểu thị bằng F, nghĩa là 1 hàm/ánh xạ uF = F(r). Một bộ điều khiển Feed-forward thông thường có thể được sử dụng để bù thêm cho các hệ thống động học và theo cách này sẽ thu được độ bám chính xác cao. Khi bộ điều khiển feed-forward bằng với đối tượng nghịch đảo F = P-1, thì đầu ra của đối tượng, y, sẽ bằng tín hiệu đặt , r. Hình 1.2 Bộ điều khiển FEL r - Hµm xÊp xØ C + + + UF P y r (n) r . . . . . Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 8 Đối tượng P, luôn chịu sự tác động của nhiễu. Các loại nhiễu ở bao gồm cả nhiễu ngẫu nhiên và nhiễu có bản chất tái sinh. Những nhiễu tái sinh tái diễn giống nhau khi một chuyển động cụ thể được lặp lại. Điều này có nghĩa rằng chúng có thể được xem xét như một hàm trạng thái của đối tượng, x, xem hình 1.3. Hình 1.3 đối tượng và nhiễu phát sinh 1.3.1. Một ví dụ về vị trí ma sát độc lập. Giống như đối tượng động học, các nhiễu tái sinh có thể được bù bởi một bộ điều khiển feed-forward. Để bù chính xác cho hệ thống động học và nhiễu tái sinh, yêu cầu cần phải có một mô hình chi tiết. Sự không chính xác về mô hình có thể làm cho bộ điều khiển feed-forward vận hành kém. Khi một mô hình chính xác khó có thể xác định được, thì một phương pháp thay thế có thể được thực hiện. Thay vì đi thiết kế một bộ điều khiển feed-forward dựa trên những đặc điểm cơ bản của mô hình thực hiện bộ điều khiển feed-forward giống như là một hàm xấp xỉ, ví dụ như là  ,F rFU  . Trong suốt quá trình điều khiển, quan hệ vào/ra của hàm xấp xỉ được tự thích ứng để học các đối tượng nghịch đảo và để bù các nhiễu phát sinh. Khó khăn chính ở đây là lựa chọn tín hiệu học mà chỉ ra được mối quan hệ vào/ra của hàm xấp xỉ phải được tương thích như thế nào. Tín hiệu học có thể thu được theo rất nhiều cách. Theo lý thuyết đã chứng minh chỉ ra rằng khi đầu ra của u + + P y x d(x) Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 9 F bộ điều khiển phản hồi được sử dụng làm tín hiệu học (hình 1.2) thì quan hệ vào/ra của hàm xấp xỉ hội tụ tới đối tượng nghịch đảo và giá trị bù của nhiễu tái sinh. Loại hàm xấp xỉ mà chúng ta sử dụng ở đây là mạng nơron MLP.   93,3,3,2,2,2,1,1,1, Rr T ddddddddd    (1.1) Trong trường hợp cánh tay 3 bậc tự do (Degrees Of Freedom DOF) sử dụng kinh nghiệm, đầu vào của MLP bao gồm góc khớp đặt θd và đạo hàm bậc 1 bậc 2 của chúng: Trong khi đầu ra uF được xét dưới dạng lực xoắn động cơ; (công thức 1.2)   3321 Ru T F   (1.2) Bộ điều khiển phản phản hồi. Như đã được nói tới, bộ điều khiển phản hồi trạng thái, đem lại các tín hiệu học cho bộ điều khiển feed-forward. Hơn thế, nó xác định quá trình bám cực tiểu tại thời điểm bắt đầu học. Cuối cùng, bộ điều khiển phản hồi bù các nhiễu ngẫu nhiên. Bộ điều khiển FEL đã được thực hiện trong nhiều ứng dụng của nhiều tác giả; ví dụ như là: - Hệ thống phanh tự động cho ôtô. - Điều khiển hệ thống camera. - Điều khiển cánh tay robot. - Máy hàn. Các ứng dụng chỉ ra rằng bộ điều khiển FEL đã cải thiện một cách rõ ràng dựa trên quá trình vận hành của bộ điều khiển phản hồi và các ứng dụng này cũng chỉ ra có thể thu được chất lượng bám cao mà không cần mô hình mở rộng. Cách hoạt động của một bộ FEL được so sánh với cách hoạt động của hệ thống điều khiển thích nghi. Kết luận rằng, trong trường hợp mô hình đối tượng chính xác được sử dụng trong các hệ thống điều khiển thích nghi, quá trình bám của bộ điều khiển thích nghi và của bộ điều khiển FEL là tương tự như nhau. Khi FEL hội tụ chậm hơn Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 10 bộ điều khiển thích nghi, trong tình huống này bộ điều khiển thích nghi được ưa chuộng hơn. Tuy nhiên khi chưa có một mô hình đối tượng chính xác, thì bộ điều khiển thích nghi sẽ không thể thu được hiệu suất bám như mong muốn. Bộ điều khiển FEL không phải trải qua điều này và nó vẫn đem lại hệ số bám chính xác. Khả năng này nâng cao giả thiết rằng bộ FEL có phù hợp cho hang loạt các ứng dụng mở rộng khi trong thực tế các đối tượng thường khó có một mô hình chính xác. Câu hỏi đặt ra là nếu xét về mặt thương mại thì nên sử dụng bộ điều khiển nào? Để trả lời cho câu hỏi này chúng ra sẽ đi đánh giá xem bộ điều khiển FEL có đáp ứng được đầy đủ các chỉ tiêu chất lượng mà ta đã đưa ra trong mục 1.2 hay không. Dễ dàng sử dụng trên hệ thống điều khiển có sẵn. Sự mở rộng duy nhất đối với hệ thống điều khiển có sẵn là hàm xấp xỉ. Khi hệ thống điều khiển được thực hiện bằng phần mềm điều này yêu cầu ít có sự thay đổi và có thể dễ dàng được thực hiện. Sự hợp nhất các kiến thức quan trọng trong thiết kế. Khi cấu trúc của đối tượng động học được xác định, thì mạng MLP trong bộ điều khiển feed-forward có thể tách ra thành một vài mạng MLP nhỏ hơn. Mỗi một mạng con này sẽ bù cho một phần riêng biệt của đối tượng động học. Những thí nghiệm đã chỉ ra rằng mạng này đã nâng tốc độ học lên đáng kể. Sự ổn định được xác lập. Điều này đã được chứng minh bằng lý thuyết rằng bộ điều khiển FEL sử dụng cho điều khiển cánh tay robot cho kết quả hội tụ. Với các hệ thống khác, sự ổn định chưa được xét đến trên phương diện lý thuyết. Đáp ứng ngắn hạn tốt. Trong quá trình học, sai số bám sẽ dần hội tụ đến giá trị cực tiểu của nó. Giống như sự ổn định, đáp ứng ngắn hạn cũng chưa được xét tới trên phương diện lý thuyết. Hàm xấp xỉ phù hợp cho việc điều khiển. Rất nhiều các giá trị thực của bộ một LC phụ thuộc vào loại hàm xấp xỉ được sử dụng. Mặc dù thực tế là bộ điều khiển Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 11 FEL cũng đạt được chất lượng bám cao nhưng cách học không phải là tối ưu cho mạng MLP. Yêu cầu bộ nhớ nhỏ. Một trong số những thuộc tính tốt của MLP là nó có thể xấp xỉ các hàm mục tiêu đa chiều với một số ít các thông số. Do đó tổng dung lượng bộ nhớ của máy tính yêu cầu cho việc thực hiện là rất nhỏ. Tốn kém cho việc tính toán giá trị. Việc tính toán đầu ra của mạng MLP và trọng số của bộ thích nghi bao gồm một số lượng lớn các tính toán phức tạp. Do đó, với một số ứng dụng điều khiển thời gian thực thì loại mạng mạng nơron này có thể không phù hợp. Cơ chế học hội tụ chậm và trải qua vùng giá trị cực tiểu cục bộ. Cơ chế học dễ dàng đạt được tại vùng giá trị cực tiểu cục bộ. Hàm trọng lượng của mạng kết thúc ở vùng cực tiểu nào phụ thuộc vào hàm trọng lượng ban đầu của mạng. Do đó nó cần phải thực hiện nhiều thử nghiệm huấn luyện mạng với các cài đặt hàm trọng lượng ban đầu khác nhau, để thu được độ bám chính xác có thể chấp nhận được. Có khả năng tổng quát hoá tốt. Một thuận lợi thực tế là mối quan hệ vào ra chỉ có thể thích ứng toàn bộ đó là khi MLP có khả năng tổng quát tốt khi quá trình huấn luyện được thực hiện một cách tổng thể. Khi một hệ thống chuyển động phải vận hành ở tốc độ thấp, bộ điều khiển FEL có khuynh hướng đưa ra hiệu suất kém. Điều này là do thực tế mạng MLP gặp khó khăn trong việc học các dữ liệu có tương quan với nhau ở mức cao. Khi các dữ liệu có tương quan với nhau ở mức cao, mạng có khuynh hướng chuẩn hoá tín hiệu theo dữ liệu cuối cùng, kết quả là đưa ra khả năng khái quát hoá kém. Sự trơn tru của các giá trị xấp xỉ là không hoàn toàn điều khiển được. Số lượng các thông số của một bộ MLP quyết định tính chính xác cực đại của giá trị xấp xỉ. Nó không đảm bảo được độ trơn tru nhất định. Nhờ việc học, mạng MLP có thể xấp xỉ rất gần các hàm mục tiên trong phạm vi đầu vào và rất chính xác ở phần còn lại. Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 12 Nhìn vào các thuộc tính ở trên, ta có thể kết luận rằng trong trường hợp mà cách học tốt, bộ điều khiển FEL có khả năng đáp ứng rất tốt. Các nghiên cứu khác nhau nhằm mục đích khắc phục các vấn đề tồn tại của bộ điều khiển FEL. Theo đó ta sẽ giới thiệu tóm lược 3 phương pháp: 2 phương pháp đầu thay đổi cấu trúc của bộ điều khiển học. Trong khi ở phương pháp còn lại loại hàm xấp xỉ khác đựơc sử dụng. Trước tiên, phương pháp thứ nhất có thể cải thiện cách học bằng cách chọn các đầu vào khác nhau cho hàm xấp xỉ. Sai số tín hiệu được thêm vào như một đầu vào của bộ xấp xỉ, điều này sẽ làm thay đổi bộ điều khiển LC từ chỗ hoàn toàn là 1 bộ điều khiển feed-forward nguyên bản chuyển sang bộ điều khiển feed-forward (hình 1.4). Các thí nghiệm đã chỉ ra rằng bộ LC này khắc phục được một số lỗi của bộ điều khiển FEL gốc. Hình 1.4 Học theo sai số phản hồi. Phương thức thứ 2 là sử dụng nhiều bộ điều khiển feed-forward, mỗi một bộ được huấn luyện để thực hiện một nhiệm vụ cụ thể. Một mạng neural giám sát học xem là bộ feed-forward nào được sử dụng cho nhiệm vụ nào. Bộ LC này đã được kiểm tra trên tay máy mà phải thực hiện các chuyển động với các đối tượng có trọng lượng khác nhau. Sau khi học, mỗi bộ điều khiển feed-forward đã học sẽ phải đảm r - Hµm xÊp xØ C + + + UF P y r (n) r . . . . Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 13 nhiệm cho một đối tượng xác định. Mạng giám sát đã học từ bộ điều khiển feed- forward nào được áp dụng cho đối tượng đó. Khi mạng MLP là nguyên nhân chính gây nên các khó khăn của điều khiển FEL, một phương pháp rõ ràng ở đây là phải tìm ra những hàm xấp xỉ khác nhau. Mạng MLP được thay thế bởi mạng (Cerebellar Model Articulation Controller CMAC). Mạng CMAC phụ thuộc vào các lớp mạng nơron mà làm việc với hàm cơ sở. Trong trường hợp mạng CMAC, hàm cơ sở bao gồm các hàm đa thức thông minh mà có giá trị khác không trên phần không gian đầu vào. Ở mỗi điểm trong không gian đầu vào p các hàm cơ sở chồng chéo lên nhau. Thông số của p được biết đến như là một thông số khái quát hoá và có thể được lựa chọn bởi nhà thiết kế. Đầu ra của mạng CMAC là tổng các trọng số của hàm ước lượng cơ sở. Việc học được tiến hành bằng cách mô phỏng theo các trọng số của mạng, chứ không phải là theo bản thân các hàm cơ sở. Tất cả điều này nhằm mục đích cải thiện những vấn đề sau: Độ hội tụ nhanh hơn. Khi việc học diễn ra một cách cục bộ, chỉ có 1 số nhỏ các hàm trọng lượng được thích nghi, gây ra độ hội tụ nhanh. Có thể học các dữ liệu tương quan. Các vùng của hàm cơ sở đã được trộn lẫn, điều này có ích cho quá trình học các dữ liệu tương quan. Không có cực tiểu cục bộ. Cơ cấu học không trải qua vùng cực tiểu cục bộ. Tuy nhiên một bất lợi là người thiết kế bộ điều khiển phải lựa chọn sự phân phối của các hàm cơ sở. Điều này yêu cầu phải có một số kiến thức nền tảng về ánh xạ vào/ra theo mong muốn và việc điều chỉnh sự phân phối của hàm cơ sở là cần thiết trước khi đạt được hiệu suất có thể chấp nhận được. Các nghiệm thí đã chỉ ra rằng việc thay thế mạng MLP bởi mạng CMAC đem lại một quá trình học tốt hơn và độ bám chính xác hơn. 1.4. Điều khiển truyền thẳng tự học. Trong luận văn này một hệ thống LC được xét có cấu trúc tương tự như cấu Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 14 trúc của bộ điều khiển FEL (hình 1.2). Tuy nhiên, phần feed-forward của bộ điều khiển LC được thực hiện giống như mạng B-Spline (BSN) thay vì mạng MLP. Loại điều khiển FEL được gọi là LFFC. Phương pháp BSN cũng tương tự như phương pháp CMAC. Giống như mạng CMAC, mạng BSN sử dụng các hàm cơ bản còn gọi là B-Spline để xấp xỉ hoá. Trong thiết kế LFFC các thông số sau của BSN phải được lựa chọn : 1.4.1. Đầu vào của mạng BSN. Đối với các hệ thống chuyển động, các đầu vào của BSN bao gồm các vị trí đặt, r, và các đạo hàm của nó (xem hình 1.2). 1.4.2. Sự phân bố B-Spline trên đầu vào của mạng BSN. Đầu ra của BSN là tổng trọng lượng của các B- spline ước lượng . Do đó, số lượng của các B-Spline và các vị trí của chúng quyết định tính chính xác của giá trị xấp xỉ. Các tín hiệu đích có dạng trơn có thể được xấp xỉ một cách chính xác với một số lượng thấp các B-Spline “rộng”. Các tín hiệu có độ dao động lớn yêu cầu một số lượng lớn các B-Spline “hẹp” (xem hình 1.5) Hình 1.5 ánh xạ BSN B-splines μ uF 0 1 --==Hàm mục tiêu --==Hàm xấp xỉ r[m] r[m] Hàm xấp xỉ Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 15 Một khả năng riêng biệt của việc phân bố các B-Spline có thể được tạo ra trên cơ sở kiến thức của đối tượng nghịch đảo và của các nhiễu, hoặc nhờ một tiến trình lặp đi lặp lại sử dụng các dữ liệu thực nghiệm. 1.4.3. Sự lựa chọn các cơ cấu học. Tự học ví dụ như là sự thích nghi của các trọng số mạng có thể được tiến hành sau mỗi một mẫu - được biết tới gọi là học trực tuyến hoặc sau mỗi chuyển động đã được thực hiện xong - được gọi là off-line learning. Luật online learning như sau: )()( rerw ii  (1.3) Và luật offline learning như sau:     s s N i ji N i jji i r rer w 1 1 )( )()(    (1.4) với: rj: đầu vào của BSN. Trong LFFC đầu vào bao gồm cả vị trí đặt và đạo hàm của nó  ,....,, jjj rrrf  )( ji r : thành phần của B-Spline thứ I  1.0)( ji r i : sự thích nghi của trọng số B-Spline thứ i  : tỷ lệ học 0 <   1 )( jre : Sai số xấp xỉ được tạo bởi mạng, trong LFFC e(rj) là đầu ra của bộ điều khiển phản hồi uC; Ns: Số lượng các mẫu đầu vào. 1.4.4. Sự lựa chọn tốc độ học. Tốc độ học càng lớn thì độ hội tụ của kỹ thuật học càng nhanh. Tuy nhiên một tốc độ học mà lớn thì sẽ làm cho giá trị xấp xỉ thêm nhạy cảm với nhiễu và có thể là nguyên nhân gây mất ổn định. Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 16 Bằng việc sử dụng BSN, ta đã có các ưu điểm sau: Không có cực tiểu cục bộ. Đầu ra của BSN là một hàm trọng số tuyến tính. Điều này có nghĩa là các kỹ thuật học được đưa ra trong (1.3) và (1.4) không trải qua vùng cực tiểu cục bộ. Điều này nhấn mạnh rằng các trọng số đầu của BSN không ảnh hưởng đến độ chính xác tự hiệu chỉnh cuối cùng. Học cục bộ. Khi B-Spline có một nền tảng chắc chắn, ánh xạ vào/ra của BSN có thể thích nghi một cách cục bộ. Việc huấn luyện một chuyển động mới không nhất thiết phải ảnh hưởng tới khả năng hiệu chỉnh các chuyển động đã học trước đó. Hơn thế nữa, do nền tảng chắc chắn của B-Spline chỉ có một số lượng nhỏ các trọng số góp phần cho đầu ra, trong quá trình huấn luyện, chỉ có các trọng số cần cần được đáp ứng. Điều này trái ngược với MLP nơi mà tất cả các trọng số của mạng bị thay đổi trong suốt quá trình học. Do đó, BSN hội tụ nhanh hơn nhiều so với MLP. Sự chính xác trong điều chỉnh. Độ trơn của quan hệ vào/ra là xác định được bằng cách chọn phân bố B-spline. Việc chọn B-spline mà có nền tảng vững chắc hơn, làm cho BSN có được giá trị xấp xỉ dữ liệu ở miền cao tần chính xác hơn. Khi mà, do sự giới hạn của cơ cấu chấp hành, ví dụ, với một giá trị xấp xỉ trơn hơn của dữ liệu được yêu cầu ở một phần xác định của không gian đầu vào, B-spline nên được sử dụng để có một nền tảng rộng hơn hoặc thức bậc cao hơn. Trong trường hợp của MLP, người dùng không thể xác định được độ trơn của các phần khác nhau trong không gian đầu vào, thay vào đó MLP xác định rõ vị trí nguồn của nó. Cho tới nay mạng CMAC cũng đã nắm bắt được những thuận lợi đã được liệt kê ở trên của mạng BSN. Chúng ta chọn BSN bởi vì nó đơn giản. Trong mạng CMAC các hàm phân bố cơ bản là các hàm mà ở mỗi giá trị đầu vào hàm cơ sở chính xác p có một định lượng lớn hơn 0. Một số hàm phân bố thoả mãn điều Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 17 này và mỗi hàm như vậy dẫn đến một giá trị xấp xỉ khác nhau. Người sử dụng phải chọn hàm phân bố nào là có khả năng xấp xỉ tốt nhất. Hơn thế, việc chọn lọc một giá trị xấp xỉ bằng cách thêm một số ràng buộc (thêm một hàm cơ sở), kết quả sẽ có được hàm phân bố cơ sở khác. Điều này có thể là không được như mong muốn cho lắm. Sự phân bố của các hàm cơ bản trong BSN là không phức tạp lắm. Hạn chế chính của các BSN (và của các NN với các hàm cơ bản) đó là số lượng các trọng số mạng tăng theo hàm mũ với kích thước của không gian đầu vào. Số lượng các trọng số trong một BSN - N chiều được cho bởi:    N j jt NN 1 (1.5) Với Nj là số lượng của B-Spline được định nghĩa ở đầu vào thứ j. Khi xét tới độ chính xác có thể sẽ yêu cầu nhiều B-Spline và vì vậy giá trị của Nj sẽ lớn hơn, ví dụ khi một hàm phi tuyến ở mức độ cao được xấp xỉ hoá, các mạng này là không thực tế khi số lượng đầu vào quá lớn. Điều này được gọi là sai lệch về kích thước và nó mang lại một số các vấn đề sau: Số lượng lớn các trọng số mạng. Nếu các đối tượng động học có thành phần phi tuyến ở mức độ cao, một hàm phi tuyến ở mức độ cao có thể bị ánh xạ bởi mạng B-Spline. Một mạng mà có khả năng ánh xạ những phi tuyến này một cách chính xác sẽ chiếm một phần lớn dung lượng lớn của bộ nhớ máy tính. Trong thực tế, các nguồn bộ nhớ là có giới hạn, do đó mạng phức hợp và ánh xạ chính xác của nó phải được cân bằng với nhau. Các bộ huấn luyện rộng. Khi thực thi một sự chuyển động định trước, chỉ có các trọng số mạng được lập bởi các đầu vào của mạng là được cập nhật. Để thích ứng một số lượng lớn các trọng số mạng, yêu cầu cần phải có một số lượng lớn các huấn luyện chuyển động. Điều này sẽ dẫn tới nhiều lần huấn luyện nếu Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 18 mạng được huấn luyện trực tuyến ví dụ trong suốt quá trình điều khiển. Khả năng khái quát kém. Việc bù của bộ phi tuyến có thể yêu cầu các B-Spline hẹp để thoả mãn các yêu cầu về độ chính xác. Tuy nhiên, với các B- Spline hẹp, các tín hiệu đầu ra của mạng rất khác nhau có thể xảy ra với các đường cong quỹ đạo mà “gần với nhau”. Vì lý do đó, mà các bộ huấn luyện rộng được đề cập ở trên đáp ứng được tất cả những gì cần thiết mà phải đưa ra trước khi đề cập tới hiệu quả lợi ích thu được. Có thể thấy rằng sai lệch về kích thước có thể gây hại nghiêm trọng tới giá trị thương mại của LFFC. Do đó, nên cố gắng để vượt qua sự sai lệch về kích thước. 1.5. Ứng dụng minh hoạ: Hệ thống chuyển động động cơ tuyến tính. Một ứng dụng thú vị của LC là động cơ tuyến tính đồng bộ dùng nam châm vĩnh cửu. Các động cơ tuyến tính thường được thiết kế để thực hiện các chuyển động tuyến tính với độ chính xác nhỏ hơn mm ví dụ như cắt lazer, máy quét, hoặc các máy thực hiện nhiệm vụ gắp - đặt. Động cơ tuyến tính được xét ở đây còn được gọi là Hệ thống chuyển động động cơ tuyến tính (Linear Motor Motion System LiMMS) được chế tạo bởi Philips. Cấu trúc động cơ bao gồm phần tĩnh bao phủ bởi đế kim loại và một phần động. Phần động này chứa cuộn điện và lõi sắt xem hình 1.6. Bằng cách cung cấp dòng điện 3 pha vào trong mỗi cuộn dây của phần động sẽ tạo ra một chuỗi lực hút và đẩy giữa các cực và đế kim loại. Kết quả là gây ra sự chuyển động giữa phần động và phần tĩnh . Các hoạt động cơ bản của động cơ là chuyển động gia trọng: trọng lượng của phần động với một tải (tải giả định), mL, có giá trị là 37(kg). Chương 1: Giới thiệu Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên 19 Hình 1.6: Nguyên lý làm việc của động cơ tuyến tính LiMMS Các đường chỉ thị là các đường cong từ hoá với A B C là các pha của dòng động cơ 3 pha. Trong quá trình

Các file đính kèm theo tài liệu này:

  • pdfLuận văn- Thiết kế bộ điều khiển Learning FeedForward cho các hệ thống chuyển động điện cơ.pdf
Tài liệu liên quan