Điều khiển phi tuyến phương tiện ngầm bằng mạng nơ ron thích nghi

Tài liệu Điều khiển phi tuyến phương tiện ngầm bằng mạng nơ ron thích nghi: Kỹ thuật điều khiển P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 200 ĐIỀU KHIỂN PHI TUYẾN PHƯƠNG TIỆN NGẦM BẰNG MẠNG NƠ RON THÍCH NGHI Phan Hoài Nam1*, Lê Kỳ Biên2, Bùi Thị Thanh Tâm3 Tóm tắt: Phương tiện ngầm (PTN) tự hành và điều khiển từ xa ngày càng trở nên phổ biến trong việc nghiên cứu, thăm dò và thực hiện các nhiệm vụ dưới nước. PTN là 1 đối tượng phi tuyến, hoạt động trong môi trường có nhiễu không rõ ràng. Bài báo phát triển một bộ điều khiển phi tuyến sử dụng mạng nơ ron truyền tiến độc lập để đạt được kết quả bám tiệm cận trong điều kiện có các thành phần không tường minh trong mô hình và nhiễu loạn ngoài. Từ khóa: Mạng Nơ ron. Điều khiển phi tuyến, Phương tiện ngầm. 1. ĐẶT VẤN ĐỀ Việc điều khiển PTN theo 1 quĩ đạo chính xác và bền vững với môi trường là một trong những bài toán quan trọng và cần thiết trong quá trình thiết kế chế tạo PTN. Một vài kết quả nghiên cứu trước đây dựa trên giả thiết mô hình động học t...

8 trang | Chia sẻ: quangot475 | Lượt xem: 557 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Điều khiển phi tuyến phương tiện ngầm bằng mạng nơ ron thích nghi, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Kỹ thuật điều khiển P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 200 ĐIỀU KHIỂN PHI TUYẾN PHƯƠNG TIỆN NGẦM BẰNG MẠNG NƠ RON THÍCH NGHI Phan Hoài Nam1*, Lê Kỳ Biên2, Bùi Thị Thanh Tâm3 Tóm tắt: Phương tiện ngầm (PTN) tự hành và điều khiển từ xa ngày càng trở nên phổ biến trong việc nghiên cứu, thăm dò và thực hiện các nhiệm vụ dưới nước. PTN là 1 đối tượng phi tuyến, hoạt động trong môi trường có nhiễu không rõ ràng. Bài báo phát triển một bộ điều khiển phi tuyến sử dụng mạng nơ ron truyền tiến độc lập để đạt được kết quả bám tiệm cận trong điều kiện có các thành phần không tường minh trong mô hình và nhiễu loạn ngoài. Từ khóa: Mạng Nơ ron. Điều khiển phi tuyến, Phương tiện ngầm. 1. ĐẶT VẤN ĐỀ Việc điều khiển PTN theo 1 quĩ đạo chính xác và bền vững với môi trường là một trong những bài toán quan trọng và cần thiết trong quá trình thiết kế chế tạo PTN. Một vài kết quả nghiên cứu trước đây dựa trên giả thiết mô hình động học tường minh lấy từ các kết quả kinh nghiệm [2]. Trong khi các bộ điều khiển này cần phải có được hiệu quả điều khiển tốt nhất, mô hình kinh nghiệm thường không chính xác, khó thực hiện, kết quả điều khiển mang lại đối với một mô hình không biết chính xác không cao. Các bộ điều khiển thích nghi [3] đã giải quyết được các vấn đề không tường minh trong mô hình và bộ điều khiển đã trở nên bền vững hơn. Các kết quả này cơ bản dựa trên giả thiết là các tham số động học không biết có thể tuyến tính hoá được. Kết quả trong [4] sử dụng phương pháp thích nghi kinh điển và bộ điều khiển chuyển mạch rời rạc để bù các thành phần phi tuyến đã tuyến tính hoá. Để so sánh với những kết quả điều khiển kiểu thích nghi kinh điển, các nghiên cứu [5] đã ứng dụng logic mờ và mạng nơ ron làm các phương thức cơ bản để xấp xỉ các thành phần động học không tường minh gồm cả các nhiễu loạn bổ sung (và không giả định là các thành phần này tuyến tính); tuy nhiên, sự tồn tại của nhiễu bên ngoài và sai số vốn có của hàm xấp xỉ làm cho kết quả bám cuối cùng bị chặn đều. Kết quả trình bày trong [6] sử dụng điều khiển chế độ trượt như 1 công cụ hỗ trợ để ước lượng sai số trạng thái tĩnh, các bộ điều khiển trượt cho kết quả bền vững tốt, song bộ điều khiển là rời rạc [7]. Công trình [8] các tác giả mới dừng lại nghiên cứu sử dụng bộ điều khiển mờ- thích nghi cho ngõ ra một dạng PTN tự hành. Nội dung của bài báo sẽ phát triển một bộ điều khiển bám liên tục cho một lớp PTN đa biến phi tuyến hoạt động trong môi trường có nhiễu. 2. MÔ HÌNH ĐỘNG LỰC HỌC CỦA PTN Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 201 PTN hoạt động trong môi trường nước chịu tác động của nhiều yếu tố môi trường như dòng chảy, gió, sóng biển... nên một số thông số thủy động tính toán mô phỏng không chính xác. Sự tác động qua lại giữa các kênh điều khiển tương đối lớn ảnh hưởng đến chất lượng và tính ổn định của hệ thống. Việc đo lường đầy đủ các trạng thái rất khó khăn, vì thế xu hướng nghiên cứu thuật toán điều khiển thích nghi hồi tiếp ngõ ra cho đối tượng ngư lôi đang được phát triển mạnh [8]. Gần đây mạng nơron và hệ mờ được sử dụng rộng rãi trong trong các sơ đồ điều khiển thích nghi và đạt được những kết quả đáng kể. Theo nghiên cứu của Fossen [1], phương trình động học của PTN được mô tả:  J   (1) trong đó,   6t  là véc tơ tốc độ thẳng và tốc độ góc trong hệ qui chiếu vật thể,   6t  làm véc tơ vị trí và tư thế trong hệ qui chiếu trái đất, và   6 6J   là ma trận chuyển Jacobi giữa 2 hệ qui chiếu và được xác định bởi:     1 3 3 3 3 2 0 0 J J J             (2) với   3 3 1 J    và   3 3 2 J    được xác định bằng:  1 cos cos sin cos +cos sin sin sin sin +cos cos sin sin cos cos cos +sin sin sin cos s +sin sin cos sin cos sin cos cos J                                             Và:  2 1 sin t cos tg 0 cos sin 0 sin / cos cos / cos J                        , Các véc tơ mô tả trạng thái của PTN như sau:  Tx y z      ;   ,Tu v w p q r   trong đó, x, y và z biểu diễn toạ độ Đề các của khối tâm PTN; , ,  và  biểu diễn các hướng theo 3 trục PTN là nghiêng ngang, nghiêng dọc và góc hướng; u , v và w lần lượt là tốc độ dịch dọc, dịch ngang và lên xuống; p, q, r là vận tốc góc tương ứng. Với giả thiết rằng gốc hệ qui chiếu vật thể gắn với trọng tâm của PTN, bỏ qua gia tốc của trái đất tại điểm hệ đang hoạt động và khối lượng ảo là hằng số (độc lập với tần số sóng), phương trình động lực học của hệ có thể được biễu diễn dưới dạng véc tơ như sau:          d bM C D g t               (3) Kỹ thuật điều khiển P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 202 ở đây.   6 6M   là ma trận quán tính (gồm cả khối lượng kèm),   6 6C   là ma trận lực Coriolis và ảnh hưởng hướng tâm,   6 6D   là ma trận lực cản thuỷ động và lực ma sát,   6g   là véctơ mô men và lực trọng trường và sức nổi,   6 d t  là véc tơ nhiễu phi tuyến (như sóng, dòng chảy, ) và   6 b t  là véc tơ ngoại lực và mô men tác động vào khối tâm của PTN trong hệ qui chiếu vật thể. Mô hình động lực học của hệ còn có thể được biểu diễn theo hệ qui chiếu trái đất bằng cách áp dụng các phép biến đổi động học, giả thiết là các ma trận trong  J  không kỳ dị, ta có:          , , , dM C D g t                     (4) 3. XÂY DỰNG BỘ ĐIỀU KHIỂN Hệ thống tự động điều khiển ngư lôi thể hiện trên hình 1 bao gồm [8]: * Hệ thống chỉ đạo: nhận thông tin ban đầu để tạo ra quỹ đạo mong muốn bao gồm quỹ đạo theo hướng và độ sâu [1],[8]. * Hệ thống dẫn đường: được trang bị khối dẫn đường quán tính INS, cảm biến áp suất, thiết bị đo tốc độ âm thanh ...để đo độ sâu, hướng và vị trí [1],[8]. * Hệ thống điều khiển: So sánh hướng, độ sâu theo tín hiệu nhận được từ hệ thống dẫn đường với quỷ đạo mong muốn để tính toán tín hiệu điều khiển là góc quay các bánh lái và vây ổn định (các kênh điều khiển) [1],[8].. Hình 1. Sơ đồ hệ thống tự động điều khiển chuyển động PTN. Sai số hệ thống vòng hở đối với  r t được biểu diễn như sau [1]: , d d Mr f S      (5) Trong đó, 1 1 1 1 d d d d d d d d d d d d d d f M J M J C J D J g                   Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 203    1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 d d d d d d d d d d d d d S M J k e MJ M J M J k e MJ M J M J k e M J e CJ C J DJ D J g g                                               Áp dụng lý thuyết xấp xỉ tổng quát để xấp xỉ hàm phụ không tường minh mạng nơ ron 3 lớp:    T T d d d f W V     (6) trong đó,     218 1 NV t   và    2 1 6NW t   tương ứng là các trọng số của mạng từ lớp 1-2 và từ 2-3, Các trọng số này là hằng số lý tưởng và hữu hạn; N2 là số nơ ron của lớp ẩn,    2 1 6N    là hàm kích hoạt;   19 d t  là đầu vào của mạng nơ ron và là 1 tập compact chứa các giá trị quĩ đạo mong muốn hữu hạn và biết trước:  1, , , T T T T d d d d       Từ (5), bộ điều khiển được thiết kế sử dụng mạng nơ ron truyền thẳng 3 lớp được bổ sung thêm thành phần phản hồi tích phân bền vững dấu sai số, bộ điều khiển có dạng: ˆ d f   (7) Thành phần phản hồi được xác định:       2 2 1 1 0 s s k e k e      (8) trong đó,   6 2 ,e t  là nghiệm phương trình:       2 2 1 sgn , 0 0 s k e e       (9) s k  và   là độ lợi điều khiển và là các giá trị hằng dương. Thành phần mạng truyền tiến của mạng nơ ron:  ˆ ˆ ˆT T d d f W V  (10) trong đó,   219ˆ NV t  và    2 1 6ˆ NW t   là các ước lượng trọng số lý. Ước lượng trọng số của mạng trong (10) được cập nhật trực tuyến theo các phương trình:   1 2 ˆ ˆˆ T T d W proj V e     (11)    2 ' 2 ˆ ˆˆ T T d e V proj W     (12) trong đó,     2 2 1 1 1 N N     và 19 19 2    là các ma trận độ lợi điều khiển, các ma trận này là đối xứng, không đổi và xác định dương, còn   2 1ˆ ' N   là đạo hàm riêng của  ˆˆ T d V   . Tiến hành thay bộ điều khiển trong (7) vào mạch vòng hở (5) ta nhận được sai số hệ thống bám vòng kín : ˆ d d d Mr f f S       (13) Ước lượng sai lệch đối với trọng số mạng được xác định bằng      ˆV t V t V t  và      ˆW t W t W t  , trong đó   219 NV t   và    2 1 6NW t    . Sử dụng (6) và (10) để xác định đạo hàm của (13), ta được: Kỹ thuật điều khiển P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 204 ˆ ˆ ˆˆ ˆ ˆ' ' ' ' T T T T T T T T d d d d Mr Mr W V W V W V W V                   ˆ ˆ ˆ ˆˆ ˆ' ' T T T T T d d d W V S W W V                    (14) ở đây,  ˆ  được tính toán trong (11) và (12), và đạo hàm của (8) xác định bởi phương trình:       2 1 sgn s t k r e    (15) Thực hiện việc nhóm các thành phần, (14) có thể được viết lại:     2 2 1 1 sgn 2 s Mr Mr N N e k e          (16) trong đó,   6 1 2 ˆ ˆ, , , , , , , d d N W V e e r t     và   6ˆ ˆ, , , , d d N W V t    ,   1 2 1 ˆˆ ˆ' 2 T T d N Mr proj V e            2 2 2ˆ ˆˆ ˆ' ' T TT d d W proj We S e       (17) d B N N N   với   6, , d d d N t    được xác định: ' T T d d d N W V          và thành phần   6ˆ ˆ, , , , B d d N W V t    được tách ra sao cho: 1 2 B B B N N N    (18) với     1 2 6ˆ ˆ ˆ ˆ, , , , , , , , , B d d B d d N W V t N W V t       , 1 ˆˆ ˆ' ' T T T T B d d N W V W V          2 ˆ ˆˆ ˆ' ' T T T T B d d N W V W V         Sỡ dĩ tách ra như vậy là vì các thành phần khác nhau trong (17) bị chặn khác nhau. Việc tách các thành phần trong (17,18) làm cơ sở cho việc xây dựng luật cập nhật trọng số của mạng nơ ron và phân tích tính ổn định của hệ [1]. Giới hạn trên của (17) được xác định:  N    (19) Trong đó:  1 2 T T T T e e r   (20) và     là hàm dương toàn cục khả nghịch không tăng. 1 2 3 , , d B d N N N     Từ (14) và (15), đạo hàm của (22) bị chặn trên vì: 4 5 2B N e   Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 205 Trong đó  , 1, ..., 5 i i   là các hằng dương đã biết. 4. KẾT QUẢ MÔ PHỎNG Với dữ liệu đầu vào của quĩ đạo mẫu là đường xoắn ốc có phương trình sau: 2sin 2 cos 0 0 10 10 10 10 T d t t t t                  với điều kiện đầu:    0 1 2 0 0 0 0 Td  . Tham số khởi tạo cho ma trận trọng số lý tưởng cho mạng nơ ron được chọn là:  2ˆ 19,initNNV rand N ,  2ˆ 1, 6initNNW zeros N  và số nơ ron trong lớp ẩn được chọn 2 5N  . Hình 2. Mô hình mô phỏng PTN trên Matlab/Simulink. Độ lợi phản hồi được chọn là ma trận đường chéo có cấu trúc véc tơ như sau:  1 1 1 0.5 4 3 5 T k  ;  310 4 5 7 8 8 7 Tsk    0.3 0.3 0.5 0.3 0.3 0.1 T  ;  0.2 0.2 0.1 0.1 0.5 0.2 T  Độ lợi mạng nơ ron truyền thẳng được chọn là 1 6 6 2000 I     , 2 6 6 500 I     . Mô hình toán mô phỏng trên matlab/simulink thể hiện trên hình 2. Hình 3. Sai số bám của các biến dịch dọc (x), dịch ngang (y) và lặn nổi (z). Kỹ thuật điều khiển P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 206 Hình 4. Sai số bám của các biến góc nghiêng ngang (roll -  ), nghiêng dọc (pitch -  ) và góc hướng (yaw -  ) theo thời gian. Trên hình 3 và hình 4 là kết quả sai số bám của các biến trạng thái. Từ kết quả ta có thể rút ra được các kết luận sau: - Bộ điều khiển nơ ron bám quĩ đạo cho dạng PTN 6 bậc tự do đã thực hiện bám tiệm cận theo quĩ đạo cho trước. - Khả năng bám dựa trên việc thích nghi với mô hình phi tuyến của PTN và khử bỏ được nhiễu môi trường.Từ giây 30 trở đi hệ gần như bám hoàn toàn theo quĩ đạo với nhiễu dòng chảy của môi trường trong giới hạn. - Giải thuật học trực tuyến của mạng nơ ron đa lớp cho phép PTN bám theo một quĩ đạo liên tục, quán tính (hệ có chứa thành phần lực quán tính do chuyển động theo quĩ đạo xoắn ốc). 5. KẾT LUẬN Bài báo đã phát triển bộ điều khiển phi tuyến sử dụng mạng nơ ron truyền thẳng độc lập cho một đối tượng phi tuyến hoạt động không rõ ràng. Kết quả nhận được đã minh chứng tính đúng đắn của thuật toán. Kết quả nghiên cứu làm tiền đề cho việc phát triển hệ điều khiển phi tuyến thích nghi ứng dụng hệ mờ - nơ ron với các hệ thống tương tự. TÀI LIỆU THAM KHẢO [1] T.I.Fossen, “Guidance and Control Of Ocean Vehicles,” John Wiley & Sons, 1994. [2] M. Santhakumar and T. Asokan, “Coupled, non-linear control system design for autonomous underwater vehicle (AUV)” in Proc. Int. Conf.on Control, Autom. Robot., and Vis., 17-20 2008, pp. 2309 –2313. [3] R. P. Kumar, A. Dasgupta, and C. S. Kumar, “A new tracking controller design for underwater vehicles using quadratic stabilization” J. Dyn.Syst. Meas. Contr., vol. 130, no. 2, 2008. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 207 [4] L. Lapierre and B. Jouvencel, “Robust nonlinear path-following control of an AUV” IEEE J. Oceanic. Eng., vol. 33, no. 2, pp. 89–102, 2008. [5] L.-J. Zhang, X. Qi, and Y.-J. Pang, “Adaptive output feedback control based on DRFNN for AUV” IEEE J. Oceanic. Eng., vol. 36(9-10), pp. 716–722, 2009. [6] G. Indiveri, M. Pino, M. Aicardi, and G. Casalino, “Nonlinear timeinvariant feedback control of an underactuated marine vehicle along a straight course” in Proc. IFAC Conf. on Manoeuvring and Control of Mar. Craft, 2000, pp. 221–226. [7] G.N. Robert “Advance in Unmanned Marine Vehicles,” Control of Engineering Series 69 (1996) pp. 92-101. [8] Trương Duy Trung, Trần Đức Thuận, Nguyễn Quang Vịnh “Mô hình động học chuyển động của ngư lôi”, Tạp chí Nghiên cứu khoa học và công nghệ quân sự, (2012). ABSTRACT NONLINEAR CONTROL OF UNDERWATER VEHICLES USING AN ADAPTIVE NEURAL NETWORK Autonomous and remotely operated underwater vehicles such as ships and submarines are becoming a key component in search and recovery, exploration, surveillance, monitoring, and military applications. Underwater are nonlinear systems, works in unknown disturbance environment. This paper explores the development of a nonlinear controller for a fully actuated autonomous underwater vehicle (AUV) using an adaptive neural network to achieve asymptotic tracking results in the presence of complete model uncertainty and unknown disturbances. Keywords: Neural network, Nonlinear control, Underwater vehicles. Nhận bài ngày 20 tháng 07 năm 2015 Hoàn thiện ngày 10 tháng 08 năm 2015 Chấp nhận đăng ngày 07 tháng 09 năm 2015 Địa chỉ: 1 Học viện Hải quân; 2 Viện Khoa học và Công nghệ quân sự; * Email: namphanhoai@gmail.com.

Các file đính kèm theo tài liệu này:

26_phan_hoai_nam_1106_2149997.pdf