Tổng hợp luật dẫn tối ưu tên lửa đảm bảo độ trượt nhỏ nhất trên cơ sở ứng dụng lý thuyết trò chơi vi phân

Tài liệu Tổng hợp luật dẫn tối ưu tên lửa đảm bảo độ trượt nhỏ nhất trên cơ sở ứng dụng lý thuyết trò chơi vi phân: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 41, 02 - 2016 19 TỔNG HỢP LUẬT DẪN TỐI ƯU TÊN LỬA ĐẢM BẢO ĐỘ TRƯỢT NHỎ NHẤT TRÊN CƠ SỞ ỨNG DỤNG LÝ THUYẾT TRÒ CHƠI VI PHÂN Phạm Trung Dũng1, Nguyễn Trọng Hà2*, Nguyễn Đức Thi3 Tóm tắt: Bài báo trình bày kết quả nghiên cứu tổng hợp luật dẫn tối ưu tên lửa trên cơ sở ứng dụng lý thuyết trò chơi vi phân. Luật dẫn tối ưu này đảm bảo độ trượt tại điểm gặp nhỏ. Các kết quả mô phỏng đã chứng tỏ những ưu điểm của luật dẫn được xây dựng trên cơ sở lý thuyết trò chơi vi phân. Tõ khãa: Tên lửa, Luật dẫn, Tối ưu, Trò chơi vi phân, Độ trượt. 1. ĐẶT VẤN ĐỀ Lý thuyết trò chơi vi phân xuất hiện vào những năm 60 của thế kỷ trước do nhu cầu nghiên cứu các đối tượng có điều khiển trong tình huống đối lập nhau mà chuyển động của chúng được mô ta qua hệ thống các phương trình vi phân. Trong lý thuyết trò chơi vi phân, những nghiên cứu về quá trình “đuổi bắt-lẩn trốn” của các đối tượng có điều khiển chiếm một ...

pdf8 trang | Chia sẻ: quangot475 | Lượt xem: 436 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Tổng hợp luật dẫn tối ưu tên lửa đảm bảo độ trượt nhỏ nhất trên cơ sở ứng dụng lý thuyết trò chơi vi phân, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 41, 02 - 2016 19 TỔNG HỢP LUẬT DẪN TỐI ƯU TÊN LỬA ĐẢM BẢO ĐỘ TRƯỢT NHỎ NHẤT TRÊN CƠ SỞ ỨNG DỤNG LÝ THUYẾT TRÒ CHƠI VI PHÂN Phạm Trung Dũng1, Nguyễn Trọng Hà2*, Nguyễn Đức Thi3 Tóm tắt: Bài báo trình bày kết quả nghiên cứu tổng hợp luật dẫn tối ưu tên lửa trên cơ sở ứng dụng lý thuyết trò chơi vi phân. Luật dẫn tối ưu này đảm bảo độ trượt tại điểm gặp nhỏ. Các kết quả mô phỏng đã chứng tỏ những ưu điểm của luật dẫn được xây dựng trên cơ sở lý thuyết trò chơi vi phân. Tõ khãa: Tên lửa, Luật dẫn, Tối ưu, Trò chơi vi phân, Độ trượt. 1. ĐẶT VẤN ĐỀ Lý thuyết trò chơi vi phân xuất hiện vào những năm 60 của thế kỷ trước do nhu cầu nghiên cứu các đối tượng có điều khiển trong tình huống đối lập nhau mà chuyển động của chúng được mô ta qua hệ thống các phương trình vi phân. Trong lý thuyết trò chơi vi phân, những nghiên cứu về quá trình “đuổi bắt-lẩn trốn” của các đối tượng có điều khiển chiếm một vị trí quan trọng. Các nghiên cứu đã thu được những kết quả quan trọng trong việc xây dựng mô hình toán học của các phương pháp điều khiển trong trường hợp thiếu thông tin. Trò chơi vi phân, nói dúng hơn là trò chơi động lực học được mô tả bằng phương trình vi phân có thể xác định nếu nhận được kết quả tổng hợp các chiến lược cân bằng của các đối tượng tham gia. Nghĩa là sự phụ thuộc của các biến điều khiển vào tọa độ pha và thời gian. Khác với các luật dẫn tối ưu được tổng hợp trên giả thiết các mô hình mục tiêu (MT) biết trước như: MT không cơ động hoặc thông tin đầy đủ về sự cơ động trong tương lai của MT [12,13]. Luật dẫn trò chơi vi phân khi xây dựng không có giả định về chuyển động tương lai của MT mà thay vào đó là xem xét các khả năng cơ động của MT. Đối với một hệ thống dẫn tên lửa (TL) thì một trong những chỉ số quan trọng nhất là độ trượt ở giai đoạn dẫn cuối. Quá trình dẫn, TL tiếp cận MT đảm bảo độ trượt nhỏ nhất trong khi MT áp dụng các biện pháp cơ động lẩn tránh làm độ trượt tại điểm gặp lớn nhất. Như vậy nó phù hợp với lý thuyết trò chơi vi phân. Những năm gần đây, trên thế giới đã có những nghiên cứu tổng hợp luật dẫn TL trên cơ sở ứng dụng lý thuyết trò chơi vi phân [5,6,8,10,11]. Tuy nhiên, những luật dẫn được tổng hợp cũng như kết quả khảo sát được công bố hết sức sơ lược. Việc tổng hợp luật dẫn trò chơi vi phân cũng như các kết quả khảo sát, đánh giá hiệu quả luật dẫn TL mới này thì chưa có công bố công khai ở trong và ngoài nước. 2. TỔNG HỢP LUẬT DẪN TRÒ CHƠI VI PHÂN Xét quan hệ động hình học TL-MT trong mặt phẳng đứng như trên hình 1 [3]: Các tham số trong hình 1 được định nghĩa như sau: θTL: Góc nghiêng quỹ đạo TL; θMT: Góc nghiêng quỹ đạo MT; TLV  : Véc tơ vận tốc TL; MTV  : Véc tơ vận tốc MT; V  : Véc tơ vận tốc tương đối giữa TL và MT; tcV  : Véc tơ tốc độ tiếp cận giữa TL và MT; TLW  : Véc tơ gia tốc TL; MTW  : Véc tơ gia tốc MT; D: Cự ly nghiêng TL-MT; : Góc đường ngắm TL-MT so với mặt phẳng ngang; h: Độ trượt tức thời. Tên lửa & Thiết bị bay P.T. Dũng, N.T. Hà, N.Đ. Thi, “Tổng hợp luật dẫn tối ưu lý thuyết trò chơi vi phân.” 20 Hệ phương trình động hình học TL-MT: cos( ) cos( ) sin( ) sin( ) MT MT TL TL MT MT TL TL D V V D V V                      (1) Độ trượt tức thời được tính như sau [3,9,12]: 2 2 2 tc D D D h V V D            (2) Kết hợp với phương trình thứ hai của hệ phương trình (1) ta có:    sin sinMT MT TL TL D h V V D          (3) Giả thiết TL và MT chuyển động với vận tốc không đổi, 0   tcD V . Khi đó tốc độ thay đổi độ trượt tức thời được tính như sau:      sin sinh MT MT TL TL MT TL D V h V V W W D D                   (4) Với:  cosTL TL TL TLW V       : Thành phần gia tốc TL vuông góc với đường ngắm;  cosMT MT MT MTW V       : Thành phần gia tốc MT vuông góc với đường ngắm. Gia tốc thay đổi độ trượt tức thời: 2 2h h MT TL MT TL MT TL D DD D W V W W D W W D W W D D DD                                               (5) Trong thực tế việc xác định TLW và  MTW là rất khó khăn, do vậy không mất tính tổng quát của bài toán tổng hợp luật dẫn, nhóm tác giả sử dụng giả thiết 0 TLW và 0  MTW . Kết hợp với phương trình thứ 2 của hệ (1) ta có thể viết lại công thức (5) như sau: h h MT TLW V W W     (6) Yêu cầu đối với quỹ đạo bay của TL trong quá trình dẫn là độ trượt h tại điểm gặp nhỏ nhất, trong khi MT lại thực hiện các phương thức cơ động khác nhau nhằm tăng độ trượt đạt cực đại. Như vậy ta có thể lấy hàm chỉ tiêu chất lượng như sau:   21 2 gJ h t      (7) Với tg là thời điểm TL gặp MT. Hình 1. Quan hệ động hình học TL-MT trong mặt phẳng Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 41, 02 - 2016 21 Để tổng hợp được luật dẫn trò chơi vi phân chúng ta phải tiến hành giải bài toán theo hai bước. Bước 1, điều kiện cần: Chúng ta đi tìm cặp chiến lược tối ưu của TL và MT (điểm yên ngựa). Bước 2, điều kiện đủ: Chứng minh điểm yên ngựa đó là ổn định. Điều kiện cần: Theo lý thuyết trò chơi vi phân (nguyên lý minimax Nash-Pontryagin), ta cần tìm các chiến lược điều khiển tối ưu TL *TLW  và MT *MTW  thỏa mãn bất đẳng thức kép sau [7,8]: * * * *( , ) ( , ) ( , )TL MT TL MT TL MTJ W W J W W J W W        (8) Để giải bài toán tìm các chiến lược điều khiển tối ưu *TLW  và *MTW  ta xây dựng hàm Hamilton như sau [1,2]:        v sin sinMT MT TL TL MT TL w MT TL D H V V W W D W W D                         (9) Trong đó: w,v  là các thừa số Lagrange chưa xác định. Độ biến thiên của các thừa số w,v  được tính theo hệ phương trình Hamilton [1,2,3], kết hợp với điều kiện đầu v ( )g tdt D  và w (t ) 0g  ta có: v w 0 , gt D Ddt   (10) Thay w,v  vào (9), ta viết lại hàm Hamilton như sau:         sin sin cos cos MT TLMT TL MT TLMT TL W W H D                                  0 gt TL MT MT TL MT TL TL MT MT TL D W W D W W Ddt W W                        (11) Để xác định được các chiến lược điều khiển tối ưu *TLW  , *MTW  là các cực trị của hàm Hamilton (11) ta cần giải hệ phương trình:             2 2 2 2 0 2 2 2 2 sin 0 cos sin gt MTTL MT TL MT MT TL MTMTMT TL MT MT TL TL MT MT TL TTL MT TL MT MT TL TLTL TL MT MT TL TL MT MT TL H D D D W W D Ddt W W WW W H D D D W W D W W WW W                                                                        0 0 cos gt L TL Ddt           (12) Giải hệ phương trình (12) ta được:   * TL TL MT TL y D x W              (13)   * MT MT MT TL y D x W              (14) Trong đó: Tên lửa & Thiết bị bay P.T. Dũng, N.T. Hà, N.Đ. Thi, “Tổng hợp luật dẫn tối ưu lý thuyết trò chơi vi phân.” 22          2 1 1 2 2 1 1 2 2 1 1 1 2 2 1 2 2 1 1 2 2 1 1 1 2 2 1 b a b a b a c a c c a b a b x a a c a c a a c a c        (15) 2 1 1 2 1 2 2 1 a b a b y a c a c    (16) 2 2 1 TL MTa D     ; 21 TL MTb D     ;    1 0 sin cos gt MT MTMT D c Ddt          (17) 2 2 2 TL MTa D     ; 22 TL MTb D     ;    2 0 sin cos gt TL TLTL D c Ddt          (18) Như vậy các giá trị nghiệm tìm được theo (13) và (14) là các chiến lược tối ưu (điểm yên ngựa. Trong đó, phương trình (14) là phương trình luật dẫn trò chơi vi phân (DGL - Differential game guidance law) đảm bảo TL bám theo MT với độ trượt nhỏ nhất, phương trình (13) là chiến lược cơ động tối ưu của MT nhằm “lẩn trốn” sự “đuổi bắt” của TL làm độ trượt lớn nhất. Điều kiện đủ: Trong lý thuyết điều khiển tối ưu phân biệt rõ điểm yên ngựa lý thuyết trò chơi và điểm yên ngựa trong phép tính vi phân. Sự tồn tại các nghiệm theo (13) và (14) không có nghĩa là điểm yên ngựa sẽ tồn tại. Theo [4] điểm yên ngựa của lý thuyết trò chơi vi phân trùng với điểm yên ngựa của phép tính vi phân khi: 2 2 2 *2 *2 * * 0 TL MT MT TL H H H W W W W             (19) Tính các giá trị 2 *2 TL H W    , 2 *2 MT H W    và 2 * * MT TL H W W     thay vào (19). Tiến hành một loạt các phép biến đổi tương đương, ta được:   2 0MT TL      (20) Bất phương trình (20) luôn đúng, điều này chứng tỏ điểm yên ngựa ổn định, hay (13) và (14) là các chiến lược tối ưu cần tìm. Để hiện thực được các thuật toán (13) và (14) cần phải xác định được các tham số sau: , , , , , , , ,TL TL MT MT MTD D W        . Những tham số , , ,TL TL     có thể đo được bằng cảm biến và thiết bị trên khoang hoặc đài điều khiển dưới mặt đất. Xác định các tham số ,D D bằng hệ đo-bám cự ly MT hệ đo-bám vận tốc hướng tâm. Tham số gia tốc của MT MTW  về nguyên tắc là không đo được trực tiếp. Tuy nhiên, có thể ứng dụng lý thuyết lọc tối ưu Kalman ta có thể xây dựng các bộ lọc đánh giá trạng thái của MT. Như vậy, thông qua các giải pháp này có thể chứng minh được khả năng hiện thực hóa luật dẫn mới tổng hợp được. 3. MÔ PHỎNG ĐÁNH GIÁ HIỆU QUẢ LUẬT DẪN TRÒ CHƠI VI PHÂN Để đánh giá hiệu quả luật dẫn tối ưu được xây dựng trên cơ sở lý thuyết trò chơi vi phân (DGL), ta chia vùng không gian xung quanh MT thành các góc phần tư thứ I, II, III, IV như hình 2. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 41, 02 - 2016 23 Khi MT bay vào (bắn đón) thì MT chỉ có thể cơ động tăng độ cao theo góc phần tư thứ II và cơ động bổ nhào ở góc phần tư thứ III với các gia tốc khác nhau.Tương tự, khi MT bay ra (bắn đuổi) thì MT chỉ có thể cơ động ở các góc phần tư thứ I và IV với các gia tốc khác nhau. Chúng tôi đánh giá hiệu quả của luật dẫn DGL thông qua các thông số như độ trượt tại điểm gặp, quá tải TL và thời điểm gặp. Chọn các thông số mô phỏng ban đầu như sau: VTL = 900m/s, RTLX = 0m; RTLY = 10000m; RMTY = 12000m. 3.1. Khi mục tiêu bay vào Tham số MT: VMT = 450m/s; RMTX = 15000m. Trường hợp MT cơ động tăng độ cao Giả thiết MT cơ động tăng độ cao với các gia tốc khác nhau: 1. * 230 /MTW m s   , 2. * 260 /MTW m s   , 3. * 290 /MTW m s   . Kết quả mô phỏng thể hiện trên hình 3, 4 và bảng 1. Trường hợp MT cơ động bổ nhào Giả thiết MT cơ động bổ nhào với các gia tốc khác nhau: 1. * 210 /MTW m s    , 2. * 220 /MTW m s    , 3. * 230 /MTW m s    . Kết quả mô phỏng thể hiện trên hình 5 và bảng 2. Hình 3. Quá tải tên lửa khi mục tiêu cơ động với gia tốc 9MTW g   . Hình 2. Phân vùng không gian cơ động của MT. 1 2 3 Hình 4. Quỹ đạo TL-MT khi MT bay vào, cơ động tăng độ cao. 1 2 3 Hình 5. Quỹ đạo TL-MT khi MT bay vào, cơ động bổ nhào. Tên lửa & Thiết bị bay P.T. Dũng, N.T. Hà, N.Đ. Thi, “Tổng hợp luật dẫn tối ưu lý thuyết trò chơi vi phân.” 24 Bảng 1. Kết quả mô phỏng khi MT bay vào, cơ động tăng độ cao. TT Tình huống mục tiêu D(tg) [m] tg [s] 1 * 230 /MTW m s   0,6561 11,2529 2 * 260 /MTW m s   1,5330 13,4290 3 * 290 /MTW m s   2,1334 18,2081 Bảng 2. Kết quả mô phỏng khi MT bay vào, cơ động bổ nhào. TT Tình huống mục tiêu D(tg) [m] tg [s] 1 * 210 /MTW m s    0,3279 11,0958 2 * 220 /MTW m s    0,5328 11,2122 3 * 230 /MTW m s    1,3334 18,2081 Trường hợp MT cơ động phức tạp Kết quả mô phỏng quỹ đạo TL, MT được thể hiện trên hình 6, độ trượt và thời điểm gặp trên bảng 3. Bảng 3. Kết quả mô phỏng khi MT cơ động phức tạp. TT Tình huống mục tiêu D(tg) [m] tg [s] 1 * 2 * 2 20( / ) khi 13000( ) 50( / ) khi 13000( ) MT MTX MT MTX W m s R m W m s R m         1,7809 11,1504 2 * 2 * 2 10( / ) khi 13000( ) 60( / ) khi 13000( ) MT MTX MT MTX W m s R m W m s R m         1,6538 11,2004 Kết quả mô phỏng trong các trường hợp MT cơ động bay vào cho thấy, luật dẫn trò chơi vi phân có thể đưa TL đến gặp MT với độ trượt tại điểm gặp nhỏ. Luật dẫn mới này hoàn toàn có thể tiêu diệt được các MT cơ động lớn (9g) (độ trượt khoảng 2m) và các MT cơ động phức tạp. 3.2. Khi mục tiêu bay ra Giả thiết: 250 MT V  m/s. Giả sử MT cơ động phức tạp khi bay ra Trường hợp 1: RMTX = 5000m, trường hợp 2: RMTX = 6000m. 1 2 Hình 7. Quỹ đạo TL-MT khi MT cơ động ra phức tạp. 1 2 Hình 6. Quỹ đạo TL-MT khi MT cơ động vào phức tạp. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 41, 02 - 2016 25 Kết quả mô phỏng quỹ đạo TL, MT được thể hiện trên hình 7, độ trượt và thời điểm gặp trên bảng 4. Bảng 4. Kết quả mô phỏng khi MT cơ động ra phức tạp. TT Tình huống mục tiêu D(tg) [m] tg [s] 1 * 2 * 2 60( / ) khi 6000( ) 20( / ) khi 6000( ) MT MTX MT MTX W m s R m W m s R m         2,1809 7,7207 2 * 2 * 2 10( / ) khi 7000( ) 50( / ) khi 7000( ) MT MTX MT MTX W m s R m W m s R m         1,6480 9,0789 Từ các kết quả mô phỏng có thể rút ra nhận xét sau: Khi MT cơ động ra ở cự ly và vận tốc cho phép thì luật dẫn trò chơi vi phân vẫn có thể đưa TL đến gặp MT với độ trượt tại điểm gặp nhỏ (trong tình huống phức MT cơ động phức tạp là khoảng 2m). Quỹ đạo TL tương đối thẳng, đồng nghĩa với việc quá tải TL nhỏ sẽ làm giảm sai số động của hệ thống dẫn. 4. KẾT LUẬN Bài báo đã tổng hợp được luật dẫn tối ưu TL trên cơ sở ứng dụng lý thuyết trò chơi vi phân đảm bảo độ trượt nhỏ nhất. Luật dẫn mới này hơn hẳn các luật dẫn tối ưu thông thường (trong tài liệu số [8] tác giả gọi luật dẫn trò chơi vi phân là luật dẫn thông minh, các luật dẫn tối ưu chỉ là trường hợp riêng của luật dẫn trò chơi vi phân), bởi vì các đối tượng tham gia vào mô hình động hình học sử dụng luật dẫn trò chơi vi phân sẽ có được chiến lược cơ động tối ưu của mình nhằm tối ưu hóa hàm chỉ tiêu chất được đã chọn. Kết quả khảo sát đã chứng tỏ được hiệu quả của luật dẫn mới, đặc biệt trong trường hợp MT cơ động mạnh và cơ động với gia tốc thay đổi. Trong các tình huống khác nhau, luật dẫn đều có thể đưa TL đến gặp MT với độ trượt nhỏ, đồng nghĩa với quá tải TL tại lân cận điểm gặp nhỏ. Quá tải TL trong trường hợp MT cơ động với gia tốc 9g thì quá tải đòi hỏi cực đại của luật dẫn cũng chỉ nhỏ hơn 13g (hình 3). Đối với các TL phòng không tự dẫn hiện đại như S300-PMU1, quá tải phát huy có thể đạt được 23g thì luật dẫn hoàn toàn có thể phù hợp với thực tế. TÀI LIỆU THAM KHẢO [1]. Nguyễn Doãn Phước. “Lý thuyết điều khiển nâng cao”. Nhà xuất bản Khoa học và Kỹ thuật, 2005. [2]. Phạm Trung Dũng, Vũ Xuân Đức. “Cơ sở điều khiển tối ưu trong các hệ thống kỹ thuật”. Nhà xuất bản quân đội nhân dân, 2012. [3]. А.И. Канащенкова, В.И. Меркулова. “Авиационные системы радиоуправления”. Мoсква, Том 1,2,3, 2003. [4]. Брейсон А., Хо Ю-Ши. “Прикладная теория оптимального управления”. М.: Мир. 1972. [5]. Battistini, S. Shima, T. “Differential games missile guidance with bearings-only measurements”. Aerospace and Electronic Systems, IEEE Transactions on, vol.50, pp.2906-2915, 2014. [6]. Battistini, S. Shima, T. “Differential games missile guidance with bearings-only measurements”. Decision and Control (CDC), IEEE 52nd Annual Conference on, pp.4218-4223, 2013. [7]. Cardaliaguet Pierre. “Introduction to differential games”. University of Brest, 1st version, 2010. Tên lửa & Thiết bị bay P.T. Dũng, N.T. Hà, N.Đ. Thi, “Tổng hợp luật dẫn tối ưu lý thuyết trò chơi vi phân.” 26 [8]. Farhan A. Faruqi. “Differential Game Theory Application to Intelligent Missile Guidance”. © Commonwealth of Australia. 2013. [9]. George M.Siouris. “Missle guidance and control systems”. 2003. [10]. Naiming Qi, Yanfang Liu, Zhiwei Tang. “Bounded Differential Game Guidance Law for Interceptor with Second-Order Maneuvering Dynamics”. Instrumentation, Measurement, Computer, Communication and Control, First International Conference on, pp.925 – 928, 2011. [11]. Ming-Hsiung Hsueh, Chin-I Huang, Li-Chen Fu. “A Differential Game Based Guidance Law for the Interceptor Missiles”. Industrial Electronics Society, IECON, 33rd Annual Conference of the IEEE, pp.665-670, 2007. [12]. Paul Zarchan. “Tactical and strategic missile guidance”. Sixth edition, 2012. [13]. S.Vathsal, A.K. Sarkar. “Current Trends in Tactical Missile Guidance”. Defence Science Journal, Vol.55, No.2, pp.265-280, 2005. ABSTRACT A DIFFERENTIAL GAME BASED GUIDANCE LAW FOR MINIMIZING MISS DISTANCE In this paper a missile guidance law is synthesized based on the differential game theory. The performance criterion is miss distance. The new missile guidance law has demonstrated the advantages in the aerial engagements. Keywords: Missile, Guidance law, Optimal, Different game theory, Miss distance. Nhận bài ngày 15 tháng 12 năm 2015 Hoàn thiện ngày 22 tháng 02 năm 2016 Chấp nhận đăng ngày 22 tháng 02 năm 2016 Địa chỉ: 1 Học viện Kỹ thuật quân sự ; 2 Học viện Phòng không-Không quân; 3 Tổng cục CNQP. * Email: nguyentrongha.tdh@gmail.com

Các file đính kèm theo tài liệu này:

  • pdf03_ha_71_2150008.pdf