Tài liệu Điều khiển phi tuyến phương tiện ngầm bằng mạng nơ ron thích nghi: Kỹ thuật điều khiển
P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 200
ĐIỀU KHIỂN PHI TUYẾN PHƯƠNG TIỆN NGẦM
BẰNG MẠNG NƠ RON THÍCH NGHI
Phan Hoài Nam1*, Lê Kỳ Biên2, Bùi Thị Thanh Tâm3
Tóm tắt: Phương tiện ngầm (PTN) tự hành và điều khiển từ xa ngày càng trở nên
phổ biến trong việc nghiên cứu, thăm dò và thực hiện các nhiệm vụ dưới nước. PTN
là 1 đối tượng phi tuyến, hoạt động trong môi trường có nhiễu không rõ ràng. Bài
báo phát triển một bộ điều khiển phi tuyến sử dụng mạng nơ ron truyền tiến độc lập
để đạt được kết quả bám tiệm cận trong điều kiện có các thành phần không tường
minh trong mô hình và nhiễu loạn ngoài.
Từ khóa: Mạng Nơ ron. Điều khiển phi tuyến, Phương tiện ngầm.
1. ĐẶT VẤN ĐỀ
Việc điều khiển PTN theo 1 quĩ đạo chính xác và bền vững với môi trường là
một trong những bài toán quan trọng và cần thiết trong quá trình thiết kế chế tạo
PTN. Một vài kết quả nghiên cứu trước đây dựa trên giả thiết mô hình động học
t...
8 trang |
Chia sẻ: quangot475 | Lượt xem: 414 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Điều khiển phi tuyến phương tiện ngầm bằng mạng nơ ron thích nghi, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỹ thuật điều khiển
P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 200
ĐIỀU KHIỂN PHI TUYẾN PHƯƠNG TIỆN NGẦM
BẰNG MẠNG NƠ RON THÍCH NGHI
Phan Hoài Nam1*, Lê Kỳ Biên2, Bùi Thị Thanh Tâm3
Tóm tắt: Phương tiện ngầm (PTN) tự hành và điều khiển từ xa ngày càng trở nên
phổ biến trong việc nghiên cứu, thăm dò và thực hiện các nhiệm vụ dưới nước. PTN
là 1 đối tượng phi tuyến, hoạt động trong môi trường có nhiễu không rõ ràng. Bài
báo phát triển một bộ điều khiển phi tuyến sử dụng mạng nơ ron truyền tiến độc lập
để đạt được kết quả bám tiệm cận trong điều kiện có các thành phần không tường
minh trong mô hình và nhiễu loạn ngoài.
Từ khóa: Mạng Nơ ron. Điều khiển phi tuyến, Phương tiện ngầm.
1. ĐẶT VẤN ĐỀ
Việc điều khiển PTN theo 1 quĩ đạo chính xác và bền vững với môi trường là
một trong những bài toán quan trọng và cần thiết trong quá trình thiết kế chế tạo
PTN. Một vài kết quả nghiên cứu trước đây dựa trên giả thiết mô hình động học
tường minh lấy từ các kết quả kinh nghiệm [2]. Trong khi các bộ điều khiển này
cần phải có được hiệu quả điều khiển tốt nhất, mô hình kinh nghiệm thường không
chính xác, khó thực hiện, kết quả điều khiển mang lại đối với một mô hình không
biết chính xác không cao. Các bộ điều khiển thích nghi [3] đã giải quyết được các
vấn đề không tường minh trong mô hình và bộ điều khiển đã trở nên bền vững hơn.
Các kết quả này cơ bản dựa trên giả thiết là các tham số động học không biết có
thể tuyến tính hoá được. Kết quả trong [4] sử dụng phương pháp thích nghi kinh
điển và bộ điều khiển chuyển mạch rời rạc để bù các thành phần phi tuyến đã tuyến
tính hoá. Để so sánh với những kết quả điều khiển kiểu thích nghi kinh điển, các
nghiên cứu [5] đã ứng dụng logic mờ và mạng nơ ron làm các phương thức cơ bản
để xấp xỉ các thành phần động học không tường minh gồm cả các nhiễu loạn bổ
sung (và không giả định là các thành phần này tuyến tính); tuy nhiên, sự tồn tại của
nhiễu bên ngoài và sai số vốn có của hàm xấp xỉ làm cho kết quả bám cuối cùng bị
chặn đều. Kết quả trình bày trong [6] sử dụng điều khiển chế độ trượt như 1 công
cụ hỗ trợ để ước lượng sai số trạng thái tĩnh, các bộ điều khiển trượt cho kết quả
bền vững tốt, song bộ điều khiển là rời rạc [7]. Công trình [8] các tác giả mới
dừng lại nghiên cứu sử dụng bộ điều khiển mờ- thích nghi cho ngõ ra một dạng
PTN tự hành. Nội dung của bài báo sẽ phát triển một bộ điều khiển bám liên tục
cho một lớp PTN đa biến phi tuyến hoạt động trong môi trường có nhiễu.
2. MÔ HÌNH ĐỘNG LỰC HỌC CỦA PTN
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 201
PTN hoạt động trong môi trường nước chịu tác động của nhiều yếu tố môi
trường như dòng chảy, gió, sóng biển... nên một số thông số thủy động tính toán
mô phỏng không chính xác. Sự tác động qua lại giữa các kênh điều khiển tương
đối lớn ảnh hưởng đến chất lượng và tính ổn định của hệ thống. Việc đo lường đầy
đủ các trạng thái rất khó khăn, vì thế xu hướng nghiên cứu thuật toán điều khiển
thích nghi hồi tiếp ngõ ra cho đối tượng ngư lôi đang được phát triển mạnh [8].
Gần đây mạng nơron và hệ mờ được sử dụng rộng rãi trong trong các sơ đồ điều
khiển thích nghi và đạt được những kết quả đáng kể. Theo nghiên cứu của Fossen
[1], phương trình động học của PTN được mô tả:
J (1)
trong đó, 6t là véc tơ tốc độ thẳng và tốc độ góc trong hệ qui chiếu vật
thể, 6t làm véc tơ vị trí và tư thế trong hệ qui chiếu trái đất, và 6 6J
là ma trận chuyển Jacobi giữa 2 hệ qui chiếu và được xác định bởi:
1 3 3
3 3 2
0
0
J
J
J
(2)
với 3 3
1
J
và 3 3
2
J
được xác định bằng:
1
cos cos sin cos +cos sin sin sin sin +cos cos sin
sin cos cos cos +sin sin sin cos s +sin sin cos
sin cos sin cos cos
J
Và:
2
1 sin t cos tg
0 cos sin
0 sin / cos cos / cos
J
,
Các véc tơ mô tả trạng thái của PTN như sau:
Tx y z
; ,Tu v w p q r
trong đó, x, y và z biểu diễn toạ độ Đề các của khối tâm PTN; , , và biểu
diễn các hướng theo 3 trục PTN là nghiêng ngang, nghiêng dọc và góc hướng; u , v
và w lần lượt là tốc độ dịch dọc, dịch ngang và lên xuống; p, q, r là vận tốc góc
tương ứng.
Với giả thiết rằng gốc hệ qui chiếu vật thể gắn với trọng tâm của PTN, bỏ qua
gia tốc của trái đất tại điểm hệ đang hoạt động và khối lượng ảo là hằng số (độc lập
với tần số sóng), phương trình động lực học của hệ có thể được biễu diễn dưới
dạng véc tơ như sau:
d bM C D g t (3)
Kỹ thuật điều khiển
P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 202
ở đây. 6 6M là ma trận quán tính (gồm cả khối lượng kèm),
6 6C là ma trận lực Coriolis và ảnh hưởng hướng tâm, 6 6D là ma
trận lực cản thuỷ động và lực ma sát, 6g là véctơ mô men và lực trọng
trường và sức nổi, 6
d
t là véc tơ nhiễu phi tuyến (như sóng, dòng chảy, )
và 6
b
t là véc tơ ngoại lực và mô men tác động vào khối tâm của PTN trong
hệ qui chiếu vật thể. Mô hình động lực học của hệ còn có thể được biểu diễn theo
hệ qui chiếu trái đất bằng cách áp dụng các phép biến đổi động học, giả thiết là các
ma trận trong J không kỳ dị, ta có:
, , , dM C D g t (4)
3. XÂY DỰNG BỘ ĐIỀU KHIỂN
Hệ thống tự động điều khiển ngư lôi thể hiện trên hình 1 bao gồm [8]:
* Hệ thống chỉ đạo: nhận thông tin ban đầu để tạo ra quỹ đạo mong muốn bao
gồm quỹ đạo theo hướng và độ sâu [1],[8].
* Hệ thống dẫn đường: được trang bị khối dẫn đường quán tính INS, cảm biến
áp suất, thiết bị đo tốc độ âm thanh ...để đo độ sâu, hướng và vị trí [1],[8].
* Hệ thống điều khiển: So sánh hướng, độ sâu theo tín hiệu nhận được từ hệ
thống dẫn đường với quỷ đạo mong muốn để tính toán tín hiệu điều khiển là góc
quay các bánh lái và vây ổn định (các kênh điều khiển) [1],[8]..
Hình 1. Sơ đồ hệ thống tự động điều khiển chuyển động PTN.
Sai số hệ thống vòng hở đối với r t được biểu diễn như sau [1]:
,
d d
Mr f S (5)
Trong đó,
1 1 1 1
d d d d d d d d d d d d d d
f M J M J C J D J g
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 203
1 1 1 1 1 1
1 1 1 1
1 1 1 1 1 1
1 1 1
d d d d d d
d d d d d d d
S M J k e MJ M J M J k e MJ M J
M J k e M J e CJ C J DJ D J g g
Áp dụng lý thuyết xấp xỉ tổng quát để xấp xỉ hàm phụ không tường minh mạng
nơ ron 3 lớp: T T
d d d
f W V (6)
trong đó, 218 1 NV t và 2 1 6NW t tương ứng là các trọng số của mạng từ
lớp 1-2 và từ 2-3, Các trọng số này là hằng số lý tưởng và hữu hạn; N2 là số nơ ron
của lớp ẩn, 2 1 6N là hàm kích hoạt; 19
d
t là đầu vào của mạng nơ
ron và là 1 tập compact chứa các giá trị quĩ đạo mong muốn hữu hạn và biết trước:
1, , ,
T
T T T
d d d d
Từ (5), bộ điều khiển được thiết kế sử dụng mạng nơ ron truyền thẳng 3 lớp
được bổ sung thêm thành phần phản hồi tích phân bền vững dấu sai số, bộ điều
khiển có dạng:
ˆ
d
f (7)
Thành phần phản hồi được xác định:
2 2
1 1 0
s s
k e k e (8)
trong đó, 6
2
,e t là nghiệm phương trình:
2 2
1 sgn , 0 0
s
k e e (9)
s
k và là độ lợi điều khiển và là các giá trị hằng dương. Thành phần
mạng truyền tiến của mạng nơ ron: ˆ ˆ ˆT T
d d
f W V (10)
trong đó, 219ˆ NV t và 2 1 6ˆ NW t là các ước lượng trọng số lý. Ước
lượng trọng số của mạng trong (10) được cập nhật trực tuyến theo các phương
trình:
1 2
ˆ ˆˆ
T T
d
W proj V e
(11)
2
'
2
ˆ ˆˆ
T
T
d e
V proj W
(12)
trong đó,
2 2
1 1
1
N N
và
19 19
2
là các ma trận độ lợi điều khiển, các ma
trận này là đối xứng, không đổi và xác định dương, còn 2 1ˆ ' N là đạo hàm
riêng của ˆˆ T
d
V .
Tiến hành thay bộ điều khiển trong (7) vào mạch vòng hở (5) ta nhận được sai
số hệ thống bám vòng kín :
ˆ
d d d
Mr f f S (13)
Ước lượng sai lệch đối với trọng số mạng được xác định bằng
ˆV t V t V t và ˆW t W t W t , trong đó 219 NV t và
2 1 6NW t . Sử dụng (6) và (10) để xác định đạo hàm của (13), ta được:
Kỹ thuật điều khiển
P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 204
ˆ ˆ ˆˆ ˆ ˆ' ' ' '
T T T T T T T T
d d d d
Mr Mr W V W V W V W V
ˆ ˆ ˆ ˆˆ ˆ' '
T T T T T
d d d
W V S W W V
(14)
ở đây, ˆ được tính toán trong (11) và (12), và đạo hàm của (8) xác định bởi
phương trình:
2
1 sgn
s
t k r e (15)
Thực hiện việc nhóm các thành phần, (14) có thể được viết lại:
2 2
1
1 sgn
2
s
Mr Mr N N e k e
(16)
trong đó, 6
1 2
ˆ ˆ, , , , , , ,
d d
N W V e e r t và 6ˆ ˆ, , , ,
d d
N W V t ,
1 2
1
ˆˆ ˆ'
2
T T
d
N Mr proj V e
2 2 2ˆ ˆˆ ˆ' '
T
TT
d d
W proj We S e (17)
d B
N N N
với 6, ,
d d d
N t được xác định:
'
T T
d d d
N W V
và thành phần 6ˆ ˆ, , , ,
B d d
N W V t được tách ra sao cho:
1 2
B B B
N N N
(18)
với
1 2
6ˆ ˆ ˆ ˆ, , , , , , , , ,
B d d B d d
N W V t N W V t ,
1
ˆˆ ˆ' '
T T T T
B d d
N W V W V
2
ˆ ˆˆ ˆ' '
T T T T
B d d
N W V W V
Sỡ dĩ tách ra như vậy là vì các thành phần khác nhau trong (17) bị chặn khác
nhau.
Việc tách các thành phần trong (17,18) làm cơ sở cho việc xây dựng luật cập
nhật trọng số của mạng nơ ron và phân tích tính ổn định của hệ [1]. Giới hạn trên
của (17) được xác định: N
(19)
Trong đó: 1 2
T
T T T
e e r
(20)
và là hàm dương toàn cục khả nghịch không tăng.
1 2 3
, ,
d B d
N N N
Từ (14) và (15), đạo hàm của (22) bị chặn trên vì:
4 5 2B
N e
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 205
Trong đó , 1, ..., 5
i
i là các hằng dương đã biết.
4. KẾT QUẢ MÔ PHỎNG
Với dữ liệu đầu vào của quĩ đạo mẫu là đường xoắn ốc có phương trình sau:
2sin 2 cos 0 0
10 10 10 10
T
d
t t t t
với điều kiện đầu: 0 1 2 0 0 0 0 Td . Tham số khởi tạo cho ma trận
trọng số lý tưởng cho mạng nơ ron được chọn là: 2ˆ 19,initNNV rand N ,
2ˆ 1, 6initNNW zeros N và số nơ ron trong lớp ẩn được chọn 2 5N .
Hình 2. Mô hình mô phỏng PTN trên Matlab/Simulink.
Độ lợi phản hồi được chọn là ma trận đường chéo có cấu trúc véc tơ như sau:
1 1 1 0.5 4 3 5
T
k ; 310 4 5 7 8 8 7 Tsk
0.3 0.3 0.5 0.3 0.3 0.1 T ; 0.2 0.2 0.1 0.1 0.5 0.2 T
Độ lợi mạng nơ ron truyền thẳng được chọn là
1 6 6
2000 I
,
2 6 6
500 I
.
Mô hình toán mô phỏng trên matlab/simulink thể hiện trên hình 2.
Hình 3. Sai số bám của các biến dịch dọc (x), dịch ngang (y) và lặn nổi (z).
Kỹ thuật điều khiển
P. H.Nam, L.K. Biên, B.T.T.Tâm, “Điều khiển phi tuyến nơ ron thích nghi.” 206
Hình 4. Sai số bám của các biến góc nghiêng ngang (roll - ),
nghiêng dọc (pitch - ) và góc hướng (yaw - ) theo thời gian.
Trên hình 3 và hình 4 là kết quả sai số bám của các biến trạng thái. Từ kết quả
ta có thể rút ra được các kết luận sau:
- Bộ điều khiển nơ ron bám quĩ đạo cho dạng PTN 6 bậc tự do đã thực hiện bám
tiệm cận theo quĩ đạo cho trước.
- Khả năng bám dựa trên việc thích nghi với mô hình phi tuyến của PTN và khử
bỏ được nhiễu môi trường.Từ giây 30 trở đi hệ gần như bám hoàn toàn theo quĩ
đạo với nhiễu dòng chảy của môi trường trong giới hạn.
- Giải thuật học trực tuyến của mạng nơ ron đa lớp cho phép PTN bám theo một
quĩ đạo liên tục, quán tính (hệ có chứa thành phần lực quán tính do chuyển động
theo quĩ đạo xoắn ốc).
5. KẾT LUẬN
Bài báo đã phát triển bộ điều khiển phi tuyến sử dụng mạng nơ ron truyền thẳng
độc lập cho một đối tượng phi tuyến hoạt động không rõ ràng. Kết quả nhận được
đã minh chứng tính đúng đắn của thuật toán. Kết quả nghiên cứu làm tiền đề cho
việc phát triển hệ điều khiển phi tuyến thích nghi ứng dụng hệ mờ - nơ ron với các
hệ thống tương tự.
TÀI LIỆU THAM KHẢO
[1] T.I.Fossen, “Guidance and Control Of Ocean Vehicles,” John Wiley & Sons, 1994.
[2] M. Santhakumar and T. Asokan, “Coupled, non-linear control system design
for autonomous underwater vehicle (AUV)” in Proc. Int. Conf.on Control,
Autom. Robot., and Vis., 17-20 2008, pp. 2309 –2313.
[3] R. P. Kumar, A. Dasgupta, and C. S. Kumar, “A new tracking controller
design for underwater vehicles using quadratic stabilization” J. Dyn.Syst.
Meas. Contr., vol. 130, no. 2, 2008.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san Viện Điện tử, 10 - 2015 207
[4] L. Lapierre and B. Jouvencel, “Robust nonlinear path-following control of an
AUV” IEEE J. Oceanic. Eng., vol. 33, no. 2, pp. 89–102, 2008.
[5] L.-J. Zhang, X. Qi, and Y.-J. Pang, “Adaptive output feedback control based
on DRFNN for AUV” IEEE J. Oceanic. Eng., vol. 36(9-10), pp. 716–722,
2009.
[6] G. Indiveri, M. Pino, M. Aicardi, and G. Casalino, “Nonlinear timeinvariant
feedback control of an underactuated marine vehicle along a straight
course” in Proc. IFAC Conf. on Manoeuvring and Control of Mar. Craft,
2000, pp. 221–226.
[7] G.N. Robert “Advance in Unmanned Marine Vehicles,” Control of
Engineering Series 69 (1996) pp. 92-101.
[8] Trương Duy Trung, Trần Đức Thuận, Nguyễn Quang Vịnh “Mô hình động
học chuyển động của ngư lôi”, Tạp chí Nghiên cứu khoa học và công nghệ
quân sự, (2012).
ABSTRACT
NONLINEAR CONTROL OF UNDERWATER VEHICLES
USING AN ADAPTIVE NEURAL NETWORK
Autonomous and remotely operated underwater vehicles such as ships and
submarines are becoming a key component in search and recovery,
exploration, surveillance, monitoring, and military applications. Underwater
are nonlinear systems, works in unknown disturbance environment. This
paper explores the development of a nonlinear controller for a fully actuated
autonomous underwater vehicle (AUV) using an adaptive neural network to
achieve asymptotic tracking results in the presence of complete model
uncertainty and unknown disturbances.
Keywords: Neural network, Nonlinear control, Underwater vehicles.
Nhận bài ngày 20 tháng 07 năm 2015
Hoàn thiện ngày 10 tháng 08 năm 2015
Chấp nhận đăng ngày 07 tháng 09 năm 2015
Địa chỉ: 1 Học viện Hải quân;
2 Viện Khoa học và Công nghệ quân sự;
* Email: namphanhoai@gmail.com.
Các file đính kèm theo tài liệu này:
- 26_phan_hoai_nam_1106_2149997.pdf