Tài liệu Đề tài Tổng quan về mạng nơ ron nhân tạo: Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
5
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình do tôi tổng hợp và nghiên cứu.
Trong luận văn có sử dụng một số tài liệu tham khảo như đã nêu trong phần tài liệu
tham khảo.
Tác giả Luận văn
Nguyễn Đắc Nam
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
LỜI NÓI ĐẦU
Trong hệ thống điều khiển hiện đại, có rất nhiều phương pháp điều khiển
đảm bảo được tốt chất lượng điều khiển. Trong điều khiển tự động, để điều khiển
chính xác đối tượng khi chưa biết rõ được thông số, trước tiên ta phải hiểu rõ đối
tượng đó. Đặc biệt đối với các đối tượng phi tuyến ta cần dạng được đặc tính vào-ra
của nó để đảm bảo tạo ra tín hiệu điều khiển thích nghi được lựa chọn chính xác
hơn. Những bộ điều khiển hiện đại thường được sử dụng như lôgic mờ, mạng
nơron, mạng nơron mờ để nhận dạng và điều khiển thích nghi hệ thố...
82 trang |
Chia sẻ: hunglv | Lượt xem: 1642 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Đề tài Tổng quan về mạng nơ ron nhân tạo, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
5
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này là công trình do tôi tổng hợp và nghiên cứu.
Trong luận văn có sử dụng một số tài liệu tham khảo như đã nêu trong phần tài liệu
tham khảo.
Tác giả Luận văn
Nguyễn Đắc Nam
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
LỜI NÓI ĐẦU
Trong hệ thống điều khiển hiện đại, có rất nhiều phương pháp điều khiển
đảm bảo được tốt chất lượng điều khiển. Trong điều khiển tự động, để điều khiển
chính xác đối tượng khi chưa biết rõ được thông số, trước tiên ta phải hiểu rõ đối
tượng đó. Đặc biệt đối với các đối tượng phi tuyến ta cần dạng được đặc tính vào-ra
của nó để đảm bảo tạo ra tín hiệu điều khiển thích nghi được lựa chọn chính xác
hơn. Những bộ điều khiển hiện đại thường được sử dụng như lôgic mờ, mạng
nơron, mạng nơron mờ để nhận dạng và điều khiển thích nghi hệ thống phi tuyến.
Trong thời gian của khoá học cao học, chuyên ngành Tự động hoá tại trường
Đại Học Kỹ Thuật Công Nghiệp Thái Nguyên, được sự tạo điều kiện giúp đỡ của
nhà trường và Tiến Sĩ Phạm Hữu Đức Dục em đã lựa chọn đề tài của mình là:
“Nghiên cứu ứng dụng mạng nơron truyền thẳng nhiều lớp nhận dạng vị trí
rôbốt hai khâu”.
Trong khoảng 6 tháng thực hiện đề tài, được sự hướng dẫn nhiệt tình của
Tiến Sĩ Phạm Hữu Đức Dục, sự giúp đỡ của bạn bè cùng với sự nỗ lực, cố gắng của
mình bản luận văn đến nay đã hoàn thành.
Dù đã có nhiều cố gắng, xong bản luận văn vẫn không tránh khỏi những
thiếu sót và hạn chế, em rất mong nhận được sự góp ý của các thầy để bản luận văn
được tốt hơn.
Em xin trân trọng cảm ơn!
Học viên
Nguyễn Đắc Nam
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
7
MỤC LỤC
Trang
Lời cam đoan.
Danh mục các ký hiệu, bảng, các chữ viết tắt.
Danh mục các hình vẽ.
PHẦN MỞ ĐÀU. 1
Chƣơng I- TÔNG QUAN VỀ MẠNG NƠ RON NHÂN TẠO. 5
1.1. Lịch sử phát triển của mạng nơ ron nhân tạo. 5
1.2. Các tính chất của mạng nơ ron nhân tạo. 5
1.3. Mô hình nơ ron. 6
1.3.1.Mô hình nơ ron sinh học. 6
1.3.1.1. chức năng, tổ chức và hoạt động của bộ não con người. 6
1.3.1.2. Mạng nơ ron sinh học. 9
1.3.2. Mạng nơ ron nhân tạo. 10
1.3.2.1. Khái niệm. 10
1.3.2.2. Phân loại mạng nơ ron. 13
1.3.2.3. Các luật học. 15
1.3.3. Mô hình toán học mạng nơ ron truyền thẳng và mạng nơ ron hồi quy. 19
1.3.3.1. Mạng nơ ron truyền thẳng. 19
1.3.3.2. Mạng nơ ron hồi quy. 22
1.4. Quá trình huấn luyện mạng nơ ron nhiều lớp. 24
1.4.1. Quá trình thực hiện. 24
1.4.2. Quy tắc chuỗi. 25
1.4.3. Độ chính xác của lan truyền ngược. 27
1.4.4. Biến thể của lan tryền ngược. 27
1.4.5. Tổng quát.(phép nội suy và phép ngoại suy). 28
1.5. Công nghệ phân cứng sử dụng mạng nơ ron. 31
1.6. So sánh khả năng của mạng nơ ron với mạch logic 32
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8
KẾT LUẬN CHƢƠNG 1. 33
Chƣơng II- Các phƣơng pháp ứng dụng mạng nơ ron trong nhận dạng và
điều khiển.
34
2.1. Các vấn đề chung. 34
2.2. Các phƣơng pháp ứng dụng mạng nơ ron trong nhận dạng. 34
2.2.1. Cơ sở lý luận. 34
2.2.2. Mô tả toán học của đối tượng ở miền rời rạc. 36
2.2.3. Mô hình dùng mạng nơ ron. 39
2.2.3.1. Mô hình song song. 39
2.2.3.2. Mô hình nối tiếp song song. 39
2.2.3.3. Mô hình ngược trực tiếp. 40
2.2.3.4. Mô hình tổ hợp. 41
2.3. Các phƣơng pháp ứng dụng mạng nơ ron trong điều khiển. 42
2.3.1. Bộ điều khiển đảm bảo tính ổn định vững chắc. 42
2.3.2. Bộ điều khiển thích nghi ngược trực tiếp. 42
2.3.3. Điều khiển phi tuyến mô hình trong. 44
2.3.4. Điều khiển dự báo. 44
2.3.5. Điều khiển thích nghi theo mô hình mẫu (MRAC) 45
2.3.6. Điều khiển thích nghi tự chỉnh. 46
2.3.7. Điều khiển thích nghi bằng mạng nơ ron hồi quy tuyến tính. 46
2.3.8. Điều khiển thích nghi ổn định trực tiếp. 48
2.3.9. Điều khiển tối ưu. 49
2.3.10. Phương pháp bảng tra. 50
2.3.11. Điều khiển lọc. 50
2.4. Những hạn chế và chú ý. 51
KẾT LUẬN CHƢƠNG 2 52
Chƣơng III - Ứng dụng mạng nơ ron truyền thẳng nhiều lớp nhận dạng
vị trí rô bốt hai khâu.
53
3.1. Mạng nơ ron truyền thẳng nhiều lớp 53
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
9
3.1.1. Sơ đồ khối mạng nơ ron truyền thẳng nhiều lớp. 53
3.1.2. Thuật toán học lan truyền ngược của sai lệch. 53
3.2. Ứng dụng mạng nơ ron truyền thẳng nhiều lớp nhận dạng vị trí rô
bốt hai khâu.
57
3.2.1. Phân tích sơ đồ ứng dụng. 57
3.2.2. Mô tả động học của rô bốt hai khâu. 59
3.2.3. Thiết lập mạng nơ ron nhận dạng. 60
3.2.3.1. Thiết lập sơ đồ nhận dạng 60
3.2.4.2. Quá trình nhận dạng. 63
3.2.4.3. Kết quả mô phỏng và nhận dạng. 65
3.2.4.4. Kết luận chương III 74
KẾT LUẬN CHUNG 75
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ.
STT Ký hiệu Diễn giải tên hình vẽ.
1 Hình 1 Sơ đồ khối điều khiển thích nghi rô bốt hai khâu.
2 Hình 2 Sơ đồ ứng dụng mạng nơ ron nhận dạng vị trí rô bốt hai khâu.
3 Hình 1.1 Mô hình hai nơ ron sinh học.
4 Hình 1.2 Mô hình nơ ron nhân tạo.
5 Hình 1.3a Biểu diễn hình học của hàm Rump
6 Hình 1.3b Biểu diễn hình học của hàm bước nhảy.
7 Hình 1.3c Biểu diễn hình học của hàm giới hạn cứng.
8 Hình 1.3d Biểu diễn hình học của hàm Sigmoid hai cực.
9 Hình 1.4a Mạng một lớp truyền thẳng.
10 Hình 1.4b Mạng nhiều lớp truyền thẳng.
11 Hình 1.4c Mạng nơ ron có phản hồi.
12 Hình 1.4d Mạng nơ ron hồi quy.
13 Hình 1.5 Cấu trúc huấn luyện mạng nơ ron.
14 Hình 1.6 Mô hình học có giám sát và học củng cố.
15 Hình 1.7 Mô hình học không có giám sát.
16 Hình 1.8 Sơ đồ cấu trúc chung của quá trình học.
17 Hình 1.9 Cấu trúc mạng nơ ron một lớp.
18 Hình 1.10 Ký hiệu mạng R đầu vào và S nơ ron.
19 Hình 1.11 Ký hiệu mạng một lớp.
20 Hình 1.12 Cấu trúc mạng nơ ron 3 lớp.
21 Hình 1.13 Ký hiệu mạng nơ ron 3 lớp.
22 Hình 1.14 Ký hiệu mạng một l lớp hồi quy.
23 Hình 1.15 Ký hiệu mạng nơ ron 3 lớp hồi quy.
24 Hình 1.16a
Mạng được huấn luyện theo phương pháp bình phương sai
lệch cực tiểu.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
11
PHẦN MỞ ĐẦU
1.Lý do lựa chọn đề tài.
Để điều khiển chính xác đối tượng khi chưa biết rõ được thông số, trước tiên
ta phải hiểu rõ đối tượng đó. Đối với đối tượng là phi tuyến như rô bốt, ta cần thực
hiện nhận dạng đặc tính vào ra của nó để đảm bảo tạo ra tín hiệu điều khiển thích
nghi được lựa chọn chính xác hơn. Hiện nay thường sử dụng logic mờ (Fuzzy
Logic), mạng nơ ron ( Neural Networks), và mạng no ron mờ (Fuzzy Neural
Networks) để nhận dạng và điều khiển thích nghi hệ thống phi tuyến.Trong khuôn
khổ của khoá học Cao học, chuyên ngành Tự động hoá tại trường Đại học Kỹ thuật
Công nghiệp Thái Nguyên, được sự tạo điều kiện giúp đỡ của nhà trường và Tiến sĩ
Phạm Hữu Đức Dục, em đã lựa chọn đề tài của mình là “Nghiên cứu ứng dụng
mạng nơ ron truyền thẳng nhiều lớp nhận dạng vị trí rô bốt hai khâu”.
2.Mục đích của đề tài.
Nghiên cứu việc ứng dụng mạng nơ ron trong quá trình nhận dạng và điều
khiển hệ thống phi tuyến nói chung. Đặc biệt đi sâu nghiên cứu mạng nơ ron truyền
thẳng nhiều lớp nhận dạng đặc tính vào – ra của rô bốt hai khâu, làm cơ sở cho việc
tạo ra tín hiệu điều khiển thích nghi được lựa chọn chính xác hơn.
3. Đối tƣợng và phạm vi nghiên cứu.
a/ Đối tượng nghiên cứu.
Đối tượng nghiên cứu của đề tài là sử dụng mạng nơ ron truyền thẳng nhiều
lớp nhận dạng vị trí hai khâu rô bốt.
Sơ đồ hình 1 mô tả một mô hình điều chỉnh thích nghi rô bốt hai khâu theo mô hình
mẫu.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
12
Sơ đồ điều khiển được thực hiện theo hai giai đoạn sau đây:
Giai đoạn 1: Sử dụng mạng nơ ron nhận dạng vị trí của rô bốt hai khâu, khi
đó các khoá K mở. Căn cứ vào sai lệch e1 giữa tín hiệu ra của rô bốt (y) và tín hiệu
ra của mạng nơ ron nhận dạng(ymh), mạng nơ ron tiến hành học để nhận dạng đặc
tính vào ra y của rô bốt hai khâu, sao cho tín hiệu mạng nơ ron nhận dạng ymh bám
theo được tín hiệu ra y của rô bốt hai khâu. Với e1= y- ymh
Giai đoạn 2: Căn cứ vào kết quả nhận dạng ta có được mạng nơ ron có thể
thay thế gần đúng cho rô bốt hai khâu từ đó tiến hành điều khiển thích nghi rô bôt
hai khâu theo mô hình mẫu. Các khoá K đóng, dựa vào bộ thông số sai lệch (e2, 2e
) giữa tín hiệu đầu ra của mô hình mẫu ym và tín hiệu đầu ra của mạng nơ ron nhận
dạng ymh, bộ điều khiển thực hiện các luật học thích nghi tạo ra tín hiệu điều khiển u
với mục đích tạo ra được tín hiệu đầu ra của mạng nhận dạng bám theo được tín
hiệu đầu ra của mô hình. Với e2 = ym – ymh và ė2 là đạo hàm cấp một của sai lệch e2
Với thời gian nghiên cứu có hạn, luận văn này chỉ đi sâu nghiên cứu ứng dụng
mạng nơ ron nhiều lớp truyền thẳng nhận dạng vị trí rô bốt hai khâu.
b/ Phạm vi nghiên cứu của đề tài.
- ymh
-
e2
e1
y
ymh
ym
u
K
Bộ điều
khiển
Mô hình mẫu
Rôbốt hai khâu
Mạng nơron nhận
dạng
K
xd
e2
ė2
Hình 1. Sơ đồ khối điều khiển thích nghi rô bốt hai khâu
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
13
Chương I. Tổng quan về mạng nơ ron nhân tạo:
Phân tích tổng quan nề mạng nơ ron bao gồm : Lịch sử phát triển, kết cấu
của các mạng nơ ron, vai trò của các mạng nơ ron trong điều khiển.
Chương II. Các phương pháp ứng dụng mạng nơ ron trong nhận dạng và điều
khiển:
Trình bày các phương pháp ứng dụng mô hình mạng nơ ron trong nhận dạng
và điều khiển.
Chương III. Ứng dụng mạng nơ ron truyền thẳng nhiều lớp nhận dạng vị trí rô bốt
hai khâu.
Đưa ra mô hình nhận dạng vị trí rô bốt hai khâu, từ đó phân tích, lựa chọn
mạng nơ ron truyền thẳng nhiều lớp với luật học lan truyền ngược tiến hành nhận
dạng đặc tính vào ra của rô bốt hai khâu với sơ đồ tổng quát như hình 2:
4. Ý nghĩa khoa học và thực tiễn của đề tài.
Với ứng dụng mạng nơ ron truyền thẳng nhiều lớp nhận dạng quỹ đạo
chuyển động trong miền thời gian thực của rô bốt hai khâu. Sau khi nhận dạng được
vị trí của rô bốt hai khâu, ta có thể thay thế gần đúng mô hình vị trí rô bốt hai khâu
bằng một mạng nơ ron truyền thẳng, từ đó căn cứ vào các thông số mô phỏng của
ymh
y
e1
xd
Robot hai khâu
(Mô hình tính toán vị trí)
Mạng nơ ron nhận dạng
Hình2. Sơ đồ ứng dụng mạng nơ ron nhận dạng vị trí rô bốt hai khâu
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
14
mạng nơ ron ta tính toán được tín hiệu điều chỉnh nhằm điều khiển thích nghi vị trí
của rô bốt hai khâu phù hợp với những yêu cầu cần thiết của điều chỉnh thích nghi
vị trí rô bốt hai khâu.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
15
CHƢƠNG I
TỔNG QUAN VỀ MẠNG NƠ RON NHÂN TẠO
Mạng nơ ron nhân tạo (Artificial Neural Networks) là hệ thống được xây
dựng dựa trên nguyên tắc cấu tạo của bộ não người. Nó cho chúng ta một hướng
mới trong nghiên cứu hệ thống thông tin. Mạng nơ ron nhân tạo có thể thực hiện
các bài toán: Tính toán gần đúng các hàm số, thực hiện các bài toán tối ưu, nhận
mẫu, nhận dạng và điều khiển đối tượng hiệu quả hơn so với các phương pháp
truyền thống.
Mạng nơ ron nhân tạo có một số lượng lớn mối liên kết của các phần tử biến
đổi có liên kết song song. Nó có hành vi tương tự như bộ não người với khả năng
học ( Learning ), gọi lại (Recall) và tổng hợp thông tin từ sự luyện tập của các tập
mẫu dữ liệu. Các phần tử biến đổi của mạng nơ ron nhân tạo được gọi là các nơ ron
nhân tạo hoặc gọi tắt là nơ ron
1.1 LỊCH SỬ PHÁT TRIỂN CỦA MẠNG NƠ RON NHÂN TẠO.
Mạng nơ ron nhân tạo đã có một lịch sử phát triển lâu dài. Năm 1943,
McCulloch và Pitts đã đưa ra khả năng liên kết và một số liên kết cơ bản của mạng
nơ ron. Năm1949, Hebb đã đưa ra các luật thích nghi trong mạng nơ ron. Năm
1958, Rosenbatt đưa ra cấu trúc Perception. Năm 1969, Minsky và Papert phân tích
sự đúng đắn của Perception, họ đã chứng minh các tính chất và chỉ rõ các giới hạn
của một số mô hình. Năm 1976, Grossberg dựa vào tính chất sinh học đã đưa ra một
số cấu trúc của hệ động học phi tuyến với các tính chất mới. Năm 1982, Rumelhart
đưa ra mô hình song song một số thuật toán và kết quả. Thuật toán học lan truyền
ngược được Rumelhart, Hinton, Williams (1986) đề xuất luyện mạng nơ ron nhiều
lớp. Những năm gần đây, nhiều tác giả đã đề xuất nhiều loại cấu trúc mạng nơ ron
mới. Mạng nơ ron được ứng dụng trong nhiều lĩnh vực kinh tế kỹ thuật khoa học vũ
trụ (Hecht – Nielsen, 1988)
1.2 CÁC TÍNH CHẤT CỦA MẠNG NƠ RON NHÂN TẠO.
Là hệ phi tuyến: Mạng nơ ron có khả năng to lớn trong lĩnh vực nhận dạng
và điều khiển các đối tượng phi tuyến.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
16
Là hệ xử lý song song: Mạng nơ ron có cấu trúc song song, do đó có độ tính
toán rất cao rất phù hợp với lĩnh vực nhận dạng và điều khiển.
Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ và có khả
năng tự chỉnh khi số liệu đầu vào bị mất, có thể điều khiển on- line.
Là hệ nhiều biến, nhiều đầu vào, nhiều đầu ra (MIMO), rất tiện dùng khi đối
tượng điều khiển có nhiều biến số.
1.3 MÔ HÌNH NƠ RON
1.3.1.Mô hình nơ ron sinh học.
1.3.1.1 Chức năng, tổ chức và hoạt động của bộ não con người.
Bộ não người có chức năng hết sức quan trọng trong đời sống của con người.
Nó gần như kiểm soát hầu hết mọi hành vi của con người từ các hoạt động cơ bắp
đơn giản đến những hoạt động phức tạp như học tập, nhớ, suy luận, tư duy, sáng
tạo, ...
Bộ não người được hình thành từ sự liên kết của khoảng 1011 phần tử (tế
bào), trong đó có khoảng 1010 phần tử là nơ ron, số còn lại khoảng 9*1010 phần tử là
các tế bào thần kinh đệm và chúng có nhiệm vụ phục vụ cũng như hỗ trợ cho các nơ
ron. Thông thường một bộ não trung bình cân nặng khoảng 1,5 kg và có thể tích là
235 cm
3 . Cho đến nay người ta vẫn chưa thực sự biết rõ cấu tạo chi tiết của bộ não.
Tuy vậy về đại thể thì cấu tạo não bộ được phân chia ra thành nhiều vùng khác
nhau. Mỗi vùng có thể kiểm soát một hay nhiều hoạt động của con người.
Các đặc tính của não người:
- Tính phân lớp: Các vùng trong bộ não được phân thành các lớp, thông tin
được xử lý theo các tầng.
- Tính môđun: Các vùng của bộ nhớ được phân thành các môđun được mã
hoá bằng các định nghĩa mối quan hệ tích hợp giữa các tín hiệu vào qua các giác
quan và các tín hiệu ra.
- Mối liên kết: Liên kết giữa các lớp dẫn đến các dữ liệu dùng chung xem
như các liên hệ phản hồi khi truyền tín hiệu.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
17
- Sử lý phân tán các tín hiệu vào: Các tín hiệu vào được truyền qua nhiều
kênh thông tin khác nhau, được xử lý bằng các phương pháp đặc biệt.
Bộ não có cấu trúc nhiều lớp. Lớp bên ngoài thường thấy như là các nếp
nhăn, là lớp có cấu tạo phức tạp nhất. Đây là nơi kiểm soát và phát sinh các hành
động phức tạp như nghe, nhìn, tư duy, ...
Tín hiệu thu, nhận ở các dạng xung điện – Màng (Membrane): Mỗi tế bào
thần kinh có một màng, có nhiệm vụ giữ cho các chất nuôi tế bào không tràn ra
ngoài. Do đó, các phần tử nội bào và ngoại bào không bằng nhau, giữa chúng có
dung dịch muối lỏng làm cho chúng bị phân rã thành các nguyên tử âm và dương.
Các nguyên tử dương trong màng tạo ra điện thế màng, nó tồn tại trong trạng thái
cân bằng lực: lực đẩy các nguyên tử dương ra khỏi tế bào bằng với lực hút chúng
vào trong tế bào.
Điện thế màng là phần tử quan trọng trong quá trình truyền tin của hệ thần
kinh. Khi thay đổi khả năng thẩm thấu ion của màng thì điện thế màng của tế bào bị
thay đổi và tiến tới một ngưỡng nào đó, đồng thời sinh ra dòng điện, dòng điện này
gây ra phản ứng kích thích làm thay đổi khả năng thẩm thấu ion của tế bào tiếp
theo.
Xử lý thông tin trong bộ não:
Thông tin được tiếp nhận từ các giác quanvà chuyển vào các tế bào thần kinh
vận động vào các tế bào cơ. Mỗi tế bào thần kinh tiếp nhận thông tin, điện thế sẽ
tăng trong thần kinh cảm giác, nếu điện thế này vượt ngưỡng nó tạo ra dòng điện
trong tế bào thần kinh cảm giác, ý nghĩa dòng điện đó được giải mã và lưu ở thần
kinh trung ương, kết quả xử lý thông tin được gửi đến các tế bào cơ.
Các tế bào thần kinh đưa các tín hiệu giống nhau, do đó không thể phân biệt
được đó là của loài động vật nguyên thuỷ hay của một giáo sư. Các khớp thần kinh
chỉ cho các tín hiệu phù hợp qua chúng, còn lại các tín hiệu khác bị cản lại. Lượng
tín hiệu được biến đổi được gọi là cường độ khớp thần kinh đó chính là trọng số của
nơ ron trong mạng nơ ron nhân tạo.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
18
Tại sao việc nghiên cứu về mạng thần kinh lại có tầm quan trọng lớn lao. Có
thể trả lời ngắn gọn là sư giống nhau của các tín hiệu của các tế bào thần kinh đơn
lẻ, do đó chức năng thực sự của bộ não không phụ thuộc vào vai trò của một tế bào
thần kinh đơn, mà phụ thuộc vào toàn bộ các tế bào thần kinh hay các tế bào thần
kinh liên kết với nhau thành một mạng thần kinh hay một mạng nơ ron (Neural
Networks)
Hoạt động của bộ não nói riêng và của hệ thần kinh nói chung đã được con
người quan tâm nghiên cứu từ lâu nhưng cho đến nay người ta vẫn chưa hiểu rõ
thực sự về hoạt động của bộ não và hệ thần kinh. Đặc biệt là trong các hoạt động
liên quan đến trí óc như suy nghĩ, nhớ, sáng tạo, ... Tuy thế cho đến nay, người ta
cũng có những hiểu biết căn bản về hoạt động cấp thấp của não.
Mỗi nơ ron liên kết với khoảng 104 nơ ron khác, cho nên khi hoạt động thì bộ
não hoạt động một cách tổng lực và đạt hiệu quả cao. Nói một cách khác là các
phần tử của não hoạt động một cách song song và tương tác hết sức tinh vi phức
tạp, hiệu quả hoạt động thường rất cao, nhất là trong các vấn đề phức tạp. Về tốc độ
xử lý của bộ não người rất nhanh mặc dù tốc độ xử lý của mỗi nơ ron (có thể xem
như phần tử xử lý hay phần tử tính) là rất chậm so với xử lý của các cổng logic
silicon trong các chip vi xử lý (10-3 giây so với 10-10 giây).
Hoạt động của cả hệ thống thần kinh bao gồm não bộ và các giác quan như
sau:
Trước hết con người bị kích thích bởi giác quan từ bên ngoài hoặc trong cơ
thể. Sự kích thích đó được biến thành các xung điện bởi chính các giác quan tiếp
nhận kích thích. Những tín hiệu này được chuyển về trung ương thần kinh là não bộ
để xử lý. Trong thực tế não bộ liên tục nhận thông tin xử lý, đánh giá và so sánh với
thông tin lưu trữ để đưa ra các quyết định thích đáng.
Những mệnh lệnh cần thiết được phát sinh và gửi đến những bộ phận thi
hành thích hợp như các cơ tay, chân, ... Những bộ phận thi hành biến những xung
điện thành dữ liệu xuất của hệ thống.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
19
Tóm lại: Bộ não người có chức năng hết sức quan trọng đối với đời sống của
con người. Cấu tạo của nó rất phức tạp, tinh vi bởi được tạo thành từ mạng nơ ron
có hàng chục tỉ tế bào với mức độ liên kết giữa các nơ ron là rất cao. Hơn nữa, nó
còn được chia thành các vùng và các lớp khác nhau. Bộ não hoạt động dựa trên cơ
chế hoạt động song song của các nơ ron tạo nên nó.
1.3.1.2. Mạng nơron sinh học.
a/ Cấu tạo.
Nơ ron là phần tử cơ bản tạo nên bộ não con người. Sơ đồ cấu tạo của một
nơ ron sinh học được chỉ ra như trong hình 1.1. Một nơ ron điển hình có 3 phần
chính:
- Thân nơ ron (soma): Nhân của nơ ron được đặt ở đây.
- Các nhánh (dendrite): Đây chính là các mạng dạng cây của các dây thần
kinh để nối các soma với nhau.
- Sợi trục (Axon): Đây là một nối kết, hình trụ dài và mang các tín hiệu từ đó
ra ngoài. Phần cuối của axon được chia thành nhiều nhánh nhỏ. Mỗi nhánh nhỏ (cả
của dendrite và axon) kết thúc trong một cơ quan nhỏ hình củ hành được gọi là
synapte mà tại đây các nơ ron đưa các tín hiệu của nó vào các nơr on khác. Những
điểm tiếp nhận với các synapte trên các nơ ron khác có thể ở các dendrite hay chính
soma.
Nhánh
Khớp nối
Sợi trục
Hình1.1. Mô hình 2 nơ ron sinh học
Thân
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
20
b/ Hoạt động.
Các tín hiệu đưa ra bởi một synapte và được nhận bởi các dendrite là các
kích thích điện tử. Việc truyền tín hiệu như trên liên quan đến một quá trình hóa học
phức tạp mà trong đó các chất truyền đặc trưng được giải phóng từ phía gửi của nơi
tiếp nối. Điều này làm tăng hay giảm điện thế bên trong thân của nơ ron nhận. Nơ
ron nhận tín hiệu sẽ kích hoạt (fire) nếu điện thế vượt khỏi một ngưỡng nào đó và
một xung (hoặc điện thế hoạt động) với độ mạnh (cường độ) và thời gian tồn tại cố
định được gửi ra ngoài thông qua axon tới phần nhánh của nó rồi tới các chỗ nối
synapte với các nơ ron khác. Sau khi kích hoạt, nơ ron sẽ chờ trong một khoảng thời
gian được gọi là chu kỳ, trước khi nó có thể được kích hoạt lại. Synapses là hưng
phấn (excitatory) nếu chúng cho phép các kích thích truyền qua gây ra tình trạng
kích hoạt (fire) đối với nơ ron nhận. Ngược lại, chúng là ức chế (inhibitory) nếu các
kích thích truyền qua làm ngăn trở trạng thái kích hoạt (fire) của nơ ron nhận.
1.3.2. Mạng nơ ron nhân tạo.
1.3.2.1. Khái niệm.
Nơ ron nhân tạo là sự sao chép nơ ron sinh học của não người, nó có những
đặc tính sau:
- Mỗi nơ ron có một số đầu vào, những kết nối (Synaptic) và một đầu ra
(axon)
- Một nơ ron có thể hoạt động (+35mV) hoặc không hoạt động (-0,75mV)
- Chỉ có một đầu ra duy nhất của một nơ ron được nối với các đầu vào khác
nhau của nơ ron khác. Điều kiện để nơ ron được kích hoạt hay không kích hoạt chỉ
phụ thuộc những đầu vào hiện thời của chính nó.Thông thường một nơ ron có 3
phần như hình 1.2:
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
21
Trên mỗi đầu vào của nơ ron có gắn một trọng số để liên kết giữa nơ ron thứ i và nơ
ron thứ j. Các trọng số này tương tự như các tế bào cảm giác của mạng nơ ron sinh
học.
Tổng trọng: Vi(t) = neti(t) =
ik
N
j
M
k
j tuty
)(.W)(.W
1 1
ik
*
ij
(1.1)
Với Vi(t) là tổng trọng của nơ ron thứ i; yj(t) là các đầu ra của nơ ron thứ jvà
uk(t) là các đầu vào từ bên ngoài tương ứng với các trọng số Wij và W
*
ik; là hằng
số gọi là ngưỡng của nơ ron thứ i.
Hệ động học tuyến tính SISO: Đầu vào là vi đầu ra là xi. Ở dạng toán tử Laplace ta
có:
Xi(s)= H(s).Vi(s) (1.2)
Dạng thời gian của (1.2) có dạng (1.3)
t
ii dvthtx )()()(
(1.3)
vi
xi yi
Wij
Wi1
WiN
W
*
i1
W
*
ik
W
*
iM
Hệ
động
học
tuyến
tính
Hàm
động học
phi tuyến
a(.)
y1
yj
ym
u1
uk
uM
1
Hình 1.2. Mô hình nơ ron nhân tạo
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
22
Quan hệ của H(s) và h(t) và quan hệ vào – ra tương ứng của nơ ron được cho trong
bảng 1.1
H(s) 1
s
1
1
1
sT
sTe
h(t)
)(t
1(t)
T
t
e
T
1
)( Tt
xi(t) = wi(t) xi(t) = vi(t)
Txi(t) +xi(t) = vi(t) xi(t) = vi(t-T)
Bảng 1.1
Hàm động học phi tuyến: Mô tả mối quan hệ của đầu ra yi với đầu vào xi:
yi=a(xi) với a(.) là hàm chuyển đổi.
Hàm chuyển đổi: Để tìm được đầu ra của nơ ron ta phải tiến hành qua hai bước như
sau:
- Tìm các giá trị tổng trọng lượng đầu vào neti(t)
- Căn cứ vào neti(t) để tìm ra yi bằng các hàm chuyển đổi vào ra.
Hàm chuyển đổi a(.) thực hiện coi nơ ron như một hộp đen, chuyển đổi một
tín hiệu vào thành tín hiệu ra.Các dạng hàm chuyển đổi thường được sử dụng có
dạng như sau:
+ Hàm Rump (Rump Function) là hàm có biểu diễn toán học như (1.4):
(1.4)
Biểu diễn hình học của hàm Rump như hình vẽ 1.3.a
+ Hàm bước nhảy (Step Function) là hàm có biểu diễn toán học như (1.5):
(1.5)
1 nếu f > 1
a(f) = f nếu 0 f 1
0 nếu f < 0
1 nếu f 0
a(f) =
0 nếu f < 0
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
23
Biểu diễn hình học của hàm như hình vẽ 1.3.b
+ Hàm giới hạn cứng (Threshold Function) là hàm có biểu diễn toán học như (1.6):
(1.6)
Biểu diễn hình học của hàm như hình vẽ 1.3.c
+ Hàm sigmoid hai cực (Bipolar Sigmoid Function) là hàm có biểu diễn toán học
như (1.7): a(f) =
1
1
2
fe
(1.7)
Biểu diễn hình học của hàm như hình vẽ 1.3d
1.3.2.2. Phân loại mạng nơ ron.
Nelson và IIlingworth (1991) đã đưa ra mộy số loại cấu trúc của mạng nơ
ron như hình 1.4. Nơron được vẽ là các vòng tròn xem như một tế bào thần kinh,
chúng có các mối liên hệ đến các nơ ron khác nhờ các trọng số, lập thành các ma
trận trọng số tương ứng.
1 nếu f 0
a(f) =
-1 nếu f < 0
Hình 1.3.d Hàm Sigmoid hai cực
0
a
f 1
1
0
a
f
1
0
a
f
-1
1
Hình 1.3a. Hàm Rump Hình 1.3b. Hàm bước nhảy Hình 1.3b. Hàm giới hạn cứng
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
24
Mỗi một nơ ron có thể phối hợp với các nơ ron khác tạo thành một lớp các
trọng số. Mạng một lớp truyền thẳng (Single- Layer Feedforward Network) như
hình 1.4 a
Có thể nối vài lớp nơ ron với nhau tạo thành mạng nhiều lớp truyền thẳng
(Multi- Layer Feedforward Network) như hình 1.4.b
Hai loại mạng nơ ron một lớp và nhiều lớp được gọi là truyền thẳng nếu đầu
ra của mỗi nơ ron được nối với các đầu vào của các nơ ron của lớp trước đó.
Mạng nơ ron phản hồi là mạng mà đầu ra của mỗi nơ ron được quay trở lại
nối với đầu vào của các nơ ron cùng lớp được gọi là mạng Laeral như hình 1.4.c
Mạng nơ ron phản hồi có thể thực hiện đóng vòng được gọi là mạng nơ ron
hồi quy (Recurrent Network) như hình 1.4.d
Các nơ ron lớp vào trực tiếp nhận tín hiệu ở đầu vào, ở đó mỗi nơ ron chỉ có
một tín hiệu vào. Mỗi nơ ron ở lớp ẩn được nối với tất cả các nơ ron lớp vào và lớp
ra. Các nơ ron ở lớp ra có đầu vào được nối với tất cả các nơ ron ở lớp ẩn, chúng là
đầu ra của mạng. Cần chú ý rằng một mạng nơ ron cũng có thể có nhiều lớp ẩn. Các
mạng nơ ron trong mỗi nơ ron chỉ được liên hệ với tất cả các nơ ron ở lớp kế tiếp và
w11
wmm
y1
y2
ym
x1
x2
xm
Hình 1.4.a
y1
y2
ym
x1
x2
xm
Hình 1.4.b
Hình 1.4.c
y1
y2
ym
x1
x2
xm
w11
wmm
y1
y2
ym
x1
x2
xm
Hình 1.4.d
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
25
tất cả các mối liên kết chỉ được xây dựng từ trái sang phải được gọi là mạng nhiều
lớp truyền thẳng (perceptrons).
1.3.2.3. Các luật học.
Thông thường mạng nơ ron được điều chỉnh hoặc được huấn luyện để hướng
các đầu vào riêng biệt đến đích ở đầu ra. Cấu trúc huấn luyện mạng được chỉ ra trên
hình 1.5 Ở đây, hàm trọng của mạng được điều chỉnh trên cơ sở so sánh đầu ra với
đích mong muốn (taget) cho tới khi đầu ra mạng phù hợp với đích. Những cặp
vào/đích (input/taget) được dùng để giám sát cho sự huấn luyện mạng.
Để có được một số cặp vào/ra, ở đó mỗi giá trị vào được gửi đến mạng và giá
trị ra tương ứng được thực hiện bằng mạng là sự xem xét và so sánh với giá trị
mong muốn. Bình thường tồn tại một sai số bởi lẽ giá trị mong muốn không hoàn
toàn phù hợp với giá trị thực. Sau mỗi lần chạy, ta có tổng bình phương của tất cả
các sai số. Sai số này được sử dụng để xác định các hàm trọng mới.
Sau mỗi lần chạy, hàm trọng của mạng được sửa đổi với đặc tính tốt hơn
tương ứng với đặc tính mong muốn. Từng cặp giá trị vào/ra phải được kiểm tra và
trọng lượng được điều chỉnh một vài lần. Sự thay đổi các hàm trọng của mạng được
dừng lại nếu tổng các bình phương sai số nhỏ hơn một giá trị đặt trước hoặc đã chạy
đủ một số lần chạy xác định (trong trường hợp này mạng có thể không thoả mãn
yêu cầu đặt ra do sai lệch còn cao). Có hai kiểu học:
- Học thông số (Paramater Learning): Tìm ra biểu thức cập nhật các thông số
về trọng số, cập nhật kết nối giữa các nơ ron.
Đích
So sánh
Hàm trọng (weights)
giữa các nơ ron
Vào
Điều chỉnh
Hình 1.5. Cấu trúc huấn luyện mạng nơ ron
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
26
- Học cấu trúc (Structure Learning): Trọng tâm là sự biến đổi cấu trúc của
mạng nơ ron gồm số lượng nút (node) và các mẫu liên kết
Nhiệm vụ của việc học thông số là bằng cách nào đó, tìm được ma trận chính
xác mong muốn từ ma trận giả thiết ban đầu với cấu trúc của mạng nơ ron có sẵn.
Để làm được việc đó, mạng nơ ron sử dụng các trọng số điều chỉnh, với
nhiều phương pháp học khác nhau có thể tính toán gần đúng ma trận W cần tìm đặc
trưng cho mạng.Có ba phương pháp học:
- Học có giám sát ( Supervised Learning).
Là quá trình học ở mỗi thời điểm thứ i khi đưa tín hiệu xi vào mạng nơ ron,
tương ứng sẽ có các đáp ứng mong muốn di của đầu ra cho trước ở thời điểm đó.
Hay nói cách khác, trong quá trình học có giám sát, mạng nơ ron được cung cấp
liên tục các cặp số liệu mong muốn vào –ra ở từng thời điểm (x1 ,d1), (x2, d2),… (xk,
d
k),…khi cho tín hiệu vào thực là xk sẽ tương ứng có tín hiệu đầu ra cũng được lặp
lại là dk giống như mong muốn. Kết quả của quá trình học có giám sát là tạo được
một hộp đen có đầu vào là véc tơ tín hiệu vào X sẽ đưa ra được câu trả lời đúng d.
Để đạt được kết quả mong muốn trên, khi đưa vào tín hiệu xk, thông thường
sẽ có sai lệch ek giữa tín hiệu đầu
ra thực yk với tín hiệu đầu ra
mong muốn dk. Sai lệch đó sẽ
được truyền ngược tới đầu vào
để điều chỉnh thông số mạng nơ
ron là ma trận trọng số W…Quá
trình cứ thế tiếp diễn sao cho sai
lệch giữa tín hiệu ra mong muốn và tín hiệu ra thực tế nằm trong phạm vi cho
phép, kết quả nhận được ma trận trọng số với các phần tử wij đã được điều chỉnh
phù hợp với đặc điểm của đối tượng hay hàm số mạng nơ ron cần học. Mô hình
học có giám sát được minh hoạ như hình 1.6
Mạng
nơron
Máy tính
phát hiện
sai
x y
d
e
Hình 1.6.Mô hình học có giám sát và học củng cố
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
27
- Học củng cố:(Reinforcement Learning).
Là phương pháp học trong đó tín hiệu d được đưa từ bên ngoài nhưng không
được đầy đủ mà có thể chỉ đưa đại diện 1 bít để có tính chất kiểm tra quá trình
đúng hay sai. Tín hiệu đó được gọi là tín hiệu củng cố (Reinforcement Signal).
Phương pháp học củng cố chỉ là một phương pháp học riêng của phương pháp học
có giám sát, bởi vì nó cũng nhận tín hiệu chỉ đạo từ bên ngoài. Chỉ khác là tín hiệu
củng cố có tính ước lượng hơn là để dạy. Tín hiệu giám sát bên ngoài d thường
được tiến hành bởi các tín hiệu ước lượng để tạo thông tin ước lượng cho mạng nơ
ron điều chỉnh trọng số với hy vọng sự ước lượng đó mang lại sự chính xác trong
quá trình tính toán. Mô hình học củng cố được minh hoạ như hình 1.6
- Học không có giám sát (Unsupervied Learning).
Trong trường hợp này, hoàn toàn không có tín hiệu ở bên ngoài. Giá trị mục
tiêu điều khiển không được cung cấp và không được tăng cường. Mạng phải khám
phá các mẫu, các nét đặc trưng, tính cân đối, tính tương quan… Trong khi khám phá
các đặc trưng khác, mạng nơ ron đã chải
qua việc tự thay đổi thông số, vấn đề đó
được gọi tự tổ chức (Self- Organizing).
Mô hình học không có giám sát được
minh hoạ như hình 1.17
Cấu trúc chung của quá trình học được mô tả như hình 1.20.
wij
wim-1=
wi1
x(t)
r
y
Máy phát tín
hiệu học
Nơ ron thứ i
x1
x1
xj
xm-1
xm= -1
d
wi
Hình 1.8. Sơ đồ cấu trúc chung của quá trình học
x y
Hình1.7.Mô hình học không có giám sát
Mạng
nơron
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
28
Trong đó tín hiệu vào xj, j=1,2,3…,m, có thể được lấy từ đầu ra của các nơ ron khác
hoặc có thể được lấy từ bên ngoài. Tín hiệu mong muốn di có sẵn chỉ có trong
phương pháp học có giám sát hoặc củng cố. Từ hai phương pháp học trên, trọng số
của nơ ron thứ i được thay đổi tuỳ theo tín hiệu ở đầu vào mà nó thu nhận và giá trị
đầu ra của nó. Trong phương pháp học không có giám sát sự thay đổi của trọng số
chỉ dựa trên cơ sở các giá trị đầu vào và đầu ra. Dạng tổng quát của luật học trọng
số của mạng nơ ron là cho biết gia số của véc tơ wi là wi tỷ lệ với tín hiệu học r và
tín hiệu đầu vào x(t):
wi(t) = .r.x(t) (1.8)
: Là hằng số học, xác định tốc độ học và là một số dương
r: Là tín hiệu học r = fr(wi,x,d
i
) (1.9)
Biểu thức (1.8) là biểu thức chung để tính số gia của trọng số, ta thấy trọng số
wi = (wi1, wi2, …, wim)
T
có gia số tỷ lệ với tín hiệu vào x và tín hiệu học r. Từ các
biểu thức trên ta có véc tơ trọng số ở thời điểm (t+1) được tính là:
w i(t+1) = wi(t) + .fr{wi (t), x(t), d
i
(t)}.x(t) (1.10)
Vấn đề quan trọng trong việc phân biệt luật học cập nhật trọng số có giám
sát hay không có giám sát là tín hiệu học r như thế nào để thay đổi hoặc cập nhật
trọng số có trong mạng nơ ron.
Có 2 phương pháp cơ bản để huấn luyện mạng nơ ron: Huấn luyện gia tăng
(tiến dần) và huấn luyện theo gói. Sự huấn luyện theo gói của mạng nhận được bằng
việc thay đổi hàm trọng và độ dốc trong một tập (batch) của véc tơ đầu vào. Huấn
luyện tiến dần là thay đổi hàm trọng và độ dốc của mạng sau mỗi lần xuất hiện của
một phần tử véc tơ đầu vào. Huấn luyện tiến dần đôi khi được xem như huấn luyện
trực tuyến hay huấn luyện thích nghi.
Mạng nơ ron đã được huấn luyện để thực hiện những hàm phức tạp trong
nhiều lĩnh vực ứng dụng khác nhau như trong nhận dạng, phân loại sản phẩm, xử lý
tiếng nói, chữ viết và điều khiển hệ thống.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
29
Thông thường để huấn luyện mạng nơron, người ta sử dụng phương pháp
huấn luyện có giám sát, nhưng cũng có mạng thu được từ sự huấn luyện không có
giám sát. Mạng huấn luỵện không giám sát có thể được sử dụng trong trường hợp
riêng để xác định nhóm dữ liệu.
1.3.3. Mô hình toán học mạng nơ ron truyền thẳng và mạng nơ ron hồi quy.
1.3.3.1.Mạng nơ ron truyền thẳng.
a/ Mạng nơ ron một lớp.
Một cấu trúc toán học mạng 1 lớp với
R đầu vào và S nơ ron được chỉ ra trên hình
1.9.
Trong đó:
-Véc tơ vào P có R phần tử PT = [p1 p2 … pR]
-Véc tơ vào n có S phần tử nT = [n1 n2 … nS]
-Véc tơ ra a có S phần tử aT = [a1 a2 … aS]
Trong mạng này mỗi phần tử của véc tơ vào P liên hệ với đầu vào mỗi nơ ron thông
qua ma trận trọng lượng liên kết W. Bộ cộng của nơ ron thứ i thu thập các trọng
liên kết đầu vào và độ dốc để tạo thành một đầu ra vô hướng ni. Các ni tập hợp với
nhau tạo thành s phần tử của véc tơ vào n. Cuối cùng ở lớp ra nơ ron ta thu được
véc tơ a gồm s phần tử.
Ta có thể thiết lập lớp đơn của các nơ ron có các hàm chuyển khác nhau một
cách dễ dàng bởi lẽ hai mạng được đặt song song. Tất cả các mạng có thể có chung
đầu vào và mỗi mạng có thể thiết lập một vài đầu ra.
Các phần tử của véc tơ đầu vào được đưa vào mạng thông qua ma trận trọng
W, với:
.
.
.
a = f(WP+b) (1.11)
Hình1.9.Cấu trúc mạng nơ ron 1 lớp
p1
w1,1
1
f
n1 a1
b1
p2
p3
pR
wS,R
1
f
n2 a2
b2
1
f
nS aS
bS
Vào Các nơron
.
.
.
.
.
.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
30
W
SR2S1S
R22221
R11211
www
www
www
(1.12)
Trong đó: Chỉ số hàng trong các phần tử của ma trận W cho biết nơ ron nơi
đến còn chỉ số cột cho biết nơi xuất phát của trọng liên kết. Ví dụ: w12 nói lên sự có
mặt của tín hiệu vào từ phần tử thứ hai đến nơ ron thứ nhất với trong liên kết là w12.
Để đơn giản ta ký hiệu mạng một
lớp gồm S nơ ron, R đầu vào như hình
vẽ 1.10.
Trong đó: véc tơ vào P có kích
thước R, ma trận trọng liên kết W có
kích thước S x R còn a và b là các véc
tơ có kích thước S. Như chúng ta đã
biết, một lớp mạng bao gồm ma trận
trọng liên kết, toán tử nhân, véc tơ độ
dốc b, bộ tổng và hàm truyền.
b/. Mạng nơron nhiều lớp.
Để khảo sát mạng nhiều lớp trước hết chúng ta cần đưa ra các ký hiệu qui
ước cho một lớp mạng. Đặc biệt ta cần phải phân biệt sự khác nhau giữa ma trận
trọng lượng liên kết ở đầu vào và các ma trận trọng liên kết giữa các lớp.
Ta gọi ma trận trọng lượng liên kết nối với đầu vào là các trọng vào (input
weights) và các ma trận đến từ lớp ra là trọng liên kết lớp (layer weights). Ta sẽ
dùng các chỉ số viết bên trên để phân biệt nguồn (chỉ số thứ hai) và đích (chỉ số thứ
nhất) cho các trọng liên kết và các phần tử khác của mạng.
Để minh hoạ, ta xét một lớp mạng có nhiều đầu vào như hình 1.11. Trong đó
R là số phần tử lớp vào và S1 là số nơron của lớp 1. Ta thấy ma trận trọng liên kết
với véc tơ vào P là ma trận trọng vào (IW1,1) có nguồn là 1 (chỉ số thứ 2) và đích là
P
Hình 1.10. Ký hiệu mạng một lớp
R đầu vào và S nơ ron
a = f(WP+b) (1.13)
f
n
W
1
R
b
+
Sx1
a
Sx1
Sx1
SxR
Vào Nơ ron
Rx1
S
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
31
1 (chỉ số thứ nhất). Đồng thời
các phần tử của 1 lớp như độ
dốc, tín hiệu vào hàm chuyển,
đầu ra có chỉ số viết trên là 1 để
nói rằng chúng được liên kết với
lớp thứ nhất (b1, n1, a1).
Một mạng nơ ron có thể
có một vài lớp. Mỗi lớp có ma
trận trọng liên kết W, véc tơ độ
dốc b và đầu ra a. Để phân biệt các ma trận trọng liên kết véc tơ vào cho mỗi lớp
mạng trong sơ đồ, ta thêm con số chỉ lớp viết ở phía trên cho biến số quan tâm.
Hình 1.12 là ký hiệu sơ đồ mạng 3 lớp. Trong đó có R1 đầu vào, S1 nơ ron ở
lớp 1, S2 nơron ở lớp 2 … Thông thường, các lớp khác nhau có số nơ ron khác
nhau.
Chú ý rằng đầu ra của mỗi lớp trung gian là đầu vào của lớp tiếp theo. Như
vậy lớp 2 có thể được xem như mạng 1 lớp với S1 đầu vào, S2 nơ ron và S2 x S1
trọng liên kết của ma trận W2. Đầu vào của lớp 2 là véc tơ a1, đầu ra là véc tơ a2.
Các lớp của mạng nhiều lớp đóng vai trò khác nhau. Lớp cuối cùng là kết quả ở đầu
ra của mạng, được gọi là lớp ra. Lớp đầu tiên thu thập tín hiệu vào được gọi là lớp
vào, các lớp khác được gọi là lớp ẩn. Mạng 3 lớp ở trên có 1lớp ra (lớp3) có 1lớp
vào (lớp1) và 1lớp ẩn (lớp 2).
Đối với mạng 3 lớp ta cũng có thể sử dụng ký hiệu tắt để biểu diễn (hình 1.13).
Mạng nhiều lớp rất mạnh, ví dụ có mạng 2 lớp, trong đó lớp 1 có hàm chuyển
sigmoid, lớp 2 có hàm chuyển linear có thể được huấn luyện để làm xấp xỉ một
hàm bất kỳ (với số điểm gián đoạn có hạn chế).
Trong đó a3 là đầu ra của mạng, ta ký hiệu đầu ra này là y. Ta sẽ sử dụng ký
hiệu này để định rõ đầu ra của mạng nhiều lớp.
P
a
1
= f
1
(W
1,1
P+b
1
) (1.14)
f
1
n
1
1
R
+
S
1
x1
a
1
S
1
x1
S
1
x1
S
1
xR
Vào Lớp 1
Rx1
S
1
W
1,1
Hình 1.11: Ký hiệu một lớp mạng
b
1
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
32
1.3.3.2.Mạng nơ ron hồi quy.
Mạng hồi quy còn được gọi là mạng phản hồi là loại mạng tự liên kết thành
các vòng và liên kết hồi quy giữa các nơ ron. Mạng nơ ron hồi quy có trọng số liên
kết đối xứng như mạng Hopfield luôn hội tụ về trạng thái ổn định. Mạng liên kết hai
chiều (BAM) là mạng thuộc nhóm mạng nơ ron hồi quy hai lớp nơ ron liên kết tay
đôi, trong đó đảm bảo nơ ron của cùng một lớp không liên kết với nhau, cũng hội tụ
về trạng thái ổn định. Nghiên cứu mạng nơ ron hồi quy có trọng số liên kết không
……………………………………………………………………………………….
b
2
S
1
2,3
1,1lw
Hình 1.12. Cấu trúc mạng nơ ron 3 lớp
a
1
= f
1
(W
1,1
P+b
1
)
f
1 n
1
1
b
1
1
1
f
1
n
1
2
b
1
2
1
f
1
n
1
S
b
1
S
p1
1
p2
p3
pR
Vào Lớp 1(lớp vào)
a
2
= f
2
(W
2,1
a
1
+b
2
)
f
2
n
2
1 a
2
1
b
2
1
1
f
2 n
2
2
a
2
2
b
2
2
1
f
2
n
2
S
a
2
S
Lớp 2 (lớp ẩn)
a
3
= f
3
(W
3,2
a
2
+b
3
) (1.15)
1
n
3
1
b
3
1
1
n
3
2
b
3
2
1
n
3
S
b
3
S
f
3
a
3
1
f
3
a
3
2
f
3
a
3
S
Lớp 3 (lớp ra)
a
1
1
a
1
2
a
1
S
1,2
S,S 12
lw
2,3
S,S 23
lw
1,1 R,Siw
1,1
1,1iw
S1xR
S2x1
Rx1 S
2
x1
a
1
a
2 a
3
= y P
Hình 1.13. Ký hiệu tắt của mạng nơ ron 3 lớp
1
R S1
a
1
= f
1
(IW
1,1
P+b
1
)
n1
b1
+
S
1
x1
S
1
x1
Vào Lớp 1
S
2
a
2
= f
2
(LW
2,1
a
1
+b
2
)
f2
n2
b2
+
S
2
x1
S
2
xS
1
Lớp 2
LW
2,1
1
f1
S
3
a
3
= f
3
(LW
3,2
a
2
+b
3
)
f3
n3
b3
+
S3x1
S
3
x1
S
3
xS
2
Lớp 3
LW
3,2
S
3
x1
1
a
3
= f
3
[LW
3,2
f
2
(LW
2,1
f
1
(IW
1,1
P+b
1
)+b
2
]+b
3
= y (1.16)
IW
1,1
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
33
đối xứng sẽ gặp nhiều phức tạp hơn so với mạng truyền thẳng và mạng hồi quy đối
xứng. Mạng nơ ron hồi quy có khả năng về nhận mẫu, nhận dạng các hàm phi
tuyến, dự báo … Một ưu điểm khác của mạng nơ ron hồi quy là chỉ cần mạng nhỏ
hơn về cấu trúc cũng có khả năng như mạng truyền thẳng có cấu trúc lớp hơn.
a/ Mạng nơ ron hồi quy không hoàn toàn (Partially Recrrent Networks).
Là mạng đó dựa trên cơ sở mạng lan truyền ngược vì cấu trúc hồi quy. Cấu
trúc của mạng hồi quy không hoàn toàn phần lớn là cấu trúc truyền thẳng nhưng có
cả sự lựa chọn cho một bộ phận có cấu trúc hồi quy.Trong nhiều trường hợp, trọng
số của cấu trúc hồi quy được duy trì không đổi, như vậy luật học truyền ngược có
thể dễ dàng được sử dụng. Trong các mạng loại này, sự truyền thẳng được xảy ra rất
nhanh hoặc không phụ thuộc vào thời gian, trong khi đó tín hiệu hồi quy được thực
hiện có tính thời gian. Mạng có thể nhận mẫu dãy dựa vào tình trạng cuối cùng của
dãy và có thể dự báo tiếp theo cho tín hiệu của dãy theo thời gian. Như vậy, mạng
hồi quy không hoàn toàn về cơ bản là mạng tryền thẳng , liên kết hồi quy có thể đi
từ các nút ở các lớp ra hoặc lớp ẩn.
b/ Mạng nơ ron hồi quy hoàn toàn (Fully Recrrent Networks).
Là một trong những
loại mạng nơ ron hồi quy đầu
tiên được Gossberg xây dựng
để học và biểu diễn các mẫu
bất kỳ loại mạng này được
xây dựng theo mẫu Instar-
Outstar. Loại mạng hồi quy
hoàn toàn có tác dụng nhận số
lượng mẫu nhiều nhơn. Với mạng hồi quy hoàn toàn đã hình thành quan điểm thực
hiện và luyện mạng hồi quy từ mạng truyền thẳng nhiều lớp được xây dựng từ một
lớp cho mỗi bước tính. Khái niệm này được gọi là lan truyền ngược theo thời gian
phù hợp khi quan tâm đến các dãy với độ lớn T là nhỏ. Nó đã được sử dụng học
P
f
1
n
1
1
R
+
S
1
x1
a
1
S
1
x1
S
1
x1
S
1
xR
Vào Lớp 1
Rx1
S
1
W
1,1
Hình 1.14. Ký hiệu một lớp mạng hồi quy
b
1
Wph
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
34
cho máy ghi cho nhiệm vụ thực hiện các dãy. Nó có khả năng áp dụng cho điều
khiển thích nghi. Hình 1.14 là mạng nơ ron một lớp hồi quy. Hình 1.15 là mạng nơ
ron nhiều lớp hồi quy
1.4.QUÁ TRÌNH HUẤN LUYỆN MẠNG NHIỀU LỚP.
Chúng ta đã biết, mạng nơ ron nhiều lớp có thể xấp xỉ gần đúng một hàm bất
kỳ, tiếp đó là thủ tục tính chọn các thông số của mạng (các hàm trọng lượng và độ
dốc) cho một đối tượng cụ thể được gọi là quá trình huấn luyện mạng. Trong phần
này chúng ta sẽ chỉ ra một phương pháp huấn luyện là phương pháp lan truyền
ngược. Kỹ thuật cơ bản của phương pháp lan truyền ngược là cập nhật trọng số theo
hướng giảm độ dốc.
Như đã nêu, mạng nhiều lớp có đầu ra của lớp trước là đầu vào của lớp tiếp
theo. Sơ đồ cấu trúc được cho như hình vẽ 1.13.
Biểu thức toán học mô tả sự hoạt động như (1.17):
a
m+1
= f
m+1
(w
m+1
.a
m
+ b
m+1
). Với m = 0,1,2,…M-1. (1.17)
Trong đó M là số lớp nơ ron trong mạng. Các nơ ron của lớp thứ nhất nhận
tín hiệu đầu vào từ bên ngoài: a0 = p (1.18)
Đầu ra của các nơ ron ở lớp cuối cùng của mạng được coi là đầu ra của mạng:
y = a
m
(1.19)
1.4.1.Quá trình thực hiện.
S1xR
S2x1
Rx1 S
2
x1
a
1
a
2 a
3
= y P
Hình 1.15. Ký hiệu tắt của mạng nơron 3 lớp hồi quy
1
R S1
n1
b1
+
S
1
x1
S
1
x1
Vào Lớp 1
S
2
f2
n2
b2
+
S
2
x1
S
2
xS
1
Lớp 2
LW
2,1
1
f1
S
3
f3
n3
b3
+
S3x1
S
3
x1
S
3
xS
2
Lớp 3
LW
3,2
S
3
x1
1
IW
1,1
Wph
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
35
Thuật toán lan truyền ngược của mạng nhiều lớp là một phương pháp làm
giảm độ dốc. Phương pháp này được dùng để cập nhật những thông số sao cho giảm
thiểu sai số của mô hình. Sai số được đo bằng phương pháp trung bình bình phương
sai lệch. Tập hợp mẫu vào ra được cho dưới dạng như (1.20):
(1.20)
Trong đó pq là một đầu vào của mạng, và tq tương ứng là một đầu ra. Mỗi
một đầu vào tác động vào mạng sẽ có một đầu ra thực được so sánh với đáp ứng
mẫu. Hàm thông số của mạng được xác định theo biểu thức tổng bình phương sai
lệch cực tiểu như (1.21):
F(x) =
2
11
2
)( q
Q
q
q
Q
q
q ate
(1.21)
Trong đó x là véc tơ bao gồm cả trọng số liên kết và độ dốc của mạng. Nếu
mạng có nhiều đầu ra thì biểu thức tổng quát được tính như (1.22):
F(x) =
)()(
11
qq
T
q
Q
q
q
Q
q
q
T
q atatee
(1.22)
Sử dụng phương pháp xấp xỉ quen thuộc, chúng ta sẽ thay thế tổng bình
phương sai lệch bằng sai lệch của đáp ứng hiện tại:
)}()({)}()({)( kaktkaktxF T
(1.23)
Trong đó bình phương sai lệch mong muốn đã được thay thế bằng bình
phương sai lệch tại thời điểm k.
Thuật toán giảm độ dốc theo phương pháp xấp xỉ bình phương sai lệch là:
m
ji
m
ji
m
ji
w
F
kwkw
,
,, )()1(
(1.24)
m
i
m
i
m
i
b
F
kbkb
)()1(
(1.25)
Trong đó là tốc độ học.
1.4.2.Qui tắc chuỗi.
p1,t1
p2,t2
pQ,tQ …
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
36
Với mạng một lớp tuyến tính thì các thành phần đạo hàm trong công thức
(1.24) và (1.25) được tính dễ dàng và tiện lợi, từ đó sai lệch có thể được viết như
một hàm tuyến tính của các trọng số.
Với mạng nhiều lớp, sai lệch là hàm ẩn của các hàm trọng lượng ở các lớp
ẩn, vì thế các phép đạo hàm sẽ tính khó khăn. Bởi vì sai lệch là hàm ẩn của các
trọng số ở các lớp ẩn nên chúng ta sẽ sử dụng qui tắc chuỗi toán học để tính đạo
hàm riêng trong các biểu thức (1.24) và (1.25)
m
ji
m
i
m
ji wn
F
w
F
,
m
i
,
n
x
(1.26)
m
i
m
i
m
i bn
F
b
F
m
inx
(1.27)
Số hạng thứ hai trong mỗi công thức có thể được tính dễ dàng vì đầu vào lớp
mạng thứ m là hàm hiện của trọng số và độ dốc của lớp ấy:
m
i
m
j
S
j
m
ji
m
i bawn
m
.
1
,
(1.28)
Do đó:
1;
,
m
i
m
im
jm
ji
m
i
b
n
a
w
n (1.29)
Nếu chúng ta định nghĩa:
m
i
m
i
n
F
S
(1.30)
thì công thức (1.26) và (1.27) có thể được đơn giản hoá như (1.31), (1.32):
1
,
.
m
j
m
im
ji
as
w
F (1.31)
m
im
i
s
b
F
(1.32)
Đến đây chúng ta có thể biểu diễn thuật toán xấp xỉ để giảm độ dốc như
(1.33), (1.34):
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
37
)1(, kw
m
ji
1
, .)(
mj
m
i
m
ji aSkw
(1.33)
m
i
m
i
m
i Skbkb )()1(
(1.34)
Khi đó ta có ma trận dạng (1.35), (1.36):
W
m
(k+1) = W
m
(k) - Sm.( am-1)T (1.35)
B
m
(k+1) = b
m
(k) - Sm (1.36)
Trong đó các phần tử riêng của S được tính theo công thức (1.32)
1.4.3. Độ chính xác của thuật toán lan truyền ngược.
Việc còn lại bây giờ là chúng ta tính toán độ chính xác Sm, nó cần đến các
ứng dụng khác của qui tắc chuỗi. Đó là quá trình chúng ta cho số hạng lan truyền
ngược, bởi vì nó diễn tả mối liên hệ phản hồi và độ chính xác ở lớp m được tính từ
độ chính xác của lớp m+1:
S
m
= - 2.Ḟm (nm). (t-a) (1.37)
S
m
= Ḟm (nm). (wm+1)T.Sm+1 .
m = M-1… 2,1 (1.38)
Trong đó mF (n
m
) có dạng như (1.39).
)(....................00
0)........(0
0..................0)(
)( 2
1
m
s
m
m
m
m
m
m
m
nf
nf
nf
nF
(1.39)
1.4.4.Biến thể của thuật toán lan truyền ngược.
Trong một số trường hợp sẽ là không thích hợp với thuật toán mà chúng ta
thường quy vào như lan truyền ngược cho bởi biểu thức (1.35) và (1.36). Trên thực
tế, thường là thuật toán giảm độ dốc nhất. Ở đây có nhiều thuật toán khả quan sử
dụng các biến thể của giải thuật lan truyền ngược, trong đó các đạo hàm được xử lý
từ lớp cối cùng đến lớp đầu tiên của mạng được tính theo công thức (1.37),(1.38).
Ví dụ: Kết hợp giữa độ dốc và thuật toán Newton ([Shan 90], [Scanl 185],
[Char 92]) thông thường cho độ chính xác hơn giải thuật giảm độ dốc nhất. Ngày
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
38
nay, khi cần thiết người ta có thể sử dụng giải thuật tương tự như lan truyền ngược
để tính toán các đạo hàm riêng.
Thuật toán Levenberg- Marqanrdt rất chính xác cho việc huấn luyện mạng cỡ
nhỏ và trung bình và nó được sử dụng một thuật toán tương tự với thuật toán lan
truyền ngược được cho bởi biểu thức (1.38). Để hiểu rõ các thuật toán trên, chúng ta
sẽ phân tích trong phần sử dụng thuật toán lan truyền ngược, đó là các phép tính đạo
hàm được xử lý từ lớp cuối cùng đến lớp đầu tiên. Đó chính là lý do để người ta gọi
là thuật toán lan truyền ngược. Một sự khác biệt của thuật toán là kết quả của các
phép đạo hàm được sử dụng để cập nhật các trọng số.
1.4.5.Tổng quát (Phép nội suy và ngoại suy).
Chúng ta đã biết mạng nhiều lớp có khả năng làm xấp xỉ gần đúng các hàm
bất kỳ, nhưng chúng ta chưa đề cập đến vấn đề tính chọn số nơ ron và số lớp cần
thiết để đạt được một độ chính xác nhất định nào đó, chúng ta chưa đề cập đến vấn
đề huấn luyện theo dữ liệu mẫu phải được chọn như thế nào. Môt bí quyết xác định
đủ số lượng nơ ron để đạt được mức độ phức tạp của hàm biên mà không cần quan
tâm đến quá trình huấn luyện dữ liệu đó là trong trường hợp không cập nhật trạng
thái mới. Nếu không, chúng ta cần phải có đủ quá trình huấn luyện dữ liệu để mô tả
tương xứng hàm biên. Để minh hoạ cho việc chúng ta có thể huấn luyện mạng, ta
xét ví dụ tổng quát dưới đây.Quá trình huấn luyện mạng được khái quát hoá theo
biểu thức (1.40):
tq = g(pq) + eq (1.40)
Trong đó pq là tập hợp các đầu vào; g( ) là hàm biên mà chúng ta muốn xấp
xỉ gần đúng; eq là sai số đo của nhiễu và tq là tập hợp các đầu ra (đáp ứng của
mạng).
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
39
Trên hình vẽ cho biết : Hàm biên g( ) (có nét đậm), Giá trị đích của quá trình học là
tq (các vòng tròn ), đáp ứng đầu ra thực tương ứng vớp các đầu vào là aq (vòng tròn
nhỏ có gạch chéo bên trong) và đáp ứng toàn bộ của quá trình huấn luyện là đường
nét mảnh.
Trong ví dụ trên hình vẽ 1.16a, đó là quá trình huấn luyện cho một mạng cỡ
lớn sử dụng phương pháp bình phương sai lệch cực tiểu. Quá trình học dựa trên 15
mẫu cho trước, chúng ta có thể thấy được độ chính xác với giá trị đích tại mỗi điểm
trong quá trình học. Tuy nhiên, đáp ứng toàn bộ của mạng lại không có khả năng
đạt được tới đường biên. Điều đó có 2 nguyên nhân chủ yếu là:
Thứ nhất do mạng có lượng quá điều chỉnh trong quá trình huấn luyện, đáp
ứng của mạng quá phức tạp vì mạng có nhiều thông số độc lập.
Vấn đề thứ hai ở đây là trong quá trình huấn luyện không nhận giá trị p< 0,
nên các nơ ron( bao gồm cả dữ lệu cơ sở và các phương pháp xấp xỉ ) không thể đáp
ứng được yêu cầu ngoại suy chính xác.
Nếu một đầu vào mạng mà nằm ngoài phạm vi bao phủ của dữ liệu huấn
luyện thì đáp ứng của mạng sẽ luôn bị sai.
Rất ít khi chúng ta làm cho mạng biển diễn ra ngoài phạm vi của dữ liệu học,
chúng ta có thể làm cho mạng có khả năng nội suy giữa các điểm dữ liệu. Quá trình
Hình 1.16a.
Đáp ứng của mạng khi sử dụng thuật
toán bình phương sai lệch cực tiểu
Hình 1.16b.
Đáp ứng của mạng khi sử dụng thuật
toán Bayesian
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
40
khái quát hoá có thể đạt được sự đa dạng của các phương pháp kỹ thuật. Một
phương pháp được gọi là sự dừng sớm, nhiệm vụ của chúng ta là phân chia dữ liệu
huấn luyện theo biến dữ liệu đặt. Sự biểu diễn mạng dựa trên biến đặt sẽ được chỉ
đạo trong suốt quá trình học. Trong giai đoạn đầu của quá trình huấn luyện thì biến
sai lệch giảm, khi bắt đầu có lượng quá điều chỉnh thì biến sai lệch cũng bắt đầu
tăng và tại các điểm quá trình huấn luyện được dừng lại.
Thêm một phương pháp kỹ thuật nữa làm cho mạng tổng quát hoá được gọi
là sự làm đúng theo quy tắc. Với phương pháp biểu diễn chỉ số so sánh làm thay đổi
đến số hạng đem đến sự phức tạp cho mạng, số hạng bất lợi đó là tổng bình phương
của các hàm trọng lượng:
F(x)=
2
,
1
)( k ji
Q
q
q
T
q wee
(1.41)
Một bí quyết của phương pháp trên là sự lựa chọn đúng thông số ρ. Nếu giá
trị của nó lớn thì đáp ứng của mạng sẽ bằng phẳng và sẽ xấp xỉ không chính xác
được hàm biên. Nếu giá trị của ρ quá nhỏ thì mạng có sự quá điều chỉnh. Một trong
các phương pháp thành công nhất trong việc lựa chọn ρ tốt nhất là quy tắc Bayesian
([Mack 92] và [FoHa 97]).
Trên hình 1.16b. cho thấy đáp ứng của mạng khi mạng được huấn luyện theo
quy tắc Bayesian. Chú ý rằng đáp ứng của mạng có độ chính xác phù hợp không dài
hơn các điểm dữ liệu huấn luyện. Nhưng nhìn chung đặc tính đầu ra của mạng lại
sát vào nhau hơn so với hàm biên trong phạm vi của dữ liệu huấn luyện.
Tuy nhiên, với quy tắc Bayesian đáp ứng của mạng không tính toán được
ngoài phạm vi dữ liệu huấn luyện. Như chúng ta đã đề cập trước đây là chúng ta
không thể đòi hỏi mạng tính toán ngoại suy. Nếu chúng ta muốn đáp ứng của mạng
chính xác từ đầu đến cuối thì ta cần phải cung cấp dữ liệu huấn luyện trong suốt
phạm vi đó. Điều đó sẽ khó khăn hơn đối với trường hợp mạng có nhiều đầu vào.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
41
1.5. CÔNG NGHỆ PHẦN CỨNG SỬ DỤNG MẠNG NƠ RON.
Mạng nơ ron nhân tạo được dùng để xây dựng các chip mang lại nhiều lợi
ích với bản chất cấu trúc phân bố song song của sự gia công thông tin như các nơ
ron sinh học. Chíp nơ ron có thể được sử dụng làm các bộ đồng xử lý trong các máy
tính thông thường và trong việc tính toán.
Trong phần cứng, mạng nơ ron có thể sử dụng vào nhiều lĩnh vực. Mạng nơ
ron có thể sử dụng với các chức năng như các phần tử analog hoặc digital thay thế
cho các phần tử điện tử thông thường. Các chíp analog có một tiềm năng to lớn về
sử lý tốc độ cao và kinh tế hơn chip digital cùng loại, các chip digital cũng có ưu
điểm là có độ chính xác cao và dễ chế tạo hơn.
Ở phần tử analog, các trọng số liên kết mã hoá được với các phần tử điện trở,
điện cảm và điện dung. Các mức của các nút hoạt hoá (cường độ của tín hiệu) được
đặc trưng bằng các đại lượng dòng và áp.Ví dụ như lưới silic (Silicon Retina) là một
mạng chip analog có thể cạnh tranh được với lưới sinh học (Biologcal Retina)
Công nghệ digital có thể áp dụng để chế tạo các chip nơ ron. Vấn đề này
được Hammestrom và Means (1990) đề cập đến. Khả năng khác là xung học là đặc
trưng cho trọng số và cường độ tín hiệu. Xung học phản ánh tương ứng với tần suất
hoặc khả năng của nơ ron hoạt hoá, tái tạo điều biến quan sát được như của mạng
nơ ron sinh học. Phép nhân của 2 xung học tương ứng với phép AND trong mạch
logic, phép cộng của 2 xung học tương ứng với phép OR trong mạch logic.
Trong hướng của thuật học, có một vài chọn lọc, các trọng số trong một chip
nơ ron cần cố định trước như ROM(Read Only Memory), bộ nhớ có thể chương
trình hoá PROM (Programmable ROM), bộ nhớ có thể xoá và lập trình được
EPROM(Erasable PROM), hoặc bộ nhớ đọc / ghi RAM (Random Access Memory).
Mạng nơ ron mở ra một hướng quan trọng về công nghệ, với ưu thế nổi bật
của mạng nơ ron là khả năng truyền tín hiệu song song ở các chip nơ ron do đó tốc
độ truyền tín hiệu rất cao, đặc trưng này không có ở các chip điện tử truyền thống.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
42
1.6. SO SÁNH KHẢ NĂNG CỦA MẠNG NƠ RON VỚI MẠCH LOGIC.
- Mạng nơ ron dùng ở các dạng mức (0,1), (-1,1) ở dạng liên tục như hàm
chuyển đổi sigmoid và dạng phi tuyến. Do đó phần tử logic chỉ là một trường hợp
riêng của mạng nơ ron
- Khả năng lập trình được của mạng nơ ron là rất tốt, thay vì phương pháp
lắp giáp phần cứng không lập trình được của mạch logic.
- Ưu điểm nổi bật của mạng nơ ron là khả năng truyền tín hiệu song song
làm tăng tốc độ xử lý và tính toán.
- Ngay ở một phần tử nơ ron cũng có thể được coi là một hệ điều khiển trong
mạch vì nó có đầy đủ các thành phần: ngưỡng, tín hiệu vào- ra, phản hồi, bộ tổng.
Trong khi đó mạch logic chỉ là một phần tử hoặc một mạch điện tử.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
43
KẾT LUẬN CHƢƠNG 1
1.Qua phân tích mô hình mạng nơ ron ta thấy mạng nơ ron có các tính chất sau:
- Là hệ phi tuyến.
- Là hệ xử lý song song.
- Là hệ học và thích nghi, mạng được luyện từ số liệu quá khứ, có khả năng
tự chỉnh khi số liệu đầu vào bị mất.
- Là hệ nhiều biến, có nhiều đầu vào / ra (MIMO) rất tiện dùng khi điều
khiển đối tượng có nhiều biến số.
- Có khả năng học và làm xấp xỉ các hàm toán học bất kỳ với độ chính xác
tùy ý.
2.So sánh mạng nơ ron truyền thẳng nhiều lớp với mạng nơ ron hồi quy nhiều lớp ta
thấy mạng nơ ron truyền thẳng nhiều lớp đơn giản hơn vì mạng nơ ron hồi quy
nhiều lớp có thêm các liên kết phản hồi.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
44
CHƢƠNG II. CÁC PHƢƠNG PHÁP ỨNG DỤNG MẠNG NƠ RON TRONG
NHẬN DẠNG VÀ ĐIỀU KHIỂN
2.1.CÁC VẤN ĐỀ CHUNG.
Mạng nơ ron đã được ứng dụng thành công trong nhiều lĩnh vực như: các hệ
thống điều khiển, xử lý hình ảnh, tiếng nói , tối ưu, truyền thông, y học…
Vì có yêu cầu ngày càng tăng về điều khiển, các hệ thống động học phức tạp
với điều kiện thông tin không đầy đủ hoặc không xác định nên việc sử dụng mạng
nơ ron rất hấp dẫn bởi khả năng học tập để xấp xỉ hàm và phân loại mẫu của mạng.
Ngoài ra còn bởi tính xử lý song song mạnh mẽ của phần cứng thực thi mạng.
Thông thường người ta hay dùng mạng nơ ron truyền thẳng nhiều lớp với
luật dạy học có giám sát. Ưu điểm lớn nhất của các mạng loại này là khả năng tổng
quát hoá ánh xạ đầu vào- đầu ra để có thể xấp xỉ bất cứ hàm nào với độ chính xác
tuỳ ý. Chủ yếu mạng nơ ron sử dụng để nhận dạng và điều khiển hệ thống.
2.2 CÁC PHƢƠNG ỨNG DỤNG MẠNG NƠ RON TRONG NHẬN DẠNG.
2.2.1. Cơ sở lý luận.
Trong nhận dạng hệ thống, để mô hình hoá quan hệ đầu vào - đầu ra của hệ
thống động học, mạng được học tập bằng tập hợp dữ liệu đầu vào đầu ra, còn trọng
số được điều chỉnh bằng thuật toán lan truyền ngược. Dễ nhận thấy rằng ánh xạ tĩnh
phi tuyến sinh ra có thể thể hiện thoả đáng mọi hành vi động học của hệ thống trong
khoảng quan tâm. Để điều đó trở thành hiện thực, cần cung cấp cho mạng nơ ron
thông tin về quá khứ của hệ thống, thông thường là các trễ đầu vào và đầu ra. Phụ
thuộc vào độ chính xác mong muốn mà ta phải cung cấp các thông tin về quá khứ
đến mức độ phù hợp cho mạng. Thực tế cho thấy việc sử dụng mạng hai lớp ẩn cho
kết quả tốt hơn mạng một lớp ẩn.
Mạng nơ ron có thể được dùng để phát hiện và nhận dạng lỗi, giúp đỡ lưu trữ
thông tin để ra quyết định. Nhưng trong hệ thống điều khiển có mạng nơ ron rất khó
chứng minh các đặc tính như ổn định hệ thống. Điều đó là do các khó khăn toán học
liên quan với hệ thống phi tuyến điều khiển bằng mạng nơ ron.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
45
Nói chung có các ứng dụng tiềm tàng của mạng nơ ron tại tất cả các mức độ
trong hệ thống điều khiển thông minh cho phép thực hiện tự động hoá ở mức cao
đối với hệ thống. Mạng nơ ron cũng rất có ích ở mức độ thi hành thấp nhất với khả
năng xấp xỉ hàm và xử lý song song mạch.
Các phương pháp nhận dạng được phân loại như sau:
a/ Phân loại dựa trên các cơ sở các phần tử hệ thống.
- Phân loại theo hệ thống nhận dạng S.
- Phân loại theo tín hiệu vào.
- Phân loại theo tiêu chuẩn nhận dạng.
b/ Phân loại theo phương pháp cập nhật dữ liệu của hệ thống.
- Phương pháp nhận dạng đệ quy: Thông số nhận dạng được tính toán trực
tiếp theo mỗi thời điểm. Nghĩa là nếu có giá trị ^
(t) được cập nhật ở thời điểm t thì
giá trị của ^
(t+1) được xác định từ ^
(t). Phương pháp nhận dạng đệ quy có đặc
trưng:
+ Là bộ phận chính của hệ thống thích nghi.
+ Đòi hỏi cần có bộ nhớ.
+ Thuật toán có thể được thay đổi dễ dàng.
+ Tại bước tính toán đầu tiên có thể tìm ra được lỗi của thuật toán khi hệ
thống có sự thay đổi thông số đủ lớn. Có 3 loại nhận dạng đệ quy:
+ Nhận dạng đệ quy On-line.
Trong phương pháp nhận dạng đệ quy nếu không cần đòi hỏi dữ liệu vào-ra
đầy đủ ở mỗi thời điểm thì được gọi là phương pháp on-line. Nhận dạng on-line vì
thế được xem như là phương pháp dễ thực hiện cho việc tính toán. Nhận dạng on-
line được sử dụng trong nhiều lĩnh vực như: Nhận dạng thích nghi, học thích nghi,
lọc phi tuyến…
+ Nhận dạng theo thời gian thực.
Trong phương pháp nhận dạng đệ quy nếu thông số của mô hình có đầy đủ
cho mỗi thời điểm quan sát được theo thời gian thực, gọi là phương pháp nhận
dạng theo thời gian thực. Nó được sử dụng trong nhận dạng thông số hệ thống biến
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
46
đổi chậm theo thời gian. Để xác định thông số ^
(t+1) trên cơ sở N cặp tín hiệu vào-
ra, phải thực hiện liên tiếp thủ tục nhận dạng dữ liệu tín hiệu vào-ra với bậc phù
hợp. Thuật toán có dạng (2.1) ^
(t+1) = ^
(t) +
(t).e(t) ( 2.1)
Trong đó:
.
(t) là hàm số phụ thuộc vào đối tượng nhận dạng tại thời điểm t.
. e(t) là sai lệch tại thời điểm t.
+ Nhận dạng off- line.
Ngược lại với phương pháp on-line, phương pháp nhận dạng off-line sử dụng
đồng thời tất cả các dữ liệu. Nhận dạng off-line sử dụng khi cần thiết sử lý một
“mớ” tín hiệu cùng một lúc.
Phương pháp nhận dạng theo đặc tính vào- ra, là điểm mạnh về ứng dụng
của mạng nơ ron. Sử dụng mạng nơ ron để nhận dạng đối tượng có nhiều ưu điểm
hơn so với phương pháp nhận dạng truyền thống vì:
.Mạng nơ ron là hệ học và thích nghi có khả năng học on-line từ các số liệu
quá khứ, do đó kết quả nhận dạng có thể đạt được độ chính xác rất cao.
.Mạng nơ ron là hệ xử lý song song do đó tốc độ tính toán cao mà các
phương pháp nhận dạng truyền thống khó có thể đạt được.
.Mạng nơ ron là hệ MIMO, do đó rất tiện dùng khi nhận dạng cho đối tượng
nhiều biến.
Tóm lại bản chất “HỌC” của mạng nơ ron có một trong những đặc trưng rất
đặc biệt đó là nhận dạng đối tượng căn cứ vào đặc tính vào- ra của nó.
2.2.2. Mô tả toán học của đối tượng ở miền rời rạc.
Phương trình trạng thái của đối tượng được biểu diễn ở dạng liên tục như
(2.2):
(2.2)
Trong đó: x(t) = [x1(t) x2(t) x3(t) x4(t) … xn(t) ]
dt
tdx )(
[x(t), u(t) ]
y(t) = [x(t) ]
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
47
u(t) = [u1(t) u2(t) u3(t) u4(t) … up(t) ]
y(t) = [y1(t) y2(t) y3(t) y4(t) … ym(t)]
Tương ứng với hệ có p đầu vào, m đầu ra có bậc n
Phương trình trạng thái viết ở dạng rời rạc như (2.3) :
(2.3)
Trong đó: là véc tơ bậc
pn xRR
là véc tơ bậc mR
u(k), x(k), y(k) là các biến ở dạng rời rạc.
+Nếu biểu thức (2.3) là dạng tuyến tính thì ta có:
(2.4)
Trong đó A,B,C là các ma trận có cấp tương ứng là (n x n), (n x p), (m x n)
Đối với hệ một đầu vào một đầu ra SISO ( Single Input Single Output) để
điều khiển và quan sát được thì các ma trận A, B, C phải thoả mãn điều kiện (2.5),
(2.6):
M = [
BAn .1
BAn .2
BAn .3
….B] có Rank (M) = n (2.5)
N = [
TC
TTCA
…
TnT CA 1)(
] có Rank(N) = n (2.6)
Và khi đó yp(k+1) =
)()(
1
0
1
1
jkuiky
m
j
jp
n
i
i
(2.7)
Trong đó i và j là các hằng số chưa biết ; m n
Tín hiệu đầu ra yp(k+1) là tổ hợp tuyến tính của các giá trị quá khứ của các
giá trị vào u(k-j) với ( j= 0
m-1) và tín hiệu đầu ra yp(k-i) với (i=1 n-1)
+ Nếu đối tượng là phi tuyến đầu ra yp(k+1) có 4 dạng như (2.8), (2.9),
(2.10), (2.11):
Dạng1:
x(k+1) = [x(k), u(k) ]
y(k) = [x(k) ]
x(k+1) = Ax(k) + Bu(k)
y(k) = Cx(k)
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
48
yp(k+1) =
)(
1
1
iky p
n
i
i
g[ u(k), u(k-1),…, u(k-m +1) ] (2.8)
yp(k+1) phụ thuộc vào giá trị quá khứ của đầu ra yp(k-i) và giá trị quá khứ của đầu
vào u( k), u(k-1), u(k-m+1).
Dạng2:
yp(k+1) = f[ yp(k), yp (k-1),…, yp(k-n +1) ] +
)(
1
0
jku
m
j
j
(2.9)
yp(k+1) phụ phi tuyến vào các giá trị ra quá khứ yp(k), yp(k-1),…, yp(k-n+1) và phụ
thuộc tuyến tính giá trị vào quá khứ u(k-j) với j = 0
m-1
Dạng3:
yp(k+1) = f[yp(k), yp (k-1),…, yp(k-n +1) ]+g[ u (k), u (k-1),…, u(k-m +1)] (2.10)
yp(k+1) phụ thuộc phi tuyến vào các giá trị ra quá khứ và các giá trị vào quá khứ
Dạng 4:
yp(k+1) = f[ yp(k), yp (k-1),…, yp(k-n +1) ,u (k), u (k-1),…, u(k-m +1) ] (2.11)
yp(k+1) phụ thuộc phi tuyến vào giá trị ra quá khứ và các giá trị đầu vào cùng các
giá trị quá khứ của nó.
Với u(k), y(k) là các cặp tín hiệu vào ra của đối tượng tại thời điểm k, f(.),
g(.) là các hàm phi tuyến của đối tượng chưa biết cần được tuyến tính gần đúng bởi
mạng nơ ron có độ chính xác mong muốn.
Số lớp, số lượng nơ ron ở các lớp cũng như các mối liên kết giữa các nơ ron
của mỗi lớp với nhau trong mạng nơ ron nhận dạng được chọn cần phù hợp với độ
chính xác và đặc tính vào- ra của hàm phi tuyến tương ứng của đối tượng đã cho.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
49
2.2.3 Mô hình dùng mạng nơ ron.
yp: Là đầu ra của đối tượng
py
: Là đầu ra của mạng nơ ron
e = yp-
py
: Là sai lệch giữa đầu ra của
đối tượng và mạng nơ ron, được sử dụng
làm tín hiệu học sửa trọng số cho mạng.
2.2.3.1.Mô hình song song.
Trong trường hợp này, cấu trúc của bộ nhận dạng giống như của hệ thống
cần nhận dạng.
2.2.3.2.Mô hình nối tiếp - song song.
Mô hình nhận dạng nối tiếp - song song có ưu điểm tốc độ hội tụ cao (Hình vẽ
2.3)
Tín hiệu ra của mô hình có dạng như (2.12):
+ Với đối tượng là tuyến tính:
)()()()()1(
1
0
1
1
jkukikykky
m
j
jp
n
i
ip
(2.12)
Trong đó
)1(),(),(
kykk ji
là các thông số nhận dạng của (2.7)
-
p
y
yp
u
Mạng nơron
Đối tƣợng
Hình 2.1. Mô hình mạng nơ ron
nhận dạng kiểu truyền thẳng
+
+
+
+
+
+
+
+
-
u(k)
g
N
0
1
0
1
1z
1z
1z
1z
yp(k+1)
)1(
ky
e
Hình 2.2 .Mô hình mạng nơ ron
nhận dạng kiểu song song
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
50
+ Với đối tượng là phi tuyến:
Dạng 1:
)1(),...1(),()()()1(
1
1
mkukukugikykky p
n
i
ip (2.13)
Dạng 2:
)()()1(
1
0
jkukky
m
j
jp
+ f [
)1(),...,1(),(
nkykyky
ppp
] (2.14)
Dạng 3:
)1(ky
p
f
[
)1(),...,1(),(
nkykyky
ppp
] +
g
[u(k), u(k-1), …, u(k-m+1)] (2.15)
Dạng 4:
)1(ky
p
f
[
)1(),...,1(),(
nkykyky
ppp
, u(k), u(k-1), …, u(k-m+1) ] (2.16)
2.2.3.3.Mô hình ngược trực tiếp.
Hình 2.4 chỉ rõ, có thể dùng mạng nơ ron để nhận dạng hệ thống ngược như thế
nào.
+
+
+
+
+
+
+
+
-
u(k)
g
N
0
1
0
1
1z
1z
1z
1z
yp(k+1)
)1(
ky
e
Hình 2.3.Mô hình mạng nơ ron nhận dạng kiểu nối tiếp
song song
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
51
Tín hiệu ra của đối tượng yp là tín hiệu vào của mạng nơ ron, tín hiệu này so
sánh với tín hiệu đặt ở đầu vào, sai lệch e được sử dụng làm tín hiệu luyện mạng nơ
ron, đầu ra của mạng là đầu vào của hệ thống.
2.2.3.4.Mô hình tổ hợp.
Theo mô hình này, đầu tiên mạng nhiều lớp phải học để nhận dạng hệ thống
thuận như hình 2.5a. Sau đó mạng này và mạng nhiều lớp khác được sử dụng như
bộ điều khiển được cấu trúc như trên hình 2.5b. Lợi ích của mô hình hệ thống thuận
là ta có thể tính toán khá dễ dàng đạo hàm của đầu ra theo mô hình của đầu vào dựa
trên quá trình lan truyền ngược(tính toán chuyển đổi của ma trận Jacobi của mạng
tại vector đầu vào hiện thời). Kết quả là sai số giữa đầu ra thực và đầu ra mong
muốn của hệ thống được lan truyền ngược lại qua mô hình thuận sinh ra sai số của
tín hiệu điều khiển, sai số này có thể để dạy cho một mạng khác làm chức năng điều
khiển. Phương pháp này có ưu điểm so với nhận dạng trực tiếp hệ thống ngược khi
hệ thống ngược không xác định tốt.
- +
Mạng nơron
e
u
r
yp
Hình 2.4.Mô hình mạng nơ ron nhận dạng ngược trực tiếp
Đối tƣợng
Đầu ra
mong
muốn
của
mạng
Hệ thống
Mạng nơron
(a)
y
v u N
2 N
W(z)
(b)
Hình 2.5.Mô hình mạng nơ ron nhận dạng tổ hợp
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
52
2.3.CÁC PHƢƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG ĐIỀU
KHIỂN.
Nhiều mạng nơ ron đã và đang được ứng dụng rất thành công trong lĩnh vực
nhận dạng và điều khiển hệ thống truyền động. Thông thường người ta hay sử dụng
mạng nhiều lớp truyền thẳng làm mô hình mẫu, làm các bộ điều khiển cho đối
tượng là phi tuyến.
Khi hệ thống đã được nhận dạng với độ chính xác nhất định, quá trình điều
khiển được bắt đầu để cho đầu ra của hệ thống bám theo đầu ra của mô hình ổn
định. Sau đây chúng ta nghiên cứu cấu trúc một số mạng nơron phổ biến cho việc
nhận dạng và điều khiển hệ thống.
2.3.1.Bộ điều khiển đảm bảo tính ổn định bền vững.
Bộ điều khiển đảm bảo tính ổn định bền vững có sơ đồ cấu trúc như (2.6):
2.3.2. Điều khiển thích nghi ngược trực tiếp.
Hình vẽ 2.7 là sơ đồ cấu trúc của hệ điều khiển thích nghi ngược theo tài liệu
[WiWa 96]
Tín hiệu vào của khối thuật toán thích nghi là sai lệch giữa tín hiệu ra của
thiết bị và tín hiệu ra của mô hình mẫu. Các thông số của bộ điều khiển luôn được
cập nhật theo tín hiệu sai lệch này. Mạng nhận dạng của bộ điều khiển thích nghi
bởi ảnh hưởng của nhiễu trên thiết bị và nhiễu ngoài khác. Một sự lựa chọn mà cho
phép khử được sự tác động của các loại nhiễu trên là mắc song song mạng nơ ron
-
+
+ +
Tín hiệu đặt
Đầu ra thiết bị
Bộ đ.k ổn
định
Thiết bị
Mạng
nơron
TTthích
nghi
Hình 2.6.Sơ đố cấu trúc bộ điều khiển ổn định bền vững
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
53
mô hình mẫu với thiết bị. Mô hình sẽ học các tín hiệu vào giống như tín hiệu vào
thiết bị và cho tín hiệu ra mẫu. Sự khác nhau giữa các đầu ra của thiết bị và của mô
hình đó là do sự ảnh hưởng của nhiễu. Tín hiệu này sẽ được đưa vào mạng nơ ron
phản hồi để phát hiện và lọc nhiễu. Tín hiệu ra của khối này được trừ với tín hiệu
vào của thiết bị, sự phối hợp đó trong điều khiển thích nghi được ứng dụng trong
điều khiển quỹ đạo của các cánh tay rô bốt.
Trên hình 2.7 chúng ta thấy rằng tín hiệu điều khiển đưa vào thiết bị là tổng
của tín hiệu điều khiển phản hồi và tín hiệu truyền thẳng. Đó là mô hình sử dụng
đặc tính mong muốn làm tín hiệu đầu vào và tín hiệu điều khiển phản hồi như tín
hiệu sai lệch. Một lợi thế về cấu trúc, cho chúng ta có thể bắt đầu với một hệ thống
ổn định bền vững dù cho mạng nơ ron chưa có quá trình huấn luyện triệt để. Tương
tự như trong điều khiển cấu trúc, trong các bộ điều khiển ổn định đã sử dụng cách
nối song song với mạng điều khiển nơ ron [Sas 192].
Sai lệch
Nhiễu Nhiễu
+
+
+
+
-
-
-
Tín hiệu
ra
Tín hiệu
đặt Mạng ĐK
Mô
hình
mẫu
Mạng
phản hồi
Thiết Bị
T.T thích
nghi
Mạng nơron
mô hình mẫu
Hình 2.7.Sơ đồ cấu trúc của hệ điều khiển thích nghi ngƣợc
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
54
2.2.3. Điều khiển phi tuyến mô hình trong.
Sơ đồ điều khiển phi tuyến theo mô hình trong (NIMC) được cho như hình 2.8:
Sơ đồ gồm có một bộ điều khiển nơ ron, một mạng nơ ron mô hình mẫu thiết
bị và một bộ lọc thô với sự điều chỉnh đơn thông số [NaHe 92].
Bộ điều khiển nơ ron thông thường được huấn luyện để thay thế cho phản
hồi của thiết bị, nếu có phản hồi trong. Sai lệch giữa đầu ra của mạng nơ ron mô
hình mẫu và số đo đầu ra của thiết bị thực được sử dụng làm tín hiệu phản hồi đưa
vào bộ lọc thô sau đó được chuyển đến bộ điều khiển nơ ron.
Mạng nơ ron mô hình mẫu và bộ điều khiển nơ ron có thể được huấn luyện
off-line sử dụng dữ liệu tự có từ thiết bị trong quá trình hoạt động. Bộ lọc thô là bộ
lọc bậc nhất nó có hằng số thời gian được chọn sao cho mạch kín ổn định.
2.2.4. Mô hình điều khiển dự báo.
Mô hình điều khiển dự báo được cho như sơ đồ hình 2.9.
Tín hiệu
vào đặt Đầu ra
+
-
+
-
Bộ lọc thô Bộ ĐK
Nơron
Thiết bị
Mô hình
thiết bị
Hình 2.8.Sơ đồ điều khiển mô hình trong
Tín hiệu
vào đặt
Đầu ra
dự báo
Đầu ra
thiết bị
Đầu vào
điều khiển
Mô hình
mạng
nơron
Bộ ĐK
nơron
Thiết bị
Hình 2.9.Sơ đồ điều khiển dự báo
Mô hình
mẫu
Luật tối
ưu
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
55
Sơ đồ cấu trúc bao gồm một mô hình mạng nơ ron, một bộ điều khiển nơ
ron, một hàm thực hiện đánh giá sự phản ứng của hệ thống và một luật tối ưu để
chọn tín hiệu điều khiển đầu vào tốt nhất:
Luật tối ưu có thể được ước tính, nó đòi hỏi cần qua nhiều bước tính trước,
trong đó mạng nơ ron được sử dụng để dự báo phản ứng của thiết bị. Bộ điều khiển
nơ ron học để đưa ra tín hiệu điều khiển được chọn theo phương pháp tối ưu. Khi
quá trình huấn luyện hoàn thành, các bước tối ưu hoá có thể được thay thế bằng bộ
điều khiển nơ ron.
2.2.5 Điều khiển thích nghi theo mô hình mẫu (MRAC).
Cũng như các phương pháp kỹ thuật khác, kỹ thuật điều khiển thích nghi
theo mô hình mẫu sử dụng hai mạng nơ ron, một mạng điều khiển và một mạng mô
hình. Sơ đồ cấu trúc như hình 2.10
Mạng nơ ron nhận dạng có thể được huấn luyện off-line, sử dụng các tín
hiệu đo được trong quá khứ của thiết bị. Bộ điều khiển nơ ron được huấn luyện
thích nghi tương ứng với đầu ra của thiết bị để theo giõi đầu ra của mô hình mẫu.
Mạng nơ ron được sử dụng để dự báo tác động thay đổi của bộ điều khiển lên đầu ra
của thiết bị, điều đó cho phép cập nhật được các thông số của bộ điều khiển.
Sai lệch
mô hình
Đầu ra
Sai lệch
điều
khiển
Tín hiệu
đặt
-
+
-
Mạng nơron
điều khiển
Thiết bị
Mạng nơron
nhận dạng
Mô hình
mẫu +
Hình 2.10.Sơ đồ cấu trúc điều khiển thích nghi theo mô
hình mẫu
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
56
2.2.6. Điều khiển thích nghi tự chỉnh.
Bộ điều khiển thích nghi tự chỉnh có sơ đồ khối như hình vẽ 2.11. Bộ điều
khiển bao gồm có hai mạng nơ ron [SuBa 98], mạng thứ nhất hoạt động như bộ điều
khiển ngược và được gọi là mạng hành vi, mạng thứ hai được gọi là mạng tự chỉnh
dự báo diễn biến tương lai của hệ thống. Mạng tự chỉnh được huấn luyện để tối ưu
hoá phản ứng tương lai của thiết bị. Quá trình huấn luyện được thực hiện theo
phương pháp học củng cố, đó là một chương trình làm xấp xỉ quá trình động học.
2.2.7. Điều khiển thích nghi bằng mạng nơron hồi quy tuyến tính.
Kỹ thuật điều khiển thích nghi dùng mạng nơ ron hồi quy tuyến tính là tiêu
chuẩn cơ bản của bộ điều khiển tuyến tính hoá [SlLi 91], sơ đồ thực hiện như hình
2.12
Phương pháp kỹ thuật điều khiển tuyến tính hoá thích nghi dùng mạng nơ ron hồi
quy cho ra một bộ điều khiển với hai thành phần: Thành phần thứ nhất khử độ phi
tuyến đầu ra của thiết bị, thành phần thứ hai là một trạng thái tuyến tính của bộ điều
khiển hồi quy.
Với phương pháp kỹ thuật trên, có thể được áp dụng để mô tả các hệ thống
phi tuyến bằng quan hệ (2.17):
uxgxfx pp
n
p ).()(
)(
(2.17)
Trong đó:
)1(,...,
npppp xxxx
(2.18)
Đầu ra
Tín hiệu
đặt
Luật tối ưu
Bộ điều
khiển
Thiết bị
Hình 2.11.Sơ đồ khối bộ điều khiển thích nghi tự chỉnh
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
57
là các biến trạng thái của hệ thống và u là đầu vào điều khiển. Để có được hệ thống
tuyến tính từ hệ phi tuyến cho bởi công thức 2.17 chúng ta có thể sử dụng đầu vào:
rxkxf
xg
u p
T
p
p
)(
)(
1
(2.19)
Trong đó k bao gồm các hệ số phản hồi khếch đại, r là đầu vào đặt. Thay
(2.19) vào (2.17) ta được kết quả trong hệ thống tuyến tính:
rxkx p
Tn
p
)(
(2.20)
Chúng ta có thể sử dụng mạng nơ ron hồi quy tuyến tính để thực hiện tuyến
tính hoá với một mục đích nhất định. Nếu sử dụng mạng nơ ron NNf và NNg để xấp
xỉ gần đúng hàm f và g thì ta có thể viết lại tín hiệu điều khiển như (2.21):
rxkxNN
xNN
u p
T
pf
pg
)(
)(
1
( 2.21)
Chúng ta muốn hệ thống theo mô hình mẫu cho bởi công thức (2.22):
rxkx m
Tn
m
)(
(2.22)
Thay thế biểu thức 2.21 vào biểu thức 2.17 ta có:
rxkxNN
xNN
xg
xfx p
T
pf
pg
p
p
n
p )(
)(
)(
)()(
(2.23)
Sai lệch điều khiển được định nghĩa là: e = xp- xm (2.24)
Vi phân của sai lệch có biểu thức như (2.25):
e
(n)
= -k
T
e +{f(xp)- NNf(xp) } + {g(xp)- NNg(xp) }u (2.25)
Với một thuật toán huấn luyện phù hợp, biểu thức vi phân của sai lệch sẽ
được xác định và sai lệch sẽ hội tụ về 0 nếu sai lệch đủ nhỏ [VaVe96].
Trong các sự biến thiên khác nhau của bộ điều khiển thích nghi hồi quy
tuyến tính hoá có các mô hình xấp xỉ gần đúng của Narendra[NaBa94].
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
58
2.2.8. Điều khiển thích nghi ổn định trực tiếp.
Gần đây, đã có các phương pháp điều khiển thích nghi trực tiếp khác nhau,
điều đó thuận lợi cho việc thiết kế nên tất cả các hệ thống đảm bảo tính ổn định
([Sas 192], [Poly 96], [Spcr 98] ). Phương pháp của [Sas192] sử dụng nguyên lý ổn
định Lyapunov trong thiết kế quy tắc của mạng, nói đúng hơn là trong xây dựng
thuật toán giảm độ dốc. Bộ điều khiển thích nghi ổn định trực tiếp được cho như
hình 2.13:
xm
- +
e
r +
-
-
xp
NNf
NNg
Mô hình
mẫu
P
k
+ x
+
Tối ưu
cho NNg
Tối ưu
cho NNf
Hình 2.12.Sơ đồ điều khiển thích nghi dùng
mạng nơron hồi quy tuyến tính
+
+
+
X
x
xd
upd
usl
uad Mạng
nơron
Thiết bị
Điều
chỉnh
X +
X
Hình 2.13.Sơ đồ bộ điều khiển thích nghi ổn định trực tiếp
Điều khiển
trượt
Hồi quy tuyến
tính
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
59
Sơ đồ gồm có: Một kâu hồi quy tuyến tính, một bộ điều khiển độ trượt phi
tuyến , một bộ điều khiển nơ ron thích nghi. Tín hiệu điều khiển được tổng hợp như
(2.26):
u(t) = upd(t) + [1-m(t) ].uad(t) + m(t).usl(t) ( 2.26)
Trong đó: upd(t) là tín hiệu điều khiển hồi quy tuyến tính, usl là tín hiệu điều
khiển theo mô hình trượt, uad là tín hiệu điều khiển thich nghi của mạng nơ ron, hàm
m(t) cho phép san bằng quá trình quá độ giữa quá trình của bộ điều khiển trượt và
quá trình của bộ điều khiển thich nghi dựa trên cơ sở định vị trạng thái hệ thống:
Trong đó miền Ad và Ac được xác định như hình 2.14:
Bộ điều khiển trượt được sử dụng để
giữ ổn định cho hệ thống trong một miền mà
mạng nơ ron có thể huấn luyện được để đạt
độ chính xác của điều khiển tối ưu.
Bộ điều khiển trượt được mở (bộ
điều khiển nơ ron được khoá ) bất cứ lúc
nào hệ thống lệch ra ngoài miền. Sự tổ hợp
các bộ điều khiển tạo ra một hệ thống ổn
định theo tiêu chuẩn tối ưu.
Cần chú ý rằng bộ điều khiển nơ ron được ứng dụng trên cơ sở sự hoạt động
của mạng nơ ron thần kinh. Đầu ra của mỗi nơ ron thần kinh là hàm tuyến tính cơ
sở của hàm trọng. Điều đó cho phép mạng nhiều lớp phân tích quá trình huấn luyện
đơn giản và nhanh hơn, nhưng cũng có một điều khó khăn ở đây là phải cần nhiều
nơ ron nếu số đầu vào mạng lớn.
2.2.9. Điều khiển tối ưu.
Không gian trạng thái được chia thành các vùng đặc trưng tương ứng với
các trạng thái điều khiển khác nhau. Sự nhận biết về mặt điều khiển thực hiện qua
m(t) = 0 Khi x(t) Ad
0< m(t) <1 Các trường hợp khác
m(t) = 1 Khi x(t) Ac
x
ẋ
Ac
Ad
Hình 2.14.Các miền của bộ điều khiển
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
60
các thủ tục học. Từ đó bề mặt tối ưu thời gian, nhìn chung là phi tuyến, nó cần được
sử dụng vào khả năng tính gần đúng bề mặt phi tuyến. Một khả năng cơ bản là
lượng hoá không gian trạng thái vào các phần tử cơ bản, ở đó hoạt động điều khiển
được giả thiết không đổi. Quá trình này có thể sử dụng mạng liên kết Leteral. Bề
mặt thay đổi không được biết trước, nhưng chúng được định nghĩa hoàn toàn bởi
quá trình học của các điểm trong không gian trạng thái với điều khiển thích nghi đã
được cho trước. Trong quá trình học, các luật học điều chỉnh trọng số của mạng trên
cơ sở đưa véc tơ điều khiển về trạng thái mong muốn. Quá trình học của véc tơ mẫu
hiện có được điều khiển liên tục ở nhiều thời điểm cho đến khi các véc tơ mẫu hoàn
toàn được phân loại chính xác, học cho đến khi các dạng sai lệch có giá trị không đổi.
2.2.10. Phương pháp bảng tra.
Mạng nơ ron được sử dụng như một liên kết bộ nhớ, lưu giữ mối quan hệ
giữa thông số của bộ điều khiển với trạng thái của đối tượng. Mạng Hopfield và
mạng CMAC được sử dụng trong trường hợp này. Bộ thông số của bộ điều khiển
được thiết kế thoả mãn các luật điều khiển tối ưu.
2.2.11. Điều khiển lọc.
Lọc là quá trình lấy được tín hiệu ra từ nhiễu. Như vậy phương pháp này có
tác dụng loại bỏ sự tác động của nhiễu. Cơ sở của phương pháp là tính gần đúng
bình phương nhỏ nhất, bỏ đi một số phần tử của dãy Wiener- Volterra. Các dãy này
mô tả cho hệ phi tuyến, có ưu điểm là thiết lập được quan hệ tuyến tính giữa các
đầu ra và trọng số của mạng. Phương pháp có nhược điểm là độ phức tạp và số
lượng phép tính lớn, do đó nó chỉ được sử dụng vào hệ có độ phi tuyến thấp.
Trường hợp đặc biệt của nhiễu là dạng hỗn loạn có thể tìm được biểu thức tương
đương thoả mãn lọc sai số cực tiểu, sử dụng mạng nơ ron theo luật lan truyền ngược
theo sai lệch BP.
giá trị dự báo cho tương lai. Cơ sở thiết kế của trường hợp này là sự liên kết của
nhiều dạng mẫu.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
61
2.2.12. Những hạn chế và chú ý.
Trong mỗi cấu trúc của các bộ điều khiển nơ ron chúng ta đều đánh giá về
những thuận lợi và không thuận lợi của các bộ điều khiển này. Ví dụ với phương
pháp kỹ thuật hồi quy tuyến tính chỉ có thể được áp dụng trong những hệ thống cho
bởi biểu thức 2.17. Phương pháp kỹ thuật điều khiển thích nghi trực tiếp thì xuất
hiện tính phi tuyến và nó được xem như một ẩn số của đầu vào điều khiển biểu diễn
trong không gian trạng thái. Phương pháp kỹ thuật điều khiển theo mô hình mẫu
không đảm bảo độ ổn định, phương pháp kỹ thuật điều khiển ngược thích nghi cần
đến trạng thái thực ổn định của thiết bị ngược…
Nói chung những phương pháp kỹ thuật trên đều đảm bảo sự ổn định nhưng
chỉ được áp dụng trong một giới hạn nào đó của hệ thống. Lĩnh vực điều khiển nơ
ron tiếp tục được nghiên cứu, cách thức ổn định hoá trong hệ thống sẽ được phát
triển rộng khắp trong các hệ thống.
Từ các vấn đề thực tế cho thấy, vấn đề mấu chốt cho những hệ thống điều
khiển nơ ron là khả năng hoạt động tốt của một mạng trong các trạng thái mới. Ví
dụ cấu trúc mô hình điều khiển dự báo cần đến một mô hình mạng nơ ron nhận
dạng thiết bị, mô hình thiết bị là một ánh xạ từ các đầu vào và đầu ra của thiết bị
trước tới đầu ra của thiết bị sau. Trong trình tự tính toán mô hình thiết bị, mạng cần
được huấn luyện với dữ liệu bao gồm toàn bộ phạm vi đầu vào mạng có thể thực
hiện được. Điều khó có thể thực hiện được ở đây là dữ liệu, bởi vì chúng ta không
có điều khiển trực tiếp vượt trước đầu ra của thiết bị. Nhiều lúc chúng ta có thể có
điều khiển độc lập trên đầu vào thiết bị, nhưng chỉ có điều khiển gián tiếp trên đầu
ra của thiết bị (mà sau đó trở thành đầu vào mạng). Những hệ thống bậc cao sẽ khó
khăn để đạt được dữ liệu cho phản ứng đầu ra của thiết bị thích hợp cho việc phân
vùng không gian trạng thái. Trạng thái sẽ trở nên quan trọng để mạng có thể phát
hiện ra trạng thái trong đó đầu vào rơi ra ngoài miền dữ liệu được cho là đúng mà
mạng đã được huấn luyện.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
62
KẾT LUẬN CHƢƠNG 2
1. Có nhiều phương pháp ứng dụng mạng nơron để nhận dạng đối tượng,
trong đó nổi bật là hai phương pháp nhận dạng on-line và nhận dạng off-line.Trong
hai phương pháp trên thì phương pháp nhận dạng off-line có nhiều ưu điểm; nó có
thể sử dụng đồng thời tất cả các dữ liệu. Nhận dậng off-line sử dụng khi cần thiết
phải xử lý rất nhiều tín hiẹu cùng một lúc.
2. Phương pháp sử dụng mạng nơron nhận dạng đối tượng theo đặc tính vào
- ra, là điểm mạnh của về ứng dụng của mạng nơron. Sử dụng mạng nơron để nhận
dạng đối tượng có nhiều ưu điểm hơn so với phương pháp nhận dạng truyền thống
vì:
- Mạng nơron là hệ học và thích nghi có khả năng học on-line hoặc off-line
từ các số liệu quá khứ, do đó kết quả nhận dạng có thể đạt được độ chính xác rất
cao.
- Mạng nơron là hệ xử lý song song do đó tốc độ tính toán cao, mà các
phương pháp nhận dạng truyền thống khó có thể đạt được.
- Mạng nơron là hệ MIMO, do đó rất tiện dùng khi nhận dạng cho đối tượng
nhiều biến.
3. Với bản chất “HỌC” mạng nơron có một trong những ứng dụng rất đặc
trưng đó là nhận dạng đối tượng căn cứ vào đặc tính vào - ra của nó.
Mạng nơ ron truyền thẳng nhiều lớp có cấu tạo đơn
giản, có luật học lan truyền ngược rất nổi tiếng thực hiện dễ dàng và có hiệu quả cao
phù hợp với thực hiện quá trình học cho các đối tượng là tuyến tính và phi tuyến
tính.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
63
CHƢƠNG III
ỨNG DỤNG MẠNG NƠRON TRUYỀN THẲNG NHIỀU LỚP NHẬN DẠNG
VỊ TRÍ RÔ BỐT HAI KHÂU.
Qua phân tích ở các phần trên, ta thấy mạng nơ ron truyền thẳng nhiều lớp có
nhiều ưu điểm; có cấu trúc đơn giản, có thuật toán học lan truyền ngược rất nổi
tiếng được sử dụng nhiều trong các lĩnh vực nhận dạng và điều khiển các đối tượng
phi tuyến. Vì vậy luận văn này chọn mạng nơ ron truyền thẳng nhiều lớp cho việc
nhận dạng vị trí Rô bốt hai khâu .
3.1. Mạng nơ ron truyền thẳng nhiều lớp.
3.1.1.Sơ đồ khối mạng nơ ron truyền thẳng nhiều lớp(3lớp).
Lớp 1 là lớp vào có số nơ ron là S1, hàm chuyển là f1 và đầu ra là a1, lớp 2 là
lớp ẩn có số lượng nơ ron là S2 hàm chuyển là f2 và có đầu ra là a2, lớp 3 là lớp ra có
số lượng nơ ron là S3, hàm chuyển là f
3
và có đầu ra là a3
P là véc tơ đầu vào có R phần tử.
W
ji
là ma trận hàm trọng lượng liên kết, j là chỉ số nguồn, i là chỉ số đích.
3.1.2.Thuật toán học lan truyền ngược của sai lệch(Back Propagation Learning
Rule).
Mạng truyền thẳng chỉ có thể làm việc ở một trong hai trạng thái đó là trạng
thái ánh xạ và trạng thái học.
S2x1
Rx1 S
2
x1
a
1
a
2 a
3
= y P
Hình 3.1.Ký hiệu tắt của mạng nơ ron 3 lớp
1
R S1
a
1
= f
1
(IW
1,1
P+b
1
)
n1
b1
+
S
1
x1
S
1
x1
S1xR
Vào Lớp 1
S
2
a
2
= f
2
(LW
2,1
a
1
+b
2
)
f2
n2
b2
+
S
2
x1
S
2
xS
1
Lớp 2
LW
2,1
1
f1
S
3
a
3
= f
3
(LW
3,2
a
2
+b
3
)
f3
n3
b3
+
S3x1
S
3
x1
S
3
xS
2
Lớp 3
LW
3,2
S
3
x1
1
a
3
= f
3
[LW
3,2
f
2
(LW
2,1
f
1
(IW
1,1
P+b
1
)+b
2
]+b
3
= y (3.1)
IW
1,1
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
64
Trong trạng thái ánh xạ, thông tin lan tryền từ lớp nhận đến lớp xuất và mạng
thực hiện ánh xạ để tính giá trị các biến phụ thuộc dựa vào các giá trị của các biến
độc lập đã cho. Quá trình ánh xạ có thể được tóm tắt như sau:
Trước tiên, giá trị của các biến độc lập được chuyển cho lớp vào của mạng,
các nút nhập không tính toán gì cả, mỗi nút nhập chuyển giá trị của nó cho tất cả
các nút ẩn. Mỗi nút ẩn tính tổng trọng hoá của tất cả các dữ liệu nhập bằng cách
cộng dồn tất cả các tích giữa giá trị nút ẩn với trọng số của cung liên kết giữa nút ẩn
đó với các nút nhập. Kế tiếp, một hàm truyền được áp dụng trên tổng trọng hoá này
cùng với một ngưỡng của nút ẩn đó để cho ra giá trị thực của nút ẩn. Hàm truyền
chỉ đơn giản nén giá trị vào một miền giới hạn nào đó. Sau khi nén tổng trọng hoá
của nó đến lượt mình, mỗi nút ẩn sẽ gửi kết quả đến tất cả các nút xuất. Mỗi nút
xuất thực hiện các thao tác tương tự như đã thực hiện trong nút ẩn để cho ra giá trị
kết xuất của nút xuất. Giá trị của các nút xuất là chính là giá trị thực, nghĩa là giá trị
của các biến phụ thuộc cần xác định.
Trong trạng thái học, thông tin được lan truyền theo hai chiều nhiều lần để
học các trọng số.
Thuật toán học lan truyền ngược là một phương pháp cho phép xác định tập
hàm trọng lượng tốt nhất để giải một bài toán được cho. Việc áp dụng phương pháp
lan truyền ngược là một quá trình lặp đi lặp lại nhiều lần hai tiến trình chính; ánh xạ
và lan truyền ngược. Sai số của hai tiến trình này được áp dụng trên một tập mẫu
xác định. Ta gọi chung quá trình này là luyện mạng hay là học.
Quá trình luyện mạng được bắt đầu với các giá trị trọng số tuỳ ý (có thể là
các số ngẫu nhiên) và tiến hành lặp đi lặp lại, mỗi lần lặp được gọi là một thế hệ.
Trong mỗi thế hệ, mạng hiệu chỉnh các thông số sao cho sai số giảm dần (sai số là
độ lệch giữa các kết xuất thực và các kết xuất đích ). Tiến trình điều chỉnh nhiều lần
giúp cho trọng số dần dần đạt được tập hợp các giá trị tối ưu.
Thuật toán lan truyền ngược có thể được tóm tắt như sau:
Cho trước tập mẫu gồm P mẫu thông số vào- ra (xk- dk), k = 1,2,3,…,P. Với xk là
véc tơ đầu vào, dk là véc tơ đầu ra mẫu. Để học bộ thông số mẫu trên mạng thực
hiện theo hai giai đoạn sau:
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
65
Giai đoạn đầu, bộ đầu vào mẫu xk được lan truyền từ lớp vào đến lớp ra, khi
đó kết quả dữ liệu được lan truyền thẳng tạo ra tín hiệu đầu ra yk.
Giai đoạn thứ hai, tín hiệu sai lệch ek giữa bộ đầu ra mẫu dk và tín hiệu ra thực tế
của mạng nơ ron được lan truyền ngược từ đầu ra quay trở lại các lớp ẩn và lớp đầu
vào.
e
k
= d
k
- y
k
(3.2)
Thuật toán lan truyền ngược của sai lệch cho phép nhận được kết quả cập
nhật sự thay đổi của bộ trọng số
ij
q w
sao cho mạng nơ ron nhiều lớp truyền thẳng có
bộ thông số vào - ra là (xk- yk) cũng được thiết lập sau quá trình học bộ mẫu vào - ra
( x
k
- d
k
) đã cho trước. Cơ sở của luật cập nhật trọng số là phương pháp giảm độ dốc.
Thuật toán lan truyền ngược được thực hiện theo các bước như sau:
Xét mạng truyền thẳng có Q lớp và có
netiq
và
yiq
tương ứng là đầu vào và đầu ra
của nơ ron thứ i ở lớp thứ q (q =1,2,3,…,Q), mạng nơ ron có m nơ ron ở lớp đầu
vào l nơ ron ở lớp ẩn và n nơ ron ở lớp ra, với
ij
q w
là trọng số nối từ phần tử
j
q y1
đến phần tử i của lớp q. Bộ thông số vào - ra mẫu {( xk- dk), k = 1,2,3…,Q}.
Bước 0:(Thiết lập trạng thái ban đầu cho mạng)
Chọn trước giá trị cho các thông số:
- Hằng số học 0<η<1.
- Sai lệch trung bình bình phương cực đại; giá trị cho phép Emax và giá trị ban
đầu E0 = 0.
- k =1.
- Chọn các trọng số ban đầu nối từ phần tử thứ j của lớp (q – 1) đến phần tử
thứ i của lớp q là
ij
q w
có giá trị nhỏ và ngẫu nhiên.
Bước 1(Vòng luyện tập):
Đưa các dữ liệu mẫu thứ k vào lớp đầu vào (q=1):
k
ii
q xyy 1
với mọi i = 1,2,3,…,m. (3.3)
Bước 2( Quá trình truyền thẳng):
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
66
Quá trình truyền thẳng của tín hiệu trọng mạng được xác định theo công
thức:
)..().( 1
1
i
q
j
ij
q
i
q
i
q ywanetay
(3.4)
cho mỗi phần tử i và lớp q tới khi đầu ra
i
Q y
của lớp ra được xác định.
Bước 3:Tính toán sai lệch trung bình bình phương ở lớp ra:
Xác định giá trị trung bình bình phương sai lệchở lớp ra:
2
1
2
1
)(
2
1
))((
2
1 Q
i
n
i
k
i
n
i
ydkeE
(3.5)
Tín hiệu sai lệch cho lớp đầu ra là
)().( ' i
Q
i
Qk
ii
Q netayd
(3.6)
Trong đó:
i
Q
là tín hiệu sai lệch của nơ ron thứ i cho lớp ra Q;
)(' i
Qneta
là
đạo hàm của hàm hoạt hoá a(.) theo tổng trọng lương của phần tử i của lớp đầu ra là
i
Qnet
.
)(
)('
i
Qi
Q
netd
da
neta
(3.7)
Bước 4: Lan truyền ngược của sai lệch:
Quá trình lan truyền ngược của sai lệch được cập nhật các trọng số tính toán
theo tín hiệu sai lệch
i
q 1
cho các lớp:
j
q
i
q
ij
q yw 1.
(3.8)
mij
q w cij
q w ij
qw
(3.9)
j
q
j
ij
q
i
q
i
q wneta .).( 1'1
(3.10)
Trong đó:
ij
qw
là sai lệch tại thời điểm tính của giá trị trọng số liên kết cập
nhật mới và cũ liên kết từ phần tử thứ j của lớp q-1 đến phần tử i của lớp q.
m
ij
q w
là giá trị trọng số liên kết cập nhật mới từ phần tử thứ j của lớp q-1
đến phần tử i của lớp q.
c
ij
q w
là giá trị trọng số liên kết cũ từ phần tử thứ j của lớp q-1 đến phần tử i
của lớp q.
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
67
j
q y1
là tín hiệu ra của phần tử j của lớp q-1.
Bước 5: ( Cho mỗi chu kỳ học):
- Kiểm tra vòng luyện tập
+ Nếu k<p thì k = k+1.
+ Nếu k = p thì thực hiện bước 6.
Bước 6: Kiểm tra giá trị sai lệch trung bình bình phương tổng:
- Nếu E > Emax thì thực hiện bước 1.
- Nếu E ≤ Emax thì đã hoàn thành quá trình học.
3.2. Ứng dụng mạng nơ ron truyền thẳng nhiều lớp nhận dạng vị trí rô bốt hai
khâu.
3.2.1. Phân tích sơ đồ ứng dụng.
Rô bốt là đối tượng phi tuyến nên rất khó xác định được chính xác các giá trị
của các thông số đo lường tại các thời điểm nhất định, đặc biệt rất khó khăn trong
việc điều khiển thích nghi theo mô hình mẫu. Do đó cần thiết kế một thiết bị nhận
dạng vị trí q (rad) của rô bốt. Trong luận văn này sử dụng mạng nơ ron truyền thẳng
nhiều lớp để nhận dạng vị trí rôbốt hai khâu sao cho tín hiệu ra của mô hình nhận
dạng
m
iq
bám theo được tín hiệu ra thực
iq
của rô bốt.
Sơ đồ ứng dụng mạng nơ ron truyền thẳng nhiều lớp nhận dạng vị trí rô bốt
hai khâu như hình 3.2
ei
-
q
m
i
qi
i
i
Mô hình vị trí rô
bốt hai khâu
Mạng nơ ron
nhận dạng
Hình 3.2. Sơ đồ ứng dụng mạng nơ ron
nhận dạng vị trí rô bốt hai khâu
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
68
i
là mô men đầu vào tác dụng lên khâu thứ i của rô bốt; qi là vị trí thực của khâu
thứ i
m
iq
là vị trí đầu ra của mạng nơ ron nhận dạng; ei là sai lệch giữa vị trí đầu ra
thực và vị trí đầu ra của mạng nơ ron:
ei =
iq
-
m
iq
(3.11)
Sai lệch ei chính là tín hiệu điều khiển quá trình học của mạng nơ ron, làm
cho mạng nơ ron thay đổi giá trị của các hàm trọng lượng sao cho tín hiệu đầu ra
của mạng
m
iq
thay đổi để có : ei =
iq
-
m
iq
→ min (3.12)
Khi mạng nơ ron đã nhận dạng chính xác vị trí của rô bốt hai khâu thì mạng
nơ ron sẽ thay thế mô hình của rô bốt hai khâu để điều khiển thích nghi vị trí theo
mô hình mẫu như sơ đồ hình 3.3:
qiđ là vị trí đặt ban đầu của khâu i; Kui là bộ điều khiển điện áp của khâu i; ui là tín
hiệu điện áp điều chỉnh của khâu i; qi là vị trí thưc của khâu i; m
iq
là vị trí tương ứng
của mô hình mẫu i; eqi là sai lệch giữa qi và m
iq
:
eqi = m
iq
- qi. (3.13)
Giá trị của sai lệch này được sử dụng để thay đổi thông số và cấu trúc của bộ
điều khiển từ đó tạo ra tín hiệu điều chỉnh ui sao cho vị trí khâu i của rô bốt bám
theo được vị trí tương ứng của mô hình mẫu với sai số đạt yêu cầu.
Quá trình điều khiển thích nghi được thực hiện theo hai giai đoạn:
- Giai đoạn thứ nhất là nhận dạng vị trí của rô bốt hai khâu.
- Giai đoạn thứ hai thực hiện tạo ra tín hiệu điều chỉnh để vị trí q của rô bốt
đạt được theo yêu cầu.
eqi
qiđ
m
iq
eqi
-
+ ui
-
qi
Mô hình mẫu
Mạng nơ ron Kui
+
Hình 3.3. Sơ đồ điều khiển thích nghi vị rô bốt
hai khâu theo mô hình mẫu
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
69
Ta nghiên cứu giai
đoạn thứ nhất của quá trình
điều khiển này bằng cách sử
dụng mạng nơ ron truyền
thẳng nhiều lớp với thuật
toán lan truyền ngược có sơ
đồ cấu trúc tổng quát như
hình 3.4:
3.2.2. Mô tả động học rô bốt hai khâu:
Để xác định phương trình động học của rô bốt hai khâu ta xét cơ cấu tay máy
hai khâu như hình 3.5:
q1, q2 tương ứng là vị trí
của khâu thứ 1 và khâu thứ
2;
21 ,
tương ứng là mô men
điều khiển khâu thứ 1 và
thứ2;
m1, m2 tương ứng là khối
lượng của khâu thứ 1và
khâu thứ2;
l1, l2 tương ứng là độ dài của
khâu thứ 1 và khâu thứ 2;
lc1 là khoảng cách từ điểm nối của khâu thứ 1 đến trọng tâm của khâu này;
lc2 là khoảng cách từ điểm nối của khâu thứ 2 đến trọng tâm của khâu này;
I1, I2 tương ứng là mô men quán tính của khâu 1 và khâu 2;
ei
-
i
i
m
iq
iq
Mô hình vị trí
rô bốt hai khâu
Mạng nơ ron
nhận dạng
Hình 3.4. Sơ đồ ứng dụng mạng nơ ron nhận dạng vị trí
rô bốt hai khâu với thuật toán lan truyền ngược
Lan truyền
ngƣợc
Hình 3.5. Sơ đồ động học rôbôt hai khâu
1q
2q
11 I,m
22 I,m
3m
1l
2l
2cl
Y
X
1cl
Chương I.Tổng quan về mạng nơ ron nhân tạo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
70
m3 là khối lượng tải của rô bốt.
Theo [3] phương trình Lagrangian mô tả động học cho rô bốt hai khâu như (3.14):
(3.14)
Với: H11 =
Các file đính kèm theo tài liệu này:
- LV_07_CN_DK_NDN.pdf