Tài liệu Luận văn Dụng cụ đo và cảm biến: 1
Luận văn : Dụng cụ đo và cảm biến
BẢNG KÝ HIỆU
A= [aij ] : Ma trận n x m chiều.
AT : Ma trận chuyển vị của A.
A-1 : Ma trận nghịch đảo của A.
Rn : Không gian thực n chiều.
g(.) : Hàm quan hệ phi tuyến vào ra.
f-1 : Hàm ngược của hàm f.
W= [wik] : Ma trận trọng số liên kết n x m chiều.
1. BẢNG CHỮ VIẾT TẮT VÀ MỘT SỐ THUẬT NGỮ
Adaline : Adaptive Linear Element- Phần tử nơron tuyến tính
thích nghi, tên loại nơron do Windrow đề xuất năm 1960.
ART : Adaptive Resonance Theory- Thuyết cộng hưởng thích
nghi. Một loại mạng được xây dựng theo lý thuyết này.
BAM : Bidirection Associative Memory- Một loại mạng do
Kosko đề xuất năm 1988.
BP : Backpropagation - Thuật học lan truyền ngược.
CAM : Content Addressable Memory- Bộ nhớ nội dung được
địa chỉ hóa.
2
LMS : Least Mean Square - Tên một thuật học (trung bình bình
phương nhỏ nhất).
LVQ : Learning Vector Quantization - Thuật học lượng hóa
véctơ.
MIMO : Multi Input Multi Output - Hệ nhiều đầu vào ...
97 trang |
Chia sẻ: hunglv | Lượt xem: 1240 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Dụng cụ đo và cảm biến, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
1
Luận văn : Dụng cụ đo và cảm biến
BẢNG KÝ HIỆU
A= [aij ] : Ma trận n x m chiều.
AT : Ma trận chuyển vị của A.
A-1 : Ma trận nghịch đảo của A.
Rn : Không gian thực n chiều.
g(.) : Hàm quan hệ phi tuyến vào ra.
f-1 : Hàm ngược của hàm f.
W= [wik] : Ma trận trọng số liên kết n x m chiều.
1. BẢNG CHỮ VIẾT TẮT VÀ MỘT SỐ THUẬT NGỮ
Adaline : Adaptive Linear Element- Phần tử nơron tuyến tính
thích nghi, tên loại nơron do Windrow đề xuất năm 1960.
ART : Adaptive Resonance Theory- Thuyết cộng hưởng thích
nghi. Một loại mạng được xây dựng theo lý thuyết này.
BAM : Bidirection Associative Memory- Một loại mạng do
Kosko đề xuất năm 1988.
BP : Backpropagation - Thuật học lan truyền ngược.
CAM : Content Addressable Memory- Bộ nhớ nội dung được
địa chỉ hóa.
2
LMS : Least Mean Square - Tên một thuật học (trung bình bình
phương nhỏ nhất).
LVQ : Learning Vector Quantization - Thuật học lượng hóa
véctơ.
MIMO : Multi Input Multi Output - Hệ nhiều đầu vào nhiều đầu
ra.
MNN : Artificial Neural Networks - Mạng nơron nhân tạo
SISO : Single Input Single Output - Hệ một đầu vào một đầu ra.
RBF : Radial Basis Functions - Tên một loại mạng do Moody
và Darken đề xuất năm 1989.
3
MỞ ĐẦU
Mô phỏng sinh học đã tạo ra những thành tựu khoa học kỹ thuật to lớn
cho cuộc sống và công cuộc chinh phục thế giới tự nhiên của loài người. Mô
phỏng mạng nơron sinh học là một trong những lĩnh vực đang được phát triển
mạnh mẽ để tạo ra những hệ thống thông minh có những khả năng như ghi
nhớ kinh nghiệm quá khứ, nhận dạng, điều khiển, ra quyết định, dự
đoán...tương tự như bộ não người. Việc nghiên cứu và phát triển lý thuyết
mạng nơron nhân tạo đã được ứng dụng trong nhiều lĩnh vực như đo lường,
điều khiển, công nghệ rôbôt, truyền thông, giao thông vận tải, hàng
không.v.v...
Mạng nơron với những ưu điểm vượt trội so với các hệ thống tính toán
truyền thống như: cho phép xấp xỉ những ánh xạ phi tuyến tùy ý; là hệ thống
xử lý song song làm tăng tốc độ tính toán cho phép đáp ứng khả năng tính
toán thời gian thực và chính xác; là hệ học và thích nghi, khi mạng được huấn
luyện từ các dữ liệu quá khứ, đồng thời có khả năng khái quát hóa khi dữ liệu
vào bị thiếu hoặc không đầy đủ, phù hợp với các hệ thống nhận dạng, chuẩn
đoán kỹ thuật...
Với những ưu điểm trên việc ứng dụng mạng nơron để chế tạo các cảm
biến thông minh với độ chính xác cao là điều hoàn toàn cần thiết, có khả năng
thúc đẩy sự phát triển của kỹ thuật công nghệ nói chung và lĩnh vực đo lường
nói riêng.
Nội dung chủ yếu của luận văn là tập trung nghiên cứu ứng dụng mạng
nơron cho khắc độ dụng cụ đo và cảm biến thông minh. Luận văn bao gồm
năm chương, trong đó chương 1 là phần tổng quan về các phương pháp khắc
độ thiết bị đo bao gồm các phương pháp khắc độ cho dụng cụ đo tương tự,
dụng cụ đo có sử dụng vi xử lý hoặc máy vi tính và các chuyển đổi đo lường
sơ cấp. Chương này cũng nêu ra các hướng ứng dụng mạng nơron cho việc xử
lý số liệu đo và hiệu chỉnh đặc tính thang đo của cảm biến.
4
Chương 2 trình bày phần lý thuyết cơ sở của mạng nơron cho việc
nghiên cứu ứng dụng trong việc xử lý số liệu nhằm giảm sai số ngẫu nhiên,
khắc độ tự động đặc tính và hiệu chỉnh sai số hệ thống của cảm biến.
Ở chương 3, tác giả đã tập trung vào việc nghiên cứu ứng dụng mạng
nơron nhân tạo để xử lý số liệu đo ngẫu nhiên nhằm giảm sai số ngẫu nhiên,
từ các giá trị lấy mẫu đã được xử lý để giảm sai số ngẫu nhiên bằng mạng
nơron chúng tôi đề xuất sử dụng hàm nội suy Lagrange để khắc độ tự động
đường đặc tính của cảm biến thông minh. Đồng thời chương này cũng đã
nghiên cứu việc ứng dụng mạng nơron để khắc độ tự động đặc tính của cảm
biến đảm bảo độ chính xác cao.
Chương 4 nghiên cứu ứng dụng mạng nơron để hiệu chỉnh đặc tính thang
đo của cảm biến đảm bảo giới hạn sai số cho phép.
Chương 5 đánh giá kết quả đạt được và hướng nghiên cứu tiếp theo dựa
trên những kết quả của đề tài.
5
Chương 1
TỔNG QUAN CÁC PHƯƠNG PHÁP KHẮC ĐỘ CỦA DỤNG CỤ ĐO
VÀ CẢM BIẾN
1.1 Phương pháp khắc độ dụng cụ đo tương tự
Dụng cụ đo tương tự là loại dụng cụ đo mà số chỉ của nó là đại lượng
liên tục tỉ lệ với đại lượng đo liên tục. Trong dụng cụ đo tương tự người ta
thường dùng các chỉ thị cơ điện, trong đó tín hiệu vào là dòng điện còn tín
hiệu ra là góc quay của phần động (kim chỉ) hoặc là di chuyển của bút ghi
trên giấy (dụng cụ tự ghi).
Các cơ cấu chỉ thị này thường dùng trong máy đo các đại lượng như
dòng điện, điện áp, công suất, tần số, góc pha, điện trở.v.v . Những dụng cụ
này chính là dụng cụ đo chuyển đổi thẳng. Tức là thực hiện việc biến năng
lượng điện từ thành năng lượng cơ học làm quay phần động một góc α so với
phần tĩnh. Như vậy α = F(x), với x là đại lượng điện ( dòng hay áp hoặc là
tích của hai dòng điện)
Đối với chỉ thị cơ điện ta có phương trình đặc tính thang đo αα d
dw
D
e1= ,
trong đó D là mômen cản riêng và We là năng lượng điện từ trường. Từ
phương trình này ta sẽ biết được đặc tính của thang đo và tính chất của cơ cấu
chỉ thị. Do trong cơ cấu chỉ thị cơ điện tồn tại nhiều mômen như mômen ma
sát, mômen cản dịu, mômen động lượng nên để xác định dạng thang đo của
cơ cấu chỉ thị thường sử dụng phương pháp đồ thị. Bằng thực nghiệm ta xây
dựng các đường cong mômen quay Md = f(α) với các giá trị X khác nhau. Ví
dụ với cơ cấu chỉ thị điện từ ta xây dựng các đường cong mômen quay 1, 2, 3,
4 với các giá trị X tương ứng bằng 40, 60, 80 và 100% Xn (Xn- trị số dòng
điện định mức làm kim lệch toàn thang). Trong trường hợp ở đồ thị hình 1.1
Xn =In=50mA. Các đường cong mômen quay Mq cắt đường mômen cản Mc tại
các điểm A, B, C, D. Từ giao điểm A, B, C, D ta có các vị trí cân bằng α =
30°, 50°, 70°, 90° tương ứng với các giá trị X=20, 30, 40, 50 mA. Như vậy ta
có thang đo của cơ cấu chỉ thị điện từ theo đơn vị của đại lượng X đầu vào.
6
Tuỳ thuộc vào phương trình đặc tính thang đo mà thang đo có thể là
tuyến tính (ví dụ : cơ cấu chỉ thị từ điện) hoặc phi tuyến (ví dụ : cơ cấu chỉ thị
điện từ , điện động, tĩnh điện). Nếu thang đo phi tuyến ta thường để thang đo
đạt được tương đối đều.
Đối với cơ cấu chỉ thị từ điện ta có phương trình đặc tính thang đo là α=
BswI
D
1 = K.I [TL3]
Trong đó B- Độ từ cảm của nam châm vĩnh cửu
s- Diện tích khung dây
w- số vòng dây
α- góc lệch của khung dây so với vị trí ban đầu
Góc lệch α tỉ lệ thuận với dòng điện I nên đặc tính của thang đo đều.
Cơ cấu chỉ thị điện từ có phương trình đặc tính là α= 2
2
1 I
d
dL
D α [TL3].
Góc quay tỉ lệ với bình phương dòng điện do đó thang đo không đều. Ngoài
Mq
α 0° 30° 50° 70° 90°
X=40%Xn (I= 20 mA)
X=60%Xn (I= 30 mA)
X=80%Xn (I= 40 mA)
X=100%Xn (I= 50 mA)
4
3
2
1
0 20 30 40 50
Hình 1.1 : Xác định thang đo bằng phương pháp đồ thị
X(mA)
7
ra đặc tính thang đo lại còn phụ thuộc vào tỉ số αd
dL là một đại lượng phi
tuyến. Để cho đặc tính thang đo đều cần phải tính toán sao cho khi góc lệch α
thay đổi thì tỉ số αd
dL thay đổi theo quy luật tỉ lệ nghịch với dòng điện. Như
vậy đường cong tổng hợp sẽ là đường tuyến tính với một độ chính xác nhất
định.
Cơ cấu chỉ thị điện động có phương trình đặc tính thang đo đối với
trường hợp dòng một chiều I1 và I2 : α= 2112 IId
dM
α [TL3]. Trong trường hợp
dòng xoay chiều ta có α= 2112
cos II
Dd
dM ϕ
α . Như vậy góc lệch α phụ thuộc vào
tích I1I2 nên thang đo không đều. Có thể thay đổi vị trí của các cuộn dây để
thay đổi tỉ số αd
dM 12 theo hàm ngược với I1I2 nhằm đạt được thang đo đều
(thường từ 20%÷100% thang đo có thể chia đều còn 20% đầu thang đo chia
không đều)
Đối với Lôgômét điện động ta có phương trình đặc tính thang đo α=
⎟⎟⎠
⎞
⎜⎜⎝
⎛
),cos(
),cos(
22
11
III
IIIF [TL3]. Khi cos(I,I1)=cos(I,I2)=1 tức là dòng điện chạy qua
α
I, L
I2αd
dL Đặc tính thang đo ~ αd
dLI 2
Hình 1.2 : Đặc tính thang đo với αd
dL đã điều chỉnh
8
cuộn động và cuộn tĩnh đồng pha thì α = ⎟⎟⎠
⎞
⎜⎜⎝
⎛
2
1
I
IF . Như vậy góc lệch α tỉ lệ với
tỉ số hai dòng điện.
Cơ cấu chỉ thị sắt điện động có phương trình đặc tính thang đo :
α=k1s2 w2I1I2cos(I1,I2), góc lệch α tỉ lệ với tích hai dòng điện.
Đối với cơ cấu chỉ thị tĩnh điện ta có phương trình đặc tính thang đo α=
αd
dCU
2
2
[TL3]. Như vậy góc lệch α tỉ lệ với bình phương điện áp U. Đặc tính
thang đo không đều (bậc hai) và phụ thuộc vào tỉ số αd
dC là một đại lượng phi
tuyến. Trong thực tế để cho đặc tính thang đo đều cần phải tính toán sao cho
khi góc lệch α thay đổi thì tỉ số αd
dC thay đổi tỉ lệ nghịch với điện áp và đường
cong tổng hợp sẽ là đường tuyến tính với một độ chính xác nhất định. Giống
như trường hợp cơ cấu chỉ thị điện từ.
Đối với cơ cấu chỉ thị tự ghi đầu vào thường là dòng điện biến thiên theo
thời gian i(t) và đầu ra là đường quan hệ α(t). Đường ghi trên băng giấy là sự
phối hợp giữa hai chuyển động y=α=f(i) và x=Kt. Theo cách ghi có thể phân
loại cơ cấu tự ghi làm ba loại : loại thứ nhất là ghi các đường cong liên tục;
loại thứ hai là ghi các đường cong rời rạc; loại thứ ba là in số lên băng giấy.
Nhận xét : trong dụng cụ đo tương tự chỉ thị kim thì sai số phi tuyến
được đưa lên thang đo mà không nhất thiết phải tuyến tính hóa đặc tính phi
tuyến như dụng cụ đo số.
1.2 Phương pháp khắc độ dụng cụ đo có sử dụng vi xử lý hoặc máy
vi tính [TL3]
Việc sử dụng vi xử lý trong lĩnh vực đo lường mở ra những hướng phát
triển và mang lại nhiều ưu điểm cho dụng cụ đo và hệ thống thông tin đo
lường như :
9
- Có thể ghép nối thiết bị đo với bàn phím cho phép nhập thông tin bằng
bàn phím số hoặc đặt trước giá trị đo lường hay kiểm tra của một thông số nào
đó.
- Có thể ghép nối với màn hình để đọc kết quả và sai số
- Có thể gia công kết quả đo theo các thuật toán đã định sẵn và đưa ra
màn hình.
- Có thể nối với máy in để in kết quả đo hay tự động vẽ lại các đường
cong sau khi đã gia công kết quả bằng phép xây dựng đường cong thực
nghiệm.
- Thay đổi toạ độ bằng cách đưa thêm vào các hệ số nhân thích hợp.
- Tiến hành tính toán khi thực hiện phép đo gián tiếp hay hợp bộ hoặc đo
lường thống kê.
- Hiệu chỉnh được sai số của phép đo
- Bù các kết quả đo bị sai lệch do ảnh hưởng của sự biến động các thông
số như nhiệt độ, độ ẩm, tần số….
- Điều khiển các khâu của dụng cụ đo cho phù hợp với đại lượng đo ví
dụ : tự động chọn thang đo.
- Mã hoá các tín hiệu đo
- Ghép nối với kênh liên lạc để truyền số liệu đi xa.
- Có thể ghép nối với bộ nhớ để lưu giữ số liệu của kết quả đo hay các
giá trị tức thời của tín hiệu đo.
Ngoài ra dụng cụ đo có sử dụng vi xử lý hoặc máy vi tính còn có khả
năng tự động khắc độ. Quá trình tự động khắc độ như sau :
- Đầu tiên người ta đo các giá trị của tín hiệu chuẩn, ghi vào bộ nhớ, sau
đó đo các giá trị của đại lượng cần đo và bằng các công cụ toán học (dưới
dạng thuật toán) có thể so sánh, gia công kết quả đo và loại trừ các sai số.
10
Ví dụ : Trong một Vônmét thực hiện theo phương pháp này việc khắc độ
được thực hiện trước mỗi lần đo (ở chế độ đồng bộ trong). Việc bù sai số do
sự lệch không của bộ khuếch đại (sự trôi điểm không chẳng hạn) sẽ được thực
hiện bằng cách đo mức không (mức đất) của tín hiệu, sau đó bắt đầu đo điện
áp chuẩn cố định từ nguồn mẫu (ví dụ như pin mẫu).
Sử dụng vi xử lý hoặc máy vi tính có thể thay thế cho một loạt các thao
tác mà trong dụng cụ tương tự không thực hiện được ví dụ như : phép nhân,
phép tuyến tính hoá, điều khiển quá trình đo, điều khiển sự làm việc của các
thiết bị vào ra v.v...
1.3 Phương pháp khắc độ các chuyển đổi đo lường sơ cấp
1.3.1 Chuyển đổi đo lường so cấp
Chuyển đổi đo lường là thiết bị thực hiện một quan hệ hàm đơn trị giữa
hai đại lượng vật lý với một độ chính xác nhất định.
Như vậy chuyển đổi đo lường làm nhiệm vụ biến đổi từ đại lượng vật lý
này sang đại lượng vật lý khác. Mối quan hệ hàm có thể là tuyến tính hay phi
tuyến. Tuy nhiên trong kỹ thuật đo lường người ta cố gắng tạo ra các chuyển
đổi tuyến tính để nâng cao độ chính xác của phép đo.
Chuyển đổi đo lường sơ cấp là các chuyển đổi đo lường mà đại lượng
vào là đại lượng không điện và đại lượng ra của nó là đại lượng điện.
Phương trình đặc tính của chuyển đổi Y=f(X)
Trong đó X-là đại lượng không điện cần đo
Y-đại lượng điện sau chuyển đổi
Hàm đặc tính của chuyển đổi là một hàm đồng biến hoặc nghịch biến.
Khi chuyển đổi sơ cấp được đặt trong một vỏ hộp có kích thước và hình
dáng phù hợp với vị trí điểm đo hoặc có khi tích hợp với mạch đo để tạo
thành một dụng cụ được gọi là đầu đo, bộ cảm biến hoặc là sensor.
Để có được đặc tính của chuyển đổi sơ cấp người ta thường làm thực
nghiệm để tìm ra mối quan hệ giữa X và Y. Mối quan hệ này thường là phi
11
tuyến, nhưng để nâng cao độ chính xác của thiết bị đo người ta tìm cách tuyến
tính hoá nó bằng các mạch điện tử hay dùng các thuật toán khi gia công số
liệu đo bằng máy tính hoặc vi xử lý.
Trong thực tế tín hiệu ra Y của chuyển đổi không những phụ thuộc vào
X mà còn phụ thuộc vào điều kiện bên ngoài Z : Y=f(X,Z)
Đặc tính của chuyển đổi phải là hàm đơn trị, nghĩa là với đường cong hồi
phục của chuyển đổi ứng với một giá trị X ta chỉ nhận được một giá trị Y.
Đường cong của chuyển đổi phải ổn định, nghĩa là không thay đổi theo thời
gian. Và tín hiệu ra của chuyển đổi phải tiện cho việc ghép nối vào dụng cụ
đo, hệ thống đo và máy tính.
Đặc tính của chuyển đổi có thể là hàm tuyến tính hoặc phi tuyến, chẳng
hạn như hàm lôga-rít, hàm đa thức, hàm mũ.
Đặc tính tuyến tính được mô tả bởi biểu thức :Y=a+bx
Đặc tính lôga-rít : Y=a+b.lnx
Đặc tính hàm mũ : Y=a.ekx
Đặc tính hàm đa thức : Y=ao + a1.x + a2x2 +...+ anxn
Đặc tính quan trọng của chuyển đổi là sai số.
- Sai số cơ bản của chuyển đổi là sai số gây ra do nguyên lý của chuyển
đổi, sự không hoàn thiện của cấu trúc, sự yếu kém của công nghệ chế tạo.
- Sai số phụ là sai số gây ra do biến động của điều kiện bên ngoài khác
với điều kiện tiêu chuẩn.
Sai số tương đối quy đổi: %100max
N
n X
XΔ=γ , với XN là giá trị cực đại của
thang đo, cần phải nhỏ hơn hoặc bằng cấp chính xác. Sai số tuyệt đối được
tính bằng hiệu của giá trị đo được với giá trị thực. Ví dụ một sensor đo
khoảng cách tuyến tính lý tưởng sẽ tạo ra 1 mV trên 1mm dịch chuyển. Tuy
nhiên trong thực tế một dịch chuyển 10 mm tạo ra 10.5 mV, từ 10.5 mV tính
ngược lại (1mm trên 1 mV) ta được 10.5 mm, lớn hơn 0.5 mm so với thực tế.
12
0.5mm này là sai số tuyệt đối và do đó trong khoảng 10 mm sai số tương đối
quy đổi của sensor là 0.5mm/10 mm x 100% =5%.
Để cảm biến đạt cấp chính xác nhất định thì đường cong đặc tính thực tế
phải nằm trong hai đường giới hạn sai số cho phép như biểu diễn trên hình 1.3
và hình 1.4 .
Các đường giới hạn sai số cho phép lệch với đường đặc tính lý tưởng
một khoảng Δ± và đường cong thực tế lệch với đường đặc tính lý tưởng một
khoảng δ± , trong đó Δ≤δ .
100% x
Y
100%
y
y’
z
z’
x x’ -δ
+Δ
-Δ
Đường đặc tính
thực tế
Đường đặc tính
lý tưởng
Đường giới hạn
YFS
Hình 1.3 : Đường cong đặc tính của cảm biến
Δ−
Δ+
-δ
Đường giới hạn phải
Đường giới hạn trái Đường hiệu chuẩn
Đường đặc tính thực tế
Hình 1.4 : Đường giới hạn độ chính xác
x
Y
13
Có nhiều phương pháp để tuyến tính hoá đường đặc tính của cảm biến.
Đối với đặc tính có thể tuyến tính bằng một đường thẳng người ta thường
dùng các phương pháp sau :
+ Phương pháp dùng điểm đầu và điểm cuối của đường đặc tính :
Ta xác định các giá trị đầu ra của cảm biến tại giá trị nhỏ nhất và lớn
nhất của đầu vào và vẽ đường thẳng qua hai điểm này (đường 1 trên hình 1.5).
Gần các điểm đầu và điểm cuối thì sai số nhỏ và sai số lớn nhất rơi vào
khoảng giữa của đường đặc tính.
+ Phương pháp xấp xỉ bình phương cực tiểu :
Đo vài giá trị đầu ra Y (n giá trị) tương ứng với các giá trị đầu vào x
trong toàn thang đo. Sử dụng công thức sau để xác định các giá trị a và b của
đường thẳng Y=a+b.x (đường 2 trên hình 1.5)
( )22
2
∑∑
∑ ∑∑∑
−
−=
xxn
xYxxY
a
( )22 ∑∑
∑∑∑
−
−=
xxn
YxxYn
b
Trong đó ∑ là tổng của n số hạng.
Trong một vài ứng dụng thì độ chính xác cao nhất cần phải đạt được ở
trong một khoảng nhỏ nhất định. Ví dụ nhiệt kế y tế phải có độ chính xác cao
Điểm đầu và điểm
cuối
L2
L1
100% x
Y
100%
0
Hình1.5 : Đường thẳng xấp xỉ đường cong phi tuyến
c
2
1 3
14
trong vùng nhiệt độ sốt của cơ thể từ 37 đến 38°C. Nó có thể kém chính xác ở
ngoài khoảng nhiệt độ đó. Cảm biến được hiệu chuẩn ở vùng yêu cầu độ
chính xác cao nhất . Do đó đường xấp xỉ có thể được vẽ qua điểm hiệu chuẩn
c (đường 3 trên hình 1.5). Sai số nhỏ ở gần điểm hiệu chuẩn và tăng lên về
phía hai đầu của thang đo. Trong phương pháp này thì đường thẳng thường
được xác định như là tiếp tuyến của đường đặc tính tại điểm hiệu chuẩn.
+ Phương pháp dùng đường thẳng độc lập : đường thẳng xấp xỉ độc lập
là đường thẳng nằm giữa hai đường song song sát nhau và bao toàn bộ các giá
trị đầu ra trên đường đặc tính thực tế như hình 1.6.
Đặc tính động của chuyển đổi là khi cho tín hiệu đo vào chuyển đổi
thường xuất hiện quá trình quá độ. Quá trình này có thể nhanh hay chậm tuỳ
thuộc vào dạng chuyển đổi. Đặc tính này được gọi là độ tác động nhanh. Độ
tác động nhanh hay chậm tức là thời gian trễ nhỏ hay lớn của đáp ứng tín hiệu
ra so với sự thay đổi của tín hiệu vào.
Phương trình cơ bản của cảm biến có dạng :
Y=f(x, a, b, c…)
Trong đó x là đại lượng đo hay còn gọi là đại lượng chủ, các đại lượng a,
b, c… được gọi là các yếu tố ảnh hưởng cần được loại bỏ. Yêu cầu của cảm
biến là tạo được đặc tính Y=f(x) và quan hệ này được lặp lại với một giá trị
Hình1.6 : Đường thẳng xấp xỉ độc lập
Đường thẳng xấp xỉ
-δ
100% x
Y
100%
0
+δ
c
15
chính xác để từ Y ta có thể suy ra được x với một sai số nhỏ hơn yêu cầu.
Trong cảm biến thông minh người ta phải sử dụng triệt để khả năng xử lý kết
quả đo của các bộ vi xử lý hay vi tính đơn phiến để nâng cao đặc tính kỹ thuật
của các cảm biến.
1.3.2 Ứng dụng vi xử lý trong xử lý số liệu đo của cảm biến [TL3]
+Xử lý khắc độ
Yêu cầu cơ bản nhất đối với chuyển đổi là tạo được đặc tính Y=f(x) với
Yi=KiXi. Động tác khắc độ hay chuẩn độ là xác định các Ki với sai số của nó
là max
i
i
K
KΔ ≤
iK
γ
Trong trường hợp cảm biến bị nhiều yếu tố ngẫu nhiên tác động thì Ki
được xác định bằng phương pháp thống kê.
m
K
K
m
j
ij
i
∑
== 1
iK này được vi xử lý lưu giữ làm hệ số biến đổi tại điểm Xi của cảm
biến và Xi=
i
i
K
Y , sai số tuyệt đối ngẫu nhiên của hệ số Ki được tính với giả
thiết phân bố xác suất của nó là phân bố Student.
*
iXsti
kK δ=Δ với xác suất P
iKΔ sai số tuyệt đối của Ki có tính ngẫu nhiên
kst - hệ số tra ở bảng Student
*
iX
δ =
)1(
)( 2
−
−
nn
Xx ii là độ lệch bình quân phương
Bộ hệ số Ki và iKΔ có thể được tính toán và ghi trong bộ nhớ của vi xử
lý.
16
+Xử lý tuyến tính hoá từng đoạn
Giá trị đo X tương ứng với giá trị Yx .Kiểm tra giá trị của Yx nằm trong
khoảng Yi<Yx<Yi+1 tương ứng với Xi<X<Xi+1
Thực hiện phép nội suy tuyến tính
X=Xi+ )(
1
1
ix
ii
ii YY
YY
XX −−
−
+
+
Ghi lại kết quả X cùng với Ki và
i
i
K K
K
i
Δ=γ
+Xử lý thống kê
Khi bản thân đối tượng đo biến đổi hoặc chịu tác động của nhiễu, gây ra
sai số ngẫu nhiên. Cảm biến thông minh có thể xử lý thống kê tức là đo với
tốc độ nhanh rồi tính giá trị trung bình, tính sai số thống kê của kết quả đo,
lưu giữ và truyền lên máy tính cấp trên.
Giá trị trung bình :
m
X
X
m
i
i∑
== 1
Sai số là : *Xstkx δ±=Δ
Kết quả đo sẽ nằm giữa XXXXX o Δ+<<Δ−
1.3.3 Cấu trúc của cảm biến thông minh
Đối
tượng
đo
CB1
CB2
CBn
CĐCH1
CĐCH2
CĐCHn
MUX A/D µC
Cảm biến thông minh
Hình 1.7:Cấu trúc Cảm biến thông minh
17
Cảm biến gồm những chuyển đổi sơ cấp dùng để biến đại lượng không
điện hoặc điện thành đại lượng điện. Các đại lượng này có thể là đại lượng
chủ hoặc là các đại lượng của yếu tố ảnh hưởng dùng để loại trừ sai số do ảnh
hưởng của chúng. Có thể có hai loại công nghệ :
+ Nếu các chuyển đổi là loại chuyển đổi sơ cấp bình thường thì các đầu
ra của chúng được đưa vào một vi mạch công nghệ lai, gồm bộ biến đổi chuẩn
hoá, MUX, A/D và vi xử lý trong một khối có truyền thông với máy tính và
bộ nạp chương trình cho EPROM.
+ Nếu các chuyển đổi là loại chuyển đổi thực hiện bằng công nghệ vi
mạch thì cả chuyển đổi lẫn phần tử gia công phía sau được mô-đun hoá trong
một khối công nghệ mạch lai.
Với sự phát triển mạnh mẽ của lĩnh vực mạng nơron nhân tạo, các giải
pháp nơron đã được ứng dụng vào nhiều lĩnh vực nhằm thông minh hoá thiết
bị như các hệ thống điều khiển, robot, các thiết bị gia dụng, phân loại sản
phẩn, các hệ thống nhận dạng, phân tích tài chính v.v... và ta có thể ứng dụng
mạng nơron trong lĩnh vực đo lường để thông minh hoá cảm biến. Tính chất
ưu việt của mạng nơron là xử lý song song cho khả năng dung lượng tính toán
lớn, tính toán cho đáp ứng thời gian thực đảm bảo độ chính xác cũng như tốc
độ đáp ứng của hệ thống đo có một hoặc nhiều cảm biến.
Tiếp theo ta sẽ xem xét một số khía cạnh thông minh hoá cảm biến.
1.4 Ứng dụng mạng nơron trong cảm biến thông minh
1.4.1 Khắc độ tự động cảm biến
Cảm biến cho ra giá trị đo X thông qua phương trình đặc tính : X=f(Y).
Phương trình này được xây dựng từ tập các giá trị lấy mẫu (Xi,Yi), i=1,..n,
trong đó n là số điểm lấy mẫu. Thông thường sử dụng phương pháp tuyến tính
hoá để xây dựng đường xấp xỉ đường cong đặc tính trong một giới hạn sai số
cho phép. Mạng nơron có khả năng xấp xỉ hàm một hoặc nhiều biến với độ
chính xác tuỳ ý, do đó ta có thể sử dụng mạng nơron để thực hiện xấp xỉ hàm
X=f(Y) trên cơ sở tập lấy mẫu đã có.
18
Y
X
0 Y1 Y2 Yn
X1
Xn
X2
Xi
Yi
19
Hình 1.8 : Đường cong đặc tính của cảm biến
Tập các giá trị lấy mẫu được đưa vào để huấn luyện mạng cho ra quan hệ
hàm X=f(Y) như sơ đồ sau :
Mạng nơron được cài vào vi xử lý để xử lý khắc độ tự động đặc tính của
cảm biến thông minh.
Hình 1.10 : Cảm biến thông minh sử dụng mạng nơron để khắc độ tự
động đường đặc tính
1.4.2 Hiệu chỉnh đặc tính thang đo của cảm biến
MNN
W
{Yi }
{Xi }
X=f(Y)
Chỉ thị
Hình 1.9 : Sơ đồ khắc độ tự động bằng mạng nơron
CĐCH CB A/D
VXL
MNN Hiển thị
số
Đối
tượng
đo x xđo y y
20
Các cảm biến trong quá trình chế tạo hoặc sau một thời gian sử dụng đều
mắc phải sai số hệ thống và sai số ngẫu nhiên, trong đó sai số hệ thống là sai
số của phép đo luôn không đổi hoặc thay đổi có quy luật khi đo nhiều lần một
đại lượng đo và sai số ngẫu nhiên là thành phần sai số của phép đo thay đổi
không theo một quy luật nào cả mà ngẫu nhiên khi lặp lại phép đo nhiều lần
một đại lượng duy nhất, có thể hình dung như hình 1.11.
Trong trường hợp chung sai số hệ thống là hàm của đại lượng đo, đại
lượng ảnh hưởng và thời gian. Khi là hàm của đại lượng đo (trong điều kiện
tiêu chuẩn), sai số hệ thống gồm hai thành phần : Sai số cấu trúc và sai số
công nghệ chế tạo. Sai số cấu trúc là sai số do bản thân nguyên lý cấu trúc
chuyển đổi gây nên, sai số công nghệ chế tạo là sai số gây ra bởi các sai sót
trong quá trình chế tạo.
Bằng việc ứng dụng mạng nơron ta có thể giảm sai số hệ thống và sai số
ngẫu nhiên của cảm biến để đạt sai số nằm trong giới hạn cho phép rất hiệu
quả. Trước tiên ta xét sai số hệ thống thể hiện qua đường cong đặc tính của
Giá trị thực
Hình 1.11: Mô hình sai số hệ thống và sai số ngẫu nhiên
Sai số hệ
thống
Sai số
ngẫu
nhiên
21
cảm biến. Giả sử đường cong đặc tính của cảm biến có sai số vượt quá sai số
cho phép, ta có thể biểu diễn như trên hình 1.12.
Như vậy δ>Δ , tức là sai số vượt quá giới hạn cho phép. Có thể dùng
phương pháp tuyến tính hoá hoặc phương pháp biến đổi hàm để hiệu chuẩn
lại đường đặc tính của cảm biến đạt sai số trong giới hạn cho phép.
Để tuyến tính hoá đặc tính thực tế của cảm biến ta cần lấy mẫu nhiều
điểm với tần số lấy mẫu được tính theo công thức :
M
e CF
T 1= . Trong đó C≥ 2
theo Shannon.
Để đảm bảo sai số của phép hồi phục đường cong ban đầu và sai số phép
rời rạc hoá cho trước, giá trị C phụ thuộc sai số hồi phục ε : ε
π
8
2=C [TL4].
Hoặc lấy mẫu theo định lý mới về lấy mẫu tín hiệu đo lường của PGS.TS
Phạm Thượng Hàn theo biểu thức : γ
π
3
2 maxffe = [TL1 ]
Phương pháp tuyến tính hoá từng đoạn đòi hỏi nhiều thao tác lấy mẫu và
thực hiện tuyến tính từng đoạn. Với tần số lấy mẫu lớn, số điểm lấy mẫu
nhiều thì việc tuyến tính hoá cần khối lượng tính toán lớn, thủ công và mất rất
nhiều thời gian, công sức.
Δ−
Δ+
Đường giới hạn phải
Đường giới hạn trái Đường hiệu chuẩn
Đường đặc tính thực tế
Hình 1.12 : Đường đặc tính với sai số vượt quá giới hạn cho
hé
x
Y
-δ
22
Giả sử phương trình đường đặc tính thực tế Y1=g(X) và đường cong hiệu
chuẩn (đường đặc tính lý thuyết) được biểu diễn bằng phương trình Y2=f(X).
Để hiệu chỉnh lại đường đặc tính lý thuyết dịch lại gần với đường đặc
tính thực tế nhằm đạt sai số cho phép ta dùng phương pháp biến đổi hàm :
Y1=f(g-1(Y2))= φ(Y2), trong đó g-1 là hàm ngược của g.
Hàm Y1= φ(Y2) có thể được xấp xỉ gần đúng với độ chính xác tuỳ ý sử
dụng mạng nơron, loại trừ được sai số do tuyến tính hoá đường cong thực tế.
Lý thuyết mạng nơron chỉ ra rằng có thể xấp xỉ một hàm phi tuyến bất kỳ với
độ chính xác tuỳ ý bằng mạng nơron với số nơron và số lớp ẩn thích hợp
[TL14], [TL18].
Tương tự ta cũng có thể hiệu chỉnh đường cong đặc tính lý thuyết theo
giá trị đo X. Hàm biến đổi có dạng X1=ϕ(X2) cũng có thể xấp xỉ chính xác
bằng mạng nơron.
Do các hàm Y1= φ(Y2) và X1=ϕ(X2) đều là hàm đơn trị, đồng biến hoặc
nghịch biến nên ta có thể sử dụng những mạng nơron khá đơn giản đủ để thoã
mãn yêu cầu bài toán đặt ra.
Đặc tính thực tế - (1)
Đường hiệu chuẩn (Đặc tính lý thuyết) – (2)
100% X
100% Y
0
X
Hình 1.13: Hiệu chỉnh đường đặc tính thực tế
Y1
Y2
23
Ta có một nhận xét quan trọng là phương pháp tuyến tính hoá đường
cong thực tế mắc phải một sai số hồi phục trong khi sử dụng mạng nơron có
thể xấp xỉ chính xác hàm chuyển đổi với độ chính xác tuỳ ý mà không phải
tuyến tính hoá đường cong thực tế, do đó sẽ giảm được sai số hệ thống và cho
độ chính xác cao hơn.
1.5 Đề xuất phương pháp sử dụng mạng nơron để giảm sai số ngẫu
nhiên và khắc độ bằng hàm nội suy Lagrange
Thông thường khi thực hiện phép đo ta cố định một giá trị chẳng hạn yk
và thu được các giá trị đo ngẫu nhiên phân bố xung quanh giá trị thực xk ,
k=1,..n ; n là số điểm lấy mẫu để xây dựng đường đặc tính của cảm biến
Ta giả thiết đã có các giá trị thực Xk và các giá trị đo ngẫu nhiên phân bố
theo luật phân phối chuẩn- luật Gauss đối với số lượng phép đo n≥20, và luật
phân phối Student đối với 2≤ n<20 [TL3].
Hình 1.14 : Xây dựng đường đặc tính của cảm biến
Theo lý thuyết thống kê giá trị đo thực Xk sẽ nằm trong khoảng :
kkkkk XXXXX Δ+<<Δ− . Như vậy giá trị trung bình kX sẽ lệch với giá trị
thực Xk một khoảng kkk XXX Δ≤− .
X
Yn 0 Y1 Y2 Yk Y
*
1X
*
2X
*
kX
*
nX
24
Từ tập các giá trị đo ngẫu nhiên ta sẽ sử dụng mạng nơron để tìm được
giá trị *kX sao cho kkkk XXXX −<<− ε* với ε nhỏ tuỳ ý cho trước. Khi
mạng nơron được huấn luyện để giá trị đầu ra của mạng *kX hội tụ về giá trị
thực Xk thì đó là kết quả ước lượng tốt hơn giá trị trung bình kX . Sau khi đã
có mạng nơron được huấn luyện để có đáp ứng gần với giá trị thực nhất thì
với một tập đầu vào số liệu đo ngẫu nhiên ta sẽ có giá trị đầu ra của mạng
*
kX . Các giá trị đầu ra *kX này có thể xem là giá trị thực để tiến hành thao tác
khắc độ cảm biến bằng phương pháp nội suy Lagrange. Việc sử dụng phương
pháp nội suy Lagrange có ưu điểm là hàm này sẽ đi qua tất cả những điểm lấy
mẫu và xấp xỉ hàm phi tuyến với độ chính xác cao.
25
Chương 2
CƠ SỞ LÝ THUYẾT MẠNG NƠRON
Mô phỏng sinh học, đặc biệt là mô phỏng các chức năng hoạt động của bộ
não người là mơ ước từ lâu của loài người. Não người được cấu tạo từ khoảng
1011 nơron, mỗi nơron trung bình nhận thông tin từ 104 nơron khác. Như vậy
có khoảng 1015 mối liên kết trong bộ não người. Với số lượng nơron và các
mối liên kết giữa chúng làm cho bộ não người có cấu trúc cực kỳ phức tạp.
Điều này cho phép bộ não người có khả năng tư duy, nghi nhớ những sự kiện
quá khứ, dự đoán, tổng quát hóa, nhận dạng, phân loại, điều khiển. Việc
nghiên cứu bộ não người theo khía cạnh giải phẫu học, tâm lý học, thần kinh
học để hiểu biết các nguyên tắc hoạt động của bộ não là rất cần thiết. Từ đó
cho phép chúng ta tạo ra được những hệ thống thông minh có thể giải quyết
nhiều vấn đề phức tạp trong đo lường, điều khiển tự động, hệ thống chuyên
gia, công nghệ robot.v.v...
2.1 Nơron sinh vật
2.1.1 Cấu trúc cơ bản của nơron
Nơron sinh học thu nhận, xử lý thông tin và kết nối với các bộ phận của cơ
thể.
Hình 2.1: Sơ đồ liên kết các nơron
Mỗi nơron nhận các tín hiệu đầu vào qua các khớp thần kinh và tạo ra một
tín hiệu ra truyền đến các nơron khác.
Khớp thần kinh
Dây thần
kinh vào
Các đầu vào
song song
Nơron
Dây thần kinh ra
Dây thần kinh ra
26
Hình 2.2: Cấu trúc một nơron sinh học
Mỗi nơron nhận nhiều tín hiệu đầu vào thông qua các khớp thần kinh và
tạo ra một tín hiệu đầu ra truyền dọc theo dây thần kinh ra.
Thân nơron (soma) có đường kính khoảng 30μm. Trong thân nơron là
nhân tế bào thần kinh. Mỗi tế bào thần kinh nhận nhiều đầu vào (khoảng 104)
qua các dây thần kinh vào (dendrite) và sau vài quá trình xử lý tạo ra một tín
hiệu đầu ra truyền dọc theo dây thần kinh ra (axon). Điểm nối giữa dây thần
kinh ra của nơron này với dây thần kinh vào của nơron khác được gọi là khớp
thần kinh (synapse). Dây thần kinh vào có độ dài khoảng 200-300μm. Thông
tin tạo ra bởi tế bào thần kinh được truyền dọc theo dây thần kinh ra. Dây thần
kinh ra có độ dài từ 50μm cho đến vài mét. Trung bình có 10.000 khớp thần
kinh nối với mỗi dây thần kinh ra. Nơron được bao quanh bởi dung dịch các
ion hóa học hòa tan, chủ yếu là Na+, Ca2+, K+ và Cl-. Các ion Na+ và K+ góp
phần quan trọng để tạo ra các đáp ứng của nơron, những đáp ứng này gọi là
điện thế hoạt động hay xung thần kinh. Ion K+ tập trung chủ yếu bên trong
nhân của nơron và Na+ được tập trung chủ yếu bên ngoài của màng tế bào
thần kinh. Ở trạng thái nghỉ thì điện thế nghỉ của nơron vào khoảng -70mV
được cung cấp bởi sự hoạt động của màng tế bào.
Các khớp thần kinh
Các đầu vào từ
nơron khác
Các dây thần
kinh vào
Hướng truyền
thông tin
Các nhánh đầu ra
Thân nơron
27
Hình 2.3: Cấu trúc hóa học của nơron
Hình 2.4: Cấu trúc đơn giản của khớp thần kinh
Hình 2.5: Xung thần kinh
Dung dịch Na+
Nhân nơron
K+ Màng tế bào
thần kinh
-70mV
Xung thần kinh
Khớp kích thích
Khớp ức chế
Điện thế kích thích
Điện thế ức chế
Dây thần kinh vào
Màng trước
khớp thần kinh
Thời gian hồi phục
Thời gian hoạt động
Thời gian tăng
Đỉnh xung Suy giảm điện
thế hoạt động
0 1 2
-70
+30
0
Điện thế màng (mV)
Điện thế nghỉ (mV)
t (ms)
t (ms) 0 1 2
Kích thích
28
2.1.2 Các tín hiệu điện của nơron
Trong nơron sinh học, dây thần kinh vào cung cấp các tín hiệu đầu vào cho
nơron. Chúng truyền và giữ nguyên dạng các tín hiệu vào thân nơron. Thân
nơron thực hiện các thao tác toán học trên các tín hiệu này và tạo ra điện thế
hoạt động truyền theo dây thần kinh ra. Điện thế hoạt động xuất hiện trên các
dây thần kinh ra như một chuỗi xung, gọi là xung thần kinh. Các điện thế hoạt
động được truyền không suy giảm trên dây thần kinh ra và các nhánh của nó
đến các tế bào đích như các nơron, cơ bắp, các tuyến... Quá trình tạo ra xung
thần kinh trong nơron hoặc truyền trên các dây thần kinh ra là do thay đổi sự
thẩm thấu của các ion K+ và Na+ trên màng tế bào thần kinh.
Khớp thần kinh đóng vai trò bộ biến đổi hóa học để truyền tín hiệu qua
ranh giới của khớp nối. Điện thế hoạt động dọc theo dây thần kinh ra của
nơron này được khớp thần kinh chuyển thành điện áp trên dây thần kinh vào
của nơron khác. Nơron được xem là hoạt động khi nó tạo ra chuỗi các điện
thế hoạt động. Khi xung thần kinh truyền tới khớp thần kinh giải phóng chất
trong khớp tạo ra đáp ứng điện. Đáp ứng điện này có thể là kích thích hoặc ức
chế được biểu trên hình 2.6.
Hình 2.6: Điện thế kích thích và ức chế của khớp thần kinh.
Bản chất của đáp ứng điện tùy thuộc vào kiểu của bộ biến đổi hóa học và
màng dây thần kinh vào. Các dây thần kinh đầu vào bắt nguồn từ các khớp
thần kinh kích thích có xung hướng tăng cường độ đốt nơron. Trong khi các
đầu vào từ các khớp ức chế có xu hướng giảm cường độ đốt nơron. Một nơron
nhận nhiều đầu vào kích thích và ức chế. Nếu các đầu vào kích thích càng
mạnh thì xung đầu ra càng lớn. Ngược lại, nếu các đầu vào ức chế chiếm ưu
thế thì đầu ra sẽ nhỏ hoặc bị triệt tiêu hoàn toàn. Độ lớn của tín hiệu trên dây
thần kinh vào tỉ lệ với tần số trung bình của các xung truyền tới khớp thần
29
kinh. Các khớp thần kinh thường nằm giữa dây thần kinh vào và dây thần
kinh ra. Nó cũng có thể xuất hiện giữa các dây thần kinh ra hoặc giữa các dây
thần kinh vào, thậm chí nằm giữa dây thần kinh ra và thân nơron. Một nơron
có khả năng mã hóa các tín hiệu kích thích thành tần số xung như hình 2.5.
Hai tính chất quan trọng của các điện thế hoạt động có liên hệ trực tiếp với
khả năng mã hóa tần số của nơron. Tính chất thứ nhất là thời gian tăng, nó
được xác định bằng thời gian bắt đầu kích thích đến khi điện thế hoạt động
đạt cực đại. Thời gian tăng này giảm theo hàm mũ khi tăng cường độ kích
thích. Tính chất thứ hai gọi là thời gian hồi phục, là thời gian ngắn nhất cần
thiết để tạo hai điện thế hoạt động thành công trên dây thần kinh ra như hình
2.5. Nói cách khác là thời gian ngắn nhất giữa hai điện thế hoạt động. Ngưỡng
của kích thích thứ hai tùy thuộc vào thời gian hồi phục. Có một vùng thời
gian chết gọi là thời gian hồi phục tuyệt đối. Trong khoảng thời gian này,
nơron không thể tạo ra một xung thần kinh khác. Sau thời gian hồi phục tuyệt
đối thì cường độ ngưỡng kích thích của xung thứ hai giảm theo hàm mũ khi
tăng thời gian hồi phục.
Do đó, nếu cung cấp kích thích với ngưỡng không đổi thì thời gian tăng và
thời gian hồi phục sẽ điều khiển tần số của các xung đầu ra. Chẳng hạn, kích
thích với cường độ cao sẽ thu được thời gian hồi phục nhỏ và thời gian tăng
ngắn, do đó tạo ra điện thế hoạt động có tần số cao.
2.2 Mô hình nơron nhân tạo
Từ những nghiên cứu về nơron sinh vật ta có thể xây dựng mô hình
nơron nhân tạo như hình 2.7.
W1
W2
Wn
x1
x2
xn
b
∑ g(.) y(t) u(t)
Hình 2.7: Mô hình một nơron nhân tạo
30
Mô hình một nơron nhân tạo ở trên bao gồm bộ tổng các liên kết đầu
vào và phần phi tuyến g(.).
+ Bộ tổng liên kết:
Phương trình mô tả của bộ tổng liên kết:
u(t)= )(W
1
k tx
n
k
k∑
=
+b
Trong đó:
u(t): Tổng tất cả các đầu vào mô tả thế năng tác động ở thân nơron
xk(t) : Các đầu vào ngoài, mô tả tín hiệu vào từ các khớp nơron ngoài tới
nơron hiện tại, n là số đầu vào, k=1..n
y(t) : Đầu ra nơron
Wk : trọng số liên kết các đầu vào ngoài
b: Ngưỡng, xác định ngưỡng kích thích hay ức chế
+ Phần phi tuyến:
Quan hệ phi tuyến y(t)=g(u(t)) cho đầu ra y(t) với đầu vào u(t). Có nhiều
hàm phi tuyến có thể sử dụng trong mạng nơron nhân tạo. Các hàm phi tuyến
thông thường được mô phỏng theo các hàm ánh xạ của nơron sinh vật. Tuy
nhiên có một số dạng hàm mũ, lôgarít được sử dụng nhưng cơ sở sinh vật của
các hàm này chưa được giải quyết.
Bảng 2.1:Một số hàm phi tuyến thường dùng trong các mô hình nơron
Tên hàm Công thức Đặc tính
Hàm bước nhảy đơn
vị (hard limit) g(u)=
1 nếu u≥ 0
0 nếu u< 0
Hàm bước nhảy
lưỡng cực
g(u)=
1 nếu u≥ 0
-1 nếu u< 0
u
g
-1
1
0
g
u
1
0
31
Hàm tuyến tính g(u)=u
Hàm tuyến tính bão
hòa g(u)=
1 nếu u>1
u nếu 0≤u≤1
0 nếu 0<u
Hàm tuyến tính bão
hòa đối xứng g(u)=
1 nếu u>1
u nếu -1≤u≤1
-1 nếu 0<u
Hàm tuyến tính
dương g(u)=
u nếu u ≥0
0 nếu u <0
Hàm sigmoid đơn
cực ue
ug λ−+= 1
1)(
1
0
0.5
u
Hàm sigmoid lưỡng
cực
1
1
2)( −+= − ueug λ
1
-1
0 u
Hàm cạnh tranh g(u)=
1 nơron gần tâm nhất
0 nơron khác
2.3 Mạng nơron nhân tạo
2.3.1 Cấu trúc mạng nơron
Mạng nơron hai lớp: Mạng nơron hai lớp gồm một lớp đầu vào và một
lớp đầu ra riêng biệt.
Mạng nơron nhiều lớp: Mạng nơron nhiều lớp gồm một lớp đầu vào và
một lớp đầu ra riêng biệt. Các lớp nằm giữa lớp đầu vào và lớp đầu ra gọi là
các lớp ẩn (Hidden layers).
Mạng nơron truyền thẳng: Mạng nơron truyền thẳng là mạng hai hay
nhiều lớp mà tín hiệu truyền theo một hướng từ đầu vào đến đầu ra.
u
g
0
u
1
1 0
g
-1
1
1
-1
u
u
g
0
32
Mạng nơron phản hồi: Mạng nơron phản hồi là mạng mà trong đó một
hoặc nhiều đầu ra của các phần tử lớp sau truyền tín hiệu ngược lại tới đầu
vào của lớp trước.
2.3.2 Phân loại mạng nơron
Có nhiều cách để phân loại mạng nơron.
- Dựa vào số lớp có trong mạng nơron ta có thể phân loại thành : mạng
nơron một lớp; mạng nơron nhiều lớp.
- Dựa vào đường truyền tín hiệu trong mạng nơron ta phân loại thành:
Mạng nơron truyền thẳng; mạng nơron phản hồi; mạng nơron tự tổ chức.
Một kiểu phân loại điển hình được biểu diễn như hình 2.8.
2.3.3 Một số mạng nơron nhân tạo
2.3.3.1 Mạng nơron truyền thẳng
+ Mạng truyền thẳng một lớp
Mạng nơron truyền thẳng một lớp là mạng mà các nơron tạo thành một
lớp và tín hiệu truyền theo một hướng từ đầu vào đến đầu ra.
Hình2.8: Phân loại mạng nơron nhân tạo
Truyền thẳng Phản hồi Tự tổ chức
Một lớp Nhiều lớp
BackPropa
gation
Percept
ron
Adaline
Brain
State-
in Box
Hop-
field
Máy
Boltz-
Man BAM
Mc
Culloch
Pitts
Cohen
Grossberg
RBF
Ánh xạ
đặc trưng
ART
Mạng nơron nhân tạo
33
34
Trường hợp H(s)=1, ta có phương trình mô tả mạng:
ui(t)= i
m
k
kik btpw +∑
=1
)(
yi(t)=g(ui(t))
Trong đó ui(t) là tổng tất cả các đầu vào thứ i, i=1,..n.
pk(t) : đầu vào ngoài thứ k, k=1,...m, tại thời điểm t.
wik : trọng liên kết từ đầu vào thứ k đến nơron thứ i.
yi(t) : đầu ra của nơron thứ i.
bi : ngưỡng của nơron thứ i.
n : số phần tử nơron.
m : số tín hiệu đầu vào.
Có thể mô tả bằng phương trình dạng ma trận như sau:
U(t)= W.P(t)+B
Y(t)=g(U(t))
Trong đó:
g(.) u1(t) y1
b1
p1 w11 ∑
g(.) u2(t) y2
b2
p2 w22 ∑
g(.) un(t) yn
bn
pm wnm ∑
Hình 2.9: Mô hình mạng nơron truyền thẳng một lớp
35
P(t)= [p1(t), p2(t),... pm(t) ]T
U(t)= [u1(t), u2(t),...un(t) ]T
Y(t)= [y1(t), y2(t),.... ym(t) ]T
W= [wik]
B=[b1, b2,...bn]T
+ Mạng nơron truyền thẳng nhiều lớp
Mạng nơron truyền thẳng hai lớp gồm lớp sigmoid và lớp tuyến tính có
thể xấp xỉ hầu hết các hàm tùy ý, mạng một lớp không làm được điều này.
Hình 2.10: Mạng nơron truyền thẳng nhiều lớp
Phương trình mô tả mạng :
)()(
1
1
1 q
i
n
j
q
j
q
ij
q
i
q
i
q
i
q
i bywgugy
q
+== ∑
−
=
−
Trong đó :
q
iy : đầu ra của nơron thứ i ở lớp thứ q, i=1...
qn , q=1,...Q
qn : số nơron ở lớp thứ q.
Q: Số lớp nơron của mạng.
Lớp ẩn
g1
g1
g1
gq
gq
gq
gQ
gQ
gQ
∑
∑
∑
∑
∑
∑
∑
∑
∑
p1
p2
pm
Qy1
Qy2
Q
nQy
qy1
qy2
q
n q
y
1
1y
1
2y
1
1n
y
Lớp vào Lớp ra
1
1b
1
1n
b
qb1
q
n q
b Q
nQ
b
Qb1
36
q
ib : ngưỡng của nơron thứ i ở lớp thứ q.
q
ijw : trọng liên kết giữa đầu ra thứ j của lớp thứ q-1 đến nơron thứ i của
lớp thứ q, j=1... 1−qn
Đầu vào mạng y0=p.
Đầu ra mạng y=yQ
Hàm năng lượng của mạng có thể tính theo biểu thức:
2
1
)(
2
1)( Qi
n
i
i ydwE
Q
−= ∑
=
Trong đó di là đầu ra mong muốn của nơron thứ i ở lớp ra.
Hầu hết các mạng nơron thực tế chỉ có 2 hoặc 3 lớp, rất hiếm mạng có từ
4 lớp trở lên. Các đặc điểm của tín hiệu đầu ra sẽ quyết định hàm truyền của
mạng ở lớp ra.
+ Một số mạng nơron truyền thẳng
- Mạng Perceptron (PE)
Trong đó :
m: số đầu vào
n: Số nơron
∑
∑
∑
p1
p2
pm
1y
2y
ny
1b
2b
nb
W
∑
b 1
n x 1
n x m
p
m x1
m
y
n x1 n x1
u
y=hardlim(Wp+b)
Hard limit Layer Input
Hình 2.11: Mạng perceptron một lớp với hàm truyền hardlimit
37
Ma trận trọng số:
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
=
nmnn www ....
..............
w...ww
w...ww
W
21
2m2221
1m1211
Ma trận đầu vào p= [p1,p2,....pm ]T
b= [b1, b2,....bn ]T
Phương trình tác động :
)()(
1
)( sgn ki
k
j
m
j
ij
k
i dpWy =⎟⎟⎠
⎞
⎜⎜⎝
⎛
= ∑
=
Trong đó )(kid là đầu ra mong muốn của nơron thứ i ở bước lặp thứ k.
Mạng sử dụng luật học Perceptron:
Wnew = Wold+e.pT
bnew = bold +e
Trong đó e =d-y là sai số Perceptron.
Mạng Perceptron thích hợp cho bài toán nhận dạng và phân loại mẫu.
-Mạng Adaline
Năm 1960, Windrow và Marcian Hoff đã giới thiệu mạng Adaline và
một luật học gọi là LMS (Least Mean Square).
Mạng Adaline tương tự như perceptron ngoại trừ hàm truyền là hàm
tuyến tính thay cho hardlimit. Cả Adaline và Perceptron đều có cùng hạn chế:
chúng chỉ có thể giải quyết được bài toán phân lớp tuyến tính (khả tách tuyến
tính). Tuy vậy thuật học LMS mạnh hơn luật học perceptron. Luật học
perceptron được đảm bảo hội tụ đến một lời giải cho phép phân nhóm đúng
đắn các mẫu huấn luyện, mạng thu được có thể nhạy với nhiễu vì các mẫu
thường nằm ở gần các biên quyết định. Thuật học LMS cực tiểu hóa sai số
bình phương trung bình do đó cố gắng dịch chuyển các biên quyết định ra xa
các mẫu huấn luyện nhất có thể tránh được ảnh hưởng của nhiễu.
38
Thuật học LMS có nhiều ý nghĩa sử dụng thực tế hơn luật học
perceptron, điều này đặc biệt đúng trong lĩnh vực xử lý tín hiệu số. Chẳng
hạn, các hệ thống điện thoại đường dài có thể sử dụng các mạng Adaline để
khử nhiễu lặp. Mạng Adaline cũng được ứng dụng để lọc thích nghi.
Trong đó :
m: số đầu vào
n: số nơron
Ma trận trọng số:
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
=
nmnn www ....
..............
w...ww
w...ww
W
21
2m2221
1m1211
Ma trận đầu vào p= [p1,p2,....pm ]T
b= [b1, b2,....bn ]T
Phương trình tác động
)()(
1
)( k
i
k
j
m
j
ij
k
i dpWy == ∑
=
Thuật toán sai số bình phương nhỏ nhất hay còn gọi là luật học delta
hoặc thuật học Windrow-Hoff.
∑
∑
∑
p1
p2
pm
1y
2y
ny
1b
2b
nb
W
∑
b 1
n x 1
n x m
p
m x1
m
y
n x1 n x1
u
y=pureline(Wp +b)
Lớp nơron tuyến tính Đầu vào
Hình 2.12: Mạng Adaline
39
Tại bước lặp thứ k+1 ta có:
)().(.2)()1( kpkekWkW Tα+=+
)(.)()1( keekbkb α+=+
Trong đó:
)().()()()()( kpkWkdkykdke −=−=
và α là hệ số học
- Mạng nơron truyền thẳng nhiều lớp sử dụng thuật học lan truyền
ngược
Mạng lan truyền ngược thường có một hoặc nhiều lớp ẩn với các nơron
dạng sigmoid và lớp ra là các nơron với hàm truyền tuyến tính. Mạng nhiều
lớp sử dụng thuật học lan truyền ngược đang được sử dụng rộng rãi nhất trong
lĩnh vực nơron.
Luật học lan truyền ngược được phát triển từ luật học delta. Cũng như
luật học delta, luật học lan truyền ngược (BP) là xấp xỉ của thuật toán giảm
dốc nhất, trong đó hàm chất lượng là sai số bình phương trung bình. Sự khác
nhau giữa luật học delta và luật học lan truyền ngược chỉ là cách thức lấy đạo
hàm.
W1
∑
b1 1
n1x 1
n1xm
p
m x1
m
y1
n1x1
n1x1
u1
y1=tansig(W1p +b1)
Lớp nơron Sigmoid Đầu vào
W2
∑
b2
n2x1
n2x1 n2x1
u2
y2=pureline(W2y1 +b2)
Lớp nơron tuyến tính
1
y2n2xn1
Hình 2.13: Ví dụ mạng hai lớp sử dụng thuật học BP
40
Đối với mạng đa lớp ta có phương trình )( 1111 ++++ += qqqqq byWgy với
q=0,1,..Q-1. Trong đó Q là số lớp của mạng. Các nơron ở lớp đầu tiên nhận
đầu vào từ ngoài: y0=p làm điểm khởi đầu. Các đầu ra của các nơron trong lớp
cuối cùng được xem là đầu ra của mạng y=yQ.
Mạng được cung cấp các tập mẫu học: {p1,d1},{p2,d2},...{pk,dk}, trong đó
pi là một đầu vào mạng và di là đầu ra đích tương ứng. Khi mỗi đầu vào được
áp lên mạng, luật học sẽ điều chỉnh các tham biến mạng để cực tiểu hóa sai số
bình phương trung bình:
))()(.())()(()().()( kykdkykdkekexF TT −−==∧ với x là véc tơ chứa các trọng
số và ngưỡng của mạng: x= ⎥⎦
⎤⎢⎣
⎡
b
W'
Thuật toán giảm dốc nhất cho xấp xỉ sai số bình phương trung bình là:
q
ij
q
ij
q
ij
ˆ
)()1(
w
Fkwkw
∂
∂−=+ α
q
i
q
i
q
i
ˆ
)()1(
b
Fkbkb
∂
∂−=+ α
Trong đó α là hệ số học.
Với định nghĩa q
i
ˆ
u
Fsqi ∂
∂= là độ nhạy của Fˆ theo thay đổi của net input tại
lớp q.
Thuật toán xấp xỉ giảm dốc nhất trở thành :
1q
ij
q
ij )()1(
−−=+ qjqi yskwkw α
q
iskbkb α−=+ )()1( qiqi
Và dạng ma trận:
Tqqqq yskWkW )(.)()1( 1−−=+ α
41
qqq skbkb .)()1( α−=+
Trong đó:
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢
⎣
⎡
∂
∂
∂
∂
=∂
∂=
q
n
q
q
q
qu
F
.
u
F
u
F
ˆ
.
ˆ
ˆ
1
s
Ký hiệu
⎥⎥
⎥⎥
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢⎢
⎢⎢
⎢
⎣
⎡
=
)('...00
..
..
..
0...)('0
0...0)('
)('
2
1
q
n
q
qq
qq
qq
quf
uf
uf
uF
Ta có: ( ) 11)(' ++= qTqqqq sWuFs
))(('2 yduFs QQQ −−=
Ta sẽ truyền lùi các độ nhạy thông qua mạng từ lớp cuối cùng cho đến
lớp đầu tiên.
sQ sQ-1 ..... s2 s1
Tóm lại giải thuật BP được mô tả như sau:
• Bước truyền thẳng: truyền đầu vào xuôi theo mạng:
y0 = p
)( 1111 ++++ += qqqqq byWgy với q=0,1,...,Q-1.
y = yQ
• Bước truyền lùi: truyền lùi các độ nhạy:
))(('2 yduFs QQQ −−= ;
42
( ) 11)(' ++= qTqqqq sWuFs với q = Q-1,...,2,1.
• Các trọng số và ngưỡng được cập nhật theo luật xấp xỉ giảm dốc
nhất:
Tqqqq yskWkW )(.)()1( 1−−=+ α
qqq skbkb .)()1( α−=+
Tuy nhiên thuật toán BP cơ bản ở trên vẫn còn quá chậm cho các ứng
dụng. Việc nghiên cứu các thuật toán nhanh hơn được chia thành hai nhóm.
Nhóm thứ nhất phát triển các kỹ thuật mang tính kinh nghiệm (heuristic), nay
sinh khi nghiên cứu về chất lượng đặc trưng của thuật toán BP. Các kỹ thuật
heuristic này đưa ra các ý tưởng như hệ số học biến đổi, sử dụng momentum
và các biến co giãn. Nhóm thứ hai phát triển theo hướng kỹ thuật tối ưu hóa
số. Một số kỹ thuật về tối ưu hóa số đã áp dụng thành công cho mạng nơron
nhiều lớp là : thuật toán gradient liên hợp và thuật toán Levenberg-Marquardt
(LM- một phiên bản khác của phương pháp Newton)... [TL5]
2.3.3.2 Mạng nơron phản hồi
Mạng nơron phản hồi có một số đầu ra kết nối đến các đầu vào của
mạng.
Hình 2.14: Mạng nơron phản hồi một lớp
Trong trường hợp tổng quát, mô hình mạng nơron phản hồi được mô tả
bằng hàm:
U(t)=F(Y(t), P(t), b)
p1
p2
pm
y1
y2
yn
b1
b2
bn
43
Y(t)=G(U(t))
Trong đó: U(t) là trạng thái
P(t) là các đầu vào ngoài
b là tham số ngưỡng
F(.) là hàm mô tả cấu trúc
G(.) là hàm mô tả quan hệ giữa biến trạng thái và đầu ra
Ta xét một số mạng nơron phản hồi sau:
+ Mạng Hopfield liên tục
Mô hình Hopfield thể hiện
ở dạng mạch điện. Mỗi nơron thể
hiện bằng một khuếch đại và các
điện trở/tụ điện. Có 2 tập đầu
vào nơron. Tập thứ nhất thể hiện
bởi các dòng điện I1,I2,... là các
đầu vào từ bên ngoài không đổi.
Tập còn lại là gồm các kết nối
phản hồi từ các khuếch đại thao
tác khác.
Phương trình thao tác cho mô hình Hopfield, sử dụng định luật
Kirchoff là:
∑
=
+−=
S
j
i
i
i
jji
i I
R
tntaT
t
tdnC
1
,
)()()(
Trong đó ni là điện áp đầu vào của bộ khuếch đại thứ i, ai là điện áp đầu
ra của bộ khuếch đại thứ i, C là điện dung đầu vào và Ii là cường độ dòng điện
đầu vào và cố định cho bộ khuếch đại thứ i.
Và ( )∑
=
− ==+ρ==
S
j
iiii
jiiji
ji nfaafnRRR
T
1
1
,,
, )(hay )(,
111,1 .
Giả thiết là mạch điện là đối xứng do đó Ti,j = Tj,i.
Hình 2.15: Mô hình Hopfield
ρ ρ ρ
44
Ta biến đổi phương trình thao tác thành dạng:
∑
=
++−=ε
S
j
ijjii
i btawtn
dt
tdn
1
, )()(
)(
hay ở dạng véctơ :
btWatn
dt
tdn ++−= )()()(ε
và ))(()( tnfta =
Kết quả ta có mạng Hopfield cho ở hình 2.16
Hopfield đã chọn hàm Lyapunov hay hàm năng lượng (áp dụng trong
định lý bất biến LaShalle) sau:
∑ ∫
=
− −
⎪⎭
⎪⎬
⎫
⎪⎩
⎪⎨
⎧
+−=
s
i
T
a
T abduufWaaaV
i
1 0
1 )(
2
1)(
và chứng minh được )(aV
dt
d ≤ 0
nghĩa là )(aV
dt
d là bán xác định âm và V chính là một hàm Lyapunov.
Áp dụng định lý bất biến LaShalle cho phép xác định các điểm cân bằng
của mạng Hopfield. Đầu tiên ta xác định tập Z:
Hình 2.16: Mạng Hopfield
n(0)=f-1(p), (a(0)=p), εdn/dt = -n+Wf(n)+b
1/ε
Đầu vào Lớp phản hồi
45
Z = {a: , Ga0,
dt
dV(a) ∈= G là bao đóng của G }
Tập này chứa tất cả các điểm mà tại đó đạo hàm của hàm Lyapunov bằng
0. Đạo hàm của hàm Lyapunov bằng 0 một khi các đạo hàm của đầu ra của
nơron bằng 0: 0=
dt
da
Hệ này tồn tại nhiều điểm cân bằng ứng với mức năng lượng cực tiểu
trên một siêu phẳng năng lượng của siêu diện n chiều.
Mạng Hopfield không có luật huấn luyện và không được huấn luyện hay tự
học. Mạng có khả năng dùng làm bộ nhớ các mẫu lệnh để sau đó gọi lại.Mạng
cũng có thể dùng trong hệ nhận dạng các tham số, làm các suy diễn mờ trong
điều khiển thông minh, mở ra những lớp bài toán cho nhiều lĩnh vực khác
nhau.
+ Mạng BAM (Bidirection Associative Memory)
Mạng BAM là cải tiến của các mạng Hopfield do Kosko đề xuất năm
1988 với đầu ra truyền ngược trở về bằng một nơron. Thực chất có thể xem sự
phản hồi đó như lớp mạng thứ hai.
Phương trình tác động: y’=g(Wx) hoặc y’i = g )(
1
'∑
=
m
j
jij xw ; i=1,2..,n
x’=g(WTy’) hoặc )( '
1
'
i
n
i
jii xwgx ∑
=
= ; j=1,2...m
Qúa trình gọi lại:
y(1) =g(Wx(0))
x(2) = g(WTy(1))
y(3) =g(Wx(2))
x(4) = g(WTy(3))
.
.
Hình 2.17: Mạng BAM
x1 x2 xm
y1 y2 ym
46
y(k-1) =g(Wx(k-2))
x(k) = g(WTy(k-1))
Ta có hàm năng lượng
E(x,y)= wxywxyywx TTTT −=−
2
1
2
1
Chỉnh trọng trên cơ sở luật Hebb:
⎪⎪⎩
⎪⎪⎨
⎧
−−
=
∑
∑
=
=
p
k
Tkk
p
k
Tkk
xy
xy
W
1
1
)12)(12(
)(
hoặc
⎪⎪⎩
⎪⎪⎨
⎧
−−
=
∑
∑
=
=
p
k
k
j
k
i
p
k
k
j
k
i
ij
xy
xy
w
1
1
)12)(12(
Mạng BAM nhớ tập trọng liên kết x-y, với đầu vào x mạng cho đầu ra y
tương ứng và ngược lại.
+ Mạng RBF(Radial Basis Function Networks)
Mạng RBF đã được đề xuất bởi một số tác giả như Moody và Darken
1989; Renals và Rohwer 1989... Kiến trúc chung của mạng RBF như ở hình
2.18.
cho vectơ lưỡng cực
cho vectơ không lưỡng cực
x1
x2
xm
y1
y2
yn
.
.
.
.
.
Hình 2.18: Mạng RBF
cho vectơ lưỡng cực
cho vectơ không lưỡng cực
47
Với lớp ẩn chứa các hàm RBF. Hàm RBF là hàm đối xứng hình chuông
chẳng hạn như hàm Gauss.
Hàm gauss: f(x) = exp[-(x - M)2/2σ2 ]
Trong đó M và σ là giá trị trung bình và phương sai của biến x.
Mạng RBF Gauss có thể áp dụng luật học không giám sát của Kohonen
mở rộng.
Phương trình tác động:
[ ][ ]∑ −− −−=
k
kk
qq
q
mx
mx
z 22
22
2/)(exp
2/)(exp
σ
σ
yi=gi( )
1
∑
=
+
n
q
iqiq bzw với i=1,...n
Trong đó
mq : giá trị trung bình
kσ : phương sai
Hàm sai lệch:
∑∑ ∑∑∑
=
−=−=
k i
i
q
k
qiq
k
i
k i
k
i
k
iiq zwdydwE
2
1
2 )(
2
1)(
2
1)(
Chỉnh trọng:
qiiwiq zydw )( −=Δ η
∑ ∂∂−=Δ i q
i
iim m
y
ydmq )(η
∑ ∂∂−=Δ i q
i
iiq
y
yd σησ σ )(
Mô hình RBF có thể thực hiện như một mô hình mờ bởi vì các RBF có
thể xem như các hàm liên thuộc.
48
So sánh các loại mạng nơron ta thấy một số đặc điểm sau:
- Mạng nơron truyền thẳng không có lớp ẩn dễ phân tích nhưng không
mô tả được mọi hàm. Mạng có lớp ẩn cho phép mô tả được hầu hết các hàm
nhưng khó phân tích và có thể gây ra sai số tích lũy qua các lớp.
- Mạng nơron phản hồi một lớp đơn giản trong phân tích, không chứa sai
số tích lũy, dễ thực hiện trên các mạch điện và mạch tổ hợp. Mạng được
nghiên cứu và ứng dụng với phần động học tuyến tính thích hợp với các bài
toán điều khiển và công nghệ rôbốt.
- Mạng tự tổ chức mở ra nhiều khả năng giải quyết các bài toán phức
tạp, thông minh gần với tri thức con người nhưng chậm trong xử lý do số
lượng tính toán nhiều.
2.4 Học của mạng nơron
Luật học (thuật toán huấn luyện) thực hiện thuật toán để điều chỉnh các
trọng và ngưỡng hoặc cấu trúc của mạng để có tín hiệu đầu ra mong muốn.
Có hai thuật học cơ bản là thuật học tham số quan tâm đến việc điều chỉnh các
trọng số, ngưỡng của mạng và thuật học cấu trúc tập trung vào việc điều
chỉnh cấu trúc mạng bao gồm số lượng các nơron, số lớp và mối liên kết giữa
chúng.
Các thuật học có thể phân thành học có tín hiệu chỉ đạo, học củng cố và
học không có hướng dẫn.
Học có tín hiệu chỉ đạo là học để đưa ra các tín hiệu bám sát các đầu ra
mong muốn. Mạng được cung cấp các cặp giá trị mẫu học (p1, d1), (p2, d2),...
(pk, dk) là các cặp giá trị đầu vào đầu ra mong muốn. Quá trình học là điều
chỉnh trọng số và ngưỡng của mạng để giảm sai số giữa giá trị đầu ra thực tế
và đầu ra mong muốn. Luật học điển hình của nhóm này là luật học Delta của
Widrow dùng để xấp xỉ trọng của mạng Adaline dựa trên nguyên lý giảm
Gradient. Một luật học hiệu quả và được sử dụng rộng rãi trong lĩnh vực
mạng nơron là thuật toán lan truyền ngược cũng nằm trong nhóm này với các
trọng số và ngưỡng được cập nhật theo luật xấp xỉ giảm dốc nhất. Ngoài ra
49
còn có luật học Perceptron. Về cơ bản luật học Perceptron giống luật học
Delta. Điểm khác nhau là luật học Delta thay đổi các giá trị của trọng trong
thời gian học, còn luật học Perceptron thêm hoặc bỏ trọng tuỳ theo giá trị sai
số đầu ra là dương hay âm.
Học củng cố được thực hiện trên thông tin phản hồi hai trạng thái đúng
hoặc sai và tín hiệu mang thông tin phản hồi được gọi là tín hiệu cũng cố cho
quá trình học.
Quá trình học không có hướng dẫn là quá trình học không có thông tin
phản hồi cho biết tín hiệu đầu ra là đúng hay không. Mạng phải tự xác định
các cặp dữ liệu mẫu, các tính chất, các quan hệ và mã hóa chúng trong tín
hiệu đầu ra. Luật học không có hướng dẫn điển hình là luật Hebb thường
dùng cho mạng tự liên kết. Luật học LVQ thường dùng cho mạng nơron tự tổ
chức.
MNN
W
Bộ tính sai số
X Y
d
Tín
hiệu
sai số
Đầu ra mong muốn
Đầu ra thực tế
(a)- Học có tín hiệu chỉ đạo
MNN
W
Bộ nhận xét
X Y
d
Tín
hiệu
nhận
xét
Đầu ra thực tế
Đầu ra mong muốn
(b)- Học củng cố
MNN
W
X Y
Đầu vào Đầu ra thực tế
(c)- Học không có hướng dẫn
50
Hình 2.19 : Sơ đồ khối các thuật học của mạng nơron.
Ứng với các nhóm mạng nơron khác nhau thường áp dụng một số luật
học nhất định. Nếu tồn tại hàng chục loại mạng nơron khác nhau thì các luật
học dùng trong mạng nơron có thể liệt kê gấp nhiều lần.
Đối với mạng nơron phản hồi thường sử dụng luật Hebb và các luật cải
tiến của nó để chỉnh trọng mà không cần tín hiệu chỉ đạo từ bên ngoài.
Đối với mạng nơron truyền thẳng thường sử dụng luật truyền ngược để
chỉnh trọng với tín hiệu chỉ đạo từ bên ngoài.
Nếu coi cấu trúc mô hình mạng là phần xương thịt, thể xác thì các luật
học là phần trí tuệ thông minh của mạng nơron và các công trình nghiên cứu
luật học chiếm số lượng lớn nhất trong mấy chục năm qua.
2.5 Một số ứng dụng mạng nơron nhân tạo
+ Mạng nơron nhân tạo có khả năng nhận dạng (ảnh, vật thể, tiếng
nói...), xử lý thông tin có nhiễu, không đầy đủ, không chắc chắn, mờ [TL7],
[TL18].
+ Mạng nơron có khả năng xử lý song song với tốc độ xử lý nhanh do
vậy nó là công cụ mới đầy hứa hẹn trong khoa học tính toán, nhận dạng, điều
khiển tự động cũng như nhiều lĩnh vực khác. Các hệ thống sử dụng nó có thể
tăng tốc độ xử lý và tính toán theo thời gian thực [TL18].
+ Mạng nơron nhân tạo có khả năng học thích nghi, nó sẽ thích ứng với
quá trình tự chỉnh trong quá trình điều khiển tự động.
51
+ Mạng nơron có khả năng tổng quát hoá do đó có thể áp dụng để dự
báo lỗi hệ thống tránh được những sự cố đáng tiếc mà các hệ thống điều khiển
có thể gây ra [TL5], [TL7].
+ Mạng nơron có thể phối hợp cả nhận dạng và điều khiển đối tượng do
đó nó có thể được thực hiện như một bộ điều khiển thích nghi.
Việc nghiên cứu để đưa mạng nơron nhân tạo áp dụng vào quá trình
điều khiển tự động đã được nhiều nhà khoa học thực hiện và đã đưa ra được
nhiều kết quả quan trọng.
+ Theo Hunt (1992) thì mạng Hopfield có thể dùng làm bộ điều khiển
cho hệ thống học tuyến tính [TL15]. Trong trường hợp này người ta dùng các
phần tử của cấu trúc nơron thay đổi được để xây dựng bộ điều khiển. Bộ điều
khiển đưa ra chứa đựng sự thích nghi và đạt độ bền tốt.
+ Theo Chu thì mạng Hopfield có thể dùng làm một phần của cơ chế
thích nghi trong nhận dạng hệ tuyến tính. Trong trường hợp này, mạng tham
gia vào vòng thích nghi và được dùng để tối thiểu tốc độ sai số bình phương
tức thời của tất cả các trạng thái. Các đầu ra của mạng được dùng để thể hiện
các tham số của mô hình đối tượng dạng tuyến tính có tham số thay đổi theo
thời gian hoặc tham số bất biến.
+ Chang, Zhang và Sami cho biết mạng Hopfield cũng có thể kết hợp
với mạng Gabor để nhận dạng hệ phi tuyến. Trong trường hợp này, mạng bao
gồm ba lớp. Lớp thứ nhất gọi là bộ tạo hàm sử dụng mạng Gabor để tạo hàm
phi tuyến cơ sở Gabor. Lớp thứ hai dùng mạng Hopfield để tối ưu các hệ số
trọng chưa biết. Lớp thứ ba được gọi là mạng điều khiển để tính sai số ước
lượng và điều khiển hoạt động của các lớp mạng thứ nhất và lớp mạng thứ
hai. Hệ không yêu cầu phải ổn định tiệm cận mà chỉ cần các đầu vào-ra giới
hạn và ổn định đối với các kết quả được coi là hợp lý theo miền vào-ra lớn.
Thành công của phương pháp ở chỗ đã đạt được lý luận của phương pháp và
cho kết quả mô phỏng.
52
+ Mạng phản hồi Hopfield được dùng để tổng hợp hệ điều khiển tuyến
tính có phản hồi thông qua đặt cực. Trong trường hợp này mạng nơron có khả
năng giải những bài toán quy hoạch lồi. Để thu được ma trận phản hồi trạng
thái K thông qua đặt cực, người ta dùng mạng nơron phản hồi kiểu Hopfield.
So với các phương pháp đặt cực truyền thống khác, phương pháp này có ưu
điểm là phương pháp tổng hợp on-line và tự điều chỉnh thông qua mạng nơron
phản hồi. So với phương pháp sử dụng mạng nơron khác dùng để tổng hợp hệ
tuyến tính, phương pháp này có ưu điểm là tự động cả đặt cực và tối thiểu
chuẩn mà không cấn huấn luyện trước. Phương pháp này sử dụng bản chất
vốn dĩ về tính toán song song và phân bổ của mạng nơron phản hồi nên có thể
dùng trực tiếp trong các ứng dụng theo thời gian thực. Các tác giả này đang
định hướng nghiên cứu phương pháp này để đặt cực trong tổng hợp hệ phi
tuyến.
+ Mạng nơron phản hồi có thể dùng làm bộ nhớ liên kết. Bộ nhớ liên
kết có thể sử dụng như bộ suy diễn mờ. Như vậy có sự kết hợp giữa mạng
nơron và các luật mờ tạo nên bộ điều khiển nơron mờ. Phần điều kiện trong
trường hợp này có thể sử dụng mạng 'học lượng tử véc tơ'. Luật if...then...
dùng bộ nhớ liên kết với mạng Hopfield hoặc mạng liên kết hai chiều.
+ Yun-Ki Lei và các đồng tác giả đã sử dụng mạng nơron truyền thẳng
ba lớp lấy tín hiệu sai số để điều chỉnh tham số của PID là các hệ số Ki, Kp,
Kd. Đầu vào hiệu chỉnh mạng nơron trong trường hợp này sử dụng độ lệch
giữa sai số chuẩn g(t) và sai số thực của hệ điều khiển. Tuy nhiên, hệ điều
khiển được xây dựng chưa được chứng minh đảm bảo ổn định.
+ Abiev (1994) cũng đã nêu sơ đồ chỉnh định trực tiếp các hệ số PID.
Trong trường hợp này, mạng nơron ba lớp truyền thẳng chứa các tình huống
điều khiển để đưa ra tín hiệu điều khiển cho hệ. Mạng nơron lúc đó được mô
tả theo các luật mờ if...then...Phương pháp đã được áp dụng để điều khiển
nhiệt độ trong công nghệ hoá dầu ở Bacu.
+ Allon Gues cũng đã nêu một phương pháp tuyến tính hóa quanh điểm
cân bằng của mạng Hopfield liên tục nhằm xác định hệ số của mô hình bằng
53
cách rút ra và giải n(n+1) phương trình và bất phương trình, (trong đó n là số
phần tử nơron). Phương pháp Liapunov trực tiếp sử dụng ở đây để xác định
nghiệm ổn định tiệm cận cho mạng. Các vùng ổn định của mạng dùng làm các
vùng điều chỉnh các tham số của bộ điều chỉnh PD. Đây là một phương pháp
tổng hợp mạng kết hợp với tiêu chuẩn ổn định Liapunov để xác định các hệ số
trọng của mạng liên tục cho từng phần tử nơron, mỗi nơron chỉnh một tham
số của bộ PD.
+ Năm 1996, vấn đề nhận dạng tham số và điều khiển hệ servo với bộ
điều chỉnh PID đã được đưa ra. Sơ đồ sử dụng mạng Hopfield liên tục để
nhận dạng, sử dụng mạng Hopfield rời rạc bậc ba theo phương pháp điều
khiển gián tiếp để điều chỉnh tham số của bộ điều khiển PID theo tình huống,
đồng thời ứng dụng nó để điều khiển rô bốt.
+ Mạng nơron RBF, với khả năng ứng dụng trong điều khiển thích nghi
phi tuyến. Trên cơ sở phân tích ưu điểm của mạng nơron RBF là khả năng
sinh và diệt nơron tác giả đưa ra nhận định khả năng ứng dụng nó vào quá
trình điều khiển thích nghi các hệ thống phi tuyến có cấu trúc thay đổi.
+ Mạng nơron truyền thẳng nhiều lớp với khả năng xấp xỉ các hàm phi
tuyến bất kỳ với độ chính xác tuỳ ý do đó ngày càng được ứng dụng nhiều
trong các bài toán điều khiển.
+ Một số tác giả đã tập trung nghiên cứu việc ứng dụng mạng nơron
nhân tạo vào điều khiển rô bốt và tay máy [TL13]. Các mạng nơron phản hồi,
mạng nơron truyền thẳng cũng đã được sử dụng để hiệu chỉnh tín hiệu điều
khiển nhằm đạt được chế độ điều khiển tối ưu.
+ Mạng nơron đã dần được ứng dụng vào các lĩnh vực truyền thông
như nhận dạng kênh, mô hình hoá kênh, mã hoá và giải mã, hiệu chỉnh kênh,
phân tích phổ, lượng tử hoá véc tơ... ở đây các mạng nơron truyền thẳng, phản
hồi, mạng nơron tự tổ chức được ứng dụng trong các lĩnh vực phù hợp.
54
+ Có thể sử dụng mạng nơron để làm bộ biến đổi tương tự-số. Để xác
định các trọng và ngưỡng của mạng nơron ta tiến hành so sánh sai số của bộ
biến đổi với hàm năng lượng của mạng Hopfield.
+ Mạng nơron được dùng để xấp xỉ các đặc tính phi tuyến của cảm biến
dựa trên lý thuyết xấp xỉ hàm một hoặc nhiều biến bằng mạng nơron với độ
chính xác tủy ý.
+ Ứng dụng mạng nơron trong xử lý điện não. Trong điện não đồ thì
sóng điện não EEG bao gồm bốn sóng là Delta, Theta, Alpha và Beta. Để
nhận dạng ra bốn loại sóng đó rồi tiến hành so sánh điện não đồ của người
mắc bệnh và người không mắc bệnh giúp cho quá trình chuẩn đoán bệnh được
dễ dàng. Mạng nơron có thể thực hiện được việc đó. Mạng nơron Back-
propagation có trễ với hàm kích hoạt Sigmoid đã được sử dụng để nhận dạng
các thông số của điện não đồ.
+ Các mạng nơron đã được nhiều tác giả nghiên cứu ứng dụng trong xử
lý chữ viết, như: nhận dạng ký tự, nhận dạng chữ viết, nhận dạng tiếng nói.
+ Trong các lĩnh vực nghiên cứu về hình ảnh cũng được các tác giả sử
dụng mạng nơron để xử lý hình ảnh như nhận dạng, xử lý.
2.6 Kết luận
Trong chương này chúng tôi đã trình bày các nét đặc thù điển hình của
mạng nơron và khả năng hiệu chỉnh trọng của nó. Trong đó nổi bật lên mấy
vấn đề sau:
+ Cơ sở nghiên cứu mạng nơron nhân tạo là quá trình phỏng cấu hình
mạng của nơron sinh vật, từ cấu trúc của một nơron sinh vật đến cấu trúc
mạng của nơron nhân tạo cũng như quá trình học.
+ Cấu trúc cơ bản của mạng nơron nhân tạo đã được nêu làm sáng tỏ
nguyên lý hoạt động của mạng. Một số cấu trúc mạng truyền thẳng, mạng
phản hồi cũng được giới thiệu làm cơ sở cho các nghiên cứu và lựa chọn cấu
trúc mạng cho đề tài của luận văn.
55
+ Nguyên lý xấp xỉ theo quan điểm lý thuyết đối với mạng nơron và
một số luật học cơ bản cũng được nêu ra cho cách chỉnh trọng của mạng
nơron.
Từ những phân tích trên chúng tôi đề ra vấn đề nghiên cứu ứng dụng
mạng nơron:
- Để khắc độ tự động thiết bị đo và cảm biến
- Xử lý số liệu đo để xác định giá trị thực
- Chỉnh định đường đặc tính của thiết bị đo và cảm biến nằm trong giới
hạn sai số cho phép.
56
Chương 3
ỨNG DỤNG MẠNG NƠRON ĐỂ KHẮC ĐỘ TỰ ĐỘNG
3.1 Cơ sở lý thuyết xử lý số liệu đo
3.1.1 Tính toán sai số ngẫu nhiên [TL3]
Sai số ngẫu nhiên xuất hiện khi đo nhiều lần một điểm đo, nghĩa là khi
thực hiện phép đo theo cùng một phương pháp bằng những thiết bị có độ
chính xác như nhau trong cùng một điều kiện bên ngoài.
Đặc tính chung nhất cho sai số ngẫu nhiên và đại lượng ngẫu nhiên bất
kỳ là luật phân bố xác suất của chúng, nó được xác định bởi các giá trị có thể
của sai số ngẫu nhiên và xác suất xuất hiện của chúng.
Phần lớn các đại lượng đo các đại lượng vật lý có sai số ngẫu nhiên tuân
theo luật phân bố chuẩn-luật Gauss. Nó dựa trên giả thiết : các sai số ngẫu
nhiên có cùng giá trị (độ lớn) thì có cùng xác suất ; có giá trị nhỏ thì xác suất
xuất hiện lớn và giá trị lớn thì xác suất nhỏ. Nếu sai số ngẫu nhiên vượt quá
một giá trị nào đó thì xác suất xuất hiện hầu như bằng không và giá trị trung
bình của tất cả sai số ngẫu nhiên sẽ tiến tới « không » khi số lượng các lần đo
tăng lên đến vô cùng.
Sai số ngẫu nhiên Δ của lần đo thứ i có thể xem là hiệu giữa kết quả đo x
và kì vọng toán học mx của nó : Δ=x-mx (3-1)
Trong đó kỳ vọng toán học của biến ngẫu nhiên X , ký hiệu mx được xác
định như sau :
- Nếu X là biến rời rạc có hàm xác suất p(xi) =pi, i=1,2... thì
mx=∑
∀i
ii px ;
- Nếu X là biến liên tục có hàm mật độ f(x), x∈R thì
mx= ∫
+∞
∞−
dxxxf )(
57
Kỳ vọng chính là tổng có trọng số của tất cả các giá trị của X, hay còn là
giá trị trung bình của biến ngẫu nhiên (phân biệt với trung bình cộng của các
giá trị). Trong thực tế, nếu quan sát các giá trị của X nhiều lần và lấy trung
bình cộng, thì khi số quan sát càng lớn số trung bình đó càng gần tới kỳ vọng
toán học mx, vì vậy kỳ vọng còn được gọi là trị trung bình của biến X.
Biến ngẫu nhiên X được gọi là tuân theo luật phân phối chuẩn nếu hàm
mật độ phân bố xác suất của sai số ngẫu nhiên hay là hàm phân bố vi phân w(
Δ ) có dạng :
2
2
2
5,0
2
)(
2
1
2
1)(
⎟⎠
⎞⎜⎝
⎛Δ−−−
==Δ σσ πσπσ eew
xmx
(3-2)
ở đây Δ - sai số ngẫu nhiên tuyệt đối
σ - Độ lệch bình quân phương.
Phương sai D của sai số ngẫu nhiên bằng phương sai của các kết quả đo,
nó được định nghĩa là kì vọng toán học của bình phương sai số ngẫu nhiên và
nó đặc trưng cho sự sai lệch của kết quả đo vì có sai số ngẫu nhiên.
1σ
2σ
3σ
Hình 3.1: Phân bố chuẩn của sai số ngẫu nhiên
58
D= ∫+∞
∞−
ΔΔΔ= dw )(22σ (3-3)
Trong thực tế thường sử dụng khái niệm độ lệch bình quân phương
D±=σ có thứ nguyên của đại lượng ngẫu nhiên.
Từ công thức (3-3) và các đường cong mật độ phân bố đối với các giá trị
321 σσσ << được vẽ ở hình 3.1, rõ ràng khi σ giảm thì sẽ tăng các giá trị đo
có sai số nhỏ. Tức là càng gần đến giá trị thực của đại lượng đo hay càng
giảm tán xạ của kết quả đo.
Xác suất rơi của sai số ngẫu nhiên vào trong một khoảng nào đó cho
trước Δ 1 và Δ 2 bằng :
Δ=ΔΔ= Δ−
Δ
Δ
Δ
Δ
∫ ∫ dedwP 21
2
1
2
)/(5,0
2
1)( σπσ (3-4)
Xác suất rơi của kết quả đo hay là sai số ngẫu nhiên vào khoảng cho
trước sẽ bằng diện tích bao bọc đường cong phân bố, trục hoành và các đường
thẳng đứng giới hạn khoảng đó. Việc tính xác suất theo (3-4) gặp phải khó
khăn. Vì vậy trong thực tế người ta sử dụng máy tính với các phần mềm
tương ứng, hoặc dùng bảng số có sẵn.
Với khái niệm hàm Láp-la-xơ :
φ(x)= dte
x t
∫ −
0
2
2
2
1
π (3-5)
Dễ thấy hàm phân phối chuẩn của X có dạng:
F(x)= dte
x mt x
∫
∞−
−−
2
2
2
)(
2
1 δ
πδ (3-6)
Dễ dụng phép biến đổi z= δ
xmt − ta có thể đưa về dạng
59
F(x)= dzedzedze
xx mx
zz
mx
z
∫∫∫
−
−
∞−
−
−
∞−
− +=
δδ
πππ 0
2
2
0
2
2
2
2
2
1
2
1
2
1 = )(
2
1
δφ
xmx −+ (3-7)
Do vậy P( )21 Δ<≤Δ X = )()( 12 δφδφ
xx mm −Δ−−Δ (3-8)
Nếu ta đưa vào một hệ số k= σ/2,1Δ sau đó lập bảng các giá trị xác suất
đáng tin P (là xác suất của khoảng sai số, hệ số tin cậy) là một hàm của hệ số
k= )(kφ được tính theo biểu thức :
∫==
k t
dtekP
0
2
2
/2)( πφ 0≤ )(kφ ≤1 (3-9)
Như vậy để tính được sai số ngẫu nhiên 122,1 Δ−Δ=Δ nhất thiết phải tìm
được các giá trị σ và k. Hệ số k thường được xác định bằng xác suất đã cho
của P và dạng luật phân bố xác suất của sai số ngẫu nhiên.
Giá trị lý thuyết của hệ số k khi luật phân bố của sai số ngẫu nhiên là
chuẩn có các giá trị sau đây tuỳ thuộc vào xác suất P (bảng 3.1)
Bảng 3.1
P 0,5 0,68 0,95 0,98 0,99 0,997
k 0,667 1 2 2,33 2,58 3
Để tính sai số ngẫu nhiên người ta thường chọn :
σ=Δ 2,1 nghĩa là k=1
Đôi khi ta cũng chọn σ)3/2(2,1 =Δ tức là k=0,667 đối với một số phép đo.
Sai số lớn nhất có thể mắc phải là σ32,1 =Δ tức là k=3. khi đó sai số ngẫu
nhiên lớn hơn 3σ chỉ chiếm 0,3% còn giá trị nhỏ hơn chiếm 99,7%. Vì vậy
60
khoảng σ3± trong trường hợp phân bố chuẩn là khoảng đủ để cho kết quả đo
đáng tin cậy. Việc xuất hiện sai số lớn hơn σ3 hầu như không xảy ra.
Trong kỹ thuật đo người ta còn dùng luật phân bố đều của sai số ngẫu
nhiên, tức là hàm mật độ phân bố w(Δ ) không đổi trong khoảng ( Δ+Δ− , ) và
bằng 0 ngoài khoảng đó.
3.1.2 Gia công kết quả đo [TL3]
Khi tính toán sai số ngẫu nhiên, người ta thường sử dụng các đặc tính số
của chúng, đó là kỳ vọng toán học và độ lệch bình quân phương. Các đặc
trưng thống kê này đủ để đánh giá sai số của kết quả đo. Việc tính các đặc
tính số này là nội dung cơ bản trong quá trình gia công kết quả đo.
Để tính kỳ vọng toán học và độ lệch bình quân phương ta có số lượng
các phép đo rất lớn. Tuy nhiên trong thực tế số lượng các phép đo n là có hạn,
vì vậy ta chỉ tìm được ước lượng của kỳ vọng toán học và độ lệch bình quân
phương. Thường các ước lượng này đối với các đại lượng đo vật lý có các
tính chất cơ bản là ước lượng có căn cứ, không lệch và có hiệu quả.
Nếu *ξ là ước lượng của đặc tính thống kê ξ và ta tăng số lượng N các
giá trị đo và với mọi ε>0 mà ta có :
∞→
=⎥⎦
⎤⎢⎣
⎡ ≥−
N
P 0lim * εξξ (3-10)
Thì ước lượng được gọi là có căn cứ.
Nếu lấy trung bình ước lượng ta có :
M [ ] ξξ =* (3-11)
thì ước lượng *ξ được gọi là không chệch.
Nếu lấy trung bình bình phương độ sai lệch (phương sai) của một ước
lượng đã cho *lξ nào đó không lớn hơn trung bình bình phương độ sai lệch của
bất kỳ ước lượng thứ i nào *iξ thì ước lượng đó được gọi là có hiệu quả :
61
M [ ] [ ]2*2* )()( ξξξξ −≤− il M (3-12)
Giả sử ta tiến hành n phép đo cùng một giá trị X. Giá trị đáng tin nhất đại
diện cho đại lượng đo X là giá trị trung bình đại số của dãy phép đo như
nhau :
∑
=
=+++=
n
i
in
n
x
n
xxx
X
1
21 ... (3-13)
Trong đó x1, x2,…xn là kết quả của các phép đo riêng biệt.
n là số các phép đo
ước lượng của kì vọng toán học *xm của đại lượng đo sẽ bằng X khi số
lượng phép đo tiến đến vô cùng. Nếu không có sai số hệ thống thì X sẽ là giá
trị thực của đại lượng đo. Tất cả các giá trị của kết quả đo sẽ phân tán xung
quanh giá trị X này.
Độ lệch của kết quả đo so với giá trị trung bình (theo giá trị số và theo
dấu) được xác định từ biểu thức :
xi- X =vi (3-14)
vi là sai số dư
Sai số dư có tính chất sau :
Tổng tất cả các số dư bằng 0 :
0
1
=∑
=
n
i
iv
Tổng số bình phương của chúng có giá trị nhỏ nhất :
∑
=
=
n
i
i Minv
1
2 (3-15)
Theo tổng bình phương của tất cả sai số dư người ta xác định ước lượng
độ lệch bình quân phương *σ , tiêu biểu cho mức độ ảnh hưởng của sai số
ngẫu nhiên đến kết quả đo.
62
Theo lý thuyết xác suất việc tính *σ được thực hiện theo công thức
Bessel : ∑
= −=
n
i
i
n
v
1
2
*
)1(
σ (3-16)
Ước lượng này không chệch, có căn cứ và có hiệu quả.
Việc chia tổng bình phương sai số dư cho n-1 thay cho n có thể chấp
nhận được vì kết quả gần bằng nhau và n càng lớn thì sự sai lệch càng nhỏ.
Ước lượng độ lệch quân phương *σ đặc trưng cho độ chính xác của một
dãy các phép đo và được xác định bởi một tập các điều kiện đo (các đặc tính
kỹ thuật của dụng cụ đo, các đặc điểm của người làm thí nghiệm, các yếu tố
bên ngoài ảnh hưởng đến phép đo). Ước lượng *σ đặc trưng cho độ phân tán
của kết quả đo xung quanh giá trị trung bình đại số của nó.
Vì giá trị trung bình đại số còn có một sai số ngẫu nhiên nào đó, nên ta
đưa ra khái niệm ước lượng độ lệch quân phương của giá trị trung bình đại
số :
nnn
v
nn
Xx
n
i
i
n
i
i
X
*
1
2
1
2
*
)1()1(
)( σσ =−=−
−
=
∑∑
== (3-17)
Ước lượng này đặc trưng cho sai số kết quả đo. Ước lượng đã khảo sát
trên đây được gọi là ước lượng điểm bao gồm : Xo= nX X ,,
*σ .
Ước lượng điểm của sai số phép đo không hoàn chỉnh bởi vì *
Xσ chỉ thể
hiện ở khoảng mà giá trị thực có thể nằm trong đó nhưng lại không nói gì về
xác suất rơi của Xo vào khoảng đó. Ước lượng điểm chỉ cho phép làm một vài
kết luận nào đó về độ chính xác của phép đo.
Ước lượng khoảng là khoảng đáng tin mà trong giới hạn của khoảng đó
với một xác suất nhất định ta tìm thấy giá trị thực Xo.
Cho trước giá trị xác suất đáng tin P với đại lượng ngẫu nhiên có phân bố
chuẩn và số lượng phép đo là vô hạn n ∞→ , thì theo bảng 3.1 ta tìm được hệ
số k và như vậy tìm được khoảng đáng tin *2,1 σk=Δ
63
Khi số lượng các phép đo n ≥20 khoảng đáng tin đó có thể tính gần
bằng :
*
2,1 Xkσ=Δ (3-18)
Trong thực tế ta không thể tiến hành nhiều phép đo được thường chỉ hạn
chế trong 2≤ n <20, khi đó thì khoảng đáng tin được tính theo biểu thức:
*'
2,1 Xsth σ=Δ (3-19)
Ở đây hst là hệ số phân bố Student, phụ thuộc vào xác suất đã cho P và số
lượng phép đo n và được xác định bằng cách tra bảng. Số liệu trong bảng này
được tính theo công thức:
[ ] 2/2 )/1(
1
! 2/)1()1(
)!2/();( nntnn
nntS +−−= π (3-20)
S(t;n) là mật độ phân bố Student ;
t=( */) XoXX σ− là phân số Student ;
n - số lần đo
Trường hợp n ∞→ (thực tế với n≥20) thì phân bố Student sẽ tiến đến
phân bố chuẩn, lúc đó hst có thể thay thế bằng hệ số k như ở biểu thức (3-18).
Kết quả đo với ước lượng khoảng, nhờ có phân bố Student có thể viết
dưới dạng ( ) ( )' 2,1' 2,1 Δ+<<Δ− XXX o (3-21)
Từ 3-21 ta thấy rằng độ lệch giá trị trung bình đại số so với giá trị thực
của đại lượng đo không vượt quá ' 2,1Δ
Khi thực hiện gia công kết quả đo người ta còn xác định khái niệm sai số
bình quân phương tương đối theo biểu thức sau đây :
100
*
X
X
X
σγ = (3-22)
Quá trình gia công kết quả đo được biểu diễn theo sơ đồ thuật toán ở
hình 3.2
64
65
Bắt đầu
n phép đo xi
Kì vọng toán học M[x]= X
Sai số dư vi=xi- X
Kiểm tra 0
1
=∑
=
n
i
iv
Tính ∑
=
n
i
iv
1
2
Tính ∑
=
−=
n
i
i nv
1
2* )1/(σ
nX /
** σσ =
Cho xác suất P tìm hst
Khoảng đáng tin *' 2,1 Xsth σ=Δ
Kết quả đo = ' 2,1Δ±X
Kết thúc
Hình 3.2: Lưu đồ gia công kết quả đo
66
Quá trình gia công này có thể thực hiện trên máy tính. Kết quả cho ta giá
trị thực Xo = X và khoảng đáng tin ' 2,1Δ . Kết quả đo được sau khi gia công là :
'
2,1Δ±X
Nhận xét : Phương pháp xử lý thống kê cho ra kết quả nằm trong khoảng
đáng tin phụ thuộc xác suất P và số lượng phép đo n. Thông thường ta sử
dụng giá trị trung bình X để xây dựng đường đặc tính của cảm biến. Giá trị
trung bình X mắc phải một sai số nằm trong khoảng đáng tin ' 2,1Δ so với giá
trị thực X0. Do đó đường đặc tính của cảm biến nếu loại trừ được sai số hệ
thống thì vẫn tồn tại một sai số ngẫu nhiên do sử dụng giá trị trung bình X
gây ra.
Trong luận văn này tôi đề xuất việc ứng dụng mạng nơron để xử lý số
liệu đo hội tụ về giá trị thực với độ chính xác tùy ý để giảm sai số ngẫu nhiên
một cách rất hiệu quả. Sử dụng giá trị đo đã được xử lý giảm sai số ngẫu
nhiên bằng mạng nơron để xây dựng đường đặc tính của cảm biến bằng hàm
nội suy Lagrange cho phép cảm biến đạt cấp chính xác cao.
3.2 Giảm sai số ngẫu nhiên bằng mạng nơron để khắc độ tự động
thiết bị đo và cảm biến
3.2.1 Đặt vấn đề
Để xây dựng đường đặc tính của cảm biến Y=f(x), trong đó x là đại
lượng đo chủ yếu. Theo phương pháp tuyến tính hóa từng đoạn ta cần lấy mẫu
nhiều giá trị trên toàn thang đo. Tần số lấy mẫu được tính theo công thức :
M
e CF
T 1= với ε
π
8
2=C , ε là sai số hồi phục đường cong [TL4].
Thông thường người ta tiến hành đo nhiều giá trị tại mỗi điểm lấy mẫu
để giảm sai số ngẫu nhiên của phép đo. Tại mỗi điểm lấy mẫu kết quả đo sau
khi gia công theo lý thuyết xác suất thống kê là : kk XX Δ± , k=1,..n và n là số
điểm lấy mẫu. Điều này cho thấy giá trị trung bình kX thường dùng để khắc
độ cảm biến vẫn mắc phải một sai số nằm trong khoảng kXΔ so với giá trị
67
thực Xk. Tương tự Y cũng tuân theo luật phân phối xác suất như X và độ lệch
của kY so với giá trị thực Yk cũng nằm trong khoảng kYΔ .
Đối với mỗi tập giá trị đo ngẫu nhiên tại mỗi điểm lấy mẫu ta có thể sử
dụng mạng nơron để đưa ra được giá trị sát với giá trị thực hơn so với giá trị
trung bình. Giả sử ta đã biết được giá trị thực tại mỗi điểm lấy mẫu và tập các
giá trị đo ngẫu nhiên phân tán xung quanh giá trị thực theo hàm phân phối
chuẩn.
Hình 3.3: Các kết qủa đo phân bố ngẫu nhiên xung quanh giá trị thực
Tại điểm lấy mẫu thứ k, k=1,..n, ta đo m lần để có tập giá trị đo ngẫu
nhiên {x(1),x(2)....x(m) } và {y(1),y(2),...y(m) } phân bố xung quanh cặp giá trị thực
(xk,yk). Các tập giá trị đo ngẫu nhiên này sẽ được đưa vào huấn luyện mạng
nơron để được đầu ra là các giá trị thực Xk và Yk mong muốn. Sau khi đã có
mạng nơron được huấn luyện để có đáp ứng gần với giá trị thực nhất thì với
mỗi tập đầu vào số liệu đo ngẫu nhiên ta sẽ có giá trị đầu ra *kX , *kY gần với
các giá trị thực Xk và Yk. Các giá trị đầu ra này có thể được dùng để khắc độ
cảm biến bằng hàm nội suy Lagrange cho độ chính xác cao, (Xem mục 1.5).
y
x 0
ky
kxXk
Yk
Mạng nơron
W
x(1)
x(2)
x(m)
-
+
Xk
*
kX
Hình 3.4 : Sơ đồ huấn luyện mạng cho giá trị ngẫu nhiên X
68
69
Hình 3.5: Sơ đồ huấn luyện mạng cho giá trị ngẫu nhiên Y.
3.2.2 Xử lý số liệu đo bằng mạng nơron để giảm sai số ngẫu nhiên
Xét đường đặc tính của cảm biến có dạng y=x2.
Với giải đo từ 0-xmax= 0-10 tương ứng với 0-ymax= 0-100. Thực hiện lấy
mẫu tại n điểm và tại mỗi điểm lấy mẫu thứ k, k=1..n, ta đo m lần để được tập
giá trị {x(1), x(2)...x(m)} và {y(1), y(2),...y(m) } phân bố xung quanh giá trị thực Xk
và Yk.
Mạng nơron
W
y(1)
y(2)
y(m)
-
+
Yk
*
kY
x
y
0 1 2 3 4 5 6 7 8 9 10
0
10
20
30
40
50
60
70
80
90
100
Hình 3.6: Đặc tính cảm biến
70
Ứng với các tập giá trị đo ngẫu nhiên X tại điểm lấy mẫu thứ k, ta sử
dụng mạng nơron hai lớp và thuật học lan truyền ngược để huấn luyện mạng
cho ra kết quả chính xác gần với Xk. Với tập giá trị ngẫu nhiên Y ta cũng sử
dụng mạng tương tự như đối với biến X, tức là dùng hai mạng nơron để huấn
luyện tập các giá trị X và Y tương ứng.
+ Xây dựng mạng nơron:
Ta sử dụng mạng nơron truyền thẳng hai lớp như sau :
- Lớp vào : có m đầu vào và số nơron bằng số tự nhiên làm tròn của giá
trị đúng tại điểm lấy mẫu. Trong chương trình mô phỏng Matlab số nơron
được tính bằng hàm round(t(k)+1) trong đó t(k) là giá trị đúng tại điểm lấy
mẫu thứ k. Hàm truyền sử dụng cho lớp này là hàm sigmoid lưỡng cực :
1
1
2)( −+= −neng . Hàm này được dùng trong Matlab với tên hàm là tansig
- Lớp ra : một nơron với hàm truyền tuyến tính : nng =)( . Trong Matlab
hàm này được dùng với tên purelin.
- Thuật học sử dụng cho mạng : Ta dùng thuật học lan truyền ngược
Levenberg-Marquardt. Algorith này là nhanh nhất trong việc dạy mạng có
kích thước vừa phải và giảm bộ nhớ khi tập mẫu học quá lớn.
Nếu số mẫu học tại mỗi điểm lấy mẫu càng lớn đồng thời sai số học càng
nhỏ thì kết quả thu được càng chính xác. Trong trường hợp này chỉ cần dùng
200 mẫu học tại mỗi điểm lấy mẫu đủ để đạt được độ chính xác mong muốn.
Với 20 điểm lấy mẫu (n=20), số giá trị đo tại mỗi điểm lấy mẫu là 10
(m=10) và số mẫu học tại mỗi điểm lấy mẫu là 200 (h=200). Mạng được huấn
luyện theo thuật học lan truyền ngược, số lần lặp tối đa là 3000 và giá trị sai
số học là 10-10 đủ để đạt được mục tiêu của bài toán đề ra. Sau khi huấn luyện
mạng tại mỗi điểm lấy mẫu ta sẽ có một ma trận trọng số tối ưu. Ta kiểm tra
lại kết quả bằng cách lấy m=10 giá trị ngẫu nhiên tại mỗi điểm cho vào mạng
71
nơron đã huấn luyện để được giá trị đầu ra *kX , *kY thoã mãn : kk XX −* <
kk XX − và kk YY −* < kk YY −* với k=1,..n.
Lưu đồ thuật toán quá trình học như hình 3.7
72
Bắt đầu
- Nhập số điểm lấy mẫu, số giá trị
ngẫu nhiên, số mẫu học, sai số cho
phép
- k=0
- Tạo mạng ở điểm lấy mẫu thứ k
- Tạo mẫu học ở điểm lấy mẫu thứ k
- Tính sai lệch trọng và cập nhật
trọng theo thuật toán lan truyền
ngược
- Tính sai lệch Emới
Emới≤ ε sai
- Tạo tập giá trị ngẫu nhiên mô phỏng
- Tính kết quả bằng mạng đã huấn
luyện
- Gán k=k+1
k> số điểm
lấy mẫu
sai
đúng
đúng
- Vẽ đồ thị sai số
- lưu kết quả
Kết thúc
Hình 3.7: Lưu đồ thuật toán qúa trình học
73
Kết quả mô phỏng:
Số điểm lấy mẫu: n=20
Số giá trị đo ngẫu nhiên tại mỗi điểm lấy mẫu: m=10
Số mẫu học tại mỗi điểm lấy mẫu: h =200
- Mô phỏng đối với các giá trị ngẫu nhiên X (0≤ x ≤10) ta được kết quả
với các đồ thị sai số tuyệt đối thể hiện trên hình 3.8 và hình 3.9.
Bảng 3.2: Liệt kê các kết quả mô phỏng
Đầu ra mạng ( *X ) Giá trị trung bình ( X ) Giá trị thực X
0,00000006060542
0,50000000002978
0,99999999992853
1,50000000000253
1,99999999973687
2,49999928158084
2,99998934352460
3,49999999830347
3,99999657058059
4,49999999989793
4,99999999995207
5,49999999831897
5,99999999986617
6,49999994654007
6,99999996939560
7,49999651946078
7,99999728632537
8,49999304449184
8,99999869244313
9,49999999125812
9,99999999828265
0,00000000000015
0,50007836778220
1,00221730947259
1,49837875201959
2,00129209733474
2,50667369385198
3,00409276259502
3,50120637498524
4,00778532001772
4,49785243112724
4,98920624163394
5,49489551061936
5,98401929137361
6,51640259371695
6,97407969009206
7,50741352837351
7,98356088223748
8,51771984922467
9,00466876286380
9,50912038327919
9,97734890122512
0,00
0,50
1,00
1,50
2,00
2,50
3,00
3,50
4,00
4,50
5,00
5,50
6,00
6,50
7,00
7,50
8,00
8,50
9,00
9,50
10,00
74
Hình 3.9 : Đồ thị sai số tuyệt đối giữa giá trị trung bình và giá trị đúng
Hình 3.8 : Đồ thị sai số tuyệt đối giữa giá trị đầu ra của mạng và giá trị
đúng
X
Sa
i s
o
Sa
i s
o
X
75
- Mô phỏng cho các giá trị ngẫu nhiên Y (0≤ y ≤100) ta có kết quả với
các đồ thị sai số tuyệt đối thể hiện trên hình 3.10 và hình 3.11.
Bảng 3.3: Liệt kê các kết quả mô phỏng
Đầu ra mạng ( *Y ) Giá trị trung bình (Y ) Giá trị thực Y
0,00000000010387
0,24999999989464
1,00000005729888
2,24999931078880
4,00000000002612
6,24999999997494
8,99999999993234
12,24999576927858
15,99999273844916
20,24999935577222
24,99999880818501
30,24999547344620
35,99999830162605
42,24998820977342
48,99999932707719
56,24999920228370
63,99999461792213
72,24999346342256
80,99999841811624
90,25000023922870
99,99998768170779
0,00000000000210
0,24942875405719
0,99915747684112
2,25121691543895
4,00113099459300
6,25075112808389
8,98525138405521
12,24274314798082
16,01898970014716
20,24321902584729
24,92475117531456
30,25789879401264
36,06930622057524
42,28807302912637
49,01084163554467
56,34915904413644
63,99708132808966
72,25535966859097
80,91901315192682
90,16951604848173
99,71198783869305
0,00
0,25
1,00
2,25
4,00
6,25
9,00
12,25
16,00
20,25
25,00
30,25
36,00
42,25
49,00
56,25
64,00
72,25
81,00
90,25
100,00
76
Hình 3.10 : Đồ thị sai số tuyệt đối giữa giá trị đầu ra mạng và giá trị đúng
Hình 3.11 : Đồ thị sai số tuyệt đối giữa giá trị trung bình và giá trị đúng
Nhận xét: Sai số tuyệt đối lớn nhất của giá trị đầu ra của mạng nơron so
với giá trị đúng của biến X là 1,1x10-5 trong khi đó sai số tuyệt đối lớn nhất
giữa giá trị trung bình và giá trị đúng là:0,026. Tương tự các giá trị sai số
0 10 20 30 40 50 60 70 80 90 100 0
0.2
0.4
0.6
0.8
1
1.2
1.4 x 10
-5
0 10 20 30 40 50 60 70 80 90 100
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
Y
sa
i s
o
Y
sa
i s
o
77
tuyệt đối tương ứng đối với biến Y là 1,2x10-5 và 0,29. Như vậy việc sử dụng
mạng nơron đã cho ta kết quả chính xác hơn so với giá trị trung bình rất
nhiều. Bằng cách tăng số lượng mẫu học và giảm sai số học của mạng ta có
thể thu được giá trị đầu ra của mạng với độ chính xác tuỳ ý. Tức là với một
sai số ε tuỳ ý cho trước ta có thể dùng nhiều mẫu học cho việc huấn luyện
mạng để thoã mãn: kk XX −* <ε hoặc kk YY −* <ε với k=1,..n. Từ các kết quả
đầu ra mạng sau khi đã được huấn luyện **, kk YX , có thể tiến hành khắc độ tự
động bằng một số phương pháp như phương pháp tuyến tính hóa, phương
pháp nội suy Lagrange hoặc sử dụng mạng nơron... Tiếp theo ta sẽ xem xét
việc sử dụng phương pháp nội suy Lagrange và mạng nơron để khắc độ tự
động cảm biến.
3.3 Khắc độ tự động thiết bị đo và cảm biến
3.3.1 Sử dụng hàm nội suy Lagrange để khắc độ tự động
Dùng các kết quả đầu ra của mạng nơron sau khi đã được huấn luyện:
**, kk YX , k=1,..n để tiến hành khắc độ tự động đặc tính của cảm biến. Trong
luận văn này tôi đề xuất phương pháp dùng hàm nội suy Lagrange với lý do
hàm này sẽ đi qua tất cả những điểm lấy mẫu **, kk YX .
Hàm nội suy Lagrange được cho bởi phương trình:
n
nnnn
n
n
n
n
n
y
xxxxxx
xxxxxx
y
xxxxxx
xxxxxx
y
xxxxxx
xxxxxx
y
))...()((
))...()((
......
))...()((
))...()((
))...()((
))...()((
121
121
2
23212
31
1
13121
32
−
−
−−−
−−−+
+−−−
−−−+−−−
−−−=
Hàm này sẽ đi qua tất cả các điểm (Xk,Yk) , k=1,..n. Ta thay các giá trị
(Xk,Yk) bằng các giá trị (
**, kk YX ) đã tìm được ở trên vào phương trình
Lagrange để có đường đặc tính cần tìm của cảm biến. Đường đặc tính này đi
qua tất cả những điểm lấy mẫu đã giảm sai số ngẫu nhiên bằng mạng nơron.
78
Kết quả mô phỏng:
Với các giá trị mô phỏng **, kk YX đã tìm được ở bảng 3.2 và bảng 3.3
của mục 3.2.2, ta xây dựng được đường đặc tính bằng hàm nội suy Lagrange.
Đường này gần trùng khít với đường cong đặc tính chuẩn y=x2 tạo thành một
đường thể hiện trên hình 3.12.
Đường sai số giữa đường đặc tính dùng hàm nội suy và đặc tính chuẩn
y=x2 như hình 3.13.
0 1 2 3 4 5 6 7 8 9 10
0
10
20
30
40
50
60
70
80
90
100
Hình 3.12: Đường đặc tính cảm biến dùng hàm nội suy Lagrange
X
Y
0 1 2 3 4 5 6 7 8 9 1 0 -0 .0 8
-0 .0 7
-0 .0 6
-0 .0 5
-0 .0 4
-0 .0 3
-0 .0 2
-0 .0 1
0
0 .0 1
sa
i s
o
X
Hình 3.13: Đường sai số giữa hai đường đặc tính
79
Nhận xét: Sử dụng phương pháp nội suy Lagrange để xây dựng đường
đặc tính mắc phải sai số tương đối nhỏ (trong ví dụ này sai số tương đối mắc
phải là 0.006 %). Như vậy việc ứng dụng mạng nơron để xử lý số liệu đo
ngẫu nhiên hội tụ về giá trị thực cho phép giảm sai số ngẫu nhiên. Từ các giá
trị đã được xử lý để giảm sai số ngẫu nhiên bằng mạng nơron, có thể dùng
hàm nội suy Lagrange để tiến hành khắc độ đường đặc tính của cảm biến đạt
độ chính xác cao.
3.3.2 Khắc độ tự động bằng mạng nơron
Phương trình đặc tính của cảm biến y=f(x), là hàm quan hệ giữa đại
lượng điện y và giá trị thực của đại lượng cần đo x, được xây dựng từ n điểm
lấy mẫu (Xi,Yi), i=1,..n. Đường đặc tính của cảm biến phải nằm trong giới hạn
sai số 0ε nhất định tùy vào cấp chính xác của cảm biến.
Gọi đặc tính chuẩn của cảm biến là y=f0(x) và trong trường hợp cảm biến
có sai số hệ thống ta ký hiệu đường đặc tính thực tế là y=fs(x). Đường đặc tính
thực tế cần phải nằm trong hai đường giới hạn sai số trên và dưới như biểu
diễn trên hình 3.14 để đảm bảo cấp chính xác cần thiết của cảm biến.
Khả năng xấp xỉ hàm phi tuyến hoặc tuyến tính với độ chính xác cao của
mạng nơron có thể ứng dụng vào việc khắc độ tự động cũng như hiệu chỉnh
đường đặc tính của cảm biến khi sai số hệ thống vượt quá giới hạn cho phép.
Hình 3.14 : Đặc tính của cảm biến
100%
Đường giới hạn dưới
Đường giới hạn trên Đặc tính chuẩn y=f0(x)
Đường đặc tính thực tế y=fs(x)
x
y
80
Mạng nơron để khắc độ tự động cảm biến có thể được huấn luyện lại để
hiệu chỉnh đường đặc tính trong trường hợp sai số hệ thống vượt quá giới hạn
cho phép.
Ta có sơ đồ cấu trúc khắc độ tự động đặc tính của cảm biến sử dụng
mạng nơron như hình 3.15.
Hình 3.15: Cấu trúc cảm biến sử dụng mạng nơron để khắc độ tự động
Trong trường hợp không có sai số hệ thống, mạng nơron khắc độ cảm
biến cần phải được huấn luyện để xấp xỉ hàm đặc tính chuẩn x=f0(y). Khi cảm
biến có sai số hệ thống vượt quá giới hạn cho phép, mạng nơron cần được
huấn luyện lại để thực hiện việc bù sai số bằng cách xấp xỉ theo đường đặc
tính thực tế x=fs(y).
Với các giá trị mô phỏng **, kk YX đã tìm được ở bảng 3.2 và bảng 3.3
của mục 3.2.2, sử dụng mạng nơron có cấu trúc như sau để khắc độ tự động
đặc tính của cảm biến :
- Chọn mạng nơron truyền thẳng hai lớp.
- Lớp vào : một đầu vào và số nơron bằng giá trị tự nhiên làm tròn lớn
nhất của thang đo. Hàm truyền sử dụng cho lớp này là hàm sigmoid :
1
1
2)( −+= −neng hoặc neng −+= 1
1)(
- Lớp ra : có một đầu ra, một nơron với hàm truyền tuyến tính : nng =)( .
- Thuật học cho mạng nơron : Dùng thuật học lan truyền ngược.
Lưu đồ thuật toán quá trình học như hình 3.16.
CĐCH CB A/D
VXL
MNN Chỉ thị
số
Đối
tượng
đo x
y
xđo y
Bắt đầu
- Nhập điểm lấy mẫu
- Nhập mẫu học
- Nhập sai số học ε
81
Hình 3.16 : Lưu đồ thuật toán quá trình học
Kết quả mô phỏng :
Dựa trên các giá trị mô phỏng **, kk YX đã tìm được ở bảng 3.1 và bảng
3.2 của mục 3.2.2, sử dụng mạng nơron đã thiết kế để khắc độ đặc tính với sai
số học yêu cầu là 10-6. Ta có kết quả mô phỏng thể hiện trên các hình 3.17,
3.18 và 3.19.
82
Hình 3.18: Đường đặc tính chuẩn và đặc tính khắc độ bằng mạng nơron
+ Điểm lấy mẫu
-- Đặc tính khắc độ bằng mạng nơron
Đặc tính chuẩn
X
Y
Hình 3.17: Sai số học giảm dần khi tăng số chu kỳ học
i s
o
0 1 2 3 4 5 6 7 8 9 10
0
10
20
30
40
50
60
70
80
90
100
0.02
0.03
0 200 400 600 800 1000 1200 1400 1600 1800
10
-6
10
-4
10
-2
10
0
10
2
1964 Epochs
Tr
ai
ni
ng
-B
lu
e
G
oa
l-B
la
ck
Performance is 9.64924e-007, Goal is 1e-006
83
Nhận xét : Mạng nơron đã thiết kế để khắc độ tự động đặc tính của cảm
biến, dựa trên các giá trị lấy mẫu đã qua xử lý giảm sai số ngẫu nhiên, cho
phép đạt độ chính xác cao. Với yêu cầu sai số học là 10-6, sai số tương đối quy
đổi của đặc tính khắc độ bằng mạng nơron trong ví dụ này là 0,025%. Tuy
nhiên trong bài toán này thì sai số khắc độ bằng mạng nơron (0,025%) vẫn
lớn hơn sai số khắc độ bằng hàm Lagrange (0,006%).
Như vậy việc sử dụng phương pháp nội suy Lagrange để khắc độ tự
động đặc tính của thiết bị đo và cảm biến, dựa trên các giá trị lấy mẫu đã được
xử lý giảm sai số ngẫu nhiên bằng mạng nơron, cho độ chính xác cao. Ngoài
ra phương pháp này còn cho phép giảm khối lượng tính toán cũng như dung
lượng bộ nhớ chương trình và đơn giản, dễ ứng dụng trong thực tế.
84
Chương 4
ỨNG DỤNG MẠNG NƠRON ĐỂ HIỆU CHỈNH ĐẶC TÍNH
THANG ĐO CỦA CẢM BIẾN
4.1 Đặt vấn đề
Đường cong đặc tính của cảm biến x=f(y) là một hàm đơn trị, giữa x và
y có ánh xạ một-một. Ta có thể biểu diễn : y=f-1(x), f-1 là hàm ngược của f.
Giả sử đường đặc tính thực tế có phương trình là: x=f1(y) và đường đặc
tính lý thuyết của cảm biến có phương trình : x=f2(y). Ta ký hiệu x1 là giá trị
đo đúng và x2 là giá trị đo thực tế của cảm biến. Sơ đồ cấu trúc và các đường
đặc tính của cảm biến như hình 4.1.
Hình 4.1 : Sơ đồ cấu trúc và các đường đặc tính của cảm biến
Đường đặc tính thực tế có sai số so với đường đặc tính lý thuyết vượt quá
giới hạn cho phép do đó kết quả đo cần phải được hiệu chỉnh theo phương
trình: x1=f1(y)= f1( 12−f (x2))=ϕ(x2).
CB CĐCH A/D
VXL
Đối
tượng
đo
x1 y y x2
x1 =f1(y)
Đặc tính thực tế Đặc tính lý thuyết
x1=f1(y)= f1( 12−f (x2))=ϕ(x2)
x2=f2(y) hay
y= 12
−f (x2)
85
Theo lý thuyết mạng nơron ta có thể thực hiện xấp xỉ hoá hàm phi tuyến
x1=ϕ(x2) với độ chính xác tuỳ ý. Hàm x1=ϕ(x2) là hàm đơn trị, đồng biến hoặc
nghịch biến do đó để xấp xỉ hàm này ta có thể sử dụng mạng nơron hai lớp
sigmoid/linear. Mạng này có thể xấp xỉ hầu hết các hàm phi tuyến với độ
chính xác tùy ý nếu có đủ số nơron cần thiết. Ta có sơ đồ huấn luyện mạng
như hình 4.3.
Ở sơ đồ trên {x1} và {x2} là tập các giá trị đo của cảm biến chuẩn (xem
như là tập giá trị đúng) và cảm biến sai tương ứng. Tập {x2} là tập giá trị đầu
Đặc tính thực tế - (1)
Đường hiệu chuẩn (Đặc tính lý thuyết) – (2)
Ym= 100% Y
100% X
0
Y
2X
1X
Hình 4.2: Đường cong đặc tính thực tế và lý thuyết
Hình 4.3: Sơ đồ huấn luyện mạng nơron hiệu chỉnh sai số
Cảm biến sai
x1=ϕ(x2) x
1 {x2 } MNN
W
x1 ≈ ϕ(x2)
Đối
tượng
đo
Cảm biến
chuẩn
{x1 } +
86
vào và tập {x1} là tập giá trị đích dùng để huấn luyện mạng. Sau khi huấn
luyện mạng sẽ cho ra hàm xấp xỉ mong muốn x1=ϕ(x2).
Mạng nơron đặc biệt hữu hiệu trong việc hiệu chỉnh sai số hoặc tự động
khắc độ của hệ thống đo gồm nhiều điểm đo. Mạng này được thiết kế với một
đầu vào và nhiều đầu ra.
Trong tự động khắc độ nhiều cảm biến thì mỗi đầu ra thứ i tương ứng với
một chuyển đổi và hàm đặc tính của chuyển đổi thứ i: X=fi(Y).
Để hiệu chỉnh sai số ta cũng sử dụng cấu trúc mạng tương tự, đầu ra thứ i
tương ứng với hàm biến đổi hiệu chỉnh sai số: x1=ϕi (x2). Giả sử hệ thống đo
gồm n điểm đo cùng một đại lượng, ta có mô hình mạng nơron dùng để hiệu
chỉnh sai số:
Tín hiệu đo thực tế của các chuyển đổi x2 được đưa vào mạng nơron để
xấp xỉ hoá các hàm x1=ϕi (x2) đồng thời. Mạng nơron đã huấn luyện sẽ dùng
chung cho nhiều chuyển đổi.
Y
X=f1 (Y).
X=f2 (Y).
X=fn (Y).
MNN
Hình 4.4: Khắc độ cảm biến bằng mạng nơron
MNN x
2
x1=ϕ1 (x2).
x1=ϕ2 (x2).
x1=ϕn (x2).
Hình 4.5: Hiệu chỉnh sai số cảm biến bằng mạng nơron
87
4.2 Hiệu chỉnh đặc tính thang đo của cảm biến sử dụng mạng nơron
Xét bài toán thực tế :
Đo điện áp xoay chiều từ 0-1000 V và đưa ra chỉ thị số kết quả đo đảm
bảo sai số hệ thống nhỏ hơn 0.5%. Giả sử chuyển đổi chuẩn hóa có điện áp
đầu vào từ 0-500V và cho điện áp đầu ra là 0-5VDC. Ta cần dùng biến áp có
tỉ số biến k (k=2) để biến đổi điện áp 0-1000 V thành 0-500 V để đưa vào
biến truyền. Thực tế biến áp không thể đạt cấp chính xác trên toàn thang đo,
do đó tỉ số biến không phải là hằng số mà có thể là một hàm số gần bằng k.
Kết quả đo tính toán theo tỉ số biến k có thể mắc phải một sai số vượt quá giới
hạn cho phép. Ta có thể sử dụng mạng nơron để tiến hành hiệu chuẩn đường
cong đặc tính thực tế về đường cong đặc tính lý thuyết với một độ chính xác
tuỳ ý.
Giả sử biến áp thực tế có quan hệ vào/ra : Uv1=0.004 2rU
Với k=2 ta có đường đặc tính lý thuyết : Uv2=2Ur
Hình 4.7 : Đường đặc tính lý thuyết và đặc tính thực tế
0 50 100 150 200 250 300 350 400 450 500
0
100
200
300
400
500
600
700
800
900
1000
Uv2
Uv1
Ur
Đặc tính lý thuyết
Đặc tính thực tế
CĐCH
A/D
0-5VDC 0-500V 0-1000V
VXL Chỉ
thị số
Hình 4.6: Sơ đồ đo điện áp
Uv Ur
88
Ta có hàm chuyển đổi để biến đổi đường cong lý thuyết về đường cong
thực tế: Uv1=0.001 22vU với Uv2 từ 0÷1000V.
Hệ thống đo với những giả thiết như trên mắc phải sai số 12.5%. Sử
dụng mạng nơron được huấn luyện bởi tập các giá trị Uv1 và Uv2 tương ứng sẽ
cho ra kết quả xấp xỉ hàm chuyển đổi đảm bảo sai số cho phép.
+ Xây dựng mạng nơron :
- Lớp vào : một đầu vào và số nơron bằng giá trị tự nhiên làm tròn lớn
nhất của thang đo. Hàm truyền sử dụng cho lớp này là hàm sigmoid :
1
1
2)( −+= −neng hoặc neng −+= 1
1)(
- Lớp ra : có một đầu ra, một nơron với hàm truyền tuyến tính : nng =)( .
- Thuật học cho mạng nơron : Dùng thuật học lan truyền ngược.
Lưu đồ thuật toán quá trình học như hình 4.8
Bắt đầu
- Nhập số điểm lấy mẫu
- Nhập mẫu học
- Nhập sai số học ε
- Cập nhật trọng theo thuật
toán lan truyền ngược
- Tính sai lệch Emới
Emới≤ ε
- Mô phỏng kết quả qua
mạng đã huấn luyện
- Vẽ đồ thị
- Lưu kết quả
Kết thúc
sai
đúng
89
Kết quả mô phỏng :
Mạng nơron được huấn luyện với yêu cầu sai số học là 10-10. Ta có kết
quả sai số tương đối quy đổi giảm dần khi tăng số điểm lấy mẫu như bảng 4.1
và hình 4.9
Bảng 4.1 : Kết quả mô phỏng sai số phụ thuộc số điểm lấy mẫu
Số điểm lấy mẫu N Số chu kỳ học Sai số %
5 606 1.107
6 724 0.723
7 1207 0.096
8 1800 0.029
Hình 4.8: Lưu đồ thuật toán quá trình học để hiệu chỉnh đường đặc tính
90
9 1844 0.021
10 1256 0.008
Hình 4.9 : Sai số tương đối quy đổi giảm dần khi tăng số điểm lấy mẫu
Số điểm lấy mẫu cần thiết để đạt sai số yêu cầu 0.5% là N=7. Với N =7
ta có các kết quả thể hiện trên các hình 4.10, 4.11 và 4.12.
Hình 4.10 : Sai số học giảm dần khi tăng số chu kỳ học
Sa
i s
o
%
N
0 200 400 600 800 1000 1200
10-15
10-10
10
-5
10
0
1207 Epochs
Tr
ai
ni
ng
-B
lu
e
G
oa
l-B
la
ck
Performance is 4.34745e-018, Goal is 1e-010
91
Mạng xấp xỉ gần đúng đường cong chuyển đổi Uv1=0.001 22vU tạo thành
một đường cong như trên hình 4.11 sau :
Hình 4.11 : Đường cong xấp xỉ hàm bằng mạng nơron và đường cong
chuyển đổi
Hình 4.12 : Đường sai số giữa đường cong xấp xỉ bằng mạng nơron và
đường cong chuyển đổi
Uv2
Uv1
0 100 200 300 400 500 600 700 800 900 1000
-0.2
0
0.2
0.4
0.6
0.8
1
1.2
Sa
i s
o
Uv2
+ Điểm lấy mẫu
-- Đường chuyển đổi
Đường xấp xỉ bằng mạng nơron
92
Nhận xét : Hệ thống đo sử dụng mạng nơron để hiệu chỉnh sai số của bài
toán trên đã giảm được sai số của hệ thống từ 12.5% xuống còn 0.096 % đảm
bảo nằm trong giới hạn sai số 0.5% cho phép chỉ với 7 điểm lấy mẫu. Như
vậy việc ứng dụng mạng nơron để hiệu chỉnh sai số của cảm biến, kể cả
những cảm biến mắc phải sai số lớn, cho độ chính xác cao.
93
Chương 5
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN CỦA ĐỀ TÀI
Nội dung của luận văn này là ứng dụng mạng nơron nhân tạo để khắc độ
tự động thiết bị đo và cảm biến. Luận văn đã trình bày tổng quan các phương
pháp khắc độ thiết bị đo và cảm biến bao gồm khắc độ dụng cụ đo tương tự,
khắc độ dụng cụ đo có sử dụng vi xử lý hoặc máy tính và khắc độ chuyển đổi
đo lường sơ cấp. Phần lý thuyết cơ sở của mạng nơron đã trình bày những
hiểu biết về nơron sinh học đến khái niệm mạng nơron nhân tạo, nêu ra những
mạng nơron nhân tạo với các thuật học làm cơ sở cho các nghiên cứu ứng
dụng mạng nơron trong việc chế tạo cảm biến thông minh.
Luận văn đã nghiên cứu ứng dụng mạng nơron trong việc xử lý số liệu
nhằm giảm sai số ngẫu nhiên, nêu ra được số lớp của mạng, số nơron và thuật
học ứng dụng cho việc xử lý số liệu đo. Từ số liệu đã được xử lý, chúng tôi đề
xuất việc sử dụng hàm Lagrange để xây dựng đường đặc tính đi qua tất cả
những điểm lấy mẫu. Phưong pháp này cho phép giảm khối lượng tính toán
cũng như bộ nhớ chương trình và đơn giản hơn so với những phương pháp
thông thường. Với những kết quả thu được có thể áp dụng vào công nghệ chế
tạo cảm biến và thiết bị đo để nâng cao độ chính xác của chúng.
Khắc độ tự động cảm biến dựa trên nguyên lý xấp xỉ hàm phi tuyến bằng
mạng nơron đã được nghiên cứu trong luận văn cho ra những kết quả rất khả
quan.
Đồng thời luận văn cũng đề cập đến việc hiệu chỉnh đặc tính thang đo
của cảm biến đảm bảo sai số cho phép. Mạng được sử dụng là mạng hai lớp
với hàm truyền Sigmoid/linear cho phép xấp xỉ hầu hết các hàm phi tuyến với
độ chính xác tùy ý.
Do thời gian và điều kiện còn hạn chế nên luận văn mới dừng lại ở mức
mô phỏng bằng phần mềm trên máy tính, chưa được ứng dụng trong thực tế.
Nhưng cũng đã đề xuất được những hướng nghiên cứu cụ thể cho phép áp
dụng vào việc chế tạo cảm biến thông minh trong tương lai không xa.
94
Ứng dụng mạng nơron để xử lý số liệu đo nhằm giảm sai số ngẫu nhiên
cho phép ứng dụng không chỉ trong cảm biến thông minh mà còn có thể ứng
dụng cho các thiết bị đo tương tự, thiết bị đo s
Các file đính kèm theo tài liệu này:
- Nghin c7913u 7913ng d7909ng m7841ng n417ron cho kh7855c 2737897 damp.pdf