Tài liệu Ứng dụng Dempster - Shafer xây dựng mô hình suy luận: Kỹ thuật điều khiển & Điện tử
B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 90
ỨNG DỤNG DEMPSTER - SHAFER
XÂY DỰNG MÔ HÌNH SUY LUẬN
Bùi Công Thành1*, Vũ Tuấn Anh1 , Hoàng Trung Kiên 2
Tóm tắt: Bộ não của con người xử lý, phân tích dữ liệu thu thập từ các giác quan
để nhận biết sự vật hiện tượng xung quanh. Theo cách đó, lĩnh vực nghiên cứu kỹ
thuật kết hợp thông tin từ nhiều nguồn (Multiple Sensor Data Fusion) đã được đẩy
mạnh nghiên cứu để nâng cao độ chính xác trong suy diễn, ra quyết định. Bài báo
trình bày kết quả nghiên cứu, ứng dụng lý thuyết Dempster Shafer (D-S) xây dựng mô
hình tự suy luận, kết quả thực nghiệm với bộ dữ liệu Iris cho thấy mô hình có khả
năng ra quyết định với độ chính xác cao, góp phần bổ sung cho lý thuyết đã đề xuất.
Keywords: Dempster-Shafer, D-S, Theory of Evidence, Multiple Sensor Data Fusion.
1. GIỚI THIỆU CHUNG
Tổng hợp dữ liệu từ nhiều nguồn (THDLNN) là một kỹ thuật cho phép kết hợp các ...
8 trang |
Chia sẻ: quangot475 | Lượt xem: 284 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Ứng dụng Dempster - Shafer xây dựng mô hình suy luận, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỹ thuật điều khiển & Điện tử
B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 90
ỨNG DỤNG DEMPSTER - SHAFER
XÂY DỰNG MÔ HÌNH SUY LUẬN
Bùi Công Thành1*, Vũ Tuấn Anh1 , Hoàng Trung Kiên 2
Tóm tắt: Bộ não của con người xử lý, phân tích dữ liệu thu thập từ các giác quan
để nhận biết sự vật hiện tượng xung quanh. Theo cách đó, lĩnh vực nghiên cứu kỹ
thuật kết hợp thông tin từ nhiều nguồn (Multiple Sensor Data Fusion) đã được đẩy
mạnh nghiên cứu để nâng cao độ chính xác trong suy diễn, ra quyết định. Bài báo
trình bày kết quả nghiên cứu, ứng dụng lý thuyết Dempster Shafer (D-S) xây dựng mô
hình tự suy luận, kết quả thực nghiệm với bộ dữ liệu Iris cho thấy mô hình có khả
năng ra quyết định với độ chính xác cao, góp phần bổ sung cho lý thuyết đã đề xuất.
Keywords: Dempster-Shafer, D-S, Theory of Evidence, Multiple Sensor Data Fusion.
1. GIỚI THIỆU CHUNG
Tổng hợp dữ liệu từ nhiều nguồn (THDLNN) là một kỹ thuật cho phép kết hợp các
thông tin từ nhiều nguồn nhằm mục đích cải tiến hiệu suất của hệ thống [5]. Theo Siaterlis
and Maglaris [2004], THDLNN là các bước xử lý dữ liệu thu thập từ nhiều nguồn thông
tin thành một nguồn với mức độ thông tin tổng quát hơn, có nghĩa hơn. Theo Bass [1],
THDLNN là một hướng nghiên cứu về các kỹ thuật để xử lý thông tin từ nhiều nguồn
khác nhau, loại thông tin khác nhau để giúp suy diễn một sự kiện, nhận định rõ hơn một
tình huống. Rất nhiều phương pháp THDLNN đã được nghiên cứu nhằm mục đích nâng
cao độ chính xác trong ra quyết định, ứng dụng trong nhiều lĩnh vực như chỉ huy chiến
trường; an ninh mạng; chuẩn đoán y học, sinh học; giám sát môi trường; đo lường, tự động
hóa,
Một trong số các hướng nghiên cứu THDLNN là việc ứng dụng lý thuyết D-S, hiện
đang được rất nhiều nhà nghiên cứu quan tâm [3]. Lý thuyết D-S được giới thiệu từ 1968
bởi tác giả Arthur Dempster và phát triển bởi Glenn Shafer. Lý thuyết D-S đưa ra một nền
tảng mở trong ứng dụng để tạo ra mô hình ra quyết định dựa trên các suy luận không chắc
chắn thu thập được. Theo Shafer [2], lập luận của lý thuyết D-S dựa trên hai ý tưởng chính:
Mức độ của “niềm tin” cho mỗi giả thuyết trong tập tất cả các giả thuyết được đưa ra cho
một vấn đề và hàm kết hợp (Dempster’s Rule), là phương pháp xác định “độ tin” khi kết
hợp nhiều niềm tin hay giả thuyết với nhau. Lý thuyết D-S đề xuất phương án khả thi
trong tính toán đưa ra kết luận dựa vào các lập luận không chắc chắn. Thuật toán chạy
không cần thông tin về tri thức ban đầu của hệ thống do vậy đặc biệt phù hợp cho ứng
dụng để nhận dạng, phát hiện bất thường.
2. LÝ THUYẾT DEMPSTER SHAFER
2.1. Định nghĩa
Tập F, hoặc FoD (Frame of Discernment) là tập hợp tất cả các trạng thái có thể của một
hệ thống nào đó, ta có tập hàm mũ là tập chứa tất cả các tập con của F [2] . Tập đôi
khi còn được gọi là tập giả thuyết hoặc tập dẫn chứng.
Ví dụ: F = { a, b, c}. Tập hàm mũ là tập chứa tất cả các tập con của F. Ta được:
= { , a, b, c, ab, ac, bc, abc }
Tùy theo đặc trưng của từng hệ thống cụ thể mà tập F có thể rất khác nhau. Chẳng hạn
như trong hệ thống phân lớp dữ liệu, tập F chính là tập các nhãn lớp khác nhau. Hoặc
trong các hệ thống phát hiện xâm nhập mạng, tập F chỉ đơn giản là trạng thái mạng bình
thường hoặc mạng bị tấn công.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 50, 08 - 2017 91
Lý thuyết D-S sử dụng một hàm để gán một mức độ “niềm tin” vào mỗi phần tử của
tập hàm mũ. Hàm đó được gọi là Hàm niềm tin cơ bản (Basic Belief Assignment – BBA),
có thể gọi tắt là hàm niềm tin:
m: → [0,1]
Với mỗi nguồn thông tin cung cấp các phần tử (giả thuyết) của tập , ta sẽ có hàm
niềm tin tương ứng là , i = 1,n. Hàm niềm tin của D-S có hai tính chất:
- Khối niềm tin của tập rỗng là bằng 0
m( ) = 0
- Khối niềm tin của tất cả các tập con còn lại cộng vào với nhau có tổng bằng 1.
= 1
Khối niềm tin của một tập con A nào đó, m(A), chỉ liên quan tới bản thân tập A nhưng
không liên quan đến bất kỳ tập con nào nằm trong A. Do vậy, có thể tìm được giới hạn
trên và giới hạn dưới cho một khoảng xác suất nào đó của tập con A. D-S đưa ra hai khái
niệm độ tin (belief) và độ hợp lý (plausibility) để tính các giới hạn đó:
Bel(A) =
Pl(A) =
Một hàm BBA có thể được coi như là việc xác định một tập các xác suất P cho các
phần tử (giả thuyết) của tập sao cho:
Bel(A) ≤ P(A) ≤ Pl(A)
Ngoài ra, mối liên hệ giữa hàm m, Bel và Pl còn được thể hiện qua công thức:
Pl(A)=1-bel( )
m(A)=
với |A -B |làsố phần tử khác nhau giữa tập A và B[5].
Vì vậy, chỉ cần xác định được một trọng ba tham số m, Bel và Pl là có thể suy ra hai
tham số còn lại.
2.2. Luật kết hợp – Dempster’s Rule
Luật kết hợp là phương pháp xác định độ tin tổng hợp khi kết hợp các dẫn chứng khác
nhau. Phương trình kết hợp[2], độ tin của hai dẫn chứng được thể hiện như sau:
( ) = 0
(A) = ( ) (A) = (1)
K =
Trong đó:
là thành phần tử số của hàm kết hợp
K được gọi là thước đo mức độ xung đột giữa hai giả thuyết
1 - K là thành phần mẫu số của hàm kết hợp
3. MÔ HÌNH THDLNN ỨNG DỤNG D-S
3.1. Mô hình tổng quát
Xét một hệ thống có n nguồn thông tin cùng không gian xác định , m là số chiều
của không gian đó. Với mỗi nguồn, có thể không có đầy đủ m tính chất, giá trị của các tính
chất này thể hiện đặc trưng của nguồn thông tin đó.
Kỹ thuật điều khiển & Điện tử
B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 92
Mỗi nguồn vào thứ i ứng với giá trị , với ϵ , độ tin cậy của nguồn thể hiện
bằng phân bố xác suất . Xác suất là xác suất của trên .
Mô hình THDLNN là mô hình có nhiệm vụ tìm ra hàm f: → (đơn giản là từ
n đầu vào thành 1 kết quả đầu ra). Bài toán có thể được mô tả tóm tắt như sau:
Input: ( n nguồn thông tin x, dữ liệu x ϵ )
Output: Luật f thỏa mãn: →
Hình 1. Mô hình THDLNN tổng quát.
3.2. Xây dựng mô hình ứng dụng lý thuyết D-S
Mô hình đề xuất áp dụng cho các bài toán phân biệt loại đối tượng dựa vào các thuộc
tính đặc trưng, thuộc tính này đã được quy ra giá trị thuộc không gian R1, các giá trị đặc
trưng này sẽ thể hiện đối tượng này là ai trong số các nhóm đối tượng đã biết. Mô hình đề
xuất để áp dụng D-S trong trường hợp này như sau:
Hình 2. Mô hình THDLNN áp dụng lý thuyết D-S.
Mô hình 2 xác định các ngưỡng từ nhiều nguồn thông tin, từ đó xác định các trạng thái
cho dữ liệu kiểm tra và kết hợp các trạng thái thu được sử dụng luật kết hợp D-S để tìm ra
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 50, 08 - 2017 93
một trạng thái đơn làm kết quả phân loại cho dữ liệu. Trong trường hợp sau, khi sử dụng
luật kết hợp vẫn chưa tìm được trạng thái đơn, mô hình sẽ sử dụng thêm phương pháp
dụng phương pháp lựa chọn duy nhất của Chen S. và cộng sự [6] (Chen-Rule) để tìm ra
trạng thái đơn đó.
Đầu vào của mô hình 2 là hai tập dữ liệu: Dữ liệu huấn luyện và Các nguồn dữ liệu
kiểm tra.
Khối Nguồn: Từ tập dữ liệu huấn luyện, mô hình sẽ xác định các ngưỡng tương ứng
với từng nguồn thông tin. Trong trường hợp này ngưỡng là các giá trị min, max, còn
nguồn thông tin là các giá trị trong từng thuộc tính của dữ liệu kiểm tra.
Khối Xác định các trạng thái: Các ngưỡng thu được từ Nguồn sẽ được sử dụng để xác
định tập các trạng thái cho dữ liệu kiểm tra. Tập các trạng thái này là tập con của tập các
trạng thái trong không gian .
Khối Bộ kết hợp sử dụng luật kết hợp D-S: Tập các trạng thái đã xác định được được
đưa vào bộ kết hợp sử dụng luật D-S theo công thức (1). Kết quả thu được sẽ chỉ còn là
một trạng thái thuộc không gian .
Khối Ra quyết định thực hiện kiểm tra trạng thái thu được từ Bộ kết hợp sử dụng luật
kết hợp D-S. Nếu trạng thái thu được là trạng thái rỗng (hoàn toàn không), khi đó hệ thống
hoàn toàn không ra được quyết định cuối cùng; nếu đầu ra cho kết quả là trạng thái đơn
(có) thì đưa ra quyết định và kết thúc; nếu đầu ra là trạng thái tổ hợp (chưa chắc chắn) thì
chuyển trạng thái sang khối Bổ sung hỗ trợ ra quyết định.
Khối Bổ sung hỗ trợ ra quyết định sử dụng phương pháp lựa chọn duy nhất của Chen-
Rule để chuyển một trạng thái tổ hợp (chưa chắc chắn) thành một trạng thái đơn. Sau mỗi
lần gọi Chen-Rule, quá trình sẽ tự động cập nhật lại các ngưỡng.
Phương pháp lựa chọn duy nhất của Chen-Rule theo công thức sau:
= (2)
Trong đó:
: Là giá trị Chen-Rule cho thuộc tính thứ j
: Là độ lệch chuẩn của lớp trong thuộc tính thứ j.
j = 1m với m là số thuộc tính.
i = 1n với n là số lớp
Theo lý thuyết Chen-Rule, tại mỗi thuộc tính được xét, tính giá trị trung bình của tập
giá trị của mỗi loại đối tượng. Cuối cùng, tính độ lệch của giá trị đang xét tại đặc trưng
được chọn so với giá trị trung bình của tập giá trị của mỗi loại đối tượng đã tìm. Loại đối
tượng có độ lệch nhỏ nhất được lựa chọn làm kết quả nhận dạng cho dữ liệu đang xét.
4. CÀI ĐẶT THỬ NGHIỆM MÔ HÌNH
4.1. Bộ dữ liệu thử nghiệm
Để kiểm nghiệm mô hình, tập dữ liệu Iris [10] được sử dụng. Đây là bộ dữ liệu do
Ronald Fisher phát minh, gồm có 150 bản ghi mô tả dữ liệu cụ thể cho bốn thuộc tính của
hoa Iris là độ dài đài hoa (Sepal Length), độ rộng đài hoa (Sepal Width), độ dài cánh hoa
(Petal Length) và độ rộng cánh hoa (Petal Width), tất cả đều được đo theo đơn vị cen-ti-
mét (cm). Dữ liệu được phân thành 3 lớp, đặt tên theo ba loài hoa Iris là Iris Setosa, Iris
Versicolor, và Iris Virginica; mỗi lớp chứa 50 bản ghi. Theo lý thuyết D-S, không gian F =
{Iris Setosa, Iris Versicolour, Iris Virginica}.
Kỹ thuật điều khiển & Điện tử
B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 94
4.2. Kết quả thử nghiệm
Kết quả thử nghiệm thu được sẽ tập trung vào việc trình bày mức độ hiệu quả của việc
ứng dụng phương pháp D-S và mức độ nhận dạng chính xác các dữ liệu cần nhận dạng
trong từng trường hợp lựa chọn ngẫu nhiên. Mức độ hiệu quả của việc ứng dụng phương
pháp D-S dựa vào thước đo số “trạng thái đơn”, số “trạng thái tổ hợp”, số trạng thái tổ hợp
đúng (là các trạng thái tổ hợp có chứa kết quả đúng trong nó), số trạng thái tổ hợp sai (là
các trạng thái tổ hợp không có chứa kết quả đúng trong nó). Còn mức độ nhận dạng chính
xác dữ liệu được thể hiện qua các thước đo số phân loại đúng, số phân loại sai và độ chính
xác (số phân loại đúng / số phân loại sai).
a. Phiên thử nghiệm thứ nhất
Chi tiết số thứ tự các bản ghi dữ liệu được lựa chọn cho quá trình huấn luyện được liệt
kê trong bảng 1.
Bảng 1. Tập số thứ tự của 20 bản ghi ngẫu nhiên cho mỗi lớp.
Lớp Tập các số thứ tự
Iris Setosa 7, 44, 22, 36, 48, 18, 21, 12, 9, 49, 17, 13, 34, 21, 19, 44, 43, 42, 13,
23
Iris Versicolor 58, 98, 93, 59, 80, 70, 88, 71, 91, 75, 66, 54, 57, 50, 51, 82, 78, 86, 90,
80
Iris Virginica 146, 118, 141, 119, 128, 124, 115, 120, 100, 139, 122, 114, 107, 148,
131, 140, 139, 137, 135, 146
Kết quả thu được cho quá trình kiểm thử thứ nhất với toàn bộ dữ liệu Iris thể hiện tại
bảng 2 và bảng 3.
Bảng 2. Kết quả thu được sau khi sử dụng “Bộ kết hợp sử dụng luật kết hợp D-S”.
Lớp Số trạng
thái đơn
Số trạng thái
tổ hợp
Số trạng thái tổ
hợp đúng
Số trạng thái tổ
hợp sai
Iris Setosa 50 0 0 0
Iris Versicolor 49 1 1 0
Iris Virginica 50 0 0 0
Bảng 3. Kết quả suy luận của mô hình trong phiên thử thứ nhất.
Lớp Số phân loại đúng Số phân loại sai Độ chính xác (%)
Iris Setosa 50 0 100
Iris Versicolor 47 3 94
Iris Virginica 44 6 88
b. Phiên thử nghiệm thứ hai
Chi tiết số thứ tự các bản ghi dữ liệu được lựa chọn cho quá trình huấn luyện được liệt
kê trong bảng 4.
Bảng 4. Tập số thứ tự của 30 bản ghi ngẫu nhiên cho mỗi lớp.
Lớp Tập các số thứ tự
Iris Setosa 3, 6, 47, 38, 20, 46, 5, 26, 6, 30, 43, 31, 0, 16, 39, 18, 36, 13, 32, 23,
44, 10, 7, 1, 46, 46, 30, 30, 0, 9
Iris Versicolor 81, 94, 91, 64, 58, 83, 68, 93, 66, 88, 53, 77, 59, 77, 63, 63, 60, 77, 70,
55, 85, 93, 99, 75, 80, 68, 52, 62, 76, 85
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 50, 08 - 2017 95
Iris Virginica 105, 128, 110, 123, 107, 149, 114, 143, 106, 113, 112, 129, 134, 146,
122, 122, 121, 111, 149, 109, 100, 103, 122, 141, 114, 127, 106, 129,
116, 142
Kết quả thu được cho quá trình kiểm thử thứ nhất với toàn bộ dữ liệu Iris thể hiện tại
bảng 5 và bảng 6.
Bảng 5. Kết quả thu được sau khi sử dụng “Bộ kết hợp sử dụng luật kết hợp D-S”.
Lớp
Số trạng
thái đơn
Số trạng
thái tổ hợp
Số trạng thái tổ
hợp đúng
Số trạng thái tổ
hợp sai
Iris Setosa 50 0 0 0
Iris Versicolor 34 16 16 0
Iris Virginica 43 7 7 0
Bảng 6. Kết quả suy luận của mô hình sau phiên thử thứ hai.
Lớp Số phân loại đúng Số phân loại sai Độ chính xác (%)
Iris Setosa 50 0 100
Iris Versicolor 47 3 94
Iris Virginica 48 2 96
c. Phiên thử nghiệm thứ ba
Chi tiết số thứ tự các bản ghi dữ liệu được lựa chọn cho quá trình huấn luyện được liệt
kê trong bảng 7.
Bảng 7. Tập số thứ tự của 40 bản ghi ngẫu nhiên cho mỗi lớp.
Lớp Tập các bản ghi ngẫu nhiên
Iris Setosa 35, 43, 20, 0, 4, 28, 11, 8, 40, 9, 4, 8, 23, 43, 35, 23, 19, 24, 44, 26, 36,
23, 40, 28, 22, 15, 38, 41, 27, 34, 3, 34, 11, 30, 39, 7, 1, 46, 11, 35
Iris Versicolor 90, 81, 71, 98, 70, 58, 89, 53, 98, 82, 82, 97, 89, 98, 86, 91, 91, 74, 83,
79, 73, 98, 83, 52, 59, 69, 64, 80, 69, 52, 61, 97, 97, 93, 59, 54, 65, 93,
86, 69
Iris Virginica 134, 133, 130, 147, 148, 119, 101, 133, 118, 120, 143, 102, 148, 147,
128, 117, 136, 118, 143, 135, 129, 101, 100, 115, 145, 139, 123, 105,
117, 132, 105, 147, 103, 138, 106, 105, 115, 112, 149, 108
Kết quả thu được cho quá trình kiểm thử thứ nhất với toàn bộ dữ liệu Iris thể hiện tại
bảng 8 và bảng 9.
Bảng 8. Kết quả thu được sau khi sử dụng “Bộ kết hợp sử dụng luật kết hợp D-S”.
Lớp Số trạng
thái đơn
Số trạng
thái tổ hợp
Số trạng thái tổ
hợp đúng
Số trạng thái tổ
hợp sai
Iris Setosa 50 0 0 0
Iris Versicolor 34 16 16 0
Iris Virginica 43 7 7 0
Bảng 9. Kết quả suy luận của mô hình sau phiên thử thứ ba.
Lớp Số phân loại đúng Số phân loại sai Độ chính xác (%)
Iris Setosa 50 0 100
Iris Versicolor 46 4 92
Kỹ thuật điều khiển & Điện tử
B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 96
Iris Virginica 49 1 98
Bảng 10. Kết quả so sánh giữa các phương pháp [8].
Phương pháp Tỷ lệ khẳng định
đúng (True
Positive Rate)
Tỷ lệ khẳng định
sai (False Positive
Rate)
Độ chính
xác
Mô hình ứng dụng D-S đề xuất
(dữ liệu huấn luyện = 20)
0,96 0,02 0,96
Mô hình ứng dụng D-S đề xuất
(dữ liệu huấn luyện = 30)
0,96 0,02 0,96
Mô hình ứng dụng D-S đề xuất
(dữ liệu huấn luyện = 40)
0,966 0,016 0,966
Mô hình ứng dụng D-S đề
xuất(dữ liệu huấn luyện = 50)
0,973 0,013 0,973
DecisionStump 0,667 0,167 0.5
MultilayerPerceptron 0,973 0,013 0,973
NaiveBayes 0,96 0,02 0,96
MultiClassClassifier 0,96 0,02 0,96
Theo kết quả trên cho thấy mô hình đề xuất cho khả năng suy luận với độ chính xác cao
khi so sánh với các phương pháp phân loại phổ biến hiện có [8]. Đặc biệt, khi sử dụng cùng
bộ dữ liệu huấn luyện và kiểm tra cho mô hình, kết quả suy luận của mô hình suy luận ứng
dụng D-S có độ chính xác tương đương với phương pháp MultilayerPerceptron. Và cả hai
phương pháp này đều là hai phương pháp có tỷ lệ nhận dạng đạt độ chính xác cao hơn so
với các phương pháp còn lại (0,973).
5. KẾT LUẬN
Trong lĩnh vực THDLNN, lý thuyết Dempster Shafer là lý thuyết dựa trên các dẫn
chứng, đã được nghiên cứu ứng dụng rất nhiều trong tất cả các lĩnh vực. Một trong những
vấn đề khó khăn lớn nhất trong áp dụng D-S cho các mô hình suy luận đó là xác định
không gian giả thuyết. Tại Việt Nam, lý thuyết D-S chưa được nghiên cứu nhiều, khó khăn
trong ứng dụng D-S.
Bài viết đã trình bày kết quả nghiên cứu lý thuyết D-S và ứng dụng cho xây dựng mô
hình nhận suy luận dựa vào các thuộc tính đặc trưng đầu vào. Kết quả thử nghiệm với bộ
dữ liệu Iris cho thấy mô hình hoạt động bình thường và cho kết quả suy luận với độ chính
xác cao. Qua thực nghiệm cho thấy D-S cho kết quả suy luận có thể chưa ra kết quả cuối
cùng nhưng vẫn theo đúng hướng duy diễn vì trong tập các giả thuyết còn lại vẫn chứa giả
thuyết cuối cùng của vấn đề cần kết luận. Điều này mở đường cho việc nghiên cứu để đưa
ra một mô hình tối ưu trong ra quyết định dựa trên các dẫn chứng thu thập được từ các
nguồn thông tin khác nhau.
TÀI LIỆU THAM KHẢO
[1]. Tim Bass, “Intrusion detection systems and multisensor data fusion”,
Communications of the ACM, Vol.43, 2000.
[2]. Shafer, G. “A mathematical theory of evidence”, Princeton U.P., Princeton, N .J., 1976.
[3]. C. Siaterlis and B. Magiaris, "Towards Multisensor Data Fusion for DoS Detection,"
The Proceedings of the 2004 ACM symposium on Applied Computing, 2004
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 50, 08 - 2017 97
[4]. Ciza Thomas and N. Balakrishnan, “Mathematical Analysis of Sensor Fusion for
Intrusion Detection Systems”, Indian Institute of Science, Bangalore, 2009.
[5]. Ren C.Luo, Chh Chen Yih, “MultilSensor Fusion and Integration: Approaches”,
Application and Future Research Directions, IEEE Proceedings of the International
Conference on avanced Robotics, 2005.
[6]. Chen S. and Fang. Y, “A new approach for handling the iris data classification
problem”, International Journal of Applied Science and Engineering, 2005.
[7]. A. Orlandi, “Feature Selection Validation for validation of computational
electromagnetic”, IEEE Transactions on Electromagnetic Compatibility Volume
48, 2006.
[8]. Kanu Patel, Jay Vala, Jaymit Pandya, “Comparison of various classification
algorithms on iris datasets using Weka”, International journal of Advance
Engineering and Research Development (IJAERD), Volume 1 Issue 1, February
2014, ISSN: 2348 - 4470
[9]. Trần Thuận Hoàng, “Nghiên cứu phương pháp tổng hợp cảm biến dùng cho kỹ thuật
dẫn đường các Robot di động”, Luận án Tiến sĩ, Trường Đại học Công nghệ - Đại
học Quốc Gia Hà Nội, 2013.
[10]. “Machine Learning with Iris Dataset. February”, 2017. URL: https://rstudio-
pubsstatic.s3.amazonaws.com/202738_7cad2477d76b4acc82b44244f94ccfa8.html#/
ABSTRACT
AN MODEL-BASED INFERENCE AND DECISION MAKING
USING DEMPSTER SHAFER THEORY
The human brain recognize the surrounded phenomena by processing and
analyzing data collected from the senses. In the same way, multiple sensor data
fusion has been intensified to improve accuracy of inference and decision making.
The article presents results and application of Dempster Shafer (DS) theory to
construct the self-reasoning model. The empirical results on the Iris dataset show
that the model has the ability to make decisions with high accuracy which
contribute to the proposed theory.
Keywords: Dempster-Shafer, D-S, Theory of Evidence, Multiple Sensor Data Fusion.
Nhận bài ngày 12 tháng 5 năm 2017
Hoàn thiện ngày 04 tháng 7 năm 2017
Chấp nhận đăng ngày 18 tháng 8 năm 2017
Địa chỉ: 1 Binh chủng Thông tin liên lạc;
2 Học viện Kỹ thuật quân sự.
*Email: kienht74@gmail.com.
Các file đính kèm theo tài liệu này:
- 12_kien_1632_2151713.pdf