Ứng dụng Dempster - Shafer xây dựng mô hình suy luận

Tài liệu Ứng dụng Dempster - Shafer xây dựng mô hình suy luận: Kỹ thuật điều khiển & Điện tử B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 90 ỨNG DỤNG DEMPSTER - SHAFER XÂY DỰNG MÔ HÌNH SUY LUẬN Bùi Công Thành1*, Vũ Tuấn Anh1 , Hoàng Trung Kiên 2 Tóm tắt: Bộ não của con người xử lý, phân tích dữ liệu thu thập từ các giác quan để nhận biết sự vật hiện tượng xung quanh. Theo cách đó, lĩnh vực nghiên cứu kỹ thuật kết hợp thông tin từ nhiều nguồn (Multiple Sensor Data Fusion) đã được đẩy mạnh nghiên cứu để nâng cao độ chính xác trong suy diễn, ra quyết định. Bài báo trình bày kết quả nghiên cứu, ứng dụng lý thuyết Dempster Shafer (D-S) xây dựng mô hình tự suy luận, kết quả thực nghiệm với bộ dữ liệu Iris cho thấy mô hình có khả năng ra quyết định với độ chính xác cao, góp phần bổ sung cho lý thuyết đã đề xuất. Keywords: Dempster-Shafer, D-S, Theory of Evidence, Multiple Sensor Data Fusion. 1. GIỚI THIỆU CHUNG Tổng hợp dữ liệu từ nhiều nguồn (THDLNN) là một kỹ thuật cho phép kết hợp các ...

8 trang | Chia sẻ: quangot475 | Lượt xem: 348 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Ứng dụng Dempster - Shafer xây dựng mô hình suy luận, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Kỹ thuật điều khiển & Điện tử B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 90 ỨNG DỤNG DEMPSTER - SHAFER XÂY DỰNG MÔ HÌNH SUY LUẬN Bùi Công Thành1*, Vũ Tuấn Anh1 , Hoàng Trung Kiên 2 Tóm tắt: Bộ não của con người xử lý, phân tích dữ liệu thu thập từ các giác quan để nhận biết sự vật hiện tượng xung quanh. Theo cách đó, lĩnh vực nghiên cứu kỹ thuật kết hợp thông tin từ nhiều nguồn (Multiple Sensor Data Fusion) đã được đẩy mạnh nghiên cứu để nâng cao độ chính xác trong suy diễn, ra quyết định. Bài báo trình bày kết quả nghiên cứu, ứng dụng lý thuyết Dempster Shafer (D-S) xây dựng mô hình tự suy luận, kết quả thực nghiệm với bộ dữ liệu Iris cho thấy mô hình có khả năng ra quyết định với độ chính xác cao, góp phần bổ sung cho lý thuyết đã đề xuất. Keywords: Dempster-Shafer, D-S, Theory of Evidence, Multiple Sensor Data Fusion. 1. GIỚI THIỆU CHUNG Tổng hợp dữ liệu từ nhiều nguồn (THDLNN) là một kỹ thuật cho phép kết hợp các thông tin từ nhiều nguồn nhằm mục đích cải tiến hiệu suất của hệ thống [5]. Theo Siaterlis and Maglaris [2004], THDLNN là các bước xử lý dữ liệu thu thập từ nhiều nguồn thông tin thành một nguồn với mức độ thông tin tổng quát hơn, có nghĩa hơn. Theo Bass [1], THDLNN là một hướng nghiên cứu về các kỹ thuật để xử lý thông tin từ nhiều nguồn khác nhau, loại thông tin khác nhau để giúp suy diễn một sự kiện, nhận định rõ hơn một tình huống. Rất nhiều phương pháp THDLNN đã được nghiên cứu nhằm mục đích nâng cao độ chính xác trong ra quyết định, ứng dụng trong nhiều lĩnh vực như chỉ huy chiến trường; an ninh mạng; chuẩn đoán y học, sinh học; giám sát môi trường; đo lường, tự động hóa, Một trong số các hướng nghiên cứu THDLNN là việc ứng dụng lý thuyết D-S, hiện đang được rất nhiều nhà nghiên cứu quan tâm [3]. Lý thuyết D-S được giới thiệu từ 1968 bởi tác giả Arthur Dempster và phát triển bởi Glenn Shafer. Lý thuyết D-S đưa ra một nền tảng mở trong ứng dụng để tạo ra mô hình ra quyết định dựa trên các suy luận không chắc chắn thu thập được. Theo Shafer [2], lập luận của lý thuyết D-S dựa trên hai ý tưởng chính: Mức độ của “niềm tin” cho mỗi giả thuyết trong tập tất cả các giả thuyết được đưa ra cho một vấn đề và hàm kết hợp (Dempster’s Rule), là phương pháp xác định “độ tin” khi kết hợp nhiều niềm tin hay giả thuyết với nhau. Lý thuyết D-S đề xuất phương án khả thi trong tính toán đưa ra kết luận dựa vào các lập luận không chắc chắn. Thuật toán chạy không cần thông tin về tri thức ban đầu của hệ thống do vậy đặc biệt phù hợp cho ứng dụng để nhận dạng, phát hiện bất thường. 2. LÝ THUYẾT DEMPSTER SHAFER 2.1. Định nghĩa Tập F, hoặc FoD (Frame of Discernment) là tập hợp tất cả các trạng thái có thể của một hệ thống nào đó, ta có tập hàm mũ là tập chứa tất cả các tập con của F [2] . Tập đôi khi còn được gọi là tập giả thuyết hoặc tập dẫn chứng. Ví dụ: F = { a, b, c}. Tập hàm mũ là tập chứa tất cả các tập con của F. Ta được: = { , a, b, c, ab, ac, bc, abc } Tùy theo đặc trưng của từng hệ thống cụ thể mà tập F có thể rất khác nhau. Chẳng hạn như trong hệ thống phân lớp dữ liệu, tập F chính là tập các nhãn lớp khác nhau. Hoặc trong các hệ thống phát hiện xâm nhập mạng, tập F chỉ đơn giản là trạng thái mạng bình thường hoặc mạng bị tấn công. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 50, 08 - 2017 91 Lý thuyết D-S sử dụng một hàm để gán một mức độ “niềm tin” vào mỗi phần tử của tập hàm mũ. Hàm đó được gọi là Hàm niềm tin cơ bản (Basic Belief Assignment – BBA), có thể gọi tắt là hàm niềm tin: m: → [0,1] Với mỗi nguồn thông tin cung cấp các phần tử (giả thuyết) của tập , ta sẽ có hàm niềm tin tương ứng là , i = 1,n. Hàm niềm tin của D-S có hai tính chất: - Khối niềm tin của tập rỗng là bằng 0 m( ) = 0 - Khối niềm tin của tất cả các tập con còn lại cộng vào với nhau có tổng bằng 1. = 1 Khối niềm tin của một tập con A nào đó, m(A), chỉ liên quan tới bản thân tập A nhưng không liên quan đến bất kỳ tập con nào nằm trong A. Do vậy, có thể tìm được giới hạn trên và giới hạn dưới cho một khoảng xác suất nào đó của tập con A. D-S đưa ra hai khái niệm độ tin (belief) và độ hợp lý (plausibility) để tính các giới hạn đó: Bel(A) = Pl(A) = Một hàm BBA có thể được coi như là việc xác định một tập các xác suất P cho các phần tử (giả thuyết) của tập sao cho: Bel(A) ≤ P(A) ≤ Pl(A) Ngoài ra, mối liên hệ giữa hàm m, Bel và Pl còn được thể hiện qua công thức: Pl(A)=1-bel( ) m(A)= với |A -B |làsố phần tử khác nhau giữa tập A và B[5]. Vì vậy, chỉ cần xác định được một trọng ba tham số m, Bel và Pl là có thể suy ra hai tham số còn lại. 2.2. Luật kết hợp – Dempster’s Rule Luật kết hợp là phương pháp xác định độ tin tổng hợp khi kết hợp các dẫn chứng khác nhau. Phương trình kết hợp[2], độ tin của hai dẫn chứng được thể hiện như sau: ( ) = 0 (A) = (  ) (A) = (1) K = Trong đó: là thành phần tử số của hàm kết hợp K được gọi là thước đo mức độ xung đột giữa hai giả thuyết 1 - K là thành phần mẫu số của hàm kết hợp 3. MÔ HÌNH THDLNN ỨNG DỤNG D-S 3.1. Mô hình tổng quát Xét một hệ thống có n nguồn thông tin cùng không gian xác định , m là số chiều của không gian đó. Với mỗi nguồn, có thể không có đầy đủ m tính chất, giá trị của các tính chất này thể hiện đặc trưng của nguồn thông tin đó. Kỹ thuật điều khiển & Điện tử B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 92 Mỗi nguồn vào thứ i ứng với giá trị , với ϵ , độ tin cậy của nguồn thể hiện bằng phân bố xác suất . Xác suất là xác suất của trên . Mô hình THDLNN là mô hình có nhiệm vụ tìm ra hàm f: → (đơn giản là từ n đầu vào thành 1 kết quả đầu ra). Bài toán có thể được mô tả tóm tắt như sau: Input: ( n nguồn thông tin x, dữ liệu x ϵ ) Output: Luật f thỏa mãn: → Hình 1. Mô hình THDLNN tổng quát. 3.2. Xây dựng mô hình ứng dụng lý thuyết D-S Mô hình đề xuất áp dụng cho các bài toán phân biệt loại đối tượng dựa vào các thuộc tính đặc trưng, thuộc tính này đã được quy ra giá trị thuộc không gian R1, các giá trị đặc trưng này sẽ thể hiện đối tượng này là ai trong số các nhóm đối tượng đã biết. Mô hình đề xuất để áp dụng D-S trong trường hợp này như sau: Hình 2. Mô hình THDLNN áp dụng lý thuyết D-S. Mô hình 2 xác định các ngưỡng từ nhiều nguồn thông tin, từ đó xác định các trạng thái cho dữ liệu kiểm tra và kết hợp các trạng thái thu được sử dụng luật kết hợp D-S để tìm ra Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 50, 08 - 2017 93 một trạng thái đơn làm kết quả phân loại cho dữ liệu. Trong trường hợp sau, khi sử dụng luật kết hợp vẫn chưa tìm được trạng thái đơn, mô hình sẽ sử dụng thêm phương pháp dụng phương pháp lựa chọn duy nhất của Chen S. và cộng sự [6] (Chen-Rule) để tìm ra trạng thái đơn đó. Đầu vào của mô hình 2 là hai tập dữ liệu: Dữ liệu huấn luyện và Các nguồn dữ liệu kiểm tra. Khối Nguồn: Từ tập dữ liệu huấn luyện, mô hình sẽ xác định các ngưỡng tương ứng với từng nguồn thông tin. Trong trường hợp này ngưỡng là các giá trị min, max, còn nguồn thông tin là các giá trị trong từng thuộc tính của dữ liệu kiểm tra. Khối Xác định các trạng thái: Các ngưỡng thu được từ Nguồn sẽ được sử dụng để xác định tập các trạng thái cho dữ liệu kiểm tra. Tập các trạng thái này là tập con của tập các trạng thái trong không gian . Khối Bộ kết hợp sử dụng luật kết hợp D-S: Tập các trạng thái đã xác định được được đưa vào bộ kết hợp sử dụng luật D-S theo công thức (1). Kết quả thu được sẽ chỉ còn là một trạng thái thuộc không gian . Khối Ra quyết định thực hiện kiểm tra trạng thái thu được từ Bộ kết hợp sử dụng luật kết hợp D-S. Nếu trạng thái thu được là trạng thái rỗng (hoàn toàn không), khi đó hệ thống hoàn toàn không ra được quyết định cuối cùng; nếu đầu ra cho kết quả là trạng thái đơn (có) thì đưa ra quyết định và kết thúc; nếu đầu ra là trạng thái tổ hợp (chưa chắc chắn) thì chuyển trạng thái sang khối Bổ sung hỗ trợ ra quyết định. Khối Bổ sung hỗ trợ ra quyết định sử dụng phương pháp lựa chọn duy nhất của Chen- Rule để chuyển một trạng thái tổ hợp (chưa chắc chắn) thành một trạng thái đơn. Sau mỗi lần gọi Chen-Rule, quá trình sẽ tự động cập nhật lại các ngưỡng. Phương pháp lựa chọn duy nhất của Chen-Rule theo công thức sau: = (2) Trong đó: : Là giá trị Chen-Rule cho thuộc tính thứ j : Là độ lệch chuẩn của lớp trong thuộc tính thứ j. j = 1m với m là số thuộc tính. i = 1n với n là số lớp Theo lý thuyết Chen-Rule, tại mỗi thuộc tính được xét, tính giá trị trung bình của tập giá trị của mỗi loại đối tượng. Cuối cùng, tính độ lệch của giá trị đang xét tại đặc trưng được chọn so với giá trị trung bình của tập giá trị của mỗi loại đối tượng đã tìm. Loại đối tượng có độ lệch nhỏ nhất được lựa chọn làm kết quả nhận dạng cho dữ liệu đang xét. 4. CÀI ĐẶT THỬ NGHIỆM MÔ HÌNH 4.1. Bộ dữ liệu thử nghiệm Để kiểm nghiệm mô hình, tập dữ liệu Iris [10] được sử dụng. Đây là bộ dữ liệu do Ronald Fisher phát minh, gồm có 150 bản ghi mô tả dữ liệu cụ thể cho bốn thuộc tính của hoa Iris là độ dài đài hoa (Sepal Length), độ rộng đài hoa (Sepal Width), độ dài cánh hoa (Petal Length) và độ rộng cánh hoa (Petal Width), tất cả đều được đo theo đơn vị cen-ti- mét (cm). Dữ liệu được phân thành 3 lớp, đặt tên theo ba loài hoa Iris là Iris Setosa, Iris Versicolor, và Iris Virginica; mỗi lớp chứa 50 bản ghi. Theo lý thuyết D-S, không gian F = {Iris Setosa, Iris Versicolour, Iris Virginica}. Kỹ thuật điều khiển & Điện tử B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 94 4.2. Kết quả thử nghiệm Kết quả thử nghiệm thu được sẽ tập trung vào việc trình bày mức độ hiệu quả của việc ứng dụng phương pháp D-S và mức độ nhận dạng chính xác các dữ liệu cần nhận dạng trong từng trường hợp lựa chọn ngẫu nhiên. Mức độ hiệu quả của việc ứng dụng phương pháp D-S dựa vào thước đo số “trạng thái đơn”, số “trạng thái tổ hợp”, số trạng thái tổ hợp đúng (là các trạng thái tổ hợp có chứa kết quả đúng trong nó), số trạng thái tổ hợp sai (là các trạng thái tổ hợp không có chứa kết quả đúng trong nó). Còn mức độ nhận dạng chính xác dữ liệu được thể hiện qua các thước đo số phân loại đúng, số phân loại sai và độ chính xác (số phân loại đúng / số phân loại sai). a. Phiên thử nghiệm thứ nhất Chi tiết số thứ tự các bản ghi dữ liệu được lựa chọn cho quá trình huấn luyện được liệt kê trong bảng 1. Bảng 1. Tập số thứ tự của 20 bản ghi ngẫu nhiên cho mỗi lớp. Lớp Tập các số thứ tự Iris Setosa 7, 44, 22, 36, 48, 18, 21, 12, 9, 49, 17, 13, 34, 21, 19, 44, 43, 42, 13, 23 Iris Versicolor 58, 98, 93, 59, 80, 70, 88, 71, 91, 75, 66, 54, 57, 50, 51, 82, 78, 86, 90, 80 Iris Virginica 146, 118, 141, 119, 128, 124, 115, 120, 100, 139, 122, 114, 107, 148, 131, 140, 139, 137, 135, 146 Kết quả thu được cho quá trình kiểm thử thứ nhất với toàn bộ dữ liệu Iris thể hiện tại bảng 2 và bảng 3. Bảng 2. Kết quả thu được sau khi sử dụng “Bộ kết hợp sử dụng luật kết hợp D-S”. Lớp Số trạng thái đơn Số trạng thái tổ hợp Số trạng thái tổ hợp đúng Số trạng thái tổ hợp sai Iris Setosa 50 0 0 0 Iris Versicolor 49 1 1 0 Iris Virginica 50 0 0 0 Bảng 3. Kết quả suy luận của mô hình trong phiên thử thứ nhất. Lớp Số phân loại đúng Số phân loại sai Độ chính xác (%) Iris Setosa 50 0 100 Iris Versicolor 47 3 94 Iris Virginica 44 6 88 b. Phiên thử nghiệm thứ hai Chi tiết số thứ tự các bản ghi dữ liệu được lựa chọn cho quá trình huấn luyện được liệt kê trong bảng 4. Bảng 4. Tập số thứ tự của 30 bản ghi ngẫu nhiên cho mỗi lớp. Lớp Tập các số thứ tự Iris Setosa 3, 6, 47, 38, 20, 46, 5, 26, 6, 30, 43, 31, 0, 16, 39, 18, 36, 13, 32, 23, 44, 10, 7, 1, 46, 46, 30, 30, 0, 9 Iris Versicolor 81, 94, 91, 64, 58, 83, 68, 93, 66, 88, 53, 77, 59, 77, 63, 63, 60, 77, 70, 55, 85, 93, 99, 75, 80, 68, 52, 62, 76, 85 Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 50, 08 - 2017 95 Iris Virginica 105, 128, 110, 123, 107, 149, 114, 143, 106, 113, 112, 129, 134, 146, 122, 122, 121, 111, 149, 109, 100, 103, 122, 141, 114, 127, 106, 129, 116, 142 Kết quả thu được cho quá trình kiểm thử thứ nhất với toàn bộ dữ liệu Iris thể hiện tại bảng 5 và bảng 6. Bảng 5. Kết quả thu được sau khi sử dụng “Bộ kết hợp sử dụng luật kết hợp D-S”. Lớp Số trạng thái đơn Số trạng thái tổ hợp Số trạng thái tổ hợp đúng Số trạng thái tổ hợp sai Iris Setosa 50 0 0 0 Iris Versicolor 34 16 16 0 Iris Virginica 43 7 7 0 Bảng 6. Kết quả suy luận của mô hình sau phiên thử thứ hai. Lớp Số phân loại đúng Số phân loại sai Độ chính xác (%) Iris Setosa 50 0 100 Iris Versicolor 47 3 94 Iris Virginica 48 2 96 c. Phiên thử nghiệm thứ ba Chi tiết số thứ tự các bản ghi dữ liệu được lựa chọn cho quá trình huấn luyện được liệt kê trong bảng 7. Bảng 7. Tập số thứ tự của 40 bản ghi ngẫu nhiên cho mỗi lớp. Lớp Tập các bản ghi ngẫu nhiên Iris Setosa 35, 43, 20, 0, 4, 28, 11, 8, 40, 9, 4, 8, 23, 43, 35, 23, 19, 24, 44, 26, 36, 23, 40, 28, 22, 15, 38, 41, 27, 34, 3, 34, 11, 30, 39, 7, 1, 46, 11, 35 Iris Versicolor 90, 81, 71, 98, 70, 58, 89, 53, 98, 82, 82, 97, 89, 98, 86, 91, 91, 74, 83, 79, 73, 98, 83, 52, 59, 69, 64, 80, 69, 52, 61, 97, 97, 93, 59, 54, 65, 93, 86, 69 Iris Virginica 134, 133, 130, 147, 148, 119, 101, 133, 118, 120, 143, 102, 148, 147, 128, 117, 136, 118, 143, 135, 129, 101, 100, 115, 145, 139, 123, 105, 117, 132, 105, 147, 103, 138, 106, 105, 115, 112, 149, 108 Kết quả thu được cho quá trình kiểm thử thứ nhất với toàn bộ dữ liệu Iris thể hiện tại bảng 8 và bảng 9. Bảng 8. Kết quả thu được sau khi sử dụng “Bộ kết hợp sử dụng luật kết hợp D-S”. Lớp Số trạng thái đơn Số trạng thái tổ hợp Số trạng thái tổ hợp đúng Số trạng thái tổ hợp sai Iris Setosa 50 0 0 0 Iris Versicolor 34 16 16 0 Iris Virginica 43 7 7 0 Bảng 9. Kết quả suy luận của mô hình sau phiên thử thứ ba. Lớp Số phân loại đúng Số phân loại sai Độ chính xác (%) Iris Setosa 50 0 100 Iris Versicolor 46 4 92 Kỹ thuật điều khiển & Điện tử B. C. Thành, V. T. Anh, H. T. Kiên, “Ứng dụng Dempster – Shafer mô hình suy luận.” 96 Iris Virginica 49 1 98 Bảng 10. Kết quả so sánh giữa các phương pháp [8]. Phương pháp Tỷ lệ khẳng định đúng (True Positive Rate) Tỷ lệ khẳng định sai (False Positive Rate) Độ chính xác Mô hình ứng dụng D-S đề xuất (dữ liệu huấn luyện = 20) 0,96 0,02 0,96 Mô hình ứng dụng D-S đề xuất (dữ liệu huấn luyện = 30) 0,96 0,02 0,96 Mô hình ứng dụng D-S đề xuất (dữ liệu huấn luyện = 40) 0,966 0,016 0,966 Mô hình ứng dụng D-S đề xuất(dữ liệu huấn luyện = 50) 0,973 0,013 0,973 DecisionStump 0,667 0,167 0.5 MultilayerPerceptron 0,973 0,013 0,973 NaiveBayes 0,96 0,02 0,96 MultiClassClassifier 0,96 0,02 0,96 Theo kết quả trên cho thấy mô hình đề xuất cho khả năng suy luận với độ chính xác cao khi so sánh với các phương pháp phân loại phổ biến hiện có [8]. Đặc biệt, khi sử dụng cùng bộ dữ liệu huấn luyện và kiểm tra cho mô hình, kết quả suy luận của mô hình suy luận ứng dụng D-S có độ chính xác tương đương với phương pháp MultilayerPerceptron. Và cả hai phương pháp này đều là hai phương pháp có tỷ lệ nhận dạng đạt độ chính xác cao hơn so với các phương pháp còn lại (0,973). 5. KẾT LUẬN Trong lĩnh vực THDLNN, lý thuyết Dempster Shafer là lý thuyết dựa trên các dẫn chứng, đã được nghiên cứu ứng dụng rất nhiều trong tất cả các lĩnh vực. Một trong những vấn đề khó khăn lớn nhất trong áp dụng D-S cho các mô hình suy luận đó là xác định không gian giả thuyết. Tại Việt Nam, lý thuyết D-S chưa được nghiên cứu nhiều, khó khăn trong ứng dụng D-S. Bài viết đã trình bày kết quả nghiên cứu lý thuyết D-S và ứng dụng cho xây dựng mô hình nhận suy luận dựa vào các thuộc tính đặc trưng đầu vào. Kết quả thử nghiệm với bộ dữ liệu Iris cho thấy mô hình hoạt động bình thường và cho kết quả suy luận với độ chính xác cao. Qua thực nghiệm cho thấy D-S cho kết quả suy luận có thể chưa ra kết quả cuối cùng nhưng vẫn theo đúng hướng duy diễn vì trong tập các giả thuyết còn lại vẫn chứa giả thuyết cuối cùng của vấn đề cần kết luận. Điều này mở đường cho việc nghiên cứu để đưa ra một mô hình tối ưu trong ra quyết định dựa trên các dẫn chứng thu thập được từ các nguồn thông tin khác nhau. TÀI LIỆU THAM KHẢO [1]. Tim Bass, “Intrusion detection systems and multisensor data fusion”, Communications of the ACM, Vol.43, 2000. [2]. Shafer, G. “A mathematical theory of evidence”, Princeton U.P., Princeton, N .J., 1976. [3]. C. Siaterlis and B. Magiaris, "Towards Multisensor Data Fusion for DoS Detection," The Proceedings of the 2004 ACM symposium on Applied Computing, 2004 Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 50, 08 - 2017 97 [4]. Ciza Thomas and N. Balakrishnan, “Mathematical Analysis of Sensor Fusion for Intrusion Detection Systems”, Indian Institute of Science, Bangalore, 2009. [5]. Ren C.Luo, Chh Chen Yih, “MultilSensor Fusion and Integration: Approaches”, Application and Future Research Directions, IEEE Proceedings of the International Conference on avanced Robotics, 2005. [6]. Chen S. and Fang. Y, “A new approach for handling the iris data classification problem”, International Journal of Applied Science and Engineering, 2005. [7]. A. Orlandi, “Feature Selection Validation for validation of computational electromagnetic”, IEEE Transactions on Electromagnetic Compatibility Volume 48, 2006. [8]. Kanu Patel, Jay Vala, Jaymit Pandya, “Comparison of various classification algorithms on iris datasets using Weka”, International journal of Advance Engineering and Research Development (IJAERD), Volume 1 Issue 1, February 2014, ISSN: 2348 - 4470 [9]. Trần Thuận Hoàng, “Nghiên cứu phương pháp tổng hợp cảm biến dùng cho kỹ thuật dẫn đường các Robot di động”, Luận án Tiến sĩ, Trường Đại học Công nghệ - Đại học Quốc Gia Hà Nội, 2013. [10]. “Machine Learning with Iris Dataset. February”, 2017. URL: https://rstudio- pubsstatic.s3.amazonaws.com/202738_7cad2477d76b4acc82b44244f94ccfa8.html#/ ABSTRACT AN MODEL-BASED INFERENCE AND DECISION MAKING USING DEMPSTER SHAFER THEORY The human brain recognize the surrounded phenomena by processing and analyzing data collected from the senses. In the same way, multiple sensor data fusion has been intensified to improve accuracy of inference and decision making. The article presents results and application of Dempster Shafer (DS) theory to construct the self-reasoning model. The empirical results on the Iris dataset show that the model has the ability to make decisions with high accuracy which contribute to the proposed theory. Keywords: Dempster-Shafer, D-S, Theory of Evidence, Multiple Sensor Data Fusion. Nhận bài ngày 12 tháng 5 năm 2017 Hoàn thiện ngày 04 tháng 7 năm 2017 Chấp nhận đăng ngày 18 tháng 8 năm 2017 Địa chỉ: 1 Binh chủng Thông tin liên lạc; 2 Học viện Kỹ thuật quân sự. *Email: kienht74@gmail.com.

Các file đính kèm theo tài liệu này:

12_kien_1632_2151713.pdf