Độ đo tương tự mới trên các tập mờ bức tranh và ứng dụng trong phân cụm dữ liệu

Tài liệu Độ đo tương tự mới trên các tập mờ bức tranh và ứng dụng trong phân cụm dữ liệu: Vietnam J. Agri. Sci. 2019, Vol. 17, No. 5: 386-396 Tạp chí Khoa học Nông nghiệp Việt Nam 2019, 17(5): 386-396 www.vnua.edu.vn 386 ĐỘ ĐO TƯƠNG TỰ MỚI TRÊN CÁC TẬP MỜ BỨC TRANH VÀ ỨNG DỤNG TRONG PHÂN CỤM DỮ LIỆU Lê Thị Diệu Thùy*, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ Khoa Công nghệ thông tin, Học viện Nông Nghiệp Việt Nam *Tác giả liên hệ: ltdthuy@vnua.edu.vn Ngày nhận bài: 08.07.2019 Ngày chấp nhận đăng: 26.08.2019 TÓM TẮT Chỉ số Jaccard là một chỉ số trong thống kê dùng để so sánh độ giống nhau và sự đa dạng giữa các bộ mẫu. Trong bài báo này chúng tôi đề xuất một độ đo tương tự mới giữa các tập mờ bức tranh dựa trên chỉ số Jaccard. Sau đó chúng tôi đưa ra một số ví dụ cho thấy độ đo tương tự mới đã khắc phục được những hạn chế của các độ đo tương tự đã có. Cuối cùng chúng tôi sử dụng độ đo tương tự mới vào bài toán phân cụm dữ liệu. Từ khóa: Tập mờ bức tranh, độ đo tương tự, bài toán phân cụm. A New Similarity Measure of Picture Fuzzy Sets and Its...

pdf11 trang | Chia sẻ: quangot475 | Lượt xem: 460 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Độ đo tương tự mới trên các tập mờ bức tranh và ứng dụng trong phân cụm dữ liệu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Vietnam J. Agri. Sci. 2019, Vol. 17, No. 5: 386-396 Tạp chí Khoa học Nông nghiệp Việt Nam 2019, 17(5): 386-396 www.vnua.edu.vn 386 ĐỘ ĐO TƯƠNG TỰ MỚI TRÊN CÁC TẬP MỜ BỨC TRANH VÀ ỨNG DỤNG TRONG PHÂN CỤM DỮ LIỆU Lê Thị Diệu Thùy*, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ Khoa Công nghệ thông tin, Học viện Nông Nghiệp Việt Nam *Tác giả liên hệ: ltdthuy@vnua.edu.vn Ngày nhận bài: 08.07.2019 Ngày chấp nhận đăng: 26.08.2019 TÓM TẮT Chỉ số Jaccard là một chỉ số trong thống kê dùng để so sánh độ giống nhau và sự đa dạng giữa các bộ mẫu. Trong bài báo này chúng tôi đề xuất một độ đo tương tự mới giữa các tập mờ bức tranh dựa trên chỉ số Jaccard. Sau đó chúng tôi đưa ra một số ví dụ cho thấy độ đo tương tự mới đã khắc phục được những hạn chế của các độ đo tương tự đã có. Cuối cùng chúng tôi sử dụng độ đo tương tự mới vào bài toán phân cụm dữ liệu. Từ khóa: Tập mờ bức tranh, độ đo tương tự, bài toán phân cụm. A New Similarity Measure of Picture Fuzzy Sets and Its Application to Data Clustering ABSTRACT The Jaccard index is a statistic used for comparing the similarity and diversity of sample sets. In this paper, we proposed a new similarity measure for picture fuzzy sets based on the Jaccard index. We then compared the proposed similarity measure with some existing similarity measures and showed that the new similarity measure overcomes the restrictions of the existing similarity measures. Finally, we used this new similarity measure for the data clustering problem. Keywords: Picture fuzzy set, similarity measure, fuzzy clustering. 1. ĐẶT VẤN ĐỀ Zadel (1965) læn đæu tiên đþa ra khái niệm và lý thuyết về têp mą thông qua bài báo “Fuzzy Set” đþợc đëng trên täp chí Information and Control, đã mć đæu cho să phát triển và Āng dýng cûa lý thuyết này. Ngày nay lý thuyết têp mą vén không ngÿng phát triển và đã đþợc Āng dýng trong nhiều lïnh văc nghiên cĀu nhþ lý thuyết điều khiển, trí tuệ nhân täo, khai phá dĂ liệu,„ Đðnh nghïa têp mą cûa Zadel sā dýng một hàm thuộc để mô tâ cho mĀc độ cûa một phæn tā thuộc về một têp. Atanasov (1986) đã mć rộng khái niệm têp mą bìng khái niệm têp mą trăc câm (Intuitionistic fuzzy sets), ngoài hàm thuộc, ông sā dýng thêm một hàm không thuộc để biểu thð độ không thuộc cûa một phæn tā vào têp hợp. Bùi Công Cþąng (2014) giĆi thiệu khái niệm têp mą bĀc tranh vĆi ba hàm thành viên là hàm thuộc khîng đðnh, hàm thuộc phû đðnh và hàm thuộc trung lêp. Về cĄ bân, lý thuyết mą bĀc tranh phù hợp vĆi các tình huống khi một vçn đề có nhiều câu trâ ląi, khi đò lý thuyết têp mą và têp mą trăc câm không giâi quyết đþợc. Chîng hän trong các tình huống tổng hợp ý kiến cûa mọi ngþąi về một vçn đề trong đò cò 4 cåu trâ ląi cĄ bân: có, không, không biết và không đþa ra cåu trâ ląi. Bæu cā là một ví dý điển hình, ngþąi bó phiếu đþợc phân làm bốn nhóm: ûng hộ, phân đối, bó phiếu tríng hoặc phiếu không hợp lệ và không bó phiếu. Hiện nay lý thuyết têp mą bĀc tranh đã và đang đþợc các nhà nghiên cĀu tiếp týc tìm hiểu, khai thác và có nhiều Āng dýng trong thăc tiễn. Phäm Huy Thông & Lê Hoàng SĄn (2014) đã phát triển mô hình lai mĆi giĂa têp mą bĀc tranh và têp mą Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ 387 trăc câm để chuèn đoán y tế và Āng dýng vào hệ thống chëm sòc sĀc khóe. Nguyễn Đình Hòa & cs. (2014) đề xuçt phþĄng pháp mĆi để dă báo thąi tiết tÿ hình ânh vệ tinh bìng cách sā dýng kết hợp phân cým mą bĀc tranh và hồi quy. Phäm Hồng Phong & cs. (2014) đã kiểm tra một số tính chçt cûa phép hợp thành quan hệ mą bĀc tranh và đề xuçt một cách tiếp cên mĆi trong chuèn đoán y khoa bìng cách sā dýng phép hợp thành quan hệ mą bĀc tranh. Bùi Công Cþąng và Phäm Vën Hâi (2015) nghiên cĀu các toán tā logic mą. Phäm Vën Việt & cs. (2015) đã đþa ra hệ thống suy luên mą bĀc tranh dăa vào biểu đồ thành viên. Singh (2015) đề xuçt hệ số tþĄng quan cho têp mą bĀc tranh và Āng dýng hệ số tþĄng quan vào bài toán phân cým mą bĀc tranh. Lê Hoàng SĄn (2015) giĆi thiệu một số thuêt toán phân cým mą bĀc tranh và Āng dýng trong dă báo thąi tiết, dă báo chuỗi thąi gian. Nguyễn Xuân Thâo & Nguyễn Vën Đðnh (2015) đþa ra khái niệm têp mą bĀc tranh - thô và nghiên cĀu cçu trúc tô pô cûa têp mą bĀc tranh - thô. Nguyễn Vën Đðnh & cs. (2015) nghiên cĀu về cĄ sć dĂ liệu mą bĀc tranh. Lê Hoàng SĄn (2016) đþa ra độ đo khoâng cách tổng quát cho các têp mą bĀc tranh và Āng dýng trong phân cým. Nguyễn Đình Hòa & cs. (2017) đþa ra một số câi tiến cho thuêt toán phân cým mą bìng cách sā dýng các têp mą bĀc tranh và Āng dýng trong phân cým dĂ liệu đða lý. Phäm huy Thông (2016; 2017) đã cò nhiều nghiên cĀu về phân cým dĂ liệu mą bĀc tranh. Garg (2017) trình bày một số toán tā tổng hợp mą bĀc tranh và Āng dýng trong quyết đðnh đa tiêu chí. Lê Hoàng SĄn & cs. (2017) đã đề xuçt hệ thống suy luên mĆi trên têp mą bĀc tranh. Lê Hoàng SĄn (2017) đþa các độ đo mĆi trên các têp mą bĀc tranh, đò là các độ đo khoâng cách tổng quát và các độ đo kết hợp bĀc tranh. Peng & Dai (2017) đề xuçt độ đo khoâng cách mĆi cho các têp mą bĀc tranh và đþa ra thuêt toán cho bài toán quyết đðnh đa tiêu chí mą bĀc tranh dăa trên các độ đo này. Nguyễn Vën Đðnh & Nguyễn Xuân Thâo (2018) đề xuçt các độ đo khoâng cách, độ đo không tþĄng tă trên têp mą bĀc tranh và Āng dýng trong quyết đðnh đa tiêu chí. Phäm Thð Minh PhþĄng & cs. (2018) nghiên cĀu cĄ sć lý thuyết cho thuêt toán phân cým mą bĀc tranh. Zeng & cs. (2019) đề xuçt độ đo phån kỳ mü Jensen cho các têp mą bĀc tranh và Āng dýng trong quyết đðnh đa tiêu chí„ Độ đo tþĄng tă là một công cý hĂu ích để xác đðnh să giống nhau giĂa hai đối tþợng. Nhiều độ đo tþĄng tă khác nhau trên các têp mą trăc câm đã đþợc nghiên cĀu, nhþ các nghiên cĀu cûa Szmidt & Kacorhot (2000), Li & Cheng (2002), Dengfeng (2002), Mitchell (2003), Liu (2005), Szmidt (2005), Hung & Yang (2007), Xu & Xia (2010), Ye (2011, 2012), Shi & Ye (2013), Tian (2013), Szmidt (2014), Ye (2016), SĄn & Phong (2016), Wei (2017),„ Trên các têp mą bĀc tranh cüng đã cò một số độ đo tþĄng tă đþợc đề xuçt và Āng dýng trong các bài toán khác nhau. Wei (2017, 2018) đề xuçt một số độ đo tþĄng tă cho têp mą bĀc tranh và Āng dýng trong bài toán ra quyết đðnh. Joshi & Kumar (2018) đþa ra độ đo tþĄng tă cho têp mą bĀc tranh dăa trên chî số Dice. Wei (2018) đþa ra một số độ đo tþĄng tă Dice tổng quát„ Tuy nhiên các độ đo này vén còn một số hän chế, nhĂng hän chế đò sẽ đþợc chî ra ć phæn 3 cûa bài báo. Chî số Jaccard là chî số thống kê dùng để so sánh să giống nhau và să đa däng cûa các bộ méu. Dăa vào chî số này gæn đåy, Hwang & cs. (2018) đã đþa ra một số độ đo tþĄng tă mĆi trên têp mą trăc câm. Trên cĄ sć đò, chúng tôi muốn nghiên cĀu đề xuçt độ đo tþĄng tă mĆi trên têp mą bĀc tranh dăa trên chî số Jaccard và Āng dýng độ đo này trong bài toán phân cým. 2. PHƯƠNG PHÁP NGHIÊN CỨU Trong bài báo này chúng tôi sā dýng phþĄng pháp nghiên cĀu lý thuyết, phþĄng pháp phân tích và tổng hợp lý thuyết thông qua các tài liệu về têp mą, têp mą bĀc tranh, độ đo tþĄng tă trên têp mą bĀc tranh, các thuêt toán phân cým dĂ liệu. Chúng tôi nghiên cĀu các độ đo tþĄng tă đã cò trên têp mą bĀc tranh, phân tích þu nhþợc điểm cûa chúng, tÿ đò đề xuçt độ đo tþĄng tă mĆi trên têp mą bĀc tranh dăa trên chî số Jaccard và tính toán vĆi các ví dý để so sánh độ đo mĆi vĆi các độ đo đã cò. Sau đò chúng tôi xây dăng thuêt toán phân cým cho têp mą bĀc tranh dăa ma trên kết hợp tþĄng đþĄng và áp dýng độ đo mĆi vào thuêt toán này. Độ đo tương tự mới trên các tập mờ bức tranh và ứng dụng trong phân cụm dữ liệu 388 DþĆi đåy là các khái niệm cĄ bân về têp mą bĀc tranh, độ đo tþĄng tă trên têp mą bĀc tranh và chî số Jaccard. 2.1. Tập mờ bức tranh Bùi Công Cþąng (2014) đã đþa ra khái niệm têp mą bĀc tranh nhþ sau: Định nghĩa 1. Cho têp nền  1 2X = x ,x ,..., , nx một têp mą bĀc tranh A trên X đþợc xác đðnh bći       A A AA x, x , x , x x X     VĆi A: X  [0;1] là hàm thuộc khîng đðnh, A: X  [0;1] là hàm thuộc trung lêp, A: X  [0;1] là hàm thuộc phû đðnh và thóa mãn điều kiện A(x) + A(x) + A(x)  1 x  X Ta kí hiệu PFS(X) là têp hợp tçt câ các têp mą bĀc tranh trên X. Định nghĩa 2. Cho hai têp mą bĀc tranh A,B  PFS(X):              A B A B A B (1) A B (x) (x), (x) (x), (x) (x) x X              A B A B A B (2) A B (x) (x), (x) (x), (x) (x) x X 2.2. Độ đo tương tự trên tập mờ bức tranh Định nghĩa 3. Cho hai têp mą bĀc tranh A,B  PFS(X). Ánh xä S : PFS(X) PFS(X)  [0;1] gọi là độ đo tþĄng tă giĂa A, B nếu S(A, B) thóa mãn các điều kiện sau: (1)  0 S(A,B) 1 (2) S(A,A) 1 (3) S(A,B) S(B,A) (4) Nếu  A B C thì S(A,C) S(A,B); S(A,C) S(B,C) A,B,C PFS(X)   Một số độ đo tþĄng tă trên têp mą bĀc tranh đã đþợc đề xuçt: Độ đo tþĄng tă Cosine (Wei, 2017) theo công thĀc (1). Độ đo tþĄng tă dăa trên lý thuyết têp hợp (Wei, 2018) theo công thĀc (2) Độ đo tþĄng tă Grey (Wei, 2018) theo công thĀc (3). Các độ đo tþĄng tă dăa trên hàm cosin (Wei, 2017) theo công thĀc (4) và (5). Độ đo tþĄng tă dăa trên hàm cotan (Wei, 2017) theo công thĀc (6). Độ đo tþĄng tă Dice (Joshi & Kumar, 2018) theo công thĀc (7) n 1 A i B i A i B i A i B i 2 2 2 2 2 2 i 1 A i A i A i B i B i B i (x ) (x ) (x ) (x ) (x ) (x )1 PFC (A,B) n (x ) (x ) (x ) (x ) (x ) (x )                     (1) n 2 A i B i A i B i A i B i 2 2 2 2 2 2 i 1 A i A i A i B i B i B i (x ) (x ) (x ) (x ) (x ) (x )1 PFC (A,B) n max( (x ) (x ) (x ), (x ) (x ) (x ))                     (2) n 3 min max min max min max i 1 i max i max i max 1 PFC (A,B) 3n                            (3) VĆi: i A i B i | (x ) (x )|    ,  min A i B iimin | (x ) (x )| ,     max A i B iimax | (x ) (x )|    i A i B i | (x ) (x )|,     min A i B iimin | (x ) (x )| ,     max A i B iimax | (x ) (x )|    i A i B i | (x ) (x )|,         min A i B i i min | (x ) (x )| ,  max A i B i i max | (x ) (x )| .      n 1 A i B i A i B i A i B i i 1 1 PFCS (A,B) cos [| (x ) (x )| | (x ) (x )| | (x ) (x )|] n 2               (4)  n 2 A i B i A i B i A i B i i 1 1 PFCS (A,B) cos [| (x ) (x )| | (x ) (x )| | (x ) (x )|] n 4               (5) Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ 389  n A i B i A i B i A i B i i 1 1 PFCT(A,B) cot [| (x ) (x )| | (x ) (x )| | (x ) (x )|] n 4 4                 (6)  n A i B i A i B i A i B i PFS 2 2 2 2 2 2 i 1 A i A i A i B i B i B i 2 (x ) (x ) (x ) (x ) (x ) (x )1 D (A,B) n (x ) (x ) (x ) (x ) (x ) (x )                     (7) A i B i A i B i A i B i A i B i A i B i A i B i A i B i A i B i A i B (x ) (x )n PFS 2 (x ) 2 (x ) (x ) (x ) i 1 (x ) (x ) 2 (x ) 2 (x ) (x ) (x ) (1 (x )) (1 (x )) 2(1 (x )) 2(1 (x )) (1 (x )) (1 ( 1 e e J (A,B) 4n e e e e e e e e e e e e e e e e                                           i A i A i A i B i B i B i A i A i A i B i B i B i A i A i A i B i B i B i x )) 1 1 (1 (x ) (x ) (x )) (1 (x ) (x ) (x )) 2 2 1 1 (1 (x ) (x ) (x )) (1 (x ) (x ) (x )) (1 (x ) (x ) (x )) (1 (x ) (x ) (x )) 2 2 e e e e e e                                (8) 2.3. Chỉ số Jaccard Chî số Jaccard là chî số đþợc sā dýng trong thống kê để đo mĀc độ tþĄng tă giĂa hai bộ méu. Cho hai bộ méu A và B, chî số Jaccard giĂa A và B đþợc xác đðnh bći công thĀc: |A B| |A B| J(A,B) |A B| |A| |B| |A B|         Ta có 0 J(A,B) 1  và J(A,B) càng lĆn thì mĀc độ tþĄng đồng giĂa A, B càng lĆn. Nếu xét hai véc tĄ n chiều là X = (x1, x2,„, xn), Y = (y1, y2,„, yn) thì chî số Jaccard giĂa XA, XB xác đðnh nhþ sau: 2 2 n i i i 1 n n n 2 2 i i i i i 1 i 1 i 1 XY J(X,Y) X Y XY x y x y x y               3. KẾT QUẢ VÀ THẢO LUẬN 3.1. Độ đo tương tự mới dựa trên chỉ số Jaccard giữa các tập mờ bức tranh Dăa trên chî số Jaccard, chúng tôi đề xuçt độ đo tþĄng tă giĂa các têp mą bĀc tranh bìng cách đo mĀc tþĄng tă giĂa ba hàm thành viên trên hai têp mą bĀc tranh nhþ sau: Cho:               j A j A j A j j j B j B j B j j A x ,( (x ), (x ), (x )) |x X , B x ,( (x ), (x ), (x )) |x X là hai têp mą bĀc tranh trên têp nền  1 2 nX x ,x ,...,x . Khi đò độ đo tþĄng tă giĂa A, B đþợc xác đðnh nhþ sau nhþ công thĀc (8). Ta chĀng minh PFS J (A,B) thóa mãn 4 tính chçt cûa độ đo tþĄng tă: Xét hàm   2 2 xy f(x,y) x y xy . Ta có :       A i B i A i B i A i B i A i A i A i B i B i B i n (x ) (x ) PFS i 1 (x ) (x ) (1 (x )) (1 (x )) 1 1 (1 (x ) (x ) (x )) (1 (x ) (x ) (x )) 2 2 1 J (A,B) f e ,e 4n f e ,e f e ,e f e ,e                               (1) Dễ thçy 0 f(x,y) 1 x,y 0    , do đò  A i B i(x ) (x )0 f e ,e 1,    A i B i(x ) (x )0 f e ,e 1,    A i B i(1 (x )) (1 (x ))0 f e ,e 1,     A i A i A i B i B i B i 1 (1 (x ) (x ) (x )) 2 1 (1 (x ) (x ) (x )) 2 0 f e , e                   1 i 1,2,...,n  Độ đo tương tự mới trên các tập mờ bức tranh và ứng dụng trong phân cụm dữ liệu 390 Vêy PFS 0 J (A,B) 1.  (2) Giâ sā A = B, tĀc là A(xi) = B(xi), A(xi) = A(xi) , A(xi) = B(xi). Khi đò A i B i A i B i A i A i A i A i B i B i B i B i (x ) (x ) (x ) (x ) (1 (x )) 1 (1 (x ) (x ) (x )) (1 (x )) 2 1 (1 (x ) (x ) (x )) 2 e e ,e e ,e e ,e e                    Mặt khác nếu x = y thì f(x,y) =1. Do đò:  A i B i(x ) (x )f e ,e 1,    A i B i(x ) (x )f e ,e 1,    A i B i(1 (x )) (1 (x ))f e ,e 1,     A i A i A i B i B i B i 1 (1 (x ) (x ) (x )) 2 1 (1 (x ) (x ) (x )) 2 f e , e                 = 1 i 1,n  Suy ra JPFS(A,B) = 1. Ngþợc läi giâ sā JPFS(A,B) = 1, khi đò  A i B i(x ) (x )f e ,e 1,    A i B i(x ) (x )f e ,e 1,    A i B i(1 (x )) (1 (x ))f e ,e 1,     , A i A i A i B i B i B i 1 (1 (x ) (x ) (x )) 2 1 (1 (x ) (x ) (x )) 2 f e , e                 = 1 i 1,n  Mà 2 2 xy f(x,y) 1 1 x y xy       (x-y)2 = 0  x = y Tÿ đò ta cò A i B i A i B i (x ) (x ), (x ) (x ),      A i B i (x ) (x )   , hay A= B. (3) Dễ thçy PFS PFS J (A,B) J (B,A) . (4) Ta có 2 2 2 2 2 y(y x ) f '(x) (x y xy)     . Do đò f(x) đồng biến trên (0,y) và nghðch biến trên (y,1). Giâ sā A B C  , tĀc là vĆi i 1,n  A i B i C i A i B i C i A i B i C i (x ) (x ) (x ), (x ) (x ) (x ), (x ) (x ) (x )                Suy ra C iA i B i (x )(x ) (x ) e e e ,     A i (x ) e   C iB i (x )(x ) e e ,   C iA i B i (1 (x ))(1 (x )) (1 (x )) e e e        và    A i A i A i B i B i C i 1 1 (x ) (x ) (x ) (x ) (x ) (x ) 2 2e e            C i C i C i 1 (x ) (x ) (x ) 2e .     Do đò    C iA i A i B i(x )(x ) (x ) (x )f e ,e f e ,e ,      C iA i A i B i(x )(x ) (x ) (x )f e ,e f e ,e ,   A i A i A i C i C i C i A i A i A i B i B i B i 1 1 (1 (x ) (x ) (x )) (1 (x ) (x ) (x )) 2 2 1 1 (1 (x ) (x ) (x )) (1 (x ) (x ) (x )) 2 2 f e ,e f e ,e                                  Do đò ta cò PFS PFS J (A,C) J (A,B) . TþĄng tă có PFS PFS J (A,C) J (B,C) . 3.2. Một số ví dụ DþĆi đåy là một số ví dý so sánh độ đo tþĄng tă mĆi vĆi các độ đo tþĄng tă đã cò. Ví dụ 1. Xét bài toán y tế trong Dutta (2017) nhþ sau: giâ sā trên têp nền  1 2 3 4 5X x ,x ,x ,x ,x có 5 têp mą bĀc tranh 1 1 2A x , , x0.4,0,0 0.3,0.2, ,,0.4 3 4 x , , x ,0.1,0.35,0.5 0.4,0.3,0.2 , 5x ,0.1,0.25,0.5 2 1 2A x , , x ,0.7,0,0 0.2,0.4, ,0.35 3 4 x , , x0,0.4,0.5 0.7,0., 1,0 , 43 x ,x ,0.2,0.3,0.4 , 0.2,0.35,0.3 ,    C iA i A i B i(1 (x ))(1 (x )) (1 (x )) (1 (x ))f e ,e f e ,e ,       5x ,0.1,0.3,0.5 3 1 2A x ,0.3,0.4,0.3 , x ,0.6,0.2,0.1 , 5x ,0.1,0.2,0.6 , Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ 391 4 1 2A x ,0.1,0.3,0.5 , x ,0.2,0.4,0.3 ,  43 x ,x ,0.8,0,0 , 0.2,0.4,0.3 , 5x ,0.2,0.35,0.3   5 1 2 3 4 5 A x ,0.1,0.3,0.5 , x ,0,0.5,0.35 x ,0.2,0.3,0.5 , 0.2,0.35x , , x ,0.8,0 , .4 1 0 ,0.  Giâ sā có têp mą bĀc tranh mĆi là:   1 2 3 4 3 0.8,0,0.1 ,0.3,0.1 ,0 B x , , x ,0.6 , x 0.2 , x 0..4,0.4 ,0.15,0.6 , x 0. 1 ,0.4,0.41     Sā dýng công thĀc (1), (2), (3), (4), (5), (6), (7), (8) để đo độ tþĄng tă giĂa B và Ai (i =1, 2, 3, 4, 5) ta đþợc kết quâ nhþ trong bâng 1. Nhþ vêy độ đo mĆi có cùng kết quâ vĆi tçt câ các độ đo cñn läi, đò là độ tþĄng tă giĂa B và A2 là lĆn nhçt, do đò xếp B vào lĆp cûa A2. Ví dụ 2. Xét dĂ liệu trong Singh (2015) nhþ sau: giâ sā trên têp nền  1 2 3 4 5X x ,x ,x ,x ,x có 3 têp mą bĀc tranh   1 1 2 3 0.4,0.5,0.1 0.7A x , , x , ,,0.1,0.1 0.3,0.3 2x , ,0.    2 1 2 3 0.5,0.4,0.1 0.7,A x , , x , , x 0.2,0.1 0.4,0.3, ,,0.1    3 1 2 3 A x ,0.4,0.5,0.1 , x ,0.7,0.1,0.1 , x ,0.4,0.3,0.2  Giâ sā có têp mą bĀc tranh mĆi là:  1 2 3B x , , x0.1,0.1,0.4 1,, , x0,0 0,1,0  Sā dýng công thĀc (1), (2), (3), (4), (5), (6), (7), (8) để đo độ tþĄng tă giĂa A1 và B, giĂa A2 và B, giĂa A3 và B ta đþợc kết quâ nhþ trong bâng 2. Bảng 1. So sánh độ đo tương tự và xếp hạng kết quả phân lớp trong ví dụ 1 Độ đo tương tự Độ đo tương tự giữa B và Ai = (i = 1, 2) Kết luận A1 A2 A3 A4 A4 PFC 1 0.9167 0.9193 0.8191 0.5875 0.5098 B vào lớp của A2 PFC 2 0.7517 0.8301 0.712 0.4841 0.4551 B vào lớp của A2 PFC 3 0.7703 0.8089 0.7899 0.7571 0.7336 B vào lớp của A2 PFCS 1 0.9222 0.9446 0.8885 0.7295 0.6585 B vào lớp của A2 PFCS 2 0.9353 0.952 0.8807 0.7053 0.667 B vào lớp của A2 PFCT 0.6983 0.7597 0.6717 0.4876 0.4337 B vào lớp của A2 DPFS 0.8701 0.9132 0.8077 0.5754 0.5033 B vào lớp của A2 JPFS 0.969 0.9786 0.96 0.9063 0.8921 B vào lớp của A2 Bảng 2. So sánh độ đo tương tự và xếp hạng kết quả phân lớp trong ví dụ 2 Độ đo tương tự Độ đo tương tự giữa B và Ai (i =1, 2) Kết luận A1 A2 A3 PFC 1 0.6975 0.6712 0.67 B vào lớp của A1 PFC 2 0.4365 0.4365 0.4365 Null PFC 3 0.8628 0.8844 0.8489 B vào lớp của A2 PFCS 1 0.718 0.718 0.718 Null PFCS 2 0.7396 0.7286 0.7178 B vào lớp của A1 PFCT 0.4541 0.4541 0.4541 Null DPFS 0.6174 0.6062 0.6085 B vào lớp của A1 JPFS 0.9019 0.9001 0.8892 B vào lớp của A1 Ghi chú: Null nghĩa là ta không có kết quả xếp lớp. Độ đo tương tự mới trên các tập mờ bức tranh và ứng dụng trong phân cụm dữ liệu 392 Nhþ vêy các độ đo PFC2, PFCS1, PFCT không có kết quâ phân lĆp, độ đo PFC3 cho kết quâ B vào lĆp cûa A2, cñn độ đo mĆi có cùng kết quâ vĆi các độ đo PFC1, PFCS2, DPFS, đò là B vào lĆp cûa A1. Ví dụ 3. Giâ sā trên têp nền  1 2 3X x ,x ,x có 2 têp mą bĀc tranh:   1 1 2 3 A x ,0.3,0.5,0.2 , x ,0.1,0.1,0.5 , x ,0.6,0.1,0.1 ,    2 1 2 3 A x ,0.15,0.3,0.45 , x ,0.3,0.3,0.3 , x ,0.6,0.15,0.15  Giâ sā có một têp mą bĀc tranh mĆi là:   1 2 3 B x ,0.4,0.4,0.1 , x ,0.2,0.2,0.4 , x ,0.35,0.2,0.35  . Sā dýng công thĀc (1), (2), (3), (4), (5), (6), (7), (8) để đo độ tþĄng tă giĂa A1 và B, giĂa A2 và B ta đþợc kết quâ nhþ trong bâng 3. Nhþ vêy chî cò độ đo mĆi JPFS phân lĆp đþợc B vào nhóm nào, cý thể B vào lĆp cûa A1. Ví dụ 4. Giâ sā trên têp nền  1 2 3X x ,x ,x có 2 têp mą bĀc tranh:   1 1 2 3 A x ,0.4,0.4,0.1 , x ,0.3,0.4,0.1 , x ,0.1,0.3,0.4  ,   2 1 2 3 A x ,0.5,0.2,0.2 , x ,0.5,0.1,0.0 , x ,0.4,0.1,0.3  Giâ sā có một têp mą bĀc tranh mĆi là:   1 2 3 B x ,0.3,0.3,0.3 , x ,0.3,0.1,0.3 , x ,0.2,0.2,0.2  Sā dýng công thĀc (1), (2), (3), (4), (5), (6), (7), (8) để đo độ tþĄng tă giĂa A1 và B, giĂa A2 và B ta đþợc kết quâ nhþ trong bâng 4. Nhþ vêy chî cò độ đo mĆi phân lĆp đþợc B vào nhóm nào, cý thể B thuộc vào nhóm cûa A2. Bảng 3. So sánh độ đo tương tự và xếp hạng kết quả phân lớp trong ví dụ 3 Độ đo tương tự Độ đo tương tự giữa B và Ai (i=1, 2) Kết luận A1 A2 PFC 1 0.8209 0.8209 Null PFC 2 0.5833 0.5833 Null PFC 3 0.8329 0.8329 Null PFCS 1 0.891 0.891 Null PFCS 2 0.902 0.902 Null PFCT 0.6128 0.6128 Null DPFS 0.7396 0.7396 Null JPFS 0.9672 0.9603 B vào lớp của A1 Ghi chú: Null nghĩa là ta không có kết quả xếp lớp. Bảng 4. So sánh độ đo tương tự và xếp hạng kết quả phân lớp trong ví dụ 4 Độ đo tương tự Độ đo tương tự giữa B và Ai (i=1, 2) Kết luận A1 A2 PFC 1 0.8434 0.8434 Null PFC 2 0.683 0.683 Null PFC 3 0.8519 0.8519 Null PFCS 1 0.931 0.931 Null PFCS 2 0.942 0.942 Null PFCT 0.6887 0.6887 Null DPFS 0.8177 0.8177 Null JPFS 0.9712 0.9744 B vào lớp của A2 Ghi chú: Null nghĩa là ta không có kết quả xếp lớp. Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ 393 3.3 Ứng dụng độ đo mới vào bài toán phân cụm dữ liệu Xu & cs. (2018) đã đþa ra thuêt toán phân cým mą trăc câm bìng ma trên kết hợp tþĄng đþĄng, trên cĄ sć đò chúng tôi áp dýng độ đo tþĄng tă mĆi vào bài toán phân cým cho têp mą bĀc tranh. Định nghĩa 4. Cho 1 2 n A ,A ,...,A là các têp mą bĀc tranh, khi đò ij n n C (c )   gọi là ma trên kết hợp mą bĀc tranh nếu ij i j c c(A ,A ) thóa mãn các tính chçt sau: i)     ij 0 c 1 i, j 1,...,n ii)    ij i j c 1 A A iii)    ij ji c c i, j 1,...,n. Định nghĩa 5. Cho ij n n C (c )   là một ma trên kết hợp. Khi đò ma trên  2 ij n n C C C c    gọi là ma trên hợp thành cûa C, vĆi   ij ik kj k c max min c ,c ,i, j 1,...,n  Định lý 1. Cho ij n n C (c )   là một ma trên kết hợp. Khi đò ma trên hợp thành C2 cüng là ma trên kết hợp. ChĀng minh: i) Do ij 0 c 1 i, j 1,...,n    nên ij 0 c    ik kj k max min c ,c 1 i, j 1,...,n   ii) Ta có   ij ik kj k c max min c ,c 1  khi vào chî khi tồn täi k {1,2,...,n} sao cho ik kj c c . Do C là ma trên kết hợp nên điều này xây ra khi và chî khi Ai = Ak = Aj. iii) Do ij ji c c i, j 1,...,n   nên:          ij ik kj k ki jk k jk ki ji k c max min c ,c max min c ,c max min c ,c c i, j 1,2,...,n.       Định lý 2. Cho ij n n C (c )   là một ma trên kết hợp. Khi đò vĆi mọi số nguyên dþĄng k, ma trên k 12C  vĆi k 1 k k2 2 2C C C   cüng là ma trên kết hợp. ChĀng minh: VĆi k = 0 ta có 2C C C , do đðnh lý 1 nên C2 là ma trên kết hợp. Giâ sā h 1 h h2 2 2C C C   là ma trên kết hợp. Ta chĀng minh h 22C  là ma trên kết hợp. Thêt vêy theo Đðnh nghïa 5 ta cò h 2 h 1 h 12 2 2C C C     , do đò theo Đðnh lý 1 thì h 22C  là ma trên kết hợp. Định nghĩa 6. Cho ij n n C (c )   là một ma trên kết hợp. Nếu 2C C , tĀc là   ik kj ij k max min c ,c c i, j 1,...,n   thì C gọi là ma trên kết hợp tþĄng đþĄng. Định lý 3. Cho ij n n C (c )   là một ma trên kết hợp. Khi đò dãy các ma trên kết hợp k2 4 2C C C ... C ...     luôn tồn täi số nguyên dþĄng k sao cho k k 12 2C C ,   khi đò k2C là ma trên kết hợp tþĄng đþĄng. ChĀng minh VĆi mỗi i, j xét dãy số  k(2 )ij k 1 c   , ć đò k(2 ) ij c là phæn tā thuộc hàng i, cột j cûa ma trên k2C . Do cách xây dăng ma trên thành phæn ć đðnh nghïa 5 ta có  k(2 )ij k 1 c   là dãy không giâm và bð chặn, do đò tồn täi k* (2 ) ij ijk c limc   . Mặt khác dãy  k(2 )ij k 1 c   chî nhên hĂu hän các giá trð khác nhau thuộc têp các phæn tā cûa ma trên C, do đò vĆi k đû lĆn thì k k 1(2 ) (2 ) ij ij c c   . Vêy vĆi k đû lĆn thì k k 1(2 ) (2 ) ij ij c c i, j    , tĀc là k k 12 2C C   và k2C là ma trên kết hợp tþĄng đþĄng. Định nghĩa 7. Cho ij n n C (c )   là một ma trên kết hợp tþĄng đþĄng. Khi đò ma trên ij n n C ( c )     đþợc gọi là ma trên _lát cít cûa C, ć đò ij ij ij 0, c c i, j 1,2,...,n 1, c         .  gọi là mĀc tin cêy vĆi  [0,1]. Độ đo tương tự mới trên các tập mờ bức tranh và ứng dụng trong phân cụm dữ liệu 394 Sā dýng các khái niệm nêu trên chúng tôi đề xuçt thuêt toán phân cým dăa trên ma trên kết hợp tþĄng đþĄng nhþ sau: Thuêt toán phân cým: Đæu vào: Cho 1 2 n A ,A ,...,A là các têp mą bĀc tranh trên têp nền  1 2 nX x ,x ,...,x Đæu ra: kết quâ phân tích cým: là một phân hoäch cûa họ  1 2 nA ,A ,...,A Các bþĆc cûa thuêt toán: Bước 1. Xây dăng ma trên kết hợp ij n n C (c )   vĆi ij PFS i j c J (A ,A ) đþợc tính vći công thĀc (8). Bước 2. Nếu ij n n C (c )   là ma trên kết hợp tþĄng đþĄng thì ta xåy dăng ma trên _lát cít ij n n C ( c )     theo đðnh nghïa 7. Nếu không ta xây dăng dãy các ma trên k2 4 2C C C ... C ...     theo đðnh lý 3 để có ma trên kết hợp tþĄng đþĄng C , sau đó xây dăng ma trên lát cít C cûa C . Bước 3. Nếu mọi phæn tā thuộc hàng (cột) thĀ i cûa C  (hoặc C ) giống các phæn tā tþĄng Āng thuộc hàng (cột) thĀ j cûaC  (hoặc C ) thì i j A ,A đþợc xếp vào một cým. Sau đåy chúng ta xét ví dý Āng dýng thuêt toán phân cým đã đề xuçt ć trên. Ví dụ 5. Xét bài toán phân cým xe hĄi (Singh, 2015), kí hiệu 4 chiếc xe hĄi là 1 2 3 4 A ,A ,A ,A . Mỗi chiếc xe ta xét 3 thuộc tính: tiết kiệm nhiên liệu (x1), giá câ (x2), an toàn (x3). Thông tin đþợc thể hiện bìng têp mą bĀc tranh nhþ sau:   1 1 2 3 A x ,0.3,0.2,0.1 , x ,0.8,0.1,0.1 , x ,0.1,0,0.9    2 1 2 3 A x ,0.4,0.1,0.5 , x ,0,0.7,0.1 , x ,0.3,0.2,0.4    3 1 2 3 A x ,0.2,0.6,0.1 , x ,0.9,0.1,0 , x ,0.7,0.1,0.2    4 1 2 3 A x ,0.7,0.3,0 , x ,0.5,0.1,0.3 , x ,0.6,0,0.3  Bước 1. Sā dýng công thĀc (8) tính các PSF i j J (A ,A ) , ta có ma trên kết hợp 1 0.8582 0.9035 0.9055 0.8582 1 0.8750 0.8912 0.9035 0.8750 1 0.9414 0.9055 0.8912 0. C 9414 1               Bước 2. Tính ma trên hợp thành 2 1 0.8912 0.9055 0.9055 0.8912 1 0.8912 0.8912 0.9055 0.8912 1 0.9414 0.9055 0.8912 0. C 9414 1               Ta thçy C không phâi là ma trên kết hợp tþĄng đþĄng 4 1 0.8912 0.9055 0.9055 0.8912 1 0.8912 0.8912 0.9055 0.8912 1 0.9414 0.9055 0.8912 0. C 9414 1               Ta có C4 = C2, do đò C2 là ma trên kết hợp tþĄng đþĄng Bước 3. Xây dýng ma trên _lát cít cûa C 2 ta có các khâ nëng phån cým nhþ sau: VĆi   0.8912: ta có một cým {A1, A2, A3, A4}. VĆi 0.8912 <  < 0.905: ta có hai cým{A1, A3, A4}, {A2}. VĆi 0.905 <   0.9414: ta có ba cým {A1}, {A2}, {A3, A4}. VĆi 0.9414 <   1: ta có 4 cým {A1}, {A2}, {A3}, {A4}. 5. KẾT LUẬN Trong bài báo này chúng tôi đã đề xuçt một độ đo tþĄng tă mĆi cho các têp mą bĀc tranh dăa trên chî số Jaccard. Bìng một số ví dý, chúng tôi đã chî ra rìng trong nhiều trþąng hợp việc sā dýng độ đo tþĄng tă mĆi đã khíc phýc đþợc nhĂng hän chế cûa các độ đo tþĄng tă đã cò. Chúng tôi cüng đã sā dýng độ đo tþĄng tă mĆi vào bài toán phân cým têp mą bĀc tranh dăa trên thuêt toán phân cým ma trên kết hợp Lê Thị Diệu Thùy, Nguyễn Hữu Hải, Nguyễn Văn Hạnh, Đỗ Thị Huệ 395 tþĄng đþĄng, điều này cho thçy tính khâ dýng cûa độ đo tþĄng tă mĆi đþợc đề xuçt. Trong tþĄng lai độ đo tþĄng tă đþợc đề xuçt cæn đþợc tiếp týc nghiên cĀu Āng dýng nhiều hĄn trong các bài toán nhên däng méu, phân cým, quyết đðnh đa tiêu chí,„ và nghiên cĀu mć rộng hþĆng này trên các däng têp mą khác. TÀI LIỆU THAM KHẢO Atanassov K.T. (1986). Intuitionistic fuzzy sets. Fuzzy sets and Systems. 20(1): 87-96. Cuong B.C. (2014). Picture fuzzy sets. Journal of Computer Science and Cybernetics. 30(4): 409- 420. Cuong B.C. & Hai P.V. (2015). Some fuzzy logic operators for picture fuzzy sets. Seventh International Conference on Knowledge and Systems Engineering. pp. 132-137. Dengfeng L. & Chuntian C. (2002). New similarity measures of intuitionistic fuzzy sets and application to pattern recognitions. Pattern Recogn. Lett. 23: 221-225. Dinh N.V. & Thao N.X. (2018). Some Measures of Picture Fuzzy Sets and Their Application in Multi- attribute Decision Making. I.J. Mathematical Sciences and Computing. 3: 23-41. Dinh N.V., Thao N.X. & Chau N.M. (2015). On the picture fuzzy database: theories and application. Việt Nam National University of Agriculture, J. Sci. & Devel. 13(6): 1028-1035. Dutta P. (2017). Medical Diagnosis via Distance Measures on Picture Fuzzy Sets. Amse Journals- Amseiieta publication. 54(2): 137-152. Garg H. (2017). Some picture fuzzy aggregation operators and their applications to multicriteria decision-making. Arabian Journal for Science Engineering. 42(12): 5275-5290. Hoa N.D., Son L.H. & Thong P.H. (2014). Weather nowcasting from satellite image sequences using the combination of picture fuzzy clustering and spatiotemporal regression. Proceeding of Conference of GISIDEAR. Đà Nẵng, Việt Nam. Hoa N.D., Son L.H. & Thong P.H. (2016). Some improvements of fuzzy clustering algorithms using picture fuzzy sets and applications for geographic data clustering. VNU Journal of Science: Computer Science and Communication Engineering. 32(3): 32-38. Hung W.L & Yang M.S. (2004). Similarity measures of intuitionistic fuzzy sets based on Hausdorff distance. Pattern Recognition Letters. 25: 1603-1611. Hung W.L. & Yang M.S. (2007). Similarity measures of intuitionistic fuzzy sets based on Lpmetric. International Journal of Approximate Reasoning. 46: 120-136. Hwang C.M., Yang M.S. & Hung W.L. (2018). New similarity measures of intuitionistic fuzzy sets based on the Jaccard index with its application to clustering. International Journal of Intelligent Systems. 33(8): 1672-1688. Joshi D. & Kumar S. (2018). An Approach to Multi- criteria Decision Making Problems Using Dice Similarity Measure for Picture Fuzzy Sets. Mathematics and Computing. Springer, Singapore. Li D.F. & Cheng C. (2002). New similarity measures of intuitionistic fuzzy sets and application to pattern recognitions. Pattern Recognition Letters. 23: 221-225. Liu H.W. (2005). New similarity measures between intuitionistic fuzzy sets and between elements. Mathematical and Computer Modelling. 42: 61-70. Mitchell H.B. (2003). On the Dengfeng-Chuntian similarity measure and its application to pattern recognition. Pattern Recognition Letters. 24: 3101-3104. Peng X. & Dai J. (2017). Algorithm for picture fuzzy multiple attribute decision making based on new distance measure. International Journal for Uncertainty Quantification. 7: 177-187. Phong P.H., Hieu D.T., Ngan R.T.H. & Them P.T. (2014). Some compositions of picture fuzzy relations, in: Proceedings of the 7th National Conference on Fundamental and Applied Information Technology Research, FAIR’7, Thai Nguyen. pp. 19-20. Singh P. (2015). Correlation coefficients for picture fuzzy sets. Journal of Intelligent & Fuzzy Systems. 28(2): 591-604. Son L.H. (2015). DPFCM: A novel distributed picture fuzzy clustering method on picture fuzzy sets. Expert System with Applications. 42(1): 51-66. Son L.H. (2016). Generalized picture distance measure and applications to picture fuzzy clustering. Applied Soft Computing. 46: 248-295. Son L.H. (2017). Measuring analogousness in picture fuzzy sets: from picture distance measures to picture association measures. Fuzzy Optimization and Decision Making. 16(3): 359-378. Son L.H., Phong P.H. (2016). On the performance evaluation of intuitionistic vector similarity measures for medical diagnosis. Journal of Intelligent and Fuzzy Systems. 31: 1597-1608. Son L.H., Viet P.V. & Hai P.V. (2017). Picture inference system: a new fuzzy inference system on picture fuzzy set. Applied Intelligence. 46(3): 652-669. Độ đo tương tự mới trên các tập mờ bức tranh và ứng dụng trong phân cụm dữ liệu 396 Szmidt E. (2014). Distances and Similarities in Intuitionistic Fuzzy Sets. Springer International Publishing Switzerland. p. 307. Thao N.X. & Dinh N.V. (2015). Rough picture fuzzy set and picture fuzzy topologies. Journal of Computer Science and Cybernetics. 31(3): 245. Thong P.H. & Son L.H. (2014). A new approach to multi-variable fuzzy forecasting using picture fuzzy clustering and picture fuzzy rule interpolation method. Knowledge and Systems Engineering, Springer, Cham. pp. 679-690. Thong P.H. (2016). Picture fuzzy clustering: a new computational intelligence method. Soft Computing. 20(9): 3549-3562. Thong P.H. (2016). Picture fuzzy clustering for complex data. Engineering Applications of Arti_cial Intelligence. 56: 121-130. Thong P. H. (2017). Some novel hybrid forecast methods based on picture fuzzy clustering for weather now-casting from satellite image sequences. Applied Intelligence. 46(1):1-15. Viet P.V., Chau H.T.M & Hai P.V. (2015). Some extensions of membership graphs for picture inference systems. Seventh International Conference on Knowledge and Systems Engineering, (KSE), IEEE. pp. 192-197. Wei G.W. (2017). Some similarity measures for picture fuzzy sets and their applications to strategic decision making. Informatica. 28: 547-564. Wei G.W. (2017). Some cosine similarity measures for picture fuzzy sets and their applications to strategic decision making. Informatica. 28(3): 547-564. Wei G.W. (2018). Some similarity measures for picture fuzzy sets and their applications. Iranian Journal of Fuzzy Systems. 15(1): 77-89. Wei G.W. (2018). The Generalized Dice Similarity Measures for Picture Fuzzy Sets and Their Applications. Informatica. 29(1): 107-124. Xu Z.S., Chen J. & Wu J.J. (2008). Clustering algorithm for intuitionistic fuzzy sets. Information Sciences. 178: 3775-3790. Xu Z.S. & Xia M.M. (2010). Some new similarity measures for intuitionistic fuzzy values and their application in group decision making. Journal of System Science and Engineering. 19: 430-452. Ye J. (2011). Cosine similarity measures fot intuitionistic fuzzy sets and their applications. Mathematical and Computer Modelling. 53: 91-97. Ye J. (2012). Multicriteria decision-making method using the Dice similarity measure based on the reduct intuitionistic fuzzy sets of interval-valued intuitionistic fuzzy sets. Applied Mathematical Modelling. 36: 4466-4472. Ye J. (2016). Similarity measures of intuitionistic fuzzy sets based on cosine function for the decision making of mechanical design schemes. Journal of Intelligent and Fuzzy Systems. 30: 151-158. Zadeh L.A. (1965). Fuzzy sets. Information and control. 8(3): 338-353. Zeng S., Asharf S., Arif M. & Abdullah S. (2019). Application of Exponential Jensen Picture Fuzzy Divergence Measure in Multi-Criteria Group Decision Making. Mathematics. 7(2): 191-207.

Các file đính kèm theo tài liệu này:

  • pdftap_chi_so_5_2_5_3095_2179757.pdf
Tài liệu liên quan