Hệ thống tương tác thông minh trong tra cứu, tìm kiếm thông tin bệnh - Nguyễn Hồng Sơn

Tài liệu Hệ thống tương tác thông minh trong tra cứu, tìm kiếm thông tin bệnh - Nguyễn Hồng Sơn: Công nghệ thông tin & Cơ sở toán học cho tin học N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 160 HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU, TÌM KIẾM THÔNG TIN BỆNH Nguyễn Hồng Sơn1*, Dương Trọng Hải2, Hoa Tất Thắng3 Abstract: Hệ thống tương tác thông minh trong tra cứu và tìm kiếm thông tin bệnh “Smart Doctor” được xây dựng dựa trên phương thức tìm kiếm ngữ nghĩa, tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Đầu tiên, chúng tôi kế thừa và Việt hóa mạng tri thức về các bệnh tật Disease Ontology là sản phẩm kết hợp của đại học Northwestern, Trung tâm y học di truyền và Đại học Maryland School of Medicine, Viện Khoa học Di truyền. Mạng tri thức này là cơ sở cho suy luận, hướng luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá trình tìm kiếm. Tiếp đến, thông tin tìm kiếm được phân cụm động (dynamic clustering) th...

pdf10 trang | Chia sẻ: quangot475 | Lượt xem: 880 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Hệ thống tương tác thông minh trong tra cứu, tìm kiếm thông tin bệnh - Nguyễn Hồng Sơn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Công nghệ thông tin & Cơ sở toán học cho tin học N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 160 HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU, TÌM KIẾM THÔNG TIN BỆNH Nguyễn Hồng Sơn1*, Dương Trọng Hải2, Hoa Tất Thắng3 Abstract: Hệ thống tương tác thông minh trong tra cứu và tìm kiếm thông tin bệnh “Smart Doctor” được xây dựng dựa trên phương thức tìm kiếm ngữ nghĩa, tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Đầu tiên, chúng tôi kế thừa và Việt hóa mạng tri thức về các bệnh tật Disease Ontology là sản phẩm kết hợp của đại học Northwestern, Trung tâm y học di truyền và Đại học Maryland School of Medicine, Viện Khoa học Di truyền. Mạng tri thức này là cơ sở cho suy luận, hướng luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá trình tìm kiếm. Tiếp đến, thông tin tìm kiếm được phân cụm động (dynamic clustering) theo các facets và hệ thống phân cấp (categories) dựa trên mạng ngữ nghĩa và tương tác của người dùng. Dựa trên cơ sở đó, hệ thống tương tác thông minh trong tra cứu và tìm kiếm thông tin bệnh “Smart Doctor” được xây dựng và trình bày trong bài báo này như là một minh chứng thực tế cho các khái niệm của chúng tôi. Keywords: Big Data, Smart doctor, Dynamic clustering, Facets. 1. MỞ ĐẦU Sự bùng nổ số lượng thông tin bởi người dùng trực tuyến cũng như sự phát triển của dữ liệu lớn - Big data, cung cấp một cơ hội mới và cũng là một thách thức cho việc tìm ra đúng thông tin cần thiết. Khi tìm kiếm thông tin, người dùng có nhu cầu muốn biết thật chính xác hoặc nhiều thông tin liên quan với những từ khóa ngắn nhất. Đôi lúc người dùng cũng cần hệ thống đề nghị một số từ khóa hay thông tin liên quan để tiếp tục quá trình tìm kiếm vì họ cũng chưa thực sự hiểu được nội dung đang tìm kiếm là gì. Ví dụ, người bệnh chỉ biết một số triệu chứng bệnh căn bản và cần biết mình đang mắc bệnh gì; họ cần hệ thống khuyến nghị một số triệu chứng bệnh liên quan để người dùng chọn và xác nhận [5]. Hiện nay, các trang tìm kiếm thông tin về bệnh tật chủ yếu dừng ở mức độ tra cứu, thường theo một tuần tự, phải đi từ chỉ mục đến vấn đề/triệu chứng cần tra cứu, tiếp đến phải đọc rất nhiều để tìm đến thông tin cần tham khảo, như thế mất rất nhiều thời gian, hiệu quả đem lại không cao và thường kém chính xác. Đây chính là những lý do cơ bản khiến cho các hệ thống tìm kiếm hiện nay có kết quả trả về không phải lúc nào cũng thỏa mãn yêu cầu của người sử dụng [5]. Trong ngữ cảnh đó, chúng tôi tập trung vào việc xây dựng hệ thống Web tìm kiếm ngữ nghĩa [1] tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Trước hết, mạng tri thức về các bệnh tật Disease Ontology [5] được kế thừa và Việt hóa là cơ sở cho suy luận, hướng luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá trình tìm kiếm. Cụ thể là, Web tìm kiếm ngữ nghĩa sử dụng dữ liệu bệnh tật được đặc tả nói trên, có khả năng tự tạo lập và cập nhật một mạng ngữ nghĩa mô tả thông tin bệnh tật tích hợp với dữ liệu bệnh được cung cấp bởi chuyên gia và các nguồn đáng tin cậy. Nhờ đó, thông tin tìm kiếm được phân cụm động theo các facets và hệ thống phân cấp (categories) dựa trên mạng ngữ nghĩa và tương tác của người dùng. Dựa trên thông tin cung cấp ban đầu và lịch sử tương tác của người dùng, các facets được tạo ra thích ứng với tương tác người dùng nhằm điều hướng luồng tìm kiếm và gợi ý thông minh theo ý định của người dùng trong Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 161 quá trình tìm kiếm. Với sự điều hướng luồng thông tin tìm kiếm giúp người dùng tìm đến thông tin chủ ý và thông tin liên quan nhanh chóng và chính xác. Bài báo được trình bày theo cấu trúc như sau: phần 2 sẽ trình bày cấu trúc khung của hệ thống Smart Doctor, và tóm tắt về Disease Ontology; phần 3 sẽ trình bày chi tiết công cụ chiết thông tin và phương pháp tạo lập cũng như sử dụng mạng Disease Ontology. Trong phần này, việc chuyển hóa Disease Ontology sang tiếng Việt cũng được trình bày. Do hạn chế của giới hạn bài báo, chúng tôi chỉ giới thiệu sơ lược cách sử dụng máy học (machine learning) trong hướng nghiên cứu này. Kết luận và hướng mở của đề tài sẽ được trình bày trong phần 4. 2. HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU/TÌM KIẾM THÔNG TIN BỆNH - “SMART DOCTOR” Smart Doctor cung cấp công cụ tìm kiếm bệnh thông minh thông qua những triệu chứng của người dùng. Mặc khác, ứng dụng cung cấp nhiều thông tin về bệnh, được lấy từ nhiều nguồn với sự xem xét và đánh giá của những chuyên gia trong lĩnh vực y tế. Mục tiêu của “Smart Doctor” cố gắng giảm thiểu công sức và thời gian của người dùng trong quá trình tìm kiếm bệnh, và cung cấp những thông tin cần thiết về bệnh cho người dùng để họ có thể sớm biết về tình trạng bệnh, và có những biện pháp phù hợp. 2.1. Cấu trúc khung của Hệ thống Cấu trúc khung của Hệ thống “Smart Doctor” được mô tả trong hình 1: Hình 1. Cấu trúc khung của ứng dụng. 2.2. Ontology dịch bệnh Ontology dịch bệnh (Disease Ontology) đã được phát triển như là một bản thể học chuẩn cho bệnh nhân với mục đích cung cấp cho cộng đồng y sinh thiệu phù hợp, tái sử dụng và bền vững về bệnh của con người, đặc điểm kiểu hình và khái niệm bệnh từ vựng y tế có liên quan thông qua các nỗ lực hợp tác của các nhà nghiên cứu tại Đại học Northwestern, Trung tâm y học di truyền và Đại học Maryland School of Medicine, Viện Khoa học Di truyền [5]. Ví dụ thông tin bệnh trong Disease Ontology (xem hình 2, 3). Công nghệ thông tin & Cơ sở toán học cho tin học N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 162 3. XÂY DỰNG HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU/TÌM KIẾM THÔNG TIN BỆNH - “SMART DOCTOR” 3.1. Công cụ trích xuất dữ liệu Dựa vào cấu trúc thông tin với định dạng XML của bệnh trong “Disease Ontology”, công cụ “Extraction data tool” mô hình hóa cấu trúc dữ liệu của “Disease Ontology” thành những lớp trong ngôn ngữ lập trình, và trích xuất dữ liệu đưa vào cơ sở dữ liệu bệnh (Disease schema) theo những phương pháp sau: a. Phương pháp rút thông tin bệnh Hình 2. Mẫu ví dụ về một bệnh trong Disease Ontology. Hình 3. Mẫu dữ liệu bệnh trong Disease Ontology. Mã số bệnh: - Dữ liệu được chứa vào cột [DiseaseId] của bảng [Disease] - Dữ liệu được rút từ tag “”, <owl:Class rdf:about=""> => [DiseaseId] = “DOID:0050004” Tên bệnh: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 163 - Dữ liệu được chứa vào cột [LabelEn] của bảng [Disease] - Dữ liệu được rút từ tag “”, ví dụ từ mẫu trong Hình 4.5: seminal vesicle acute gonorrhea => [LabelEn] = “seminal vesicle acute gonorrhea” Mã số bệnh cha: - Dữ liệu được chứa vào cột [ParentDiseaseId] của bảng [Disease] - Dữ liệu được rút từ tag “”, ví dụ từ mẫu trong hình 7: => [LabelEn] = “DOID:10400” b. Phương pháp rút loại thuộc tính bệnh Hình 4. Mẫu dữ liệu loại thuộc tính bệnh trong Disease Ontology. Tên loại thuộc tính bệnh bệnh: - Dữ liệu được chứa vào cột [LabelEn] của bảng [DiseasePropertyCategory] - Dữ liệu được rút từ tag “” như sau: has_symptom ” => Rút được [LabelEn] = “has_symptom” c. Phương pháp rút dữ liệu tính chất bệnh Hình 5. Mẫu dữ liệu chứa tính chất bệnh trong Disease Ontology. Tên tính của tính chất bệnh: - Dữ liệu được chứa vào cột [LabelEn] của bảng [DiseaseProperty] Công nghệ thông tin & Cơ sở toán học cho tin học N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 164 - Rút dữ liệu tính chất bệnh trong tag “” và “”. Dữ liệu trong những tags này chứa nhiều tính chất bệnh, như: “A viral infectious disease that results_in infection located_in joint, has_material_basis_in Chikungunya virus, which is transmitted_by Aedes mosquito bite. The infection has_symptom fever” => Trích xuất được thông tin của tính chất loại: “results_in”, “has_material_basis_in” , “transmitted_by”, và “has_symptom”. Vì vậy, công cụ này sẽ dùng trích xuất dữ liệu bằng kỷ thuật “regular expression”, theo từng bước như sau: Bước 1: chia nhỏ từng phần của đoạn dữ liệu lớn thành từng phần nhỏ, và đảm bảo một phần chỉ chứa duy nhất một tính chất của bệnh, như ví dụ trên thì có thể chia thành những phần sau: “A viral infectious disease that” “results_in infection” “located_in joint,” “has_material_basis_in Chikungunya virus, which is” “transmitted_by Aedes mosquito bite. The infection” “has_symptom fever” Bước 2: sử dụng mẫu (pattern) của “regular expression” theo từng loại thuộc tính bệnh để rút chính thông tin, như ví dụ trên thì: “has_symptom fever”: dùng mẫu của loại “has_symptom” là “has_symptom (.*)”, và có thể rút ra được dữ liệu “fever”. d. Phương pháp dịch dữ liệu sang tiếng Việt Hệ thống hỗ trợ phương thức dịch từ ngữ từ tiếng Anh sang tiếng Việt, thông qua “Translation website” của Google: Hình 6. Phương thức dịch ngôn ngữ. Dữ liệu sau khi được dịch sẽ được lưu vào cột “LabelVn” của những bảng như: “Disease”, “DiseaseProperty”, “DiseasePropertyCategory”. e. Kết quả trích xuất dữ liệu từ Disease Ontology Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 165 * Bệnh: có 8796 bệnh trong bảng “Disease” Hình 7. Mẫu dữ liệu trong bảng “Disease”. * Loại thuộc tính bệnh: các loại tính chất bệnh trong “DiseasePropertyCategories”: Hình 8. Mẫu dữ liệu trong bảng “DiseasePropertyCategories”. * Thuộc tính bệnh: có 2444 thuộc tính bệnh trong bảng “DiseaseProperty” Hình 9. Mẫu dữ liệu trong bảng "DiseaseProperty". 3.2. Công cụ Machine learning Dựa vào dữ liệu từ trích xuất từ “Disease Ontology”, thì những tính chất của bệnh có mỗi quan hệ với nhau, ví dụ: Hình 10. Mẫu dữ liệu bệnh trong CSDL. Trong 2 bệnh nêu trên có những tính chất bệnh cùng xuất hiện ở hai bệnh như: sốt (fever), đau đầu (headache), Vì vậy, có thể sử dụng một số thuật toán của “machine learning”, cụ thể là Word2Vec [9] để khám phá ra mối quan hệ của những tính chất bệnh. Công nghệ thông tin & Cơ sở toán học cho tin học N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 166 Hình 11. Khám phá 1.355.834 luật liên kết của tính chất bệnh. Hình 12. Mẫu dữ liệu về một luật liên kết. Theo hình trên, thì ta có thông tin luật với mã số (ID) = 2 là: - Độ hỗ trợ (Support) = 0.2581 - Độ tin cậy (Confidence) = 60 - Mối quan hệ:{fever, vomiting, water contaminated with feces, muschle spasams} =>{direct contract with the oral secretions, ingestion of food, human poliovirus 3} 3.3. Ghi lại quá trình tìm kiếm của người dùng Trong tìm kiếm của người sử dụng, hệ thống lưu lại các truy vấn của người dùng như các từ khóa tìm kiếm, bối cảnh của người sử dụng (thời gian, địa điểm); và cũng là tham khảo kết quả của người sử dụng như: kết quả mà bệnh được nhập, bao lâu dừng sử dụng để đọc thông tin dịch bệnh, những nhận xét của người dùng về mỗi kết quả tìm kiếm của bệnh, và sự đánh giá của người dùng trên mỗi kết quả tìm kiếm của bệnh. Hệ thống sẽ lưu lại lịch sử tìm kiếm để khám phá các hành vi của người sử dụng, và điều chỉnh cơ sở dữ liệu bệnh trên đánh giá của người sử dụng. 3.4. Các thành phần khác Ngoài các thành phần cấu thành hệ thống như đã nêu ở trên, Hệ thống Smart Doctor còn bao gồm một số thành phần sau: - Mô hình thực thể trong cơ sở dữ liệu. - Lớp truy xuất dữ liệu: cung cấp các phương thức truy xuất cơ sở dữ liệu. - Lớp Repository: chứa những câu truy vấn phức tạp sử dụng “Lambda expression” - Lớp nghiệp vụ của hệ thống: dùng để hiện thực các nghiệp vụ của hệ thống. - Các hàm truy vấn dữ liệu - REST APIs: cung cấp những phương thức truy vấn dữ liệu của hệ thống thông qua URI cho những hệ thống khách. - Ứng dụng Single page (SPA): Sử dụng công nghệ web như: HTML5, CSS3, Typescripts, và Angular.js để làm ứng dụng website trên một trang với mục tiêu đưa trải nghiệm người dùng trên web như ứng dụng trên máy tính. 3.5. Kết quả giao diện người sử dụng Hình 13. Autocomplete trong khung tìm kiếm. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 167 Hệ thống này cung cấp tính năng gợi ý đề nghị để tăng tính tương tác giữa người sử dụng và hệ thống, trong một số tình huống dưới đây: Khi người sử dụng chỉ cần nhập một số ký tự vào hộp tìm kiếm, hệ thống sẽ đề nghị truy vấn với các gợi ý bắt đầu với những ký tự này. Nó giúp người sử dụng điền các truy vấn nhanh hơn bằng cách lựa chọn câu hỏi từ gợi ý và sử dụng các tiêu chí tìm kiếm chính xác hơn bằng cách đưa ra gợi ý chính tả. Trong trường hợp, người sử dụng chỉ nhớ một từ khóa của các truy vấn, và họ có thể nhập các từ khóa vào ô tìm kiếm, hệ thống sẽ đề xuất các truy vấn, có chứa các từ khóa này. Nó giúp người sử dụng lựa chọn các truy vấn phù hợp với ý định của họ mà không cần nhớ toàn bộ truy vấn. Ngoài ra, đề nghị gợi ý không chỉ giúp người dùng lựa chọn các truy vấn chính xác cho ý định của họ, mà còn giúp họ có các truy vấn thuộc vào từ điển của hệ thống. Điều này sẽ giúp sự tự tin của các truy vấn cao hơn và các kết quả tìm kiếm chính xác hơn. Hình 14. Gợi ý từ khóa liên quan trong khung tìm kiếm. Hệ thống này cũng cung cấp tính năng đề xuất để giới thiệu các triệu chứng có liên quan hoặc thuộc bệnh khác, ví dụ như khi người sử dụng lựa chọn một số từ khóa tìm kiếm là "sốt" (fever), "đau đầu" (headache), và họ dừng lại để nghĩ cho tìm kiếm các từ khóa tiếp theo; lúc này hệ thống sẽ giới thiệu các triệu chứng liên quan với các triệu chứng bình chọn là "co giật" (convulsions). Các triệu chứng liên quan được khám phá từ các quy tắc quan hệ của các triệu chứng, và các triệu chứng liên quan được đặt hàng (trên xuống dưới) bởi sự tự tin của quy tắc của các triệu chứng liên quan. Khi người dùng thực hiện tìm kiếm thì hệ thống sẽ tìm bệnh tương ứng với những thuộc tính bệnh mà người dùng đã gõ vào, với những lựa chọn kết quả tìm kiếm như sau: - Dữ liệu hệ thống chọn ra bệnh có thuộc tính đang tìm kiếm, bệnh được sắp xếp theo số lượng đã xem và đánh giá đó, và nội dung của những bệnh này được cung cấp bởi những tài liệu trong hệ thống. - Dữ liệu bên ngoài, ứng với mỗi bệnh từ Hình 15. Hiển thị kết quả tìm kiếm bệnh. Công nghệ thông tin & Cơ sở toán học cho tin học N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 168 dữ liệu hệ thống thì hệ thống sẽ tìm kiếm trên Google với từ khóa là tên bệnh, và lấy những kết quả (top 3) được đánh giá cao để gợi ý người dùng. Kết quả hiển thị từng khối cho mỗi bệnh, và được sắp xếp từ trái sang phải, từ trên xuống dưới. Mỗi khối bệnh được hiển thị như sau (hình 15): - Phần trên hiển thị ảnh đại diện của bệnh. - Phần giữa hiển thị tên bệnh, và số lượng người xem bệnh này. - Phần cuối hiển thị đánh giá của người dùng về nội dung bệnh. 4. KẾT LUẬN VÀ HƯỚNG MỞ Trong bài báo này, chúng tối đã giới thiệu việc xây dựng hệ thống Web tìm kiếm ngữ nghĩa tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Trước hết, chúng tôi kế thừa và Việt hóa mạng tri thức về các bệnh tật Disease Ontology [5], đây là cơ sở cho việc hướng luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá trình tìm kiếm. Từ đó, công cụ Web tìm kiếm ngữ nghĩa được xây dựng có khả năng tự tạo lập và cập nhật một mạng ngữ nghĩa mô tả thông tin bệnh tật tích hợp với dữ liệu bệnh được cung cấp bởi chuyên gia và các nguồn đáng tin cậy khác. Từ đây, các facets và hệ thống phân cấp (categories) được đặc tả và sử dụng trong việc tương tác với người dùng nhằm điều hướng luồng tìm kiếm và gợi ý thông minh theo ý định của người dùng trong quá trình tìm kiếm. Trong hướng nghiên cứu tiếp theo, chúng tôi sẽ tập trung vào việc hỗ trợ giao tác trực tuyến (interoperabiligy) để có thể kết nối Smart Doctor với các hệ thống liên kết. Đặc biệt, để đảm bảo mạng tri thức luôn được cấp nhập, chúng tôi sẽ xây dựng công cụ để đồng bộ hóa mạng tri thức bệnh đã được Việt hóa và hệ thống Disease Ontology [5]. TÀI LIỆU THAM KHẢO [1]. Dario Bonino, Fulvio Corno, Laura Farinetti, Alessio Bosca, “Ontology Driven Semantic Search”, WSEAS Transaction on Information Science and Application, Issue 6, Volume 1, December 2004, pp. 1597-1605. [2]. Denman, S., et al., “Searching for people using semantic soft biometric descriptions”. Pattern Recognition Letters, 2015. 68: p. 306-315. [3]. Guha, R., R. McCool, and E. Miller. “Semantic search”. in Proceedings of the 12th international conference on World Wide Web. 2003. ACM. [4]. Henrik Eriksso, “The semantic-document approach to combining documents and ontologies”, International Journal of Human-Computer Studies Volume 65, Issue 7, July 2007, Pages 624-639. [5]. Kibbe WA, Arze C, Felix V, Mitraka E, Bolton E, Fu G, Mungall CJ, Binder JX, Malone J, Vasant D, Parkinson H, Schriml LM. “Disease Ontology 2015 update: an expanded and updated database of human diseases for linking biomedical knowledge through disease data Nucleic Acids Research 2014”; Oct 27. pii: gku1011 [6]. Ma, B., et al., “Public opinion analysis based on probabilistic topic modeling and deep learning”. Public opinion, 2016. [7]. Trong Hai Duong, Jo G.S., Jung J.J., Nguyen N.T. (2009): “Complexity Analysis of Ontology Integration Methodologies: A Comparative Study”. Journal of Universal Computer Science 15(4), 877-897. [8]. Trong Hai Duong, Jo G.S. (2010): “Collaborative Ontology Building by Reaching Consensus among Participants”. Information-An International Interdisciplinary Journal, 1557-1569. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 169 [9]. https://en.wikipedia.org/wiki/Word2vec TÓM TẮT SMART DOCTOR – AN INTELLIGENT INTERACTIVE SYSTEM FOR SEARCHING AND RETRIEVING DISEASE INFORMATION Intelligent interactive system for searching and retrieving disease information, namely Smart Doctor, is studied and developed based on semantic search methodology. The system is also aimed by integrating concepts of expert system and of recommendation system in searching and retrieving disease documents. First, the disease knowledge network is built based on the OWL standard and is integrated from multiple sources. Afterwards, the search information is dynamically clustered according to the facets and categorized based on the semantic network and the user interaction. Hereafter, the intelligent interactive system Smart Doctor is built and presented as typical examples to prove our concepts in this paper. Keywords: Big Data, Smart doctor, Dynamic clustering, Facets. Nhận bài ngày 11 tháng 10 năm 2017 Hoàn thiện ngày 08 tháng 11 năm 2017 Chấp nhận đăng ngày 26 tháng 02 năm 2018 Địa chỉ: 1 Trường Đại học Luật, Đại học Huế; 2 Trường Đại học Nguyễn Tất Thành; 3 Học viện Kỹ thuật quân sự. *Email: son_nguyenhong2002@yahoo.com.

Các file đính kèm theo tài liệu này:

  • pdf19_thang_0615_2150600.pdf
Tài liệu liên quan