Tài liệu Hệ thống tương tác thông minh trong tra cứu, tìm kiếm thông tin bệnh - Nguyễn Hồng Sơn: Công nghệ thông tin & Cơ sở toán học cho tin học
N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 160
HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU,
TÌM KIẾM THÔNG TIN BỆNH
Nguyễn Hồng Sơn1*, Dương Trọng Hải2, Hoa Tất Thắng3
Abstract: Hệ thống tương tác thông minh trong tra cứu và tìm kiếm thông tin
bệnh “Smart Doctor” được xây dựng dựa trên phương thức tìm kiếm ngữ nghĩa,
tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa
Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Đầu tiên, chúng tôi kế thừa
và Việt hóa mạng tri thức về các bệnh tật Disease Ontology là sản phẩm kết hợp
của đại học Northwestern, Trung tâm y học di truyền và Đại học Maryland School
of Medicine, Viện Khoa học Di truyền. Mạng tri thức này là cơ sở cho suy luận,
hướng luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá
trình tìm kiếm. Tiếp đến, thông tin tìm kiếm được phân cụm động (dynamic
clustering) th...
10 trang |
Chia sẻ: quangot475 | Lượt xem: 848 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Hệ thống tương tác thông minh trong tra cứu, tìm kiếm thông tin bệnh - Nguyễn Hồng Sơn, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Công nghệ thông tin & Cơ sở toán học cho tin học
N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 160
HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU,
TÌM KIẾM THÔNG TIN BỆNH
Nguyễn Hồng Sơn1*, Dương Trọng Hải2, Hoa Tất Thắng3
Abstract: Hệ thống tương tác thông minh trong tra cứu và tìm kiếm thông tin
bệnh “Smart Doctor” được xây dựng dựa trên phương thức tìm kiếm ngữ nghĩa,
tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa
Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Đầu tiên, chúng tôi kế thừa
và Việt hóa mạng tri thức về các bệnh tật Disease Ontology là sản phẩm kết hợp
của đại học Northwestern, Trung tâm y học di truyền và Đại học Maryland School
of Medicine, Viện Khoa học Di truyền. Mạng tri thức này là cơ sở cho suy luận,
hướng luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá
trình tìm kiếm. Tiếp đến, thông tin tìm kiếm được phân cụm động (dynamic
clustering) theo các facets và hệ thống phân cấp (categories) dựa trên mạng ngữ
nghĩa và tương tác của người dùng. Dựa trên cơ sở đó, hệ thống tương tác thông
minh trong tra cứu và tìm kiếm thông tin bệnh “Smart Doctor” được xây dựng và
trình bày trong bài báo này như là một minh chứng thực tế cho các khái niệm của
chúng tôi.
Keywords: Big Data, Smart doctor, Dynamic clustering, Facets.
1. MỞ ĐẦU
Sự bùng nổ số lượng thông tin bởi người dùng trực tuyến cũng như sự phát triển của dữ
liệu lớn - Big data, cung cấp một cơ hội mới và cũng là một thách thức cho việc tìm ra
đúng thông tin cần thiết. Khi tìm kiếm thông tin, người dùng có nhu cầu muốn biết thật
chính xác hoặc nhiều thông tin liên quan với những từ khóa ngắn nhất. Đôi lúc người dùng
cũng cần hệ thống đề nghị một số từ khóa hay thông tin liên quan để tiếp tục quá trình tìm
kiếm vì họ cũng chưa thực sự hiểu được nội dung đang tìm kiếm là gì. Ví dụ, người bệnh
chỉ biết một số triệu chứng bệnh căn bản và cần biết mình đang mắc bệnh gì; họ cần hệ
thống khuyến nghị một số triệu chứng bệnh liên quan để người dùng chọn và xác nhận [5].
Hiện nay, các trang tìm kiếm thông tin về bệnh tật chủ yếu dừng ở mức độ tra cứu,
thường theo một tuần tự, phải đi từ chỉ mục đến vấn đề/triệu chứng cần tra cứu, tiếp đến
phải đọc rất nhiều để tìm đến thông tin cần tham khảo, như thế mất rất nhiều thời gian,
hiệu quả đem lại không cao và thường kém chính xác. Đây chính là những lý do cơ bản
khiến cho các hệ thống tìm kiếm hiện nay có kết quả trả về không phải lúc nào cũng thỏa
mãn yêu cầu của người sử dụng [5].
Trong ngữ cảnh đó, chúng tôi tập trung vào việc xây dựng hệ thống Web tìm kiếm ngữ
nghĩa [1] tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ
nghĩa Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Trước hết, mạng tri thức về
các bệnh tật Disease Ontology [5] được kế thừa và Việt hóa là cơ sở cho suy luận, hướng
luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá trình tìm kiếm.
Cụ thể là, Web tìm kiếm ngữ nghĩa sử dụng dữ liệu bệnh tật được đặc tả nói trên, có khả
năng tự tạo lập và cập nhật một mạng ngữ nghĩa mô tả thông tin bệnh tật tích hợp với dữ
liệu bệnh được cung cấp bởi chuyên gia và các nguồn đáng tin cậy. Nhờ đó, thông tin tìm
kiếm được phân cụm động theo các facets và hệ thống phân cấp (categories) dựa trên
mạng ngữ nghĩa và tương tác của người dùng. Dựa trên thông tin cung cấp ban đầu và lịch
sử tương tác của người dùng, các facets được tạo ra thích ứng với tương tác người dùng
nhằm điều hướng luồng tìm kiếm và gợi ý thông minh theo ý định của người dùng trong
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 161
quá trình tìm kiếm. Với sự điều hướng luồng thông tin tìm kiếm giúp người dùng tìm đến
thông tin chủ ý và thông tin liên quan nhanh chóng và chính xác.
Bài báo được trình bày theo cấu trúc như sau: phần 2 sẽ trình bày cấu trúc khung của hệ
thống Smart Doctor, và tóm tắt về Disease Ontology; phần 3 sẽ trình bày chi tiết công cụ
chiết thông tin và phương pháp tạo lập cũng như sử dụng mạng Disease Ontology. Trong
phần này, việc chuyển hóa Disease Ontology sang tiếng Việt cũng được trình bày. Do hạn
chế của giới hạn bài báo, chúng tôi chỉ giới thiệu sơ lược cách sử dụng máy học (machine
learning) trong hướng nghiên cứu này. Kết luận và hướng mở của đề tài sẽ được trình bày
trong phần 4.
2. HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA CỨU/TÌM KIẾM
THÔNG TIN BỆNH - “SMART DOCTOR”
Smart Doctor cung cấp công cụ tìm kiếm bệnh thông minh thông qua những triệu
chứng của người dùng. Mặc khác, ứng dụng cung cấp nhiều thông tin về bệnh, được lấy từ
nhiều nguồn với sự xem xét và đánh giá của những chuyên gia trong lĩnh vực y tế. Mục
tiêu của “Smart Doctor” cố gắng giảm thiểu công sức và thời gian của người dùng trong
quá trình tìm kiếm bệnh, và cung cấp những thông tin cần thiết về bệnh cho người dùng để
họ có thể sớm biết về tình trạng bệnh, và có những biện pháp phù hợp.
2.1. Cấu trúc khung của Hệ thống
Cấu trúc khung của Hệ thống “Smart Doctor” được mô tả trong hình 1:
Hình 1. Cấu trúc khung của ứng dụng.
2.2. Ontology dịch bệnh
Ontology dịch bệnh (Disease Ontology) đã được phát triển như là một bản thể học
chuẩn cho bệnh nhân với mục đích cung cấp cho cộng đồng y sinh thiệu phù hợp, tái sử
dụng và bền vững về bệnh của con người, đặc điểm kiểu hình và khái niệm bệnh từ vựng y
tế có liên quan thông qua các nỗ lực hợp tác của các nhà nghiên cứu tại Đại học
Northwestern, Trung tâm y học di truyền và Đại học Maryland School of Medicine, Viện
Khoa học Di truyền [5].
Ví dụ thông tin bệnh trong Disease Ontology (xem hình 2, 3).
Công nghệ thông tin & Cơ sở toán học cho tin học
N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 162
3. XÂY DỰNG HỆ THỐNG TƯƠNG TÁC THÔNG MINH TRONG TRA
CỨU/TÌM KIẾM THÔNG TIN BỆNH - “SMART DOCTOR”
3.1. Công cụ trích xuất dữ liệu
Dựa vào cấu trúc thông tin với định dạng XML của bệnh trong “Disease Ontology”,
công cụ “Extraction data tool” mô hình hóa cấu trúc dữ liệu của “Disease Ontology” thành
những lớp trong ngôn ngữ lập trình, và trích xuất dữ liệu đưa vào cơ sở dữ liệu bệnh
(Disease schema) theo những phương pháp sau:
a. Phương pháp rút thông tin bệnh
Hình 2. Mẫu ví dụ về một bệnh trong Disease Ontology.
Hình 3. Mẫu dữ liệu bệnh trong Disease Ontology.
Mã số bệnh:
- Dữ liệu được chứa vào cột [DiseaseId] của bảng [Disease]
- Dữ liệu được rút từ tag
“”, <owl:Class
rdf:about="">
=> [DiseaseId] = “DOID:0050004”
Tên bệnh:
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 163
- Dữ liệu được chứa vào cột [LabelEn] của bảng [Disease]
- Dữ liệu được rút từ tag “”, ví dụ từ mẫu trong Hình 4.5:
seminal
vesicle acute gonorrhea
=> [LabelEn] = “seminal vesicle acute gonorrhea”
Mã số bệnh cha:
- Dữ liệu được chứa vào cột [ParentDiseaseId] của bảng [Disease]
- Dữ liệu được rút từ tag “”, ví dụ từ mẫu trong hình 7:
=> [LabelEn] = “DOID:10400”
b. Phương pháp rút loại thuộc tính bệnh
Hình 4. Mẫu dữ liệu loại thuộc tính bệnh trong Disease Ontology.
Tên loại thuộc tính bệnh bệnh:
- Dữ liệu được chứa vào cột [LabelEn] của bảng [DiseasePropertyCategory]
- Dữ liệu được rút từ tag “” như sau:
has_symptom
”
=> Rút được [LabelEn] = “has_symptom”
c. Phương pháp rút dữ liệu tính chất bệnh
Hình 5. Mẫu dữ liệu chứa tính chất bệnh trong Disease Ontology.
Tên tính của tính chất bệnh:
- Dữ liệu được chứa vào cột [LabelEn] của bảng [DiseaseProperty]
Công nghệ thông tin & Cơ sở toán học cho tin học
N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 164
- Rút dữ liệu tính chất bệnh trong tag “” và
“”. Dữ liệu trong những tags này chứa nhiều tính chất
bệnh, như:
“A viral infectious disease that results_in infection located_in joint,
has_material_basis_in Chikungunya virus, which is transmitted_by Aedes mosquito bite.
The infection has_symptom fever”
=> Trích xuất được thông tin của tính chất loại: “results_in”, “has_material_basis_in” ,
“transmitted_by”, và “has_symptom”.
Vì vậy, công cụ này sẽ dùng trích xuất dữ liệu bằng kỷ thuật “regular expression”, theo
từng bước như sau:
Bước 1: chia nhỏ từng phần của đoạn dữ liệu lớn thành từng phần nhỏ, và đảm bảo một
phần chỉ chứa duy nhất một tính chất của bệnh, như ví dụ trên thì có thể chia thành những
phần sau:
“A viral infectious disease that”
“results_in infection”
“located_in joint,”
“has_material_basis_in Chikungunya virus, which is”
“transmitted_by Aedes mosquito bite. The infection”
“has_symptom fever”
Bước 2: sử dụng mẫu (pattern) của “regular expression” theo từng loại thuộc tính bệnh
để rút chính thông tin, như ví dụ trên thì:
“has_symptom fever”: dùng mẫu của loại “has_symptom” là “has_symptom (.*)”,
và có thể rút ra được dữ liệu “fever”.
d. Phương pháp dịch dữ liệu sang tiếng Việt
Hệ thống hỗ trợ phương thức dịch từ ngữ từ tiếng Anh sang tiếng Việt, thông qua
“Translation website” của Google:
Hình 6. Phương thức dịch ngôn ngữ.
Dữ liệu sau khi được dịch sẽ được lưu vào cột “LabelVn” của những bảng như:
“Disease”, “DiseaseProperty”, “DiseasePropertyCategory”.
e. Kết quả trích xuất dữ liệu từ Disease Ontology
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 165
* Bệnh: có 8796 bệnh trong bảng “Disease”
Hình 7. Mẫu dữ liệu trong bảng “Disease”.
* Loại thuộc tính bệnh: các loại tính chất bệnh trong “DiseasePropertyCategories”:
Hình 8. Mẫu dữ liệu trong bảng “DiseasePropertyCategories”.
* Thuộc tính bệnh: có 2444 thuộc tính bệnh trong bảng “DiseaseProperty”
Hình 9. Mẫu dữ liệu trong bảng "DiseaseProperty".
3.2. Công cụ Machine learning
Dựa vào dữ liệu từ trích xuất từ “Disease Ontology”, thì những tính chất của bệnh có
mỗi quan hệ với nhau, ví dụ:
Hình 10. Mẫu dữ liệu bệnh trong CSDL.
Trong 2 bệnh nêu trên có những tính chất bệnh cùng xuất hiện ở hai bệnh như: sốt
(fever), đau đầu (headache),
Vì vậy, có thể sử dụng một số thuật toán của “machine learning”, cụ thể là Word2Vec
[9] để khám phá ra mối quan hệ của những tính chất bệnh.
Công nghệ thông tin & Cơ sở toán học cho tin học
N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 166
Hình 11. Khám phá 1.355.834 luật liên kết của tính chất bệnh.
Hình 12. Mẫu dữ liệu về một luật liên kết.
Theo hình trên, thì ta có thông tin luật với mã số (ID) = 2 là:
- Độ hỗ trợ (Support) = 0.2581
- Độ tin cậy (Confidence) = 60
- Mối quan hệ:{fever, vomiting, water contaminated with feces, muschle spasams}
=>{direct contract with the oral secretions, ingestion of food, human poliovirus 3}
3.3. Ghi lại quá trình tìm kiếm của người dùng
Trong tìm kiếm của người sử dụng, hệ thống lưu lại các truy vấn của người dùng như
các từ khóa tìm kiếm, bối cảnh của người sử dụng (thời gian, địa điểm); và cũng là tham
khảo kết quả của người sử dụng như: kết quả mà bệnh được nhập, bao lâu dừng sử dụng
để đọc thông tin dịch bệnh, những nhận xét của người dùng về mỗi kết quả tìm kiếm của
bệnh, và sự đánh giá của người dùng trên mỗi kết quả tìm kiếm của bệnh. Hệ thống sẽ lưu
lại lịch sử tìm kiếm để khám phá các hành vi của người sử dụng, và điều chỉnh cơ sở dữ
liệu bệnh trên đánh giá của người sử dụng.
3.4. Các thành phần khác
Ngoài các thành phần cấu thành hệ thống như đã nêu ở trên, Hệ thống Smart Doctor
còn bao gồm một số thành phần sau:
- Mô hình thực thể trong cơ sở dữ liệu.
- Lớp truy xuất dữ liệu: cung cấp các phương thức truy xuất cơ sở dữ liệu.
- Lớp Repository: chứa những câu truy vấn phức tạp sử dụng “Lambda expression”
- Lớp nghiệp vụ của hệ thống: dùng để hiện thực các nghiệp vụ của hệ thống.
- Các hàm truy vấn dữ liệu - REST APIs: cung cấp những phương thức truy vấn dữ
liệu của hệ thống thông qua URI cho những hệ thống khách.
- Ứng dụng Single page (SPA): Sử dụng công nghệ web như: HTML5, CSS3,
Typescripts, và Angular.js để làm ứng dụng website trên một trang với mục tiêu
đưa trải nghiệm người dùng trên web như ứng dụng trên máy tính.
3.5. Kết quả giao diện người sử dụng
Hình 13. Autocomplete trong khung tìm kiếm.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 167
Hệ thống này cung cấp tính năng gợi ý đề nghị để tăng tính tương tác giữa người sử
dụng và hệ thống, trong một số tình huống dưới đây:
Khi người sử dụng chỉ cần nhập một số ký tự vào hộp tìm kiếm, hệ thống sẽ đề nghị
truy vấn với các gợi ý bắt đầu với những ký tự này. Nó giúp người sử dụng điền các truy
vấn nhanh hơn bằng cách lựa chọn câu hỏi từ gợi ý và sử dụng các tiêu chí tìm kiếm chính
xác hơn bằng cách đưa ra gợi ý chính tả.
Trong trường hợp, người sử dụng chỉ nhớ một từ khóa của các truy vấn, và họ có thể
nhập các từ khóa vào ô tìm kiếm, hệ thống sẽ đề xuất các truy vấn, có chứa các từ khóa
này. Nó giúp người sử dụng lựa chọn các truy vấn phù hợp với ý định của họ mà không
cần nhớ toàn bộ truy vấn.
Ngoài ra, đề nghị gợi ý không chỉ giúp người dùng lựa chọn các truy vấn chính xác cho
ý định của họ, mà còn giúp họ có các truy vấn thuộc vào từ điển của hệ thống. Điều này sẽ
giúp sự tự tin của các truy vấn cao hơn và các kết quả tìm kiếm chính xác hơn.
Hình 14. Gợi ý từ khóa liên quan trong khung tìm kiếm.
Hệ thống này cũng cung cấp tính năng đề
xuất để giới thiệu các triệu chứng có liên
quan hoặc thuộc bệnh khác, ví dụ như khi
người sử dụng lựa chọn một số từ khóa tìm
kiếm là "sốt" (fever), "đau đầu" (headache),
và họ dừng lại để nghĩ cho tìm kiếm các từ
khóa tiếp theo; lúc này hệ thống sẽ giới thiệu
các triệu chứng liên quan với các triệu chứng
bình chọn là "co giật" (convulsions). Các
triệu chứng liên quan được khám phá từ các
quy tắc quan hệ của các triệu chứng, và các
triệu chứng liên quan được đặt hàng (trên
xuống dưới) bởi sự tự tin của quy tắc của các
triệu chứng liên quan.
Khi người dùng thực hiện tìm kiếm thì hệ
thống sẽ tìm bệnh tương ứng với những thuộc
tính bệnh mà người dùng đã gõ vào, với
những lựa chọn kết quả tìm kiếm như sau:
- Dữ liệu hệ thống chọn ra bệnh có thuộc
tính đang tìm kiếm, bệnh được sắp xếp theo
số lượng đã xem và đánh giá đó, và nội dung
của những bệnh này được cung cấp bởi
những tài liệu trong hệ thống.
- Dữ liệu bên ngoài, ứng với mỗi bệnh từ
Hình 15. Hiển thị kết quả tìm kiếm bệnh.
Công nghệ thông tin & Cơ sở toán học cho tin học
N. H. Sơn, D. T. Hải, H. T. Thắng, “Hệ thống tương tác thông minh thông tin bệnh.” 168
dữ liệu hệ thống thì hệ thống sẽ tìm kiếm trên Google với từ khóa là tên bệnh, và lấy
những kết quả (top 3) được đánh giá cao để gợi ý người dùng.
Kết quả hiển thị từng khối cho mỗi bệnh, và được sắp xếp từ trái sang phải, từ trên
xuống dưới. Mỗi khối bệnh được hiển thị như sau (hình 15):
- Phần trên hiển thị ảnh đại diện của bệnh.
- Phần giữa hiển thị tên bệnh, và số lượng người xem bệnh này.
- Phần cuối hiển thị đánh giá của người dùng về nội dung bệnh.
4. KẾT LUẬN VÀ HƯỚNG MỞ
Trong bài báo này, chúng tối đã giới thiệu việc xây dựng hệ thống Web tìm kiếm ngữ
nghĩa tích hợp giữa hệ chuyên gia và hệ thống khuyến nghị sử dụng công nghệ ngữ nghĩa
Ontology phục vụ tra cứu, tìm kiếm văn bản mẫu bệnh. Trước hết, chúng tôi kế thừa và
Việt hóa mạng tri thức về các bệnh tật Disease Ontology [5], đây là cơ sở cho việc hướng
luồng tìm kiếm và đưa ra các gợi ý thông minh cho người dùng trong quá trình tìm kiếm.
Từ đó, công cụ Web tìm kiếm ngữ nghĩa được xây dựng có khả năng tự tạo lập và cập nhật
một mạng ngữ nghĩa mô tả thông tin bệnh tật tích hợp với dữ liệu bệnh được cung cấp bởi
chuyên gia và các nguồn đáng tin cậy khác. Từ đây, các facets và hệ thống phân cấp
(categories) được đặc tả và sử dụng trong việc tương tác với người dùng nhằm điều hướng
luồng tìm kiếm và gợi ý thông minh theo ý định của người dùng trong quá trình tìm kiếm.
Trong hướng nghiên cứu tiếp theo, chúng tôi sẽ tập trung vào việc hỗ trợ giao tác trực
tuyến (interoperabiligy) để có thể kết nối Smart Doctor với các hệ thống liên kết. Đặc biệt,
để đảm bảo mạng tri thức luôn được cấp nhập, chúng tôi sẽ xây dựng công cụ để đồng bộ
hóa mạng tri thức bệnh đã được Việt hóa và hệ thống Disease Ontology [5].
TÀI LIỆU THAM KHẢO
[1]. Dario Bonino, Fulvio Corno, Laura Farinetti, Alessio Bosca, “Ontology Driven
Semantic Search”, WSEAS Transaction on Information Science and Application,
Issue 6, Volume 1, December 2004, pp. 1597-1605.
[2]. Denman, S., et al., “Searching for people using semantic soft biometric
descriptions”. Pattern Recognition Letters, 2015. 68: p. 306-315.
[3]. Guha, R., R. McCool, and E. Miller. “Semantic search”. in Proceedings of the 12th
international conference on World Wide Web. 2003. ACM.
[4]. Henrik Eriksso, “The semantic-document approach to combining documents and
ontologies”, International Journal of Human-Computer Studies Volume 65, Issue 7,
July 2007, Pages 624-639.
[5]. Kibbe WA, Arze C, Felix V, Mitraka E, Bolton E, Fu G, Mungall CJ, Binder JX,
Malone J, Vasant D, Parkinson H, Schriml LM. “Disease Ontology 2015 update: an
expanded and updated database of human diseases for linking biomedical knowledge
through disease data Nucleic Acids Research 2014”; Oct 27. pii: gku1011
[6]. Ma, B., et al., “Public opinion analysis based on probabilistic topic modeling and
deep learning”. Public opinion, 2016.
[7]. Trong Hai Duong, Jo G.S., Jung J.J., Nguyen N.T. (2009): “Complexity Analysis of
Ontology Integration Methodologies: A Comparative Study”. Journal of Universal
Computer Science 15(4), 877-897.
[8]. Trong Hai Duong, Jo G.S. (2010): “Collaborative Ontology Building by Reaching
Consensus among Participants”. Information-An International Interdisciplinary
Journal, 1557-1569.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 53, 02 - 2018 169
[9]. https://en.wikipedia.org/wiki/Word2vec
TÓM TẮT
SMART DOCTOR – AN INTELLIGENT INTERACTIVE SYSTEM
FOR SEARCHING AND RETRIEVING DISEASE INFORMATION
Intelligent interactive system for searching and retrieving disease information,
namely Smart Doctor, is studied and developed based on semantic search
methodology. The system is also aimed by integrating concepts of expert system and
of recommendation system in searching and retrieving disease documents.
First, the disease knowledge network is built based on the OWL standard and is
integrated from multiple sources. Afterwards, the search information is dynamically
clustered according to the facets and categorized based on the semantic network
and the user interaction. Hereafter, the intelligent interactive system Smart Doctor
is built and presented as typical examples to prove our concepts in this paper.
Keywords: Big Data, Smart doctor, Dynamic clustering, Facets.
Nhận bài ngày 11 tháng 10 năm 2017
Hoàn thiện ngày 08 tháng 11 năm 2017
Chấp nhận đăng ngày 26 tháng 02 năm 2018
Địa chỉ: 1 Trường Đại học Luật, Đại học Huế;
2 Trường Đại học Nguyễn Tất Thành;
3 Học viện Kỹ thuật quân sự.
*Email: son_nguyenhong2002@yahoo.com.
Các file đính kèm theo tài liệu này:
- 19_thang_0615_2150600.pdf