Đề tài Tổng quan một số nghiên cứu xây dựng các thuật toán học sâu áp dụng trong phân tích ảnh y tế - Lê Thị Thu Hồng

Tài liệu Đề tài Tổng quan một số nghiên cứu xây dựng các thuật toán học sâu áp dụng trong phân tích ảnh y tế - Lê Thị Thu Hồng: Công nghệ thông tin L. T. T. Hồng, N. C. Thành, P. T. Hương, “Tổng quan một số nghiên cứu ảnh y tế.” 196 TỔNG QUAN MỘT SỐ NGHIÊN CỨU XÂY DỰNG CÁC THUẬT TOÁN HỌC SÂU ÁP DỤNG TRONG PHÂN TÍCH ẢNH Y TẾ Lê Thị Thu Hồng*, Nguyễn Chí Thành , Phạm Thu Hương Tóm tắt: Hiện nay các thuật toán học sâu (deep learning) đặc biệt là các mạng nơ ron tích chập (CNN- Convolutional neural networks) là phương pháp được nhiều nhà nghiên cứu lựa chọn để giải quyết bài toán tự động phân tích ảnh y tế. Bài báo này sẽ giới tổng quan về các nghiên cứu xây dựng các thuật toán học sâu được sử dụng cho phân tích ảnh y tế và giới thiệu một số các nghiên cứu áp dụng trên một số lĩnh vực cụ thể như phân tích ảnh chụp cộng hưởng từ não, phân tích ảnh X vùng ngực, ảnh huỳnh quang chụp đáy mắt, ảnh nội soi tiêu hóa. Từ khóa: Học sâu; Mạng nơ-ron tích chập; Phân tích ảnh y tế. 1. ĐẶT VẤN ĐỀ Kể từ khi các ảnh y tế có thể quét để lưu trữ trên máy tính các nhà nghiên cứu đã xây dựng các hệ thốn...

pdf9 trang | Chia sẻ: Đình Chiến | Ngày: 30/06/2023 | Lượt xem: 408 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Đề tài Tổng quan một số nghiên cứu xây dựng các thuật toán học sâu áp dụng trong phân tích ảnh y tế - Lê Thị Thu Hồng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Công nghệ thông tin L. T. T. Hồng, N. C. Thành, P. T. Hương, “Tổng quan một số nghiên cứu ảnh y tế.” 196 TỔNG QUAN MỘT SỐ NGHIÊN CỨU XÂY DỰNG CÁC THUẬT TOÁN HỌC SÂU ÁP DỤNG TRONG PHÂN TÍCH ẢNH Y TẾ Lê Thị Thu Hồng*, Nguyễn Chí Thành , Phạm Thu Hương Tóm tắt: Hiện nay các thuật toán học sâu (deep learning) đặc biệt là các mạng nơ ron tích chập (CNN- Convolutional neural networks) là phương pháp được nhiều nhà nghiên cứu lựa chọn để giải quyết bài toán tự động phân tích ảnh y tế. Bài báo này sẽ giới tổng quan về các nghiên cứu xây dựng các thuật toán học sâu được sử dụng cho phân tích ảnh y tế và giới thiệu một số các nghiên cứu áp dụng trên một số lĩnh vực cụ thể như phân tích ảnh chụp cộng hưởng từ não, phân tích ảnh X vùng ngực, ảnh huỳnh quang chụp đáy mắt, ảnh nội soi tiêu hóa. Từ khóa: Học sâu; Mạng nơ-ron tích chập; Phân tích ảnh y tế. 1. ĐẶT VẤN ĐỀ Kể từ khi các ảnh y tế có thể quét để lưu trữ trên máy tính các nhà nghiên cứu đã xây dựng các hệ thống để tự động phân tích ảnh y tế. Bắt đầu từ những năm 1970 tới những năm 1990 các hệ thống tự động phân tích ảnh y tế ứng dụng xử lý ảnh và áp dụng các mô hình toán học được xây dựng dựa vào hệ thống tập luật để giải quyết một tác vụ cụ thể nào đó, các hệ thống này còn được gọi là các hệ chuyên gia. Sau đó các phương pháp học máy trở nên thông dụng trong các hệ thống phân tích ảnh y tế vào những năm 2000, có sự dịch chuyển từ hệ thống xây dựng dựa trên các tập luật do chuyên gia con người đưa ra sang hệ thống được huấn luyện dựa trên dữ liệu, tuy nhiên việc trích xuất các đặc trưng của ảnh đều do con người can thiệp dựa trên các quan sát về đặc tính riêng của ảnh, các hệ thống này được gọi là các hệ thống trích rút đặc trưng thủ công. Trong những năm gần đây các thuật toán học sâu được chú ý nhiều vì đã đạt được các kết quả rất tốt trong một số các lĩnh vực ứng dụng như nhận dạng khuôn mặt, nhận dạng ký tự viết tay, phân loại ảnh, phát hiện đối tượng và phân vùng các đối tượng trên ảnh. Các hệ thống này được xây dựng dựa trên việc máy tính tự học các đặc trưng bằng thuật toán học sâu. Các thuật toán học sâu mở hướng phát triển rất tiềm năng cho các ứng dụng phân tích ảnh y tế. Các nghiên cứu xây dựng các thuật toán học sâu áp dụng cho phân tích ảnh y tế những năm gần đây được đưa ra tại các hội thảo khoa học và công bố trên các tạp chí khoa học với số lượng tăng khá nhanh. Hiện tại chủ đề này được nhiều nhóm nghiên cứu trong và ngoài nước tập trung nghiên cứu và đã đạt được một số kết quả khả quan, tuy nhiên các kết quả đạt được còn chưa cao do nghiên cứu áp dụng học sâu vào phân tích ảnh y tế là một lĩnh vực nghiên cứu đa ngành, nó đòi hỏi sự kết hợp chặt chẽ của các nhà nghiên cứu về trí tuệ nhân tạo và các chuyên gia phân tích chuyển đoán hình ảnh y tế. Bài báo này sẽ giới thiệu tổng quan các nghiên cứu xây dựng các thuật toán học sâu sử dụng trong phân tích ảnh y tế. Bài báo được trình bày theo thứ tự sau: Phần 2 giới thiệu các lý thuyết của mạng nơ-ron và các mô hình học sâu. Phần 3 giới thiệu các nghiên cứu sử dụng các thuật toán học sâu cho các bài toán phân tích ảnh y tế. Phần 4 giới thiệu các ứng dụng sử dụng học sâu để phân tích ảnh y tế trên các lĩnh vực ứng dụng cụ thể. Phần 5 tổng kết các khả năng áp dụng, những khó khăn và hướng phát triển của các nghiên cứu xây dựng các thuật toán học sâu dùng cho phân tích ảnh y tế. Thông tin khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 04 - 2019 197 2. TỔNG QUAN VỀ CÁC THUẬT TOÁN HỌC SÂU 2.1. Mạng nơ-ron (Artificial Neural Network) và học sâu (deep learning) Mạng nơ-ron (Artificial Neural Network- ANN) là một thuật toán học được mô phỏng dựa trên hoạt động của hệ thống thần kinh của sinh vật, bao gồm số lượng lớn các nơ-ron được gắn kết để xử lý thông tin. ANN giống như bộ não con người, được học bởi kinh nghiệm, có khả năng lưu giữ những kinh nghiệm, tri thức và sử dụng những tri thức đó trong việc dự đoán các dữ liệu chưa biết. Một mạng nơ-ron bao gồm các nơ-ron hay còn gọi là các đơn vị tính toán (unit), một hàm kích hoạt (activation) a=σ( )và tập các tham số Ѳ={Ⱳ, B} trong đó W được gọi là tập các trọng số (weight) của mạng. Mạng nơ-ron gồm nhiều lớp được gọi là MLP (Multi Layered Peceptrons). Một hạn chế của các kiến trúc MLP nói chung là hàm mất mát không phải là một hàm lồi, việc tìm nghiệm tối ưu toàn cục cho bài toán tối ưu hàm mất mát rất khó. Một vấn đề khác là việc huấn luyện MLP không hiệu quả khi số lượng các lớp ẩn lớn,vấn đề này được gọi là “vanishing gradient”. Để giúp phần nào tránh được vanishing gradient người ta đưa ra ý tưởng tiền huấn luyện không giám sát (unsupervised pretraining) trong đó các ma trận trọng số ở những lớp ẩn đầu tiên được tiền huấn luyện (pretrained). Các trọng số được tiền huấn luyện này có thể coi là giá trị khởi tạo tốt cho các lớp ẩn phía đầu ra và mạng nơ-ron nhiều lớp ẩn như vậy được gọi là mạng nơ ron kiến trúc sâu. Hình 1. Cấu trúc mạng nơ-ron. Học sâu (Deep Learning) là một phương pháp của học máy được xây dựng dựa trên các mạng nơ-ron kiến trúc sâu, có thể hiểu học sâu chính là mạng nơ-ron với nhiều lớp ẩn. Học sâu cho phép hệ thống được huấn luyện trên một tập dữ liệu có thể dự đoán được các đầu ra dựa vào một tập các đầu vào, với học sâu thì các đặc trưng sẽ được trích xuất tự động. 2.2. Mạng nơ- ron tích chập (Convolutional Neural Networks -CNN) Mạng nơ-ron tích chập (CNN- Convolutional Neural Network) là một trong những mô hình học sâu tiên tiến giúp cho chúng ta xây dựng được những hệ thống thông minh với độ chính xác cao như hiện nay như hệ thống xử lý ảnh lớn của Facebook, Google hay Amazon. CNN dựa trên khái niệm về tích chập (convolution), tích chập (convolution) là nhân ma trận 3x3 (hoặc 5x5) với ma trận trượt trên ma trận ảnh đầu vào,giá trị đầu ra do tích các thành phần này cộng lại, kết quả của tích chập là một ma trận sinh ra từ việc trượt ma trận filter và thực hiện Công nghệ thông tin L. T. T. Hồng, N. C. Thành, P. T. Hương, “Tổng quan một số nghiên cứu ảnh y tế.” 198 tích chập trên toàn bộ ma trận ảnh. CNN là một tập hợp các lớp Convolution chồng lên nhau và sử dụng các hàm kích hoạt không tuyến tính như ReLU, Tanh để kích hoạt các trọng số trong các nút. Mỗi một lớp sau khi thông qua các hàm kích hoạt sẽ tạo ra các thông tin trừu tượng hơn cho các lớp tiếp theo. Ngoài ra có một số lớp khác như pooling/subsampling dùng để chắt lọc lại các thông tin hữu ích hơn. Một số kiến trúc mạng CNN nổi tiếng[6] - LeNet : LeNet là một trong những mạng CNN lâu đời nổi tiếng nhất được Yann LeCUn phát triển vào những năm 1998s. Cấu trúc của LeNet gồm: 2 lớp (Convolution + maxpooling) và 2 lớp fully connected và output là softmax layer. - AlexNet: AlexNet là một mạng CNN đã dành chiến thắng trong cuộc thi ImageNet LSVRC-2012 năm 2012. AlexNet là một mạng CNN với một số lượng parameter rất lớn (60 triệu), kiến trúc của Alexnet gồm 5 lớp convolution và 3 lớp fully connection. Hàm kích hoạt Relu được sử dụng sau mỗi convolution và fully connection. - VGG: Sau AlexNet thì VGG ra đời với một số cải thiện hơn,VGG cho tỉ lệ lỗi thấp hơn AlexNet trong ImageNet Large Scale Visual Recognition Challenge (ILSVRC) năm 2014. VGG có 2 phiên bản là VGG16 và VGG19. Kiến trúc của VGG16 bao gồm 16 lớp: 13 lớp Conv (2 lớp conv-conv,3 lớp conv-conv-conv) đều có kernel 3x3, sau mỗi lớp Conv là maxpooling downsize xuống 0.5, và 3 lớp fully connection. VGG19 tương tự như VGG16 nhưng có thêm 3 lớp convolution ở 3 lớp conv cuối. - GoogleNet: Năm 2014, Google công bố một CNN do nhóm nghiên cứu của họ phát triển có tên là GoogleNet. GoogleNet gồm 22 lớp, khởi đầu vẫn là những lớp convolution đơn giản, tiếp theo là những block của Inception module với maxpooling theo sau mỗi block, nó sử dụng 9 Inception module trên toàn bộ và không sử dụng fully connection layer mà thay vào đó là average pooling làm giảm thiểu được rất nhiều số lượng tham số. -ResNet: ResNet được phát triển bởi Microsoft năm 2015. ResNet thắng tại ImageNet ILSVRC competition 2015 với tỉ lệ lỗi 3.57%, ResNet có cấu trúc gần giống VGG với nhiều lớp làm cho mô hình sâu hơn. ResNet có kiến trúc gồm nhiều residual block, y tưởng của residual block là feed foward đầu vào x qua một số layer conv-max-conv, ta thu được đầu ra F(x) sau đó thêm x vào đầu ra H(x) = F(x) + x . 3. HỌC SÂU SỬ DỤNG TRONG PHÂN TÍCH ẢNH Y TẾ Phần này giới thiệu các nghiên cứu các thuật toán học sâu cho các bài toán phân tích ảnh y tế, bao gồm phân loại (classification), phát hiện đối tượng (detect object), phân vùng ảnh (segmentation). Ngoài ra chúng ta còn có thể xây dựng các thuật học sâu cho một số các bài toán khác biến đổi ảnh (registration), tổng hợp ảnh (retrieval), tuy nhiên đây là những bài toán khó và chưa có nhiều các nghiên cứu được thực hiện để giải quyết những bài toán này. 3.1. Phân loại ( Classification) 3.1.1. Phân loại ảnh (Image classification) Thông tin khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 04 - 2019 199 Phân loại ảnh là bài toán trong phân tích ảnh y tế mà học sâu đem lại kết quả tốt nhất. Với bài toán phân loại ảnh trong phân tích ảnh y tế, đầu vào là một hoặc nhiều ảnh chụp một vùng nào đó của cơ thể, đầu ra là chẩn đoán mắc hoặc không mắc một căn bệnh nào đó. Tập dữ liệu huấn luyện trong bài toán phân loại ảnh y tế thường có kích thước không lớn, do đó các nghiên cứu giải quyết bài toán này thường sử dụng các thuật toán học chuyển giao (Tranfer learning) tức là sử dụng các mạng nơ-ron đã được huấn luyện trước (pretrained-network) trước trên tập dữ liệu ảnh lớn như ImageNet và đưa vào thêm các kỹ thuật khác để giải quyết bài toán. Ngoài hướng tiếp cập dùng tranfer learning, một số nhóm nghiên cứu tự xây dựng các cấu trúc mạng CNN riêng dùng cho bài toán riêng. Ví dụ nhóm tác giả Mina Rezaei, Haojin Yang, Christoph Meinel [4] xây dựng một mạng CNN để phân loại ảnh cộng hưởng từ não (MRI não) xác định các tổn thương vùng não. Kiến trúc bao gồm 7 lớp trong đó 3 lớp polling nhằm giảm đáng kể kích thước của véc tơ đặc trưng. Sau lớp conv7 là 3 lớp 7th fully-connected gồm 4096 neural, cuối cùng áp dụng chuẩn hóa sau lớp full-connected cuối để giảm overfitting. Hình 2. Kiến trúc mạng phân loại ảnh MRI. 3.1.2. Phân loại các đối tượng trên ảnh (Object or lesion classification) Bài toán phân loại đối tượng trên ảnh tập trung vào phân loại một phần ảnh, ví dụ: phân loại các đối tượng bất thường trên ảnh chụp CT vùng ngực để xác định các u bứu ở vùng ngực. Trong bài toán này cả thông tin cục bộ về sự xuất hiện các đối tượng bất thường và thông tin tổng thể ảnh cần được phân tích. Do đó người ta thường sử dụng kiến trúc multi-stream để giải quyết bài toán. Ví dụ nhóm Kawahara and Hamarneh(2016) đã sử dụng multi-stream CNN để phân loại các vết tổn thương bề trên da, các stream xử lý ảnh với độ phân giải khác nhau. Gao et al. (2015) đề xuất mô hình kết hợp CNNs và RNNs để xây dựng hệ thống xác định bệnh đục thủy tinh thể dựa trên ảnh chụp huỳnh quang mắt, trong đó CNN filters là các mạng huấn luyện sẵn. Sự kết hợp này cho phép xử lý tất các các thông tin chung tổng quan của ảnh mà không quan tâm đến kích thước ảnh. 3.2. Xác định các đối tượng trên ảnh (Object Detection) 3.2.1. Xác định vị trị các bộ phận của cơ thể hoặc các vùng cơ thể Xác định các bộ phận cơ thể, các vùng cơ thể là bước quan trọng của phân tích ảnh y tế. Để xác định vị trí các đối tượng ta cần phải phân tích các ảnh 3D, có hai hướng tiếp cận để phân tích các ảnh 3D xác định vị trí đối tượng giải phẫu trên ảnh y tế được đề xuất bao gồm: Một là xem ảnh 3D là tập hợp của các ảnh 2D theo một các lát cắt trực giao, sau đó xác định vị trí vật thể trên ảnh 2D, đây là phương pháp Công nghệ thông tin L. T. T. Hồng, N. C. Thành, P. T. Hương, “Tổng quan một số nghiên cứu ảnh y tế.” 200 phổ biến hiện nay cho các kết quả khá tốt. Hai là xây dựng các mạng CNN riêng trực tiếp áp dụng cho ảnh 3D, các phương pháp này khá phức tạp yêu cầu khối lượng tính toán lớn. 3.2.2. Phát hiện các đối tượng hoặc các vùng dị thường Việc phát hiện các đối tượng cần quan tâm hoặc các vùng dị thường trong các ảnh y tế là một phần rất quan trọng trong chẩn đoán bệnh và là một việc khó khăn của các của các bác sỹ. Về cơ bản phát hiện các vùng dị thường chính là xác định vị trí và nhận biết các vùng bất thường nhỏ trong một không gian ảnh lớn. Ví dụ: phát hiện các khối u tế bào trong các ảnh chụp cộng hưởng từ não, phát hiện ra các vết tụ máu chảy trong các ảnh chụp cộng hưởng từ não, Phát hiện các khối u trong ảnh chụp X quang vùng ngực. Phần lớn các thuật toán được công bố hiện nay đều sử dụng các kiến trúc mạng CNN để thực hiện phân loại đối tượng sau đó là các bước xử lý để xác định được các đối tượng. Dưới đây trình bày ví dụ một kiến trúc được sử dụng để xây dựng hệ thống phát hiện dị thường trên não dựa trên ảnh cộng hưởng từ não của nhóm tác giả Mina Rezaei, Haojin Yang, Christoph Meinel [4] Hình 3. Kiến trúc mạng phát hiện vùng bất thường trên ảnh MRI não. Hệ thống sử dụng đồng thời hai kiến trúc mạng: Kiến trúc thứ nhất là một mạng CNN để trích rút các đặc trưng của toàn bộ ảnh. Kiến trúc thứ hai là sự kết hợp của một mạng Fast R-CNN để nhận dạng các vùng cần quan tâm và một mạng VGG-16 được tinh chỉnh lại để trích rút các đặc trưng cục bộ ở các vùng. Ứng dụng này được các tác giả áp dụng với tập dữ liệu BRATS-2015 gồm 220 người bệnh mắc khối u và 54 người bệnh không mắc khối u, tỉ lệ phát hiện đạt được độ chính xác 94.3 %. 3.3. Phân đoạn đối tượng trên ảnh (Segmentation) Phân đoạn trong phân tích ảnh y tế thường có hai dạng: một là phân đoạn các bộ phận cơ thể hoặc các cấu trúc nhỏ trên ảnh, hai là phân đoạn các vùng bị tổn thương hoặc bất thường trên ảnh. Phân đoạn các bộ phận cơ thể hoặc các cấu trúc trong ảnh y tế được dùng để phân tích các tham số liên quan kích thước và hình dạng của các bộ phận. Phân đoạn các vùng bị tổn thương hoặc bất thường là sự kết hợp của phát hiện đối tượng và phân đoạn đối tượng trên ảnh dựa vào các đặc trưng riêng biệt của các vùng bất thường. Có một số phương pháp được sử dụng cho phân đoạn đối tượng, đa số đều trúc CNN và RNN. Gần đây một kiến trúc khá thành công là U-net được sử dụng khá phổ biến trong tác vụ phân đoạn. Thông tin khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 04 - 2019 201 4. MỘT SỐ NGHIÊN CỨU ỨNG DỤNG PHÂN TÍCH ẢNH Y TẾ SỬ DỤNG CÁC THUẬT TOÁN HỌC SÂU Phân tích hình ảnh não: Các nghiên cứu ứng dụng phân tích hình ảnh não hiện nay đa số tập trung vào sử dụng các thuật toán phân loại ảnh để chẩn đoán các bệnh về não ví dụ như bệnh Alzheimer. Một số các nghiên cứu khác lại theo hướng sử dụng phát hiện và phân đoạn đối tượng để phát hiện các khối u và các vùng dị thường trên não. Hiện nay phần lớn các nghiên cứu đều xây dựng các thuật toán học sâu trên tập ảnh chụp cộng hưởng từ (MRI) và sử dụng kiến trúc mạng CNN. Bảng 1. Một số công trình nghiên cứu thuật toán học sâu áp dụng phân tích ảnh não. Nhóm tác giả Công trình Shi, J., Zheng, X., Li, Y., Zhang, Q., Ying, S., Jan. 2017 Multimodal neuroimaging feature learning with multimodal stacked deep polynomial networks for diagnosis of Alzheimer’s disease Sarraf, S., Tofighi, G., 2016 Classification of Alzheimer’s disease using fMRI data and deep learning convolutional neural networks Van der Burgh, H. K., Schmidt, R., Westeneng, H.-J., de Reus, 2017 Deep learning predictions of survival based on MRI in amyotrophic lateral sclerosis Kamnitsas, K., Ledig, C., Newcombe, V. F., Simpson, J. P., Kane, A. D., 2017 Efficient multi-scale 3D CNN with fully connected CRF for accurate brain lesion segmentation Phân tích ảnh phản quang chụp đáy mắt: Một bài toán được các nghiên cứu hướng tới khá nhiều là phát hiện màng phủ đáy mắt của các bệnh nhân do biến chứng bệnh tiểu đường dựa trên phân tích ảnh màu phản quang chụp đáy mắt (CFI) chụp đáy mắt. Để thực hiện bài toán này các nghiên cứu tập trung vào sử dụng mạng CNN để phân tích ảnh CFI, sử dụng detection, segmentation để phát hiện các dị thường ở võng mạc và chẩn đoán bệnh về mắt. Bảng 2. Một số công trình nghiên cứu thuật toán học sâu áp dụng phân tích ảnh vùng mắt. Nhóm tác giả Công trình Zilly, J., Buhmann, J. M., Mahapatra, D., 2017 Glaucoma detection using entropy sampling and ensemble learning for automatic optic cup and disc segmentation Gulshan, V., Peng, L., Coram, M., Stumpe, M. C., Wu., Narayanaswamy , 2016 Development and validation of a deep learning algorithm for detection of diabetic retinopathy in retinal fundus photographs Worrall, D. E., Wilson, C. M., Brostow, G. J., 2016 Automated retinopathy of prematurity case detection with convolutional neural networks Maninis, K.-K., Pont-Tuset, J., Arbelaez, P., Gool, L., 2016 Deep retinal image understanding: Segmentation of blood vessels and optic disk; VGG-19 network extended with specialized layers for each segmentation task Phân tích ảnh vùng ngực: Các nghiên cứu phân tích ảnh vùng ngực hiện nay chủ yếu tập trung vào phân tích ảnh X quang ngực sử dụng classification và detection để phát hiện các khối u, chẩn đoán các bệnh về phổi, tim mạch. Công nghệ thông tin L. T. T. Hồng, N. C. Thành, P. T. Hương, “Tổng quan một số nghiên cứu ảnh y tế.” 202 Bảng 3. Một số công trình nghiên cứu thuật toán học sâu áp dụng phân tích ảnh vùng ngực. Nhóm tác giả Công trình Rajkomar, A., Lingam, S., Taylor, A. G., Blum, M., Mongan, J., 2017 High-throughput classification of radiographs using deep convolutional neural networks Christodoulidis,Anthimopoulos, Ebner, L., Christe, A., 2017 Multi-source transfer learning with convolutional neural networks for lung pattern analysis Shin, H.-C., Roberts, K., Lu, L., Demner-Fushman, D., 2016 Learning to read chest x-rays: Recurrent neural cascade model for automated image annotation, CNN detects 17 diseases, large data set (7k images) Dou, Q., Chen, H., Yu, L., Qin, J., Heng, P. A., 2016 Multi-level contextual 3D CNNs for false positive reduction in pulmonary nodule detection Phân tích ảnh nội soi tuyến tiêu hóa: Các nghiên cứu phân tích ảnh nội soi tuyến tiêu hóa chủ yếu xây dựng các thuật toán phát hiện các đối tượng bất thường trên các ảnh được cắt từ các video do camera nội soi thu được. Các bất thường có thể là các u, polyp, các vết viêm loét hoặc xuất huyết. Bảng 4. Một số công trình nghiên cứu thuật toán học sâu áp dụng phân tích ảnh nội soi tuyến tiêu hóa. Nhóm tác giả Công trình Younghak shin, Hemin ali qadir, Ilangko balasingham, 2018 Abnormal Colon Polyp Image Synthesis Using Conditional Adversarial Networks for Improved Detection Performance N. Tajbakhsh, S. Gurudu, and J. Liang, 2016 Automated polyp detection in colonoscopy videos using shape and context information S. Park, M. Lee, and N. Kwak, 2016 Polyp detection in colonoscopy videos using deeply-learned hierarchical features Ruikai Zhang , Yali Zheng , Carmen C.Y. Poon , Dinggang Shen, James Y.W. La, 2017 Polyp Detection during Colonoscopy using a Regression- based Convolutional Neural Network with a Tracker Ngoài các nghiên cứu ứng dụng phân tích ảnh các vùng cơ thể kể trên còn có các ứng dụng phân tích ảnh tim mạch (cardiac), hệ cơ xương (musculoskeletal) để chẩn đoán các bệnh có liên quan khác. 5. KẾT LUẬN Qua phần nghiên cứu tổng quan đã trình bày chúng ta thấy các thuật toán học sâu có thể được áp dụng ở tất cả các khía cạnh trong phân tích ảnh y tế và hiện tại CNN là kiến trúc đạt hiệu quả cao nhất cho các bài toán phân tích ảnh y tế. Các thuật toán học sâu được xây dựng để áp dụng cho phân tích ảnh y tế hiện nay đi theo hai hướng tiếp cận chính: thứ nhất là sử dụng các mạng CNN huấn luyện trước và điều chỉnh lại để phù hợp với tập dữ liệu ảnh y tế được áp dụng, thứ hai là xây dựng các mạng CNN riêng và huấn luyện mạng trực tiếp trên tập dữ liệu ảnh mẫu của bài toán áp dụng. Kiến trúc mạng là yếu tố đầu tiên quyết định hiệu quả của thuật toán đối với cho các bài toán phân tích ảnh y tế, tuy vậy kiến trúc mạng không phải là yếu tố duy nhất quyết định việc đạt hiệu quả cao trong giải quyết các Thông tin khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 04 - 2019 203 bài toán, các kỹ thuật tiền xử lý dữ liệu và tăng cường dữ liệu cũng là một trong những yếu tố ảnh hưởng đến kết quả của các giải pháp, ngoài ra còn có các yếu tố khác như kích thước đầu vào của mạng, các tham số tối ưu mạng ví dụ learning rate, drop out rate Khi xây dựng các thuật toán học sâu áp dụng cho phân tích ảnh y tế một khó khăn lớn nhất là sự thiếu hụt các tập dữ liệu huấn luyện đủ lớn. Các hệ thống PACS hiện nay đã được sử dụng rộng rãi trong các hệ thống y tế và chúng đã lưu trữ một lượng ảnh y tế rất lớn tuy nhiên khó khăn gặp phải là việc gán nhãn cho các tập dữ liệu ảnh này. Gán nhãn cho các dữ liệu ảnh y tế phải được thực hiện bởi các chuyên gia chẩn đoán hình ảnh ở các lĩnh vực riêng và tốn rất nhiều công sức, thời gian. Một khó khăn khác liên quan đến dữ liệu là các bộ dữ liệu ảnh y tế là những bộ dữ liệu không cân bằng tức là số lượng ảnh cho các trường hợp mắc bệnh ít hơn rất nhiều so với số lượng ảnh cho các trường hợp không mặc bệnh, do đó thuật toán có thể cho hiệu quả rất tốt trên tập dữ liệu thử nghiệm, nhưng lại có thể sai cho các trường hợp thực tế ít gặp trong tập dữ liệu mẫu. Ngoài ra trong lĩnh vực y tế, việc chẩn đoán bệnh không chỉ các thông tin được trích rút qua phân tích ảnh y tế mà còn phải dựa vào các thông tin khác của người bệnh ví dụ như độ tuổi, chiều cao, cân nặng, tiền sử bệnh, các biểu hiện lâm sàng Do đó các nhà nghiên cứu trong khi xây dựng các thuật toán học sâu cần phải kết hợp cả các thông tin bệnh nhân và các ảnh y tế để làm đầu vào cho các thuật toán, khó khăn khi giải quyết vấn đề kết hợp này là cần phải cân bằng giữa các đặc trưng ảnh (có thể lên tới hàng hàng nghìn đặc trưng) và các đặc trưng mang thông tin bệnh nhân (chỉ khoảng vài chục thông tin). Xem xét xu hướng phát triển của các thuật toán học sâu hiện tại và nguồn dữ liệu ảnh y tế chúng ta có thể xác định hướng phát triển cho các thuật toán học sâu áp dụng cho phân tích ảnh y tế trong tương lai có thể là các thuật toán học không giám sát. Các thuật toán học sâu không giám sát có điểm lợi thế rất phù hợp với dữ liệu ảnh y tế là chúng có thể phân tích trên một tập dữ liệu ảnh lớn không cần gán nhãn để tìm ra được các tri thức ẩn sâu trong dữ liệu. TÀI LIỆU THAM KHẢO [1]. Geert Litjens, Thijs Kooi, Babak Ehteshami Bejnordi, Arnaud Arindra Adiyoso Setio, Francesco Ciompi, Mohsen Ghafoorian, Jeroen A.W.M. van der Laak, Bram van Ginneken, Clara I. Sanchez. (2017). A Survey on Deep Learning in Medical Image Analysis. arXiv:1702.05747. [2]. Rajpurkar P, Irvin J, Ball RL, Zhu K, Yang B, Mehta H, et al. (2018). Deep learning for chest radiograph diagnosis. PLoS Med 15(11): e1002686. https://doi.org/10.1371/journal.pmed.1002686 [3]. Mina Rezaei, Haojin Yang, Christoph Meinel. 2017. Deep Learning for Medical Image Analysis. arXiv:1708.08987 [4]. Shen, W., Zhou, M., Yang, F., Yang, C., Tian, J., 2015. Multi-scale convolutional neural networks for lung nodule classification. In: Inf Process Med Imaging. Vol. 9123 of Lect Notes Comput Sci.pp. 588–599J. Công nghệ thông tin L. T. T. Hồng, N. C. Thành, P. T. Hương, “Tổng quan một số nghiên cứu ảnh y tế.” 204 [5]. Bernal et al.,2017. ‘‘Comparative validation of polyp detection methods in video colonoscopy: Results from the MICCAI 2015 endoscopic vision challenge,’’ IEEE Trans. Med. Imag., vol. 36, no. 6, pp. 1231–1249. [6]. https://www.coursera.org/specializations/deep-learning; ABSTRACT AN OVERVIEW OF STUDIES ON DEEP LEARNING IN MEDICAL IMAGE ANALYSIS Deep learning algorithms, in particular convolutional neural networks, have rapidly become a methodology of choice for analyzing medical images. This article will provide an overview of the studies on deep learning algorithms used for medical imaging analysis. It also introduces some studies applied in specific areas such as brain magnetic resonance imaging, chest X-ray image, abdominal region endoscopy, colono-scopy. Keywords: Deep learning; Convolutional neural networks; Medical imaging. Nhận bài ngày 26 tháng 12 năm 2018 Hoàn thiện ngày 10 tháng 3 năm 2019 Chấp nhận đăng ngày 25 tháng 3 năm 2019 Địa chỉ: Viện Công nghệ thông tin/Viện Khoa học và Công nghệ quân sự. * Email: lethithuhong1302@gmail.com.

Các file đính kèm theo tài liệu này:

  • pdfde_tai_tong_quan_mot_so_nghien_cuu_xay_dung_cac_thuat_toan_h.pdf
Tài liệu liên quan