Thuật toán dbscan trong phân vùng ảnh chụp CT và ứng dụng trong trích xuất đặc trưng não người

Tài liệu Thuật toán dbscan trong phân vùng ảnh chụp CT và ứng dụng trong trích xuất đặc trưng não người: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 223 THUẬT TOÁN DBSCAN TRONG PHÂN VÙNG ẢNH CHỤP CT VÀ ỨNG DỤNG TRONG TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI Nguyễn Thị Bích Điệp1*, Bùi Thị Hương Thơm1, Đỗ Duy Cốp2 Tóm tắt: Các bài toán phân vùng ảnh y khoa hướng đến mục đích cung cấp những giải pháp hỗ trợ chẩn đoán tổn thương, bệnh lý. Có nhiều ứng dụng thực tế của bài toán phân vùng ảnh y khoa như: Truy xuất hình ảnh dựa trên nội dung, xác định vị trí khối u và bệnh lý , đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc giải phẫu. Đối với bài toán này, thuật toán DBSCAN tối ưu hơn so với các thuật toán phân cụm dùng trong phân vùng ảnh. Dựa trên thuật toán phân vùng này, tác giả lựa chọn các thông số để trích xuất đặc trưng não như: mô não, cấu trúc xương, mạch máu... Cấu trúc xương và mạch máu có trị số đậm độ tương đương nên khi thu nhận ảnh sẽ có mức xám tương đương, do đó việc xây dựng bài toán phân biệt hai cấu trúc n...

8 trang | Chia sẻ: quangot475 | Lượt xem: 429 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Thuật toán dbscan trong phân vùng ảnh chụp CT và ứng dụng trong trích xuất đặc trưng não người, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 223 THUẬT TOÁN DBSCAN TRONG PHÂN VÙNG ẢNH CHỤP CT VÀ ỨNG DỤNG TRONG TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI Nguyễn Thị Bích Điệp1*, Bùi Thị Hương Thơm1, Đỗ Duy Cốp2 Tóm tắt: Các bài toán phân vùng ảnh y khoa hướng đến mục đích cung cấp những giải pháp hỗ trợ chẩn đoán tổn thương, bệnh lý. Có nhiều ứng dụng thực tế của bài toán phân vùng ảnh y khoa như: Truy xuất hình ảnh dựa trên nội dung, xác định vị trí khối u và bệnh lý , đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc giải phẫu. Đối với bài toán này, thuật toán DBSCAN tối ưu hơn so với các thuật toán phân cụm dùng trong phân vùng ảnh. Dựa trên thuật toán phân vùng này, tác giả lựa chọn các thông số để trích xuất đặc trưng não như: mô não, cấu trúc xương, mạch máu... Cấu trúc xương và mạch máu có trị số đậm độ tương đương nên khi thu nhận ảnh sẽ có mức xám tương đương, do đó việc xây dựng bài toán phân biệt hai cấu trúc này thông qua kích thước và độ tròn là cần thiết cho việc xây dựng các ứng dựng hỗ trợ chẩn đoán hình ảnh. Từ khóa: Xử lý ảnh y tế, Phân vùng ảnh, Thuật toán phân cụm, Ảnh chụp cắt lớp điện toán. 1. ĐẶT VẤN ĐỀ Xử lý ảnh là một lĩnh vực khoa học công nghệ khá mới so với nhiều ngành khoa học khác. Phân vùng ảnh là một bài toán cơ bản trong toàn bộ quá trình xử lý ảnh. Có nhiều ứng dụng thực tế của bài toán phân vùng ảnh như: Truy xuất hình ảnh dựa trên nội dung; Hình ảnh y khoa: xác định vị trí khối u và bệnh lý khác, đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc giải phẫu; Phát hiện và nhận dạng: Nhận dạng vân tay, nhận dạng khuôn mặt Ảnh y học thường chụp các bộ phận bên trong cơ thể người bằng các thiết bị chuyên dụng như máy X-Quang chụp hộp sọ, máy chụp cắt lớp vi tính, máy chụp cộng hưởng từ, máy chụp mạch não...nên ảnh thường không rõ, không sắc nét, gây khó khăn cho các chuyên gia y học trong việc chẩn đoán bệnh. Mặc dù các thiết bị y tế với công nghệ ngày càng nâng cao để hỗ trợ cho các chuyên gia y tế phân tích và xử lý thông tin từ ảnh nhưng vấn đề đặt ra cần phải giải quyết song song là việc nâng cao chất lượng ảnh. Nếu phân vùng ảnh không tốt sẽ dẫn đến sai lầm trong quá trình nhận dạng ảnh, bởi vậy người ta xem công đoạn phân vùng ảnh là quá trình then chốt trong quá trình xử lý ảnh nói chung. Bài báo này đề cập tới việc ứng dụng thuật toán DBSCAN trong phân vùng ảnh vào việc phân tách ảnh chụp CT não người. Qua đó, tách các vùng ảnh dựa trên các cấu trúc xương, mô não, mạch máu để hỗ trợ chẩn đoán tổn thương và bệnh lý. Những vấn đề liên quan đến phân vùng ảnh trong y tế hiện được nhiều nhà nghiên cứu trên thế giới quan tâm. Những nghiên cứu mới đây có thể kể đến như “Phân vùng ảnh MRI não người sử dụng thuật toán DBSCAN mở rộng” [1], “Phân vùng u não từ hình ảnh cộng hưởng từ (MRI), sử dụng phân nhóm với KMeans và DBSCAN” [2], “Phân đoạn ảnh sử dụng thuật toán dựa trên mật độ” [3],v.v...các nghiên cứu này đã đạt được một số kết quả phân tách vùng ảnh tự động và bán tự động dựa trên giám sát của các chuyên gia. Tuy nhiên, phần lớn các nghiên cứu hướng đến việc phân tách ảnh chụp MRI. Ảnh MRI có ưu điểm là hình ảnh sắc nét hơn ảnh CT do cơ chế tạo ảnh. Tuy nhiên, với một số chẩn đoán cụ thể hiện nay, ảnh CT được chỉ định nhiều hơn từ các bác sĩ trong các thăm khám cận lâm sàng. Do những ưu điểm như: chụp nhanh chóng, không gây tiếng ồn như MRI, giá thành rẻ. Bởi vậy, sử dụng một thuật toán phù hợp cho phân tách vùng ảnh CT, từ đó đưa ra một phương pháp trích xuất đặc trưng não người, là một tiền đề quan trọng cho các hướng Điều khiển – Cơ điện tử - Truyền thông N. T. B. Điệp, B. T. H. Thơm, Đ. D. Cốp, “Thuật toán DBSCAN đặc trưng não người.” 224 nghiên cứu về trợ giúp chẩn đoán các tổn thương bệnh lý trong não. Với mục đích đó, nghiên cứu này tập trung vào một số nội dung chính sẽ được trình bày cụ thể dưới đây: - Đánh giá ưu điểm của thuật toán phân cụm DBSCAN cho phân vùng ảnh y tế. - Vấn đề về trích xuất đặc trưng dựa trên trị số đậm độ Housfiled – một trị số cơ bản trong các vấn đề liên quan đến ảnh CT - Đề xuất thuật toán trích xuất đặc trưng não người ứng dụng DBSCAN. 2. THUẬT TOÁN DBSCAN VÀ VẤN ĐỀ TRÍCH XUẤT ĐẶC TRƯNG 2.1. Thuật toán DBSCAN Thuật toán DBSCAN [5] (Density Based Spatial Clustering of Applications with Noise) do Martin Ester và các tác giả khác đề xuất là thuật toán gom cụm dựa trên mật độ, hiệu quả với cơ sở dữ liệu lớn, có khả năng xử lý nhiễu. Ý tưởng chính của thuật toán là vùng lân cận mỗi đối tượng trong một cụm có số đối tượng lớn hơn ngưỡng tối thiểu. Hình dạng vùng lân cận phụ thuộc vào hàm khoảng cách giữa các đối tượng (nếu sử dụng khoảng cách Manhattan trong không gian 2 chiều thì vùng lân cận có hình chữ nhật, nếu sử dụng khoảng cách Eucler trong không gian 2 chiều thì vùng lân cận có hình tròn). Thuật toán sử dụng khái niệm mật độ của các đối tượng để xây dựng các cluster. DBSCAN sử dụng hai tham số là MinPts và Eps. Trong quá trình xây dựng các cluster, DBSCAN sẽ kết nối trực tiếp các “siêu cầu” có bán kính Eps mà ở đó nó chứa ít nhất MinPts đối tượng.  Vùng lân cận Eps: của đối tượng p (kí hiệu NEps(p)) là tập hợp các đối tượng q sao cho khoảng cách giữa p và q nhỏ hơn Eps. NEps(p) = {q∈D | dist(p,q) ≤ Eps}.  Minpts: mật độ - số đối tượng tối thiểu trong 1 cụm. Hình 1. Quan hệ kết nối theo mật độ trong thuật toán DBSCAN. 2.2. Đánh giá thuật toán DBSCAN so với các thuật toán phân cụm khác Với các ảnh đầu vào “image input”, kết quả phân chia vùng ảnh với các thuật toán phân cụm K-means (k=2 và k=3), Fuzzy-Cmeans (k=3, m=2), DBSCAN (eps=1, min=3), ta thấy DBSCAN không cần biết trước số cụm mà kết quả đầu ra khám phá được các cụm có hình dáng bất kỳ. Ngoài ra, một số điểm được coi là nhiễu chỉ bị loại ở thuật toán phân cụm DBSCAN. Đó là ưu điểm nổi bật của thuật toán này. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 225 Hình 2. Sơ đồ thuật toán DBSCAN. Hình 3. Đánh giá các thuật toán phân cụm. Điều khiển – Cơ điện tử - Truyền thông N. T. B. Điệp, B. T. H. Thơm, Đ. D. Cốp, “Thuật toán DBSCAN đặc trưng não người.” 226 Với ảnh chụp cắt lớp điện toán não người, các cấu trúc mô não, xương, mạch máu, trong ảnh thường có dạng hình tròn. Đặc biệt cấu trúc xương sọ trong ảnh cắt lớp điện toán có hình dạng khối tròn bao quanh các cấu trúc khác. Ngoài ra, khi phân tách vùng trong ảnh cắt lớp điện toán thường ảnh hưởng bởi nhiễu. Bởi vậy, việc lựa chọn thuật toán DBSCAN với ưu điểm nổi bật là khử được nhiễu sẽ là một lựa chọn phù hợp cho bài toán này. 2.3. Vấn đề trích xuất đặc trưng Trong ảnh chụp CT não người, các cấu trúc xương, mô não, mạch máu trong ảnh CT được đặc trưng bởi trị số độ đậm Housfiled (HU): - Đậm độ của khí: -1000 HU (mức xám 0) - Đậm độ của xương:+1000 HU (mức xám 255) - Đậm độ của mỡ: -1000 HU - Đậm độ của mô não: 20-40 HU - Đậm độ của nước: 0 HU Khi xử lý các ảnh CT, để phân biệt được những cấu trúc cơ bản, ta quy ra mức xám của các cấu trúc từ đậm độ. Ngoài ra, vì cấu trúc xương và mạch máu có mức xám tương đương. Chỉ thông qua tiêu chí này, ta không thể phân biệt hai cấu trúc. Ta cần dựa trên các tiêu chí sau để phân biệt:  Kích thước (vùng diện tích) của mạch máu nhỏ hơn so với xương.  Độ tròn: mạch máu có dạng gần tròn, còn xương thì hầu như không  Vị trí mạch máu và xương ở một số vùng nhất định trên ảnh  Độ tương phản ở biên của mạch máu lớn hơn đô tương phản ở biên của xương (nghĩa là biên của mạch máu không rõ ràng như của xương) Áp dụng hai tiêu chuẩn trong số này cho việc phân loại  Đối với kích thước: Đếm số pixel tạo nên vùng để xác định kích thước. Loại bỏ cùng nào có số pixel quá vượt trội  Đối với độ tròn: được tính bằng cách so sánh diện tích và chu vi của đối tượng đó. Công thức tính độ tròn: Với S là diện tích đối tượng; P là chu vi đối tượng. 3. MÔ PHỎNG, TÍNH TOÁN VÀ KẾT QUẢ 3.1. Trích xuất đặc trưng não người dựa trên DBSCAN: Hình 4. Trích xuất đặc trưng ảnh chụp CT não người. Bước 1: Tiền xử lý Một bức ảnh CT được scan ở dưới định dạng .DCM (chuẩn DICOM). Đây là định dạng file ban đầu chưa qua một thao tác xử lý nào hết. Các file này đều không được hỗ trợ đọc hoặc ghi trong các công cụ xử lý ảnh thông thường. Do vậy, luôn có một bước chuyển .dcm file để tiện cho việc xử lý. Ảnh đa mức xám Ảnh có các vùng gán nhãn theo trị số đậm độ Ảnh CT Ảnh có các vùng gán nhãn theo cấu trúc Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 227 Quan sát các ảnh chụp CT ta đều dễ nhận thấy khoảng màu hầu như nằm trong mức xám nhiều. Nên quá trình chuyển đổi tiếp từ các ảnh RGB sang ảnh xám vẫn đảm bảo cho ta các thông tin đầy đủ cho các thao tác phân chia vùng ảnh. Bước 2: Phân chia ảnh theo cấu trúc dựa trên trị số đậm độ Hình định vị trong ảnh CT là hình dùng để xác định các vị trí lát cắt. Ở hình định vị có các đường được đánh số và đặt chồng lên vùng cơ thể khảo sát. Các số được đánh dấu cúa các đường này sẽ tương ứng với các số của các hình hay lát cắt trình bày trên phim CT. Ta có thể dùng hình định vị để quan sát nhanh các lát cắt nào cần xem trên phim CT. Hoặc ngược lại, xác định bất thường trên lát cắt CT nằm ở vị trí nào trên hình định vị. Dữ liệu ảnh của nghiên cứu là 500 ảnh chụp CT được cung cấp bởi khoa Chẩn đoán hình ảnh, bệnh viện Đa khoa Trung ương Thái Nguyên. Ta nhận thấy rằng mỗi bệnh nhân có khoảng 20 đến 50 ảnh tương ứng với số lát cắt. Tương ứng với mỗi lát cắt, ta xác định trị số độ đậm tương ứng với các mức xám đặc trưng của các cấu trúc: Xương, mô não, mạch máu,.. Qua đó ta xác định được cấu trúc cần phân vùng. Mục đích của phân chia vùng ảnh là chia ảnh thành nhiều vùng dựa trên một đặc tính nào đó. Ở đây ta chọn tiêu chí mức xám làm điều kiện phân chia vùng ảnh. Bước 3: Phân chia vùng ảnh bằng thuật toán DBSCAN Các thuật toán phân cụm làm việc trên tập dữ liệu là các điểm rời rạc, trong khi đó dữ liệu đầu vào cần xử lý của ta là một file ảnh. Vậy ta cần có bước chuyển đổi dữ liệu phù hợp với bài toán đặt ra. Khi đọc một file ảnh trong matlab ta dùng lệnh: X= imread (‘ file path’); Khi đó X sẽ nhận được giá trị là một mảng 3 chiều (với ảnh RGB). Mỗi một điểm ảnh bao gồm 3 thông số R, G,B. Ta chuyển đổi X thành ảnh xám, X sẽ nhận giá trị là mảng 2 chiều, mỗi tọa độ biểu diễn một mức xám. Sau đó, với mỗi nhóm đã chia ở bước 2, ta dựa trên vị trí (tọa độ) của nó trên ảnh mà thực hiện phân chia mỗi điểm ảnh này vào nhóm mới. Việc lựa chọn các thông số MinPts và Epscho thuật toán DBSCAN có thể được xác định bằng tay hoặc thông qua thuật toán heuristics xác định thông số Eps và MinPts cho cụm có mật độ ít dày đặc nhất. Qua thực nghiệm, chúng tôi nhận thấy cấu trúc nhỏ nhất trong ảnh CT chụp não là mạch máu với số điểm ảnh tối thiểu là 10. Kích thước ảnh cho việc xử lý cũng là cố định. Vậy, chúng tôi tính toán thông số Eps thông qua thuật toán heuristics [5] với giá trị Minpts =10. [Eps]=epsilon(x,Minpts) [m,n function]=size(x); Eps=((prod(max(x)- min(x))*Minpts*gamma(.5*n+1))/(m*sqrt(pi.^n))).^(1/n); Bước 4: Phân biệt xương và mạch máu Sau bước 3, ta đã thu được một vùng đặc trưng của não thông qua phân cụm theo mức xám. Tuy nhiên, chưa phân biệt được cấu trúc xương và mạch máu. Dựa vào mức xám chung của xương và mạch máu, ta áp dụng phần nghiên cứu về trích xuất đặc trưng phân biệt xương và mạch máu ở trên. Dựa vào chu vi và diện tích mỗi đối tượng thu được, ta tính toán độ tròn của đối tượng để phân biệt hai cấu trúc này. 3.2. Các kết quả Nhóm tác giả sử dụng 500 hình ảnh chụp cắt lớp điện toán được cung cấp bởi Khoa chẩn đoán hình ảnh, bệnh viện Đa khoa Trung ương Thái Nguyên cho nghiên cứu này. Với chương trình cài đặt trên matlab, thuật toán đã thực hiện được việc phân tách vùng đối với xương và mô não, phân biệt được cấu trúc xương và mạch máu. Điều khiển – Cơ điện tử - Truyền thông N. T. B. Điệp, B. T. H. Thơm, Đ. D. Cốp, “Thuật toán DBSCAN đặc trưng não người.” 228 Bảng 1. Số liệu tổng hợp cho mô phỏng. ID tệp file ảnh CT Số hình định vị Số lượng ảnh mang thông tin các cấu trúc não Số lượng ảnh được phân vùng cấu trúc xương. Số lượng ảnh được phân vùng cấu trúc mô não. Số lượng ảnh được phân tách tự động cấu trúc xương và mạch máu Dcm01 50 45 45 21 21 Dcm02 32 30 30 24 24 Dcm03 17 15 15 15 15 Dcm04 34 30 30 13 13 Dcm05 24 24 24 24 24 Dcm06 34 30 30 10 10 Dcm07 34 30 30 9 9 Dcm08 36 35 35 12 12 Dcm09 66 60 60 27 27 Dcm010 34 30 30 15 15 Dcm011 25 22 22 11 11 Dcm012 38 35 35 12 12 Dcm013 32 28 28 10 10 Dcm014 44 41 41 17 17 Hình 4. Phân tách cấu trúc mô não bằng phương pháp phân vùng dựa trên thuật toán phân cụm DBSAN. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 229 Hình 5. Phân tách cấu trúc xương và mạch máu. 4. KẾT LUẬN Phương pháp phân chia vùng ảnh dựa trên thuật toán phân cụm DBSCAN hiệu quả với ảnh chụp CT não người. Ngoài ra, việc phân tích sau phân cụm về trích xuất đặc trưng dựa trên chỉ số đậm độ của ảnh CT giúp phân tách các vùng thịt và cấu trúc xương, mạch máu. Hướng phát triển của nghiên cứu này hướng đến mục tiêu có thể phân tích một tệp các ảnh đầu vào, trích xuất đặc trưng ảnh CT não người, sau đó phân tích và đưa ra các ảnh có thể có tổn thương giúp cho các bác sĩ nhanh chóng đưa ra được những chẩn đoán chính xác. Lời cảm ơn: Nhóm tác giả cảm ơn sự giúp đỡ của lãnh đạo Khoa chẩn đoán hình ảnh, bệnh viên Đa khoa Trung ương Thái Nguyên đã hỗ trợ và cung cấp hình ảnh cho nghiên cứu này. Điều khiển – Cơ điện tử - Truyền thông N. T. B. Điệp, B. T. H. Thơm, Đ. D. Cốp, “Thuật toán DBSCAN đặc trưng não người.” 230 TÀI LIỆU THAM KHẢO [1]. Mir Morteza Mousavi, Ali Farzan. “Brain MRI segmentation by using extended heuriatic DBSCAN”, Journalsci, Volume 3, Issue 12, 2014, Pages:589-592. [2] Prof. Samir Kumar Bandyopadhyay, Tuhin Utsab Paul. “Segmentation of Brain Tumour from MRI image – Analysis of Kmeans and DBSCAN Clustering”. IJRES, Volume 1, Issue 1, May 2013, Pages: 48-57. [3] Atrayee Dhua, Debjani Nath Sarma, Sneha Singh, Bijoyeta Roy.“Segmentation of Images using Density-Based Algorithms”. IJARCCE, Volume 4, Issue 5, 2015. Pages: 273-277. [4] R. C. Gonzalez and R. E. Woods. Digital Image Processing, 3rd ed, Prentice Hall, New Jersey, 2008. [5] M. Ester, H. Peter Kriegel, J. Sander, X. Xu, “A Density-Based Algorithm for Discovering Clustersin Large Spatial Databases with Noise”,Proceedings of 2nd Internation Conference on Knowledge Discovery and Data Mining,1996. [6] J. Shi and J. Malik, “Normalized cuts and image segmentation”, IEEE Transactions on Pattern Analysis and Machine Itelligence,2000. [7] Sunita Jahirabadkar, Parag Kulkarni,“Algorithm to determine” - distance parameter in density based clustering”, Expert System with Applications, 2013. [8] V.V. Vu, N. Labroche, and B. Bouchon-Meunier, “Active learning for semi supervised k-means clustering”, Proceedings of the 22nd International Conference on Tools with Artiﬁcial Intelligence, IEEE ICTAI, pages 12–15, 2010. ABSTRACT DBSCAN ALGORITHM IN CT IMAGE SEGMENTATION AND APPLICATIONS IN THE BRAIN EXTRACT FEATURE The problem of medical image segmentation aims to provide solutions that support the diagnosis of lesions, pathological. There are many practical applications of math, such as medical image segmentation: Retrieve images based on content, locate the tumor and pathology, diagnostic tissue volume measured, studied anatomy. DBSCAN optimization algorithm than the clustering algorithms used in image segmentation. Based on this partition algorithm, the authors selected parameters specific to extract the brain, such as brain tissue, bone structure, bone structure of blood vessels ... and vascular attenuation equivalent value should when receiving grayscale images will be equal, so you need to build math distinguish two structures through size and roundness are two of the four criteria to distinguish. Keywords: DBSCAN; Feature extraction; Brain; Clustering; CT. Nhận bài ngày 20 tháng 5 năm 2017 Hoàn thiện ngày 10 tháng 07 năm 2017 Chấp nhận đăng ngày 20 tháng 07 năm 2017 Địa chỉ: 1Đại học Công nghệ Thông tin và Truyền thông, Đại học Thái Nguyên; 2 Đại học Kỹ thuật Công nghiệp, Đại học Thái Nguyên. * Email (Corresponding author): ntbdiep@ictu.edu.vn.

Các file đính kèm theo tài liệu này:

28_diep_6963_2151767.pdf