Tài liệu Thuật toán dbscan trong phân vùng ảnh chụp CT và ứng dụng trong trích xuất đặc trưng não người: Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 223
THUẬT TOÁN DBSCAN TRONG PHÂN VÙNG ẢNH CHỤP CT VÀ
ỨNG DỤNG TRONG TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI
Nguyễn Thị Bích Điệp1*, Bùi Thị Hương Thơm1, Đỗ Duy Cốp2
Tóm tắt: Các bài toán phân vùng ảnh y khoa hướng đến mục đích cung cấp
những giải pháp hỗ trợ chẩn đoán tổn thương, bệnh lý. Có nhiều ứng dụng thực tế
của bài toán phân vùng ảnh y khoa như: Truy xuất hình ảnh dựa trên nội dung, xác
định vị trí khối u và bệnh lý , đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc
giải phẫu. Đối với bài toán này, thuật toán DBSCAN tối ưu hơn so với các thuật
toán phân cụm dùng trong phân vùng ảnh. Dựa trên thuật toán phân vùng này, tác
giả lựa chọn các thông số để trích xuất đặc trưng não như: mô não, cấu trúc
xương, mạch máu... Cấu trúc xương và mạch máu có trị số đậm độ tương đương
nên khi thu nhận ảnh sẽ có mức xám tương đương, do đó việc xây dựng bài toán
phân biệt hai cấu trúc n...
8 trang |
Chia sẻ: quangot475 | Lượt xem: 354 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Thuật toán dbscan trong phân vùng ảnh chụp CT và ứng dụng trong trích xuất đặc trưng não người, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 223
THUẬT TOÁN DBSCAN TRONG PHÂN VÙNG ẢNH CHỤP CT VÀ
ỨNG DỤNG TRONG TRÍCH XUẤT ĐẶC TRƯNG NÃO NGƯỜI
Nguyễn Thị Bích Điệp1*, Bùi Thị Hương Thơm1, Đỗ Duy Cốp2
Tóm tắt: Các bài toán phân vùng ảnh y khoa hướng đến mục đích cung cấp
những giải pháp hỗ trợ chẩn đoán tổn thương, bệnh lý. Có nhiều ứng dụng thực tế
của bài toán phân vùng ảnh y khoa như: Truy xuất hình ảnh dựa trên nội dung, xác
định vị trí khối u và bệnh lý , đo khối lượng mô chẩn đoán, nghiên cứu về cấu trúc
giải phẫu. Đối với bài toán này, thuật toán DBSCAN tối ưu hơn so với các thuật
toán phân cụm dùng trong phân vùng ảnh. Dựa trên thuật toán phân vùng này, tác
giả lựa chọn các thông số để trích xuất đặc trưng não như: mô não, cấu trúc
xương, mạch máu... Cấu trúc xương và mạch máu có trị số đậm độ tương đương
nên khi thu nhận ảnh sẽ có mức xám tương đương, do đó việc xây dựng bài toán
phân biệt hai cấu trúc này thông qua kích thước và độ tròn là cần thiết cho việc
xây dựng các ứng dựng hỗ trợ chẩn đoán hình ảnh.
Từ khóa: Xử lý ảnh y tế, Phân vùng ảnh, Thuật toán phân cụm, Ảnh chụp cắt lớp điện toán.
1. ĐẶT VẤN ĐỀ
Xử lý ảnh là một lĩnh vực khoa học công nghệ khá mới so với nhiều ngành khoa học
khác. Phân vùng ảnh là một bài toán cơ bản trong toàn bộ quá trình xử lý ảnh. Có nhiều
ứng dụng thực tế của bài toán phân vùng ảnh như: Truy xuất hình ảnh dựa trên nội dung;
Hình ảnh y khoa: xác định vị trí khối u và bệnh lý khác, đo khối lượng mô chẩn đoán,
nghiên cứu về cấu trúc giải phẫu; Phát hiện và nhận dạng: Nhận dạng vân tay, nhận dạng
khuôn mặt Ảnh y học thường chụp các bộ phận bên trong cơ thể người bằng các thiết bị
chuyên dụng như máy X-Quang chụp hộp sọ, máy chụp cắt lớp vi tính, máy chụp cộng
hưởng từ, máy chụp mạch não...nên ảnh thường không rõ, không sắc nét, gây khó khăn
cho các chuyên gia y học trong việc chẩn đoán bệnh. Mặc dù các thiết bị y tế với công
nghệ ngày càng nâng cao để hỗ trợ cho các chuyên gia y tế phân tích và xử lý thông tin từ
ảnh nhưng vấn đề đặt ra cần phải giải quyết song song là việc nâng cao chất lượng ảnh.
Nếu phân vùng ảnh không tốt sẽ dẫn đến sai lầm trong quá trình nhận dạng ảnh, bởi vậy
người ta xem công đoạn phân vùng ảnh là quá trình then chốt trong quá trình xử lý ảnh nói
chung. Bài báo này đề cập tới việc ứng dụng thuật toán DBSCAN trong phân vùng ảnh
vào việc phân tách ảnh chụp CT não người. Qua đó, tách các vùng ảnh dựa trên các cấu
trúc xương, mô não, mạch máu để hỗ trợ chẩn đoán tổn thương và bệnh lý.
Những vấn đề liên quan đến phân vùng ảnh trong y tế hiện được nhiều nhà nghiên cứu
trên thế giới quan tâm. Những nghiên cứu mới đây có thể kể đến như “Phân vùng ảnh MRI
não người sử dụng thuật toán DBSCAN mở rộng” [1], “Phân vùng u não từ hình ảnh cộng
hưởng từ (MRI), sử dụng phân nhóm với KMeans và DBSCAN” [2], “Phân đoạn ảnh sử
dụng thuật toán dựa trên mật độ” [3],v.v...các nghiên cứu này đã đạt được một số kết quả
phân tách vùng ảnh tự động và bán tự động dựa trên giám sát của các chuyên gia. Tuy
nhiên, phần lớn các nghiên cứu hướng đến việc phân tách ảnh chụp MRI. Ảnh MRI có ưu
điểm là hình ảnh sắc nét hơn ảnh CT do cơ chế tạo ảnh. Tuy nhiên, với một số chẩn đoán
cụ thể hiện nay, ảnh CT được chỉ định nhiều hơn từ các bác sĩ trong các thăm khám cận
lâm sàng. Do những ưu điểm như: chụp nhanh chóng, không gây tiếng ồn như MRI, giá
thành rẻ.
Bởi vậy, sử dụng một thuật toán phù hợp cho phân tách vùng ảnh CT, từ đó đưa ra một
phương pháp trích xuất đặc trưng não người, là một tiền đề quan trọng cho các hướng
Điều khiển – Cơ điện tử - Truyền thông
N. T. B. Điệp, B. T. H. Thơm, Đ. D. Cốp, “Thuật toán DBSCAN đặc trưng não người.” 224
nghiên cứu về trợ giúp chẩn đoán các tổn thương bệnh lý trong não. Với mục đích đó,
nghiên cứu này tập trung vào một số nội dung chính sẽ được trình bày cụ thể dưới đây:
- Đánh giá ưu điểm của thuật toán phân cụm DBSCAN cho phân vùng ảnh y tế.
- Vấn đề về trích xuất đặc trưng dựa trên trị số đậm độ Housfiled – một trị số cơ bản
trong các vấn đề liên quan đến ảnh CT
- Đề xuất thuật toán trích xuất đặc trưng não người ứng dụng DBSCAN.
2. THUẬT TOÁN DBSCAN VÀ VẤN ĐỀ TRÍCH XUẤT ĐẶC TRƯNG
2.1. Thuật toán DBSCAN
Thuật toán DBSCAN [5] (Density Based Spatial Clustering of Applications with
Noise) do Martin Ester và các tác giả khác đề xuất là thuật toán gom cụm dựa trên mật độ,
hiệu quả với cơ sở dữ liệu lớn, có khả năng xử lý nhiễu.
Ý tưởng chính của thuật toán là vùng lân cận mỗi đối tượng trong một cụm có số đối
tượng lớn hơn ngưỡng tối thiểu. Hình dạng vùng lân cận phụ thuộc vào hàm khoảng cách
giữa các đối tượng (nếu sử dụng khoảng cách Manhattan trong không gian 2 chiều thì
vùng lân cận có hình chữ nhật, nếu sử dụng khoảng cách Eucler trong không gian 2 chiều
thì vùng lân cận có hình tròn).
Thuật toán sử dụng khái niệm mật độ của các đối tượng để xây dựng các cluster.
DBSCAN sử dụng hai tham số là MinPts và Eps.
Trong quá trình xây dựng các cluster, DBSCAN sẽ kết nối trực tiếp các “siêu cầu” có
bán kính Eps mà ở đó nó chứa ít nhất MinPts đối tượng.
Vùng lân cận Eps: của đối tượng p (kí hiệu NEps(p)) là tập hợp các đối tượng q
sao cho khoảng cách giữa p và q nhỏ hơn Eps.
NEps(p) = {q∈D | dist(p,q) ≤ Eps}.
Minpts: mật độ - số đối tượng tối thiểu trong 1 cụm.
Hình 1. Quan hệ kết nối theo mật độ trong thuật toán DBSCAN.
2.2. Đánh giá thuật toán DBSCAN so với các thuật toán phân cụm khác
Với các ảnh đầu vào “image input”, kết quả phân chia vùng ảnh với các thuật toán phân
cụm K-means (k=2 và k=3), Fuzzy-Cmeans (k=3, m=2), DBSCAN (eps=1, min=3), ta
thấy DBSCAN không cần biết trước số cụm mà kết quả đầu ra khám phá được các cụm có
hình dáng bất kỳ. Ngoài ra, một số điểm được coi là nhiễu chỉ bị loại ở thuật toán phân
cụm DBSCAN. Đó là ưu điểm nổi bật của thuật toán này.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 225
Hình 2. Sơ đồ thuật toán DBSCAN.
Hình 3. Đánh giá các thuật toán phân cụm.
Điều khiển – Cơ điện tử - Truyền thông
N. T. B. Điệp, B. T. H. Thơm, Đ. D. Cốp, “Thuật toán DBSCAN đặc trưng não người.” 226
Với ảnh chụp cắt lớp điện toán não người, các cấu trúc mô não, xương, mạch máu,
trong ảnh thường có dạng hình tròn. Đặc biệt cấu trúc xương sọ trong ảnh cắt lớp điện toán
có hình dạng khối tròn bao quanh các cấu trúc khác. Ngoài ra, khi phân tách vùng trong
ảnh cắt lớp điện toán thường ảnh hưởng bởi nhiễu. Bởi vậy, việc lựa chọn thuật toán
DBSCAN với ưu điểm nổi bật là khử được nhiễu sẽ là một lựa chọn phù hợp cho bài toán
này.
2.3. Vấn đề trích xuất đặc trưng
Trong ảnh chụp CT não người, các cấu trúc xương, mô não, mạch máu trong ảnh CT
được đặc trưng bởi trị số độ đậm Housfiled (HU):
- Đậm độ của khí: -1000 HU (mức xám 0)
- Đậm độ của xương:+1000 HU (mức xám 255)
- Đậm độ của mỡ: -1000 HU
- Đậm độ của mô não: 20-40 HU
- Đậm độ của nước: 0 HU
Khi xử lý các ảnh CT, để phân biệt được những cấu trúc cơ bản, ta quy ra mức xám của
các cấu trúc từ đậm độ.
Ngoài ra, vì cấu trúc xương và mạch máu có mức xám tương đương. Chỉ thông qua tiêu
chí này, ta không thể phân biệt hai cấu trúc. Ta cần dựa trên các tiêu chí sau để phân biệt:
Kích thước (vùng diện tích) của mạch máu nhỏ hơn so với xương.
Độ tròn: mạch máu có dạng gần tròn, còn xương thì hầu như không
Vị trí mạch máu và xương ở một số vùng nhất định trên ảnh
Độ tương phản ở biên của mạch máu lớn hơn đô tương phản ở biên của
xương (nghĩa là biên của mạch máu không rõ ràng như của xương)
Áp dụng hai tiêu chuẩn trong số này cho việc phân loại
Đối với kích thước: Đếm số pixel tạo nên vùng để xác định kích thước. Loại
bỏ cùng nào có số pixel quá vượt trội
Đối với độ tròn: được tính bằng cách so sánh diện tích và chu vi của đối
tượng đó.
Công thức tính độ tròn:
Với S là diện tích đối tượng; P là chu vi đối tượng.
3. MÔ PHỎNG, TÍNH TOÁN VÀ KẾT QUẢ
3.1. Trích xuất đặc trưng não người dựa trên DBSCAN:
Hình 4. Trích xuất đặc trưng ảnh chụp CT não người.
Bước 1: Tiền xử lý
Một bức ảnh CT được scan ở dưới định dạng .DCM (chuẩn DICOM). Đây là định dạng
file ban đầu chưa qua một thao tác xử lý nào hết. Các file này đều không được hỗ trợ đọc
hoặc ghi trong các công cụ xử lý ảnh thông thường. Do vậy, luôn có một bước chuyển
.dcm file để tiện cho việc xử lý.
Ảnh đa
mức xám
Ảnh có các
vùng gán nhãn
theo trị số đậm
độ
Ảnh
CT
Ảnh có các
vùng gán nhãn
theo cấu trúc
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 227
Quan sát các ảnh chụp CT ta đều dễ nhận thấy khoảng màu hầu như nằm trong mức
xám nhiều. Nên quá trình chuyển đổi tiếp từ các ảnh RGB sang ảnh xám vẫn đảm bảo cho
ta các thông tin đầy đủ cho các thao tác phân chia vùng ảnh.
Bước 2: Phân chia ảnh theo cấu trúc dựa trên trị số đậm độ
Hình định vị trong ảnh CT là hình dùng để xác định các vị trí lát cắt. Ở hình định vị có
các đường được đánh số và đặt chồng lên vùng cơ thể khảo sát. Các số được đánh dấu cúa
các đường này sẽ tương ứng với các số của các hình hay lát cắt trình bày trên phim CT. Ta
có thể dùng hình định vị để quan sát nhanh các lát cắt nào cần xem trên phim CT. Hoặc
ngược lại, xác định bất thường trên lát cắt CT nằm ở vị trí nào trên hình định vị.
Dữ liệu ảnh của nghiên cứu là 500 ảnh chụp CT được cung cấp bởi khoa Chẩn đoán
hình ảnh, bệnh viện Đa khoa Trung ương Thái Nguyên. Ta nhận thấy rằng mỗi bệnh nhân
có khoảng 20 đến 50 ảnh tương ứng với số lát cắt. Tương ứng với mỗi lát cắt, ta xác định
trị số độ đậm tương ứng với các mức xám đặc trưng của các cấu trúc: Xương, mô não,
mạch máu,.. Qua đó ta xác định được cấu trúc cần phân vùng. Mục đích của phân chia
vùng ảnh là chia ảnh thành nhiều vùng dựa trên một đặc tính nào đó. Ở đây ta chọn tiêu
chí mức xám làm điều kiện phân chia vùng ảnh.
Bước 3: Phân chia vùng ảnh bằng thuật toán DBSCAN
Các thuật toán phân cụm làm việc trên tập dữ liệu là các điểm rời rạc, trong khi đó dữ
liệu đầu vào cần xử lý của ta là một file ảnh. Vậy ta cần có bước chuyển đổi dữ liệu phù
hợp với bài toán đặt ra.
Khi đọc một file ảnh trong matlab ta dùng lệnh: X= imread (‘ file path’); Khi đó X sẽ
nhận được giá trị là một mảng 3 chiều (với ảnh RGB). Mỗi một điểm ảnh bao gồm 3 thông
số R, G,B. Ta chuyển đổi X thành ảnh xám, X sẽ nhận giá trị là mảng 2 chiều, mỗi tọa độ
biểu diễn một mức xám. Sau đó, với mỗi nhóm đã chia ở bước 2, ta dựa trên vị trí (tọa độ)
của nó trên ảnh mà thực hiện phân chia mỗi điểm ảnh này vào nhóm mới.
Việc lựa chọn các thông số MinPts và Epscho thuật toán DBSCAN có thể được xác
định bằng tay hoặc thông qua thuật toán heuristics xác định thông số Eps và MinPts cho
cụm có mật độ ít dày đặc nhất. Qua thực nghiệm, chúng tôi nhận thấy cấu trúc nhỏ nhất
trong ảnh CT chụp não là mạch máu với số điểm ảnh tối thiểu là 10. Kích thước ảnh cho
việc xử lý cũng là cố định. Vậy, chúng tôi tính toán thông số Eps thông qua thuật toán
heuristics [5] với giá trị Minpts =10.
[Eps]=epsilon(x,Minpts)
[m,n function]=size(x);
Eps=((prod(max(x)-
min(x))*Minpts*gamma(.5*n+1))/(m*sqrt(pi.^n))).^(1/n);
Bước 4: Phân biệt xương và mạch máu
Sau bước 3, ta đã thu được một vùng đặc trưng của não thông qua phân cụm theo mức
xám. Tuy nhiên, chưa phân biệt được cấu trúc xương và mạch máu. Dựa vào mức xám
chung của xương và mạch máu, ta áp dụng phần nghiên cứu về trích xuất đặc trưng phân
biệt xương và mạch máu ở trên. Dựa vào chu vi và diện tích mỗi đối tượng thu được, ta
tính toán độ tròn của đối tượng để phân biệt hai cấu trúc này.
3.2. Các kết quả
Nhóm tác giả sử dụng 500 hình ảnh chụp cắt lớp điện toán được cung cấp bởi Khoa
chẩn đoán hình ảnh, bệnh viện Đa khoa Trung ương Thái Nguyên cho nghiên cứu này.
Với chương trình cài đặt trên matlab, thuật toán đã thực hiện được việc phân tách vùng đối
với xương và mô não, phân biệt được cấu trúc xương và mạch máu.
Điều khiển – Cơ điện tử - Truyền thông
N. T. B. Điệp, B. T. H. Thơm, Đ. D. Cốp, “Thuật toán DBSCAN đặc trưng não người.” 228
Bảng 1. Số liệu tổng hợp cho mô phỏng.
ID tệp
file ảnh
CT
Số
hình
định
vị
Số lượng
ảnh mang
thông tin các
cấu trúc não
Số lượng ảnh
được phân
vùng cấu trúc
xương.
Số lượng ảnh
được phân
vùng cấu
trúc mô não.
Số lượng ảnh
được phân tách
tự động cấu trúc
xương và mạch
máu
Dcm01 50 45 45 21 21
Dcm02 32 30 30 24 24
Dcm03 17 15 15 15 15
Dcm04 34 30 30 13 13
Dcm05 24 24 24 24 24
Dcm06 34 30 30 10 10
Dcm07 34 30 30 9 9
Dcm08 36 35 35 12 12
Dcm09 66 60 60 27 27
Dcm010 34 30 30 15 15
Dcm011 25 22 22 11 11
Dcm012 38 35 35 12 12
Dcm013 32 28 28 10 10
Dcm014 44 41 41 17 17
Hình 4. Phân tách cấu trúc mô não bằng phương pháp phân vùng
dựa trên thuật toán phân cụm DBSAN.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san ACMEC, 07 - 2017 229
Hình 5. Phân tách cấu trúc xương và mạch máu.
4. KẾT LUẬN
Phương pháp phân chia vùng ảnh dựa trên thuật toán phân cụm DBSCAN hiệu quả với
ảnh chụp CT não người. Ngoài ra, việc phân tích sau phân cụm về trích xuất đặc trưng dựa
trên chỉ số đậm độ của ảnh CT giúp phân tách các vùng thịt và cấu trúc xương, mạch máu.
Hướng phát triển của nghiên cứu này hướng đến mục tiêu có thể phân tích một tệp các
ảnh đầu vào, trích xuất đặc trưng ảnh CT não người, sau đó phân tích và đưa ra các ảnh có
thể có tổn thương giúp cho các bác sĩ nhanh chóng đưa ra được những chẩn đoán chính xác.
Lời cảm ơn: Nhóm tác giả cảm ơn sự giúp đỡ của lãnh đạo Khoa chẩn đoán hình ảnh,
bệnh viên Đa khoa Trung ương Thái Nguyên đã hỗ trợ và cung cấp hình ảnh cho nghiên
cứu này.
Điều khiển – Cơ điện tử - Truyền thông
N. T. B. Điệp, B. T. H. Thơm, Đ. D. Cốp, “Thuật toán DBSCAN đặc trưng não người.” 230
TÀI LIỆU THAM KHẢO
[1]. Mir Morteza Mousavi, Ali Farzan. “Brain MRI segmentation by using extended
heuriatic DBSCAN”, Journalsci, Volume 3, Issue 12, 2014, Pages:589-592.
[2] Prof. Samir Kumar Bandyopadhyay, Tuhin Utsab Paul. “Segmentation of Brain
Tumour from MRI image – Analysis of Kmeans and DBSCAN Clustering”. IJRES,
Volume 1, Issue 1, May 2013, Pages: 48-57.
[3] Atrayee Dhua, Debjani Nath Sarma, Sneha Singh, Bijoyeta Roy.“Segmentation of
Images using Density-Based Algorithms”. IJARCCE, Volume 4, Issue 5, 2015.
Pages: 273-277.
[4] R. C. Gonzalez and R. E. Woods. Digital Image Processing, 3rd ed, Prentice Hall,
New Jersey, 2008.
[5] M. Ester, H. Peter Kriegel, J. Sander, X. Xu, “A Density-Based Algorithm for
Discovering Clustersin Large Spatial Databases with Noise”,Proceedings of 2nd
Internation Conference on Knowledge Discovery and Data Mining,1996.
[6] J. Shi and J. Malik, “Normalized cuts and image segmentation”, IEEE Transactions
on Pattern Analysis and Machine Itelligence,2000.
[7] Sunita Jahirabadkar, Parag Kulkarni,“Algorithm to determine” - distance parameter
in density based clustering”, Expert System with Applications, 2013.
[8] V.V. Vu, N. Labroche, and B. Bouchon-Meunier, “Active learning for semi
supervised k-means clustering”, Proceedings of the 22nd International Conference
on Tools with Artificial Intelligence, IEEE ICTAI, pages 12–15, 2010.
ABSTRACT
DBSCAN ALGORITHM IN CT IMAGE SEGMENTATION
AND APPLICATIONS IN THE BRAIN EXTRACT FEATURE
The problem of medical image segmentation aims to provide solutions that
support the diagnosis of lesions, pathological. There are many practical
applications of math, such as medical image segmentation: Retrieve images based
on content, locate the tumor and pathology, diagnostic tissue volume measured,
studied anatomy. DBSCAN optimization algorithm than the clustering algorithms
used in image segmentation. Based on this partition algorithm, the authors selected
parameters specific to extract the brain, such as brain tissue, bone structure, bone
structure of blood vessels ... and vascular attenuation equivalent value should when
receiving grayscale images will be equal, so you need to build math distinguish two
structures through size and roundness are two of the four criteria to distinguish.
Keywords: DBSCAN; Feature extraction; Brain; Clustering; CT.
Nhận bài ngày 20 tháng 5 năm 2017
Hoàn thiện ngày 10 tháng 07 năm 2017
Chấp nhận đăng ngày 20 tháng 07 năm 2017
Địa chỉ: 1Đại học Công nghệ Thông tin và Truyền thông, Đại học Thái Nguyên;
2 Đại học Kỹ thuật Công nghiệp, Đại học Thái Nguyên.
* Email (Corresponding author): ntbdiep@ictu.edu.vn.
Các file đính kèm theo tài liệu này:
- 28_diep_6963_2151767.pdf