Tài liệu Luận văn Hỗ trợ chẩn đoán tự động tổn thương xuất huyết-tụ máu dựa vào ảnh CT não: TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN CÔNG NGHỆ TRI THỨC
Ngụy Đức Thuận
HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG TỔN THƯƠNG
XUẤT HUYẾT/TỤ MÁU DỰA VÀO ẢNH CT NÃO
KHOÁ LUẬN CỬ NHÂN TIN HỌC
TP. HCM, NĂM 2005
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN CÔNG NGHỆ TRI THỨC
Ngụy Đức Thuận – 0112283
HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG TỔN THƯƠNG
XUẤT HUYẾT/TỤ MÁU DỰA VÀO ẢNH CT NÃO
KHÓA LUẬN CỬ NHÂN TIN HỌC
GIÁO VIÊN HƯỚNG DẪN
TIẾN SĨ LÊ HOÀI BẮC
NIÊN KHÓA 2001-2005
Lời cảm ơn
Em xin gửi lời biết ơn chân thành nhất đến thầy Lê Hoài Bắc, người
đã tận tình dạy dỗ em trong suốt quá trình học, cho em nhiều lời động viên
cũng như những chỉ dẫn quý báu để em có thể thực hiện tốt được đề tài này.
Bên cạnh đó, em xin chân thành cảm ơn các thầy cô trong khoa Công
Nghệ Thông Tin đã hết lòng trong công tác giảng dạy, tận tình cung cấp
nhiều kiến thức cần thiết trong suốt những năm học tại trường.
Em cũng gửi lời cảm ơn sâu sắc đến ...
84 trang |
Chia sẻ: haohao | Lượt xem: 1158 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Hỗ trợ chẩn đoán tự động tổn thương xuất huyết-tụ máu dựa vào ảnh CT não, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN CÔNG NGHỆ TRI THỨC
Ngụy Đức Thuận
HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG TỔN THƯƠNG
XUẤT HUYẾT/TỤ MÁU DỰA VÀO ẢNH CT NÃO
KHOÁ LUẬN CỬ NHÂN TIN HỌC
TP. HCM, NĂM 2005
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA CÔNG NGHỆ THÔNG TIN
BỘ MÔN CÔNG NGHỆ TRI THỨC
Ngụy Đức Thuận – 0112283
HỖ TRỢ CHẨN ĐOÁN TỰ ĐỘNG TỔN THƯƠNG
XUẤT HUYẾT/TỤ MÁU DỰA VÀO ẢNH CT NÃO
KHÓA LUẬN CỬ NHÂN TIN HỌC
GIÁO VIÊN HƯỚNG DẪN
TIẾN SĨ LÊ HOÀI BẮC
NIÊN KHÓA 2001-2005
Lời cảm ơn
Em xin gửi lời biết ơn chân thành nhất đến thầy Lê Hoài Bắc, người
đã tận tình dạy dỗ em trong suốt quá trình học, cho em nhiều lời động viên
cũng như những chỉ dẫn quý báu để em có thể thực hiện tốt được đề tài này.
Bên cạnh đó, em xin chân thành cảm ơn các thầy cô trong khoa Công
Nghệ Thông Tin đã hết lòng trong công tác giảng dạy, tận tình cung cấp
nhiều kiến thức cần thiết trong suốt những năm học tại trường.
Em cũng gửi lời cảm ơn sâu sắc đến bác sỹ Nguyễn Ngọc Diệp và các
cán bộ phòng Chẩn đoán hình ảnh bệnh viện Đa Khoa Đồng Tháp, đến anh
Lục Thành Vũ, cán bộ phòng Chẩn đoán hình ảnh bệnh viện Nguyễn Trãi
thành phố Hồ Chí Minh đã cung cấp cho em những kiến thức y khoa và dữ
liệu hình ảnh cần thiết để em thực hiện đề tài này.
Trong quá trình thực hiện đề tài, không thể không kể đến sự giúp đỡ,
đóng góp ý kiến và những lời động viên hết mình của bạn bè xung quanh,
điều này thật sự đã giúp cho tôi rất nhiều. Xin chân thành cám ơn các bạn.
Và cuối cùng, con xin gửi đến ba mẹ và em trai của anh lòng biết ơn
vô bờ bến. Công lao dưỡng dục của ba mẹ, niềm tin mãnh liệt vào con và
những đêm thức trắng nơi quê nhà vì lo lắng cho con của ba mẹ đã giúp con
vượt qua được những giờ phút khó khăn nhất, khắc phục được những trở
ngại lớn lao nhất để hoàn thành đề tài này.
Thành phố Hồ Chí Minh, ngày 13 tháng 7 năm 2005
Ngụy Đức Thuận
1
Mở đầu
Theo [13], chấn thương là nguyên nhân tử vong hàng đầu ở trẻ em và
người trẻ (dưới 44 tuổi), trong đó chấn thương vùng đầu chiếm trên 50% các
ca tử vong, với di chứng nặng nề và chi phí y tế rất lớn.
Để chẩn đoán, theo dõi, tiên lượng chấn thương đầu thật nhanh chóng
và chính xác thì hình ảnh học ( gồm X quang, CT, MRI…) là dữ kiện cơ bản
và quan trọng. Trong số đó, CT là khảo sát hình ảnh được lựa chọn đầu tiên
và rất có giá trị trong đánh giá chấn thương sọ não, đặc biệt là chấn thương
sọ não cấp [13].
Việc đọc phim CT hiện nay chủ yếu là do các bác sĩ chuyên khoa
chẩn đoán hình ảnh thực hiện, với số ca mỗi ngày khá lớn. Với mỗi ca chấn
thương đầu, số lượng ảnh phải chụp tối thiểu là 20, và bác sĩ phải quan sát
qua tất cả các ảnh để tìm ra nhiều biểu hiện bất thường khác nhau. Từ những
lý do đó, nhận thấy nhu cầu cho một công cụ trợ giúp chẩn đoán tự động, hỗ
trợ các bác sĩ đưa ra những chẩn đoán chính xác và ít sai sót hơn. Điều này
cũng phù hợp với xu thế hiện này là áp dụng công nghệ thông tin vào mọi
lĩnh vực của đời sống, trong đó có lĩnh vực y khoa. Tuy vậy, cũng phải nhìn
nhận rằng đây là một vấn đề không hề dễ dàng, bởi vì bản thân các bác sĩ
chuyên khoa cũng gặp nhiều khó khăn khi phân tích hình ảnh của các ca
bệnh phức tạp. Vì vậy, mục tiêu của đề tài này chỉ mới dừng lại ở giai đoạn
khai phá, tìm hiểu và thử nghiệm xây dựng hệ thống cho một số loại tổn
thương tương đối đơn giản, cụ thể hơn là loại tổn thương xuất huyết và tụ
máu. Báo cáo gồm có 4 chương và 3 phụ lục:
• Chương 1: Giới thiệu chung – kiến thức tổng quan
Giới thiệu chung về đề tài.
• Chương 2: Cơ sở lý thuyết
Trình bày các vấn đề lý thuyết quan trọng.
• Chương 3: Xây dựng hệ thống
2
Mô tả cách xây dựng hệ thống và các cách áp dụng các vấn
đề lý thuyết đã nêu.
• Chương 4: Cài đặt, kết quả thử nghiệm
Cài đặt chương trình, sơ lược về cách sử dụng, các kết quả
thử nghiệm.
• Phụ lục A: Bệnh học
Sơ lược một số kiến thức y khoa về các tổn thương có liên
quan đến đề tài.
• Phụ lục B: Dữ liệu DICOM
Một số kiến thức về dữ liệu DICOM và xử lý tập tin
DICOM.
• Phụ lục C: Giải phẫu CT đơn giản
Giải phẫu các bộ phận của não dựa vào ảnh CT (ở mức độ
đơn giản).
3
Mục lục
Lời cảm ơn ..................................................................................................................1
Mở đầu ........................................................................................................................2
Mục lục........................................................................................................................4
Danh mục hình ảnh .....................................................................................................6
Danh mục bảng biểu....................................................................................................7
Bảng kí hiệu các chữ viết tắt .......................................................................................8
Chương 1 : Giới thiệu – kiến thức tổng quan..............................................................9
1.1 Xác định vấn đề và động cơ thúc đẩy ..........................................................9
1.2 Một số kiến thức cơ bản .............................................................................10
1.2.1 Nguyên lý tạo hình:.............................................................................10
1.2.2 Tạo hình ..............................................................................................10
1.2.3 Trị số đậm độ ......................................................................................11
1.2.4 Thay đổi đậm độ .................................................................................12
1.2.5 Đặt cửa sổ (Window setting) ..............................................................13
1.2.6 Độ dày lát cắt và khoảng cách lát cắt..................................................13
1.2.7 Hình định vị ........................................................................................14
1.3 Hệ thống .....................................................................................................15
1.4 Tiêu chuẩn đánh giá độ chính xác..............................................................18
1.4.1 Độ nhạy (sensitivity)...........................................................................18
1.4.2 Độ đặc trưng (specificity) ...................................................................18
1.4.3 Tỉ lệ vùng bệnh được phân lớp đúng ..................................................18
1.4.4 Tỉ lệ vùng bình thường được phân lớp đúng ......................................19
Chương 2 : Cơ sở lý thuyết .......................................................................................20
2.1 Phân đoạn ảnh ............................................................................................20
2.2.1 Lọc ngưỡng .........................................................................................21
2.2.2 Phương pháp dựa vào biên..................................................................23
2.2.3 Phương pháp dựa trên vùng ................................................................24
2.2.4 Phương pháp thống kê và Bayes.........................................................26
2.2.5 Phương pháp mạng nơ ron và logic mờ ..............................................26
2.3 Làm mảnh biên...........................................................................................27
2.4 Biểu diễn đường biên .................................................................................29
2.4.1 Biểu diễn bằng chain -code.................................................................29
2.4.2 Biểu diễn bằng dòng quét (scanline)...................................................31
2.5 Các đặc trưng mô tả vùng (đường kính, chu vi, diện tích…).....................32
2.5.1 Diện tích và chu vi ..............................................................................32
2.5.2 Khoảng cách xuyên tâm (radial distance)...........................................33
2.5.3 Chiều dài trục chính và phụ ................................................................34
2.6 Cây quyết định............................................................................................35
2.6.1 Giới thiệu về cây quyết định ...............................................................35
2.6.2 Thuật toán ID3 ....................................................................................38
2.7 Thông tin tương hỗ .....................................................................................43
4
2.8 Học dựa vào sự trình diễn ..........................................................................44
Chương 3 : Xây dựng hệ thống.................................................................................46
3.1 Phân đoạn đơn giản ....................................................................................46
3.2 Học dựa vào sự trình diễn ..........................................................................47
3.2.1 Hệ thống học .......................................................................................47
3.2.2 Đặc trưng vùng....................................................................................48
3.2.3 Phân lớp bằng thuật toán k-người láng giềng gần nhất ......................50
3.3 Dùng hệ luật để định vị vùng tổn thương...................................................51
3.3.1 Hệ luật đơn giản..................................................................................51
3.3.2 Hệ luật phức tạp ..................................................................................54
Chương 4 : Chương trình cài đặt – kết quả thử nghiệm............................................57
4.1 Chương trình cài đặt ...................................................................................57
4.1.1 Công cụ sử dụng .................................................................................57
4.1.2 Cấu trúc dữ liệu học............................................................................57
4.1.3 Chương trình .......................................................................................57
4.2 Đánh giá kết quả.........................................................................................60
4.2.1 Độ hiệu quả của giai đoạn phân lớp....................................................60
4.2.2 Đánh giá công việc..............................................................................61
4.2.3 Hướng phát triển trong tương lai ........................................................62
Tài liệu tham khảo.....................................................................................................63
Phụ lục.......................................................................................................................65
A. Bệnh học.........................................................................................................65
A.1 Tụ máu dưới màng cứng (Subdural Hematoma/SDH)...........................65
A.2 Tụ máu ngoài màng cứng (Epidural Hematoma/EDH)..........................66
A.3 Xuất huyết khoang dưới nhện (subarachnoid hemorrhage) ...................68
A.4 Xuất huyết trong não thất (intraventricular hemorrhage).......................69
A.5 Tụ máu trong não (intracerebral hematoma) ..........................................69
B. Dữ liệu DICOM .............................................................................................71
B.1 Giới thiệu ................................................................................................71
B.2 Cấu trúc chung của tập tin DICOM........................................................71
B.3 Một số thông tin cần thiết khi xử ảnh DICOM.......................................72
C. Giải phẫu CT đơn giản vùng trên lều.............................................................76
5
Danh mục hình ảnh
Hình 1-1: Hình định vị (topogram) ..........................................................................15
Hình 1-2: Mô hình hệ thống.....................................................................................16
Hình 2-1: Ảnh độ xám với: (a) 1 ngưỡng phân đoạn và (b) 2 ngưỡng phân đoạn ..22
Hình 2-2: Mặt nạ Sobel ............................................................................................23
Hình 2-3: Mặt nạ của toán tử Laplace......................................................................23
Hình 2-4: Ví dụ về thuật toán Region Growing.......................................................26
Hình 2-5: Lân cận 8 của điểm p1..............................................................................28
Hình 2-6: Chain code 4 hướng và 8 hướng..............................................................30
Hình 2-7: Ví dụ về biễu diễn đường biên bằng chain code lân cận 8 ......................30
Hình 2-8: Đường biên của một vùng và biểu diễn dòng quét của nó ......................31
Hình 2-9: Một số đặc trưng dùng để mô tả vùng.....................................................32
Hình 2-10: Trục chính và trục phụ hình ellipse. ......................................................35
Hình 2-11: Minh họa phương pháp của Hunt ..........................................................37
Hình 2-12: Một cây quyết định chọn nhiệt độ làm gốc ...........................................40
Hình 3-1: Ảnh CT qua bộ lọc thứ nhất, trong đó màu đỏ biểu diễn cho vùng bệnh48
Hình 3-2: Minh họa lát cắt đầu tiên vùng trên lều ...................................................53
Hình 3-3: Minh họa cách phân vùng các lát cắt giữa...............................................53
Hình 3-4: Hình minh họa lát cắt trên cùng (thùy đỉnh)............................................54
Hình 3-5: Ảnh phân vùng não với các tiêu chuẩn dừng khác nhau.........................56
Hình 4-1: Giao diện chính........................................................................................57
Hình 4-2: Màn hình học dựa vào sự trình diễn........................................................58
Hình 4-3: Chọn bệnh nhân .......................................................................................59
Hình 4-4: Dữ liệu về bệnh nhân đã được hiển thị. ..................................................59
Hình 4-5: Sau khi dò tìm vùng tổn thương ..............................................................60
Hình A-1: Tụ máu dưới màng cứng.........................................................................66
Hình A-2: Tụ máu ngoài màng cứng. ......................................................................67
Hình A-3: Xuất huyết khoang dưới nhện.................................................................68
Hình A-4: Xuất huyết trong não thất .......................................................................69
Hình A-5: Tụ máu trong não....................................................................................70
Hình C-1:Giải phẫu CT não đơn giản ......................................................................76
Hình C-2: Giải phẫu CT não đơn giản .....................................................................77
Hình C-3: Giải phẫu CT não đơn giản .....................................................................78
Hình C-4: Giải phẫu CT não đơn giản .....................................................................79
Hình C-5: Giải phẫu CT não đơn giản .....................................................................80
Hình C-6: Giải phẫu CT não đơn giản .....................................................................81
Hình C-7: Giải phẫu CT não đơn giản .....................................................................82
6
Danh mục bảng biểu
Bảng 1-1: Trị số đậm độ của các cấu trúc nội sọ ......................................................11
Bảng 2-1: Dữ liệu minh họa cho cây quyết định ......................................................37
Bảng 2-2: Thông tin phân bố thuộc tính quang cảnh................................................38
Bảng 2-3: Thông tin phân bố lớp của thuộc tính Độ ẩm...........................................39
Bảng 4-1: Độ chính xác của bộ phân lớp..................................................................61
Bảng A-1: Phân biệt tụ máu dưới màng cứng và ngoài màng cứng .........................68
Bảng B-2: Một số thẻ quan trọng..............................................................................73
Bảng B-3: Một số thẻ quan trọng..............................................................................74
Bảng B-4: Một số thẻ quan trọng..............................................................................74
7
Bảng kí hiệu các chữ viết tắt
DICOM Digital Imaging and Communications in Medicine
CT Computed Tomography
kNN k nearest neighbour
8
Chương 1 : Giới thiệu – kiến thức tổng quan
1.1 Xác định vấn đề và động cơ thúc đẩy
Năm 1972 G.N Hounsfield giới thiệu phương pháp chụp cắt lớp điện
toán (Computed Tomography Scanner – CT). Đây là kỹ thuật không xâm
lấn cho phép đánh giá tốt về bệnh lý hệ thần kinh trung ươn. Sự ra đời của
CT được xem là cuộc cách mạng trong chuẩn đoán hình ảnh. Đặc biệt, trong
bệnh lý chấn thương sọ não, CT chẩn đoán tốt các tổn thương nội sọ (tụ máu,
dập não, phù não…), chi tiết xương, khảo sát được các trường hợp bệnh nhân
cấp cứu (không nằm yên, mang trợ cụ hô hấp, tuần hoàn…) và có giá thành
rẻ. CT giúp đánh giá, theo dõi, tiên lượng, lập kế hoạch điều trị thích hợp cho
từng bệnh nhân.
Theo [13], có một số đặc điểm đáng lưu ý về chấn thương sọ não như
sau:
i. Chấn thương là nguyên nhân tử vong hàng đầu ở trẻ
em và người trẻ (dưới 44 tuổi), trong đó chấn thương
vùng đầu chiếm trên 50% các ca tử vong.
ii. Để lại di chứng nặng nề.
iii. Chi phí y tế lớn (83.5 tỉ dollars/năm hay 228 triệu
dollars/ngày ở Mỹ).
Để chẩn đoán, theo dõi, tiên lượng chấn thương đầu thật nhanh chóng
và chính xác thì hình ảnh học ( gồm X quang, CT, MRI…) là dữ kiện cơ bản
và quan trọng. Trong số đó, CT là khảo sát hình ảnh được lựa chọn đầu tiên
và rất có giá trị trong đánh giá chấn thương sọ não, đặc biệt là chấn thương
sọ não cấp [13].
Việc đọc phim CT hiện nay chủ yếu là do các bác sĩ chuyên khoa
chẩn đoán hình ảnh thực hiện, với số ca mỗi ngày khá lớn. Với mỗi ca chấn
thương đầu, số lượng ảnh phải chụp tối thiểu là 20, và bác sĩ phải quan sát
qua tất cả các ảnh để tìm ra nhiều biểu hiện bất thường khác nhau. Từ những
9
lý do đó, nhận thấy nhu cầu cho một công cụ trợ giúp chẩn đoán tự động, hỗ
trợ các bác sĩ đưa ra những chẩn đoán chính xác và ít sai sót hơn.
1.2 Một số kiến thức cơ bản
1.2.1 Nguyên lý tạo hình
CT dùng một chùm tia X với độ dày nhất định, quét qua lát cắt ngang
của vật thể, theo nhiều huớng khác nhau. Lượng tia X sau khi đi qua vật thể
được đo bằng các đầu dò (detectors). Dữ liệu thu nhận từ các đầu dò này sẽ
được máy tính xử lý và tạo hình.
1.2.2 Tạo hình
Các lát cắt ngang qua vùng cơ thể khảo sát, được phân thành nhiều khối
(block) nhỏ. Các khối riêng lẽ này gọi là các phần tử thể tích (voxel). Thành
phần độ dày của phần tử thể tích cùng với tính chất chùm tia X sẽ xác định
mức độ hấp thu tia X của các phần tử thể tích này (hình 1-1).
Các dữ liệu số về sự hấp thu tia X của các phần tử thể tích được máy
tính chuyển thành các độ xám khác nhau của các phần tử hình hay điểm ảnh
(pixel) tương ứng trên hình CT.
Hình 1-1: Phần tử thể tích (voxel)
10
1.2.3 Trị số đậm độ
Mỗi phần tử thể tích có trị số tương ứng với mức độ hấp thu tia của mô
và được biẻu thị bằng các độ xám khác nhau trên hình.Trị số mức độ hấp thu
tia X biểu thị bằng đơn vị Hounsfield (HU).
Theo qui ước của máy, các đậm độ cơ bản là:
Đậm độ của nước: 0 HU
Đậm độ của khí: -1000 HU
Đậm độ của xương: +1000 HU
Đậm độ của mỡ: -1000 HU
Các trị số đậm độ của các mô, dịch khác trong cơ thể sẽ được tính
theo tương ứng với các trị số trên.
Các cấu trúc vật chất hấp thụ tia X càng nhiều thì có độ Hounsfield
càng cao, trên hình có màu càng trắng và ngược lại. Ví dụ: xương, máu tụ có
màu trắng do hấp thụ tia X nhiều; ngược lại khí, mỡ, dịch não tuỷ có màu
đen. Điều này giống như các đậm độ trên hình X quang thông thường.
Cấu trúc Trí số giới hạn(HU)
Đóng vôi, xương 80-250
Xuất huyết, tụ máu 55-75
Chất xám 35-45
Chất trắng 20-30
Phù nề 10-20
Dịch não tuỷ 0-10
Nước 0
Mỡ <0-(-100)
Khí (-100)-(-1000)
Bảng 1-1: Trị số đậm độ của các cấu trúc nội sọ
11
1.2.4 Thay đổi đậm độ
Thay đổi đậm độ biểu hiện sự khác biệt tương đối về đậm độ của vùng
chúng ta lưu ý với cấu trúc bình thường. Các từ diễn tả đậm độ khi mô tả:
- Giảm đậm độ (Hypodense)
- Đồng đậm độ (Isodense)
- Tăng đậm độ (Hyperdense)
Các từ giảm, đồng và tăng đậm độ sẽ tương ứng với các vùng có màu
đen hơn, ngang bằng và trắng hơn so với vùng được so sánh
Ví dụ:
- Xuất huyết trong não có đậm độ cao
- Vùng phù có đậm độ thấp
- Tụ máu dưới màng cứng bán cấp đồng đậm độ với chất xám…
Các hình tăng đậm độ trên CT sọ não có thể là các đóng vôi bình
thường (như màng cứng,tuyến tùng,đám rối mạch mạc…) hoặc các đóng vôi
bất thường (trong u, tổn thương cũ…), xuất huyết, các cấu trúc protein cao,
hoặc mật độ tế bào cao (một số u não).
Các hình giảm đậm độ thường gặp trên CT sọ não bình thường (như
dịch não tuỷ, mỡ hốc mắt, khí trong xoang) hoặc bất thường (như phù não,
dịch trong các nang, mỡ trong u, khí nội sọ trong chấn thương).
Cũng cần lưu ý rằng khối máu tụ cấp tính ở bệnh nhân chấn thương sọ
não thuờng có đậm độ cao hơn nhu mô não. Đậm độ khối máu tụ liên quan với
nồng độ hemoglobin, hematocrit, protein máu, tình trạng đông máu. Trong một
số trường hợp, do có sự thay đổi các yếu tố trên (hematocrit, protein thấp…),
khối máu tụ cấp có thể có đậm độ ngang với nhu mô não.
Theo thời gian, khối máu não sẽ giảm đậm độ dần, trung bình
1.5HU/ngày. Do đó, máu tụ bán cấp hay mãn tính sẽ đồng hay giảm đậm độ so
với nhu mô não.
12
1.2.5 Đặt cửa sổ (Window setting)
Trị số đậm độ của các mô khác nhau trong cơ thể thay đổi từ -
1000HU đến +1000HU, các trị số này được biểu hiện trên hình bằng các độ
xám khác nhau. Tuy nhiên mắt thường của chúng ta không thể phân biệt được
khác biệt tất cả các độ xám này, để phân biệt, phải thay đổi cửa sổ, nhằm tạo
tương phản giúp mắt thường nhận biết được. Có hai thông số đặt cửa sổ là độ
rộng cửa sổ(window width) và trung tâm cửa sổ (window level/centre).Viết tắt
trên phim là:W/L hay W/C
Độ rộng cửa sổ: là khoảng độ Hounsfield mà ta muốn xem. Các cấu trúc
có độ đậm phía trên giới hạn này sẽ có màu trắng, dưới giới hạn này sẽ có màu
đen.
Trung tâm cửa sổ: Là điểm giữa của độ rộng cửa sổ, có độ Hounsfield
thường gần bằng với cấu trúc mà ta quan sát.
Ví dụ: Để khảo sát sọ não chúng ta có thể đặt 2 cửa sổ:
1.Cửa sổ nhu mô: Độ rộng cửa sổ 140 HU (từ -200 HU đến +110HU),
trung tâm cửa sổ 40HU, giúp ta phân biệt được cấu trúc nội sọ như chất xám,
chất trắng, dịch não tuỷ, mạch máu.
2.Cửa sổ xương: Độ rộng cửa sổ 1200HU (từ -200 HU đến +1000 HU),
trung tâm cửa sồ là +400HU. Với cửa sổ này,ta không phân biệt đựoc chất
trắng chất xám hay dịch não tuỷ mà chỉ phân biệt được giữa xương, khí, mô
mềm.
Chúng ta có thể thay đổi cửa sổ hẹp hoặc rộng hơn để phân biệt rõ các
khác biệt đậm độ. Ví dụ khi khảo sát tụ máu dưới màng cứng lớp mỏng, sát
bản sọ, đồng đậm độ vỏ nảo…..
1.2.6 Độ dày lát cắt và khoảng cách lát cắt
Độ dày lát cắt: là độ dày của lát cắt khảo sát (tương ứng với độ mở của
bộ chuẩn trực/colimator ở đầu đèn).
13
Khoảng cách lát cắt: Là khoảng cách giữa các lát cắt (tương ứng với
khoảng di chuyển của bàn bệnh nhân).
Độ dày lát cắt thường được thể hiện trực tiếp ở các thông số trên hình.
Còn khoảng cách các lát cắt cũng được thể hiện trên hình
Từ hai khái niệm này, kỹ thuật khảo sát CT sẽ có các kiểu cắt như sau:
- Cắt liên tục (continuity) khi độ dày lát cắt bằng khoảng cách
lát cắt.
- Cắt chồng (overlap) khi độ dày lát cắt lớn hơn khoảng cách
lát cắt.
- Cắt hở (gap) khi độ dày lát cắt nhỏ hơn khoảng cách lát cắt.
Trong bệnh lý chấn thương sọ não, thường khảo sát bằng các lát cắt liên
tục, từ lỗ chẩm lên đến vòm sọ.
1.2.7 Hình định vị
Hình định vị (topogram, scout view) [hình 1-1] là hình dùng để xác
định các vị trí lát cắt. Ở hình định vị có các đường được đánh số và đặt chồng
lên vùng cơ thể khảo sát. Các số được đánh dấu cúa các đường này sẽ tương
ứng với các số của các hình hay lát cắt trình bày trên phim CT.
Ta có thể dùng hình định vị để quan sát nhanh các lát cắt nào cần xem
trên phim CT. Hoặc ngược lại, xác định bất thường trên lát cắt CT nằm ở vị trí
nào trên hình định vị
Ví dụ: Ta chỉ muốn quan sát tổn thương ở vùng đỉnh. Ta thấy trên hình
định vị, ở vùng đỉnh, có các đường số đánh số 10,11,12; như vậy, ta chỉ cần
xem các hình 10,11,12 trên phim CT.
14
Hình 1-1: Hình định vị (topogram)
1.3 Hệ thống
Trước hết, phải nhận xét rằng phân tích các chấn thương sọ não cấp
trong ảnh CT một cách tự động là một vấn đề không hề dễ dàng. Hầu hết các
nghiên cứu trong lĩnh vực này tập trung phần lớn vào việc phân đoạn ảnh để
phục vụ cho bài toán xây dựng mô hình 3-D của não. Qua tìm kiếm trên các tạp
chí chuyên về khoa học máy tính, em không tìm được một mô hình khả dĩ cho
vấn đề này. Chính vì vậy, mục tiêu xác định cho đề tài này chỉ nằm ở mức xây
dựng thử nghiệm một hệ thống dùng để chẩn đoán những chấn thương dễ phát
hiện, với những giới hạn sau:
i. Chỉ khảo sát ở những ảnh chụp nằm ở vùng trên lều (do các
lát cắt ở vùng dưới lều có thành phần khá phức tạp).
ii. Khảo sát tổn thương nội sọ, chủ yếu tập trung vào tổn thương
xuất huyết, tụ máu.
iii. Chọn lựa những hình ảnh đạt chất lượng tốt (không bị xảo
ảnh).
Các kết quả được nhắm tới gồm có:
15
i. Phát hiện chính xác vùng tổn thương (không sót, không phát
hiện lầm).
ii. Xác định các thông số định lượng về vùng tổn thương đó.
iii. Xác định vị trí vùng tổn thương trong não (ví dụ như thuộc
vùng đỉnh, chẩm, thái dương…)
iv. Kết quả: đưa ra mô tả hình ảnh về vùng tổn thương.
Với dữ liệu đầu vào là ảnh CT lưu dưới định dạng DICOM, mô hình hệ
thống như sau:
Hình 1-2: Mô hình hệ thống
Giai đoạn tiền xử lý bao gồm các công việc như: đọc thông tin về bệnh
nhân, thông tin về các lát cắt được chụp (độ dày, kích thước, vị trí…), lọc ra
biên của sọ dùng làm mốc định vị cho các module sau, chuyển dữ liệu ảnh
Hounsfield (xem phụ lục) thành ảnh độ xám…
16
Sau khi rút ra được các thông tin cần thiết, ta sẽ tiến hành bước khảo sát,
phân tích ảnh. Trước tiên, các lát cắt sẽ được cho qua bộ lọc đơn giản. Nhiệm
vụ của bộ lọc này là tìm ra những vùng có độ đo Hounsfield nằm trong
ngưỡng của tổn thương đang được dò tìm (các ngưỡng này được xác định
dựa vào tri thức của các chuyên gia, vốn được nêu ra trong tất cả các tài liệu
về chẩn đoán hình ảnh CT). Mục tiêu ưu tiên của bước này là không sót, tức
là có thể có nhiều vùng bị xác định nhầm. Như ta sẽ thấy, do bị ảnh hưởng
của hiệu ứng thể tích từng phần, những vùng như vậy là khá nhiều.
Nhiệm vụ của module tiếp theo chính là để loại ra những vùng bị phát
hiện nhầm đó. Ở đây ta sử dụng thuật toán k-người láng giềng gần nhất để
tạo bộ phân lớp. Vấn đề quan trọng nhất để xây dựng bộ phân lớp là phải có
dữ liệu học, mà hiện nay chưa có một bộ dữ liệu học nào được tạo ra cho
mục đích này (hầu hết các nghiên cứu đều sử dụng dữ liệu tự tạo, với kích
thước khá nhỏ hoặc dùng các bộ giả lập để tạo dữ liệu ảo). Hơn nữa, dữ liệu
học có sẵn thường thiếu những thông tin cần thiết trong khi lại thừa những
thông tin không cần thiết. Để giải quyết vấn đề này, ta sẽ sử dụng phương
pháp học bằng sự trình diễn: xây dựng một công cụ giao tiếp trực tiếp với
chuyên gia để tạo dữ liệu học. Kết quả của bộ lọc thứ nhất sẽ được hiển thị,
và các chuyên gia (bác sĩ chẩn đoán hình ảnh), bằng tri thức và kinh nghiệm
của mình, sẽ quyết định xem vùng nào sẽ bị loại bỏ và vùng nào sẽ được giữ
lại. Thông tin về các vùng đó sẽ được lưu lại để làm dữ liệu học cho bộ phân
lớp. Có thể xem đây là một áp dụng của phương pháp học dựa vào sự trình
diễn vào lĩnh vực xử lý ảnh.
Sau khi loại bỏ các vùng bị nhận dạng nhầm, ta sẽ tiến hành đo các
thông tin định tính về vùng đó, sau đó sử dụng hệ luật để định vị vùng tổn
thương đó trong não. Do vấn đề thời gian nghiên cứu, hệ luật này chỉ mới
được xây dựng ở mức độ đơn giản, dựa vào các quan sát trên hình ảnh và
tiêu bản não. Bên cạnh đó, ý tưởng về một hệ thống xây dựng dữ liệu học chi
tiết hơn cho vấn đề định vị cũng được đề xuất.
17
Cuối cùng, dựa vào các thông tin trên, hệ thống sẽ tổng hợp, đưa ra mô
tả hình ảnh về tổn thương (vị trí, kích thước, biểu hiện hình ảnh…) và kết
luận bệnh.
1.4 Tiêu chuẩn đánh giá độ chính xác
Ta sẽ dùng một số tiêu chuẩn để đánh giá độ chính xác của giai đoạn
phát hiện vùng bệnh, cụ thể hơn là ở bộ phân lớp dùng thuật toán k-người
láng giềng gần nhất . Đối với bước định vị vùng tổn thương, do không có
những độ đo định lượng thích hợp nên ta sẽ chỉ đưa ra một số nhận xét chung.
Gọi:
TP là số vùng bệnh được phân lớp đúng.
FP là số vùng bình thường bị xác định sai là có bệnh.
TN là số vùng bình thường được phân lớp đúng.
FN là số vùng bệnh bị xác định sai là không có bệnh.
Ta xét các độ đo sau:
1.4.1 Độ nhạy (sensitivity)
Độ nhạy cho ta biết xác suất phát hiện đúng vùng bị tổn thương thật sự:
FNTP
TPySensitivit +=
%100*
1.4.2 Độ đặc trưng (specificity)
Độ đặc trưng cho biết xác suất phân lớp đúng các vùng không bị tổn
thương.
FPTN
TNySpecificit +=
%100*
1.4.3 Tỉ lệ vùng bệnh được phân lớp đúng
Đại lượng này cho ta biết tỉ lệ vùng bệnh thật sự trong số những vùng
được xác định bởi hệ thống.
18
FPTP
TPPP +=
%100*%
1.4.4 Tỉ lệ vùng bình thường được phân lớp đúng
Đại lượng này cho ta biết tỉ lệ vùng không bị tổn thương thật sự trong
số những vùng đã được bộ phân lớp kNN loại bỏ.
FNTN
TNNP +=
%100*%
19
Chương 2 : Cơ sở lý thuyết
2.1 Phân đoạn ảnh
Theo [4, 14], phân đoạn thường là công đoạn đầu tiên được thực hiện
trong xử lý ảnh. Mục đích của phân đoạn là để dò ra và xác định những vùng
nào của ảnh cần được nhóm chung với nhau theo một tiêu chuẩn nào đó. Ảnh
sau khi phân đoạn cần thỏa mãn yêu cầu sau: các phân đoạn rời nhau, mỗi
vùng mang tính đồng nhất (theo tiêu chuẩn phân đoạn) và hợp của bất kì 2
phân đoạn liền kề nhau nào cũng sẽ phá vỡ tính đồng nhất của chúng. Mức
độ phân đoạn phụ thuộc vào vấn đề đang giải quyết, và thường kết thúc khi
đối tượng cần quan tâm đã được cô lập. Nói chung, phân đoạn ảnh một cách
tự động là một trong những công việc khó khăn nhất trong xử lý ảnh, quyết
định đến sự thành công hay thất bại của toàn bộ công việc phân tích ảnh.
Cách tiếp cận thường thấy nhất là lựa chọn một bộ lọc sao cho có thể làm nổi
bật lên các đối tượng cần quan tâm đồng thời loại bỏ những thành phần
không liên quan.
Cho đến nay, mặc cho rất nhiều thuật toán đã được đề xuất nhưng
phân đoạn vẫn còn là một vấn đề thu hút nhiều qua tâm nghiên cứu. Nhiều
khảo sát trước đây đã cho thấy rằng không có một phương pháp nào có thể
hoạt động tốt cho mọi ứng dụng. Vì đối tượng được quan tâm ở đây là ảnh
CT nên chúng tôi sẽ hạn chế tìm hiểu, trình bày những phương pháp phân
đoạn đã được phát triển cho riêng ảnh độ xám. Fu và Mui [4] đã phân các
thuật toán này thành 3 nhóm:
1. Các phương pháp dựa trên ngưỡng (threshold-based).
2. Các phương pháp dựa trên biên (edge-based).
3. Các phương pháp dựa trên vùng (region-based).
thêm vào đó là 2 phương pháp khác cũng thường được sử dụng:
4. Phương pháp thống kê và Bayes.
5. Phương pháp dựa trên mạng nơ ron và logic mờ.
20
2.2.1 Lọc ngưỡng
Lọc ngưỡng là một trong những cách tiếp cận đơn giản, quen thuộc và
quan trọng nhất trong việc phân đoạn ảnh. Phương pháp này có thể được
thực hiện dựa vào những thông tin toàn cục như histogram hoặc thông tin
cục bộ như ma trận đồng hiện. Nếu một giá trị ngưỡng được áp dụng cho
toàn bộ tấm ảnh thì ngưỡng đó được gọi là ngưỡng toàn cục. Ngược lại,
trong trường hợp giá trị ngưỡng được xác định riêng cho mỗi vùng con, ta có
ngưỡng cục bộ (hay ngưỡng thích nghi). Các phương pháp lọc ngưỡng còn
có thể được phân thành 2 nhóm: nhóm đơn ngưỡng và nhóm đa ngưỡng.
Phương pháp đơn ngưỡng có tác dụng phân chia bức ảnh thành 2 vùng: đối
tượng cần quan tâm và nền (background). Cũng vì lí do này mà phương pháp
đơn ngưỡng có thể được xem là một dạng của phương pháp phân lớp 2 lớp.
Cơ sở của phương pháp phân đoạn dựa trên ngưỡng như sau: khi một
ảnh độ xám bao gồm nhiều vùng phân biệt, histogram của nó thường sẽ có
nhiều đỉnh phân biệt nhau, mỗi đỉnh ứng với một vùng và giữa 2 đỉnh liền kề
nhau thường là một “thung lũng” sâu. Đáy của thung lũng này có thể được
chọn để làm ngưỡng phân biệt giữa 2 vùng kề nó.
Xét ảnh có histogram như trong hình 2.1, trong đó ta kí hiệu f(x,y) là
độ xám của điểm (x,y). Có thể hình dung (a) là ảnh gồm một đối tượng sáng
trên nền tối, và do đó histogram sẽ bao gồm 2 đỉnh rõ rệt. Rõ ràng là ta có thể
tách đối tượng ra khỏi nền bằng cách chọn một ngưỡng T sao cho chia cách
được 2 đỉnh này. Khi đó, mọi điểm f(x,y) nhỏ hơn T sẽ được xem là nền,
trong khi những điểm có độ xám lớn hơn T sẽ được cho là thuộc về đối
tượng. Hình 2-1(b) cho ta một trường hợp phức tạp hơn: histogram gồm có 3
đỉnh (chẳng hạn như 2 đối tượng sáng trên một nền màu tối). Tương tự như
trên, ta có thể chọn 2 ngưỡng T1 và T2 để phân biệt 2 đối tượng trên và nền.
Mặc dù vậy, phương pháp đa ngưỡng này kém tin cậy hơn so với trường hợp
đơn ngưỡng. Lí do là vì ta rất khó xác lập được nhiều ngưỡng sao cho chúng
21
có thể cô lập thật hiệu quả tất cả các vùng cần quan tâm, đặc biệt là khi số
lượng các đỉnh trong histogram tương ứng khá nhiều.
Hình 2-1: Ảnh độ xám với: (a) 1 ngưỡng phân đoạn và (b) 2 ngưỡng phân đoạn
Về mặt hình thức, phép lọc ngưỡng có thể được xem như là một phép
thử của hàm T có dạng:
T = T[x, y, p(x,y), f(x,y)]
trong đó f(x,y) là độ xám của điểm (x,y), p(x,y) tượng trưng cho một đặc
điểm cục bộ nào đó của điểm (x,y), ví dụ như trung bình độ xám của 4 điểm
xung quanh (x,y) (lân cận 4 của (x,y)). Kết quả của phép lọc ngưỡng là một
ảnh g(x,y) thỏa:
⎩⎨
⎧
≤
>=
Tyxfif
Tyxfif
yxg
),(0
),(1
),(
trong đó 1 tượng trưng cho một giá trị độ xám nào đó mà ta muốn gán cho
đối tượng, và 0 ứng với độ xám gán cho nền.
Khi T chỉ phụ thuộc vào f(x,y), ta có ngưỡng toàn cục (hình 2-1 (a)).
Nếu T phụ thuộc vào cả f(x,y) và p(x,y), ta có ngưỡng cục bộ. Thêm nữa,
nếu T phụ thuộc vào tọa độ của x và y, ta có ngưỡng động.
22
2.2.2 Phương pháp dựa vào biên
Phương pháp phân đoạn dựa vào biên giả định rằng tại các biên vùng
sẽ xảy ra sự thay đổi đột ngột của độ xám. Nhiều phương pháp đã được đề
xuất nhằm tìm ra các biên trong ảnh. Một trong những phương pháp quen
thuộc nhất là sử dụng toán tử gradient (tương ứng với mặt nạ Sobel như
trong hình 2-2), hoặc toán tử Laplace (tương ứng với mặt nạ trong hình 2-3).
Hình 2-2: Mặt nạ Sobel
Hình 2-3: Mặt nạ của toán tử Laplace
Kĩ thuật phân đoạn dựa vào biên không cho được kết quả tốt như
mong đợi, lý do là vì thao tác tìm biên thường liên quan đến các phép toán vi
phân (như 2 toán tử Gradient và Laplace đã nói ở trên), vốn rất nhạy cảm đối
với nhiễu. Như vậy, cách tiếp cận dựa trên đường biên không phải sự lựa
chọn tốt cho bài toán phân đoạn ảnh.
23
2.2.3 Phương pháp dựa trên vùng
Phương pháp phân đoạn dựa trên vùng sử dụng các thuật toán region-
growing để thực hiện phân đoạn ảnh. Thuật toán region-growing bắt đầu từ
một hoặc nhiều điểm hạt giống (seed point) và sau đó lan rộng ra bằng cách
kết hợp với các điểm lân cận nó theo một tiêu chuẩn tương tự nào đó. Nếu
các điểm liền kề nhau là tương tự so với điểm hạt giống, nó sẽ được đánh
dấu thuộc về vùng có điểm hạt giống đó. Quá trình tiếp diễn cho đến khi mọi
điểm ảnh đều được gán vào một vùng nào đó. Nhiều thuật toán đã được đề
xuất cho cách tiếp cận này, trong đó có thể kể đến phương pháp của Chang
và Li [3]. Phương pháp của hai ông có tên gọi là phân đoạn thích nghi nhanh.
Thuật toán chia ảnh thành nhiều vùng nhỏ vốn có một điểm tương đồng nào
đó.. Các vùng nhỏ này sẽ được kiểm tra theo tiêu chuẩn tương tự. Nếu tiêu
chuẩn này thỏa, các vùng này sẽ được nối lại để hình thành vùng lớn hơn.
Quá trình cứ tiếp tục cho đến khi không thể thực hiện được nữa.
Rõ ràng trong hướng tiếp cận này, có thể thấy việc chọn lựa điểm hạt
giống là rất quan trọng, và có thể được thực hiện thủ công hoặc tự động. Một
ví dụ cho trường hợp chọn điểm hạt giống một cách tự động là dựa vào các
đỉnh của histogram.
Xét ví dụ minh họa sau (hình 2-4a: một ảnh kích thước 6*6, trong đó
con số trong mỗi ô chỉ độ xám của ô đó. Với điểm hạt giống bắt đầu là điểm
có tọa độ (3,3) cùng tiêu chí “trị tuyệt đối của độ xám 2 điểm kề nhau không
vượt quá 3”. Đầu tiên, điểm hạt giống được đưa vào vùng. Tiếp theo đó, nó
kiểm tra tất cả các điểm lân cận với điều kiện đã nêu, và đưa những điểm
thỏa vào vùng (hình 2-4b). Những điểm vừa được bổ sung sẽ trở thành điểm
hạt giống mới, và quá trình tiếp tục cho đến khi không còn có thêm điểm nào
được thêm vào nữa (hình 2-4c).
24
(a)
(b)
25
Hình 2-4: Ví dụ về thuật toán Region Growing
(a) ảnh ban đầu, (b) sau khi qua bước lan vùng thứ 1, (c) kết quả cuối cùng
2.2.4 Phương pháp thống kê và Bayes
Phương pháp thống kê và Bayes sử dụng “không gian đặc trưng” để
phân đoạn ảnh. Phương pháp này chuyển thông tin điểm ảnh thành không
gian đặc trưng và tiến hành phân đoạn bằng cách sử dụng các tính chất xác
suất của chúng. Phương pháp xác suất thu hút nhiều quan tâm của các nhà
nghiên cứu vì chúng cho phép thực hiện các phân tích toán học cho bài toán
phân đoạn thay cho những phương pháp sử dụng heuristic đã trình bày phía
trên.
Khuyết điểm lớn nhất của cách tiếp cận dựa trên thống kê và Bayes là
độ phức tạp tính toán của chúng khá lớn. Một khó khăn khác nữa là chúng
đòi hỏi một mô hình ảnh ngẫu nhiên (stochastic image model) tốt, vốn rất
khó đạt được.
2.2.5 Phương pháp mạng nơ ron và logic mờ
Mọi hệ thống thị giác đều cần có tốc độ nhanh, mạnh mẽ, ít nhạy cảm
với nhiễu cũng như những sai sót khác ở một mức độ hợp lí. Đó chính là
26
mục tiêu chính của phương pháp phân đoạn dùng mạng nơ ron và lý thuyết
tập mờ. Nhiều nghiên cứu đã dùng mạng nơ ron vào công việc phân đoạn
ảnh, chẳng hạn trong [4]. Ông đã sử dụng mạng nơ ron 3 lớp, trong đó số nút
ở lớp nhập được xác định theo số đặc trưng được rút ra cho mỗi pixel, số nút
xuất ứng với số phân vùng của ảnh. Mạng nơ ron nhiều lớp cũng đã được
dùng để phân đoạn ảnh nhiễu. Các trọng số được cập nhật sao cho chúng có
thể làm giảm được độ mờ của hệ thống. Như vậy, cách tiếp cận này nhằm
mục đích kết hợp các ưu điểm của tập mờ (suy luận dựa trên tính không
chính xác/không hoàn chỉnh của tri thức) và ưu điểm của mạng nơ ron.
2.3 Làm mảnh biên
Làm mảnh biên là một bước quan trọng và cần thiết trong nhiều bài
toán. Chẳng hạn, trong vấn đề mà ta đang xem xét, có một yêu cầu đặt ra là
tìm ra đường biên (và chỉ cần đường biên mà thôi) của sọ để làm mốc và tạo
thuận lợi cho việc định vị những vùng khác trong não. Nói chung, các thuật
toán làm mảnh sẽ liên tục xóa những điểm ở biên trong vùng đang quan tâm
theo 3 ràng buộc sau đây:
i. Không xóa những điểm cuối.
ii. Không làm mất tính liên tục của vùng.
iii. Không làm vùng đang xét bị rỗng quá mức.
Sau đây là một thuật toán quen thuộc dùng để làm mảnh. Không mất
tính tổng quát, có thể giả sử rằng các điểm thuộc đối tượng đang xét có giá
trị bằng 1 và các điểm nền có độ xám bằng 0. Ta gọi một điểm là điểm biên
(contour point) nếu điểm đó có giá trị 1 và một trong 8 điểm lân cận của nó
có giá trị bằng 0 (hình 2-4). Quá trình thực hiện gồm 2 bước, bước 1 như sau:
(a) 6)(2 1 ≤≤ pN
(b) S(p1) = 1
(c) p2 * p4 * p6 = 0
(d) p4 * p6 * p8 = 0
27
trong đó N(p1) là tổng số điểm lân cận khác 0 của p1:
N(p1) = p2 + p3 + … + p8 + p9
Hình 2-5 :Lân cận 8 của điểm p1
Và S(p1) là số lần chuyển từ 0 sang 1 trong chuỗi (theo đúng thứ tự)
p2, p3, …, p7, p8, p2.
Ở bước 2, ta giữ nguyên 2 điều kiện (a) và (b), nhưng thay (c) và (d)
bằng (c’) và (d’) sau:
(c’) p2 * p4 * p8 = 0
(d’) p2 * p6 * p8 = 0
Bước 1 được áp dụng cho tất cả mọi điểm biên trong vùng đang xét.
Nếu có ít nhất 1 trong 4 điều kiện (a) – (d) bị vi phạm, ta giữ nguyên giá trị
điểm ảnh đó. Ngược lại, ta đánh dấu điểm ảnh đó và sau này nó sẽ bị xóa.
Lưu ý rằng ta chỉ xóa điểm ảnh khi tất cả các điểm biên đã được duyệt qua,
nhờ vậy dữ liệu không bị thay đổi trong quá trình xử lý. Sau khi thực hiện
xong bước 1, ta xóa tất cả các điểm đã đánh dấu và thực hiện tiếp bước 2
giống như đã thực hiện cho bước 1. Như vậy, quá trình thực hiện là một vòng
lặp liên tục gồm các giai đoạn sau:
i. Áp dụng bước 1 để đánh dấu điểm cần xóa.
ii. Xóa các điểm đã đánh dấu.
iii. Áp dụng bước 2 để đánh dấu điểm.
iv. Xóa các điểm đã được đánh dấu.
Thuật toán dừng khi không còn điểm nào được xóa nữa.
Điều kiện (a) bị vi phạm khi điểm biên p1 có 1 hoặc 7 điểm lân cận có
giá trị 1. Trường hợp 1 điểm lân cận đồng nghĩa với việc p1 là điểm cuối, và
28
do đó không thể xóa được. Tương tự, trong trường hợp p1 có 7 điểm lân cận,
nếu ta xóa nó sẽ gây ra lỗ hổng trong vùng đang xét. Điều kiện (b) không
thỏa khi điểm đang xét nằm trên vùng biên có độ dày bằng 1, và do đó nếu
xóa nó sẽ làm mất tính liên tục của đối tượng.
2.4 Biểu diễn đường biên
Cách lưu trữ ảnh thô thường thấy nhất là lưu trữ theo dạng ma trận.
Đây là lưu trữ chứa đựng được nhiều thông tin nhất (dù thông tin đó ở dạng
tiềm ẩn hoặc tường minh). Tuy vậy, trong trường hợp cần biểu diễn đường
biên của một đối tượng, phương pháp trên sẽ có những bất tiện như tốn nhiều
bộ nhớ và không thuận lợi cho xử lý. Trong phần dưới đây, ta sẽ tìm hiểu 2
phương pháp lưu trữ đường biên khá hiệu quả và có sử dụng trong chương
trình.
2.4.1 Biểu diễn bằng chain -code
Cách biểu diễn này dựa trên lân cận 4 và lân cận 8 của một điểm. Tùy
theo vị trí tương đối của một điểm so với điểm hiện tại mà hướng của nó sẽ
được mã hóa bằng 1 con số tương ứng như trong hình 2-5. Để xây dựng chain
code của một đường biên, trước hết ta cần chọn 1 điểm khởi đầu, ví dụ như
điểm ở góc trái trên của ảnh. Sau đó, ta duyệt lần lượt qua tất cả các điểm theo
chiều ngược chiều kim đồng hồ, gán mã cho nó theo một trong 2 kiểu trong
hình 2-5. Lấy ví dụ như trong hình 2-6, chain code tương ứng của nó là 5-6-5-
5-6-7-0-0-0-1-7-1-2-1-3-3-4-4-3.
29
Hình 2-6: Mã tương ứng với hướng của (a) chain code 4 hướng và (b) chain code 8 hướng
Hình 2-7: Ví dụ về chain code của đường biên, ở đây ta dùng chain code lân cận 8
Chain code tỏ ra rất hữu dụng khi dùng để xác định hướng của đường
biên tại một điểm, hoặc dùng để tính chu vi của vùng (xem 2.5.1). Tuy vậy,
nếu xét trong vấn đề mà chúng ta đang bàn, cách biểu diễn này không phù
hợp. Lí do là vì với cách biểu diễn này, thật khó có thể rút ra được các thông
tin cần thiết cho quá trình xử lý, chẳng hạn như khoảng cách từ một điểm
đến đường biên.
30
2.4.2 Biểu diễn bằng dòng quét (scanline)
Nguyên tắc tắc rất đơn giản: xem mỗi đối tượng là một tập hợp các dòng,
và thay vì lưu tất cả các điểm trong mỗi dòng, ta chỉ cần lưu chỉ số của dòng
đó, cùng với điểm bắt đầu và kết thúc tương ứng trong dòng.
Ví dụ: Xét ảnh trong hình 2-7, biểu diễn đường biên của nó theo dòng
quét của nó là:
1 5,6
2 4,7
3 3,8
4 3,9
5 4,7 7,9
6 4,6 8,8
7 5,5
Hình 2-8: Vùng và biểu diễn dòng quét của nó
31
Nhận thấy rằng cách biểu diễn này đã khắc phục những bất lợi của
phương pháp chain code, và đem đến cho ta những thuận lợi trong các phép
xử lý sau (vốn được sử dụng thường xuyên trong bài):
i. Tính diện tích vùng.
ii. Xác định một điểm là nằm trong hay ngoài vùng.
iii. Dễ dàng duyệt qua toàn bộ các điểm trong vùng.
2.5 Các đặc trưng mô tả vùng (đường kính, chu vi, diện tích…)
Trong phần này ta tìm hiểu về một số đặc trưng thường được dùng để
mô tả vùng. Các đặc trưng này rất hữu dụng cho việc phân lớp vùng và cung
cấp nhiều thông tin quan trọng để so sánh và phân lớp vùng trong ảnh nhị
phân. Hình 2-8 mô tả một vùng ảnh nhị phân điển hình.
Hình 2-9: Một số đặc trưng dùng để mô tả vùng
2.5.1 Diện tích và chu vi
Diện tích và chu vi là 2 trong số những đặc trưng được sử dụng nhiều
nhất cho những bài toán phân lớp trong ảnh nhị phân. Diện tích của một
vùng tương ứng với tổng số điểm ảnh thuộc vùng đó. Tương tự, chu vi của
vùng nhị phân bằng tổng số điểm ảnh nằm trên đường biên của vùng. Đối
với biên ảnh xác định bằng lân cận 4, ta có thể xuất phát từ một điểm tùy ý
32
trên biên, đếm tất cả các điểm dọc theo đường biên cho đến khi trở về điểm
ban đầu. Tuy vậy, vấn đề sẽ phát sinh nếu đường biên được tạo xác định
bằng lân cận 8. Khi đó, khoảng cách giữa 2 điểm kề nhau không phải lúc nào
cũng bằng 1 nữa, mà sẽ là 2 . Khi đó, ta có thể sử dụng cách mô tả đường
biên bằng chain code. Gọi Ne và No lần lượt là tổng số số chẵn và lẻ có trong
chuỗi (theo phần 2.4.1, số chẵn ứng với trường hợp 2 điểm liên tiếp cùng cột
hoặc cùng dòng, còn số lẻ ứng với trường hợp 2 điểm nằm theo đường chéo),
ta ước lượng chu vi theo công thức sau:
Chu vi = Ne + No 2
2.5.2 Khoảng cách xuyên tâm (radial distance)
Khoảng cách xuyên tâm là khoảng cách Euclide giữa tâm khối lượng
của vùng và tâm của hợp tất cả các vùng trong ảnh. Cách đơn giản nhất để
ước lượng tâm vùng là dùng giá trị trung bình của tọa độ các điểm của vùng
đó. Đối với ảnh nhị phân, ta có thể tính tâm khối lượng bằng cách dùng
moment. Moment (i,j) của vùng R được định nghĩa như sau:
∑∑=
x y
ji
ij yxRyx ),(μ
trong đó x và y là tọa độ của các điểm ảnh trong vùng. Khi đó, tâm khối
lượng có thể được tính như sau:
00
10
μ
μ=x
00
01
μ
μ=y
Khoảng cách xuyên tâm có thể được tính bằng cách sử dụng khoảng
cách Euclide de giữa tâm khối lượng của hợp tất cả các vùng và của vùng
đang xét theo công thức sau:
22 )()(),( lrlre yyxxurd −+−=
trong đó r và u tương ứng là vùng đang xét và vùng tổng hợp.
33
Bên cạnh đó, ta có thể sử dụng khoảng cách xuyên tâm chuẩn hóa
u
e
R
urd ),( , trong đó Ru là bán kính của vùng tổng hợp. Vì 00μ là diện tích của
vùng, suy ra Ru có thể được xấp xỉ theo công thức π
μ
4
00=uR , với giả định
rằng vùng tổng hợp có dạng hình tròn.
2.5.3 Chiều dài trục chính và phụ
Chiều dài trục chính và phụ là những đặc trưng rất quan trọng và có
thể được ước lượng bằng cách sử dụng các giá trị riêng. Trước hết, một vùng
sẽ được biểu diễn như là một tập các điểm {(x1, y1), (x2, y2), (x3, y3), . . . , (xn,
yn)} và giả sử rằng các điểm này được biểu diễn bởi một vector ngẫu nhiên
S = [x, y]. Gọi C là ma trận hiệp phương sai của vector đó:
⎟⎟⎠
⎞
⎜⎜⎝
⎛=
0211
1120
μμ
μμ
C
trong đó:
∑∑ −−=
x y
yyxx ))((11μ
∑∑ −=
x y
xx 220 )(μ
∑∑ −=
x y
yy 202 )(μ
với x và y là tâm của vùng đang tính. Vector riêng của ma trận hiệp
phương sai cho ta hướng của 2 trục chính và phụ. Chiều dài của các trục
bằng với căn bậc hai của các giá trị riêng của ma trận hiệp phương sai.
34
Hình 2-10: Trục chính và trục phụ hình ellipse.
2 vector e1 và e2 là 2 vector riêng của ma trận hiệp phương sai.
2.6 Cây quyết định
2.6.1 Giới thiệu về cây quyết định
Cây quyết định là một cây đồ thị trong đó mỗi nút bên trong đại diện
cho một điểm quyết định và mỗi nút lá tương ứng với một nhãn (lớp) sẽ được
gán cho mỗi bộ dữ liệu nhập. Mỗi nút của cây là một phép thử (so sánh) của
một thuộc tính nào đó, và nhánh trổ xuống từ nút đó đại diện cho những giá trị
có thể có của thuộc tính này. Để xây dựng được cây quyết định, ta cần có một
tập dữ liệu được phân lớp trước (dữ liệu học). Việc xây dựng các cây quyết
định chính là quá trình phát hiện ra các luật phân chia tập dữ liệu đã cho thành
các lớp đã được định nghĩa trước.
Việc sinh cây quyết định bao gồm hai giai đoạn:
i. Xây dựng cây:
• Tại thời điểm khởi đầu, tất cả các ca ( case ) dữ liệu học
đều nằm tại gốc.
• Các ca dữ liệu được phân chia đệ qui trên cơ sở các
thuộc tính được chọn.
35
ii. Rút gọn cây:
• Phát hiện và bỏ đi các nhánh chứa các điểm dị thường
và nhiễu trong dữ liệu.
Hầu hết các thuật toán dựa vào qui nạp hiện có đều sử dụng phương
pháp của Hunt dùng để xây dựng một cây quyết định từ một tập T các ca học
với các lớp được kí hiệu là {C1,C2,……Cn}.
- Trường hợp 1: T chứa một hoặc nhiều ca, tất cả đều thuộc về một lớp
đơn C1: Cây quyết định T là một lá định dạng lớp C1.
- Trường hợp 2: T không chứa ca nào: Cây quyết định cho T là một lá,
nhưng lớp được gắn với lá này phải được xác định từ các thuộc tính
không thuộc T.
- Trường hợp 3: T chứa các ca thuộc về một hỗn hợp các lớp: Một phép
thử được lựa chọn dựa vào một thuộc tính đơn có một hoặc nhiều kết
quả ( giá trị ) loại trừ lẫn nhau {O1,O2,….On}. T được phân chia thành
các tập con T1, T2, ….Tn trong đó T1 chứa tất cả các ca trong T có kết
quả O1 của phép thử đã chọn. Cây quyết định cho T gồm một đỉnh
quyết định định danh cho phép thử, và một nhánh cho mỗi kết quả có
thể có. Cơ chế xây dựng cây này được áp dụng đệ qui cho từng tập
con của các ca học.
Bảng 2-1 là một tập dữ liệu học của một ví dụ về thi đấu tennis với năm
thuộc tính và hai lớp ( thuộc tính Ngày được sử dụng làm định danh cho các
ca ). Hình 2-10 chỉ ra cách làm việc của thuật toán Hunt, một phép thử dựa
trên thuộc tính đơn được chọn để khai triển đỉnh hiện hành.
36
Ngày Quang cảnh Nhiệt
độ
Độ ẩm ( %) Gió to Kết quả
N1 Nắng 24 70 Không Thi đấu
N2 Nắng 27 90 Có Không thi đấu
N3 Nắng 30 85 Không Không thi đấu
N4 Nắng 22 95 Không Không thi đấu
N5 Nắng 20 70 Không Thi đấu
N6 Nhiều mây 22 90 Có Thi đấu
N7 Nhiều mây 28 75 Không Thi đấu
N8 Nhiều mây 18 65 Có Thi đấu
N9 Nhiều mây 28 75 Không Thi đấu
N10 Mưa 21 80 Có Không thi đấu
N11 Mưa 18 70 Có Không thi đấu
N12 Mưa 24 80 Không Thi đấu
N13 Mưa 20 80 Không Thi đấu
N14 Mưa 21 96 Không Thi đấu
Bảng 2-1: Dữ liệu minh họa cho cây quyết định
Hình 2-11: Minh họa phương pháp của Hunt
37
2.6.2 Thuật toán ID3
Thuật toán ID3 ( Quinlan86 ) là một trong những thuật toán xây dựng cây
quyết định sử dụng information gain để lựa chọn thuộc tính phân lớp đối
tượng. Nó xây dựng cây theo cách từ trên xuống, bắt đầu từ một tập các đối
tượng và đặc tả của các thuộc tính. Tại mỗi đỉnh của cây, một thuộc tính có
information gain lớn nhất sẽ được chọn để phân chia tập đối tượng. Quá trình
này được thực hiện một cách đệ qui cho đến khi một tập đối tượng tại một
cây con đã cho trở nên thuần nhất, tức là nó chỉ chứa các đối tượng thuộc về
cùng một lớp. Lớp này sẽ trở thành một lá của cây.
Việc lựa chọn một thuộc tính nào cho phép thử là rất quan trọng. Nếu
chọn không thích hợp, chúng ta có thể có một cây rất phức tạp. Ví dụ, nếu ta
chọn thuộc tính Nhiệt độ làm gốc cây thì cây quyết định sẽ có hình dạng như
trong hình 2-11. Nhưng nếu chọn thuộc tính Quang cảnh làm gốc thì ta lại
có một cây quyết định tất đơn giản như đã chọn trong hình 2-10. Vậy nên
chọn thuộc tính nào là tốt nhất?
Thông thường việc chọn thuộc tính đều dựa vào một độ đo gọi là
Entropy Gains hay còn gọi là Information Gains của các thuộc tính.
Entropy của một thuộc tính được tính toán từ các thuộc tính phân lớp. Đối
với thuộc tính rời rạc, cần phải có các thông tin phân lớp của từng giá trị
thuộc tính.
Lớp
Giá trị thuộc tính Thi đấu Không thi
đấu
Nắng 2 3
Nhiều mây 4 0
Mưa 3 2
Bảng 2-2: Thông tin phân bố thuộc tính quang cảnh
38
Lớp
Giá trị thuộc
tính
Phép thử nhị
phân
Thi đấu
Không thi
đấu
65 1 0
> 8 5
70 3 1
> 6 4
75 5 1
> 4 4
78 5 1
> 4 4
80 7 2
> 2 3
85 7 3
> 2 2
90 8 4
> 1 1
95 8 5
> 1 0
96 9 5
> 0 0
Bảng 2-3: Thông tin phân bố lớp của thuộc tính Độ ẩm
Bảng 2-2 cho thấy thông tin phân lớp của thuộc tính Quang cảnh. Đối với
một thuộc tính liện tục. chúng ta phải xét phép thử nhị phân đối với tất cả các
giá trị khác nhau của thuộc tính. Bảng 2-3 chỉ ra thông tin phân lớp của thuộc
tính Độ ẩm.
39
Một khi đã thu nhận được các thông tin phân lớp của tất cả các thuộc tính,
chúng ta sẽ tính Entropy. Một thuộc tính với Entropy lớn nhất sẽ được chọn làm
một phép thử để khai triển cây.
2.6.2.1 Hàm Entropy
Hàm Entropy xác định tính không thuần khiết của một tập các ca dữ
liệu bất kỳ. Chúng ta gọi S là tập các ca dương tính ( ví dụ Thi đấu ) và âm
tính ( ví dụ Không thi đấu ). P(+) là tỉ lệ các ca dương tính S, P(-) là tỉ lệ âm
tính S.
Entropy(S) = -P(+)log 2 P(+) – P(-)log 2 P(-)
Ví dụ 1. Trong Bảng 2-1 của ví dụ thi đấu tennis, tập S có 9 ca dương
và 5 ca âm ( ký hiệu là [9+,5-]).
Entropy(S) = Entropy([9+,5-]) = -
14
9 log 2 14
9 -
14
5 log 2 14
5 = 0.940
Hình 2-12: Một cây quyết định chọn nhiệt độ làm gốc
Nhận xét. Entropy bằng 0 nếu tất cả các ca trong S đều thuộc về cùng
một lớp. Chẳng hạn như, nếu tất cả các ca đều dương thì P(+) = 1 và P(-) = 0,
do vậy:
Entropy(S) = -1log 2(1) – 0log 2 (0) = 0
40
Entropy bằng 1 nếu tập S chứa số ca dương và âm bằng nhau. Nếu số
các ca này khác nhau thi Entropy nằm giữa 0 và 1.
Trường hợp tổng quát, nếu S bao gồm c lớp thì Entropy của S được
tính bằng công thức sau:
Entropy(S) = ∑ -P
=
n
i 1
ilog 2 Pi
trong đó Pi là tỉ lệ thuộc tính I trong tập S.
2.6.2.2 Độ đo (Informatic Gain)
Đo mức độ hiệu quả của một thuộc tính trong bài toán phân lớp dữ
liệu. Đó chính là sự rút gọn mà ta mong đợi khi phân chia các ca dữ liệu theo
thuộc tính này. Nó được tính theo công thức sau đây:
Gains(S,A) = Entropy(S) - ∑
)( AValue
r
S
S
Entropy(S)
trong đó Value(A) là tập tất cả các giá trị có thể có đối với thuộc tính
A và Sr là tập con của S mà A có giá trị là v.
Ví dụ 2.
Value(Gió to) = { true,false},S=[9+,5-]
Strue là đỉnh con với giá trị là “true”, bằng [2+,3-]
Sfalse là đỉnh con với giá trị là “false”, bằng [7+,2-]
Gaint(S,Gió to) = Entropy(S) - ∑
)( AValue
r
S
S
Entropy(S)
= Entropy(S) -
14
5 * Entropy(Strue) - 14
9 *
41
Entropy(Sfalse) = 0.940 - 14
5 *0.97 -
14
9 *0.764
= 0.1024
Tương tự như vậy, ta có thể tính được độ đo cho các thuộc tính còn lại
của ví dụ trong Bảng 1. Đối với thuộc tính Độ ẩm. ta lấy độ ẩm 75% để chia
các ca thành hai phần, một phần ứng với các ca có độ ẩm ≤ 75% được gọi là
độ ẩm Bình thường ( [5+,1-] ), phần còn lại được gọi là có độ ẩm Cao
( [4+,4-] ). Còn đối với thuộc tính Nhiệt độ, ta sẽ chia thành ba mức, các
ngày có nhiệt độ nhỏ hơn 210 được gọi là Lạnh(4 ngày), các ngày có nhiệt độ
lớn hơn hay bằng 210 đến nhỏ hơn hoặc bằng 270 được gọi là Ấm (6 ngày),
và còn lại là những ngày có nhiệt độ lớn hơn hoặc bằng 270 được gọi là Nóng
(4 ngày).
Gain(S,Quang cảnh) = 0.246
Gain(S,Gió to) = 0.1024
Gain(S,Nhiệt độ) = 0.029
Gain(S,Độ ẩm) = 0.045
Từ đây ta thấy rằng độ đo của S đối với thuộc tính Quang cảnh là lớn
nhất trong số 4 thuộc tính. Như vậy, có thể quyết định chọn Quang cảnh làm
thuộc tính đầu tiên khai triển cây, Hình 2-12 là khai triển của cây quyết định
theo thuộc tính Quang cảnh.
Tương tự như vậy, ta có thể tiến hành triển khai các nút ở mức tiếp
theo:
Snắng = {N1, N2, N3, N4, N5}
Entropy(Snắng) = - 5
2 log 2 5
2 -
5
3 log 2 5
3 = 0.970
Gain(Snắng , Độ ẩm) = 0.970 - 5
3 *0.0 -
5
2 *0.0 = 0.970
42
Gain(Snắng , Nhiệt độ) = 0.970 - 5
2 *0.0 -
5
2 *1.0 -
5
1 *0.0 = 0.570
Gain(Snắng , Gió to) = 0.970 - 5
2 *1.0 -
5
3 *0.918= 0.019
Từ các giá trị của Entropy Gain, ta thấy Độ ẩm là thuộc tính tốt nhất
cho đỉnh nằm dưới nhánh Nắng của thuộc tính Quang cảnh.
Tiếp tục quá trình trên cho tất cả các đỉnh và sẽ dừng khi không còn
đỉnh nào có thể khai triển được nữa. Cây kết quả sẽ có dạng như phần c) của
hình 2-12.
2.7 Thông tin tương hỗ
Cho trước một biến ngẫu nhiên X = {x1, …, xn}. Ta định nghĩa công
thức tính entropy Shannon như sau:
∑
=
−=
n
i
ii ppXH
1
log)(
với pi = Pr[X = xi] và n là lực lượng của X. Độ đo entropy này thể hiện độ
thông tin trung bình hay là độ không chắc chắn của biến ngẫu nhiên. Bây giờ
ta xét thêm một biến ngẫu nhiên Y = {y1, …, yn}. Ta định nghĩa entropy có
điều kiện với p∑∑
= =
−=
m
j
n
i
jiij ppYXH
1 1
|log)|( i|j = Pr[X = xi|Y=yj ] là xác suất có
điều kiện và entropy hợp với p∑∑
= =
−=
n
i
m
j
ijij ppYXH
1 1
log),( ij = Pr[X = xi,
Y=yj].
Thông tin tương hỗ giữa X và Y được xác định theo công thức:
∑∑
= =
=
n
i
m
j ji
ij
ij qp
p
pYXI
1 1
log),(
Dễ thấy I(X,Y) = H(X) – H(X|Y) = H(Y) – H(Y|X) nên còn được gọi
là thông tin chia sẻ giữa X và Y.
43
Một kết quả cơ bản của lý thuyết thông tin là bất đẳng thức về xử lý
thông tin có thể được diễn tả dưới dạng sau: nếu X -> Y -> Z là chuỗi
Markov, nói cách khác p(x,y,z) = p(x)p(y|x)p(z|y) thì:
),(),( ZXIYXI ≥
Kết quả này nói lên rằng không tồn tại cách xử lý Y nào, dù là ngẫu
nhiên hay chủ ý, có thể làm tăng thông tin Y chứa về X.
Ở phần 3.4, ta sẽ bàn về cách sử dụng thông tin tương hỗ này
vào bài toán phân vùng ảnh.
2.8 Học dựa vào sự trình diễn
Theo [4], một vấn đề quan trọng khi xây dựng những hệ thống dựa
vào tri thức là giai đoạn thu thập tri thức. Đây là một thách thức lớn và là
một đề tài thu hút nhiều quan tâm trong lĩnh vực máy học cũng như trí tuệ
nhân tạo. Thông thường, người kĩ sư tri thức cần có một chuyên gia trình bày
những hiểu biết chuyên môn của mình và dựa vào đó để xây dựng cơ sở tri
thức. Đây là quá trình khá buồn tẻ và thường có nhiều sai sót. Cách trình bày
của chuyên gia có thể không hoàn toàn chính xác, không hoàn chỉnh và có
thể không được hiểu đúng bởi người kĩ sư tri thức. Trong nhiều trường hợp,
các chuyên gia có khuynh hướng thực hiện hành động hơn là giải thích về
chuyên môn của mình. Những vấn đề trên thúc đẩy chúng ta tìm kiếm một
giải pháp khác cho bài toán xây dựng cơ sở tri thức: thay vì thu thập các tri
thức dưới dạng trao đổi với chuyên gia, ta sẽ yêu cầu họ trình diễn các tri
thức của mình thông qua các hành động mà hệ thống có thể quan sát và ghi
nhận lại được. Cách tiếp cận này gọi là phương pháp học dựa vào trình diễn
(learning by demonstration).
Nhiều dạng máy học có thể xem như là một hình thức tương tác giữa
giáo viên và học sinh: người giáo viên đưa ra các ví dụ và máy tính (hoặc
học sinh) tổng quát hóa những ví dụ đó để tạo thành tri thức cho riêng mình.
Sau đó, giáo viên sẽ kiểm tra khả năng của học sinh bằng cách đưa ra những
44
bài kiểm tra và xem xét kết quả thực hiện của học sinh. Trong suốt quá trình
học, thường thì không có bất kì một phản hồi nào từ phía người học sinh về
mức độ kiến thức mà họ đã tiếp thu được, do đó cách học này có thể làm
lãng phí nhiều tài nguyên, thời gian và công sức. Cách học dựa vào trình diễn
là một bước phát triển cao hơn của mô hình tương tác trên: người học sinh
yêu cầu giáo viên giải một ví dụ nào đó và bằng cách quan sát cách giải
quyết của giáo viên, học sinh sẽ tổng quát thành kiến thức cho mình. Lợi thế
của của cách học này là học sinh có thể định hướng trực tiếp được những
phần chưa hiểu để giáo viên tập trung vào đó. Nhờ vậy, vai trò của người học
sinh trong quá trình học là chủ động chứ không phải bị động.
45
Chương 3 : Xây dựng hệ thống
Phần đầu tiên của hệ thống là module dò tìm vùng tổn thương bằng
phương pháp lọc ngưỡng. Nhiệm vụ của bộ lọc này là tìm ra những vùng có
độ đo Hounsfield nằm trong ngưỡng của tổn thương đang được dò tìm. Do
ảnh hưởng của hiệu ứng thể tích từng phần nên sẽ có khá nhiều vùng bị nhận
lầm. Chính vì vậy, nhiệm vụ của module tiếp theo chính là để loại ra những
vùng bị phát hiện nhầm đó. Ở đây ta sử dụng thuật toán k-người láng giềng
gần nhất để tạo bộ phân lớp. Bộ phân lớp này được xây dựng dựa vào
phương pháp học bằng sự trình diễn: kết quả của bộ lọc thứ nhất sẽ được
hiển thị, và các chuyên gia (bác sĩ chẩn đoán hình ảnh), bằng tri thức và kinh
nghiệm của mình, sẽ quyết định xem vùng nào sẽ bị loại bỏ và vùng nào sẽ
được giữ lại. Đặc trưng của những vùng này, cùng với thông tin về hành
động tương ứng tách động lên nó (giữ hay xóa) sẽ được lưu lại tạo thành dữ
liệu học.
Sau khi loại bỏ các vùng bị nhận dạng nhầm, ta sẽ tiến hành đo các
thông tin định tính về vùng đó, sau đó sử dụng hệ luật để định vị vùng tổn
thương đó trong não. Do vấn đề thời gian nghiên cứu, hệ luật này chỉ mới
được xây dựng ở mức độ đơn giản, dựa vào các quan sát trên hình ảnh và
tiêu bản não. Để xây dựng được hệ luật phức tạp hơn, một lần nữa phương
pháp học bằng sự trình diễn sẽ được dùng đến.
3.1 Phân đoạn đơn giản
Dữ liệu sau khi tiền xử lý sẽ được cho qua bộ phân đoạn để xác định
vùng chấn thương thứ nhất. Module này sử dụng phương pháp lọc ngưỡng để
phát hiện ra các vùng xuất huyết/tụ máu. Phương pháp này được chọn vì nó
có những ưu điểm sau:
a. Như đã trình bày trong bảng 1-1, mỗi một cấu trúc trong não sẽ có độ
hấp thụ đối với tia X khác nhau, tức là có đậm độ khác nhau. Như vậy,
ngưỡng đậm độ của tổn thương xuất huyết/tụ máu là đã xác định được,
46
mà ta biết rằng xác định ngưỡng chính là bước quan trọng và khó
khăn nhất trong cách tiếp cận này.
b. Cài đặt đơn giản, tốc độ cao, không cần dữ liệu học.
c. Qua thử nghiệm, với ngưỡng cho tổn thương xuất huyết/tụ máu như
trong bảng 1-1 thì tất cả những vùng bị tổn thương đều được phát hiện,
không bỏ sót vùng nào.
Tuy vậy, bộ phân đoạn đơn giản này cũng có một khuyết điểm quan
trọng: phân đoạn nhầm một số vùng khác. Nguyên nhân chính gây ra sai sót
này là do hiện tượng gọi là hiệu ứng thể tích từng phần. Một ví dụ về hiện
tượng này là trường hợp những vùng nhu mô não (vốn có đậm độ chỉ khoảng
30-45) nhưng nếu nằm kế bên vùng xương (có đậm độ cao hơn rất nhiều, từ
250 trở lên) thì đậm độ của vùng nhu mô đó sẽ tăng lên. Đó chính là lí do mà
những vùng như mô não nằm cạnh xương sọ sẽ bị nhận lầm là vùng tổn
thương xuất huyết/tụ máu. Loại bỏ những vùng này chính là nhiệm vụ của
module tiếp theo: phân lớp bằng K người láng giềng gần nhất với dữ liệu học
thu được bằng phương pháp học dựa vào sự trình diễn.
3.2 Học dựa vào sự trình diễn
Như đã nói, mọi phương pháp máy học đều bao gồm 2 giai đoạn: giai
đoạn học và giai đoạn hoạt động. Trong hệ thống của chúng ta, giai đoạn học
sẽ được thực hiện trên một hộp thoại riêng, và những tri thức thu được từ
người sử dụng sẽ được lưu lại để sử dụng cho quá trình chẩn đoán thật sự ở
màn hình chính.
3.2.1 Hệ thống học
Để thu nhận tri thức từ chuyên gia cho hệ thống học dựa vào sự trình
diễn, ta cần xây dựng một giao diện tương tác trực tiếp với người sử dụng.
Dữ liệu nhập cho hệ thống này là kết quả từ module phân đoạn đơn giản ở
trên, gồm dữ liệu về các lát cắt CT cùng những vùng tụ máu/xuất huyết đã
được phát hiện (bao gồm cả những vùng bị phát hiện nhầm). Chuyên gia sẽ
47
sử dụng những kiến thức chuyên môn của mình để quyết định hành động sẽ
được thực hiện lên mỗi vùng (gồm một trong 2 hành động là xóa hoặc giữ
lại). Bên cạnh đó, chương trình sẽ tính toán các đặc trưng cần thiết của mỗi
vùng. Tại mỗi vùng, kết hợp hành động với đặc trưng ta sẽ có một mẫu học.
Những mẫu này sẽ được lưu lại và trở thành dữ liệu học cho một phương
pháp phân lớp nào đó, ví dụ như mạng nơ ron, cây quyết định hoặc k-người
láng giềng gần nhất…
Hình 3-1: Ảnh CT qua bộ lọc thứ nhất, trong đó màu đỏ biểu diễn cho vùng bệnh
và màu xanh ứng với những vùng bị nhận nhầm
3.2.2 Đặc trưng vùng
Bên cạnh những đặc trưng đã nêu ra trong phần 2.5, sẽ có thêm một số
đặc trưng khác được sử dụng:
48
3.2.2.1 Đậm độ lớn nhất, nhỏ nhất, trung bình của vùng
Ứng với mỗi vùng, ta sẽ tính các thông số về đậm độ lớn nhất, nhỏ nhất
và trung bình của nó. Do mỗi vùng được lưu theo dạng dòng quét nên việc
duyệt qua tất cả các điểm ảnh và tính ra các giá trị này khá đơn giản.
3.2.2.2 Diện tích của vùng
Đặc trưng này đã được trình bày trong phần trong phần 2.5. Đặc trưng
này cho ta biết độ lớn nhỏ của vùng.
3.2.2.3 Khoảng cách gần nhất
Nhớ rằng do hiệu ứng thể tích từng phần nên những vùng nhu mô não ở
quá gần vùng xương sọ sẽ bị ảnh hưởng tăng đậm độ, do đó sẽ là hợp lý nếu
ta tìm khoảng cách từ một vùng đến vùng sọ gần nhất của nó. Vấn đề cần
quan tâm nhất là điểm nào trong vùng sẽ được chọn làm mốc để tính khoảng
cách tới vùng xương. Ở đây ta chọn điểm trung tâm của vùng, với điểm trung
tâm được xác định như là “điểm giữa của dòng quét giữa của vùng”. Ví dụ:
vùng đó có 9 dòng quét và dòng quét thứ 5 có 7 điểm thì điểm thứ 4 của
dòng quét 5 chính là điểm được chọn.
3.2.2.4 Đậm độ trung bình của vùng nội sọ (vùng nhu mô não)
Cũng xuất phát từ ảnh hưởng của hiệu ứng thể tích toàn phần nên đậm
độ ở những lát cắt trên cùng sẽ tăng cao (do gần với vùng sọ đỉnh), và dĩ
nhiên những vùng tụ máu/xuất huyết ở đây cũng sẽ có đậm độ cao hơn. Từ
đó, ta nhận thấy rằng đậm độ trung bình của vùng nhu mô não sẽ đóng vai
trò quan trọng, và phản ánh tương đối vị trí của lát cắt đó trong não ( lát cắt
càng cao thì đậm độ trung bình càng lớn, tuy nhiên nó cũng sẽ bị ảnh hưởng
bởi nhiều yếu tố khác, chẳng hạn như những tổn thương có biểu hiện là giảm
đậm độ…) cũng như là đậm độ của vùng tụ máu/xuất huyết được phát hiện.
49
Qua quá trình thử nghiệm, vector đặc trưng của mỗi vùng gồm 3 đại
lượng sau: diện tích vùng, trung bình đậm độ, và khoảng cách nhỏ nhất.
3.2.3 Phân lớp bằng thuật toán k-người láng giềng gần nhất
Sau khi thu thập đầy đủ dữ liệu học, bây giờ ta có thể sử dụng nó cho hệ
thống của mình. Cụ thể hơn, ta sẽ sử dụng dữ liệu học này để phân lớp
những vùng tổn thương đã được phát hiện ở bộ phân đoạn đơn giản. Mỗi
vùng sẽ được phân vào một trong hai lớp: lớp xóa (tương ứng với việc xóa
bỏ vùng đó, do nó không phải là bệnh) và lớp giữ (đây đúng là vùng bị tổn
thương). Phương pháp được chọn ở đây là sử dụng thuật toán k-người láng
giềng gần nhất.
Cách hoạt động của thuật toán k-người láng giềng gần nhất như sau:
Với mỗi vùng được đưa vào, ta sẽ tính toán khoảng cách giữa vector đặc
trưng của vùng đó với tất cả các vector trong bộ dữ liệu học đã cho, và chọn
ra k vector có khoảng cách nhỏ nhất. Lần lượt đếm số lần xuất hiện của các
mẫu giữ và mẫu xóa trong k vector này và hành động xuất hiện nhiều hơn sẽ
được chọn là hành động sẽ tác động lên mẫu cần phân lớp.
3.2.3.1 Chọn lựa k
Chọn k bằng bao nhiêu là một vấn đề quan trọng của thuật toán k-người
láng giềng gần nhất. Ở trường hợp tới hạn với k = 1, ta có thuật toán người
láng giềng gần nhất. Nói chung, việc chọn k là một vấn đề phụ thuộc từng
bài toán cụ thể, và giá trị k tốt nhất chỉ có thể xác định dựa vào phương pháp
thử sai.
Qua quan sát, người ta đã đưa ra một số giá trị k tỏ ra khá tốt với nhiều
bài toán khác nhau, một trong số đó là cách chọn k = n . Riêng trong bài
này, với số lượng mẫu học khoảng 600, sau quá trình thử nghiệm em chọn k
bằng 7.
50
3.2.3.2 Tính khoảng cách giữa hai vector
Cùng với cách chọn giá trị cho k thì việc xác định công thức tính
khoảng cách giữa 2 vector đặc trưng (nói cách khác, là độ tương tự giữa 2
mẫu) cũng đóng vai trò quan trọng. Cách tính quen thuộc nhất là dùng
khoảng cách Euclide: nếu gọi u và v là 2 vector cần tính khoảng cách, mỗi
vector có n thành phần thì khoảng cách Euclide được tính theo công thức
sau:
(4.3) )()(2 vuvuDist T −−=
Nhận xét rằng trong công thức trên, tất cả các đặc trưng đều có một vai
trò như nhau. Tuy vậy, trong thực tế (cũng như trong vấn đề mà ta đang xét),
thường sẽ có những đặc trưng giữ vai trò quan trọng hơn các đặc trưng còn
lại. Chẳng hạn, một vùng càng nằm gần sọ não thì càng có nhiều khả năng đã
bị phát hiện lầm ở bước phân đoạn trước, như vậy hệ số cho đại lượng này
trong công thức tính khoảng cần phải lớn hơn. Mặt khác, nếu vùng đó nằm
gần não, nhưng có diện tích lớn khá lớn thì nhiều khả năng đó là tổn thương
tụ máu dưới/ngoài màng cứng nên cần được giữ lại, như vậy hệ số về tương
ứng với diện tích cũng phải cao.
Để tính khoảng cách giữa 2 vector mà trong đó các đặc trưng có vai trò
khác nhau, ta dùng công thức sau:
)()(2 vuWvuDist T −−= (4.4)
trong đó W là ma trận đường chéo, và phần tử wii của nó sẽ tương ứng với hệ
số mà đặc trưng thứ i được nhận.
3.3 Dùng hệ luật để định vị vùng tổn thương
3.3.1 Hệ luật đơn giản
Muốn đưa ra được lời mô tả hình ảnh, ta xác định vị trí của vùng tổn
thương trong não (ví dụ: nằm ở vùng thùy chẩm hay thùy thái dương…). Ở
mức đơn giản, bằng các quan sát thực tế, ta có thể đưa ra một số luật cơ bản.
51
Hiện các luật này được xây dựng chủ yếu dựa vào thông tin về vị trí tương
đối của một vùng so với sọ não.
Nằm lệch về bên trái hay bên phải, phía trên hay phía dưới của
sọ.
Nhờ vào thông tin về vị trí các lát cắt: lát cắt đầu tiên, cuối
cùng…
Trường hợp vị trí của vùng tổn thương không rõ ràng, ta sẽ chỉ
kết luận nó thuộc về bán cầu não trái hoặc bán cầu não phải.
Với những lát cắt đầu tiên (hình 3-2), những vùng chúng ta cần định vị
gồm có bán cầu tiểu não, thùy thái dương phải và thùy thái dương trái. Do đã
có được đường biên của xương sọ nên ta dễ dàng xác định được vị trí tương
đối của một vùng là nằm về phía trái, phía phải, hay bên dưới (lấy mốc là sọ
não). Ví dụ về các luật trong trường hợp này là:
Ví dụ:
NẾU vùng nằm về phía dưới THÌ nó thuộc tiểu não
NẾU vùng nằm về phần trên và lệch về phía phải THÌ nó thuộc
về thùy thái dương (P).
Với các lát cắt tiếp theo, ta xác định các vùng theo hình 3-3, với các vị
trí có thể là thùy trán, thùy thái dương phải và trái, thùy chẩm và vùng não
thất. Với cách phân vùng như trong hình 3-3, ta có một luật ví dụ như sau:
Ví dụ:
NẾU vùng thuộc về phân vùng trên cùng THÌ nó thuộc về thùy
trán.
Lên cao nữa, ở những lát cắt cuối cùng như hình 3-4, ta định vị một
vùng duy nhất là thùy đỉnh.
Nếu một vùng tổn thương nằm trên nhiều vùng khác nhau của não thì vị
trí được xác định sẽ là hợp của các vị trí đó lại với nhau, chẳng hạn “thái
dương-trán” hay “thái dương-chẩm”.
52
Hình 3-2: Minh họa lát cắt đầu tiên vùng trên lều
Hình 3-3: Minh họa cách phân vùng các lát cắt giữa
53
Hình 3-4: Hình minh họa lát cắt trên cùng (thùy đỉnh)
3.3.2 Hệ luật phức tạp
Có thể thấy rằng những luật này đều có độ chính xác tương đối. Nếu
như muốn mô tả vị trí của tổn thương cụ thể hơn, thì rõ ràng hệ luật sẽ phức
tạp hơn và không thể xây dựng bằng phương pháp quan sát như trên được. Dĩ
nhiên, cách thức truyền thống trong trường hợp này là yêu cầu bác sĩ chuyên
môn trợ giúp. Tuy nhiên, một vấn đề khác lại xuất hiện là bản thân các tri
thức của bác sĩ đều mờ, và họ rất khó trình bày được cách họ suy luận để đi
đến kết luận như thế. Nếu nói đến vấn đề giải quyết thông tin mờ, ta sẽ nghĩ
ngay đến công cụ logic mờ. Tuy vậy, ở đây em muốn thử nghiệm một cách
giải quyết khác: sử dụng lại một lần nữa phương pháp học dựa vào sự trình
diễn. Quá trình thực hiện như sau:
1. Phân vùng ảnh ra thành nhiều vùng con.
2. Yêu cầu chuyên gia đánh dấu mỗi vùng, số lượng nhãn phụ
thuộc vào mức độ chi tiết các bộ phận mà ta muốn định vị.
3. Lưu thông tin các vùng để tạo thành dữ liệu học.
4. Tạo ra cơ sở luật bằng cách dùng phương pháp cây quyết
định (thuật toán ID3 đã trình bày ở 2.7.2).
54
5. Khi định vị, ta chỉ cần phân vùng ảnh theo cách đã làm khi
học, xác định phân vùng chứa tổn thương, tính toán các đặc
trưng và sử dụng hệ luật đã xây dựng để định vị.
Ta nhận thấy cần phải tìm một phương pháp phân vùng ảnh sao cho
thỏa 2 điều kiện sau:
- Không quá lớn để nhiều bộ phận khác nhau của não bị rơi
vào chung một vùng.
- Không quá nhỏ vì như vậy sẽ tạo thành quá nhiều phân,
mỗi vùng sẽ không mang đầy đủ đặc trưng của nó, làm tăng
thời gian xử lý.
Cách thực hiện là sử dụng thông tin tương hỗ (đã trình bày ở phần
2.8). Ý tưởng chính như sau: xem ảnh ban đầu như một vùng duy nhất, ta
tiến hành chia ảnh theo 2 chiều ngang hoặc dọc dựa theo độ tăng cực đại của
thông tin tương hỗ.
Các tập biến ngẫu nhiên X và Y được xác định như sau:
X:
N
np ii = là histogram i của ảnh (bin i).
Y:
N
qi
1=
Suy ra:
- pj|i là xác suất chuyển từ bin i của histogram sang pixel j.
- I(X,Y) = H(X) vì cho trước 1 điểm ảnh, sẽ không có bất
cứ sự không chắc chắn nào về histogram bin tương ứng
của nó.
Kết quả thu được [7] sẽ tùy vào điều kiện dừng của thuật toán. Sau đây
là một số kết quả:
55
các tiêu chuẩn dừng khác nhau Hình 3-5: Ảnh phân vùng não với
Với kết quả như trên, ta nhận thấy rằng đây là một cách phân vùng rất
có triển vọng.
56
Chương 4 : Chương trình cài đặt – kết quả thử nghiệm
4.1 Chương trình cài đặt
4.1.1 Công cụ sử dụng
- Chương trình được viết bằng ngôn ngữ Microsoft Visual C++ 6.0 trên
môi trường Windows XP.
- Dữ liệu thử nghiệm bao gồm 60 ca khảo sát CT não được cung cấp
bởi bệnh viện Nguyễn Trãi, thành phố Hồ Chí Minh.
4.1.2 Cấu trúc dữ liệu học
Dữ liệu học từ module học bằng sự trình diễn được lưu lại trong tập tin
LearningData.Dat đặt trong thư mục LDATA (nằm cùng cấp với tập tin thực
thi của chương trình). Cấu trúc tập tin dữ liệu học gồm có:
- 4 byte đầu tiên: chứa số lượng mẫu học có trong tập tin nNumSample..
- Phần còn lại chứa nNumSample mẫu học.
4.1.3 Chương trình
Giao diện chính:
Hình 4-1: Giao diện chính
57
Nếu hệ thống chưa có dữ liệu học (hoặc muốn bổ sung thêm dữ liệu
học) ta làm như sau:
i. Từ giao diện chính, bấm vào nút “Học dò tìm” để mở hộp thoại
học:
Hình 4-2: Màn hình học dựa vào sự trình diễn
ii. Lần lượt load dữ liệu về bệnh nhân, thực hiện các bước sau:
• Dò tìm đơn giản: dò tìm bằng phương pháp lọc ngưỡng đơn
giản.
• Sau đó, sử dụng công cụ đánh dấu vùng kèm theo để chọn
những vùng bệnh thật (vùng sẽ được giữ lại).
• Lưu dữ liệu xuống đĩa.
58
Sau khi đã có dữ liệu học, hệ thống chính đã có thể hoạt động. Muốn
chẩn đoán, ta quay về màn hình giao diện chính, mở dữ liệu về bệnh nhân lên
và thực hiện chức năng “Dò tìm”:
Hình 4-3: Chọn bệnh nhân
Hình 4-4: Dữ liệu về bệnh nhân đã được hiển thị. Vùng màu sáng là vùng xuất huyết
59
Hình 4-5: Sau khi dò tìm vùng tổn thương
Rất tiếc do thời gian có hạn nên em đã không kịp cài đặt và thử
nghiệm phần tạo hệ luật cho module định vị vùng tổn thương trong não.
4.2 Đánh giá kết quả
4.2.1 Độ hiệu quả của giai đoạn phân lớp
Phần này trình bày về độ chính xác của bộ phân lớp dùng thuật toán
k-người láng giềng gần nhất. Nhắc lại rằng sau bước lọc ngưỡng, ta sẽ có
một tập các vùng, bao gồm những vùng tổn thương thật sự và những vùng bị
nhận lầm. Bộ phân lớp dùng kNN được xây dựng nhằm mục đích phân loại
các vùng này. Sử dụng các độ đo đã giới thiệu trong phần 1.4, ta sẽ đánh giá
độ hiệu quả của bộ phân lớp, với dữ liệu vào là tập các vùng được xác định
sau bước lọc ngưỡng. Quá trình thử nghiệm được thực hiện trên 2 tập dữ
liệu: tập thứ nhất (gọi là tập (1)) gồm 17 khảo sát CT có tổn thương xuất
60
huyết/tụ máu, tập thứ hai (tập (2)) gồm tập (1) bổ sung thêm 10 khảo sát CT
bình thường. Kết quả như sau:
Tập dữ liệu Độ nhạy Độ đặc trưng Tỉ lệ phân lớp
vùng bệnh đúng
Tỉ lệ phân lớp
vùng bình
thường đúng
(1) 94% 94.3% 70.5% 98%
(2) 94% 93% 71.3% 97.5%
Bảng 4-1: Độ chính xác của bộ phân lớp
Ta sẽ nói thêm về các giá trị trên. Tỉ lệ phân lớp vùng bệnh đúng là
70%, tức là chỉ 70% vùng được đánh dấu bệnh thực sự là vùng tổn thương.
Đây là một kết quả khá thấp. Ngược lại, “tỉ lệ phân lớp vùng bình thường
đúng” rất cao (98%) nói lên rằng 98% các vùng được đánh nhãn bình thường
là đúng; nói cách khác, chỉ có 2% số vùng bệnh bị đánh dấu không bệnh là
sai. Như vậy, bộ phân lớp này đã đạt được mục tiêu đề ra ban đầu: không bỏ
sót vùng bệnh, dù tỉ lệ vùng bệnh nhận lầm có thể cao. (Tham khảo phần
4.2.3 về các hướng cải tiến độ hiệu quả của bộ phân lớp).
4.2.2 Đánh giá công việc
Những công việc đã thực hiện được:
- Tìm hiểu được các kiến thức chuyên môn cơ bản về lĩnh vực chẩn đoán
chấn thương sọ não cấp dựa vào ảnh CT não.
- Các vấn đề về lý thuyết cần thiết.
- Đề xuất mô hình hệ thống.
- Cài đặt thử nghiệm một phần của mô hình
• Phát hiện vùng tổn thương, module học dựa vào sự trình
diễn để phát hiện vùng tổn thương
• Xây dựng hệ luật đơn giản để định vị vùng tổn thương.
Những công việc còn tồn tại:
61
- Do thời gian có hạn nên chưa hoàn thành hết mô hình, chưa xây dựng
được hệ luật tốt hơn để định vị vùng tổn thương.
- Chưa thử nghiệm nhiều phương pháp khác nhau tại mỗi bước xử lý để
chọn ra cách thích hợp nhất.
- Chỉ mới đề cập đến một góc nhỏ của việc chẩn đoán chấn thương sọ
não bằng ảnh CT, cộng thêm việc yêu cầu dữ liệu đầu vào khá chặt, nên
tính thực tế vẫn còn thấp.
4.2.3 Hướng phát triển trong tương lai
- Hoàn chỉnh phần cài đặt các phần còn lại.
- Nghiên cứu thử nghiệm nhiều phương pháp và thuật toán khác, vì các
thuật toán được chọn nói chung đều do chủ quan của người viết, không
qua quá trình thử nghiệm so sánh độ hiệu quả cụ thể.
- Để nâng cao tính chính xác của hệ thống, ta có thể áp dụng thêm các
kiến thức khác về chuyên môn, đặc biệt chú ý đến tính đối xứng của
não. (Tham khảo tài liệu [16] về vấn đề phát hiện các đối xứng bình
thường và bất thường trong ảnh CT).
- Phát triển hệ thống lên một bước cao hơn: hỗ trợ nhiều dạng tổn thương
hơn, với dữ liệu đầu vào đa dạng hơn.
62
Tài liệu tham khảo
[1] Bạch Hưng Khang, Hoàng Kiếm, Trí tuệ nhân tạo các phương pháp và ứng
dụg, NXB Khoa Học Kĩ Thuật, 1989.
[2] Campbell, N. W., Thomas, B. T., and Troscianko, T., “Automatic
segmentation and classification of outdoor images using neural networks,”
International Journal of Neural Systems, vol. 8, no. 1, pp. 137–144, 1997
[3] Chang, Y. and Li, X., “Adaptive image region-growing,” IEEE Transactions
on Image Processing, vol. 3, pp. 868–872, November 1994.
[4] Erol Sarigul, Interactive Machine Learning for Refinement and Analysis of
Segmented CT/MRI Images, A doctoral dissertation submitted to the faculty
of the Virginia Polytechnic Institute and State University in partial
fulfillment of the requirements for the degree of Doctor of Philosophy in
Electrical Engineering, 2004
[5] J.-F. Mangin et al., Coordinate-based versus structural approaches to brain
image analysis, Elsevier, Artificial Intelligence in Medicine 30, 2004, pp.
177-197.
[6] J. Rigau, M. Feixas, M. Sbert, A. Bardera, and I. Boada, Medical Image
Segmentation Based on Mutual Information Maximization, Institut
d’Information I Aplicacions, Universitat de Girona, Spain.
[7] Johannes W. Rohen, Chihiro Yokochi, Elke Lutjen – Drecoll, “Atlas giải
phẫu người”, Nhà xuất bản Y học, Việt Nam, 2002.
[8] Jyh-Shing Roger Jang, Chuen-Tsai Sun, Elli Mizutani, Neuro-Fuzzy and Soft
Computing, A computational Approach to Learning and Machine
Intelligence, Prentice Hall, Upper Saddle River, Ney York, 1997.
[9] Ioannis Pitas, Digital Image Processing Algorithms, Prentice Hall, New York,
1992.
[10] Lê Hoài Bắc, Nguyễn Thanh Nghị, “Bionet - Hệ chẩn đoán bệnh”, Luận văn
thạc sĩ, Đại học Quốc gia TP. HCM, Đại học Khoa học Tự nhiên, Khoa Công
nghệ thông tin, 2003.
63
[11] Nathalie Richard, Michel Dojat, Catherine Garbay, Automated Segmentation
of human brain MR images using a multi-agent approach, Elsevier, Artificial
Intelligence in Medicine 30, 2004, pp. 153-175.
[12] Phạm Ngọc Hoa, Lê Văn Phước, “Đọc phim CT chấn thương sọ não”, bộ
môn hình ảnh y khoa Đại học Y Dược thành phố Hồ Chí Minh, 2003.
[13] Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing 2nd Edition,
Addison-Wesley, New York, 1993.
[14] Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing 3rd Edition,
Addison-Wesley, New York, 2001.
[15] Richard O. Duda, Peter E.Hart, David G. Stort, Pattern Classification 2nd
Edition, Wiley, New York, 2000.
[16] S. Prima, J. P. Thirion, G. Subsol, N. Roberts Statistical analysis of normal
and abnormal dissymmetry in volumetric medical images, Elsevier, Medical
Image Analysis 4, 2000, pp. 111-121.
[17] Terry S. Yoo, Michael J. Ackerman, Open Source Software for Medical
Image Processing and Visualization, Communications, Volume 48, Number
2, February 2005, pp. 55-59.
[18] Tài liệu chính thức về định dạng DICOM: Digital Imaging and
Communications in Medicine (DICOM), National Electrical Manufacturers
Association, Virginia, 2004.
64
Phụ lục
A. Bệnh học
Phần này trình bày về các dạng tổn thương não được đề cập đến trong
bài làm, kèm theo đó là một số hình ảnh minh họa điển hình.
A.1 Tụ máu dưới màng cứng (Subdural Hematoma/SDH)
- Tụ máu dưới màng cứng (TMDMC) là tụ máu ở khoang dưới màng
cứng, khoang giữa lớp trong màng cứng và màng nhện.
- Biểu hiện hình ảnh tụ máu dưới màng cứng cấp (dưới 3-4 ngày):
• Tụ dịch ngoài trục, đậm độ cao, hình liềm, bờ trong không
đều. Vượt qua được các khớp sọ. Không vượt qua được
các nếp gấp của màng cứng (liềm, lều não) (hình A-1). Có
thể vươn vào rãnh liên bán cầu, dọc theo liềm não.
• Thường kết hợp tổn thương não bên dưới (dập não, tụ
máu khu trú)
• Cần điều chỉnh cửa sổ để quan sát TMDMC lượng ít.
• Hình ảnh:
65
Hình A-1: Tụ máu dưới màng cứng
A.2 Tụ máu ngoài màng cứng (Epidural Hematoma/EDH)
- Tụ máu ngoài màng cứng (TMNMC) là tụ máu ở khoang giữa bản sọ
và lớp ngoài màng cứng.
- Biểu hiện hình ảnh tụ máu ngoài màng cứng cấp (dưới 3-4 ngày):
• Khối choán chỗ ngoài trục, khu trú, hình lồi hai mặt, bờ trong
nhẵn. Không chạy qua các khớp sọ (hình A-2). Chạy qua được
các nếp màng cứng (đường giữa – lều tiểu não) (hình 3-8). Ở
vùng cao của vòm sọ, trên hình cắt ngang, TMNMC thường có
bờ không rõ.
• Thường kết hợp với các dấu hiệu thoát vị dưới liềm, xuyên lều
hướng xuống, tăng áp lực sọ não.
• Khối máu tụ có đậm độ cao, đồng nhất (2/3 trường hợp), đậm
độ hỗn hợp (1/3 trường hợp, do máu đang chảy và các vùng
máu không đông).
66
Hình A-2: Tụ máu ngoài màng cứng.
Phân biệt tụ máu ngoài màng cứng và tụ máu dưới màng cứng:
67
Tụ máu ngoài
màng cứng
Tụ máu dưới
màng cứng
Hình dạng Hình lồi hai mặt Hình liềm
Khớp sọ Không vượt qua Vượt qua
Nếp gấp màng
cứng (liềm, lều
não)
Vượt qua Không vượt qua
Bảng A-1: Phân biệt tụ máu dưới màng cứng và ngoài màng cứng
A.3 Xuất huyết khoang dưới nhện (subarachnoid hemorrhage)
- Thường kết hợp với các loại tổn thương khác.
- Bệnh nguyên: Do tổn thương mạch máu màng mềm, hoặc các mạch
máu trong não.
- Vị trí: Khu trú quanh vùng dập não, rãnh liên bán cầu, hoặc lan tỏa
theo khoang dưới nhện.
- Hình ảnh: tăng đậm độ ở các rãnh và bể não.
Hình A-3: Xuất huyết khoang dưới nhện
68
A.4 Xuất huyết trong não thất (intraventricular hemorrhage)
- Xuất huyết nặng (vỡ khối máu tụ ở nhu mô não lân cận vào não
thất), tổn thương đám rối mạch mạc, vỡ phình mạch não.
- Hình ảnh:
• Tăng đậm độ trong não thất (hình A-4)
• Hình mức dịch-máu (hay gặp sừng chẩm)
• Tụ máu khu trú ở đám rối mạch mạc.
Hình A-4: xuất huyết trong não thất
A.5 Tụ máu trong não (intracerebral hematoma)
- Tụ máu trong tổ chức não do tổn thương các mạch máu sâu trong não.
- Vị trí: thái dương, trán và chẩm – đính (2% trường hợp ở nhân nền và
bao trong).
- Hình ảnh: ổ tụ máu tăng đậm độ trong nhu mô não (hình A-5)
69
Hình A-5: Tụ máu trong não
70
B. Dữ liệu DICOM
B.1 Giới thiệu
Chuẩn DICOM (Digital Imaging and Communications in Medicine)
là một tập các qui tắc cho phép ảnh y khoa và các thông tin liên quan khác có
thể truyền đi giữa các thiết bị, máy tính hoặc bệnh viện. Chuẩn này thiết lập
một ngôn ngữ chung để ảnh y khoa và các thông tin khác được tạo ra bởi
thiết bị của một nhà sản xuất này có thể được sử dụng dễ dàng bởi một nhà
sản xuất khác.
B.2 Cấu trúc chung của tập tin DICOM
Một tập tin DICOM thường gồm những phần sau (ở đây chỉ nêu
những phần cần thiết):
• Preamble: gồm 128 bytes trắng đầu tiên (chưa được sử dụng).
• Prefix: 4 byte tiếp theo, chứa 4 kí tự ‘D’, ‘I’, ‘C’, ‘M’.
• UID: một chuỗi số và dấu chấm, dùng làm chuỗi định danh (duy nhất)
cho mỗi tổ chức có đăng kí với ISO. Chuỗi này cho ta biết cú pháp
truyền và thứ tự byte được sử dụng.
Ví dụ: UID “1.2.840.10008.1.2” có ý nghĩa:
- 1: chỉ tổ chức ISO
- 2: chỉ tổ chức thành viên con của ISO
- 840: mã quốc gia thành viên
- 10008: được ANSI đăng kí với NEMA cho các DICOM
UID.
• Transfer Syntax: dùng để xác định thứ tự byte được sử dụng là Little
Endian hay Big Endian.
- Little Endian: ở dạng này, byte thấp sẽ nằm ở địa chỉ
thấp và byte cao sẽ nằm ở địa chỉ cao. Ví dụ nếu ta nhận
được chuỗi byte là 11111111 00000000 thì giá trị tương
ứng phải là (00000000 11111111)2 = 255.
71
- Big Endian: thứ tự byte sẽ ngược lại với Little Endian.
Khi đó chuỗi byte 11111111 00000000 sẽ ứng với giá
trị (11111111 00000000)2 =65280.
• Tag: mỗi phần thông tin của DICOM được gán cho một thẻ (tag). Mỗi
tag gồm có 2 phần: nhóm và thành phần. Xét ví dụ về tag
(0010,0010):
- Nhóm (group): cho biết nhóm thông tin đang được lưu
trữ phía sau. Ví dụ 0010 sẽ cho biết đây là thông tin về
bệnh nhân.
- Thành phần (element): là một số định danh duy nhất cho
dữ liệu. Ví dụ: 0010 cho biết dữ liệu được chứa là tên
bệnh nhân.
Như vậy, nếu muốn tìm thông tin về tên bệnh nhân, ta sẽ tìm tag
(0010,0010) tập tin DICOM.
• Chiều dài dữ liệu: gồm 4 bytes cho biết chiều dài của phần dữ liệu
được lưu tiếp theo (trong tag). Ví dụ, nếu bệnh nhân có tên là
“Roentgen” thì phần chiều dài dữ liệu sẽ là 8.
• Trường giá trị (value field): gồm một số chẵn các byte chứa giá trị của
thành phần (element) trong tag.
• Số giá trị (VM - Value Multiplicity): số lượng giá trị được lưu trong
trường giá trị. Chẳng hạn, nếu VM bằng 3 tức là có 3 giá trị được lưu
trong trường giá trị.
B.3 Một số thông tin cần thiết khi xử ảnh DICOM
B.3.1 Các nhóm quan trọng
• Nhóm 2 (0002): chứa siêu thông tin về tập tin.
• Nhóm 8 (0008): thông tin chung về chuỗi ảnh.
• Nhóm 10 (0010): thông tin về bệnh nhân.
• Nhóm 20 (0020): thông tin chung về khảo sát này.
72
• Nhóm 28 (0028): thông tin về ảnh.
• Nhóm 7F (007F): dữ liệu về các điểm ảnh.
B.3.2 Các thẻ (tag) quan trọng
Sau đây là các thẻ quan trọng, cần thiết cho quá trình xử lý ảnh CT:
Nhóm Thành phần Ý nghĩa
0010 Tên bệnh nhân
0020 Mã bệnh nhân
0030 Ngày sinh
0040 Giới tính
0010
(thông tin về
bệnh nhân)
1010 Tuổi
Bảng B-1: một số thẻ quan trọng
Nhóm Thành phần Ý nghĩa
0010 Số dòng (chiều cao ảnh)
0011 Số cột (chiều ngang ảnh)
0012 Số mặt phẳng
0030 Khoảng cách giữa 2 điểm ảnh (tính bằng
mm)
0100 Số bit được cấp cho mỗi điểm ảnh
0101 Số bit thật sự được sử dụng cho mỗi điểm
ảnh
1050 Trung tâm cửa sổ
1051 Độ rộng cửa sổ
1052 Rescale Intercept
0028
(thông tin về
ảnh)
1053 Rescale Slope
Bảng B-2: Một số thẻ quan trọng
73
Nhóm Thành phần Ý nghĩa
0015 Vùng cơ thể được khảo sát 0018
0050 Độ dày lát cắt
Bảng B-3: Một số thẻ quan trọng
Nhóm Thành phần Ý nghĩa
0032 Vị trí lát cắt 0020
(thông tin
chung về các
lát cắt)
0037 Hướng của lát cắt
Bảng B-4: Một số thẻ quan trọng
B.3.3 Hiển thị ảnh
Sử dụng các tag trên, ta dễ dàng tìm được các thông tin về ảnh CT được
chụp như kích thước ảnh, số bit dành cho mỗi điểm ảnh. Đối với ảnh CT, kích
thước ảnh là 512*512, mỗi điểm ảnh được lưu bằng 16 bit (nhưng chỉ có 12 bit
được dùng, 4 bit còn lại luôn bằng 0). Để biến dữ liệu CT đó thành ảnh có thể
xuất ra màn hình, ta cần thực hiện các bước sau:
1. Tìm tag (7FE0,0010). Tag này chứa toàn bộ thông tin về giá trị các
điểm ảnh.
2. Với mỗi điểm ảnh, ta chuyển nó về giá trị Hounsfield bằng công thức
sau:
H(x,y) = S(x,y)*RS + RI
Trong đó S(x,y) là giá trị được lưu, RS và RI là rescale slope và
rescale intercept đã nói ở trên.
3. Chuyển giá trị Hounsfield sang độ xám: công việc này phụ thuộc vào
2 thông số:
74
i. Phạm vi độ xám mà ta muốn chuyển. Thông thường, để xuất ra
màn hình máy tính, phạm vi được chọn là từ 0 đến 255.
ii. Thông số cửa sổ: gồm 2 thông số là độ rộng cửa sổ (Window
Width) và tâm cửa sổ (Window Center). Gọi độ rộng cửa sổ là
WW, tâm là WC, và đặt:
L = WC-WW/2
R = WC+WW/2
Khi đó, mọi điểm có giá trị Hounsfield nhỏ hơn L sẽ nhận giá
trị là 0, lớn hơn R sẽ có độ xám là 255. Những giá trị
Hounsfield nằm giữa 2 phạm vi này sẽ được biến đổi tỉ lệ về
khoảng [0,255].
a sổ và tâm cửa sổ Hình B-1: ý nghĩa độ rộng cử
75
C. Giải phẫu CT đơn giản vùng trên lều
Hình C-1: Minh họa giải phẫu CT não
1 Nhãn cầu
2 Hố yên
3 Lưng yên
4 Sừng thái dương
5 Cầu não
6 Bán cầu tiểu não
7 Động mạch thân nền
8 Thùy thái dương
9 Não thất IV
10 Thùy giun
76
Hình C-2: Minh họa giải phẫu CT não
1 Thuỳ trán
2 Đoạn ngang động mạch
não giữa
3 Bể nền (bể trên yên)
4 Thuỳ thái dương
5 Bể quanh củ não sinh tư
6 Bể trên thuỳ giun
7 Rãnh Sylvius
8 Cuống đại não
9 Củ não sinh tư
10 Thuỳ chẩm
77
Hình C-3: Giải phẫu CT não đơn giản
7 Liềm đại não
8 Nhân bèo
9 Não thất III
10 Đồi thị
11 Tuyến tùng
12 Sừng chẩm não thất bên
1 Thuỳ trán
2 Sừng trán não thất bên
3 Thuỳ đảo
4 Thuỳ thái dương
5 Bể trên thuỳ giun
6 Thuỳ chẩm
78
Hình C-4: Giải phẫu CT não đơn giản
1 Thuỳ trán
2 Sừng trán não thất bên
3 Đầu nhân đuôi
4 Nhân bèo
5 Đồi thị
6 Sừng chẩm não thất bên
7 Chi trước bao trong
8 Gối bao trong
9 Bao ngoài
10 Chi sau bao trong
11 Thuỳ chẩm
12 Xoang tĩnh mạch dọc trên
79
Hình C-5: Giải phẫu CT não đơn giản
1 Liềm đại não trước
2 Thuỳ trán
3 Thuỳ đính
4 Thuỳ chẩm
5 Thể chai
6 Thân não thất bên
7 Liềm đại não sau
80
Hình C-6: Giải phẫu CT não đơn giản
1 Thuỳ trán
2 Thuỳ đính
3 Thuỳ chẩm
4 Trung tâm bán bầu dục
5 Liềm đại não
81
n giản Hình C-7: Giải phẫu CT não đơ
1 Liềm đại não
2 Rãnh trung tâm
3 Liềm đại não
4 Hồi trán trên
5 Hồi não trước trung tâm
6 Hồi não sau trung tâm
82
Các file đính kèm theo tài liệu này:
- Luận văn-Hỗ trợ chẩn đoán tự động tổn thương xuất huyết-tụ máu dựa vào ảnh ct não.pdf