Tài liệu Phân loại bệnh rung nhĩ dùng xgboost và học sâu: Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91
85
PHÂN LOẠI BỆNH RUNG NHĨ DÙNG XGBOOST VÀ HỌC SÂU
Nguyễn Hồng Quang1*, Trịnh Văn Loan1, Phạm Ngọc Hưng3,
Hà Quang Thái
2
, Bùi Trung Anh
2, Phan Cơng Mạnh2
1Trường Đại học Bách Khoa Hà Nội,
2Cơng ty TNHH phát triển phần mềm Toshiba (Việt Nam),
3Trường Đại học Sư phạm Kỹ thuật Hưng Yên
TĨM TẮT
Bài báo này đề xuất một phương pháp phân loại tín hiệu rung nhĩ được đo từ các thiết bị điện tâm
đồ (ECG) cầm tay. Phương pháp tiếp cận của chúng tơi sử dụng kết hợp XGBoost và mơ hình học
sâu (deep learning) trong đĩ XGBoost được xây dựng trên bộ đặc trưng được tăng cường và tinh
chỉnh qua thực nghiệm, thực hiện vai trị sinh dữ liệu cho mơ hình học sâu. Chúng tơi sử dụng các
kỹ thuật phân đoạn và sinh nhãn cho các đoạn tín hiệu, giúp tăng cường, tạo sự cân bằng và độ tin
cậy cho bộ dữ liệu. Mơ hình học sâu với hướng tiếp cận học chuyển đổi (transfer learning) được sử
dụng để thực hiện phân loạ...
7 trang |
Chia sẻ: quangot475 | Lượt xem: 331 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Phân loại bệnh rung nhĩ dùng xgboost và học sâu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91
85
PHÂN LOẠI BỆNH RUNG NHĨ DÙNG XGBOOST VÀ HỌC SÂU
Nguyễn Hồng Quang1*, Trịnh Văn Loan1, Phạm Ngọc Hưng3,
Hà Quang Thái
2
, Bùi Trung Anh
2, Phan Cơng Mạnh2
1Trường Đại học Bách Khoa Hà Nội,
2Cơng ty TNHH phát triển phần mềm Toshiba (Việt Nam),
3Trường Đại học Sư phạm Kỹ thuật Hưng Yên
TĨM TẮT
Bài báo này đề xuất một phương pháp phân loại tín hiệu rung nhĩ được đo từ các thiết bị điện tâm
đồ (ECG) cầm tay. Phương pháp tiếp cận của chúng tơi sử dụng kết hợp XGBoost và mơ hình học
sâu (deep learning) trong đĩ XGBoost được xây dựng trên bộ đặc trưng được tăng cường và tinh
chỉnh qua thực nghiệm, thực hiện vai trị sinh dữ liệu cho mơ hình học sâu. Chúng tơi sử dụng các
kỹ thuật phân đoạn và sinh nhãn cho các đoạn tín hiệu, giúp tăng cường, tạo sự cân bằng và độ tin
cậy cho bộ dữ liệu. Mơ hình học sâu với hướng tiếp cận học chuyển đổi (transfer learning) được sử
dụng để thực hiện phân loại các đoạn tín hiệu dưới dạng ảnh phổ tần số. Chúng tơi thử nghiệm mơ
hình trên bộ dữ liệu của cuộc thi PhysioNet/Computing in Cardiology Challenge 2017 (PCCC
2017) để phân loại 4 loại tín hiệu: rung nhĩ, bình thường, các loại bệnh tim khác và nhiễu. Mơ hình
học sâu thể hiện khả năng dự đốn tốt trên các đoạn dữ liệu ngắn với kết quả F1 = 0.8397. Nghiên
cứu của chúng tơi mở ra một hướng phát triển mới cho bài tốn phân loại tín hiệu ECG khi thực
hiện phân loại trên các đoạn tín hiệu ngắn, đồng thời mang đến một giải pháp ứng dụng các mơ
hình học sâu khi bài tốn gặp những hạn chế về mặt dữ liệu.
Từ khĩa: Tín hiệu điện tim, Bệnh rung nhĩ, học sâu, XGBoost, mạng nơ ron tích chập, Biến đổi
Wavelet rời rạc
GIỚI THIỆU*
Rung nhĩ (hay rung tâm nhĩ, atrial fibrillation)
là một trong những bệnh rối loạn nhịp tim
thường gặp. Rung nhĩ cĩ nguy cơ dẫn đến suy
tim, đột quỵ, và các biến chứng tim mạch
nguy hiểm khác. Người bị bệnh thường phải
đến bệnh viện khám định kỳ để theo dõi nhịp
tim bằng hệ thống máy đo điện tâm đồ
(ECG), tốn kém nhiều thời gian và chi phí.
Những năm gần đây các nhà sản xuất đã cho
ra đời nhiều loại thiết bị đo ECG cầm tay,
giúp việc theo dõi nhịp tim trở nên thuận lợi
và nhanh chĩng hơn với người bệnh. Sự phát
triển của các thiết bị đo này cũng mở ra nhiều
cơ hội cho các nhà phát triển tích hợp các hệ
thống phần mềm thơng minh đi kèm. Tuy
nhiên, so với việc sử dụng các hệ thống máy
đo ECG 12 kênh (12-lead) thơng thường, chất
lượng tín hiệu của các thiết bị đo cầm tay sẽ
kém hơn do chỉ đo đơn kênh (single-lead) và
thường gặp rất nhiều nhiễu do tác động của
mơi trường, cũng như sai số do việc đo được
*
Tel: 0978 813688, Email: quangnh@soict.hust.edu.vn
thực hiện bởi những người khơng chuyên.
Những điều này đặt ra nhiều thách thức cho
việc phát triển các thuật tốn phân loại tín
hiệu. Nắm bắt được xu hướng phát triển này,
PCCC 2017 đã triển khai đề tài phân biệt tín
hiệu bệnh rung nhĩ với các tín hiệu nhịp tim
thơng thường, tín hiệu nhiễu hay các tín hiệu
bệnh tim khác.
Trong nghiên cứu này, chúng tơi đề xuất một
phương pháp giải quyết bài tốn phân loại tín
hiệu nhịp tim theo hướng tiếp cận sử dụng kết
hợp XGBoost và học sâu, trong đĩ XGBoost
đĩng vai trị tạo ra dữ liệu, và mơ hình học
sâu thực hiện phân loại các mẫu tín hiệu.
Trước tiên, chúng tơi trích chọn các đặc trưng
từ tín hiệu ECG để xây dựng một mơ hình
XGBoost. Các đặc trưng sẽ được điều chỉnh
và cải tiến qua quá trình thực nghiệm. Tiếp
theo đĩ, mơ hình XGBoost được sử dụng để
sinh dữ liệu cho mơ hình học sâu. Chúng tơi
áp dụng kỹ thuật học chuyển đổi (transfer
learning) trên một mạng CNN (Convolutional
Neural Network) được huấn luyện trước
(pretrained) là VGG-16 [16], kết hợp với một
Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91
86
kiến trúc Multi-layer Perceptron (MLP) với
hai lớp ẩn.
Bài báo này đề xuất một phương pháp mới cĩ
khả năng phát hiện các mẫu tín hiệu ngắn bất
thường xuất hiện trong đoạn tín hiệu dài.
Chúng tơi thử nghiệm và đánh giá mơ hình
này trên dữ liệu của PCCC 2017. Phần tiếp
theo sẽ trình bày về các nghiên cứu liên quan.
Phần 3 mơ tả phương pháp đề xuất. Phần 4
trình bày kết quả thử nghiệm và đánh giá.
Phần 5 là kết luận và định hướng nghiên cứu
tiếp theo.
CÁC NGHIÊN CỨU LIÊN QUAN
Bài tốn phân loại tín hiệu ECG đã được các
nhà nghiên cứu thử nghiệm và tiếp cận theo
nhiều hướng khác nhau. Hướng nghiên cứu
trích chọn đặc trưng (feature engineering) kết
hợp các thuật tốn phân lớp trong họ cây
quyết định là một hướng tiếp cận phổ biến và
hiệu quả. Chẳng hạn như Teijeiro và cộng sự
[6] (đạt kết quả tốt nhất của PCCC 2017) đã
thử nghiệm trên 79 đặc trưng, bao gồm các
đặc trưng hình thái, đặc trưng thống kê và sử
dụng XGBoost để tối ưu trên 8-fold cross-
validation. Zabihi và cộng sự [8] cũng sử
dụng 491 đặc trưng, bao gồm các đặc trưng
về hình thái miền thời gian, các đặc trưng
miền tần số, các đặc trưng miền thời gian-tần
số; sau đĩ 150 đặc trưng được lựa chọn và sử
dụng bộ phân lớp Random Forest. Bin và
cộng sự [7] sử dụng các đặc trưng riêng của
bệnh rung nhĩ, hay các đặc trưng liên quan
đến khoảng RR (khoảng cách giữa 2 đỉnh R
của tín hiệu điện tim), sử dụng tập hợp cây
quyết định huấn luyện bằng thuật tốn
AdaBoost.M2. Trên bộ dữ liệu MIT/BIH gồm
5 loại nhịp tim, Emanet trích chọn các đặc
trưng từ tín hiệu ECG sử dụng biến đổi
wavelet rời rạc (Discrete Wavelet Transform)
kết hợp với bộ phân lớp Random Forest và
đạt độ chính xác 99.8% [9].
Bên cạnh hướng trích chọn đặc trưng, khơng
nằm ngồi xu hướng chung, học sâu cũng
được thử nghiệm cho bài tốn phân loại tín
hiệu ECG. Các nghiên cứu sử dụng mạng
CNNs cĩ thể kể đến Pyakillya và cộng sự
[10] sử dụng 7 lớp 1D-CNNs và 3 lớp FC
(Fully Connected) với đầu vào là dữ liệu
chuỗi thời gian (time series), hay Al Rahhal
và cộng sự [11] sử dụng CNNs với hướng tiếp
cận transfer learning. Ngồi ra, các kiến trúc
RNNs, GRU hay LSTM là một hướng triển
vọng khác cho dữ liệu dạng time series như
ECG. Sujadevi và cộng sự [12] sử dụng bộ dữ
liệu MIT-BIH Physionet để thử nghiệm các
kiến trúc RNNs, GRU, LSTM trên tín hiệu
gốc, khơng cần qua các bước tiền xử lý như
khử nhiễu hay lọc tín hiệu nhưng đạt độ chính
xác 95% đến 100%. Mohamad M. Al Rahhal
và cộng sự [13] thử nghiệm kết hợp CNN và
LSTM (CRNN) trên dữ liệu ảnh phổ tần số
được biến đổi từ tín hiệu ECG gốc.
Các mơ hình học sâu là một hướng tiếp cận
phổ biến trong nhiều lĩnh vực với hiệu quả
vượt trội so với nhiều thuật tốn học máy
truyền thống khác. Tuy nhiên học sâu thường
chỉ phù hợp cho các bài tốn cĩ kích thước dữ
liệu lớn. Trong khi đĩ các bộ dữ liệu về ECG
như bộ dữ liệu của PCCC 2017 thường bị giới
hạn về số lượng, đặc biệt là các mẫu nhịp tim
thể hiện bệnh. Vì vậy các nghiên cứu ứng
dụng học sâu trong lĩnh vực liên quan đến tín
hiệu ECG vẫn chưa thực sự dồi dào do giới
hạn về mặt dữ liệu. Nghiên cứu này của
chúng tơi mở ra một hướng giải quyết để xây
dựng các mơ hình học sâu trong điều kiện hạn
chế về mặt dữ liệu. Ngồi ra, điểm chung của
các nghiên cứu kể trên là việc phân loại được
thực hiện trên đoạn tín hiệu ECG dài (như bộ
dữ liệu PCCC 2017 các tín hiệu dài 9 đến 61
giây). Trong khi đĩ đặc điểm của rất nhiều
bệnh tim (trong đĩ cĩ bệnh rung nhĩ) là các
dấu hiệu bất thường chỉ xảy ra bất chợt trong
vài giây, đặt ra nhu cầu trong việc xác định
được các mẫu tín hiệu nhịp tim bệnh trên cả
đoạn tín hiệu dài. Phương pháp đề xuất của
chúng tơi cũng cĩ khả năng phát hiện các mẫu
tín hiệu ngắn bất thường xuất hiện trong đoạn
tín hiệu dài.
Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91
87
PHƯƠNG PHÁP ĐỀ XUẤT
Phương pháp chúng tơi đề xuất gồm các bước
phân đoạn tín hiệu điện tim ngắn, lọc các
đoạn tín hiệu điện tim ngắn sử dụng bộ phân
lớp XGBoost, huấn luyện và thử nghiệm nhận
dạng các đoạn tín hiệu điện tim ngắn sử dụng
phương pháp học sâu.
Phân đoạn tín hiệu điện tim ngắn
Để cĩ thể phát hiện các mẫu tín hiệu bất
thường trong tín hiệu điện tim, chúng tơi thực
hiện đánh giá trên từng đoạn tín hiệu điện tim
ngắn. Vì tín hiệu ngắn nhất trong bộ dữ liệu
PCCC 2017 cĩ độ dài 2352 mẫu, và vì thơng
tin chúng tơi sử dụng để huấn luyện mơ hình
học sâu là thơng tin trên miền tần số, do vậy
chúng tơi chọn độ dài của đoạn tín hiệu điện
tim là 2048 mẫu (giá trị lũy thừa của 2 lớn
nhất nhỏ hơn độ dài trên).
Như đã trình bày ở phần trên, để cĩ thể huấn
luyện mạng nơ ron sâu hiệu quả thì cần cĩ bộ
dữ liệu lớn và cĩ phân bố đồng đều giữa các
lớp. Tuy nhiên bộ dữ liệu của PCCC 2017 lại
cĩ sự phân bố khơng đồng đều giữa các lớp
(mục 4.1). Do đĩ để tạo sự cân bằng dữ liệu
giữa các lớp trong tập dữ liệu huấn luyện,
chúng tơi lựa chọn khoảng dịch khi thực hiện
phân đoạn dựa vào lớp của tín hiệu. Chúng tơi
chọn cố định 20000 đoạn tín hiệu điện tim
ngắn cho từng lớp. Như vậy với lớp cĩ nhiều
mẫu thì độ dịch lớn và ngược lại với lớp cĩ ít
mẫu thì độ dịch nhỏ. Từ đĩ với từng lớp
Normal, AF, Other và Noise, chúng tơi tính
được khoảng dịch là 2248 điểm, 150 điểm,
400 điểm và 35 điểm.
Lọc các tín hiệu điện tim ngắn
Vì trong cả một tín hiệu điện tim dài, đã phần
là ở dạng Normal, các dạng tín hiệu điện tim
bất thường như AF, Other và Noise chỉ xuất
hiện rải rác. Như vậy khơng phải tất cả các
đoạn trong mẫu AF (Other/Noise) đều được
gán nhãn là AF. Do vậy chúng tơi đã xây
dựng một bộ lọc dựa trên mơ hình XGBoost
để gán nhãn lại cho từng đoạn tín hiệu điện
tim ngắn.
Đầu tiên chúng tơi thực hiện trích chọn đặc
trưng. Các đặc trưng phổ biến cho tín hiệu
ECG đã được phát triển và chọn lọc từ nhiều
nghiên cứu trước [2], như các đặc trưng xử lý
tín hiệu số sử dụng biến đổi wavelet [17], các
đặc trưng về hình thái sĩng [18] hay sử dụng
mạng nơ-ron để xác định các đặc trưng cho
tín hiệu ECG [19]. Ở trong nghiên cứu này,
chúng tơi sử dụng 2 nhĩm đặc trưng của tín
hiệu ECG.
Hình 1. Lựa chọn đoạn tín hiệu để huấn luyện mơ
hình deep learning cho lớp Normal
Các đặc trưng thống kê: Một mẫu tín hiệu
ECG đặc trưng sẽ xuất hiện các sĩng P-QRS-
T. Các thơng tin liên quan đến vị trí, khoảng
cách, biên độ các sĩng này trên mỗi tín hiệu
sẽ được thu thập. Ví dụ: các biên độ của sĩng
R, các vị trí của sĩng R, các khoảng cách giữa
2 đỉnh R, ... Các hàm thống kê như average,
median, standard deviation, min, max,
percentile [75%, 25%, 90%, 10%] được sử
dụng để rút ra những đặc trưng thống kê trên
mỗi miền đặc trưng thu thập được.
Các đặc trưng biến đổi nhịp tim (HRV, Heart-
Rate Variability) [14]: các đặc trưng HRV
được trích xuất từ tín hiệu ECG qua các đặc
trưng miền thời gian, miền tần số và phân tích
thống kê, cung cấp thơng tin về sự thay đổi
giữa các nhịp tim liên tiếp. Chúng tơi sử dụng
bộ cơng cụ Neurokit [15] để trích xuất các
đặc trưng này.
Chúng tơi sử dụng những đặc trưng trên để
huấn luyện bộ phân lớp sử dụng mơ hình
XGBoost. Đầu vào của bộ phân lớp là một
đoạn tín hiệu điện tim ngắn và đầu ra là 1
trong 4 lớp Normal, AF, Other và Noise. Tiếp
Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91
88
theo đoạn tín hiệu điện tim ngắn được mơ
hình XGBoost nhận dạng khác với lớp của
mẫu chứa đoạn tín hiệu này thì đoạn tín hiệu
này sẽ bị loại bỏ [Hình 1]. Sau đĩ chúng tơi
chuyển đổi đoạn tín hiệu ECG này sang dạng
ảnh phổ tẩn số [Hình 2].
Hình 2. Ví dụ ảnh phổ tần số của đoạn tín hiệu
ECG
Huấn luyện mạng nơ ron sâu để nhận dạng
bệnh rung nhĩ
Ảnh phổ tần số (224x224x3)
Mạng VGG16
Lớp kết nối đầy đủ (25088)
Lớp kết nối đầy đủ (2048)
Lớp kết nối đầy đủ (2048)
Kết quả nhận dạng (4)
Hình 3. Kiến trúc mơ hình học sâu
Chúng tơi đề xuất kiến trúc mơ hình học sâu
mới dựa trên mơ hình mạng CNN để nhận
dạng một đoạn tín hiệu điện tim ngắn thuộc
vào một trong 4 lớp Normal, AF, Other và
Noise [Hình 3]. Các mạng CNNs thường bao
gồm 2 thành phần chính: phần trích xuất đặc
trưng (các lớp convolution) và phần phân loại
(là các lớp fully-connected). Chúng tơi áp
dụng phương pháp “transfer learning” theo
cách dùng 1 một mạng CNN đã xây dựng sẵn
để làm bộ trích xuất đặc trưng. Phần trích
xuất đặc trưng của nhiều mơ hình CNNs đã
được huấn luyện trên bộ dữ liệu lớn nên cĩ
khả năng học được các đặc trưng tốt cho phần
lớn các dữ liệu cùng loại. Ở đây chúng tơi
chọn mạng VGG-16 vì hai nguyên nhân. Thứ
nhất mạng VGG-16 đạt thứ hạng rất cao (thứ
2) trong cuộc thi phân loại ảnh ImageNet
2014 [21]. Nguyên nhân thứ 2 là mạng VGG-
16 cĩ số tầng khơng quá lớn, vì vậy phù hợp
với bài tốn cĩ bộ dữ liệu hạn chế như bài
tốn điện tim. Đầu vào của mạng VGG-16 là
các ảnh cĩ kích thước 224x224x3. Vector đặc
trưng đầu ra của khối convolution trong mạng
VGG-16 cĩ kích thước 25088 chiều. Chúng
tơi xây dựng thêm một số lớp kết nối đầy đủ
(fully-connected) phù hợp cho việc phân loại
các tín hiệu ECG.
THỬ NGHIỆM VÀ ĐÁNH GIÁ
Bộ dữ liệu PCCC 2017
Bộ dữ liệu được sử dụng trong cuộc thi PCCC
2017 bao gồm 8528 bản ghi ECG đơn kênh ở
tần số 300Hz, với độ dài khác nhau, từ 9 giây
(2700 giá trị) đến 61 giây (18300 giá trị). Dữ
liệu được gán nhãn thành 4 lớp: N (Normal)
bao gồm các tín hiệu nhịp tim thơng thường,
A (AF) là các tín hiệu nhịp tim của người bị
rung nhĩ, O (Other) là các tín hiệu nhịp tim
bệnh khác, ~ (Noise) là các tín hiệu nhiễu. Số
lượng các mẫu trong từng lớp là khơng cân
bằng, phần lớn là các mẫu Normal với 5076
mẫu và Other với 2415 mẫu. Số lượng mẫu
AF và Noise rất ít với 758 và 279 mẫu.
Hình 3. Phân bố chiều dài của các mẫu dữ
liệu trong tập huấn luyện (hình bên trái), tập xác
thực (hình ở giữa) và tập thử nghiệm (hình bên
phải), đồng thời tương ứng với 4 lớp Normal
(dịng trên cùng), AF (dịng thứ hai), Other (dịng
thứ ba) và Noise (dịng thứ tư).
Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91
89
Chúng tơi chia dữ liệu thành 3 tập: tập huấn
luyện (Training), tập xác thực (Validation),
tập kiểm tra (Test). Trong đĩ, 70% số mẫu
của mỗi lớp được dùng cho Training, 15%
mẫu mỗi lớp dùng cho Validation, 15% mẫu
mỗi lớp dùng cho Test.
Nhìn hình 1 chúng tơi nhận thấy đa phần các
bản ghi cĩ chiều dài 9000 mẫu (tương ứng
với 30 giây). Tuy cịn cĩ những bản ghi cĩ
chiều dài rất ngắn (khoảng 2500 mẫu) hoặc cĩ
những bản ghi cĩ chiều dài lớn (khoảng
18000 mẫu), tuy nhiên số lượng các bản ghi
này khá nhỏ. Sự phân bố này đồng đều cho tất
cả 4 lớp Normal, AF, Other, Noise, cũng như
cĩ sự phân bố đồng đều trên các tập huấn
luyện, tập xác thực và tập thử nghiệm.
Độ chính xác của mơ hình được đánh giá bằng
giá trị F1 = (F1n + F1a + F1o + F1n)/4, trong
đĩ F1n, F1a, F1o, F1n lần lượt là giá trị F1 tính
trên từng lớp Normal, AF, Other và Noise.
Phân loại tín hiệu gốc dùng XGBoost
Như chúng tơi đã đề cập, tín hiệu ECG thu
thập qua các thiết bị cầm tay thường gồm rất
nhiều nhiễu, vì vậy chúng tơi cũng kết hợp
thử nghiệm việc lọc nhiễu tín hiệu trước khi
đưa vào XGBoost. Chúng tơi phân rã tín hiệu
thành các thành phần tần số khác nhau theo
kỹ thuật Wavelet Multi-Resolution Analysis,
sử dụng DWT, hàm ‘db6’, mức phân rã là 9.
Những tín hiệu thành phần cĩ tần số khơng
phù hợp như D1 và D9 sẽ được loại bỏ.
Bảng 1. Kết quả thử nghiệm phân lớp tín hiệu
điện tim sử dụng bộ phân lớp XGBoost (tính theo
F1-score)
Đặc trưng
Dữ liệu
gốc
Dữ liệu
lọc nhiễu
Thống kê 0.7133 0.6898
Thống kê + HRV 0.7222 0.7421
Chúng tơi thử nghiệm mơ hình phân lớp
XGBoost trên các loại đặc trưng khác nhau:
đặc trưng thống kê và đặc trưng HRV. Các
đặc trưng sẽ được trích xuất trên cả 2 bộ dữ
liệu gốc và bộ dữ liệu đã được lọc nhiễu. Kết
quả phân lớp tính theo F1-score được liệt kê
trong Bảng 1.
Như vậy, lọc nhiễu giúp mơ hình dự đốn
chính xác hơn ngoại trừ trường hợp chỉ dùng
đặc trưng thống kê. Việc tăng cường thêm đặc
trưng cũng giúp mơ hình đạt được kết quả cao
hơn cho dữ liệu gốc.
Kết quả nhận dạng các đoạn tín hiệu ngắn
ECG
Chúng tơi thử nghiệm huấn luyện tối ưu mạng
theo hai hàm loss: Cross-entropy loss và F1
loss [5]. Kết quả phân loại F1-score được
tổng hợp trong bảng 2. Kết quả ở bảng 2 cho
thấy việc tối ưu trực tiếp theo F1 đem lại kết
quả trên F1-score tốt hơn (0.8397 so với
0.8304). Các mơ hình thường gặp nhầm lẫn
nhiều ở các trường hợp: AF bị nhầm thành
Other và ngược lại. Trường hợp này thường
dễ xảy ra do nhiều bệnh lý về tim khác
(Other) cũng xuất hiện những dấu hiệu bất
thường về nhịp tim như rung nhĩ, trong khi đĩ
các hình thái của bệnh rung nhĩ cũng khá đa
dạng. Kết quả F1 = 0.8397 là tương đương
với kết quả của top 1 trong cuộc thi PCCC
2017. Sự khác biệt cũng như ưu điểm trong
phương pháp của chúng tơi là mơ hình cĩ thể
dự đốn cho mẫu tín hiệu ngắn hơn.
Bảng 2. Kết quả nhận dạng (F1) các đoạn tín hiệu
ECG khi tối ưu theo cross-entropy loss và F1-score
Lớp
Tối ưu theo
cross entropy
loss
Tối ưu theo
F1-score
Normal 0.8747 0.8759
AF 0.8316 0.8427
Other 0.6915 0.7098
Noise 0.9239 0.9302
F1 trung bình 0.8304 0.8397
KẾT LUẬN
Trong nghiên cứu này, chúng tơi đã đề xuất
một hướng giải quyết mới cho việc ứng dụng
học sâu trên các bài tốn gặp hạn chế về dữ
liệu nĩi chung và bài tốn phân loại tín hiệu
ECG nĩi riêng. Phương pháp của chúng tơi
kết hợp 2 mơ hình XGBoos và học sâu trong
đĩ XGBoost được xây dựng trước và đĩng
Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91
90
vai trị sinh dữ liệu cho mơ hình học sâu.
Chúng tơi đã thử nghiệm cho bộ dữ liệu của
cuộc thi PCCC 2017 và đạt được kết quả F1-
score, tương đương với top 1 cho các đoạn tín
hiệu ngắn. Nghiên cứu của chúng tơi mở ra
một hướng phát triển thiết thực trong lĩnh vực
liên quan đến tín hiệu ECG, đĩ là việc phát
hiện cĩ đoạn tín hiệu bất thường trong tồn bộ
bản ghi ECG đo được. Kết quả thực nghiệm
của chúng tơi trên mơ hình học sâu cho thấy
hiệu quả của các kiến trúc mạng DNNs.
Trong tương lai, chúng tơi sẽ tiếp tục tinh
chỉnh bộ dữ liệu, thơng qua việc cải tiến, tăng
cường, tinh lọc các đặc trưng cho mơ hình
XGBoost đồng thời xem xét việc thử nghiệm
nhiều kiến trúc mạng khác bên cạnh VGG-16.
Một hướng phát triển khác là kết hợp nhiều
thơng tin khác cho kiến trúc mạng DNNs.
Thay vì chỉ cĩ ảnh phổ tần số, chúng tơi cĩ
thể kết hợp thêm các ảnh biên độ-thời gian,
hoặc các đặc trưng chuyên gia trích xuất từ tín
hiệu ECG gốc.
LỜI CÁM ƠN
Nghiên cứu này được tài trợ bởi Trường Đại
học Bách Khoa Hà Nội trong đề tài mã số
T2017-PC-080.
REFERENCES
1. X. Du, S.M. George (2008), “Thickness
dependence of sensor response for CO gas sensing
by tin oxide films grown using atomic layer
deposition”, Sens. Actuators B, 135, pp. 152-160.
2. G. D. Clifford et al. (2017), “AF classification
from a short single lead ECG recording: The
PhysioNet/computing in cardiology challenge
2017,” 2017 Computing in Cardiology (CinC),
Rennes, pp. 1-4.
3. Karpagachelvi S., Dr Arthanari M., SivaKumar
M. (2010), “ECG feature extraction techniques - a
survey approach”, Int. J. Comput. Sci. Inf.
Security, Vol. 8, No. 1, pp. 76-80.
4. Rẳl Alcaraz, Daniel Abásolo, Roberto
Hornero, José J. Rieta (2010), “Optimal
parameters study for sample entropy-based atrial
fibrillation organization analysis,” Computer
Methods and Programs in Biomedicine, Vol. 99,
Issue 1, 2010, pp. 124-132.
5. Tianqi Chen and Carlos Guestrin (2016),
“XGBoost: A Scalable Tree Boosting System,” In
22nd SIGKDD Conference on Knowledge
Discovery and Data Mining, pp. 785-794.
6. Scherzinger, Aaron & Klemm, Sưren & Berh,
Dimitri & Jiang, Xiaoyi. (2017), “CNN-Based
Background Subtraction for Long-Term In-Vial
FIM Imaging”, In CAIP, Proceedings, pp. 359-371.
7. Teijeiro T., García C. A., Castro D. & Félix P.
(2017), Arrhythmia Classification from the
Abductive
8. Interpretation of Short Single-Lead ECG
Records, Computing in Cardiology, Vol. arXiv
preprint 1711.03892.
9. G. Bin, M. Shao, G. Bin, J. Huang, D. Zheng
and S. Wu (2017), “Detection of atrial fibrillation
using decision tree ensemble,” 2017 Computing in
Cardiology (CinC), Rennes, pp. 1-4.
10. M. Zabihi, A. B. Rad, A. K. Katsaggelos, S.
Kiranyaz, S. Narkilahti and M. Gabbouj (2017),
"Detection of atrial fibrillation in ECG hand-held
devices using a random forest classifier," 2017
Computing in Cardiology (CinC), Rennes, pp. 1-4.
11. N. Emanet (2009), "ECG beat classification by
using discrete wavelet transform and Random
Forest algorithm," 2009 Fifth International
Conference on Soft Computing, Computing with
Words and Perceptions in System Analysis,
Decision and Control, Famagusta, pp. 1-4.
12. Pyakillya B., N. Kazachenko, and N.
Mikhailovsky (2017), “Deep Learning for ECG
Classification”, Journal of Physics: Conference
Series, Vol. 913. No. 1. IOP Publishing.
13. Mohamad M. Al Rahhal et al. (2018),
“Convolutional neural networks for
electrocardiogram classification”, Journal of
Medical and Biological Engineering.
14. V. G. Sujadevi, K. P. Soman, and R.
Vinayakumar (2018), “Real-time detection of
atrial fibrillation from short time single lead ecg
traces using recurrent neural networks,” in
Intelligent Systems Technologies and Applications
(S. M. Thampi, S. Mitra, J. Mukhopadhyay, K.-C.
Li, A. P. James, and S. Berretti, eds.), (Cham), pp.
212–221, Springer International Publishing.
14. M. Zihlmann, D. Perekrestenko and M.
Tschannen (2017), "Convolutional recurrent
neural networks for electrocardiogram
classification," 2017 Computing in Cardiology
(CinC), Rennes, pp. 1-4.
15. Zohar A. H., Cloninger C. R., McCraty R.
(2013), “Personality and Heart Rate Variability:
Exploring Pathways from Personality to Cardiac
Coherence and Health”, Journal of Social
Sciences, 1(6), pp. 32–39.
16. Makowski D. (2016), NeuroKit: A Python
Toolbox for Statistics and Neurophysiological
Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91
91
Signal Processing (EEG, EDA, ECG, EMG...),
Memory and Cognition Lab' Day, 01 November,
Paris, France.
17. K. Simonyan and A. Zisserman (2014), “Very
deep convolutional networks for large-scale image
recognition”, CoRR, Vol. abs/1409.1556.
18. B. Castro, D. Kogan and A. B. Geva (2000),
"ECG feature extraction using optimal mother
wavelet," 21st IEEE Convention of the Electrical
and Electronic Engineers in Israel. Proceedings
(Cat. No.00EX377), Tel-Aviv, pp. 346-350.
19. C. Alexakis, H. O. Nyongesa, R. Saatchi, N.
D. Harris, C. Davies, C. Emery, R. H. Ireland, and
S. R. Heller (2003), “Feature Extraction and
Classification of Electrocardiogram (ECG) Signals
Related to Hypoglycaemia”, Conference on
computers in Cardiology, Vol. 30, pp. 537-540.
20. Kuo-Kuang Jen, and Yean-Ren Hwang (2008),
“ECG Feature Extraction and Classification Using
Cepstrum and Neural Networks”, Journal of
Medical and Biological Engineering, Vol. 28, No.
1, pp. 31-37.
21. Justin Johnson, Andrej Karpathy, Transfer
learning, 2018,
learning/
ImageNet Dataset,
ABSTRACT
ATRIAL FIBRILLATION RECOGNITION
USING XGBOOST AND DEEP LEARNING
Nguyễn Hồng Quang1*, Trịnh Văn Loan1, Phạm Ngọc Hưng3,
Hà Quang Thái
2
, Bùi Trung Anh
2, Phan Cơng Mạnh2
1Hanoi University of Science and Technology,
2Toshiba (Vietnam) Software Development Co., Ltd.,
3Hung Yen University of Technology and Education
This article proposes a method for classification of atrial fibrillation signals measured from hand-
held ECG devices. Our approach utilizes the XGBoost combination and deep learning model, in
which XGBoost is built on a feature set that is enhanced and refined experimentally, performing
the role of data generation. We use segmentation and labeling techniques for signal segments,
which enhances, balances and relies on data sets. Deep learning with transfer learning approaches
is used to classify signal segments in the form of spectral representation. We tested the model on
the PhysioNet / Computing in Cardiology Challenge 2017 (PCCC 2017) database to classify four
types of signals: atrial fibrillation, normal, other types of heart disease and noise. Deep modeling
demonstrates the ability to predict well on short data segments with F1 = 0.8397 results. Our
research paves the way for a new ECG signal classification problem when performing
classification on short signal segments, while providing a solution for applying deep learning
models when the problem arises with data limitations.
Keywords: ECG signal, Atrial fibrillation, Deep Learning, XGBoost, Discrete Wavelet
Transform
Ngày nhận bài: 08/10/2018; Ngày hồn thiện: 17/10/2018; Ngày duyệt đăng: 30/11/2018
*
Tel: 0978 813688, Email: quangnh@soict.hust.edu.vn
Các file đính kèm theo tài liệu này:
- 129_157_1_pb_2807_2125114.pdf