Phân loại bệnh rung nhĩ dùng xgboost và học sâu

Tài liệu Phân loại bệnh rung nhĩ dùng xgboost và học sâu: Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91 85 PHÂN LOẠI BỆNH RUNG NHĨ DÙNG XGBOOST VÀ HỌC SÂU Nguyễn Hồng Quang1*, Trịnh Văn Loan1, Phạm Ngọc Hưng3, Hà Quang Thái 2 , Bùi Trung Anh 2, Phan Cơng Mạnh2 1Trường Đại học Bách Khoa Hà Nội, 2Cơng ty TNHH phát triển phần mềm Toshiba (Việt Nam), 3Trường Đại học Sư phạm Kỹ thuật Hưng Yên TĨM TẮT Bài báo này đề xuất một phương pháp phân loại tín hiệu rung nhĩ được đo từ các thiết bị điện tâm đồ (ECG) cầm tay. Phương pháp tiếp cận của chúng tơi sử dụng kết hợp XGBoost và mơ hình học sâu (deep learning) trong đĩ XGBoost được xây dựng trên bộ đặc trưng được tăng cường và tinh chỉnh qua thực nghiệm, thực hiện vai trị sinh dữ liệu cho mơ hình học sâu. Chúng tơi sử dụng các kỹ thuật phân đoạn và sinh nhãn cho các đoạn tín hiệu, giúp tăng cường, tạo sự cân bằng và độ tin cậy cho bộ dữ liệu. Mơ hình học sâu với hướng tiếp cận học chuyển đổi (transfer learning) được sử dụng để thực hiện phân loạ...

7 trang | Chia sẻ: quangot475 | Lượt xem: 420 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Phân loại bệnh rung nhĩ dùng xgboost và học sâu, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91 85 PHÂN LOẠI BỆNH RUNG NHĨ DÙNG XGBOOST VÀ HỌC SÂU Nguyễn Hồng Quang1*, Trịnh Văn Loan1, Phạm Ngọc Hưng3, Hà Quang Thái 2 , Bùi Trung Anh 2, Phan Cơng Mạnh2 1Trường Đại học Bách Khoa Hà Nội, 2Cơng ty TNHH phát triển phần mềm Toshiba (Việt Nam), 3Trường Đại học Sư phạm Kỹ thuật Hưng Yên TĨM TẮT Bài báo này đề xuất một phương pháp phân loại tín hiệu rung nhĩ được đo từ các thiết bị điện tâm đồ (ECG) cầm tay. Phương pháp tiếp cận của chúng tơi sử dụng kết hợp XGBoost và mơ hình học sâu (deep learning) trong đĩ XGBoost được xây dựng trên bộ đặc trưng được tăng cường và tinh chỉnh qua thực nghiệm, thực hiện vai trị sinh dữ liệu cho mơ hình học sâu. Chúng tơi sử dụng các kỹ thuật phân đoạn và sinh nhãn cho các đoạn tín hiệu, giúp tăng cường, tạo sự cân bằng và độ tin cậy cho bộ dữ liệu. Mơ hình học sâu với hướng tiếp cận học chuyển đổi (transfer learning) được sử dụng để thực hiện phân loại các đoạn tín hiệu dưới dạng ảnh phổ tần số. Chúng tơi thử nghiệm mơ hình trên bộ dữ liệu của cuộc thi PhysioNet/Computing in Cardiology Challenge 2017 (PCCC 2017) để phân loại 4 loại tín hiệu: rung nhĩ, bình thường, các loại bệnh tim khác và nhiễu. Mơ hình học sâu thể hiện khả năng dự đốn tốt trên các đoạn dữ liệu ngắn với kết quả F1 = 0.8397. Nghiên cứu của chúng tơi mở ra một hướng phát triển mới cho bài tốn phân loại tín hiệu ECG khi thực hiện phân loại trên các đoạn tín hiệu ngắn, đồng thời mang đến một giải pháp ứng dụng các mơ hình học sâu khi bài tốn gặp những hạn chế về mặt dữ liệu. Từ khĩa: Tín hiệu điện tim, Bệnh rung nhĩ, học sâu, XGBoost, mạng nơ ron tích chập, Biến đổi Wavelet rời rạc GIỚI THIỆU* Rung nhĩ (hay rung tâm nhĩ, atrial fibrillation) là một trong những bệnh rối loạn nhịp tim thường gặp. Rung nhĩ cĩ nguy cơ dẫn đến suy tim, đột quỵ, và các biến chứng tim mạch nguy hiểm khác. Người bị bệnh thường phải đến bệnh viện khám định kỳ để theo dõi nhịp tim bằng hệ thống máy đo điện tâm đồ (ECG), tốn kém nhiều thời gian và chi phí. Những năm gần đây các nhà sản xuất đã cho ra đời nhiều loại thiết bị đo ECG cầm tay, giúp việc theo dõi nhịp tim trở nên thuận lợi và nhanh chĩng hơn với người bệnh. Sự phát triển của các thiết bị đo này cũng mở ra nhiều cơ hội cho các nhà phát triển tích hợp các hệ thống phần mềm thơng minh đi kèm. Tuy nhiên, so với việc sử dụng các hệ thống máy đo ECG 12 kênh (12-lead) thơng thường, chất lượng tín hiệu của các thiết bị đo cầm tay sẽ kém hơn do chỉ đo đơn kênh (single-lead) và thường gặp rất nhiều nhiễu do tác động của mơi trường, cũng như sai số do việc đo được * Tel: 0978 813688, Email: quangnh@soict.hust.edu.vn thực hiện bởi những người khơng chuyên. Những điều này đặt ra nhiều thách thức cho việc phát triển các thuật tốn phân loại tín hiệu. Nắm bắt được xu hướng phát triển này, PCCC 2017 đã triển khai đề tài phân biệt tín hiệu bệnh rung nhĩ với các tín hiệu nhịp tim thơng thường, tín hiệu nhiễu hay các tín hiệu bệnh tim khác. Trong nghiên cứu này, chúng tơi đề xuất một phương pháp giải quyết bài tốn phân loại tín hiệu nhịp tim theo hướng tiếp cận sử dụng kết hợp XGBoost và học sâu, trong đĩ XGBoost đĩng vai trị tạo ra dữ liệu, và mơ hình học sâu thực hiện phân loại các mẫu tín hiệu. Trước tiên, chúng tơi trích chọn các đặc trưng từ tín hiệu ECG để xây dựng một mơ hình XGBoost. Các đặc trưng sẽ được điều chỉnh và cải tiến qua quá trình thực nghiệm. Tiếp theo đĩ, mơ hình XGBoost được sử dụng để sinh dữ liệu cho mơ hình học sâu. Chúng tơi áp dụng kỹ thuật học chuyển đổi (transfer learning) trên một mạng CNN (Convolutional Neural Network) được huấn luyện trước (pretrained) là VGG-16 [16], kết hợp với một Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91 86 kiến trúc Multi-layer Perceptron (MLP) với hai lớp ẩn. Bài báo này đề xuất một phương pháp mới cĩ khả năng phát hiện các mẫu tín hiệu ngắn bất thường xuất hiện trong đoạn tín hiệu dài. Chúng tơi thử nghiệm và đánh giá mơ hình này trên dữ liệu của PCCC 2017. Phần tiếp theo sẽ trình bày về các nghiên cứu liên quan. Phần 3 mơ tả phương pháp đề xuất. Phần 4 trình bày kết quả thử nghiệm và đánh giá. Phần 5 là kết luận và định hướng nghiên cứu tiếp theo. CÁC NGHIÊN CỨU LIÊN QUAN Bài tốn phân loại tín hiệu ECG đã được các nhà nghiên cứu thử nghiệm và tiếp cận theo nhiều hướng khác nhau. Hướng nghiên cứu trích chọn đặc trưng (feature engineering) kết hợp các thuật tốn phân lớp trong họ cây quyết định là một hướng tiếp cận phổ biến và hiệu quả. Chẳng hạn như Teijeiro và cộng sự [6] (đạt kết quả tốt nhất của PCCC 2017) đã thử nghiệm trên 79 đặc trưng, bao gồm các đặc trưng hình thái, đặc trưng thống kê và sử dụng XGBoost để tối ưu trên 8-fold cross- validation. Zabihi và cộng sự [8] cũng sử dụng 491 đặc trưng, bao gồm các đặc trưng về hình thái miền thời gian, các đặc trưng miền tần số, các đặc trưng miền thời gian-tần số; sau đĩ 150 đặc trưng được lựa chọn và sử dụng bộ phân lớp Random Forest. Bin và cộng sự [7] sử dụng các đặc trưng riêng của bệnh rung nhĩ, hay các đặc trưng liên quan đến khoảng RR (khoảng cách giữa 2 đỉnh R của tín hiệu điện tim), sử dụng tập hợp cây quyết định huấn luyện bằng thuật tốn AdaBoost.M2. Trên bộ dữ liệu MIT/BIH gồm 5 loại nhịp tim, Emanet trích chọn các đặc trưng từ tín hiệu ECG sử dụng biến đổi wavelet rời rạc (Discrete Wavelet Transform) kết hợp với bộ phân lớp Random Forest và đạt độ chính xác 99.8% [9]. Bên cạnh hướng trích chọn đặc trưng, khơng nằm ngồi xu hướng chung, học sâu cũng được thử nghiệm cho bài tốn phân loại tín hiệu ECG. Các nghiên cứu sử dụng mạng CNNs cĩ thể kể đến Pyakillya và cộng sự [10] sử dụng 7 lớp 1D-CNNs và 3 lớp FC (Fully Connected) với đầu vào là dữ liệu chuỗi thời gian (time series), hay Al Rahhal và cộng sự [11] sử dụng CNNs với hướng tiếp cận transfer learning. Ngồi ra, các kiến trúc RNNs, GRU hay LSTM là một hướng triển vọng khác cho dữ liệu dạng time series như ECG. Sujadevi và cộng sự [12] sử dụng bộ dữ liệu MIT-BIH Physionet để thử nghiệm các kiến trúc RNNs, GRU, LSTM trên tín hiệu gốc, khơng cần qua các bước tiền xử lý như khử nhiễu hay lọc tín hiệu nhưng đạt độ chính xác 95% đến 100%. Mohamad M. Al Rahhal và cộng sự [13] thử nghiệm kết hợp CNN và LSTM (CRNN) trên dữ liệu ảnh phổ tần số được biến đổi từ tín hiệu ECG gốc. Các mơ hình học sâu là một hướng tiếp cận phổ biến trong nhiều lĩnh vực với hiệu quả vượt trội so với nhiều thuật tốn học máy truyền thống khác. Tuy nhiên học sâu thường chỉ phù hợp cho các bài tốn cĩ kích thước dữ liệu lớn. Trong khi đĩ các bộ dữ liệu về ECG như bộ dữ liệu của PCCC 2017 thường bị giới hạn về số lượng, đặc biệt là các mẫu nhịp tim thể hiện bệnh. Vì vậy các nghiên cứu ứng dụng học sâu trong lĩnh vực liên quan đến tín hiệu ECG vẫn chưa thực sự dồi dào do giới hạn về mặt dữ liệu. Nghiên cứu này của chúng tơi mở ra một hướng giải quyết để xây dựng các mơ hình học sâu trong điều kiện hạn chế về mặt dữ liệu. Ngồi ra, điểm chung của các nghiên cứu kể trên là việc phân loại được thực hiện trên đoạn tín hiệu ECG dài (như bộ dữ liệu PCCC 2017 các tín hiệu dài 9 đến 61 giây). Trong khi đĩ đặc điểm của rất nhiều bệnh tim (trong đĩ cĩ bệnh rung nhĩ) là các dấu hiệu bất thường chỉ xảy ra bất chợt trong vài giây, đặt ra nhu cầu trong việc xác định được các mẫu tín hiệu nhịp tim bệnh trên cả đoạn tín hiệu dài. Phương pháp đề xuất của chúng tơi cũng cĩ khả năng phát hiện các mẫu tín hiệu ngắn bất thường xuất hiện trong đoạn tín hiệu dài. Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91 87 PHƯƠNG PHÁP ĐỀ XUẤT Phương pháp chúng tơi đề xuất gồm các bước phân đoạn tín hiệu điện tim ngắn, lọc các đoạn tín hiệu điện tim ngắn sử dụng bộ phân lớp XGBoost, huấn luyện và thử nghiệm nhận dạng các đoạn tín hiệu điện tim ngắn sử dụng phương pháp học sâu. Phân đoạn tín hiệu điện tim ngắn Để cĩ thể phát hiện các mẫu tín hiệu bất thường trong tín hiệu điện tim, chúng tơi thực hiện đánh giá trên từng đoạn tín hiệu điện tim ngắn. Vì tín hiệu ngắn nhất trong bộ dữ liệu PCCC 2017 cĩ độ dài 2352 mẫu, và vì thơng tin chúng tơi sử dụng để huấn luyện mơ hình học sâu là thơng tin trên miền tần số, do vậy chúng tơi chọn độ dài của đoạn tín hiệu điện tim là 2048 mẫu (giá trị lũy thừa của 2 lớn nhất nhỏ hơn độ dài trên). Như đã trình bày ở phần trên, để cĩ thể huấn luyện mạng nơ ron sâu hiệu quả thì cần cĩ bộ dữ liệu lớn và cĩ phân bố đồng đều giữa các lớp. Tuy nhiên bộ dữ liệu của PCCC 2017 lại cĩ sự phân bố khơng đồng đều giữa các lớp (mục 4.1). Do đĩ để tạo sự cân bằng dữ liệu giữa các lớp trong tập dữ liệu huấn luyện, chúng tơi lựa chọn khoảng dịch khi thực hiện phân đoạn dựa vào lớp của tín hiệu. Chúng tơi chọn cố định 20000 đoạn tín hiệu điện tim ngắn cho từng lớp. Như vậy với lớp cĩ nhiều mẫu thì độ dịch lớn và ngược lại với lớp cĩ ít mẫu thì độ dịch nhỏ. Từ đĩ với từng lớp Normal, AF, Other và Noise, chúng tơi tính được khoảng dịch là 2248 điểm, 150 điểm, 400 điểm và 35 điểm. Lọc các tín hiệu điện tim ngắn Vì trong cả một tín hiệu điện tim dài, đã phần là ở dạng Normal, các dạng tín hiệu điện tim bất thường như AF, Other và Noise chỉ xuất hiện rải rác. Như vậy khơng phải tất cả các đoạn trong mẫu AF (Other/Noise) đều được gán nhãn là AF. Do vậy chúng tơi đã xây dựng một bộ lọc dựa trên mơ hình XGBoost để gán nhãn lại cho từng đoạn tín hiệu điện tim ngắn. Đầu tiên chúng tơi thực hiện trích chọn đặc trưng. Các đặc trưng phổ biến cho tín hiệu ECG đã được phát triển và chọn lọc từ nhiều nghiên cứu trước [2], như các đặc trưng xử lý tín hiệu số sử dụng biến đổi wavelet [17], các đặc trưng về hình thái sĩng [18] hay sử dụng mạng nơ-ron để xác định các đặc trưng cho tín hiệu ECG [19]. Ở trong nghiên cứu này, chúng tơi sử dụng 2 nhĩm đặc trưng của tín hiệu ECG. Hình 1. Lựa chọn đoạn tín hiệu để huấn luyện mơ hình deep learning cho lớp Normal Các đặc trưng thống kê: Một mẫu tín hiệu ECG đặc trưng sẽ xuất hiện các sĩng P-QRS- T. Các thơng tin liên quan đến vị trí, khoảng cách, biên độ các sĩng này trên mỗi tín hiệu sẽ được thu thập. Ví dụ: các biên độ của sĩng R, các vị trí của sĩng R, các khoảng cách giữa 2 đỉnh R, ... Các hàm thống kê như average, median, standard deviation, min, max, percentile [75%, 25%, 90%, 10%] được sử dụng để rút ra những đặc trưng thống kê trên mỗi miền đặc trưng thu thập được. Các đặc trưng biến đổi nhịp tim (HRV, Heart- Rate Variability) [14]: các đặc trưng HRV được trích xuất từ tín hiệu ECG qua các đặc trưng miền thời gian, miền tần số và phân tích thống kê, cung cấp thơng tin về sự thay đổi giữa các nhịp tim liên tiếp. Chúng tơi sử dụng bộ cơng cụ Neurokit [15] để trích xuất các đặc trưng này. Chúng tơi sử dụng những đặc trưng trên để huấn luyện bộ phân lớp sử dụng mơ hình XGBoost. Đầu vào của bộ phân lớp là một đoạn tín hiệu điện tim ngắn và đầu ra là 1 trong 4 lớp Normal, AF, Other và Noise. Tiếp Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91 88 theo đoạn tín hiệu điện tim ngắn được mơ hình XGBoost nhận dạng khác với lớp của mẫu chứa đoạn tín hiệu này thì đoạn tín hiệu này sẽ bị loại bỏ [Hình 1]. Sau đĩ chúng tơi chuyển đổi đoạn tín hiệu ECG này sang dạng ảnh phổ tẩn số [Hình 2]. Hình 2. Ví dụ ảnh phổ tần số của đoạn tín hiệu ECG Huấn luyện mạng nơ ron sâu để nhận dạng bệnh rung nhĩ Ảnh phổ tần số (224x224x3) Mạng VGG16 Lớp kết nối đầy đủ (25088) Lớp kết nối đầy đủ (2048) Lớp kết nối đầy đủ (2048) Kết quả nhận dạng (4) Hình 3. Kiến trúc mơ hình học sâu Chúng tơi đề xuất kiến trúc mơ hình học sâu mới dựa trên mơ hình mạng CNN để nhận dạng một đoạn tín hiệu điện tim ngắn thuộc vào một trong 4 lớp Normal, AF, Other và Noise [Hình 3]. Các mạng CNNs thường bao gồm 2 thành phần chính: phần trích xuất đặc trưng (các lớp convolution) và phần phân loại (là các lớp fully-connected). Chúng tơi áp dụng phương pháp “transfer learning” theo cách dùng 1 một mạng CNN đã xây dựng sẵn để làm bộ trích xuất đặc trưng. Phần trích xuất đặc trưng của nhiều mơ hình CNNs đã được huấn luyện trên bộ dữ liệu lớn nên cĩ khả năng học được các đặc trưng tốt cho phần lớn các dữ liệu cùng loại. Ở đây chúng tơi chọn mạng VGG-16 vì hai nguyên nhân. Thứ nhất mạng VGG-16 đạt thứ hạng rất cao (thứ 2) trong cuộc thi phân loại ảnh ImageNet 2014 [21]. Nguyên nhân thứ 2 là mạng VGG- 16 cĩ số tầng khơng quá lớn, vì vậy phù hợp với bài tốn cĩ bộ dữ liệu hạn chế như bài tốn điện tim. Đầu vào của mạng VGG-16 là các ảnh cĩ kích thước 224x224x3. Vector đặc trưng đầu ra của khối convolution trong mạng VGG-16 cĩ kích thước 25088 chiều. Chúng tơi xây dựng thêm một số lớp kết nối đầy đủ (fully-connected) phù hợp cho việc phân loại các tín hiệu ECG. THỬ NGHIỆM VÀ ĐÁNH GIÁ Bộ dữ liệu PCCC 2017 Bộ dữ liệu được sử dụng trong cuộc thi PCCC 2017 bao gồm 8528 bản ghi ECG đơn kênh ở tần số 300Hz, với độ dài khác nhau, từ 9 giây (2700 giá trị) đến 61 giây (18300 giá trị). Dữ liệu được gán nhãn thành 4 lớp: N (Normal) bao gồm các tín hiệu nhịp tim thơng thường, A (AF) là các tín hiệu nhịp tim của người bị rung nhĩ, O (Other) là các tín hiệu nhịp tim bệnh khác, ~ (Noise) là các tín hiệu nhiễu. Số lượng các mẫu trong từng lớp là khơng cân bằng, phần lớn là các mẫu Normal với 5076 mẫu và Other với 2415 mẫu. Số lượng mẫu AF và Noise rất ít với 758 và 279 mẫu. Hình 3. Phân bố chiều dài của các mẫu dữ liệu trong tập huấn luyện (hình bên trái), tập xác thực (hình ở giữa) và tập thử nghiệm (hình bên phải), đồng thời tương ứng với 4 lớp Normal (dịng trên cùng), AF (dịng thứ hai), Other (dịng thứ ba) và Noise (dịng thứ tư). Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91 89 Chúng tơi chia dữ liệu thành 3 tập: tập huấn luyện (Training), tập xác thực (Validation), tập kiểm tra (Test). Trong đĩ, 70% số mẫu của mỗi lớp được dùng cho Training, 15% mẫu mỗi lớp dùng cho Validation, 15% mẫu mỗi lớp dùng cho Test. Nhìn hình 1 chúng tơi nhận thấy đa phần các bản ghi cĩ chiều dài 9000 mẫu (tương ứng với 30 giây). Tuy cịn cĩ những bản ghi cĩ chiều dài rất ngắn (khoảng 2500 mẫu) hoặc cĩ những bản ghi cĩ chiều dài lớn (khoảng 18000 mẫu), tuy nhiên số lượng các bản ghi này khá nhỏ. Sự phân bố này đồng đều cho tất cả 4 lớp Normal, AF, Other, Noise, cũng như cĩ sự phân bố đồng đều trên các tập huấn luyện, tập xác thực và tập thử nghiệm. Độ chính xác của mơ hình được đánh giá bằng giá trị F1 = (F1n + F1a + F1o + F1n)/4, trong đĩ F1n, F1a, F1o, F1n lần lượt là giá trị F1 tính trên từng lớp Normal, AF, Other và Noise. Phân loại tín hiệu gốc dùng XGBoost Như chúng tơi đã đề cập, tín hiệu ECG thu thập qua các thiết bị cầm tay thường gồm rất nhiều nhiễu, vì vậy chúng tơi cũng kết hợp thử nghiệm việc lọc nhiễu tín hiệu trước khi đưa vào XGBoost. Chúng tơi phân rã tín hiệu thành các thành phần tần số khác nhau theo kỹ thuật Wavelet Multi-Resolution Analysis, sử dụng DWT, hàm ‘db6’, mức phân rã là 9. Những tín hiệu thành phần cĩ tần số khơng phù hợp như D1 và D9 sẽ được loại bỏ. Bảng 1. Kết quả thử nghiệm phân lớp tín hiệu điện tim sử dụng bộ phân lớp XGBoost (tính theo F1-score) Đặc trưng Dữ liệu gốc Dữ liệu lọc nhiễu Thống kê 0.7133 0.6898 Thống kê + HRV 0.7222 0.7421 Chúng tơi thử nghiệm mơ hình phân lớp XGBoost trên các loại đặc trưng khác nhau: đặc trưng thống kê và đặc trưng HRV. Các đặc trưng sẽ được trích xuất trên cả 2 bộ dữ liệu gốc và bộ dữ liệu đã được lọc nhiễu. Kết quả phân lớp tính theo F1-score được liệt kê trong Bảng 1. Như vậy, lọc nhiễu giúp mơ hình dự đốn chính xác hơn ngoại trừ trường hợp chỉ dùng đặc trưng thống kê. Việc tăng cường thêm đặc trưng cũng giúp mơ hình đạt được kết quả cao hơn cho dữ liệu gốc. Kết quả nhận dạng các đoạn tín hiệu ngắn ECG Chúng tơi thử nghiệm huấn luyện tối ưu mạng theo hai hàm loss: Cross-entropy loss và F1 loss [5]. Kết quả phân loại F1-score được tổng hợp trong bảng 2. Kết quả ở bảng 2 cho thấy việc tối ưu trực tiếp theo F1 đem lại kết quả trên F1-score tốt hơn (0.8397 so với 0.8304). Các mơ hình thường gặp nhầm lẫn nhiều ở các trường hợp: AF bị nhầm thành Other và ngược lại. Trường hợp này thường dễ xảy ra do nhiều bệnh lý về tim khác (Other) cũng xuất hiện những dấu hiệu bất thường về nhịp tim như rung nhĩ, trong khi đĩ các hình thái của bệnh rung nhĩ cũng khá đa dạng. Kết quả F1 = 0.8397 là tương đương với kết quả của top 1 trong cuộc thi PCCC 2017. Sự khác biệt cũng như ưu điểm trong phương pháp của chúng tơi là mơ hình cĩ thể dự đốn cho mẫu tín hiệu ngắn hơn. Bảng 2. Kết quả nhận dạng (F1) các đoạn tín hiệu ECG khi tối ưu theo cross-entropy loss và F1-score Lớp Tối ưu theo cross entropy loss Tối ưu theo F1-score Normal 0.8747 0.8759 AF 0.8316 0.8427 Other 0.6915 0.7098 Noise 0.9239 0.9302 F1 trung bình 0.8304 0.8397 KẾT LUẬN Trong nghiên cứu này, chúng tơi đã đề xuất một hướng giải quyết mới cho việc ứng dụng học sâu trên các bài tốn gặp hạn chế về dữ liệu nĩi chung và bài tốn phân loại tín hiệu ECG nĩi riêng. Phương pháp của chúng tơi kết hợp 2 mơ hình XGBoos và học sâu trong đĩ XGBoost được xây dựng trước và đĩng Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91 90 vai trị sinh dữ liệu cho mơ hình học sâu. Chúng tơi đã thử nghiệm cho bộ dữ liệu của cuộc thi PCCC 2017 và đạt được kết quả F1- score, tương đương với top 1 cho các đoạn tín hiệu ngắn. Nghiên cứu của chúng tơi mở ra một hướng phát triển thiết thực trong lĩnh vực liên quan đến tín hiệu ECG, đĩ là việc phát hiện cĩ đoạn tín hiệu bất thường trong tồn bộ bản ghi ECG đo được. Kết quả thực nghiệm của chúng tơi trên mơ hình học sâu cho thấy hiệu quả của các kiến trúc mạng DNNs. Trong tương lai, chúng tơi sẽ tiếp tục tinh chỉnh bộ dữ liệu, thơng qua việc cải tiến, tăng cường, tinh lọc các đặc trưng cho mơ hình XGBoost đồng thời xem xét việc thử nghiệm nhiều kiến trúc mạng khác bên cạnh VGG-16. Một hướng phát triển khác là kết hợp nhiều thơng tin khác cho kiến trúc mạng DNNs. Thay vì chỉ cĩ ảnh phổ tần số, chúng tơi cĩ thể kết hợp thêm các ảnh biên độ-thời gian, hoặc các đặc trưng chuyên gia trích xuất từ tín hiệu ECG gốc. LỜI CÁM ƠN Nghiên cứu này được tài trợ bởi Trường Đại học Bách Khoa Hà Nội trong đề tài mã số T2017-PC-080. REFERENCES 1. X. Du, S.M. George (2008), “Thickness dependence of sensor response for CO gas sensing by tin oxide films grown using atomic layer deposition”, Sens. Actuators B, 135, pp. 152-160. 2. G. D. Clifford et al. (2017), “AF classification from a short single lead ECG recording: The PhysioNet/computing in cardiology challenge 2017,” 2017 Computing in Cardiology (CinC), Rennes, pp. 1-4. 3. Karpagachelvi S., Dr Arthanari M., SivaKumar M. (2010), “ECG feature extraction techniques - a survey approach”, Int. J. Comput. Sci. Inf. Security, Vol. 8, No. 1, pp. 76-80. 4. Rẳl Alcaraz, Daniel Abásolo, Roberto Hornero, José J. Rieta (2010), “Optimal parameters study for sample entropy-based atrial fibrillation organization analysis,” Computer Methods and Programs in Biomedicine, Vol. 99, Issue 1, 2010, pp. 124-132. 5. Tianqi Chen and Carlos Guestrin (2016), “XGBoost: A Scalable Tree Boosting System,” In 22nd SIGKDD Conference on Knowledge Discovery and Data Mining, pp. 785-794. 6. Scherzinger, Aaron & Klemm, Sưren & Berh, Dimitri & Jiang, Xiaoyi. (2017), “CNN-Based Background Subtraction for Long-Term In-Vial FIM Imaging”, In CAIP, Proceedings, pp. 359-371. 7. Teijeiro T., García C. A., Castro D. & Félix P. (2017), Arrhythmia Classification from the Abductive 8. Interpretation of Short Single-Lead ECG Records, Computing in Cardiology, Vol. arXiv preprint 1711.03892. 9. G. Bin, M. Shao, G. Bin, J. Huang, D. Zheng and S. Wu (2017), “Detection of atrial fibrillation using decision tree ensemble,” 2017 Computing in Cardiology (CinC), Rennes, pp. 1-4. 10. M. Zabihi, A. B. Rad, A. K. Katsaggelos, S. Kiranyaz, S. Narkilahti and M. Gabbouj (2017), "Detection of atrial fibrillation in ECG hand-held devices using a random forest classifier," 2017 Computing in Cardiology (CinC), Rennes, pp. 1-4. 11. N. Emanet (2009), "ECG beat classification by using discrete wavelet transform and Random Forest algorithm," 2009 Fifth International Conference on Soft Computing, Computing with Words and Perceptions in System Analysis, Decision and Control, Famagusta, pp. 1-4. 12. Pyakillya B., N. Kazachenko, and N. Mikhailovsky (2017), “Deep Learning for ECG Classification”, Journal of Physics: Conference Series, Vol. 913. No. 1. IOP Publishing. 13. Mohamad M. Al Rahhal et al. (2018), “Convolutional neural networks for electrocardiogram classification”, Journal of Medical and Biological Engineering. 14. V. G. Sujadevi, K. P. Soman, and R. Vinayakumar (2018), “Real-time detection of atrial fibrillation from short time single lead ecg traces using recurrent neural networks,” in Intelligent Systems Technologies and Applications (S. M. Thampi, S. Mitra, J. Mukhopadhyay, K.-C. Li, A. P. James, and S. Berretti, eds.), (Cham), pp. 212–221, Springer International Publishing. 14. M. Zihlmann, D. Perekrestenko and M. Tschannen (2017), "Convolutional recurrent neural networks for electrocardiogram classification," 2017 Computing in Cardiology (CinC), Rennes, pp. 1-4. 15. Zohar A. H., Cloninger C. R., McCraty R. (2013), “Personality and Heart Rate Variability: Exploring Pathways from Personality to Cardiac Coherence and Health”, Journal of Social Sciences, 1(6), pp. 32–39. 16. Makowski D. (2016), NeuroKit: A Python Toolbox for Statistics and Neurophysiological Nguyễn Hồng Quang và Đtg Tạp chí KHOA HỌC & CƠNG NGHỆ 189(13): 85 - 91 91 Signal Processing (EEG, EDA, ECG, EMG...), Memory and Cognition Lab' Day, 01 November, Paris, France. 17. K. Simonyan and A. Zisserman (2014), “Very deep convolutional networks for large-scale image recognition”, CoRR, Vol. abs/1409.1556. 18. B. Castro, D. Kogan and A. B. Geva (2000), "ECG feature extraction using optimal mother wavelet," 21st IEEE Convention of the Electrical and Electronic Engineers in Israel. Proceedings (Cat. No.00EX377), Tel-Aviv, pp. 346-350. 19. C. Alexakis, H. O. Nyongesa, R. Saatchi, N. D. Harris, C. Davies, C. Emery, R. H. Ireland, and S. R. Heller (2003), “Feature Extraction and Classification of Electrocardiogram (ECG) Signals Related to Hypoglycaemia”, Conference on computers in Cardiology, Vol. 30, pp. 537-540. 20. Kuo-Kuang Jen, and Yean-Ren Hwang (2008), “ECG Feature Extraction and Classification Using Cepstrum and Neural Networks”, Journal of Medical and Biological Engineering, Vol. 28, No. 1, pp. 31-37. 21. Justin Johnson, Andrej Karpathy, Transfer learning, 2018, learning/ ImageNet Dataset, ABSTRACT ATRIAL FIBRILLATION RECOGNITION USING XGBOOST AND DEEP LEARNING Nguyễn Hồng Quang1*, Trịnh Văn Loan1, Phạm Ngọc Hưng3, Hà Quang Thái 2 , Bùi Trung Anh 2, Phan Cơng Mạnh2 1Hanoi University of Science and Technology, 2Toshiba (Vietnam) Software Development Co., Ltd., 3Hung Yen University of Technology and Education This article proposes a method for classification of atrial fibrillation signals measured from hand- held ECG devices. Our approach utilizes the XGBoost combination and deep learning model, in which XGBoost is built on a feature set that is enhanced and refined experimentally, performing the role of data generation. We use segmentation and labeling techniques for signal segments, which enhances, balances and relies on data sets. Deep learning with transfer learning approaches is used to classify signal segments in the form of spectral representation. We tested the model on the PhysioNet / Computing in Cardiology Challenge 2017 (PCCC 2017) database to classify four types of signals: atrial fibrillation, normal, other types of heart disease and noise. Deep modeling demonstrates the ability to predict well on short data segments with F1 = 0.8397 results. Our research paves the way for a new ECG signal classification problem when performing classification on short signal segments, while providing a solution for applying deep learning models when the problem arises with data limitations. Keywords: ECG signal, Atrial fibrillation, Deep Learning, XGBoost, Discrete Wavelet Transform Ngày nhận bài: 08/10/2018; Ngày hồn thiện: 17/10/2018; Ngày duyệt đăng: 30/11/2018 * Tel: 0978 813688, Email: quangnh@soict.hust.edu.vn

Các file đính kèm theo tài liệu này:

129_157_1_pb_2807_2125114.pdf