BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
PHẠM VĂN NAM
XÂY DỰNG MÔ HÌNH NHẬN DẠNG KẾT HỢP
NHẰM NÂNG CAO ĐỘ CHÍNH XÁC PHÂN LOẠI
TÍN HIỆU ĐIỆN TIM LOẠN NHỊP
Ngành : Kỹ thuật Điều khiển và Tự động hóa
Mã số
: 9520216
TÓM TẮT LUẬN ÁN TIẾN SĨ
KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
-1Hà Nội-2018
Công trình được hoàn thành tại:
Trường Đại học Bách khoa Hà Nội
Người hướng dẫn khoa học:
1. PGS.TSKH. Trần Hoài Linh
2. PGS. TS. Nguyễn Thị Lan Hương
Phản biện 1:…………………………………
Phản biện 2:…………………………………
Phản biện 3:…………………………………
dạng tín hiệu điện tim ECG;
Nhu cầu về các thiết bị y tế hiện đại để theo dõi các thông số
về sức khỏe, trong đó có các thiết bị đo điện tim, cụ thể:
Nhu cầu về thiết bị đo điện tim thông minh, cầm tay, có chức
năng nhận dạng tự động tín hiệu điện tim ECG. Thiết bị cần
thiết đối với những người có nguy cơ mắc bệnh cao (như
người béo phì, người cao tuổi, người nghiện hút thuốc…)
giúp phát hiện sớm các bệnh lý về tim mạch. Ngoài ra, đối
với người đang điều trị cần có thiết bị đo điện tim gọn nhẹ để
mang theo người để theo dõi và lưu trữ liên tục tín hiệu điện
tim. Thiết bị cần có phần mềm tiện ích để hỗ trợ kết nối dễ
dàng với bác sĩ, bệnh viện từ xa (ví dụ qua internet) để thuận
tiện trong quá trình theo dõi và chẩn đoán nhanh;
Nhu cầu về các giải pháp nhận dạng tín hiệu điện tim có độ
chính xác và tin cậy cao, phân biệt được nhiều loại bệnh để
áp dụng cho nhiều đối tượng bệnh nhân, hỗ trợ các bác sĩ
trong chuẩn đoán nhanh và chính xác các bệnh về tim mạch;
-1-
2. Mục đích nghiên cứu
Xuất phát từ các nhu cầu thực tế ở trên luận án sẽ tập trung
nghiên cứu và phát triển một giải pháp mới để nâng cao độ chính
xác và tin cậy của kết quả nhận dạng tín hiệu điện tim, sau đó
triển khai tích hợp trên thiết bị đo điện tim, có khả năng phát triển
thành sản phẩm hoàn chỉnh để phục vụ các nhu cầu cấp thiết của
đời sống xã hội, cụ thể các mục tiêu nghiên của luận án như sau:
Đề xuất xây dựng giải pháp nâng cao chất lượng nhận dạng
tín hiệu điện tim (giảm số mẫu nhận dạng sai, giảm số
trường hợp chẩn đoán âm tính sai FN);
Nghiên cứu mô hình cây quyết định DT (Decision Tree), khả
năng ứng dụng để kết hợp kết quả từ các mô hình đơn, đánh
giá kết quả của giải pháp;
Thiết bị đo và tiền xử lý tín hiệu điện tim: Tìm hiểu tổng
quan về các mô hình thiết bị đo đã được triển khai và ứng
dụng trong thực tế, đánh giá ưu nhược điểm, đề xuất giải
pháp cho luận án. Đối với khối tiền xử lý, lựa chọn và áp
dụng các phương pháp lọc nhiễu phù hợp với thiết bị đo (nhỏ
gọn, xách tay, sử dụng các vi xử lý thông dụng). Nghiên cứu
về khả năng triển khai mô phỏng các mô hình trí tuệ nhân
tạo và mô hình kết hợp được đề xuất trong luận án trên thiết
bị đo;
Nghiên cứu các mô hình phối hợp từ nhiều mô hình nhận
dạng đơn để nâng cao chất lượng so với các mô hình đơn.
4. Ý nghĩa khoa học và thực tiễn của đề tài
Ý nghĩa khoa học: Luận án đề xuất được giải pháp nâng cao
chất lượng (độ chính xác) nhận dạng tín hiệu điện tim dựa
trên việc sử dụng cây quyết định để kết hợp song song nhiều
mô hình nhận dạng đơn. Các đề xuất đã được kiểm nghiệm
trên hai bộ dữ liệu, bốn mô hình nhận dạng đơn và 20
phương án kết hợp.
Ý nghĩa thực tiễn: Mục tiêu nâng cao chất lượng nhận dạng
điện tim vẫn đang là vấn đề được quan tâm do các nhu cầu
cấp thiết trong thực tế phục vụ người bệnh. Các thuật toán đã
được triển khai thử nghiệm trên các bộ mẫu số liệu kinh điển
của quốc tế để kiểm tra chất lượng, bước đầu đã thử nghiệm
trên các thiết bị tự xây dựng để kiểm tra tính đáp ứng thời
gian thực, khả năng áp dụng được vào các thiết bị thông
minh nhỏ gọn phục vụ người bệnh trong thực tế của các giải
pháp là cao.
phần đầu trình bày về giải pháp sử dụng cây quyết định để kết hợp
kết quả của các hệ thống nhận dạng đơn. Tiếp theo, trình bày về
các mô hình nhận dạng đơn đó là mạng nơ-rôn truyền thẳng nhiều
lớp MLP, mạng nơ-rôn logic mờ TSK, máy véc-tơ hỗ trợ SVM và
rừng ngẫu nhiên RF. Cuối cùng, đề xuất phương án thiết kế phần
cứng cho thiết bị đo tín hiệu điện tim.
-4-
Chương IV: Chương này trình bày về phương pháp tạo bộ dữ
liệu học và kiểm tra từ bộ hai cơ sở dữ liệu MIT-BIH và
MGH/MF. Kết quả xây dựng mô hình nhận dạng tín hiệu ECG,
các kết quả thử nghiệm, đánh giải pháp đề xuất của luận án.
Phần cuối cùng, là kết luận và hướng phát triển, danh mục các
tài liệu tham khảo, các công trình đã công bố của luận án.
CHƯƠNG I: TỔNG QUAN CÁC PHƯƠNG PHÁP
NÂNG CAO CHẤT LƯỢNG NHẬN DẠNG ECG
1.1. Tổng quan về tín hiệu điện tim ECG
Mục này giới thiệu tổng quan về tín hiệu điện tim ECG, một số
yếu tố ảnh hưởng đến tín hiệu điện tim.
1.2. Tình hình nghiên cứu và phương pháp nâng cao chất
lượngnhận dạng tín hiệu điện tim ECG
1.2.1. Tình hình nghiên cứu
Mục này giới thiệu tóm tắt một số công trình nghiên cứu về tín
hiệu điện tim trong những năm vừa qua.
1.2.2. Một số giải pháp nâng cao chất lượng nhận dạng
Giới thiệu một số giải pháp nâng cao chất lượng nhận dạng tín
tuyến mới có chất lượng nhận dạng tốt hơn so với các mô
hình cũ, ví dụ [78] các hệ thống nhận dạng 7 loại nhịp tim
sử dụng các hàm cơ sở Hermite để trích chọn đặc tính, các
kết quả thử nghiệm với mô hình TSK, SVM trên bộ cơ sở
dữ liệu MIT-BIH, kết quả sai số nhận dạng được giảm từ
3,26% khi dùng mạng TSK xuống 1,96 % khi dùng SVM.
1.2.3. Nâng cao độ chính xác bằng mô hình kết hợp
Do kết quả chẩn đoán các bệnh về tim mạch ảnh hưởng trực
tiếp đến sức khỏe bệnh nhân, nên các hệ thống nhận dạng tự động
tín hiệu điện tim có yêu cầu về độ chính xác, ổn định, tin cậy ngày
càng cao. Khi nhận dạng và kiểm tra một đối tượng đầu vào thì
mỗi một giải pháp sẽ có thuật toán xử lý riêng để đưa ra các kết
quả nhận dạng riêng. Các giải pháp khác nhau có thể đưa ra các
kết quả khác nhau (nếu nhiều mô hình đều đưa ra một kết quả
thống nhất thì kết quả này thường có độ tin cậy khá cao). Do đối
với các bài toán thực tế, ta thường không có giải pháp nhận dạng
có độ chính xác tuyệt đối, nên bất cứ giải pháp đơn lẻ nào đều có
xác suất gây lỗi (mỗi giải pháp sẽ bị lỗi nhận dạng sai với một
nhóm mẫu khác nhau). Từ nguyên nhân chính này mà có nhiều tác
giả đã đề xuất ra giải pháp “mô hình kết hợp” tức là sử dụng đồng
thời nhiều mô hình nhận dạng đơn và đưa thêm một khâu xử lý
nữa, nhiệm vụ của khâu xử lý thêm này là kết hợp các kết quả của
-6-
các mô hình nhận dạng đơn để đưa ra một kết luận cuối cùng. Một
số ưu điểm của “mô hình kết hợp”:
Mỗi “mô hình đơn” được coi như một chuyên gia độc lập,
phần, thử nghiệm trên bộ cơ sở dữ liệu MIT-BIH có độ chính xác
tăng thêm khoảng 1,5%.
Xu hướng hiện nay là dùng các mô hình nhận dạng đơn lẻ sử
dụng các thuật toán khác nhau là phổ biến hơn so với việc sử dụng
cùng loại như ở các ví dụ trên. Xu hướng này khá hợp lý bởi vì nó
sẽ nâng cao ưu điểm của từng mô hình nhận dạng đơn lẻ. Như
trong nghiên cứu [25] tác giả đã sử dụng hai thuật toán phân loại
khác nhau là SVM và PSO (Particles Swarm Optimization) gọi là
hệ thống nhận dạng PSO-SVM, kết quả thử nghiệm trên bộ cơ sở
dữ liệu MIT-BIH có độ chính xác tăng khoảng 4%, trong [23] tác
giả kết hợp mạng logic mờ Fuzzy KNN (Fuzzy K Nearest
Neighbors) và mạng MLP cho kết quả có độ chính xác được cải
thiện từ 97.3% lên 98%.
Một số giải pháp phối hợp kết quả thông dụng đã được đề xuất
như: Biểu quyết theo đa số [22, 31], biểu quyết có trọng số [78,
103], tổng hợp theo xác suất điều kiện Bayes [78]… Các giải pháp
kết hợp này khá đơn giản, điều này cũng dễ hiểu do mô hình kết
hợp khá phức tạp vì dùng nhiều mô hình nhận dạng đơn, khối
lượng tính toán lớn nên ở khâu kết hợp các tác giả thường lựa
chọn các giải pháp đơn giản, hay dùng nhất là giải pháp biểu
quyết theo đa số.
Về số lượng mô hình đơn, thực tế ít sử dụng kết hợp hai mô
hình đơn vì khi xảy ra mẫu thuẫn trong kết quả từ hai hệ đơn ta
không có cơ sở chắc chắn để kết luận hệ đơn nào đúng, hệ đơn
nào sai. Vì thế, đa số các mô hình kết hợp đều sử dụng số lượng
mô hình cơ sở từ ba hệ thành phần trở lên (nhiều công trình
khuyến cáo sử dụng số mô hình đơn là số lẻ để có thể đưa ra kết
luận cuối cùng, nhất là trong trường hợp biểu quyết theo đa số).
1.3. Định hướng nghiên cứu của luận án
mẫu MIT-BIH và MGH/MF có thể tải về từ trang web
http://physionet.org;
Thiết kế, chế tạo thiết bị đo điện tim cầm tay, sử dụng công
nghệ ARM đời mới để chạy thử nghiệm chương trình nhận
-9-
dạng, kiểm tra khả năng đáp ứng được về mặt tốc độ tính
toán theo thời gian thực.
1.4. Cơ sở dữ liệu sử dụng trong luận án
Để kiểm chứng chất lượng của các giải pháp trong luận án,
NCS sử dụng CSDL chuẩn MIT-BIH (Massachusetts Institute of
Technology, Boston’s Beth Israel Hospital) và MGH/MF, cả hai
bộ cơ sở dữ liệu điện tim này đều có thể tải về từ trang web
http://physionet.org.
CHƯƠNG II: THU THẬP, TIỀN XỬ LÝ VÀ TRÍCH CHỌN
ĐẶC TÍNH TÍN HIỆU ECG
2.1. Thu thập và tiền xử lý tín hiệu điện tim
Nhiệm vụ của khối này là chuẩn hóa tín hiệu điện áp tương tự
thu được từ các điện cực ECG về dải biến thiên trong khoảng
0÷5V hoặc trong khoảng 0÷3,3V, tín hiệu từ các điện cực ECG
thường được xử lý tuần tự qua các khâu: Tiền khuếch đại, khuếch
đại.
Nhiệm vụ thứ 2 là loại bỏ các nhiễu nằm ngoài dải tần số điện
tim quan tâm là 0,1÷100Hz, bằng các bộ lọc thông thấp có tần số
cắt 100Hz và bộ lọc thông cao có tần số cắt 0,1Hz. Loại bỏ các
nhiễu do điện lưới gây ra bằng bộ lọc Notch 50Hz (bộ lọc triệt tần
50Hz).
18
của
16 hệ số khai triển ci i 0 15 của tín hiệu điện tim
ECG theo các hàm Hermite;
2 đặc tính trong miền thời gian của tín hiệu điện tim, là
RRlast khoảng cách giữa hai đỉnh R liên tiếp (còn gọi là
khoảng cách R-R), và RRmean giá trị trung bình của 10
khoảng cách R-R cuối cùng.
CHƯƠNG III. GIẢI PHÁP KẾT HỢP CÁC MÔ HÌNH
NHẬN DẠNG ĐỂ CẢI THIỆN CHẤT LƯỢNG
3.1. Kết hợp kết quả bằng mô hình cây quyết định
3.1.1. Mô hình chung để kết hợp nhiều giải pháp nhận dạng
Hình 3.1 biểu diễn sơ đồ chung của mô hình kết hợp sử dụng
nhiều mô hình nhận dạng đơn, trong đó, M số mô hình nhận
dạng đơn, xin tín hiệu điện tim ECG đầu vào, Pi là các khối
tiền xử lý và trích chọn đặc tính, Ci các khối phân loại, z kết
quả nhận dạng cuối cùng tương ứng với tín hiệu điện tim đầu vào
xin .
- 11 -
Hình 3.1: Sơ đồ chung của mô hình kết hợp sử dụng nhiều
mô hình nhận dạng đơn
Nhìn chung, các mô hình nhận dạng cơ sở làm việc độc lập
với tín hiệu điện tim đầu vào xin có thể từ các chuyển đạo khác
y 2 y M y11 y12 y1K y21 y22 y2 K yM 1 yM 2 yMK
Hình 3.2: Sơ đồ khối chung của hệ thống kết hợp
song song nhiều mô hình đơn
3.1.2. Quy trình xây dựng cây quyết định DT cho khối tổng
hợp kết quả
3.1.3. Cây quyết định
Cây quyết định là một mô hình xử lý tín hiệu kinh điển đã được
sử dụng rất rộng rãi trong nhiều ứng dụng thực tế. Cây là một đồ
thị không có chu trình. Đồ thị G được định nghĩa chung bởi hai
tập hợp G=(V,E), trong đó V là tập hợp các nút (vertex) còn E là
tập hợp các cạnh (edge) nối hai nút của tập V. Đối với các cây, ta
sử dụng trường hợp cạnh có hướng. Khi đó nếu đồ thị G không có
chu trình kín thì được gọi là cây. Với mỗi cây ta có [2]:
Tồn tại một nút được gọi là nút gốc;
- 13 -
Các nút được nối với nhau bởi các nhánh có hướng còn gọi
là cành. Với mỗi cành, nút gốc được gọi nút cha/mẹ, nút
ngọn là nút con;
Mỗi nút trong cây có thể có từ một đến nhiều nút con. Các
nút không có nút con còn được gọi là (nút) lá/ngọn của cây.
902
964
472
105
6643
Số mẫu học
1065
639
515
504
549
271
68
3611
- 14 -
Số mẫu kiểm tra
935
561
485
398
451
201
37
3068
Bảng 4.2: Bảng phân chia số lượng mẫu học và mẫu kiểm tra của 2
3068
4.1.2. Cơ sở dữ liệu MGH/MF
Luận án lựa chọn sử dụng các mẫu tín hiệu ECG của 20 bản
ghi có mã số là: 029, 030, 058, 105, 106, 107, 108, 110, 111, 114,
117, 119, 121, 123, 124, 125, 128, 131, 137, 142. Số lượng chi tiết
số mẫu sử dụng được thống kê chi tiết trong bảng 4.3 và bảng 4.4
dưới đây:
Bảng 4.3: Bảng phân chia số lượng mẫu học và mẫu kiểm tra
của 3 loại nhịp
Loại nhịp
Tổng số mẫu
Số mẫu học
Số mẫu kiểm tra
N
3000
1997
1003
S
Số mẫu kiểm tra
Normal
3000
1997
1003
Abnormal
1500
1003
497
Tổng
4500
3000
1500
4.2. Cách đánh giá chất lượng mô hình nhận dạng
Các mô hình nhận dạng (các mô hình đơn và cả mô hình kết
hợp) được đánh giá thông qua các chỉ tiêu đánh giá như sau:
R
A
V
I
E
N
928
1
1
10
0
0
0
L
1
5
0
3
383
1
0
0
V
0
2
0
1
446
0
0
37
Tổng sai số
7
4
4
15
5
3
0
Kết quả
- 16 -
Bảng 4.19: Các thông số đánh giá chất lượng của 3 mô hình cơ sở và
mô hình kết hợp MLP-TSK-SVM khi nhận dạng 7 loại nhịp
Loại mô hình
Sai
số
2115
99,16
96,79
TSK
100
3,26
23
920
15
2110
98,92
98,40
SVM
60
1,96
Nhận xét kết quả
Trong bảng 4.18 là ma trận phân bố kết quả của mô hình
kết hợp (MLP-TSK-SVM), ta thấy hầu hết các trường hợp
nhận nhầm là giữa loại A và N (số lần nhận nhầm A thành
N là 10), nguyên nhân là do hình dạng của nhịp loại A và N
khá giống nhau, còn các lỗi nhầm lẫn khác là không đáng
kế (≤ 3 lỗi);
Trong bảng 4.19 là tổng hợp các thông số chất lượng của
các mô hình nhận dạng đơn và mô hình kết hợp. Ta thấy,
trong ba mô hình nhận dạng cơ sở thì SVM có chất lượng
cao nhất, nhưng kết quả nhận dạng tiếp tục được cải thiện
khi sử dụng của mô hình kết hợp MLP-TSK-SVM bằng cây
quyết định DT, nếu so sánh với mô hình cơ sở tốt nhất là
SVM thì tất cả các tiêu chí đánh giá chất lượng đều có kết
quả tốt hơn, cụ thể:
- Sai số kiểm tra đã giảm 22 mẫu (từ 60 mẫu xuống còn
38 mẫu);
- Số trường hợp chẩn đoán âm tính sai FN đã giảm 3 mẫu
(từ 15 mẫu xuống 12 mẫu);
- Số trường hợp chẩn đoán dương tính sai FP đã giảm 9
mẫu (từ 16 mẫu xuống 7 mẫu);
- Tỷ lệ chẩn đoán dương tính đúng Sensitivity đã được
cải thiện thêm khoảng 0,14%;
- Tỷ lệ chẩn đoán âm tính tính đúng Specificity đã được
cải thiện thêm khoảng 0,96%;
- 17 -
1,37
Kullback–Leibler
45
1,47
Modified Bayes
48
1,56
Decision tree
38
1,24
Kết luận:
Qua các kết quả thử nghiệm trên bộ cơ sở dữ liệu MIT-BIH
(là được các nhóm nghiên cứu quốc tế thường dùng để
tham chiếu), nghiên cứu sinh đã minh chứng được giải
pháp kết hợp song song ba mô hình nhận dạng cơ sở (MLP,
Sai số
(%)
FN
TN
FP
TP
Sens
(%)
Spec
(%)
MLP
110
3,59
18
905
30
2115
919
16
2118
99,30
98,29
RF
70
2,28
20
914
21
2113
99,06
97,75
MLP-TSK-SVM
99,25
99,14
MLP-RF-SVM
40
1,30
13
923
12
2120
99,39
98,72
RF-TSK-SVM
39
1,27
10
Thử nghiệm 2: Trên bộ cơ sở dữ liệu MIT-BIH (cụ thể trong
bảng 4.2), nhận dạng hai loại nhịp (bình thường và bất thường).
Bảng 4.22: Kết quả nhận dạng 2 loại nhịp (CSDL MIT-BIH) bằng
các mô hình đơn và các mô hình kết hợp
Loại mô hình
Sai
số
Sai số
(%)
FN
TN
FP
TP
Sens
(%)
Spec
(%)
MLP
99,20
97,43
SVM
26
0,85
8
917
18
2125
99,62
98,07
RF
37
1,21
13
22
0,72
8
921
14
2125
99,62
98,50
MLP-RF-SVM
23
0,75
9
921
14
2124
927
8
2126
99,67
99,14
Thử nghiệm 3: Trên bộ cơ sở dữ liệu MGH/MF (cụ thể trong
bảng 4.3), nhận dạng ba loại nhịp N, S, V.
Bảng 4.23: Kết quả nhận dạng 3 loại nhịp (CSDL MGH/MF) bằng
các mô hình đơn và các mô hình kết hợp
Loại mô hình
Sai số
Sai số
(%)
FN
TN
FP
TP
Sens
983
20
453
91,15
98,01
SVM
32
2,13
6
991
12
491
98,79
98,80
RF
99,40
99,10
MLP-TSK-RF
30
2,00
10
992
11
487
97,99
98,90
MLP-RF-SVM
25
1,67
6
21
1,40
5
996
7
492
98,99
99,30
- 20 -
Thử nghiệm 4: Trên bộ cơ sở dữ liệu MGH/MF (cụ thể trong
bảng 4.4), nhận dạng hai loại nhịp (bình thường và bất thường).
Bảng 4.24: Kết quả nhận dạng 2 loại nhịp (CSDL MGH/MF)
Loại mô hình
Sai số
Sai số
(%)
98,50
TSK
62
4,13
37
978
25
460
92,56
97,51
SVM
20
1,33
6
989
1,13
5
991
12
492
98,99
98,80
MLP-TSK-RF
20
1,33
6
989
14
491
98,79
12
491
98,79
98,80
MLP-TSK-SVM-RF
15
1,00
4
992
11
493
99,20
98,90
Đánh giá kết quả: Từ các kết quả thử nghiệm trên ta có một số
đánh giá như sau:
- Khi thử nghiệm nhận dạng 7 loại nhịp tim trong bộ cơ
sở dữ liệu MIT-BIH: Sai số kiểm tra của các mô hình
tổng hợp từ 1,21÷1,40% (kết quả trong thí nghiệm 1),
thấp hơn so với 2,6% trong [4];
- Khi thử nghiệm nhận dạng 3 loại nhịp tim trong bộ cơ
sở dữ liệu MGH/MF: Sai số kiểm tra của các mô hình
tổng hợp từ 1,4÷2% (kết quả trong thí nghiệm 3), thấp
hơn so với 3,4% trong [4].
4.5 Kết quả thử nghiệm trên thiết bị
Kết quả phần cứng:
Ngoài các kết quả lý thuyết và thực hiện tính toán, mô phỏng,
nghiên cứu sinh có định hướng triển khai các giải pháp trên thiết
bị phần cứng để tiến tới có thể hoàn thiện thiết bị đưa vào ứng
dụng trong thực tế. Với mục đích đó, nghiên cứu sinh đã phân
tích, lựa chọn các linh kiện và thi công phần cứng, bước đầu đóng
gói thành thiết bị khá nhỏ gọn, với đầy đủ các chức năng như yêu
cầu, thiết bị kích thước (11,5cm x 10,5cm x 5cm). Sử dụng điện
cực đo chuyển đạo tay trái - tay phải, như thể hiện trên hình 4.11.
Bước đầu, các khâu thu thập tín hiệu điện tim đã thu thập được
các tín hiệu với chất lượng tương tự như các thiết bị đo thông
dụng.
- 22 -
Hình 4.11: Hình ảnh của thiết bị đo kích thước (11,5cm x 10,5cm x 5cm)
Kết quả thử nghiệm các thuật toán: