BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
____________________________________________
TRẦN NGỌC MINH
NGHIÊN CỨU MỘT SỐ KỸ THUẬT
NÂNG CAO CHẤT LƯỢNG ẢNH Y TẾ VÀ ỨNG DỤNG
TRONG BỆNH VIỆN 74 TRUNG ƯƠNG
LUẬN VĂN THẠC SĨ MÁY TÍNH
HÀ NỘI, 2013
1
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
____________________________________
TRẦN NGỌC MINH
NGHIÊN CỨU MỘT SỐ KỸ THUẬT
NÂNG CAO CHẤT LƯỢNG ẢNH Y TẾ VÀ ỨNG DỤNG
TRONG BỆNH VIỆN 74 TRUNG ƯƠNG
Chuyên ngành: Khoa học máy tính
Mã ngành: 60 48 01 01
LUẬN VĂN THẠC SĨ MÁY TÍNH
thầy cô, quý đồng nghiệp và bạn bè.
Hà Nội, ngày 04 tháng 8 năm 2013
Học viên
Trần Ngọc Minh
3
LỜI CAM ĐOAN
Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này
là trung thực và không trùng lặp với các đề tài khác. Tôi cũng xin cam đoan
rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các
thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc.
Hà Nội, ngày 04 tháng 8 năm 2013
Học viên
Trần Ngọc Minh
4
MỤC LỤC
TRANG PHỤ BÌA .................................................................................................. 1
LỜI CẢM ƠN ......................................................................................................... 2
LỜI CAM ĐOAN.................................................................................................... 3
MỤC LỤC .............................................................................................................. 4
DANH MỤC CÁC TỪ VIẾT TẮT ......................................................................... 5
MỞ ĐẦU ................................................................................................................ 6
CHƯƠNG 1. GIỚI THIỆU VỀ XỬ LÝ ẢNH Y HỌC ............................................ 9
TT
Tên viết tắt
Tên tiếng anh
Định nghĩa
1.
CT
Computed Tomography Scanner
Chụp cắt lớp vi tính
2.
DCM
Digital color microscopy
Kính hiển vi màu kỹ thuật số
3.
DICOM
Digital Imaging and
Hình ảnh cộng hưởng từ
7.
PACS
Picture Archiving and
Hệ thống lưu trữ và truyền ảnh
Communication System
Positron-emision tomagraphy
Chụp phát xạ
9.
Telemedicine
Điều trị từ xa
10. WWW
World Wide Web
Mạng toàn cầu
8.
PET
có thể phát hiện các vùng bất thường nếu có thể chữa trị kịp thời cho bệnh
7
nhân. Tuy nhiên việc phát hiện này không phải người thầy thuốc nào cũng
làm tốt được đặc biệt đối với những bác sĩ mới ra trường và những bác sĩ
không phải là chuyên ngành chẩn đoán hình ảnh.
Trong luận văn “Nghiên cứu một số kỹ thuật nâng cao chất lượng ảnh
y tế và ứng dụng trong Bệnh viện 74 Trung ương” này, em tập trung tìm
hiểu một số kỹ thuật, thuật toán nâng cao chất lượng ảnh nói chung và chọn
lọc ứng dụng, tìm hiểu một số kỹ thuật cụ thể nâng cao chất lượng ảnh y học.
Cài đặt chương trình với một số chức năng để thực nghiệm kết quả tại Bệnh
viện 74 Trung ương nơi em đang làm việc.
2. Mục đích nghiên cứu:
- Nâng cao chất lượng ảnh chuyên môn y tế
- Trợ giúp công tác chuyên môn y tế về chẩn đoán hình ảnh y học trong
Bệnh viện.
- Hỗ trợ công tác NCKH của Bệnh viện 74 Trung ương
3. Nhiệm vụ nghiên cứu
- Nghiên cứu các kỹ thuật xử lý ảnh cơ bản.
- Nghiên cứu một số kỹ thuật nâng cao ảnh y tế.
4. Đối tượng và phạm vi nghiên cứu
a. Đối tượng nghiên cứu
- Một số hình ảnh y tế (phim X quang, nội soi, siêu âm, soi kính hiển
vi) của các bệnh nhân đã và đang điều trị tại Bệnh viện.
- Các kỹ thuật xử lý ảnh
- Xây dựng phần mềm thử nghiệm các kỹ thuật nâng cao chất lượng
ảnh.
ta khoảng hơn chục năm nay. Đây là một ngành liên quan đến nhiều lĩnh vực
và cần nhiều kiến thức cơ sở khác. Đầu tiên phải kể đến Xử lý tín hiệu số là
một môn học hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích
chập, phép biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn… Thứ hai,
các công cụ toán như Đại số tuyến tính, xác xuất, thống kê. Một số kiến thức
cần thiết như Trí tuệ nhân tao, Mạng nơ ron nhân tạo cũng được đề cập trong
quá trình phân tích và nhận dạng ảnh.
Thuật ngữ “xử lý ảnh số” thường dùng để chỉ các quá trình xử lý ảnh hai
chiều bằng máy tính, ảnh số thường được biểu diễn bởi ma trận hai chiều các
số thực hay số phức gồm một số hữu hạn các bit. Để có thể xử lý được trên
máy tính, ảnh đã cho (ảnh, giấy phim hay đồ thị ) đầu tiên phải được số hoá
(digitalized) và lưu dưới dạng ma trận hai chiều các bit.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất
lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất
lượng ảnh báo được truyền qua cáp từ Luân đôn đến New York từ những năm
1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và
độ phân giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào
khoảng những năm 1955. Điều này có thể giải thích được vì sau thế chiến thứ
hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận
10
lợi. Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ
mặt trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh.
Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng
ảnh phát triển không ngừng. Các phương pháp tri thức nhân tạo như mạng nơ
ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh
ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan.
Chúng ta xem xét các bước cần thiết trong xử lý ảnh như sau: đầu tiên,
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh
25 dòng), cũng có loại camera đã số hoá (như loại CCD – Change Coupled
Device) là loại photodiot tạo cường độ sáng tại mỗi điểm ảnh.
11
Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều.
Chất lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường
(ánh sáng, phong cảnh)
b) Tiền xử lý (Image Preprocessing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào
bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
c) Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch)
trên phong bì thư cho mục đích phân loại phẩm, cần chia các câu, chữ về địa
chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để
nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ
gây lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất
nhiều vào công đoạn này.
d) Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân
đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này
thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn
các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection)
gắn với việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng
hoặc làm cơ sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm
vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên phong bì thư, chúng ta
đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng
dụng và công nghệ. Thông thường, các ảnh thô đó được đặc tả (biểu diễn) lại
(hay đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng
ảnh (Image Features) như: biên ảnh (Boundary/Egde), vùng ảnh (Region).
Một số phương pháp biểu diễn thường dùng:
13
• Biểu diễn bằng mã chạy (Run-Length Code)
• Biểu diễn bằng mã xích (Chaine -Code)
• Biểu diễn bằng mã tứ phân (Quad-Tree Code)
Trên đây là các thành phần cơ bản trong các khâu xử lý ảnh. Trong thực
tế, các quá trình sử dụng ảnh số không nhất thiết phải qua hết các khâu đó tùy
theo đặc điểm ứng dụng.
Hình 1.2. Sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các khối
Hình 1.2 cho sơ đồ phân tích và xử lý ảnh và lưu đồ thông tin giữa các
khối một cách khá đầy đủ. Ảnh sau khi được số hóa được nén, lưu lại để
truyền cho các hệ thống khác sử dụng hoặc để xử lý tiếp theo. Mặt khác, ảnh
sau khi số hóa có thể bỏ qua công đoạn nâng cao chất lượng (khi ảnh đủ chất
lượng theo một yêu cầu nào đó) để chuyển tới khâu phân đoạn hoặc bỏ tiếp
khâu phân đoạn chuyển trực tiếp tới khâu trích chọn đặc trưng. Hình 1.2 cũng
chia các nhánh song song như: nâng cao chất lượng ảnh có hai nhánh phân
biệt: nâng cao chất lượng ảnh (tăng độ sáng, độ tương phản, lọc nhiễu…)
hoặc khôi phục ảnh (hồi phục lại ảnh thật khi ảnh nhận được bị méo) v.v…
14
1.1.2.3. Mức xám của ảnh
Một điểm ảnh (pixel) có hai đặc trưng cơ bản là vị trí (x, y) của điểm ảnh
và độ xám của nó. Mức xám của điểm ảnh là cường độ sáng của nó được gán
bằng giá trị số điểm đó. Các thang giá trị mức xám thông thường: 16, 32, 64,
128, 256 (Mức 256 là mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte
(8 bit) để biểu diễn mức xám: Mức xám dùng 1 byte biểu diễn: 28 =256 mức,
tức là từ 0 đến 255).
Ảnh đen trắng là ảnh có hai màu đen, trắng (không chứa màu khác) với
mức xám ở các điểm ảnh có thể khác nhau. Ảnh nhị phân là ảnh chỉ có 2 mức
đen trắng phân biệt tức dùng 1 bit mô tả 2 mức khác nhau, nói cách khác: mỗi
điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1. Ảnh màu được tạo lập trong
khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu,
người ta thường dùng 3 byte để mô tả mức màu.
1.1.2.4. Ảnh số
Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh
gần với ảnh thật.
1.1.2.5. Quan hệ giữa các điểm ảnh
Một ảnh số giả sử được biểu diễn bằng hàm f(x, y). Tập con các điểm
ảnh là S; cặp điểm ảnh có quan hệ với nhau ký hiệu là p, q. Chúng ta có một
số các khái niệm sau.
a) Các lân cận của điểm ảnh (Image Neighbors):
Giả sử có điểm ảnh p tại toạ độ (x, y). p có 4 điểm lân cận gần nhất theo
chiều đứng và ngang (có thể coi như lân cận 4 hướng chính: Đông, Tây, Nam,
Bắc).
{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4(p)
trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p.
16
1. D(p,q) ≥ 0 (Với D(p,q)=0 nếu và chỉ nếu p=q)
2. D(p,q) = D(q,p)
3. D(p,z) ≤ D(p,q) + D(q,z); z là một điểm ảnh khác.
Khoảng cách Euclide: Khoảng cách Euclide giữa hai điểm ảnh p(x, y) và
q(s, t) được định nghĩa như sau:
Khoảng cách khối: Khoảng cách D4(p, q) được gọi là khoảng cách khối
đồ thị (City-Block Distance) và được xác định như sau:
Giá trị khoảng cách giữa các điểm ảnh r: giá trị bán kính r giữa điểm ảnh
từ tâm điểm ảnh đến tâm điểm ảnh q khác. Ví dụ: Màn hình CGA 12”
(12”*2,54cm = 30,48cm=304,8mm) độ phân giải 320*200; tỷ lệ 4/3 (Chiều
dài/Chiều rộng). Theo định lý Pitago về tam giác vuông, đường chéo sẽ lấy tỷ
lệ 5 phần (5/4/3: đường chéo/chiều dài/chiều rộng màn hình); khi đó độ dài
thật là (305/244/183) chiều rộng màn hình 183mm ứng với màn hình CGA
200 điểm ảnh theo chiều dọc.
Như vậy, khoảng cách điểm ảnh lân cận của CGA 12” là ≈ 1mm.
Khoảng cách D8(p, q) còn gọi là khoảng cách bàn cờ (Chess-Board
Distance) giữa điểm ảnh p, q được xác định như sau:
1.1.3. Một số định dạng ảnh cơ bản:
Ảnh thu được sau quá trình số hóa thường được lưu lại cho các quá trình
xử lý tiếp theo hay truyền đi. Trong quá trình phát triển của kỹ thuật xử lý
ảnh, tồn tại nhiều định dạng ảnh khác nhau từ ảnh đen trắng (với định dạng
IMG), ảnh đa cấp xám cho đến ảnh màu: (BMP, GIF, JPEG…). Tuy các định
18
dạng này khác nhau, song chúng đều tuân theo một cấu trúc chung nhất. Nhìn
chung, một tệp ảnh bất kỳ thường bao gồm 3 phần:
- Mào đầu tệp (Header): Mào đầu tệp là phần chứa các thông tin về kiểu
chứa các thông tin cần thiết, ảnh IMG được nén theo từng dòng. Mỗi dòng
bao gồm các gói ( pack). Các dòng giống nhau cũng nén thành một gói.
- BMP: (Windows Bitmap) Đặc điểm nổi bật nhất của định dạng BMP là
tập tin hình ảnh thường không được nén bằng bất kỳ thuật toán nào. Khi lưu
ảnh, các điểm ảnh được ghi trực tiếp vào tập tin - một điểm ảnh sẽ được mô tả
bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh. Do đó, một hình ảnh
lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều lần so với các ảnh
được nén (chẳng hạn GIF, JPEG hay PNG).
- GIF : (Graphics Interchange Format) : Định dạng trao đổi hình ảnh) là 1
định dạng ảnh quản lý không quá 256 màu cho 1 ảnh tĩnh cũng như từng
khuôn hình cho các ảnh động, được dùng rộng rãi trên WWW do dùng kỹ
thuật nén bảo toàn LZW làm giảm kích thước file mà không làm thất thoát dữ
liệu. Do giới hạn về màu sắc nên thường được dùng cho các hình vẽ nét, sơ
đồ vốn không cần dùng đến dải 16 triệu màu và không phù hợp để lưu các ảnh
chụp.
- PNG : (Portable Net Graphics) là định dạng ảnh có nhiều đặc điểm
giống GIF ngoại trừ phần động (Có thể nén để đưa lên net, hỗ trợ lưu ảnh
transparancy) nhưng do có dãi tần màu rộng hơn, có thể đến 16 triệu màu, nên
ngày càng được sử dụng rộng rãi trên WWW với các ảnh có chất lượng như
ảnh chụp.
- JPG : (Joint Photographic Experts Group) là định dạng ảnh nén hiệu
quả, có thể nén ảnh đến vài chục lần, tuy nhiên chất lượng lượng ảnh sẽ suy
giảm tỉ lệ thuận với hệ số nén (Compression) dựa trên nguyên tắc loại bỏ
20
những thông số màu để giảm thông tin cho file dựa trên xu hướng nhận thức
về màu sắc của mắt người. Do vậy, JPG còn được gọi là định dạng ảnh nén
chịu thiệt. Thường được dùng để lưu ảnh chụp, tất nhiên tuỳ theo nhu cầu mà
Các thực thể tạo ảnh y học (medical imaging modallity) khác nhau cung
cấp các thông tin đặc tính riêng biệt về các cơ quan bên trong hay của các tổ
chức mô của cơ thể. Độ tương phản và độ nhìn thấy của ảnh y học phụ thuộc
vào thực thể tạo ảnh, hàm đáp ứng cũng như phụ thuộc vào các vùng bệnh lý
của bệnh nhân. Ví dụ cụ thể như khi thăm khám vết rạn ở khung xương sườn
bằng chụp X-quang ngực thì cần nhìn rõ cấu trúc xương cứng, muốn kiểm tra
khả năng có bị ung thư vú hay không thông qua phim chụp X-quang vú thì lại
cần thấy rõ sự vi vôi hoá, các khối bất thường, các cấu trúc mô mềm…Do
vậy, mục tiêu của tạo ảnh và xử lý ảnh y học là thu nhận và xử lý các thông
tin hữu ích về các cơ quan sinh lý hay các cơ quan của cơ thể bằng cách sử
dụng các nguồn năng lượng để phục vụ cho việc chẩn đoán bệnh.
Các phương pháp chẩn đoán hình ảnh rất phong phú, như chẩn đoán qua
hình ảnh X quang (X-ray), hình ảnh siêu âm (Ultrasound), siêu âm – Doppler
màu, hình ảnh nội soi (mà thông dụng là nội soi tiêu hoá và hô hấp) hình ảnh
chụp cắt lớp vi tính (Computed Tomography Scanner- CT. Scanner), hình ảnh
chụp cộng hưởng từ hạt nhân (Magnetic Resonance Imaging- MRI), hình ảnh
y học hạt nhân ( SPECT, PET)…
Các thực thể tạo ảnh y học được phân chia chủ yếu theo 3 dạng : nguồn
năng lượng bên trong, nguồn năng lượng bên ngoài và kết hợp cả hai, thể hiện
theo sơ đồ sau:
22
Hình 1.4. Phân chia các loại ảnh y học theo nguồn năng lượng tạo thành
Nguyên lý tạo ảnh được sử dụng để thu được dữ liệu thông qua các máy
chuyên dụng. Với ảnh 2 chiều của vật thể ảnh được tạo qua các dụng cụ
quang học như camera hay kính hiển vi..., ảnh 2 chiều hay 3 chiều của một tổ
chức được tạo qua các thực thể tạo ảnh y học bằng các phương pháp truyền
qua, phát xạ, phản xạ, tán xạ hay cộng hưởng từ hạt nhân như CT scanner sử
dùng trong quản lý tại bệnh viện và giữa các bệnh viện với nhau ngày một
nhiều, nên các giao thức truyền ảnh trên mạng được dưa ra (có một chuẩn
chung thống nhất, chất lượng ảnh đủ để chẩn đoán, giảm nhẹ gánh nặng
đường truyền), tạo nên phòng “hội chẩn ảo" giữa các chuyên gia y tế ở xa
nhau.
Ảnh y tế được số hóa theo nhiều định dạng khác nhau tùy thuộc vào
phương thức, giải phẫu học, và kỹ thuật quét. Tính năng nổi bật nhất của ảnh
y tế là chúng gần như luôn hiển thị dưới dạng ảnh xám thay vì ảnh mầu, trừ
ảnh siêu âm Doppler và hình ảnh y học hạt nhân giả màu. ảnh y tế 2 chiều có
kích thước M x N x k bit, trong đó M là chiều cao tính bằng pixel và N là
24
chiều rộng, và 2k mức xám. Bảng dưới liệt kê dung lượng trung bình tính
bằng MB cho mỗi lần kiểm tra sử dụng ảnh y tế, trong đó một ảnh 12-bit
được biểu diễn bằng 2 byte trong bộ nhớ. Kích thước của một ảnh và số lượng
ảnh được chụp trong một lần kiểm tra bệnh nhân thay đổi theo phương thức.
Như được thể hiện trong bảng dưới, trừ kính hiển vi kỹ thuật số (DEM) và
kính hiển vi màu kỹ thuật số (DCM), tạo nên những hình ảnh bệnh lý và mô
học của kính hiển vi mô, tất cả các phương thức được phân loại là phóng xạ
hình ảnh (được dùng rộng rãi bao gồm cả các hình ảnh để sử dụng trong các
lĩnh vực y tế khác như tim mạch và thần kinh học) và được sử dụng để chẩn
đoán, lên kế hoạch điều trị và phẫu thuật . Mỗi lần kiểm tra phóng xạ theo
một trình tự được xác định trước. Một lần kiểm tra chụp CT (khoảng 40 lát
cắt), mỗi lát cắt với kích thước ảnh là 512 x 512 x 12 bit, khoảng 20MB, trong
khi một ảnh chụp X quang tuyến vú thường là 32MB.
Các máy thiết bị và máy y tế chẩn đoán hình ảnh đầu tiên khi mới ra đời
chỉ là tín hiệu dạng sóng (Analog) đưa lên màn hình VIDEO của máy. Theo
thời gian, máy được chế tạo ngày càng có cấu hình cao hơn và chuyển dần