ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN PHƯƠNG THÚY
NGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN
ẢNH KỸ THUẬT SỐ GIẢ MẠO VÀ ỨNG DỤNG
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2014
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN PHƯƠNG THÚY
NGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN
ẢNH KỸ THUẬT SỐ GIẢ MẠO VÀ ỨNG DỤNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS. NGUYỄN NGỌC CƯƠNG
THÁI NGUYÊN – 2014
LỜI CẢM ƠN
ii
MỤC LỤC
LỜI CẢM ƠN ..............................................................................................................
i LỜI CAM ĐOAN .......................................................................................................
ii MỤC LỤC..................................................................................................................
iii DANH MỤC CÁC HÌNH VẼ....................................................................................
vi
PHẦN
1:
PHẦN
MỞ
ĐẦU......................................................................................... 1
1. Giới thiệu tổng quan về đề tài .................................................................................
1
2. Bố cục luận văn .......................................................................................................
2
PHẦN 2: NỘI DUNG .................................................................................................
4
CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO ...................... 4
1.1. Xử lý ảnh, một số vấn đề cơ bản trong xử lý ảnh ................................................
4
1.1.1. Xử lý ảnh ....................................................................................................... 4
1.1.2. Biểu diễn ảnh ................................................................................................. 4
2.1. Phát hiện ảnh giả mạo dựa trên thuật toán Exact Match.................................... 18
2.1.1. Ý tưởng ........................................................................................................ 18
2.1.2. Thuật toán .................................................................................................... 19
2.1.3. Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước ...................... 20
2.1.3.1. Các kỹ thuật thay đổi kích thước........................................................... 20
2.1.3.2. Thuật toán cải tiến Exact Match* .......................................................... 22
2.2. Phát hiện ảnh giả mạo dựa trên thuật toán phân tích nguồn sáng ...................... 25
2.2.1. Các phương pháp uớc lượng hướng nguồn sáng ......................................... 25
2.2.1.1. Nguồn ánh sáng vô tận (3-D) ................................................................ 25
2.2.1.2. Nguồn ánh sáng vô tận (2-D) ................................................................ 27
2.2.1.3. Nguồn sáng cục bộ (2-D) ...................................................................... 28
2.2.1.4. Nhiều nguồn sáng .................................................................................. 28
2.2.2. Thuật toán nhận dạng ảnh giả mạo dựa trên phân tích nguồn sáng ............. 29
5
2.2.2.1. Tách biên đối tượng............................................................................... 29
2.2.2.2. Loại bỏ các đối tượng nhỏ và nhiễu ...................................................... 32
2.2.2.3. Chọn các đoạn biên để uớc lượng hướng ánh sáng ............................... 33
2.2.2.4. Thuật toán uớc lượng hướng sáng trên đoạn biên ................................. 33
2.3. Phát hiện ảnh giả mạo dựa vào thuật toán phân tích mẫu nhiễu cảm biến ........ 35
2.3.1. Mẫu nhiễu và các phương thức biểu diễn .................................................... 35
2.3.2. Dò tìm mẫu nhiễu......................................................................................... 38
2.3.3. Thuật toán phát hiện giả mạo ....................................................................... 41
CHƯƠNG 3: THỬ NGHIỆM CHƯƠNG TRÌNH ................................................... 44
3.1. Bài toán phát hiện ảnh giả mạo .......................................................................... 44
3.2. Chương trình thử nghiệm ................................................................................... 45
3.2.1. Giao diện chương trình ................................................................................ 45
3.2.2. Thông tin chương trình ................................................................................ 45
3.2.3. Phát hiện ảnh giả mạo bằng thuật toán Exact Match ................................... 52
Hình 2.16: Minh họa các liên thông theo 4, 8, 6 láng giềng .................................... 32
7
Hình 2.17: Minh họa các điểm được đánh dấu để xóa............................................. 33
Hình 2.18: Minh họa các điểm được đánh dấu để nối nét đứt. ................................ 33
Hình 2.19: Minh họa kết quả xác định hướng ánh sáng trên bức ảnh giả mạo có sẵn
................................................................................................................................... 34
Hình 2.20: Mô hình mẫu nhiễu ................................................................................ 37
Hình 2.21: Minh họa vùng R được chọn và mẫu nhiễu tham chiếu tương ứng của
nó. ............................................................................................................................. 39
Hình 2.22: Hình ảnh minh họa chọn các vùng Q i và mẫu tham chiếu ............... 40
Hình 2.23: Mô hình tạo mẫu tham chiếu của camera .............................................. 41
Hình 2.24: Sơ đồ mô tả mô hình thực nghiệm ......................................................... 44
Hình 3.1: Giao diện chính ........................................................................................ 45
Hình 3.2: Giao diện thông tin................................................................................... 46
Hình 3.3: Lựa chọn vùng nghi vấn........................................................................... 47
Hình 3.4: Giao diện kiểm tra vùng nghi vấn............................................................ 48
Hình 3.5: Thêm vùng nghi vấn ................................................................................ 48
Hình 3.6: Chương trình đang phân tích.................................................................... 49
Hình 3.7: Kết quả kiểm tra vùng giống nhau ........................................................... 50
vii
PHẦN 1: PHẦN MỞ ĐẦU
1. Giới thiệu tổng quan về đề tài
Mỗi bức ảnh được sáng tác một cách có chủ đích đều truyền tải những thông
điệp riêng, bên cạnh đó ảnh được coi là công cụ biểu diễn và truyền đạt thông tin rất
nguồn sáng, thuật toán phân tích mẫu nhiễu cảm biến.
Trong thực tế, các bức ảnh giả mạo thường được làm giả bằng cách thêm, bớt,
xóa, sửa...thuật toán Exact Mach dựa trên ý tưởng đối sánh khối bao để tìm ra
những điểm giống nhau trên bức ảnh nhằm phát hiện ảnh giả mạo trong trường hợp
ảnh bị cắt dán bởi các phần khác trong ảnh nhưng chưa phát hiện được ảnh có thay
*
đổi kích thước, thuật toán Exact Mach cũng dựa trên ý tưởng đối sánh khối bao có
khả năng phát hiện đối với các ảnh giả mạo đạng cắt dán từ hính một ảnh và có sự
thay đổi về kích thước cho phép giả quyết bài toán thực tế. Do vậy, tôi lựa chọn
*
thuật toán Exact Mach, thuật toán Exact Mach để thử nghiệm cho chương trình phát
hiện ảnh giả mạo.
2. Bố cục luận văn
Phần mở đầu: Giới thiệu tổng quan đề tài và bố cục luận văn
Nội dung:
Ử LÝ ẢNH VÀ ẢNH GIẢ MẠO
1.1. Một số khái niệm cơ bản trong xử lý ảnh.
1.2. Ảnh giả mạo và phát hiện ảnh giả mạo.
CHƯƠNG 2: MỘT SỐ KỸ THUẬT PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ
MẠO
2.1. Phát hiện ảnh giả mạo dựa trên thuật toán Exact Match
2.2. Phát hiện ảnh giả mạo dựa trên thuật toán phân tích nguồn sáng
2
2.3. Phát hiện ảnh giả mạo dựa trên thuật toán phân tích mẫu nhiễu
CHƯƠNG 3: THỬ NGHIỆM CHƯƠNG TRÌNH
P(X,Y)
Hình 1.2. Biểu diễn ảnh bằng hàm f(X,Y)
Các ảnh thường được biểu diễn theo 2 mô hình cơ bản:
Mô hình Raster: Là mô hình biểu diễn ảnh thông dụng nhất hiện nay. Ảnh
được biểu diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu thực tế mà mỗi
điểm ảnh có thể được biểu diễn bởi một hay nhiều bit. Mô hình Raster thuận lợi cho
việc thu nhận, hiển thị và in ấn.
Mô hình Vector: Bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ dàng
hiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có ưu điểm cho phép dễ
dàng lựa chọn, sao chép, di chuyển, tìm kiếm,…Theo những yêu cầu này thì kỹ
thuật biểu diễn vector tỏ ra ưu việt hơn.
1.1.3. Một số khái niệm cơ bản trong xử lý ảnh
Ảnh: Là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một
mảng hai chiều I ( n, p ) có n dòng và p cột, ảnh sẽ có n
để chỉ
p (pixel). Ta ký hiệu I ( X ,Y )
điểm ảnh có toạ độ ( X , Y ) .
Điểm ảnh: Gốc của ảnh là ảnh liên tục về không gian và độ sáng. Để xử
lý bằng máy tính, ảnh cần phải được số hoá.
Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm phù
hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các
điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa
chúng.
Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là
Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x,y).
biến đổi.
- Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân
khắc phục bằng các
phép lọc.
Phân tích ảnh
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh. Trong
phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng, các đặc điểm của
6
đối tượng được trích chọn tùy theo mục đích nhận dạng trong quá trình xử lý ảnh.
Một số đặc điểm của ảnh như: Đặc điểm không gian, đặc điểm biến đổi, đặc điểm
biên và đường biên.[1]
Nhận dạng ảnh
Nhận dạng ảnh thường đi sau các quá trình trích chọn các đặc trưng chủ yếu
của đối tượng. Quá trình này liên quan đến các mô tả đối tượng mà người ta muốn
đặc tả nó.
Nhận dạng ảnh là một qua trình phân hoạch ảnh thành các đối tượng ảnh con,
chúng được gán vào từng lớp nhãn để đối sánh với mẫu và đối sánh theo các quy
luật biết trước nào đó.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ
yếu sau đây:
- Thu nhận dữ liệu và tiền xử lý.
- Biểu diễn dữ liệu.
- Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
- Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
- Phân loại thống kê.
1.1.4.3. Phân đoạn ảnh
Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác nhau
hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh. Đây là phần
phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính xác
của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này.
1.1.4.4. Hệ quyết định
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng
điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý
và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện
lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo
cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các
phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
1.1.4.5. Trích chọn đặc điểm
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinh
trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt ra
những yêu cầu về tốc độ tính toán.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm
xuống.
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng
trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn.
- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện
lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature
mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung
tròn v.v..)
9
- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do
thủ, làm sai lệch chứng cứ tội phạm v.v…
Ảnh giả mạo được chia làm hai loại:
Thứ nhất, đó là ảnh giả mạo như thật, được dàn dựng một cách có ý
đồ sau đó thu nhận ảnh và không thực hiện thao tác chỉnh sửa trực tiếp
trên ảnh thu nhận được.
Thứ hai, ảnh giả mạo được tạo ra từ việc có tác động lên ảnh nhằm
thay đổi nội dung và bản chất bức ảnh dựa trên các kỹ thuật xử lý ảnh
(cắt, dán, ghép, thêm, bớt, chỉnh sửa).
ị tiêu diệt, những bức ảnh giả về thi thể
của thủ lĩnh al-Qaeda đã nhanh chóng lan truyền trên internet. Tuy nhiên, đây
không phải lần đầu tiên cư dân mạng bị lừa vì những bức ảnh giả
- .
Bức ảnh giả về thi thể của trùm khủng bố Osama bin Laden xuất hiện trên
mạng sau khi thủ lĩnh al-Qaeda bị tiêu diệt. Thậm chí một số nghị sĩ Mỹ cũng tin
đây là ảnh thật cho tới khi biết họ bị lừa.
11
Hình 2.1. Bức anh giả mạo của Brian Walski
Ví dụ, bức ả
2.1 về chiến tranh Iraq. Năm 2003, phóng viên ảnh
chiến trường Brian Walski của tờ Los Angeles Times đã tạo ra bức ảnh giả (dưới)
bằng cách phối 2 bức ảnh nguyên bản (trên) để tăng tính gay cấn . Nhưng kỹ xảo
của phóng viên Walski, một phóng viên ảnh lâu năm và có uy tín, đã bị phát hiện
nhờ việc phát hiện ra một vài người ở nền xuất hiện hai lần trên bức .
Hình 2.2. Nghị sĩ John Kerry và nữ diễn viên Jane Fonda phát biểu
13
Một ví dụ khác của dạng giả mạo này là hình 2.3b. Hình này là ảnh ghép từ
hai ảnh có sự thay đổi tỷ lệ.
1.2.2.2. Tăng cường ảnh
Đây là một lớp kỹ thuật tiến hành trên một vùng rộng, không phải là làm
tăng cường lượng thông tin vốn có mà làm nổi bật một số đặc tính của ảnh như:
thay đổi độ tương phản, lọc nhiễu, nổi biên, làm trơn biên, tăng cường độ tương
phản, điều chỉnh mức xám của ảnh. Hình 2.4 gồm một ảnh gốc (góc trên bên trái),
và 3 ví dụ về việc tăng cường ảnh. Ảnh gốc (trên trái) và ảnh được thay đổi màu sắc
(trên phải), tăng độ tương phản (dưới trái) và làm mờ nền (dưới phải). Mặc dù loại
giả mạo này không thay đổi sự xuất hiện của các đối tượng nhưng có thể gây nên
một vài hiệu ứng trong việc cảm nhận bức ảnh.
Hình 2.4. Ví dụ về tăng cường ảnh
1.2.2.3. Sao chép và dịch chuyển vùng trên ảnh
Một dạng khác thường thấy nữa của ảnh giả mạo loại 2 là việc sao chép dịch chuyển các đối tượng trong ảnh, việc này được xem như là che phủ hoặc xóa đi
đối tượng. Hình 2.5a là ảnh gốc với hai chiếc ô tô, một xe con và một xe tải. Hình
2.5b là ảnh 2.5a giả mạo với việc che phủ chiếc xe tải bởi một cành cây cũng lấy từ
14
chính trong ảnh. Trong khi hình 2.5c là ảnh gốc với chiếc trực thăng nhỏ còn hình
2.5d chính là ảnh gốc 2.5c đã được bỏ đi đối tượng là trực thăng. Trong cả hai dạng
giả mạo này đều được thực hiện từ một ảnh nên độ tương đồng về ánh sáng và bóng
là như nhau. Trong những trường hợp này bằng mắt thường rất khó xác định.
Hình 2.5. Ảnh che phủ và bỏ đi đối tượng