1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN HỮU TUYÊN ĐÁNH GIÁ CÁC PHƢƠNG PHÁP PHÁT HIỆN
ẢNH SỐ GIẢ MẠO Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin
Mã số: 60 48 05
LUẬN VĂN THẠC SĨ
NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. Lê Vũ Hà Hà Nội - 2013
3
MỤC LỤC
DANH MỤC CÁC HÌNH 5
4
Chương 3: NGHIÊN CỨU SỬ DỤNG MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN ẢNH SỐ GIẢ
MẠO 33
3.1. Phương ph|p sử dụng DCT ph|t hiện sao - chuyển ảnh 33
3.1.1. Phương ph|p 33
3.1.2. Thuật to|n 36
3.1.3. Kết quả thực nghiệm 36
3.1.4. Kết luận 38
3.2. Phương ph|p ph}n tích mức độ lỗi JPEG (ELA) 39
3.2.1. Phương ph|p 39
3.2.2. Thuật to|n 40
3.2.3. Thực nghiệm 41
3.2.4. Kết luận 43
3.3. Quang sai màu (Chromatic Aberration) 43
3.3.1. Phương ph|p 43
3.3.2. Thuật toán 45
3.3.3. Thực nghiệm 45
3.3.4. Kết luận 48
Chương 4: ĐÁNH GIÁ CÁC PHƯƠNG PHÁP PHÁT HIỆN ẢNH SỐ GIẢ MẠO 49
4.1. Thực nghiệm so s|nh ba phương ph|p ph|t hiện ảnh số giả mạo 49
4.2. Đề xuất mô hình ph|t hiện ảnh số giả mạo 52
KẾT LUẬN 54
TÀI LIỆU THAM KHẢO 55 5
Hình 4.2 Ảnh giả bởi kỹ thuật ghép ảnh (splicing) trong thư viện CASIA v1.0 50
Hình 4.3 Mô hình đề xuất phát hiện ảnh số giả mạo 53
6
DANH MỤC CÁC BẢNG
Bảng 3.1 Kết quả thực nghiệm phương pháp DCT phát hiện ảnh giả mạo 37
Bảng 3.2 Các kết quả thử nghiệm phương pháp phân tích mức độ lỗi ELA với
các bức ảnh được lấy từ nhiều nguồn khác nhau 43
Bảng 3.3 Kết quả so sánh thực nghiệm giữa các phương pháp phát hiện ảnh giả
50
7
DANH MỤC CÁC TỪ VIẾT TẮT
Viết tắt
Đầy đủ - mô tả
JPEG
Joint Photographic Experts Group - Là một phương pháp nén ảnh
hiệu quả
DCT
Discrete Cosine Transform - Dãy biến đổi cosine rời rạc
PCA
Principal Component Analysis - Phân tích thành phần chính
EM
Expectation Maximization - Thuật toán kỳ vọng cực đại
xác minh bằng các công cụ phân tíchảnh.
Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau
như việc vu cáo, tạo ra các tin giật gân, làm sai lệch chứng cứ phạm tội v.v…
Nhiều phương pháp phát hiện loại ảnh giả được phát triển, tuy nhiên,
không có phương án nào là tối ưu cho mọi ảnh giả. Vì vậy cần thiết phải so sánh
các phương pháp phát hiện ảnh giả với nhau, từ đócó thể đưa ra giải pháp tốt để
phát hiện ảnh số giả mạo. Chính vì vậy, tôi đã chọn đề tài “Đánh giá các
phƣơng pháp phát hiện ảnh số giả mạo”.
Mục tiêu nghiên cứu được đề ra như sau:
- Tìm hiểu một số phương pháp giả mạo ảnh số thường gặp.
- Tìm hiểu một số kỹ thuật phát hiện ảnh số giả mạo.
- Cài đặt các kỹ thuật được tìm hiểu và thử nghiệm nhằm so sánh đánh giá
hiệu quả của các kỹ thuật này chống lại các phương pháp giả mạo ảnh khác
nhau.
Bố cục của luận văn được trình bày như sau:
Mở đầu
Đặt vấn đề về ý nghĩa, tính cấp thiết và tính thực tế của đề tài.
Chƣơng 1: Tổng quan về nhận diện ảnh giả mạo
Chương này sẽ giới thiệu với người đọc khái quát một số phương pháp giả
mạo ảnh số thường gặp, bao gồm lịch sử ra đời, các đặc điểm, đồng thời cũng
trình bày một số kỹ thuật phát hiện ảnh số giả mạo hiện nay, để từ đó giúp người
đọc có cái nhìn tổng quan về lĩnh vực nhận diện ảnh số giả mạo.
Chƣơng 2: Tổng quan về các kỹ thuật phát hiện ảnh số giả mạo
Chương này trình bày một cách khái quát về các phương pháp phát hiện
ảnh số giả mạo và sự phân loại giữa chúng, từ đó lựa chọn ba phương pháp để
9
tiến hành thực nghiệm nhằm so sánh, đánh giá các phương pháp phát hiện ảnh
Năm 1937: Adolf Hitler đã loại JosephGoebbels ra khỏi bức ảnh. [1]
Hình 1.2Bức ảnh giả của tướng Grant được cắt ghép từ ba hình ảnh riêng biệt
11
Năm 1964:Một bứcảnh được làm giả với ngụ ý, tổng tư lệnh quân đội miền
Nam- tướng Ulysses S. Grant đứng trước quân đội của mình tại thành phố
Virginia trong cuộc nội chiến Mỹ. Công việc phát hiện sự giả mạo này được
thực hiện bởi một nhóm nhà nghiên cứu tại thư viện quốc hội Mỹ, cho thấy ảnh
in này được ghép từ ba bức ảnh riêng biệt. Bức ảnh thứ nhất được lấy từ chân
dung của tướng Grant, thứ hai, lấy hình ảnh con ngựa và cơ thể của một vị tướng
có tên là Alexander M.McCook và thứ ba, nền được lấy từ một bứ ảnh chụp
những tù nhân miền Bắc bị bắt. [1]
Hình 1.3Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh
Tháng 8/2006: một bức ảnh minh họa của hãng tin Reuters xuất hiện trên các
trang báo lớn nhỏ trên khắp thế giới. Nội dung của bức ảnh là những cột khói
tỏa lên từ một số tòa nhà cao tầng sau một đợt không kích của không quân Isarel
vào Beirut. Nhưng sau đó họ đã phát hiện ra một phần của bức ảnh đã bị người
ta sao chép (copy), rồi dán lặp lại nhiều lần trong bức ảnh, nhằm làm tăng liều
lượng khói.
Bằng cách này hay cách, với mục đích này hay mục đích khác, người ta
đã tạo ra rất nhiều bức ảnh giả mạo nhằm phục vụ các mục đích khác nhau.
Nhiệm vụ của các nhà khoa học đó là làm thế nào để phát hiện ra các bức ảnh
giả đó và chứng minh phương pháp phát hiện của mình là đúng đắn.
1.2. Một số phƣơng pháp giả mạo ảnh số thƣờng gặp
Kỹ thuật giả mạo ảnh số không khác nhiều so với kỹ thuật giả mạo ảnh
thông thường. Thay vì sử dụng các bức ảnh, thì kỹ thuật giả mạo ảnh số sử dụng
Hình 1.5 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật cắt ghép (Splicing)
1.2.3. Sao - chuyển vùng ảnh (Copy-Move)
Kỹ thuật sao - chuyển vùng ảnh về mức độ nguy hiểm tương tự như kỹ
thuật ghép ảnh, theo cách nhìn cả hai kỹ thuật này đều làm thay đổi một vùng
của ảnh gốc. Tuy nhiên, thay vì cần một hình ảnh bên ngoài như kỹ thuật ghép
ảnh, kỹ thuật sao - chuyển vùng ảnh dùng chính vùng trên ảnh gốc để tạo ra bức
ảnh giả. Nói cách khác, nguồn và đích của đều bắt nguồn từ một hình ảnh. Trong
một thao tác sao - chuyển vùng ảnh, một phần của ảnh sẽ được cắt và dán đến
một vị trí mong muốn của bức ảnh. Điều này thường được thực hiện để che dấu
một số chi tiết hoặc nhân bản một số đối tượng trên hình ảnh. Các kỹ thuật làm
mờ thường được áp dụng dọc theo biên của khu vực sao - chuyển vùng ảnh để
làm giảm hiệu ứng bất thường giữa khu vực gốc và khu vực được sao - chuyển
vùng ảnh. Hình ảnh dưới đây cho thấy một hình ảnh mẫu đã bị giả mạo bằng
cách sử dụng sao - chuyển vùng ảnh. Bên trái là ảnh giả và bên phải là ảnh thật.
Hình 1.6 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật sao - chép vùng ảnh
Trong khuôn khổ của đề tài, tôi tập trung nghiên cứu cách phát hiệnhai
loại ảnh giả là sao - chuyển vùng ảnh và ghép ảnh, có mức độ nguy hiểm lớn vì
nó làm sai lệch thông tin so với ảnh gốc. Còn loại ảnh tút ảnh (retouching) - loại
14
ảnh làm đẹp cho các tạp chí, các ảnh quảng cáo với mức độ nguy hiểm thấp, do
không làm sai khác nhiều thông tin, sẽ chỉ được giới thiệu ở chương này.
15
JPEG, nó sẽ gây ra sự khó khăn trong việc so sánh để tìm ra các vùng nhân bản.
Hiện nay, có hai phương pháp chính nghiên cứu để phát hiện ra các vùng
nhân bản của ảnh giả dạng sao - chuyển vùng ảnh. Thứ nhất đó là phương pháp
dựa trên thuật toán dãy biến đổi cosin rời rạc (DCT). Khu vực nhân bản sẽ được
16
phát hiện bởi từ điển phân loại khối hệ số DCT và nhóm các khối tương tự. Thứ
hai đó là phương pháp dựa trên việc phân tích thành phần chính (PCA), việc sử
dụng PCA nhằm xác định các vector cơ sở và tìm khu vực trùng lặp phát hiện
bởi từ điển phân loại khối vector cơ sở và nhóm các khối tương tự.
2.1.2. Lấy mẫu lại (Re-sampling)
Để tạo ra một bức ảnh thuyết phục, người ta có thể phải thay đổi kích
thước, xoay ảnh hoặc kéo dài các phần của hình ảnh. Quá trình này yêu cầu lấy
mẫu lại (re-sampling) vào một lưới mẫu mới. Mặc dù việc lấy mẫu lại bình
thường không dễ nhận thấy, nhưng nó có mối tương quan đặc biệt với hình ảnh,
khi phát hiện nó có thể được sử dụng làm bằng chứng của sự giả mạo.
Xét ví dụ đơn giản với tín hiệu một chiều x(n) có độ dài là M. Lấy mẫu lại
tín hiệu này để có tín hiệu mới là y(n) có độ dài 2M. Các mẫu lẻ của tín hiệu
được lấy mẫu lại bằng giá trị của tín hiệu ban đầu: y(2i-1)= x(i), i=1,…
,. Các
mẫu chẵn sẽ là trung bình của các tín hiệu liền kề.
y(2i) =
1
2
x(i)+
Một hình thức phổ biến của việc giả mạo ảnh số đó là ghép hai hoặc nhiều
ảnh vào với nhau. Khi họ thực hiện một cách cẩn thận không thể thấy được biên
giới giữa các vùng ghép đó bằng mắt thường. Tuy nhiên, một số nhà nghiên cứu
đã cho thấy có thể sử dụng thống kê Fourier bậc cao để phát hiện ra sự ghép nối
đó. Xét một tín hiệu một chiều x(n) và có dãy biến đổi Fourier X(). Phổ năng
lượng biểu diễn là P(Ω)=X(Ω)X*(Ω) được sử dụng để phân tích các thành phần
của tần số tín hiệu. Ngoài phổ, ta có công thức thống kê sử dụng để tìm kiếm các
tương tác không tuyến tính:
B(Ω
1
,Ω
2
) = X(Ω
1
)X(Ω
2
)X*(Ω
1
+Ω
2
) (2.3)
Dựa vào công thức, ta thấy được sự tương quan giữa bathành phần tần
sốΩ
1
, Ω
2
và Ω
1
+ Ω
2
với tỷ lệ nén cao hơn. Với một số biến thể khác nhau, trình tự nêu trên được phát
triển bởi các bộ mã hóa JPEG trong máy ảnh kỹ thuật số và phần mềm chỉnh sửa
hình ảnh. Các nguồn chính của các bộ mã hóa là sự chọn lựa các bảng lượng tử.
Như vậy, một dấu hiệu sắp xếp đã được nhúng vào trong mỗi ảnh JPEG. Bảng
lượng tử hóa có thể được triết xuất từ bộ mã hóa ảnh JPEG hoặc ước lượng từ
các hình ảnh được chụp từ máy ảnh này. Do các máy ảnh sử dụng các bộ mã hóa
khác nhau vì thế chúng ta có thể so sánh bảng lượng tử hóa của chúng và có thể
xác định được nguồn gốc của một hình ảnh, có thể được chụp bằng loại máy ảnh
này hay không.
2.2.2. Phần đầu ảnh JPEG (JPEG Header)
Sau khi lượng tử hóa, các hệ số DCT được đưa đến quá trình mã hóa dữ
liệu thường sử dụng mã hóa Huffman. Huffman là một phương pháp mã hóa với
độ dài từ mã biến đổi trong đó các giá trị xuất hiện thường xuyên hơn được gán
từ mã có độ dài ngắn hơn, còn các giá trị xuất hiện ít thường xuyên hơn được
gán các từ mã có độ dài lớn hơn. Đây là phương pháp mã hóa (nén) không mất
mát, được tăng hiệu quả nhờ sự lượng tử hóa các hệ số DCT trước khi mã hóa. Hình 2.1 Quá trình nén dữ liệu JPEG
Các chuẩn JPEG không quy định quá trình lượng tử hóa bảng mã hay mã
hóa Huffman. Các bộ nén có thể tùy ý cân đối giữa việc nén và chất lượng cho
nhu cầu và thị hiếu riêng của họ. Các bảng lượng tử hóa và các bảng mã
Huffman được sử dụng để giải mã một tập tin JPEG sẽ được nhúng vào phần
đầu (header) của JPEG. Các bảng lượng tử hóa JPEG và mã Huffman cùng với
các trích xuất dữ liệu từ các phần đầu của tệp ảnh JPEG có thể coi là một dấu
hiệu riêng biệt của bộ nén và có thể được sử dụng để nhận dạng.
Phần chính (2) Exif (3) Khả năng tương thích (4) Ảnh thu nhỏ (5) GPS. Nhà sản
xuất thiết bị chụp ảnh số có thể tùy ý đưa bất kỳ thông tin vào trong tệp ảnh số.
Một biểu diễn nhỏ của họ có thể được chiết xuất bằng cách đếm số lượng các
mục của một trong năm thành phần chính. Bởi vì tiêu chuẩn EXIF cho phép tạo
ra thêm các thành phần bổ sung. Tổng số bất kỳ một IFD và tổng số các mục
trong IFD cũng được sử dụng để nhận dạng. Một số nhà sản xuất máy ảnh tùy
chỉnh những dữ liệu theo cách không phù hợp với tiêu chuẩn EXIFsẽ gặp lỗi khi
phân tích các dữ liệu. Những lỗi này được coi là một tính năng của máy ảnh
được thiết kế và tổng số lỗi phân tích cú pháp được sử dụng như một tính năng
để nhận dạng. Trong tám giá trị được chiết xuất từ dữ liệu, năm lần đếm cho
năm phần trong IFD, một lần đếm số bổ sung của IFD, một cho đếm các lỗi
phân tích cú pháp.
20
Trong phần tóm lược, có 284 giá trị chiết xuất từ độ phân giải đầy đủ của
hình ảnh, tương đương với 284 giá trị của phần đầu (header) trong hình ảnh thu
nhỏ, 8 từ chuẩn EXIF, tổng cộng là 576 giá trị hình thành nên 576 dấu hiệu riêng
có thể dùng là nhận dạng. Trong phạm vi mà hình ảnh phần mềm chỉnh sửa ảnh
sử dụng các thông số JPEG khác từ bộ nén khác, bất kỳ thay đổi sẽ làm thay đổi
nhận dạng ban đầu và do đó có thể được phát hiện.
Cụ thể, sự thay đổi hình ảnh được phát hiện bằng cách giải nén các dấu
hiệu riêng và so sánh nó với một cơ sở dữ liệu các dấu hiệu riêng của máy ảnh
đó. Bất kỳ một vùng nào của máy ảnh tạo ra cũng có thể được đưa ra so sánh với
các đặc điểm riêng của mô hình dữ liệu EXIF. Sự không phù hợp là bằng chứng
thuyết phục cho một sự giả mạo.
Một số thí nghiệm của các nhà khoa học cũng cho thấy rằng, các dấu hiệu
từ các phiên bản của phần mềm Adobe Photoshop (ver 3, 4, 7, CS, CS2, CS3,
CS4, CS5) được so sánh với dấu hiệu của 9.163 dấu hiệu riêng của bộ nén trên
quátrình ngượi lại của lượng tử hóakhông phải là hàm nghịch đảo của lượng tử.
Hoạt động hai lần lượng tử hóa là hoạt động được mô tả bởi hàm:
=
(2.5)
Trong đó a và b là các bước lượng tử hóa (số nguyên dương), Lượng tử
hóa kép có thể biểu diễn với ba bước: lượng tử hóavới a, đảo ngược lại bước
lượng tử hóa với hệ số a, sau đó lượng tử hóa với hệ số b.
2.2.4. Hiệu ứng khối JPEG (JPEGBlocking)
Như mô tả trong phần trước, cơ sở cho việc nén JPEG là biến đổi DCT.
Vì mỗi một khối DCT được biến đổi riêng biệt và được lượng tử hóa, dấu hiệu
riêng sẽ xuất hiện ở biên của các khối lân cận ở các cạnh dọc và ngang. Khi một
hình ảnh bị thay đổi, các dấu hiệu riêng của các khối sẽ bị thay đổi. Người ta
cũng dựa vào các dấu hiệu thay đổi này để tìm ra việc làm giả hình ảnh. Họ xem
xét các giá trị khác biệt của điểm ảnh trong và giữa ranh giới các khối. Những sự
khác biệt này có xu hướng trong khối sẽ nhỏ hơn ngoài khối. Khi một hình ảnh
được cắt và nén lại, tập các dấu hiệu khối mới có thể sẽ khác với ranh giới ban
đầu. Các giá trị điểm ảnh khác nhau của trong và giữa ranh giới được tính toán
từ bốn điểm ảnh lân cận bằng một giá trị xác định, trong đó một điểm ảnh lân
Hình 2.2 Mô phỏng sử dụng quang sai để phát hiện ảnh giả
Trong quang học cổ điển, sự khúc xạ ánh sáng ở biên giới giữa hai nguồn
sáng được mô tả theo luật Snell‟s: sin
=
sin
, trong đó là góc sáng,
23
là góc khúc xạ, n và n
f
là chỉ số khúc xạ của các phương tiện truyền ánh sáng
mà qua đó, ánh sáng đi qua. Chỉ số khúc xạ của thủy tinh n
0
+
0
(2.7)
Trong đó là một giá trị vô hướng và (x
0
, y
0
) là gốc khúc xạ.
Việc ước tính thông số của mô hình này như là chìa khóa để giải quyết
vấn đề. Khi quang sai cho kế quả không thẳng hàng giữa các kênh màu. Mô hình
tham số được ước tính bằng cách tối đa hóa sự liên kết của các kênh màu. Cụ
thể, thông tin giữa các kênh màu đỏ và màu xanh lá cây được tối đa (một ước
lượng tương tự được thực hiện để xác định sự biến dạng giữa các kênh màu
xanh và màu xanh lá cây). Tính toán quang sai của khu vực sau đó so sánh với
quang sai toàn cục ta sẽ phát hiện ra sự giả mạo.
2.3.2. Mảng lọc màu (Color Filter Array)
Một hình ảnh kỹ thuật số bao gồm ba kênh màu chứa sự khác nhau về dải
tần quang phổ màu sắc. Hầu hết các máy ảnh kỹ thuật số đều trang bị bộ cảm
biến CCD hoặc CMOS và các ảnh màu được chụp qua mảng lọc màu (CFA).
Hầu hết các bộ lọc màu gồm ba màu (đỏ, xanh và xanh lá cây), được đặt trên
mỗi đỉnh của bộ cảm biến. Kể từ khi chỉ là một mẫu màu duy nhất được ghi lại
tại mỗi vị trí điểm ảnh, hai mẫu màu sắc phải được ước tính từ màu lân cận để
có được một màu gồm có cả ba kênh màu. Việc ước tính của các màu bị mất
được gọi là phép nội suy hoặc khử (Demosaicking) CFA. Demosaicking là
phương pháp dựa trên những hoạt động hạt nhân trên mỗi kênh độc lập (ví dụ,
nội suy tuyến tính hoặc song lập phương). Hơn thế nữacác thuật toán nội suy
tuyến tính sẽ làm mờ các tính năng hình ảnh. Bất kể triển khai cụ thể thực tế,
CFA nội suy đưa ra thống kê cụ thể mối tương quan giữa một tập hợp các điểm
ảnh với mỗi một kênh màu. Khi mà mảng lọc màu CFA thường được sắp xếp
2
. Nếu đáp ứng máy ảnh là
tuyến tính thì các điểm ảnh dọc theo cạnh đó phải là một sự kết hợp tuyến tính
màu sắc của các điểm ảnh lân cận. Độ lệch của các điểm ảnh trung gian dự kiến
sẽ đáp ứng tuyến tính được sử dụng để ước tính chức năng đáp ứng của máy
ảnh. Chức năng đáp ứng nghịch đảo của máy ảnh sẽ được lấy từ mối tương quan
giữa các điểm ảnh màu trước và mối quan hệ tuyến tính được ước tính từ ước
lượng hậu cực đại (MAP). Để ổn định ước lượng các cạnh được lựa chọn trên cả
hai mặt của cạnh tương tự, sự chênh lệch ở hai bên cạnh là nhỏ, sự khác biệt
giữa c
1
và c
2
là lớn và các điểm ảnh dọc theo cạnh là giữa c
1
và c
2
. Hạn chế của
phương pháp này là cần thiết phải có tăng đơn điệu với nhiều nhất một điểm ảnh
có sự thay đổi và nên xét trên mỗi kênh màu. Khi có thể ước tính được đáp ứng
ở mức độ bộ phận, ta cũng có thể so sánh với đáp ứng trên toàn cục để tìm ra
vùng bị làm giả.
25
2.3.4. Nhiễu có cấu trúc (Pattern Noise)
Trung tâm của mọi máy ảnh kỹ thuật số là cảm biến hình ảnh. Cảm biến
chia thành những địa chỉ rất nhỏ điểm ảnhđó là tập hợp photon và giấu chúng