Phương pháp SPF động và ứng dụng trong lọc thư rác - Pdf 16

PHƯƠNG PHÁP SPF ĐỘNG VÀ ỨNG DỤNG TRONG
LỌC THƯ RÁC

Trần Quang Anh
(1)
, Cao Việt Thiện
(2)
(1)
Khoa Công nghệ Thông tin, Trường Đại học Hà Nội,
(2)
Văn phòng UBND tỉnh Sơn La
(1)
,
(2)
TÓM TẮT
Điểm yếu của các phương pháp xác thực địa chỉ người gửi hiện tại xuất phát từ bản chất
của vấn đề là: Bên gửi thư phải thiết lập lại DNS của phía mình, nhưng người được
hưởng lợi trực tiếp lại không phải là bên gửi thư mà là bên nhận thư. Chúng tôi đã đề
xuất phương pháp SPF động, cho phép các bên gửi thư và nh
ận thư không phải thiết lập
lại DNS của mình mà vẫn có thể xác thực địa chỉ người gửi. Kết quả thí nghiệm cho thấy
phương pháp SPF động có thể cho tỷ lệ lọc thư rác là 98%, tỷ lệ lọc nhầm thư bình
thường là 0.1%. Kết quả nghiên cứu được ứng dụng trong lọc thư rác, lừa đảo trực tuyến
tại Trường Đại học Hà Nội.

1. GIỚI THIỆU
Ngày nay, thư điện tử đã trở thành một công cụ đắc lực phục vụ cho nhu cầu trao đổi
thông tin của các cơ quan, tổ chức, doanh nghiệp cũng như mỗi cá nhân. Tuy nhiên, thư

chỉ IP của máy chủ gửi thư để xác định thư nào là thư giả mạo.
Trong phương pháp SPF động, các thông tin xác thực địa chỉ người gửi sẽ do một bên thứ
3 phụ trách. Các bên gửi thư và nhận thư không phải thi
ết lập lại DNS của mình mà vẫn
có thể xác thực địa chỉ người gửi. Kết quả nghiên cứu được ứng dụng trong lọc thư rác,
lừa đảo trực tuyến và hỗ trợ quá trình triển khai SPF tại Việt Nam.
Phần còn lại của báo cáo được trình bày như sau: Phần 2 giới thiệu về phương pháp SPF
và điểm yếu của nó. Phần 3 đưa ra phương pháp SPF động và các phân tích liên quan.
Phần 4 thảo lu
ận các vấn đề lý luận liên quan đến phương pháp SPF động. Phần 5 trình
bầy kết quả triển khai phương pháp SPF động tại Trường Đại học Hà Nội. Cuối cùng là
kết luận và các hướng nghiên cứu tiếp theo.

2. PHƯƠNG PHÁP SPF
Sender Policy Framework (SPF) là kỹ thuật ngăn chặn spam thuộc nhóm phương pháp
xác thực địa chỉ người gửi (sender authentication), kỹ thuật này giúp người nhận xác thực
địa chỉ của người gửi là thậ
t hay giả, từ đó có thể ngăn chặn được việc phát tán thư rác
hay lừa đảo trực tuyến [3].
Phương pháp SPF do tập đoàn American Online (AOL) đưa ra. Phương pháp này yêu cầu
xác lập DNS, trong đó khai báo những máy chủ nào có thể gửi thư từ một tên miền
Internet nhất định. Phía người nhận sẽ thông qua truy vấn DNS để xác thực địa chỉ của
người gửi và địa chỉ IP có phù hợp với nhau không, từ đ
ó biết được địa chỉ người gửi là
thật hay giả. Hoạt động của SPF được mô tả trong Hình 1: Hình 1: Phương thức hoạt động của SPF

Trước hết phía gửi thư cần thực hiện thao tác cài đặt trên máy chủ DNS của mình để khai

hoạt động của SPF động.
Hình 2: Phương thức hoạt động của SPF động

Cơ sở dữ liệu SPF động chứa thông tin khai báo những máy chủ nào có thể gửi thư từ
một tên miền Internet nhất định. Cơ sở dữ liệu SPF động được xây dựng thông qua thống
kê, phân tích các số liệu lịch sử. Dựa vào cơ sở dữ liệu này để phán đoán một thư mới có
phải là thư rác hay lừ
a đảo trực tuyến hay không. Nếu thư mới được gửi đi từ một địa chi
IP có trong cơ sở dữ liệu ứng với tên miền của địa chỉ người gửi thì đó là thư bình thường,
ngoài ra thì bị nghi vấn là thư rác. Để hệ thống hoạt động chính xác thì cơ sở dữ liệu này
cần phải chính xác.
Các dữ liệu SPF động sẽ được cung cấp cho người dùng (máy ch
ủ thư điện tử) dưới dạng
dịch vụ của một bên thứ 3. Trong Hình 2, khi máy chủ nhận được một thư điện tử, nó sẽ
truy vấn dịch vụ của máy chủ cung cấp dịch vụ SPF động để lấy các thông số về địa chỉ
người gửi, từ đó xác định địa chỉ người gửi là thật hay giả. Các truy vấn của ng
ười dùng
đến dịch vụ SPF động sẽ được máy chủ cung cấp dịch vụ ghi lại. Số liệu này sẽ được
dùng để thống kê, phân tích và cập nhật CSDL của SPF động. Chúng tôi đã sử dụng dịch
vụ DNS để cung cấp dịch vụ SPF động, như vậy, người dùng không phải cài đặt hay thay
đổi các thiết lập hiện tại mà vẫn có thể sử dụng được dịch vụ SPF động.
Thách thức lớn nhất của phương pháp SPF động này là làm thế nào để tự động cập nhật
CSDL của SPF động dựa trên các số liệu lịch sử (log). Phần tiếp theo của báo cáo sẽ phân
tích vấn đề
này.

4. CẬP NHẬT CSDL SPF ĐỘNG

60
80
100So luong domain_ip
Thoi gian co hieu luc (ngay)
thu binh thuong
thu rac

Hình 3. Phân bố số lượng cặp (tên miền, IP) theo thơi gian

Kết quả này khẳng định có thể thông qua thống kê các số liệu lịch sử để chắt lọc các địa
chỉ máy chủ thật cho một tên miền. Chúng tôi đã làm thí nghiệm về hiệu quả của phương
pháp SPF động khi sử dụng các ngưỡng thời gian có hiệu lực khác nhau, kết quả được
trình bày trong Hình 4.
1234567
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5

sai so (%)
Nguong thoi gian co hieu luc
thu binh thuong
thu rac


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status