LUẬN VĂN: NGHIÊN CỨU MẠNG THƯ ĐIỆN TỬ VÀ ỨNG DỤNG TRONG LỌC THƯ RÁC - Pdf 10

- 1 -

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Bùi Ngọc Lan NGHIÊN CỨU MẠNG THƯ ĐIỆN TỬ
VÀ ỨNG DỤNG TRONG LỌC THƯ RÁC KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUI

Ngành: Công nghệ thông tin


KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QU
I

Ngành: Công nghệ thông tin
Cán bộ hướng dẫn: Tiến sĩ Trần Quang Anh
Cán bộ đồng hướng dẫn: Tiến sĩ Hà Quang Thụy
dẫn em trong suốt quá trình thực hiện khoá luận này.
Em xin chân thành cám ơn các thầy lãnh đạo Viện CNTT - ĐHQGHN, anh
Nguyễn Việt Cường (Trường Đại h
ọc Công nghệ - ĐHQGHN) và anh Phan Bá Hùng
(Viện Công nghệ Thông tin - ĐHQGHN) đã giúp đỡ, tạo điều kiện thuận lợi để em
tiến hành có kết quả các thử nghiệm trên mail-server thực.
Em xin bày tỏ lời cảm ơn sâu sắc tới các thầy, cô trong trường Đại học Công
nghệ đã dạy dỗ và tận tình chỉ bảo cho em trong suốt quá trình học tập tại trường.
Em cũng muốn gửi lời cảm
ơn tới các thầy cô, anh chị và các bạn trong nhóm
xê-mi-na “Khai phá dữ liệu và khám phá tri thức” thuộc bộ môn Các hệ thống thông
tin, Trường Đại học Công nghệ đã ủng hộ và khuyến khích em trong quá trình nghiên
cứu và thực hiện khoá luận này.
Và lời cuối cùng, em xin gửi lời cảm ơn chân thành và biết ơn vô hạn tới bố, mẹ,
anh chị những người đã có công sinh thành, nuối nấng, dạy dỗ và luôn động viên,
khuyến khích em trong cuộc s
ống, trong học tập và làm việc.

Sinh viên
Bùi Ngọc Lan
- 4 -

Tóm tắt
Vấn đề thư rác từ lâu đã gây không ít phiền nhiễu cho người sử dụng thư điện tử
và là vấn đề đau đầu của những người quản lý mạng. Có rất nhiều giải pháp chống thư
rác đã được đưa ra và áp dụng trong thực tế. Tuy nhiên, các phương pháp này đều tỏ ra
chưa thực sự hiệu quả và mang những nhược điểm cố hữu củ
a nó. Trong luận văn này,
trên cơ sở nghiên cứu cấu trúc và các tính chất đặc trương của mạng thư điện tử (Email
Networks) từ đó đề xuất một phương pháp lọc thư rác mới dựa trên mạng thư điện tử.

N
N 3
MỞ ĐẦU 8
CHƯƠNG 1: TỔNG QUAN VỀ THƯ RÁC 10
1.1 Khái niệm thư rác 10
1.1.1 Thư rác là gì ? 10
1.1.2 Các đặc điểm của thư rác. 11
1.1.3 Phân loại thư rác 12
1.1.4 Những thiệt hại do thư rác gây ra 13
1.2 Các giải pháp cho vấn đề lọc thư rác 16
1.2.1 Ban hành các bộ luật chống thư rác 16
1.2.2 Các phương pháp lọc thư rác trước đây 16
CHƯƠNG 2: KIẾN THỨC CƠ SỞ 26
2.1 Mạng phức hợp (Complex Networks) 26
2.1.1 Độ dài đường dẫn trung bình 30
2.1.2 Độ phân cụm 31
2.1.3 Độ phân bố bậc 31
2.2 Các mô hình của mạng phức hợp 33
2.2.1 Mạng cặp thông thường (Regular coupled networks) 33
2.2.2 Đồ thị ngẫu nhiên (Random Graphs) 34
2.2.3 Các mô hình Small-world 36
2.2.4 Các mô hình Scale-free 39
2.3 Mạng xã hội (Social Networks) 41
2.4 Mạng thư điện tử (Email Networks) 43
2.4.1 Mạng thư điện tử scale-free. 43
2.4.2 Tính chất Small-world của mạng thư điện tử. 44
2.4.3 Mạng thư điện tử là mạng có hướng 46
2.4.4 Sự lan rộng của virus trong mạng thư điện tử 48
2.4.5 Mạng thư điện tử khi bị spam tấn công 49
- 6 -

i tạo ra một số sơ hở để cho các loại thư không mong muốn
(thư rác: spam mail) hoạt động gây phiền toái cho người dùng. Trong một vài năm gần
đây, những thư điện tử không mong muốn như vậy phát triển và gây ra không ít thiệt
hại cho người dùng nói riêng và cho nền kinh tế - xã hội nói chung. Theo nhiều bản
thống kê [10,15], thư rác đã chiếm tới ¾ tổng số thư điện tử lưu thông trên toàn thế
gi
ới. Có không ít người dùng đã hạn chế sử dụng thư điện tử như một phương tiện liên
lạc, và điều đó đã gây ra sự trở ngại đáng kể cho liên lạc giữa các người dùng cũng
như hạn chế việc phát sinh lợi nhuận chính đáng của nền kinh tế nhờ phương tiện liên
lạc này.
Hiện nay, thư rác đang là một trong những vấ
n đề nhức nhối của xã hội.
Nhiều phương pháp, công cụ lọc thư rác đã được đề xuất, tuy nhiên nhìn chung các
công cụ lọc thư rác hiện nay vẫn tỏ ra chưa thực sự hiệu quả. Chính vì lý do đó, nhiều
hướng tiếp cận lọc thư rác mới đã được đề xuất [39], kể cả các hướng tiếp cận kết hợp
các phương pháp khác nhau, trong đó hướng tiế
p cận theo mạng xã hội là một trong
các hướng nổi bật nhất. Ý thức được điều này, hướng nghiên cứu về các phương pháp
lọc thư rác, tập trung theo hướng tiếp cận mạng thư điện tử đề tài của khóa luận với tên
gọi "Nghiên cứu mạng thư điện tử và ứng dụng trong lọc thư rác".
Khóa luận được tổ chức thành 4 chương nh
ư sau:
Chương 1 giới thiệu tổng quan về thư rác và một số hướng tiếp cận điển hình
trước đây trong việc lọc thư rác.
Chương 2 trình bày về một số tính chất quan trọng của mạng phức hợp, mạng
xã hội, mạng thư điện tử. Đây là cơ sở kiến thức để phát triển nội dung của khóa luận
trong các chương sau.
Chương 3 trình bày một phương pháp mới ứng dụng các tính chất của mạng
thư điện tử vào vấn đề lọc thư rác thông qua việc tính hạng phân cụm của các địa chỉ
thư. Các nội dung đề xuất được trình bày chi tiết trong chương này.


V
V

ỀT
T
H
H
Ư
ƯR
R
Á
Á
C
CTừ lâu, thư điện tử (Email) đã trở thành một ứng dụng không thể
thiếu khi Internet và công nghệ mạng phát triển. Đây là điều mà thực tế đã
chứng minh qua những đóng góp của ứng dụng này trong nhiều lĩnh vực
như kinh doanh, thương mại, viễn thông và các dịch vụ cá nhân. Tuy nhiên
trong những năm gần đây, một hình thức mới của thư điện tử
đã xuất hiện
với số lượng lớn gây phiền hà cho người nhận và những thiệt hại không

¾ Thư rác được gửi đi một cách tự động: Mục đích của những kẻ gửi thư rác
(spammer) là có thể phát tán lượng thư rác tới người dùng càng nhiều càng tốt.
Do vậy, chúng thường viết ra những phần mềm tự động gửi một lượng lớn thư
rác trong một khoảng thời gian ngắn.
¾ Thư rác được gửi đến những địa chỉ ngẫu nhiên trên một diện rộng. Địa chỉ
email của người bị nhận thư rác rất ngẫu nhiên và dường như giữa họ không có
mối quan hệ với nhau. Có nhiều phương pháp và thủ thuật khác nhau mà những
kẻ gửi thư rác áp dụng trong việc dò tìm địa chỉ email của người dùng như:
 Dùng chương trình tự động dò tìm địa chỉ email trên mạng Internet, các
trang chủ, Newsgroup, Chat room
 Mua địa chỉ email từ những công ty đã xây dựng danh sách khách hàng
của họ nhưng vì lý do nào đó phải bán đi hoặc đối tác của công ty được
phép truy cập danh sách khách hàng của công ty này để gửi thông tin về
dịch vụ hay sản phẩm.
 Email chuỗi (Chain letter) từ bạn bè và người thân, yêu cầu gửi thư cho
càng nhiều người càng tốt vì lý do thương người, ủng hộ một chương
trình nào đó, hoặc mời chào người dùng nếu gửi cho nhiều người sẽ
được nhận nhiều tiền hơn.
 Dùng chương trình đoán tên tự động: Những kẻ gửi thư rác dùng chương
trình này gửi email liên tục vào một nơi để đoán địa chỉ email qua những
phương pháp như E-pending, Dictionary hay Alphabet.
Bên cạnh đó, những kẻ gửi thư rác còn có thể có được địa chỉ email của người
dùng do:
- 12 -
 Các nhà cung cấp dịch vụ ISP không có chính sách và công nghệ bảo
mật, dẫn đến các tin tặc (hacker) ăn cắp địa chỉ của khách hàng để buôn
bán và quấy nhiễu. Hoặc có thể do chính nhà cung cấp ISP buôn bán địa
chỉ email của khách hàng để kiếm lợi nhuận. Nhân viên của các ISP đã
tiết lộ thông tin về khách hàng cho các đối thủ cạnh tranh của chính ISP
đó, hoặc cho những công ty muốn quảng cáo cho những khách hàng

Service - SMS) và các dịch vụ gửi tin nhắn trên mạng (như Yahoo Messenger,
Windows Messenger ).
2>
Dựa vào quan hệ với người gửi thư rác
Các mối quan hệ với người gửi thư rác bao gồm người lạ mặt, bạn bè, người
quen và các dịch vụ quyên góp giúp đỡ…
3>
Dựa vào nội dung của thư rác.
Các kiểu nội dung phổ biến như thư về thương mại, thư về chính trị, thư về
công nghệ, chuỗi thư (chain email) và các loại khác (như thư phát tán virus ).
4>
Dựa trên động lực của người gửi
Thông thường, thư rác được gửi đi cho những mục đích quảng bá thông tin.
Ngoài ra, còn có một số loại thư rác được gửi tới một người nhận xác định nào
đó nhằm mục đích phá vỡ và gây cản trở công việc của người nhận hay mạng
của nhà cung cấp dịch vụ thư điện tử ESP (Email Service Provider) được gọi là
“bom th
ư”. Thư rác còn được cố ý gửi đi nhằm thông báo tin sai lệch, làm xáo
trộn công việc và cuộc sống của người nhận.
1.1.4 Những thiệt hại do thư rác gây ra
Các khảo sát cho thấy thư rác hiện chiếm hơn một nửa số email qua lại hàng
ngày trên Internet và chính thư rác là nguồn lây lan virus nhanh nhất. Thiệt hại do
chúng gây ra rất lớn.
Năm 2003, báo cáo của Hội thảo Thương mại và Phát triển của Liên Hiệp
Quốc cho thấy thiệt hại do thư rác gây ra khoảng 20,5 tỷ USD. Các hãng diệt virus
cũng đưa ra ước tính thiệt hại của các cuộc tấn công do virus năm 2001 là 13 tỷ USD,
năm 2002 khoảng từ 20 - 30 t
ỷ USD. Chi phí để khắc phục sự cố do virus gây ra trong
các doanh nghiệp được điều tra ngẫu nhiên ở Mỹ năm 2002 là 81.000 USD, đến năm
2003 đã tăng lên 100.000 USD. Trên 3/4 số doanh nghiệp cho rằng sự cố virus đã gây

Từ những con số thống kê trên ta có thể thấy, việc thông qua các chế tài pháp
lý quốc tế, đầu tư mạnh vào hệ thống lọc thư rác, thiết lập những trung tâm phản ứng
nhanh liên kết các ISP toàn cầu, đồng thời tăng cường các chiến dịch tuyên truy
ền
cộng đồng về sự nguy hại và cách đối phó với thư rác là công việc rất quan trọng và
cần thiết.
Ngày nay, spam không phải đơn giản chỉ nằm trong thư điện tử mà còn có cả
trong blog
1
, còn gọi là spam blogs hay splogs, trên các tin nhắn trực tuyến. Những xu
thế này chính là những hình thức mới của spam có thể phát triển nở rộ trong năm 2006.

1
Blog, gọi tắt của weblog (tiếng Anh, "nhật ký web"), là một dạng đàm luận thời sự trực tuyến, bùng
nổ từ cuối thập niên 1990. Các bloger(người viết blog), có thể là cá nhân hoặc nhóm, đưa thông tin lên
mạng với mọi chủ đề, thông thường có liên quan tới kinh nghiệm hoặc ý kiến cá nhân, chủ yếu cung
cấp thông tin đề cập tới những chủ đề chọn lọc, không giống như các báo truyền thống. Một trang blog
có th
ể chứa các siêu liên kết, hình ảnh và liên kết (tới các trang chứa phim và âm nhạc).
- 15 -
Ngoài ra, luật phòng chống spam và các bộ lọc spam ngày càng chặt chẽ sẽ khiến cho
những kẻ gửi thư rác phải thay đổi đối tượng tấn công.
Để có thể loại bỏ được thư rác, ta không thể dùng một phương pháp riêng lẻ
nào để loại bỏ tận gốc mà cần áp dụng các phương pháp kết hợp với nhau. Một trong
những cách hữu hiệu nhất để chặn spam là giáo dục người dùng cuối. Khi ngườ
i sử
dụng đã có kiến thức thì họ sẽ ít bị rơi vào bẫy do những kẻ phát tán thư rác cố tình
giăng ra để khai thác địa chỉ email và duy trì mục đích của chúng.
Một số lời khuyên cho người dùng thư điện tử:
 Yêu cầu và đòi hỏi những nhà chức trách có những luật lệ nghiêm cấm thư

dân Internet và sức mạnh công nghệ, chỉ có thể hạn chế phần nào nó mà thôi.
1.2 Các giải pháp cho vấn đề lọc thư rác
1.2.1 Ban hành các bộ luật chống thư rác
Thư rác đang gia tăng với tốc độ khủng khiếp và đòi hỏi cần có những biện
pháp cứng rắn phối hợp từ phía chính phủ. Chính vì vậy, việc ban hành các bộ luật
chống thư rác là rất cần thiết và xác đáng.
Hiện nay, có rất ít quốc gia trên thế giới có luật bảo vệ người dùng dưới sự tấn
công của thư rác. Về mặt luật pháp đối với th
ư rác, Mỹ là nước đi đầu với bộ luật quy
định về “Email không do yêu cầu” (Unsolicited Electronic Mail Act), theo sau đó là
Khối Cộng đồng chung Châu Âu với bộ luật mẫu về Thương mại Điện tử và Quảng
cáo trên Internet. Hai bộ luật này đều dựa trên những luật căn bản như Quyền riêng tư,
Bảo vệ Thông tin cá nhân và Quy định Thư tín/Giấy tờ Điện tử. Cả hai đều có những
điểm chung là bắt buộc người gửi email không được mời phải nêu rõ mục đích và nội
dung trong phần tiêu đề (Subject) để người nhận có thể xác định thông tin ngay và
đồng thời phải có thông tin cho phép người nhận được quyền rút tên khỏi danh sách
email nếu muốn. Thêm vào đó, những công ty hoặc người gửi thư rác phải hiểu và
nắm vững chính sách quản lý thư rác/quảng cáo của mỗi ISP mà họ gặp phải.
Ở Việt Nam, chúng ta ch
ỉ mới công nhận tính chất pháp lý của thư điện tử
trong bộ Luật Hình sự, nhưng chưa có luật quy định và nghiêm cấm các hình thức gửi
thư rác. Theo dự kiến, Pháp lệnh Thương mại điện tử và các dịch vụ liên quan đang
được xây dựng, dự kiến sẽ trình Quốc hội phê chuẩn trong thời gian tới, trong đó sẽ có
một số điều khoản quy định v
ề thư rác được đưa ra xem xét.
1.2.2 Các phương pháp lọc thư rác trước đây
Vấn đề thư rác là vấn đề gây nhức nhối trong xã hội trong những năm gần đây.
Nhiều nhà khoa học và nhiều công trình nghiên cứu về phương pháp lọc thư rác đã
được đầu tư và tiến hành từ khá lâu.
Để đánh giá hiệu quả của một công cụ lọc thư rác người ta thường dựa trên

của chúng đã bị chặn bởi bộ lọc theo từ khóa này. Do vậy những kẻ gửi thư rác này đã
thay đổi cách viết nội dung của thư rác nhằm làm cho thư rác của chúng có thể “xuyên
qua” các bộ lọc. Điều này có thể giải thích tại sao bạn nhậ
n nhiều thư với những từ
như "Vi@gra", "Mort.gage", "L|0|a|n|$" hay những tranh ảnh được nhúng vào trong
thư.
Phương pháp này có một số ưu điểm và nhược điểm sau:
Ưu điểm:
 Tính thích nghi: Người dùng có thể dễ dàng biến đổi bộ lọc của mình để
nó có thể lọc các kiểu thư rác mà người đó đang phải nhận và điều quan
- 18 -
trọng là nó không cản trở (thích nghi) các từ và các cụm từ được sử dụng
hàng ngày trong kinh doanh thương mại với bạn bè hay những người
thân quen.
Nhược điểm:
 Yêu cầu nhiều tiến trình xử lý bằng tay để điều chỉnh và duy trì bộ lọc
được hiệu quả. Để có thể đánh lừa các bộ lọc, những kẻ gửi thư rác luôn
luôn thay đổi hình thức nội dung của th
ư rác, do đó những bộ lọc mở
rộng phải được tạo ra để chống lại điều đó.
. Phương pháp lọc Bayesian
Lọc bằng thống kê Bayesian là đánh giá xem những từ ngữ trong một email
sắp được chuyển đến có thường xuyên xuất hiện trên thư rác (spam) hay thư hợp pháp
(ham) không. Một cách hiệu quả giúp lọc chính xác là người dùng thông báo cho
chương trình lọc bất kỳ thư
rác nào mà đã may mắn “thoát” đợt “truy quét” đầu tiên.
Lần lọc sau, chắc chắn nó sẽ không thể trốn thoát qua bộ lọc.
Bộ lọc Bayesian phải được học từ những email được xác định trước là thư tốt
hay thư không tốt. Trong suốt quá trình cho bộ lọc học, nội dung của các thư này được
tách các từ tố (token) và lưu vào trong một cơ sở dữ liệu. Dựa vào công thức Bayes,

(header) và nội dung của thư rồi dựa trên tập các luật được xác định trước và những kí
hiệu dấu câu đặc biệt (tell-tale), xem thư có vi phạm các luật này không sau đó tính
điểm đối với từng thư. Từ kết quả thu được, xác định được một thư là thư rác hay thư
thường.
Ưu điểm:
 Tỉ lệ lọc thư rác của phương pháp SpamAssassin rất cao
Nhượ
c điểm:
 Phương pháp SpamAssassin tiêu tốn khá nhiều tài nguyên (khối điều
khiển trung tâm CPU, bộ nhớ, thời gian xử lý) của máy chủ, đặc biệt khi
phải xử lý những email có dung lượng lớn. Cấu hình để SpamAssassin
hoạt động tốt, đồng thời giảm nhẹ sự tiêu tốn tài nguyên cho máy chủ là
một vấn đề quan trọng.
. Phương pháp dùng danh sách trắng/đen
Đây là phương pháp cơ sở c
ủa các bộ lọc thư rác. Tuy nhiên, ngày nay người
ta ít khi sử dụng nó một cách đơn lập mà được dùng kết hợp với các phương pháp lọc
khác như là một phần của hệ thống bộ lọc tích hợp.
Bộ lọc danh sách trắng (Whitelist filter) sẽ không chấp nhận những email từ
bất cứ địa chỉ nào nếu không có trong danh sách được chắc chắn là những địa chỉ
email (hoặc địa chỉ
IP) tốt.
- 20 -
Bộ lọc danh sách đen (Blacklist filter), ngược lại sẽ cho phép những thư đến
từ bất cứ địa chỉ email (hoặc địa chỉ IP) nào trừ những địa chỉ được liệt kê trong danh
sách được biết đến như là địa chỉ email (hoặc địa chỉ IP) xấu. Danh sách đen có thể
được lưu trữ và được quản lý trên những hệ thống địa phương hoặc ánh xạ thông qua
mạ
ng Internet.
Ưu điểm:

- 21 -
Trong một vài năm gần đây xuất hiện của một vài dịch vụ Internet tự động xử
lý hàm Challenge/Response này cho người dùng. Chương trình yêu cầu người gửi thư
phải vào website của họ và trả lời một số câu hỏi đơn giản để xác minh về email mà
người này đã gửi.Việc này chỉ được yêu cầu trong lần gửi thư đầu tiên. Đáp ứng hàm
Challenge/Response này rất đơn giản và không có gì khó khăn khi m
ột người dùng
muốn gửi thư cho một người khác nhưng nó không mấy dễ dàng cho những kẻ gửi thư
rác muốn phát tán một lượng lớn thư rác đi.
Ưu điểm:
 Đối với một số người dùng có lượng thư trao đổi thấp, hệ thống đơn lẻ
này có thể chấp nhận được như một phương pháp hoàn hảo để loại trừ
hoàn toàn thư
rác từ hòm thư của họ.
Nhược điểm:
 Người dùng thường cảm thấy không thuận tiện.
 Những kẻ gửi thư rác có thể viết những chương trình trả lời tự động
những chuỗi hỏi đáp trên.
. Phương pháp lọc dựa vào vị trí của các bộ lọc (Filter Placement)
Có 3 mô hình chính cho bộ lọc được sắp đặt:
a. Bộ l
ọc tích hợp với máy trạm email của người dùng:
Nhiều bộ lọc thư rác được tích hợp với các máy trạm email chẳng hạn như
Outlook hoặc outlool Exprees.
Ưu điểm:
 Tối thiểu sự ảnh hưởng đối với những thói quen đọc thư thông thường
của người dùng. Thư rác thường bị di chuyển tới một thư mục “Junk
Mail”. Người dùng có thể xem lại hoặc xóa spam lưu trong th
ư mục này
đi một cách dễ dàng.

việc trên máy chủ đầu tiên.
 Thông tin tài khoản email cần được cài đặt trong bộ lọc cũng như trong
máy trạm email của người dùng.
c. Bộ lọc dựa trên máy chủ
Những bộ lọ
c này thường chỉ được sử dụng trong một nhóm hoặc môi trường
làm việc kinh doanh hơn là ở trong gia đình. Tất cả email đến đều thông qua máy
chủ trung tâm. Tại máy chủ trung tâm này, email được lọc bởi bộ lọc dựa trên máy
chủ và những người dùng riêng biệt nhận thư của họ trên màn hình nền của máy họ
lấy từ máy chủ trung tâm.
Ưu điểm:
- 23 -
 Việc quản lý trung tâm của tất cả các luật lọc thư bảo đảm tính an toàn
trong mạng.
 Những người dùng riêng biệt không phải chịu trách nhiệm cũng như
không phải lo lắng đến sự quản lý thư rác, giải phóng họ để họ có thể
yên tâm trong công việc với trao đổi thư điện tử.
Nhược điểm:
 Thường yêu cầu nhiều tới s
ự duy trì và cầm có một người quản trị mạng
có khả năng và kinh nghiệm để quản lý bộ lọc thư rác này.
 Thường đắt hơn.
. Phương pháp lọc dựa trên xác nhận danh tính của người gửi
Giả mạo thư điện tử - là việc giả mạo địa chỉ thư điện tử của một công ty hoặc
của một người khác
để khiến người sử dụng tin tưởng và mở thư - đang là một trong
những thử thách lớn nhất mà cộng đồng sử dụng Internet và các kỹ thuật viên chống
thư rác hiện đang phải đối mặt. Nếu không có sự thẩm định quyền, xác nhận và khả
năng truy tìm danh tính của người gửi, các hãng cung cấp dịch vụ thư điện tử không
bao giờ có thể biết chắ

Chuẩn SPF cũng yêu cầu người gửi thư điện tử
phải sửa đổi DNS để cho biết
máy chủ nào có thể gửi thư từ một tên miền Internet nhất định. Tuy nhiên, SPF chỉ
kiểm tra sự giả mạo khi bức thư trong quá trình chuyển thư hay còn gọi là ở mức
“ngoài phong bì”, xác minh địa chỉ “phản hồi” của một bức thư, thường được máy chủ
nhận thư gửi trở lại trước khi tiếp nhận phần nội dung thư, sau
đó sẽ thông báo tới máy
chủ nhận thư để loại bỏ bức thư.
Trong đặc tả kỹ thuật kết hợp hai tiêu chuẩn, các công ty gửi thư điện tử sẽ
công bố địa chỉ máy chủ thư điện tử của họ trong bản ghi DNS dưới định dạng Ngôn
ngữ đánh dấu mở rộng (XML). Các công ty sẽ có thể kiểm tra sự giả mạ
o ở mức
phong bì (cũng giống như trong đề xuất SPF) và trong phần nội dung thư (theo đề xuất
của Microsoft).
Kỹ thuật này sẽ cho phép các công ty sử dụng cách thức của SPF để loại bỏ
thư rác trước khi chúng được gửi đi, nếu sự giả mạo bị phát hiện ngay ở mức phong bì.
Với những bức thư đòi hỏi sự kiểm tra kỹ hơn trong nội dung thư
, thì phương pháp
Caller ID sẽ được sử dụng. Đề xuất này cũng sẽ hỗ trợ các tên miền đã có sẵn những
bản ghi SPF là văn bản, không theo định dạng XML.
. Phương pháp lọc thư rác mới dựa trên mạng Xã hội
Các nghiên cứu gần đây đã bắt đầu khai thác thông tin từ mạng xã hội cho
việc xác định thư rác bằng cách xây dựng một đồ thị (các đỉnh là địa chỉ
email, cung
được thêm vào giữa 2 node A và B nếu giữa A và B có sự trao đổi thư qua lại). P.O.
Boykin và V. Roychowdhury đã sử dụng một số tính chất đặc trưng của mạng xã hội
để xây dựng một công cụ lọc thư rác [6].
Đầu tiên, người ta phân đồ thị thành các thành phần con rồi tính độ phân cụm
cho từng thành phần này. Mỗi thành phần con là một đồ thị mạng xã hội của một node,
- 25 -


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status