Nghiên cứu một số kỹ thuật phát hiện xâm nhập mạng bằng phương pháp so khớp - Pdf 40

i

LỜI CAM ĐOAN
Học viên xin cam đoan luận văn “Nghiên cứu một số kỹ thuật phát
hiện xâm nhập mạng bằng phương pháp so khớp” là công trình nghiên
cứu của cá nhân học viên tìm hiểu, nghiên cứu dưới sự hướng dẫn của TS.
Nguyễn Ngọc Cương. Các kết quả là hoàn toàn trung thực, toàn bộ nội dung
nghiên cứu của luận văn, các vấn đề được trình bày đều là những tìm hiểu và
nghiên cứu của chính cá nhân học viên hoặc là được trích dẫn từ các nguồn tài
liệu được trích dẫn và chú thích đầy đủ.

TÁC GIẢ LUẬN VĂN

Trần Thanh Hòa

ii

LỜI CẢM ƠN
Học viên xin bày tỏ lời cảm ơn chân thành tới tập thể các thầy cô giáo
Viện công nghệ thông tin, các thầy cô giáo Trường Đại học Công nghệ thông
tin và truyền thông - Đại học Thái Nguyên đã mang lại cho học viên kiến thức
vô cùng quý giá và bổ ích trong suốt quá trình học tập chương trình cao học
tại trường. Đặc biệt học viên xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo
TS.Nguyễn Ngọc Cương - Học viện an ninh đã định hướng khoa học và đưa
ra những góp ý, gợi ý, chỉnh sửa quý báu, quan tâm, tạo điều kiện thuận lợi
trong quá trình nghiên cứu hoàn thành luận văn này.
Cuối cùng, học viên xin chân thành cảm ơn các bạn bè đồng nghiệp,
gia đình và người thân đã quan tâm, giúp đỡ và chia sẻ với học viên trong
suốt quá trình học tập.
Do thời gian và kiến thức có hạn nên luận văn không tránh khỏi

DANH MỤC CÁC HÌNH VẼ......................................................................... iii

MỞ ĐẦU ....................................................................................................... 3
1. Lý do chọn đề tài ........................................................................................ 3
2. Hướng nghiên cứu của luận văn ................................................................. 4
3. Đối tượng và phạm vi nghiên cứu............................................................... 5
4. Những nội dung nghiên cứu chính .............................................................. 5
5. Phương pháp nghiên cứu ............................................................................ 5
1.1.1. Định nghĩa ........................................................................................... 6
1.1.1.1. Phát hiện xâm nhập............................................................................ 6
1.1.1.2. Hệ thống phát hiện xâm nhập ............................................................ 7
1.1.2. Tính năng của IDS ................................................................................ 8
1.1.3. Phân loại IDS ....................................................................................... 8
1.1.3.1. Network based IDS – NIDS ............................................................... 9
1.1.3.2. Host based IDS – HIDS ................................................................... 10
1.1.4. Cơ chế hoạt động của hệ thống IDS .................................................... 11
1.1.4.1. Phát hiện sự lạm dụng...................................................................... 12
1.1.4.2. Phát hiện sự bất thường ................................................................... 13
1.1.5. Ưu điểm và hạn chế của IDS ............................................................. 13
1.1.5.1. Ưu điểm........................................................................................... 13
1.1.5.2. Hạn chế ........................................................................................... 13
1.2. Các thành phần của hệ thống phát hiện xâm nhập.................................. 13

1.3. Phân biệt những hệ thống không phải là IDS ......................................... 14
1.4. Một số kỹ thuật phát hiện xâm nhập mạng ............................................ 15
1.4.1. Phương pháp tiếp cận dựa trên xác suất thống kê................................ 15
1.4.2. Phương pháp tiếp tiếp cận dựa trên trạng thái ..................................... 15
1.4.3. Phương pháp tiếp cận dựa trên hệ chuyên gia ..................................... 16
1.4.4. Phương pháp tiếp cận dựa trên khai phá dữ liệu.................................. 17

3.2.1. Giới thiệu ........................................................................................... 47
3.2.2. Các thành phần của Snort ................................................................... 48
3.3. Hệ thống luật ......................................................................................... 52
3.3.1. Định nghĩa .......................................................................................... 52
3.3.2. Các thành phần của tập luật ................................................................ 52
3.3.2.1. Rule header...................................................................................... 52
3.3.3.2. Rule options..................................................................................... 52
3.4. Cài đặt và cấu hình Snort ....................................................................... 53
3.5. Mô hình triển khai ................................................................................. 55
3.5.1. Mô hình bài toán: .............................................................................. 55
3.5.1.1. Đặt ra giải pháp ............................................................................... 56
3.5.1.2. Yêu cầu ........................................................................................... 57

3.6. Thực hiện .............................................................................................. 57
3.6.1. Đầu vào của bài toán .......................................................................... 57
3.6.2. Đầu ra của bài toán ............................................................................. 58
3.6.3. Thử nghiệm và đánh giá kết quả ......................................................... 58
3.6.3.1. Tập dữ liệu thử nghiệm.................................................................... 58
3.6.3.2. Tiền xử lý dữ liệu ............................................................................ 59
3.6.3.3. Dữ liệu lựa chọn .............................................................................. 59
3.6.3.4. Thiết kế thử nghiệm......................................................................... 60
3.6.3.5. Kết quả thử nghiệm ......................................................................... 60
3.6.3.6. Nhận xét kết quả .............................................................................. 60
3.6.4. Sử dụng chương trình so khớp đa mẫu Aho-Corasick vào Snort ......... 61
3.6.4.1. Cài đặt chương trình so khớp đa mẫu Aho – Corasick ..................... 61
3.6.4.2. Cài đặt thuật toán so khớp đa mẫu Aho Corasick vào Snort............. 61
3.7. Kết chương ............................................................................................ 63
KẾT LUẬN................................................................................................ 634
TÀI LIỆU THAM KHẢO .......................................................................... 635

của việc sử dụng mạng nơ ron nhân tạo là cung cấp một phương pháp phân

4

loại không giám sát để vượt qua số chiều nhiều đối với số lượng lớn các tính
năng đầu vào.
- Sử dụng kỹ thuật so khớp mẫu: Các thuật toán so khớp mẫu tiếp cận
theo phương pháp dựa trên đặc trưng (signature-based) cho phép các công cụ
nhanh chóng tìm kiếm nhiều mẫu cùng một lúc trong đầu vào của hệ thống
IDS. Kỹ thuật này được sử dụng phổ biến trong các hệ thống phát hiện và
ngăn chặn xâm nhập mạng. Nguyên lý của kỹ thuật này là: việc phát hiện các
nguy cơ tiềm ẩn trong hệ thống phát hiện xâm nhập mạng được thực hiện
bằng cách so khớp nội dung gói tin với các mẫu đã biết. Với sự đa dạng về số
lượng các đợt tấn công, hình thức tấn công thì việc thu thập đầy đủ các mẫu
làm cho kích thước tập mẫu ngày càng tăng nhanh.
Vì vậy, em lựa chọn đề tài “Nghiên cứu một số kỹ thuật phát hiện
xâm nhập mạng bằng phương pháp so khớp”. Luận văn sẽ nghiên cứu việc
sử dụng kỹ thuật so khớp mẫu trong việc phát hiện xâm nhập mạng. So khớp
mẫu là kỹ thuật được ứng dụng nhiều trong vấn đề an ninh mạng. Trong hệ
thống phát hiện xâm nhập mạng, so khớp được thể hiện dưới dạng mẫu hoặc
biểu thức chính quy nhằm tạo thuận lợi trong việc chia sẻ cơ sở dữ liệu mẫu.
Nguyên lý của kỹ thuật này là việc phát hiện các nguy cơ tiềm ẩn trong
hệ thống phát hiện xâm nhập mạng được thực hiện bằng cách so khớp nội
dung gói tin với các mẫu đã biết.
2. Hướng nghiên cứu của luận văn
- Tìm hiểu, phân tích đánh giá về thời gian thực hiện các thuật toán so
khớp đơn mẫu, đa mẫu trên hệ thống phát hiện thâm nhập Snort;
- Tìm hiểu thuật toán so khớp đa mẫu và thử nghiệm
- Cài đặt thực nghiệm của thuật toán so khớp đa mẫu trong việc phát

6

CHƯƠNG 1
TỔNG QUAN VỀ XÂM NHẬP MẠNG
Nội dung chương trình bày các kỹ thuật xâm nhập trái phép và một số
kỹ thuật ngăn chặn xâm nhập, đi sâu vào hệ thống phát hiện xâm nhập IDS
(Intrusion Detetion System) và các hướng nghiên cứu trong và ngoài nước về
kỹ thuật phát hiện: tiếp cận dựa trên trí tuệ nhân tạo (Artificial Intelligence),
tiếp cận dựa trên so khớp mẫu.
1.1. Giới thiệu về hệ thống phát hiện xâm nhập mạng
1.1.1. Định nghĩa
Khi một máy tính hay một hệ thống hoạt động trên môi trường mạng,
sẽ có rất nhiều kết nối giữa nó và các máy tính, các thiết bị khác. Trong những
kết nối đó có những kết nối đang tìm cách tấn công hệ thống để đạt được mục
đích nào đó. Bản thân mỗi máy tính đều có những cơ chế để tự bảo vệ nhưng
nó có những điểm yếu và thực sự không đủ sức chống lại các cuộc tấn công
mới với mức độ nguy hiểm ngày càng lớn hơn. Bên cạnh đó các máy tính hay
hệ thống cũng phải chịu các nguy cơ đến từ các hành vi vi phạm chính sách
an toàn và bảo mật công nghệ thông tin một cách vô tình hay hữu ý. Bài toán
được đặt ra là cần có cơ chế để phát hiện sớm các cuộc tấn công để từ đó có
những biện pháp ngăn chặn hoặc giảm thiểu tối đa những thiệt hại, tác động
do các cuộc tấn công gây ra.
1.1.1.1. Phát hiện xâm nhập
Phát hiện xâm nhập là tập hợp các kỹ thuật và phương pháp được sử
dụng để phát hiện các hành vi đáng ngờ cả ở cấp độ mạng và máy chủ. Phát
hiện xâm nhập có thể dựa trên dấu hiệu xâm nhập hoặc dựa vào dấu hiệu bất
thường. Kẻ tấn công có những dấu hiệu tìm ra dữ liệu của gói tin mà có chứa
bất kỳ dấu hiệu xâm nhập hoặc dị thường được biết đến. Dựa trên một tập hợp
các dấu hiệu này hệ thống phát hiện xâm nhập có thể dò tìm, ghi lại những

- Chịu lỗi.

8

- Khả năng mở rộng.

Hình 1.1. Hệ thống chống xâm nhập IDS

1.1.2. Tính năng của IDS
- Giám sát lưu lượng mạng và các hoạt động khả nghi.
- Cảnh báo về tình trạng mạng cho hệ thống và nhà quản trị.
- Kết hợp với các hệ thống giám sát, tường lửa, diệt virus tạo thành một
hệ thống bảo mật hoàn chỉnh.
1.1.3. Phân loại IDS
Cách thông thường nhất để phân loại các hệ thống IDS là dựa vào đặc
điểm của nguồn dữ liệu thu thập được. Trong trường hợp này, các hệ thống
IDS được chia thành các loại sau:
- Host-based IDS (HIDS): Sử dụng dữ liệu kiểm tra từ một máy trạm
đơn để phát hiện xâm nhập.
- Network-based IDS (NIDS): Sử dụng dữ liệu trên toàn bộ lưu thông
mạng, cùng với dữ liệu kiểm tra từ một hoặc một vài máy trạm để phát hiện
xâm nhập.

9

1.1.3.1. Network based IDS – NIDS
NIDS thường bao gồm có hai thành phần logic:

công mạng từ các gói tin phân mảnh. Các gói tin định dạng sai này có
thể làm cho NIDS hoạt động sai và đổ vỡ.
1.1.3.2. Host based IDS – HIDS
Host-based IDS tìm kiếm dấu hiệu của xâm nhập vào một host cục bộ;
thường sử dụng các cơ chế kiểm tra và phân tích các thông tin được logging.
Nó tìm kiếm các hoạt động bất thường như login, truy nhập file không thích
hợp, bước leo thang các đặc quyền không được chấp nhận.
Kiến trúc IDS này thường dựa trên các luật (rule-based) để phân tích
các hoạt động. Ví dụ: đặc quyền của người sử dụng cấp cao chỉ có thể đạt
được thông qua lệnh su-select user, như vậy những cố gắng liên tục để login
vào account root có thể được coi là một cuộc tấn công.

Hình 1.3. Mô hình Host based IDS – HIDS

Ưu điểm

• Xác định được kết quả của cuộc tấn công

11

• Giám sát được các hoạt động cụ thể của hệ thống
• Phát hiện các xâm nhập mà NIDS bỏ qua.
• Thích nghi tốt với môi trường chuyển mạch, mã hoá.
• Không yêu cầu thêm phần cứng
Nhược điểm

• Khó quản trị
• Thông tin nguồn không an toàn
• Hệ thống host-based tương đối đắt

kịch bản đang được tiến hành. Hệ thống này có thể xem xét hành động hiện
tại của hệ thống được bảo vệ trong thời gian thực hoặc có thể là các bản ghi
kiểm tra được ghi lại bởi hệ điều hành.
Các kỹ thuật để phát hiện sự lạm dụng khác nhau ở cách thức mà chúng
mô hình hoá các hành vi chỉ định một sự xâm nhập. Các hệ thống phát hiện sự
lạm dụng thế hệ đầu tiên sử dụng các luật (rules) để mô tả những gì mà các
nhà quản trị an ninh tìm kiếm trong hệ thống. Một lượng lớn tập luật được
tích luỹ dẫn đến khó có thể hiểu và sửa đổi bởi vì chúng không được tạo thành
từng nhóm một cách hợp lý trong một kịch bản xâm nhập.
Để giải quyết khó khăn này, các hệ thống thế hệ thứ hai đưa ra các biểu
diễn kịch bản xen kẽ, bao gồm các tổ chức luật dựa trên mô hình và các biểu
diễn về phép biến đổi trạng thái. Điều này sẽ mang tính hiệu quả hơn đối với
người dùng hệ thống cần đến sự biểu diễn và hiểu rõ ràng về các kịch bản. Hệ
thống phải thường xuyên duy trì và cập nhật để đương đầu với những kịch
bản xâm nhập mới được phát hiện.
Do các kịch bản xâm nhập có thể được đặc tả một cách chính xác, các
hệ thống phát hiện sự lạm dụng sẽ dựa theo đó để theo vết hành động xâm
nhập. Trong một mẫu hành động, hệ thống phát hiện có thể đoán trước được
bước tiếp theo của hành động xâm nhập. Bộ dò tìm phân tích thông tin hệ

13

thống để kiểm tra bước tiếp theo, và khi cần sẽ can thiệp để làm giảm bởi tác
hại có thể.
1.1.4.2. Phát hiện sự bất thường
Dựa trên việc định nghĩa và mô tả đặc điểm của các hành vi có thể chấp
nhận của hệ thống để phân biệt chúng với các hành vi không mong muốn
hoặc bất thường, tìm ra các thay đổi, các hành vi bất hợp pháp.
Như vậy, bộ phát hiện sự không bình thường phải có khả năng phân

nhập được phân tích ở trên đến người quản trị hệ thống.

Hình 1.4. Các thành phần của hệ thống phát hiện xâm nhập

1.3. Phân biệt những hệ thống không phải là IDS
Theo một cách riêng biệt nào đó, các thiết bị bảo mật dưới đây không
phải là IDS:
- Hệ thống đăng nhập mạng được sử dụng để phát hiện lỗ hổng đối với
vấn đề tấn công từ chối dịch vụ (DoS) trên một mạng nào đó. Ở đó sẽ có hệ
thống kiểm tra lưu lượng mạng.
- Các công cụ đánh giá lỗ hổng kiểm tra lỗi và lỗ hổng trong hệ điều
hành, dịch vụ mạng (các bộ quét bảo mật).
- Các sản phẩm chống virus được thiết kế để phát hiện các phần mềm
mã nguy hiểm như virus, trojan horse, worm…. Mặc dù những tính năng mặc
định có thể giống IDS và thường cung cấp một công cụ phát hiện lỗ hổng bảo
mật hiệu quả.
- Tường lửa – firewall.
- Các hệ thống bảo mật, mật mã như: SSL, Kerberos, VPN,…

15

1.4. Một số kỹ thuật phát hiện xâm nhập mạng
1.4.1. Phương pháp tiếp cận dựa trên xác suất thống kê
Các phương pháp thống kê đo lường các hành vi của người dùng và của
hệ thống bằng một số các biến được lấy mẫu theo thời gian và xây dựng các
profile dựa trên các thuộc tính của hành vi bình thường. Các thông số theo dõi
trên thực tế sẽ được so sánh với các profile này, và các sai khác vượt qua một
ngưỡng sẽ bị coi là một bất thường.
Các hệ thống phát hiện bất thường như ADAM, NIDES, và SPADE có

mỗi trạng thái đại diện một mẫu các lời gọi hệ thống hoặc các hành vi của
người dùng. Trong mỗi trạng thái, có một giá trị xác suất của việc sinh ra các
trạng thái đầu ra và một xác suất chỉ ra các trạng thái kế tiếp. Trong quá trình
huấn luyện, máy trạng thái hữu hạn này sẽ được cập nhật các trạng thái mà nó
được học. Sau đó trong pha phát hiện, các sự kiện chuyển trạng thái bất
thường sẽ bị hệ thống phát hiện và phát ra cảnh báo.
1.4.3. Phương pháp tiếp cận dựa trên hệ chuyên gia
Để phát hiện bất thường, các hệ chuyên gia mô tả các hành vi bình
thường của người sử dụng bằng một tập các luật. Các hệ thống phát hiện bất
thường sử dụng hệ chuyên gia đã triển khai là ComputerWatch ( Dowell và
Ramstedt, 1990) và Wisdom & Sense (Liepins và Vaccaro,1992).
ComputerWatch ( phát triển tại AT&T) sử dụng hệ chuyên gia để tổng
kết các sự kiện an ninh nhạy cảm và xây dựng các luật để phát hiện các hành
vi bất thường. Nó sẽ kiểm tra các hành vi của người dùng theo một tập các
luật mô tả chính sách sử dụng bình thường của hệ thống, và sẽ kết luận các
hành động không phù hợp với các mẫu có thể chấp nhận được là bất thường.
Wisdom & Sense ( được phát triển tại phòng thí nghiệm Los Alamos
National) phát hiện các bất thường có tính thống kê trong hành vi của người
dùng. Đầu tiên, nó xây dựng một tập các luật mô tả một cách thống kê hành vi
dựa trên việc ghi lại các hành vi của người dùng theo một khoảng thời gian

17

cho trước. Các mẫu hành vi nhỏ sau đó được so sánh với những luật này để
phát hiện các hành vi mâu thuẫn. Cơ sở tri thức luật được xây dựng lại một
cách định kỳ để phù hợp với các mẫu sử dụng mới.
1.4.4. Phương pháp tiếp cận dựa trên khai phá dữ liệu
Khai phá dữ liệu tập trung khai thác các thông tin hữu ích tiềm tàng,
chưa biết trước từ các tập dữ liệu. Các hệ thống phát hiện xâm nhập có ứng

dùng, việc học hồ sơ người dùng cũng được thực hiện thông qua các biểu đồ
này. Dữ liệu để sử dụng cho việc thống kê được lấy từ các bản ghi nhật ký
(log record) của hệ thống, với mục đích ghi lại toàn bộ hành vi của mỗi người
dùng trong phiên đăng nhập của họ. Các bản ghi này không làm ảnh hưởng
tới quyền riêng tư của người dùng khi tham gia vào hệ thống. Tần suất sử
dụng các câu lệnh trong hệ thống hay thói quen của mỗi người dùng khi sử
dụng các ứng dụng trong hệ thống được gọi là dấu vết người dùng (a “print”
of the user).
Hệ thống NNID gồm 3 tầng chuẩn (tầng đầu vào- input layer, tầng ẩnhidden layer và tầng đầu ra- output layer). Tầng đầu vào của hệ thống NNID
gồm 100 nơ- ron, đại diện cho vector người dùng; tầng ẩn gồm 30 nơ- ron và
tầng đầu ra có 10 nơ-

ron tương ứng với 10 người dùng.

NNID được triển khai theo 3 giai đoạn:
- Thu thập dữ liệu huấn luyện (training data): thống kê nhật ký đăng
nhập của mỗi người dùng trong nhiều ngày trước đó. Lập vector thể hiện tần
suất sử dụng các lệnh của mỗi người dùng trong từng ngày.
+ Huấn luyện (training): Huấn luyện NNID để nhận dạng người dùng dựa trên
các vector phân bố câu lệnh.
- Thực hiện (performance): Xác định người dùng dựa trên mỗi vector
phân bố lệnh mới. Nếu hệ thống xác định nó không thuộc các người dùng

19

thường, hoặc không có xác định rõ ràng thì sẽ đưa ra cảnh báo về một sự bất
thường.
1.4.6. Tiếp cận dựa trên so khớp mẫu
Các thuật toán so khớp đa mẫu là trái tim của nhiều hệ thống IDS tiếp

+ Mẫu văn bản T
- Output: Số chỉ vị trí của ký tự đầu tiên của mẫu P xuất hiện trong T.
2.1.1. So khớp mẫu là gì?
So khớp mẫu bao gồm việc tìm kiếm một, nhiều, hoặc tất cả số lần xuất
hiện của một mẫu (thường được gọi là mẫu (Pattern)) trong một văn bản.
So khớp mẫu có thể được biểu diễn dưới dạng toán học như sau :

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Nghiên cứu một số kỹ thuật phát hiện xâm nhập mạng bằng phương pháp so khớp - Pdf 40

Tài liệu, ebook tham khảo khác

Học thêm