Cách thức hoạt động của một trang Web, tìm hiểu về Web Caching và sau đó là phân tích thiết kế và xây dựng hệ thống - Pdf 32

Đồ án tốt nghiệp
Lời cảm ơn
Em xin chân thành cảm ơn cô giáo Dỗn Hồ Liên là người đã trực tiếp hướng
dẫn em trong quá trình thực hiện đồ án này. Cô đã nhiệt tình chỉ bảo, giải đáp mọi
thắc mắc, cung cấp các kiến thức cần thiết giúp em hồn thành đề tài. Quan trọng hơn,
cô là người định hướng để em tiếp cận được với phương pháp nghiên cứu khoa học
nói chung và phương pháp nghiên cứu thực hiện phân tích, thiết kế một ứng dụng
thực tế. Qua đây em cũng xin được cảm ơn các thầy cô trong khoa CNTT đã tận tình
dạy bảo em trong 5 năm học tại trường cùng các bạn sinh viên đã đóp góp những ý
kiến quý báu cho chương trình.
Đỗ Hải Nam - KHMT - K46 Trang 1
Đồ án tốt nghiệp
I.3.1 Internet Information Server làm việc như thế nào ?.........................................4
I.4 Web Browser URL Request................................................................................................4
I.5 Web Server Response..........................................................................................................5
I.8 Sử dụng Internet Information Server như thế nào ?......................................................6
CHƯƠNG III: NGÔN NGỮ ACTIVE SERVER PAGE (ASP)........................................26
III.1 Active Server Pages là gì?..............................................................................................26
III.2 Mô hình của Active Server Pages.................................................................................26
III.2.1 Cách viết các file ASP Script..........................................................................26
III.2.2 Cú pháp của ASP..............................................................................................27
III.4 Sử dụng các method.......................................................................................................30
III.5.1 Request object...................................................................................................31
III.5.2 Response object.................................................................................................31
III.5.3 Session object.....................................................................................................32
III.5.4 Application object.............................................................................................32
III.5.5. Server object.....................................................................................................33
III.12 Sử dụng các Component của ASP.............................................................................36
III.12.2 Database Access Component.........................................................................37
III.13.2 Các sự kiện Application-start và Session-start............................................40
III.13.3 Các sự kiện Application-end và Session-end.......................................40

Web.
Cùng với việc nghiên cứu về Web Caching, trong khuôn khổ đồ án tốt nghiệp
này em cũng xây dựng một Website nhằm hỗ trợ cho các bạn học sinh, sinh viên
những người quan tâm đến kiến thức về hạ tầng mạng cơ sở, nhằm đem lại một kiến
thức tốt nhất trong việc xây dựng và bảo tŕ một hệ thống mạng máy tính.
Đồ án của em sẽ trình bày lần lượt các khái niệm về Internet, cách thức hoạt
động của một trang Web, tìm hiểu về Web Caching và sau đó là phân tích thiết kế và
xây dựng hệ thống.
Đồ án được chia làm 5 chương với nội dung chính như sau:
Chương I : Tổng quan về Internet và Intranet
Chương này sẽ đưa ra các khai niệm cơ bản về Internet, về Web và cách thức
mà một trang Web hoạt động trên Internet
Chương II : Tìm hiều về Web Caching
Chương này sẽ đưa ra những khái niệm cơ bản của Web Caching. Giải pháp
để tối ưu hố tốc độ duyệt Web và cách cài đặt Web Caching trên các máy Client
Chương III :Tìm hiều ngôn ngữ ASP (Active server Page)
Tìm hiểu công cụ ASP ngôn ngữ lập trình VB script để xây dựng hệ thống
Chương IV : Phân tích và thiết kế hệ thống
Đưa ra những phân tích về chức năng, thiết kế hệ thống cơ sở dữ liệu để có
thể triển khai hệ thống.
Chương V : Cài đặt và thử nghiệm
Đưa ra được một số hình ảnh minh hoạ của hệ thống.
CHƯƠNG I: TỔNG QUAN INTERNET - INTRANET
I.1 Internet là gì ?
Internet là một mạng máy tính tồn cầu sử dụng một ngôn ngữ truyền thông
chung nó tương tự như một hệ thống điện thoại quốc tế nhưng nó được nối kết theo
cách làm việc của một mạng lớn.
World Wide Web (WWW) cho ta một hình ảnh dễ dàng giao tiếp và tìm kiếm
dữ liệu trên Internet. Các dữ liệu này được liên kết với nhau thông qua trang Web.
Các file, các trang được nối kết với nhau thông qua các mối liên kết là text hoặc hình

Mỗi trang Web trên Intranet hoặc Internet có một URL duy nhất. Web browser
yêu cầu một trang bằng cách gửi một URL tới một Web server. Web server sử dụng
thông tin trong URL để xác định và cho hiển thị trang Web theo yêu cầu của
Browser.
Cú pháp URL là một chuỗi văn bản tuần tự gồm có : Protocol, Domain Name,
và đường dẫn (Path) tới thông tin yêu cầu. Protocol là chuẩn truyền thông dùng để
truyền tải thông tin như là : HTP, FTP và Gopher. Domain Name chính là Domain
Name System (DNS) của máy tính chứa thông tin. Path là đường dẫn tới thông tin
yêu cầu trên máy tính.Ví dụ :
Phương thức Tên Domain Đường dẫn (Path)
Http:// www.microsoft.com /backoffice
Https://
(secure HTTP)
www.company.com /catalog/orders.htm
Đỗ Hải Nam - KHMT - K46 Trang 4
Đồ án tốt nghiệp
Gopher:// gopher.college.edu /research/astronomy/index.htm
ftp:// orion.bureau.gov /stars/alpha quadrant/starlist.txt
Một URL cũng có thể chứa thông tin mà Web server cần phải xử lý trước khi
trả lại một trang, dữ liệu trong URL được gắn thêm vào cuối đường dẫn. Web server
gửi dữ liệu này tới một chương trìng hay một Scirpt để xử lý và trả lại kết quả trong
một trang web.Ví dụ :
Request Type URL
Static HTML page />ISAPI application />Internet Database Connector />Common Gateway Interface
(CGI) script
/>I.5 Web Server Response
Web server đáp ứng yêu cầu của Web browser bằng cách trả lại một trang
HTML. Trang trả lại có thể là trang HTML tĩnh, trang HTML động hoặc là trang
trong danh sách thư mục.
I.6 Trang HTML tĩnh (Static Page)

Đồ án tốt nghiệp
I.9 Các kịch bản Intranet
Trong một nhóm(Workgroup) ta có thể tích hợp Internet Information Server
với một Server. Web server của Workgroup có khả năng tổ chức các loại trang web
để đáp ứng cho các ứng dụng trong workgroup như là cho phép giao tiếp với
Database SQL hay là cho phép truy xuất tài nguyên từ xa(Remote Access Service).
Trong một mạng thương mại lớn có nhiều bộ phận (workgroup), mỗi bộ phận
chạy Internet Information Server trên server của mình. Một server trung tâm được
dùng để phối hợp và quản lý tất cả thông tin trên mạng.
I.10 Các kịch bản Internet.
Internet Information server có thể là một Web server đơn giản trên Internet
như ví dụ minh họa sau đây
Đỗ Hải Nam - KHMT - K46 Trang 7
Đồ án tốt nghiệp
Trong các Site lớn hơn, ta có thể cho phép các thành viên trong mạng truy xuất tới
Web server và sử dụng các công cụ chế tác như FrontPage để chế tác nội dung cho
Web server.
Sự tích hợp Internet Information Server với Windows NT có thể tạo ra các
server có nhiều chức năng. Ví dụ như một công ty có nhiều site khác nhau trên thế
giới, có thể dùng Internet Information Server để truyền thông giữa các site này với
nhau, và ta cũng có thể dùng RAS để cho phép truy cập tới Intranet hoặc Internet.
Đỗ Hải Nam - KHMT - K46 Trang 8
Đồ án tốt nghiệp
Nhiều kịch bản nối kết tới Internet còn liên quan tới thành phần thứ ba là các
Routersvà các thiết bị an ninh nằm giữa máy tính của ta và Internet dùng để lọc các
gói(packets) thông tin gửi qua chúng. Các trường hợp này chưa được đề cập trong
các kịch bản ở trên.
CHƯƠNGII : TÌM HIỂU WEB CACHING
II.1 Các thuật ngữ cơ bản
Tuy nhiên trước khi đi vào các khái niệm về Web caching ta sẽ tìm hiểu một

HTTP server là một trong những server Web thông dụng và hồn tồn miễn phí.
Đỗ Hải Nam - KHMT - K46 Trang 9
Đồ án tốt nghiệp
Netcape , Microsoft và các công ty khác cũng có một số các sản phẩm. Nhưng hầu
hết tất cả các sản phẩm thì đều tập trung và hiệu năng của các server. Một site nổi
tiếng trên Net thì có thể nhận 10 triệu yêu cầu một ngày. Trong trường hợp này thì cả
phần cứng lẫn phần mềm đều phải được thiết kế một cách cẩn thận để có thể đáp ứng
được nhiều yêu cầu một lúc như vậy. Có rất nhiều site chạy trên nhiều server song
song với nhau để có thể đáp ứng được tỉ lệ cao các yêu cầu như vậy và còn phục vụ
cho việc dự phòng.
II.1.2 Proxy
Một chương trình trung gian có thể hoạt động với vai trò của server hoặc của
client nhằm mục đích thay mặt các client tạo ra các yêu cầu. Yêu cầu được phục vụ
tại chỗ hoặc chuyển qua các proxy đến các server khác. Một proxy phải biết biên dịch
và nếu cần có thể viết lại các thông điệp yêu cầu trước khi chuyển tiếp yêu cầu. Các
proxy thường được sử dụng như các bộ đóng gói phía client qua các firewall của
mạng và như các chương trình hỗ trợ để xử lý các yêu cầu thông qua các giao thức
không được triển khai ở phía người sử dụng.
II.1.3 Cache
Một nơi lưu trữ tạm thời các bản tin đáp ứng của chương trình, một hệ thống
phụ trợ điều khiển việc lưu trữ, cung cấp và huỷ các tài liệu. Cache lưu các bản tin
đáp ứng có thuộc tính có thể lưu trữ được (cacheable) để giảm thời gian đáp ứng và
bǎng thông tiêu thụ cho mỗi yêu cầu. Bất cứ client hay server nào đều có thể có
cache.
- Mạng lưới cache server (caching mesh): hệ thống các caching server phối hợp hoạt
động với nhau.
- Web cache server cục bộ (local cache): cache server chạy trên cùng một mạng LAN
với client.s
- Web cache server cấp một: Web cache server mà client của người sử dụng kết nối
trực tiếp đến . Loại này gần giống loại cục bộ.

II.2 Định nghĩa Web Caching
Kỹ thuật Web Caching chính là việc chuyển bản copy của các tài liệu Web từ
Web server đến gần với Web client hơn. Nhìn chung, người sử dụng Web client sẽ
chỉ nhận thấy độ trễ rất thấp khi yêu cầu một URL, phía nhà quản lý mạng sẽ nhận
thấy ít lưu lượng hơn và các Web server có số lượng các yêu cầu cung cấp dịch vụ
thấp hơn. Web client yêu cầu tài liệu từ Web server hoặc trực tiếp hoặc thông qua
Web cache server hay proxy. Web cache server có chức nǎng như Web server khi
nhìn từ phía client và có chức nǎng như client khi nhìn từ phía Web server. Chức
nǎng của Web cache server là lưu trữ các tài liệu Web (có thể là các trang HTML, các
hình ảnh hoặc các tệp tin) tại vị trí gần với người sử dụng để tránh phải chuyển về
nhiều lần cùng một tài liệu qua cùng một kết nối và do đó làm giảm thời gian tải về
và tạo ra ít tải hơn trên các server đầu xa
II.3 Tại sao phải sử dụng Cache đối với Web ?
Đơn giản vì nó tiết kiệm được thời gian cho người duyệt Web. Nó cung cấp
một cách hiệu quả khả năng phân bổ thông tin trên Web. Chúng ta hãy xem xét một
ví dụ thực tế về việc phân bổ sách. Chúng ta hãy suy nghĩ làm sao các cuốn sách
được phân bố tới tay của những độc giả ? Các nhà xuất bản in những cuốn sách và
bán chúng với số lượng lớn tới các nhà bán buôn. Các nhà bán buôn thì lại bán các
cuốn sách với số lượng nhỏ hơn tới các cửa hàng sách. Độc giả có thể đến các cửa
hàng sách và mua các cuốn sách đó. Trên internet thì Web caches cũng hoạt động
tương tự như các cửa hàng sách và các nhà phân phối.
3 lợi ích chính của Web caching
+ Làm cho trang Web được load nhanh hơn (giảm thời gian trễ)
+ Giảm băng thông sử dụng
+ Giảm số lần truy cập lại trên server gốc
II.3.1 Thời gian trễ
Thời gian trễ chính là khoảng thời gian mà dữ liệu được chuyển từ nơi này đến nơi
khác. Một nguồn gốc khác của việc trễ mạng chính là ngẽn mạng. Khi các đường kết
nối đã được sử dụng tối đa thì các gói tin sẽ được xếp hàng trong các Router hay
Đỗ Hải Nam - KHMT - K46 Trang 11

gian đĩa dành cho caching là bao nhiêu. Microsoft thì yêu cầu bạn cần phải điều
khiển kích thước cache dành cho đĩa của bạn là bao nhiêu. Thông thường thì ta
thường sử dụng 10-100 MB không gian đĩa cứng dành cho Browser cache.
II.4.2 Caching Proxy (Server Cache)
Loại cache này nằm trên một server trong mạng lưới gồm nhiều client và
nhiều server. Thông thường, nó không nằm trong cùng một hệ thống chạy một loại
Web client hay một HTTP server nào đó. Không giống như Browser caches, dịch vụ
cache này có thể phục vụ nhiều user cùng một lúc. Khi có nhiều người cùng tới thăm
một website tại một thời điểm thì caching proxies thường được sử dụng hơn Browser
cache.
Caching proxies thì cần thiết đối với rất nhiều tổ chức như các nhà cung cấp
dịch vụ Web, các tổng công ty lớn, các trường đại học, viện nghiên cứu. Caching
Proxies thì thường được đặt ở các gateway (như router) hay nói một cách khác thì nó
thường được sử dụng để có thể phục vụ một số lượng người lớn nhất.
Đỗ Hải Nam - KHMT - K46 Trang 12
Đồ án tốt nghiệp
II.5 Web caching hoạt động như thế nào ?
Tất cả các hệ thống cache đều sử dụng một bộ nguyên tắc để xác định thời
điểm cung cấp các đối tượng (hay các tài liệu Web), tất nhiên là với điều kiện các đối
tượng đó đã được lưu trong cache. Trường hợp các đối tượng được yêu cầu chưa
được lưu sẵn trong cache thì cache server sẽ gửi yêu cầu đó đến server gốc. Một số
nguyên tắc được thiết lập trong các giao thức HTTP/1.0, HTTP/1.1 và một số khác
được thiết lập bởi những người quản trị cache (có thể là người sử dụng browser cache
hoặc người quản trị proxy).
II.5.1 Các nguyên tắc chung
+ Nếu phần tiêu đề của đối tượng cho cache biết không phải lưu đối tượng thì cache
không lưu đối tượng đó. Nếu biến logic xác nhận (biến validator) không xuất hiện,
phần lớn các cache sẽ đánh dấu đối tượng là không thể lưu (uncacheable).
+ Nếu đối tượng có yêu cầu nhận thực hay bảo mật, nó sẽ được lưu.
+ Một đối tượng được lưu được coi là còn tươi - "fresh" (có nghĩa là có thể được gửi

Connection: Keep-alive
Trong thực tế thì yêu cầu này gồm nhiều header hơn so với những gì đã đưa ra
ở trên đây. Ở đây ta thấy rằng URL đã được chia làm 2 phần. Dòng request line(dòng
đầu) chỉ bao gồm thành phần tên của URL. Trong đó phần hostname được xuất hiện
trong phần Host header. Host header là một đặc điểm của HTTP/1.1, nó hỗ trợ
hosting ảo, hay nhiều website logic trên một server vật lý(một địa chỉ IP). Nếu server
gốckhông hỗ trợ domain ảo thì Host header dùng để làm dự trữ.
II.5.1.3 Yêu cầu Proxy
Khi Client giao tiếp với proxy, các yêu cầu cũng không có sự khác biệt so với server
gốc. Tuy nhiên dòng yêu cầu proxy sẽ bao gồm một URL đầy đủ.
GET HTTP/1.1
Host: www.nlanr.net
Accept: */*
Proxy-connection: Keep-alive
HTTP đưa ra một sự thật là: yêu cầu và đáp ứng có thể được đưa qua một số
các proxies giứa Client và Server gốc. Một số HTTP header được định nghĩa như là
end to end(điêm cuối tới điểm cuối) và một số như là hop to hop(điểm tới điểm). End
to end header thì vận chuyển thông tin tới các hệ thống cuối(Client và Server gốc), và
bình thường thì nó không phải được chỉnh sửa bới proxies Cookie header cũng là end
to end. Ngược lại thông tin trong hop to hop header có nghĩa là dành cho các hệ thống
trung gian và nó phải được chỉnh sửa hay di chuyển trước khi được chúng được đưa
đến vị trí mới. Proxy- connection và proxy- authorization header ở dạng hop to hop.
Một Client sử dụng Proxy – connection header để hỏi proxy làm cho TCP kết nối
một cách liên tục bởi vậy chúng được sử dụng lại để cho các yêu cầu khác trong
tương lai. Proxy –authorization header chứa sự ủy nhiệm để có thể truy cập vào
proxy, không phải server gốc.
II.5.1.4 Yêu cầu không phải là HTTP Proxy.
Cuối cùng chúng ta thử xem proxies đối xử với các yêu cầu không phải là
HTTP như thế nào. Đối với các Client thì chúng luôn hỗ trợ các giao thức khác
HTTP như là FTP, HTTPS điều này có nghĩa là chúng chúng luôn biết cách giao tiếp

II.5.2.2 Các phương thức yêu cầu:
Ngồi các nhân tố khác để xác định có thể được lưu trữ đó là các phương
thức yêu cầu. Bảng dưới đây có thể chi ra một vài phương thức và khả năng lưu trữ
của chúng.
Phương thức yêu
cầu
Khả năng lưu trữ
GET
Mặc định được lưu trữ
HEAD
Có thể được sử dụng để cập nhật các thông tin lưu trữ trước
POST
Mặc đinh là không lưu; Nhưng sẽ lưu nếu Cache-control headers
cho phép
PUT
Không bao giờ lưu trữ
DELETE
Không bao giờ lưu trữ
OPTIONS
Không bao giờ lưu trữ
TRACE
Không bao giờ lưu trữ
Ta có thể nhận thấy GET là phương thức yêu cầu phổ biến nhất và đáp ứng
cho yêu cầu GET thì mặc định sẽ được lưu trữ trong cache. Trong khi đó khi phương
thức yêu cầu là POST thì nó chỉ có thể được lưu trữ khi trong đáp ứng của nó gồm cả
thời gian hết hạn và cho phép Cache-control thay thế giá trị mặc định. Nhưng trong
thực tế thì ít khi yêu cầu POST được lưu trữ.
II.5.2.3 Thời gian kết thúc và tính xác thực
Đỗ Hải Nam - KHMT - K46 Trang 15
Đồ án tốt nghiệp

requests). Đáp ứng lại những yêu cầu điều kiện hoặc là một thông điệp “Not
Modified” hoặc tồn bộ một đáp ứng mới.
Nhưng làm thế nào để có thể biết đó là một đáp ứng mới hay đáp ứng cũ.
HTTP/1.1 cung cấp cho ta hai cách để có thể xác định được đólà dựa vào expires
header và max-age cache control. Giá trị expires header chính là ngày và giờ mà tại
đó nó trở thành đáp ứng cũ. Ví dụ
Date: Mon, 19 Feb 2001 01:46:17 GMT
Còn giá trị max-age thì chỉ dẫn cho ta biết số giây mà đáp ứng còn được
xem như là mới. Ví dụ
Cache-control: max-age=21600
Tình trạng này cho ta biết đáp ứng này còn đựoc coi là mới trong vòng 6h đồng hồ kể
từ khi nó được sinh ra.
Đỗ Hải Nam - KHMT - K46 Trang 16
Đồ án tốt nghiệp
II.5.4 Quá trình kiểm tra.
Ở phần trên thì chúng ta đã nghiên cứu quá trình kiểm tra của cache trong
các trạng thái là cache hits hay cache-misses. Ngay sau khi nhận được một yêu cầu về
một đối tượng, thì cache sẽ tiến hành xác định tính hợp lệ đối với server gốc. Nếu
như đối tượng được lưu vẫn còn hợp lệ thì server sẽ trả lời lại bằng một thông điệp
ngắn HTTP 304 (Not modifed). Nếu không thì tồn bộ đối tượng sẽ được gửi đi.
HTTP /1.1 cung cấp hai kĩ thuật để ta có thể kiểm tra đó là xác định thời điểm cuối
cùng đối tượng thay đổi last-modified và E Tag (entity Tags header).
II.5.4.1 Last-modified
Hầu hết các đáp ứng HTTP thì bao gồm last-modified header để xác định
thời gian khi đối tượng tài nguyên có sự thay đổi lần cuối cùng trên server gốc. Last-
Modified thì đưa ra thời gian GMT (Greenwich Mean Time) với đơn vị nhỏ nhất là
giây. Ví dụ
HTTP/1.1 200 OK
Date: Sun, 04 Mar 2001 03:57:45 GMT
Last-Modified: Fri, 02 Mar 2001 04:09:20 GMT

năng nó có thể được yêu cầu lại một lần nữa. Caching đã nghiên cứu, phát triển và
đưa ra một số đề nghị về các giải thuật thay thế trong Cache.
Đỗ Hải Nam - KHMT - K46 Trang 18
Đồ án tốt nghiệp
II.5.5.1 Giá trị ít sử dụng gần đây nhất (Least Recently Used)(LRU)
LRU là một trong những giải thuật hayd được sử dụng bởi web caches. Giải
thuật này hồn tồn đơn giản và đễ thực hiện. Nó đưa ra được hiểu quả tốt trong mọi
hồn cảnh. Như tên của nó đã nói, LRU sẽ xóa bỏ những đối tượng mà nó không được
truy cập trong thời gian nhiều nhất. Giải thuật này có thể được tiến hành trên những
danh sách đơn giản. Tại mỗi thời điểm khi đối tượng được truy cập nó sẽ được di
chuyển đến đầu danh sách. Và khi đó đối tượng ít được sử dụng nhất sẽ chắc chắn tự
động di chuyển xuống cuối danh sách. Tuy nhiên vấn đề của giải thuật này chính là
nó không quan tâm tới kích thước của đối tượng. Bạn muốn lưu một đối tượng với
kích thước lớn hay nhiều đối tượng với kích thước nhỏ. Câu trả lời này có lẽ tùy
thuộc vào sự tối ưu của người quản trị. Nếu cần tiết kiệm băng thông thì bạn sẽ muốn
một đối tượng có kích thước lớn còn nếu bạn giảm số lần truy cập đến server gốc thě
các đối tượng có kích thước nhỏ lại là sự lựa chọn trong trường hợp này.
II.5.5.2 First In, First Out (FIFO)
FIFO là một giải thuật thậm chí còn đơn giản hơn cả LRU. Đối tượng ở đây
thì cùng một cấp bậc sau khi thêm vào. Giải thuật này không quan tâm đến sự phổ
biến của các đối tượng. FIFO thì ít được sử dụng nếu có thì nó được sử dụng cho
cache proxies.
II.5.5.3 Đối tượng ít được sử dụng (Least Frequently Used)(LFU)
LFU thì cũng tương tự như LRU, nhưng thay vì việc chọn lựa dựa trên yếu
tố thời gian truy cập thì dấu hiệu nhận biết đối với giải thuật này là số lần truy cập.
LFU sẽ thay thế những đối tượng mà số lần truy cập ít và giữ lại những đối tượng mà
có số lần truy cập thường xuyên. LFU cũng thỉnh thoảng được sử dụng trong các sản
phẩm nhưng chúng cũng ít được sử dụng thường xuyên.
II.5.5.4 Kích thước
Giải thuật dựa trên kích thước sử dụng kích thước của đối tượng như một

Hiệu năng thì luôn làm cho mọi người muốn gia nhập vào hệ thống kế thừa.
Tuy nhiên hệ thống caching kế thừa không phải là điều thần kì, nó không đảm bảo
được chắc chắn hệ thống sẽ cải thiện được hiệu năng. Nếu bạn muốn tìm kiếm hiệu
năng tốt hơn thì bạn phải quyết định điều gì là quan trọng đối với bạn. Giảm băng
thông ? Giảm độ trễ. Bạn nên tạo ra một hệ thống cho việc giám sát hệ thống hiệu
năng Cache của bạn. Vậy để có một hệ thống hoạt động tốt thì cần chú ý những điểm
sau:
+ Một số đối tượng không tìm thấy trong cache của nó nhưng sẽ được tìm
thấy trong cache của hàng xóm của nó. Hay nói cách khác là bạn có thể nhận được
cache-hits từ cache hàng xóm
+ Cache-hits từ cache hàng xóm thì được phân bố nhanh hơn so với cache-
misses ở server gốc
+ Cache misses từ cache cha thì chậm hơn so với đáp ứng từ phía server
gốc.
Nếu một trong các điều kiện trên đây không thoả mãn thì hiệu năng hoạt
động cache của bạn sẽ bị ảnh hưởng. tuy nhiên chúng hoạt động đúng hay sai còn ảnh
hưởng của rất nhiều các nhân tố. Ví dụ như nếu cache tìm kiếm một cách chậm chạp
thì nó có thể chậm hơn so với kết nối trực tiếp đến server gốc. Và các hành vi của
chúng cũng có thể thay đổi theo thời gian, một ngày nào đó cache cha hoạt động rất
nhanh nhưng những ngày tiếp theo nó lại hoạt động một cách chậm chạp
Đỗ Hải Nam - KHMT - K46 Trang 20
Đồ án tốt nghiệp
II.6.2.2 Thay đổi quá trình định tuyến mặc định
Cache cha thì rất hữu ích khi bạn cần tăng tốc một luồng dữ liệu web. Một
ví dụ là việc vượt qua Filewall. Đối với các tổ chức thì việc sử dụng filewall để bảo
vệ mạng nội bộ của họ. Có rất nhiều cách để triển khai một filewall. Một số thì ngăn
chặn không cho người sử dụng có thể kết nối trực tiếp với các server bên ngồi. Họ
khố tất cả các đường kết nối đi ra cho tất cả các cổng bao gồm cả cổng HTTP(port
80). Trong trường hợp này chỉ có một cách để có thể vượt ra server bên ngồi là thông
qua filewall proxy, mà ở đó có thể đã được đặt cache. Nếu bạn có một caching proxy

port sau: 3128,8080,80 hoặc 1080. Ngày nay thì hầu hết các Web caches thì có thể
lắng nghe các yêu cầu trên nhiều cổng tại một thời điểm. Vì vậy có thể đáp ứng được
tốt hơn các yêu cầu của người dùng. Sau đây ta sẽ nghiên cứu cách cấu hình bằng tay
đối với một Client.
II.7.2 Cấu hình bằng tay
Đỗ Hải Nam - KHMT - K46 Trang 21
Đồ án tốt nghiệp
Như trên ta đã đưa ra việc cấu hình bằng tay đơn giản là thiết lập một địa chỉ
proxy cho một hoặc nhiều giao thức kết nối như HTTp, FTP, SSL. Thông thường thì
một proxy thì hỗ trợ tất cả bởi vây cùng một địa chỉ Proxy được sử dụng cho tất cả
các giao thức. Tuỳ thuộc vào mục đích sử dụng proxy của bạn mà ban có thể cần hay
không cần cấu hình các protocol. Nếu bạn sử dụng ở sau filewall thì bạn nó sẽ yêu
cầu proxy cho tất các các yêu cầu của bạn. Tuy nhiên cấu hình bằng tay thì cũng có
một số nhược điểm. Nó sẽ yêu cầu bạn sử dụng để cấu hình cho một số lượng lớn,
ngồi ra đối với những người dùng thông thương thì yêu cầu một cách trong sáng và
rõ ràng. Cộng thêm bạn phải cung cấp những cho những trình duyệt khác nhau và các
phiên bản khác nhau của cùng một trình duyệt. Khi một proxy bị lỗi thì trình duyệt sẽ
không thử kết nối trực tiếp hay sử dụng một proxy khác. Đó là những yếu điểm của
việc cấu hình bằng tay. Say đây ta sẽ cấu hình mẫu trong một trình duyệt thông dụng
nhất hiện nay đó là Internet Explore.
II.7.2.1 Cấu hình Microsoft Internet Explore
Để cấu hình cho trình duyệt này bạn chọn menu Tool sau đó chọn Internet
Options, ta sẽ thấy có 7 tab, chọn Tab connection
Chọn LAN Settings để cấu hình cho proxy, tại đây một cửa sổ xuất hiện sau đó bạn
thiết lập địa chỉ proxy và cổng của nó như hình dưới đây.
Đỗ Hải Nam - KHMT - K46 Trang 22
Đồ án tốt nghiệp
Nếu bạn muốn sử dụng nhiều proxy khác nhau cho các giao thức khác nhau
thì bạn có thể chọn nút Advanced . Khi đó bạn có thể điền các proxy khác nhau đối
với mỗi giao thức như hình dưới đây.

"PROXY proxy.web-cache.net:3128; DIRECT;
SOCKS socks.web-cache.net:1080;"
Khi bạn viết FindProxyForURL() thì bạn muốn xây dựng trong nó chức
năng tự phân tích URL. Để có thêm những thông tin chi tiết bạn có thể tham khảo tại
/>PAC phải được đặt trên Web server và server phải được cấu hình để trả về
giá trị MIME Content-type header trong đáp ứng của chúng. Nếu Content-type không
thiết lập Application/x-ns-proxy-autoconfig, thì trình duyệt sẽ không nhận biết được
PAC script. Và phần mở rộng của file này phải là .pac và sau đó chỉ dẫn cho HTTP
server trả lại Content-type cho tất cả các URIs với phần mở rộng này. Giả sử một
Webserver chạy Apache ta có thể thêm dòng sau:
Srm.conf.AddType application/x-ns-proxy-autoconfig.pac
II.7.5 Cấu hình cho PAC Script
Khi ta đã viết và đặt PAC script lên server thì ta phải cấu hình browser để
có thể sử dụng chúng. Tất cả những gì ta cần làm là đưa PAC Script URL trong cấu
hình phù hợp với trình duyệt.
Với Netscape ta đặt ở chế độ proxy auto configuration URL trong cùng cửa sổ để cấu
hình với proxy bằng tay. Ta chọn Edit =>Preferences… Sau đó chọn Advanced chọn
Select Proxies. Chọn “Automatic proxy configuration” như hình vẽ:
Đỗ Hải Nam - KHMT - K46 Trang 24
Đồ án tốt nghiệp
Còn nếu bạn sử dụng Microsoft Internet Explore thì bạn có thể làm tương tự
như trong phần cấu hình bằng tay nhưng bạn chọn chế độ use automatic
configuration script như hình vẽ và thêm URL của file PAC vào trong ô địa chỉ.
Đỗ Hải Nam - KHMT - K46 Trang 25


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status