TẬP ĐOÀN BƯU CHÍNH VIỄN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
BÁO CÁO THỰC TẬP TỐT
NGHIỆP ĐẠI HỌC
Đề tài : “ Tìm hiểu một số cơ chế hoạt động
trong CDN ”
Người hướng dẫn : TS. Lê Tuấn Anh
Sinh viên thực hiện : Nguyễn Mạnh Cường
Mã số sinh viên : N102104137
Lớp : D10CQMT01
Khoá : 2010
Hệ : Đại học chính quy
TP.HCM, tháng 7 /2014
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 2 LỜI CẢM ƠN
Trước hết, tôi xin chân thành cảm ơn Khoa Công Nghệ Thông Tin, Học Viện
Công Nghệ Bưu Chính Viễn Thông cơ sở tại Thành Phố Hồ Chí Minh đã tạo điều
kiện tốt cho tôi thực hiện đề tài thực tập tốt nghiệp này.
TP. Hồ Chí Minh, ngày tháng năm 20……
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
THỰC TẬP TỐT NGHIỆP ĐẠI HỌC
1. Tên đề tài:
2. Sinh viên: Lớp:
3. Giáo viên hướng dẫn:
4. Nơi công tác:
NỘI DUNG NHẬN XÉT
1. Đánh giá chung:
………………………………………………………………………………………………
……………………………………………………………………………………
2. Đánh giá chi tiết:
………………………………………………………………………………………………
……………………………………………………………………………………
………………………………………………………………………………………………
……………………………………………………………………………………
3. Nhận xét về tinh thần, thái độ làm việc:
………………………………………………………………………………………………
……………………………………………………………………………………
4. Kết luận:
………………………………………………………………………………………………
……………………………………………………………………………………
5. Điểm hướng dẫn ():
GIẢNG VIÊN HƯỚNG DẪN
(Ký, ghi rõ họ tên)
2.2.2. Định tuyến yêu cầu dựa vào NAT
2.2.3. Định tuyến yêu cầu lớp truyền tải
2.2.4. Định tuyến yêu cầu dựa trên URL
2.3. Kỹ thuật định tuyến dựa vào DNS
2.3.1. Kỹ thuật định tuyến theo IP dựa vào DNS
2.3.2. Phương pháp định tuyến theo tên miền dựa vào DNS
2.4. Kết luận
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 5 CHƯƠNG III : MÔ PHỎNG KỸ THUẬT ĐỊNH TUYẾN THEO TÊN MIỀN SỬ DỤNG
WIPMANIA WORLDIP DATABASE KẾT HỢP VỚI PHẦN MỀM BIND
3.1 Giới thiệu WipMania và phần mềm BIND
3.2 Mô hình mô phỏng
3.3 Thực hiện mô phỏng
3.3.1 Cài đặt Apache
3.3.2 Cài đặt BIND và WIPmania WorldIP Databse
KẾT LUẬN
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 6
DANH MỤC CÁC HÌNH VÀ BẢN VẼ
HÌNH 1.1 : Mô hình mạng CDN
HÌNH 1.2 : Cấu trúc hệ thống định tuyến yêu cầu
HÌNH 1.3 : Quá trình phân phối nội dung
HÌNH 1.4 : Quá trình phân phát nội dung
HÌNH 1.5 : Phân phối nội dung trong một mạng CDN và giữa các mạng CDN ngang cấp
RSTP : Real Time Streaming Protocol – Giao thức truyền theo thời gian thực
TTL : Time To Live – Thời gian tồn tại
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 8
MỞ ĐẦU
Ngày nay với sự phát triển bùng nổ của internet. Thế giới mạng đã có hàng triệu máy chủ
với hàng nghìn loại nội dung từ các dịch vụ cơ bản như các trang web tĩnh, web động, dịch vụ
email, dịch vụ lưu trữ . . . tới các dịch vụ gia tăng như đàm thoại trên internet, xem phim theo yêu
cầu, các dịch vụ về ngân hàng . . . Chính sự bùng nổ các nội dung trên mạng đồng thời với sự gia
tăng cấp số nhân của người dùng và số lượng truy cập nên năng lực đáp ứng của mạng, chất lượng
dịch vụ ngày càng đi xuống trong khi đòi hỏi của người dùng lại gia tăng mãnh liệt.
Về phía các nhà cung cấp dịch vụ việc phải đáp ứng sự gia tăng nhu cầu thông tin và chất
lượng dịch vụ trên một cơ sở hạ tầng phát triển không tương xứng đòi hỏi phải có các giải pháp kỹ
thuật nhằm phân phối hiệu quả tài nguyên như định cỡ mạng, điều phối lưu lượng, cân bằng tải,
quản lý chất lượng dịch vụ.
CDN là một mạng thông minh, nó cung cấp một lớp thông minh ở trên cơ sở hạ tầng mạng
IP, chuyển đổi mô hình web tập trung truyền thống thành mạng hướng nội dung và phân bố nội
dung một cách có hiệu quả. Cụ thể là các nhà cung cấp dịch vụ nội dung triển khai nhiều server
đại diện (server thay thế) ra trên toàn mạng internet sao cho người sử dụng có thể truy nhập dễ
dàng đến một server đại diện gần nhất nhằm giảm đến mức tối đa thời gian truy nhập và tránh tăng
lưu lượng mạng một cách đột ngột.
Trong các mạng phân phối nội dung, định tuyến là công việc hết sức quan trọng nhằm định
hướng yêu cầu của người sử dụng (client) tới các server đại diện gần nhất và khả dụng nhất thông
Hình 1.1: Mô hình mạng CDN
Trong mạng CDN có nhiều các server thay thế được đặt ở các vị trí khác nhau. Các server
thay thế thường có nội dung như nhau, tuy nhiên khách hàng chỉ có thể kết nối một số server thay
thế phù hợp theo chính sách của nhà cung cấp CDN.
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 10 CDN là một mạng nội dung thông minh, nó cung cấp một lớp thông minh ở trên cơ sở hạ tầng
mạng IP, chuyển đổi mô hình Web tập trung truyền thống thành mạng hướng nội dung và phân bố
nội dung một cách có hiệu quả. Trong kỷ nguyên thông tin, một giải pháp mạng
CDN cho phép các doanh nghiệp, các nhà cung cấp dịch vụ nội dung điều khiển nội dung của họ
và quản lý nó. Các mạng CDN cho phép các doanh nghiệp:
Cải thiện chất lượng mạng và chất lượng dịch vụ thậm chí ngay cả khi lưu lượng tổng tăng
lên.
Sử dụng truyền thông đa phương tiện tốc độ cao như video để tăng cường năng lực người
dùng cuối mà không bị tắc nghẽn ở các mạng.
Đảm bảo cung cấp nội dung dữ liệu mới nhất cho người dùng cuối trong các môi trường
sách các nút mạng và danh sách các client cho từng nút mạng. Nội dung của bảng định tuyến phải
được cập nhật sửa đổi cho phù hợp với mức độ tải hiện thời của mạng và của các nút mạng CDN.
Do vậy thành phần thứ ba của giải pháp CDN là việc đánh giá hoạt động mạng. Ngoài ra còn có
các thành phần khác như hệ thống tính cước, quản lý mạng phân phối nội dung . . . sẽ được trình
bày chi tiết các phần sau.
1.3.1. Nút CDN
Mỗi mạng phân phối nội dung bao gồm một số các nút mạng CDN và mỗi nút mạng
CDN lại bao gồm một hoặc nhiều thiết bị. Các nút mạng CDN này bao gồm một nút gốc và một số
nút thay thế. Do mục tiêu cơ bản của CDN là hỗ trợ các ứng dụng truy cập bởi số lượng lớn khách
hàng, nên mỗi nút CDN phải được thiết kế sao cho nó có độ tin cậy cao và khả năng mở rộng linh
hoạt.
1.3.2. Định tuyến yêu cầu của người sử dụng
Cấu trúc của hệ thống định tuyến yêu cầu được chỉ ra trong Hình 1.2. Hình 1.2 thể hiện
khái niệm tổng quan về hệ thống định tuyến yêu cầu, nó bao gồm các thành phần: Trao đổi cấu
hình nội dung CTE (Content Topology Exchang), cơ sở dữ liệu cấu hình nội dung CTD (Content
Topology Database) và tính toán định tuyến (route computation).
Tính toán CSDL cấu Trao đổi Giao thức trao đổi thông
định tuyến hình thông báo tin định tuyến yêu cầu Hình 1.2: Cấu trúc hệ thống định tuyến yêu cầu
Bước 1. Tính toán định tuyến: Tính toán để lựa chọn server sao lưu tốt nhất cho các
1.3.4. Hệ thống phân phối nội dung
Hệ thống phân phối bao gồm một tập các phần tử mạng thực hiện chung một quá trình phân
phối nội dung của các nhà cung cấp nội dung từ server gốc tới một hoặc nhiều server sao lưu và
phân phát nội dung từ các server sao lưu tới các client trong một mạng
CDN. Quá trình phân phối có thể xảy ra cả khi server sao lưu không nhận được yêu cầu từ các
client, quá trình này được gọi là tìm nạp trước, hoặc có thể xảy ra khi server sao lưu nhận được
yêu cầu của client mà không lưu giữ nội dung được yêu cầu đó, gọi là tìm nạp theo yêu cầu. Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 13
Hình 1.5: Phân phối nội dung trong một mạng CDN và giữa các mạng CDN ngang cấp
Hình 1.5 mô tả các bước phân phối nội dung trong một mạng CDN và phân phối giữa các
mạng CDN ngang cấp. Sau đây là các bước thực hiện phân phối:
Bước 1: Server gốc cho phép các CDN ngang cấp phân phối nội dung của nó và đặt nội
dung vào hệ thống phân phối ngang cấp của một trong các CDN. Tồn tại hai cách đặt nội dung:
Đẩy nội dung xuống trước: Nội dung sẽ được sử dụng trong các CDN được đẩy xuống một
cách tích cực.
Kéo nội dung theo yêu cầu: Nội dung được kéo theo yêu cầu từ OS khi có một bộ đệm bị
lỗi tại server sao lưu tại cùng thời gian đối tượng được yêu cầu.
Bước 4: Hệ thống phân phối ngang cấp di chuyển nội dung giữa các CDN ngang cấp. Nó
cung cấp thông tin về các vị trí nơi mà nội dung có mặt tới hệ thống định tuyến ngang cấp. Hệ
thống định tuyến ngang cấp thông báo thông tin này tới các mạng CDN ngang cấp.
Bước 2, 5: Hệ thống phân phối ngang cấp truyền nội dung tới hệ thống phân phối.
Bước 3, 6: Hệ thống phân phối sẽ phân phối nội dung giữa các server sao lưu trong cùng
một mạng CDN.
Có hai phương pháp để phân phối nội dung tới các server sao lưu đó là: Sử dụng mạng
3. Đảm bảo bảo mật nội dung được lưu trữ hoặc sao lưu tại nút thay thế của mỗi
mạng CDN thành phần.
Bảo mật thông tin giữa các mạng CDN khác nhau có thể được đảm bảo theo một
trong ba cách dưới đây:
1. Mạng riêng thứ cấp được biết đến như là mạng bảo mật có thể được thiết lập ở giữa các
mạng CDN khác nhau và được sử dụng cho việc giao tiếp giữa các bên.
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 16
2. Mạng riêng ảo (VPN) có thể được thiết lập giữa các bên CDN. Mạng này có thể
được thiết lập trên mạng chung sử dụng các công nghệ bảo mật như là IP-sec. Tất cả các giao tiếp
xảy ra giữa các mạng CDN trên mạng riêng ảo đều được mật mã và được bảo mật nhờ sử dụng các
đường hầm IP-sec.
3. Tất cả các giao tiếp giữa các mạng CDN có thể được mã hóa nhờ sử dụng một giao thức
truyền tải bảo mật như là SSL. Các kết nối được thiết lập giữa các mạng CDN đều được nhận thực.
Tất cả các chương trình giao tiếp giữa các mạng CDN phải sử dụng truyền tải bảo mật hoặc bảo
mật dữ liệu bằng cách mã hóa lớp ứng dụng.
1.4. Tương tác giữa Content Distribution và Requesst Routing Hình 1.6 Các thành phần cơ bản trong kiến trúc hệ thống CDN
8. Billing Organization sử dụng những bản ghi chi tiết nội dung để giải quyết những xung
đột phức tạp của mỗi thành phần trong việc phân tán nội dung và xử lý phân phối. .
Dựa vào mô hình cũng như miêu tả chi tiết , ta có thể dễ dàng nhận thấy Content
Distribution System đóng vai trò trung gian giữa Replica Server và Request Routing System . Và
với vai trò này , Content Distribution System cần phải đảm bảo được một số yêu cầu sau : 1.4.1 Trạng thái và vị trí
Replica Server sẽ là nơi lưu trữ nội dung để phân phối đến client. Và việc lựa chọn
Server nào sẽ do Request Routing System quyết định . Nên Distribution System ngoài
việc phân phối nội dung đến các Replica Server còn phải có một cơ chế nhằm xác định
Replica Server nào đang lưu trữ nội dung nào . Để tránh tình trạng , định tuyến đến
Node không có nội dung mà client yêu cầu . Bên cạnh đó việc Health Check thường
xuyên đối với Replica Server là việc cần phải làm, Content Distribution System và
Request Routing System cần phải kết hợp với nhau để tạo ra những Link Backup cho
trường hợp một Server chính bị sự cố , thì sẽ phải định tuyến request đến Server dự
phòng có nội dung tương tự
1.4.2 Đường truyền
Một lưu ý cực kỳ quan trọng đối với những nội dung chiếm lưu lượng như Video (
Youtube , LIVE TV ) thì Request Routing System cần phải có một cơ chế Load
Balancing đặc biệt dựa trên những thông tin được cung cấp từ Distribution System
nhắm mục đích đảm bảo lưu lượng kết nối cho client Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 18
1.5. Các nhà cung cấp dịch vụ CDN hang đầu ở Việt Nam và Thế Giới
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 19
CHƯƠNG II. NGHIÊN CỨU KỸ THUẬT ĐỊNH TUYẾN THEO
TÊN MIỀN DỰA VÀO DNS TRONG MẠNG CDN2.1. Giới thiệuKiến trúc chung của hệ thống CDN bao gồm server gốc và các server thay thế, một hệ thống phân
phối, hệ thống định tuyến yêu cầu, hệ thống tài khoản và các khách hàng.
Các tác giả của đề xuất kỹ thuật biên dịch địa chỉ mạng - NAT (Network Address
Translation) dựa trên kỹ thuật định tuyến yêu cầu - TRIAD (Translating Relaying Internet
Architecture integrating Active Directories). NAT được đưa vào để cho phép tái sử dụng địa chỉ
IP. Nó được dùng trong một hệ thống tự trị cho phép các doanh nghiệp tự cấp địa chỉ độc lập với
các ISP. Nó hỗ trợ các multi-homing và chuyển mạch ISP và ghép cặp số lượng các host với các
số lượng địa chỉ được cấp bởi ISP. Nhưng với NAT thì địa chỉ IP chỉ thực sự có nghĩa với một dải
địa chỉ nhất định. Bộ định tuyến NAT yêu cầu có các proxy chuyên dụng lớp ứng dụng để thực
hiện chức năng ứng dụng Internet một cách chính xác. Nó cần điều chỉnh các đáp ứng DNS truyền
qua bộ định tuyến NAT và cập nhật trường checksum của gói tin, hứa hẹn đảm bảo độ tin cậy và
bảo mật xuyên suốt. Tuy nhiên trong NAT, việc truyền thông giữa dải địa chỉ riêng biệt mà không
cần đánh số lại là rất khó. Kỹ thuật
TRIAD rất thích hợp cho định tuyến yêu cầu CDN sử dụng NAT.
2.2.3. Định tuyến yêu cầu lớp truyền tải
Định tuyến yêu cầu dựa trên lớp truyền tải được sử dụng để đạt được định tuyến yêu cầu
mức cao hơn và tốt hơn sau khi mức đầu tiên được thực hiện, đó là mức định tuyến yêu cầu dựa
trên DNS. Nó sử dụng các thông tin như là địa chỉ IP của client và số cổng sẵn có trong gói tin đầu
tiên từ client, trong quá trình định tuyến yêu cầu và chuyển phiên này tới server đại diện thích hợp
hơn.
2.2.4. Định tuyến yêu cầu dựa trên URL
Định tuyến yêu cầu dựa theo URL (URL based) sử dụng URL hoặc các tiền tố URL của nội
dung yêu cầu để đưa ra quyết định định tuyến. Định tuyến yêu cầu dựa theo URL có hai loại là sử
dụng mã định hướng lại 302 và In-path Element (phần tử trong luồng)
Sử dụng mã định hướng lại 302: Mã 302 mang ý nghĩa là dịch chuyển tạm thời: Yêu cầu
đối tượng được tạm thời chuyển sang vị trí mới và được đáp ứng tại đó. Các yêu cầu trong tương
lai của client nên vẫn là như cũ. Theo phương pháp này, yêu cầu của client trước tiên được chuyển
sang một Server đại diện “ảo”. Sau đó server đại diện này sẽ gửi trả lại một mã ứng dụng cụ thể là
302 (đối với giao thức truyền tải là HTTP hoặc RTSP) để định hướng client tới nút phân phối thực.
chuyên dụng sẽ:
1. Nhận các yêu cầu phân giải tên miền.
2. Xác định vị trí của client dựa trên địa chỉ IP của client (hoặc các điều kiện rang buộc
khác).
3. Trả về địa chỉ của server CDN gần đó.
Nói chung câu trả lời được cache tại server nội bộ của client trả lời trong một thời gian
ngắn để nhờ đó bộ định tuyến yêu cầu có thể nhanh chóng thích nghi với các thay đổi trong mạng
hay của tải server. Điều này đạt được bằng cách thiết lập trường time-to-live (TTL) trong câu trả
lời với một giá trị rất nhỏ (ví dụ như 20 giây).
Hình 2.2 thể hiện một quá trình phân giải tên miền theo IP dựa vào DNS. Theo phương
pháp này thì DNS có thẩm quyền sẽ trả về cho khách hàng địa chỉ của server thay thế phù hợp với
yêu cầu.
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 22
Nguyễn Mạnh Cường D10CQCNMT01-N Page 23
2.3.2. Phương pháp định tuyến theo tên miền dựa vào DNSKhác với phương pháp định tuyến theo IP, khi khách hàng yêu cầu phân giải một tên miền
thì DNS trong mạng CDN sẽ không trả lại cho khách hàng địa chỉ IP của server thay thế, thay vào
đó nó sẽ gửi về khách hàng một tên miền khác tưng ứng với điều kiện và chính sách của nhà cung
cấp CDN. Chính sách được sử dụng trong luận văn sẽ sử dụng chính IP của khách hàng query đến
hoặc DNS Local của chúng. Khi đó khách hàng muốn biết được server nào sẽ phục vụ nhu cầu của
mình thì khách hàng sẽ tiếp tục gửi yêu cầu phân giải thứ
2 về tên miền nhận được.
Sơ đồ dịch vụ CDN theo phương pháp này như sau. Hình 2.3: Định tuyến theo tên miền dựa vào DNS
Trong hệ thống CDN cung cấp dịch vụ web chẳng hạn như “24h.com” trên hình 2.3, server
giao trên DNS VNNIC của Việt Nam.
Bước 8. DNS local đi hỏi DNS VNNIC về IP của tên miền “24h.com.vn”.
Bước 9. DNS VNNIC trả lời IP tương ứng với tên miền “24h.com.vn” là
“123.30.129.148”.
Bước 10. DNS local trả về IP tưng ứng với tên miền “24h.com” cho khách hàng.
Bước 11. Khách hàng yêu cầu nội dung từ server thay thế có IP “123.30.129.148”.
Bước 12. Server thay thế cung cấp nội dung cho khách hàng.
Như vậy quá trình từ yêu cầu nội đến cung cấp nội dung phải trải qua 2 lần DNS local,
hoặc máy tính của khách hàng yêu cầu phân giải tên miền do đó làm tăng thời gian đáp ứng
nội dung. Tuy nhiên nó có ưu điểm rất lớn là các server thay thế tại các Quốc gia khác nhau
có thể sử dụng IP động chứ không phải IP tĩnh, do đó làm giảm chi phí thuê Ip tĩnh đồng thời
nó còn giúp tiết kiệm tài nguyên IPv4 đang ngày càng cạn kiệt. Các server thay thế có IP động
sẽ hoạt động dựa vào phương pháp DNS động (Dynamic DNS).
Dynamic DNS là phương thức ánh xạ tên miền tới địa chỉ IP có tần xuất thay đổi cao
(do không phải mọi máy tính đều sử dụng địa chỉ IP tĩnh).
Những đối tượng không sử dụng dịch vụ kết nối Internet trực tiếp leased-line với địa chỉ IP
tĩnh mà thuê kết nối Internet gián tiếp dialup hoặc dịch vụ ADSL có địa chỉ IP động, nếu đăng
Báo cáo TTTN Đại Học
Nguyễn Mạnh Cường D10CQCNMT01-N Page 25
ký sử dụng Dynamic DNS hoàn toàn có thể tự duy trì máy chủ dịch vụ của mình. Đặc biệt,
các thuê bao ADSL với số lượng ngày càng tăng nhanh sẽ rất hưởng ứng dịch vụ dynamic
DNS bởi vì với dynamic DNS, thuê bao ADSL (thường là các tổ chức) có khả năng tự duy trì
máy chủ dịch vụ (mail, web, ftp…server), không phải thuê dịch vụ mail hosting, web hosting
của ISP vốn rất tốn kém. Việc tự duy trì máy chủ trước đây vốn chỉ có thể đối với các tổ chức
có kết nối trực tiếp leased-line vốn là một dạng dịch vụ kết nối giá thành cao.
Ở Việt Nam: Để sử dụng dịch vụ Dynamic DNS, khách hàng ADSL chỉ cần đăng ký