Nghiên cứu giải pháp tự động sao lưu và khôi phục dữ liệu trong hệ thống thông tin điện tử - Pdf 25


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

Đặng Minh Chính

NGHIÊN CỨU
GIẢI PHÁP TỰ ĐỘNG SAO LƯU VÀ KHÔI PHỤC DỮ LIỆU
TRONG HỆ THỐNG THÔNG TIN ĐIỆN TỬ

Ngành:
Công nghệ thông tin.
Mã số:
1.01.10 LUẬN VĂN THẠC SỸ

NGƯỜI HƯỚNG DẪN KHOA HỌC:

PGS.TS. Vũ Duy Lợi


1.2.2 Hệ thống lƣu trữ NAS ……………………………………………………
14
1.2.3 Hệ thống lƣu trữ SAN ……………………………………………………
15
1.2.4 So sánh các hệ thống lƣu trữ ……………………………………………
16
1.3 Ứng dụng sao lƣu, khôi phục dữ liệu trong hệ thống thông tin điện tử
của các cơ quan Đảng …

17
1.3.1 Các phần mềm ứng dụng dùng chung…………………………………
17
1.3.2 Những hạn chế tồn tại ……………………………………………………
19
1.3.3 Hƣớng giải quyết hạn chế tồn tại………………………………………
19
Chƣơng 2: CÁC PHƢƠNG PHÁP SAO LƢU, KHÔI PHỤC CƠ SỞ DỮ
LIỆU ……………………

20
2.1 Khái niệm cơ bản…………………………………………………………………
20
2.1.1 Định nghĩa sao lƣu, khôi phục dữ liệu …………………………………
20
2.1.2 Phân loại các kiểu sao lƣu, khôi phục phục dữ liệu …………….……
22
2.1.3 Tiêu chí đánh giá dịch vụ sao lƣu, khôi phục dữ liệu …. …………
24
2.2 Các phƣơng pháp sao lƣu, khôi phục cơ sở dữ liệu ………………………
26

39
3.3.2 Nguyên tắc hoạt động ……………………………………………………
41
3.3.3 Thử nghiệm chƣơng trình ………………………………………………
42
KẾT LUẬN…………………………………………………………………………………
47
TÀI LIỆU THAM KHẢO ……………………………………………………………….
50
PHỤ LỤC……………………………………………………………………………………
52
A. Cài đặt và cách sử dụng chƣơng trình………………………………………….
52
B. Mã nguồn chƣơng trình…………………………………………………………
53
C. Cơ chế chạy tự động cron trong Linux…………………………………………
69
D. Cơ chế chạy tự động Scheduled Tasks trong Windows……………………
70
4
DANH MỤC BẢNG BIỂU

Hình 1. Mô hình hệ thống lưu trữ DAS (Direct Access Storage)
12
Hình 2. Mô hình NAS (Network Attached Storage)
14
Hình 3. Mô hình SAN (Storage Area Network)
15
Hình 4. So sách các phương pháp sao lưu dữ liệu
16

Hình 20. Màn hình các ứng dụng chạy trong chế độ crontab
68
Hình 21. Màn hình chọn tệp chạy tự động trong Scheduled Tasks
70
Hình 22. Màn hình chọn thời gian chạy ứng dụng trong Scheduled Tasks
70
Hình 23. Màn hình kết thúc quá trình đặt lịch chạy trong Scheduled Tasks
71
5
DANH MỤC CÁC KÝ HIỆU

STT
Ký hiệu
Chú giải cho ký hiệu sử dụng
1.
API
Giao diện lập trình ứng dụng
2. 1
backup
Sao lưu
3.
Backup offline
Sao lưu không trực tuyến
4.
Backup online
Sao lưu trực tuyến
5. 2
consistent
Tính nhất quán
6. 3

Incremnental Backup
Sao lưu gia tăng
17.
Instance
Thực thể
18.
Ip
Giao thức Internet
19.
J2EE
Công nghệ phát triển các ứng dụng web,
chạy trên máy ảo Java
20.
Java Complier
Bộ dịch java
21.
Modul
Là một đoạn chương trình có khả năng
thực hiện một chức năng cụ thể
6
22. 5
Transaction log
Tệp ghi lại nhật ký các giao dịch
23. 6
Pure java
Hoàn toàn bằng java
24. 7
Request
Yêu cầu
25. 8

35. 1
3
UMS
Hệ thống quản lý người dùng
36. 1
4
WFS
Hệ thống quản lý luồng công việc
7
MỞ ĐẦU

1. Tính cấp thiết của luận văn
Thực hiện chỉ thị 58-CT/TW về đẩy mạnh ứng dụng và phát triển công
nghệ thông tin phục vụ sự nghiệp công nghiệp hóa, hiện đại hóa và Đề án 06
tin học hoá hoạt động của các các cơ quan Đảng giai đoạn 2006 – 2010 nhằm
xây dựng các hệ thống thông tin điện tử của các cấp uỷ Đảng đảm bảo cung
cấp thông tin và trao đổi thông tin từ Trung ương xuống các địa phương. Các
ứng dụng dùng chung trong hệ thống các cơ quan Đảng được xây dựng trên
hệ thống mã nguồn mở, cài đặt trên nền hệ điều hành Linux, cơ sở dữ liệu
Posgresql, MySQl, MicroSoft SQL. Webserver là Tomcat, Application Server
là Jboss.
Đây là hệ thống thông tin điện tử phục vụ sự lãnh đạo, chỉ đạo, điều
hành của các cấp uỷ Đảng, nơi chứa các thông tin quan trọng của Đảng. Do
vậy, cần đảm bảo hệ thống này hoạt động liên tục và an toàn. Các ứng dụng
hiện nay đang được sao lưu, khôi phục một cách cục bộ. Mỗi ứng dụng sử
dụng một chương trình sao lưu riêng, việc sao lưu tương đối phức tạp, đòi hỏi
người quản trị mạng phải có kiến thức nhất định về cơ sở dữ liệu mình quản
lý. Việc xây dựng giải pháp sao lưu và khôi phục các cơ sở dữ liệu một cách
tập trung, tự động là rất quan trọng và rất cần thiết.
2. Mục đích của luận văn

nhưng được cải tiến một số nhược điểm mà các giải pháp trước đó gặp phải.
Như vậy, luận văn đã đạt được ý nghĩa khoa học và khẳng định tính thực tiễn
9
của mình. Nó đóng góp một phần quan trọng trong việc đảm bảo an toàn dữ
liệu và đảm bảo hoạt động liên tục của các hệ thống thông tin điện tử đang
hoạt động trong mạng diện rộng của Đảng.

7. Kết cấu luận văn
Ngoài phần Mở đầu và phần Kết luận, luận văn gồm có 3 chương sau:
Chương 1: Giới thiệu tổng quan về sự cần thiết sao lưu, khôi phục
dữ liệu và hiện trạng thực hiện các hệ thống thông tin điện tử trong
các cơ quan Đảng.

Chương 2. Nghiên cứu các giải pháp sao lưu, khôi phục dữ liệu,
đánh giá ưu nhược điểm của từng giải pháp.

Chương 3: Đề xuất giải pháp sao lưu, khôi phục các cơ sở dữ liệu
áp dụng cho các hệ thống thông tin điện tử trong các cơ quan Đảng. 10
Chƣơng 1: GIỚI THIỆU CHUNG

1.1 Sự cần thiết sao lưu, khôi phục dữ liệu
Trong thời đại ngày nay, thông tin đóng vai trò hết sức quan trọng
trong hầu hết các cơ quan, tổ chức. Xét trên khía cạnh công nghệ, hoạt động
của cơ quan, tổ chức là quá trình xử lý, trao đổi dữ liệu và lưu trữ thông tin.
Việc sao lưu, khôi phục dữ liệu để đảm bảo hệ thống hoạt động liên tục, thông
suốt ngày càng được quan tâm cao và được đầu tư thỏa đáng.
Có nhiều nguyên nhân làm hỏng hóc hoặc mất mát dữ liệu như: tệp

thống sẽ có ghi nhận một cách thứ tự tất cả các thao tác chứa trong tệp
nhật ký giao dịch (transaction log) kể từ lần nhật ký giao dịch được sao
lưu gần nhất. Và do vậy có thể khôi phục dữ liệu vào một thời điểm nào
đó trong quá khứ mà vẫn đảm bảo tính nhất quán (consistent).

- Lỗi do thiên tai : Một số trường hợp hệ thống bị lỗi do các thảm hoạ
thiên tai như động đất, sét đánh, cháy, điện không ổn định, Tùy thuộc
số lượng dữ liệu bị mất, sẽ có các mức độ khôi phục khác nhau.

12
1.2 Các hệ thống lưu trữ dữ liệu [22]
Hiện nay có rất nhiều hệ thống lưu trữ dữ liệu để thực hiện việc sao lưu,
khôi phục dữ liệu, trong đó ba hệ thống lưu trữ dữ liệu phổ biến nhất là DAS,
NAS, SAN.
1.2.1 Hệ thống lƣu trữ DAS
DAS (Direct Access Storage) là hệ thống lưu trữ dữ liệu mà ở đó thiết
bị lưu trữ được gắn trực tiếp vào máy chủ. Thiết bị lưu trữ có thể là tủ đĩa đặt
bên ngoài và được nối với máy chủ bởi cáp điều khiển với cổng bên ngoài,
hoặc là những ổ đĩa ở bên trong máy chủ. Hiện nay hầu hết các hệ máy chủ
đều có các hệ thống lưu trữ DAS dùng chuẩn SCSI hoặc Serial SCSI. Trong
hệ thống DAS, các máy trạm truy xuất qua máy chủ, trong trường hợp máy
chủ hỏng, các truy xuất dữ liệu sẽ không thực hiện được. Với giải pháp này,
mỗi máy chủ sẽ có một hệ thống lưu trữ và phần mềm quản lý lưu trữ riêng
biệt. Hình 1. Mô hình hệ thống lưu trữ DAS (Direct Access Storage)
Các thành phần chính của hệ thống DAS là:
- Máy chủ (Server)
- Card HBA được cài đặt trong máy chủ để kết nối máy chủ với thiết bị

cho phép thực hiện mở rộng về dung lượng lưu trữ khi nhu cầu sử dụng tăng
cao.
Vì NAS là thiết bị lưu trữ dựa trên mạng LAN nên NAS đòi hỏi các
yêu cầu riêng về cách truy xuất tệp, tính bảo mật, môi trường kết nối mạng.

Hình 2. Mô hình hệ thống lưu trữ NAS (Network Attached Storage)

Các ưu điểm của NAS:
- Không tốn chi phí cho các card điều hợp HBA và RAID.
- Dễ dàng cấu hình vì đây là các thiết bị plug-and-play.
- Có thể truy xuất từ bất kì nơi nào, qua kết nối mạng.
- Hỗ trợ nhiều hệ điều hành.
Nhược điểm của NAS
- Chỉ cho phép dùng qua LAN.
- Bị giới hạn băng thông và làm ảnh hưởng đến lưu thông mạng LAN.
- Bị giới hạn về khả năng quản lí dung lượng. 15
1.2.3 Hệ thống lƣu trữ SAN
SAN (Storage Area Network) là một mạng riêng tốc độ cao dùng cho
việc truyền dữ liệu giữa các máy chủ tham gia vào hệ thống lưu trữ cũng như
giữa các thiết bị lưu trữ với nhau. Một mạng SAN cho phép các thành phần
kết nối với nhau thông qua thiết bị như routers, gateways, hubs, switchs. Điều
đó cho phép bỏ kết nối lưu trữ và sao lưu truyền thống giữa một máy chủ với
thiết bị lưu trữ, đồng thời bỏ ý niệm một máy chủ chỉ sở hữu và quản lý một
thiết bị lưu trữ.
Sử dụng mạng lưu trữ SAN cho phép quản lý toàn bộ hệ thống lưu trữ,
cho phép một hay nhiều máy chủ hỗn hợp chia sẻ các tiện ích lưu trữ như
dùng chung ổ đĩa, băng từ và các phương tiện lưu trữ quang, mặc dù hệ thống

Gắn ngoài
qua mạng
Gắn ngoài chia sẻ
chung
Quản trị
Theo nhân sự
Tập trung
Tập trung
Hiệu suất
Ảnh hưởng nhất định
đến hiệu suất mạng
Tăng hiệu
suất mạng
Băng thông rộng
Tốc độ
Chậm, dễ bị tình
trạng thắt cổ chai
Cải thiện
tình trạng
thắt cổ chai
Tốc độ cao
Sẵn sàng cao
Bị giới hạn
Bị giới hạn
Không có điểm gây lỗi
Chi phí
Thấp
Chấp nhận
được
Chi phí cao nhưng có


18
Kiến trúc của phần mềm eDocman được mô tả trong Hình 5.

Hình 5. Kiến trúc phần mềm eDocMan

Thành phần cơ bản của phần mềm eDocMan là phân hệ quản lý văn
bản (document management) và xử lý luồng công việc (workflow). Các phân
hệ này liên hệ chặt chẽ với các phân hệ cung cấp dịch vụ hệ thống như: a)
dịch vụ thư điện tử và thông báo, phục vụ việc trao đổi văn bản giữa các phân
hệ quản lý văn bản khác nhau; b) dịch vụ lưu trữ dữ liệu; c) dịch vụ quản trị
người dùng, bao gồm quản lý tài khoản người dùng, quản lý quyền truy nhập
các cơ sở dữ liệu văn bản, quản lý vai trò người dùng trong xử lý luồng công
việc; và d) xác thực người dùng. Ngoài ra, các phân hệ cơ bản của eDocMan
còn được tích hợp với dịch vụ ứng dụng khác như: dịch vụ fax, dịch vụ nhận
dạng văn bản OCR, dịch vụ quét ảnh văn bản (scan document).
Người dùng trao đổi dữ liệu với hệ thống eDocMan thông qua các giao
diện trình duyệt Web (Webbrowser) và dịch vụ ODMA, cho phép truy nhập
trực tiếp từ các ứng dụng văn phòng như: MS Word, MS Powerpoint, vào
cơ sở dữ liệu văn bản được quản lý bởi eDocMan.


cứng như các tệp, thư mục, cơ sở dữ liệu và các ứng dụng. Phần mềm thực
hiện quá trình sao lưu dữ liệu sang các thiết bị lưu trữ gọi là phần mềm sao
lưu dữ liệu. Đích là các thiết bị lưu trữ như băng từ, đĩa từ, đĩa quang,
Nguồn
Tiến trình
sao lưu

Đích
21
Khôi phục dữ liệu là quá trình tạo lại dữ liệu gốc từ dữ liệu đã được lưu trữ. Hình 7. Mô hình tiến trình khôi phục dữ liệu

Sao lưu dữ liệu trong môi trường mạng là quá trình sao lưu dữ liệu
trong đó tiến trình sao lưu dữ liệu từ nguồn sang các thiết bị lưu trữ thông qua
môi trường mạng.
Sao lưu dữ liệu trong môi trường mạng cần chú ý một số vấn đề sau :
- Thiết bị sao lưu phải có khả năng kết nối đến bất kỳ hệ thống
máy tính trong mạng.
- Định tuyến luồng dữ liệu sẽ sao lưu trong mạng
- Quản trị hoạt động sao lưu đối với bất kỳ hệ thống nào.
- Hỗ trợ sao lưu nhiều loại hệ thống khác nhau.

Sao lưu tự động là quá trình hệ thống tự động sao lưu theo một thời
gian định trước. Việc sao lưu tự động đem lại rất nhiều lợi ích như giúp quản
trị mạng thực hiện công việc sao lưu vào thời điểm không có người dùng truy
cập hệ thống hoặc ít sử dụng tài nguyên hệ thống, tránh các sai sót trong quá
trình sao lưu. Trên hệ điều hành Linux, Unix để chạy các chương trình tự
động thì thường sử dụng chức năng Cron. Đó là chức năng cho phép người

(Full Backup)
Sao lưu toàn bộ
các tệp trong
thư mục được
xác định cần
sao lưu.

Dễ dàng xác
định dữ liệu để
sao lưu và khôi
phục

Tốn thời gian và
không gian lưu
trữ dữ liệu
23
Sao lưu gia tăng
so với lần sao
lưu cuối cùng
(Incremental
backup)

Một xác lập để
sao lưu những
tệp có sự thay
đổi kể từ lần
sao lưu cuối


Mất ít thời gian
và không gian
lưu trữ hơn so
với sao lưu toàn
bộ, khi khôi
phục dữ liệu lại
nhanh hơn so
với sao lưu gia
tăng
Thông tin sao
lưu còn bị lặp
lại. Sao lưu tốn
nhiều thời gian
hơn so với sao
lưu gia tăng

Hình 8. So sách các phương pháp sao lưu dữ liệu

Sao lưu theo phương thức đầy đủ là sao lưu toàn bộ các tệp trong thư
mục được xác định cần sao lưu hoặc sao lưu toàn bộ ứng dụng bao gồm cả
24
chương trình và dữ liệu. Đây là kiểu sao lưu thông dụng, rất dễ. Tuy nhiên,
sao lưu theo phương thức này sẽ tốn không gian lưu trữ và thời gian sao lưu.
Sao lưu theo phương thức gia tăng là phương thức chỉ sao lưu khi có sự
thay đổi trong hệ thống tệp hoặc các đối tượng trong cơ sở dữ liệu. Nó chia ra
làm hai loại, đó là:
a) Sao lưu những tệp hoặc các đối tượng trong cơ sở dữ liệu có sự thay
đổi kể từ lần sao lưu cuối cùng thuộc bất kỳ loại sao lưu nào
(Incremental backup).

chiều mũi tên sang trái trong Hình 9, lượng dữ liệu bị mất khi xảy ra thảm họa
sẽ tăng dần cùng với sự giảm tính năng các công nghệ được áp dụng: từ tạo
bản sao dữ liệu theo phương pháp đồng bộ, tạo bản sao theo phương pháp
không đồng bộ, tạo bản sao theo định kỳ, và cuối cùng là tạo bản sao bằng
băng từ.

Trích đoạn Nguyên tắc hoạt động
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status