HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
TRẦN VĂN HIỂN
LUẬN VĂN THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
HÀ NỘI - 2016
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
TRẦN VĂN HIỂN
NGHIÊN CỨU ÁP DỤNG MÔ HÌNH ĐỒNG BỘ
TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN
Chuyên ngành : KHOA HỌC MÁY TÍNH
Mã số:
60.48.01.01
TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. HÀ HẢI NAM
HÀ NỘI - 2016
1
3
DANH MỤC KÝ HIỆU CÁC CHỮ VIẾT TẮT
Viết tắt
Tiếng Anh
Tiếng Việt
CSDL
DataBase
Cơ sở dữ liệu
DDB
Distributed DataBase
Cơ sở dữ liệu phân tán
TCP
Transmission Control Protocol
Giao thức mạng
QGIS
Quantum Geographic
ĐTKKR
Điều tra kiểm kê rừng
NFIS
National Forest Inventory
Hệ thống kiểm kê rừng
System
quốc gia
Module Quantum Geographic
Modul phần mềm hệ
Information System
thống thông tin địa lý
Module QGIS
PosgreSQL
Hệ quản trị CSDL
SOA
DANH MỤC CÁC HÌNH VẼ
Số liệu hình vẽ
Tên hình vẽ
Trang
Hình 1.1
Mô hình hệ CSDL phân tán
10
Hình 1.2
Lược đồ quá trình thiết kế từ trên xuống
14
Hình 2.1
Phân mảnh ngang
21
Hình 2.2
Phân mảnh dọc
39
5
LỜI CẢM ƠN
Lời đầu tiên, tôi xin chân thành gửi cảm ơn đến PGS.TS Hà Hải Nam, người
đã trực tiếp hướng dẫn và giúp tôi hoàn thành luận văn. Với sự nhiệt tình và kiến
thức sâu rộng của thầy đã giúp tôi vượt qua những hạn chế về kiến thức chuyên
môn để tập trung hoàn thành tốt luận văn của mình.
Tôi xin chân thành cảm ơn Ban Giám đốc, Ban Chủ nhiệm Khoa sau Đại học
và các thầy, cô đã giảng dạy trong suốt thời gian tôi theo học tại Học viên Công
nghệ Bưu chính Viễn thông.
Tôi xin chân thành cảm ơn Hội đồng chấm đề cương đã có nhiều góp ý quý
báu cho đề cương luận văn ngay từ bước đầu hình thành ý tưởng xây dựng.
Cuối cùng, tôi xin cảm ơn cơ quan đã tạo điều kiện thuận lợi cho tôi trong
suốt quá trình học tập và nghiên cứu làm luận văn.
Xin chân thành cảm ơn!
6
MỞ ĐẦU
1. Tính cấp thiết của đề tài:
Với sự phát triển của ngành công nghệ thông tin, các giao dịch điện tử ngày
càng tăng về số lượng và đòi hỏi đảm bảo về chất lượng, đặc biệt trong các lĩnh vực
quan trọng như tài chính ngân hàng, chứng khoán, thương mại điện tử, đấu
giá...Việc xử lý thông tin của người dùng từ những dịch vụ trên phải đảm bảo thời
gian thực và không chấp nhận cho việc gián đoạn, có độ trễ cao hoặc thời gian chết.
vấn đề trong thiết kế hệ cơ sở dữ liệu phân tán.
Chương II: Vai trò của đồng bộ cơ sở dữ liệu phân tán và các mô hình ứng
dụng
Chương II, tập trung giới thiệu bài toán đồng bộ, các vấn đề liên quan đến phân
mảnh dữ liệu như phân mảnh ngang, phân mảnh dọc và đưa ra mô hình triển khai
đồng bộ dữ liệu.
Chương III: Thử nghiệm và đánh giá
Chương III, trình bày vào kiến trúc đề xuất để thử nghiệm, mô hình triển khai
SymmetricDS và các kịch bản kiểm thử đồng bộ. Trong luận văn mô tả Hệ thống
theo dõi diễn biến tài nguyên rừng tại Việt Nam.
III. KẾT LUẬN
8
CHƯƠNG I
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
1.1 Giới thiệu về cơ sở dữ liệu (CSDL) phân tán
1.1. 1 Các khái niệm về CSDL phân tán
Cơ sở dữ liệu phân tán là một tập hợp nhiều cơ sở dữ liệu có liên đới logic và
được phân bổ trên một mạng máy tính. Trong khái niệm này có hai thuật ngữ quan
trọng trong các định nghĩa này là “liên đới logic” và “phân bố trên một mạng máy
tính”.
- Liên đới logic: Toàn bộ dữ liệu của cơ sở dữ liệu phân tán có một số các
thuộc tính ràng buộc chúng với nhau, điều này giúp chúng ta có thể phân biệt một
cơ sở dữ liệu phân tán với một tập hợp cơ sở dữ liệu cục bộ hoặc các tập tin lưu
trữ tại các vị trí khác nhau trong một mạng máy tính.
- Phân bổ trên một mạng máy tính: Toàn bộ dữ liệu của cơ sở dữ liệu phân tán
không được lưu trữ ở một nơi mà lưu trữ trên trạm thuộc mạng máy tính, điều này
1.2.2. Độc lập dữ liệu
1.2.3. Giảm dư thừa dữ liệu
1.2.4. Độ tin cậy qua các giao dịch phân tán
1.2.5. Cải thiện hiệu năng
10
1.2.6. Dễ dàng mở rộng hệ thống
1.2.7. Tính toàn vẹn, phục hồi và điều khiển tương tranh
1.3. Các vấn đề trong thiết kế hệ cơ sở dữ liệu phân tán
Thiết kế một hệ cơ sở dữ liệu phân tán cần phải chọn những vị trí đặt dữ liệu
và các chương trình trên một mạng máy tính. Đối với hệ quản trị cơ sở dữ liệu phân
tán, việc phân tán các ứng dụng đòi hỏi hai điều:
- Phân tán hệ quản trị cơ sở dữ liệu;
- Phân tán các chương trình ứng dụng chạy trên hệ quản trị cơ sở dữ liệu đó.
Trong phần này, chúng ta thảo luận ngắn gọn hai phương pháp thiết kế cơ sở
dữ liệu phân tán: Phương pháp thiết kế từ trên xuống và từ dưới lên.
1.3.1 Quá trình thiết kế từ trên xuống (top-down)
Hình 1.2: Lược đồ quá trình thiết kế từ trên xuống.
11
CHƯƠNG II
VAI TRÒ CỦA ĐỒNG BỘ CƠ SỞ DỮ LIỆU PHÂN TÁN VÀ
CÁC MÔ HÌNH ỨNG DỤNG
2.1 Giới thiệu bài toán đồng bộ
2 chiều. Các thao tác đối với cơ sở dữ liệu được thực hiện trên các bảng.
- Việc phân rã một quan hệ thành nhiều mảnh, mỗi mảnh được xử lý như một
đơn vị dữ liệu, sẽ cho phép thực hiện nhiều giao dịch đồng thời.
2.2.3. Các kiểu phân mảnh
Có 3 kiểu phân mảnh:
-
Phân mảnh ngang.
-
Phân mảnh dọc.
-
Phân mảnh hỗn hợp.
2.2.4. Các quy tắc phân mảnh
Có 3 quy tắc phải tuân thủ khi phân mảnh cơ sở dữ liệu quan hệ:
Quy tắc 1: Tính đầy đủ
Quy tắc 2: Tính phục hồi
Quy tắc 3: Tính tách biệt
2.2.5. Các phương án phân phối
Giả sử cơ sở dữ liệu được phân mảnh, người ta cần phải quyết định sự phân
phối các phân mảnh này tới các trạm khác nhau trên mạng. Khi dữ liệu được phân
phối, có thể không nhân bản hoặc có thể được nhân bản.
Việc cấp phát dữ liệu phải được thực hiện sao cho thỏa mãn hai yêu cầu sau:
- Chi phí thấp nhất;
Giả sử R là một quan hệ được phân mảnh thành các mảnh:
{ F1, F2......,Fi} i=1,.....n.
Giả sử Fi được triển khai tại các vị trí Si; R được triển khai tại vị trí S0, T1 có
mô hình triển khai như sau:
14
R
S0
..........
F1
F2
Fi
Fn
N
Hình 2.3: Mô hình triển khai đồng bộ.
Các mô hình đồng bộ được phân loại như sau:
Đồng bộ một chiều từ R
Fi: Mỗi khi có thay đổi dữ liệu tại R thì
các thay đổi đó phải được đồng bộ tới các mảnh Fk tại vị trí Sk tương
ứng.
Mô hình Hệ thống theo dõi diễn biến tài nguyên rừng được áp dụng theo phân mảnh
ngang.
Ứng dụng
Desktop
Ứng dụng
Web
Đồng bộ hóa
Mạng nội bộ
MẠNG
INTERNET
Bộ cơ sở dữ liệu trung tâm
Hình 3.1: Kiến trúc khái niệm của Hệ thống theo dõi diễn biến tài nguyên rừng.
16
3.2. Các chức năng chính của Ứng dụng Desktop
-
Biên tập thay đổi dữ liệu bản đồ
3.3. Các chức năng chính của Ứng dụng Web
-
Hiển thị dữ liệu bản đồ
phần ứng dụng Web được cài đặt trên máy chủ đặt tại TCLN. Cơ sở dữ liệu được
dóng gói kèm theo Thành phần ứng dụng desktop được gọi là cơ sở dữ liệu CỤC
BỘ và cơ sở dữ liệu cài đặt trên máy chủ đặt tại TCLN được gọi là CSDL trung
tâm. Cơ chế đồng bộ dữ liệu đảm bảo dữ liệu lưu trữ trong cơ sở dữ liệu CỤC BỘ
nhất quán với dữ liệu lư trữ trong cơ sở dữ liệu TRUNG TÂM. Việc đồng bộ dữ
liệu được thực hiện thông qua thành phần đồng bộ dữ liệu.
Hình 3.2. minh họa việc triển khai thành phần đồng bộ.
Hình 3.2: Mô hình triển khai SymmetricDS.
Thành phần đồng bộ dữ liệu phía ứng dụng khách, có tên là SymmetricDSClient, được tích hợp với ứng dụng Báo cáo của Thành phần ứng dụng desktop.
Chức năng quan lý quá trình đồng bộ là một phần của ứng dụng Báo cáo chạy trên
máy tính cục bộ.
Thành phần đồng bộ dữ liệu phía ứng dụng chủ, có tên là SymmetricDSServer, được cài đặt trên máy chủ trung tâm và được kết nối với SymmetricDSClient thông qua mạng Internet để đồng bộ dữ liệu.
Có 2 hướng đồng bộ:
1) từ cơ sở dữ liệu trung tâm đến cơ sở dữ liệu cục bộ;
2) Từ các cơ sở dữ liệu cục bộ đến cơ sở dữ liệu trung tâm:
18
3.7.
Đồng bộ dữ liệu trong ứng dụng Desktop
3.8.
Các kịch bản kiểm thử đồng bộ
Kịch bản 1: Tải dữ liệu từ máy chủ
biến.
Điều kiện kiểm thử thành công: Lô được xem trên ứng dụng FRMS Web có
cùng giá trị thuộc tính, không gian với lô đã được biên tập ở máy tính cục bộ sử
dụng Ứng dụng QGIS tùy biến.
Kịch bản 3: Đồng bộ dữ liệu ở dụng chế độ ngoại tuyến
Mục đích: Kiểm thử chức năng đồng bộ dữ liệu từ cơ sử dữ liệu cục bộ lên cơ sở
dữ liệu trung tâm khi nhập liệu ở chế độ ngoại tuyến.
Mô tả:
1. Đảm bảo chức năng đồng bộ đang không chạy;
2. Đăng nhập vào ứng dụng QGIS tùy chỉnh sử dụng tài khoản kiểm thử cho
một tỉnh (tài khoản được cung cấp sẵn trong gói cài đặt);
3. Chọn một lô và bắt đầu biên tập dữ liệu không gian và thuộc tính của lô;
4. Đăng nhập vào Ứng dụng báo cáo trên máy cục bộ sử dụng cùng tài khoản ở
bước 2;
5. Đảm bảo kết nối Internet sẵn sàng;
6. Click biểu tượng “Bắt đầu đồng bộ”;
7. Đăng nhập vào thành phần ứng dụng FRMS Web sử dụng tài khoản cấp tỉnh;
8. Kiểm tra lô đã được biên tập ở máy tính cục bộ sử dụng Ứng dụng QGIS tùy
biến.
Điều kiện kiểm thử thành công: Lô được xem trên ứng dụng FRMS Web có
cùng giá trị thuộc tính, không gian với lô đã được biên tập ở máy tính cục bộ sử
dụng Ứng dụng QGIS tùy biến.
Kịch bản 4: Đồng bộ dữ liệu theo hai hướng ở chế độ trực tuyến
Mục đích: Kiểm thử chức năng đồng bộ theo hai hướng khi nhập dữ liệu ở chế độ
trực tuyến.
20
Mô tả: Kịch bản này cần hai máy tính cục bộ: Máy A và Máy B được cài sẵn phân
sở dữ liệu phân tán; Đưa ra bài toán kiểm thử và đánh giá cụ thể từng kịch bản đồng
bộ. Mô hình kiểm thử với Hệ thống theo dõi diễn biến tài nguyên rừng trong cả
nước đã đáp ứng được yêu cầu trong việc quản lý tài nguyên rừng ở nước ta từ
Trung ương đến địa phương. Những số liệu cụ về tình hình tài nguyên rừng thu
được từ hệ thống, từ đó có phương hướng xử lý khi có sự cố rừng xẩy ra.
Từ những kết quả đã đạt được, trong thời gian tới Luận văn có thể được tiếp
tục mở rộng nghiên cứu nghiên cứu để áp dụng cho một số hệ thống thực tế có cơ
sở dữ liệu lớn.