Kỹ năng của Kiến trúc sư dữ liệu Rational, Phần 3: Phát hiện các mối quan hệ của lược đồ bằng Kiến trúc sư dữ liệu Rational - Pdf 20

Kỹ năng của Kiến trúc sư dữ liệu Rational, Phần 3: Phát hiện các mối quan
hệ của lược đồ bằng Kiến trúc sư dữ liệu Rational
Tạo các ánh xạ lược đồ bán tự động
Torsten Bittner, Kỹ sư phần mềm, IBM
Tóm tắt: Bạn có thể sử dụng Kiến trúc sư Dữ liệu Rational® của IBM® để định
nghĩa các ánh xạ dữ liệu. Khi làm việc với các lược đồ lớn, có thể rất cồng kềnh
nếu tạo các ánh xạ bằng tay. Kiến trúc sư Dữ liệu Rational cung cấp một thành
phần khám phá để nhận biết một cách bán tự động các ánh xạ có tiềm năng.
Hướng dẫn này cung cấp một giới thiệu nhập môn về thành phần khám phá quan
hệ của Kiến trúc sư Dữ liệu Rational.
Trước khi bạn bắt đầu
Trong hướng dẫn này, hãy tìm hiểu làm thế nào để sử dụng thành phần khám phá
của Kiến trúc sư Dữ liệu Rational (Rational Data Architect) để tạo ra bán tự động
các ánh xạ giữa các nguồn dữ liệu quan hệ và các nguồn dữ liệu XML. Hướng dẫn
này là phần thứ ba trong một loạt bài viết về Kiến trúc sư Dữ liệu Rational.
Về hướng dẫn này
Hướng dẫn này chỉ dẫn cho bạn thấy từng bước làm thế nào để:
 Gọi thực hiện thuật toán phát hiện sự giống nhau về từ vựng của Kiến trúc
sư Dữ liệu Rational (RDA) để phát hiện các ánh xạ lược đồ tiềm năng dựa
vào sự giống nhau của các tên cột.
 Định nghĩa một mô hình bảng chú giải thuật ngữ có chứa các từ, chữ viết
tắt và từ đồng nghĩa bằng cách sử dụng trình soạn thảo Mô hình bảng chú
giải thuật ngữ của RDA.
 Sử dụng thông tin của mô hình bảng chú giải thuật ngữ với thuật toán dựa
vào nghĩa của tên để phát hiện thêm các kết quả phù hợp.
 Thiết lập việc khám phá quan hệ để sử dụng các mẫu dữ liệu.
 Tìm các ánh xạ có tiềm năng với các thuật toán, sử dụng các mẫu dữ liệu. Mục tiêu
Sau khi hoàn thành hướng dẫn này, bạn sẽ có khả năng sử dụng thành phần khám

nén gói làm thư mục cho vùng làm việc của bạn (ví dụ, C:\RDA_Tutorials).
5. Thư mục RDA_Discovery trong gói phần mềm là thư mục dự án dữ liệu
của Kiến trúc sư Dữ liệu Rational. Trong Kiến trúc sư Dữ liệu Rational bạn
phải nhập khẩu nó vào trong vùng làm việc của bạn. Từ trình đơn File,
chọn Import.
6. Chọn trình thủ thuật Existing Project into Workspace.

Hình 1. Chọn trình thủ thuật Import 7. Nhấn vào Next. Duyệt đến vị trí ở đó bạn đã giải nén tệp tin ar-
rdamapcode.zip (ví dụ, C:\RDA_Tutorials).

Hình 2. Trình thủ thuật Import Project 8. Nhấn vào Finish. Kết quả là, bạn thấy dự án RDA_Discovery với một tập
hợp các mô hình dữ liệu, một mô hình bảng chú giải thuật ngữ và các tệp
tin mô hình ánh xạ trong vùng làm việc của bạn như được hiển thị trong
Hình 3. (Nếu bạn không nhìn thấy Database Explorer, hãy kiểm tra chắc
chắn rằng bạn ở trong phối cảnh Dữ liệu, như thấy trong Hình 4.)

Hình 3. Data Project Explorer sau khi nhập khẩu dự án

Hình 4. Phối cảnh Dữ liệu
Hình 7. Các thông số cài đặt kết nối cơ sở dữ liệu 15. Nhấn vào Test Connection để kiểm tra xem tất cả các tham số đã được
thiết lập đúng chưa. Nếu thử nghiệm thành công, hãy nhấn vào Finish.
16. Lặp lại các bước từ 13 đến 15 cho cơ sở dữ liệu OLD_LIB bằng cách sử
dụng cùng giá trị thiết lập kết nối, trừ tên của cơ sở dữ liệu.
Tổng quan kịch bản và mô tả vấn đề
Kịch bản cho hướng dẫn này có liên quan chặt chẽ đến kịch bản trong các hướng
dẫn đã xuất bản trước đó. Mục đích là để sử dụng trình soạn thảo ánh xạ của Kiến
trúc sư Dữ liệu Rational để tích hợp dữ liệu (xem Phần 1) và tạo ra truy vấn (xem
Phần 2).
Trình soạn thảo ánh xạ làm giảm đáng kể lượng thời gian phải dùng để tự tay viết
các truy vấn SQL hoặc SQL/XML. Trình soạn thảo cũng cho phép người sử dụng
nắm bắt các mối quan hệ dữ liệu và công bố thông tin trong một báo cáo.
Tuy nhiên, một vấn đề mới phát sinh khi sử dụng trình soạn thảo ánh xạ. Việc tạo
bằng tay từng ánh xạ, từng cái một, rất tốn thời gian. Đặc biệt, khi làm việc với
các lược đồ lớn về phía nguồn và phía đích, sẽ thật khó tìm thấy các cột được ánh
xạ tới.
Kiến trúc sư Dữ liệu Rational giải quyết vấn đề này bằng thành phần khám phá
mối quan hệ. Ý tưởng là để tạo ra các ánh xạ một cách bán tự động. Công cụ này
phát hiện các ánh xạ có tiềm năng cho người sử dụng, người chỉ phải chấp nhận
hoặc từ chối kết quả so khớp được đề xuất.
Thành phần khám phá hoạt động dựa trên giả thiết rằng các phần tử nguồn và đích
đưa vào trong một ánh xạ có sự giống nhau nhất định. Các đặc điểm giống nhau
này rơi vào hai thể loại.
Sự giống nhau của siêu dữ liệu
Thể loại này đề cập đến thông tin có chứa trong mô hình dữ liệu, như là mô hình
cơ sở dữ liệu vật lý, mô hình cơ sở dữ liệu logic hoặc mô hình lược đồ XML. Phần
tử được ánh xạ giữa các mô hình dữ liệu ấy là các cột, các thực thể và các phần tử

Trong phần này, bạn sẽ gọi thực hiện việc khám phá các quan hệ. Từng bước một,
chúng ta sẽ mở một mô hình ánh xạ hiện có mà chưa định nghĩa ánh xạ nào, chạy
khám phá Tìm cái phù hợp nhất (Find Best Fit) và Tìm cái tương tự (Find
Similar) với thuật toán tương tự từ vựng và phân tích các kết quả phát hiện ra.
Gọi thực hiện khám phá Find Best Fit
1. Chuyển tới Data perspective.
2. Trong Data Project Explorer, mở mô hình ánh xạ CompanyMapping.msl
như được hiển thị trong Hình 8. Thao tác này sẽ mở trình soạn thảo ánh xạ
của Kiến trúc sư Dữ liệu Rational. Ở phía bên trái là mô hình cơ sở dữ liệu
nguồn Company_old.dbm và ở bên phải là mô hình cơ sở dữ liệu đích
Company_new.dbm.

Hình 8. Mở mô hình ánh xạ CompanyMapping.msl 3. Để gọi thực hiện khám phá, nhấn chuột phải vào cột Customer trong bảng
CUSTOMER. Từ trình đơn ngữ cảnh, chọn Discover Relationships >
Find Best Fit.

Hình 9. Gọi thực hiện khám phá Find Best Fit 4. Trong trình thủ thuật định phạm vi Discover Relationship, hãy bảo đảm
chắc chắn đã đánh dấu chọn vào cột Customer ở bên phía nguồn và đánh
dấu vào tất cả các cột bên phía đích. Nhấn vào Finish.

Hình 10. Trình thủ thuật định phạm vi khám phá quan hệ (Discover
Relationship) cho Find Best Fit
hợp được sử dụng cho việc xếp hạng để xác định điểm số phù hợp.
Một bảng có chứa hai giá trị tỷ lệ phù hợp. Giá trị Mức lá (Leaf Level) đề
cập đến sự giống nhau của các phần tử mức lá trong khung nhìn cây lược
đồ, chẳng hạn như các tên cột khi làm việc với các mô hình cơ sở dữ liệu
vật lý. Giá trị Mức cha mẹ (Parent Level) đề cập đến phần tử cha mẹ trực
tiếp của phần tử mức lá, chẳng hạn như tên bảng trong kịch bản mô hình cơ
sở dữ liệu vật lý.

8. Nhấn chuột phải vào đường ánh xạ mầu vàng trong trình soạn thảo ánh xạ
và chọn Accept Mapping. Đường ánh xạ mầu vàng chuyển thành một
đường ánh xạ màu xanh dương.

Hình 13. Chấp nhận một kết quả phù hợp được phát hiện
IGọi thực hiện khám phá Find Similar
Find Best Fit so với Find Similar
Find Best Fit (tìm kết quả phù hợp nhất) thường cung cấp cho bạn một bước nhảy
khởi động để tìm kiếm các ánh xạ có tiềm năng tốt nhất. Khi gọi thực hiện khám
phá trên một phạm vi rộng các nguồn và đích, Find Best Fit là sự lựa chọn được
ưu tiên. Nếu không thì số các kết quả phù hợp trả về quá lớn và khó xử lý trong
trình soạn thảo ánh xạ.
Nhược điểm của Find Best Fit là bạn có thể bỏ sót một số các ánh xạ ứng viên rất
tốt. Nếu bạn không muốn bỏ sót những ứng cử viên này, đồng thời muốn có thể xử
lý được các kết quả, hãy gọi thực hiện khám phá Find Similar (tìm sự giống nhau)
với phạm vi hẹp ở phía nguồn và phạm vi hẹp rộng ở phía đích.
Gọi thực hiện khám phá các mối quan hệ bằng cách sử dụng Find Best Fit trả về
một kết quả phù hợp với điểm số cao nhất đối với cột nguồn đã chọn. Các kết quả
phù hợp khác, ngay cả khi chúng có cùng một điểm số phù hợp, sẽ tự động bị loại


Hình 15. Trình thủ thuật định phạm vi khám phá Find Similar 3. Các kết quả phù hợp sau đây được trả về:
WORK.Employee
100%
CONTACT.Employee
86%
CLIENT.Employee
72%
WORK.Employer
58%
WORK.Deployment
43%
4. Các điểm số phù hợp khác nhau của ba cột Employee là do các tên bảng
khác nhau của chúng (tỷ số phù hợp mức cha mẹ).

Hình 16. Các kết quả khám phá Find Similar Tạo ra một mô hình bảng chú giải thuật ngữ
Trong phần này, bạn sử dụng trình soạn thảo mô hình bảng chú giải thuật ngữ
(glossary model) của Kiến trúc sư Dữ liệu Rational để tạo ra một mô hình bảng
chú giải thuật ngữ. Mô hình này định nghĩa các từ bằng các chữ viết tắt và các từ
đồng nghĩa. Thông tin được sử dụng để tìm các kết quả phù hợp bổ sung thêm
trong phần kế tiếp.


7. Nhấn vào vào từ Client để chọn nó trong trình soạn thảo mô hình bảng chú
giải thuật ngữ. Trong khung nhìn Properties, chọn Synonyms, rồi nhấn vào
Add.

Hình 22. Thêm một từ đồng nghĩa với một từ đã cho 8. Đánh dấu chọn vào từ Customer và nhấn vào OK.

Hình 23. Chọn một từ đồng nghĩa 9. Lặp lại các bước 7 và 8 để thêm vào các mối quan hệ từ đồng nghĩa
Employee/Worker và Identifier/Number.
Phát hiện các ánh xạ bằng cách sử dụng các chữ viết tắt
Trong phần này, bạn sử dụng các chữ viết tắt từ mô hình bảng chú giải thuật ngữ
CompanyGlossary.ndm, để phát hiện các mối quan hệ.
1. Mở mô hình ánh xạ CompanyMapping.msl.
2. Nhấn chuột phải trong trình soạn thảo ánh xạ và chọn Discover
Relationships > Enterprise Naming Standard từ trình đơn ngữ cảnh.

Hình 24. Gọi trình thủ thuật Enterprise Naming Standard (tiêu chuẩn đặt tên
doanh nghiệp)


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status