Sử dụng infosphere data architect để định nghĩa và thi hành các tiêu chuẩn đặt tên đối tượng dữ liệugiới thiệu gần đây c - Pdf 32

Sử dụng InfoSphere Data Architect để định
nghĩa và thi hành các tiêu chuẩn đặt tên đối
tượng dữ liệu
Giới thiệu
Gần đây các tổ chức đã nhận ra tầm quan trọng của các tiêu chuẩn đặt tên trong việc quản lý dữ
liệu và bắt đầu thi hành chúng. Khi thi hành một tiêu chuẩn đặt tên, cần phải sử dụng các từ được
định nghĩa trong một bảng chú giải và thực hiện theo thứ tự của từ khi đặt tên một đối tượng dữ
liệu. IDA sẽ giúp những người dùng định nghĩa bảng chú giải và các tiêu chuẩn đặt tên đối tượng
dữ liệu của họ, làm cho việc tạo các tên đối tượng dễ dàng tuân theo các tiêu chuẩn đặt tên. Nó
tạo điều kiện thuận lợi cho việc chuyển đổi các tên đối tượng của mô hình logic thành các tên đối
tượng của mô hình vật lý và cho phép người dùng xác nhận hợp lệ các đối tượng dữ liệu của họ
để đảm bảo tuân thủ các tiêu chuẩn đặt tên của chúng.

Thay đổi tên sản phẩm
Ngày 16 tháng 12 năm 2008, IBM đã công bố rằng Phiên bản 7.5.1, Rational Data Architect
(Kiến trúc sư dữ liệu Rational) được đổi tên thành InfoSphere Data Architect nhằm đề cao vai trò
của nó trong các công cụ của nền tảng InfoSphere (InfoSphere Foundation).
Các tiêu chuẩn đặt tên được thi hành trong nhiều tổ chức để cung cấp một môi trường dữ liệu
thúc đẩy truyền thông tốt hơn và đưa ra quyết định am hiểu hơn cho cả các bên liên quan ở bên
trong lẫn bên ngoài. Các lợi ích của việc lập ra các tiêu chuẩn đặt tên đối tượng dữ liệu gồm có:




Thúc đẩy một sự hiểu biết chung về dữ liệu.
Thúc đẩy việc chia sẻ dữ liệu qua các ranh giới của tổ chức.
Giảm dư thừa dữ liệu thông qua việc hợp nhất các thành phần dữ liệu đồng nghĩa và
chồng chéo.

Các tiêu chuẩn đặt tên đối tượng dữ liệu
Một tiêu chuẩn, hay quy ước, đặt tên đối tượng dữ liệu mô tả cách tạo thành tên đối tượng dữ

Các quy tắc nội dung hoặc ngữ nghĩa học liên quan đến ý nghĩa cơ bản của các từ được
chọn làm tên đối tượng và cho phép tên đối tượng chuyển tải ý nghĩa đó. Có ba loại từ
đóng góp vào các nội dung của tên đối tượng dữ liệu: các từ gốc, các từ phân loại và các
từ bổ nghĩa (còn được gọi là các từ hạn định) như được mô tả trong Tiêu chuẩn đặt tên
thành phần dữ liệu.
Các từ gốc:
o
o
o
o

Trình bày khái niệm nghiệp vụ về dữ liệu nào đang được thu thập.
Mô tả vùng chủ đề của dữ liệu.
Một danh từ hoặc cụm từ danh từ mô tả chủ đề và tập trung chủ yếu vào tên.
Đặt các thành phần dữ liệu trong ngữ cảnh logic của mô hình thông tin.

Các ví dụ: Từ vay mượn, khách hàng, nhân viên, đặc tính
Các từ phân loại:
o
o
o

Xác định một thể loại hoặc phân loại riêng của dữ liệu.
Phác họa kiểu dữ liệu đang được mô tả bằng tên dữ liệu.
Mô tả phân loại chính của dữ liệu gắn liền với một thành phần dữ liệu.

Các ví dụ: Ngày, tổng số, tỷ lệ, số lượng, mã, chỉ số, tên, mô tả, ghi chú
Các từ hạn định:
o
o


Các ví dụ về đối tượng dữ liệu hợp lệ là:
o
o
o

EMPLOYEE NAME (PW CW)
EMPLOYEE LAST NAME (PW MOD CW)
PERMANENT EMPLOYEE LAST NAME (MOD PW MOD CW)

Một tên nghiệp vụ là một tên có ý nghĩa và giống như tiếng Anh được sử dụng để mô tả một đối
tượng dữ liệu. Các tên nghiệp vụ được sử dụng trong các mô hình dữ liệu dựa trên các khái niệm
hoặc lô-gic. Một tên truy cập hoặc tên kỹ thuật mô tả một đối tượng dữ liệu khi được biểu diễn
trong một cơ sở dữ liệu vật lý. Do các hệ thống quản lý cơ sở dữ liệu thường có các ràng buộc cụ
thể, bao gồm các ký tự và độ dài ký tự, cho các tên đối tượng, nên để sử dụng các chữ viết tắt và
dấu phân cách khác nhau cho các tên nghiệp vụ là rất phổ biến với các tên truy cập. Ví dụ, đối
tượng EMPLOYEE LAST NAME trong mô hình lô-gic được chuyển thành EMPL_LST_NM
trong mô hình vật lý.
Định nghĩa một tiêu chuẩn đặt tên bằng cách sử dụng IDA
Khi thi hành một tiêu chuẩn đặt tên, cần phải sử dụng các từ được định nghĩa trong một bảng chú
giải và thực hiện theo các thứ tự của từ khi đặt tên một đối tượng dữ liệu. IDA sẽ giúp người
dùng định nghĩa các tiêu chuẩn đặt tên đối tượng dữ liệu của họ. Để định nghĩa một tiêu chuẩn
đặt tên bằng IDA, bạn quy định các từ được chọn cho các tên đối tượng dữ liệu trong một mô
hình bảng chú giải và các mẫu từ khi sử dụng các sở thích về tiêu chuẩn đặt tên dữ liệu.
Tạo một mô hình bảng chú giải
Một mô hình bảng chú giải là một mô hình mô tả các từ được dùng, được phê duyệt và được chia
sẻ trong một tổ chức dùng cho các tên của đối tượng dữ liệu. Khi sử dụng một mô hình bảng chú
giải, bạn có thể định nghĩa tên, chữ viết tắt, chữ viết tắt thay thế, kiểu (gốc hoặc phân loại), nếu
có thể sử dụng nó như một từ bổ nghĩa, trạng thái và bản tóm tắt hoặc mô tả cho các từ. Các mô
hình bảng chú giải được lưu trữ trong các dự án thiết kế dữ liệu IDA. Bạn có thể chia sẻ một mô

Quy định một mẫu đặt tên
Phần thứ hai của một tiêu chuẩn đặt tên định nghĩa mẫu hoặc cấu trúc của một tên. Bạn có thể
quy định điều này bằng cách sử dụng các sở thích về tiêu chuẩn đặt tên dữ liệu. Các sở thích này
áp dụng cho tất cả các mô hình dữ liệu trong vùng làm việc của bạn.
Để thiết lập các sở thích cho các tiêu chuẩn đặt tên:
1. Nhấn vào Window > Preferences (Cửa sổ > Các sở thích) từ trình đơn chính.
2. Nhấn vào Data > Naming Standard (Dữ liệu > Tiêu chuẩn đặt tên).
3. Trên trang Logical, như trong Hình 3, hãy thiết lập mẫu cho các tên của đối tượng thực
thể và thuộc tính. Bạn có thể chỉ rõ liệu các từ gốc, các từ phân loại và các từ bổ nghĩa có


là tùy chọn không và thứ tự cần xuất hiện của các thành phần này. Bạn cũng có thể quy
định các ký tự dấu phân cách hợp lệ cho các đối tượng logic này. Theo mặc định, dấu
phân cách cho các đối tượng logic là một khoảng trống. Với IDA V7.0, bạn có thể chọn
<Title Case> làm dấu phân cách nếu tiêu chuẩn đặt tên của bạn đòi hỏi các tên có một
định dạng viết bằng chữ hoa, ví dụ như EmployeeLastName.
4. Trên trang Physical-Table/Column, hãy thiết lập mẫu cho các tên đối tượng bảng và cột
trong một mô hình vật lý. Bạn có thể quy định liệu các từ gốc, các từ phân loại và các từ
bổ nghĩa có là bắt buộc hay tùy chọn không và thứ tự cần xuất hiện của các thành phần
này. Bạn cũng có thể quy định các ký tự dấu phân cách hợp lệ cho các đối tượng vật lý.
Theo mặc định, dấu phân cách là một ký tự gạch dưới.
5. Trên trang Physical-Other, như trong Hình 4, hãy thiết lập mẫu tên cho các đối tượng vật
lý khác với các bảng và các cột, ví dụ, các khóa chính, các khóa ngoài, các ràng buộc
kiểm tra, các ràng buộc đáng lưu ý, các chỉ mục và các tri-gơ bằng cách thêm hoặc bớt
các biến và các chuỗi ký tự. Các mẫu đã định nghĩa trong trang này sử dụng các biến, ví
dụ như tên bảng và tên cột và không tham khảo các từ.
6. Trên trang Glossary (Bảng chú giải), hãy quy định một mô hình bảng chú giải mặc định.
Các mô hình bảng chú giải đã quy định ở đây được sử dụng cho các đối tượng cơ sở dữ
liệu hiển thị trong Database Explorer (Trình thám hiểm cơ sở dữ liệu).



Hộp thoại của mô hình phân tích nhắc nhở bạn chọn các quy tắc để dựa vào, như trong Hình 5.
Khi bạn chọn quy tắc tuân thủ tiêu chuẩn đặt tên, các mô hình bảng chú giải được bổ sung vào
các đặc tính của dự án khi tiêu chuẩn đặt tên dự án hiển thị trên trang tiếp theo của trình hướng
dẫn. Bạn có thể thêm hoặc bớt các mô hình chú giải vào lúc này và trang này sẽ được đồng bộ tự
động với trang các đặc tính của tiêu chuẩn đặt tên cho dự án. Khi bạn nhấn Finish, IDA lặp lại
tất cả các đối tượng đã bao gồm từ các lựa chọn của bạn và kiểm tra các tên của chúng để đảm
bảo rằng chúng sử dụng các từ và các mẫu đã định nghĩa trong tiêu chuẩn đặt tên của bạn. Ví dụ,
nếu mẫu đặt tên được định nghĩa là:
{PW} {MOD} {CW}
Và với employee, last và name là từ gốc, từ bổ nghĩa và từ phân loại đã định nghĩa trong mô hình
bảng chú giải, thì một đối tượng EMPLOYEE LAST NAME là một tên hợp lệ.

Hình 5. Hộp thoại của mô hình phân tích nhắc nhở người dùng chọn các quy tắc để dựa


vào

Nếu phát hiện ra bất kỳ sự vi phạm nào, chúng được hiển thị trong khung nhìn Problems (Vấn
đề), như trong Hình 6.

Hình 6. Các vi phạm tiêu chuẩn đặt tên được hiển thị là các cảnh báo trong khung nhìn


Problems

Dưới đây là một số ví dụ có tiêu chuẩn đặt tên bị vi phạm.


Một tên không đầy đủ:

Một từ bổ nghĩa, tùy chọn;
Một từ bổ nghĩa, tùy chọn;
Một từ phân loại, bắt buộc;
Một từ bổ nghĩa, tùy chọn;


Hình 7. Dấu hiệu trợ giúp nội dung hiển thị mẫu đặt tên

Dấu hiệu trợ giúp nội dung có sẵn cho các đối tượng dữ liệu để định nghĩa các tiêu chuẩn đặt tên
cho chúng như là một sự kết hợp của các sở thích về tiêu chuẩn đặt tên dữ liệu và các tệp mô
hình bảng chú giải.
Hiển thị các bảng chú giải trong danh sách thả xuống
Khi bạn biết mẫu để đặt tên một đối tượng, bạn cần chọn các từ trong mô hình bảng chú giải cho
phù hợp với mô hình. Bạn có thể sử dụng tổ hợp phím Ctrl+Space hoặc kiểu dấu phân cách để
xem một danh sách thả xuống với các từ, chữ viết tắt và các mô tả có sẵn, như trong Hình 8.

Hình 8. Trợ giúp nội dung hiển thị các từ và các đặc tính của chúng

Danh sách thả xuống được rút gọn khi người dùng gõ vào các chữ cái trong Hình 9.

Hình 9. Danh sách từ của trợ giúp nội dung được rút gọn khi người dùng gõ vào các chữ


cái

Khi bạn chọn một từ trong danh sách đó, nó sẽ được thêm vào làm một phần của tên.
Về đầu trang
Chuyển đổi các đối tượng dữ liệu từ mô hình logic sang mô hình vật lý bằng cách sử dụng tiêu
chuẩn đặt tên
Một mô hình dữ liệu logic định nghĩa các thực thể và các mối quan hệ giữa các thực thể mà

cột vật lý, trừ một thuộc tính được xác nhận cho một đặc tính miền đã định nghĩa đầu tiên
và cột tương ứng được đặt tên theo tên của đặc tính miền nếu được tìm thấy.

Ví dụ, một thuộc tính MESSAGE ORIGINATOR IDENTIFIER (Mã định danh của người tạo
thông báo) trong một mô hình logic được chuyển đổi thành một cột MSG_ORITR_ID trong mô
hình vật lý, ở đây, MSG, ORITR và ID là chữ viết tắt của MESSAGE, ORIGINATOR và
IDENTIFIER được định nghĩa trong mô hình bảng chú giải và các khoảng trống được thay thế
bằng cách các dấu gạch dưới.
Về đầu trang
Ví dụ về các tiêu chuẩn đặt tên thành phần của lực lượng bảo vệ bờ biển
Trong phần này, Các tiêu chuẩn đặt tên thành phần dữ liệu của Lực lượng bảo vệ bờ biển (Coast
Guard) được lấy làm ví dụ để giải thích việc sử dụng IDA để định nghĩa và thi hành các tiêu
chuẩn đặt tên. Coast Guard có một nhu cầu ngày càng tăng về chia sẻ dữ liệu qua các ranh giới tổ
chức và chức năng. Một hệ thống đa chức năng là một hệ thống thông tin hỗ trợ quá trình tổ chức
liên quan đến các hoạt động của một vài chương trình hoặc các đơn vị chức năng, chứ không
phải là hoạt động của một chương trình đơn lẻ. Các tiêu chuẩn đặt tên thành phần dữ liệu của
Coast Guard đã được phát triển và được thi hành để đáp ứng các nhu cầu trong quá trình phát
triển của các hệ thống đa chức năng này.
Bảng chú giải
Các tiêu chuẩn đặt tên yêu cầu một danh sách từ phân loại chính thức được phát triển, được duy
trì và được điều khiển chủ yếu bởi Người lãnh đạo. Do khối lượng các từ gốc cần thiết có khả
năng lên đến hàng ngàn từ, nên họ yêu cầu phát triển một danh sách từ gốc sơ bộ như là một
bảng từ vựng hạn chế để phối hợp và sử dụng trong toàn bộ tổ chức. Danh sách này có thể được
phát triển từ việc xem lại hoặc sàng lọc các từ đang xuất hiện trong các tên của các thành phần
dữ liệu đã định nghĩa trong các hệ thống dữ liệu hiện có. Các từ bổ nghĩa hay các từ hạn định
mẫu được liệt kê trong Các tiêu chuẩn đặt tên thành phần dữ liệu của Coast Guard. Các từ này có
thể được lưu trữ trong một mô hình bảng chú giải của IDA theo một số định dạng bằng cách sử
dụng một trình soạn thảo văn bản và sau đó sao chép và dán vào. Hình 10 hiển thị bảng chú giải
được tạo ra bằng cách sử dụng danh sách từ phân loại và các từ gốc và các từ bổ nghĩa mẫu của
Các tiêu chuẩn đặt tên thành phần dữ liệu của Coast Guard.

đặt trước từ phân loại trong một tên thành phần dữ liệu. Số lượng các từ tối thiểu trong
một tên thành phần dữ liệu là hai từ (từ gốc + từ phân loại) và số lượng các từ tối đa là
chín từ.

Những quy tắc này được giữ trong mục các sở thích về tiêu chuẩn đặt tên dữ liệu của IDA, như
trong Hình Hình 11.

Hình 11. Các sở thích về tiêu chuẩn đặt tên của Coast Guard

Kiểm tra sự tuân thủ tiêu chuẩn đặt tên
Khi định nghĩa các tiêu chuẩn đặt tên, quy tắc tuân thủ tiêu chuẩn đặt tên có thể được viện dẫn
cho bất kỳ các mô hình lô-gic hoặc mô hình vật lý nào như được mô tả trong phần Xác nhận hợp
lệ tuân thủ tiêu chuẩn đặt tên. Các thông báo cảnh báo hiển thị các tên đối tượng dữ liệu không
tuân thủ các tiêu chuẩn đặt tên; ví dụ, các tên sau:








Thiếu một từ phân loại.
Thiếu một từ gốc.
Không có một từ gốc trước một từ phân loại.
Có ít hơn hai từ.
Có nhiều hơn chín từ.

Quy tắc bắt buộc thi hành này được mô tả trong Các tiêu chuẩn đặt tên thành phần dữ liệu của
Coast Guard.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status