Các mẫu dịch vụ thông tin Phần 2: Mẫu hợp nhất dữ liệu - Pdf 11

Các mẫu dịch vụ thông tin
Phần 2: Mẫu hợp nhất dữ liệu

Tuyên bố giá trị của cách tiếp cận hợp nhất dữ liệu
Tính trong suốt của tính không đồng nhất bên dưới
Người dùng nhìn thấy chỉ một giao diện thống nhất. Ứng dụng khách hàng của
mẫu không cần biết về:
 Dữ liệu nguồn ban đầu được lưu trữ ở đâu (Tính trong suốt về vị trí).
 Các cơ sở dữ liệu nguồn hỗ trợ giao diện lập trình hoặc ngôn ngữ nào, ví dụ,
sử dụng XQuery hay SQL hoặc nguồn đó hỗ trợ ngôn ngữ SQL nào (Tính
trong suốt về thực hiện).
 Lưu trữ vật lý dữ liệu như thế nào (Tính độc lập của dữ liệu vật lý, sự phân
mảnh và tính trong suốt về bản sao).
 Sử dụng giao thức nối mạng nào (Tính trong suốt về mạng).
Hiệu năng và khả năng mở rộng quy mô
Mẫu hợp nhất dữ liệu tách nhiệm vụ tích hợp dữ liệu khỏi nhiệm vụ truy cập dữ
liệu. Việc truy cập cơ sở dữ liệu đích không đòi hỏi phải thi hành một quá trình
hợp nhất dữ liệu. Thông thường, theo lịch biểu quá trình hợp nhất sẽ xảy ra hàng
ngày, hàng tuần và v.v độc lập với việc truy cập của người dùng dữ liệu đích. Vì
dữ liệu cần thiết đã được thu gom tại một vị trí, nên có thể bảo đảm mức hiệu năng
và khả năng mở rộng quy mô cao nhất cho những người dùng dữ liệu.
Một phiên bản sự thật duy nhất
Cách tiếp cận này áp dụng các khả năng mạnh mẽ để giải quyết các xung đột khi
tích hợp dữ liệu từ các nguồn không đồng nhất. Sau đó các dịch vụ có thể rút ra từ
kho hợp nhất này và thỏa mãn các yêu cầu chất lượng dữ liệu cao.
Khả năng tái sử dụng
Sau khi áp dụng mẫu hợp nhất dữ liệu cho một kịch bản tích hợp cụ thể, có thể
cung cấp kết quả truy cập hợp nhất như là một dịch vụ cho nhiều người dùng dịch
vụ. Ví dụ, một kịch bản tích hợp có thể yêu cầu tích hợp thông tin tài chính từ rất
nhiều vùng. Khi áp dụng mẫu dữ liệu hợp nhất, dữ liệu khác nhau được hợp nhất
vào một nơi duy nhất, rồi được trưng ra thông qua một bảng tài chính. Sau đó có

kịch bản xử lý phân tích và báo cáo tài chính, đòi hỏi phải truy cập vào dữ
liệu phân tán trên nhiều nguồn. Chất lượng của các quyết định tùy thuộc vào
chất lượng và tính toàn diện của thông tin bên dưới. Do đó, dữ liệu phân tán
cần được tích hợp và tạo sẵn cho rất nhiều phân tích. Trong nhiều trường
hợp, cần thực hiện các ảnh chụp nhanh (bản sao) lịch sử để đánh giá xu
hướng qua một khoảng thời gian. Hợp nhất dữ liệu giúp cung cấp cho các
công ty chỉ một phiên bản sự thật duy nhất từ nhiều nguồn. Một kho dữ liệu
để hỗ trợ ra quyết định là một ví dụ điển hình về sử dụng một mẫu hợp nhất
dữ liệu.
 Quản lý dữ liệu chủ: Quản lý dữ liệu chủ nhằm mục đích tách thông tin chủ,
theo định nghĩa là các sự thật mô tả các thực thể nghiệp vụ cốt lõi, chẳng hạn
như khách hàng và sản phẩm, ra khỏi các ứng dụng riêng lẻ. Việc tạo ra dữ
liệu chủ này hoặc phiên bản sự thật duy nhất, được thực hiện thông qua một
tập hợp các quy tắc, các công nghệ và các giải pháp thường dùng để tạo ra
và duy trì dữ liệu nghiệp vụ nhất quán, đầy đủ, theo ngữ cảnh và chính xác
cho tất cả các bên liên quan đến thông tin đó. Động lực phía sau việc bắt đầu
quản lý dữ liệu chủ là một tình huống trong đó dữ liệu chủ lưu trú trong
nhiều hệ thống cô lập, được lưu trữ và duy trì theo các định dạng khác nhau,
dẫn đến không nhất quán và không đầy đủ ở một mức cao. Để tạo ra tập hợp
thông tin chính xác và nhất quán, có thể được quản lý trong một hệ thống
quản lý dữ liệu chủ trung tâm, cần thu gom dữ liệu, chuyển đổi chúng thành
mô hình dữ liệu chủ và hợp nhất vào kho chứa dữ liệu chủ.
Tất cả các kịch bản này đều chia sẻ một chủ đề chung:
 Phân phối thông tin nguồn trên nhiều hệ thống tự trị và không đồng nhất.
 Thông tin nguồn có thể tồn tại theo các định dạng không nhất quán hoặc
không đầy đủ.
 Áp dụng các quy tắc không nhất quán cho nguồn dữ liệu.
 Tính linh hoạt để thay đổi các nguồn thông tin và các định dạng khá hạn chế.
Dữ liệu nguồn phải được hợp nhất thành một dữ liệu đích tồn tại lâu bền để giải
quyết những thách thức trên bằng cách tích hợp dữ liệu thành một định dạng chung

Bus) đứng trung gian xử lý các thông điệp (yêu cầu và đáp ứng của dịch vụ) giữa
nhiều người tiêu dùng và nhà cung cấp dịch vụ thông tin, như minh họa trong Hình
2, do đó cho phép thực hiện dịch vụ một cách nhất quán và đúng chuẩn.

Hình 2. SOA truy cập vào dữ liệu hợp nhất

Để hỗ trợ thực hiện các dịch vụ tích hợp thông tin trong một SOA đòi hỏi có chức
năng bổ sung bao gọn việc truy cập thông tin trong một giao diện hướng dịch vụ.
Điều này được thực hiện thông qua thành phần information service enablement (hỗ
trợ dịch vụ thông tin). Mục đích của thành phần này là trưng ra dữ liệu hợp nhất
trong một giao diện hướng dịch vụ. Ví dụ, có thể lưu trữ dữ liệu xe nguyên chiếc
đã hợp nhất trong một cơ sở dữ liệu quan hệ. Qua thành phần hỗ trợ dịch vụ thông
tin, có thể trưng ra dữ liệu xe nguyên chiếc theo mô hình quan hệ này như là một
dịch vụ được định nghĩa bởi Service Component Architecture (SCA - Kiến trúc
thành phần dịch vụ) hay Web Services Definition Language (WSDL – Ngôn ngữ
định nghĩa dịch vụ Web) chẳng hạn. Rồi sau đó có thể chia sẻ dịch vụ để thực hiện
truy cập dữ liệu xe nguyên chiếc trong và ngoài doanh nghiệp.
Trường hợp sử dụng SOA thứ hai:
Trường hợp sử dụng SOA thứ hai minh họa một tình huống trong đó một người
dùng gọi ra quá trình hợp nhất. Theo truyền thống, quá trình hợp nhất chạy theo
một lịch biểu thời gian tương đối cố định, thông thường nhất là trong các cửa sổ
thời gian bảo trì, trên cơ sở hàng tuần hoặc hàng ngày. Việc hợp nhất được tách
khỏi quy trình nghiệp vụ thường chạy theo một lịch biểu thời gian ít cứng nhắc
hơn. Trong bối cảnh SOA, một bước nào đó trong một quy trình nghiệp vụ hoặc
một ứng dụng có thể gọi trực tiếp quá trình hợp nhất. Hai ví dụ về trường hợp sử
dụng này là:
 "Refresh my DataMart Now" có thể là một button có sẵn dành cho nhà phân
tích kinh doanh, người chỉ muốn cập nhật thông tin "khi cần đến". Việc làm
mới tự động sẽ gây ra nhiều vấn đề không lường trước bởi vì với dữ liệu tài
chính thì cần phải thực hiện việc phân tích đúng thời điểm. Các bản cập nhật


Hình 4. Hợp nhất dữ liệu kết hợp với việc xuất bản dữ kiện

Nhiều công ty gặp thách thức khi muốn quản lý hàng tồn kho có hiệu quả. Một
phần của vấn đề là thông tin liên quan đến hàng tồn kho nằm trong nhiều cơ sở dữ
liệu không đồng nhất. Tuy nhiên, để tối ưu hóa hàng tồn kho, thông tin này cần
truy cập theo cách tích hợp và nhất quán. Ví dụ, cần giải quyết vấn đề về cùng một
bộ phận phụ tùng lại có nhiều mã số khác nhau khi hợp nhất thông tin để truy cập
và phân tích hàng tồn kho. Một số thông tin liên quan đến hàng tồn kho sẽ liên tục
thay đổi ví dụ, với các sản phẩm có nhu cầu cao trong khi dữ liệu khác lại
không thay đổi. Tình trạng này đòi hỏi phải hợp nhất thông tin phân tán, không
đồng nhất và liên tục thay đổi vào một kho lưu trữ duy nhất.
Việc xuất bản dữ kiện và "việc cấp từ từ" dữ liệu đến một kho lưu trữ dữ liệu đích
là một bối cảnh quan trọng khác để áp dụng mẫu hợp nhất dữ liệu. Có một số động
lực chính để sử dụng phương pháp này là:
 Các hệ thống dữ liệu đích được đồng bộ hóa với các nguồn theo cách gần
thời gian thực. Điều này có thể quan trọng đối với các ứng dụng hỗ trợ ra
quyết định hoặc các hệ thống vận hành hợp tác. Những người dùng hệ thống
dữ liệu đích thấy kết quả ngay lập tức.
 Mẫu này ngăn ngừa sự cần thiết phải có các quá trình quét lâu dài các hệ
thống nguồn trong cửa sổ thời gian xử lý theo từng gói. Các quá trình quét
như vậy có thể làm giảm hiệu năng của nguồn, ảnh hưởng đến các ứng dụng
khác.
 Chỉ có thông tin "thay đổi" được gửi qua mạng và trải qua các quá trình
chuyển đổi toàn diện, nhờ đó làm giảm gánh nặng cho mạng và các hệ thống
thực hiện thao tác.
Về đầu trang
Đặt vấn đề
Những người dùng SOA yêu cầu một dịch vụ cần phải truy cập thông tin từ nhiều
nguồn không đồng nhất. Các nguồn đã được thiết kế, phát triển và tiến hóa độc lập,

Cách tiếp cận hợp nhất dữ liệu có ba giai đoạn chính. Trong giai đoạn đầu tiên máy
chủ hợp nhất thành phần thực hiện mẫu hợp nhất dữ liệu thu gom (hoặc "trích
ra") dữ liệu từ các nguồn. Tiếp theo, tích hợp và chuyển đổi dữ liệu nguồn cho phù
hợp với mô hình dữ liệu đích, có thể trong nhiều hoạt động. Cuối cùng, máy chủ
hợp nhất áp dụng dữ liệu đã chuyển đổi cho kho lưu trữ dữ liệu đích.
Quá trình này có thể chạy (lặp lại) theo một lịch biểu thời gian hoặc có thể gọi nó
(nhiều lần) như là một dịch vụ từ một quy trình nghiệp vụ hay bất kỳ người dùng
dịch vụ nào khác. Sau khi nạp vào hoặc làm mới dữ liệu tích hợp trong mô hình dữ
liệu đích, có thể trưng ra thông tin hợp nhất như là một dịch vụ cho những người
dùng.
Các đặc điểm thời gian thiết kế
Nhiệm vụ trọng tâm trong thời gian thiết kế là chỉ rõ luồng dữ liệu từ các nguồn tới
đích đó là, làm thế nào để tái cấu trúc và sáp nhập các mô hình nguồn vào mô
hình đích. Giả định rằng khi áp dụng mẫu hợp nhất dữ liệu, quản trị viên hoặc nhà
phát triển luồng dữ liệu đã có một sự hiểu biết chi tiết về các giao diện truy cập có
sẵn tới các nguồn, ngữ nghĩa và tính đúng đắn của mô hình dữ liệu nguồn và những
ràng buộc về tính toàn vẹn của nó. Cũng giả định rằng mô hình dữ liệu đích đã
được định nghĩa. Nếu các giả định ấy không đúng, cần phải kết hợp mẫu hợp nhất
với các cách tiếp cận khác, chẳng hạn như lược tả dữ liệu và mô hình hóa dữ liệu,
để giải quyết những vấn đề còn để mở này.
Dựa trên những giả định đó, nhà phát triển định nghĩa tập hợp các hoạt động có thể
chuyển đổi dữ liệu nguồn thành dữ liệu đích tương ứng với các mô hình nguồn và
mô hình đích. Các việc thực hiện mẫu này thay đổi trong phạm vi của các hoạt
động chuyển đổi được hỗ trợ và những hoạt động đó có thể mở rộng ra sao. Nhiều
việc thực hiện hướng tới sử dụng một tập hợp các hoạt động tiêu biểu nhất, chẳng
hạn như tra tìm, các phép nối và các bộ lọc. Nhiều việc thực hiện bổ sung tạo ra
các cơ cấu mạnh mẽ để mở rộng tập hợp các hoạt động này cho các nhu cầu riêng
của khách hàng hay đặc trưng cho dự án. Khi sử dụng những khả năng của hoạt
động này trong giai đoạn thiết kế, có thể định nghĩa luồng dữ liệu (có nghĩa là,
chuỗi các hoạt động chuyển đổi và xử lý dữ liệu đó). Rồi triển khai đặc tả luồng dữ

Một khi cấu trúc dữ liệu đã xử lý phù hợp với mô hình đích, máy chủ hợp nhất áp
dụng dữ liệu cho mô hình đích, có thể sử dụng lại một lần nữa các đầu nối đặc
trưng cho mô hình đích.
Mặc dù một máy chủ hợp nhất có thể xử lý các bản ghi duy nhất, hầu hết các việc
thực hiện đều được nhắm vào việc di chuyển một số lượng lớn dữ liệu từ nhiều
nguồn khác nhau tới một hoặc nhiều mô hình đích. Việc này thường được gọi là di
chuyển dữ liệu gói. Một số sản phẩm thực hiện mẫu này đã khai thác chế độ song
song để xử lý dữ liệu hiệu quả hơn.
Về đầu trang
Những việc cần xem xét
Khi áp dụng mẫu hợp nhất dữ liệu, điều quan trọng cần hiểu xem mẫu đó ảnh
hưởng đến các yêu cầu phi chức năng sau đây như thế nào.
Bảo mật dữ liệu
Cấu hình bảo mật trong cơ sở dữ liệu đích các dịch vụ được định nghĩa trên đó
là độc lập với các nguồn. Như chúng ta đã đề cập trước đây, mẫu này thường được
áp dụng để di chuyển dữ liệu trong chế độ theo gói/theo nhóm từ các nguồn tới cơ
sở dữ liệu đích. Quá trình này thường được áp dụng cho tập hợp dữ liệu đầy đủ
trong các nguồn có nghĩa là, không có các hạn chế nào về bảo mật. Thông
thường, cơ sở dữ liệu đích được tạo ra khi áp dụng mẫu hợp nhất lần đầu tiên, do
đó không có sẵn bất kỳ việc kiểm soát quyền truy cập nào và có thể cần định nghĩa
việc kiểm soát này. Mỗi nguồn dữ liệu có thể có những hạn chế bảo mật của riêng
mình, có thể cần phải giải quyết những hạn chế đó để cho phép truy cập và lấy ra
dữ liệu một cách thích hợp.
Do tính chất không đồng nhất và phân tán của môi trường này, nên có một số thách
thức liên quan đến việc đăng nhập một lần và kiểm soát truy cập chung có thể phát
sinh nằm ngoài phạm vi của mẫu hợp nhất dữ liệu. Để giải quyết những thách thức
đó, các kiến trúc sư sẽ cần kết hợp mẫu hợp nhất dữ liệu với các mẫu liên quan đến
bảo mật.
Độ trễ của dữ liệu
Thông thường, độ trễ của dữ liệu hoặc sự lưu thông của dữ liệu phụ thuộc vào chu

yêu cầu dịch vụ với dữ liệu đích.
Tính sẵn dùng của dữ liệu
Tính sẵn dùng của dữ liệu tích hợp trong hệ thống đích chỉ phụ thuộc vào tính sẵn
sàng của hệ thống đích, chẳng hạn như một cơ sở dữ liệu. Quá trình hợp nhất dữ
liệu và điền nó vào hệ thống đích được tách ra khỏi luồng yêu cầu khi một người
dùng truy cập dữ liệu trong hệ thống đích. Theo quan điểm của người dùng, việc
truy cập dữ liệu hợp nhất trong hệ thống đích có các đặc điểm về tính sẵn dùng
giống như khi truy cập bất kỳ dữ liệu nào khác trong hệ thống này. Vì vậy, có thể
áp dụng bất kỳ các cách tiếp cận nào để làm tăng tính sẵn dùng của dữ liệu trong
lúc kết hợp với mẫu hợp nhất dữ liệu. Do sự hợp nhất dữ liệu chỉ có một đích duy
nhất, nên việc áp dụng công nghệ để cải thiện tính sẵn dùng tương đối dễ dàng
như việc phân cụm chẳng hạn. Mẫu này là một cách tiếp cận được ưa thích nếu bắt
buộc dữ liệu phải có tính sẵn dùng cao.
Ảnh hưởng của các thay đổi mô hình đến mô hình tích hợp
Khi thay đổi bất kỳ trong số các mô hình nguồn nào, đặc tả luồng dữ liệu và có lẽ
cả mô hình đích sẽ cần được điều chỉnh. Nếu cần sửa đổi mô hình đích, thì dữ liệu
đích sẽ cần được điều chỉnh cho phù hợp. Tùy thuộc vào các thay đổi cần thiết,
việc này có thể có ảnh hưởng rất ít hoặc rất nhiều đến tính sẵn sàng của dịch vụ.
Tần suất thực hiện giao dịch
Tần suất của các yêu cầu dịch vụ đối với cơ sở dữ liệu đích hợp nhất chỉ được xác
định bằng khả năng của cơ sở dữ liệu đích và thành phần hỗ trợ dịch vụ thông tin
để xử lý những yêu cầu đó. Do cơ sở dữ liệu đích được tạo ra chuyên để hỗ trợ
những yêu cầu dịch vụ đó, nên mẫu này là một cách tiếp cận ưa thích cho các yêu
cầu thực hiện giao dịch rất thường xuyên.
Khả năng của chính máy chủ hợp nhất để chạy một giao dịch chuyển dữ liệu ở tốc
độ cao được xác định bằng tốc độ mà máy chủ hợp nhất có thể truy cập các hệ
thống nguồn và các hệ thống nguồn có thể đáp ứng để cung cấp dữ liệu. Do cách
tiếp cận tách rời mà chúng ta đã thảo luận ở trên, điều này không ảnh hưởng đến
tần suất có thể thực hiện các yêu cầu dịch vụ đối với cơ sở dữ liệu đích.
Sự tương tranh của giao dịch

Tuy nhiên, người ta thường áp dụng mẫu này khi các nguồn dữ liệu có sự khác biệt
đáng kể về cấu trúc dữ liệu cần được tích hợp. Điều này có thể yêu cầu cải tiến
nhiều vòng đặc tả luồng dữ liệu và áp dụng đặc tả đó trong các môi trường thử
nghiệm để chứng minh tính đúng đắn. Các công ty có thể trải nghiệm các chu kỳ
phát triển tương đối dài khi áp dụng cách tiếp cận này không phải do các đặc
điểm của cách tiếp cận này mà do các đặc điểm của vấn đề.
Tập hợp kỹ năng và kinh nghiệm
Hầu hết các việc thực hiện hiện có của mẫu hợp nhất đều có một cách tiếp cận
dùng công cụ, đòi hỏi phải có kiến thức đặc trưng về sản phẩm khi định nghĩa ánh
xạ. Các nhà phát triển cần hiểu rõ các cách tiếp cận riêng của sản phẩm này. Họ
cũng cần có kiến thức về các khái niệm cơ sở dữ liệu hoặc kinh nghiệm của Quản
trị viên cơ sở dữ liệu (DBA) để hiểu các hậu quả đối với cơ sở dữ liệu nguồn và cơ
sở dữ liệu đích khi thiết kế giải pháp này. Khi trưng ra thông tin tích hợp như là
các dịch vụ, các nhà phát triển cũng cần hiểu các khái niệm, các tiêu chuẩn và các
công nghệ SOA.
Khả năng tái sử dụng
Có thể sử dụng lại logic và siêu dữ liệu đã dùng để định nghĩa truy cập và tổng hợp
dữ liệu trên các dự án khác nhau.
Chi phí về bảo trì nhiều nguồn dữ liệu
Sau khi hợp nhất dữ liệu, có thể hoặc giữ nguyên các nguồn dữ liệu ban đầu hoặc
rút bỏ các nguồn một khi đã di chuyển dữ liệu đến hệ thống đích trong trường hợp
di trú dữ liệu. Như đã mô tả trong các trường hợp sử dụng (phần Bối cảnh), hệ
thống đích mới này thường đáp ứng các yêu cầu nghiệp vụ bổ sung như cung cấp
một phiên bản sự thật duy nhất và sự hiểu biết thêm. Khi sử dụng mẫu này để di trú
khỏi (có nghĩa là thay thế) các hệ thống di sản hiện có, việc di chuyển và có thể
là việc hợp nhất dữ liệu chỉ là một bước trong toàn bộ quá trình di trú. Toàn bộ
quá trình di trú cũng cần giải quyết việc di trú của logic nghiệp vụ và logic ứng
dụng, chẳng hạn. Mặc dù mẫu hợp nhất dữ liệu không thể một mình giải quyết vấn
đề di trú ứng dụng, nhưng nó là một thành phần quan trọng theo nghĩa là nó có thể
di chuyển dữ liệu từ hệ thống di sản sang nền tảng tương lai. Sau khi đã hoàn thành

Sử dụng tài nguyên
Máy chủ hợp nhất sử dụng tài nguyên đó là, năng lực xử lý trên máy chủ hợp
nhất, máy chủ nguồn và dung lượng mạng khi nó di chuyển dữ liệu từ các nguồn
đến đích. Sự phức tạp của các chuyển đổi, số lượng các nguồn cần được truy cập
và khối lượng dữ liệu cần được xử lý sẽ xác định mức sử dụng tài nguyên.
Các khả năng chuyển đổi
Việc thực hiện mẫu hợp nhất cần xử lý nhu cầu giải quyết hầu như bất kỳ sự khác
biệt nào về cấu trúc giữa dữ liệu nguồn và dữ liệu đích. Một kết quả quan trọng của
các chuyển đổi rất phức tạp là một quá trình di chuyển dữ liệu bị kéo dài do việc
xử lý chuyển đổi phức tạp.
Kiểu mô hình nguồn, các giao diện, các giao thức
Hợp nhất dữ liệu giải quyết vấn đề tích hợp dữ liệu từ các mô hình nguồn không
đồng nhất và đưa vào các kỹ thuật để ánh xạ các mô hình nguồn khác nhau đó vào
mô hình chung ở đích. Các việc thực hiện sản phẩm của mẫu hợp nhất dữ liệu thay
đổi khác nhau tùy theo phạm vi các mô hình nguồn mà chúng có thể tích hợp,
nhưng chủ yếu là, mẫu hợp nhất dữ liệu loại bỏ sự phức tạp của các mô hình
nguồn, các giao diện và các giao thức sao cho các nhà phát triển chỉ cần quan tâm
đến một mô hình, một giao diện và một giao thức mà thôi.
Phạm vi / kích cỡ của các mô hình nguồn
Kích cỡ của các mô hình nguồn, số lượng và kiểu của các thuộc tính và sự phức tạp
của định nghĩa chuyển đổi có thể tốn nhiều thời gian của các nhà phân tích, kiến
trúc sư và người triển khai thực hiện. Những yếu tố này có thể ảnh hưởng đến thời
gian cần thiết để thực hiện mẫu này cũng như thời gian và tài nguyên để thực hiện
hợp nhất. Các hướng dẫn thực hành để định nghĩa và điều chỉnh quy mô của dự án
tiêu chuẩn cần giải quyết mức độ phức tạp gắn liền với các phép chuyển đổi dữ
liệu khi đánh giá sự nỗ lực, khoảng thời gian và chi phí liên quan đến thực hiện dự
án.
Ảnh hưởng của tải công việc của máy chủ hợp nhất (khối lượng giao dịch) đến các
nguồn
Cần thực hiện một phân tích ảnh hưởng trên các hệ thống nguồn để hiểu rõ ảnh

xuyên dữ liệu nguồn. Nếu người dùng hiếm khi cần truy cập thông tin tích hợp
này, thì cách tiếp cận này có thể không có hiệu quả kinh tế như các cách tiếp cận
khác và có thể không phân phối dữ liệu cập nhật như một ứng dụng được trông
đợi.
Về đầu trang
Bản đồ sản phẩm
Các sản phẩm sau đây của IBM thực hiện mẫu này:
 Ấn bản doanh nghiệp IBM® WebSphere® DataStage (cũng là một phần của
sản phẩm trong danh mục WebSphere Data Integration Suite - Bộ tích hợp
WebSphere và cũng là một phần của sản phẩm trong danh mục IBM
Information Server - Máy chủ thông tin của IBM) là một nền tảng tích hợp
dữ liệu khối lượng lớn dùng để làm sạch, chuyển đổi và bố trí lại dữ liệu.
Luồng dữ liệu phức tạp trong WebSphere DataStage được phát triển bằng
cách sử dụng một mẫu hình đồ họa hướng-"luồng dữ liệu" để thúc đẩy việc
tái sử dụng và nâng cao năng suất của nhà phát triển. Các khả năng xử lý
song song, chẳng hạn như hỗ trợ cho phân vùng lại động, các cơ sở dữ liệu
song song và các cấu hình lưới, cho phép WebSphere DataStage thao tác số
lượng lớn dữ liệu trong các khung thời gian ngắn. Các nguồn và các đích
gồm có các hệ thống quản lý cơ sở dữ liệu quan hệ, các hệ thống ERP, hệ
thống máy tính lớn kế thừa, XML và các định dạng dữ liệu độc quyền. Nền
tảng mở rộng dựa vào websphere DataStage chạy trên các môi trường
UNIX, Windows, Linux và zSeries và nó bao gồm một tầng siêu dữ liệu
toàn diện để quản lý và kiểm soát các quy tắc nghiệp vụ dùng cho việc quản
trị dữ liệu nâng cao và theo dõi thực thể.
 WebSphere Information Services Director - Giám đốc Các dịch vụ thông tin
WebSphere (cũng là một phần của sản phẩm trong danh mục IBM
Information Server ) trưng ra các khả năng quản lý thông tin như là các dịch
vụ. Nó đóng gói thông tin logic tích hợp, các quy tắc làm sạch, truy cập
thông tin v.v như là các dịch vụ. Điều này cách ly nhà phát triển ra khỏi nhà
cung cấp bên dưới của chức năng này. Liên quan nhiều nhất với bài viết này


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status