Xét lại chuẩn hóa dữ liệu, Phần 1: Lịch sử của các hồ sơ kinh doanh potx - Pdf 11

Xét lại chuẩn hóa dữ liệu, Phần 1: Lịch sử của các hồ
sơ kinh doanh
Giới thiệu
Bài này mô tả sự thay đổi vai trò của việc chuẩn hóa dữ liệu [30] trong các hệ thống thương mại.
Từ những năm 1970, khi người ta đã định nghĩa chuẩn hóa hóa dữ liệu, các công nghệ và các hệ
thống máy tính và các ứng dụng của chúng đã phát triển đáng kể. Đặc biệt vào những năm 1970,
các cấu trúc dữ liệu đã ổn định, dung lượng đĩa còn bị hạn chế rất nhiều và thông tin kinh doanh
chỉ trên giấy tờ. Con người và các thiết bị vào-ra rất cần để chuyển dịch văn bản giấy tờ thành
một dạng mà máy tính có thể đọc, ví dụ, các bìa đục lỗ. Các máy tính lớn thuộc sở hữu của các tổ
chức lớn như các ngân hàng đã có 512K bộ nhớ và chi phí gần 2.000.000 Đô la Mỹ. Một tổ chức
lớn đã có dung lượng đĩa 10 MB cho tất cả các hệ thống máy tính và dữ liệu của mình. Trong
những năm 1970, cơ sở hạ tầng Internet chỉ mới bắt đầu được tạo ra còn Mạng toàn cầu (World
Wide Web) đã có cách đó hơn mười năm rồi.
Vì dung lượng đĩa còn bị hạn chế nhiều, nên người ta giả định rằng chỉ có thông tin thông dụng
nhất mới được lưu trữ và được tạo sẵn cho các ứng dụng. Việc chuẩn hóa đảm bảo rằng mỗi
mảnh dữ liệu, như tên, địa chỉ hoặc thông tin đặt hàng, xuất hiện đúng một lần trên đĩa để tránh
các dị thường dữ liệu và bảo tồn dung lượng. Thông thường, dữ liệu đã chuẩn hóa chỉ tồn tại
trong các hệ thống máy tính và không phù hợp với việc biểu diễn dữ liệu kinh doanh ban đầu.
Trong thế kỷ 21, các dữ liệu kinh doanh hầu như luôn luôn được tạo ra ở dạng số, như một thông
báo đơn đặt hàng dưới dạng một yêu cầu dịch vụ web. Do đó, việc chuẩn hóa dữ liệu ngụ ý rằng
việc biểu diễn một hồ sơ kinh doanh dưới dạng số hiện có được chia nhỏ để lưu trữ trong một cơ
sở dữ liệu và sau đó được khôi phục lại để trình bày và sử dụng các hồ sơ kinh doanh.
Trong bài này, thuật ngữ "hồ sơ kinh doanh" được sử dụng với nghĩa là thông tin có thể được
chia sẻ giữa hai hoặc nhiều bên hoặc nhiều thành phần, như một đơn đặt hàng, một phiếu thu,
một giấy báo nợ, một giao dịch tài chính, một chuyển khoản ngân hàng, một chính sách bảo
hiểm, một email, một hồ sơ bệnh nhân, một bản ghi nhật ký, một phép đo, một sự kiện được ghi
lại, một chính sách hoặc sắc lệnh bắt buộc và v.v
Các giả định mà mô hình quan hệ dựa vào đã thay đổi. Ngày nay, nhiều hệ thống và cấu trúc
thông tin không còn đơn giản và cố định nữa mà phức tạp và chúng thay đổi nhanh chóng. Trong
thế giới ngày nay, việc chuẩn hóa là một quá trình có thể hoạt động như một chất ức chế cho cả
việc phân phối của các hệ thống linh hoạt lẫn việc phân phối linh hoạt của các hệ thống.

đánh dấu làm bằng chứng. Rồi các cây gậy này được lưu trữ và giữ nguyên. Gậy đếm kiểm đã
chia được chính phủ Anh sử dụng liên tục cho đến năm 1826 để quản lý thuế. Các kho gậy đếm
kiểm được lệnh tiêu huỷ bằng cách đốt vào năm 1834 khi các phương thức ghi âm hiện đại hơn
đã được giới thiệu [ 5].
Giấy và trong thời gian trước đó là giấy cói và giấy da [ 6], đã ngày càng được sử dụng qua nhiều
thế kỷ cho đến cuối thế kỷ 20 để ghi lại các thỏa thuận kinh doanh, các hóa đơn bán hàng, các
hợp đồng và các tài liệu quan trọng khác. Thông thường, các hồ sơ đã được ký kết và đôi khi
được đóng dấu bằng sáp ong với các nhãn hiệu của các nhà buôn liên quan. Các phương pháp
như kế toán kép đã được giới thiệu trong thế kỷ 15. Các thư ký và những người chép thuê đã hỗ
trợ các nhà buôn khi công việc giấy tờ tăng lên. Khi các máy tính được đưa vào sử dụng thương
mại trong thế kỷ 20, các doanh nghiệp bắt đầu tin học hóa các hệ thống của mình – với yêu cầu
chuyển đổi các hồ sơ giấy tờ của thế giới thực sang một cách biểu diễn để các máy tính có thể
hiểu được [ 7].
Trước khi đưa vào các máy tính, nguyên tắc chính của việc lưu giữ hồ sơ là chụp ảnh và duy trì
một bản sao thông tin chính xác đã được trao đổi giữa các bên liên quan trong một giao dịch.
Thường thì các hồ sơ đã được ký kết hoặc đánh dấu theo một cách nào đó và được lưu trữ "như
nó vốn có" cho các nhu cầu trong tương lai. Các quy tắc chi phối việc lưu trữ và xử lý các hồ sơ
và các hợp đồng kinh doanh đã tồn tại trong suốt lịch sử.
Lưu giữ hồ sơ trong các hệ thống máy tính
Phần này mô tả môi trường trong đó các hệ thống cơ sở dữ liệu đã được giới thiệu vào nửa sau
của thế kỷ hai mươi và mục đích chính của các hệ thống đó.
Khi các hệ thống máy tính số đã được đưa vào để hỗ trợ các doanh nghiệp thương mại trong
những năm 1950 và 1960, các hồ sơ đầu tiên được lưu trữ trên các bìa giấy đục lỗ [8], mà người
ta cũng đã thường sử dụng bìa này cho đầu vào và đầu ra. Những người sử dụng gõ nội dung của
các hồ sơ giấy, biểu thị các giao dịch kinh doanh, vào các bìa, sao cho máy tính có thể đọc và sử
dụng thông tin đó (Hình 1). Dữ liệu được lưu trữ và được xử lý bên trong hệ thống máy tính
không còn phù hợp với giao dịch kinh doanh thực sự trên giấy, mặc dù nó có thể phù hợp với
cách nhập dữ liệu vào máy tính trong thời đại bìa đục lỗ.

Hình 1. Nhân viên nhập dữ liệu vào những năm 1950

năm 1970 và 1980 và đã được chuyển đổi, thường là bằng các máy quét hoặc do những người sử
dụng gõ lại các biểu mẫu. Việc chia nhỏ dữ liệu kinh doanh điển hình theo các nguyên tắc chuẩn
hóa dữ liệu [ 16][ 17] tiếp tục được dạy và được sử dụng trong thế kỷ 21 để giảm thiểu việc sao
chép và các dị thường dữ liệu.
Vào lúc các khái niệm về các cơ sở dữ liệu quan hệ đã được xác định, một thiết bị lưu trữ đĩa phổ
biến là 3330 model 11 có dung lượng 200 MB và giá mua thiết bị này dao động từ $ 74.000 đến
$ 87.000 (giá Đô la năm 1970) [ 19]. Khi các cơ sở dữ liệu quan hệ bắt đầu giảm bớt vào những
năm 1980, một đĩa rất phổ biến là 3380. Nó có kích thước bằng một tủ quần áo và có dung lượng
lưu trữ 1,2 GB với chi phí trên $ 200.000 [ 20]. Vì thế, 1MB dung lượng lưu trữ đĩa có giá trên
$160 (giá Đô la năm 1970), tương đương với hàng ngàn đô la vào năm 2010 [ 21].
Thông thường, các hệ thống cơ sở dữ liệu quan hệ đã không giữ thông tin bảo mật liên quan đến
các chữ ký và thường chứa bất kỳ mảnh thông tin nào đúng một lần – chỉ phiên bản mới nhất,
khiến cho việc thực hiện kiểm tra trở nên khó khăn. Điều sớm đã trở nên rõ ràng là cần lưu trữ
các bản sao của các hồ sơ kinh doanh thế giới thực, ví dụ để có thể thực hiện kiểm tra các chính
sách bảo hiểm và các khiếu nại có liên quan trong trường hợp tranh chấp. Các hệ thống tài liệu
cũng cần tuân theo các quy tắc đòi hỏi các dữ liệu kinh doanh được lưu trữ với một số năm nhất
định. Một thể loại phần mềm mới, được gọi là Hệ thống quản lý tài liệu doanh nghiệp (Enterprise
Document Management Systems) [ 23], được phát triển vào cuối những năm 1980 để lưu trữ các
hình ảnh của các hồ sơ giấy tờ. Các hệ thống này đã được tách khỏi các cơ sở dữ liệu đã lưu trữ
dữ liệu giống như trong các bảng quan hệ. Trong thế kỷ 21, Quản lý tài liệu doanh nghiệp được
gọi là Quản lý nội dung doanh nghiệp [ 24].
Nguyên tắc chính về lưu giữ hồ sơ trong các máy tính trong thế kỷ XX đã giới thiệu một kiểu lưu
trữ phù hợp với cách mà các máy tính làm việc, để lưu trữ bất kỳ mục dữ liệu cụ thể nào đúng
một lần, giảm thiểu lưu trữ. Nếu cần một bản sao chính xác của hồ sơ giấy tờ thực thế giới, thì
người ta đã xây dựng các hệ thống riêng biệt để thực hiện chính xác điều đó, làm cho dữ liệu
giống nhau được lưu trữ nhiều lần. Các quy tắc để quản lý lưu trữ và xử lý các hồ sơ vẫn tiếp tục
tăng lên.
Quá trình chuẩn hóa dữ liệu
Phần này mô tả mục đích và các ảnh hưởng của quá trình chuẩn hóa dữ liệu lần đầu tiên được
giới thiệu vào năm 1970 với các dạng chuẩn tắc hơn được giới thiệu suốt những năm 1970.

lưu trữ những hồ sơ này dưới dạng ban đầu của chúng làm cho việc sử dụng và hiểu chúng dễ
dàng khi lấy chúng ra khỏi nơi lưu trữ. Các lý do tương tự đang áp dụng hiện nay để lưu trữ các
hồ sơ kinh doanh số thế giới thực dưới dạng chưa chuẩn hóa sẽ được thảo luận sau trong bài này.
Khi việc sử dụng các hồ sơ giấy tăng lên nhanh chóng trong thế kỷ 19 và 20, không gian lưu trữ
đã trở thành một vấn đề đối với một số thư viện và các kho tư liệu. Điều này đã kích thích phát
minh ra vi phim và tấm vi phim để giảm không gian lưu trữ cần thiết xuống giữa 0,25% và 3%
so với vật liệu ban đầu [ 25]. Tuy nhiên, đây chỉ là một hình thức nén mà không biểu diễn thông
tin theo một cách khác dựa trên khái niệm. Tương tự như vậy, hiện nay có thể áp dụng việc nén
số để làm giảm tiêu dùng dung lượng lưu trữ của các hồ sơ kinh doanh không chuẩn hóa.
Do chi phí lưu trữ cao, nên chuẩn hóa dữ liệu biểu diễn các hồ sơ kinh doanh trong các máy tính
bằng cách chia nhỏ hồ sơ thành nhiều phần, đôi khi hàng trăm phần và tái tạo lại chúng khi cần
thiết. Cần có các khóa nhân tạo và các chỉ mục liên quan để liên kết các phần của một hồ sơ duy
nhất với nhau. Điều này trái ngược hẳn với các hệ thống lưu giữ hồ sơ trước đó (các viên đá, các
gậy đếm kiểm, giấy v.v ) đã lưu giữ hồ sơ kinh doanh như nó vốn có. Các cách biểu diễn chuẩn
hóa làm cho việc hiểu các hồ sơ kinh doanh trở nên khó khăn hơn nhiều và tăng thêm các chi phí
để chia nhỏ và ghép chúng lại.
Quá trình không chuẩn hóa
Phần này mô tả các tình huống mà ở đó việc không chuẩn hóa đã trở thành cách thực hiện phổ
biến. Các lược đồ cơ sở dữ liệu cho các kho dữ liệu là một ví dụ và các kho lưu trữ dữ liệu có
khả năng mở rộng mới như Google BigTable [ 47] và HBase [ 49] là các ví dụ khác.
Chuẩn hóa có hai nhược điểm cố hữu. Đầu tiên, các hồ sơ kinh doanh phức tạp thường dẫn đến
một số lượng lớn các bảng quan hệ trong một lược đồ cơ sở dữ liệu đã chuẩn hóa, làm cho việc
biểu diễn dữ liệu khó hiểu. Kết quả là, việc viết các truy vấn có thể yêu cầu nhiều liên kết và trở
nên ngày càng phức tạp [ 46]. Thứ hai, số lượng lớn các liên kết có tiềm năng gây bất lợi cho hoạt
động phục hồi dữ liệu. Việc không chuẩn hóa các bảng đã chuẩn hóa hoặc việc sử dụng một thiết
kế không chuẩn hóa có thể trực tiếp giải quyết những vấn đề này.
Không chuẩn hóa trong các kho dữ liệu
Do dung lượng của các thiết bị điện toán và lưu trữ đã tăng lên trong những năm 1980 và 1990,
trong khi chi phí đã giảm xuống, các công ty đã có thể có đủ khả năng tích lũy và phân tích khối
lượng dữ liệu kinh doanh lịch sử lớn hơn, như các hồ sơ bán hàng, trong các kho dữ liệu. Để có

hóa vẫn thường thích hợp cho các ứng dụng OLTP chuyên sâu về cập nhật. Tuy nhiên, nhu cầu
chuẩn hóa các lược đồ cơ sở dữ liệu cho các ứng dụng OLTP đang thay đổi trong thế kỷ 21 khi
càng ngày càng có nhiều ứng dụng hơn cần lưu giữ một lịch sử đầy đủ của tất cả các hàng cơ sở
dữ liệu. Do đó, nhiều ứng dụng chỉ thực hiện chèn các phiên bản mới của một hàng chứ không
thực hiện cập nhật hàng hiện có [45] – giảm nguy cơ về các dị thường cập nhật trong một lược
đồ đã chuẩn hóa và làm giảm nhu cầu đối với việc chuẩn hóa.
Không chuẩn hóa trong BigTable của Google, HBase và các hệ thống khác
BigTable của Google là hệ thống cơ sở dữ liệu không chia sẻ thứ gì song song được thực hiện
như một bản đồ phân loại, nhiều chiều, phân tán, thưa thớt [ 47]. Nó được thiết kế với khả năng
mở rộng tới các khối dữ liệu rất lớn (petabyte – một triệu GB) và để phân phối qua hàng trăm
hoặc hàng ngàn máy tính. Trong mỗi mục của bản đồ, BigTable sắp đặt ba phần gồm có một
khóa hàng, một khóa cột và một dấu thời gian theo một giá trị. Ngoài ra, các khóa cột được
nhóm lại thành các họ cột, hình thành đơn vị cơ bản về nén và kiểm soát truy cập.
Một trong những nguyên lý nổi bật trong việc thiết kế các cơ sở dữ liệu và các ứng dụng cho
BigTable là không chuẩn hóa và trùng lặp dữ liệu [ 48]– một sự khởi đầu có gốc từ lý thuyết cơ
sở dữ liệu quan hệ truyền thống. Mục đích là tối ưu hóa cơ sở dữ liệu để truy cập đọc hiệu quả và
có khả năng mở rộng. Không chuẩn hóa thường được sử dụng sao cho một hoạt động đọc đơn lẻ
có thể lấy ra tất cả các trường thuộc về một hồ sơ kinh doanh lô-gic.
Không chuẩn hóa trong BigTable đi kèm với các phí tổn về các bản cập nhật phức tạp hơn và ít
hiệu quả hơn, khi nhiều bản sao tiềm năng có cùng một giá trị phải được cập nhật theo chương
trình. Chấp nhận sự hy sinh này để đạt được khả năng mở rộng cao cho các ứng dụng có tỷ lệ
đọc/cập nhật cao. Ngoài ra, trường dấu thời gian trong BigTable được sử dụng giúp cho việc tạo
phiên bản dễ dàng hơn, có nghĩa là, nhiều bản sao về một địa chỉ khách hàng hoặc nhiều bản sao
về một mô tả sản phẩm phản ánh tình trạng của thế giới tại một điểm nào đó đúng lúc.
Hãy tưởng tượng một cơ sở dữ liệu lưu trữ các khách hàng và các đơn đặt hàng, với một mối
quan hệ logic một-nhiều giữa chúng. Trong khi việc chuẩn hóa cơ sở dữ liệu quan hệ thường yêu
cầu ít nhất là 2 bảng, một bảng cho khách hàng và một bảng cho các đơn đặt hàng, thì một thiết
kế BigTable điển hình thường lặp lại thông tin khách hàng cho mỗi lần đặt hàng. Điều này biểu
diễn trạng thái thông tin khách hàng cho mỗi đơn hàng cụ thể. Ví dụ, một khách hàng có thể
hoặc không thể sử dụng cùng một địa chỉ cho mỗi đơn đặt hàng. Với nghĩa này, cách biểu diễn

động này thường do con người thực hiện, qua điện thoại hoặc thư. Các cơ sở hạ tầng được phát
triển để cung cấp truy cập web vào cơ sở dữ liệu quan hệ và chuyển đổi nội dung của chúng
thành HTML có ở mọi nơi và các ứng dụng được tạo ra đã sử dụng HTML cho giao diện người
dùng của chúng [ 36].
HTML đã trở nên thành công lớn. Nó đã được mô tả trong một định nghĩa tài liệu Standard
Generalized Markup Language (SGML - Ngôn ngữ đánh dấu chuẩn tổng quát) [ 38] đã có phiên
bản 4.0 vào năm 1997. SGML, có nguồn gốc từ Generalized Markup Language (Ngôn ngữ đánh
dấu tổng quát) của IBM vào những năm 1960, là một tiêu chuẩn ISO để xác định cách đánh dấu.
Một trường hợp đơn giản hóa của SGML, được gọi là eXtensible Markup Language (XML-
Ngôn ngữ đánh dấu mở rộng) [ 37], đã được giới thiệu vào năm 1998 để nới lỏng việc triển khai
thực hiện trình phân tích cú pháp so với các trình phân tích cú pháp SGML đầy đủ mà HTML
cần. Một ví dụ về các trường hợp đơn giản hóa trong XML là tất cả các thẻ bắt đầu phải có các
thẻ kết thúc, còn trong SGML không dùng các thẻ như vậy.
Việc giới thiệu XML đã khuyến khích tạo ra nhiều bảng từ vựng vượt xa HTML để biểu diễn các
cấu trúc dữ liệu tùy ý. Khi các hồ sơ kinh doanh trong thế giới thực được tạo ra dưới dạng số vào
cuối những năm 1990, được Web cấp tư liệu làm phương tiện đầu ra đầu vào, XML đã trở thành
sự lựa chọn tự nhiên để biểu diễn các hồ sơ kinh doanh theo một định dạng không chuẩn hóa,
giống như các hình thức giấy hoặc các viên đá là những hồ sơ kinh doanh không chuẩn hóa.
Phần mềm XML mã nguồn mở miễn phí đã được bắt nguồn từ bộ vi xử lý SGML hoặc bộ vi xử
lý loại mới có thể phân tích cú pháp XML đúng định dạng đã được tạo ra, loại bỏ nhu cầu sử
dụng các trình phân tích cú pháp tùy chỉnh.
Người ta đã giới thiệu nhiều đặc tả hơn để hỗ trợ XML, ví dụ các lược đồ XML đã cho phép các
tổ chức và các tập đoàn quy định chính xác những gì cấu thành nội dung có thể chấp nhận được
trong một hồ sơ kinh doanh cụ thể. Việc xác nhận hợp lệ trình phân tích cú pháp đã trở nên phổ
biến rộng rãi. Các vùng tên cho phép một hồ sơ kinh doanh chứa dữ liệu có các định nghĩa do
các nhóm khác nhau sở hữu. Các vùng tên cho phép các tổ chức tái sử dụng, phân vùng hoặc mở
rộng các cấu trúc hồ sơ kinh doanh. Có thể áp dụng các chữ ký số cho XML, để đảm bảo rằng nó
đã không bị làm giả, theo một cách tương tự như các chữ ký và các dấu đã được sử dụng trên
giấy da và giấy.
Các đặc tả đã được giới thiệu mô tả cách nên truyền dẫn các hồ sơ XML, bao gồm WSDL,

đã phát minh ra chuẩn hóa dữ liệu để tổ chức các hồ sơ kinh doanh sao cho mỗi mục dữ liệu
được lưu trữ đúng một lần để bảo tồn lưu trữ và tránh các dị thường cập nhật. Chuẩn hóa đã được
phát triển vào những năm 1970 với các lý do thuyết phục vào thời điểm đó. Dung lượng đĩa khan
hiếm và đắt tiền, các hồ sơ kinh doanh không phức tạp như hiện nay và chỉ dự định lưu trữ phiên
bản mới nhất của từng thông tin. Do đó, nỗ lực chuyển đổi các hồ sơ kinh doanh sang và từ cách
biểu diễn chuẩn hóa trong các máy tính nói chung được chấp nhận.
Với sự xuất hiện của kho dữ liệu và kinh doanh thông minh vào đầu những năm 1990, những hạn
chế của chuẩn hóa đã nhận được nhiều sự quan tâm. Một lược đồ cơ sở dữ liệu chuẩn hóa là một
sự biểu diễn trái tự nhiên của các hồ sơ kinh doanh, rất khó hiểu cho những người dùng doanh
nghiệp và không hiệu quả cho việc trình bày và xử lý các truy vấn phân tích kinh doanh. Kết quả
là, không chuẩn hóa đã được giới thiệu để tháo gỡ những thiếu sót ở một mức độ nào đó.
Và thế giới Công nghệ thông tin tiếp tục thay đổi trong thế kỷ 21. Chi phí cho mỗi MB dung
lượng lưu trữ số đã giảm rất nhiều. Do những tiến bộ về mật độ lưu trữ và nén, chuẩn hóa không
còn cần thiết để tiết kiệm dung lượng nữa. Tương tự như vậy, các quy tắc kiểm tra và tuân thủ
đòi hỏi nhiều ứng dụng hiện nay cần giữ lại một lịch sử về các đối tượng dữ liệu của chúng. Kết
quả là, các việc chèn phiên bản mới và không thay đổi của các đối tượng dữ liệu thường phổ biến
hơn so với các cập nhật dữ liệu hiện có, làm giảm nguy cơ về các dị thường cập nhật. Do đó, nhu
cầu chuẩn hóa dữ liệu không còn có thể được áp dụng phổ biến nữa như trong những năm 1970.
Ngoài ra, sự thành công của Web, các dịch vụ Web và các công nghệ Web 2.0 đã đảm bảo rằng
các hồ sơ kinh doanh được tạo ra dưới dạng số, chủ yếu là XML. Trong khi phần mềm phía máy
khách đã chấp nhận XML và các dẫn xuất của nó, thì phần mềm phía máy chủ liên quan đến các
cơ sở dữ liệu vẫn tiếp tục yêu cầu tuỳ chỉnh đáng kể để thiết kế, xây dựng và phát triển, do các
phép chuyển đổi dữ liệu mà chuẩn hóa đòi hỏi. Một trong những lý do là chuẩn hóa dữ liệu đã
được giảng dạy như một phương pháp luận thiết kế cơ sở dữ liệu trong suốt 30 năm và tiếp tục
được giảng dạy như một phần thiết kế hệ thống. Tuy nhiên, do các hồ sơ kinh doanh hiện nay là
số, phức tạp hơn và đang phát triển, nên cần có thời gian để xem xét lại việc sử dụng chuẩn hóa
một cách cẩn thận.
Phần thứ hai của loạt bài này thảo luận về XML và cách biểu diễn dữ liệu thay thế khác và xem
xét khi nào và làm thế nào mà chúng có thể làm giảm bớt các vấn đề phổ biến với chuẩn hóa.
Tài liệu tham khảo

22. Cơ sở dữ liệu về nguồn thu nhập tiền lương trung bình quốc tế:

23. Các hệ thống quản lý tài liệu điện tử:

24. Quản lý nội dung doanh nghiệp:

25. Tấm vi phim:
26. Kimball, Ralph: Bộ dụng cụ của kho lưu trữ dữ liệu Toolkit, Phát hành lần thứ 2. Wiley
Computer Publishing (2002).
27. Burleson, Donald: "Phát triển Kho lưu trữ dữ liệu hiệu quả Oracle và các ứng dụng OLAP",
1996
28. Zaker, M. et al.: "Cấu trúc Không chuẩn hóa: Một Triển vọng để Tối ưu hóa thiết kế Kho lưu
trữ dữ liệu", Tạp chí Các máy tính quốc tế, Số 1, Tập 3, trang 143-150, 2009.
29. Sanders, G. and Shin, S.: "Các ảnh hưởng của việc không chuẩn hóa lên hiệu năng của các
RDBM", Hội nghị quốc tế về Khoa học hệ thống Hawaii lần thứ 34, HICSS 2001.
30. Codd, E.F. "Một mô hình quan hệ của dữ liệu cho Các ngân hàng dữ liệu chia sẻ lớn",
Communications of the ACM 13 (6): 377–387, 1970.
31. Ngôn ngữ đánh dấu siêu văn bản:
32. Giao thức truyền siêu văn bản:
33. Trình định vị tài nguyên thống nhất:

34. Mạng toàn cầu:
35. Các trình duyệt Web:
36. Bảng thời gian về Mạng toàn cầu:
37. Ngôn ngữ đánh dấu mở rộng:
38. Các sự khác biệt giữa SGML và XML:
39. Murthy, R. et al.: "Hướng tới một kiến trúc XML doanh nghiệp", SIGMOD 2005.
40. Nicola, M., Gonzalez, A.: "Phân đoạn một Terabyte trong dữ liệu XML", Tạp chí quản lý dữ
liệu của IBM, tập 14, Số 1, 2009.
41. Nicola, M., van-der-Linden, B.: "Hỗ trợ nguyên gốc XML trong cơ sở dữ liệu phổ quát của

60. UBL (Ngôn ngữ kinh doanh phổ biến) từ OASIS: is-
open.org/committees/tc_home.php?wg_abbrev=ubl
61. Tham khảo dữ liệu liên kết - Dữ liệu liên kết:
62. Tham khảo RDF – Sách vỡ lòng về RDF:
63. Cách Best Buy đang sử dụng Semantic Web:

64. JSON:


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status