Nghiên cứu Web Service, ứng dụng trong đồng bộ dữ liệu - pdf 28

Download miễn phí Đồ án Nghiên cứu Web Service, ứng dụng trong đồng bộ dữ liệu



MỤC LỤC
LỜI NÓI ĐẦU 1
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 6
1.1 Phát biểu bài toán 6
1.2 Dữ liệu là gì? 6
1.3 Các dạng dữ liệu 6
1.3.1 Dữ liệu nghiệp vụ 7
1.3.2 Dữ liệu nghiệp vụ phi cấu trúc 7
1.3.3 Siêu dữ liệu 7
1.4 Cơ sở dữ liệu phân tán 8
1.4.1 Lợi điểm của cơ sở dữ liệu phân tán 8
1.4.2 Tính trong suốt của cơ sơ dữ liệu phân tán 8
1.4.2.1 Trong suốt về vị trí 9
1.4.2.2 Trong suốt về ánh xạ địa phương 9
1.4.3 Tối ưu kết nối trong cơ sở dữ liệu phân tán 10
1.5 Hệ quản trị cở sở dữ liệu 10
1.5.1 Định nghĩa 10
1.5.2 Một số hệ quản trị cở sở dữ liệu 10
1.6 Hạ tầng viễn thông 11
1.6.1 Internet 11
1.6.2 Mạng cục bộ - LAN( Local Area Network) 11
1.6.3 Mạng VPN 11
CHƯƠNG 2: GIẢI PHÁP THỰC HIỆN 12
2.1 Một số phương pháp truyền thống khai thác dữ liệu dựa trên Web 12
2.2 Tìm hiểu về Web Service 12
2.2.1 Khái niệm về Web Service 12
2.2.2 Đặc điểm Web Service 12
2.2.3 Ưu điểm của Web Service 13
2.2.4 Mô hình Web Service 14
2.2.5 Các thành phần chính của Web Service 14
2.2.5.1 Giao thức giao vận HTTP 14
2.2.5.2 Giao thức truyền thông SOAP 15
2.2.5.3 Tầng mô tả dịch vụ XML, WSDL 16
2.2.5.4 Universal Discovery Description and Intergration 18
2.3 Tổng hợp dữ liệu sử dụng Web Service 19
2.3.1 Xử lý dữ liệu tại máy trạm chứa cơ sở dữ liệu cục bộ 19
2.3.2 Xử lý dữ liệu tại trung tâm 21
2.3.3 Trung tâm gửi trả lại dữ liệu cho máy trạm chứa cơ sở dữ liệu cục bộ 22
CHƯƠNG 3: TRIỂN KHAI VÀ CÀI ĐẶT 23
3.1 Xây dựng Web Service 23
3.2 Xây dựng các Website khai thác dữ liệu từ Web Service 25
3.2.1 Web site lấy danh sách các bến xe 25
3.2.2 Web site lấy danh sách các tỉnh trên toàn quốc 26
3.2.3 Web site lấy danh sách các cầu theo tên tỉnh 27
3.2.4 Web site lấy danh sách thông tin cầu theo mã cầu 28
KẾT LUẬN 30
TÀI LIỆU THAM KHẢO 31
 
 





Để tải tài liệu này, vui lòng Trả lời bài viết, Mods sẽ gửi Link download cho bạn ngay qua hòm tin nhắn.

Ket-noi - Kho tài liệu miễn phí lớn nhất của bạn


Ai cần tài liệu gì mà không tìm thấy ở Ket-noi, đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:


ervice là giải pháp tốt nhất hiện nay và có thể triển khai một cách tương đối dễ dàng.
1.2 Dữ liệu là gì?
Trong cuốn “Data Warehouse: From Architecture to Implementation“, dữ liệu được định nghĩa là: “Dữ liệu là sự biễu diễn các thông tin nghiệp vụ trên máy tính“.[2]
Đặc điểm của dữ liệu:
Dữ liệu có thông tin và ý nghĩa riêng của nó.
Dữ liệu có thể cũ và lạc hậu theo thời gian.
Dữ liệu có thể được thay đổi thường xuyên theo yêu cầu.
Dữ liệu có thể có cấu trúc hay không có cấu trúc.
1.3 Các dạng dữ liệu
Ở mức cao nhất, dữ liệu có thể được phân chia theo nhiều cách. Có ba điểm cần lưu ý là:
Ý nghĩa (meaning)
Dữ liệu có thể có nghĩa hay thay mặt cho thứ gì có nghĩa. Sự phân biệt này là nguyên tắc cơ bản và và cũng là điều khó hiểu nhất.
Dữ liệu trên máy tính được sử dụng để thực hiện và quản lý nghiệp vụ. Những dữ liệu đó gọi là dữ liệu nghiệp vụ, thể hiện trạng thái của nghiệp vụ và giá trị của chúng nằm trong ý nghĩa mà chúng thể hiện.
Dữ liệu có ý nghĩa riêng nó và giá trị này nằm trong nội dung hơn là những gì chúng thể hiện. Do đó, chúng được gọi tên là dữ liệu thành phẩm bởi vì chúng được tạo ra và trao đổi giống như sản phẩm. Ví dụ phim, ảnh, sách dưới dạng số hóa [2].
Dạng cuối là các siêu dữ liệu, chúng mô tả ý nghĩa của dữ liệu. Siêu dữ liệu chỉ định nghĩa hay mô tả dữ liệu nghiệp vụ hay dữ liệu thành phẩm
Cấu trúc (structure):
Dữ liệu có thể có cấu trúc ở mức độ cao hay phi cấu trúc [2].
Phạm vi (scope):
Dữ liệu có thể mang tính cá nhân nghĩa là chủ sở hữu có thể thay đổi tùy thích hay mang tính công cộng – khi đó nó được chia sẻ giữa một nhóm người và bất kỳ thay đổi nào cũng đòi hỏi giám sát chặt chẽ [2].
1.3.1 Dữ liệu nghiệp vụ
Dữ liệu nghiệp vụ là dữ liệu cần thiết để vận hành và quản lý nghiệp vụ hay các tổ chức khác. Nó biểu diễn các hoạt động nghiệp vụ phải thực hiện cũng như các đối tượng của thế giới thực phải xử lý như khách hàng, địa điểm, và sản phẩm[2]
1.3.2 Dữ liệu nghiệp vụ phi cấu trúc
Dữ liệu nghiệp vụ phi cấu trúc là dữ liệu nghiệp vụ với cấu trúc các bản ghi tối thiểu như hình ảnh, âm thanh, video.[2]
1.3.3 Siêu dữ liệu
Siêu dữ liệu là dữ liệu mô tả ý nghĩa, cấu trúc cũng như cách thức tạo ra, truy cập và sử dụng dữ liệu nghiệp vụ.[2]
1.4 Cơ sở dữ liệu phân tán
Một cách đơn giản, cơ sở dữ liệu phân tán là tập hợp dữ liệu logic thuộc về cùng một hệ thống nhưng trải rộng ra nhiều điểm trên mạng máy tính.
1.4.1 Lợi điểm của cơ sở dữ liệu phân tán
Có nhiều nguyên nhân để phát triển cơ sở dữ liệu phân tán nhưng tựu trung lại chỉ gồm những điểm sau đây:
Lợi điểm về tổ chức và tính kinh tế.
Tận dụng những cơ sở dữ liệu sẵn có.
Thuận lợi cho nhu cầu phát triển.
Giảm chi phí truyền thông.
Tăng số công việc thực hiện.
Tính dễ hiểu và sẵn sàng.
1.4.2 Tính trong suốt của cơ sơ dữ liệu phân tán
Tính trong suốt của một hệ phân tán được hiểu là việc che khuất đi các thành phần riêng biệt của hệ đối với người sử dụng và những người lập trình ứng dụng.
Khi dữ liệu đã được phân đoạn thì việc truy cập vào cơ sở dữ liệu được thực hiện bình thường như là không bị phân tán và không ảnh hưởng tới người sủ dụng
Ví dụ: xét quan hệ tổng thể NCC (id, ten, tuoi) và các phân đoạn tách ra từ nó: NCC1(id, ten, tuoi), NCC2 (id, ten, tuoi), NCC3(id, ten, tuoi)
NCC1
NCC2
NCC3
DBMS
Vị trí 1
Vị trí 2
Vị trí 3
Hình 1 : Trong suốt phân đoạn.
1.4.2.1 Trong suốt về vị trí
Người sử dụng không cần biết vị trí vật lí của dữ liệu mà có quyền truy cập đến cơ sở dữ liệu tại bất cứ vị trí nào. Các thao tác lấy hay cập nhật dữ liệu từ xa được tự động thực hiện bởi hệ thống tại thời điểm đưa ra yêu cầu. Nó cho phép người sử dụng bỏ qua các bản sao dữ liệu đã tồn tại ở mỗi vị trí. Do đó có thể di chuyển một bản sao dữ liệu từ vị trí này sang vị trí khác và cho phép tạo bản sao mời mà không ảnh hưởng tới các ứng dụng
NCC1
NCC2
NCC2
DBMS
Vị trí 1
Vị trí 2
Vị trí 3
Ví dụ: với quan hệ tổng thể R và các phân đoạn như đã nói ở ví dụ trên nhưng giả sử rằng DBMS không cung cấp trong suốt phân đoạn về mà cung cấp trong suốt về vị trí
Hình 2 : Trong suốt về vị trí.
1.4.2.2 Trong suốt về ánh xạ địa phương
Là đặc tính quan trọng trong hệ thống DBMS không đồng nhất, ứng dụng tham chiếu đến các đối tượng có tên độc lập từ các hệ thống cục bộ địa phương được cài đặt trên một hệ thống không đồng nhất nhưng nó được sử dụng như một hệ thống đồng nhất.
NCC1
NCC2
DBMS
Vị trí 1
Vị trí 2
Hình 3 : Trong suốt về ánh xạ địa phương.
1.4.3 Tối ưu kết nối trong cơ sở dữ liệu phân tán
Trên một CSDL phân tán, các thao tác chủ yếu là các phép chiếu-chọn- kết nối (PSJ). Thứ tự kết nối các quan hệ là một yếu tố quan trọng trong việc tối ưu hóa chi phí truyền tải, vì với một thứ tự kết nối tồi thì số bộ ở các kết quả trung gian là rất lớn, trong khi số bộ ở kết quả cuối cùng lại khá nhỏ, như vậy sẽ lãng phí chi phí tính toán và truyền tải các kết quả trung gian trong quá trình kết nối. Vì vậy người ta luôn mong muốn tìm được một thứ tự kết nối tối ưu, sao cho số bộ ở các kết quả trung gian không lớn hơn số bộ ở kết quả cuối cùng.
Thực chất của việc tối ưu hóa kết nối cho cơ sở dữ liệu phân tán là việc làm giảm các chi phí truyền tải dữ liệu. Để làm được điều này ta tối ưu hóa các phép toán đại số quan hệ.
1.5 Hệ quản trị cở sở dữ liệu
1.5.1 Định nghĩa
Hệ quản trị cơ sở dữ liệu (tiếng Anh: Database Management System – DBMS), là phần mềm hay hệ thống được thiết kế để quản trị một cơ sở dữ liệu. Cụ thể, các chương trình thuộc loại này hỗ trợ khả năng lưu trữ, sửa chữa, xóa và tìm kiếm thông tin trong một cơ sở dữ liệu. Có rất nhiều loại hệ quản trị CSDL khác nhau: từ phần mềm nhỏ chạy trên máy tính cá nhân cho đến những hệ quản trị phức tạp chạy trên một hay nhiều siêu máy tính.
1.5.2 Một số hệ quản trị cở sở dữ liệu
Microsoft SQL Server 2005 là một hệ quản trị CSDL quan hệ Client - Server tốc độ cao (High – Performance, Client - Server Relational Database Management System – RDBMS)sử dụng Transact-SQL để trao đổi dữ liệu giữa Client computer và SQL Server computer. Nó được thiết kế để hỗ trợ các xử lý giao tác tốc độ cao, hạn chế lỗi, giảm lượng dữ liệu dư thừa và là hệ thống có tính mở có độ tin cậy cao.
Access là một hệ quản trị cơ sở dữ liệu quan hệ (RDMS - Relational Database Management System), rất phù hợp cho các bài toán quản lý vừa và nhỏ. Hiệu năng cao và đặc biệt dễ sử dụng- bởi lẽ giao diện sử dụng phần mềm này gần giống hệt một số phần mềm khác trong bộ MS Office. Hơn nữa, Access còn cung cấp hệ thống công cụ phát triển khá mạnh đi kèm (Development Tools). Công cụ này sẽ giúp các nhà phát triển phần mềm đơn giản trong việc xây dựng trọn gói các dự án phần mềm quản lý quy mô vừa và nhỏ.
1.6 Hạ tầng viễn thông
1.6.1 Internet
Internet là mạng máy tính lớn nhất thế giới, hay chính xác hơn là mạng của các mạng, tức bao gồm nhiều mạng máy tính được nối lại với nhau. Một số mạng máy tính bao gồm một máy tính trung tâm (còn gọi là máy chủ hay máy phục vụ) và nhiều máy khác (còn gọi là máy khách hàng hay trạm làm việc) nối vào nó. Một khi đã được kết nối vào Internet, máy tính của bạn sẽ là một trong số hàng chục triệu thành viên của mạng lớn này.
Mạng Internet là của chung điều đó có nghĩa là không ai thực sự sở hữu nó với tư cách cá nhân. Mỗi phần nhỏ của mạng được quản lý bởi các tổ chức khác nhau nhưng không ai không một thực thể nào cũng như không một trung tâm máy tính nào nắm quyền điều khiển mạng. Mỗi phần của mạng được liên kết với nhau theo một cách thức nhằm tạo nên một mạng toàn cầu.-
1.6.2 Mạng cục bộ - LAN( Local Area Network)
Mạng cục bộ (LAN) là hệ truyền thông tốc độ cao được thiết kế để kết nối các máy tính và các thiết bị xử lý dữ liệu khác cùng hoạt động với nhau trong một khu vực địa lý nhỏ như ở một tầng của toà nhà, hay trong một toà nhà.... Một số mạng LAN có thể kết nối lại với nhau trong một khu làm việc. Kết nối được thực hiện thông qua môi trường truyền thông tốc độ cao như dây cáp.
1.6.3 Mạng VPN
Virtual Private Networks (VPN) hay gọi theo tiếng Việt là Mạng Riêng Ảo, cho phép bạn mở rộng phạm vi mạng nội bộ bằng cách sử dụng lợi thế của internet. Kỹ thuật VPN cho phép bạn kết nối với một host nằm xa hàng ngàn dặm với mạng LAN của bạn và làm cho nó trở thành một node hay một máy tính nữa trong mạng LAN. Một đặc điểm nữa của VPN là sự kết nối giữa clients và mạng ảo của bạn khá an toàn như chính bạn đang ngồi trong cùng một mạng LAN.
CHƯƠNG 2: GIẢI PHÁP THỰC HIỆN
Trong chương này, sẽ trình bày các vấn đề sau :
Tìm hiểu về một số phuơng pháp truyền thống khai thác dữ liệu trên Web.
Tìm hiểu về Web Service.
Tổng hợp dữ liệu để đồng bộ.
2.1 Một số phương pháp truyền thống khai thác dữ liệu dựa trên Web
Phương pháp Java Socket.
Phương pháp RMI.
Phương pháp CORBA.
2.2 Tìm hiểu về Web Service
Web Service là phương pháp cho phép trao đổi thông tin giữa các hệ thống dựa trên giao thức HTTP và SOAP, hoàn toàn độc lập với hệ điều hành hay ngôn ngữ lập trình được sử dụng trên máy chủ và máy khách. Không như các công nghệ trước kia, Web Service ...
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status