1
MỤC LỤC
CHƯƠNG 1: CƠ SỞ HỆ THỐNG THÔNG TIN ĐỊA LÝ 5
1.1. Giới thiệu 5
1.2. Các thành phần của GIS 5
1.2.1. Đối tượng 5
1.2.2. Các thuộc tính 7
1.2.3. Hình ảnh 7
1.2.4. Bề mặt 9
1.3. Hiển thị dữ liệu địa lý 11
1.3.1. Ảnh Vector 11
1.3.2. Ảnh Raster 13
1.4. Tổ chức thông tin địa lý 15
1.4.1. Các lớp bản đồ 15
1.4.2. Chủ đề dữ liệu 16
1.5. Hệ tọa độ và tham chiếu địa lý 17
1.5.1. Tham chiếu địa lý 17
1.5.2. Hệ tọa độ trong GIS 18
CHƯƠNG 2: TỔNG QUAN VỀ POSTGIS RASTER 22
2.1. Giới thiệu 22
2.1.1. So sánh PostGIS Raster với Oracle GEORaster 23
2.2. Cơ sở nền tảng trong PostGIS Raster 33
2.2.1. Sự thực thi 33
2.2.2. Cấu trúc 34
2.2.3. Xác định tham chiếu không gian 36
2.2.4. Dữ liệu Raster 36
2.2.5. Độ phân giải không gian 46
2.2.6. Loại điểm ảnh 47
2.2.7. Giá trị Nodata 48
2.2.8. Các khối ảnh 48
2
tin vẫn được lưu trữ trên những tài liệu, sổ sách qua thời gian cùng với các tác
động bên ngoài có thể làm cho những tài liệu đó bị hỏng hóc, khó phục hồi. Do
đó, nhu cầu sử dụng các phần mềm hỗ trợ khả năng lưu trữ các dữ liệu đảm bảo
các yếu tố an toàn và tiện lợi trong thao tác với dữ liệu đó là vô cùng cần thiết.
Trên thị trường hiện nay có rất nhiều loại hệ quản trị CSDL khác nhau : từ
phần mềm nhỏ chạy trên máy tính cá nhân cho đến những hệ quản trị phức tạp
chạy trên một hoặc nhiều siêu máy tính trong đó có thể kể tới các hệ quản trị
CSDL như: MySQL, Oracle, SQL Server, PostgreSQL…Mỗi loại trên có những
tính năng, lợi ích riêng. Đặc biệt hơn cả, hệ quản trị CSDL PostgreSQL có
những tính năng và lợi thế hơn hẳn các hệ quản trị CSDL khác.
PostgreSQL là sự lựa chọn sử dụng của nhiều người vì nó có nhiều
ưu điểm nổi trội so với các hệ quản trị CSDL khác. Thứ nhất, PostgreSQL là
phần mềm mã nguồn mở, miễn phí hoàn toàn trong sử dụng. Thứ hai, hiệu suất
làm việc của PostgreSQL chênh lệch so với các hệ quản trị khác trong sai số +/-
10%. Thứ ba, đây là hệ quản trị có độ tin cậy cao, bằng chứng là quá trình phát
triển của nó. Thứ tư, PostgreSQL còn có thể chạy được trên rất nhiều hệ điều
hành khác nhau như Window, Linux, Unix, MacOSX…Và cuối cùng, một tính
năng nổi trội của PostgreSQL là khả năng mở rộng hàm, kiểu dữ liệu, toán tử…
người sử dụng có thể tự định nghĩa hàm, kiểu dữ liệu, kiểu toán tử…và có thể
thêm những kiểu dữ liệu, toán tử…vào hệ quản trị CSDL PostgreSQL. Ngoài ra
PostgreSQL còn hỗ trợ kiểu dữ liệu hình học (geometry) như Point, Line,
Polygon…Và PostGIS chính là công cụ được bổ sung cho PostgreSQL để hỗ
trợ hiển thị đối tượng địa lý. PostGIS là một mã nguồn mở, mở rộng không gian
cho PostgreSQL giúp cải thiện được tốc độ truy cập, dễ dàng quản lý và đảm
bảo tính toàn vẹn dữ liệu khi thao tác với dữ liệu không gian.
4
Một đặc điểm nổi trội của PostGIS đó là trong khi hầu hết các hệ thống
thông tin địa lý khác chỉ cung cấp dữ liệu vector để thực thi thì PostGIS hỗ trợ
một kiểu dữ liệu mới cho phép miêu tả sự phân bố của các hiện tượng vật lý
thay đổi liên tục theo thời gian và không gian (gọi là các trường liên tục) như
hiển thị kết quả của tất cả các hoạt động đó.
Một hệ thống thông tin địa lý (HTTTĐL) là sự kết hợp của bản đồ, phân
tích, thống kê và công nghệ cơ sở dữ liệu. Đó là thiết kế có thể tùy chỉnh cho
một tổ chức. Một HTTTĐL được phát triển với mục đích thẩm quyền hay các
doanh nghiệp có thể không nhất thiết phải tương thích hoặc tương thích với hệ
thống GIS đã được xây dựng cho các ứng dụng khác.
1.2. Các thành phần của GIS
Tất cả GIS cung cấp các cách xử lý cho việc hiển thị và quản lý thông tin
địa lý dựa trên bốn yếu tố cơ bản:
• Đối tượng
• Thuộc tính
• Hình ảnh
• Bề mặt
1.2.1. Đối tượng
Một đối tượng được sử dụng để mô tả một thực thể trong không gian –
thời gian. Bên cạnh một số đối tượng được thêm vào, các đối tượng địa lý cơ
6
bản là tập hợp các điểm, đường và vùng. Chúng thể hiện những điều xảy ra tự
nhiên, đối tượng rời rạc ( như sông, thảm thực vật) đối với các công trình xây
dựng (như đường sá, đường ống, giếng, các tòa nhà…) hay các khu đất ( quận,
khu vực chính trị và các mảnh đât…)
Điểm: xác định những vật rời rạc mà chúng quá nhỏ để mô tả theo kiểu
đường hay vùng như địa điểm, bốt điện thoại, và các điểm máy đo dòng chảy…
Điểm cũng có thể đại diện cho vị trí địa điểm nào đó, tọa độ GPS hay đỉnh núi.
Hình 1.1: Đối tượng điểm
Đường: đường thể hiện hình dạng của đối tượng địa lý quá hẹp để mô tả
theo kiểu một vùng (như đường phố, dòng chảy). Đường cũng được sử dụng thể
hiện các đối tượng có chiều dài nhưng không phải vùng như đường đồng mức và
địa giới hành chính.
Hình 1.2: đối tượng đường
ghi lại trong một mạng lưới riêng biệt.
Hình 1.6: Dữ liệu raster nhiều kênh.
9
1.2.4. Bề mặt
Một bề mặt mô tả một hiện tượng có một giá trị đối với từng điểm trong
không gian. Ví dụ, bề mặt độ cao là một vùng liên tục mà ở đó tất cả các vị trí
không gian có giá trị độ cao trên mực nước biển. Các ví dụ khác bao gồm bề mặt
lượng mưa, nồng độ ô nhiễm v.v…
Một vấn đề lớn trong bề mặt đó là không thể thể hiện tất cả các giá trị của
tất cả các vị trí trong một khu vực. Có nhiều lựa chọn khác nhau thay thế cho bề
mặt như sử dụng các đối tượng hay raster. Dưới đây là một số thay thế:
Đường đồng mức: đại diện cho một tập hợp các điểm có giá trị như nhau
chẳng hạn như độ cao.
Hình 1.7: Bề mặt thể hiện bởi các đường cong
Kênh
Mỗi kênh mô tả một vùng đặc biệt của các giá trị. Một vùng, nơi mà mỗi
giá trị của điểm thuộc 1 kênh, sẽ được thể hiện bởi một màu tương ứng. Ví dụ
kênh bao gồm tất cả lượng mưa trung bình hàng năm từ 25cm đến 50cm.
Dữ liệu Raster
Một ma trận các cell mà ở đó giá trị mỗi cell thể hiện việc đo đạc mỗi
điểm trong không gian.
Ví dụ, mô hình số độ cao thể hiện bởi lưới ô vuông, thường được sử dụng
để mô tả bề mặt độ cao.
10
Mạng lưới tam giác không đều
Một mạng lưới tam giác không đều (TIN): một cấu trúc dữ liệu thể hiện
bề mặt như một mạng lưới kết nối các tam giác. Mỗi nút tam giác có tọa độ x,y
và giá trị bề mặt z.
Raster và TIN có thể được sử dụng để ước tính giá trị bề mặt cho bất kì vị
trí nào sử dụng phép nội suy.
toán học được tính toán lại để tạo ra đối tượng có kích thước gấp 2 lần đối tượng
ban đầu. Do vậy biểu thức toán học được tính toán lại để tạo ra một đối tượng có
kích thước gấp 2 lần đối tượng ban đầu. Vì vậy, hình ảnh vector có thể được tạo
12
ra với bất kì độ phân giải nào mà một máy in có thể tạo ra được. Không giống
với ảnh raster, chất lượng ảnh vector không giới hạn bằng cách quét độ phân
giải.
Hình 1.11: ảnh vector với các tỷ lệ khác nhau
Màu sắc
Từ khi các ảnh vector bao gồm các đối tượng, đối tượng vector màu giống
như được tô với bút màu trong sách màu. Sử dụng chương trình vẽ, người sử
dụng có thể dễ dàng thay đổi màu của các đối tượng riêng rẽ bằng cách kich vào
bên trong đối tượng và xác định màu của nó, cùng với việc xác định chiều rộng
của dòng. Ảnh màu vector thường dễ hơn ảnh màu raster
Kích thước tập tin
Lưu trữ hình ảnh vector chỉ cần mô tả toán học. Vì lý do này, các tập tin
vector thường rất bé trong kích thước của tập tin. Hầu hết các biểu tượng dựa
trên vector đều có kích thước dưới 100 kB. Vì lý do này, tập tin vector lý tưởng
cho việc chuyển giao qua Internet.
Định dạng tập tin
Các định dạng vector phổ biến bao gồm EPS (Encapsulated PostScript),
WMF (Windows Metafile), AI (Adobe Illustrator), CDR (CorelDraw), DXF
(AutoCAD), SVG (Scalable Vector Graphics) and PLT (Hewlett Packard
Graphics Language Plot File).
Màn hình hiện đại và máy in là các thiết bị raster, định dạng vector được
chuyển đổi sang định dạng raster trước khi chúng được hiển thị hoặc in ra. Hoặc
trong công việc đồ họa, các thiết bị như máy ảnh và máy quét thường cho ra các
13
đồ họa raster tông màu liên tục không thực để chuyển sang vector. Vì vậy một
chỉnh sửa hình ảnh được thực hiện trên điểm ảnh hơn là trên các đối tượng vẽ
Hình 1.13: Ảnh raster phóng to.
Nhược điểm lớn nhất khi sử dụng ảnh raster nằm ở việc chỉnh sửa và thao
tác với màu sắc ảnh. Ảnh vector là hướng đối tượng trong khi đó ảnh raster là
điểm ảnh có định hướng, để thay đổi màu sắc điểm ảnh, một màu sắc cụ thể
hoặc nhiều màu sắc phải tách ra khỏi phần còn lại để thay đổi. Công việc này là
một thách thức đối với người dùng, thậm chí phải có kinh nghiệm.
Kích thước tập tin
Với mỗi tập tin ảnh raster, một số lượng lớn các thông tin, bao gồm vị trí
chính xác và màu sắc trong lưới điểm ảnh, cần phải được lưu trữ theo dõi để tái
tạo lại hình ảnh. Điều này dẫn đến kích thước tập tin ảnh raster lớn. Độ phân
giải cao (dpi) và độ sâu màu lớn (số bit cho mỗi điểm ảnh) tạo ra những tập tin
có kích thước lớn. Điển hình như logo ảnh đen và trắng sẽ có kích thước tập tin
nhỏ hơn 70kB. Tập tin tương tự lưu dưới dạng 300dpi 24 bit (hàng triệu màu),
logo ảnh raster có thể có kích thước gấp 100 lần (trên 7MB). Khi tạo và quét ảnh
raster, kích thước tập tin raster trở thành vấn đề quan trọng, các tập tin lớn có xu
15
hướng dùng cho bộ vi xử lý máy tính và ổ cứng. Việc chuyển giao các tập tin
lớn trên Internet (hơn 1MB) yêu cầu kết nối internet tốc độ cao trên cả hai đầu
để việc đưa lên và tải được đúng lúc.
Định dạng tập tin
Định dạng ảnh raster phổ biến bao gồm BMP (Window Bitmap), PCX
(Paintbrush), TIFF (TagInterleave Format), JPEG (Joint Photographics Expert
Group), GIF (Graphics Interchange Format), PNG (Portable Network Graphic),
PSD (Adobe PhotoShop) và CPT (Corel Photo PAINT).
Các công cụ đồ họa hoàn hảo sẽ kết hợp hình ảnh từ các nguồn vector và
raster và cung cấp các công cụ chỉnh sửa cho cả hai, từ một vài bộ phận của một
ảnh có thể đến một nguồn ảnh và hơn nữa có thể được vẽ sử dụng công cụ
vector.
1.4. Tổ chức thông tin địa lý
1.4.1. Các lớp bản đồ
• Tất cả các lớp phải được tham chiếu địa lý đến một vị trí trên Trái đất vì
thế chúng có thể kết nối với nhau. Quá trình tham chiếu địa lý được thực
hiện bằng cách xác định hệ tọa độ địa lý của mỗi bộ dữ liệu.
• Các lớp có thể được kết hợp bằng nhiều cách như xếp theo thứ tự các lớp
trong một bản đồ hoặc khai thác sử dụng hoặc dùng lệnh. Các hoạt động
địa lý có thể làm việc với các mối quan hệ bên trong và giữa các lớp.
• Các lớp GIS có thể được kết hợp từ nhiều nguồn và nhiều người sử dụng.
Trong thực tế, hầu như người dùng phụ thuộc vào nhau về các phần dữ
liệu mà học muốn sử dụng. Vì thế, khả năng tương tác trở thành đối tượng
cơ bản trong GIS.
1.5. Hệ tọa độ và tham chiếu địa lý
1.5.1. Tham chiếu địa lý
Tất cả yếu tố trong bản đồ có một vị trí địa lý cụ thể và khả năng chúng
nằm trên bề mặt trái đất. Vì thế để tham chiếu địa lý một vật gì đó nghĩa là để
mô tả sự tồn tại của nó trên bề mặt trái đất. Thuật ngữ này được sử dụng khi
thiết lập mối quan hệ giữa ảnh raster hoặc vector và hệ tọa độ hoặc khi xác định
vị trí không gian của các đối tượng địa lý khác. Ví dụ bao gồm thiết lập vị trí
chính xác của một bức ảnh hàng không trong một bản đồ hoặc tìm kiếm tọa độ
địa lý của một địa chỉ đường nào đó. Vì thế tham chiếu địa lý là bắt buộc với mô
hình dữ liệu địa lý trong các lĩnh vực của hệ thống thông tin địa lý.
18
Hình 1.16: Thực hiện tham chiếu một đối tượng địa lý.
1.5.2. Hệ tọa độ trong GIS
Một hệ thống tọa độ là một hệ thống sử dụng tọa độ để xác định duy nhất
vị trí một điểm hoặc các yếu tố địa lý khác trên mặt đất. Có hai loại hệ tọa độ
phổ biến sử dụng trong GIS:
• Một hệ thống tọa độ toàn cầu như gồm kinh độ, vĩ độ. Hệ thống này
thường được gọi là hệ tọa độ địa lý.
• Một hệ quy chiếu dựa trên phép chiếu bản đồ. Tồn tại các phép chiếu bản
đồ khác nhau cung cấp các kĩ thuật khác nhau để chiếu bề mặt hình cầu
cấp bởi hệ quy chiếu
Hệ quy chiếu sử dụng tọa độ Descart
Hệ quy chiếu là bất kì hệ tọa độ nào được thiết kế cho một bề mặt phẳng.
Hệ tọa độ Descart 2D và 3D cung cấp kĩ thuật mô tả vị trí địa lý của các đối
tượng địa lý sử dụng các giá trị x, y và z. x, y thể hiện vị trí trên bề mặt trái đất
và z thể hiện chiều cao so với mực nước biển.
Hệ tọa độ Descart 2 chiều
Là hệ tọa độ sử dụng 2 trục: trục ngang x đại diện 2 hướng Đông – Tây và
trục dọc y đại diện 2 hướng Bắc – Nam. Điểm giao nhau của các trục là gốc. Vị
20
trí các đối tượng được xác định tương đối so với vị trí gốc sử dụng các kí hiệu
(x,y), trong đó x nói tới khoảng cách dọc theo trục ngang và y nói tới khoảng
cách dọc theo trục đứng. Gốc được xác định là (0,0). Ví dụ, hình 1.19, kí hiệu
(4,3) cho thấy điểm cách 4 đơn vị trên trục x và 3 đơn vị trên trục y so với gốc.
Hình 1.19: Hệ tọa độ Descart 2D
Hệ tọa độ Descart 3 chiều
Là hệ tọa độ sử dụng thêm giá trị z để xác định độ cao so với mực nước
biển. Kí hiệu (2,3,4) hình 1.20 chỉ một điểm cách gốc tọa độ 2 đơn vị theo
hướng trục x, 3 đơn vị theo hướng trục y và có độ cao là 4 đơn vị so với bề mặt
trái đất, cũng như 4 đơn vị so với mực nước biển.
Hình 1.20: hệ tọa độ Descart 3D
Kể từ lúc trái đất hình cầu, một thách thức phải đối mặt là làm thế nào để
thể hiện thế giới thực sử dụng hệ tọa độ phẳng. Quá trình chuyển thế giới thành
bề mặt phẳng gọi là chiếu, do đó thuật ngữ chiếu bản đồ ra đời. Ví dụ các
phương pháp chiếu bản đồ khác nhau được minh họa trong hình 1.21.
21
Không giống như hệ tọa độ địa lý, một hệ quy chiếu có chiều dài không
đổi, các góc và khu vực trên hai chiều. Tuy nhiên, tất cả phép chiếu bản đồ thể
hiện bề mặt trái đất tạo ra sự biến dạng một số mặt như khoảng cách, diện tích, tỉ
lệ hoặc phương hướng (hình 1.22). Phụ thuộc vào ứng dụng người dùng, nhiều
yếu tố hình học, raster có liên quan đến một cấu trúc dữ liệu ma trận.
Tích hợp trong suốt với Vector
PostGIS Raster cung cấp một tập các hoạt động và các chức năng tương
tự những cái có sẵn cho vector để hổ trợ raster. Bằng cách này, người sử dụng có
thể sử dụng kiến thức về vector để thao tác tương tự khi sử dụng các hoạt động
và chức năng. Do đó sẽ tăng cường sự tương tác giữa người sử dụng với ứng
dụng địa lý.
Với các nhà phát triển, một mô hình SQL cho cả raster và vector sẽ giúp
chúng ta viết được các ứng dụng GIS tốt hơn. Các nhà phát triển sẽ xây dựng
một giao diện người dùng đồ họa độc đáo đối với cả hai loại dữ liệu vector và
raster.
23
Lưu trữ linh hoạt
Ngoài việc lưu trữ truyền thống (lưu trữ trong cơ sở dữ liệu), PostGIS
Raster cho phép người sử dụng đăng kí đơn giản dữ liệu của ảnh raster lưu trữ
trong tập tin hệ thống (lưu trữ ngoài cơ sở dữ liệu). Khi lấy những raster ngoài
cơ sở dữ liệu từ cơ sở dữ liệu, chúng truy cập trực tiếp từ file hệ thống.
Tính thừa kế và mở rộng của PostGIS Raster
PostGIS Raster sử dụng thư viện GDAL (Geospatial Data Abstraction
Library) để nạp raster vào cơ sở dữ liệu và làm việc với raster ngoài cơ sở dữ
liệu. Với GDAL, PostGIS Raster có thể làm việc với gần một trăm định dạng
file.
Những chức năng bổ sung làm cho PostGIS Raster không chỉ là một định
dạng raster mới mà còn là một sự bổ sung rất cần thiết cho PostGIS.
2.1.1. So sánh PostGIS Raster với Oracle GEORaster
a. Kiến trúc
Kiến trúc chung
Nhìn chung, công cụ hỗ trợ dữ liệu raster gồm 5 thành phần:
Đặc tính Oracle GeoRASTER PostGIS Raster
SQL API Chuẩn SQL
Trong Oracle GeoRASTER, mỗi ảnh được lưu trữ như mội đối tượng
riêng của SDO_GEORASTER. Một bảng GeoRaster là bảng có ít nhất một cột
SDO_Georaster. Đối tượng SDO-GeoRaster bao gồm dữ liệu (metadata) và
thông tin về cách lấy dữ liệu Georaster được lưu trữ trong một bảng khác, gọi là
bảng dữ liệu Raster (RDT). Dữ liệu GeoRaster là một đối tượng SDO-Raster –
đối tượng bao gồm cột đối tượng nhị phân lớn Binary Larger Object (BLOB) gọi
là RASTERBLOCK lưu trữ các khối raster ( phần chính của dữ liệu raster có
thể được chia nhỏ thành nhiều khối nhỏ để lưu trữ và phục hồi tốt nhất).
Hình 2.1: Kiến trúc cơ sở dữ liệu Georaster
Các thông tin khác liên quan đến đối tượng GeoRaster có thể được lưu trữ
trong cột hay bảng riêng, ví dụ như bảng giá trị thuộc tính (VAT).
Đơn giản hơn, PostGIS Raster chỉ sử dụng một loại raster để lưu trữ một
ảnh raster, giống như một loại hình học, raster là một loại rất phức tạp, nó nhúng
thông tin raster của chính nó với tham chiếu địa lý.