Các ontology trong lĩnh vực thông tin địa lý
PHẦN MỞ ĐẦU
Trong những năm gần đây cùng với sự phát triển nhanh chóng của
khoa học kỹ thuật là sự bùng nổ về xử lý tri thức. Kho dữ liệu, nguồn tri
thức của nhân loại càng trở nên đồ sộ, vô tận làm cho vấn đề khai thác các
nguồn tri thức đó ngày càng trở nên nóng bỏng và đặt ra thách thức lớn cho
nền công nghệ thông tin thế giới.
Nhu cầu về tìm kiếm, xử lý thông tin và nâng cao khả năng xử lý của
máy tính trong việc giải quyết các vấn đề thực tế của con người, cùng với
yêu cầu về khả năng kịp thời khai thác chúng để nâng cao năng suất và chất
lượng cho công tác quản lý, điều hành, ra quyết định, dự báo trong các hoạt
động sản xuất, kinh doanh,… đã trở nên cấp thiết trong xã hội hiện đại.
Nhưng vấn đề tìm kiếm và sử dụng nguồn tri thức đó như thế nào để phục
vụ cho công việc của mình lại là một vấn đề khó khăn đối với người sử
dụng trong việc biểu diễn những tri thức đó vào máy tính. Để đáp ứng phần
nào yêu cầu này, người ta đã xây dựng các công cụ biểu diễn tri thức và xử
lý thông tin nhằm giúp cho người dùng tìm kiếm, giải quyết được các bài
toán cần thiết cho mình, nhưng với sự rộng lớn, đồ sộ của các bài toán
trong thực tế đã làm cho người sử dụng cảm thấy khó khăn trong việc thu
thập và biểu diễn chúng để máy tính có thể hiểu và xử lý như con người.
Trong Trí tuệ nhân tạo và Biểu diễn tri thức, người ta thường xây
dựng các ontology hỗ trợ bên dưới các công cụ tìm kiếm, phân tích, tính
toán nhằm mục đích làm cho máy tính hiểu được ngữ nghĩa của các đối
tượng trong lĩnh vực mà nó xử lý sao cho giống với cách mà con người suy
nghĩ nhất. Ontology là một giải pháp biểu diễn tri thức và chia sẻ thông tin
mà cả máy tính và con người có thể hiểu được. Ontology chứa những đặc
tả rõ ràng của các khái niệm về một lĩnh vực và quan hệ giữa các khái niệm
đó. Nó được sử dụng trong lĩnh vực Trí tuệ nhân tạo, công nghệ Web ngữ
nghĩa, kỹ thuật phần mềm, sinh tin học và kiến trúc thông tin như là một
hình thức biểu diễn tri thức về thế giới thực trong một số lĩnh vực cụ thể.
Biểu diễn tri thức và ứng dụng Trang 1
Chương 3: Mô hình cơ sở dữ liệu đất đai đa mục tiêu tại Việt nam.
Biểu diễn tri thức và ứng dụng Trang 2
2
Các ontology trong lĩnh vực thông tin địa lý
CHƯƠNG 1
TỔNG QUAN VỀ ONTOLOGY VÀ LĨNH VỰC
THÔNG TIN ĐỊA LÝ
Nội dung Chương 1 trình bày sơ lược khái niệm ontology cũng như
nhu cầu cần thiết phải có ontology. Đồng thời cũng tóm lược về các khái
niệm và một số vấn đề trong lĩnh vực thông tin địa lý.
1. Định nghĩa về ontology
Bỏ qua ngữ nghĩa Triết học, trong lĩnh vực Công nghệ thông tin
ontology cũng có rất nhiều định nghĩa khác nhau. Trong tiểu luận này, chỉ
xin nêu một định nghĩa - được đánh giá là diễn tả đúng nhất về ontology -
của A. Maedche & B. Motik & L. Sjanovic (2003) như sau: “Ontology là
mô hình khái niệm trong phạm vi ứng dụng nhất định, có thể thực thi và
chia xẻ trên máy tính”.
Theo đó, một ontology phải có những tính chất sau:
- Được sử dụng để mô tả một phạm vi ứng dụng cụ thể.
- Các khái niệm và quan hệ được định nghĩa rõ ràng trong phạm vi
ứng dụng.
- Có cơ chế tổ chức các khái niệm (phân cấp).
- Có sự đồng thuận về mặt ý nghĩa các khái niệm của những người
cùng sử dụng.
2. Các thành phần của ontology
- Khái niệm (concept):
Các khái niệm được phân loại để định nghĩa tập hợp các thuộc tính
hoặc tập hợp các thao tác là đặc trưng của các thành phần của khái niệm.
Ví dụ trong ontology về giao thông đô thị, Ga xe lửa và Trạm xe buýt
là hai khái niệm.
} {sk
a
, sk
b
, …, sk
m
}
Ví dụ, Ngã tư phải có nhiều hơn một đường hoặc Nếu là ngã tư thì
phải có hai đường giao nhau.
- Thể hiện (instance):
Là đại diện cho những phần tử riêng biệt của khái niệm hay quan hệ.
Ví dụ, Đường được đặt tên là đường Nguyễn Chí Thanh là thể hiện
của khái niệm Đường.
3. Lĩnh vực thông tin địa lý và các tồn tại
Lĩnh vực thông tin địa lý (Geographical information hoặc
Geoinformation - GI) mô tả các đối tượng, hiện tượng liên quan trực tiếp
hoặc gián tiếp với một vị trí (hệ tọa độ, hệ thống địa chỉ ) đối với bề mặt
trái đất. Các đối tượng, hiện tượng đó có thể rời rạc hóa về mặt không gian
(đại diện bởi các đối tượng hình học như điểm, đường, vùng,…) như một
Biểu diễn tri thức và ứng dụng Trang 4
4
Các ontology trong lĩnh vực thông tin địa lý
khu đô thị, một trục đường,… hoặc liên tục hóa về mặt không gian (ví dụ,
đại diện bằng cách nội suy trên một lưới ảnh) như độ cao địa hình hay
khuếch tán ô nhiễm môi trường,… Thông tin địa lý được tạo ra bằng cách
thao tác trên các dữ liệu địa lý (hoặc dữ liệu không gian địa lý) trong một
hệ thống máy tính. Dữ liệu không gian địa lý có thể thu thập bởi các
phương tiện khác nhau như: khảo sát địa hình, ảnh viễn thám, ảnh hàng
không, GPS, công nghệ bay quét (LiDAR) và tất cả các loại khảo sát khác
dựa vào kỹ thuật cảm biến. Theo truyền thống, những dữ liệu này là thành
thuật không độc quyền (CEN 2006).
Từ định nghĩa trên của SDI có thể rút ra được rằng một trong những
mục tiêu chính của SDI là làm cho việc thao tác với dữ liệu không gian
hiệu quả hơn (McKee 2000; Nebert 2001), tránh được các vấn đề đã xảy ra
với công nghệ GIS truyền thống và các tập dữ liệu không gian. Bernard và
các cộng sự (2004) nhận xét có hai vấn đề lớn đối với các ứng dụng độc lập
của GIS truyền thống: (1) Các tập dữ liệu tồn tại trong rất nhiều định dạng
khác nhau (các tập dữ liệu trong định dạng này thường phải được chuyển
đổi mới sử dụng được trên một hệ thống khác) và (2) Những dữ liệu này
thường không được lập tài liệu đầy đủ (người sử dụng rất khó hoặc thậm
chí không thể khám phá, đánh giá xem liệu một tập dữ liệu đã cho có hữu
dụng đối với các tác vụ của mình hay không). Nói cách khác, các tác giả
muốn nói lên sự bất lực của các công cụ GIS tách biệt trong việc giải quyết
vấn đề tương thích dữ liệu trong bối cảnh hiện nay, khi mà thông tin địa lý
phải được chia xẻ giữa các hệ thống trực tuyến. Khi đề cập đến khả năng
tương thích của thông tin địa lý, người ta mong muốn “mục tiêu của các hệ
thống GIS liên tác vụ là để đạt được một tiến trình tự động cho phép sử
dụng dữ liệu và các dịch vụ phần mềm vượt qua ranh giới mà các nhà thu
thập và thiết kế chúng đặt ra” (Egenhofer 1999).
Cần nói thêm một chút về vấn đề tương thích trong thông tin địa lý,
trở ngại chính của các hệ thống liên tác là sự không đồng nhất trong dữ liệu
và các dịch vụ được quản lý bởi những hệ thống đó. Để xác định xem hai
hệ thống không đồng nhất ở những nơi nào, người ta phải phân tích các
tính năng khác nhau của chúng cũng như sự khác nhau của từng mức độ
tương thích. Một khác biệt thường thấy là sự tương thích giữa cú pháp (giải
Biểu diễn tri thức và ứng dụng Trang 6
6
Các ontology trong lĩnh vực thông tin địa lý
quyết sự không đồng nhất cú pháp) và ngữ nghĩa (giải quyết sự không đồng
nhất ngữ nghĩa) (Kolodziej 2003). Tương thích cú pháp có liên quan đến
Các ontology trong lĩnh vực thông tin địa lý
thông tin địa lý, mặc dù đã có các giao diện chuẩn hóa cho dịch vụ danh
mục (như là các đặc tả dịch vụ danh mục OGC), việc phù hợp với các đặc
tả vẫn không tránh khỏi có các danh mục thông tin địa lý không đồng nhất
về ngữ nghĩa.
Do đó việc nghiên cứu ontology trong lĩnh vực thông tin địa lý là một
hướng tiếp cận khả dĩ tạo thuận lợi cho khả năng tương tác ngữ nghĩa và
khắc phục được các vấn đề không đồng nhất ngữ nghĩa. Việc định nghĩa rõ
ràng về tri thức của ontology thường được sử dụng như một cơ chế để hiểu
và giải quyết sự không đồng nhất ngữ nghĩa phát sinh khi có sự thực hiện
liên tác vụ giữa hai hệ thống khác nhau (Wache et al. 2001). Xác định, xây
dựng và sử dụng ontology đã trở thành một chủ đề nghiên cứu quan trọng
trong Khoa học thông tin địa lý (Geographical Information Sciences -
GISc).
Biểu diễn tri thức và ứng dụng Trang 8
8
Các ontology trong lĩnh vực thông tin địa lý
CHƯƠNG 2
CÁC ONTOLOGY TRONG LĨNH VỰC THÔNG TIN ĐỊA LÝ
Nội dung Chương 2 trình bày các tính năng, đặc điểm của các
ontology liên quan đến thông tin địa lý, trong đó tập trung vào vai trò của
ontology trong việc tạo thuận lợi cho khả năng tương thích thông tin. Phần
cuối sẽ trình bày 3 nghiên cứu về các phương pháp thiết kế ontology và
việc sử dụng ontology trong ngữ cảnh thông tin địa lý.
1. Một số vấn đề cơ bản
Trong lĩnh vực thông tin địa lý, đặc biệt hơn là trong cộng đồng cơ sở
dữ liệu không gian, thuật ngữ ontology thường được gắn với (Yeung và
Hall 2007):
- Một khái niệm sử dụng chính thức và xác định rõ ràng các thuật
ngữ và từ vựng để mô tả các đối tượng của thế giới thực hoặc hiện
2003), quá trình xây dựng và lập tài liệu ontology có thể so sánh với quá
trình mô hình hóa cơ sở dữ liệu khái niệm, bởi vì cả hai quá trình đều nhằm
mục đính xác định và định nghĩa các đối tượng của thế giới thực và các mối
quan hệ của chúng. Tuy nhiên, mặc dù quy trình là giống nhau nhưng sản
phẩm cuối cùng là khác nhau. Trong khi mục đích của một lược đồ khái
niệm là để mô tả cấu trúc của một cơ sở dữ liệu đang xây dựng ở mức độ
trừu tượng cao thì một ontology đại diện cho một đồng thuận về ý nghĩa và
quan hệ giữa các từ vựng của các thuật ngữ được sử dụng để đại diện cho
dữ liệu. Không nhất thiết phải có sự tương ứng trực tiếp giữa cấu trúc của
một ontology và cấu trúc của cơ sở dữ liệu khi nó được đại diện bằng một
mô hình cơ sở dữ liệu khái niệm. Điều này sẽ được minh họa trong mục
3.2.
Các ontology có thể được xây dựng theo hướng tiếp cận từ trên xuống,
từ dưới lên hay trung hòa của hai tiếp cận đó. Ta chỉ cần ghi nhớ rằng tiếp
cận từ trên xuống xây dựng ontology từ các ontology ở mức cao hơn, tiếp
cận từ dưới lên trích xuất ontology từ các hệ thống đã triển khai và tiếp cận
trung hòa là kết hợp của cả hai cách trên. Mục 3.1 mô tả một tiếp cận từ
trên xuống, Mục 3.2 mô tả một tiếp cận từ dưới lên.
Nói chung, các ontology được tạo ra bởi sự đồng thuận của các
chuyên gia về dữ liệu trong một lĩnh vực cụ thể. Tập hợp các chuyên gia
Biểu diễn tri thức và ứng dụng Trang 10
10
Các ontology trong lĩnh vực thông tin địa lý
này, đôi khi còn gọi là một cộng đồng thông tin, bằng các hoạt động xây
dựng một loạt các ontology chuyên ngành (Auxilio và Nieto 2003). Những
hoạt động này bao gồm việc chiết xuất từ các lược đồ cơ sở dữ liệu có sẳn
(trong trường hợp tiếp cận từ dưới lên) và thông qua một quá trình mô hình
hóa dữ liệu, được gọi là mô hình ngữ nghĩa, tập trung vào việc xác định và
định nghĩa các thuật ngữ liên quan. Trong quá trình xây dựng ontology,
thường cần phải thu hút sự trợ giúp từ các chuyên gia đầu ngành để bảo
hợp bởi vì chúng thiếu ngữ nghĩa, có sự mơ hồ trong ngôn ngữ tự nhiên và
không thể áp dụng cơ chế suy luận. Sự xuất hiện của ontology cung cấp
khả năng để tăng cường cho khai phá và rút trích thông tin, nó giải quyết
được bài toán không đồng nhất ngữ nghĩa giữa tìm kiếm của người dùng và
mô tả của thông tin địa lý trong SDI.
SDI cung cấp các dịch vụ danh mục để khai phá các dữ liệu và dịch vụ
phù hợp cho một tác vụ cụ thể. Việc tìm kiếm trên các danh mục này hiện
nay chủ yếu vẫn dựa trên kỹ thuật so khớp chuỗi của các từ khóa với các
mục trong mô tả dữ liệu (metadata) (Lutz 2005). Tìm kiếm dựa trên từ
khóa đem lại kết quả thấp nếu khác với các thuật ngữ được sử dụng và /
hoặc đem lại độ chính xác thấp nếu thuật ngữ này là đồng âm hoặc vì khả
năng hạn chế của chúng trong việc thể hiện các truy vấn phức tạp
(Bernstein và Klein 2002, trích dẫn bởi Lutz 2005). Một cách để khắc phục
những hạn chế này là sử dụng các ontology để cải thiện các quá trình
so khớp.
Ví dụ, (Bernard et al. 2004) mô tả kiến trúc của một ontology dựa trên
hệ thống khai phá và rút trích thông tin địa lý. Trong hệ thống này, các dịch
vụ đặc tính Web (Web Feature Services - WFS) khác nhau được mô tả
cùng với metadata bao gồm một tham chiếu đến một ứng dụng ontology.
Ứng dụng ontology này mô tả các kiểu đặc tính dưới dạng một ontology
chuyên ngành được chia xẻ. Các truy vấn của người dùng được xử lý như
sau: người dùng phát biểu các truy vấn của họ dưới dạng ontology chuyên
ngành được chia xẻ; sau đó, hệ thống mở rộng các giới hạn truy vấn của
người dùng bằng tên của các tính năng đã được lưu trữ trước đó. (Lutz và
Biểu diễn tri thức và ứng dụng Trang 12
12
Các ontology trong lĩnh vực thông tin địa lý
Klien 2006) đã cải tiến hệ thống này. Phiên bản thứ hai định nghĩa một
ngôn ngữ truy vấn và cung cấp một giao diện giúp người dùng xây dựng
các truy vấn từ các từ vựng chuyên ngành đã biết. Trong hệ thống này, tên
vựng thích hợp và tích hợp nội dung không đồng nhất từ các tập dữ liệu
khác nhau.
Liên quan đến các dịch vụ khai phá và rút trích thông tin địa lý, các
tiếp cận tương tự dựa trên mô tả theo hướng ontology của các truy vấn và
dịch vụ đã được đề xuất. Bằng cách sử dụng ontology để làm giàu các mô
tả dịch vụ, các ngữ nghĩa của chúng đã trở thành máy thông dịch và người
dùng được phép đặt ra các truy vấn xúc tích và biểu cảm. Hơn nữa, suy
luận logic được sử dụng để khám phá các mối quan hệ tiềm ẩn giữa các
thuật ngữ tìm kiếm và các mô tả dịch vụ.
2.2. Tích hợp dữ liệu trong các cơ sở dữ liệu không gian không đồng nhất
Các ứng dụng địa lý là một ví dụ cho sự cần thiết để đưa việc tích hợp
dữ liệu lên quy mô lớn. Điển hình là các nghiên cứu trong các lĩnh vực thời
tiết, môi trường, phát triển bền vững, quy hoạch sử dụng đất, quản lý đất
đai, các ứng dụng di động kèm theo… Thông hiểu ngữ nghĩa là yêu cầu bắt
buộc để khai phá và trích xuất thông tin cần thiết vào một cấu trúc phù hợp
cho việc tích hợp từ các nguồn dữ liệu. Các nhà nghiên cứu đã chỉ ra sự cần
thiết phải tập trung vào một lĩnh vực chuyên ngành mới có thể đạt được
mục tiêu chính của sự hiểu biết ngữ nghĩa.
Ontology xác định ngữ nghĩa độc lập với dữ liệu mà chúng đại diện và
phản ảnh được sự liên quan của dữ liệu mà không cần truy cập đến chúng.
Như vậy, một mô tả ngữ nghĩa cấp cao của thông tin địa lý cung cấp thêm
phương tiện mới để so sánh và tích hợp dữ liệu không gian. Ngoài ra, các
ontology còn cho phép tái sử dụng tri thức bằng dữ liệu mô tả ngữ nghĩa
được phát sinh từ sự đồng thuận của các cộng đồng GIS khác nhau.
(Kashyap and Sheth 1996) trình bày một phân loại ngữ nghĩa để minh
họa sự tương đồng ngữ nghĩa giữa hai đối tượng liên quan dựa trên một
nguyên tắc phân loại có cấu trúc. Ngày nay, tích hợp thông minh đã được
áp dụng để tích hợp cơ sở dữ liệu không đồng nhất.
Biểu diễn tri thức và ứng dụng Trang 14
14
của hệ thống thông tin. Trong ODIS, ontology được gọi là ontology ứng
dụng và nó là một đặc tả của một ontology chuyên ngành và ontology tác
vụ (Guarino 1998). Sự khác biệt giữa hệ thống thông tin hướng ontology
với các hệ thống thông tin khác là ontology này thậm chí còn được thực
1
2 />Biểu diễn tri thức và ứng dụng Trang 15
15
Các ontology trong lĩnh vực thông tin địa lý
hiện một cách tường minh trước khi hệ thống thông tin được thiết kế. Theo
giải thích của (Fonseca 2007), bằng cách sử dụng ontology trong giai đoạn
phát triển hệ thống cho phép các nhà thiết kế thực hành ở mức độ cao hơn
việc sử dụng lại tri thức so với việc sử dụng các công nghệ phần mềm
thường dùng. Việc sử dụng một vốn từ vựng phổ biến trên các nền tảng các
phần mềm không đồng nhất cung cấp việc tái sử dụng và chia xẻ các tri
thức chuyên ngành của ứng dụng. Vì vậy, các nhà thiết kế có thể tập trung
vào cấu trúc của lĩnh vực thay vì quá quan tâm đến các chi tiết thực thi.
Phát triển và sử dụng các ontology nên là một điều kiện tiên quyết để mô
hình hóa khái niệm. Các ontology có các ý nghĩa rộng hơn so với các lược
đồ khái niệm. Tại thời gian chạy, một ontology có thể tạo ra các giao tiếp
giữa các phần mềm hoặc được dùng để hỗ trợ việc tích hợp thông tin.
Cách tiếp cận của Fonseca cũng được liên kết với một tiếp cận gần
đây của công nghệ phần mềm được gọi là Model Driven Engineering
(MDE) hay Model Driven Development (MDD). MDD tập trung vào các
mô hình như là sản phẩm chính trong quá trình phát triển với các biến đổi
như là hoạt động chính của các mô hình. Hướng tiếp cận mới này cho phép
tập trung các nỗ lực vào việc mô hình hóa các chức năng hệ thống thay vì
các chi tiết cụ thể. Ứng dụng nối tiếp của biến đổi mô hình tạo thuận lợi
cho việc chuyển hóa mô hình ban đầu vào một ứng dụng nền cụ thể.
(Grangel et al. 2007) mô tả các nội dung chính cho việc áp dụng hướng tiếp
cận MDD này trong lĩnh vực đô thị.
ngành toàn cầu và hiện nay nó đang cố gắng để bao gồm hết các đặc tính
thủy văn được thể hiện trên bản đồ. Phiên bản cuối cùng của ontology này
được hoàn thành vào giữa năm 2008.
hydrOntology có 150 lớp, 34 thuộc tính đối tượng, 66 thuộc tính dữ
liệu và 256 tiên đề. Một số mẫu ví dụ của bốn quan hệ phân loại được định
nghĩa trong Frame Ontology (Farquahr et al. 1997) và OKBC Ontology
(Chaudhri et al. 1998) tên là Subclasses, Disjoint-Decomposition,
Exhaustive-Decomposition và Partitions đã được thể hiện trong ontology
3 Từ điển địa dư (gazetteer) là một từ điển địa lý hoặc thư mục địa lý, là một tài liệu tham khảo quan
trọng đối với thông tin về địa điểm và tên địa danh, được sử dụng kết hợp với một bản đồ hoặc một atlas.
Nó thường chứa thông tin liên quan đến các điều kiện địa lý của một quốc gia, khu vực hay lục địa cùng
với các số liệu thống kê về kinh tế, xã hội và các đặc điểm vật lý chẳng hạn như núi, sông, đường Ví dụ,
các thông tin được cung cấp bởi từ điển địa dư thường bao gồm vị trí địa điểm, kích thước các đặc điểm
vật lý, dân số, GDP, tỷ lệ biết chữ… Những thông tin này thường được chia thành các chủ đề phía trên và
các mục được liệt kê phía dưới theo thứ tự bảng chữ cái.
Biểu diễn tri thức và ứng dụng Trang 17
17
Các ontology trong lĩnh vực thông tin địa lý
này. Nội dung chi tiết được trình bày trong (Vilches-Blázquez et al. 2007).
Các tài liệu của ontology này rất đầy đủ, vì vậy, các định nghĩa và nguồn
gốc các định nghĩa đều được tìm thấy trong mỗi khái niệm (mỗi lớp).
Ontology này có một lượng lớn các nhãn với những tên thay thế (từ đồng
nghĩa) cũng như khái niệm và xuất xứ của từ đồng nghĩa.
Để phát triển ontology này theo hướng tiếp cận từ trên xuống, hơn 20
mô hình tri thức khác nhau như: các danh mục chức năng của IGN-E, the
Water Framework European Directive, the Alexandria Digital Library, the
UNESCO Thesaurus, Getty Thesaurus, GeoNames, FACC codes,
EuroGlobalMap, EuroRegionalMap, EuroGeonames, các từ điển địa dư
Tây ban nha và nhiều nguồn khác, đã được tham khảo. Ngoài ra, một số
vấn đề tích hợp thông tin địa lý và tiêu chí cấu trúc cũng đã được xem xét
BCN200) và hai là từ điển địa dư (Conciso Gazetteer và National
Geographic Gazetteer). Cuối cùng, đối với các cơ sở dữ liệu địa phương,
dự án sử dụng hai cơ sở dữ liệu, một được phát triển bởi các nhà sản xuất
bản đồ địa phương (Viện bản đồ Andalusia - Cartographic Institute of
Andalusia) và một được phát triển bởi các nhà sản xuất bản đồ chuyên đề
(Liên đoàn thủy văn sông Ebro - Hydrographical Confederation of Ebro River).
Hình 1: Tổng quan về các bao hàm giữa hydrOntology và các cơ sở dữ liệu
Trong bối cảnh các cơ sở dữ liệu này, sự hiểu biết ngữ nghĩa đạt được
bằng cách thiết lập các bao hàm giữa hydrOntology và các cơ sở dữ liệu
Biểu diễn tri thức và ứng dụng Trang 19
19
Các ontology trong lĩnh vực thông tin địa lý
khác nhau thông qua ngôn ngữ R2O (Barrasa et al. 2004). Các bao hàm vẫn
còn trong tiến trình xây dựng và cải thiện mối quan hệ giữa các đặc tính (từ
ontology) và các thể hiện (từ cơ sở dữ liệu). Hình 1 cho thấy tổng quan về
công việc này.
Một khi hydrOntology được hợp nhất như là một khuôn khổ hài hòa
cho cộng đồng các nhà sản xuất thông tin địa lý, giai đoạn thứ hai sẽ bao
gồm một khuôn khổ tích hợp phức tạp của các cơ sở dữ liệu và các
ontology. Hình 2 mô tả tổng quan về cách tiếp cận tích hợp này. Tiếp cận
này liên quan đến các phương pháp tiếp cận lai được đề xuất bởi (Wache et
al. 2001). Trong phương pháp tiếp cận lai, hydrOntology sẽ cung cấp vốn
từ vựng chia xẻ toàn cầu và mỗi nhà sản xuất (châu Âu, khu vực và địa
phương) sẽ có một ontology địa phương được thiết lập ánh xạ với ontology
toàn cầu và cơ sở dữ liệu của nó. Việc áp dụng phương pháp này làm cho
các dịch vụ web từ điển địa dư SDI của Tây ban nha cung cấp câu trả lời
tốt hơn và phong phú hơn.
Hình 2: Phương pháp tiếp cận lai của hydrOntology
3.2. Một ontology tiếp cận từ dưới lên trong dự án tái cấu trúc dữ liệu
không gian
Biểu diễn tri thức và ứng dụng Trang 21
21
Các ontology trong lĩnh vực thông tin địa lý
Hình 3: Phương pháp tiếp cận từ dưới lên theo lý thuyết và ứng dụng thực tế của nó
(Chaidron et al. 2007)
2. Ở giai đoạn này, có hai lựa chọn tùy thuộc vào sự hợp tác của các
nhà thiết kế cơ sở dữ liệu:
a. Sự phù hợp của các ontology dẫn xuất có thể được kiểm tra
bằng cách so sánh chúng với các cơ sở dữ liệu phổ biến có liên
quan.
b. Nếu có thể, bước tiếp theo là gửi bản thảo các ontology đến các
nhà thiết kế cơ sở dữ liệu. Một vấn đề quan trọng ở giai đoạn
này là phải bảo đảm chắc rằng cả hai “đội” đều sử dụng cùng
một ngôn ngữ, cùng các khái niệm. Mỗi khái niệm phải có một
định nghĩa. Định nghĩa này bao gồm một mô tả bằng văn bản và
Biểu diễn tri thức và ứng dụng Trang 22
22
Các ontology trong lĩnh vực thông tin địa lý
một biểu thức hình thức thể hiện các mối quan hệ của nó với
các khái niệm khác.
3. Các ghi chú được xây dựng bởi các nhà thiết kế cơ sở dữ liệu phải
được thêm vào trong quá trình chiết xuất các ontology và các
ontology mới phải được cập nhật và cung cấp liên tục cho đến khi
có được bản chấp thuận cuối cùng.
Một số khó khăn nảy sinh trong ứng dụng thực tế của phương pháp
tiếp cận này. Trước hết là các tài liệu hiện có không được đầy đủ và không
được chuẩn hóa; các lược đồ đặc tả quan hệ, danh sách dữ liệu đơn giản,
các đặc tả thu thập dữ liệu (như các không ảnh và các số liệu khảo sát, đo
đạc đất đai). Kết quả là chỉ có một vài liên kết theo phân cấp và chủ đề
được rút ra từ các tài liệu này. Khi đó, các nhà thiết kế cơ sở dữ liệu thất
Nghiên cứu này làm rõ vai trò của ontology trong việc thiết kế và tái
cấu trúc các SDB. Nếu mức độ ontology này là cần thiết cho việc thiết kế
cơ sở dữ liệu (và cả khả năng tương thích) (Frank 1997, Smith và Mark
1998) thì các ontology liên quan lại không phải lúc nào cũng được hình
thức hóa. Vì vậy, các ontology SDB địa phương thường được ẩn trong các
SDB và các tài liệu liên quan (như danh mục tính năng và các CDM).
Trong trường hợp này, có thể trích xuất chúng từ các tài liệu bằng cách áp
dụng hướng tiếp cận từ dưới lên. Quá trình này có thể được cải thiện bằng
Biểu diễn tri thức và ứng dụng Trang 24
24
Các ontology trong lĩnh vực thông tin địa lý
cách tạo ra một sự phối hợp tốt với nhà thiết kế cơ sở dữ liệu ban đầu khi
cơ sở dữ liệu không được lập tài liệu tốt.
Từ kinh nghiệm của dự án, việc trích xuất các ontology địa phương
(và các định nghĩa đối tượng liên quan) hàm ý một tri thức rất tốt về các
mối quan hệ không gian giữa các đối tượng của cơ sở dữ liệu. Các chuyên
gia của dự án tin rằng một phân tích toàn diện các mối quan hệ không gian
giữa các thể hiện nên là bước đầu tiên trong việc trích xuất các ontology địa
phương.
3.3. Cho phép định vị địa lý thông qua các ontology
Nghiên cứu này liên quan đến việc sử dụng các ontology trong việc
chú giải ngữ nghĩa của các dịch vụ mã hóa địa lý trong một hệ thống tích
hợp các dịch vụ mã hóa địa lý khác nhau. Nghiên cứu này được mô tả chi
tiết trong (Florczyk et al. 2009), giải quyết việc mã hóa địa lý của các địa
chỉ trong đô thị bằng cách sử dụng các dịch vụ mã hóa địa lý khác nhau
như là một dịch vụ mã hóa địa lý của hội đồng địa phương, một dịch vụ mã
hóa địa lý địa chính quốc gia và một dịch vụ từ điển địa dư quốc gia. Các
ontology được sử dụng ở đây để giải quyết sự bất đồng ngữ nghĩa giữa các
kết quả thu được từ các dịch vụ khác nhau dưới dạng một địa chỉ.
Ở Tây ban nha, Hội đồng thành phố Zaragoza xây dựng SDI của họ