Luận văn thạc sĩ công nghệ thông tin Vận dụng khả năng tìm kiếm của hệ thống truy vấn mờ để xây dựng modul tích hợp vào SQL server nhằm hỗ trợ cho hệ thống trả lời truy vấn linh hoạt - Pdf 24

Trang 1

LỜI CẢM ƠN
Trƣớc tiên, tôi thể hiện sự biết ơn sâu sắc đến cha mẹ tôi, những ngƣời
đã nuôi nấng tôi nên ngƣời, là chỗ dựa tinh thần vững chắc để tôi tự tin
bƣớc vào đời. Kế tiếp, tôi xin gửi lời cảm ơn tới PGS.TS Đặng Trần
Khánh, ngƣời đã cho tôi những ý tƣởng quý báu, mới lạ, hƣớng dẫn tận
tình và đầy lòng nhiệt huyết. Bên cạnh đó, tôi cũng chân thành cảm ơn
chồng tôi, ngƣời luôn ủng hộ và tạo mọi điều kiện để tôi có thể hoàn
thành chƣơng trình học cũng nhƣ quá trình thực hiện luận văn. Cuối cùng
là lời cảm ơn tới những ngƣời đồng nghiệp đã đóng góp cho tôi những ý
kiến bổ ích để tôi hòan thiện luận văn này.

MỤC LỤC
LỜI CẢM ƠN 1
DANH MỤC CÁC HÌNH VẼ 6
Trang 2

CHƢƠNG 1: GIỚI THIỆU 7

4.5. Các điều kiện thêm vào 55
4.6. Việc thực hiện hệ thống VQS: 56
4.7.Nhúng VQS vào hệ thống thông tin bất động sản 57
5. Xử lý kết nối mờ trong VQS: 58
6. Tích hợp thêm các điều kiện sắp xếp mờ: 63
7. Kết luận 68
CHƢƠNG 4: XÂY DỰNG HỆ THỐNG HỖ TRỢ TRẢ LỜI TRUY
VẤN LINH HOẠT VÀO SQL SERVER 69
1. Giới thiệu 69
2. Một số tập lệnh SQL cơ bản dùng để xây dựng VQS 69
2.1. Dạng chuẩn của truy vấn SQL trong SQL Server: 69
2.2. Một số phép toán và hàm có sẵn để xây dựng ngôn ngữ VQS 70
2.3. Hàm do ngƣời dùng định nghĩa 70
2.4. Chuẩn bị dữ liệu hỗ trợ cho việc tìm kiếm gần đúng 73
2.4.1.Các quan hệ và siêu dữ liệu 73
Trang 4

2.4.2.Khung nhìn 74
2.5. Xây dựng ngôn ngữ truy vấn mờ mở rộng 75
3. Thử nghiệm và đánh giá 77
3.1. Các giao diện modun quản lý 78
Hình 4.3 Giao diện quản lý siêu dữ liệu dành cho ngƣời quản trị 79
3.2. Các giao diện thực thi ngôn ngữ VQS gốc 79
4. Kết luận chƣơng 81
CHƢƠNG 5: TỔNG KẾT VÀ HƢỚNG PHÁT TRIỂN 82
1. Tổng kết 82
2. Hƣớng nghiên cứu trong tƣơng lai 82

RDBMSs

IR
FD
Content-Based Image
Retrieval
DataBase Management System
Incremental hyper-Cube
Approach
Incremental hyper-Sphere
Approach
Flexible Query Answering
System
Multidimensional Access
Method
Numeric Coordinate
Representation
Structured Query Language
Property Information Systems

Vague Query Language
Vague Query System
Relation Database
Management Syterms
Information Retrival
Fuzzy Database
Truy tìm hình ảnh dựa vào nội
dung
Hệ quản trị cơ sở dữ liệu
Phƣơng pháp mở rộng siêu

Hình 3.4 Một ví dụ về sử dụng các bảng NCR 38
Hình 3.5 Sơ đồ kiến trúc tổng quát của hệ thống [4] 40
Hình 3.6 Mẫu dữ liệu bất động sản 45
Hình 3.7 Khung nhìn đƣợc chuẩn bị cho ứng dụng VQS 46
Hình 3.8 Các bảng NCR trong dữ liệu mẫu về hệ thống thông tin bất
động sản 49
Hình 3.9 Minh họa về việc ánh xạ các bảng NCR đến các trƣờng mờ 50
Hình 3.10 Tập kết quả đã đƣợc sắp xếp của truy vấn mẫu 53
Hình 3.11 Tập kết quả đã đƣợc sắp xếp với độ ƣu tiên về vị trí địa lý 54
Hình 3.12 Tập kết quả đƣợc sắp xếp của một truy vấn với các điều kiện
cố định. 56
Hình 3.13 PIS-VQL Adapter với các khả năng truy vấn mờ 58
Hình 3.14 Mô tả chính thức của ngôn ngữ VQL mở rộng 61
Hình 3.15: Cú pháp mở rộng ngôn ngữ truy vấn mờ. 64
Hình 3.16 : Bảng 1 - thông tin KHACH_SAN 66
Hình 3.17 Bảng 2 - Tập kết quả 67
Hình 4.1 Các quan hệ và các bảng miêu tả tọa độ số 74
Hình 4.2 Khung nhìn làm nguồn dữ liệu chính 75
Trang 7

Hình 4.4 Giao diện thực thi ngôn ngữ VQL 79
Hình 4.5 Kết quả của truy vấn mờ 80 Trang 8

CHƢƠNG 1: GIỚI THIỆU
1. Lý do chọn đề tài:
Trong suốt nhiều thập kỉ qua, mô hình cơ sở dữ liệu quan hệ đã
chiếm lĩnh thị trƣờng và rất thành công trong việc thỏa mãn phần lớn các

trang web đã cung cấp nhiều thông tin với công cụ hỗ trợ tìm kiếm, nhƣng
đến nay vẫn chƣa có một hệ thống hỗ trợ tìm kiếm nào đáp ứng tốt đƣợc
nhu cầu thông tin cho ngƣời dùng. Điều đó cho thấy cần phải có một sự
đầu tƣ đúng mức trong việc xây dựng dịch vụ hỗ trợ tìm kiếm thực sự
hiệu quả, đồng thời thực tế cho nhu cầu hiện tại và tƣơng lai.
Bài tóan đặt ra: khi một khách hàng tìm kiếm thông tin của một sản
phẩm: ví dụ tìm kiếm thông tin về bất động sản để mua một căn nhà diện
tích 100m
2
, kích thƣớc mặt tiền 5m hƣớng đông với giá 1.000đ thuộc khu
vực Quận 2, ngƣời khách hàng này sẽ không tìm thấy trong hệ thống quản
lý cơ sở dữ liệu truyền thống nếu nhƣ không có căn nhà nào nhƣ vậy. Và
khi đó, hệ thống sẽ trả về một kết quả rỗng và dĩ nhiên ngƣời khách hàng
cảm thấy hơi thất vọng. Trên thực tế thì ngƣời khách hàng này có lẽ chấp
nhận một thông tin rằng có ít nhất một căn nhà có diện tích lớn hơn hoặc
nhỏ hơn 100m
2
, hoặc giá bán lớn hơn hoặc nhỏ hơn 1.000đ, thậm chí cũng
chấp nhận thông tin rằng căn nhà đó có địa chỉ không thuộc quận 2 mà
thuộc quận khác.
Để giải quyết bài tóan này, giải pháp là: biểu diễn lại các giá trị
không phải là số trong cơ sở dữ liệu bằng các tọa độ số trong không gian
đặc trƣng và thông tin này đƣợc lƣu trữ trong các bảng biểu diễn tọa độ
số. Từ đó việc xác định độ tƣơng tự về ngữ nghĩa đƣợc tính toán trên các
Trang 10

bảng biểu diễn tọa độ số đƣợc dễ dàng và có độ chính xác cao, nhất là
trong không gian dữ liệu nhiều đặc trƣng, nhiều chiều. Đồng thời sử dụng
hệ thống hỗ trợ trực tiếp khả năng truy vấn mờ VRC (Vague Retrieval
Capabilities) để xây dựng một hệ thống hỗ trợ tìm kiếm một cách linh

VQS) và nhu cầu dữ liệu (từ DBMS) cho ngƣời sử dụng. Luận văn nhằm
tận dụng các khả năng tìm kiếm của hệ thống VQS đã đƣợc xây dựng
trong [4] để mở rộng thêm toán tử so sánh tƣơng tự cho ngôn ngữ SQL
chuẩn, gọi là ngôn ngữ VQL (Vague Query Language), từ đó chúng tôi sẽ
lựa chọn giải pháp đơn giản và hiệu quả nhất để tích hợp khả năng tìm
kiếm của VQS vào hệ quản trị cơ sở dữ liệu SQL Server 2008, phục vụ
nhu cầu tìm kiếm cho hệ thống thông tin bất động sản nói riêng và các hệ
thống truy tìm thông tin hiện đại nói chung.
Đề tài còn xây dựng mô đun quản trị và mô đun thực thi các truy vấn
mờ "on top" để trả lời các câu hỏi linh hoạt hơn, từ đó mở rộng dịch vụ
tìm kiếm và tích hợp khả năng này vào hệ quản trị SQL Server 2008 sao
cho hệ thống phải đảm bảo đƣợc tính ổn định, vận hành trơn tru và dễ sử
dụng, đáp ứng đƣợc nhu cầu tìm kiếm hiện tại của ngƣời dùng muốn tìm
kiếm thông tin về bất động sản.
Luận văn này cũng đi vào việc giới thiệu thêm những nghiên cứu
mới cho việc thiết lập lại về mặt toán học cho khái niệm VQS theo nghĩa
của quan hệ mờ.
Trang 12

3. Đối tƣợng và phạm vi nghiên cứu:
Đối tƣợng nghiên cứu là cơ sở dữ liệu lƣu tất cả các thông tin cần tìm
kiếm liên quan đến bất động sản: phòng trọ, nhà, căn hộ, đất, mặt bằng ;
hệ quản trị cơ sở dữ liệu SQL Server 2008. Các giải thuật về tính khoảng
cách, tìm kiếm lân cận gần nhất dựa vào ngữ nghĩa.
Đề tài đƣợc thực hiện trên việc khai thác dữ liệu từ hệ thống cơ sở dữ
liệu của các trang thông tin mua bán cho thuê bất động sản trên Internet
và các phòng giao dịch bất động sản.
4. Phƣơng pháp nghiên cứu:
Các phƣơng pháp nghiên cứu đƣợc sử dụng để thực hiện đề tài:
- Khảo sát, thu thập dữ liệu: tập hợp các nguồn dữ liệu liên quan đến

này có nghĩa là tập kết quả chỉ bao gồm dữ liệu hoàn toàn trùng khớp với
truy vấn tƣơng ứng.
Trang 14

+ Dữ liệu chính xác, truy vấn mờ và kết quả mờ (Crisp Data, Fuzzy
Query, and Fuzzy Result – CDFQ_FR): Mô hình này khác với
CDCQ_CR ở các truy vấn và tập kết quả. Với mô hình này hệ thống sẽ
cho phép các giá trị mờ chẳng hạn nhƣ "dài", "ngắn", "cao", "thấp"
Chẳng hạn chúng ta có thể thực hiện một truy vấn liên quan đến học sinh
một trƣờng học nhƣ tìm các học sinh có điểm số cao, và truy vấn có thể
đƣợc biểu diễn nhƣ sau: "Tìm tất cả các học sinh có điểm cao". Trong
trƣờng hợp này, tìm điểm cao là một truy vấn mờ và do đó tập kết quả là
mờ.
+ Dữ liệu mờ, truy vấn mờ và kết quả mờ (Fuzzy Data, Fuzzy Query,
and Fuzy Result – FDFQ_FR): Đây là một đặc điểm đặc trƣng của một hệ
thống cơ sở dữ liệu mờ cơ bản, hệ thống có thể lƣu trữ các kiểu dữ liệu
không chính xác khác nhau, ví dụ: tuổi của Long trẻ, dáng ngƣời của
Minh là cao, v.v Trong các hệ thống này, việc định nghĩa các thuộc tính
mờ ("trẻ", "cao") và các phép so sánh mờ ("lớn hơn nhiều") đƣợc cung
cấp để cho phép ngƣời sử dụng có thể xác định các truy vấn mờ.
+ Dữ liệu chính xác, truy vấn chính xác và kết quả mờ (Crisp Data,
Crisp Query, and Fuzzy Result – CDCQ_FR): Các hệ thống làm cho phù
hợp với mô hình này có thể trả về các kết quả cho một truy vấn chính xác
nhƣng các kết quả phù hợp với truy vấn chỉ là xấp xỉ. Một truy vấn minh
họa cho các hệ thống nhƣ thế này có thể đƣợc diễn đạt nhƣ sau: "Tìm các
căn hộ có giá khoảng 1000". Ở đây "khoảng" là yếu tố mờ trong truy vấn,
tuy nhiên nó không phải là một giá trị mờ mà chỉ là một toán tử mờ.
Trang 15

1.2. Các giải pháp dựa trên nền tảng mờ (Fuzzy Based


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status