Luận văn thạc sĩ công nghệ thông tin vận dụng khả năng tìm kiếm của hệ thống truy vấn mở để xây dựng môdun tích hợp vào sql server nhằm hỗ trợ cho hệ thống trả lời truy vấn - Pdf 23



LỜI CẢM ƠN
Trước tiên, tôi thể hiện sự biết ơn sâu sắc đến cha mẹ tôi, những người
đã nuôi nấng tôi nên người, là chỗ dựa tinh thần vững chắc để tôi tự tin
bước vào đời. Kế tiếp, tôi xin gửi lời cảm ơn tới PGS.TS Đặng Trần
Khánh, người đã cho tôi những ý tưởng quý báu, mới lạ, hướng dẫn tận
tình và đầy lòng nhiệt huyết. Bên cạnh đó, tôi cũng chân thành cảm ơn
chồng tôi, người luôn ủng hộ và tạo mọi điều kiện để tôi có thể hoàn
thành chương trình học cũng như quá trình thực hiện luận văn. Cuối cùng
là lời cảm ơn tới những người đồng nghiệp đã đóng góp cho tôi những ý
kiến bổ ích để tôi hòan thiện luận văn này.
MỤC LỤC

4.2. Truy vấn mờ trong hệ thống thông tin bất động sản: 37
4.3. Định nghĩa siêu thông tin ngữ nghĩa 41
4.4. Thực thi các truy vấn mờ 44
4.5. Các điều kiện thêm vào 49
4.6. Việc thực hiện hệ thống VQS: 50
4.7.Nhúng VQS vào hệ thống thông tin bất động sản 51
5. Xử lý kết nối mờ trong VQS: 52
6. Tích hợp thêm các điều kiện sắp xếp mờ: 57
7. Kết luận 62
CHƯƠNG 4: XÂY DỰNG HỆ THỐNG HỖ TRỢ TRẢ LỜI TRUY
VẤN LINH HOẠT VÀO SQL SERVER 63
1. Giới thiệu 63
2. Một số tập lệnh SQL cơ bản dùng để xây dựng VQS 63
2.1. Dạng chuẩn của truy vấn SQL trong SQL Server: 63
2.2. Một số phép toán và hàm có sẵn để xây dựng ngôn ngữ VQS 64 2.3. Hàm do người dùng định nghĩa 64
2.4. Chuẩn bị dữ liệu hỗ trợ cho việc tìm kiếm gần đúng 67
2.4.1.Các quan hệ và siêu dữ liệu 67
2.4.2.Khung nhìn 68
2.5. Xây dựng ngôn ngữ truy vấn mờ mở rộng 69
3. Thử nghiệm và đánh giá 71
3.1. Các giao diện modun quản lý 72
Hình 4.3 Giao diện quản lý siêu dữ liệu dành cho người quản trị 73
3.2. Các giao diện thực thi ngôn ngữ VQS gốc 73
4. Kết luận chương 75
CHƯƠNG 5: TỔNG KẾT VÀ HƯỚNG PHÁT TRIỂN 76
1. Tổng kết 76
2. Hướng nghiên cứu trong tương lai 76


VQL
VQS
RDBMSs

IR
FD
Content-Based Image
Retrieval
DataBase Management System
Incremental hyper-Cube
Approach
Incremental hyper-Sphere
Approach
Flexible Query Answering
System
Multidimensional Access
Method
Numeric Coordinate
Representation
Structured Query Language
Property Information Systems

Vague Query Language
Vague Query System
Relation Database
Management Syterms
Information Retrival
Fuzzy Database
Truy tìm hình ảnh dựa vào nội

Hình 3.1 Ví dụ bảng NCR về các tên màu 27
Hình 3.2 Việc bình thường hóa sử dụng đường kính có ảnh hưởng 29
Hình 3.3 Mô tả chính thức của ngôn ngữ VQL 31
Hình 3.4 Một ví dụ về sử dụng các bảng NCR 32
Hình 3.5 Sơ đồ kiến trúc tổng quát của hệ thống [4] 34
Hình 3.6 Mẫu dữ liệu bất động sản 39
Hình 3.7 Khung nhìn được chuẩn bị cho ứng dụng VQS 40
Hình 3.8 Các bảng NCR trong dữ liệu mẫu về hệ thống thông tin bất
động sản 43
Hình 3.9 Minh họa về việc ánh xạ các bảng NCR đến các trường mờ 44
Hình 3.10 Tập kết quả đã được sắp xếp của truy vấn mẫu 47
Hình 3.11 Tập kết quả đã được sắp xếp với độ ưu tiên về vị trí địa lý 48
Hình 3.12 Tập kết quả được sắp xếp của một truy vấn với các điều kiện
cố định. 50
Hình 3.13 PIS-VQL Adapter với các khả năng truy vấn mờ 52
Hình 3.14 Mô tả chính thức của ngôn ngữ VQL mở rộng 55
Hình 3.15: Cú pháp mở rộng ngôn ngữ truy vấn mờ. 58
Hình 3.16 : Bảng 1 - thông tin KHACH_SAN 60
Hình 3.17 Bảng 2 - Tập kết quả 61
Hình 4.1 Các quan hệ và các bảng miêu tả tọa độ số 68
Hình 4.2 Khung nhìn làm nguồn dữ liệu chính 69 Hình 4.4 Giao diện thực thi ngôn ngữ VQL 73
Hình 4.5 Kết quả của truy vấn mờ 74

CHƯƠNG 1: GIỚI THIỆU

Lĩnh vực thương mại bất động sản là một trong những lĩnh vực kinh
doanh “nóng bỏng nhất hiện nay ở Việt Nam” với nhu cầu mua, bán, cho
thuê bất động sản thu hút sự quan tâm của nhiều người. Mặc dù có nhiều
trang web đã cung cấp nhiều thông tin với công cụ hỗ trợ tìm kiếm, nhưng
đến nay vẫn chưa có một hệ thống hỗ trợ tìm kiếm nào đáp ứng tốt được
nhu cầu thông tin cho người dùng. Điều đó cho thấy cần phải có một sự
đầu tư đúng mức trong việc xây dựng dịch vụ hỗ trợ tìm kiếm thực sự
hiệu quả, đồng thời thực tế cho nhu cầu hiện tại và tương lai.
Bài tóan đặt ra: khi một khách hàng tìm kiếm thông tin của một sản
phẩm: ví dụ tìm kiếm thông tin về bất động sản để mua một căn nhà diện
tích 100m
2
, kích thước mặt tiền 5m hướng đông với giá 1.000đ thuộc khu
vực Quận 2, người khách hàng này sẽ không tìm thấy trong hệ thống quản
lý cơ sở dữ liệu truyền thống nếu như không có căn nhà nào như vậy. Và
khi đó, hệ thống sẽ trả về một kết quả rỗng và dĩ nhiên người khách hàng
cảm thấy hơi thất vọng. Trên thực tế thì người khách hàng này có lẽ chấp
nhận một thông tin rằng có ít nhất một căn nhà có diện tích lớn hơn hoặc
nhỏ hơn 100m
2
, hoặc giá bán lớn hơn hoặc nhỏ hơn 1.000đ, thậm chí cũng
chấp nhận thông tin rằng căn nhà đó có địa chỉ không thuộc quận 2 mà
thuộc quận khác.
Để giải quyết bài tóan này, giải pháp là: biểu diễn lại các giá trị
không phải là số trong cơ sở dữ liệu bằng các tọa độ số trong không gian
đặc trưng và thông tin này được lưu trữ trong các bảng biểu diễn tọa độ
số. Từ đó việc xác định độ tương tự về ngữ nghĩa được tính toán trên các
bảng biểu diễn tọa độ số được dễ dàng và có độ chính xác cao, nhất là
giới thiệu khá rõ trong [4] là một sự mở rộng của các hệ quản trị cơ sở dữ
liệu (DBMS) trước đây, hệ thống VQS có thể tự động vận hành "on top"
trước khi DBMS truy tìm dữ liệu nhằm vừa đáp ứng nhu cầu thông tin (từ
VQS) và nhu cầu dữ liệu (từ DBMS) cho người sử dụng. Luận văn nhằm
tận dụng các khả năng tìm kiếm của hệ thống VQS đã được xây dựng
trong [4] để mở rộng thêm toán tử so sánh tương tự cho ngôn ngữ SQL
chuẩn, gọi là ngôn ngữ VQL (Vague Query Language), từ đó chúng tôi sẽ
lựa chọn giải pháp đơn giản và hiệu quả nhất để tích hợp khả năng tìm
kiếm của VQS vào hệ quản trị cơ sở dữ liệu SQL Server 2008, phục vụ
nhu cầu tìm kiếm cho hệ thống thông tin bất động sản nói riêng và các hệ
thống truy tìm thông tin hiện đại nói chung.
Đề tài còn xây dựng mô đun quản trị và mô đun thực thi các truy vấn
mờ "on top" để trả lời các câu hỏi linh hoạt hơn, từ đó mở rộng dịch vụ
tìm kiếm và tích hợp khả năng này vào hệ quản trị SQL Server 2008 sao
cho hệ thống phải đảm bảo được tính ổn định, vận hành trơn tru và dễ sử
dụng, đáp ứng được nhu cầu tìm kiếm hiện tại của người dùng muốn tìm
kiếm thông tin về bất động sản.
Luận văn này cũng đi vào việc giới thiệu thêm những nghiên cứu
mới cho việc thiết lập lại về mặt toán học cho khái niệm VQS theo nghĩa
của quan hệ mờ. 3. Đối tượng và phạm vi nghiên cứu:
Đối tượng nghiên cứu là cơ sở dữ liệu lưu tất cả các thông tin cần tìm
kiếm liên quan đến bất động sản: phòng trọ, nhà, căn hộ, đất, mặt bằng ;
hệ quản trị cơ sở dữ liệu SQL Server 2008. Các giải thuật về tính khoảng
cách, tìm kiếm lân cận gần nhất dựa vào ngữ nghĩa.
Đề tài được thực hiện trên việc khai thác dữ liệu từ hệ thống cơ sở dữ
liệu của các trang thông tin mua bán cho thuê bất động sản trên Internet
và các phòng giao dịch bất động sản.

dữ liệu quan hệ điển hình. Ở dạng này, chỉ các giá trị chính xác được lưu
trữ trong cơ sở dữ liệu, chỉ các truy vấn chính xác được nhập vào và cũng
chỉ các tập kết quả chính xác được trả về cho người dùng mà thôi. Điều
này có nghĩa là tập kết quả chỉ bao gồm dữ liệu hoàn toàn trùng khớp với
truy vấn tương ứng. + Dữ liệu chính xác, truy vấn mờ và kết quả mờ (Crisp Data, Fuzzy
Query, and Fuzzy Result – CDFQ_FR): Mô hình này khác với
CDCQ_CR ở các truy vấn và tập kết quả. Với mô hình này hệ thống sẽ
cho phép các giá trị mờ chẳng hạn như "dài", "ngắn", "cao", "thấp"
Chẳng hạn chúng ta có thể thực hiện một truy vấn liên quan đến học sinh
một trường học như tìm các học sinh có điểm số cao, và truy vấn có thể
được biểu diễn như sau: "Tìm tất cả các học sinh có điểm cao". Trong
trường hợp này, tìm điểm cao là một truy vấn mờ và do đó tập kết quả là
mờ.
+ Dữ liệu mờ, truy vấn mờ và kết quả mờ (Fuzzy Data, Fuzzy Query,
and Fuzy Result – FDFQ_FR): Đây là một đặc điểm đặc trưng của một hệ
thống cơ sở dữ liệu mờ cơ bản, hệ thống có thể lưu trữ các kiểu dữ liệu
không chính xác khác nhau, ví dụ: tuổi của Long trẻ, dáng người của
Minh là cao, v.v Trong các hệ thống này, việc định nghĩa các thuộc tính
mờ ("trẻ", "cao") và các phép so sánh mờ ("lớn hơn nhiều") được cung
cấp để cho phép người sử dụng có thể xác định các truy vấn mờ.
+ Dữ liệu chính xác, truy vấn chính xác và kết quả mờ (Crisp Data,
Crisp Query, and Fuzzy Result – CDCQ_FR): Các hệ thống làm cho phù
hợp với mô hình này có thể trả về các kết quả cho một truy vấn chính xác
nhưng các kết quả phù hợp với truy vấn chỉ là xấp xỉ. Một truy vấn minh
họa cho các hệ thống như thế này có thể được diễn đạt như sau: "Tìm các
căn hộ có giá khoảng 1000". Ở đây "khoảng" là yếu tố mờ trong truy vấn,
tuy nhiên nó không phải là một giá trị mờ mà chỉ là một toán tử mờ.

Trích đoạn Việc thực hiện hệ thống VQS:
Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status