Phương pháp phân cụm dữ liệu không gian và
ứng dụng trong việc xác định vị trí tối ưu đặt
máy ATM
Nguyễn Sơn
Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Hệ thống Thông tin; Mã số: 60 48 05
Người hướng dẫn: PGS.TS Đặng Văn Đức
Năm bảo vệ: 2011
Abstract: Tổng quan về Hệ thông tin Địa lý (GIS) và khai phá dữ liệu không gian.
Khái quát về phân cụm dữ liệu và một số phương pháp phân cụm dữ liệu không gian.
Xây dựng chương trình thử nghiệm ứng dụng phân cụm dữ liệu không gian hỗ trợ tìm
vị trí tối ưu đặt máy ATM trong khu vực nội thành Hà Nội, đánh giá các kết quả đạt
được cũng như những hạn chế còn tồn tại.
Keywords: Khai thác dữ liệu; Công nghệ thông tin; ATM; Dữ liệu
Content
CHƯƠNG 1. MỞ ĐẦU
Khai phá dữ liệu không gian hay còn gọi là khai phá tri thức từ dữ liệu không gian là
một lĩnh vực có nhu cầu rất cao. Bởi lẽ dữ liệu đầu vào ở đây bao gồm một khối lượng dữ liệu
không gian khổng lồ đã được thu thập từ nhiều ứng dụng khác nhau, từ thiết bị viễn thám đến
hệ thống thông tin địa lý, từ bản đồ số, từ các hệ thống quản lý và đánh giá môi trường,
…Việc phân tích và khai thác lượng thông tin khổng lồ này ngày càng tạo ra các thách thức
và khó khăn, đòi hỏi phải có các nghiên cứu sâu hơn để tìm ra các kỹ thuật khai phá dữ liệu
hiệu quả hơn.
Trong những năm gần đây, việc nghiên cứu về khai phá dữ liệu đã có xu hướng chuyển
từ cơ sở dữ liệu quan hệ và cơ sở dữ liệu giao dịch sang cơ sở dữ liệu không gian. Sự thay đổi
này không những giúp hiểu được dữ liệu không gian mà còn giúp khám phá được mối quan
nghiệm một ứng dụng sử dụng kỹ thuật phân cụm dữ liệu địa lý, trong đó khai thác thông tin
địa lý của các đối tượng địa lý có tầm ảnh hưởng quan trọng đến vị trí đặt các máy ATM như:
các siêu thị, trung tâm thương mại, khách sạn, nhà hàng, khu đông dân cư, đường giao
thông… để hỗ trợ giải quyết bài toán tìm vị trí tối ưu đặt các máy ATM trong thành phố Hà
Nội.
Luận văn được chia thành các chương mục sau:
- Chương 1: Mở đầu, giới thiệu bài toán
- Chương 2: Tổng quan về Hệ thông tin Địa lý (GIS) và khai phá dữ liệu không gian.
- Chương 3: Một số phương pháp phân cụm dữ liệu không gian
- Chương 4: Xây dựng chương trình thử nghiệm ứng dụng phân cụm dữ liệu không gian
hỗ trợ tìm vị trí tối ưu đặt máy ATM trong khu vực nội thành Hà Nội.
- Chương 5: Kết luận, đánh giá
References
Tiếng Việt [DVD01]
Đặng Văn Đức (2001), Hệ thống thông tin địa lý, NXB Khoa học và kỹ thuật,
Hà Nội.
3
Tiếng Anh [BEKS90]
Beckmann N., Kriegel P., Schneider R., Seeger B. (1990), “The R*-tree: An
Information Systems , 129-144.
[ESFKS00]
Ester, M., Frommelt, A., Kriegel, H P., & Sander, J. (2000), “Spatial data
mining: database primitives, algorithms and efficient DBMS support”, Data
Mining and Knowledge Discovery , 193-216.
[ESKSX96]
Ester, M., Kriegel, H P., Sander, J., & Xu, X. (1996), “A density-based
algorithm for discovering clusters in large spatial databases with noise”,
Second Int. Conf. on Knowledge Discovery and Data Mining , (pp. 226-231).
Portland, Oregon.
[ESKS01]
Ester, Hans-Peter Kriegel, Jörg Sander (2001), “Algorithms and Applications
for Spatial Data Mining”, Published in Geographic Data Mining and
Knowledge Discovery, Research Monographs in GIS, Taylor and Francis.
[FSSU96]
M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, and Ramasamy
Uthurusamy (1996), Advances in Knowledge Discovery and Data Mining.
AAAI Press/ The MIT Press.
[HAKT01]
Han, J., Kamber, M., & Tung, A. (2001), “Spatial clustering methods in data
mining: A Survey”. In Geographic Data Mining and Knowledge Discovery
(pp. 1 - 29). Taylor and Francis. 4
[OCT97]
Octavian P.(1997), Data Structures for Spatial Database Systems.
[ODC03]
Oracle (2003), Oracle Data Mining Concepts 10g Release 1 (10.1), Oracle
Corporation.
[RAJI02]
Raymond T. Ng, Jiawei Han, CLARANS (2002): “A Method for Clustering
Objects for Spatial Data Mining”, IEEE, 9-10.
[ROTE91]
Rote, G. (1991) “Computing the minimum Hausdorff distance between two
point sets on a line under translation”. Information Processing Letters , 123-
127.
[SOGHA08]
Song Y-C., O’Grady M. J., O’Hare G. M. P. (2008), “Research and
Application of Clustering Algorithm for Arbitrary Data Set”, IEEE.
[TAPA04]
Tao Y., Papadias D. (2004), “Performance Analysis of R*-trees with
Arbitrary Node Extents”, IEEE.
[TOB79]
Tobler, W. (1979). “Cellular Geography, Philosophy in Geography”.
Dordrecht, Reidel: Gale and Olsson, Eds.
[THISU08]
Thirumurugan S., Suresh L. (2008), Statistical Spatial Clustering using