BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ KHOA HỌC VÀ CÔNG NGHỆ
VIỆN ỨNG DỤNG CÔNG NGHỆ
-----------------
VŨ TRUNG KIÊN
NGHIÊN CỨU, PHÁT TRIỂN KỸ THUẬT ĐỊNH VỊ TRONG
NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi
LUẬN ÁN TIẾN SĨ KỸ THUẬT
HÀ NỘI-2019
BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ KHOA HỌC VÀ CÔNG NGHỆ
VIỆN ỨNG DỤNG CÔNG NGHỆ
-----------------
VŨ TRUNG KIÊN
NGHIÊN CỨU, PHÁT TRIỂN KỸ THUẬT ĐỊNH VỊ TRONG
NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Lân đã tận tình hướng dẫn và giúp đỡ tác giả trong quá trình nghiên cứu.
Tác giả xin chân thành cảm ơn Viện Ứng dụng Công nghệ - Bộ Khoa
học và Công nghệ đã tạo điều kiện thuận lợi để tác giả hoàn thành nhiệm vụ.
Tác giả cũng xin cảm ơn Trường Đại học Công nghiệp Hà Nội, là đơn vị chủ
quản, đã tạo điều kiện cho phép tác giả có thể tham gia nghiên cứu trong các
năm làm nghiên cứu sinh.
Tác giả cũng xin bày tỏ lòng cảm ơn sâu sắc đến TS. Hoàng Mạnh
Kha, người luôn đồng hành cùng tác giả trong thời gian nghiên cứu; xin chân
thành cảm ơn TS. Lê Văn Thái và các anh chị em đồng nghiệp thuộc khoa
Điện tử, trường Đại học Công nghiệp Hà Nội đã luôn tạo mọi điều kiện giúp
tác giả hoàn thành luận án.
Cuối cùng, tác giả xin bày tỏ lòng cảm ơn chân thành đến gia đình,
bạn bè, các đồng chí, đồng nghiệp đã luôn động viên, giúp đỡ tác giả vượt
qua mọi khó khăn để đạt được những kết quả nghiên cứu như ngày hôm nay.
i
MỤC LỤC
LỜI CAM ĐOAN .............................................................................................. i
LỜI CẢM ƠN ................................................................................................... ii
DANH MỤC HÌNH VẼ ................................................................................... iv
DANH MỤC BẢNG BIỀU, LƯỢC ĐỒ ......................................................... vi
DANH MỤC CÁC TỪ VIẾT TẮT ................................................................. vii
DANH MỤC CÁC KÝ HIỆU CHÍNH ............................................................. x
MỞ ĐẦU
....................................................................................................... 1
1. Tính cấp thiết của đề tài ............................................................................ 1
2.4. Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát
được do dropping. ....................................................................................... 44
2.5. Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát
được do censoring và dropping ................................................................... 46
2.6. Đánh giá sai số của các tham số trong GMM ước lượng được bằng
thuật toán EM .............................................................................................. 52
2.7. Kết luận chương 2 ................................................................................ 56
CHƯƠNG 3. ƯỚC LƯỢNG SỐ THÀNH PHẦN GAUSS TRONG MÔ
HÌNH MÔ TẢ PHÂN BỐ Wi-Fi RSSI ........................................................... 57
3.1. Đặt vấn đề ............................................................................................ 57
3.2. Các phương pháp ước lượng số thành phần Gauss trong GMM ......... 60
3.2.1. Ước lượng số thành phần Gauss trong GMM bằng phương pháp
PF ............................................................................................................ 60
3.2.2. Ước lượng số thành phần Gauss trong GMM bằng phương pháp
CF ............................................................................................................ 62
3.3. Ước lượng số thành phần Gauss trong GMM khi một phần dữ liệu
không quan sát được do censoring và dropping ......................................... 63
3.4. Đánh giá các thuật toán ước lượng số thành phần Gauss trong GMM....
..................................................................................................... 68
3.5. Kết luận chương 3 ................................................................................ 77
CHƯƠNG 4. XÂY DỰNG THUẬT TOÁN ĐỊNH VỊ VÀ CÁC KẾT QUẢ
iii
THỰC NGHIỆM IPS ...................................................................................... 78
4.1. Đặt vấn đề ............................................................................................ 78
4.2. Thuật toán định vị dựa trên phương pháp MaP ................................... 79
4.3. Các kết quả thực nghiệm IPS ............................................................... 82
4.3.1. Sai số định vị ................................................................................. 82
trong GMM được ước lượng bởi EM-CD-GMM ........................................... 56
Hình 3.1. Biểu đồ tần suất của Wi-Fi RSSI thu thập từ một AP ..................... 59
Hình 3.2. Thuật toán ước lượng số thành phần Gauss trong GMM bằng
phương pháp PF .............................................................................................. 61
Hình 3.3. Thuật toán ước lượng số thành phần Gauss trong GMM bằng
phương pháp CF .............................................................................................. 63
Hình 3.4. Thuật toán EM-CD-GMM-PFBIC-CD ................................................ 67
Hình 3.5. Biểu đồ tần suất của tập dữ liệu mô phỏng được tạo bằng hàm ngẫu
nhiên với J=2 ................................................................................................... 76
Hình 3.6. Tương quan giữa số mẫu dữ liệu và xác suất ước lượng đúng số
thành phần Gauss khi c 92dBm và 0.1 .............................................. 76
v
Hình 4.1. Mặt bằng mô phỏng được tạo trên Matlab ...................................... 83
Hình 4.2. CDF của sai số định vị sau 1000 lần thực nghiệm với dữ liệu mô
phỏng
..................................................................................................... 86
Hình 4.3. Mặt bằng của khu vực thực nghiệm IPS ......................................... 87
Hình 4.4. Giao diện của phần mềm thu thập Wi-Fi RSSI ............................... 87
Hình 4.5. Nội dung các file *.xml chứa Wi-Fi RSSI thu thập từ các AP khác
nhau
..................................................................................................... 88
Hình 4.6. Tổng hợp dữ liệu thu thập được trong giai đoạn huấn luyện .......... 88
Hình 4.7. CDF của sai số định vị sau 100 lần thực nghiệm với dữ liệu thực . 89
Bảng 4.1. Giá trị trung bình và phương sai của sai số định vị sau 1000 lần
thực nghiệm với dữ liệu mô phỏng ................................................................. 86
Bảng 4.2. Giá trị trung bình và phương sai của sai số định vị sau 100 lần thực
nghiệm với dữ liệu thực .................................................................................. 89
Bảng 4.3. Trung bình thời gian thực hiện, giá trị trung bình và phương sai của
sai số định vị tương ứng với bốn thực nghiệm ............................................... 91
vii
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt
2D
3D
AIC
AIC3
AoA
AP
BIC
CDF
CF
CIR
DR
D-RSSIF-IPT
EM
EM-CD-G
EM-CD-GMM
EM-CDGMM-PFBIC-CD
Channel Impulse Response
truyền
Dead Reckoning
Kỹ thuật định vị dự đoán
Kỹ thuật định vị trong nhà
Deterministic RSSI
dựa trên dấu vân tay RSSI
Fingerprinting based IPT
sử dụng phương pháp tất
định
Expectation Maximization
Cực đại kỳ vọng
EM algorithm for parameter Thuật toán EM ước lượng
estimation of Gaussian
các tham số của phân phối
distribution in the presence Gauss khi một phần dữ liệu
of Censored and Dropped
không quan sát được do
data
censoring và dropping
Thuật toán EM ước lượng
EM algorithm for parameter
các tham số của GMM khi
estimation of the GMM in
một phần dữ liệu không
the presence of Censored
quan sát được do censoring
and Dropped mixture data
và dropping
Model selection and
Nghĩa tiếng Anh
Nghĩa tiếng Việt
Thuật toán EM ước lượng
EM algorithm for parameter
các tham số của phân phối
estimation of Gaussian
Gauss khi một phần dữ liệu
distribution in the presence
không quan sát được do
of Censored data
censoring
The EM algorithm for
Thuật toán EM ước lượng
parameter estimation of the các tham số của GMM khi
GMM in the presence of
một phần dữ liệu không
Censored mixture data
quan sát được do censoring
The EM algorithm for
Thuật toán EM ước lượng
parameter estimation of the các tham số của GMM khi
GMM in the presence of
một phần dữ liệu không
Dropped mixture data
quan sát được do dropping
Model selection and
Thuật toán ước lượng các
parameter estimation
Likelihood Function
Hàm hợp lý
Log-Likelihood Function
Logarit của hàm hợp lý
Light of Sight
Trực thị
Least Squares
Bình phương cực tiểu
Cực đại xác suất hậu
Maximum a Posteriori
nghiệm
ix
Từ viết tắt
ML
Nghĩa tiếng Anh
Maximum Likelihood
MSE
Mean Squared Error
OB
NLoS
OBject
Non Light of Sight
Hàm phạt
Hàm phạt của AIC
Hàm phạt của BIC
Hàm phạt trong BIC mở
PF of extended BIC in the
rộng cho trường hợp một
presence of Censored and
phần dữ liệu không quan sát
Dropped data
được do censoring và
dropping
Mô hình suy hao đường
Path Loss Model
truyền
Kỹ thuật định vị trong nhà
Probabilistic RSSI
dựa trên dấu vân tay RSSI
Fingerprinting based IPT
sử dụng phương pháp xác
suất
Reference Point
Điểm tham chiếu
Received Signal Strength
Chỉ số cường độ tín hiệu
Indication
nhận được
RSSI Fingerprinting based Kỹ thuật định vị trong nhà
IPT
dựa trên dấu vân tay RSSI
Biến số, tham số. Ví dụ: xn , yn , J , ,
In thường,
thẳng
Hàm số. Ví dụ: ln(.) , p(.) δ .
Tập số nguyên
Tập số thực
Tổng của một phép toán
Tương đương (biểu thức)
Xấp xỉ
Hàm tương đương
Xác suất
P(. |.)
Xác suất có điều kiện
p(.)
Hàm mật độ xác suất (PDF)
p(. |.)
Hàm mật độ xác suất có điều kiện (Conditional PDF)
( .)
PDF của phân phối Gauss
Logarit tự nhiên
δ .
Hàm Kronecker Delta
Q(.)
Hàm phụ (auxiliary function), biểu diễn kỳ vọng
erf(.)
PF(.)
Hàm phạt của BIC hoặc AIC hoặc AIC3
PFBIC (.)
Hàm phạt của BIC
PFBICD (.)
Hàm phạt của BIC mở rộng cho trường hợp một số mẫu dữ
liệu không quan sát được do dropping
PFBICC (.)
Hàm phạt của BIC mở rộng cho trường hợp một số mẫu dữ
liệu không quan sát được do censoring
PFBICCD (.)
Hàm phạt của BIC mở rộng cho trường hợp một số mẫu dữ
liệu không quan sát được do censoring và dropping
P J = Jˆ
Xác suất số thành phần Gauss ước lượng Jˆ được bằng số
Bộ tham số của phân phối Gauss ,
Θ
Bộ tham số của GMM
xii
Ký hiệu
j
Ý nghĩa
Bộ tham số của thành phần Gauss thứ j trong GMM,
j [w j , j , j ]
ΘJ
Bộ tham số của GMM với J thành phần Gauss
J
Số thành phần Gauss trong GMM
J max
Số thành phần Gauss tối đa sử dụng để tính các hàm phạt
trong BIC
Tập các biến nhị phân biểu thị khi xảy ra dropping (dn=1)
hoặc không xảy ra dropping (dn=0)
dn
Các biến trong tập d
z
zn
Tập các biến nhị phân biểu thị khi xảy ra censoring ( zn 1 )
hoặc không xảy ra censoring ( zn 0 )
Các biến trong tập z
Tập các biến nhị phân biểu thị khi các mẫu dữ liệu quan sát
v
được ( vn 0 ) hoặc không quan sát được ( vn 1 ) do
censoring hoặc dropping hoặc cả hai
vn
Các biến trong tập v
Δ
Tập các biến nhị phân tiềm ẩn (latent variable)
nj
Số điểm truy cập Wi-Fi (AP)
N RP
Số điểm tham chiếu (RP)
CF
Ngưỡng hội tụ của SWRLCF
EM
Ngưỡng hội tụ của thuật toán EM
q
Vị trí của RP thứ q
ˆ .
Vị trí của OB (ước lượng được)
KNN
Số láng giềng gần nhất
DE
Trung bình của sai số định vị
Âu, hay BDS (BeiDou Navigation Satellite System) của Trung Quốc đã và
đang mang lại rất nhiều lợi ích trong các mặt của đời sống xã hội. Ở môi
trường ngoài trời, các hệ thống định vị dựa trên vệ tinh có thể định vị với sai
số chỉ vài mét. Tuy nhiên, trong đô thị hay trong tòa nhà, độ chính xác của các
hệ thống định vị này giảm đi rất nhiều.
Ở các khu vực trong nhà có diện tích rất lớn như trung tâm thương
mại, nhà ga, sân bay, việc tìm một địa điểm hoặc di chuyển tới một địa điểm
nào đó trong các khu vực này là rất khó khăn nếu như không có dịch vụ định
vị hoặc dẫn đường. Mặt khác theo kết quả khảo sát năm 2016 của Sithole.G
và nhóm tác giả [46], trung bình hàng ngày mỗi người dành 80% đến 90%
thời gian để làm việc, sinh hoạt ở môi trường trong nhà; 70% điện thoại di
động và 80% dữ liệu được sử dụng và truyền/nhận trong môi trường trong
nhà. Đây chính là các lý do vì sao trong những năm gần đây, hệ thống định vị
trong nhà (IPS: Indoor Positioning System) rất được quan tâm nghiên cứu,
phát triển.
Công nghệ định vị trong nhà đã có những bước phát triển rất nhanh.
Ban đầu từ hệ thống RADAR được giới thiệu bởi Microsoft Research Asia [6]
2
năm 2000. Năm 2005, hệ thống Horus được xây dựng bởi đại học Maryland
[58]. Những hệ thống được phát triển trong những năm gần đây (2015) có thể
kể đến như: hệ thống LIFS của đại học Tsinghua [53]; hệ thống
WHERE@UM của đại học Minho [41]. Theo thời gian, các hệ thống được
phát triển sau có độ chính xác cao hơn, giá thành thấp hơn và nhiều kỹ thuật
tiên tiến hơn được áp dụng so với các hệ thống được phát triển trước.
IPS có thể hoạt động trong trong không gian hai chiều. (2D: 2
Dimension) và trong không gian ba chiều (3D: 2 Dimension). Hệ thống định
vị 3D có giá thành cao hơn hệ thống định vị 2D do phải bổ sung các thiết bị
vậy việc triển khai IPS sẽ dễ dàng và ít tốn kém hơn [23].
Các kỹ thuật định vị sử dụng tín hiệu Wi-Fi trong WLAN có thể chia
thành hai nhóm chính:
- Nhóm các kỹ thuật định vị dựa trên thuộc tính về không gian và thời
gian của tín hiệu nhận được (TSARS: Time and Space Attributes of Received
Signal). TSARS có thể là thời gian tới (ToA: Time of Arrival), chênh lệch về
thời gian tới (TDoA: Time Difference of Arrival) hoặc góc tới (AoA: Angle
of Arrival). Để thu thập được TSARS phục vụ định vị thường phải bổ sung
thêm phần cứng, ví dụ như ăng ten dải trên thiết bị thu (OB) để xác định AoA,
thiết bị đồng bộ để xác định ToA, điều này làm cho giá thành của hệ thống
tăng lên [20, 23]. Mặt khác TSARS sẽ bị sai số khi trạm phát, ví dụ các điểm
truy cập Wi-Fi (AP: Access Point) và trạm thu không trực thị (NLoS: NonLight of Sight) với nhau [56]. Vì những lý do này, các kỹ thuật định vị trong
WLAN sử dụng TSARS ít được triển khai trong môi trường trong nhà [17].
- Nhóm các kỹ thuật định vị sử dụng chỉ số cường độ tín hiệu nhận
được (RSSI: Received Signal Strength Indication). Các kỹ thuật này có thể
thực hiện định vị cho đại đa số các thiết bị di động hoạt động trong WLAN, ví
dụ điện thoại thông minh, máy tính bảng, máy tính xách tay..., mà không cần
bổ sung phần cứng cho IPS do các thiết bị này đều có thể thu thập được RSSI.
4
Ngoài ra các kỹ thuật này không yêu cầu trực thị (LoS: Light of Sight) giữa
AP và OB [17, 56], bởi vậy rất phù hợp với môi trường trong nhà. Theo thống
kê trong bài báo khảo sát về định vị trong nhà [17], có tới 94,42% các công
trình nghiên cứu về IPS sử dụng kỹ thuật định vị dựa trên RSSI. Nhóm các kỹ
thuật định vị sử dụng Wi-Fi RSSI bao gồm:
+ Kỹ thuật định vị tiệm cận (Promixity). Đây là kỹ thuật định vị đơn
giản nhất, được giới thiệu sớm nhất nhưng có sai số lớn.
+ Kỹ thuật định vị sử dụng RSSI và mô hình suy hao đường truyền
RSSIF-IPT, sử dụng tín hiệu Wi-Fi trong WLAN. Các vấn đề được nghiên
cứu bao gồm: Đặc điểm của Wi-Fi RSSI; mô hình xác suất mô tả phân bố của
Wi-Fi RSSI; thuật toán ước lượng các tham số, tối ưu hóa các tham số của mô
hình được sử dụng mô tả phân bố của Wi-Fi RSSI; thuật toán định vị trực
tuyến.
3. Mục tiêu nghiên cứu
- Mục tiêu chung: Nghiên cứu phát triển kỹ thuật định vị trong nhà dựa
trên dấu vân tay RSSI sử dụng tín hiệu Wi-Fi trong WLAN nhằm giảm thiểu
sai số định vị, tối ưu thời gian định vị.
- Các mục tiêu cụ thể:
+ Xây dựng thuật toán ước lượng các tham số, số thành phần Gauss
trong GMM khi một phần dữ liệu không quan sát được;
+ Xây dựng thuật toán định vị với mục tiêu giảm thiểu sai số định vị,
tối ưu thời gian định vị;
6
+ Thực nghiệm IPS với các kỹ thuật đã nghiên cứu, phát triển nhằm
kiểm nghiệm, so sánh với IPS sử dụng các kỹ thuật khác.
4. Phương pháp nghiên cứu
Phương pháp thống kê (toán) để xác định xu hướng diễn biến của tập
dữ liệu (là các phép đo Wi-Fi RSSI) thu thập được từ đó đề xuất mô hình
toán học mô tả phân bố của dữ liệu; phương pháp giải tích để tính toán các
tham số của mô hình và vị trí của đối tượng cần định vị; phương pháp Monte
Carlo để đánh giá sai số của các tham số mô hình; cuối cùng, các phương
pháp thực nghiệm trên cả dữ liệu mô phỏng và dữ liệu thực tế để kiểm chứng
hiệu quả của các đề xuất khi áp dụng cho IPS.
5. Bố cục của luận án
Bố cục của luận án bao gồm bốn chương cùng với phần mở đầu, kết
8
CHƯƠNG 1. TỔNG QUAN VỀ KỸ THUẬT ĐỊNH VỊ TRONG
NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi
Chương 1 bao gồm các nội dung: Các kỹ thuật định vị trong nhà sử
dụng tín hiệu Wi-Fi, ưu điểm, nhược điểm của từng kỹ thuật; các nghiên cứu
về RSSIF-IPT, những vấn đề đã được giải quyết và chưa được giải quyết, qua
đó, luận án đưa ra định hướng nghiên cứu.
1.1. Các kỹ thuật định vị trong nhà sử dụng tín hiệu Wi-Fi
1.1.1. Kỹ thuật định vị tiệm cận
Kỹ thuật định vị tiệm cận (proximity) [27, 51] còn gọi là kỹ thuật định
vị dựa trên vị trí của AP trong WLAN có cường độ tín hiệu nhận được lớn
nhất.
Hình 1.1 mô tả kỹ thuật định
vị tiệm cận với ba AP và đối tượng
(OB) cần định vị. Khi OB nằm trong
vùng phủ sóng của AP1 (vị trí 1), vị
trí của OB sẽ là vị trí của AP1. Tại vị
trí 2, OB nằm trong vùng phủ sóng
AP3
AP2
Vị trí 3
Vị trí 2
AP1
của AP1 và AP2. Nếu RSSI do OB
thu thập được từ AP2 lớn hơn từ