BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ KHOA HỌC VÀ CÔNG NGHỆ
VIỆN ỨNG DỤNG CÔNG NGHỆ
-----------------
VŨ TRUNG KIÊN
NGHIÊN CỨU, PHÁT TRIỂN KỸ THUẬT ĐỊNH VỊ TRONG
NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi
LUẬN ÁN TIẾN SĨ KỸ THUẬT
HÀ NỘI-2019
BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ KHOA HỌC VÀ CÔNG NGHỆ
VIỆN ỨNG DỤNG CÔNG NGHỆ
-----------------
VŨ TRUNG KIÊN
NGHIÊN CỨU, PHÁT TRIỂN KỸ THUẬT ĐỊNH VỊ TRONG
NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi
LUẬN ÁN TIẾN SĨ KỸ THUẬT
LỜI CẢM ƠN
Trong quá trình nghiên cứu và hoàn thành luận án này, tác
giả đã nhận được nhiều sự giúp đỡ và đóng góp quý báu.
Đầu tiên, tác giả xin bày tỏ lòng biết ơn sâu sắc tới GS.TS. Lê Hùng
Lân đã tận tình hướng dẫn và giúp đỡ tác giả trong quá trình nghiên cứu.
Tác giả xin chân thành cảm ơn Viện Ứng dụng Công nghệ - Bộ
Khoa học và Công nghệ đã tạo điều kiện thuận lợi để tác giả hoàn
thành nhiệm vụ. Tác giả cũng xin cảm ơn Trường Đại học Công nghiệp
Hà Nội, là đơn vị chủ quản, đã tạo điều kiện cho phép tác giả có thể
tham gia nghiên cứu trong các năm làm nghiên cứu sinh.
Tác giả cũng xin bày tỏ lòng cảm ơn sâu sắc đến TS. Hoàng Mạnh
Kha, người luôn đồng hành cùng tác giả trong thời gian nghiên cứu; xin chân
thành cảm ơn TS. Lê Văn Thái và các anh chị em đồng nghiệp thuộc khoa
Điện tử, trường Đại học Công nghiệp Hà Nội đã luôn tạo mọi điều kiện giúp
tác giả hoàn thành luận án.
Cuối cùng, tác giả xin bày tỏ lòng cảm ơn chân thành đến gia đình,
bạn bè, các đồng chí, đồng nghiệp đã luôn động viên, giúp đỡ tác giả vượt
qua mọi khó khăn để đạt được những kết quả nghiên cứu như ngày hôm nay.
i
MỤC LỤC
LỜI CAM ĐOAN.............................................................................................................................. i
LỜI CẢM ƠN.................................................................................................................................... ii
1.3. Kết luận chương 1................................................................................................... 33
CHƯƠNG 2. ƯỚC LƯỢNG THAM SỐ CỦA MÔ HÌNH MÔ TẢ PHÂN BỐ
Wi-Fi RSSI........................................................................................................................................ 35
2.1. Đặt vấn đề....................................................................................................................... 35
2.2. Giới thiệu thuật toán EM.................................................................................... 39
2.3. Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát
được do censoring............................................................................................................ 41
2.4. Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát
được do dropping.............................................................................................................. 44
2.5. Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát
được do censoring và dropping............................................................................ 46
2.6. Đánh giá sai số của các tham số trong GMM ước lượng được bằng
thuật toán EM.......................................................................................................................... 52
2.7. Kết luận chương 2................................................................................................... 56
CHƯƠNG 3. ƯỚC LƯỢNG SỐ THÀNH PHẦN GAUSS TRONG MÔ
HÌNH MÔ TẢ PHÂN BỐ Wi-Fi RSSI............................................................................ 57
3.1. Đặt vấn đề....................................................................................................................... 57
3.2. Các phương pháp ước lượng số thành phần Gauss trong GMM
............................................................................................................................................................. 60
3.2.1. Ước lượng số thành phần Gauss trong GMM bằng phương pháp
PF................................................................................................................................................. 60
3.2.2. Ước lượng số thành phần Gauss trong GMM bằng phương pháp
PHỤ LỤC....................................................................................................................................... PL1
iv
DANH MỤC HÌNH VẼ
Hình 1.1. Mô tả kỹ thuật định vị tiệm cận............................................................... 8
Hình 1.2. Mô tả ToA-IPT.......................................................................................................... 9
Hình 1.3. Mô tả TDoA-IPT................................................................................................... 11
Hình 1.4. Mô tả AoA-IPT...................................................................................................... 12
Hình 1.5. Mô tả kỹ thuật định vị sử dụng kết hợp AoA và ToA .........13
Hình 1.6. Mô tả RSSIF-IPT................................................................................................. 15
Hình 1.7. Mô tả D-RSSIF-IPT............................................................................................ 17
Hình 1.8. Biểu đồ tần suất của Wi-Fi RSSI thu thập được tại các vị trí khác
nhau trong điều kiện tĩnh................................................................................................... 29
Hình 1.9. Biểu đồ tần suất của Wi-Fi RSSI được thu thập trong các điều kiện
động khác nhau.......................................................................................................................... 31
Hình 1.10. Biểu đồ tần suất của Wi-Fi RSSI thể hiện các vấn đề censoring,
dropping và đa thành phần Gauss............................................................................ 31
Hình 2.2. Mô tả hiện tượng dropping...................................................................... 37
Hình 2.3. Tương quan giữa số lượng mẫu dữ liệu (N) và MSE của các tham số
trong GMM được ước lượng bởi EM-CD-GMM............................................. 56
Hình 3.1. Biểu đồ tần suất của Wi-Fi RSSI thu thập từ một AP........59
Hình 3.2. Thuật toán ước lượng số thành phần Gauss trong GMM bằng
phương pháp PF....................................................................................................................... 61
Hình 4.7. CDF của sai số định vị sau 100 lần thực nghiệm với dữ liệu thực . 89
Hình 4.8. CDF của sai số định vị tương ứng với bốn thực nghiệm
................................................................................................................................................................... 91
vi
DANH MỤC BẢNG BIỀU, LƯỢC ĐỒ
Bảng 1.1. Thống kê sai số định vị của một số nghiên cứu về các kỹ thuật định
vị dựa trên vị trí của các AP............................................................................................ 23
Bảng 1.2. Thống kê sai số định vị của một số nghiên cứu về RSSIF-IPT
................................................................................................................................................................... 23
Bảng 1.3. Thông tin cần thu thập xây dựng cơ sở dữ liệu với các kỹ thuật định
vị.............................................................................................................................................................. 24
Bảng 1.4. Tổng hợp các ưu điểm, nhược điểm của các kỹ thuật định vị
................................................................................................................................................................... 26
Bảng 2.1.
KLD
của các thuật toán EM sau 1000 lần thực nghiệm...54
Bảng 2.2.
KLD
sai số định vị tương ứng với bốn thực nghiệm............................................ 91
vii
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết
tắt 2D
3D
Nghĩa tiếng Anh
CF
2 Dimension 3
Dimension Akaike
Information
Criterion
Akaike Information
Criterion 3 Angle of
Arrival Access Point
Bayesian
Information Criterion
Cumulative
Distribution
Function
Characteristic Function
CIR
parameter estimation
of Gaussian
distribution in the
presence of Censored
and Dropped data
EM algorithm for parameter
estimation of the GMM in
the presence of Censored
and Dropped mixture data
Model selection and
parameter BIC-CD
estimation algorithm
utilizing EM-CD-GMM and
PF
Góc tới (của tín hiệu Wi-Fi)
Nghĩa tiếng
Việt Không
gian hai
chiều
Không
gian ba
chiều Tiêu
chuẩn
thông tin
Akaike
một phần dữ liệu không
quan sát được do censoring
và dropping
Thuật toán ước lượng các
tham số và số thành phần
Gauss trong GMM sử dụng
EM-CD-GMM và PFBIC-CD
viii
Từ viết tắt
Nghĩa tiếng Anh
EM-C-G
EM algorithm for parameter
estimation of Gaussian
distribution in the presence
of Censored data
Nghĩa tiếng Việt
EM-GMMPFAIC
The EM algorithm for
parameter estimation of
the GMM in the presence
parameter estimation
algorithm utilizing EM-
dụng EM-GMM và PFAIC
Thuật toán ước lượng
các tham số và số thành
phần Gauss sử dụng
GMM and PFBIC
Model selection and
EM-GMM và PFBIC
Thuật toán ước lượng
các tham số và số thành
phần Gauss sử dụng
EM-GMM và SWRLCF
EM-C-GMM
EM-D-GMM
EM-GMMSWRLCF
GMM
IPS
IPT
KLD
KNN
LF
LLF
LoS
Bình phương cực
tiểu Cực đại xác
suất hậu nghiệm
ix
Từ viết
tắt ML
Nghĩa tiếng Anh
Maximum Likelihood
PF
Mean Squared Error
OBject
Non Light of Sight
Probability Density
Function
Penalty Function
PFAIC
PF of AIC
MSE
OB
NLoS
PDF
RSSI Fingerprinting
based IPT
Sum of Weighted Real
parts of all LogCharacteristic Functions
Time Difference of
Arrival Time of Arrival
Time and Space Attributes
TSARS
WLAN
of Received Signal
Wireless Local
Area Network
Nghĩa tiếng Việt
Hợp lý cực đại
Sai số toàn phương
trung bình
Đối tượng (được
định vị) Không trực
thị
Hàm mật độ xác
suất Hàm phạt
Hàm phạt của AIC
Hàm phạt của BIC
Hàm phạt trong BIC mở
Ý nghĩa
Ký hiệu
In đậm,
thẳng In
nghiêng In
thường,
thẳng
Ma trận, véc tơ. Ví dụ: x, y,Θ
Biến số, tham số. Ví dụ: xn , yn , J, ,
Hàm số. Ví dụ: ln(.) , p(.) δ .
Tập số nguyên
Tập số thực
Tổng của một phép toán
Tích của một phép toán
Tương đương (biểu thức)
Xấp xỉ
Hàm tương đương
.
ˆ
(.)
T
(.) 1
(Conditional PDF) PDF của phân phối Gauss
ln(.)
δ.
Q(.)
erf(.
)
Hàm Kronecker Delta
Hàm phụ (auxiliary function), biểu diễn
kỳ vọng Hàm lỗi (error function)
xi
Ký hiệu
Hàm lỗi bù (complementary error function)
Hàm hợp lý (Likelihood)
erfc(.)
(.)
(.),
(.),
Các hàm, chi tiết như trong mục 2.3 và 2.5.
Ý nghĩa
J=J
J
ˆ
AIC3 Hàm phạt của BIC
Hàm phạt của BIC mở rộng cho trường hợp một
số mẫu dữ liệu không quan sát được do dropping
Hàm phạt của BIC mở rộng cho trường hợp một
số mẫu dữ liệu không quan sát được do censoring
Hàm phạt của BIC mở rộng cho trường hợp một số mẫu
dữ liệu không quan sát được do censoring và dropping
Xác suất số thành phần Gauss ước lượng J
được bằng số thành phần Gauss thực J
ˆ
ˆ
1
ˆ
JJ 2
Xác suất xác suất J lệch so với J một thành phần Gauss
max
Bộ tham số của thành phần Gauss thứ j trong GMM,
ˆ
J
j
w
y
yn
x
xn
d
j
[ wj ,
j
,
j
]
hoặc không xảy ra dropping (dn=0)
Các biến trong tập d
Tập các biến nhị phân biểu thị khi xảy ra censoring ( zn
c
1)
hoặc không xảy ra censoring ( zn 0 )
Các biến trong tập z
Tập các biến nhị phân biểu thị khi các mẫu dữ liệu
quan sát được ( vn 0 ) hoặc không quan sát được (
vn 1) do censoring hoặc dropping hoặc cả hai
Các biến trong tập v
Tập các biến
nhị phân tiềm
ẩn (latent
variable)
Các biến trong tập
Ngưỡng thu của thiết bị thu thập WiFi RSSI Nhân tử Lagrange
xiii
Ký
hiệu
(k)
SWRLCF Ngưỡng hội tụ của
thuật toán EM Vị trí của RP
q
ˆ
.
K
NN
DE
DE
2
t
ETP
KLD
KLD
thứ q
Vị trí của OB (ước lượng được)
Số láng giềng gần nhất
Trung bình của sai số định vị
Phương sai của sai số định vị
Trung bình thời gian máy tích thực hiện thuật
trường trong nhà; 70% điện thoại di động và 80% dữ liệu được sử
dụng và truyền/nhận trong môi trường trong nhà. Đây chính là các lý
do vì sao trong những năm gần đây, hệ thống định vị trong nhà (IPS:
Indoor Positioning System) rất được quan tâm nghiên cứu, phát triển.
Công nghệ định vị trong nhà đã có những bước phát triển rất nhanh.
Ban đầu từ hệ thống RADAR được giới thiệu bởi Microsoft Research Asia [6]
2
năm 2000. Năm 2005, hệ thống Horus được xây dựng bởi đại học Maryland
[58]. Những hệ thống được phát triển trong những năm gần đây (2015) có
thể kể đến như: hệ thống LIFS của đại học Tsinghua [53]; hệ thống
WHERE@UM của đại học Minho [41]. Theo thời gian, các hệ thống được
phát triển sau có độ chính xác cao hơn, giá thành thấp hơn và nhiều kỹ thuật
tiên tiến hơn được áp dụng so với các hệ thống được phát triển trước.
IPS có thể hoạt động trong trong không gian hai chiều. (2D: 2
Dimension) và trong không gian ba chiều (3D: 2 Dimension). Hệ thống định vị
3D có giá thành cao hơn hệ thống định vị 2D do phải bổ sung các thiết bị phục
vụ định vị [54]. Mặt khác đa số các nhu cầu về định vị trong nhà chỉ cần thực
hiện trong không gian hai chiều, bởi vậy công nghệ định vị trong không gian hai
chiều được quan tâm nghiên cứu phát triển nhiều hơn [46, 54].
IPS có thể định vị đối tượng bằng cách tham chiếu tới tín hiệu, vị trí của
các thiết bị trong hạ tầng mạng có sẵn, ví dụ mạng nội bộ không dây (WLAN:
Wireless Local Area Network), hoặc quán tính của đối tượng cần định vị (OB:
Object) được xác định bằng các cảm biến, ví dụ con quay hồi chuyển, gia tốc
kế. Sử dụng cảm biến trên chính đối tượng cần định vị, còn gọi là công nghệ
định vị dự đoán (DR: Dead Reckoning), có độ chính xác cao trong khoảng thời
gian ngắn. Tuy nhiên khi OB di chuyển xa, di chuyển trong một khoảng thời
gian dài, sai số định vị được tích lũy, bởi vậy DR được dùng như một kỹ thuật
gian tới (TDoA: Time Difference of Arrival) hoặc góc tới (AoA: Angle of Arrival).
Để thu thập được TSARS phục vụ định vị thường phải bổ sung thêm phần
cứng, ví dụ như ăng ten dải trên thiết bị thu (OB) để xác định AoA, thiết bị đồng
bộ để xác định ToA, điều này làm cho giá thành của hệ thống tăng lên [20, 23].
Mặt khác TSARS sẽ bị sai số khi trạm phát, ví dụ các điểm truy cập Wi-Fi (AP:
Access Point) và trạm thu không trực thị (NLoS: Non-Light of Sight) với nhau
[56]. Vì những lý do này, các kỹ thuật định vị trong WLAN sử dụng TSARS ít
được triển khai trong môi trường trong nhà [17].
-
Nhóm các kỹ thuật định vị sử dụng chỉ số cường độ tín hiệu nhận
được (RSSI: Received Signal Strength Indication). Các kỹ thuật này có thể thực
hiện định vị cho đại đa số các thiết bị di động hoạt động trong WLAN, ví dụ điện
thoại thông minh, máy tính bảng, máy tính xách tay..., mà không cần bổ sung
phần cứng cho IPS do các thiết bị này đều có thể thu thập được RSSI.
4
Ngoài ra các kỹ thuật này không yêu cầu trực thị (LoS: Light of Sight)
giữa AP và OB [17, 56], bởi vậy rất phù hợp với môi trường trong nhà.
Theo thống kê trong bài báo khảo sát về định vị trong nhà [17], có tới
94,42% các công trình nghiên cứu về IPS sử dụng kỹ thuật định vị dựa
trên RSSI. Nhóm các kỹ thuật định vị sử dụng Wi-Fi RSSI bao gồm:
+
Kỹ thuật định vị tiệm cận (Promixity). Đây là kỹ thuật định
và định vị trực tuyến. Ở giai đoạn huấn luyện, RSSI được thu thập tại các điểm
tham chiếu (RP: Reference Point) có vị trí xác định để xây dựng cơ sở dữ liệu.
Ở giai đoạn định vị trực tuyến, RSSI do OB thu thập được so sánh với cơ sở dữ
liệu, từ đó ước lượng ra vị trí của OB thông qua vị trí của một hoặc một số RP.
Nếu thu thập một số lượng đủ lớn các mẫu dữ liệu (là các giá trị RSSI) ở nhiều
thời điểm, trong nhiều hoàn cảnh khác nhau, cơ sở dữ liệu của IPS sử dụng
RSSIF-IPT có thể phản ánh được sự biến đổi của RSSI do hiện tượng đa
đường, do môi trường xung quanh thay đổi gây ra, qua đó hạn chế được sai số
định vị [20]. Tuy mất nhiều thời gian cho việc thu thập RSSI để xây dựng cơ sở
dữ liệu nhưng bù lại, IPS sử dụng RSSIF-IPT có sai số chỉ
5
từ 1,6m đến 5m [38]; có giá thành thấp; có thể triển khai được ở hầu
hết các khu vực trong nhà [9]. Bởi vậy, có tới 94,12% bài báo nghiên
cứu về RSSIF-IPT trong số các bài báo nghiên cứu về IPS [17].
Xuất phát từ những thực tế nêu trên, luận án tập trung
nghiên cứu kỹ thuật định vị trong nhà dựa trên dấu vân tay RSSI
sử dụng tín hiệu Wi-Fi trong WLAN.
2. Đối tượng và phạm vi nghiên cứu
Nghiên cứu kỹ thuật định vị cho đối tượng tĩnh trong không
gian hai chiều ở môi trường trong nhà. Kỹ thuật định vị được tập
trung nghiên cứu là RSSIF-IPT, sử dụng tín hiệu Wi-Fi trong WLAN.
Các vấn đề được nghiên cứu bao gồm: Đặc điểm của Wi-Fi RSSI;
mô hình xác suất mô tả phân bố của Wi-Fi RSSI; thuật toán ước
lượng các tham số, tối ưu hóa các tham số của mô hình được sử
dụng mô tả phân bố của Wi-Fi RSSI; thuật toán định vị trực tuyến.