Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
*
BÀI TẬP LỚN
TRÍ TUỆ NHÂN TẠO
TÊN ĐỀ TÀI
XÂY DỰNG CHƯƠNG TRÌNH SỬ DỤNG THUẬT TOÁN TKCT* ĐỂ GIẢI
BÀI TOÁN NGƯỜI DU LỊCH
Học viên thực hiện: 1. Trần Thị Thùy Dương
2. Nguyễn Thị Thu Hằng
3. Nguyễn Thị Hồng
4. Nguyễn Văn Ninh
5. Hoàng Thị Minh Tâm
Lớp: Cao học 12ACNTT- HY
Giảng viên hướng dẫn: Ths. Nguyễn Thị Ngọc Bích
NĂM 2012
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
MỤC LỤC
I.TỔNG QUAN VỀ TRÍ TUỆ NHÂN TẠO 3
II.BÀI TOÁN NGƯỜI DU LỊCH 4
II.1 Phát biểu bài toán 4
2.1.1 Lịch sử bài toán TSP 5
2.1.2 Mô tả bài toán TSP 7
2.1.3 Phân loại bài toán 7
2.2 Các giải thuật giải bài toán người du lịch 8
2.2.1 Các giải thuật để tìm lời giải chính xác 8
2.2.2 Heuristic và các giải thuật xấp xỉ 9
2.2.3 Giải thuật Heuristics tìm đường đi có giá nhỏ nhất với tri thức bổ sung
TKCT* 11
2.3 Phân ch thiết kế giải thuật Heuris&cs 'm đường đi có giá nhỏ nhất với tri thức bổ sung TKCT*
các lĩnh vực tổng quát như máy nhận biết, suy luận logic, đến các bài toán như chơi
cờ, chứng minh định lý. Thường thì các nhà khoa học ở các lĩnh vực khác tìm đến với
trí tuệ nhân tạo ở các kỹ thuật hệ thống hoá và tự động hoá các xử lý tri thức cũng như
các phương pháp thuộc lĩnh vực mang tính người.
Trí tuệ nhân tạo nghiên cứu kỹ thuật làm cho máy tính có thể “suy nghĩ một
cách thông minh” và mô phỏng quá trình suy nghĩ của con người khi đưa ra những
quyết định, lời giải. Trên cơ sở đó, thiết kế các chương trình cho máy tính để giải
quyết bài toán.
Sự ra đời và phát triển của Trí tuệ nhân tạo đã tạo ra một bước nhảy vọt về chất
trong kỹ thuật và kỹ nghệ xử lý thông tin. Trí tuệ nhân tạo chính là cơ sở của công
nghệ xử lý thông tin mới, độc lập với công nghệ xử lý thông tin truyền thống dựa trên
văn bản giấy tờ. Điều này được thể hiện qua các mặt sau:
- Nhờ những công cụ hình thức hoá (các mô hinh logic ngôn ngữ, logic mờ, ),
các tri thức thủ tục và tri thức mô tả có thể biểu diễn được trong máy. Do vậy quá trình
giải bài toán được tiến hành hữu hiệu hơn.
3
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
- Mô hình logic ngôn ngữ đã mở rộng khả năng ứng dụng của máy tính trong
lĩnh vực đòi hỏi tri thức chuyên gia ở trình độ cao, rất khó như: y học, sinh học, địa lý,
tự động hóa.
- Một số phần mềm trí tuệ nhân tạo thể hiện tính thích nghi và tính mềm dẻo đối
với các lớp bài toán thuộc nhiều lĩnh vực khác nhau.
- Khi máy tính được trang bị các phần mềm trí tuệ nhân tạo ghép mạng sẽ cho
phép giải quyết những bài toán cỡ lớn và phân tán.
So sánh kỹ thuật lập trình truyền thống và kỹ thuật xử lý tri thức
trong TTNT
Truyền thống TTNT
Xử lý dữ liệu Xử lý tri thức
Xử lý theo các thuật toán Xử lý theo các thuật giải Heuristics
Xử lý tuần tự theo lô Xử lý theo chế độ tương tác cao (ngôn ngữ tự
tìm kiếm cụ thể đã được biết đến vì vậy một vài trường hợp của bài toán với khoảng
chục nghìn thành phố đã được giải quyết.
TSP có một vài ứng dụng thậm chí trong dạng thức nguyên thuỷ của nó như lập
kế hoạch, logistic, và sản xuất các microchip. Thay đổi đi chút ít nó xuất hiện như một
bài toán con trong rất nhiều lĩnh vực như việc phân tích gen trong sinh học. Trong
những ứng dụng này, khái niệm thành phố có thể thay đổi thành khách hàng, các điểm
hàn trên bảng mạch, các mảnh DNA trong gen, và khái niệm khoảng cách có thể biểu
diễn bởi thời gian du lịch hay giá thành , hay giống như sự so sánh giữa các mảnh
DNA với nhau. Trong nhiều ứng dụng, các hạn chế truyền thống như giới hạn tài
nguyên hay giới hạn thời gian thậm chí còn làm cho bài toán trở nên khó hơn.
Trong lý thuyết của độ phức tạp tính toán, phiên bản quyết định của bài toán
TSP thuộc lớp NP-complete. Vì vậy không có giải thuật hiệu quả nào cho việc giải bài
toán TSP. Hay nói cách khác, giống như thời gian chạy tồi nhất cho bất ký giải thuật
nào cho bài toán TSP tăng theo hàm mũ với số lượng thành phố, vì vậy thậm chí nhiều
trường hợp với vài trăm thành phố cũng đã mất vài năm CPU để giải một cách chính
xác.
2.1.1 Lịch sử bài toán TSP
Nguồn gốc của bài toán người du lịch đến nay vẫn chưa rõ ràng. Một cuốn sách
cho người du lịch từ năm 1832 đã đề cập tới vấn đề và bao gồm vài ví dụ về các đường
đi từ đức qua Thụy sỹ nhưng không chứa đựng ý nghĩa toán học nào
Vấn đề toán học liên quan tới bài toán người du lịch đã được nhắc đến trong
những năm 1800 bởi nhà toán học ireland W. R. Hamilton và nhà toán học người Anh
Thomas Kirkman. Trò chơi Icosian Game của Hamilton là một trò đố vui dựa trên cơ
sở tìm chu trình Hamilton. Dạng tổng quát của bài toán TSP được nghiên cứ bởi các
nhà toán học suốt những năm 1930 ở đại học Harvard, đáng chú ý là Karl Menger
người đã định nghĩa bài toán, xem xét giải thuật brute-force và quan sát thấy tính
không tối ưu của heuristic dựa trên láng giếng gần nhất.
Bài toán người du lịch, tìm đường đi ngắn nhất cho
người thương nhân (salesman), hay còn gọi là người chào
hàng xuất phát từ một thành phố, đi qua lần lượt tất cả các
khi Grötschel, Padberg, Rinaldi và những người khác cố gắng giải một cách chính xác
một thể hiện của bài toán với 2392 thành phố, sử dụng phương thức cắt và branch-and-
bound.
Trong những năm 1990 Applegate, Bixby, Chvátal, và Cook đã phát triển chương
trình Concorde mà đã được sử dụng nhiều trong việc giải các bài toán TSP cho đến
nay. Gerhard Reinelt đã công bố thư viện TSPLIB vào năm 1991, đó là một tập các
thể hiện của bài toán TSP với nhiều độ khó khác nhau, và đã được sử dụng bởi nhiều
nhóm nghiên cứu khác nhau để so sánh kết quả. Năm 2005, Cook và những người
6
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
khác đã tính được độ dài tối ưu cho chu trình với thể hiện của bài toán TSP lên tới
33,810 thành phố , được lấy ra từ bài toán xây dựng layout cho microchip, cho tới nay
vẫn là thể hiện lớn nhất trong các thể hiện ở TSPLIB. Nhiều thể hiện khác với hàng
triệu thành phố, lời giải tìm được có thể chứng minh nằm sai khác 1% so với lời giải
tối ưu.
2.1.2 Mô tả bài toán TSP
TSP có thể được mô hình như một đồ thị , các đỉnh của
đồ thị tương ứng với các thành phố và các cạnh thì
tương ứng với đường nối giữa các thành phố, chiều dài
của một cạnh tương ứng với khoảng cách giữa 2 thành
phố. Một đường đi trong bài toán TSP là một chu trình
Hamilton trên đồ thị và một lời giải tối ưu của bài toán
là chu trình Hamilton ngắn nhất.
Thường thì đồ thị là đồ thị đầy đủ , vì vậy mọi cặp cạnh đều được nối bởi các
cạnh. Đây là bước đơn giản hóa bài toán vì việc tìm chu trình Hamilton trong một đồ
thị đầy đủ là dễ. Các bài toán mà không phải 2 thành phố nào cũng được nối với nhau
có thể được chuyển đổi thành đồ thị đầy đủ bằng cách thêm những cạnh có độ dài lớn
giữa cách thành phố này, những cạnh sẽ không xuất hiện trong chu trình tối ưu.
2.1.3 Phân loại bài toán
Đối xứng và bất đối xứng
định tuyến. Ví dụ trong một kiểu vận tải , như du lịch bằng máy bay có thể nhanh hơn
mặc dù khoảng cách di chuyển là xa hơn.
2.2 Các giải thuật giải bài toán người du lịch
2.2.1 Các giải thuật để tìm lời giải chính xác
Lời giải trực tiếp nhất có thể là thử tất cả các hoán vị và xem hoán vị nào là tốt
nhất ( dùng brute-force). Thời gian chạy cho cách tiếp cận này là O(n!), vì vậy cách
tiếp cận này thậm chí không thể thực hiện với chỉ 20 thành phố. Một trong số những
ứng dụng mới đây nhất của quy hoạch động là giải thuật có độ phức tạp O(n
2
2
n
) và
yêu cầu không gian bộ nhớ là hàm mũ.
Cải thiện tốc độ cho cách giải thuật trên là hầu như không thể. Ví dụ, thậm chí là rất
khó tìm một giải thuật chính xác cho bài toán TSP chạy trong độ phức tạp O(1.9999
n
)
.
Những cách tiếp cận khác bao gồm:
• Rất nhiều giải thuật branch-and-bound, có thể sử dụng để giải các bài toán TSP
với khoảng 40-60 thành phố.
• Các giải thuật cải thiện dần dần sử dụng kỹ thuật ghi nhớ lại của linear
programming. Có thể làm việc tốt cho khoảng 200 thành phố.
• Thực hiện branch-and-bound và cut cho các bài toán cụ thể , đây là phương
thức sử dụng để giải quyết các bài toán với số lượng lớn thành phố. Cách tiếp
cận này đang giữ kỷ lục hiện tại giải quyết được bài toán TSP với 85,900 thành
phố.
8
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
Lời giải chính xác cho bài toán với 15,112 thành phố ở đức từ TSPLIB đã được
Gần đây một heuristic mới được đưa ra ,Match Twice and Stitch (MTS)
(Kahng, Reda 2004. MTS đã cho thấy tính hiệu quả hơn hẳn so với những heuristic
xây dựng hiện tại . MTS thực hiện hai lần khớp tuần tự , mà lần khớp thứ 2 được thực
hiện sau khi xóa tất cả các cạnh của lần khớp thứ nhất, để đưa ra tập tất cả các chu
trình. Sau đó chu trình được đóng lại để đưa ra đường đi cuối cùng
Cải tiến từng bước
• Chuyển cặp, hay heuristic Lin-Kernighan.
9
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
Kỹ thuật chuyển cặp hay '2-opt' bao gồm việc lặp lại việc xóa 2 cạnh và thay chúng
bằng hai cạnh khác nối đoạn tạo bởi cạnh bị xóa tạo thành đường di ngắn hơn. Đây là
trường hợp đặc biệt của phương thức k-opt.
• k-opt heuristic
Lấy một đường đi và xóa k cạnh đôi một không có điểm chung. Xây đựng lại đường đi
từ những mảnh còn lại để không có hai mảnh đường đi nào lối với nhau (không nối hai
điểm đầu cuối của 2 mảnh với nhau sẽ tạo thành đường đi khép kín). Điều này làm đơn
giản hóabài toán TSP thành bài toán đơn giản hơn rất nhiều. Mỗi điểm đầu cuối có thể
được nối tới 2k − 2 điểm khác có thể: trong số 2k tổng số điểm đầu cuối có thể, trừ ra
hai điểm đầu cuối của mảnh đang xem xét . Bài toán đơn giản hóa 2k thành phố TSP
có thể giải sử dụng brute force để tìm tổ hợp tốt nhất của các mảnh ban đầu. Kỹ thuật
k-opt là trường hợp riêng của kỹ thuât V-opt hay variable-opt . Kỹ thuật phổ biến của
k-opt là 3-opt, được giới thiệu bởi Shen Lin của Bell Labs vào năm 1965. Có một
trường hợp đặc biệt của 3-opt khi mà cách cạnh là có thể không nhất thiết không có
điểm chung (hai trong số các cạnh kề với nhau). Trong thực tế, có thể đạt được những
phát triển đáng kể của kỹ thuật 2-opt không nhất thiết phải sử dụng 3-opt bằgn cách
giới hạn 3-changes thành trườn hợp riêng với hai cạnh xóa đi nối với nhau. Kỹ thuật
này được gọi là 2.5-opt nằm giữa 2-opt và 3-opt, hiểu theo cả 2 nghĩa của chất lượng
lời giải đạt được và thời gian để tìm được lời giải.
• V'-opt heuristic
Kỹ thuật variable-opt method giống như , nhưng là sự tông quát hóa của k-opt kỹ
Các kỹ thuật sử dụng heuristtics gọi là các mẹo giải.
Thuật toán này tìm một đường đi từ một đỉnh khởi đầu tới một đỉnh đích cho
trước hoặc tới một đỉnh thỏa mãn một điều kiện đích mà theo bài toán này thì đỉnh
đích là đỉnh khởi đầu sau khi đi qua tất các đỉnh trong đồ thị. Thuật toán sử dụng một
"đánh giá heuristic" để xếp loại từng đỉnh theo ước lượng về tuyến đường tốt nhất đi
qua đỉnh đó. Thuật toán này duyệt các đỉnh theo thứ tự của đánh giá heuristic này.
Để biết những tuyến đường nào có khả năng sẽ dẫn tới đích, TKCT* sử dụng
"đánh giá heuristic" về khoảng cách từ điểm bất kỳ cho trước tới đích. Trong trường
hợp tìm đường đi, đánh giá này có thể là khoảng cách đường chim bay - một đánh giá
xấp xỉ, thường dùng cho khoảng cách của đường giao thông.
Điểm khác biệt của TKCT* đối với tìm kiếm theo lựa chọn tốt nhất là nó còn
tính đến khoảng cách đã đi qua. Điều đó làm cho TKCT* "đầy đủ" và "tối ưu", nghĩa
là, TKCT* sẽ luôn luôn tìm thấy đường đi ngắn nhất nếu tồn tại một đường đi như thế.
TKCT* không đảm bảo sẽ chạy nhanh hơn các thuật toán tìm kiếm đơn giản hơn.
Trong một môi trường dạng mê cung, cách duy nhất để đến đích có thể là trước hết
phải đi về phía xa đích và cuối cùng mới quay lại. Trong trường hợp đó, việc thử các
nút theo thứ tự "gần đích hơn thì được thử trước" có thể gây tốn thời gian.
2.3 Phân tích thiết kế giải thuật Heuristics tìm đường đi có giá nhỏ nhất với
tri thức bổ sung TKCT*
2.3.1 Chu trình Hammilton
Trong toán học, ngành lý thuyết đồ thị, một đường đi Hamilton là một đường đi
trong đồ thị vô hướng đi qua tất cả các đỉnh của đồ thị, mỗi đỉnh đúng một lần. Một
Chu trình Hamilton là một đường đi Hamilton sau đi qua tất cả các đỉnh của đồ thị thì
trở về đỉnh xuất phát.
Một đồ thị có chu trình Hamilton được gọi là đồ thị Hamilton, đồ thị có đường đi
Hamilton được gọi là đồ thị nửa Hamilton.
Bài toán tìm đường đi và chu trình như vậy được gọi là bài toán Hamilton. Bài toán
Hamilton là NP đầy đủ.
11
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
{ MO= {S0}; f0(S0) = g(0) + h(0);
While (M0 <> Φ)
{ S= getmoi(MO);
DONG = DONG U {S};
if S € DICH exit(“Thành công”);
12
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
if child (S) <> Φ
for each s € child(S)
if s € MO U DONG
MO= MO U {s};
f(s) = g(s) + h(s);
if f(s)cũ > f(s) mới MO= MO U {s};
}
Printf (“Không thành công”);
}
2.4 Mã nguồn
2.4.1 Cấu trúc file A_Star\A_Star
// Khai báo
int n, s, t;
int[,] a;
int[] h, g, f;
List<int> path = new List<int>();
public void ReadFile(string pathFile)
Hàm đọc dữ liệu từ file ra
public void ReadFile(string pathFile)
{
string[] tmp = new string[0];
string st; int i, j;
StreamReader sr = new StreamReader(pathFile);
14
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
{
int i, j;
Console.WriteLine("Matrix of Graph:");
for (i = 0; i < n; i++)
{
for (j = 0; j < n; ++j)
Console.Write("{0,3}", a[i, j]);
Console.WriteLine();
}
Console.WriteLine("Estimated h(u) from u to goal:");
for (int u = 0; u < n; ++u)
Console.Write("{0,3}", h[u]);
Console.WriteLine();
Console.WriteLine("Start Point:" + s);
Console.WriteLine("Terminal Point:" + t);
}
public void A_Star_Search()
Hàm duyệt đường đi
public void A_Star_Search()
{
List<int> open = new List<int>();
List<int> closed = new List<int>();
bool ok = false; int u, tmp;
open.Add(s);
while (true)
15
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
{
g[v] = tmp_gv;
f[v] = tmp_fv;
open.Add(v);
}
for (int i = 0; i < open.Count - 1; ++i)
for (int j = open.Count - 1; j > i; j)
if (f[open[j]] < f[open[j - 1]])
{
tmp = open[j];
open[j] = open[j - 1];
open[j - 1] = tmp;
}
}
if (ok)
{
Console.WriteLine("Contours of A star search:");
for (int k = 0; k < path.Count; ++k)
Console.Write("{0,3}", path[k]);
}
else
17
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
Console.WriteLine("unsuccessful!");
}
2.4.2 Cấu trúc file A sao_di du lich
Khai báo
const int size = 100;
int maxE = 100;
int maxC = size * maxE;
int C[size][size];
}
void InI()
Hàm gán giá trị đường đi ban đầu
void InI()
{
for ( int i = 1; i <= N; i++ )
{ FREE[i] = 1; }
FREE[1] = 0;
X[1] = 1;
T[1] = 0;
minSpending = maxC;
}
void BACKTRACK ( int i )
Hàm tìm đường đi với giá trị nhỏ nhất. Nhập đỉnh bắt đầu
19
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
void BACKTRACK ( int i )
{
for ( int j = 2; j <= N; j++ )
{
if ( FREE[j] )
{
X[i] = j;
T[i] = T[i-1] + C[X[i-1]][j];
if (( T[i] + C[i][1]) < minSpending )
{
if ( i < N )
{
FREE[j] = 0;
BACKTRACK ( i + 1 );
2.4.3 Cấu trúc file A_sao_Bai 2.15\ThuatToanA_sao
TTA.Nhap();
Hàm đọc thông tin từ file lưu trữ danh sách cạch và ma trận trọng số.
public void Nhap()
{
int hang = -1, cot = 0;
StreamReader h = new StreamReader(path);
string str = h.ReadLine();
21
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
n = int.Parse(str);
MaTranKe = new int[n, n];
str = h.ReadLine();
while (str != null)
{
hang++;
cot = 0;
foreach (string tmp in str.Split(' '))
{
int x = int.Parse(tmp);
MaTranKe[hang, cot] = x;
cot++;
}
str = h.ReadLine();
}
h.Close();
// khoi tao ma tran trong so
using (StreamReader dr = File.OpenText(path1))
{
string str1 = dr.ReadLine();
Console.Write("Nhap dinh ket thuc KT=");
kt = int.Parse(Console.ReadLine());
23
Báo cáo bài tập lớn Trí tuệ nhân tạo Bài toán người đi du lịch
}
TTA.Duyet();
Duyệt A* và đưa ra kết quả
public void Duyet()
{
if (Duyet_Asao())
{
Console.WriteLine();
Console.WriteLine("da tim thay ket qua");
Console.WriteLine("Hien duong di ngan nhat theo A*");
for (j = 0; j < KetQua.Length; j++)
{
if (j < KetQua.Length - 1) Console.Write("Dinh:{0},{1},{2}\t",
KetQua[j].Dinh, KetQua[j].Giatri_Gn, KetQua[j].Giatri_Fn + "==>");
else Console.WriteLine("Dinh:{0},{1},{2}", KetQua[j].Dinh,
KetQua[j].Giatri_Gn, KetQua[j].Giatri_Fn);
}
}
else Console.WriteLine("Khong tim thay ket qua");
}
private bool Duyet_Asao() {
bool TimThay = false;
// khoi tao doi tuong Stack
Stack A = new Stack();
//Khoi tao node Sau
Node Sau = new Node();