Chương 6: Sắp xếp và tìm kiếm (sorting and searching)
131
CHƯƠNG 6: SẮP XẾP VÀ TÌM KIẾM (SORTING
AND SEARCHING)
Sắp xếp & tìm kiếm là bài toán cơ bản nhất của tin học. Có thể nói, mọi tương tác
giữa con người và hệ thống máy tính về bản chất đều là tìm kiếm và thu thập thông tin. Ẩn
sau các quá trình tìm kiếm là việc sắp xếp các đối tượng theo một trật tự nào đó để quá trình
tìm kiếm diễn ra nhanh nhất, chính xác và hiệu quả nhất đó là ý nghĩa cơ bản của quá trình
sắp xếp. Nội dung chính của ch
ương này tập chung vào các giải thuật sắp xếp và tìm kiếm
cơ bản dưới đây:
9 Giải thuật Selection Sort, Giải thuật Insert Sort, Giải thuật Bubble Sort, Giải thuật
Shaker Sort, Giải thuật Quick Sort, Giải thuật Heap Sort, và giải thuật Merge
Sort.
9 Tìm kiếm tuần tự (Sequential), tìm kiếm nhị phân (Binary Search) & tìm kiếm
trên cây nhị phân (Binary Search).
Bạn đọc có thể tìm thấy những cài đặt cụ thể và những kiến thức sâu hơn trong tài
liệ
u [1] & [6].
6.1. ĐẶT BÀI TOÁN
Sắp xếp là quá trình bố trí lại các phần tử của một tập đối tượng nào đó theo một thứ
tự ấn định tăng dần (increasing), hoặc giảm dần (decreasing). Bài toán sắp xếp xuất hiện
trong bất kỳ lĩnh vực nào của tin học, phục vụ những ứng dụng riêng của hệ thống, từ
những ứng dụng ẩn bên trong của Hệ điề
u hành như bài toán điều khiển quá trình ( Proccess
Control Problem), bài toán lập lịch cho CPU (CPU Schedulling), bài toán quản lý bộ nhớ
(Memory Management) . . . cho tới những ứng dụng thông thường như sắp xếp dãy số, sắp
xếp các từ, các câu, các bản ghi theo thứ tự đều có liên quan tới quá trình sắp xếp.
Tập đối tượng cần được sắp xếp có thể xuất hiện dưới nhiều dạng khác nhau, các đối
tượng đó có thể là các đối tượng dữ liệu kiểu cơ bản như sắp xếp dãy số, sắp xếp kí tự, sắp
n
với i = 0, 1, . .,n; k
i
< k
i+1
< . . ., k
n
và đổi chỗ cho phần tử thứ k
i
. Như vậy, sau j =n-1
lần chọn, chúng ta sẽ só dãy khoá được sắp xếp theo thứ tự tăng dần. Đối với dãy số trên,
chúng ta sẽ thực hiện như sau:
Lần chọn thứ 0: Tìm trong khoảng từ 0 đến n-1 bằng cách thực hiện n- 1 lần so
sánh để xác định phần tử min
0
và đổi chỗ cho phần tử ở vị trí 0.
Lần chọn thứ 1: Tìm trong khoảng từ 1 đến n-1 bằng cách thực hiện n- 2 lần so
sánh để xác định phần tử min
1
và đổi chỗ cho phần tử ở vị trí 1.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lần chọn thứ i: Tìm trong khoảng từ i đến n-1 bằng cách thực hiện n- i lần so
sánh để xác định phần tử min
i
và đổi chỗ cho phần tử ở vị trí i.
Lần chọn thứ n-2: Tìm trong khoảng từ n-2 đến n-1 bằng cách thực hiện 1 lần so
sánh để xác định phần tử min
n-2
và đổi chỗ cho phần tử ở vị trí n-2.
Độ phức tạp tính toán của giải thuật Selection Sort là:
23
74
42
65
58
11
23
36
42
65
58
11
23
36
42
65
58
11
23
36
42
58
65
11
23
36
42
58
65
11
99
87
94
36
99
87
94
74
99
87
94
74
99
87
94
74
99
87
74
94
99
87
74
87
99
94
74
87
94
99
}
}
In(A,n);
}
}
void In(int *A, int n){
register int i;
for(i=0;i<n;i++)
printf("%5d",A[i]);
Chương 6: Sắp xếp và tìm kiếm (sorting and searching)
134
delay(1000);
}
void main(void){
int *A,n;clrscr();
printf("\n Nhap n="); scanf("%d",&n);
A=(int *) malloc(n*sizeof(int));
Init(A,n);Select(A,n);
free(A);
}
6.3. GIẢI THUẬT INSERTION SORT
Giải thuật Insert Sort được thực hiện dựa trên kinh nghiệm của những người chơi bài.
Khi có i-1 lá bài đã được sắp xếp đang ở trên tay, nay ta thêm lá bài thứ i thì lá bài đó được
so sánh với lá bài i-1, i-2, . . để tìm được vị trí thích hợp và chèn vào quân bài thứ i.
Với nguyên tắc sắp bài như vậy, giải thuật được thực hiện như sau:
Lấy phần tử đầu tiên i
0
, đương nhiên tập một phần tử là tập đã được sắp xếp.
Lấy tiếp phần tử thứ i
42
2
23
3
74
4
11
. . .
. . .
8
36
9
99
10
87
1
2
3
4
5
6
42 23
42
23
42
74
11
23
42
74
10
. . .
. . .
. . .
. . .
94 74
94
99
74
87
95
99
Thuật toán được cài đặt như sau:
#include <stdio.h>
#include <conio.h>
#include <stdlib.h>
#include <alloc.h>
#include <dos.h>
void Insert(int *, int);
void Init(int *, int);
void In(int *, int);
void Init(int *A, int n){
int i;
printf("\n Tao lap day so:");
for (i=0; i<n;i++){
A[i]=random(1000);
printf("%5d",A[i]);
}
delay(1000);
}
duyệt thứ nhất, phần tử lớn nhất sẽ được xếp đúng ở vị trí thứ n-1, ở lần duyệt thứ k thì k
phần tử
lớn nhất đã được xếp đúng vị trí n-1, n-2, . ., n-k+1. Sau lần duyệt thứ n-1, toàn bộ
n phần tử sẽ được sắp xếp. Với phương pháp này, các phần tử có giá trị nhỏ được nổi dần
lên như nước sủi bọt nhờ đó nó có tên gọi “phương pháp sủi bọt”.
Độ phức tạp của thuật toán Bubble Sort là:
C
min
= C
max
= C
tb
= n(n-1)/2.
Chương trình mô tả thuật toán Bubble Sort được cài đặt như sau:
#include <stdio.h>
#include <conio.h>
#include <stdlib.h>
#include <alloc.h>
#include <dos.h>
void Bubble(int *, int);
void Init(int *, int);
void In(int *, int);
void Init(int *A, int n){
int i;
printf("\n Tao lap day so:");
for (i=0; i<n;i++){
A[i]=random(1000);
printf("%5d",A[i]);
}
delay(1000);
}
6.5. GIẢI THUẬT SHARER SORT
Thuật toán Shaker Sort là cải tiến của thuật toán Bubble Sort. Trong đó, sau mỗi lần
duyệt đi để xếp đúng vị trí phần tử lớn nhất, chúng ta thực hiện duyệt lại để sắp đúng vị trí
phần tử nhỏ nhất. Dãy sẽ được sắp sau [n/2] + 1 lần duyệt. Chương trình mô tả thuật toán
Shaker Sort được thực hiện như sau:
#include <stdio.h>
#include <conio.h>
#include <stdlib.h>
#include <alloc.h>
#include <dos.h>
void Shaker(int *, int);
void Init(int *, int);
void In(int *, int);
void Init(int *A, int n){
int i;
printf("\n Tao lap day so:");
for (i=0; i<n;i++){
A[i]=random(1000);
Chương 6: Sắp xếp và tìm kiếm (sorting and searching)
138
printf("%5d",A[i]);
}
delay(1000);
}
void Shaker(int *A, int n){
register i,j,temp, exchange;
do {
exchange=0;
Init(A,n);Shaker(A,n);
free(A);
}