Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật
Trang: 68
{ remove(Temp1);
remove(Temp2);
return (-1);
}
if (FileMerge(Temp1, Temp2, DataFile, L) == -1)
{ remove(Temp1);
remove(Temp2);
return (-1);
}
L = 2*L;
}
remove (Temp1);
remove (Temp2);
return (1);
}
- Ví dụ minh họa thuật toán sắp xếp trộn thẳng:
Giả sử dữ liệu ban đầu trên tập tin Fd như sau:
10 4 15 2 1 20 22 15 14 30 5 8 40 31 36
Ta tiến hành phân phối và trộn các đường chạy có chiều dài cố đònh L:
Lần 1: L = 1
Phân phối luân phiên các đường chạy chiều dài L = 1 trên Fd về Ft1 và Ft2:
Fd: 10 4 15 2 1 20 22 15 14 30 5 8 40 31 36
Ft1: 10
15 1 22 14 5 40 36
Ft2: 4 2 20 15 30 8 31
Trộn các cặp đường chạy tương ứng chiều dài L = 1 trên Ft1 và Ft2 thành các đường
chạy chiều dài L = 2 (thực tế L có thể nhỏ hơn 2) và đưa về Fd:
Ft1: 10 15 1 22 14 5 40 36
e
r
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
h
a
n
Lần 3: L = 4
Phân phối luân phiên các đường chạy chiều dài L ≤ 4 trên Fd về Ft1 và Ft2:
Fd: 2 4 10 15 1 15 20 22 5 8 14 30 31 36 40
Ft1: 2 4 10 15 5 8 14 30
Ft2: 1 15 20 22 31 36 40
Trộn các cặp đường chạy tương ứng chiều dài L ≤ 4 trên Ft1 và Ft2 thành các đường
chạy chiều dài L ≤ 8 và đưa về Fd:
Ft1: 2 4 10 15
5 8 14 30
Ft2: 1 15 20 22 31 36 40
Fd: 1 2 4 10 15 15 20 22 5 8 14 30 31 36 40
Lần 4: L = 8
Phân phối luân phiên các đường chạy chiều dài L ≤ 8 trên Fd về Ft1 và Ft2:
Fd: 1 2 4 10 15 15 20 22 5 8 14 30 31 36 40
Ft1: 1 2 4 10 15 15 20 22
Ft2: 5 8 14 30 31 36 40
Trộn các cặp đường chạy tương ứng chiều dài L ≤ 8 trên Ft1 và Ft2 thành các đường
chạy chiều dài L ≤ 16 và đưa về Fd. Thuật toán kết thúc:
Ft1: 1 2 4 10 15 15 20 22
Ft2: 5 8 14 30 31 36 40
Ft1: 1 2 4 5 8 10 14 15 15 20 22 30 31 36 40
- Phân tích thuật toán:
+ Trong thuật giải này chúng ta luôn thực hiện log
2
(N) lần phân phối và trộn các run.
+ Ở mỗi lần phân phối run chúng ta phải thực hiện: N lần đọc và ghi đóa, 2N phép so
sánh (N lần so sánh hết run và N lần so sánh hết tập tin).
+ Ở mỗi lần trộn run chúng ta cũng phải thực hiện: N lần đọc và ghi đóa, 2N+N/2
phép so sánh (N lần so sánh hết run, N lần so sánh hết tập tin và N/2 lần so sánh
w
e
r
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
h
a
Trang: 70
b. Thuật toán sắp xếp trộn tự nhiên (Natural Merge Sort):
- Tư tưởng:
Tương tự như thuật toán trộn tự nhiên trên mảng, chúng ta tận dụng các đường chạy
tự nhiên ban đầu trên tập tin Fd có chiều dài không cố đònh. Tiến hành phân phối
luân phiên các đường chạy tự nhiên này của tập tin Fd về 2 tập tin phụ Ft1, Ft2. Sau
đó trộn tương ứng từng cặp đường chạy tự nhiên ở 2 tập tin phụ Ft1, Ft2 thành một
đường chạy mới có chiều dài bằng tổng chiều dài của cặp hai đường chạy đem trộn
và đưa về tập tin Fd.
Như vậy, sau mỗi lần phân phối và trộn các đường chạy tự nhiên trên tập tin Fd thì
số đường chạy tự nhiên trên tập tin Fd sẽ giảm đi một nửa, đồng thời chiều dài các
đường chạy tự nhiên cũng được tăng lên. Do đó, sau tối đa Log
2
(N) lần phân phối và
trộn thì tập tin Fd chỉ còn lại 01 đường chạy với chiều dài là N và khi đó tập tin Fd
trở thành tập tin có thứ tự.
Trong thuật giải này chúng ta sử dụng 2 tập tin phụ (có thể sử dụng nhiều hơn) và
quá trình phân phối, trộn các đường chạy tự nhiên được trình bày riêng biệt thành 2
thuật giải:
+ Thuật giải phân phối luân phiên (tách) các đường chạy tự nhiên trên tập tin Fd
về hai tập tin phụ Ft1, Ft2;
+ Thuật giải trộn (nhập) các cặp đường chạy tự nhiên trên hai tập tin Ft1, Ft2 về
tập tin Fd thành các đường chạy tự nhiên với chiều dài lớn hơn;
và chúng ta cũng giả sử rằng các lỗi thao tác trên tập tin sẽ bò bỏ qua.
- Thuật toán phân phối:
B1: Fd = fopen(DataFile, “r”) //Mở tập tin dữ liệu cần sắp xếp để đọc dữ liệu
B2: Ft1 = fopen(DataTemp1, “w”) //Mở tập tin trung gian thứ nhất để ghi dữ liệu
B3: Ft2 = fopen(DataTemp2, “w”) //Mở tập tin trung gian thứ hai để ghi dữ liệu
B4: IF (feof(Fd)) //Đã phân phối hết
Thực hiện Bkt
e
w
e
r
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
h
Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật
Trang: 71
B14: fread(&b, sizeof(T), 1, Fd) //Đọc 1 phần tử của run trên Fd ra biến tạm b
B15: IF (a > b) // Đã duyệt hết 1 đường chạy tự nhiên
B15.1: a = b // Chuyển vai trò của b cho a
B15.2: Thực hiện B18
B16: a = b
B17: Lặp lại B12
B18: Lặp lại B6
Bkt: Kết thúc
- Thuật toán trộn:
B1: Ft1 = fopen(DataTemp1, “r”) //Mở tập tin trung gian thứ nhất để đọc dữ liệu
B2: Ft2 = fopen(DataTemp2, “r”) //Mở tập tin trung gian thứ hai để đọc dữ liệu
B3: Fd = fopen(DataFile, “w”) //Mở tập tin dữ liệu để ghi dữ liệu
B4: fread(&a1, sizeof(T), 1, Ft1) //Đọc 1 phần tử của run trên Ft1 ra biến tạm a1
B5: fread(&a2, sizeof(T), 1, Ft2) //Đọc 1 phần tử của run trên Ft2 ra biến tạm a2
B6: IF (a1 ≤ a2) // a1 đứng trước a2 trên Fd
B6.1: fwrite(&a1, sizeof(T), 1, Fd)
B6.2: If (feof(Ft1)) //Đã chép hết các phần tử trong Ft1
Thực hiện B21 //Chép các phần tử còn lại trong Ft2 về Fd
B6.3: fread(&b1, sizeof(T), 1, Ft1) //Đọc tiếp 1 phần tử trên Ft1 ra biến tạm b1
B6.4: If (a1 > b1) //Đã duyệt hết đường chạy tự nhiên trong Ft1
B6.4.1: a1 = b1 // Chuyển vai trò của b1 cho a1
B6.4.2: Thực hiện B9
B6.5: a1 = b1
B6.6: Lặp lại B6
B7: ELSE // a2 đứng trước a1 trên Fd
B7.1: fwrite(&a2, sizeof(T), 1, Fd)
B7.2: If (feof(Ft2)) // Đã chép hết các phần tử trong Ft2
Thực hiện B25 // Chép các phần tử còn lại trong Ft1 về Fd
V
i
e
w
e
r
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
m
.
Giáo trình: Cấu Trúc Dữ Liệu và Giải Thuật
Trang: 72
//Chép phần đường chạy tự nhiên còn lại trong Ft1 về Fd
B15: fwrite(&a1, sizeof(T), 1, Fd)
B16: IF (feof(Ft1)) // Đã chép hết các phần tử trong Ft1
Thực hiện B21 //Chép các phần tử còn lại trong Ft2 về Fd
B17: fread(&b1, sizeof(T), 1, Ft1)
B18: IF (a1 > b1) // Đã chép hết 1 đường chạy tự nhiên trong Ft1
B18.1: a1 = b1
B18.2: Lặp lại B6
B19: a1 = b1
B20: Lặp lại B15
//Chép các phần tử còn lại trong Ft2 về Fd
B21: fwrite(&a2, sizeof(T), 1, Fd)
B22: IF (feof(Ft2))
Thực hiện Bkt
B23: fread(&a2, sizeof(T), 1, Ft2)
B24: Lặp lại B21
//Chép các phần tử còn lại trong Ft1 về Fd
B25: fwrite(&a1, sizeof(T), 1, Fd)
B26: IF (feof(Ft1))
Thực hiện Bkt
B27: fread(&a1, sizeof(T), 1, Ft1)
B28: Lặp lại B25
Bkt: Kết thúc
- Thuật toán sắp xếp trộn tự nhiên:
B1: L = Phân_Phối(DataFile, DataTemp1, DataTemp2)
B2: IF (L ≥ N) //Tập tin Fd chỉ còn 01 run
V
i
e
w
e
r
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
m
.