Nội dung:
Tìm hiểu tính toán song song hóa thuật toán và
ứng dụng song song bài toán sắp xếp theo giỏ
(bucket sort)
MỤC LỤC
TÀI LIỆU THAM KHẢO.......................................................................................15
2
Phần I: MỞ ĐẦU
Bốn thập kỷ qua chứng kiến sự phát triển bùng nổ về sức mạnh máy tính,
tạo tiền đề cho những bước tiến chưa từng thấy về phát minh, năng suất lao động
và phúc lợi cho con người. Nhưng quá trình đó giờ đây đứng trước một trở ngại
mà ít ai nghĩ đến: sự kết thúc của quá trình mở rộng sức mạnh điện toán. Ngành
tin học đã đạt đến giới hạn của những gì từng khả thi với một hay hai vi xử lý
trung tâm hoạt động theo chuỗi truyền thống (serial processing). Ngành nào vẫn
dựa vào mô hình đó để tiếp tục phát triển năng suất, tăng trưởng kinh tế và phát
triển xã hội thì cần phải bắt đầu một bước nhảy mới vào điện toán xử lý song
song (parallel processing).
Ngày nay, với các bài toán yêu cầu xử lý trên một số lượng dữ liệu lớn và
phức tạp như sự mô phỏng những hệ thống phức tạp và "những vấn đề thách
thức lớn" như: dự báo thời tiết và khí hậu, những phản ứng hoá học và hạt nhân,
hệ gen sinh học, ... đặt ra một nhu cầu lớn về tốc độ tính toán. Những bài toán
này thường yêu cầu một lượng lớn các phép tính lặp lại trên một khối lượng lớn
dữ liệu để đưa ra một kết quả đúng đắn, và các phép tính này cần hoàn thành
trong khoảng thời gian hợp lý. Ví dụ như bài toán dự bào thời tiết không thể xử
lý bằng các máy tính thông thường vì thời gian xử lý là khoảng 10 năm, điều
này hoàn toàn không phù hợp.
Đề giải quyết được các bài toán trên ta cần phải tăng tốc độ tính toán. Mặc
x 1mile x 1mile.
- Ước tính khoảng 5x10^8 khối (cells).
- Trên mỗi khối cần thực hiện ~ 200 phép toán -> cần thực hiện ~ 10^11
phép toán.
- Nếu cần dự báo cho 1 tuần, chu kỳ 1 phút -> cần thực hiện 10^4 lần, mỗi
lần 10^11phép toán.
- Siêu máy tính có thể thực hiện: 10^9 phép toán trên 1 giây -> cần 10^6
giây ~ 10 ngày để thực hiện.
Ví dụ 3: Mô phỏng tương tác của các protein với phân tử nước (Levin 1990):
- Thực hiện trên máy Cray X/MP (~800 triệu phép toán / 1 giây): để mô
phỏng 10^-12 giây phản ứng protein cần 1 giờ thực hiện.
- Nếu mô phỏng một phản ứng thực sự trên cùng máy Cray X/MP cần
31,688 năm.
TÓM LẠI:
Yêu cầu về thực nghiệm nghiên cứu, mô phỏng -> giải quyết những bài
toán có khối lượng tính toán lớn trong một khoảng thời gian chấp nhận được.
Phương hướng giải quyết vấn đề:
- Thực hiện trên các siêu máy tính mạnh.
- Thực hiện phân chia công việc thực hiện song song trên hệ thống các máy tính
Tính khả dụng của tính toán song song
SIÊU MÁY TÍNH: Khả năng tính toán phụ thuộc nhiều vào tốc độ xử lý
của CPU -> phụ thuộc vào cấu trúc và số lượng transistors chứa trong CPU –>
Có những giới hạn nhất định về kích thước, nhiệt độ -> không thể tăng số
transistors lên mãi được
THỰC HIỆN SONG SONG:
Nguyên tắc: thực hiện phân chia công việc chính thành các công việc con, có thể
thực hiện song song với nhau.
Xây dựng hệ thống song song từ nhiều bộ xử lý riêng biệt. Thực hiện các công
việc song song trên các bộ xử lý đó.
Vấn đề:
gian.
Thực hiện được với số lượng phép toán lớn hơn -> giải quyết được bài
toán lớn.
Hỗ trợ giải quyết nhiều công việc đồng thời.
2. Các ứng dụng trong hệ thống máy tính
Khi các hệ thống máy tính trở nên rộng khắp và sự tính toán trải rộng trên
toàn mạng, thì các vấn đề xử lý song song cũng được ứng dụng nhiều hơn. trong
việc bảo mật máy tính, việc phát hiện xâm phạm là một thử thách đáng kể.
Trong trường hợp phát hiệ xâm phạm mạng, dữ liệu được thu thập từ các trang
phân tán và phải được phân tích một cách nhanh chóng. Việc không thể thu thập
được dữ liệu này tại vị trí trung tâm để phân tích đòi hỏi các thuật giải song song
5
và phân tán. Trong lĩnh vực mật mã, ứng dụng đặc biệt nhất của tính toán song
song trên Internet tập trung vào việc phân tích các số nguyên cực lớn.
Các hệ thống nhúng tăng dựa trên các thuật toán điều khiển phân tán để
hoàn thành một số tác vụ. Một ô tô hiện đại gồm mười bộ xử lý liên lạc với nhau
để thực hiện các tác hợp trong việc tối ưu hoá quá trình tiến hành và sự thực
hiện. Trong các hệ thống này, các thuật toán phân tán và song song truyền thống
để lựa chọn vật dẫn đầu và tập độc lập lớn nhất, vv... thường được sử dụng.
3. Các loại máy tính song song
3.1. Phân loại theo Flynn
Dù là máy tính tuần tự hay song song đều phải thực hiện bằng cách thực
thi các chỉ lệnh trên dữ liệu
Dựa vào số lượng dòng lệnh và số lượng dòng dữ liệu thực thi cùng tại
một thời điểm mà Micheal Flynn đã phân các máy tính thành 4 loại:
- Máy tính SISD: Đơn dòng lệnh-đơn dòng dữ liệu
- Máy tính MISD: Đa dòng lệnh – đơn dòng dữ liệu
- Máy tính SIMD: Đơn dòng lệnh – đa dòng dữ liệu
- Máy tính MIMD: Đa dòng lệnh – đa dòng dữ liệu
3.2. Kiến trúc bộ nhớ của máy tính song song