Một số thuật toán tìm chuỗi và xây dựng chương trình minh họa thuật toán boyer moore - pdf 26

Link tải luận văn miễn phí cho ae
1. Lý do lựa chọn đề tài
Với sự bùng nổ và phát triển của công nghệ thông tin trong những năm
gần đây, đã mang lại nhiều hiệu quả đối với khoa học cũng nhƣ các hoạt động
thực tế, sự phát triển mạnh mẽ của công nghệ thông tin đã làm cho khả năng
thu thập và lƣu trữ thông tin của các hệ thống thông tin tăng lên một cách
nhanh chóng, lƣợng dữ liệu lƣu trữ trở nên quá nhiều. Vì vậy việc xử lý thông
tin gặp phải nhiều khó khăn, đặc biệt là công tác tìm kiếm.
Dữ liệu trong máy tính đƣợc lƣu trữ dƣới nhiều dạng khác nhau trong
đó dữ liệu dạng chuỗi là một trong những cách phổ biến nhất. Trên chuỗi các
đơn vị dữ liệu không có ý nghĩa quan trọng bằng cách sắp xếp của chúng. Có
thể thấy các dạng khác nhau của mỗi chuỗi nhƣ ở các file dữ liệu, các gói tin,
trên biểu diễn của các gen hay chính văn bản chúng ta đang đọc. Để tìm kiếm
thông tin hữu ích nhiều giải pháp, đề xuất đã đƣợc áp dụng, bao gồm các giải
pháp dựa trên phần cứng và phần mềm. Tuy nhiên, hầu hết các hệ thống tìm
kiếm thông tin hiện còn gặp phải nhiều vấn đề về hiệu năng do chúng phải
phân tích, xử lý một lƣợng rất lớn các chuỗi dữ liệu. Hơn nữa việc phân tích,
tìm kiếm, so khớp chuỗi đòi hỏi chi phí tính toán và thời gian xử lý lớn. Khi
lƣợng dữ liệu lớn, nhiều thông tin có thể bị bỏ qua không đƣợc phân tích,
không đáp ứng đƣợc nhu cầu của ngƣời sử dụng.
Để tìm kiếm thông tin một cách chính xác mà không mất quá nhiều thời
gian cần đi sâu nghiên cứu về các thuật toán so khớp chuỗi có hiệu năng
cao. Một trong những thuật toán so khớp chuỗi có hiệu năng cao đó là thuật
toán Boyer – Moore.
Chính vì các lý do trên nên em đã chọn đề tài “Một số thuật toán tìm
chuỗi và xây dựng chƣơng trình minh họa thuật toán Boyer – Moore” làm
khóa luận tốt nghiệp của mình.
2. Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu
- Áp dụng thuật toán Knuth - Morris – Pratt, Boyer – Moore, Franek -
Jennings – Smyth để tìm chuỗi.
- Xây dựng chƣơng trình minh họa thuật toán Boyer – Moore.
Nhiệm vụ
- Tìm hiểu một số thuật toán so khớp chuỗi.
- Xây dựng chƣơng trình tìm kiếm văn bản mã unicode dựa trên thuật
toán Boyer – Moor cải tiến bằng bảng giá trị dịch chuyển 2 chiều.
Cài đặt thử nghiệm và đánh giá kết quả.
3. Đối tƣợng và phạm vi nghiên cứu
Khóa luận đi sâu nghiên cứu một số thuật toán tìm chuỗi và xây dựng
chƣơng trình minh họa thuật toán Boyer – Moore cải tiến để tìm kiếm chuỗi
mã Unicode.
4. Giả thuyết khoa học
Tìm hiểu, nghiên cứu một số thuật toán tìm chuỗi sẽ giúp ngƣời lập
trình hiểu rõ hơn về công tác tìm kiếm. Từ đó, việc xây dựng các chƣơng
trình tìm kiếm văn bản, tìm kiếm thông tin và các chƣơng trình tìm kiếm mẫu
hay vết tấn công trong lĩnh vực an toàn mạng,… trở nên dễ dàng hơn.
Chƣơng trình đƣợc xây dựng nếu đƣa vào thực tiễn sẽ trợ giúp đắc lực
cho ngƣời sử dụng trong việc tìm kiếm thông tin một cách nhanh chóng,
chính xác mà không mất quá nhiều thời gian.
5. P ƣơn p p n i n ứu
a. P ƣơn p p nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của đề tài và biện pháp cần thiết để giải quyết các vấn đề
của đề tài.



zE4ts6Jp2T143Hb
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status