NGHIÊN CỨU VÀ ỨNG DỤNG HỆ THỐNG SUY DẪN MỜ VÀO MỘT SỐ BÀI TOÁN DỰ ĐOÁN - Pdf 31

TRƢỜNG ĐẠI HỌC SÀI GÕN
KHOA CÔNG NGHỆ THÔNG TIN
-----------------

CHÂU UYÊN SA

NGHIÊN CỨU VÀ ỨNG DỤNG HỆ THỐNG SUY DẪN MỜ
VÀO MỘT SỐ BÀI TOÁN DỰ ĐOÁN

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
NGÀNH CÔNG NGHỆ THÔNG TIN
Hệ đào tạo: Chính quy
Khóa học: 2007-2011
GVHD: ThS. HUỲNH MINH TRÍ

TP. HỒ CHÍ MINH, 2011


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Nghiên cứu và ứng dụng hệ thống suy dẫn mờ vào
một số bài toán dự đoán” là kết quả nghiên cứu của riêng tôi dƣới sự hƣớng dẫn của
thầy Huỳnh Minh Trí, không sao chép của ai. Nội dung luận văn có tham khảo và sử
dụng các tài liệu, thông tin đƣợc đăng tải trên các tác phẩm, tạp chí và các trang web
theo danh mục tài liệu của luận văn.

i
SVTH: Châu Uyên Sa


NHẬN XÉT CỦA GIẢNG VIÊN HƢỚNG DẪN ĐỀ TÀI


..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
TP Hồ Chí Minh, ngày … tháng … năm 2011
Ký tên

ThS. Lê Ngọc Kim Khánh

iii
SVTH: Châu Uyên Sa


NHẬN XÉT CỦA CHỦ TỊCH HỘI ĐỒNG

..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
..........................................................................................................................................
TP Hồ Chí Minh, ngày … tháng … năm 2011
Ký tên

ECOS (Evolving Connectionist Systems)
EFuNN (Evloving Fuzzy-Neural Network)
ESOM (Evolving Self Organising Maps)
FCMC (fuzzy C-means clustering)
Gas (Genetic algorithm)
KMC (K-means clustering)
LSE (Least-Square Estimatior)
MLP (Multi layer Perceptions)
NDEI (Non-Dimensional Error Index)
RAN (Resource Allocating Network)
RMSE (Root Mean Square Error)
SC (Subtractive Clustering)
TSK (Takagi-Sugeno_Kang)

vi
SVTH: Châu Uyên Sa


DANH MỤC CÁC BẢNG, ĐỒ THỊ, SƠ ĐỒ
Danh mục bảng:
Bảng 1 : So sánh phƣơng pháp phân cụm ECM với các phƣơng pháp phân cụm khác
qua dữ liệu gas-furnace .................................................................................................. 26
Bảng 2 : So sánh luật và chỉ số NDEI giữa DENFIS và các phƣơng pháp khác ........... 33
Bảng 3 : Cấu trúc dữ liệu đầu vào bài toán 1 ................................................................. 36
Bảng 4 : Cấu trúc dữ liệu đầu vào bài toán 2 ................................................................. 40
Bảng 5 : Dữ liệu đầu vào từ tháng 1 đến tháng 6 (BT 1) ............................................... 47
Bảng 6 : Dữ liệu đầu vào từ tháng 7 đến tháng 12 (BT 1) ............................................. 48
Bảng 7 : Dữ liệu đầu vào từ tháng 2/2010 đến tháng 4/2010 (BT 2)............................. 49
Bảng 8 : Dữ liệu đầu vào từ tháng 5/2010 đến tháng 7/2010 (BT 2)............................ 50
Bảng 9 : Dữ liệu đầu vào từ tháng 8/2010 đến tháng 10/2010 (BT 2).......................... 51


viii
SVTH: Châu Uyên Sa


MỤC LỤC

PHẦN MỞ ĐẦU .............................................................................................................................. 1
1.

Lý do chọn đề tài .................................................................................................................. 1

3.

Đối tƣợng nghiên cứu: .......................................................................................................... 2

4.

Phƣơng pháp nghiên cứu: ..................................................................................................... 2

5.

Ý nghĩa đề tài: ....................................................................................................................... 2

6.

Phạm vi nghiên cứu: ............................................................................................................. 2

7.


Hạn chế: ............................................................................................................................... 43
ix

SVTH: Châu Uyên Sa


3.

Hƣớng phát triển: ................................................................................................................ 43

TÀI LIỆU THAM KHẢO ............................................................................................................. 45
PHỤ LỤC ....................................................................................................................................... 47
Phụ lục A : Bảng dữ liệu............................................................................................................ 47
Phụ lục B: Hƣớng dẫn sử dụng công cụ Ecos_denfis .............................................................. 53

x
SVTH: Châu Uyên Sa


Nghiên cứu và ứng dụng hệ thống suy dẫn mờ
vào một số bài toán dự đoán

GVHD: Th.S Huỳnh Minh Trí

PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Ngày nay, việc dự đoán các phản ứng trong tƣơng lai của một tiến trình khá là
quan trọng. Dự đoán nhằm ra quyết định một cách chính xác hơn. Đặc biệt là trong các
lĩnh vực kinh tế, xã hội và nghiên cứu khoa học. Ví dụ nhƣ dự báo thời tiết ngày mai sẽ
nhƣ thế nào, dự báo thiên tai, bão lụt từ đó làm giảm thiểu tối đa thiệt hại do thiên tai

Khuynh hƣớng hiện nay vẫn là tập trung nâng cao độ chính xác của kết quả dự báo.
Trong khuôn khổ luận văn, em xin trình bày phƣơng pháp dự đoán dựa trên nền tảng hệ
suy dẫn mờ và chuỗi thời gian đã đƣợc một số tác giả phát triển từ trƣớc. Phƣơng pháp
đƣợc đề cập rõ nhất qua hệ thống DENFIS. Dựa trên hệ thống đề ra, em đã áp dụng vào
bài toán dự đoán nhiệt độ.

2. Mục tiêu đề tài:
Mục tiêu của luận văn là tìm hiểu giải pháp dựa trên chuỗi thời gian và hệ suy
dẫn mờ để xây dựng mô hình dự đoán một giá trị trong tƣơng lai từ các dữ liệu trong
quá khứ và hiện tại. Mô hình cần có khả năng linh động thích nghi đƣợc với sự biến
đổi không ngừng của môi trƣờng.
3. Đối tượng nghiên cứu:
Ứng dụng hệ thống suy diễn mờ và chuỗi thời gian vào dự đoán bài toán.
4. Phương pháp nghiên cứu:
Phƣơng pháp nghiên cứu tài liệu (với nguồn tài liệu chủ yếu là các bài báo cáo
khoa học).
5. Ý nghĩa đề tài:
Dƣới sự bùng nổ thông tin và sự phát triển công nghệ, nhiều lĩnh vực đòi hỏi hệ
thống phù hợp với tính chất động của chuỗi thời gian đồng thời có khả năng hỗ trợ ra
quyết định thay thế cho vị trí của nhiều chuyên gia. Dự đoán dựa trên chuỗi thời gian là
một vấn đề phức tạp. Đề tài đã trình bày một trong những phƣơng pháp giải quyết đƣợc
vấn đề phức tạp đó, ngoài ra phƣơng pháp này còn có khả năng cập nhật kiến thức theo
sự thay đổi không ngừng của môi trƣờng.
6. Phạm vi nghiên cứu:
Đề tài chỉ trình bày một số kiến thức nền tảng về hệ suy diễn mờ, chuỗi thời
gian cũng nhƣ quy trình dự đoán trong chuỗi thời gian. Giới thiệu hệ thống DENFIS và
cách ứng dụng của nó vào việc dự đoán dựa trên chuỗi thời gian (cụ thể là bài toán dự

2
SVTH: Châu Uyên Sa

1.1 Lý thuyết tập mờ
Lý thuyết tập mờ bao gồm logic mờ, số học mờ, quy hoạch toán học mờ, hình
học tôpô mờ, lý thuyết đồ thị mờ và phân tích dữ liệu mờ. Thuật ngữ logic mờ đƣợc chỉ
tất cả các lĩnh vực trên.
Trọng tâm của lý thuyết mờ là việc đề xuất khái niệm tập mờ (fuzzy sets). Xét
về mặt toán học tập mờ A là một hàm số (hàm thuộc- Membership function) xác định
trên khoảng giá trị mà đối số x có thể chấp nhận gọi là tập vũ trụ X (universe of
discourse).
µA (x): X [0.0; 1.0]
Với

A: nhãn mờ của biến x (thƣờng đƣợc đặc trƣng bởi biến ngôn ngữ).
0.0: đại diện cho trƣờng hợp phát biểu hoàn toàn sai.
1.0: đại diện cho trƣờng hợp phát biểu hoàn toàn đúng.

Vậy: Tập mờ A xác định trên tập X là một tập mà một phần tử của nó biểu diễn
bởi một cặp giá trị (x, µ A (x)). Trong đó x

X và µA (x) là ánh xạ.

Có hai cách để biểu diễn hàm liên thuộc µ (x) cho một tập mờ: dƣới dạng số học
và dƣới dạng hàm số (đồ thị hàm số).
Cách biểu diễn dƣới dạng số học thể hiện độ lớn của hàm liên thuộc của một tập
hợp nhƣ là một vector của các số mà đƣợc xác định dựa vào mức độ rời rạc của tập
hợp.
Cách biểu diễn dƣới dạng hàm số xác định hàm liên thuộc của một tập mờ trong
một biểu thức giải tích để cho phé p giá trị độ phụ thuộc của mỗi phần tử trong tập nền
cho trƣớc có thể tính toán đƣợc. Họ các tiêu chuẩn nào đó hay hình dạng của hàm liên
thuộc thông thƣờng đƣợc sử dụng cho các tập mờ dựa trên tập nền của các số thực. Một
số hàm liên thuộc thƣờng đƣợc sử dụng trong thực tế nhƣ dạng tam giác, dạng hình

“trung niên”, “già” trong đó mỗi giá trị ngôn ngữ là một tập mờ xác định bởi một hàm
thuộc và khoảng giá trị số tƣơng ứng.
Ví dụ:

Hình 1. 4 : Tập mờ điển hình dùng biến ngôn ngữ
Lý thuyết tập mờ áp dụng trên các nhóm ngôn ngữ mà trong đó ranh giới giữa
chúng không phân định rõ ràng. Bấy kì lý thuyết và các phƣơng pháp giải tích rõ đều
có thể đƣợc làm mờ bằng việc khái quát hóa khái niệm của một tập rõ thành một tập
mờ. Lợi ích của việc mở rộng đó là khả năng giải quyết các bài toán động có nhiễu
trong thế giới thực.
Tập mờ là một công cụ toán học cho phép chuyển đổi từ giá trị định lƣợng sang
giá trị định tính. Nói rộng ra, lý thuyết tập mờ là công cụ toán học hình thức hóa biểu
diễn thông tin mơ hồ không chắc chắn. Do vậy, lý thuyết mờ rất phù hợp với việc mô
phỏng hoạt động tƣ duy của con ngƣời, xét về khả năng xử lý xấp xỉ các thông tin để
đƣa ra quyết định.
6
SVTH: Châu Uyên Sa


Nghiên cứu và ứng dụng hệ thống suy dẫn mờ
vào một số bài toán dự đoán

GVHD: Th.S Huỳnh Minh Trí

Hệ thống suy dẫn mờ (Fuzzy Inference System) có thể nói là một công cụ xấp xỉ
toàn năng. Điều này cho phép các hệ thống suy dẫn mờ có thể xấp xỉ đặc tính tĩnh của
bất cứ một hàm phi tuyến liên tục nào trong một miền xác định với độ chính xác cao.
Đặc biệt là với những hệ phi tuyến mạnh mô hình mờ tỏ ra chiếm ƣu thế hơn so
với những mô hình khác.
1.2 Các phép toán trên tập mờ:


B (x)

= µA (x). µB (x);

Phép bù của tập mờ A có cơ sở X là tập mờ AC xác địh trên cùng cơ sở X có
hàm liên thuộc:
µAc (x) = 1- µA (x)

7
SVTH: Châu Uyên Sa


Nghiên cứu và ứng dụng hệ thống suy dẫn mờ
vào một số bài toán dự đoán

GVHD: Th.S Huỳnh Minh Trí

1.3 Cấu trúc hệ suy dẫn mờ:
Mỗi hệ suy dẫn mờ thƣờng gồm có 5 phần chủ đạo:

Hình 1. 5 : Cấu trúc hệ suy dẫn mờ
 Cơ sở luật: nơi chứa các tập luật mờ IF-THEN.Cơ sở luật là thành phần
quan trọng nhất của bất kỳ mô hình mờ nào.
 Bộ tham số: quy định hình dạng hàm thuộc của giá trị ngôn ngữ đƣợc
dùng để biểu diễn các biến mờ và các luật mờ. Giá trị tham số có thể
đƣợc đánh giá bằng kinh nghiệm của các chuyên gia hoặc là kết quả của
quá trình khai phá tri thức từ thực nghiệm.
 Cơ chế suy diễn (reasoning mechansim): có nhiệm vụ thực hiện thủ tục
suy diễn mờ dựa trên cơ sở tri thức (cơ sở luật và bộ tham số mô hình) và


Hình 1. 6 : Sơ đồ hoạt động suy dẫn mờ với các luật mờ là tiền đề

9
SVTH: Châu Uyên Sa


Nghiên cứu và ứng dụng hệ thống suy dẫn mờ
vào một số bài toán dự đoán

GVHD: Th.S Huỳnh Minh Trí

1.5 Phân loại mô hình mờ:
Dựa trên loại cơ chế suy diễn mờ và các dạng luật mờ đƣợc đƣợc sử dụng, phần
lớn các mô hình mờ có thể đƣợc xếp vào một trong ba loại mô hình sau:
1.5.1 Mô hình mờ Mamdani
Mô hình mờ Mamdani (còn gọi là mô hình ngôn ngữ) là mô hình điển hình nhất,
với bộ luật bao gồm các luật mà phần tiền đề và phần kết luận đều là các tập mờ. Ƣu
điểm của mô hình là tính thông dịch cao.Tuy nhiên, hệ thống bị giới hạn bởi sự cứng
nhắc của các giá trị ngôn ngữ và tạo nên tính thiếu chính xác nhƣ là khuyết điểm đáng
lƣu ý của hệ thống.

Hình 1. 7 : Mô hình mờ Mamdani sử dụng MIN và MAX
1.5.2 Mô hình mờ Takagi Sugeno
Mô hình mờ Takagi Sugeno (hay còn gọi là mô hình TSK) đƣợc đề xuất bởi
Takagi, Sugeno và Kang nhằm phát triển cách tiếp cận mang tính hệ thống đối với các
quá trình sinh luật mờ từ các tập dữ liệu vào ra cho trƣớc. Mô hình mờ Takagi Sugeno
đƣợc cấu thành từ một tập các luật mờ mà phần kết luận của mỗi luật là một hàm
(không mờ) ánh xạ từ các tham số đầu vào của mô hình tới tham số đầu ra mô hình.


Hình 1. 9 : Mô hình mờ Tsukamoto
Trong điều khiển dự báo thì mô hình mờ TSK đƣợc nghiên cứu và sử dụng rộng
rãi hơn cả. Mô hình này có ƣu điểm là có thể rút ra từ dữ liệu vào-ra quan sát đƣợc
bằng cách dùng kỹ thuật phân nhóm. Hơn thế, mô hình TSK còn có ƣu điểm là tốc độ
tính toán nhanh hơn mô hình Mamdani đồng thời cho kết quả chính xác hơn.

12
SVTH: Châu Uyên Sa


Nghiên cứu và ứng dụng hệ thống suy dẫn mờ
vào một số bài toán dự đoán

GVHD: Th.S Huỳnh Minh Trí

Chương 2: Mô hình chuỗi thời gian và quy trình dự đoán
trong chuỗi thời gian
2.1 Mô hình chuỗi thời gian:
Chuỗi thời gian là một dãy các giá trị quan sát X:={
theo thứ tự diễn biến thời gian với
quan sát tại thời điểm thứ hai và

1 là
n

1,

2,

…,

mối liên hệ với giá trị thời gian. Nếu thuộc tính có mối liên hệ với giá trị thời gian thì
nó đƣợc gọi là thuộc tính động, ngƣợc lại đƣợc gọi là thuộc tính tĩnh. Dựa vào chuỗi dữ
liệu này, ta tiến hành dự đoán các sự kiện xảy ra trong tƣơng lai. Công việc dự đoán
trên dữ liệu chuỗi thời gian đƣợc gọi là dự đoán chuỗi thời gian.
Công việc phân tích chuỗi thời gian thông thƣờng đƣợc thực hiện bởi một dòng
dữ liệu đơn phát sinh bởi một nguồn quan sát và đƣợc gọi là dự đoán đơn biến. Tuy
nhiên đôi lúc cũng đƣợc thực hiện với nhiều dòng dữ liệu, do cùng một hệ thống phát
sinh, cùng một lúc đƣợc gọi là dự đoán đa biến. Phƣơng pháp dự đoán đa biến dựa trên
chuỗi thời gian đƣợc đề cập đến trong [16].

13
SVTH: Châu Uyên Sa


Nghiên cứu và ứng dụng hệ thống suy dẫn mờ
vào một số bài toán dự đoán

GVHD: Th.S Huỳnh Minh Trí

Có nhiều phƣơng pháp dự đoán chuỗi thời gian, nhƣng phƣơng pháp mô hình
hóa hiện đƣợc nhiều quan tâm nhờ vào khả năng dự đoán đúng đắn dựa trên mối liên
hệ qua lại giữa các quan sát. Các mô hình dự đoán hầu hết đều đƣợc kết hợp theo tỉ lệ
khác nhau từ các lý thuyết về suy diễn mờ, mạng noron, di truyền và các thuật toán thời
gian. Trong phần sau của luận văn chúng ta sẽ tập trung nghiên cứu phƣơng pháp này
dựa trên kết hợp hệ suy dẫn mờ và chuỗi thời gian.

14
SVTH: Châu Uyên Sa



Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status