Header Page 1 of 126.
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TP.HCM
-----------------
CÔNG TRÌNH DỰ THI
GIẢI THƯỞNG NGHIÊN CỨU KHOA HỌC SINH VIÊN
“NHÀ KINH TẾ TRẺ – NĂM 2011”
TÊN CÔNG TRÌNH:
ỨNG DỤNG MÔ HÌNH MẠNG THẦN KINH
DỰ BÁO LẠM PHÁT VIỆT NAM
THUỘC NHÓM NGÀNH: KHOA HỌC KINH TẾ
Footer Page 1 of 126.
Header Page 2 of 126.
i
MỤC LỤC
DANH MỤC CÁC TỪ VIẾT TẮT
DANH MỤC BẢNG BIỂU
DANH MỤC HÌNH
DANH MỤC PHỤ LỤC
LỜI MỞ ĐẦU
1.2.4.3. Sắp xếp lại bộ dữ liệu.............................................................................. 19
1.2.4.4. Xây dựng cấu trúc mô hình mạng ............................................................ 21
1.2.4.4.1. Số lớp ẩn của mô hình mạng truyền thẳng đa lớp ........................ 21
1.2.4.4.2. Số nơ-ron của mỗi lớp ẩn trong mô hình mạng ............................ 21
1.2.4.5. Huấn luyện mạng và các tiêu chuẩn đánh giá mô hình............................. 22
1.2.5. Bằng chứng thực nghiệm của mô hình mạng thần kinh ....................................22
1.2.5.1. Ứng dụng trong dự báo tài chính ............................................................. 23
1.2.5.2. Ứng dụng trong xếp hạng tín dụng ........................................................... 23
1.2.5.3. Ứng dụng trong dự báo lạm phát ............................................................. 24
1.2.5.4. Một số ứng dụng khác của mô hình mạng thần kinh nhân tạo .................. 25
CHƯƠNG 2: ỨNG DỤNG MÔ HÌNH MẠNG THẦN KINH
DỰ BÁO LẠM PHÁT VIỆT NAM .................................................... 27
2.1. Xác định biến số đầu vào của mô hình ...................................................................27
2.2. Thu thập và xử lý dữ liệu ....................................................................................... 32
2.3. Sắp xếp lại bộ dữ liệu ............................................................................................ 36
2.4. Xây dựng mô hình dự báo lạm phát .......................................................................36
2.5. Kết quả thực nghiệm của mô hình và kết luận ....................................................... 39
CHƯƠNG 3: MỘT SỐ GỢI MỞ TỪ KẾT QUẢ MÔ HÌNH ..................................48
3.1. Gợi ý về hướng nghiên cứu tiếp theo .....................................................................48
3.2. Gợi ý chính sách ....................................................................................................49
KẾT LUẬN
PHẦN PHỤ LỤC
TÀI LIỆU THAM KHẢO
Footer Page 3 of 126.
IMF
Quỹ tiền tệ quốc tế
INF
Tỷ lệ lạm phát (Inflation)
JCN
Mô hình mạng thần kinh kết nối bước nhảy (Jump connection
networks)
LR
Mô hình hồi quy tuến tính (Linear regression model)
M2
Tăng trưởng cung tiền M2 (Money supply M2)
MA
Trung bình di động (Simple moving average)
MFN
Mô hình mạng thần kinh chuyển tiếp đa tầng (Multi feedforward
networks)
iv
DANH MỤC BẢNG BIỂU
Danh mục bảng.................................................................................................... Trang
Bảng 2.1: Mô tả các biến cơ sở và ký hiệu sử dụng ...................................................... 34
Bảng 2.2: Một số chỉ số thống kê cơ bản của các biến cơ sở ........................................35
Bảng 2.3: Thống kê các mô hình mạng được sử dụng .................................................. 38
Bảng 2.4: Kết quả kiểm định ngoài mẫu chuỗi các mô hình MLF
sử dụng hàm kích hoạt log-sigmoid ............................................................. 40
Bảng 2.5: Kết quả kiểm định ngoài mẫu chuỗi các mô hình MLF
sử dụng hàm kích hoạt tag-sigmoid .............................................................. 40
Bảng 2.6: Kết quả kiểm định ngoài mẫu chuỗi các mô hình GNN ................................ 44
Footer Page 5 of 126.
Header Page 6 of 126.
v
DANH MỤC HÌNH
Danh mục hình .................................................................................................... Trang
Hình 1.1: Cấu trúc nơ-ron trong não bộ và hệ thần kinh .................................................9
Hình 1.2: Cấu trúc mạng thần kinh đơn giản ................................................................ 10
Hình 1.3: Hàm log-sigmoid ......................................................................................... 12
Hình 1.4: Cấu trúc mạng truyền thẳng (feed forward)
và mạng phản hồi (feed back) ......................................................................13
Hình 1.5: Mô hình mạng truyền thẳng một lớp ẩn ........................................................ 14
Phụ lục 6: Mô hình mạng truyền thẳng đa lớp ............................................................. 61
Phụ lục 7: Kết quả kiểm định ngoài mẫu mô hình MLF-7-5-4-1 ..................................63
Phụ lục 8: Kết quả kiểm định ngoài mẫu mô hình GNN-7-4-1.....................................64
Phụ lục 9: Kết quả kiểm định ngoài mẫu mô hình GNN-7-4-4-4-1 .............................. 65
Footer Page 7 of 126.
Header Page 8 of 126.
-1-
LỜI MỞ ĐẦU
1. Lý do chọn đề tài.
Nếu như lạm phát trong nền kinh tế Việt Nam được duy trì ổn định trong suốt những
năm 2000 thì đến năm 2004, lạm phát bắt đầu tăng tốc mà đỉnh điểm là năm 2008, tỷ
lệ lạm phát đạt đến mức gần 20%. Trong nửa năm đầu 2011, tỷ lệ lạm phát đã vào
khoảng 13%. Lạm phát, nhất là lạm phát cao đã tác động đến nhiều mặt đời sống kinh
tế - xã hội: làm tăng chi phí sản xuất kinh doanh và giảm khả năng cạnh tranh của các
doanh nghiệp; làm méo mó nền kinh tế và làm cho việc thực hiện các kế hoạch chi
tiêu và tiết kiệm của dân chúng bị đảo lộn, gây tác động xấu đến những người có thu
nhập thấp, đặc biệt là những người sống chủ yếu bằng nguồn thu nhập từ tiền lương.
Trong bối cảnh đó, lạm phát mục tiêu, một công cụ của chính sách tiền tệ, đang dần
được chú ý nhiều hơn bởi các nhà điều hành chính sách lẫn giới nghiên cứu học thuật
bởi tính hiệu quả của nó trong việc ổn định giá cả, thúc đẩy tăng trưởng. Tuy nhiên,
một trong những điều kiện tiên quyết cho việc sử dụng hiệu quả công cụ lạm phát
mục tiêu chính là công tác dự báo của Ngân hàng Nhà nước đối với xu hướng chung
của giá cả để từ đó đề ra những biện pháp chủ động đưa mức lạm phát về mức mục
tiêu kỳ vọng. Mặt khác, nhận thấy tiềm năng của mô hình mạng thần kinh phi tuyến
3. Kết cấu đề tài.
Để đi vào giải quyết mục tiêu nghiên cứu trên, đề tài được xây dựng với kết cấu gồm
ba chương với nội dung như sau:
Chương 1: Cơ sở lý thuyết về lạm phát và mô hình mạng thần kinh nhân tạo.
Chương 2: Ứng dụng mô hình mạng thần kinh dự báo lạm phát Việt Nam.
Chương 3: Một số gợi mở từ kết quả mô hình.
4. Đóng góp của đề tài.
Đề tài đã góp phần vào việc hệ thống hóa các khái niệm và nguyên lý nền tảng của
mô hình mạng, cơ chế vận hành của mô hình cùng với quy trình các bước để tiến
hành ứng dụng xây dựng mô hình trong dự báo thực tiến. Tiếp đó, kết quả thực
nghiệm đã cho thấy cấu trúc mạng tốt nhất để dự báo tỷ lệ lạm phát hàng tháng ở Việt
Nam là mô hình truyền thẳng giản đơn với một lớp ẩn và ba nơ-ron ẩn. Cuối cùng,
trên cơ sở kết quả thực nghiệm của mô hình, một số gợi ý về chính sách điều hành
lạm phát trong thời gian tới đã được đưa ra.
5. Hướng phát triển đề tài.
Mô hình mạng thần kinh được sử dụng trong đề tài chỉ là mô hình mạng truyền thẳng
giản đơn, do vậy, những nghiên cứu trong thời gian tới hướng đến việc áp dụng mô
hình mạng có phản hồi hoặc kết hợp với thuật toán di truyền và logic mờ để xây dựng
các mô hình “lai tạp” kỳ vọng sẽ góp phần vào việc nâng cao hiệu quả dự báo. Mặt
khác, bên cạnh lạm phát thì mô hình còn có thể được ứng dụng trong dự báo các biến
số khác như tỷ giá, tốc độ tăng trưởng GDP… Ngoài ra, một hướng phát triển khả dĩ
khác cho đề tài chính là ứng dụng mô hình trong hoạt động phân loại đối tượng đi
vay để hỗ trợ cho quá trình thẩm định tín dụng của các ngân hàng.
Footer Page 9 of 126.
Header Page 10 of 126.
-3-
công nghệ lạc hậu, cơ chế quản lý cồng kềnh… Khi mức chi phí này vượt qua khỏi
sự bù đắp của năng suất lao động thì giá cả các mặt hàng sẽ tăng vọt và lạm phát xuất
hiện. Lúc này, lạm phát không còn là động lực để phát triển nữa mà nó sẽ khiến cho
nền kinh tế bị suy thoái, cần các biện pháp cấp bách nhằm khống chế lạm phát.
Footer Page 10 of 126.
Header Page 11 of 126.
-4-
Tóm lại, có rất nhiều góc nhìn khác nhau về lạm phát. Mỗi quan điểm, lý thuyết chỉ
giải thích cho một số thời kỳ nhất định và ngày càng nhiều quan điểm mới ra đời
cùng sự phát triển của nền kinh tế. Nhìn chung, dưới bất kỳ quan điểm nào lạm phát
cũng được đặc trưng bởi 3 điểm chính yếu sau:
o Sự gia tăng quá mức của lượng tiền trong lưu thông.
o Dẫn đến sự mất giá của đồng tiền.
o Từ đó, khiến cho giá cả các loại mặt hàng tăng cao.
1.1.2. Phân loại lạm phát
Xét về định tính, lạm phát được nhà kinh tế học Paul A. Samuelson phân thành hai
loại như sau:
Lạm phát cân bằng và có thể dự đoán trước:
Đây là loại lạm phát khi toàn bộ giá cả của nền kinh tế đều tăng và mức tăng này đã
được dự đoán trước thì thu nhập của người dân cũng đồng thời được tăng lên một
cách tương ứng. Theo đó, lạm phát cân bằng và có thể dự đoán trước sẽ không gây ra
một tác hại nào cho việc sản xuất kinh doanh, tốc độ tăng trưởng của kinh tế hay việc
phân phối thu nhập của người dân.
Lạm phát không cân bằng và không được dự đoán trước:
Loại lạm phát này xảy ra khi mức giá cả các loại hàng hóa, dịch vụ tăng không đều
nhau, vượt xa mức tăng trong tiền lương và không được dự báo trước. Đây là loại
theo lạm phát. Vì vậy, khi lạm phát tăng cao, giá trị của những khoản nợ và tài sản
này sẽ bị giảm xuống. Đó là do trong điều kiện lạm phát, giá của hầu hết các hàng
hóa và dịch vụ trong nền kinh tế đều tăng trong khi các khoản chi trả gắn liền với
những khoản nợ hoặc tài sản này vẫn luôn giữ cố định. Nghiên cứu của Césaire A.
Meh (2009), trên cơ sở dữ liệu của Ngân hàng Trung Uơng Canada, đã lượng hóa tác
động tác động của lạm phát đối với việc phân phối lại thu nhập. Kết quả cho thấy tác
động này thật sự đáng kể cho dù lạm phát chỉ ở mức thấp.
1.1.3.2.
Tác động của lạm phát đối với tăng trưởng kinh tế.
Hầu hết mọi người đều đồng ý rằng lạm phát cao sẽ tác động bất lợi đối với nền kinh
tế. Thế nhưng, các nghiên cứu lại không đồng nhất quan điểm về mối tương quan
giữa lạm phát và tăng trưởng. Lý thuyết cổ điển cho rằng, giữa tăng trưởng và lạm
phát tồn tại mối tương quan dương. Tuy nhiên, những nghiên cứu thực nghiệm ban
đầu về vấn đề này hầu như chưa thể đưa ra một kết luận rõ ràng về mối tương quan
giữa hai biến số trên. Một trong những nguyên nhân này theo Michael và William
(1996) là do giới hạn trong việc xác định mối tương quan phi tuyến, được cho là vốn
dĩ tồn tại trong mối quan hệ giữa lạm phát và tăng trưởng. Nghiên cứu của Robert
(1996), sử dụng dữ liệu của gần 100 quốc gia trong giai đoạn từ năm 1960 đến 1990
để đánh giá tác động của lạm phát lên tăng trưởng kinh tế, đã đưa ra kết luận như sau:
khi lạm phát gia tăng ở mức trung bình khoảng 10% thì tỷ tăng trưởng GDP bình
quân đầu người sẽ giảm khoảng 0.4 – 0.6%. Mức tác động này không thật sự lớn.
Tuy nhiên, nghiên cứu của Min Li (2005) sử dụng dữ liệu lạm phát và tăng trưởng ở
90 quốc gia đang phát triển và 25 nước phát triển đã cho thấy sự tồn tại mối tương
quan phi tuyến giữa hai biến số này. Kết quả nghiên cho thấy, tại các nước đang phát
Footer Page 12 of 126.
Header Page 13 of 126.
gia. Trong một số trường hợp, lý thuyết ngang giá sức mua không thể dự đoán được
ngay cả chiều hướng biến động của một đồng tiền. Điều này được lý giải một phần là
do lạm phát không phải là yếu tố duy nhất tác động đến tỷ giá. Bên cạnh lạm phát, tỷ
giá còn chịu ảnh hưởng của các yếu tố khác như: lãi suất, mức thu nhập và sự can
thiệp của Chính phủ.
Footer Page 13 of 126.
Header Page 14 of 126.
1.1.3.4.
-7-
Các tác động khác của lạm phát.
Trong điều kiện lạm phát cao và không dự đoán trước được, cơ cấu nền kinh tế dễ bị
mất cân đối vì khi đó các nhà kinh doanh thường hướng đầu tư vào những khu vực
hàng hóa có giá cả tăng lên cao, những ngành sản xuất có chu kỳ ngắn, thời gian thu
hồi vốn nhanh, hạn chế đầu tư vào những ngành sản xuất có chu kỳ dài, thời gian thu
hồi vốn chậm vì có nguy cơ gặp phải nhiều rủi ro.
Bên cạnh đó, trong lĩnh vực lưu thông, khi vật giá tăng quá nhanh thì tình trạng đầu
cơ, tích trữ hàng hóa thường là hiện tượng phổ biến, gây nên mất cân đối giả tạo làm
cho lưu thông hàng hóa càng thêm rối loạn.
Lạm phát hoặc siêu lạm phát làm cho hoạt động của hệ thống tín dụng rơi vào tình
trạng khủng hoảng. Nguồn tiền gửi trong xã hội bị sụt giảm nhanh chóng, nhiều ngân
hàng bị phá sản do mất khả năng thanh toán. Lạm phát điều chỉnh quá nhanh, biểu
giá thường xuyên thay đổi làm cho lượng thông tin trong giá cả bị phá hủy, các tính
toán kinh tế bị sai lệch nhiều theo thời gian, từ đó gây khó khăn cho các hoạt động
cạnh đó khoa học về trí tuệ nhân tạo còn có những ứng dụng khác như lý thuyết hỗn
loạn (chaos theory), thuật toán mô phỏng luyện kim (simulated annealing), hệ chuyên
gia (expert system) và lý thuyết logic mờ (Fuzzy logic)…
Tuy nhiên, trong số những ứng dụng của trí tuệ nhân tạo thì mô hình mạng thần kinh
(Artificla Neural Network) được cho là có khả năng thích nghi tốt nhất với yếu tố
“bất định”, vốn tồn tại trong các biến số kinh tế - tài chính và tạo nên rủi ro cho các
chủ thể kinh tế trong quá trình ra quyết định. Mô hình mạng thần kinh đã giải quyết
vấn đề này tốt hơn so với các công cụ khác là do khả năng nhận biết các mẫu hình
trong chuỗi dữ liệu để từ đó đưa ra những dự báo về xu hướng biến động trong tương
lai. Đây vốn là khả năng đặc biệt của não bộ con người mà mô hình mạng nhân tạo
đã mô phỏng được. Những ý tưởng cơ bản về cách thức hoạt động của não bộ sẽ giúp
cho việc tìm hiểu mô hình dễ dàng hơn.
1.2.1. Ý tưởng nền tảng của mô hình mạng thần kinh.
Não bộ và hệ thần kinh của con người được cấu thành bởi các tế bào được gọi là nơron. Theo như minh họa trong hình, mỗi nơ-ron sẽ bao gồm các thành phần chính
thực hiện nhiệm vụ tiếp nhận tín hiệu đầu vào, xử lý và cho ra các phản ứng ở đầu ra.
Bộ phận đầu vào sẽ tiếp nhận các xung thần kinh vốn dĩ là tín hiệu đầu ra của các nơron khác thông qua các khớp thần kinh. Khi tiếp nhận những tín hiệu đầu vào này, bộ
phận xử lý trung tâm của nơ-ron sẽ tổng hợp chúng lại và so sánh với mức “ngưỡng
phản ứng đầu ra”. Theo đó, chỉ khi nào các tín hiệu kích thích đầu vào vượt qua mức
ngưỡng này thì nơ-ron mới được kích hoạt và phản ứng lại bằng cách truyền tín hiệu
đầu ra đến một nơ-ron khác. Mức độ phản ứng của mỗi nơ-ron sẽ phụ thuộc vào mức
độ của các kích thích đầu vào và bản thân nơ-ron mà nó đã được nhận tín hiệu. Khi
các tín hiện được lan truyền giữa các nơ-ron thì sẽ dần hình thành nên một hệ thống
mạng lưới các nơ-ron được kích hoạt đồng thời và đây chính là nguồn gốc cho sự kỳ
diệu của não bộ con người trong việc nhận dạng các mẫu hình từ quá khứ.
Footer Page 15 of 126.
Header Page 16 of 126.
nhận hay không đối với một khoản cho vay, các biến đầu vào có giá trị tham khảo để
đưa ra quyết định này sẽ bao gồm mức thu nhập hàng tháng, trình độ học vấn, tuổi,
giới tính… Giá trị của mỗi biến số này sẽ trở được đưa vào các nơ-ron của lớp Input.
Trong một số trường hợp, giá trị của biến đầu vào sẽ đại diện cho các biến định tính
như: “đúng” hoặc “sai”; “tăng” hoặc “giảm”; “đậu” hoặc “rớt”…
Tiếp đó, biến đầu ra (Output) của mô hình chính là giải pháp của vấn đề, chính là
biến độc lập trong môi hình hồi quy tuyến tính. Tiếp theo ví dụ trong trường hợp trên,
khi đó, biến đầu ra sẽ là quyết định “cho vay” hoặc “không cho vay”. Kết quả này sẽ
được mã hóa dưới dạng giá trị số học là +1 và 0. Mục tiêu của mô hình mạng, cũng
tương tự các mô hình hồi quy khác sẽ là tính toán và dự báo giá trị của biến đầu ra
với một tập hợp các thông tin của biến đầu vào được cho trước trên cơ sở các thông
tin thu thập được từ dữ liệu quá khứ. Tương tự với quá trình hồi quy tuyến tính thông
thường, mô hình mạng thần kinh sẽ được “huấn luyện” để có thể “học” từ những
thông tin trong dữ liệu quá khứ để từ đó có thể đưa ra quyết định hoặc kết quả dự
báo. Quá trình này sẽ được tiến hành bằng các thuật toán huấn luyện mạng sẽ được
đề cập kỹ hơn ở các phần sau.
Footer Page 17 of 126.
Header Page 18 of 126.
- 11 -
Chính trong quá trình “học” này, hệ thống mạng thần kinh sẽ liên tục điều chỉnh các
trọng số (weight) của mỗi nơ-ron sao cho đạt được mục tiêu cuối cùng là giá trị dự
báo, kết quả của biến đầu ra từ mô hình mạng sẽ gần sát nhất với giá trị thực tế. Các
trọng số là một trong những thành phần quan trọng nhất của hệ thống mạng nhân tạo.
Nó sẽ ảnh hưởng đến mức độ tín hiệu được lan truyền từ lớp nơ-ron này sang lớp nơron khác. Các trọng số thể hiện mức độ ảnh hưởng của mỗi nơ-ron bởi các nơ-ron
trước đó. Khi so sánh với môi hình hồi quy tuyến tính truyền thống, các trọng số này
- 12 -
Hình 1.3: Hàm log-sigmoid
Hơn nữa, hình dạng của hàm logsigmoid còn được sử dụng vì nó phản ánh quá trình
học hỏi từ hành động thực tế (learning by doing). Cụ thể là, đồ thị hàm số thể hiện độ
dốc tăng dần cho đến một điểm uốn xác định, sau đó, nó dần trở nên phẳng hơn và độ
dốc dần tiến đến không. Tiếp theo ví dụ trước ta sẽ thấy, khi lãi suất bắt đầu tăng từ
mức thấp, người tiêu dùng sẽ đánh giá xác suất của một đợt điều chỉnh tăng hoặc
giảm mạnh của lãi suất dựa trên thông tin về mức cho vay ở hiện tại. Họ càng có
nhiều kinh nghiệm thì càng có khả năng phân tích tín hiệu này để đi đến kết luận rằng
đây là một thời cơ tốt để tận dụng mức lãi suất hiện tại hoặc đây là thời điểm nên trì
hoãn quyết định mua sắm. Kết quả cuối cùng cũng sẽ khác nhau khi những người này
phải ra quyết định ở những các thời điểm khác nhau của mức lãi suất. Tóm lại, hàm
phi tuyến logsigmoid đã nắm bắt được các “ngưỡng phản ứng” (threshold response)
đặc trưng cho “sự hợp lý có giới hạn” (bounded rationality) hoặc “quá trình tự học
hỏi” (learning porcess) của các chủ thể trong trong quá trình hình thành nên các kỳ
vọng của mình. Kuan và White (1994) đã cho rằng các điểm “ngưỡng” chính là đặc
điểm cốt lõi của các phản ứng phi tuyến trong mô hình mạng thần kinh. Điều này
được mô tả là “một số nơ-ron có khuynh hướng phản ứng thụ động trước các tác
nhân kích thích khiêm tốn, và chúng nhanh chóng trở nên “năng động” hơn chỉ khi
các kích thích này vượt qua một mức ngưỡng nào đó. Tuy nhiên, sau khi vượt quá
giai đoạn này, một sự gia tăng trong các kích thích đầu vào sẽ chỉ còn tác động hạn
chế”.
Footer Page 19 of 126.
Header Page 20 of 126.
Hình 1.5 : Mô hình mạng truyền thẳng một lớp ẩn
Nguồn: Paul D. MaNelis (2005) “Neural Network in Finance”.
Hình 1.5 minh họa cho mô hình mạng thần kinh truyền thẳng 3 lớp: 1 lớp nơ-ron của
biến đầu vào, 1 lớp nơ-ron của biến đầu ra và 1 lớp ẩn. Mạng truyền thẳng với một
lớp ẩn duy nhất là loại mô hình mạng thần kinh cơ bản, được sử dụng phổ biến nhất
trong ứng dụng kinh tế, tài chính. Nhìn chung, hệ thống mạng này sẽ mô phỏng cách
thức mà não người xử lý những dữ liệu kích thích được tiếp nhận ở nơ-ron đầu vào
và cho ra kết quả phản ứng ở nơ-ron đầu ra. Tương tự sự phát triển của não, ngày
càng có nhiều nơ-ron sẽ được kết nối với nhau bởi các khớp thần kinh. Kết quả là
nhiều lớp ẩn hơn sẽ được hình thành, tín hiệu từ những nơ-ron khác nhau sẽ hoạt
động đồng thời và được kết nối bởi các khớp thần kinh để cho ra những phản ứng có
nhiều sắc thái hơn.
Điều hiển nhiên là, với những dữ liệu kích thích đầu vào đơn giản, chẳng hạn như
kinh nghiệm về nhiệt độ quá nóng hoặc quá lạnh, thì không cần phải được xử lý bởi
quá nhiều nơ-ron ở nhiều lớp ẩn trước khi cho ra kết quả phản ứng lại. Tuy nhiên, khi
dữ liệu kích thích đầu vào trở nên phức tạp hoặc đa dạng hơn, nhiều nơ-ron hơn ở các
lớp ẩn sẽ được kích hoạt và các phản ứng hoặc những quyết định được đưa ra sẽ là
kết quả của quá trình cân nhắc khi kết hợp các tín hiệu từ nhiều nơ-ron của nhiều lớp
ẩn khác nhau.
Footer Page 21 of 126.
Header Page 22 of 126.
1.2.3.3.
(đối với mô hình chỉ có một lớp ẩn) hoặc Ω = ω ; ; ρ ; ; γ
(đối
với hệ có hai lớp ẩn) sao cho tối thiểu hóa bình phương chênh lệch giữa giá trị dự báo
đầu ra và giá trị thực tế, được ký hiệu là hàm
Footer Page 22 of 126.
.
Header Page 23 of 126.
- 16 -
( ) = ∑
(
−
)
= f( , )
Trong đó, T là số lượng quan sát của vector biến đầu ra y, và ( ;
) đại diện cho
hệ thống mạng thần kinh.
Nguyên tắc chung là tất cả các phương pháp tối ưu hóa phi tuyến đều bắt đầu bằng
Tiếp đến là quá trình thu thập những dữ liệu cần thiết cho quá trình huấn luyện hệ
thống mạng và dự báo ngoài mẫu. Trong quá trình này, việc chuẩn hóa số liệu, trong
một số trường hợp là hết sức cần thiết.
Dữ liệu đã thu thập được cần phải được phân chia thành ba phần: tập các quan sát
được dùng để huấn luyện mạng, tập các quan sát được dùng để thử nghiệm lại và
cuối cùng là tập được dùng để kiểm định ngoài mẫu.
Kế đó là những vấn đề về việc lựa chọn cấu trúc của hệ thống mạng, số lớp ẩn, số nơron cho mỗi lớp ẩn…
Sau khi đã định hình được mô hình, việc quan trọng tiếp theo là tiến hành huấn luyện
mạng để xác định tập trọng số tốt nhất phản ánh mối tương quan giữa biến đầu vào và
biến đầu ra. Quá trình thử nghiệm này đòi hỏi phải so sánh hiệu quả dự báo của các
mô hình khác nhau. Điều này được thực hiện trên cơ sở các tiêu chuẩn đánh giá như
MSE, MAE…
Và cuối cùng chính là mô hình được đề xuất để ứng dụng trong thực tiễn.
1.2.4.1.
Xác định biến số cho mô hình mạng thần kinh.
Việc nhận thức được những biến số nào đóng vai trò quan trọng, có khả năng ảnh
hưởng đến biến cần được dự báo là điều kiện tiên quyết trong quy trình thiết kế mô
hình mạng thần kinh nhân tạo. Những gợi ý từ lý thuyết thuyết kinh tế về vấn đề này
sẽ rất hữu ích cho quá trình lựa chọn các biến số thích hợp cho mô hình. Tuy nhiên,
vấn đề này đôi khi bị xem nhẹ, bởi lẽ, nhiều người đã quá đề cao khả năng của mô
hình mạng thần kinh trong việc phát hiện mối quan hệ phi tuyến phức tạp vốn tồn tại
giữa các biến số mà trước đây chưa được biến đến. Vấn đề này cũng liên hệ đến một
hạn chế, mà nhiều người vốn lầm tưởng là của mô hình mạng thần kinh. Đó là việc
cho rằng những mô hình này hầu như không có sự liên kết với các lý thuyết kinh tế.
Điều này xuất phát từ một thực tế là, mô hình mạng thần kinh nhân tạo có khả năng
linh hoạt trong việc mô hình hóa mối tương quan giữa các biến số đầu vào với biến
số đầu ra, tuy nhiên lại không thể chỉ ra một cách chính xác tác động của biến phụ
thuộc lên biến độc lập là như thế nào. Thế nhưng, cần phải lưu ý rằng, các lý thuyết
Thu thập và xử lý dữ liệu.
Sau khi xác định các biến số được cho là phù hợp với mô hình, bước tiếp theo sẽ là
thu thập và xử lý dữ liệu. Chi phí của quá trình thu thập và tính sẵn có của dữ liệu là
hai vấn đền cần được quan tâm tại thời điểm này. Thông thường, các dữ liệu kỹ thuật
sẽ dễ dàng tiếp cận hơn với so với các thông tin cơ bản do phụ thuộc vào chính sách
quản lý thông tin vĩ mô của Chính phủ quốc gia đó.
Một vấn đề khác trong quá trình thu thập chuỗi dữ liệu là khả năng xuất hiện các
quan sát bị thiếu (ví dụ khả năng mất đi quan sát về giá đóng cửa của chỉ số chứng
khoán ngày t giữa hai ngày t-1 và t+1). Các quan sát bị thiếu này thường được giải
quyết bằng nhiều cách khác nhau. Phương án thứ nhất là tất cả các quan sát bị thiếu
sẽ được bỏ qua, hai là gán cho các quan sát bị thiếu đó giá trị bằng không hoặc lấy
trung bình của các quan sát gần nhất.
Footer Page 25 of 126.