Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng (LV thạc sĩ) - Pdf 41

I

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

---------------------------------------

NGUYỄN THỊ NGỌC TÚ

NGHIÊN CỨU MỘT SỐ KỸ THUẬT NGOẠI SUY VÀ
ỨNG DỤNG

Chuyên ngành: Khoa học máy tính

Thái Nguyên - 2015

Số hóa bởi Trung tâm Học liệu – ĐHTN




II

LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn " Nghiên cứu một số kỹ thuật ngoại suy và
ứng dụng " đã đƣợc thực hiện theo đúng mục tiêu đề ra dƣới sự hƣớng dẫn
của TS. Nguyễn Văn Huân. Kết quả đạt đƣợc trong luận văn là sản phẩm của
cá nhân tôi. Trong toàn bộ luận văn, những điều đƣợc trình bày là của cá nhân
và đƣợc tổng hợp từ nhiều nguồn tài liệu. Tất cả các tài liệu tham khảo đều có
xuất xứ rõ ràng và đƣợc trích dẫn hợp pháp.
Tôi xin chịu hoàn toàn trách nhiệm và chịu mọi hình thức kỷ luật theo


Số hóa bởi Trung tâm Học liệu – ĐHTN




IV

MỤC LỤC

LỜI CAM ĐOAN ..........................................................................................................I
LỜI CẢM ƠN ............................................................................................................. III
DANH MỤC HÌNH VẼ ............................................................................................IV
DANH MỤC BẢNG BIỂU ...................................................................................VIII
MỤC LỤC ...................................................................................................................IV
MỞ ĐẦU........................................................................................................................ 1
Chƣơng 1 GIỚI THIỆU CHUNG VỀ DỮ LIỆU CHUỖI THỜI GIAN ............ 5
1.1. Khái niệm Dữ liệu ............................................................................................ 5
1.1.1. Dữ liệu định tính và dữ liệu định lƣợng .............................................. 5
1.1.2. Dữ liệu sơ cấp và dữ liệu thứ cấp........................................................ 5
1.2. Chuỗi thời gian và Dữ liệu chuỗi thời gian ................................................... 7
1.2.1. Chuỗi thời gian .................................................................................... 7
1.2.2. Dữ liệu chuỗi thời gian...................................................................... 12
1.3. Tổng quan về dự báo ...................................................................................... 16
1.3.1. Đặc điểm của dự báo ......................................................................... 16
1.3.2. Các loại dự báo.................................................................................. 17
1.3.3. Các phƣơng pháp dự báo .................................................................. 21
Chƣơng 2 MỘT SỐ KỸ THUẬT NGOẠI SUY ..................................................22
2.1. Khái niệm ngoại suy ...................................................................................... 22
2.1.1. Khái niệm ngoại suy.......................................................................... 22

2.7. Các bƣớc tiến hành ngoại suy ....................................................................... 49
Chƣơng 3 ÁP DỤNG KỸ THUẬT NGOẠI SUY VÀO BÀI TOÁN DỰ BÁO .52
3.1. Mô hình ARIMA cho dự báo tài chính, chứng khoán ............................... 52
3.1.1. Dữ liệu tài chính ................................................................................ 52
3.1.2. Mô hình ARIMA cho bài toán dự báo tài chính ............................... 52
3.1.3. Thiết kế mô hình ARIMA cho dữ liệu .............................................. 53
3.2. Áp dụng ........................................................................................................... 55
3.2.1. Môi trƣờng thực nghiệm ................................................................... 55
3.2.2. Dữ liệu ............................................................................................... 55
3.2.3. Kiểm tra tính dừng của chuỗi chứng khoán VNM ........................... 57
3.2.4. Nhận dạng mô hình ........................................................................... 57
3.2.5. Ƣớc lƣợng và kiểm định với mô hình ARIMA ................................ 60
Số hóa bởi Trung tâm Học liệu – ĐHTN




VI

3.2.6 Thực hiện dự báo................................................................................ 62
KẾT LUẬN .................................................................................................................64
TÀI LIỆU THAM KHẢO ........................................................................................65

Số hóa bởi Trung tâm Học liệu – ĐHTN




VII


1
MỞ ĐẦU
Sự phát triển mạnh mẽ của Công nghệ thông tin và Truyền thông đã
kéo theo nhiều lĩnh vực khác phát triển nhƣ khoa học máy tính, đồ họa máy
tính, khí tƣợng thủy văn, tự động hóa, thiết kế - xây dựng, kinh tế, tài chính,
giáo dục và đào tạo, y tế,… Điều này đã góp phần vào sự nghiệp công nghiệp
hóa – hiện đại hóa đất nƣớc. Trong thực tế, đối với mỗi quốc gia, trong đó có
Việt Nam muốn phát triển và trở thành các nƣớc công nghiệp thì một trong
những vấn đề không thể thiếu là phải nghiên cứu, khảo sát, phân tích tình hình
phát triển của đất nƣớc trong lịch sử và hiện tại để làm cơ sở cho việc ngoại
suy hay suy luận, xây dựng các kế hoạch phát triển trong tƣơng lai với tất cả
các lĩnh vực, ngành nghề,…
Vì ngoại suy hay suy luận là một khoa học và nghệ thuật tiên đoán
những sự việc sẽ xảy ra trong tƣơng lai, trên cơ sở phân tích khoa học về các
dữ liệu đã thu thập đƣợc. Khi tiến hành ngoại suy cần căn cứ vào việc thu thập,
xử lý số liệu trong quá khứ và hiện tại để xác định xu hƣớng vận động của các
hiện tƣợng trong tƣơng lai nhờ vào một số mô hình toán học (Định lƣợng). Tuy
nhiên, ngoại suy cũng có thể là một ngoại suy chủ quan hoặc trực giác về tƣơng
lai (Định tính) và để ngoại suy định tính đƣợc chính xác hơn, ngƣời ta cố loại
trừ những tính chủ quan của đối tƣợng ngoại suy.
Ngoại suy trƣớc hết là một thuộc tính không thể thiếu của tƣ duy của con
ngƣời, con ngƣời luôn luôn nghĩ đến ngày mai, hƣớng về tƣơng lai. Trong thời
đại công nghệ thông tin và toàn cầu hóa, ngoại suy lại đóng vai trò quan trọng
hơn khi nhu cầu về thông tin thị trƣờng, tình hình phát triển tại thời điểm nào
đó trong tƣơng lai càng cao. Ngoại suy đƣợc sử dụng trong nhiều lĩnh vực khác
nhau, mỗi lĩnh vực có một yêu cầu về ngoại suy riêng nên phƣơng pháp ngoại
suy đƣợc sử dụng cũng khác nhau.
Trong ngoại suy, các đại lƣợng khảo sát thƣờng không đƣợc cho dƣới
dạng hàm liên tục. Trong khi đó, các phƣơng pháp giải tích toán học thƣờng
Số hóa bởi Trung tâm Học liệu – ĐHTN

(3). Đối tƣợng ngoại suy không biết nhiều lắm về tình huống ngoại suy. Khi
đó chúng ta cần giả định rằng diễn biến trong tƣơng lai cũng sẽ tƣơng tự nhƣ
trong quá khứ. Với các bài toán trên thì x chắc chắn sẽ nằm ngoài khoảng
éx , x ù, và nhƣ vậy thì để tìm giá trị gần đúng của y , chúng ta không thể áp
êë 0 n ú
û

dụng đƣợc phƣơng pháp nội suy [1].
Nhằm tìm ra giá trị gần đúng của y , một trong những phƣơng pháp
đƣợc sử dụng phổ biến hiện này là áp dụng phƣơng pháp ngoại suy.
Số hóa bởi Trung tâm Học liệu – ĐHTN




3
Ngoại suy (Extrapolation) là dựa trên những số liệu đã có về một đối
tƣợng đƣợc quan tâm để đƣa ra suy đoán về hành vi của đối tƣợng đó trong
tƣơng lai. Ngoại suy có 2 dạng chính là ngoại suy theo số liệu lát cắt và ngoại
suy theo chuỗi số liệu lịch sử. [12]
Ngoại suy theo số liệu lát cắt (Extrapolation for cross-sectional data) là
dựa trên hành vi của một số thành phần tại một thời điểm nào đó để ngoại suy
về hành vi của các thành phần khác cũng tại thời điểm đó.
Ngoại suy theo chuỗi số liệu (Time-series extrapolation) là dựa trên
chuỗi số liệu lịch sử và sử dụng mô hình toán học để đƣa ra kết quả ngoại suy
đối với biến quan tâm. Giả thiết cơ bản là hành vi của biến đƣợc ngoại suy sẽ
tiếp tục trong tƣơng lai nhƣ đã diễn ra trong quá khứ.
Xuất phát từ vai trò của bài toán ngoại suy trong thực tế, đề tài luận văn
đƣợc lựa chọn “Nghiên cứu một số kỹ thuật ngoại suy và ứng dụng”. Trên cơ
sở nghiên cứu một số kỹ thuật ngoại suy, ý nghĩa và tính chất ứng dụng của

1.1.2. Dữ liệu sơ cấp và dữ liệu thứ cấp
a) Dữ liệu sơ cấp
Là những dữ liệu mà nhà nghiên cứu thu thập trực tiếp tại nguồn dữ
liệu và xử lý nó để phục vụ cho việc nghiên cứu đặt ra. Hay nói cách khác, dữ
liệu sơ cấp là dữ liệu do chính ngƣời nghiên cứu thu thập.
b) Dữ liệu thứ cấp
Dữ liệu thứ cấp là dữ liệu do ngƣời khác thu thập, sử dụng cho các mục
đích có thể là khác với mục đích nghiên cứu của chúng ta. Dữ liệu thứ cấp có
thể là dữ liệu chƣa xử lý (còn gọi là dữ liệu thô) hoặc dữ liệu đã xử lý. Nhƣ
vậy, dữ liệu thứ cấp không phải do ngƣời nghiên cứu trực tiếp thu thập.
Có nhiều nhà nghiên cứu, sinh viên đánh giá thấp nguồn dữ liệu thứ cấp có
sẵn. Vì vậy chúng ta bắt đầu xem xét sự hợp lý của nguồn dữ liệu thứ cấp đối
với vấn đề nghiên cứu của chúng ta trƣớc khi tiến hành thu thập dữ liệu của
chính mình. Các cuộc điều tra về dân số, nhà ở, điều tra doanh nghiệp, điều
tra mức sống dân cƣ, điều tra kinh tế xã hội gia đình (đa mục tiêu)... do chính
phủ yêu cầu là những nguồn dữ liệu rất quan trọng cho các nghiên cứu kinh tế
xã hội.
Số hóa bởi Trung tâm Học liệu – ĐHTN




6
Ngoài ra một số nguồn dữ liệu dƣới đây có thể là quan trọng cho các
nghiên cứu của chúng ta bao gồm:


Các báo cáo của chính phủ, bộ ngành, số liệu của các cơ quan thống

kê về tình hình kinh tế xã hội, ngân sách quốc gia, xuất nhập khẩu, đầu tƣ


Dữ liệu thứ cấp thƣờng đã qua xử lý nên khó đánh giá đƣợc mức độ

chính xác, mức độ tin cậy của nguồn dữ liệu.
Vì vậy trách nhiệm của ngƣời nghiên cứu là phải đảm bảo tính chính
xác của dữ liệu, phải kiểm tra xem các kết quả nghiên cứu của ngƣời khác là
dựa vào dữ liệu thứ cấp hay sơ cấp. Vì vậy điều quan trọng là phải kiểm tra
dữ liệu gốc.

Số hóa bởi Trung tâm Học liệu – ĐHTN




7
1.2. Chuỗi thời gian và Dữ liệu chuỗi thời gian
1.2.1. Chuỗi thời gian
1.2.1.1. Khái niệm chuỗi thời gian.
Khái niệm chuỗi thời gian: Chuỗi các quan sát đƣợc thu thập trên
cùng một đối tƣợng tại các mốc thời gian cách đều nhau đƣợc gọi là chuỗi
thời gian. Các quan sát này có thể đo đƣợc một cách liên tục theo thời gian
hoặc là có thể đƣợc lấy theo một tập rời rạc các thời điểm khác nhau.
Một

chuỗi

thời

gian


một quá trình ngẫu nhiên nhƣ sau:
Định nghĩa 1.1 (Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên {X t , t Î T }
đƣợc định nghĩa trên một không gian xác suất (W, A, P ).

Số hóa bởi Trung tâm Học liệu – ĐHTN




8
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời
điểm, ví dụ nhƣ là tập {1, 2,...}hay tập (- ¥ , + ¥ ). Tất nhiên cũng có những
quá trình ngẫu nhiên có T không phải là một tập con của R nhƣng trong giới
hạn của luận văn này ta chỉ xét cho trƣờng hợp T Î R . Và thƣờng thì ta xem
T là các tập các số nguyên, khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay

vì T ở trên. Một điểm chú ý nữa là trong luận văn này chúng ta sẽ dùng thuật
ngữ chuỗi thời gian để đồng thời chỉ dữ liệu cũng nhƣ quá trình có dữ liệu đó
là một thể hiện.
Trong các dạng dữ liệu đƣợc phân tích thì dữ liệu chuỗi thời gian luôn
thuộc tốp đầu về tính phổ biến
1.2.1.2. Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai)
Giả sử {X t , t Î Z }là một quá trình ngẫu nhiên có V ar (X t ) < ¥ với
mỗi t Î Z . Khi đó hàm tự hiệp phương sai của X t được định nghĩa theo
công thức sau:
gx (r , s ) := cov(X r , X s ) = E [(X r - E X r )(X s - EX s )], với r , s Î Z .


- 1

å

x j là trung bình mẫu.

j=1

Khi đó thì hàm tƣơng tự tƣơng quan mẫu cũng định nghĩa thông qua
hàm tự hiệp phƣơng sai mẫu nhƣ sau:
r (h ) := c(h ) / c(0), h < n .

1.2.1.4. Tính chất của chuỗi thời gian
Các tính chất đặc trƣng của chuỗi thời gian là: Tính dừng và tính
mùa vụ.
Dù một chuỗi thời gian có thể biểu hiện một hoặc nhiều tính chất
nhƣng khi trình bày, phân tích và dự báo giá trị của chuỗi thời gian thì mỗi
tính chất đƣợc xử lý tách rời.
a) Tính dừng
Một dãy số liệu theo thời gian có giá trị trung bình và phƣơng sai không
đổi theo thời gian thì dãy số đƣợc xem nhƣ có tính dừng hay còn gọi là ổn định.
Trong trƣờng hợp ngƣợc lại, ta nói dãy số liệu đó không có tính dừng.

Số hóa bởi Trung tâm Học liệu – ĐHTN




11
Xét dãy số Y t , về mặt toán học, một dãy số liệu có tính dừng phải thỏa

1.2.2.1. Khái niệm Dữ liệu chuỗi thời gian.
Mặt lƣợng của hiện tƣợng thƣờng xuyên biến động qua thời gian.
Trong thống kê để nghiên cứu sự biến động này ta thƣờng dựa vào dữ liệu
chuỗi thời gian.
Dữ liệu chuỗi thời gian là dãy số các trị số của chỉ tiêu thống kê đƣợc
sắp xếp theo thứ tự thời gian.
Dữ liệu chuỗi thời gian còn đƣợc phân biệt theo tần suất xuất hiện: số
liệu theo năm, số liệu theo quý, số liệu theo tháng…
Ví dụ:
- Số lƣợng hàng bán đƣợc trong 12 tháng của một công ty.
- Các gía trị của chuỗi thời gian của đại lƣợng X đƣợc ký hiệu
X 1, X 2,...X t ,...X n , với X t là gía trị quan sát của X ở thời điểm t .

Dữ liệu chuỗi thời gian có hai thành phần:
- Thời gian: có thể là ngày, tuần, tháng, quí, năm,.... Độ dài giữa hai
thời gian liền nhau đƣợc gọi là khoảng cách thời gian.
- Chỉ tiêu về hiện tƣợng nghiên cứu: chỉ tiêu này có thể là số tuyệt đối,
số tƣơng đối, số bình quân. Trị số của chỉ tiêu còn gọi là mức độ của dãy số.
* Phân loại dãy số thời gian:
Căn cứ vào tính chất thời gian của dữ liệu, có thể phân biệt thành 2 loại:
1. Dữ liệu thời kỳ: là dãy số biểu hiện mặt lƣợng của hiện tƣợng qua
từng thời kỳ nhất định.
2. Dữ liệu thời điểm: là loại dãy số biểu hiện mặt lƣợng của hiện tƣợng
qua các thời điểm nhất định. Dãy số này còn đƣợc phân biệt thành 2 loại:
- Dữ liệu thời điểm có khoảng cách thời gian đều nhau.
1.2.2.2. Các thành phần của dữ liệu chuỗi thời gian
Các nhà thống kê thƣờng chia chuỗi theo thời gian thành 4 thành phần:
- Thành phần xu hƣớng dài hạn (long –term trend component)

Số hóa bởi Trung tâm Học liệu – ĐHTN



14
b) Thành phần mùa
Biến động thời vụ của biến số kinh tế là sự thay đổi lặp đi lặp lại từ
năm này sang năm khác theo mùa vụ. Biến động thời vụ xảy ra do khí hậu,
ngày lễ, phong tục tập quán…Biến động thời vụ có tính ngắn hạn với chu kỳ
lặp lại thƣờng là 1 năm.
Thành phần mùa dùng để chỉ xu hƣớng tăng hay giảm của đại lƣợng X
tính theo mùa trong năm (có thể tính theo tháng trong năm)
Ví dụ:
- Lƣợng tiêu thụ chất đốt sẽ tăng vào mùa đông và giảm vào mùa hè,
ngƣợc lại, lƣợng tiêu thụ xăng sẽ tăng vào mùa hè và giảm vào mùa đông.
- Lƣợng tiêu thụ đồ dùng học tập sẽ tăng vào mùa khai trƣờng

Hình 1.2. Thành phần mùa
 Đƣợc sử dụng khi:
- Thời tiết ảnh hƣởng đến biến đang xem xét
- Niên lịch ảnh hƣởng đến biến đang xem xét
 Gồm có phƣơng pháp phân tích, san mũ Winter, hồi quy bội…
c) Thành phần chu kỳ (cyclical component)
Các số liệu kinh tế thƣờng có sự tăng giảm có quy luật theo chu kỳ kinh
tế. Sau một thời kỳ suy thoái kinh tế sẽ là thời kỳ phục hồi và bùng nổ kinh tế,
Số hóa bởi Trung tâm Học liệu – ĐHTN




15
kế tiếp tăng trƣởng kinh tế sẽ chựng lại và khỏi đầu cho một cuộc suy thoái

các môn khoa học tự nhiên phát triển thì dự báo mới thực sự đƣợc coi trọng
và những hoạt động dự báo diễn ra trên một cơ sơ khoa học vững chắc. Dự
báo vì thế ngày nay trở thành một trong những hoạt động không thể thiếu
trong hoạt động của các công ty thƣơng mại, các tổ chức xã hội. Tuy vậy thì
cho tới ngày nay hầu hết các cơ sở dữ liệu cũng nhƣ các hệ thống thông
tin quản lý đều chƣa đáp ứng đƣợc nhu cầu này. Cho dù những cấu trúc dữ
liệu đã đựợc tạo dựng một cách hết sức tinh vi, mạnh mẽ.
Khi tiến hành dự báo, ta căn cứ vào việc thu thập, xử lý số liệu trong
quá khứ và hiện tại để xác định xu hƣớng vận động của các hiện tƣợng trong
tƣơng lai nhờ vào một số mô hình toán học.
Dự báo có thể là một dự đoán chủ quan hoặc trực giác về tƣơng lai.
Nhƣng để cho dự báo đƣợc chính xác hơn, ngƣời ta cố loại trừ những tính chủ
quan của ngƣời dự báo.
Ngày nay, dự báo là một nhu cầu không thể thiếu đƣợc của mọi hoạt
động kinh tế - xác hội, khoa học - kỹ thuật, đƣợc tất cả các ngành khoa học
quan tâm nghiên cứu.
1.3.1. Đặc điểm của dự báo
- Dùng để dự báo các mức độ tƣơng lai của hiện tƣợng, qua đó giúp các
nhà quản trị doanh nghiệp chủ động trong việc đề ra các kế hoạch và các
quyết định cần thiết phục vụ cho quá trình sản xuất kinh doanh, đầu tƣ, quảng
bá, quy mô sản xuất, kênh phân phối sản phẩm, nguồn cung cấp tài chính…
và chuẩn bị đầy đủ điều kiện cơ sở vật chất, kỹ thuật cho sự phát triển trong
thời gian tới (kế hoạch cung cấp các yếu tố đầu vào nhƣ: lao động, nguyên vật
liệu, tƣ liệu lao động… cũng nhƣ các yếu tố đầu ra dƣới dạng sản phẩm vật
chất và dịch vụ).

Số hóa bởi Trung tâm Học liệu – ĐHTN




hiện tƣợng để quy định khoảng cách thời gian cho phù hợp với loại hiện
Số hóa bởi Trung tâm Học liệu – ĐHTN




18
tƣợng đó. Ví dụ trong dự báo kinh tế, dự báo dài hạn là những dự báo có tầm
dự báo trên 5 năm, nhƣng trong dự báo thời tiết, khí tƣợng học chỉ là một
tuần. Thang thời gian đối với dự báo kinh tế dài hơn nhiều so với thang thời
gian dự báo thời tiết. Vì vậy, thang thời gian có thể đo bằng những đơn vị
thích hợp (Ví dụ: quý, năm đối với dự báo kinh tế và ngày đối với dự báo dự
báo thời tiết).
1.3.2.2. Dựa vào các phương pháp dự báo
Dự báo có thể chia thành ba nhóm:
- Dự báo bằng phƣơng pháp chuyên gia: Loại dự báo này đƣợc tiến
hành trên cơ sở tổng hợp, xử lý ý kiến của các chuyên gia thông thạo với hiện
tƣợng đƣợc nghiên cứu, từ đó có phƣơng pháp xử lý thích hợp để ra các dự
đoán, các dự đoán này đƣợc cân nhắc và đánh giá chủ quan từ các chuyên gia.
Phƣơng pháp này có ƣu thế trong trƣờng hợp dự đoán những hiện tƣợng hay
quá trình bao quát rộng, phức tạp, chịu sự chi phối của khoa học - kỹ thuật, sự
thay đổi của môi trƣờng, thời tiết, chiến tranh trong khoảng thời gian dài. Một
cải tiến của phƣơng pháp Delphi là phƣơng pháp dự báo dựa trên cơ sở sử
dụng một tập hợp những đánh giá của một nhóm chuyên gia. Mỗi chuyên gia
đƣợc hỏi ý kiến và rồi dự báo của họ đƣợc trình bày dƣới dạng thống kê tóm
tắt. Việc trình bày những ý kiến này đƣợc thực hiện một cách gián tiếp (không
có sự tiếp xúc trực tiếp) để tránh những sự tƣơng tác trong nhóm nhỏ qua đó
tạo nên những sai lệch nhất định trong kết quả dự báo. Sau đó, ngƣời ta yêu
cầu các chuyên gia duyệt xét lại những dự báo của họ trên cơ sở tóm tắt tất cả
các dự báo, có thể có những bổ sung thêm.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status