www.themegallery.com
Họ và tên : Trần Văn Tâm Em.
Sinh viên Khoa CNTT – Trường ĐH lạc Hồng
Ngày tháng năm sinh : 06/09/1972
Cơ quan đang làm việc : Tín Nghĩa Corp.
Email : [email protected]
Thông tin cá nhân
www.themegallery.com
Tên đề tài:
Nghiên cứu ứng dụng chuổi thời
gian trong việc dự báo kinh
doanh xăng dầu.
Tên đề tài
www.themegallery.com
Dựa vào dữ liệu theo chuổi thời gian - time series và
xây dựng mô hình ước lượng dữ liệu, dự báo giá trị
tương lai và áp dụng cho bài toán dự báo sản lượng
tiêu thụ xăng dầu. Trong luận văn tập trung sử dụng
chuỗi thời gian trong quá khứ, dùng mô hình ARIMA
của Box – Jenkins với phương pháp hồi quy AR
(AutoRegressive) và Mô hình trung bình trượt
(Moving Average), Áp dụng hàm tự tương quan -
ACF (AutoCorrelation Function) và hàm tự tương
quan riêng phần - PACF (Patial AutoCorrelation
Function) để giải quyết bài toán mô phỏng việc dự
báo sản lương tiêu thụ xăng dầu trong tương lai.
Mục tiêu đề tài
www.themegallery.com
Chương 1: Tổng Quan.
1
Chương 2: Cơ sở lý thuyết.
AutoCorrelation Function)
2.4 Nhận dạng các mô hình
2.4.1 Mô hình tự hồi qui bậc p (Auto Regression) -
AR(P)
2.4.2 Mô hình trung bình trượt bậc q (Moving
Average) - MA(q)
2.4.3 Mô hình ARMA(p,q)
2.4.4 Các bước thực hiện của phương pháp Box - Jenkins
www.themegallery.com
Dãy số thời gian là dãy số các trị số của chỉ tiêu thống
kê được sắp xếp theo thứ tự thời gian. Mỗi dãy số thời
gian có hai thành phần:
1. Thời gian: có thể là ngày, tuần, tháng, quí, năm, . .
Độ dài giữa hai thời gian liền nhau được gọi là
khoảng cách thời gian.
2. Chỉ tiêu về hiện tượng nghiên cứu: chỉ tiêu này
có thể là số tuyệt đối, số tương đối, số bình quân.
Trị số của chỉ tiêu còn gọi là mức độ của dãy số.
2.1 Dãy số thời gian
www.themegallery.com
Phân loại dãy số thời gian:
1. Dãy số thời kỳ: là dãy số biểu hiện mặt lượng của hiện tượng qua
từng thời kỳ nhất định. Muốn tính mức độ bình quân: ta cộng các
mức độ trong dãy số rồi chia cho số các mức độ, tức là:
Trong đó:
y
i
(i = 1,…, n): các mức độ của dãy số thời kỳ
n: số mức độ của dãy số
2. Dãy số thời điểm: là loại dãy số biểu hiện mặt lượng của hiện
Sản lượng / Năm 2002 2003 2004 2005 2006
Sản lượng bán ra (triệu lít) 19 54 81 90 95
* Yi (i = 1,…, n): các mức độ của dãy số thời điểm
* n: số mức độ của dãy số
Vd:
Y = (19/2 +54+81+90+95/2)/(5-1)
y= (y
1
/2 + y
2
+ y
3
+ … + y
n-1
+ y
n
/ 2) / (n -1)
www.themegallery.com
Đối với dãy số thời điểm: Dãy số có khoảng cách thời gian Không bằng
nhau
11 2 2 3 3 1
123
1n
ii
nn i
n
n
600 26 (20.1 đến 14.2) 15600
500 23 (15.2 đến 9.3) 11500
700 22 (10.3 đến 31.3) 15400
Cộng 90 ngày 50100
Y = 556.66
www.themegallery.com
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
Hệ số tương quan của hai đại lượng ngẫu nhiên X và Y, ký hiệu là r
XY
là số
được xác định như sau:
với S
X,
S
Y
là độ lệch tiêu chuẩn của X, Y.
Ý nghĩa của hệ số tương quan:
Hê số tương quan đo mức độ phụ thuộc tuyến tính giữa X và Y.
Khi r
XY
càng gần 1 thì mối quan hệ tuyến tính càng chặt, khi r
XY
càng
gần 0 thì quan hệ tuyến tính càng lỏng lẻo.
Ước lượng hệ số tương quan:
2.2.1 Tương quan (Correlation)
www.themegallery.com
Ước lượng hệ số tương quan:
•Lập mẫu ngẫu nhiên W
=
Trong đó:
www.themegallery.com
Ước lượng hệ số tương quan:
Với mẫu cụ thể ta tính được ta tính được giá trị của R là
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
2.2.1 Tương quan – Correlation (tt)
Trong đó:
YX
SS
YXXY
R
.
.−
=
Ta có:
www.themegallery.com
Tính chất của hệ số tương quan
Hê số tương quan
được dùng để đánh giá mức độ chặt chẻ của sự phụ thuộc tương quan tuyến
tính giữa hai đại lượng ngẫu nhiên X và Y có các tính chất như sau:
2.2 Tương quan (Correlation) và Hàm tự tương quan
ACF(AutoCorrelation Function)
2.2.1 Tương quan – Correlation (tt)
YX
SS
yxxy
r
www.themegallery.com
Giả sử các biến ngẫu nhiên trong chuỗi dừng thay đổi quanh giá
trị trung bình μ với phương sai σ
2
. Khi đó, hàm tương tự quan
tại các độ trễ khác nhau sẽ có giá trị khác nhau
Trong thực tế ta có thể ước lượng hàm tự tương quan tại độ trễ
k qua phép biến đổi trung bình của tất cả các cặp quan sát,
phân biệt bằng độ trễ k. Với giá trị trung bình mẫu là μ, được
chuẩn hóa bởi phương sai σ
2
. Cho chuỗi N điểm, giá trị r
k
của
hàm tương tự quan tại độ trễ k được tính như sau:
2.2.2 Hàm tự tương quan ACF - AutoCorrelation Function (tt)
www.themegallery.com
y
t
: dữ liệu chuỗi thời gian dừng tại thời điểm t
y
t+k
: dữ liệu chuỗi thời gian dừng tại thời điểm t +k
μ : giá trị trung bình của chuỗi thời gian dừng.
r
k
: giá trị tương quan giữa y
t
và y
t+k
Để kiểm định có phải là mô hình AR hay không hoặc r
k
=0 theo ý
nghĩa thống kê, ta sử dụng kiểm định cho những mẫu lớn. khi n khá
lớn, các hệ số r
k
sẽ gần như tuân theo phân phối chuẩn và có μ = 0,
phương sai (variance) được xác định theo công thức:
)] (21[
1
2
1
2
3
2
2
2
1 −
+++++=
k
rrrr
n
Var
var
0
−
=
k
r
t
< 0)
www.themegallery.com
2.2 Hàm tự tương quan ACF (AutoCorrelation Function) (tt)
Nếu chúng ta muốn kiểm p
k
ở mức ý nghĩa 5%, ta sử dụng giá trị
tới hạn là 2 để so sánh với thống kê khi kiểm tra các giả thiết:
2
21
1
j
k
r
n
r
t
∑+
=
H
0
: p(k) = 0
H
a :
p(k) ≠ 0
Trong đó
k = độ trễ
n = số lần quan sát
j = 1,2,….k-1 (j<k)
Nếu t<2 thì ta sẽ không có AR (P
k