Đề tài: Phân tích sản lượng và doanh thu ngành bưu chính viễn thông (giai đoạn 1995-2011). - Pdf 10

LỜI NÓI ĐẦU
1
MỤC LỤC
STT Họ và tên Công việc Ghi chú
1 LƯƠNG ĐÌNH LƯU
2 PHẠM DUY KHÁNH
3 TRẦN QUANG HỢP
2
CHƯƠNG I- PHÂN TÍCH BÀI TOÁN – BẢNG SỐ LIỆU
I. Phân tích bài toán
1. Tên đề tài: Phân tích sản lượng và doanh thu ngành bưu chính viễn thông
(giai đoạn 1995-2011).
2. Tập dữ liệu mà nhóm 13 nghiên cứu gồm 8 yếu tố với 17 bộ dữ liệu
Chúng ta nhận thấy biến phụ thuộc là biến Doanh thu (tỉ đồng). Ở dữ liệu này
có 6 biến độc lập là: Bưu phẩm đi có cước, Bưu kiện đi có cước, Thư và điện
chuyển tiền, Báo chí phát hành, Điện báo có cước, Điện thoại đường dài. Các
biến độc lập này dùng để dự đoán được biến phụ thuộc (Doanh thu).
3. Phương pháp phân tích bài toán
Với tập dữ liệu này ta sẽ dùng các phương pháp là hồi quy tuyến tính, phân
tích đặc trưng và phân tích chuỗi thời gian.
II. Bảng số liệu
3
Năm
Bưu phẩm đi có
cước (triệu cái)
Bưu kiện đi có
cước
(nghìn cái)
Thư và điện
chuyển tiền
(nghìn bức)

o Median: Trung vị.
o Mode: Số trội.
o Variance: Phương sai.
o Standard deviation: Độ lệch chuẩn.
o Coeff. of variation: Hệ số biến thiên.
o Standard Error: Sai số chuẩn.
o Minimum: Trị số quan sát bé nhất.
o Maximum: Trị số quan sát lớn nhất.
o Range: Độ biến thiên.
o Skewness: Độ lệch của phân bố.
o Kurtosis: Độ nhọn của phân bố.
o Sum: Tổng các trị số quan sát.
Làm ví dụ với yếu tố “Bưu phẩm đi có cước”. Để phân tích đặc trưng ta
chọn: Analyze > Variable Data > One – Variable Analysis…
5
Đây là bảng phân tích đặc trưng nhận được
 Cách tính các giá trị trong bảng:
 Median Med=
 Variance S
2
=
 Standard deviation S
f
= = 84.3966
 Coeff. of variation C
v
= = 41.6749%
 Standard error

S

2
X
i
+ u
i
- Ưu điểm:
+ Có tính đơn giản.
+ Mỗ lần X tăng thêm một đơn vị thì Y tăng thêm β
2
đơn vị
- Nhược điểm:
+ Tính đơn giản của hàm tuyến tính,bất kỳ lúc nào tác động của X phụ thuộc
vào các giá trị của X hoặc Y, thì dạng hàm tuyến tính không thể là dạng hàm
phù hợp.
3.2. Dạng hàm Bậc hai:
- Phương trình: Y
i
= β
1
+ β
2
X
i
+ β
3
X
i
2
+ u
i

- Nếu X thay đổi 1% thì Y sẽ thay đổi B
2
%; đây là tính chất đặc biệt của quan
hệ logarit.
II- Các thông số đánh giá
1. Hệ số tương quan R (Coefficient of correlation)
- Yếu tố nào có R càng lớn thì ảnh hưởng càng nhiều
- Theo như kết quả kiểm duyệt:
R < 0.3  không tương quan
0.3 < R < 0.7  có dấu hiệu
0.5 < R < 0.7  hơi tương quan
0.7 < R < 0.9 tương quan
R > 0.9  rất tương quan
2. Bình phương của hệ số tương quan (R square)
8
- Yếu tố nào có R
2
càng lớn thì mối quan hệ giữa yếu tố đó và biến y càng chặt
chẽ:
Trong đó:
SSE (Sum of Square
Error):
SST (Sum of Square Total):
Adjusted R –Square:
3. Sai số chuẩn (standard error – với hồi quy đơn là N-2)
4. Hệ số hồi quy B-độ nghiêng B (regression coefficient)
- Yếu tố nào có B cao thì ảnh hưởng nhiều hơn, tuy nhiên các yếu tố có đơn vị
khác nhau (năm, triệu cái, nghìn cái, triệu tờ, triệu tiếng,…) nên không thể so
sánh mức ảnh hưởng giữa các yếu tố. Nếu muốn so sánh phải đổi các yếu tố có
cùng đơn vị là độ lệch chuẩn, lúc đó ta có hệ số hồi qui chuẩn hóa: B

Intercept -31864.0 4116.35 -7.74084 0.0000
Slope 307.918 18.8445 16.3399 0.0000
Analysis of Variance
Source Sum of
Squares
Df Mean
Square
F-Ratio P-Value
Model 1.08054E10 1 1.08054E10 266.99 0.0000
Residual 6.0706E8 15 4.04707E7
Total (Corr.) 1.14124E10 16
Correlation Coefficient = 0.97304
R-squared = 94.6807 percent
R-squared (adjusted for d.f.) = 94.3261 percent
Standard Error of Est. = 6361.65
Mean absolute error = 3972.39
Durbin-Watson statistic = 2.40009 (P=0.7247)
Lag 1 residual autocorrelation = -0.231529
y = -31864 + 307.918*x1
Trong đó:
- Correlation Coefficient: Hệ số tương quan
- R-squared: hệ số xác định (bình phương R)
- Standard Error of Est: độ lệch chuẩn
- Mean absolute erro: trung bình lỗi
10
Đánh giá yếu tố “Bưu phẩm đi có cước” với biến phụ thuộc là “Doanh thu”
để xem số lượng bưu phẩm đi có cước ảnh hưởng thế nào đến doanh thu:
• Nhìn vào kết quả phân tích ở trên ta thấy hệ số tương quan của nó là R=0.97304
điều đó cho thấy “Bưu phẩm đi có cước” rất tương quan với “Doanh thu”.
• Tiếp theo đến hệ số xác định R

Ta nhậnthấyt
tính
>t
bảng
 Ta chấp nhận Ha và bác bỏ Ho. Điều này cho thấy mô hình mà ta đang xét với
một biến độc lập (Bưu phẩm đi có cước) là khá phù hợp và biến này có khả năng
giải thích cho biến phụ thuộc là Doanh thu.
2. Yếu tố “Bưu kiện đi có cước (nghìn cái)”
Coefficients
Least Squares Standard T
Parameter Estimate Error Statistic P-Value
Intercept -9231.65 3273.69 -2.81996 0.0129
Slope 32.4815 2.26514 14.3398 0.0000
Analysis of Variance
Source Sum of
Squares
Df Mean
Square
F-Ratio P-Value
Model 1.06365E10 1 1.06365E10 205.63 0.0000
Residual 7.75902E8 15 5.17268E7
Total (Corr.) 1.14124E10 16
Correlation Coefficient = 0.965408
R-squared = 93.2013 percent
R-squared (adjusted for d.f.) = 92.748 percent
12
Standard Error of Est. = 7192.14
Mean absolute error = 5576.68
Durbin-Watson statistic = 1.16837 (P=0.0163)
Lag 1 residual autocorrelation = 0.369967

3. Yếu tố “Thư và điện chuyển tiền (nghìn bức)”
Coefficients
Least Squares Standard T
Parameter Estimate Error Statistic P-Value
Intercept -18892.3 8846.12 -2.13566 0.0496
Slope 8.29571 1.3586 6.10609 0.0000
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value
Model 8.13829E9 1 8.13829E9 37.28 0.0000
Residual 3.27415E9 15 2.18277E8
Total (Corr.) 1.14124E10 16
Correlation Coefficient = 0.844457
R-squared = 71.3107 percent
R-squared (adjusted for d.f.) = 69.3981 percent
Standard Error of Est. = 14774.2
Mean absolute error = 11928.4
14
Durbin-Watson statistic = 0.278645 (P=0.0000)
Lag 1 residual autocorrelation = 0.755119
Đánh giá yếu tố “Thư và điện chuyển tiền” với biến phụ thuộc là “Doanh
thu” để xem số thư và điện chuyển tiền ảnh hưởng thế nào đến doanh thu:
• Nhìn vào kết quả phân tích ở trên ta thấy hệ số tương quan của nó là
R=0.844457 điều đó cho thấy “Thư và điện chuyển tiền” tương quan với
“Doanh thu”.
• Tiếp theo đến hệ số xác định R
2
= 71,3107% điều đó khẳng định được rằng yếu
tố “Thư và điện chuyển tiền” có khả năng giải thích khoảng 71,3107% sự thay
đổi của biến phụ thuộc chính là “Doanh thu”
15

Correlation Coefficient = 0.964244
R-squared = 92.9766 percent
R-squared (adjusted for d.f.) = 92.5084 percent
Standard Error of Est. = 7310.01
Mean absolute error = 5100.44
Durbin-Watson statistic = 1.23012 (P=0.0238)
Lag 1 residual autocorrelation = 0.377733
16
Đánh giá yếu tố “Báo chí phát hành” với biến phụ thuộc là “Doanh thu” để
xem số lượng Báo chí phát hành ảnh hưởng thế nào đến doanh thu:
• Nhìn vào kết quả phân tích ở trên ta thấy hệ số tương quan của nó là
R=0.964244 điều đó cho thấy “Báo chí phát hành” tương quan với “Doanh thu”.
17
• Tiếp theo đến hệ số xác định R
2
= 92,9766% điều đó khẳng định được rằng yếu
tố “Báo chí phát hành” có khả năng giải thích khoảng 92,9766% sự thay đổi của
biến phụ thuộc chính là “Doanh thu”
• Ta so sánh đến giá trị P-value của biến độc lập này.
Với yếu tố này Pvalue = 0.0000 điều này có nghĩa là yếu tố mà ta đang xét
gần như bác bỏ giả thuyết đảo của nó, và cũng gần như chấp nhận giả thuyết
đang tin tưởng đó là yếu tố “Báo chí phát hành” có ảnh hưởng nhiều đến Doanh
thu
- Giả định độ tin cậy P = 95%
Ta cót
tính
= 14,0915
So sánht
bảng
=

0.575249 điều đó cho thấy “Điện báo có cước” không tương quan với “Doanh
thu”.
• Tiếp theo đến hệ số xác định R
2
= 33,0911% điều đó khẳng định được rằng yếu
tố “Điện báo có cước” có khả năng giải thích khoảng 33,0911% sự thay đổi của
biến phụ thuộc chính là “Doanh thu”
• Với yếu tố này Pvalue = 0.0157
- Giả định độ tin cậy P = 95%
Ta cót
tính
= -2,7237
So sánht
bảng
=
Ta nhậnthấyt
tính
<t
bảng
Điều này cho thấy mô hình mà ta đang xét với một biến độc lập (Điện báo có
cước) là không phù hợp và biến này không có khả năng giải thích cho biến phụ
thuộc là Doanh thu.
6. Yếu tố “Điện thoại đường dài (triệu phút)”
Coefficients
Least Squares Standard T
Parameter Estimate Error Statistic P-Value
Intercept 8351.48 16592.7 0.503322 0.6220
Slope 7.56734 5.25046 1.44127 0.1701
Analysis of Variance
Source Sum of Squares Df Mean Square F-Ratio P-Value

=
Ta nhậnthấyt
tính
t
bảng
.
IV- Hồi quy đa biến
1. Hồi quy đa biến tổng quát.
- Hàm hồi quy bộ tổng thể(PRF) : Y=
Trong đó:
+ : là hệ số tự do( hệ số chặn)
+ : là hệ số hồi qui riêng
: sai số ngẫu nhiên
- Hàm hồi quy mẫu(SRF):
Trong đó:
+ là ước lượng của giá trị trung bình của đối với biến đã biết
+ là ước lượng của
2. Hồi quy đa biến với bài toán
Multiple Regression - y
Dependent variable: y (doanhthu)
Independent variables:
x1 (buupham di co cuoc)
x2 (buukien di co cuoc)
x3 (thuvadienchuyentien)
x4 (Báo chí phát hành)
x5 (dienbao co cuoc)
22
x6 (dienthoaiduongdai)
Standard T
Parameter Estimate Error Statistic P-Value

- Nhìn vào giá trị P-value ở cột bên trên thì ta nhận thấy hầu như không yếu tố
nào có giá trị thống kê. Ta nhận thấy trong phân tích hồi quy đơn (riênglẻ) thì
hầu hết các yếu tố có ý nghĩa thống kê.
24
V- Kết luận về mức độ ảnh hưởng của các yếu tố tới doanh thu
STT Cácyếutố Β α R R
2
P
1 Bưuphẩmđicócước 0,97304
2 Bưukiệnđicócước 0.965408
3 Thưvàđiệnchuyểntiền 0,844457
4 Báo chí phát hành 0,964244
5 Điện báo có cước -0,575249
6 Điện thoại đường dài 0.348768
Trongđó:
Β:Hệsốhồi qui α: điểmcắttrêntrụctung
R: hệsốtươngquan P: ý nghĩathốngkê
Ta cóthểviếtcácphươngtrìnhtuyếntínhđơnsau:
1. Doanhthu= -31864 + 307,918 *(Bưuphẩmđicócước)
2. Doanhthu = -9231,65 + 32,4815*(Bưukiệnđicócước)
3. Doanhthu = -18892,3 + 8,29571 *(Thưvàđiệnchuyểntiền)
4. Doanhthu = -41489,8 + 199,431 *(Báo chí phát hành)
5. Doanhthu = 39873,6–794,566 *(Điện báo có cước)
6. Doanhthu = 8351,48 + 7,56734 *(Điện thoại đường dài)
Nhìn vào bảng phân tích đơn biến ta thấy hệ số tương quan R của Bưu phẩm
đi có cước cao nhất (0,97304) > Bưu kiện đi có cước (0.965408) > Báo chí phát
hành (0,964244) > Thư và điện chuyển tiền (0,844457) > Điện thoại đường dài
(0.348768) > Điện báo có cước (-0,575249). Như vậy chỉ có Điện báo có cước
là yếu tố hầu như không có ảnh hưởng đến doanh thu.
Nếu nhìn trị số p ( P-value) ta thấy hầu hết các yếu tố đều có ý nghĩa thống


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status