Tài liệu Bài tập về Giải tích: BAI TAP CA NHAN
I.ASSIGNMENT 1:
Bài 1:
Anh/Chị hãy vào trang web: thu thập số liệu theo tháng của chỉ số giá chứng khoán VN Index (VNI) và giá của cổ phiếu của Công ty Chứng khoán Sài Gòn (SSI), và thực hiện các yêu cầu sau đây:
lưu số liệu vừa thu thập về dưới dạng tập tin Excel với tên : data1.xls
Chuyển hai chuỗi dữ liệu đó qua tập tin Eviews với tên biến là VNI và SSI?
click chuột phải vào data1.xls chọn Open with/Eviews
trong hộp thoại Spreadsheet Read:
bước 1: chọn Custom range sau đó điều chỉnh tới cột cần đặt tên /Next
bước 2: lần lượt nhập tên cho 2 cột là VNI và SSI /Finish
Vẽ hai biến VNI và SSI trên cùng một đồ thị?
từ cửa sổ tập tin, chọn Quick/Graph
trong Series list, nhập tên biến vào (biến nào ở trục hoành gõ trước): vni ssi /OK
nếu chọn Type: là Line & Symbol và Axis/Scale : #2 SSI là Right /OK thì ta có đồ thị sau
Tính suất sinh lợi của thị trường (Rm) và hãy vẽ trên cùng đồ thị hai biến VNI và Rm? Lưu ý, Rm có thể được tính như sau Rm = (VNIt – VNIt...
51 trang |
Chia sẻ: hunglv | Lượt xem: 1948 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Bài tập về Giải tích, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
BAI TAP CA NHAN
I.ASSIGNMENT 1:
Bài 1:
Anh/Chị hãy vào trang web: thu thập số liệu theo tháng của chỉ số giá chứng khoán VN Index (VNI) và giá của cổ phiếu của Công ty Chứng khoán Sài Gòn (SSI), và thực hiện các yêu cầu sau đây:
lưu số liệu vừa thu thập về dưới dạng tập tin Excel với tên : data1.xls
Chuyển hai chuỗi dữ liệu đó qua tập tin Eviews với tên biến là VNI và SSI?
click chuột phải vào data1.xls chọn Open with/Eviews
trong hộp thoại Spreadsheet Read:
bước 1: chọn Custom range sau đó điều chỉnh tới cột cần đặt tên /Next
bước 2: lần lượt nhập tên cho 2 cột là VNI và SSI /Finish
Vẽ hai biến VNI và SSI trên cùng một đồ thị?
từ cửa sổ tập tin, chọn Quick/Graph
trong Series list, nhập tên biến vào (biến nào ở trục hoành gõ trước): vni ssi /OK
nếu chọn Type: là Line & Symbol và Axis/Scale : #2 SSI là Right /OK thì ta có đồ thị sau
Tính suất sinh lợi của thị trường (Rm) và hãy vẽ trên cùng đồ thị hai biến VNI và Rm? Lưu ý, Rm có thể được tính như sau Rm = (VNIt – VNIt-1)/VNIt-1 hoặc Rm = ln(VNIt/VNIt-1). Trong Eviews, hàm ln được sử dụng là log.
trên màn hình lệnh của Eviews nhập : genr rm=log(vni/vni(-1))
sau đó, tương tự câu b, chọn Quick/Graph, rồi nhập tên biến : vni rm /OK
chọn Type: Line & Symbol và Axis/Scale cho Rm là Right /OK, ta có đồ thị sau
Vẽ đồ thị tần suất kèm thống kê mô tả biến SSI? Giải thích ý nghĩa của các thống kê trong bảng kết quả?
chọn Quick/Series Statistics/Histogram and Stats
trong Series name, nhập tên biến : ssi /OK , có đồ thị sau
Ý nghĩa của các thống kê trong bảng kết quả :
Series : biến
Sample : mẫu quan sát
Observations : số quan sát
Mean : giá trị trung bình
Median: trung vị
Maximum: giá trị lớn nhất
Minimum: giá trị nhỏ nhất
Std.Dev. : độ lệch chuẩn
Skewness : độ nghiêng
Kurtosis : độ nhọn
Jarque-Bera: thống kê JB, càng nhỏ thì biến càng “dễ” có phân phối chuẩn
Probability: xác suất tương ứng của JB, càng nhỏ thì khả năng bác bỏ giả thiết Ho càng cao (giả thiết Ho mặc định là : biến có pp chuẩn), ở đây có kết quả 0.273222 (rất nhỏ) tức là biến không có phân phối chuẩn
Vẽ trên cùng đồ thị VNI và VNI trễ một giai đoạn?
chọn Quick/Graph
nhập tên biến : vni vni(-1) /OK , có đồ thị sau
Vẽ giản đồ tự tương quan của VNI với độ trễ được chọn là 5. Anh/Chị hãy giải thích và nêu ý nghĩa các hệ số AC và PAC?
chọn Quick/Series Statistics/Correlogram
trong Series name, nhập tên biến : vni(-5) /OK
trong Correlogram Specification, chọn Level /OK, có giản đồ tương quan sau
Ý nghĩa các hệ số AC và PAC :
AC (Autocorrelation Coefficient): hệ số tự tương quan à xác định chuỗi thời gian dừng hay không :
là “dừng” khi AC đầu tiên ¹0 nhưng các AC tiếp theo =0 một cách có ý nghĩa thống kê
là “không dừng” khi một số AC ¹0 một cách có ý nghĩa thống kê
PAC (Partial Autocorrelation Coefficient): hệ số tự tương quan riêngà xác định mô hình ARIMA thích hợp
Vẽ giản đồ tự tương quan sai phân bậc nhất của VNI với độ trễ được chọn là 5. Anh/Chị có nhận xét gì giữa kết quả câu (g) và câu (f)?
chọn Quick/Series Statistics/Correlogram
trong Series name, nhập tên biến : d(vni,5) /OK
trong Correlogram Specification, chọn Level /OK, có giản đồ tương quan sau
Nhận xét kết quả câu g và f :
ở câu g là chuỗi thời gian không dừng vì: các hệ số AC đầu rất cao và về sau giảm dần =0 theo độ trễ
ở câu f là chuỗi thời gian dừng vì: các hệ số AC đầu ¹0 nhưng tiếp theo sẽ =0
Bài 2:
Sử dụng tập tin hhexpe06.dta (tập tin Stata), chuyển sang tập tin Eviews và thực hiện các yêu cầu sau đây:
click chuột phải vào hhexpe06.dta chọn Open with/Eviews
xuất hiện hộp thoại Table read specification: chọn các biến cần thiết theo yêu cầu của đề bài để chuyển sang Eviews (mặc định là chọn hết) /OK
Vẽ đồ thị tần suất các biến chi tiêu lúa gạo, chi tiêu phi lương thực, chi tiêu giáo dục, chi tiêu sức khỏe, chi tiêu nước uống, chi tiêu điện sinh hoạt và qui mô hộ gia đình Việt Nam năm 2006?
mở cùng lúc các biến riceexp, nonfdx_1, educex_1, hlthex_1, waterexp, elecexp, hhsize bằng cách : giữ phím Ctrl khi chọn biến rồi click chuột phải chọn Open/as Group để mở biến
từ cửa sổ vừa mở, chọn View/Graph…
trong Graph Options : chọn Type là Distribution /OK, ta có đồ thị tần suất như sau
Lập bảng giá trị trung bình của các biến trên theo 5 nhóm thu nhập khác nhau? Anh/Chị rút ra được nhận xét gì?
double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau
chọn View/Descriptive Statistics & Tests/Stats by Classification…
xuất hiện hộp thoại Statistics By Classification :
trong Statistics : click chọn Mean
trong Series/Group for classify : nhập biến thu nhập (ko tìm thấy???) /OK, ta có kết quả như sau
Nhận xét:
Lập bảng giá trị trung bình của các biến trên theo 8 vùng địa lý khác nhau ở Việt Nam? Anh/Chị rút ra được nhận xét gì?
double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau
chọn View/Descriptive Statistics & Tests/Stats by Classification…
xuất hiện hộp thoại Statistics By Classification :
trong Statistics : click chọn Mean
trong Series/Group for classify : nhập Reg8 (biến vùng địa lý) /OK, ta có các kết quả như sau
Nhận xét ở Việt Nam năm 2006:
Chi tiêu lúa gạo trung bình: cao nhất ở vùng 7 (1970.702), thấp nhất ở vùng 1 (663.8771)
Chi tiêu phi lương thực trung bình: cao nhất ở vùng 7 (9690.978), thấp nhất ở vùng 3 (3196.382)
Chi tiêu giáo dục trung bình: cao nhất ở vùng 7 (2003.274), thấp nhất ở vùng 3 (675.6620)
Chi tiêu sức khỏe trung bình: cao nhất ở vùng 7 (1986.412), thấp nhất ở vùng 3 (658.8135)
Chi tiêu nước uống trung bình: cao nhất ở vùng 7 (236.9655), thấp nhất ở vùng 3 (40.83916)
Chi tiêu điện sinh hoạt trung bình: cao nhất ở vùng 7 (1182.311), thấp nhất ở vùng 3 (250.9021)
Qui mô hộ gia đình trung bình: cao nhất ở vùng 3 (6 người/hộ), thấp nhất ở vùng 1 (4 người/hộ)
àVùng 7: có chi tiêu TB cao nhất => vùng đồng bằng Nam Bộ (mức sống cao)
àVùng 3: mức chi tiêu TB thấp + qui mô hộ gia đình TB cao nhất => vùng duyên hải miền Trung (nghèo, đông con)
àVùng 1: chi tiêu TB lúa gạo và qui mô hộ gia đình TB thấp nhất => vùng núi caoTây Nguyên (thiếu lương thực, dân tộc thiểu số)
Lập bảng so sánh giá trị trung bình các biến trên theo hai khu vực thành thị và nông thôn? Anh/Chị rút ra được nhận xét gì?
double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau
chọn View/Descriptive Statistics & Tests/Stats by Classification…
xuất hiện hộp thoại Statistics By Classification :
trong Statistics : click chọn Mean
trong Series/Group for classify : nhập Urban06 (biến khu vực) /OK, ta có kết quả như sau
Nhận xét :
trung bình về chi tiêu lúa gạo, chi tiêu phi lương thực, chi tiêu giáo dục, chi tiêu sức khỏe, chi tiêu nước uống, chi tiêu điện sinh hoạt : ở thành thị (URBAN) đều cao hơn nông thôn
trung bình về qui mô hộ gia đình Việt Nam năm 2006: ở nông thôn (4.301) cao hơn thành thị (4.104)
à thành thị có mức sống cao hơn nông thôn
à nông thôn chưa thực hiện kế hoạch hóa gia đình bằng thành thị
Anh/Chị hãy kiểm định xem có sự khác biệt về chi tiêu giáo dục trung bình giữa thành thị và nông thôn hay không?
mở biến educex_1
chọn View/Descriptive Statistics & Tests/Equality Tests by Classification…
xuất hiện hộp thoại Tests By Classification:
trong Series/Group for classify: nhập URBAN06
trong Test equality of: chọn Mean ( kiểm định trung bình ) /OK, có kết quả sau
à Giá trị ANOVA F-test có Probability thấp bằng 0.0000 (mà p-value càng thấp thì khả năng bác bỏ H0 càng cao) do đó ta bác bỏ H0 (H0: trung bình chi tiêu giáo dục ở thành thị và nông thôn là bằng nhau) à có sự khác biệt về chi tiêu giáo dục trung bình giữa thành thị và nông thôn
Bài 3:
Anh/Chị hãy chọn và phân tích một vấn đề về năng lực cạnh tranh cấp tỉnh ở Việt Nam mà mình quan tâm. Để hỗ trợ bài tập này, Anh/Chị nên sử dụng tập tin PCI.xls của các năm 2006, 2007, và 2008 (và các báo cáo tổng hợp liên quan).
Bài 4:
Cho X ~ N(8,25)
è μ = 8 , σ = 5
Yêu cầu: Vẽ phát họa đồ thị cho từng trường hợp.
Tính P(X > 8.6)
Có Z = = 0.12 với Z ~ N( 0,1 )
è P( X > 8.6 ) = P( Z > 0.12 ) = 1 - P( Z < 0.12 ) = 1 - 0.5478 = 0.4522
Tính P( Z < 0.12 ) bằng Excel, sử dụng hàm : = NORMDIST ( 0.12 , 0 , 1 , true ) = 0.547758426
Tính P(8 < X < 8.6)
Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên :
è P( 8 8.6 ) = 0.5 - 0.4522 = 0.0478
Tính P(X < 7.4)
Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên :
è P( X 8.6 ) = 0.4522
Tính P(7.4 < X < 8.6)
Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên :
è P( 7.4 < X < 8.6 ) = 2 * P( 8 < X < 8.6 ) = 2 * 0.0478 = 0.0956
Bài 5:
Từ một mẫu 25 quan sát, người ta tính được giá trị trung bình là 172.5 và độ lệch chuẩn là 15.4. Giả sử có giả thiết sau đây:
è N = 25 , μ = 172.5 , σ = 15.4
H0: m = 168
H1: m ¹ 168
Yêu cầu: Vẽ phát họa đồ thị cho từng trường hợp.
Xác định loại thống kê kiểm định phù hợp?
Loại KIỂM ĐỊNH TRUNG BÌNH ( với X có phân phối chuẩn ) :
- là thống kê t : với giả thiết H0, có phân phối t với số bậc tự do là N-1 ( nếu không biết σ của X )
- là thống kê z : với giả thiết H0, có phân phối chuẩn hóa ( nếu biết σ của X )
Ở đây do ta đã biết σ = 15.4 , nên thuộc loại thống kê z có phân phối chuẩn hóa
Kiểm định giả thiết trên với mức ý nghĩa lần lượt như sau: a = 1%, 5%, 10%, và 15%? Anh/Chị cho biết khi a thay đổi thì quyết định chấp nhận hay bác bỏ giả thiết H0 sẽ thay đổi như thế nào?
Mở biến
Chọn View/ Descriptive Statistics & Tests/ Simple Hypothesis Tests
Xuất hiện hộp thoại Series Distribution Tests :
Trong Test value: nhập vào “MEAN” là 168
Trong Mean test assumption: nhập vào “ENTER s.d. if known” là 24 ( do = N-1 = 25 -1) /OK
Khi a càng tăng thì càng “dễ” chấp nhận giả thiết Ho
II. ASSIGNMENT 2:
Bài 2: Từ dữ liệu của Assignment 1
Ước lượng mô hình CAPM có dạng: log(SSI/SSI(-1)) c log(VNI/VNI(-1)) : Chọn 2 biến ssi và vni à Quick/Estimation Equation à nhập log(SSI/SSI(-1)) c log(VNI/VNI(-1))
Dependent Variable: LOG(SSI/SSI(-1))
Method: Least Squares
Date: 04/11/09 Time: 12:29
Sample (adjusted): 2 22
Included observations: 21 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.010652
0.006188
-1.721389
0.1014
LOG(VNI/VNI(-1))
0.878655
0.404512
2.172137
0.0427
R-squared
0.198927
Mean dependent var
-0.012801
Adjusted R-squared
0.156765
S.D. dependent var
0.030483
S.E. of regression
0.027992
Akaike info criterion
-4.223392
Sum squared resid
0.014888
Schwarz criterion
-4.123913
Log likelihood
46.34561
Hannan-Quinn criter.
-4.201802
F-statistic
4.718180
Durbin-Watson stat
1.670739
Prob(F-statistic)
0.042709
Vẽ trên cùng đồ thị các biến suất sinh lợi thực tế, suất sinh lợi ước lượng và phần dư của mô hình trên :
Tiếp tục trong cửa sổ Estimation Equation trên, chọn View/Actual, Fitted, Residual/ Actual, Fitted, Residual Graph.
Xây dựng khoảng tin cậy 95% cho B2:
Trên dòng lệnh, nhập:
scalar b2_cd=c(2)-@qtdist(0.975,20)*@stderrs(2) à giá trị chặn dưới.
scalar b2_ct=c(2)-@qtdist(0.975,20)*@stderrs(2 à giá trị chặn trên.
So sánh b2 với 2 giá trị trên, nếu b2_cd<b2<b2_ct à chấp nhận H0: b2 có ý nghĩa thống kê.
Kiểm định giả thiết cho rằng Hệ số Beta của công ty chứng khoán Sài Gòn =1
Tình hệ số tương quan giữa suất sinh lợi thị trường và suất sinh lợi của cổ phiếu SSI:
Nhập lệnh Genr rim=@cor(ri,rm) hoặc mở biến ri và rm as groupàQuick/Group Statistics/Correlation
Với rm=log(vni/vni(-1)) và ri=log(ssi/ssi(-1)).
RI
RM
RI
1
0.4460120397302639
RM
0.4460120397302639
1
Ước tính hệ số Beta điều chỉnh cho cổ phiếu SSI:
Genr beta_adjusted=c(2)/@cor(ri,rm).
Giả sử suất sinh lợi phi rủi ro của Việt Nam là 9.6% và phần bù rủi ro thị trường là 5.5%, ước tính suất sinh lợi kỳ vọng cho cổ phiếu SSI:
RSSI,VNI = 9,6% + beta*5,5%.
Bài 3:
III. ASSIGNMENT3:
Bài 1:
Nhấp đúp vào biến y -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “X2” ở Series/ group for classify -> ta có bảng sau:
Descriptive Statistics for Y
Categorized by values of X2
Date: 05/20/09 Time: 22:31
Sample: 1 30
Included observations: 30
X2
Mean
Std. Dev.
Obs.
[0, 20)
42.57143
9.501880
7
[20, 40)
56.28571
10.45170
7
[40, 60)
56.33333
5.316641
6
[60, 80)
59.00000
5.049752
5
[80, 100)
66.80000
8.642916
5
All
55.30000
11.16692
30
Nhận xét: doanh số bán hàng tăng theo điểm về kỹ năng bán hàng.
Mô hình dự báo: chưa học!
Hồi quy:
Ở màn hình lệnh: ls y c x2 x3 x4 x5 x6, ta có bảng sau:
Dependent Variable: Y
Method: Least Squares
Date: 05/20/09 Time: 22:39
Sample: 1 30
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-90.62915
17.84109
-5.079799
0.0000
X2
0.202915
0.028221
7.190144
0.0000
X3
6.154295
0.921462
6.678840
0.0000
X4
0.112319
0.503071
0.223266
0.8252
X5
-0.013198
0.785811
-0.016796
0.9867
X6
-0.586477
1.762090
-0.332830
0.7422
R-squared
0.895539
Mean dependent var
55.30000
Adjusted R-squared
0.873776
S.D. dependent var
11.16692
S.E. of regression
3.967380
Akaike info criterion
5.770945
Sum squared resid
377.7625
Schwarz criterion
6.051185
Log likelihood
-80.56418
Hannan-Quinn criter.
5.860596
F-statistic
41.15014
Durbin-Watson stat
1.895046
Prob(F-statistic)
0.000000
Các hệ số b4,b5,b6 không có ý nghĩa thống kê.
Hệ số b2, b3 có ý nghĩa thống kê và có dấu đúng với kỳ vọng.
Vì:
b2 >0 : điểm về kỹ năng bán hàng càng cao thì doanh số bán hàng cũng tăng theo.
b3 >0 : nhân viên càng hăng hái trong công việc thì doanh số bán hàng càng tăng.
Ước lượng mô hình dự báo: chưa học!
Bài 2:
Chọn các biến y,b2,b3,b4,b5,b6,b7,b8 -> nhấp chuột phải, Open/as group -> vào view/ Descriptive stats/common sample
X2
X3
X4
X5
X6
X7
X8
Y
Mean
22.36898
172.5951
31.74383
1723.560
255.0064
39.85211
47.95525
2266.132
Median
9.025000
26.62300
17.88800
342.2877
33.20000
20.55600
24.61515
472.0812
Maximum
207.7000
4186.930
348.1426
45999.01
4485.195
423.2698
785.0718
60334.51
Minimum
0.442000
1.066000
0.429000
2.398000
1.011100
0.267000
0.750000
6.803000
Std. Dev.
30.58231
438.6564
39.58890
4488.490
573.7774
55.84726
86.40719
5799.043
Skewness
2.638699
5.133975
3.290828
5.794956
3.859590
3.502381
5.336685
5.944537
Kurtosis
11.73742
36.88443
20.81731
45.86810
21.32879
19.38885
38.88011
48.11877
Jarque-Bera
1146.128
13789.44
3968.524
21692.00
4350.833
3494.271
15414.33
23947.59
Probability
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
0.000000
Sum
5905.412
45565.10
8380.372
455020.0
67321.69
10520.96
12660.19
598258.9
Sum Sq. Dev.
245978.0
50606322
412194.9
5.30E+09
86584999
820275.1
1963611.
8.84E+09
Observations
264
264
264
264
264
264
264
264
b) Chọn các biến y,b2,b3,b4,b5,b6,b7,b8 -> View/ Group statistics/ Correlations
X2
X3
X4
X5
X6
X7
X8
Y
X2
1.000000
0.573045
0.260664
0.581816
0.606916
0.208016
0.210286
0.602849
X3
0.573045
1.000000
0.122734
0.905251
0.627895
0.023502
0.262369
0.932005
X4
0.260664
0.122734
1.000000
0.083741
0.123914
0.456082
0.079123
0.105862
X5
0.581816
0.905251
0.083741
1.000000
0.624455
0.020705
0.196601
0.987976
X6
0.606916
0.627895
0.123914
0.624455
1.000000
0.043653
0.253913
0.618947
X7
0.208016
0.023502
0.456082
0.020705
0.043653
1.000000
0.013897
0.052856
X8
0.210286
0.262369
0.079123
0.196601
0.253913
0.013897
1.000000
0.215714
Y
0.602849
0.932005
0.105862
0.987976
0.618947
0.052856
0.215714
1.000000
Nhận xét: các hệ số tương quan giữa các biến thấp -> không có đa cộng tuyến (chưa chắc lắm!)
Các biến giải thích có hệ số tương quan với y lớn hơn 0.7 là X3, X5
Vẽ đồ thị phân tán giữa X3 với Y:
Quick/Graph/ nhập x3 y/ (Type) chọn Scatter/ (Fit lines) chọn Regression line (-> tạo đường hồi quy)
Nhận xét : đây là mô hình phù hợp vì các giá trị phân tán quanh đường hồi quy.
Vẽ đồ thị phân tán giữa X5 với Y: (tương tự với X3)
Nhận xét : đây là mô hình phù hợp vì các giá trị phân tán quanh đường hồi quy.
d) Nhấp đúp vào biến y -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “X3 X2” ở Series/ group for classify -> ta có bảng sau:
Descriptive Statistics for Y
Categorized by values of X3 and X2
Date: 05/21/09 Time: 00:22
Sample: 1 266
Included observations: 265
Mean
Std. Dev.
X2
Obs.
[0, 50)
[50, 100)
[100, 150)
[150, 200)
[200, 250)
All
[0, 1000)
1032.968
2383.734
6163.426
11049.50
NA
1246.357
1575.080
2188.790
5477.006
NA
NA
1917.238
227
21
3
1
0
252
[1000, 2000)
14698.14
16465.63
29127.00
9254.117
34736.00
17979.29
6131.026
9293.366
NA
NA
NA
9514.644
4
4
1
1
1
11
X3
[2000, 3000)
NA
28085.00
NA
NA
NA
28085.00
NA
NA
NA
NA
NA
NA
0
1
0
0
0
1
[4000, 5000)
NA
NA
60334.51
NA
NA
60334.51
NA
NA
NA
NA
NA
NA
0
0
1
0
0
1
All
1269.594
5538.690
21590.36
10151.81
34736.00
2265.183
2473.740
7873.685
24144.75
1269.527
NA
5788.070
231
26
5
2
1
265
Nhận xét:
- Cùng khoảng giá trị của X3 (chi tiêu vốn hữu hình) thì giá trị trung bình của Y tăng theo X2 (tổng số lao động)
- Cùng khoảng giá trị của X2 (tổng số lao động) thì giá trị trung bình của Y tăng theo X3 (chi tiêu vốn lao động).
Chiến lược chọn mô hình: từ tổng quát (general) đến giản đơn (simple):
B1: hồi quy Y theo tất cả các biến:
Dependent Variable: Y
Method: Least Squares
Date: 05/21/09 Time: 00:32
Sample: 1 266
Included observations: 264
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-155.3579
64.48403
-2.409246
0.0167
X2
6.102751
1.971835
3.094961
0.0022
X3
2.771448
0.241587
11.47185
0.0000
X4
-0.620636
1.258533
-0.493142
0.6223
X5
1.032169
0.023537
43.85339
0.0000
X6
-0.334775
0.106573
-3.141288
0.0019
X7
2.907275
0.882797
3.293253
0.0011
X8
0.351253
0.527540
0.665832
0.5061
R-squared
0.985744
Mean dependent var
2266.132
Adjusted R-squared
0.985355
S.D. dependent var
5799.043
S.E. of regression
701.7919
Akaike info criterion
15.97499
Sum squared resid
1.26E+08
Schwarz criterion
16.08335
Log likelihood
-2100.698
Hannan-Quinn criter.
16.01853
F-statistic
2528.820
Durbin-Watson stat
1.955415
Prob(F-statistic)
0.000000
-> các hệ số b4,b8 không có ý nghĩa thống kê.
B2: Kiểm định Wald test (kiểm định giả thiết đồng thời: có phải cả 2 biến này X4,X8 đồng thời không ảnh hưởng lên doanh số hay không)
-> từ kết quả hồi quy-> view/Coefficient
Tests/ Wald-Coefficient Restrictions/ gõ C(4)=C(8)=0 (Ho), ta có bảng:
Wald Test:
Equation: Untitled
Test Statistic
Value
df
Probability
F-statistic
0.334088
(2, 256)
0.7163
Chi-square
0.668175
2
0.7160
Null Hypothesis Summary:
Normalized Restriction (= 0)
Value
Std. Err.
C(4)
-0.620636
1.258533
C(8)
0.351253
0.527540
Restrictions are linear in coefficients.
-> p-value của F-statistic lớn (0.7163)-> chấp nhận Ho (cả x4,x8 đồng thời không ảnh hưởng đến Y)
B3: hồi quy Y theo x2,x3,x5,x6,x7
Dependent Variable: Y
Method: Least Squares
Date: 05/21/09 Time: 00:45
Sample: 1 266
Included observations: 265
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-149.1473
59.07772
-2.524596
0.0122
X2
6.068047
1.947646
3.115580
0.0020
X3
2.783337
0.237022
11.74293
0.0000
X5
1.030859
0.023233
44.37082
0.0000
X6
-0.320920
0.105859
-3.031572
0.0027
X7
2.718822
0.800158
3.397854
0.0008
R-squared
0.985573
Mean dependent var
2265.183
Adjusted R-squared
0.985295
S.D. dependent var
5788.070
S.E. of regression
701.8891
Akaike info criterion
15.96781
Sum squared resid
1.28E+08
Schwarz criterion
16.04886
Log likelihood
-2109.735
Hannan-Quinn criter.
16.00037
F-statistic
3538.779
Durbin-Watson stat
1.951116
Prob(F-statistic)
0.000000
-> Mô hình hồi quy phù hợp:
Y= -149.15 + 6.07x2 + 2.78x3 + 1.03x5 – 0.32x6 + 2.72x7
Kiểm định các hệ số hồi quy:
Các hệ số b1,b2,b3,b5,b6,b7 đều có ý nghĩa kinh tế ở mức 5% vì p-value của chúng đều nhỏ hơn 0.05 (bác bỏ Ho, Ho = các hệ số không có ý nghĩa thống kê)
Ý nghĩa kinh tế:
b1= -149.15 : hệ số cắt
b2= 6.07 : nếu các biến giải thích khác không đổi, nếu tổng số lao động (x2) tăng thêm 1 ngàn người thì doanh thu (Y) sẽ tăng thêm 6.07 triệu đôla.
Các hệ số khác giải thích tương tự.
Việc sử dụng các hệ số hồi quy trong việc tư vấn lập ngân sách vốn đầu tư cho các doanh nghiệp trong tương lai:
vì các hệ số b4,b8 không có ý nghĩa thống kê (có nghĩa các biến x4,x8 không ảnh hưởng đến doanh số) -> cắt bỏ chi phí vốn vô hình (x4) và chi phí nghiên cứu & phát triển (x8).
Vì b6 các doanh nghiệp nên cắt giảm dần chi phí quản lý (x6)
Vì b2>b3>b7>b5>0 -> các doanh nghiệp nên tập trung nâng cao tổng số lao động (x2), ưu tiên đầu tư vào chi tiêu vốn hữu hình (x3), sau đó là chi phí quảng cáo & bán hàng (x7), cuối cùng là giá vốn hàng bán (x5).
Bài 3:
Chọn các biến (12 biến) -> nhấp chuột phải, Open/as group -> vào view/ Descriptive stats/common sample
AGE
VALUE
TENURE
SALES
SALARY
PROFIT
PROF
OTHERCOM
EXPER
EDU
COMPENS
BONUS
Mean
57.66000
62.31600
23.50000
4075.680
920.1200
117.4000
5.220000
43.76000
10.38000
1.520000
1186.080
222.2000
Median
59.00000
4.050000
26.00000
2251.000
691.0000
80.00000
5.000000
33.00000
8.000000
2.000000
818.0000
106.0000
Maximum
71.00000
1689.000
46.00000
21351.00
3396.000
1166.000
9.000000
143.0000
34.00000
2.000000
4039.000
1487.000
Minimum
45.00000
0.100000
2.000000
415.0000
128.0000
-1086.000
1.000000
0.000000
1.000000
0.000000
357.0000
0.000000
Std. Dev.
5.571831
249.3224
12.69782
4552.241
697.6053
328.1078
2.589539
38.43604
8.966810
0.614120
833.5558
322.0034
Skewness
-0.270224
5.862292
-0.299182
1.882641
1.563738
0.016030
-0.180923
0.726974
0.961647
-0.877554
1.420794
2.537563
Kurtosis
2.532195
38.00932
1.947630
6.159773
5.379005
7.520569
1.899494
2.548356
2.904372
2.762636
4.758896
9.913458
Jarque-Bera
1.064427
2839.830
3.053171
50.33649
32.16827
42.57620
2.795929
4.829053
7.725424
6.534884
23.26737
153.2350
Probability
0.587304
0.000000
0.217276
0.000000
0.000000
0.000000
0.247099
0.089410
0.021011
0.038104
0.000009
0.000000
Sum
2883.000
3115.800
1175.000
203784.0
46006.00
5870.000
261.0000
2188.000
519.0000
76.00000
59304.00
11110.00
Sum Sq. Dev.
1521.220
3045922.
7900.500
1.02E+09
23846003
5275082.
328.5800
72389.12
3939.780
18.48000
34045946
5080622.
Observations
50
50
50
50
50
50
50
50
50
50
50
50
Nhận xét: ???
b) Nhấp đúp vào biến compens -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “edu” ở Series/ group for classify -> ta có bảng sau:
Descriptive Statistics for COMPENS
Categorized by values of EDU
Date: 05/22/09 Time: 16:40
Sample: 1 50
Included observations: 50
EDU
Mean
Std. Dev.
Obs.
0
2168.667
1432.994
3
1
1542.222
908.4585
18
2
863.3793
524.7285
29
All
1186.080
833.5558
50
Nhận xét: tổng tiền lương trung bình của giám đốc dự án giảm dần theo trình độ học vấn.
c) Nhấp đúp vào biến compens -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “prof” ở Series/ group for classify -> ta có bảng sau:
Descriptive Statistics for COMPENS
Categorized by values of PROF
Date: 05/22/09 Time: 16:41
Sample: 1 50
Included observations: 50
PROF
Mean
Std. Dev.
Obs.
1
1250.286
782.2090
7
2
2027.000
NA
1
3
1439.500
903.1546
6
4
1011.667
742.8256
6
5
825.7143
647.6346
7
6
1018.667
450.1959
3
7
1440.889
1117.068
9
8
1061.400
563.8123
5
9
1117.833
1129.092
6
All
1186.080
833.5558
50
Nhận xét: tổng tiền lương trung bình của giám đốc dự án ở mức cao nếu tham gia từ 1->3 khóa, từ 4-> 9 khóa : ở mức trung bình chung
Xác định mô hình hồi quy phù hợp: (không chắc chắn)
ls salary c bonus othercom compens age edu prof tenure exper value profit sales
có bảng kết quả hồi quy sau:
Dependent Variable: SALARY
Method: Least Squares
Date: 05/21/09 Time: 02:05
Sample: 1 50
Included observations: 50
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.41E-12
8.48E-13
1.668228
0.1035
BONUS
-1.000000
2.74E-16
-3.65E+15
0.0000
OTHERCOM
-1.000000
2.41E-15
-4.16E+14
0.0000
COMPENS
1.000000
1.27E-16
7.87E+15
0.0000
AGE
-9.43E-15
1.38E-14
-0.683261
0.4986
EDU
-6.18E-14
1.31E-13
-0.472206
0.6395
PROF
-9.82E-14
2.48E-14
-3.960393
0.0003
TENURE
8.39E-16
6.15E-15
0.136488
0.8922
EXPER
-5.10E-16
9.80E-15
-0.052002
0.9588
VALUE
1.21E-16
2.80E-16
0.431854
0.6683
PROFIT
-2.36E-16
2.12E-16
-1.115079
0.2718
SALES
0.000000
1.57E-17
0.000000
1.0000
R-squared
1.000000
Mean dependent var
920.1200
Adjusted R-squared
1.000000
S.D. dependent var
697.6053
S.E. of regression
4.18E-13
Sum squared resid
6.64E-24
F-statistic
1.24E+31
Durbin-Watson stat
1.842031
Prob(F-statistic)
0.000000
-> các hệ số b5, b6, b8,b9,b10,b11,b12 không có ý nghĩa thống kê ở mức ý nghĩa 11%
kiểm định Wald:
từ kết quả hồi quy-> view/Coefficient Tests/ Wald-Coefficient Restrictions/ gõ c(5)=c(6)=c(8)=c(9)=c(10)=c(11)=c(12)=0 (giả thiết Ho), ta có bảng:
Wald Test:
Equation: Untitled
Test Statistic
Value
df
Probability
F-statistic
0.303039
(7, 38)
0.9481
Chi-square
2.121275
7
0.9528
Null Hypothesis Summary:
Normalized Restriction (= 0)
Value
Std. Err.
C(5)
-9.43E-15
1.38E-14
C(6)
-6.18E-14
1.31E-13
C(8)
8.39E-16
6.15E-15
C(9)
-5.10E-16
9.80E-15
C(10)
1.21E-16
2.80E-16
C(11)
-2.36E-16
2.12E-16
C(12)
0.000000
1.57E-17
Restrictions are linear in coefficients.
p-value của F-statistic lớn (0.9481)-> chấp nhận Ho (cả age, edu, tenure, exper, value, profit, salé x8,x9,x10,x11,x12 đồng thời không ảnh hưởng đến Y)
Hồi quy salary theo bonus, othercom, compens, prof:
ls salary c bonus othercom compens prof
Dependent Variable: SALARY
Method: Least Squares
Date: 05/21/09 Time: 10:25
Sample: 1 50
Included observations: 50
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
7.72E-13
1.45E-13
5.305148
0.0000
BONUS
-1.000000
2.00E-16
-5.00E+15
0.0000
OTHERCOM
-1.000000
1.84E-15
-5.45E+14
0.0000
COMPENS
1.000000
8.75E-17
1.14E+16
0.0000
PROF
-8.90E-14
2.06E-14
-4.322178
0.0001
R-squared
1.000000
Mean dependent var
920.1200
Adjusted R-squared
1.000000
S.D. dependent var
697.6053
S.E. of regression
3.72E-13
Sum squared resid
6.24E-24
F-statistic
4.30E+31
Durbin-Watson stat
1.807065
Prob(F-statistic)
0.000000
-> mô hình hôi quy:
Salary = 7.72E-13 – bonus – othercom + compens – 8.90E-14
Các kiểm định cần thiết:
Kiểm định phương sai thay đổi:
B1: Vẽ đồ thị salary theo bonus:
Quick/Graph/ bonus salary
B2: ước lượng lại mô hình
ls salary c bonus othercom compens prof
Dependent Variable: SALARY
Method: Least Squares
Date: 05/21/09 Time: 10:25
Sample: 1 50
Included observations: 50
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
7.72E-13
1.45E-13
5.305148
0.0000
BONUS
-1.000000
2.00E-16
-5.00E+15
0.0000
OTHERCOM
-1.000000
1.84E-15
-5.45E+14
0.0000
COMPENS
1.000000
8.75E-17
1.14E+16
0.0000
PROF
-8.90E-14
2.06E-14
-4.322178
0.0001
R-squared
1.000000
Mean dependent var
920.1200
Adjusted R-squared
1.000000
S.D. dependent var
697.6053
S.E. of regression
3.72E-13
Sum squared resid
6.24E-24
F-statistic
4.30E+31
Durbin-Watson stat
1.807065
Prob(F-statistic)
0.000000
B3: Vẽ đồ thị phần dư theo giá trị ước lượng của salary
Từ kết quả hồi quy, chọn View/Representative, rồi copy phương trình hồi quy, ra cửa sổ lệnh và ước lượng như sau:
genr salaryhat= 7.71731845292e-13 - 1*BONUS - 1*OTHERCOM + 1*COMPENS - 8.90013815418e-14*PROF
Vẽ đồ thị:
Quick/Graph/ salaryhat resid
có phương sai thay đổi
B4: kiểm định thống kê
Từ bảng kết quả hồi quy-> view/Residual Tests/ Heteroskedasticity Tests/
* nếu chọn Breusch-Pagan-Godfrey -> ta có bảng:
Heteroskedasticity Test: Breusch-Pagan-Godfrey
F-statistic
4.920500
Prob. F(4,45)
0.0022
Obs*R-squared
15.21443
Prob. Chi-Square(4)
0.0043
Scaled explained SS
23.41351
Prob. Chi-Square(4)
0.0001
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/21/09 Time: 10:56
Sample: 1 50
Included observations: 50
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
4.29E-26
8.36E-26
0.513627
0.6100
BONUS
-9.18E-29
1.15E-28
-0.799212
0.4284
OTHERCOM
-2.83E-27
1.05E-27
-2.681876
0.0102
COMPENS
2.17E-28
5.03E-29
4.322641
0.0001
PROF
-6.06E-27
1.18E-26
-0.512163
0.6110
R-squared
0.304289
Mean dependent var
1.25E-25
Adjusted R-squared
0.242448
S.D. dependent var
2.46E-25
S.E. of regression
2.14E-25
Sum squared resid
2.06E-48
F-statistic
4.920500
Durbin-Watson stat
2.394366
Prob(F-statistic)
0.002235
* nếu chọn Harvey -> ta có bảng :
Heteroskedasticity Test: Harvey
F-statistic
2.092208
Prob. F(4,45)
0.0976
Obs*R-squared
7.840561
Prob. Chi-Square(4)
0.0976
Scaled explained SS
5.869265
Prob. Chi-Square(4)
0.2091
Test Equation:
Dependent Variable: LRESID2
Method: Least Squares
Date: 05/21/09 Time: 11:01
Sample: 1 50
Included observations: 50
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-57.35134
0.726762
-78.91346
0.0000
BONUS
0.000305
0.000999
0.304804
0.7619
OTHERCOM
-0.011447
0.009172
-1.248043
0.2185
COMPENS
0.000462
0.000437
1.056523
0.2964
PROF
-0.254434
0.102877
-2.473194
0.0172
R-squared
0.156811
Mean dependent var
-58.56495
Adjusted R-squared
0.081861
S.D. dependent var
1.941512
S.E. of regression
1.860349
Akaike info criterion
4.174044
Sum squared resid
155.7404
Schwarz criterion
4.365247
Log likelihood
-99.35111
Hannan-Quinn criter.
4.246855
F-statistic
2.092208
Durbin-Watson stat
1.975815
Prob(F-statistic)
0.097553
* nếu chọn Glejser -> ta có bảng:
Heteroskedasticity Test: Glejser
F-statistic
3.681065
Prob. F(4,45)
0.0112
Obs*R-squared
12.32687
Prob. Chi-Square(4)
0.0151
Scaled explained SS
12.27461
Prob. Chi-Square(4)
0.0154
Test Equation:
Dependent Variable: ARESID
Method: Least Squares
Date: 05/21/09 Time: 11:02
Sample: 1 50
Included observations: 50
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.28E-13
8.01E-14
4.093779
0.0002
BONUS
-4.69E-17
1.10E-16
-0.426069
0.6721
OTHERCOM
-1.98E-15
1.01E-15
-1.962031
0.0560
COMPENS
1.44E-16
4.82E-17
2.995479
0.0044
PROF
-2.46E-14
1.13E-14
-2.172259
0.0351
R-squared
0.246537
Mean dependent var
2.73E-13
Adjusted R-squared
0.179563
S.D. dependent var
2.26E-13
S.E. of regression
2.05E-13
Sum squared resid
1.89E-24
F-statistic
3.681065
Durbin-Watson stat
2.093847
Prob(F-statistic)
0.011219
nếu chọn arch-> ta có bảng :
Heteroskedasticity Test: ARCH
F-statistic
0.058717
Prob. F(1,47)
0.8096
Obs*R-squared
0.061140
Prob. Chi-Square(1)
0.8047
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/21/09 Time: 11:05
Sample (adjusted): 2 50
Included observations: 49 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.28E-25
4.00E-26
3.201934
0.0024
RESID^2(-1)
-0.035390
0.146048
-0.242317
0.8096
R-squared
0.001248
Mean dependent var
1.24E-25
Adjusted R-squared
-0.020002
S.D. dependent var
2.48E-25
S.E. of regression
2.51E-25
Sum squared resid
2.95E-48
F-statistic
0.058717
Durbin-Watson stat
2.000941
Prob(F-statistic)
0.809589
* nếu chọn white -> ta có bảng:
Heteroskedasticity Test: White
F-statistic
62.57475
Prob. F(14,35)
0.0000
Obs*R-squared
48.07913
Prob. Chi-Square(14)
0.0000
Scaled explained SS
73.98905
Prob. Chi-Square(14)
0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/21/09 Time: 11:08
Sample: 1 50
Included observations: 50
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
5.27E-25
5.66E-26
9.315531
0.0000
BONUS
5.10E-28
1.69E-28
3.009395
0.0048
BONUS^2
3.67E-31
1.18E-31
3.125379
0.0036
BONUS*OTHERCOM
7.98E-31
2.27E-30
0.352161
0.7268
BONUS*COMPENS
-2.17E-31
7.88E-32
-2.755959
0.0092
BONUS*PROF
-8.70E-29
1.72E-29
-5.052587
0.0000
OTHERCOM
7.63E-27
1.51E-27
5.069448
0.0000
OTHERCOM^2
1.27E-30
9.01E-30
0.141156
0.8886
OTHERCOM*COMPENS
-2.91E-30
5.78E-31
-5.043283
0.0000
OTHERCOM*PROF
-6.77E-28
1.39E-28
-4.887697
0.0000
COMPENS
-5.27E-28
7.14E-29
-7.375194
0.0000
COMPENS^2
1.14E-31
1.66E-32
6.884827
0.0000
COMPENS*PROF
7.18E-29
6.21E-30
11.54878
0.0000
PROF
-1.30E-25
1.72E-26
-7.567793
0.0000
PROF^2
7.55E-27
1.50E-27
5.045868
0.0000
R-squared
0.961583
Mean dependent var
1.25E-25
Adjusted R-squared
0.946216
S.D. dependent var
2.46E-25
S.E. of regression
5.70E-26
Sum squared resid
1.14E-49
F-statistic
62.57475
Durbin-Watson stat
1.420857
Prob(F-statistic)
0.000000
Nhận xét:
Như vậy trừ kiểm định arch, tất cả các kiểm định còn lại điều cho thấy giá trị X2 (chi-squared) tính toán rất cao và giá trị xác suất rất thấp -> ta kết luận có hiện tượng phương sai thay đổi.
Bài 4:
a) ls log(imports) c log(gdp) log(cpi)
Dependent Variable: LOG(IMPORTS)
Method: Least Squares
Date: 05/21/09 Time: 22:48
Sample: 1990Q1 2001Q3
Included observations: 47
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.506395
0.295304
1.714828
0.0934
LOG(GDP)
2.136145
0.105433
20.26059
0.0000
LOG(CPI)
0.107142
0.050123
2.137587
0.0381
R-squared
0.977820
Mean dependent var
10.76531
Adjusted R-squared
0.976812
S.D. dependent var
0.164217
S.E. of regression
0.025007
Akaike info criterion
-4.477653
Sum squared resid
0.027515
Schwarz criterion
-4.359559
Log likelihood
108.2248
Hannan-Quinn criter.
-4.433213
F-statistic
969.8746
Durbin-Watson stat
0.548284
Prob(F-statistic)
0.000000
b) Có hiện tượng đa cộng tuyến vì:
sai dấu hệ số hồi quy b3 của biến log(cpi). Kỳ vọng b3 sản xuất giảm -> nhập khẩu (imports) giảm.
R-squared = 0.977820 cao
lập ma trận hệ số tương quan giữa các biến giải thích:
View/ Group statistic/ Correlation/ nhập log(imports) log(gdp) log(cpi)
LOG(IMPORTS)
LOG(GDP)
LOG(CPI)
LOG(IMPORTS)
1.000000
0.987682
0.878005
LOG(GDP)
0.987682
1.000000
0.864534
LOG(CPI)
0.878005
0.864534
1.000000
Các hệ số tương quan giữa các biến cao -> có đa cộng tuyến, tương thích với kết quả ở câu b)
Ước lượng mô hình: lnIMPORTt = B1 + B2lnGDPt + ut
Dependent Variable: LOG(IMPORTS)
Method: Least Squares
Date: 05/21/09 Time: 23:13
Sample: 1990Q1 2001Q3
Included observations: 47
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.143095
0.250887
0.570357
0.5713
LOG(GDP)
2.330987
0.055050
42.34344
0.0000
R-squared
0.975516
Mean dependent var
10.76531
Adjusted R-squared
0.974972
S.D. dependent var
0.164217
S.E. of regression
0.025979
Akaike info criterion
-4.421405
Sum squared resid
0.030372
Schwarz criterion
-4.342675
Log likelihood
105.9030
Hannan-Quinn criter.
-4.391778
F-statistic
1792.967
Durbin-Watson stat
0.512036
Prob(F-statistic)
0.000000
Ước lượng mô hình: lnIMPORTt = B1 + B2lnCPIt + ut
Dependent Variable: LOG(IMPORTS)
Method: Least Squares
Date: 05/21/09 Time: 23:15
Sample: 1990Q1 2001Q3
Included observations: 47
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
5.942083
0.392142
15.15288
0.0000
LOG(CPI)
0.985095
0.080056
12.30506
0.0000
R-squared
0.770893
Mean dependent var
10.76531
Adjusted R-squared
0.765801
S.D. dependent var
0.164217
S.E. of regression
0.079471
Akaike info criterion
-2.185217
Sum squared resid
0.284207
Schwarz criterion
-2.106487
Log likelihood
53.35259
Hannan-Quinn criter.
-2.155590
F-statistic
151.4145
Durbin-Watson stat
0.088172
Prob(F-statistic)
0.000000
Ước lượng mô hình: lnGDPt = B1 + B2lnCPIt + ut
Dependent Variable: LOG(GDP)
Method: Least Squares
Date: 05/21/09 Time: 23:16
Sample: 1990Q1 2001Q3
Included observations: 47
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.544625
0.174462
14.58552
0.0000
LOG(CPI)
0.410999
0.035617
11.53951
0.0000
R-squared
0.747419
Mean dependent var
4.556958
Adjusted R-squared
0.741806
S.D. dependent var
0.069582
S.E. of regression
0.035357
Akaike info criterion
-3.805046
Sum squared resid
0.056254
Schwarz criterion
-3.726316
Log likelihood
91.41858
Hannan-Quinn criter.
-3.775419
F-statistic
133.1604
Durbin-Watson stat
0.051041
Prob(F-statistic)
0.000000
Rút ra kết luận về bản chất tự tương quan: tự tương quan là sự phụ thuộc giữa các biến trong mô hình.
Bài 5:
Dependent Variable: LOG(IMP)
Method: Least Squares
Date: 05/17/09 Time: 23:55
Sample: 1 24
Included observations: 24
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.503281
0.298284
8.392276
0.0000
LOG(GDP)
2.158164
0.092647
23.29457
0.0000
LOG(CPI)
-0.041740
0.030425
-1.371920
0.1846
R-squared
0.992698
Mean dependent var
11.81963
Adjusted R-squared
0.992003
S.D. dependent var
0.322220
S.E. of regression
0.028815
Akaike info criterion
-4.139360
Sum squared resid
0.017437
Schwarz criterion
-3.992103
Log likelihood
52.67231
Hannan-Quinn criter.
-4.100292
F-statistic
1427.503
Durbin-Watson stat
1.192053
Prob(F-statistic)
0.000000
Dependent Variable: LOG(IMP)
Method: Least Squares
Date: 05/18/09 Time: 00:15
Sample: 1 24
Included observations: 24
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.841244
0.171530
16.56410
0.0000
LOG(GDP)
2.042390
0.038996
52.37488
0.0000
R-squared
0.992044
Mean dependent var
11.81963
Adjusted R-squared
0.991682
S.D. dependent var
0.322220
S.E. of regression
0.029387
Akaike info criterion
-4.136857
Sum squared resid
0.018999
Schwarz criterion
-4.038686
Log likelihood
51.64229
Hannan-Quinn criter.
-4.110813
F-statistic
2743.128
Durbin-Watson stat
1.114996
Prob(F-statistic)
0.000000
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
1.798545
Prob. F(1,21)
0.1942
Obs*R-squared
1.893326
Prob. Chi-Square(1)
0.1688
LOG(IMP)
LOG(GDP)
LOG(CPI)
LOG(IMP)
1.000000
0.996014
0.896672
LOG(GDP)
0.996014
1.000000
0.910861
LOG(CPI)
0.896672
0.910861
1.000000
Dependent Variable: LOG(IMP)
Method: Least Squares
Date: 05/18/09 Time: 00:29
Sample: 1 24
Included observations: 24
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
9.346217
0.262046
35.66637
0.0000
LOG(CPI)
0.603811
0.063557
9.500364
0.0000
R-squared
0.804021
Mean dependent var
11.81963
Adjusted R-squared
0.795113
S.D. dependent var
0.322220
S.E. of regression
0.145851
Akaike info criterion
-0.932805
Sum squared resid
0.467996
Schwarz criterion
-0.834634
Log likelihood
13.19366
Hannan-Quinn criter.
-0.906760
F-statistic
90.25691
Durbin-Watson stat
0.251729
Prob(F-statistic)
0.000000
à tự tương quan
Dependent Variable: LOG(GDP)
Method: Least Squares
Date: 05/18/09 Time: 00:30
Sample: 1 24
Included observations: 24
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.170721
0.119137
26.61403
0.0000
LOG(CPI)
0.299120
0.028896
10.35178
0.0000
R-squared
0.829668
Mean dependent var
4.396017
Adjusted R-squared
0.821925
S.D. dependent var
0.157137
S.E. of regression
0.066310
Akaike info criterion
-2.509291
Sum squared resid
0.096735
Schwarz criterion
-2.411120
Log likelihood
32.11149
Hannan-Quinn criter.
-2.483246
F-statistic
107.1593
Durbin-Watson stat
0.218168
Prob(F-statistic)
0.000000
à tự tương quan
Bài 6:
a) ls price c lotsize sqrft bdrms
Dependent Variable: PRICE
Method: Least Squares
Date: 05/22/09 Time: 20:16
Sample: 1 88
Included observations: 88
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-21770.31
29475.04
-0.738601
0.4622
LOTSIZE
2.067707
0.642126
3.220096
0.0018
SQRFT
122.7782
13.23741
9.275093
0.0000
BDRMS
13852.52
9010.145
1.537436
0.1279
R-squared
0.672362
Mean dependent var
293546.0
Adjusted R-squared
0.660661
S.D. dependent var
102713.4
S.E. of regression
59833.48
Akaike info criterion
24.88091
Sum squared resid
3.01E+11
Schwarz criterion
24.99351
Log likelihood
-1090.760
Hannan-Quinn criter.
24.92627
F-statistic
57.46023
Durbin-Watson stat
2.109796
Prob(F-statistic)
0.000000
b) Kiểm định phương sai thay đổi:
B1: Vẽ đồ thị price theo lotsize:
Quick/Graph/ price lotsize
B2: ước lượng lại mô hình
ls price c lotsize sqrft bdrms
Dependent Variable: PRICE
Method: Least Squares
Date: 05/22/09 Time: 20:23
Sample: 1 88
Included observations: 88
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-21770.31
29475.04
-0.738601
0.4622
LOTSIZE
2.067707
0.642126
3.220096
0.0018
SQRFT
122.7782
13.23741
9.275093
0.0000
BDRMS
13852.52
9010.145
1.537436
0.1279
R-squared
0.672362
Mean dependent var
293546.0
Adjusted R-squared
0.660661
S.D. dependent var
102713.4
S.E. of regression
59833.48
Akaike info criterion
24.88091
Sum squared resid
3.01E+11
Schwarz criterion
24.99351
Log likelihood
-1090.760
Hannan-Quinn criter.
24.92627
F-statistic
57.46023
Durbin-Watson stat
2.109796
Prob(F-statistic)
0.000000
B3: Vẽ đồ thị phần dư theo giá trị ước lượng của salary
Từ kết quả hồi quy, chọn View/Representative, rồi copy phương trình hồi quy, ra cửa sổ lệnh và ước lượng như sau:
genr pricehat = -21770.3086036 + 2.06770660199*LOTSIZE + 122.778185222*SQRFT + 13852.5218631*BDRMS
Vẽ đồ thị:
Quick/Graph/ pricehat resid
-> có phương sai thay đổi
B4: kiểm định thống kê
Từ bảng kết quả hồi quy-> view/Residual Tests/ Heteroskedasticity Tests/
nếu chọn Breusch-Pagan-Godfrey -> ta có bảng
Heteroskedasticity Test: Breusch-Pagan-Godfrey
F-statistic
5.338919
Prob. F(3,84)
0.0020
Obs*R-squared
14.09239
Prob. Chi-Square(3)
0.0028
Scaled explained SS
27.35542
Prob. Chi-Square(3)
0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/22/09 Time: 20:31
Sample: 1 88
Included observations: 88
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-5.52E+09
3.26E+09
-1.694380
0.0939
LOTSIZE
201520.9
71009.06
2.837961
0.0057
SQRFT
1691037.
1463850.
1.155198
0.2513
BDRMS
1.04E+09
9.96E+08
1.045544
0.2988
R-squared
0.160141
Mean dependent var
3.42E+09
Adjusted R-squared
0.130146
S.D. dependent var
7.09E+09
S.E. of regression
6.62E+09
Akaike info criterion
48.10798
Sum squared resid
3.68E+21
Schwarz criterion
48.22058
Log likelihood
-2112.751
Hannan-Quinn criter.
48.15334
F-statistic
5.338919
Durbin-Watson stat
2.351111
Prob(F-statistic)
0.002048
* nếu chọn Harvey -> ta có bảng :
Heteroskedasticity Test: Harvey
F-statistic
2.883489
Prob. F(3,84)
0.0405
Obs*R-squared
8.216268
Prob. Chi-Square(3)
0.0417
Scaled explained SS
8.486394
Prob. Chi-Square(3)
0.0370
Test Equation:
Dependent Variable: LRESID2
Method: Least Squares
Date: 05/22/09 Time: 20:33
Sample: 1 88
Included observations: 88
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
17.71619
1.083894
16.34494
0.0000
LOTSIZE
3.38E-05
2.36E-05
1.430733
0.1562
SQRFT
0.000515
0.000487
1.057938
0.2931
BDRMS
0.384611
0.331333
1.160801
0.2490
R-squared
0.093367
Mean dependent var
20.43030
Adjusted R-squared
0.060987
S.D. dependent var
2.270601
S.E. of regression
2.200274
Akaike info criterion
4.459430
Sum squared resid
406.6611
Schwarz criterion
4.572036
Log likelihood
-192.2149
Hannan-Quinn criter.
4.504796
F-statistic
2.883489
Durbin-Watson stat
2.426777
Prob(F-statistic)
0.040533
* nếu chọn Glejser -> ta có bảng:
Heteroskedasticity Test: Glejser
F-statistic
7.185545
Prob. F(3,84)
0.0002
Obs*R-squared
17.97124
Prob. Chi-Square(3)
0.0004
Scaled explained SS
21.43101
Prob. Chi-Square(3)
0.0001
Test Equation:
Dependent Variable: ARESID
Method: Least Squares
Date: 05/22/09 Time: 20:34
Sample: 1 88
Included observations: 88
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-19500.44
17716.01
-1.100724
0.2742
LOTSIZE
1.129760
0.385951
2.927215
0.0044
SQRFT
10.69671
7.956360
1.344423
0.1824
BDRMS
8678.622
5415.559
1.602535
0.1128
R-squared
0.204219
Mean dependent var
43196.64
Adjusted R-squared
0.175798
S.D. dependent var
39613.11
S.E. of regression
35962.99
Akaike info criterion
23.86276
Sum squared resid
1.09E+11
Schwarz criterion
23.97536
Log likelihood
-1045.961
Hannan-Quinn criter.
23.90812
F-statistic
7.185545
Durbin-Watson stat
2.538377
Prob(F-statistic)
0.000237
nếu chọn arch-> ta có bảng :
Heteroskedasticity Test: ARCH
F-statistic
0.125639
Prob. F(1,85)
0.7239
Obs*R-squared
0.128406
Prob. Chi-Square(1)
0.7201
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/22/09 Time: 20:36
Sample (adjusted): 2 88
Included observations: 87 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.57E+09
8.55E+08
4.169434
0.0001
RESID^2(-1)
-0.038451
0.108478
-0.354457
0.7239
R-squared
0.001476
Mean dependent var
3.43E+09
Adjusted R-squared
-0.010271
S.D. dependent var
7.13E+09
S.E. of regression
7.17E+09
Akaike info criterion
48.24710
Sum squared resid
4.37E+21
Schwarz criterion
48.30379
Log likelihood
-2096.749
Hannan-Quinn criter.
48.26993
F-statistic
0.125639
Durbin-Watson stat
2.002935
Prob(F-statistic)
0.723875
* nếu chọn white -> ta có bảng:
Heteroskedasticity Test: White
F-statistic
5.386953
Prob. F(9,78)
0.0000
Obs*R-squared
33.73166
Prob. Chi-Square(9)
0.0001
Scaled explained SS
65.47818
Prob. Chi-Square(9)
0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/22/09 Time: 20:37
Sample: 1 88
Included observations: 88
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.56E+10
1.14E+10
1.374411
0.1733
LOTSIZE
-1859507.
637097.0
-2.918719
0.0046
LOTSIZE^2
-0.497839
4.631155
-0.107498
0.9147
LOTSIZE*SQRFT
456.7785
276.8903
1.649673
0.1030
LOTSIZE*BDRMS
314646.9
252093.6
1.248135
0.2157
SQRFT
-2673918.
8662183.
-0.308689
0.7584
SQRFT^2
352.2553
1839.603
0.191484
0.8486
SQRFT*BDRMS
-1020860.
1667154.
-0.612337
0.5421
BDRMS
-1.98E+09
5.44E+09
-0.364595
0.7164
BDRMS^2
2.90E+08
7.59E+08
0.381843
0.7036
R-squared
0.383314
Mean dependent var
3.42E+09
Adjusted R-squared
0.312158
S.D. dependent var
7.09E+09
S.E. of regression
5.88E+09
Akaike info criterion
47.93546
Sum squared resid
2.70E+21
Schwarz criterion
48.21698
Log likelihood
-2099.160
Hannan-Quinn criter.
48.04888
F-statistic
5.386953
Durbin-Watson stat
2.052712
Prob(F-statistic)
0.000010
Nhận xét:
Như vậy trừ kiểm định arch, tất cả các kiểm định còn lại điều cho thấy giá trị X2 (chi-squared) tính toán rất cao và giá trị xác suất rất thấp -> ta kết luận có hiện tượng phương sai thay đổi.
c) ls price c log(lotsize) log(sqrft) log(bdrms)
Dependent Variable: PRICE
Method: Least Squares
Date: 05/22/09 Time: 20:40
Sample: 1 88
Included observations: 88
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-2082664.
206661.6
-10.07765
0.0000
LOG(LOTSIZE)
62344.58
12427.50
5.016663
0.0000
LOG(SQRFT)
230938.4
30176.04
7.653037
0.0000
LOG(BDRMS)
57951.03
32937.22
1.759439
0.0821
R-squared
0.671560
Mean dependent var
293546.0
Adjusted R-squared
0.659830
S.D. dependent var
102713.4
S.E. of regression
59906.72
Akaike info criterion
24.88335
Sum squared resid
3.01E+11
Schwarz criterion
24.99596
Log likelihood
-1090.868
Hannan-Quinn criter.
24.92872
F-statistic
57.25139
Durbin-Watson stat
2.208456
Prob(F-statistic)
0.000000
Kiểm định phương sai thay đổi:
B1: Vẽ đồ thị price theo lotsize:
Quick/Graph/ price log(lotsize)
B2: ước lượng lại mô hình
ls price c log(lotsize) log(sqrft) log(bdrms)
Dependent Variable: PRICE
Method: Least Squares
Date: 05/22/09 Time: 20:40
Sample: 1 88
Included observations: 88
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-2082664.
206661.6
-10.07765
0.0000
LOG(LOTSIZE)
62344.58
12427.50
5.016663
0.0000
LOG(SQRFT)
230938.4
30176.04
7.653037
0.0000
LOG(BDRMS)
57951.03
32937.22
1.759439
0.0821
R-squared
0.671560
Mean dependent var
293546.0
Adjusted R-squared
0.659830
S.D. dependent var
102713.4
S.E. of regression
59906.72
Akaike info criterion
24.88335
Sum squared resid
3.01E+11
Schwarz criterion
24.99596
Log likelihood
-1090.868
Hannan-Quinn criter.
24.92872
F-statistic
57.25139
Durbin-Watson stat
2.208456
Prob(F-statistic)
0.000000
B3: Vẽ đồ thị phần dư theo giá trị ước lượng của price
Từ kết quả hồi quy, chọn View/Representative, rồi copy phương trình hồi quy, ra cửa sổ lệnh và ước lượng như sau:
genr pricehat = -2082663.68199 + 62344.5769751*LOG(LOTSIZE) + 230938.364794*LOG(SQRFT) + 57951.0312542*LOG(BDRMS)
Vẽ đồ thị:
Quick/Graph/ pricehat resid
-> có phương sai không đổi
Bai 8:
a) Chọn biến I -> view/Unit root test, chọn level, intercept -> có bảng:
Null Hypothesis: I has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=7)
t-Statistic
Prob.*
Augmented Dickey-Fuller test statistic
-1.158543
0.6782
Test critical values:
1% level
-3.679322
5% level
-2.967767
10% level
-2.622989
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(I)
Method: Least Squares
Date: 05/22/09 Time: 20:58
Sample (adjusted): 2001Q4 2008Q4
Included observations: 29 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
I(-1)
-0.108120
0.093324
-1.158543
0.2568
C
2.823139
1.970204
1.432917
0.1634
R-squared
0.047358
Mean dependent var
0.677586
Adjusted R-squared
0.012075
S.D. dependent var
3.642638
S.E. of regression
3.620580
Akaike info criterion
5.477617
Sum squared resid
353.9321
Schwarz criterion
5.571914
Log likelihood
-77.42545
Hannan-Quinn criter.
5.507150
F-statistic
1.342222
Durbin-Watson stat
2.387635
Prob(F-statistic)
0.256787
Ho: chuỗi I không dừng
P-value lớn -> chấp nhận Ho
-> chuỗi I không dừng
Chọn biến Y -> view/Unit root test, chọn level, intercept -> có bảng:
Null Hypothesis: Y has a unit root
Exogenous: Constant
Lag Length: 2 (Automatic based on SIC, MAXLAG=7)
t-Statistic
Prob.*
Augmented Dickey-Fuller test statistic
-0.551274
0.8657
Test critical values:
1% level
-3.699871
5% level
-2.976263
10% level
-2.627420
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(Y)
Method: Least Squares
Date: 05/22/09 Time: 21:00
Sample (adjusted): 2002Q2 2008Q4
Included observations: 27 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
Y(-1)
-0.022334
0.040514
-0.551274
0.5868
D(Y(-1))
-0.274478
0.185252
-1.481651
0.1520
D(Y(-2))
-0.450442
0.182826
-2.463769
0.0217
C
2.103577
0.920943
2.284154
0.0319
R-squared
0.263846
Mean dependent var
0.945185
Adjusted R-squared
0.167826
S.D. dependent var
1.780567
S.E. of regression
1.624297
Akaike info criterion
3.943981
Sum squared resid
60.68182
Schwarz criterion
4.135957
Log likelihood
-49.24374
Hannan-Quinn criter.
4.001065
F-statistic
2.747820
Durbin-Watson stat
2.164554
Prob(F-statistic)
0.066029
-> chuỗi Y không dừng
Chọn biến R -> view/Unit root test, chọn level, intercept -> có bảng:
Null Hypothesis: R has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=7)
t-Statistic
Prob.*
Augmented Dickey-Fuller test statistic
-6.909094
0.0000
Test critical values:
1% level
-3.679322
5% level
-2.967767
10% level
-2.622989
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(R)
Method: Least Squares
Date: 05/22/09 Time: 21:01
Sample (adjusted): 2001Q4 2008Q4
Included observations: 29 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
R(-1)
-1.267350
0.183432
-6.909094
0.0000
C
17.64524
2.717806
6.492458
0.0000
R-squared
0.638726
Mean dependent var
-0.079310
Adjusted R-squared
0.625346
S.D. dependent var
7.894809
S.E. of regression
4.832334
Akaike info criterion
6.055008
Sum squared resid
630.4892
Schwarz criterion
6.149305
Log likelihood
-85.79762
Hannan-Quinn criter.
6.084541
F-statistic
47.73559
Durbin-Watson stat
2.074225
Prob(F-statistic)
0.000000
-> chuỗi R dừng
Nếu là chuỗi không dừng thì sẽ có trung bình và phương sai thay đổi thời gian -> không dự báo chính xác được -> nếu là chuỗi dừng thì nên chuyển sang dạng sai phân bậc 1 vì thông thường 1 chuỗi thời gian là không dừng thì sai phân bậc 1 có thể sẽ là một chuỗi dừng (có trung bình và phương sai không đổi theo thời gian) -> dự báo chính xác hơn.
b) ls I c Y R
Dependent Variable: I
Method: Least Squares
Date: 05/22/09 Time: 21:02
Sample: 2001Q3 2008Q4
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
6.224938
2.510894
2.479172
0.0197
Y
0.769911
0.071791
10.72442
0.0000
R
-0.184196
0.126416
-1.457068
0.1566
R-squared
0.816282
Mean dependent var
20.22200
Adjusted R-squared
0.802673
S.D. dependent var
7.495569
S.E. of regression
3.329642
Akaike info criterion
5.338246
Sum squared resid
299.3358
Schwarz criterion
5.478366
Log likelihood
-77.07369
Hannan-Quinn criter.
5.383071
F-statistic
59.98221
Durbin-Watson stat
0.852153
Prob(F-statistic)
0.000000
Do d=0.85 -> có tự tương quan bậc 1
Ta kiểm tra xem có tự tương quan bặc cao hay không:
Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
6.764643
Prob. F(2,25)
0.0045
Obs*R-squared
10.53429
Prob. Chi-Square(2)
0.0052
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/22/09 Time: 21:04
Sample: 2001Q3 2008Q4
Included observations: 30
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.799886
2.202606
0.817162
0.4216
Y
-0.012173
0.060373
-0.201637
0.8418
R
-0.107141
0.112469
-0.952623
0.3499
RESID(-1)
0.697416
0.208636
3.342738
0.0026
RESID(-2)
-0.165681
0.204936
-0.808452
0.4265
R-squared
0.351143
Mean dependent var
-4.88E-16
Adjusted R-squared
0.247326
S.D. dependent var
3.212775
S.E. of regression
2.787301
Akaike info criterion
5.039036
Sum squared resid
194.2262
Schwarz criterion
5.272569
Log likelihood
-70.58555
Hannan-Quinn criter.
5.113746
F-statistic
3.382321
Durbin-Watson stat
1.868584
Prob(F-statistic)
0.024177
Vì Prob.Square(2) = 0.0052 nhỏ -> có tự tương quan bậc cao
c) ls log(I) c log(Y) log(R)
Dependent Variable: LOG(I)
Method: Least Squares
Date: 05/22/09 Time: 21:10
Sample: 2001Q3 2008Q4
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.023735
0.405353
2.525538
0.0177
LOG(Y)
0.734444
0.091028
8.068345
0.0000
LOG(R)
-0.108312
0.102930
-1.052288
0.3020
R-squared
0.720742
Mean dependent var
2.933305
Adjusted R-squared
0.700056
S.D. dependent var
0.400720
S.E. of regression
0.219463
Akaike info criterion
-0.100627
Sum squared resid
1.300428
Schwarz criterion
0.039493
Log likelihood
4.509408
Hannan-Quinn criter.
-0.055802
F-statistic
34.84233
Durbin-Watson stat
0.619553
Prob(F-statistic)
0.000000
Do d=0.61 -> có tự tương quan bậc 1
Ta kiểm tra xem có tự tương quan bặc cao hay không:
Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
11.32566
Prob. F(2,25)
0.0003
Obs*R-squared
14.26067
Prob. Chi-Square(2)
0.0008
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/22/09 Time: 21:11
Sample: 2001Q3 2008Q4
Included observations: 30
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.128674
0.311885
0.412569
0.6834
LOG(Y)
-0.009872
0.069046
-0.142978
0.8875
LOG(R)
-0.037666
0.079057
-0.476442
0.6379
RESID(-1)
0.792038
0.201930
3.922330
0.0006
RESID(-2)
-0.153046
0.203102
-0.753540
0.4582
R-squared
0.475356
Mean dependent var
5.12E-16
Adjusted R-squared
0.391412
S.D. dependent var
0.211760
S.E. of regression
0.165198
Akaike info criterion
-0.612328
Sum squared resid
0.682262
Schwarz criterion
-0.378795
Log likelihood
14.18492
Hannan-Quinn criter.
-0.537619
F-statistic
5.662829
Durbin-Watson stat
1.992081
Prob(F-statistic)
0.002187
Vì Prob.Square(2) = 0.008 nhỏ -> có tự tương quan bậc cao
ls I c y r @trend(2001Q3)
Dependent Variable: I
Method: Least Squares
Date: 05/22/09 Time: 21:13
Sample: 2001Q3 2008Q4
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
4.695682
3.912313
1.200232
0.2409
Y
0.992016
0.437555
2.267178
0.0319
R
-0.187741
0.128357
-1.462647
0.1555
@TREND(2001Q3)
-0.221050
0.429411
-0.514776
0.6111
R-squared
0.818136
Mean dependent var
20.22200
Adjusted R-squared
0.797151
S.D. dependent var
7.495569
S.E. of regression
3.375909
Akaike info criterion
5.394772
Sum squared resid
296.3158
Schwarz criterion
5.581598
Log likelihood
-76.92158
Hannan-Quinn criter.
5.454539
F-statistic
38.98790
Durbin-Watson stat
0.916623
Prob(F-statistic)
0.000000
Do d=0.91 -> có tự tương quan bậc 1
Ta kiểm tra xem có tự tương quan bặc cao hay không:
Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
7.743312
Prob. F(2,24)
0.0025
Obs*R-squared
11.76598
Prob. Chi-Square(2)
0.0028
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/22/09 Time: 21:14
Sample: 2001Q3 2008Q4
Included observations: 30
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
7.156954
3.716978
1.925476
0.0661
Y
-0.703810
0.399603
-1.761273
0.0909
R
-0.133598
0.111906
-1.193840
0.2442
@TREND(2001Q3)
0.684778
0.391183
1.750530
0.0928
RESID(-1)
0.832667
0.227640
3.657818
0.0012
RESID(-2)
-0.208571
0.202148
-1.031770
0.3125
R-squared
0.392199
Mean dependent var
-8.88E-17
Adjusted R-squared
0.265574
S.D. dependent var
3.196527
S.E. of regression
2.739381
Akaike info criterion
5.030197
Sum squared resid
180.1009
Schwarz criterion
5.310437
Log likelihood
-69.45296
Hannan-Quinn criter.
5.119848
F-statistic
3.097325
Durbin-Watson stat
1.871876
Prob(F-statistic)
0.026903
Vì Prob.Square(2) = 0.0028 nhỏ -> có tự tương quan bậc cao
Mô hình 1 có tự tương quan, nhưng khi chuyển sang mô hình 2 và 3 vẫn còn tự tương quan (thay đổi dạng hàm) -> như vậy tự tương quan ở mô hình 1 là tự tương quan thuần túy.
Khắc phục tự tương quan: thủ tục Cochrane-Orcutt
B1: Ước lượng phương trình: Yt=b1+b2Xt+et
ls I c Y R
Dependent Variable: I
Method: Least Squares
Date: 05/22/09 Time: 22:05
Sample: 2001Q3 2008Q4
Included observations: 30
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
6.224938
2.510894
2.479172
0.0197
Y
0.769911
0.071791
10.72442
0.0000
R
-0.184196
0.126416
-1.457068
0.1566
R-squared
0.816282
Mean dependent var
20.22200
Adjusted R-squared
0.802673
S.D. dependent var
7.495569
S.E. of regression
3.329642
Akaike info criterion
5.338246
Sum squared resid
299.3358
Schwarz criterion
5.478366
Log likelihood
-77.07369
Hannan-Quinn criter.
5.383071
F-statistic
59.98221
Durbin-Watson stat
0.852153
Prob(F-statistic)
0.000000
-> lưu et:
genr pd=resid
B2: Hồi quy: et=p^et-1+εt
ls pd pd(-1)
Dependent Variable: PD
Method: Least Squares
Date: 05/22/09 Time: 22:09
Sample (adjusted): 2001Q4 2008Q4
Included observations: 29 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
PD(-1)
0.567726
0.155221
3.657547
0.0010
R-squared
0.322978
Mean dependent var
-0.070236
Adjusted R-squared
0.322978
S.D. dependent var
3.246119
S.E. of regression
2.670950
Akaike info criterion
4.836620
Sum squared resid
199.7512
Schwarz criterion
4.883768
Log likelihood
-69.13098
Hannan-Quinn criter.
4.851386
Durbin-Watson stat
1.851803
-> p^=0.567726
lưu p^
genr rho=c(1)
B3: Tính It*,Yt*,Rt*
genr Ihat=I-rho*I(-1)
genr yhat=y-rho*y(-1)
genr rhat=r-rho*r(-1)
B4: It*=B1*+B2*Yt*+B3*Rt*+ εt (2)
ước lượng (2) theo OLS:
ls Ihat c yhat rhat
Dependent Variable: IHAT
Method: Least Squares
Date: 05/22/09 Time: 22:02
Sample (adjusted): 2001Q4 2008Q4
Included observations: 29 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.130112
1.442645
2.169704
0.0394
YHAT
0.787463
0.131353
5.995034
0.0000
RHAT
-0.293100
0.080636
-3.634844
0.0012
R-squared
0.635559
Mean dependent var
9.255682
Adjusted R-squared
0.607525
S.D. dependent var
4.276520
S.E. of regression
2.679146
Akaike info criterion
4.906570
Sum squared resid
186.6234
Schwarz criterion
5.048015
Log likelihood
-68.14527
Hannan-Quinn criter.
4.950869
F-statistic
22.67109
Durbin-Watson stat
1.547610
Prob(F-statistic)
0.000002
Do d=1.54->không có tự tương quan bậc 1
Ta kiểm tra xem có tự tương quan bặc cao hay không:
Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
0.982814
Prob. F(2,24)
0.3888
Obs*R-squared
2.195333
Prob. Chi-Square(2)
0.3336
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/22/09 Time: 22:18
Sample: 2001Q4 2008Q4
Included observations: 29
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.502257
1.492973
0.336414
0.7395
YHAT
-0.027402
0.133920
-0.204616
0.8396
RHAT
-0.036417
0.085114
-0.427866
0.6726
RESID(-1)
0.287089
0.214723
1.337020
0.1938
RESID(-2)
-0.161041
0.209509
-0.768659
0.4496
R-squared
0.075701
Mean dependent var
-1.36E-15
Adjusted R-squared
-0.078349
S.D. dependent var
2.581690
S.E. of regression
2.680919
Akaike info criterion
4.965782
Sum squared resid
172.4958
Schwarz criterion
5.201522
Log likelihood
-67.00383
Hannan-Quinn criter.
5.039613
F-statistic
0.491407
Durbin-Watson stat
1.931618
Prob(F-statistic)
0.742030
Vì Prob.Square(2) = 0.3336->không có tự tương quan bậc cao
Bai 9:
a) Chọn biến f -> view/Unit root test, chọn level, intercept -> có bảng:
Null Hypothesis: F has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=7)
t-Statistic
Prob.*
Augmented Dickey-Fuller test statistic
-0.853481
0.7888
Test critical values:
1% level
-3.670170
5% level
-2.963972
10% level
-2.621007
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(F)
Method: Least Squares
Date: 05/22/09 Time: 14:52
Sample (adjusted): 1979 2008
Included observations: 30 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
F(-1)
-0.022615
0.026497
-0.853481
0.4006
C
3.070566
2.897865
1.059596
0.2984
R-squared
0.025356
Mean dependent var
0.600000
Adjusted R-squared
-0.009453
S.D. dependent var
0.739058
S.E. of regression
0.742543
Akaike info criterion
2.306869
Sum squared resid
15.43837
Schwarz criterion
2.400282
Log likelihood
-32.60303
Hannan-Quinn criter.
2.336752
F-statistic
0.728430
Durbin-Watson stat
1.998903
Prob(F-statistic)
0.400635
Ho: chuỗi f không dừng
P-value lớn -> chấp nhận Ho
-> chuỗi f không dừng
Chọn biến p -> view/Unit root test, chọn level, intercept -> có bảng:
Null Hypothesis: P has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=7)
t-Statistic
Prob.*
Augmented Dickey-Fuller test statistic
-3.156190
0.0330
Test critical values:
1% level
-3.670170
5% level
-2.963972
10% level
-2.621007
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(P)
Method: Least Squares
Date: 05/22/09 Time: 14:56
Sample (adjusted): 1979 2008
Included observations: 30 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
P(-1)
-0.518693
0.164342
-3.156190
0.0038
C
54.57645
17.21709
3.169900
0.0037
R-squared
0.262411
Mean dependent var
0.290000
Adjusted R-squared
0.236069
S.D. dependent var
4.806630
S.E. of regression
4.201146
Akaike info criterion
5.772932
Sum squared resid
494.1896
Schwarz criterion
5.866346
Log likelihood
-84.59399
Hannan-Quinn criter.
5.802816
F-statistic
9.961532
Durbin-Watson stat
1.797577
Prob(F-statistic)
0.003803
p-value nhỏ -> bác bỏ Ho -> chuỗi p dừng
Chọn biến q -> view/Unit root test, chọn level, intercept -> có bảng:
Null Hypothesis: Q has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=7)
t-Statistic
Prob.*
Augmented Dickey-Fuller test statistic
-3.297838
0.0243
Test critical values:
1% level
-3.679322
5% level
-2.967767
10% level
-2.622989
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(Q)
Method: Least Squares
Date: 05/22/09 Time: 14:58
Sample (adjusted): 1980 2008
Included observations: 29 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
Q(-1)
-0.529847
0.160665
-3.297838
0.0027
C
17.96495
5.512537
3.258927
0.0030
R-squared
0.287143
Mean dependent var
-0.113793
Adjusted R-squared
0.260740
S.D. dependent var
3.629121
S.E. of regression
3.120325
Akaike info criterion
5.180224
Sum squared resid
262.8836
Schwarz criterion
5.274520
Log likelihood
-73.11324
Hannan-Quinn criter.
5.209756
F-statistic
10.87573
Durbin-Watson stat
1.610096
Prob(F-statistic)
0.002736
-> chuỗi q dừng
Chọn biến r -> view/Unit root test, chọn level, intercept -> có bảng:
Null Hypothesis: R has a unit root
Exogenous: Constant
Lag Length: 0 (Automatic based on SIC, MAXLAG=7)
t-Statistic
Prob.*
Augmented Dickey-Fuller test statistic
-4.342457
0.0019
Test critical values:
1% level
-3.670170
5% level
-2.963972
10% level
-2.621007
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation
Dependent Variable: D(R)
Method: Least Squares
Date: 05/22/09 Time: 14:59
Sample (adjusted): 1979 2008
Included observations: 30 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
R(-1)
-0.758234
0.174610
-4.342457
0.0002
C
75.77033
20.14129
3.761940
0.0008
R-squared
0.402436
Mean dependent var
-2.990000
Adjusted R-squared
0.381095
S.D. dependent var
60.97856
S.E. of regression
47.97216
Akaike info criterion
10.64346
Sum squared resid
64437.18
Schwarz criterion
10.73687
Log likelihood
-157.6519
Hannan-Quinn criter.
10.67334
F-statistic
18.85693
Durbin-Watson stat
1.941030
Prob(F-statistic)
0.000167
chuỗi r dừngNếu là chuỗi không dừng thì sẽ có trung bình và phương sai thay đổi thời gian -> không dự báo chính xác được -> nếu là chuỗi dừng thì nên chuyển sang dạng sai phân bậc 1 vì thông thường 1 chuỗi thời gian là không dừng thì sai phân bậc 1 có thể sẽ là một chuỗi dừng (có trung bình và phương sai không đổi theo thời gian) -> dự báo chính xác hơn.
ls q c p f r
có bảng:
Dependent Variable: Q
Method: Least Squares
Date: 05/22/09 Time: 15:04
Sample (adjusted): 1979 2008
Included observations: 30 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-11.59809
14.96435
-0.775048
0.4453
P
0.316229
0.087615
3.609282
0.0013
F
0.061583
0.080990
0.760379
0.4539
R
0.058138
0.008069
7.205443
0.0000
R-squared
0.705547
Mean dependent var
34.22000
Adjusted R-squared
0.671571
S.D. dependent var
3.647238
S.E. of regression
2.090185
Akaike info criterion
4.435948
Sum squared resid
113.5907
Schwarz criterion
4.622774
Log likelihood
-62.53922
Hannan-Quinn criter.
4.495715
F-statistic
20.76641
Durbin-Watson stat
1.805563
Prob(F-statistic)
0.000000
Do d=1.8 -> không có tự tương quan bậc 1
Ta kiểm tra xem có tự tương quan bặc cao hay không:
Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
0.092111
Prob. F(2,24)
0.9123
Obs*R-squared
0.228522
Prob. Chi-Square(2)
0.8920
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/22/09 Time: 16:25
Sample: 1979 2008
Included observations: 30
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.719567
16.31420
-0.105403
0.9169
P
0.012067
0.098153
0.122941
0.9032
F
0.004056
0.084654
0.047917
0.9622
R
3.77E-05
0.008387
0.004492
0.9965
RESID(-1)
0.038320
0.207442
0.184724
0.8550
RESID(-2)
-0.085404
0.221688
-0.385242
0.7035
R-squared
0.007617
Mean dependent var
-1.14E-14
Adjusted R-squared
-0.199129
S.D. dependent var
1.979121
S.E. of regression
2.167231
Akaike info criterion
4.561634
Sum squared resid
112.7254
Schwarz criterion
4.841874
Log likelihood
-62.42452
Hannan-Quinn criter.
4.651285
F-statistic
0.036844
Durbin-Watson stat
1.885074
Prob(F-statistic)
0.999170
Vì Prob.Square(2) = 0.8920 lớn -> không có tự tương quan bậc cao
c) ls log(q) c log(p) log(f) log(r) -> có bảng :
Dependent Variable: LOG(Q)
Method: Least Squares
Date: 05/22/09 Time: 16:33
Sample (adjusted): 1979 2008
Included observations: 30 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.371261
1.866532
-0.734657
0.4691
LOG(P)
0.840709
0.249391
3.371041
0.0024
LOG(F)
0.070237
0.237214
0.296089
0.7695
LOG(R)
0.147023
0.017684
8.313880
0.0000
R-squared
0.760499
Mean dependent var
3.527108
Adjusted R-squared
0.732864
S.D. dependent var
0.109691
S.E. of regression
0.056694
Akaike info criterion
-2.778730
Sum squared resid
0.083570
Schwarz criterion
-2.591903
Log likelihood
45.68094
Hannan-Quinn criter.
-2.718962
F-statistic
27.51971
Durbin-Watson stat
1.966064
Prob(F-statistic)
0.000000
d=1.966 -> không có tự tương quan bậc 1
Ta kiểm tra xem có tự tương quan bậc cao không
Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
0.078943
Prob. F(2,24)
0.9243
Obs*R-squared
0.196069
Prob. Chi-Square(2)
0.9066
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 05/22/09 Time: 16:36
Sample: 1979 2008
Included observations: 30
Presample missing value lagged residuals set to zero.
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.190791
2.001083
-0.095344
0.9248
LOG(P)
0.033717
0.273249
0.123393
0.9028
LOG(F)
0.007515
0.247028
0.030423
0.9760
LOG(R)
-0.000363
0.018370
-0.019766
0.9844
RESID(-1)
-0.041848
0.206665
-0.202493
0.8412
RESID(-2)
-0.077912
0.218444
-0.356668
0.7245
R-squared
0.006536
Mean dependent var
-6.98E-16
Adjusted R-squared
-0.200436
S.D. dependent var
0.053682
S.E. of regression
0.058816
Akaike info criterion
-2.651953
Sum squared resid
0.083023
Schwarz criterion
-2.371714
Log likelihood
45.77930
Hannan-Quinn criter.
-2.562302
F-statistic
0.031577
Durbin-Watson stat
1.878904
Prob(F-statistic)
0.999429
Vì Prob.Square(2) = 0.9066 lớn -> không có tự tương quan bậc cao
Các file đính kèm theo tài liệu này:
- _eco_assignment_8807.doc