Bài tập về Giải tích

Tài liệu Bài tập về Giải tích: BAI TAP CA NHAN I.ASSIGNMENT 1: Bài 1: Anh/Chị hãy vào trang web: thu thập số liệu theo tháng của chỉ số giá chứng khoán VN Index (VNI) và giá của cổ phiếu của Công ty Chứng khoán Sài Gòn (SSI), và thực hiện các yêu cầu sau đây: lưu số liệu vừa thu thập về dưới dạng tập tin Excel với tên : data1.xls Chuyển hai chuỗi dữ liệu đó qua tập tin Eviews với tên biến là VNI và SSI? click chuột phải vào data1.xls chọn Open with/Eviews trong hộp thoại Spreadsheet Read: bước 1: chọn Custom range sau đó điều chỉnh tới cột cần đặt tên /Next bước 2: lần lượt nhập tên cho 2 cột là VNI và SSI /Finish Vẽ hai biến VNI và SSI trên cùng một đồ thị? từ cửa sổ tập tin, chọn Quick/Graph trong Series list, nhập tên biến vào (biến nào ở trục hoành gõ trước): vni ssi /OK nếu chọn Type: là Line & Symbol và Axis/Scale : #2 SSI là Right /OK thì ta có đồ thị sau Tính suất sinh lợi của thị trường (Rm) và hãy vẽ trên cùng đồ thị hai biến VNI và Rm? Lưu ý, Rm có thể được tính như sau Rm = (VNIt – VNIt...

doc51 trang | Chia sẻ: hunglv | Lượt xem: 1948 | Lượt tải: 0download
Bạn đang xem trước 20 trang mẫu tài liệu Bài tập về Giải tích, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
BAI TAP CA NHAN I.ASSIGNMENT 1: Bài 1: Anh/Chị hãy vào trang web: thu thập số liệu theo tháng của chỉ số giá chứng khoán VN Index (VNI) và giá của cổ phiếu của Công ty Chứng khoán Sài Gòn (SSI), và thực hiện các yêu cầu sau đây: lưu số liệu vừa thu thập về dưới dạng tập tin Excel với tên : data1.xls Chuyển hai chuỗi dữ liệu đó qua tập tin Eviews với tên biến là VNI và SSI? click chuột phải vào data1.xls chọn Open with/Eviews trong hộp thoại Spreadsheet Read: bước 1: chọn Custom range sau đó điều chỉnh tới cột cần đặt tên /Next bước 2: lần lượt nhập tên cho 2 cột là VNI và SSI /Finish Vẽ hai biến VNI và SSI trên cùng một đồ thị? từ cửa sổ tập tin, chọn Quick/Graph trong Series list, nhập tên biến vào (biến nào ở trục hoành gõ trước): vni ssi /OK nếu chọn Type: là Line & Symbol và Axis/Scale : #2 SSI là Right /OK thì ta có đồ thị sau Tính suất sinh lợi của thị trường (Rm) và hãy vẽ trên cùng đồ thị hai biến VNI và Rm? Lưu ý, Rm có thể được tính như sau Rm = (VNIt – VNIt-1)/VNIt-1 hoặc Rm = ln(VNIt/VNIt-1). Trong Eviews, hàm ln được sử dụng là log. trên màn hình lệnh của Eviews nhập : genr rm=log(vni/vni(-1)) sau đó, tương tự câu b, chọn Quick/Graph, rồi nhập tên biến : vni rm /OK chọn Type: Line & Symbol và Axis/Scale cho Rm là Right /OK, ta có đồ thị sau Vẽ đồ thị tần suất kèm thống kê mô tả biến SSI? Giải thích ý nghĩa của các thống kê trong bảng kết quả? chọn Quick/Series Statistics/Histogram and Stats trong Series name, nhập tên biến : ssi /OK , có đồ thị sau Ý nghĩa của các thống kê trong bảng kết quả : Series : biến Sample : mẫu quan sát Observations : số quan sát Mean : giá trị trung bình Median: trung vị Maximum: giá trị lớn nhất Minimum: giá trị nhỏ nhất Std.Dev. : độ lệch chuẩn Skewness : độ nghiêng Kurtosis : độ nhọn Jarque-Bera: thống kê JB, càng nhỏ thì biến càng “dễ” có phân phối chuẩn Probability: xác suất tương ứng của JB, càng nhỏ thì khả năng bác bỏ giả thiết Ho càng cao (giả thiết Ho mặc định là : biến có pp chuẩn), ở đây có kết quả 0.273222 (rất nhỏ) tức là biến không có phân phối chuẩn Vẽ trên cùng đồ thị VNI và VNI trễ một giai đoạn? chọn Quick/Graph nhập tên biến : vni vni(-1) /OK , có đồ thị sau Vẽ giản đồ tự tương quan của VNI với độ trễ được chọn là 5. Anh/Chị hãy giải thích và nêu ý nghĩa các hệ số AC và PAC? chọn Quick/Series Statistics/Correlogram trong Series name, nhập tên biến : vni(-5) /OK trong Correlogram Specification, chọn Level /OK, có giản đồ tương quan sau Ý nghĩa các hệ số AC và PAC : AC (Autocorrelation Coefficient): hệ số tự tương quan à xác định chuỗi thời gian dừng hay không : là “dừng” khi AC đầu tiên ¹0 nhưng các AC tiếp theo =0 một cách có ý nghĩa thống kê là “không dừng” khi một số AC ¹0 một cách có ý nghĩa thống kê PAC (Partial Autocorrelation Coefficient): hệ số tự tương quan riêngà xác định mô hình ARIMA thích hợp Vẽ giản đồ tự tương quan sai phân bậc nhất của VNI với độ trễ được chọn là 5. Anh/Chị có nhận xét gì giữa kết quả câu (g) và câu (f)? chọn Quick/Series Statistics/Correlogram trong Series name, nhập tên biến : d(vni,5) /OK trong Correlogram Specification, chọn Level /OK, có giản đồ tương quan sau Nhận xét kết quả câu g và f : ở câu g là chuỗi thời gian không dừng vì: các hệ số AC đầu rất cao và về sau giảm dần =0 theo độ trễ ở câu f là chuỗi thời gian dừng vì: các hệ số AC đầu ¹0 nhưng tiếp theo sẽ =0 Bài 2: Sử dụng tập tin hhexpe06.dta (tập tin Stata), chuyển sang tập tin Eviews và thực hiện các yêu cầu sau đây: click chuột phải vào hhexpe06.dta chọn Open with/Eviews xuất hiện hộp thoại Table read specification: chọn các biến cần thiết theo yêu cầu của đề bài để chuyển sang Eviews (mặc định là chọn hết) /OK Vẽ đồ thị tần suất các biến chi tiêu lúa gạo, chi tiêu phi lương thực, chi tiêu giáo dục, chi tiêu sức khỏe, chi tiêu nước uống, chi tiêu điện sinh hoạt và qui mô hộ gia đình Việt Nam năm 2006? mở cùng lúc các biến riceexp, nonfdx_1, educex_1, hlthex_1, waterexp, elecexp, hhsize bằng cách : giữ phím Ctrl khi chọn biến rồi click chuột phải chọn Open/as Group để mở biến từ cửa sổ vừa mở, chọn View/Graph… trong Graph Options : chọn Type là Distribution /OK, ta có đồ thị tần suất như sau Lập bảng giá trị trung bình của các biến trên theo 5 nhóm thu nhập khác nhau? Anh/Chị rút ra được nhận xét gì? double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau chọn View/Descriptive Statistics & Tests/Stats by Classification… xuất hiện hộp thoại Statistics By Classification : trong Statistics : click chọn Mean trong Series/Group for classify : nhập biến thu nhập (ko tìm thấy???) /OK, ta có kết quả như sau Nhận xét: Lập bảng giá trị trung bình của các biến trên theo 8 vùng địa lý khác nhau ở Việt Nam? Anh/Chị rút ra được nhận xét gì? double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau chọn View/Descriptive Statistics & Tests/Stats by Classification… xuất hiện hộp thoại Statistics By Classification : trong Statistics : click chọn Mean trong Series/Group for classify : nhập Reg8 (biến vùng địa lý) /OK, ta có các kết quả như sau Nhận xét ở Việt Nam năm 2006: Chi tiêu lúa gạo trung bình: cao nhất ở vùng 7 (1970.702), thấp nhất ở vùng 1 (663.8771) Chi tiêu phi lương thực trung bình: cao nhất ở vùng 7 (9690.978), thấp nhất ở vùng 3 (3196.382) Chi tiêu giáo dục trung bình: cao nhất ở vùng 7 (2003.274), thấp nhất ở vùng 3 (675.6620) Chi tiêu sức khỏe trung bình: cao nhất ở vùng 7 (1986.412), thấp nhất ở vùng 3 (658.8135) Chi tiêu nước uống trung bình: cao nhất ở vùng 7 (236.9655), thấp nhất ở vùng 3 (40.83916) Chi tiêu điện sinh hoạt trung bình: cao nhất ở vùng 7 (1182.311), thấp nhất ở vùng 3 (250.9021) Qui mô hộ gia đình trung bình: cao nhất ở vùng 3 (6 người/hộ), thấp nhất ở vùng 1 (4 người/hộ) àVùng 7: có chi tiêu TB cao nhất => vùng đồng bằng Nam Bộ (mức sống cao) àVùng 3: mức chi tiêu TB thấp + qui mô hộ gia đình TB cao nhất => vùng duyên hải miền Trung (nghèo, đông con) àVùng 1: chi tiêu TB lúa gạo và qui mô hộ gia đình TB thấp nhất => vùng núi caoTây Nguyên (thiếu lương thực, dân tộc thiểu số) Lập bảng so sánh giá trị trung bình các biến trên theo hai khu vực thành thị và nông thôn? Anh/Chị rút ra được nhận xét gì? double click mở từng biến, ở cửa sổ mỗi biến ta làm như nhau chọn View/Descriptive Statistics & Tests/Stats by Classification… xuất hiện hộp thoại Statistics By Classification : trong Statistics : click chọn Mean trong Series/Group for classify : nhập Urban06 (biến khu vực) /OK, ta có kết quả như sau Nhận xét : trung bình về chi tiêu lúa gạo, chi tiêu phi lương thực, chi tiêu giáo dục, chi tiêu sức khỏe, chi tiêu nước uống, chi tiêu điện sinh hoạt : ở thành thị (URBAN) đều cao hơn nông thôn trung bình về qui mô hộ gia đình Việt Nam năm 2006: ở nông thôn (4.301) cao hơn thành thị (4.104) à thành thị có mức sống cao hơn nông thôn à nông thôn chưa thực hiện kế hoạch hóa gia đình bằng thành thị Anh/Chị hãy kiểm định xem có sự khác biệt về chi tiêu giáo dục trung bình giữa thành thị và nông thôn hay không? mở biến educex_1 chọn View/Descriptive Statistics & Tests/Equality Tests by Classification… xuất hiện hộp thoại Tests By Classification: trong Series/Group for classify: nhập URBAN06 trong Test equality of: chọn Mean ( kiểm định trung bình ) /OK, có kết quả sau à Giá trị ANOVA F-test có Probability thấp bằng 0.0000 (mà p-value càng thấp thì khả năng bác bỏ H0 càng cao) do đó ta bác bỏ H0 (H0: trung bình chi tiêu giáo dục ở thành thị và nông thôn là bằng nhau) à có sự khác biệt về chi tiêu giáo dục trung bình giữa thành thị và nông thôn Bài 3: Anh/Chị hãy chọn và phân tích một vấn đề về năng lực cạnh tranh cấp tỉnh ở Việt Nam mà mình quan tâm. Để hỗ trợ bài tập này, Anh/Chị nên sử dụng tập tin PCI.xls của các năm 2006, 2007, và 2008 (và các báo cáo tổng hợp liên quan). Bài 4: Cho X ~ N(8,25) è μ = 8 , σ = 5 Yêu cầu: Vẽ phát họa đồ thị cho từng trường hợp. Tính P(X > 8.6) Có Z = = 0.12 với Z ~ N( 0,1 ) è P( X > 8.6 ) = P( Z > 0.12 ) = 1 - P( Z < 0.12 ) = 1 - 0.5478 = 0.4522 Tính P( Z < 0.12 ) bằng Excel, sử dụng hàm : = NORMDIST ( 0.12 , 0 , 1 , true ) = 0.547758426 Tính P(8 < X < 8.6) Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên : è P( 8 8.6 ) = 0.5 - 0.4522 = 0.0478 Tính P(X < 7.4) Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên : è P( X 8.6 ) = 0.4522 Tính P(7.4 < X < 8.6) Vì μ=8 và phân phối của X là pp chuẩn ( pp chuẩn đối xứng quanh giá trị μ ) nên : è P( 7.4 < X < 8.6 ) = 2 * P( 8 < X < 8.6 ) = 2 * 0.0478 = 0.0956 Bài 5: Từ một mẫu 25 quan sát, người ta tính được giá trị trung bình là 172.5 và độ lệch chuẩn là 15.4. Giả sử có giả thiết sau đây: è N = 25 , μ = 172.5 , σ = 15.4 H0: m = 168 H1: m ¹ 168 Yêu cầu: Vẽ phát họa đồ thị cho từng trường hợp. Xác định loại thống kê kiểm định phù hợp? Loại KIỂM ĐỊNH TRUNG BÌNH ( với X có phân phối chuẩn ) : - là thống kê t : với giả thiết H0, có phân phối t với số bậc tự do là N-1 ( nếu không biết σ của X ) - là thống kê z : với giả thiết H0, có phân phối chuẩn hóa ( nếu biết σ của X ) Ở đây do ta đã biết σ = 15.4 , nên thuộc loại thống kê z có phân phối chuẩn hóa Kiểm định giả thiết trên với mức ý nghĩa lần lượt như sau: a = 1%, 5%, 10%, và 15%? Anh/Chị cho biết khi a thay đổi thì quyết định chấp nhận hay bác bỏ giả thiết H0 sẽ thay đổi như thế nào? Mở biến Chọn View/ Descriptive Statistics & Tests/ Simple Hypothesis Tests Xuất hiện hộp thoại Series Distribution Tests : Trong Test value: nhập vào “MEAN” là 168 Trong Mean test assumption: nhập vào “ENTER s.d. if known” là 24 ( do = N-1 = 25 -1) /OK Khi a càng tăng thì càng “dễ” chấp nhận giả thiết Ho II. ASSIGNMENT 2: Bài 2: Từ dữ liệu của Assignment 1 Ước lượng mô hình CAPM có dạng: log(SSI/SSI(-1)) c log(VNI/VNI(-1)) : Chọn 2 biến ssi và vni à Quick/Estimation Equation à nhập log(SSI/SSI(-1)) c log(VNI/VNI(-1)) Dependent Variable: LOG(SSI/SSI(-1)) Method: Least Squares Date: 04/11/09 Time: 12:29 Sample (adjusted): 2 22 Included observations: 21 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   C -0.010652 0.006188 -1.721389 0.1014 LOG(VNI/VNI(-1)) 0.878655 0.404512 2.172137 0.0427 R-squared 0.198927     Mean dependent var -0.012801 Adjusted R-squared 0.156765     S.D. dependent var 0.030483 S.E. of regression 0.027992 Akaike info criterion -4.223392 Sum squared resid 0.014888     Schwarz criterion -4.123913 Log likelihood 46.34561     Hannan-Quinn criter. -4.201802 F-statistic 4.718180     Durbin-Watson stat 1.670739 Prob(F-statistic) 0.042709 Vẽ trên cùng đồ thị các biến suất sinh lợi thực tế, suất sinh lợi ước lượng và phần dư của mô hình trên : Tiếp tục trong cửa sổ Estimation Equation trên, chọn View/Actual, Fitted, Residual/ Actual, Fitted, Residual Graph. Xây dựng khoảng tin cậy 95% cho B2: Trên dòng lệnh, nhập: scalar b2_cd=c(2)-@qtdist(0.975,20)*@stderrs(2) à giá trị chặn dưới. scalar b2_ct=c(2)-@qtdist(0.975,20)*@stderrs(2 à giá trị chặn trên. So sánh b2 với 2 giá trị trên, nếu b2_cd<b2<b2_ct à chấp nhận H0: b2 có ý nghĩa thống kê. Kiểm định giả thiết cho rằng Hệ số Beta của công ty chứng khoán Sài Gòn =1 Tình hệ số tương quan giữa suất sinh lợi thị trường và suất sinh lợi của cổ phiếu SSI: Nhập lệnh Genr rim=@cor(ri,rm) hoặc mở biến ri và rm as groupàQuick/Group Statistics/Correlation Với rm=log(vni/vni(-1)) và ri=log(ssi/ssi(-1)). RI RM RI 1 0.4460120397302639 RM 0.4460120397302639 1 Ước tính hệ số Beta điều chỉnh cho cổ phiếu SSI: Genr beta_adjusted=c(2)/@cor(ri,rm). Giả sử suất sinh lợi phi rủi ro của Việt Nam là 9.6% và phần bù rủi ro thị trường là 5.5%, ước tính suất sinh lợi kỳ vọng cho cổ phiếu SSI: RSSI,VNI = 9,6% + beta*5,5%. Bài 3: III. ASSIGNMENT3: Bài 1: Nhấp đúp vào biến y -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “X2” ở Series/ group for classify -> ta có bảng sau: Descriptive Statistics for Y Categorized by values of X2 Date: 05/20/09 Time: 22:31 Sample: 1 30 Included observations: 30 X2  Mean  Std. Dev.  Obs. [0, 20) 42.57143 9.501880 7 [20, 40) 56.28571 10.45170 7 [40, 60) 56.33333 5.316641 6 [60, 80) 59.00000 5.049752 5 [80, 100) 66.80000 8.642916 5 All 55.30000 11.16692 30 Nhận xét: doanh số bán hàng tăng theo điểm về kỹ năng bán hàng. Mô hình dự báo: chưa học! Hồi quy: Ở màn hình lệnh: ls y c x2 x3 x4 x5 x6, ta có bảng sau: Dependent Variable: Y Method: Least Squares Date: 05/20/09 Time: 22:39 Sample: 1 30 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob.   C -90.62915 17.84109 -5.079799 0.0000 X2 0.202915 0.028221 7.190144 0.0000 X3 6.154295 0.921462 6.678840 0.0000 X4 0.112319 0.503071 0.223266 0.8252 X5 -0.013198 0.785811 -0.016796 0.9867 X6 -0.586477 1.762090 -0.332830 0.7422 R-squared 0.895539     Mean dependent var 55.30000 Adjusted R-squared 0.873776     S.D. dependent var 11.16692 S.E. of regression 3.967380     Akaike info criterion 5.770945 Sum squared resid 377.7625     Schwarz criterion 6.051185 Log likelihood -80.56418     Hannan-Quinn criter. 5.860596 F-statistic 41.15014     Durbin-Watson stat 1.895046 Prob(F-statistic) 0.000000 Các hệ số b4,b5,b6 không có ý nghĩa thống kê. Hệ số b2, b3 có ý nghĩa thống kê và có dấu đúng với kỳ vọng. Vì: b2 >0 : điểm về kỹ năng bán hàng càng cao thì doanh số bán hàng cũng tăng theo. b3 >0 : nhân viên càng hăng hái trong công việc thì doanh số bán hàng càng tăng. Ước lượng mô hình dự báo: chưa học! Bài 2: Chọn các biến y,b2,b3,b4,b5,b6,b7,b8 -> nhấp chuột phải, Open/as group -> vào view/ Descriptive stats/common sample X2 X3 X4 X5 X6 X7 X8 Y  Mean  22.36898  172.5951  31.74383  1723.560  255.0064  39.85211  47.95525  2266.132  Median  9.025000  26.62300  17.88800  342.2877  33.20000  20.55600  24.61515  472.0812  Maximum  207.7000  4186.930  348.1426  45999.01  4485.195  423.2698  785.0718  60334.51  Minimum  0.442000  1.066000  0.429000  2.398000  1.011100  0.267000  0.750000  6.803000  Std. Dev.  30.58231  438.6564  39.58890  4488.490  573.7774  55.84726  86.40719  5799.043  Skewness  2.638699  5.133975  3.290828  5.794956  3.859590  3.502381  5.336685  5.944537  Kurtosis  11.73742  36.88443  20.81731  45.86810  21.32879  19.38885  38.88011  48.11877  Jarque-Bera  1146.128  13789.44  3968.524  21692.00  4350.833  3494.271  15414.33  23947.59  Probability  0.000000  0.000000  0.000000  0.000000  0.000000  0.000000  0.000000  0.000000  Sum  5905.412  45565.10  8380.372  455020.0  67321.69  10520.96  12660.19  598258.9  Sum Sq. Dev.  245978.0  50606322  412194.9  5.30E+09  86584999  820275.1  1963611.  8.84E+09  Observations  264  264  264  264  264  264  264  264 b) Chọn các biến y,b2,b3,b4,b5,b6,b7,b8 -> View/ Group statistics/ Correlations X2 X3 X4 X5 X6 X7 X8 Y X2  1.000000  0.573045  0.260664  0.581816  0.606916  0.208016  0.210286  0.602849 X3  0.573045  1.000000  0.122734  0.905251  0.627895  0.023502  0.262369  0.932005 X4  0.260664  0.122734  1.000000  0.083741  0.123914  0.456082  0.079123  0.105862 X5  0.581816  0.905251  0.083741  1.000000  0.624455  0.020705  0.196601  0.987976 X6  0.606916  0.627895  0.123914  0.624455  1.000000  0.043653  0.253913  0.618947 X7  0.208016  0.023502  0.456082  0.020705  0.043653  1.000000  0.013897  0.052856 X8  0.210286  0.262369  0.079123  0.196601  0.253913  0.013897  1.000000  0.215714 Y  0.602849  0.932005  0.105862  0.987976  0.618947  0.052856  0.215714  1.000000 Nhận xét: các hệ số tương quan giữa các biến thấp -> không có đa cộng tuyến (chưa chắc lắm!) Các biến giải thích có hệ số tương quan với y lớn hơn 0.7 là X3, X5 Vẽ đồ thị phân tán giữa X3 với Y: Quick/Graph/ nhập x3 y/ (Type) chọn Scatter/ (Fit lines) chọn Regression line (-> tạo đường hồi quy) Nhận xét : đây là mô hình phù hợp vì các giá trị phân tán quanh đường hồi quy. Vẽ đồ thị phân tán giữa X5 với Y: (tương tự với X3) Nhận xét : đây là mô hình phù hợp vì các giá trị phân tán quanh đường hồi quy. d) Nhấp đúp vào biến y -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “X3 X2” ở Series/ group for classify -> ta có bảng sau: Descriptive Statistics for Y Categorized by values of X3 and X2 Date: 05/21/09 Time: 00:22 Sample: 1 266 Included observations: 265  Mean  Std. Dev. X2  Obs. [0, 50) [50, 100) [100, 150) [150, 200) [200, 250) All [0, 1000) 1032.968 2383.734 6163.426 11049.50 NA 1246.357 1575.080 2188.790 5477.006 NA NA 1917.238 227 21 3 1 0 252 [1000, 2000) 14698.14 16465.63 29127.00 9254.117 34736.00 17979.29 6131.026 9293.366 NA NA NA 9514.644 4 4 1 1 1 11 X3 [2000, 3000) NA 28085.00 NA NA NA 28085.00 NA NA NA NA NA NA 0 1 0 0 0 1 [4000, 5000) NA NA 60334.51 NA NA 60334.51 NA NA NA NA NA NA 0 0 1 0 0 1 All 1269.594 5538.690 21590.36 10151.81 34736.00 2265.183 2473.740 7873.685 24144.75 1269.527 NA 5788.070 231 26 5 2 1 265 Nhận xét: - Cùng khoảng giá trị của X3 (chi tiêu vốn hữu hình) thì giá trị trung bình của Y tăng theo X2 (tổng số lao động) - Cùng khoảng giá trị của X2 (tổng số lao động) thì giá trị trung bình của Y tăng theo X3 (chi tiêu vốn lao động). Chiến lược chọn mô hình: từ tổng quát (general) đến giản đơn (simple): B1: hồi quy Y theo tất cả các biến: Dependent Variable: Y Method: Least Squares Date: 05/21/09 Time: 00:32 Sample: 1 266 Included observations: 264 Variable Coefficient Std. Error t-Statistic Prob.   C -155.3579 64.48403 -2.409246 0.0167 X2 6.102751 1.971835 3.094961 0.0022 X3 2.771448 0.241587 11.47185 0.0000 X4 -0.620636 1.258533 -0.493142 0.6223 X5 1.032169 0.023537 43.85339 0.0000 X6 -0.334775 0.106573 -3.141288 0.0019 X7 2.907275 0.882797 3.293253 0.0011 X8 0.351253 0.527540 0.665832 0.5061 R-squared 0.985744     Mean dependent var 2266.132 Adjusted R-squared 0.985355     S.D. dependent var 5799.043 S.E. of regression 701.7919     Akaike info criterion 15.97499 Sum squared resid 1.26E+08     Schwarz criterion 16.08335 Log likelihood -2100.698     Hannan-Quinn criter. 16.01853 F-statistic 2528.820     Durbin-Watson stat 1.955415 Prob(F-statistic) 0.000000 -> các hệ số b4,b8 không có ý nghĩa thống kê. B2: Kiểm định Wald test (kiểm định giả thiết đồng thời: có phải cả 2 biến này X4,X8 đồng thời không ảnh hưởng lên doanh số hay không) -> từ kết quả hồi quy-> view/Coefficient Tests/ Wald-Coefficient Restrictions/ gõ C(4)=C(8)=0 (Ho), ta có bảng: Wald Test: Equation: Untitled Test Statistic Value   df     Probability F-statistic 0.334088 (2, 256)   0.7163 Chi-square 0.668175 2   0.7160 Null Hypothesis Summary: Normalized Restriction (= 0) Value   Std. Err. C(4) -0.620636 1.258533 C(8) 0.351253 0.527540 Restrictions are linear in coefficients. -> p-value của F-statistic lớn (0.7163)-> chấp nhận Ho (cả x4,x8 đồng thời không ảnh hưởng đến Y) B3: hồi quy Y theo x2,x3,x5,x6,x7 Dependent Variable: Y Method: Least Squares Date: 05/21/09 Time: 00:45 Sample: 1 266 Included observations: 265 Variable Coefficient Std. Error t-Statistic Prob.   C -149.1473 59.07772 -2.524596 0.0122 X2 6.068047 1.947646 3.115580 0.0020 X3 2.783337 0.237022 11.74293 0.0000 X5 1.030859 0.023233 44.37082 0.0000 X6 -0.320920 0.105859 -3.031572 0.0027 X7 2.718822 0.800158 3.397854 0.0008 R-squared 0.985573     Mean dependent var 2265.183 Adjusted R-squared 0.985295     S.D. dependent var 5788.070 S.E. of regression 701.8891     Akaike info criterion 15.96781 Sum squared resid 1.28E+08     Schwarz criterion 16.04886 Log likelihood -2109.735     Hannan-Quinn criter. 16.00037 F-statistic 3538.779     Durbin-Watson stat 1.951116 Prob(F-statistic) 0.000000 -> Mô hình hồi quy phù hợp: Y= -149.15 + 6.07x2 + 2.78x3 + 1.03x5 – 0.32x6 + 2.72x7 Kiểm định các hệ số hồi quy: Các hệ số b1,b2,b3,b5,b6,b7 đều có ý nghĩa kinh tế ở mức 5% vì p-value của chúng đều nhỏ hơn 0.05 (bác bỏ Ho, Ho = các hệ số không có ý nghĩa thống kê) Ý nghĩa kinh tế: b1= -149.15 : hệ số cắt b2= 6.07 : nếu các biến giải thích khác không đổi, nếu tổng số lao động (x2) tăng thêm 1 ngàn người thì doanh thu (Y) sẽ tăng thêm 6.07 triệu đôla. Các hệ số khác giải thích tương tự. Việc sử dụng các hệ số hồi quy trong việc tư vấn lập ngân sách vốn đầu tư cho các doanh nghiệp trong tương lai: vì các hệ số b4,b8 không có ý nghĩa thống kê (có nghĩa các biến x4,x8 không ảnh hưởng đến doanh số) -> cắt bỏ chi phí vốn vô hình (x4) và chi phí nghiên cứu & phát triển (x8). Vì b6 các doanh nghiệp nên cắt giảm dần chi phí quản lý (x6) Vì b2>b3>b7>b5>0 -> các doanh nghiệp nên tập trung nâng cao tổng số lao động (x2), ưu tiên đầu tư vào chi tiêu vốn hữu hình (x3), sau đó là chi phí quảng cáo & bán hàng (x7), cuối cùng là giá vốn hàng bán (x5). Bài 3: Chọn các biến (12 biến) -> nhấp chuột phải, Open/as group -> vào view/ Descriptive stats/common sample AGE VALUE TENURE SALES SALARY PROFIT PROF OTHERCOM EXPER EDU COMPENS BONUS  Mean  57.66000  62.31600  23.50000  4075.680  920.1200  117.4000  5.220000  43.76000  10.38000  1.520000  1186.080  222.2000  Median  59.00000  4.050000  26.00000  2251.000  691.0000  80.00000  5.000000  33.00000  8.000000  2.000000  818.0000  106.0000  Maximum  71.00000  1689.000  46.00000  21351.00  3396.000  1166.000  9.000000  143.0000  34.00000  2.000000  4039.000  1487.000  Minimum  45.00000  0.100000  2.000000  415.0000  128.0000 -1086.000  1.000000  0.000000  1.000000  0.000000  357.0000  0.000000  Std. Dev.  5.571831  249.3224  12.69782  4552.241  697.6053  328.1078  2.589539  38.43604  8.966810  0.614120  833.5558  322.0034  Skewness -0.270224  5.862292 -0.299182  1.882641  1.563738  0.016030 -0.180923  0.726974  0.961647 -0.877554  1.420794  2.537563  Kurtosis  2.532195  38.00932  1.947630  6.159773  5.379005  7.520569  1.899494  2.548356  2.904372  2.762636  4.758896  9.913458  Jarque-Bera  1.064427  2839.830  3.053171  50.33649  32.16827  42.57620  2.795929  4.829053  7.725424  6.534884  23.26737  153.2350  Probability  0.587304  0.000000  0.217276  0.000000  0.000000  0.000000  0.247099  0.089410  0.021011  0.038104  0.000009  0.000000  Sum  2883.000  3115.800  1175.000  203784.0  46006.00  5870.000  261.0000  2188.000  519.0000  76.00000  59304.00  11110.00  Sum Sq. Dev.  1521.220  3045922.  7900.500  1.02E+09  23846003  5275082.  328.5800  72389.12  3939.780  18.48000  34045946  5080622.  Observations  50  50  50  50  50  50  50  50  50  50  50  50 Nhận xét: ??? b) Nhấp đúp vào biến compens -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “edu” ở Series/ group for classify -> ta có bảng sau: Descriptive Statistics for COMPENS Categorized by values of EDU Date: 05/22/09 Time: 16:40 Sample: 1 50 Included observations: 50 EDU  Mean  Std. Dev.  Obs. 0 2168.667 1432.994 3 1 1542.222 908.4585 18 2 863.3793 524.7285 29 All 1186.080 833.5558 50 Nhận xét: tổng tiền lương trung bình của giám đốc dự án giảm dần theo trình độ học vấn. c) Nhấp đúp vào biến compens -> vào view/ Descriptive Statistic & Tests/ Stats by classification, gõ “prof” ở Series/ group for classify -> ta có bảng sau: Descriptive Statistics for COMPENS Categorized by values of PROF Date: 05/22/09 Time: 16:41 Sample: 1 50 Included observations: 50 PROF  Mean  Std. Dev.  Obs. 1 1250.286 782.2090 7 2 2027.000 NA 1 3 1439.500 903.1546 6 4 1011.667 742.8256 6 5 825.7143 647.6346 7 6 1018.667 450.1959 3 7 1440.889 1117.068 9 8 1061.400 563.8123 5 9 1117.833 1129.092 6 All 1186.080 833.5558 50 Nhận xét: tổng tiền lương trung bình của giám đốc dự án ở mức cao nếu tham gia từ 1->3 khóa, từ 4-> 9 khóa : ở mức trung bình chung Xác định mô hình hồi quy phù hợp: (không chắc chắn) ls salary c bonus othercom compens age edu prof tenure exper value profit sales có bảng kết quả hồi quy sau: Dependent Variable: SALARY Method: Least Squares Date: 05/21/09 Time: 02:05 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob.   C 1.41E-12 8.48E-13 1.668228 0.1035 BONUS -1.000000 2.74E-16 -3.65E+15 0.0000 OTHERCOM -1.000000 2.41E-15 -4.16E+14 0.0000 COMPENS 1.000000 1.27E-16 7.87E+15 0.0000 AGE -9.43E-15 1.38E-14 -0.683261 0.4986 EDU -6.18E-14 1.31E-13 -0.472206 0.6395 PROF -9.82E-14 2.48E-14 -3.960393 0.0003 TENURE 8.39E-16 6.15E-15 0.136488 0.8922 EXPER -5.10E-16 9.80E-15 -0.052002 0.9588 VALUE 1.21E-16 2.80E-16 0.431854 0.6683 PROFIT -2.36E-16 2.12E-16 -1.115079 0.2718 SALES 0.000000 1.57E-17 0.000000 1.0000 R-squared 1.000000     Mean dependent var 920.1200 Adjusted R-squared 1.000000     S.D. dependent var 697.6053 S.E. of regression 4.18E-13     Sum squared resid 6.64E-24 F-statistic 1.24E+31     Durbin-Watson stat 1.842031 Prob(F-statistic) 0.000000 -> các hệ số b5, b6, b8,b9,b10,b11,b12 không có ý nghĩa thống kê ở mức ý nghĩa 11% kiểm định Wald: từ kết quả hồi quy-> view/Coefficient Tests/ Wald-Coefficient Restrictions/ gõ c(5)=c(6)=c(8)=c(9)=c(10)=c(11)=c(12)=0 (giả thiết Ho), ta có bảng: Wald Test: Equation: Untitled Test Statistic Value   df     Probability F-statistic 0.303039 (7, 38)   0.9481 Chi-square 2.121275 7   0.9528 Null Hypothesis Summary: Normalized Restriction (= 0) Value   Std. Err. C(5) -9.43E-15 1.38E-14 C(6) -6.18E-14 1.31E-13 C(8) 8.39E-16 6.15E-15 C(9) -5.10E-16 9.80E-15 C(10) 1.21E-16 2.80E-16 C(11) -2.36E-16 2.12E-16 C(12) 0.000000 1.57E-17 Restrictions are linear in coefficients. p-value của F-statistic lớn (0.9481)-> chấp nhận Ho (cả age, edu, tenure, exper, value, profit, salé x8,x9,x10,x11,x12 đồng thời không ảnh hưởng đến Y) Hồi quy salary theo bonus, othercom, compens, prof: ls salary c bonus othercom compens prof Dependent Variable: SALARY Method: Least Squares Date: 05/21/09 Time: 10:25 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob.   C 7.72E-13 1.45E-13 5.305148 0.0000 BONUS -1.000000 2.00E-16 -5.00E+15 0.0000 OTHERCOM -1.000000 1.84E-15 -5.45E+14 0.0000 COMPENS 1.000000 8.75E-17 1.14E+16 0.0000 PROF -8.90E-14 2.06E-14 -4.322178 0.0001 R-squared 1.000000     Mean dependent var 920.1200 Adjusted R-squared 1.000000     S.D. dependent var 697.6053 S.E. of regression 3.72E-13     Sum squared resid 6.24E-24 F-statistic 4.30E+31     Durbin-Watson stat 1.807065 Prob(F-statistic) 0.000000 -> mô hình hôi quy: Salary = 7.72E-13 – bonus – othercom + compens – 8.90E-14 Các kiểm định cần thiết: Kiểm định phương sai thay đổi: B1: Vẽ đồ thị salary theo bonus: Quick/Graph/ bonus salary B2: ước lượng lại mô hình ls salary c bonus othercom compens prof Dependent Variable: SALARY Method: Least Squares Date: 05/21/09 Time: 10:25 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob.   C 7.72E-13 1.45E-13 5.305148 0.0000 BONUS -1.000000 2.00E-16 -5.00E+15 0.0000 OTHERCOM -1.000000 1.84E-15 -5.45E+14 0.0000 COMPENS 1.000000 8.75E-17 1.14E+16 0.0000 PROF -8.90E-14 2.06E-14 -4.322178 0.0001 R-squared 1.000000     Mean dependent var 920.1200 Adjusted R-squared 1.000000     S.D. dependent var 697.6053 S.E. of regression 3.72E-13     Sum squared resid 6.24E-24 F-statistic 4.30E+31     Durbin-Watson stat 1.807065 Prob(F-statistic) 0.000000 B3: Vẽ đồ thị phần dư theo giá trị ước lượng của salary Từ kết quả hồi quy, chọn View/Representative, rồi copy phương trình hồi quy, ra cửa sổ lệnh và ước lượng như sau: genr salaryhat= 7.71731845292e-13 - 1*BONUS - 1*OTHERCOM + 1*COMPENS - 8.90013815418e-14*PROF Vẽ đồ thị: Quick/Graph/ salaryhat resid có phương sai thay đổi B4: kiểm định thống kê Từ bảng kết quả hồi quy-> view/Residual Tests/ Heteroskedasticity Tests/ * nếu chọn Breusch-Pagan-Godfrey -> ta có bảng: Heteroskedasticity Test: Breusch-Pagan-Godfrey F-statistic 4.920500     Prob. F(4,45) 0.0022 Obs*R-squared 15.21443     Prob. Chi-Square(4) 0.0043 Scaled explained SS 23.41351     Prob. Chi-Square(4) 0.0001 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/21/09 Time: 10:56 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob.   C 4.29E-26 8.36E-26 0.513627 0.6100 BONUS -9.18E-29 1.15E-28 -0.799212 0.4284 OTHERCOM -2.83E-27 1.05E-27 -2.681876 0.0102 COMPENS 2.17E-28 5.03E-29 4.322641 0.0001 PROF -6.06E-27 1.18E-26 -0.512163 0.6110 R-squared 0.304289     Mean dependent var 1.25E-25 Adjusted R-squared 0.242448     S.D. dependent var 2.46E-25 S.E. of regression 2.14E-25     Sum squared resid 2.06E-48 F-statistic 4.920500     Durbin-Watson stat 2.394366 Prob(F-statistic) 0.002235 * nếu chọn Harvey -> ta có bảng : Heteroskedasticity Test: Harvey F-statistic 2.092208     Prob. F(4,45) 0.0976 Obs*R-squared 7.840561     Prob. Chi-Square(4) 0.0976 Scaled explained SS 5.869265     Prob. Chi-Square(4) 0.2091 Test Equation: Dependent Variable: LRESID2 Method: Least Squares Date: 05/21/09 Time: 11:01 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob.   C -57.35134 0.726762 -78.91346 0.0000 BONUS 0.000305 0.000999 0.304804 0.7619 OTHERCOM -0.011447 0.009172 -1.248043 0.2185 COMPENS 0.000462 0.000437 1.056523 0.2964 PROF -0.254434 0.102877 -2.473194 0.0172 R-squared 0.156811     Mean dependent var -58.56495 Adjusted R-squared 0.081861     S.D. dependent var 1.941512 S.E. of regression 1.860349     Akaike info criterion 4.174044 Sum squared resid 155.7404     Schwarz criterion 4.365247 Log likelihood -99.35111     Hannan-Quinn criter. 4.246855 F-statistic 2.092208     Durbin-Watson stat 1.975815 Prob(F-statistic) 0.097553 * nếu chọn Glejser -> ta có bảng: Heteroskedasticity Test: Glejser F-statistic 3.681065     Prob. F(4,45) 0.0112 Obs*R-squared 12.32687     Prob. Chi-Square(4) 0.0151 Scaled explained SS 12.27461     Prob. Chi-Square(4) 0.0154 Test Equation: Dependent Variable: ARESID Method: Least Squares Date: 05/21/09 Time: 11:02 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob.   C 3.28E-13 8.01E-14 4.093779 0.0002 BONUS -4.69E-17 1.10E-16 -0.426069 0.6721 OTHERCOM -1.98E-15 1.01E-15 -1.962031 0.0560 COMPENS 1.44E-16 4.82E-17 2.995479 0.0044 PROF -2.46E-14 1.13E-14 -2.172259 0.0351 R-squared 0.246537     Mean dependent var 2.73E-13 Adjusted R-squared 0.179563     S.D. dependent var 2.26E-13 S.E. of regression 2.05E-13     Sum squared resid 1.89E-24 F-statistic 3.681065     Durbin-Watson stat 2.093847 Prob(F-statistic) 0.011219 nếu chọn arch-> ta có bảng : Heteroskedasticity Test: ARCH F-statistic 0.058717     Prob. F(1,47) 0.8096 Obs*R-squared 0.061140     Prob. Chi-Square(1) 0.8047 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/21/09 Time: 11:05 Sample (adjusted): 2 50 Included observations: 49 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   C 1.28E-25 4.00E-26 3.201934 0.0024 RESID^2(-1) -0.035390 0.146048 -0.242317 0.8096 R-squared 0.001248     Mean dependent var 1.24E-25 Adjusted R-squared -0.020002     S.D. dependent var 2.48E-25 S.E. of regression 2.51E-25     Sum squared resid 2.95E-48 F-statistic 0.058717     Durbin-Watson stat 2.000941 Prob(F-statistic) 0.809589 * nếu chọn white -> ta có bảng: Heteroskedasticity Test: White F-statistic 62.57475     Prob. F(14,35) 0.0000 Obs*R-squared 48.07913     Prob. Chi-Square(14) 0.0000 Scaled explained SS 73.98905     Prob. Chi-Square(14) 0.0000 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/21/09 Time: 11:08 Sample: 1 50 Included observations: 50 Variable Coefficient Std. Error t-Statistic Prob.   C 5.27E-25 5.66E-26 9.315531 0.0000 BONUS 5.10E-28 1.69E-28 3.009395 0.0048 BONUS^2 3.67E-31 1.18E-31 3.125379 0.0036 BONUS*OTHERCOM 7.98E-31 2.27E-30 0.352161 0.7268 BONUS*COMPENS -2.17E-31 7.88E-32 -2.755959 0.0092 BONUS*PROF -8.70E-29 1.72E-29 -5.052587 0.0000 OTHERCOM 7.63E-27 1.51E-27 5.069448 0.0000 OTHERCOM^2 1.27E-30 9.01E-30 0.141156 0.8886 OTHERCOM*COMPENS -2.91E-30 5.78E-31 -5.043283 0.0000 OTHERCOM*PROF -6.77E-28 1.39E-28 -4.887697 0.0000 COMPENS -5.27E-28 7.14E-29 -7.375194 0.0000 COMPENS^2 1.14E-31 1.66E-32 6.884827 0.0000 COMPENS*PROF 7.18E-29 6.21E-30 11.54878 0.0000 PROF -1.30E-25 1.72E-26 -7.567793 0.0000 PROF^2 7.55E-27 1.50E-27 5.045868 0.0000 R-squared 0.961583     Mean dependent var 1.25E-25 Adjusted R-squared 0.946216     S.D. dependent var 2.46E-25 S.E. of regression 5.70E-26     Sum squared resid 1.14E-49 F-statistic 62.57475     Durbin-Watson stat 1.420857 Prob(F-statistic) 0.000000 Nhận xét: Như vậy trừ kiểm định arch, tất cả các kiểm định còn lại điều cho thấy giá trị X2 (chi-squared) tính toán rất cao và giá trị xác suất rất thấp -> ta kết luận có hiện tượng phương sai thay đổi. Bài 4: a) ls log(imports) c log(gdp) log(cpi) Dependent Variable: LOG(IMPORTS) Method: Least Squares Date: 05/21/09 Time: 22:48 Sample: 1990Q1 2001Q3 Included observations: 47 Variable Coefficient Std. Error t-Statistic Prob.   C 0.506395 0.295304 1.714828 0.0934 LOG(GDP) 2.136145 0.105433 20.26059 0.0000 LOG(CPI) 0.107142 0.050123 2.137587 0.0381 R-squared 0.977820     Mean dependent var 10.76531 Adjusted R-squared 0.976812     S.D. dependent var 0.164217 S.E. of regression 0.025007     Akaike info criterion -4.477653 Sum squared resid 0.027515     Schwarz criterion -4.359559 Log likelihood 108.2248     Hannan-Quinn criter. -4.433213 F-statistic 969.8746     Durbin-Watson stat 0.548284 Prob(F-statistic) 0.000000 b) Có hiện tượng đa cộng tuyến vì: sai dấu hệ số hồi quy b3 của biến log(cpi). Kỳ vọng b3 sản xuất giảm -> nhập khẩu (imports) giảm. R-squared = 0.977820 cao lập ma trận hệ số tương quan giữa các biến giải thích: View/ Group statistic/ Correlation/ nhập log(imports) log(gdp) log(cpi) LOG(IMPORTS) LOG(GDP) LOG(CPI) LOG(IMPORTS)  1.000000  0.987682  0.878005 LOG(GDP)  0.987682  1.000000  0.864534 LOG(CPI)  0.878005  0.864534  1.000000 Các hệ số tương quan giữa các biến cao -> có đa cộng tuyến, tương thích với kết quả ở câu b) Ước lượng mô hình: lnIMPORTt = B1 + B2lnGDPt + ut Dependent Variable: LOG(IMPORTS) Method: Least Squares Date: 05/21/09 Time: 23:13 Sample: 1990Q1 2001Q3 Included observations: 47 Variable Coefficient Std. Error t-Statistic Prob.   C 0.143095 0.250887 0.570357 0.5713 LOG(GDP) 2.330987 0.055050 42.34344 0.0000 R-squared 0.975516     Mean dependent var 10.76531 Adjusted R-squared 0.974972     S.D. dependent var 0.164217 S.E. of regression 0.025979     Akaike info criterion -4.421405 Sum squared resid 0.030372     Schwarz criterion -4.342675 Log likelihood 105.9030     Hannan-Quinn criter. -4.391778 F-statistic 1792.967     Durbin-Watson stat 0.512036 Prob(F-statistic) 0.000000 Ước lượng mô hình: lnIMPORTt = B1 + B2lnCPIt + ut Dependent Variable: LOG(IMPORTS) Method: Least Squares Date: 05/21/09 Time: 23:15 Sample: 1990Q1 2001Q3 Included observations: 47 Variable Coefficient Std. Error t-Statistic Prob.   C 5.942083 0.392142 15.15288 0.0000 LOG(CPI) 0.985095 0.080056 12.30506 0.0000 R-squared 0.770893     Mean dependent var 10.76531 Adjusted R-squared 0.765801     S.D. dependent var 0.164217 S.E. of regression 0.079471     Akaike info criterion -2.185217 Sum squared resid 0.284207     Schwarz criterion -2.106487 Log likelihood 53.35259     Hannan-Quinn criter. -2.155590 F-statistic 151.4145     Durbin-Watson stat 0.088172 Prob(F-statistic) 0.000000 Ước lượng mô hình: lnGDPt = B1 + B2lnCPIt + ut Dependent Variable: LOG(GDP) Method: Least Squares Date: 05/21/09 Time: 23:16 Sample: 1990Q1 2001Q3 Included observations: 47 Variable Coefficient Std. Error t-Statistic Prob.   C 2.544625 0.174462 14.58552 0.0000 LOG(CPI) 0.410999 0.035617 11.53951 0.0000 R-squared 0.747419     Mean dependent var 4.556958 Adjusted R-squared 0.741806     S.D. dependent var 0.069582 S.E. of regression 0.035357     Akaike info criterion -3.805046 Sum squared resid 0.056254     Schwarz criterion -3.726316 Log likelihood 91.41858     Hannan-Quinn criter. -3.775419 F-statistic 133.1604     Durbin-Watson stat 0.051041 Prob(F-statistic) 0.000000 Rút ra kết luận về bản chất tự tương quan: tự tương quan là sự phụ thuộc giữa các biến trong mô hình. Bài 5: Dependent Variable: LOG(IMP) Method: Least Squares Date: 05/17/09 Time: 23:55 Sample: 1 24 Included observations: 24 Variable Coefficient Std. Error t-Statistic Prob.   C 2.503281 0.298284 8.392276 0.0000 LOG(GDP) 2.158164 0.092647 23.29457 0.0000 LOG(CPI) -0.041740 0.030425 -1.371920 0.1846 R-squared 0.992698     Mean dependent var 11.81963 Adjusted R-squared 0.992003     S.D. dependent var 0.322220 S.E. of regression 0.028815     Akaike info criterion -4.139360 Sum squared resid 0.017437     Schwarz criterion -3.992103 Log likelihood 52.67231     Hannan-Quinn criter. -4.100292 F-statistic 1427.503     Durbin-Watson stat 1.192053 Prob(F-statistic) 0.000000 Dependent Variable: LOG(IMP) Method: Least Squares Date: 05/18/09 Time: 00:15 Sample: 1 24 Included observations: 24 Variable Coefficient Std. Error t-Statistic Prob.   C 2.841244 0.171530 16.56410 0.0000 LOG(GDP) 2.042390 0.038996 52.37488 0.0000 R-squared 0.992044     Mean dependent var 11.81963 Adjusted R-squared 0.991682     S.D. dependent var 0.322220 S.E. of regression 0.029387     Akaike info criterion -4.136857 Sum squared resid 0.018999     Schwarz criterion -4.038686 Log likelihood 51.64229     Hannan-Quinn criter. -4.110813 F-statistic 2743.128     Durbin-Watson stat 1.114996 Prob(F-statistic) 0.000000 Breusch-Godfrey Serial Correlation LM Test: F-statistic 1.798545     Prob. F(1,21) 0.1942 Obs*R-squared 1.893326     Prob. Chi-Square(1) 0.1688 LOG(IMP) LOG(GDP) LOG(CPI) LOG(IMP)  1.000000  0.996014  0.896672 LOG(GDP)  0.996014  1.000000  0.910861 LOG(CPI)  0.896672  0.910861  1.000000 Dependent Variable: LOG(IMP) Method: Least Squares Date: 05/18/09 Time: 00:29 Sample: 1 24 Included observations: 24 Variable Coefficient Std. Error t-Statistic Prob.   C 9.346217 0.262046 35.66637 0.0000 LOG(CPI) 0.603811 0.063557 9.500364 0.0000 R-squared 0.804021     Mean dependent var 11.81963 Adjusted R-squared 0.795113     S.D. dependent var 0.322220 S.E. of regression 0.145851     Akaike info criterion -0.932805 Sum squared resid 0.467996     Schwarz criterion -0.834634 Log likelihood 13.19366     Hannan-Quinn criter. -0.906760 F-statistic 90.25691     Durbin-Watson stat 0.251729 Prob(F-statistic) 0.000000 à tự tương quan Dependent Variable: LOG(GDP) Method: Least Squares Date: 05/18/09 Time: 00:30 Sample: 1 24 Included observations: 24 Variable Coefficient Std. Error t-Statistic Prob.   C 3.170721 0.119137 26.61403 0.0000 LOG(CPI) 0.299120 0.028896 10.35178 0.0000 R-squared 0.829668     Mean dependent var 4.396017 Adjusted R-squared 0.821925     S.D. dependent var 0.157137 S.E. of regression 0.066310     Akaike info criterion -2.509291 Sum squared resid 0.096735     Schwarz criterion -2.411120 Log likelihood 32.11149     Hannan-Quinn criter. -2.483246 F-statistic 107.1593     Durbin-Watson stat 0.218168 Prob(F-statistic) 0.000000 à tự tương quan Bài 6: a) ls price c lotsize sqrft bdrms Dependent Variable: PRICE Method: Least Squares Date: 05/22/09 Time: 20:16 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob.   C -21770.31 29475.04 -0.738601 0.4622 LOTSIZE 2.067707 0.642126 3.220096 0.0018 SQRFT 122.7782 13.23741 9.275093 0.0000 BDRMS 13852.52 9010.145 1.537436 0.1279 R-squared 0.672362     Mean dependent var 293546.0 Adjusted R-squared 0.660661     S.D. dependent var 102713.4 S.E. of regression 59833.48     Akaike info criterion 24.88091 Sum squared resid 3.01E+11     Schwarz criterion 24.99351 Log likelihood -1090.760     Hannan-Quinn criter. 24.92627 F-statistic 57.46023     Durbin-Watson stat 2.109796 Prob(F-statistic) 0.000000 b) Kiểm định phương sai thay đổi: B1: Vẽ đồ thị price theo lotsize: Quick/Graph/ price lotsize B2: ước lượng lại mô hình ls price c lotsize sqrft bdrms Dependent Variable: PRICE Method: Least Squares Date: 05/22/09 Time: 20:23 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob.   C -21770.31 29475.04 -0.738601 0.4622 LOTSIZE 2.067707 0.642126 3.220096 0.0018 SQRFT 122.7782 13.23741 9.275093 0.0000 BDRMS 13852.52 9010.145 1.537436 0.1279 R-squared 0.672362     Mean dependent var 293546.0 Adjusted R-squared 0.660661     S.D. dependent var 102713.4 S.E. of regression 59833.48     Akaike info criterion 24.88091 Sum squared resid 3.01E+11     Schwarz criterion 24.99351 Log likelihood -1090.760     Hannan-Quinn criter. 24.92627 F-statistic 57.46023     Durbin-Watson stat 2.109796 Prob(F-statistic) 0.000000 B3: Vẽ đồ thị phần dư theo giá trị ước lượng của salary Từ kết quả hồi quy, chọn View/Representative, rồi copy phương trình hồi quy, ra cửa sổ lệnh và ước lượng như sau: genr pricehat = -21770.3086036 + 2.06770660199*LOTSIZE + 122.778185222*SQRFT + 13852.5218631*BDRMS Vẽ đồ thị: Quick/Graph/ pricehat resid -> có phương sai thay đổi B4: kiểm định thống kê Từ bảng kết quả hồi quy-> view/Residual Tests/ Heteroskedasticity Tests/ nếu chọn Breusch-Pagan-Godfrey -> ta có bảng Heteroskedasticity Test: Breusch-Pagan-Godfrey F-statistic 5.338919     Prob. F(3,84) 0.0020 Obs*R-squared 14.09239     Prob. Chi-Square(3) 0.0028 Scaled explained SS 27.35542     Prob. Chi-Square(3) 0.0000 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/22/09 Time: 20:31 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob.   C -5.52E+09 3.26E+09 -1.694380 0.0939 LOTSIZE 201520.9 71009.06 2.837961 0.0057 SQRFT 1691037. 1463850. 1.155198 0.2513 BDRMS 1.04E+09 9.96E+08 1.045544 0.2988 R-squared 0.160141     Mean dependent var 3.42E+09 Adjusted R-squared 0.130146     S.D. dependent var 7.09E+09 S.E. of regression 6.62E+09     Akaike info criterion 48.10798 Sum squared resid 3.68E+21     Schwarz criterion 48.22058 Log likelihood -2112.751     Hannan-Quinn criter. 48.15334 F-statistic 5.338919     Durbin-Watson stat 2.351111 Prob(F-statistic) 0.002048 * nếu chọn Harvey -> ta có bảng : Heteroskedasticity Test: Harvey F-statistic 2.883489     Prob. F(3,84) 0.0405 Obs*R-squared 8.216268     Prob. Chi-Square(3) 0.0417 Scaled explained SS 8.486394     Prob. Chi-Square(3) 0.0370 Test Equation: Dependent Variable: LRESID2 Method: Least Squares Date: 05/22/09 Time: 20:33 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob.   C 17.71619 1.083894 16.34494 0.0000 LOTSIZE 3.38E-05 2.36E-05 1.430733 0.1562 SQRFT 0.000515 0.000487 1.057938 0.2931 BDRMS 0.384611 0.331333 1.160801 0.2490 R-squared 0.093367     Mean dependent var 20.43030 Adjusted R-squared 0.060987     S.D. dependent var 2.270601 S.E. of regression 2.200274     Akaike info criterion 4.459430 Sum squared resid 406.6611     Schwarz criterion 4.572036 Log likelihood -192.2149     Hannan-Quinn criter. 4.504796 F-statistic 2.883489     Durbin-Watson stat 2.426777 Prob(F-statistic) 0.040533 * nếu chọn Glejser -> ta có bảng: Heteroskedasticity Test: Glejser F-statistic 7.185545     Prob. F(3,84) 0.0002 Obs*R-squared 17.97124     Prob. Chi-Square(3) 0.0004 Scaled explained SS 21.43101     Prob. Chi-Square(3) 0.0001 Test Equation: Dependent Variable: ARESID Method: Least Squares Date: 05/22/09 Time: 20:34 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob.   C -19500.44 17716.01 -1.100724 0.2742 LOTSIZE 1.129760 0.385951 2.927215 0.0044 SQRFT 10.69671 7.956360 1.344423 0.1824 BDRMS 8678.622 5415.559 1.602535 0.1128 R-squared 0.204219     Mean dependent var 43196.64 Adjusted R-squared 0.175798     S.D. dependent var 39613.11 S.E. of regression 35962.99     Akaike info criterion 23.86276 Sum squared resid 1.09E+11     Schwarz criterion 23.97536 Log likelihood -1045.961     Hannan-Quinn criter. 23.90812 F-statistic 7.185545     Durbin-Watson stat 2.538377 Prob(F-statistic) 0.000237 nếu chọn arch-> ta có bảng : Heteroskedasticity Test: ARCH F-statistic 0.125639     Prob. F(1,85) 0.7239 Obs*R-squared 0.128406     Prob. Chi-Square(1) 0.7201 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/22/09 Time: 20:36 Sample (adjusted): 2 88 Included observations: 87 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   C 3.57E+09 8.55E+08 4.169434 0.0001 RESID^2(-1) -0.038451 0.108478 -0.354457 0.7239 R-squared 0.001476     Mean dependent var 3.43E+09 Adjusted R-squared -0.010271     S.D. dependent var 7.13E+09 S.E. of regression 7.17E+09     Akaike info criterion 48.24710 Sum squared resid 4.37E+21     Schwarz criterion 48.30379 Log likelihood -2096.749     Hannan-Quinn criter. 48.26993 F-statistic 0.125639     Durbin-Watson stat 2.002935 Prob(F-statistic) 0.723875 * nếu chọn white -> ta có bảng: Heteroskedasticity Test: White F-statistic 5.386953     Prob. F(9,78) 0.0000 Obs*R-squared 33.73166     Prob. Chi-Square(9) 0.0001 Scaled explained SS 65.47818     Prob. Chi-Square(9) 0.0000 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/22/09 Time: 20:37 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob.   C 1.56E+10 1.14E+10 1.374411 0.1733 LOTSIZE -1859507. 637097.0 -2.918719 0.0046 LOTSIZE^2 -0.497839 4.631155 -0.107498 0.9147 LOTSIZE*SQRFT 456.7785 276.8903 1.649673 0.1030 LOTSIZE*BDRMS 314646.9 252093.6 1.248135 0.2157 SQRFT -2673918. 8662183. -0.308689 0.7584 SQRFT^2 352.2553 1839.603 0.191484 0.8486 SQRFT*BDRMS -1020860. 1667154. -0.612337 0.5421 BDRMS -1.98E+09 5.44E+09 -0.364595 0.7164 BDRMS^2 2.90E+08 7.59E+08 0.381843 0.7036 R-squared 0.383314     Mean dependent var 3.42E+09 Adjusted R-squared 0.312158     S.D. dependent var 7.09E+09 S.E. of regression 5.88E+09     Akaike info criterion 47.93546 Sum squared resid 2.70E+21     Schwarz criterion 48.21698 Log likelihood -2099.160     Hannan-Quinn criter. 48.04888 F-statistic 5.386953     Durbin-Watson stat 2.052712 Prob(F-statistic) 0.000010 Nhận xét: Như vậy trừ kiểm định arch, tất cả các kiểm định còn lại điều cho thấy giá trị X2 (chi-squared) tính toán rất cao và giá trị xác suất rất thấp -> ta kết luận có hiện tượng phương sai thay đổi. c) ls price c log(lotsize) log(sqrft) log(bdrms) Dependent Variable: PRICE Method: Least Squares Date: 05/22/09 Time: 20:40 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob.   C -2082664. 206661.6 -10.07765 0.0000 LOG(LOTSIZE) 62344.58 12427.50 5.016663 0.0000 LOG(SQRFT) 230938.4 30176.04 7.653037 0.0000 LOG(BDRMS) 57951.03 32937.22 1.759439 0.0821 R-squared 0.671560     Mean dependent var 293546.0 Adjusted R-squared 0.659830     S.D. dependent var 102713.4 S.E. of regression 59906.72     Akaike info criterion 24.88335 Sum squared resid 3.01E+11     Schwarz criterion 24.99596 Log likelihood -1090.868     Hannan-Quinn criter. 24.92872 F-statistic 57.25139     Durbin-Watson stat 2.208456 Prob(F-statistic) 0.000000 Kiểm định phương sai thay đổi: B1: Vẽ đồ thị price theo lotsize: Quick/Graph/ price log(lotsize) B2: ước lượng lại mô hình ls price c log(lotsize) log(sqrft) log(bdrms) Dependent Variable: PRICE Method: Least Squares Date: 05/22/09 Time: 20:40 Sample: 1 88 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob.   C -2082664. 206661.6 -10.07765 0.0000 LOG(LOTSIZE) 62344.58 12427.50 5.016663 0.0000 LOG(SQRFT) 230938.4 30176.04 7.653037 0.0000 LOG(BDRMS) 57951.03 32937.22 1.759439 0.0821 R-squared 0.671560     Mean dependent var 293546.0 Adjusted R-squared 0.659830     S.D. dependent var 102713.4 S.E. of regression 59906.72     Akaike info criterion 24.88335 Sum squared resid 3.01E+11     Schwarz criterion 24.99596 Log likelihood -1090.868     Hannan-Quinn criter. 24.92872 F-statistic 57.25139     Durbin-Watson stat 2.208456 Prob(F-statistic) 0.000000 B3: Vẽ đồ thị phần dư theo giá trị ước lượng của price Từ kết quả hồi quy, chọn View/Representative, rồi copy phương trình hồi quy, ra cửa sổ lệnh và ước lượng như sau: genr pricehat = -2082663.68199 + 62344.5769751*LOG(LOTSIZE) + 230938.364794*LOG(SQRFT) + 57951.0312542*LOG(BDRMS) Vẽ đồ thị: Quick/Graph/ pricehat resid -> có phương sai không đổi Bai 8: a) Chọn biến I -> view/Unit root test, chọn level, intercept -> có bảng: Null Hypothesis: I has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=7) t-Statistic   Prob.* Augmented Dickey-Fuller test statistic -1.158543  0.6782 Test critical values: 1% level -3.679322 5% level -2.967767 10% level -2.622989 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(I) Method: Least Squares Date: 05/22/09 Time: 20:58 Sample (adjusted): 2001Q4 2008Q4 Included observations: 29 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   I(-1) -0.108120 0.093324 -1.158543 0.2568 C 2.823139 1.970204 1.432917 0.1634 R-squared 0.047358     Mean dependent var 0.677586 Adjusted R-squared 0.012075     S.D. dependent var 3.642638 S.E. of regression 3.620580     Akaike info criterion 5.477617 Sum squared resid 353.9321     Schwarz criterion 5.571914 Log likelihood -77.42545     Hannan-Quinn criter. 5.507150 F-statistic 1.342222     Durbin-Watson stat 2.387635 Prob(F-statistic) 0.256787 Ho: chuỗi I không dừng P-value lớn -> chấp nhận Ho -> chuỗi I không dừng Chọn biến Y -> view/Unit root test, chọn level, intercept -> có bảng: Null Hypothesis: Y has a unit root Exogenous: Constant Lag Length: 2 (Automatic based on SIC, MAXLAG=7) t-Statistic   Prob.* Augmented Dickey-Fuller test statistic -0.551274  0.8657 Test critical values: 1% level -3.699871 5% level -2.976263 10% level -2.627420 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(Y) Method: Least Squares Date: 05/22/09 Time: 21:00 Sample (adjusted): 2002Q2 2008Q4 Included observations: 27 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   Y(-1) -0.022334 0.040514 -0.551274 0.5868 D(Y(-1)) -0.274478 0.185252 -1.481651 0.1520 D(Y(-2)) -0.450442 0.182826 -2.463769 0.0217 C 2.103577 0.920943 2.284154 0.0319 R-squared 0.263846     Mean dependent var 0.945185 Adjusted R-squared 0.167826     S.D. dependent var 1.780567 S.E. of regression 1.624297     Akaike info criterion 3.943981 Sum squared resid 60.68182     Schwarz criterion 4.135957 Log likelihood -49.24374     Hannan-Quinn criter. 4.001065 F-statistic 2.747820     Durbin-Watson stat 2.164554 Prob(F-statistic) 0.066029 -> chuỗi Y không dừng Chọn biến R -> view/Unit root test, chọn level, intercept -> có bảng: Null Hypothesis: R has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=7) t-Statistic   Prob.* Augmented Dickey-Fuller test statistic -6.909094  0.0000 Test critical values: 1% level -3.679322 5% level -2.967767 10% level -2.622989 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(R) Method: Least Squares Date: 05/22/09 Time: 21:01 Sample (adjusted): 2001Q4 2008Q4 Included observations: 29 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   R(-1) -1.267350 0.183432 -6.909094 0.0000 C 17.64524 2.717806 6.492458 0.0000 R-squared 0.638726     Mean dependent var -0.079310 Adjusted R-squared 0.625346     S.D. dependent var 7.894809 S.E. of regression 4.832334     Akaike info criterion 6.055008 Sum squared resid 630.4892     Schwarz criterion 6.149305 Log likelihood -85.79762     Hannan-Quinn criter. 6.084541 F-statistic 47.73559     Durbin-Watson stat 2.074225 Prob(F-statistic) 0.000000 -> chuỗi R dừng Nếu là chuỗi không dừng thì sẽ có trung bình và phương sai thay đổi thời gian -> không dự báo chính xác được -> nếu là chuỗi dừng thì nên chuyển sang dạng sai phân bậc 1 vì thông thường 1 chuỗi thời gian là không dừng thì sai phân bậc 1 có thể sẽ là một chuỗi dừng (có trung bình và phương sai không đổi theo thời gian) -> dự báo chính xác hơn. b) ls I c Y R Dependent Variable: I Method: Least Squares Date: 05/22/09 Time: 21:02 Sample: 2001Q3 2008Q4 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob.   C 6.224938 2.510894 2.479172 0.0197 Y 0.769911 0.071791 10.72442 0.0000 R -0.184196 0.126416 -1.457068 0.1566 R-squared 0.816282     Mean dependent var 20.22200 Adjusted R-squared 0.802673     S.D. dependent var 7.495569 S.E. of regression 3.329642     Akaike info criterion 5.338246 Sum squared resid 299.3358     Schwarz criterion 5.478366 Log likelihood -77.07369     Hannan-Quinn criter. 5.383071 F-statistic 59.98221     Durbin-Watson stat 0.852153 Prob(F-statistic) 0.000000 Do d=0.85 -> có tự tương quan bậc 1 Ta kiểm tra xem có tự tương quan bặc cao hay không: Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng: Breusch-Godfrey Serial Correlation LM Test: F-statistic 6.764643     Prob. F(2,25) 0.0045 Obs*R-squared 10.53429     Prob. Chi-Square(2) 0.0052 Test Equation: Dependent Variable: RESID Method: Least Squares Date: 05/22/09 Time: 21:04 Sample: 2001Q3 2008Q4 Included observations: 30 Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic Prob.   C 1.799886 2.202606 0.817162 0.4216 Y -0.012173 0.060373 -0.201637 0.8418 R -0.107141 0.112469 -0.952623 0.3499 RESID(-1) 0.697416 0.208636 3.342738 0.0026 RESID(-2) -0.165681 0.204936 -0.808452 0.4265 R-squared 0.351143     Mean dependent var -4.88E-16 Adjusted R-squared 0.247326     S.D. dependent var 3.212775 S.E. of regression 2.787301     Akaike info criterion 5.039036 Sum squared resid 194.2262     Schwarz criterion 5.272569 Log likelihood -70.58555     Hannan-Quinn criter. 5.113746 F-statistic 3.382321     Durbin-Watson stat 1.868584 Prob(F-statistic) 0.024177 Vì Prob.Square(2) = 0.0052 nhỏ -> có tự tương quan bậc cao c) ls log(I) c log(Y) log(R) Dependent Variable: LOG(I) Method: Least Squares Date: 05/22/09 Time: 21:10 Sample: 2001Q3 2008Q4 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob.   C 1.023735 0.405353 2.525538 0.0177 LOG(Y) 0.734444 0.091028 8.068345 0.0000 LOG(R) -0.108312 0.102930 -1.052288 0.3020 R-squared 0.720742     Mean dependent var 2.933305 Adjusted R-squared 0.700056     S.D. dependent var 0.400720 S.E. of regression 0.219463     Akaike info criterion -0.100627 Sum squared resid 1.300428     Schwarz criterion 0.039493 Log likelihood 4.509408     Hannan-Quinn criter. -0.055802 F-statistic 34.84233     Durbin-Watson stat 0.619553 Prob(F-statistic) 0.000000 Do d=0.61 -> có tự tương quan bậc 1 Ta kiểm tra xem có tự tương quan bặc cao hay không: Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng: Breusch-Godfrey Serial Correlation LM Test: F-statistic 11.32566     Prob. F(2,25) 0.0003 Obs*R-squared 14.26067     Prob. Chi-Square(2) 0.0008 Test Equation: Dependent Variable: RESID Method: Least Squares Date: 05/22/09 Time: 21:11 Sample: 2001Q3 2008Q4 Included observations: 30 Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic Prob.   C 0.128674 0.311885 0.412569 0.6834 LOG(Y) -0.009872 0.069046 -0.142978 0.8875 LOG(R) -0.037666 0.079057 -0.476442 0.6379 RESID(-1) 0.792038 0.201930 3.922330 0.0006 RESID(-2) -0.153046 0.203102 -0.753540 0.4582 R-squared 0.475356     Mean dependent var 5.12E-16 Adjusted R-squared 0.391412     S.D. dependent var 0.211760 S.E. of regression 0.165198     Akaike info criterion -0.612328 Sum squared resid 0.682262     Schwarz criterion -0.378795 Log likelihood 14.18492     Hannan-Quinn criter. -0.537619 F-statistic 5.662829     Durbin-Watson stat 1.992081 Prob(F-statistic) 0.002187 Vì Prob.Square(2) = 0.008 nhỏ -> có tự tương quan bậc cao ls I c y r @trend(2001Q3) Dependent Variable: I Method: Least Squares Date: 05/22/09 Time: 21:13 Sample: 2001Q3 2008Q4 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob.   C 4.695682 3.912313 1.200232 0.2409 Y 0.992016 0.437555 2.267178 0.0319 R -0.187741 0.128357 -1.462647 0.1555 @TREND(2001Q3) -0.221050 0.429411 -0.514776 0.6111 R-squared 0.818136     Mean dependent var 20.22200 Adjusted R-squared 0.797151     S.D. dependent var 7.495569 S.E. of regression 3.375909     Akaike info criterion 5.394772 Sum squared resid 296.3158     Schwarz criterion 5.581598 Log likelihood -76.92158     Hannan-Quinn criter. 5.454539 F-statistic 38.98790     Durbin-Watson stat 0.916623 Prob(F-statistic) 0.000000 Do d=0.91 -> có tự tương quan bậc 1 Ta kiểm tra xem có tự tương quan bặc cao hay không: Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng: Breusch-Godfrey Serial Correlation LM Test: F-statistic 7.743312     Prob. F(2,24) 0.0025 Obs*R-squared 11.76598     Prob. Chi-Square(2) 0.0028 Test Equation: Dependent Variable: RESID Method: Least Squares Date: 05/22/09 Time: 21:14 Sample: 2001Q3 2008Q4 Included observations: 30 Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic Prob.   C 7.156954 3.716978 1.925476 0.0661 Y -0.703810 0.399603 -1.761273 0.0909 R -0.133598 0.111906 -1.193840 0.2442 @TREND(2001Q3) 0.684778 0.391183 1.750530 0.0928 RESID(-1) 0.832667 0.227640 3.657818 0.0012 RESID(-2) -0.208571 0.202148 -1.031770 0.3125 R-squared 0.392199     Mean dependent var -8.88E-17 Adjusted R-squared 0.265574     S.D. dependent var 3.196527 S.E. of regression 2.739381     Akaike info criterion 5.030197 Sum squared resid 180.1009     Schwarz criterion 5.310437 Log likelihood -69.45296     Hannan-Quinn criter. 5.119848 F-statistic 3.097325     Durbin-Watson stat 1.871876 Prob(F-statistic) 0.026903 Vì Prob.Square(2) = 0.0028 nhỏ -> có tự tương quan bậc cao Mô hình 1 có tự tương quan, nhưng khi chuyển sang mô hình 2 và 3 vẫn còn tự tương quan (thay đổi dạng hàm) -> như vậy tự tương quan ở mô hình 1 là tự tương quan thuần túy. Khắc phục tự tương quan: thủ tục Cochrane-Orcutt B1: Ước lượng phương trình: Yt=b1+b2Xt+et ls I c Y R Dependent Variable: I Method: Least Squares Date: 05/22/09 Time: 22:05 Sample: 2001Q3 2008Q4 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob.   C 6.224938 2.510894 2.479172 0.0197 Y 0.769911 0.071791 10.72442 0.0000 R -0.184196 0.126416 -1.457068 0.1566 R-squared 0.816282     Mean dependent var 20.22200 Adjusted R-squared 0.802673     S.D. dependent var 7.495569 S.E. of regression 3.329642     Akaike info criterion 5.338246 Sum squared resid 299.3358     Schwarz criterion 5.478366 Log likelihood -77.07369     Hannan-Quinn criter. 5.383071 F-statistic 59.98221     Durbin-Watson stat 0.852153 Prob(F-statistic) 0.000000 -> lưu et: genr pd=resid B2: Hồi quy: et=p^et-1+εt ls pd pd(-1) Dependent Variable: PD Method: Least Squares Date: 05/22/09 Time: 22:09 Sample (adjusted): 2001Q4 2008Q4 Included observations: 29 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   PD(-1) 0.567726 0.155221 3.657547 0.0010 R-squared 0.322978     Mean dependent var -0.070236 Adjusted R-squared 0.322978     S.D. dependent var 3.246119 S.E. of regression 2.670950     Akaike info criterion 4.836620 Sum squared resid 199.7512     Schwarz criterion 4.883768 Log likelihood -69.13098     Hannan-Quinn criter. 4.851386 Durbin-Watson stat 1.851803 -> p^=0.567726 lưu p^ genr rho=c(1) B3: Tính It*,Yt*,Rt* genr Ihat=I-rho*I(-1) genr yhat=y-rho*y(-1) genr rhat=r-rho*r(-1) B4: It*=B1*+B2*Yt*+B3*Rt*+ εt (2) ước lượng (2) theo OLS: ls Ihat c yhat rhat Dependent Variable: IHAT Method: Least Squares Date: 05/22/09 Time: 22:02 Sample (adjusted): 2001Q4 2008Q4 Included observations: 29 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   C 3.130112 1.442645 2.169704 0.0394 YHAT 0.787463 0.131353 5.995034 0.0000 RHAT -0.293100 0.080636 -3.634844 0.0012 R-squared 0.635559     Mean dependent var 9.255682 Adjusted R-squared 0.607525     S.D. dependent var 4.276520 S.E. of regression 2.679146     Akaike info criterion 4.906570 Sum squared resid 186.6234     Schwarz criterion 5.048015 Log likelihood -68.14527     Hannan-Quinn criter. 4.950869 F-statistic 22.67109     Durbin-Watson stat 1.547610 Prob(F-statistic) 0.000002 Do d=1.54->không có tự tương quan bậc 1 Ta kiểm tra xem có tự tương quan bặc cao hay không: Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng: Breusch-Godfrey Serial Correlation LM Test: F-statistic 0.982814     Prob. F(2,24) 0.3888 Obs*R-squared 2.195333     Prob. Chi-Square(2) 0.3336 Test Equation: Dependent Variable: RESID Method: Least Squares Date: 05/22/09 Time: 22:18 Sample: 2001Q4 2008Q4 Included observations: 29 Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic Prob.   C 0.502257 1.492973 0.336414 0.7395 YHAT -0.027402 0.133920 -0.204616 0.8396 RHAT -0.036417 0.085114 -0.427866 0.6726 RESID(-1) 0.287089 0.214723 1.337020 0.1938 RESID(-2) -0.161041 0.209509 -0.768659 0.4496 R-squared 0.075701     Mean dependent var -1.36E-15 Adjusted R-squared -0.078349     S.D. dependent var 2.581690 S.E. of regression 2.680919     Akaike info criterion 4.965782 Sum squared resid 172.4958     Schwarz criterion 5.201522 Log likelihood -67.00383     Hannan-Quinn criter. 5.039613 F-statistic 0.491407     Durbin-Watson stat 1.931618 Prob(F-statistic) 0.742030 Vì Prob.Square(2) = 0.3336->không có tự tương quan bậc cao Bai 9: a) Chọn biến f -> view/Unit root test, chọn level, intercept -> có bảng: Null Hypothesis: F has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=7) t-Statistic   Prob.* Augmented Dickey-Fuller test statistic -0.853481  0.7888 Test critical values: 1% level -3.670170 5% level -2.963972 10% level -2.621007 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(F) Method: Least Squares Date: 05/22/09 Time: 14:52 Sample (adjusted): 1979 2008 Included observations: 30 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   F(-1) -0.022615 0.026497 -0.853481 0.4006 C 3.070566 2.897865 1.059596 0.2984 R-squared 0.025356     Mean dependent var 0.600000 Adjusted R-squared -0.009453     S.D. dependent var 0.739058 S.E. of regression 0.742543     Akaike info criterion 2.306869 Sum squared resid 15.43837     Schwarz criterion 2.400282 Log likelihood -32.60303     Hannan-Quinn criter. 2.336752 F-statistic 0.728430     Durbin-Watson stat 1.998903 Prob(F-statistic) 0.400635 Ho: chuỗi f không dừng P-value lớn -> chấp nhận Ho -> chuỗi f không dừng Chọn biến p -> view/Unit root test, chọn level, intercept -> có bảng: Null Hypothesis: P has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=7) t-Statistic   Prob.* Augmented Dickey-Fuller test statistic -3.156190  0.0330 Test critical values: 1% level -3.670170 5% level -2.963972 10% level -2.621007 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(P) Method: Least Squares Date: 05/22/09 Time: 14:56 Sample (adjusted): 1979 2008 Included observations: 30 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   P(-1) -0.518693 0.164342 -3.156190 0.0038 C 54.57645 17.21709 3.169900 0.0037 R-squared 0.262411     Mean dependent var 0.290000 Adjusted R-squared 0.236069     S.D. dependent var 4.806630 S.E. of regression 4.201146     Akaike info criterion 5.772932 Sum squared resid 494.1896     Schwarz criterion 5.866346 Log likelihood -84.59399     Hannan-Quinn criter. 5.802816 F-statistic 9.961532     Durbin-Watson stat 1.797577 Prob(F-statistic) 0.003803 p-value nhỏ -> bác bỏ Ho -> chuỗi p dừng Chọn biến q -> view/Unit root test, chọn level, intercept -> có bảng: Null Hypothesis: Q has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=7) t-Statistic   Prob.* Augmented Dickey-Fuller test statistic -3.297838  0.0243 Test critical values: 1% level -3.679322 5% level -2.967767 10% level -2.622989 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(Q) Method: Least Squares Date: 05/22/09 Time: 14:58 Sample (adjusted): 1980 2008 Included observations: 29 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   Q(-1) -0.529847 0.160665 -3.297838 0.0027 C 17.96495 5.512537 3.258927 0.0030 R-squared 0.287143     Mean dependent var -0.113793 Adjusted R-squared 0.260740     S.D. dependent var 3.629121 S.E. of regression 3.120325     Akaike info criterion 5.180224 Sum squared resid 262.8836     Schwarz criterion 5.274520 Log likelihood -73.11324     Hannan-Quinn criter. 5.209756 F-statistic 10.87573     Durbin-Watson stat 1.610096 Prob(F-statistic) 0.002736 -> chuỗi q dừng Chọn biến r -> view/Unit root test, chọn level, intercept -> có bảng: Null Hypothesis: R has a unit root Exogenous: Constant Lag Length: 0 (Automatic based on SIC, MAXLAG=7) t-Statistic   Prob.* Augmented Dickey-Fuller test statistic -4.342457  0.0019 Test critical values: 1% level -3.670170 5% level -2.963972 10% level -2.621007 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(R) Method: Least Squares Date: 05/22/09 Time: 14:59 Sample (adjusted): 1979 2008 Included observations: 30 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   R(-1) -0.758234 0.174610 -4.342457 0.0002 C 75.77033 20.14129 3.761940 0.0008 R-squared 0.402436     Mean dependent var -2.990000 Adjusted R-squared 0.381095     S.D. dependent var 60.97856 S.E. of regression 47.97216     Akaike info criterion 10.64346 Sum squared resid 64437.18     Schwarz criterion 10.73687 Log likelihood -157.6519     Hannan-Quinn criter. 10.67334 F-statistic 18.85693     Durbin-Watson stat 1.941030 Prob(F-statistic) 0.000167 chuỗi r dừng Nếu là chuỗi không dừng thì sẽ có trung bình và phương sai thay đổi thời gian -> không dự báo chính xác được -> nếu là chuỗi dừng thì nên chuyển sang dạng sai phân bậc 1 vì thông thường 1 chuỗi thời gian là không dừng thì sai phân bậc 1 có thể sẽ là một chuỗi dừng (có trung bình và phương sai không đổi theo thời gian) -> dự báo chính xác hơn. ls q c p f r có bảng: Dependent Variable: Q Method: Least Squares Date: 05/22/09 Time: 15:04 Sample (adjusted): 1979 2008 Included observations: 30 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   C -11.59809 14.96435 -0.775048 0.4453 P 0.316229 0.087615 3.609282 0.0013 F 0.061583 0.080990 0.760379 0.4539 R 0.058138 0.008069 7.205443 0.0000 R-squared 0.705547     Mean dependent var 34.22000 Adjusted R-squared 0.671571     S.D. dependent var 3.647238 S.E. of regression 2.090185     Akaike info criterion 4.435948 Sum squared resid 113.5907     Schwarz criterion 4.622774 Log likelihood -62.53922     Hannan-Quinn criter. 4.495715 F-statistic 20.76641     Durbin-Watson stat 1.805563 Prob(F-statistic) 0.000000 Do d=1.8 -> không có tự tương quan bậc 1 Ta kiểm tra xem có tự tương quan bặc cao hay không: Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng: Breusch-Godfrey Serial Correlation LM Test: F-statistic 0.092111     Prob. F(2,24) 0.9123 Obs*R-squared 0.228522     Prob. Chi-Square(2) 0.8920 Test Equation: Dependent Variable: RESID Method: Least Squares Date: 05/22/09 Time: 16:25 Sample: 1979 2008 Included observations: 30 Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic Prob.   C -1.719567 16.31420 -0.105403 0.9169 P 0.012067 0.098153 0.122941 0.9032 F 0.004056 0.084654 0.047917 0.9622 R 3.77E-05 0.008387 0.004492 0.9965 RESID(-1) 0.038320 0.207442 0.184724 0.8550 RESID(-2) -0.085404 0.221688 -0.385242 0.7035 R-squared 0.007617     Mean dependent var -1.14E-14 Adjusted R-squared -0.199129     S.D. dependent var 1.979121 S.E. of regression 2.167231     Akaike info criterion 4.561634 Sum squared resid 112.7254     Schwarz criterion 4.841874 Log likelihood -62.42452     Hannan-Quinn criter. 4.651285 F-statistic 0.036844     Durbin-Watson stat 1.885074 Prob(F-statistic) 0.999170 Vì Prob.Square(2) = 0.8920 lớn -> không có tự tương quan bậc cao c) ls log(q) c log(p) log(f) log(r) -> có bảng : Dependent Variable: LOG(Q) Method: Least Squares Date: 05/22/09 Time: 16:33 Sample (adjusted): 1979 2008 Included observations: 30 after adjustments Variable Coefficient Std. Error t-Statistic Prob.   C -1.371261 1.866532 -0.734657 0.4691 LOG(P) 0.840709 0.249391 3.371041 0.0024 LOG(F) 0.070237 0.237214 0.296089 0.7695 LOG(R) 0.147023 0.017684 8.313880 0.0000 R-squared 0.760499     Mean dependent var 3.527108 Adjusted R-squared 0.732864     S.D. dependent var 0.109691 S.E. of regression 0.056694     Akaike info criterion -2.778730 Sum squared resid 0.083570     Schwarz criterion -2.591903 Log likelihood 45.68094     Hannan-Quinn criter. -2.718962 F-statistic 27.51971     Durbin-Watson stat 1.966064 Prob(F-statistic) 0.000000 d=1.966 -> không có tự tương quan bậc 1 Ta kiểm tra xem có tự tương quan bậc cao không Từ kết quả hồi quy -> view/Residual/ Serial Correlation LM Test -> có bảng: Breusch-Godfrey Serial Correlation LM Test: F-statistic 0.078943     Prob. F(2,24) 0.9243 Obs*R-squared 0.196069     Prob. Chi-Square(2) 0.9066 Test Equation: Dependent Variable: RESID Method: Least Squares Date: 05/22/09 Time: 16:36 Sample: 1979 2008 Included observations: 30 Presample missing value lagged residuals set to zero. Variable Coefficient Std. Error t-Statistic Prob.   C -0.190791 2.001083 -0.095344 0.9248 LOG(P) 0.033717 0.273249 0.123393 0.9028 LOG(F) 0.007515 0.247028 0.030423 0.9760 LOG(R) -0.000363 0.018370 -0.019766 0.9844 RESID(-1) -0.041848 0.206665 -0.202493 0.8412 RESID(-2) -0.077912 0.218444 -0.356668 0.7245 R-squared 0.006536     Mean dependent var -6.98E-16 Adjusted R-squared -0.200436     S.D. dependent var 0.053682 S.E. of regression 0.058816     Akaike info criterion -2.651953 Sum squared resid 0.083023     Schwarz criterion -2.371714 Log likelihood 45.77930     Hannan-Quinn criter. -2.562302 F-statistic 0.031577     Durbin-Watson stat 1.878904 Prob(F-statistic) 0.999429 Vì Prob.Square(2) = 0.9066 lớn -> không có tự tương quan bậc cao

Các file đính kèm theo tài liệu này:

  • doc_eco_assignment_8807.doc
Tài liệu liên quan