Bài tập Kinh tế lượng - Tài liệu, Luận văn

Tài liệu Bài tập Kinh tế lượng: Bài 1 Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau : ĐVT:% Nam US Anh Nhat Duc Phap 1960 1.5 1 3.6 1.5 3.6 1961 1.1 3.4 5.4 2.3 3.4 1962 1.1 4.5 6.7 4.5 4.7 1963 1.2 2.5 7.7 3 4.8 1964 1.4 3.9 3.9 2.3 3.4 1965 1.6 4.6 6.5 3.4 2.6 1966 2.8 3.7 6 3.5 2.7 1967 2.8 2.4 4 1.5 2.7 1968 4.2 4.8 5.5 18 4.5 1969 5 5.2 5.1 2.6 6.4 1970 5.9 6.5 7.6 3.7 5.5 1971 4.3 9.5 6.3 5.3 5.5 1972 3.6 6.8 4.9 5.4 5.9 1973 6.2 8.4 12 7 7.5 1974 10.9 16 24.6 7 14 1975 9.2 24.2 11.7 5.9 11.7 1976 5.8 16.5 9.3 4.5 9.6 1977 6.4 15.9 8.1 3.7 9.4 1978 7.6 8.3 3.8 2.7 9.1 1979 11.4 13.4 3.6 4.1 10.7 1980 13.6 18 8 5.5 13.3 Nguồn tin : khoa tóan thống kê – ĐHKT Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho nhận xét tổng quát về lạm phát của 5 nước ? Nhận xét: NHìn chung tỷ lệ lạm phát của có đều có xu hướng tăng lên, n...

70 trang | Chia sẻ: hunglv | Lượt xem: 1773 | Lượt tải: 0

Bạn đang xem trước 20 trang mẫu tài liệu Bài tập Kinh tế lượng, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Bài 1 Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau : ĐVT:% Nam US Anh Nhat Duc Phap 1960 1.5 1 3.6 1.5 3.6 1961 1.1 3.4 5.4 2.3 3.4 1962 1.1 4.5 6.7 4.5 4.7 1963 1.2 2.5 7.7 3 4.8 1964 1.4 3.9 3.9 2.3 3.4 1965 1.6 4.6 6.5 3.4 2.6 1966 2.8 3.7 6 3.5 2.7 1967 2.8 2.4 4 1.5 2.7 1968 4.2 4.8 5.5 18 4.5 1969 5 5.2 5.1 2.6 6.4 1970 5.9 6.5 7.6 3.7 5.5 1971 4.3 9.5 6.3 5.3 5.5 1972 3.6 6.8 4.9 5.4 5.9 1973 6.2 8.4 12 7 7.5 1974 10.9 16 24.6 7 14 1975 9.2 24.2 11.7 5.9 11.7 1976 5.8 16.5 9.3 4.5 9.6 1977 6.4 15.9 8.1 3.7 9.4 1978 7.6 8.3 3.8 2.7 9.1 1979 11.4 13.4 3.6 4.1 10.7 1980 13.6 18 8 5.5 13.3 Nguồn tin : khoa tóan thống kê – ĐHKT Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho nhận xét tổng quát về lạm phát của 5 nước ? Nhận xét: NHìn chung tỷ lệ lạm phát của có đều có xu hướng tăng lên, nhưng trong đó Đức và Nhật chỉ tăng chậm. Lạm phát nước nào biến thiên nhiều hơn giải thích ? ANH DUC NHAT PHAP US Mean 8.547619 4.638095 7.347619 6.714286 5.123810 Median 6.500000 3.700000 6.300000 5.500000 4.300000 Maximum 24.20000 18.00000 24.60000 14.00000 13.60000 Minimum 1.000000 1.500000 3.600000 2.600000 1.100000 Std. Dev. 6.321046 3.458248 4.632992 3.579146 3.694984 Skewness 0.941799 2.852530 2.603757 0.653541 0.784310 Kurtosis 2.866323 11.83415 10.29502 2.214858 2.672861 Jarque-Bera 3.120083 96.76612 70.29363 2.034298 2.246638 Probability 0.210127 0.000000 0.000000 0.361625 0.325199 Sum 179.5000 97.40000 154.3000 141.0000 107.6000 Sum Sq. Dev. 799.1124 239.1895 429.2924 256.2057 273.0581 Observations 21 21 21 21 21 Từ bảng tính các thống kê mô tả, ta thấy độ lệch chuẩn lạm phát của nước Anh là lớn nhất ( = 6.321046) do đó lạm phát của nước Anh biến thiên nhiều nhất. Ươc lượng mô hình hồi qui: Lạm phát theo thời gian cho từng quốc gia theo giả định (Lamphat)i = 1 + 2 (Thoigian)i + Ui Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát về tác động lạm phát tại từng quốc gia ? Vẽ đồ thị ? - Ước lượng mô hình hồi qui US: Dependent Variable: US Method: Least Squares Date: 05/10/10 Time: 21:02 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C -0.164502 0.734285 -0.224030 0.8251 NAMMOHINH 0.528831 0.062811 8.419444 0.0000 R-squared 0.788624 Mean dependent var 5.123810 Adjusted R-squared 0.777499 S.D. dependent var 3.694984 S.E. of regression 1.742926 Akaike info criterion 4.039401 Sum squared resid 57.71804 Schwarz criterion 4.138879 Log likelihood -40.41371 F-statistic 70.88704 Durbin-Watson stat 1.131804 Prob(F-statistic) 0.000000 US = -0.1645021645 + 0.5288311688*NAMMOHINH Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Mỹ tăng lên 0.52883%. Tỷ lệ lạm phát tăng nhanh tác động mạnh mẽ đến nền kinh tế, làm cho giá cả các mặt hàng tăng lên nhanh chóng… - Ước lượng mô hình hồi qui Anh: Dependent Variable: ANH Method: Least Squares Date: 05/10/10 Time: 21:03 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 0.322944 1.612211 0.200311 0.8434 NAMMOHINH 0.822468 0.137908 5.963871 0.0000 R-squared 0.651809 Mean dependent var 8.547619 Adjusted R-squared 0.633483 S.D. dependent var 6.321046 S.E. of regression 3.826801 Akaike info criterion 5.612328 Sum squared resid 278.2437 Schwarz criterion 5.711806 Log likelihood -56.92945 F-statistic 35.56776 Durbin-Watson stat 1.141176 Prob(F-statistic) 0.000010 ANH = 0.3229437229 + 0.8224675325*NAMMOHINH Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Anh tăng lên 0.823%. - Ước lượng mô hình hồi qui Nhật: Dependent Variable: NHAT Method: Least Squares Date: 05/10/10 Time: 21:09 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 5.215152 1.919155 2.717421 0.0137 NAMMOHINH 0.213247 0.164164 1.298984 0.2095 R-squared 0.081565 Mean dependent var 7.347619 Adjusted R-squared 0.033226 S.D. dependent var 4.632992 S.E. of regression 4.555374 Akaike info criterion 5.960885 Sum squared resid 394.2773 Schwarz criterion 6.060364 Log likelihood -60.58929 F-statistic 1.687359 Durbin-Watson stat 1.175297 Prob(F-statistic) 0.209493 NHAT = 5.215151515 + 0.2132467532*NAMMOHINH Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Nhật tăng lên 0.21324%. - Ước lượng mô hình hồi qui Đức: Dependent Variable: DUC Method: Least Squares Date: 05/10/10 Time: 21:20 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 3.593939 1.468324 2.447648 0.0243 NAMMOHINH 0.104416 0.125600 0.831332 0.4161 R-squared 0.035098 Mean dependent var 4.638095 Adjusted R-squared -0.015687 S.D. dependent var 3.458248 S.E. of regression 3.485266 Akaike info criterion 5.425359 Sum squared resid 230.7945 Schwarz criterion 5.524837 Log likelihood -54.96626 F-statistic 0.691114 Durbin-Watson stat 2.328057 Prob(F-statistic) 0.416112 DUC = 3.593939394 + 0.1044155844*NAMMOHINH Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Đức tăng lên 0.104415%. - Ước lượng mô hình hồi qui Phap: Dependent Variable: PHAP Method: Least Squares Date: 05/10/10 Time: 21:21 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 1.853247 0.832871 2.225130 0.0384 NAMMOHINH 0.486104 0.071244 6.823112 0.0000 R-squared 0.710166 Mean dependent var 6.714286 Adjusted R-squared 0.694912 S.D. dependent var 3.579146 S.E. of regression 1.976933 Akaike info criterion 4.291363 Sum squared resid 74.25703 Schwarz criterion 4.390842 Log likelihood -43.05931 F-statistic 46.55486 Durbin-Watson stat 0.961869 Prob(F-statistic) 0.000002 PHAP = 1.853246753 + 0.4861038961*NAMMOHINH Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Pháp tăng lên 0.48610%. Ươc lượng mô hình hồi qui: Lạm phát của từng quốc gia theo tỉ lệ lạm phát của Mỹ (Lamphat)i = 1 + 2 (lamphat-USA)i + Ui Đọc và đánh giá từng mô hình ước lượng ? Đưa ra kết luận tổng quát về tác động lạm phát tại từng quốc gia so với lạm phát của USA ? - Anh và US: Dependent Variable: ANH Method: Least Squares Date: 05/10/10 Time: 21:22 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 3.942998 1.029230 3.831018 0.0011 ANHLP 1.344882 0.199758 6.732569 0.0000 R-squared 0.704636 Mean dependent var 8.547619 Adjusted R-squared 0.689091 S.D. dependent var 6.321046 S.E. of regression 3.524566 Akaike info criterion 5.447784 Sum squared resid 236.0287 Schwarz criterion 5.547263 Log likelihood -55.20174 F-statistic 45.32748 Durbin-Watson stat 0.439091 Prob(F-statistic) 0.000002 ANH = 3.942998281 + 1.344882282*ANHLP Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Anh sẽ tăng lên 1.345% - Nhật và US: Dependent Variable: NHAT Method: Least Squares Date: 05/10/10 Time: 21:22 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 5.795073 0.866538 6.687612 0.0000 NHATLP 0.698147 0.177928 3.923768 0.0009 R-squared 0.447610 Mean dependent var 7.347619 Adjusted R-squared 0.418536 S.D. dependent var 4.632992 S.E. of regression 3.532831 Akaike info criterion 5.452469 Sum squared resid 237.1370 Schwarz criterion 5.551947 Log likelihood -55.25092 F-statistic 15.39596 Durbin-Watson stat 0.534453 Prob(F-statistic) 0.000912 NHAT = 5.795072835 + 0.6981471192*NHATLP Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Nhật sẽ tăng lên 0.7%. -Đức va US: Dependent Variable: DUC Method: Least Squares Date: 05/10/10 Time: 21:23 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 4.860462 0.627216 7.749263 0.0000 DUCLP 0.457815 0.142581 3.210916 0.0046 R-squared 0.351757 Mean dependent var 4.638095 Adjusted R-squared 0.317639 S.D. dependent var 3.458248 S.E. of regression 2.856691 Akaike info criterion 5.027598 Sum squared resid 155.0530 Schwarz criterion 5.127076 Log likelihood -50.78978 F-statistic 10.30998 Durbin-Watson stat 1.202348 Prob(F-statistic) 0.004600 DUC = 4.860462352 + 0.4578146464*DUCLP Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Đức sẽ tăng lên 0.46%. -Pháp Và US: Dependent Variable: PHAP Method: Least Squares Date: 05/10/10 Time: 21:25 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 6.251776 1.212106 5.157778 0.0001 PHAPLP 0.290800 0.574747 0.505961 0.6187 R-squared 0.013294 Mean dependent var 6.714286 Adjusted R-squared -0.038637 S.D. dependent var 3.579146 S.E. of regression 3.647635 Akaike info criterion 5.516428 Sum squared resid 252.7996 Schwarz criterion 5.615906 Log likelihood -55.92249 F-statistic 0.255996 Durbin-Watson stat 0.273299 Prob(F-statistic) 0.618704 PHAP = 6.25177575 + 0.2907996784*PHAPLP Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Pháp sẽ tăng lên 0.29%. Nhận xét chung: Từ kết quả trên ta thấy tỉ lệ lạm phát của Anh chịu ảnh hưởng nhiều bởi tỉ lệ lạm phát của Hoa Kì ( tăng lên 1.345%) , còn tỉ lệ lạm phát của Nhật ( 0.7%) và Đức (0.46%), Pháp ( 0.29%) ít chịu ảnh hưởng bởi tỉ lệ lạm phát của Hoa Kì. Bài tập 2 : Nhà phân tích học viện nghiên cứu Anh ngữ đã thu thập dữ liệu từ 8 sinh viên khác nhau trong một lớp . Bảng dữ liệu gốc được trình bài như sau : Sinh viên Điểm tóan Điểm khoa học điểm Anh Văn 1 13.5 9.9 13.3 2 13.7 6.8 10 3 7 5.5 8.9 4 7.4 5.7 2.4 5 13.2 10.3 8.2 6 7.3 1.8 6.3 7 5.2 5.2 7.7 8 8.4 6.9 2.9 Người ta muốn xem xét xem là có mối quan hệ nào giữa điểm môn Anh văn và điểm môn Khoa học của sinh viên . Cụ thể là chúng ta có thể dựa vào điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh văn hay không - Cũng như dựa vào điểm môn Tóan của sinh viên có thể dự đóan điểm của môn Anh văn hay không ? Cho từng cặp môn học tương ứng , anh chị : Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? - Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát ? Điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh văn hay không: Dependent Variable: DIEMANHVAN Method: Least Squares Date: 05/11/10 Time: 21:13 Sample: 1 8 Included observations: 8 Variable Coefficient Std. Error t-Statistic Prob. C 3.762656 3.422463 1.099400 0.3137 DIEMKHOAHOC 0.568114 0.489567 1.160442 0.2900 R-squared 0.183299 Mean dependent var 7.462500 Adjusted R-squared 0.047182 S.D. dependent var 3.605130 S.E. of regression 3.519055 Akaike info criterion 5.566580 Sum squared resid 74.30247 Schwarz criterion 5.586440 Log likelihood -20.26632 F-statistic 1.346627 Durbin-Watson stat 1.325655 Prob(F-statistic) 0.289950 DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC Khi điểm khoa học tăng lên một điểm thì về trung bình điểm môn anh văn sẽ tăng lên 0.56 điểm. Điểm môn Tóan của sinh viên có thể dự đóan điểm của môn Anh văn hay không: Dependent Variable: DIEMANHVAN Method: Least Squares Date: 05/11/10 Time: 21:13 Sample: 1 8 Included observations: 8 Variable Coefficient Std. Error t-Statistic Prob. C 1.691257 3.486802 0.485045 0.6448 DIEMTOAN 0.609907 0.348935 1.747907 0.1311 R-squared 0.337396 Mean dependent var 7.462500 Adjusted R-squared 0.226962 S.D. dependent var 3.605130 S.E. of regression 3.169724 Akaike info criterion 5.357484 Sum squared resid 60.28290 Schwarz criterion 5.377344 Log likelihood -19.42994 F-statistic 3.055180 Durbin-Watson stat 2.104833 Prob(F-statistic) 0.131069 DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN Khi điểm toán tăng lên một điểm thì về trung bình điểm môn anh văn sẽ tăng lên 0.6 điểm. è Kết Luận tổng quát: Ta thấy hệ số tương quan của 2 mô hình thấp (R2<0.5) do đó nó không giải thích dược tất cả các biến đưa váo trong mô hình. Có nghĩa là điểm môn Khoa Học và môn Toán ảnh hưởng rất ít đến điểm của môn Anh văn. b. Giải thích ý nghĩa của hệ số tương quan ? Giải thích ý nghĩa của hệ số độ dốc và tung độ gốc của phương trình hồi qui ? Ý nghĩa của hệ số tương quan: R2 đo lường mối tương quan giữa biến phụ thuộc với biến độc lập. R2 ở 2 mô hình trên đều rất nhỏ (18.32 % và 33.74% ) chứng tỏ điểm của môn Anh Văn không phụ thuộc nhiều vào môn khoa học hay môn toán. Ý nghĩa của hệ số độ dốc và tung độ gốc: DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC + b1= 3.762656345: khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn bằng 3.76 + b2 = 0.5681141889 : khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.57 điểm DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN + b1= 1.691256533: khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn bằng 1.69 + b2 = 0.6099068394: khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.61 điểm Bài tập 3: Ta có tập dữ liệu sau bao gồm 64 quan sát của các quốc gia với các biến số được giải thích bên dưới của bảng số liệu : obs CM FLR PGNP TFR obs CM FLR PGNP TFR 1 128 37 1870 6.66 33 142 50 8640 7.17 2 204 22 130 6.15 34 104 62 350 6.6 3 202 16 310 7 35 287 31 230 7 4 197 65 570 6.25 36 41 66 1620 3.91 5 96 76 2050 3.81 37 312 11 190 6.7 6 209 26 200 6.44 38 77 88 2090 4.2 7 170 45 670 6.19 39 142 22 900 5.43 8 240 29 300 5.89 40 262 22 230 6.5 9 241 11 120 5.89 41 215 12 140 6.25 10 55 55 290 2.36 42 246 9 330 7.1 11 75 87 1180 3.93 43 191 31 1010 7.1 12 129 55 900 5.99 44 182 19 300 7 13 24 93 1730 3.5 45 37 88 1730 3.46 14 165 31 1150 7.41 46 103 35 780 5.66 15 94 77 1160 4.21 47 67 85 1300 4.82 16 96 80 1270 5 48 143 78 930 5 17 148 30 580 5.27 49 83 85 690 4.74 18 98 69 660 5.21 50 223 33 200 8.49 19 161 43 420 6.5 51 240 19 450 6.5 20 118 47 1080 6.12 52 312 21 280 6.5 21 269 17 290 6.19 53 12 79 4430 1.69 22 189 35 270 5.05 54 52 83 270 3.25 23 126 58 560 6.16 55 79 43 1340 7.17 24 12 81 4240 1.8 56 61 88 670 3.52 25 167 29 240 4.75 57 168 28 410 6.09 26 135 65 430 4.1 58 28 95 4370 2.86 27 107 87 3020 6.66 59 121 41 1310 4.88 28 72 63 1420 7.28 60 115 62 1470 3.89 29 128 49 420 8.12 61 186 45 300 6.9 30 27 63 19830 5.23 62 47 85 3630 4.1 31 152 84 420 5.79 63 178 45 220 6.09 32 224 23 530 6.5 64 142 67 560 7.2 Trong đó: - CM : Tỉ lệ tử vong của trẽ sơ sinh (%) - FLR : Tỉ lệ biết chử của dân số (%) - PGNP : GNP bình quân đầu người (Đô la) - TFR : Tỉ lệ sinh chung của dân số (%) 1. Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic ? - Sau đó vẽ biểu đồ phân tán giữa CM và FLR; CM và PGNP; CM và TFR. Rồi từ đó đối chiếu đồ thị với các giải thích của anh chị lúc ban đầu ( nêu lên sự phù hợp và không phù hợp với lời giải thích ban đầu) - Tỷ lệ tử vong và tỷ lệ biết chữ: Hai biến này có mối quan hệ nghịch biến, nếu tỷ lệ biết chữ thấp thì tỷ lệ tử vong sẽ cao và ngược lại. - Tỷ lệ tử vong và GNP bình quân đầu người: Khi GNP bình quân đầu người tăng lên thì tỷ lệ tử vong của trẻ sơ sinh sẽ giảm đi vì khi đó trẻ sẽ được chăm sóc tốt và toàn diện hơn. Ngược lại - Tỷ lệ tử vong và tỷ lệ sinh chung của dân số: Nếu tỷ lệ sinh chung tăng lên thì-> dân số tăng lên-> gia đình sẽ đông con hơn->nghèo->không chăm sóc đầy đủ cho con cái->tỷ lệ tử vong tăng. Biểu đồ phân tán giữa CM và FLR: CM va PGNP -Phù hợp với lời gải thích ban đầu. CM va TFR - Không phù hợp với lời giải thích ban đầu vì : qua biểu đồ cho thấy khi tỷ lệ sinh tăng ( giảm ) tỷ lệ tử cũng tăng ( giảm ) theo. Đây là mối quan hệ tỉ lệ thuận CM và FLR Qua đồ thị cho thấy tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp và ngược lại. Phù hợp với lời giải thích ban đầu. 2. Anh chị hãy xây dựng mô hình hồi qui đơn cho CM va PGNP . Nhận xét các thông tin chính từ mô hình nầy như ý nghĩa thống kê của hệ số hồi qui, hệ số xác định R2 . Dependent Variable: CM Method: Least Squares Date: 05/11/10 Time: 23:05 Sample: 1 64 Included observations: 64 Variable Coefficient Std. Error t-Statistic Prob. C 157.4244 9.845583 15.98935 0.0000 PGNP -0.011364 0.003233 -3.515661 0.0008 R-squared 0.166217 Mean dependent var 141.5000 Adjusted R-squared 0.152769 S.D. dependent var 75.97807 S.E. of regression 69.93413 Akaike info criterion 11.36374 Sum squared resid 303228.5 Schwarz criterion 11.43120 Log likelihood -361.6396 F-statistic 12.35987 Durbin-Watson stat 1.931458 Prob(F-statistic) 0.000826 CM = 157.4244406 - 0.01136445358*PGNP Khi GNP bình quân đầu người tăng lên 1USD thì Tỷ lệ tử vong của trẻ sơ sinh giảm 1.1%. Hệ số R2=16.62% là không tốt vì không giải thích được các biến đưa vào mô hình. Hay nói cách khác tỉ lệ tử vong của trẻ sơ sinh ít chịu ảnh hưởng bởi GNP bình quân đầu người mà phụ thuộc vào nhiều nhân tố khác nữa. 3. Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và PGNP. Nhận xét thông tin chính từ mô hình nầy , như ý nghĩa thống kê của hệ số , hệ số xác định R2. Dependent Variable: CM Method: Least Squares Date: 05/11/10 Time: 23:06 Sample: 1 64 Included observations: 64 Variable Coefficient Std. Error t-Statistic Prob. C 263.6416 11.59318 22.74109 0.0000 FLR -2.231586 0.209947 -10.62927 0.0000 PGNP -0.005647 0.002003 -2.818703 0.0065 R-squared 0.707665 Mean dependent var 141.5000 Adjusted R-squared 0.698081 S.D. dependent var 75.97807 S.E. of regression 41.74780 Akaike info criterion 10.34691 Sum squared resid 106315.6 Schwarz criterion 10.44811 Log likelihood -328.1012 F-statistic 73.83254 Durbin-Watson stat 2.186159 Prob(F-statistic) 0.000000 CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP Trong điều kiện các yếu tố khác không đổi, khi GDP đấu người tăng lên 1 USD thì tỷ lệ tử vong của trẻ sơ sinh tăng giảm đi 5%. Hệ số R2 = 70.76% được xem là không tốt vì không giải thích được tất cả các biến đưa vào mô hình. 4 . So sánh mô hình đơn và mô hình bội anh chị có nhận xét gì về hệ số hồi qui tìm được của biến PGNP , nếu phải chọn hệ số PGNP của mô hình nào để giải thích tác động của PGNP lên CM ? Tại sao? CM = 157.4244406 - 0.01136445358*PGNP CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP - Nhận xét: hệ số hồi quy của biến PGNP của mô hình đơn > hệ số hồi quy PGNP cảu mô hình đa biến. - Chọn mô hình 2 vì: ta thấy hệ số của FLR < nên ta bác bỏ H0 tức hệ số FLR có ý nghĩa thống kê. ( Kiếm định hệ số Prob ) 5. Hồi qui CM cho tất cả các biến trong tập dữ liệu ? Nhận xét va cho ý kiến của anh chị? Dependent Variable: CM Method: Least Squares Date: 05/11/10 Time: 23:17 Sample: 1 64 Included observations: 64 Variable Coefficient Std. Error t-Statistic Prob. C 168.3067 32.89165 5.117003 0.0000 FLR -1.768029 0.248017 -7.128663 0.0000 PGNP -0.005511 0.001878 -2.934275 0.0047 TFR 12.86864 4.190533 3.070883 0.0032 R-squared 0.747372 Mean dependent var 141.5000 Adjusted R-squared 0.734740 S.D. dependent var 75.97807 S.E. of regression 39.13127 Akaike info criterion 10.23218 Sum squared resid 91875.38 Schwarz criterion 10.36711 Log likelihood -323.4298 F-statistic 59.16767 Durbin-Watson stat 2.170318 Prob(F-statistic) 0.000000 CM = 168.3066897 - 1.768029221*FLR - 0.00551122506*PGNP + 12.86863633*TFR - Trong điều kiện các yếu tố khác không đổi thì khi FLR tăng lên 1% thì về trung bình CM giảm 1.768%, PGNP tăng lên 1usd thì về trung bình CM giảm 0.0055%, TFR tăng lên 1% thì về trung bình CM cũng tăng lên 12.8686%. - R2 = 0.747372 cao hơn các mô hình trên, cho thấy mức độ phù hợp này khá cao, có ý nghĩa thống kê hơn cả các mô hình trên. Bài 4 :Ta có tập dữ liệu sau: obs AGED ALCC EDU1 EDU2 HEXC INCC MORT PHYS POV TOBC URB 1 0.122 1.9 0.565 0.122 1620 10673 934.9 142 0.189 114.5 0.675 2 0.034 3.86 0.825 0.211 1667 18187 396.2 127 0.107 128.9 0.417 3 0.123 3.08 0.724 0.174 1473 12795 771.5 184 0.132 107.1 0.764 4 0.149 1.78 0.555 0.108 1552 10476 1022.8 136 0.19 125.8 0.397 5 0.106 3.19 0.735 0.196 2069 16065 766 235 0.114 102.8 0.957 6 0.09 3.09 0.786 0.23 1664 14812 625.7 196 0.101 112.4 0.817 7 0.133 2.8 0.703 0.207 1945 18089 888.4 275 0.08 111 0.926 8 0.114 3.17 0.686 0.175 1691 14272 880.2 185 0.119 144.5 0.659 9 0.122 5.34 0.671 0.275 3872 18168 1120.5 552 0.186 122.1 1 10 0.177 3.12 0.667 0.149 1886 13742 1065.6 191 0.135 124.2 0.908 11 0.1 2.48 0.564 0.146 1755 12543 814.3 159 0.166 128.8 0.648 12 0.097 2.97 0.738 0.203 1693 13814 554.2 212 0.099 69.8 0.763 13 0.112 2.43 0.737 0.158 1288 11120 708.7 118 0.126 100.7 0.2 14 0.12 2.77 0.665 0.162 1864 14738 886.5 199 0.11 121.6 0.825 15 0.119 2.19 0.664 0.125 1625 12446 876.3 142 0.097 135.3 0.681 16 0.145 2.09 0.715 0.139 1758 12594 966.1 136 0.101 109.4 0.434 17 0.134 1.95 0.733 0.17 1820 13775 900.3 162 0.101 115.7 0.534 18 0.12 1.85 0.531 0.111 1404 10824 935 149 0.176 182.4 0.461 19 0.101 2.63 0.577 0.139 1716 11274 825.4 173 0.186 125 0.692 20 0.133 2.57 0.687 0.144 1641 11887 979.4 165 0.13 127.9 0.361 21 0.106 2.84 0.674 0.204 1732 15864 833.6 303 0.098 121.9 0.929 22 0.136 3.04 0.722 0.2 2289 16380 955.4 300 0.096 117.2 0.906 23 0.114 2.6 0.68 0.143 1996 13608 866.2 174 0.104 126.6 0.799 24 0.125 2.68 0.731 0.174 1888 14087 830.2 203 0.095 113 0.666 25 0.12 2.06 0.548 0.123 1519 9187 944.6 117 0.239 115.3 0.305 26 0.137 2.27 0.635 0.139 1858 13244 1000.4 179 0.122 129.2 0.66 27 0.121 2.95 0.744 0.175 1494 10974 815 136 0.123 103.6 0.242 28 0.136 2.41 0.734 0.155 1766 13281 928.5 156 0.107 105.1 0.476 29 0.103 5.19 0.755 0.144 1946 14488 772.3 155 0.087 146.7 0.826 30 0.116 4.91 0.723 0.182 1417 14964 849.1 179 0.085 201.1 0.563 31 0.129 2.83 0.674 0.183 1702 17211 940.7 219 0.095 116.9 1 32 0.098 2.75 0.689 0.176 1385 10914 672.8 161 0.176 88 0.489 33 0.128 2.67 0.663 0.179 2412 16050 969.9 287 0.134 115.9 0.912 34 0.115 2.13 0.548 0.132 1380 11617 846.3 168 0.148 156.3 0.554 35 0.13 2.55 0.664 0.148 1872 12052 821.6 157 0.126 103.2 0.384 36 0.123 2.26 0.67 0.137 1833 13228 920.6 182 0.103 126.7 0.789 37 0.124 1.91 0.66 0.151 1644 12232 900.8 138 0.134 124.2 0.588 38 0.134 2.63 0.756 0.179 1654 12622 889.7 189 0.107 118.6 0.677 39 0.146 2.25 0.647 0.136 1894 13437 1043.9 214 0.105 115.8 0.848 40 0.146 2.92 0.611 0.154 2054 13906 997.6 223 0.103 133.4 0.926 41 0.105 2.5 0.537 0.134 1341 10586 812.6 146 0.166 125.4 0.605 42 0.139 2.33 0.679 0.14 1617 11161 932.6 130 0.169 104.4 0.291 43 0.123 1.95 0.562 0.126 1671 11243 906.8 176 0.165 128.7 0.671 44 0.095 2.82 0.626 0.169 1577 13483 722.2 160 0.147 115.9 0.813 45 0.08 1.53 0.8 0.199 1203 10493 550.1 171 0.103 66.5 0.774 46 0.119 3.12 0.71 0.19 1481 12117 871.4 232 0.121 144.5 0.232 47 0.105 2.55 0.624 0.191 1498 14542 794.1 194 0.118 134.6 0.722 48 0.117 2.71 0.776 0.19 1660 13876 782.8 196 0.098 96.5 0.816 49 0.136 1.68 0.56 0.104 1542 10193 1003.8 156 0.15 109.1 0.365 50 0.13 3.19 0.696 0.148 1862 13154 868.8 172 0.087 107 0.665 51 0.084 2.86 0.779 0.172 1453 13223 642.9 125 0.079 125.7 0.292 Trong đó : - MORT : Tỉ lệ tử vong chung trên 100.000 dân số INCC : Thu nhập đầu người tính bằng USD POV : Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó EDU1 : Tỉ lệ dân số đã học trung học EDU2 : Tỉ lệ dân số đã học trung học và đại học. ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người. TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao HEXC : Chi tiêu y tế bình quân đầu người (USD) URB : Tỉ lệ dân số sống tại các khu vực thành thị AGED : Tỉ lệ dân số có độ tuồi trên 65 PHYS : Các cán bộ y tế trên 1000.000 dân Yêu cầu : Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích, hãy lý giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể và chỉ ra hướng tác động nầy? - Thu nhập (INCC): nếu không có thu nhập sẽ dẫn đến nghèo đói, bệnh tật không có tiền mua thuốc… - Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó (POV): Không có thu nhập, nghèo đói -> thiều ăn, bệnh tật…. - Tỷ lệ EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã học trung học và đại học càng cao thi trình độ dân trí của người dân càng cao, mới tiếp thu được những kiến thức tiến bộ về sức khỏe, y tế, khoa học….từ đó có thể giảm bớt được tỉ lệ tử vong chung. - Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người(ALCC): Uống rượu sẽ dẫn đến tai nạn, bệnh tật-> tử vong - Hút thuốc(TOBC): Dẫn tới các căn bênh về đường hô hấp -Chi tiêu y tế: Khi bị bệnh cẫn phải tới bênh viên nhưng nếu chi tiêu cho y tế thấp sẽ dẫn đến không có thuốc chữa bệnh-> tử vong. - Tỉ lệ dân số sống tại các khu vực thành thị(URB): Dân số sống ở thành thị sẽ mắc phải sống trong môi trường ô nhiễm, tiếng ồn-> mắc một số căn bệnh. - Tỉ lệ dân số có độ tuồi trên 65(AGED): Những người cao tuổi khả năng chống lại bệnh tật, thời tiết kém-> dễ tử vong. - Các cán bộ y tế(PHYS): Cán bộ y tế mà ít, kém chất lượng cũng sẽ dẫn đến tỷ lệ tử vong chung. Ước lượng mô hình hồi qui đa biến bao gồm tất cả những biến giải thích đang có? Thực hiện kiểm định cho mức ý nghĩa tổng quát – Nhận xét sự thích hợp ? Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn bỏ qua. Dependent Variable: MORT Method: Least Squares Date: 05/11/10 Time: 23:30 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 46.59555 168.2097 0.277009 0.7832 AGED 4126.895 322.3451 12.80272 0.0000 ALCC -25.91511 11.09681 -2.335366 0.0246 EDU1 68.77913 196.8405 0.349415 0.7286 EDU2 -1180.217 548.8868 -2.150201 0.0376 HEXC 0.073889 0.034127 2.165088 0.0364 INCC 0.004511 0.005817 0.775551 0.4426 PHYS 0.640384 0.263636 2.429044 0.0197 POV 549.8647 308.5540 1.782069 0.0823 TOBC 1.470480 0.353504 4.159732 0.0002 URB -32.45556 35.64423 -0.910542 0.3680 R-squared 0.948570 Mean dependent var 855.0059 Adjusted R-squared 0.935713 S.D. dependent var 137.9660 S.E. of regression 34.98117 Akaike info criterion 10.13592 Sum squared resid 48947.30 Schwarz criterion 10.55259 Log likelihood -247.4660 F-statistic 73.77592 Durbin-Watson stat 1.597995 Prob(F-statistic) 0.000000 MORT = 46.59554973 + 4126.895059*AGED - 25.91510605*ALCC + 68.7791315*EDU1 - 1180.217201*EDU2 + 0.07388858751*HEXC + 0.00451136983*INCC + 0.6403836367*PHYS + 549.8646857*POV + 1.470480259*TOBC - 32.45555872*URB Ta thấy hệ số Prob(F-statistic) < nên ta bác bỏ H0 có nghĩa là có ít nhất 1 biến có ý nghĩa thống kê trong mô hình này. Nhận xét sự thích hợp: Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn bỏ qua. Qua kiểm đinh hệ số Prob ta thấy tất cả các biến trong mô hình đếu có ý nghĩa thống kê, chỉ trừ 3 biến EDU1>, INCC>, URB> là không có ý nghĩa thống kê nên đây là các biến ta có thể bỏ qua. 3. Đầu tiên hãy thực hiện một kiểm định WALD đối với việc bỏ tất cả những biến nầy. Sau đó, bỏ tất cả chúng và ước lượng lại mô hình . hãy đánh giá chất lượng của phép hồi qui mới nầy ? Mô hình thu hẹp: Dependent Variable: MORT Method: Least Squares Date: 05/16/10 Time: 10:56 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 73.76836 94.44515 0.781071 0.4390 HEXC 0.089816 0.027059 3.319302 0.0018 EDU2 -843.8800 352.4100 -2.394597 0.0211 ALCC -25.25888 10.23731 -2.467337 0.0177 AGED 4167.319 307.4568 13.55416 0.0000 PHYS 0.479654 0.193828 2.474637 0.0174 POV 452.7655 161.4134 2.805006 0.0075 TOBC 1.563512 0.286509 5.457105 0.0000 R-squared 0.946903 Mean dependent var 855.0059 Adjusted R-squared 0.938259 S.D. dependent var 137.9660 S.E. of regression 34.28140 Akaike info criterion 10.05018 Sum squared resid 50534.21 Schwarz criterion 10.35321 Log likelihood -248.2797 F-statistic 109.5479 Durbin-Watson stat 1.610035 Prob(F-statistic) 0.000000 Mô hình đầy đủ: Dependent Variable: MORT Method: Least Squares Date: 05/11/10 Time: 23:30 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 46.59555 168.2097 0.277009 0.7832 AGED 4126.895 322.3451 12.80272 0.0000 ALCC -25.91511 11.09681 -2.335366 0.0246 EDU1 68.77913 196.8405 0.349415 0.7286 EDU2 -1180.217 548.8868 -2.150201 0.0376 HEXC 0.073889 0.034127 2.165088 0.0364 INCC 0.004511 0.005817 0.775551 0.4426 PHYS 0.640384 0.263636 2.429044 0.0197 POV 549.8647 308.5540 1.782069 0.0823 TOBC 1.470480 0.353504 4.159732 0.0002 URB -32.45556 35.64423 -0.910542 0.3680 R-squared 0.948570 Mean dependent var 855.0059 Adjusted R-squared 0.935713 S.D. dependent var 137.9660 S.E. of regression 34.98117 Akaike info criterion 10.13592 Sum squared resid 48947.30 Schwarz criterion 10.55259 Log likelihood -247.4660 F-statistic 73.77592 Durbin-Watson stat 1.597995 Prob(F-statistic) 0.000000 Ta có : UuR2= 0.9485 RR2= 0.9469 F= = 0.414239 Vậy F(tính toán)<F(tra bảng): nên ta chấp nhận H0 có nghĩa là 3 biến EDU1, INCC, URB không có ý nghĩa thống kê. - Ước lượng lại mô hình: Dependent Variable: MORT Method: Least Squares Date: 05/16/10 Time: 13:50 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 73.76836 94.44515 0.781071 0.4390 HEXC 0.089816 0.027059 3.319302 0.0018 EDU2 -843.8800 352.4100 -2.394597 0.0211 ALCC -25.25888 10.23731 -2.467337 0.0177 AGED 4167.319 307.4568 13.55416 0.0000 PHYS 0.479654 0.193828 2.474637 0.0174 POV 452.7655 161.4134 2.805006 0.0075 TOBC 1.563512 0.286509 5.457105 0.0000 R-squared 0.946903 Mean dependent var 855.0059 Adjusted R-squared 0.938259 S.D. dependent var 137.9660 S.E. of regression 34.28140 Akaike info criterion 10.05018 Sum squared resid 50534.21 Schwarz criterion 10.35321 Log likelihood -248.2797 F-statistic 109.5479 Durbin-Watson stat 1.610035 Prob(F-statistic) 0.000000 MORT = 73.76835504 + 0.08981575805*HEXC - 843.8800387*EDU2 - 25.2588845*ALCC + 4167.318921*AGED + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC - Đánh giá chất lượng của phép hồi quy mới: - Việc đưa 3 biến không có ảnh đến biến phụ thuộc MORT đã gây ra hiện tượng đa cộng tuyến, làm cho mô hình ban đầu có hệ số tương quan R2 cao, trị thống kê mất ý nghĩa, làm cho chúng ta có đánh giá sai lầm về mô hình. - R2 = 94.69% được đánh giá là tốt, vì giải thích đầy đủ các biến đưa vào mô hình, tức là mô hình đưa ra có ý nghĩa thống kê 4.Trở lại với mô hình gốc ban đầu ( Mô hình không giới hạn U) , lần lượt mỗi lần bỏ một biến có ít ý nghĩa nhất và ước lượng lại . Đánh giá chất lượng của phép hồi qui mới ? Bỏ EDU1 Dependent Variable: MORT Method: Least Squares Date: 05/16/10 Time: 13:57 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 92.81956 102.7758 0.903127 0.3717 AGED 4144.662 314.8831 13.16254 0.0000 ALCC -24.63643 10.36327 -2.377283 0.0222 EDU2 -1057.359 416.9455 -2.535966 0.0151 HEXC 0.078052 0.031636 2.467190 0.0179 INCC 0.004070 0.005617 0.724592 0.4728 PHYS 0.591597 0.221220 2.674242 0.0107 POV 469.5791 203.7221 2.304998 0.0263 TOBC 1.426362 0.326631 4.366888 0.0001 URB -35.97989 33.81937 -1.063884 0.2936 R-squared 0.948413 Mean dependent var 855.0059 Adjusted R-squared 0.937089 S.D. dependent var 137.9660 S.E. of regression 34.60463 Akaike info criterion 10.09976 Sum squared resid 49096.70 Schwarz criterion 10.47854 Log likelihood -247.5438 F-statistic 83.75303 Durbin-Watson stat 1.585340 Prob(F-statistic) 0.000000 MORT = 92.8195617 + 4144.66192*AGED - 24.63643081*ALCC - 1057.359357*EDU2 + 0.07805159076*HEXC + 0.004070138276*INCC + 0.5915970828*PHYS + 469.5791064*POV + 1.426361908*TOBC - 35.97989484*URB Mô hình mới vẫn được đánh giá là không tốt vì: R2 = 0.948413 cao do xảy ra hiện tượng đa cộng tuyến. 5.với mô hình mới có K-1 biến giải thích, tiếp tục như câu 4 và yêu cầu như trên ? Bỏ EDU1 Và INCC Dependent Variable: MORT Method: Least Squares Date: 05/16/10 Time: 14:02 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 103.0909 101.2163 1.018521 0.3143 AGED 4127.928 312.2544 13.21976 0.0000 ALCC -25.19964 10.27548 -2.452404 0.0184 EDU2 -911.4815 363.0489 -2.510630 0.0160 HEXC 0.089616 0.027160 3.299569 0.0020 PHYS 0.550671 0.212676 2.589252 0.0132 POV 396.2853 175.8333 2.253755 0.0295 TOBC 1.533024 0.289927 5.287621 0.0000 URB -24.63730 29.80849 -0.826520 0.4132 R-squared 0.947753 Mean dependent var 855.0059 Adjusted R-squared 0.937801 S.D. dependent var 137.9660 S.E. of regression 34.40841 Akaike info criterion 10.07326 Sum squared resid 49725.42 Schwarz criterion 10.41417 Log likelihood -247.8682 F-statistic 95.23350 Durbin-Watson stat 1.629472 Prob(F-statistic) 0.000000 MORT = 103.0909379 + 4127.928148*AGED - 25.19963943*ALCC - 911.4814852*EDU2 + 0.08961614111*HEXC + 0.5506708875*PHYS + 396.2853088*POV + 1.533024196*TOBC - 24.63729751*URB Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do vẫn còn hiện tượng đa cộng tuyến. 6.Tiếp tục quá trình nầy cho đến khi tất cả các biến còn lại đều có ý nghĩa. Mô hình cuối nầy có giống như mô hình giới hạn R mà các bạn thu được từ kết quả câu 3 hay không ? từ kết quả đó bạn có suy gẫm gì? Bỏ EDU1 Và INCC và URB Dependent Variable: MORT Method: Least Squares Date: 05/16/10 Time: 14:03 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 73.76836 94.44515 0.781071 0.4390 AGED 4167.319 307.4568 13.55416 0.0000 ALCC -25.25888 10.23731 -2.467337 0.0177 EDU2 -843.8800 352.4100 -2.394597 0.0211 HEXC 0.089816 0.027059 3.319302 0.0018 PHYS 0.479654 0.193828 2.474637 0.0174 POV 452.7655 161.4134 2.805006 0.0075 TOBC 1.563512 0.286509 5.457105 0.0000 R-squared 0.946903 Mean dependent var 855.0059 Adjusted R-squared 0.938259 S.D. dependent var 137.9660 S.E. of regression 34.28140 Akaike info criterion 10.05018 Sum squared resid 50534.21 Schwarz criterion 10.35321 Log likelihood -248.2797 F-statistic 109.5479 Durbin-Watson stat 1.610035 Prob(F-statistic) 0.000000 MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC - 843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC Sau khi bỏ tất cả các biến không có tác động đến MORT, ta thấy mô hình thu được giống mô hình đã ước lượng lại ở câu 3. Qua kết quả trên cho ta thấy: hậu quả của hiện tượng đa cộng tuyến là nó làm cho chúng ta lầm tưởng rằng mô hình không giới hạn ban đầu có ý nghĩa thống kê, các biến đưa vào mô hình đều có tác động đến biến phụ thuộc do R2 rất lớn ( tức giải thích được tất cả các biển đưa vào mô hình ). Dễ làm cho chúng ta có những kết luận sai lầm về mô hình ban đầu. Bài 5: Tổng cục thống kê quốc gia của Đài Loan đưa ra một số dữ liệu về GDP thực của khu vực nông nghiệp từ năm 1958 đến 1972 như sau : Y : GDP thực của khu vực nông nghiệp ( triệu USD) X2 : Số ngày lao động hằng năm của khu vực nông nghiệp ( triệu ngày công lao động ) X3 : Vốn thực của khu vực nông nghiệp hằng năm ( triệu USD) YEAR Y X2 X3 1958 16607.7 275.5 17803.7 1959 17511.3 274.4 18096.8 1960 20171.2 269.7 18271.8 1961 20932.9 267 19167.3 1962 20406 267.8 19647.6 1963 20831.6 275 20803.5 1964 24806.3 283 22076.6 1965 26465.8 300.7 23445.2 1966 27403 307.5 24939 1967 28628.7 303.7 26713.7 1968 29904.5 304.7 29957.8 1969 27508.2 298.6 31585.9 1970 29035.5 295.5 33474.5 1971 29281.5 299 34821.8 1972 31535.8 288.1 41794.3 Hãy ước lượng hàm Cobb-Duoglas có dạng như sau : Y= A.eR.T.X21. X3 2 Ta lấy Ln 2 vế: lnY=lnA + RT + 1lnX2 + 2lnX3 Trong đó T là biến xu thế theo thời gian R là năng suất lao động trung bình thay đổi theo thời gian T. đặt Y* = lnY X2* = lnX2 X3* = lnX3 b1* = lnA ta có phương trình: Y* = b1* + RT + 1X2 + 2X3 (1) T = năm - 1958 ước lượng phương trình (1) ta được: Dependent Variable: LNGDP Method: Least Squares Date: 05/16/10 Time: 14:14 Sample: 1958 1972 Included observations: 15 Variable Coefficient Std. Error t-Statistic Prob. C 9.412886 4.129936 2.279185 0.0436 T 0.064795 0.018935 3.421919 0.0057 LNLAODONG 0.878171 0.432277 2.031500 0.0671 LNVON -0.468799 0.289806 -1.617632 0.1340 R-squared 0.946249 Mean dependent var 10.09653 Adjusted R-squared 0.931589 S.D. dependent var 0.207914 S.E. of regression 0.054381 Akaike info criterion -2.762431 Sum squared resid 0.032530 Schwarz criterion -2.573617 Log likelihood 24.71823 F-statistic 64.54878 Durbin-Watson stat 1.938628 Prob(F-statistic) 0.000000 LNGDP = 9.412886114 + 0.06479543845*T + 0.8781710093*LNLAODONG - 0.4687993113*LNVON lấy e mũ 2 vế ta được: GDP = e 9.412886114*e 0.06479543845*T *LAODONG 0.8781710093*VON -0.4687993113 (2) Phương trình (2) là phương trình hồi qui ước lượng từ hàm Cobb-Duoglas có dạng: Y= A.eR.T.X21. X3 2 Trong đó: A = e 9.412886114 R = 0.06479543845 b 1 = 0.8781710093 b 2 = -0.4687993113 Hãy giải thích các hệ số ước lượng R , 1 và 2 theo ý nghĩa kinh tế. + Hệ số ước lượng R: trong điều kiện các yếu tố khác không thay đổi, qua mỗi năm năng suất trung bình R tăng thêm 1 đơn vị thì về trung bình GDP tăng lên e0.06479543845 triệu USD. + Hệ số ước lượng 1: trong điều kiện các yếu tố khác không thay đổi khi Số ngày lao động hằng năm tăng thêm 1 triệu ngày công lao động thì về trung bình GDP thực của khu vực nông nghiệp tăng thêm 10.8781710093 triệu USD. + Hệ số ước lượng 2: trong điều kiện các yếu tố khác không thay đổi, khi đàu tư thêm 1 triệu USD vào khu vực nông nghiệp thì về trung bình GDP giảm 1/10.4687993113 triệu USD. Chỉ ra rằng khu vực nông nghiệp Đài loan có phát triển hiệu quả không ? Giải thích tại sao anh chị có nhận định như vậy? Ngòai những lý do về vốn, lao động , anh chị còn có giả thiết nào khác về nguyên nhân tác động đến sự phát triển của khu vực Đài loan ? Mô hình trên cho thấy khu vực nông nghiệp Đài Loan phát triển không hiệu quả. Bởi vì: khi vốn đầu tư càng tăng thêm thì GDP lại giảm đi, do vốn đầu tư cho nông nghiệp chưa được sử dụng hiệu quả. Ngoài những lý do về vốn và lao động nông nghiệp Đài Loan thì còn một số nguyên nhân tác động đến sự phát triển của khu vực Đài loan đó là: công nghệ trong sản xuất và giống… cũng có thể do các yếu tố khác như đất đai, khí hậu, kĩ thuật sản xuất…đây là một số yếu tố có thể ảnh hưởng đến sự phát triển nông nghiệp. Bài tập 6: Một quốc gia có dữ liệu về tiết kiệm và tiêu dùng như sau : YEAR SAVINGS INCOME YEAR SAVINGS INCOME 1970 61 727.1 1983 167 2522.4 1971 68.6 790.2 1984 235.7 2810 1972 63.6 855.3 1985 206.2 3002 1973 89.6 965 1986 196.5 3187.6 1974 97.6 1054.2 1987 168.4 3363.1 1975 104.4 1159.2 1988 189.1 3640.8 1976 96.4 1273 1989 187.8 3894.5 1977 92.5 1401.4 1990 208.7 4166.8 1978 112.6 1580.1 1991 246.4 4343.7 1979 130.1 1769.5 1992 272.6 4613.7 1980 161.8 1973.3 1993 214.4 4790.2 1981 199.1 2200.2 1994 189.4 5021.7 1982 205.5 2347.3 1995 249.3 5320.8 Saving :Tiết kiệm quốc gia tính bằng tỉ USD Income: Thu nhập quốc gia tính bằng tỉ USD Yêu cầu : Giai đọan 1970-1981 chính sách tiền tệ thắt chặt và mưc lãi suất rất cao , anh chi xác định Dum = 0 cho giai đọan nầy . Và Dum = 1 cho giai đọan 1982-1995 đây là giai đọan chính sách tiền tệ nới lỏng và lãi suất thấp . Xây dựng hàm hồi qui đơn tuyến tính cho từng giai đọan nói trên theo mô thức : Saving = 1 + 2* Income + u Có nghĩa là anh chị xây dựng dạng hàm nầy cho giai đọan 1970-1981 và giai đọai 1982-1995. ý nghĩa kinh tế của 2 đo lường đại lượng gì trong hàm hồi qui? Giao đoạn 70-81: Dependent Variable: SAVINGS Method: Least Squares Date: 05/16/10 Time: 14:26 Sample: 1970 1981 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 1.016117 11.63771 0.087313 0.9321 INCOME 0.080332 0.008367 9.601576 0.0000 R-squared 0.902143 Mean dependent var 106.4417 Adjusted R-squared 0.892358 S.D. dependent var 40.72222 S.E. of regression 13.36051 Akaike info criterion 8.173495 Sum squared resid 1785.032 Schwarz criterion 8.254313 Log likelihood -47.04097 F-statistic 92.19026 Durbin-Watson stat 0.864230 Prob(F-statistic) 0.000002 SAVINGS = 1.016117401 + 0.08033187867*INCOME B2 đo lường tiết kiệm của quốc gia. CÓ nghĩa là khi thu nhập quốc gia tăng lên 1usd thì vầ trung bình sẽ tiết kiệm được 0.08usd. Giai đoạn 82-95 Dependent Variable: SAVINGS Method: Least Squares Date: 05/16/10 Time: 14:27 Sample: 1982 1995 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 153.4947 32.71227 4.692266 0.0005 INCOME 0.014862 0.008393 1.770773 0.1020 R-squared 0.207169 Mean dependent var 209.7857 Adjusted R-squared 0.141100 S.D. dependent var 31.15670 S.E. of regression 28.87505 Akaike info criterion 9.695396 Sum squared resid 10005.22 Schwarz criterion 9.786690 Log likelihood -65.86777 F-statistic 3.135639 Durbin-Watson stat 1.786588 Prob(F-statistic) 0.101972 SAVINGS = 153.49467 + 0.01486243404*INCOME B2 đo lường tiết kiệm của quốc gia. CÓ nghĩa là khi thu nhập quốc gia tăng lên 1usd thì vầ trung bình sẽ tiết kiệm được 0.01usd. Vì lãi suất thấp mọi người sẽ ít tiết kiệm hơn. Hãy xây dựng hàm hồi qui dạng bội ( đa biến ) có dạng sau đây cho giai đọan 1970-1995: Saving = 1 + 2* Dum + 3* Income + u ý nghĩa kinh tế của 3 đo lường đại lượng gì trong hàm hồi qui? Dependent Variable: SAVINGS Method: Least Squares Date: 05/16/10 Time: 14:29 Sample: 1970 1995 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 71.70587 13.54567 5.293639 0.0000 DUM 37.83347 22.90507 1.651751 0.1122 INCOME 0.026468 0.007925 3.339604 0.0028 R-squared 0.791900 Mean dependent var 162.0885 Adjusted R-squared 0.773804 S.D. dependent var 63.20446 S.E. of regression 30.06008 Akaike info criterion 9.752440 Sum squared resid 20783.00 Schwarz criterion 9.897605 Log likelihood -123.7817 F-statistic 43.76180 Durbin-Watson stat 1.045517 Prob(F-statistic) 0.000000 SAVINGS = 71.70587083 + 37.83347007*DUM + 0.026467889*INCOME - Trong điều kiện các yếu tố khác không đổi, khi thu nhập tăng lên 1usd thì về trung bình sẽ tiết kiệm được 0.026usd. Từ câu 2 anh chị hãy viết phương trình hồi qui cho truờng hợp Dum=1 và Dum = 0 . So sánh kết quả nầy với kết quả mà anh chị đã tìm ra ở câu 1 . Nêu nhận xét của anh chị về kết quả tìm được ? kết quả hồi qui 2 trường hợp dum = 0 và dum = 1 giai đoạn 1970 – 1995: Dependent Variable: SAVINGS Method: Least Squares Date: 05/16/10 Time: 22:24 Sample: 1970 1995 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 62.42267 12.76075 4.891772 0.0001 INCOME 0.037679 0.004237 8.893776 0.0000 R-squared 0.767215 Mean dependent var 162.0885 Adjusted R-squared 0.757515 S.D. dependent var 63.20446 S.E. of regression 31.12361 Akaike info criterion 9.787614 Sum squared resid 23248.30 Schwarz criterion 9.884391 Log likelihood -125.2390 F-statistic 79.09925 Durbin-Watson stat 0.859717 Prob(F-statistic) 0.000000 SAVINGS = 62.42267117 + 0.03767912963*INCOME Trường hợp dum=0 hàm hồi qui có dạng: SAVINGS = 1 + 2* INCOME + u SAVINGS = 62.42267117 + 0.03767912963*INCOME + So trường hợp dum = 0( giai đoạn 1970 – 1995 ) với giai đoạn năm 1970 – 1981 của câu 1 ta thấy: Mức tiết kiệm trung bình giai đoạn 1970 – 1995 ít hơn hơn mức tiết kiệm trong giai đoạn 1970 – 1981. Cụ thể là: khi thu nhập quốc gia tăng lên 1 tỉ USD thì về trung bình tiết kiệm quốc gia sẽ tăng lên 0.08 tỉ USD (1970 – 1981) và gần 0.04 tỉ USD (1970 – 1995) Trường hợp dum=1 hàm hồi qui có dạng: SAVINGS = (1 + 2) + 3* INCOME + u SAVINGS = 100.2561412 + 0.03767912963*INCOME Hệ số b1 = ( 1 + 2 ) = 62.42267117 + 37.83347007 = 100.2561412 + So trường hợp dum = 1 (giai đoạn 1970 – 1995) với giai đoạn năm 1982 – 1995 của câu 1 ta thấy: Mức tiết kiệm trung bình của giai đoạn 1970 – 1995 cao hơn mức tiết kiệm trong giai đoạn 1982 – 1995. Cụ thể là: khi thu nhập quốc gia tăng lên 1 tỉ USD thì về trung bình tiết kiệm quốc gia tăng lên gần 0.015 tỉ USD (1982 – 1995) và gần 0.04 tỉ USD (1970 – 1995), cao hơn rất nhiều so với giai đoạn giai đoạn (1982 – 1995) Hãy xây dựng hàm hồi qui dạng bội ( đa biến ) có dạng sau đây cho giai đọan 1970-1995: Saving = 1 + 2* Dum + 3.Income + 4* Dum* Income + u Dependent Variable: SAVINGS Method: Least Squares Date: 05/16/10 Time: 14:35 Sample: 1970 1995 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 1.016117 20.16483 0.050391 0.9603 DUM 152.4786 33.08237 4.609058 0.0001 INCOME 0.080332 0.014497 5.541347 0.0000 DUM_X_INCOME -0.065469 0.015982 -4.096340 0.0005 R-squared 0.881944 Mean dependent var 162.0885 Adjusted R-squared 0.865846 S.D. dependent var 63.20446 S.E. of regression 23.14996 Akaike info criterion 9.262501 Sum squared resid 11790.25 Schwarz criterion 9.456055 Log likelihood -116.4125 F-statistic 54.78413 Durbin-Watson stat 1.648454 Prob(F-statistic) 0.000000 SAVINGS = 1.016117401 + 152.4785526*DUM + 0.08033187867*INCOME - 0.06546944463*DUM_X_INCOME 5. Từ kết quả của câu 4 hãy cho biết giữa 2 giai đọan có sự khác biệt ý nghĩa thống kê của hệ số hồi qui 4 hay không ? Sự khác biệt nầy được giải thích bằng ý nghĩa kinh tế là 2 giai đọan chính sách khác nhau ảnh hưởng thế nào đến hành vi tiết kiệm của công chúng Từ kết quả câu 4 ta thấy: giữa 2 giai đoạn có sự khác biệt ý nghĩa thống kê của hệ số hồi qui b4 : ta thấy mối quan hệ tỉ lệ nghich giữa tiết kiệm với thu nhập. Trong trường hợp dum = 0, khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm tăng thêm 0.08 USD Trong trường hợp dum = 1: khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm giảm đi (0.08 – 0.065) = 0.015 USD Tác động của 2 chính sách tiền tệ ảnh hưởng đến hành vi tiết kiệm của công chúng : + Đối với giai đoạn 1970 – 1981: khi chính phủ thực hiện chính sách tiền tệ thắt chặt, với mức lãi suất cao thì khi đó người dân sẽ gia tăng gửi tiết kiệm vào ngân hang để hưởng mức lãi suất cao và giảm đầu tư vì vậy làm cho tiết kiệm quốc gia tăng lên. + Đối với giai đoạn 1982 – 1995: khi chính phủ thực hiện chính sách tiền tệ nới lỏng, với mức lãi suất thấp do đó người dân sẽ vay tiền nhiều hơn để đầu tư, tái sản xuất mở rộng. Mặt khác, với mức lãi suất thấp người dân sẽ hạn chế gửi tiết kiệm mà giữ lại trong nhà hoặc đầu tư là chính.. Do đó làm cho tiết kiệm quốc gia giảm đi. Bài tập 7: Các dữ liệu hằng năm về sản xuất cá Ngừ Trắng tại vùng Basque Tây Ban Nha trong giai đọan 1961-1994 . Trong đó : CATCH – Tổng lượng cá đánh bắt tính bằng đơn vị 1000 Tấn EFFORT - Tổng số ngày đánh cá theo đơn vị Ngàn ngày obs CATCH EFFORT obs CATCH EFFORT 1 41.4 45.03512 18 35.804 31.36205 2 51.8 50.05673 19 38.95 25.68735 3 44.3 44.3 20 29.157 19.38004 4 48 44.54 21 23.748 21.78884 5 44.826 59.97878 22 28.333 20.1047 6 39.208 45.37687 23 31.945 27.18085 7 48.278 46.60833 24 18.434 17.92367 8 37.819 52.24526 25 22.531 18.97028 9 31.992 54.11967 26 25.587 22.37778 10 29.894 35.60816 27 29.777 16.89844 11 39.406 61.24754 28 27.906 20.19613 12 34.279 54.76161 29 25.757 16.42839 13 27.958 46.56643 30 24.503 15.57284 14 36.407 28.51477 31 16.608 17.14402 15 27.827 27.16532 32 18.162 15.78574 16 33.71 38.83327 33 18.371 12.12064 17 32.888 22.07106 34 16.993 10.31185 Yêu cầu : Ước lượng mô hình tuyến tính đơn : Catchi = 1 + 2* Efforti + ui Dependent Variable: CATCH Method: Least Squares Date: 05/16/10 Time: 14:38 Sample: 1 34 Included observations: 34 Variable Coefficient Std. Error t-Statistic Prob. C 16.72586 2.447216 6.834648 0.0000 EFFORT 0.473070 0.069201 6.836215 0.0000 R-squared 0.593567 Mean dependent var 31.83994 Adjusted R-squared 0.580866 S.D. dependent var 9.449949 S.E. of regression 6.117947 Akaike info criterion 6.517353 Sum squared resid 1197.737 Schwarz criterion 6.607139 Log likelihood -108.7950 F-statistic 46.73384 Durbin-Watson stat 1.135208 Prob(F-statistic) 0.000000 CATCH = 16.72586416 + 0.4730703715*EFFORT Ước lượng mô hình tuyến tính bội : Catchi = 1 + 2* Efforti + 3* (Efforti )2 + ui Dependent Variable: CATCH Method: Least Squares Date: 05/16/10 Time: 14:40 Sample: 1 34 Included observations: 34 Variable Coefficient Std. Error t-Statistic Prob. C 2.339564 5.785686 0.404371 0.6887 EFFORT 1.491794 0.383074 3.894275 0.0005 EFFORT2 -0.014521 0.005386 -2.696384 0.0112 R-squared 0.670780 Mean dependent var 31.83994 Adjusted R-squared 0.649540 S.D. dependent var 9.449949 S.E. of regression 5.594338 Akaike info criterion 6.365484 Sum squared resid 970.1953 Schwarz criterion 6.500163 Log likelihood -105.2132 F-statistic 31.58097 Durbin-Watson stat 1.453119 Prob(F-statistic) 0.000000 CATCH = 2.339564155 + 1.491794483*EFFORT - 0.0145214702*EFFORT2 3. Giải thích các hệ số 2, 3 tìm được trong câu trên? - Trong điều kiện các yếu tố khác không đổi, khi số ngày đánh bắt tăng lên một ngày thì về trung bình sản lượng đánh bắt sẽ tăng lên 1.49 tấn. - Trong điều kiện các yếu tố khác không đổi, khi số ngày đánh bắt tăng lên gấp đôi thì về trung bình sản lượng đánh bắt sẽ giảm xuống 0.0145 tấn so với 4. Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó anh chị lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn gì? Hãy giải thích và thực hiện những kiểm định cần thiết ? Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn là: chúng ta không đánh giá đúng tình hình đánh bắt cá ở đây từ đó sẽ đưa ra những chính sách không đúng về việc đánh bắt cá ở đây do xảy ra hiện tượng phương sai sai số thay đổi. Kiểm định lại mô hình 1 giả thiết: Ho: e1=e2=…=en H1: ei # ej White Heteroskedasticity Test: F-statistic 2.883619 Prob. F(2,31) 0.071033 Obs*R-squared 5.333174 Prob. Chi-Square(2) 0.069489 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/25/10 Time: 22:57 Sample: 1 34 Included observations: 34 Variable Coefficient Std. Error t-Statistic Prob. C -9.028710 38.31446 -0.235648 0.8153 EFFORT 1.877263 2.536823 0.740005 0.4649 EFFORT^2 -0.012570 0.035665 -0.352450 0.7269 R-squared 0.156858 Mean dependent var 35.22756 Adjusted R-squared 0.102462 S.D. dependent var 39.10480 S.E. of regression 37.04730 Akaike info criterion 10.14637 Sum squared resid 42547.57 Schwarz criterion 10.28104 Log likelihood -169.4882 F-statistic 2.883619 Durbin-Watson stat 2.444300 Prob(F-statistic) 0.071033 với mức ý nghĩa 10% nR2 > Chi-Square(2) à bác bỏ Ho à có hiện tượng phương sai sai số thay đổià mô hình câu 1 không có ý nghĩa thống kê. Bài tập 8 : Dữ l iệu sau đây cho thấy về thu nhập cá nhân và chi tiêu cho đi lại trong nước năm 199… cho 50 tiểu bang vả Thủ đô của USA . Các Biến trong tập dữ liệu nầy là : - Exptrav : Chi tiêu cho đi lại tính bằng tỉ USD Income : Thu nhập cá nhân tính bằng tỉ USD POP : Dân số tính bằng triệu người EXPTRAV INCOME POP EXPTRAV INCOME POP 1.142 9.3 0.47 6.122 76.6 3.564 1.03 11.2 0.576 4.831 61.2 3.63 3.169 17.1 0.579 3.567 64.1 3.794 1.085 13.8 0.598 5.525 71.3 3.945 0.828 10.9 0.637 3.682 71.6 4.181 0.836 15.3 0.698 4.848 71.3 4.29 0.834 12.8 0.716 4.492 94.9 4.524 1.434 14.6 0.841 4.922 118.5 4.958 0.708 21.2 1 4.453 99.9 5.044 1.462 19.3 1.1 6.779 93.9 5.094 1.408 25.1 1.124 6.215 102.4 5.235 5.866 27.4 1.166 5.318 114.5 5.259 1.483 23.3 1.24 4.22 109.6 5.706 12.539 31.6 1.382 7.452 146.9 6.018 1.751 31.7 1.613 9.076 140.2 6.473 2.695 26.4 1.616 9.186 132.9 6.902 1.371 29.4 1.818 7.884 129.8 6.952 2.712 30 1.86 11.134 211.2 7.859 2.745 38.8 2.426 7.498 194.7 9.46 2.457 50.3 2.535 8.546 217.9 11.061 2.236 38.9 2.64 13.804 263.6 11.686 2.746 51.6 2.821 10.06 256 12.03 3.795 59 3.035 28.629 283.4 13.726 2.698 55 3.233 20.215 345 18.022 3.458 92.3 3.278 19.95 450.6 18.153 42.48 683.5 31.217 Yêu cầu : Thực hiện mô hình đơn giản xác định rằng Exptrav là một hàm tuyến tính theo Income ? Dependent Variable: EXPTRAV Method: Least Squares Date: 05/16/10 Time: 14:43 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 0.498120 0.535515 0.930170 0.3568 INCOME 0.055573 0.003293 16.87558 0.0000 R-squared 0.853199 Mean dependent var 6.340706 Adjusted R-squared 0.850203 S.D. dependent var 7.538343 S.E. of regression 2.917611 Akaike info criterion 5.017834 Sum squared resid 417.1103 Schwarz criterion 5.093591 Log likelihood -125.9548 F-statistic 284.7850 Durbin-Watson stat 2.194928 Prob(F-statistic) 0.000000 EXPTRAV = 0.4981199552 + 0.05557310647*INCOME Vẽ đồ thị phần dư ( u) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ? 3. Vẽ đồ thị bình phương phần dư (u2) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ? hãy tiến hành kiểm định hiện tượng phương sai của sai số thay đổi trong mô hình câu 1 với mức ý nghĩa = 10% theo các cách thức đã đuợc giới thiệu . Các kết luận có mâu thuẩn nhau hay không ? Kiểm định White: White Heteroskedasticity Test: F-statistic 2.537633 Prob. F(2,48) 0.089614 Obs*R-squared 4.876820 Prob. Chi-Square(2) 0.087300 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/16/10 Time: 14:59 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C -1.689561 5.950486 -0.283937 0.7777 INCOME 0.126986 0.073163 1.735656 0.0890 INCOME^2 -0.000132 0.000127 -1.039498 0.3038 R-squared 0.095624 Mean dependent var 8.178634 Adjusted R-squared 0.057942 S.D. dependent var 26.00254 S.E. of regression 25.23798 Akaike info criterion 9.351600 Sum squared resid 30573.88 Schwarz criterion 9.465237 Log likelihood -235.4658 F-statistic 2.537633 Durbin-Watson stat 2.147294 Prob(F-statistic) 0.089614 n.R2=4.876820 > Chi-Square(2) = 0.210720 ---à bác bỏ Ho --àphương sai thay đổi kiểm định Goldseld - Quant giả thiết: Ho: e1=e2=…=en H1: ei # ej Chia mẫu thành ba nhóm Nhóm 1: từ n1 – n17 Nhóm 2: từ n18 –n34 (loại bỏ) Nhóm 3 : từ n35 – n51 Ước lượng phương trình hồi quy nhóm 1và 3 Nhóm 1: Dependent Variable: EXPTRAV Method: Least Squares Date: 05/16/10 Time: 21:55 Sample: 1 17 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. C -1.765089 1.793694 -0.984052 0.3407 INCOME 0.204605 0.084089 2.433181 0.0279 R-squared 0.282996 Mean dependent var 2.331824 Adjusted R-squared 0.235195 S.D. dependent var 2.914951 S.E. of regression 2.549216 Akaike info criterion 4.819579 Sum squared resid 97.47750 Schwarz criterion 4.917604 Log likelihood -38.96642 F-statistic 5.920371 Durbin-Watson stat 2.587301 Prob(F-statistic) 0.027949 Ta có: RSS1 = 97,4775 Nhóm 3: Dependent Variable: EXPTRAV Method: Least Squares Date: 05/16/10 Time: 22:00 Sample: 35 51 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. C -0.763340 1.862588 -0.409827 0.6877 INCOME 0.059705 0.006856 8.708565 0.0000 R-squared 0.834873 Mean dependent var 12.84976 Adjusted R-squared 0.823864 S.D. dependent var 9.949654 S.E. of regression 4.175722 Akaike info criterion 5.806583 Sum squared resid 261.5498 Schwarz criterion 5.904608 Log likelihood -47.35595 F-statistic 75.83910 Durbin-Watson stat 2.250119 Prob(F-statistic) 0.000000 Ta có RSS2 = 261,5498 Fc=97.4775/261.5498 = 0.373 Tra bảng phân phối Fisher với mức ý nghĩa 10% F(15;32)=1,72 Ta có Fc < F è bác bỏ Ho ---àcó hiện tượng phương sai thay đổi Nếu phần dư ở mô hình 1 có hiện tuợng phương sai của sai số thay đổi hãy sử dụng thủ tục bình phương có trọng số theo White để ước lượng lại phương trình hồi qui ? ` Dependent Variable: EXPTRAV Method: Least Squares Date: 05/16/10 Time: 15:10 Sample: 1 51 Included observations: 51 Weighting series: E2_MU_CAN Variable Coefficient Std. Error t-Statistic Prob. C -0.199715 0.784310 -0.254638 0.8001 INCOME 0.058860 0.002715 21.67839 0.0000 Weighted Statistics R-squared 0.905579 Mean dependent var 8.803754 Adjusted R-squared 0.903652 S.D. dependent var 16.34141 S.E. of regression 4.053436 Akaike info criterion 5.675433 Sum squared resid 805.0867 Schwarz criterion 5.751191 Log likelihood -142.7235 F-statistic 469.9526 Durbin-Watson stat 2.291150 Prob(F-statistic) 0.000000 Unweighted Statistics R-squared 0.847987 Mean dependent var 6.340706 Adjusted R-squared 0.844884 S.D. dependent var 7.538343 S.E. of regression 2.968956 Sum squared resid 431.9203 Durbin-Watson stat 2.101548 EXPTRAV = -0.1997152197 + 0.05886047842*INCOME Hãy kiểm định White về hiện tượng phương sai của sai số thay đổi trong mô hình của câu 5 với mức ý nghĩa = 10% giả thiết: Ho: e1=e2=…=en H1: ei # ej White Heteroskedasticity Test: F-statistic 5.527501 Prob. F(4,46) 0.001017 Obs*R-squared 16.55572 Prob. Chi-Square(4) 0.002357 Test Equation: Dependent Variable: WGT_RESID^2 Method: Least Squares Date: 05/16/10 Time: 22:19 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C -13.29557 375.3913 -0.035418 0.9719 WGT 246.7482 1257.745 0.196183 0.8453 WGT^2 -374.0439 1135.303 -0.329466 0.7433 INCOME*WGT 1.643537 2.944241 0.558221 0.5794 INCOME^2*WGT^2 -0.000408 0.000364 -1.122599 0.2674 R-squared 0.324622 Mean dependent var 15.78601 Adjusted R-squared 0.265893 S.D. dependent var 57.33304 S.E. of regression 49.12296 Akaike info criterion 10.71942 Sum squared resid 111001.0 Schwarz criterion 10.90882 Log likelihood -268.3453 F-statistic 5.527501 Durbin-Watson stat 2.649477 Prob(F-statistic) 0.001017 nR2=2.352386 > Chi-Square(4) = 1.063623---à bác bỏ Ho --àphương sai thay đổi Bài tập 9 : Dữ liệu nầy nói về doanh số và tồn kho của công nghiệp một quốc gia Châu Au trong giai đọan 1950-1991 : YEAR SALES INVENTORIES 1950 38596 59822 1951 43356 70242 1952 44840 72377 1953 47987 76122 1954 46443 73175 1955 51694 79516 1956 54063 87304 1957 55879 89052 1958 54021 87055 1959 59729 92097 1960 60827 94719 1961 61159 95580 1962 65662 101049 1963 68995 105463 1964 73682 111504 1965 80283 120929 1966 87187 136824 1967 90918 145681 1968 98794 156611 1969 105812 170400 1970 108352 178594 1971 117023 188991 1972 131227 203227 1973 153881 234406 1974 178201 287144 1975 182412 288992 1976 204386 318345 1977 229786 350706 1978 260755 400929 1979 298328 452636 1980 328112 510124 1981 356909 547169 1982 348771 575486 1983 370501 591858 1984 411427 651527 1985 423940 665837 1986 431786 664654 1987 459107 711745 1988 496334 767387 1989 522344 813018 1990 540788 835985 1991 533838 828184 --------------------------------------------- Sales : Doanh Số của ngành công nghiệp (triệu $ ) Inventories : Giá trị tồn kho của ngành công nghiệp (triệu $ ) Yêu cầu : a.Thực hiện một mô hình đơn giản xác định rằng số sales là một hàm tuyến tính theo Inventories. Dependent Variable: SALES Method: Least Squares Date: 05/16/10 Time: 15:23 Sample: 1950 1991 Included observations: 42 Variable Coefficient Std. Error t-Statistic Prob. C -911.6914 1165.337 -0.782342 0.4386 INVENTORIES 0.642845 0.002889 222.5282 0.0000 R-squared 0.999193 Mean dependent var 199479.4 Adjusted R-squared 0.999173 S.D. dependent var 166654.0 S.E. of regression 4793.439 Akaike info criterion 19.83433 Sum squared resid 9.19E+08 Schwarz criterion 19.91708 Log likelihood -414.5210 F-statistic 49518.79 Durbin-Watson stat 1.374931 Prob(F-statistic) 0.000000 SALES = -911.691393 + 0.6428449796*INVENTORIES b.Vẽ đồ thị phần dư của mô hình hồi qui ở câu a theo Inventories. Dựa vào đồ thị trên anh chị có ý kiến gì vế tương quan chuỗi ? c. Hãy trình bày kiểm định Durbin – Watson xem phần dư của phương trình trên có tương quan chuỗi bậc nhất hay không ? Giả thiết: Ho: p =0 H1: p # 0 Theo kết quả chạy hồi qui ở câu a ta có: d = 1.374931 với mức ý nghĩa 5%, tra bảng Durbin – Watson với n = 40, k=1 ta có: dL = 1.442 dU = 1.544 d < dL à bác bỏ Ho, tức là có hiẹn tượng tự tương quan chuỗi bậc nhất d. Hãy giải thích các hậu quả của tương quan chuổi bậc nhất với hàm ước lượng OLS . Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên nếu có ? Hậu quả của tương quan chuỗi bậc nhất với hàm ước lượng OLS : - phương sai ước lượng được của các ước lượng bình phương bé nhất thông thường là không chệch. - kiểm định t và F nói chung không đáng tin cậy. - Kết quả là R2 được tính toán như đã biết có thể là đo lượng không đáng tin cậy cho R2 thực. - cho các phương sai và các sai số chuẩn của dự toán đã tính được cũng có thể không hiệu quả. Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên: Khi cấu trúc tự tương quan là đã biết vì các nhiễu của các Ut không quan sát được nên tính chất của tương quan chuổi thường là vấn đề suy đoán hoặc là do những đồi hỏi cấp bách của thực tiển.trong thực hành người ta thường sử dụng mô hình tự hồi quy bậc nhất Khi cấu trúc tự tương quan là chưa biết thì ta sử dụng phương pháp sai phân cấp 1,ước lượng p dựa theo thống kê d_Durbin_Watson, thủ tục Cochrane_Orcutt để ước lượng p, thủ tục Cochrane_Orcutt 2 bước để ước lượng p, phương pháp d_Durbin_Watson 2 bước để ước lương p và các Kkhắc phục Ước lượng p dựa trên thống kê Durbin – Watson p^= 1 - d/2 = 1 - 1.374931/2 = 1 - 0.6874655 = 0.3125345 Phương trình hồi qui SALES phụ thuộc vào INVENTORIES: SALES = b`1 + b`2*INVENTORIES + et Với b`1 = b1*(1-p) = -911.691393*(1-0.3125345) = -626.7563793 b`2 = b2 = 0.6428449796 Hay : SALES = -626.7563793 + 0.6428449796* INVENTORIES Bài Tập 10 : Một quan sát thú vị về việc thuê bao truyền hình cáp , người ta đưa ra những dữ liệu sau đây : AGE AIR HOME INST SUB SVC TV Y 11.83 13 350 14.95 105 10 16 9839 11.42 11 255.631 15 90 7.5 15 10606 7.33 9 31 15 14 7 11 10455 6.92 10 34.84 10 11.7 7 22 8958 26 12 153.434 25 46 10 20 11741 8.83 8 26.621 15 11.217 7.66 18 9378 13.08 8 18 15 12 7.5 12 10433 5.58 7 9.324 15 6.428 7 17 10167 12.42 8 32 10 20.1 5.6 10 9218 4.92 6 28 15 8.5 6.5 6 10519 4.08 6 8 17.5 1.6 7.5 8 10025 4.25 9 5 15 1.1 8.95 9 9714 10.67 7 15.204 10 4.355 7 7 9294 17.58 7 97.889 24.95 78.91 9.49 12 9784 8.08 7 93 20 19.6 7.5 9 8173 0.17 6 3 9.95 1 10 13 8967 13.25 5 2.6 25 1.65 7.55 6 10133 12.67 5 18.284 15.5 13.4 6.3 11 9361 5.25 6 55 15 18.708 7 16 9085 15 6 1.7 20 1.352 5.6 6 10067 17 5 270 15 170 8.75 15 8908 6.83 6 46.54 15 15.388 8.73 9 9632 5.67 6 20.417 5.95 6.555 5.95 10 8995 7 5 120 25 40 6.5 10 7787 11.25 7 46.39 15 19.9 7.5 9 8890 2.92 4 14.5 9.95 2.45 6.25 6 8041 2.17 5 9.5 20 3.762 6.5 6 8605 7.08 4 81.98 18 24.882 7.5 8 8639 12.17 4 39.7 20 21.187 6 9 8781 13.08 4 4.113 10 3.487 6.85 11 8551 0.17 6 8 10 3 7.95 9 9306 7.67 5 99.75 9.95 42.1 5.73 8 8346 10.33 4 33.379 15 20.35 7.5 8 8803 12.25 5 35.5 17.5 23.15 6.5 8 8942 2 4 34.775 15 9.866 8.25 11 8591 13.08 6 64.84 10 42.608 6 11 9163 1 6 30.556 20 10.371 7.5 8 7683 4 5 16.5 14.95 5.164 6.95 8 7924 4.67 4 70.515 9.95 31.15 7 10 8454 3 4 42.04 20 18.35 7 6 8429 Trong đó: SUB : số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua Inst : phí lắp đặt ( USD/Lần) SVC : Phí dịch vụ cho mỗi hệ thống (USD/tháng ) TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp ) Age : thời gian hệ thống đã họat động ( năm ) Air : số kêng truyền hình mà hệ thống nhận được từ hệ thống cáp Y : thu nhập bình quân đầu người (USD/ người ) Hãy phân tích quan hệ kỳ vọng của số đăng ký thuê bao (SUB) với các nhân tố ảnh hưởng có sẳn trong dữ liệu ? Dependent Variable: SUB Method: Least Squares Date: 05/25/10 Time: 13:22 Sample: 1 40 Included observations: 40 Variable Coefficient Std. Error t-Statistic Prob. C -6.807726 26.65981 -0.255355 0.8001 AGE 1.193511 0.502651 2.374434 0.0237 AIR -5.111142 1.518459 -3.366005 0.0020 HOME 0.405549 0.035003 11.58599 0.0000 INST -0.526420 0.476074 -1.105751 0.2771 SVC 2.038732 2.126968 0.958516 0.3450 TV 0.756508 0.687811 1.099877 0.2796 Y 0.001655 0.003469 0.477101 0.6365 R-squared 0.887748 Mean dependent var 24.50850 Adjusted R-squared 0.863193 S.D. dependent var 33.53720 S.E. of regression 12.40453 Akaike info criterion 8.050857 Sum squared resid 4923.914 Schwarz criterion 8.388633 Log likelihood -153.0171 F-statistic 36.15343 Durbin-Watson stat 2.182694 Prob(F-statistic) 0.000000 SUB = -6.807725633 + 1.193511207*AGE - 5.111142311*AIR + 0.40554886*HOME - 0.5264195572*INST + 2.038732364*SVC + 0.7565077307*TV + 0.001655168974*Y Phân tích quan hệ kỳ vọng của số đăng ký thuê bao: Trong điều kiện các yếu tố khác không thay đổi: + Age: khi thời gian hoạt động của hệ thống tăng thêm 1 năm thì về trung bình sẽ tăng thêm 1.19 số thuê bao + Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình sẽ giảm 5.1 thuê bao + Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình sẽ tăng thêm 0.4 thuê bao + Inst : phí lắp đặt ( USD/Lần) giảm 1 USD/Lần thì về trung bình sẽ tăng thêm 0.526 thuê bao + SVC: Phí dịch vụ cho mỗi hệ thống (USD/tháng ) tăng thêm 1 USD/tháng thì về trung bình sẽ tăng thêm 2.039 thuê bao + TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp ) tăng thêm 1 kênh thì về trung bình sẽ tăng thêm 0.756 thuê bao + Y : thu nhập bình quân đầu người (USD/ người ) tăng thêm 1 USD/Người thì về trung bình sẽ tăng thêm được 0.00165 thuê bao. Có ý kiến cho rằng mô hình ở câu 1 cần phải bổ sung thêm các biến độc lập là bình phương các biến độc lập . Anh chị cần có kiểm định nào để chấp nhận ý kiến nầy ? + ước lượng mô hình với các biến bổ sung: Dependent Variable: SUB Method: Least Squares Date: 05/25/10 Time: 13:31 Sample: 1 40 Included observations: 40 Variable Coefficient Std. Error t-Statistic Prob. C -488.2440 264.2862 -1.847406 0.0766 AGE -1.357140 1.462274 -0.928102 0.3622 AGE2_MU 0.139275 0.073366 1.898355 0.0693 AIR 18.71175 5.239156 3.571519 0.0015 AIR2_MU -1.582278 0.373179 -4.239994 0.0003 HOME 0.439400 0.083881 5.238396 0.0000 HOME2_MU 0.000221 0.000284 0.777523 0.4441 INST 0.391969 2.124189 0.184526 0.8551 INST2_MU -0.021041 0.065512 -0.321175 0.7507 SVC 12.14427 19.19417 0.632706 0.5327 SVC2_MU -0.778979 1.285439 -0.606002 0.5500 TV -0.661471 2.654203 -0.249216 0.8052 TV2_MU 0.048444 0.101687 0.476402 0.6379 Y 0.084534 0.052575 1.607864 0.1204 Y2_MU -4.55E-06 2.83E-06 -1.603944 0.1213 R-squared 0.949466 Mean dependent var 24.50850 Adjusted R-squared 0.921167 S.D. dependent var 33.53720 S.E. of regression 9.416297 Akaike info criterion 7.602757 Sum squared resid 2216.666 Schwarz criterion 8.236087 Log likelihood -137.0551 F-statistic 33.55130 Durbin-Watson stat 2.246892 Prob(F-statistic) 0.000000 Kiểm định WALD: giả thiết: Ho: R2 = 0 H1: R2 # 0 Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 4.336042 (7, 25) 0.0029 Chi-square 30.35229 7 0.0001 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(3) 0.139275 0.073366 C(5) -1.582278 0.373179 C(7) 0.000221 0.000284 C(8) 0.391969 2.124189 C(11) -0.778979 1.285439 C(13) 0.048444 0.101687 C(15) -4.55E-06 2.83E-06 Restrictions are linear in coefficients. Theo kết quả của bảng trên: F(7;25)= 3.5 < 4.336042; 0.0029<0.1 ---à bác bỏ giả thiết Ho: R2=0. tức là mô hình có ý nghĩa thống kê, hay các biến đưa vào mô hình có biến ảnh hưởng đến biến phụ thuộc SUB. Thực hiện ước lượng theo yêu cầu của câu 2 . Nhận xét mô hình nầy và căn cứ vào đó tìm ra mô hình tốt nhất bằng cách lọai bỏ các biến độc lập ít có ý nghĩa. Dependent Variable: SUB Method: Least Squares Date: 05/25/10 Time: 13:38 Sample: 1 40 Included observations: 40 Variable Coefficient Std. Error t-Statistic Prob. C -488.2440 264.2862 -1.847406 0.0766 AGE -1.357140 1.462274 -0.928102 0.3622 AGE2_MU 0.139275 0.073366 1.898355 0.0693 AIR 18.71175 5.239156 3.571519 0.0015 AIR2_MU -1.582278 0.373179 -4.239994 0.0003 HOME 0.439400 0.083881 5.238396 0.0000 HOME2_MU 0.000221 0.000284 0.777523 0.4441 INST 0.391969 2.124189 0.184526 0.8551 INST2_MU -0.021041 0.065512 -0.321175 0.7507 SVC 12.14427 19.19417 0.632706 0.5327 SVC2_MU -0.778979 1.285439 -0.606002 0.5500 TV -0.661471 2.654203 -0.249216 0.8052 TV2_MU 0.048444 0.101687 0.476402 0.6379 Y 0.084534 0.052575 1.607864 0.1204 Y2_MU -4.55E-06 2.83E-06 -1.603944 0.1213 R-squared 0.949466 Mean dependent var 24.50850 Adjusted R-squared 0.921167 S.D. dependent var 33.53720 S.E. of regression 9.416297 Akaike info criterion 7.602757 Sum squared resid 2216.666 Schwarz criterion 8.236087 Log likelihood -137.0551 F-statistic 33.55130 Durbin-Watson stat 2.246892 Prob(F-statistic) 0.000000 SUB = -488.2440184 - 1.357139585*AGE + 0.1392753913*AGE2_MU + 18.71174637*AIR - 1.582278197*AIR2_MU + 0.4394004589*HOME + 0.0002207113314*HOME2_MU + 0.3919688673*INST - 0.0210408497*INST2_MU + 12.14426735*SVC - 0.7789787661*SVC2_MU - 0.6614709744*TV + 0.04844376526*TV2_MU + 0.0845340609*Y - 4.546508689e-006*Y2_MU Nhận xét: Ta thấy Prob của một số biến đưa vào mô hình lớn hơn mức ý nghĩa 10%, điều này chứng tỏ một số biến đưa vào mô hình không có tác động gì đến SUB R2 = 0.949466 cao, trị thống kê thấp do đó xảy ra hiện tượng đa cộng tuyến. Ước lượng lại mô hình bằng cách loại bỏ những biến ít có ý nghĩa: Dependent Variable: SUB Method: Least Squares Date: 05/25/10 Time: 14:50 Sample: 1 40 Included observations: 40 Variable Coefficient Std. Error t-Statistic Prob. C -60.49268 16.26712 -3.718709 0.0007 AGE2_MU 0.054963 0.014206 3.868916 0.0005 AIR 19.00283 4.529471 4.195376 0.0002 AIR2_MU -1.551656 0.306301 -5.065791 0.0000 HOME 0.496449 0.028582 17.36914 0.0000 R-squared 0.924209 Mean dependent var 24.50850 Adjusted R-squared 0.915547 S.D. dependent var 33.53720 S.E. of regression 9.746190 Akaike info criterion 7.508098 Sum squared resid 3324.587 Schwarz criterion 7.719208 Log likelihood -145.1620 F-statistic 106.6985 Durbin-Watson stat 2.585383 Prob(F-statistic) 0.000000 SUB = -60.49268428 + 0.05496300001*AGE2_MU + 19.00283309*AIR - 1.551655918*AIR2_MU + 0.4964486269*HOME Phương trình sau cùng mà anh chị lựa chọn như thế nào ? giải thích ý nghĩa ? Phương trình sau cùng bao gồm các biến: HOME, AIR và bình phương của AIR, AGE. + Prob của một số biến đưa vào mô hình nhỏ hơn mức ý nghĩa 10%, điều này chứng tỏ các biến đưa vào mô hình đều có tác động gì đến SUB + R2=0.924209 được đánh giá là tốt vìcác biến đưa vào mô hình giải thích được 92.4% biến SUB. + Age: Trong điều kiện các yếu tố khác không thay đổi khi bình phương thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình số đăng kí thuê bao sẽ tăng thêm 0.055 số thuê bao + Air: Trong điều kiện các yếu tố khác không thay đổi khi số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ tăng thêm 19 thuê bao + Trong điều kiện các yếu tố khác không thay đổi khi bình phương số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ gi ảm 1.55 thuê bao. + Home : Trong điều kiện các yếu tố khác không thay đổi khi số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình số đăng kí thuê bao sẽ tăng thêm 0.5 thuê bao

Các file đính kèm theo tài liệu này:

Bài tập Kinh tế lượng (3).doc