10 Bài tập môn Kinh tế lượng - Tài liệu, Luận văn

Tài liệu 10 Bài tập môn Kinh tế lượng: Bài 1 Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau : ĐVT:% Nam US Anh Nhat Duc Phap 1960 1.5 1 3.6 1.5 3.6 1961 1.1 3.4 5.4 2.3 3.4 1962 1.1 4.5 6.7 4.5 4.7 1963 1.2 2.5 7.7 3 4.8 1964 1.4 3.9 3.9 2.3 3.4 1965 1.6 4.6 6.5 3.4 2.6 1966 2.8 3.7 6 3.5 2.7 1967 2.8 2.4 4 1.5 2.7 1968 4.2 4.8 5.5 18 4.5 1969 5 5.2 5.1 2.6 6.4 1970 5.9 6.5 7.6 3.7 5.5 1971 4.3 9.5 6.3 5.3 5.5 1972 3.6 6.8 4.9 5.4 5.9 1973 6.2 8.4 12 7 7.5 1974 10.9 16 24.6 7 14 1975 9.2 24.2 11.7 5.9 11.7 1976 5.8 16.5 9.3 4.5 9.6 1977 6.4 15.9 8.1 3.7 9.4 1978 7.6 8.3 3.8 2.7 9.1 1979 11.4 13.4 3.6 4.1 10.7 1980 13.6 18 8 5.5 13.3 Nguồn tin : khoa tóan thống kê – ĐHKT Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho nhận xét tổng quát về lạm phát của 5 nước ? Nhận xét: Tỉ lệ lạm phát của các nước Hoa Kì, Anh , Pháp có xu hướng n...

65 trang | Chia sẻ: hunglv | Lượt xem: 1739 | Lượt tải: 1

Bạn đang xem trước 20 trang mẫu tài liệu 10 Bài tập môn Kinh tế lượng, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Bài 1 Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau : ĐVT:% Nam US Anh Nhat Duc Phap 1960 1.5 1 3.6 1.5 3.6 1961 1.1 3.4 5.4 2.3 3.4 1962 1.1 4.5 6.7 4.5 4.7 1963 1.2 2.5 7.7 3 4.8 1964 1.4 3.9 3.9 2.3 3.4 1965 1.6 4.6 6.5 3.4 2.6 1966 2.8 3.7 6 3.5 2.7 1967 2.8 2.4 4 1.5 2.7 1968 4.2 4.8 5.5 18 4.5 1969 5 5.2 5.1 2.6 6.4 1970 5.9 6.5 7.6 3.7 5.5 1971 4.3 9.5 6.3 5.3 5.5 1972 3.6 6.8 4.9 5.4 5.9 1973 6.2 8.4 12 7 7.5 1974 10.9 16 24.6 7 14 1975 9.2 24.2 11.7 5.9 11.7 1976 5.8 16.5 9.3 4.5 9.6 1977 6.4 15.9 8.1 3.7 9.4 1978 7.6 8.3 3.8 2.7 9.1 1979 11.4 13.4 3.6 4.1 10.7 1980 13.6 18 8 5.5 13.3 Nguồn tin : khoa tóan thống kê – ĐHKT Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho nhận xét tổng quát về lạm phát của 5 nước ? Nhận xét: Tỉ lệ lạm phát của các nước Hoa Kì, Anh , Pháp có xu hướng ngày càng tăng. Còn các nước Nhật và Đức thì tỉ lệ lạm phát tuy có những biến động qua các năm nhưng không lớn và không có xu hướng tăng. Lạm phát nước nào biến thiên nhiều hơn giải thích ? ANH DUC NHAT PHAP US Mean 8.547619 4.638095 7.347619 6.714286 5.123810 Median 6.500000 3.700000 6.300000 5.500000 4.300000 Maximum 24.20000 18.00000 24.60000 14.00000 13.60000 Minimum 1.000000 1.500000 3.600000 2.600000 1.100000 Std. Dev. 6.321046 3.458248 4.632992 3.579146 3.694984 Skewness 0.941799 2.852530 2.603757 0.653541 0.784310 Kurtosis 2.866323 11.83415 10.29502 2.214858 2.672861 Jarque-Bera 3.120083 96.76612 70.29363 2.034298 2.246638 Probability 0.210127 0.000000 0.000000 0.361625 0.325199 Sum 179.5000 97.40000 154.3000 141.0000 107.6000 Sum Sq. Dev. 799.1124 239.1895 429.2924 256.2057 273.0581 Observations 21 21 21 21 21 Từ bảng tính các thống kê mô tả, ta thấy độ lệch chuẩn lạm phát của nước Anh là lớn nhất nghĩa là lạm phát của nước Anh biến thiên nhiều nhất. Ươc lượng mô hình hồi qui: Lạm phát theo thời gian cho từng quốc gia theo giả địn: (Lamphat)i = 1 + 2 (Thoigian)i + Ui Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát về tác động lạm phát tại từng quốc gia ? Vẽ đồ thị ? Dependent Variable: ANH Method: Least Squares Date: 05/14/10 Time: 20:56 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 0.322944 1.612211 0.200311 0.8434 NAMMOHINH 0.822468 0.137908 5.963871 0.0000 R-squared 0.651809 Mean dependent var 8.547619 Adjusted R-squared 0.633483 S.D. dependent var 6.321046 S.E. of regression 3.826801 Akaike info criterion 5.612328 Sum squared resid 278.2437 Schwarz criterion 5.711806 Log likelihood -56.92945 F-statistic 35.56776 Durbin-Watson stat 1.141176 Prob(F-statistic) 0.000010 ANH = 0.3229437229 + 0.8224675325*NAMMOHINH Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Anh tăng thêm gần 0.823%. Đức Dependent Variable: DUC Method: Least Squares Date: 05/14/10 Time: 20:57 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 3.593939 1.468324 2.447648 0.0243 NAMMOHINH 0.104416 0.125600 0.831332 0.4161 R-squared 0.035098 Mean dependent var 4.638095 Adjusted R-squared -0.015687 S.D. dependent var 3.458248 S.E. of regression 3.485266 Akaike info criterion 5.425359 Sum squared resid 230.7945 Schwarz criterion 5.524837 Log likelihood -54.96626 F-statistic 0.691114 Durbin-Watson stat 2.328057 Prob(F-statistic) 0.416112 DUC = 3.593939394 + 0.1044155844*NAMMOHINH Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Đức tăng thêm 0.104%. Nhật Dependent Variable: NHAT Method: Least Squares Date: 05/14/10 Time: 21:00 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 5.215152 1.919155 2.717421 0.0137 NAMMOHINH 0.213247 0.164164 1.298984 0.2095 R-squared 0.081565 Mean dependent var 7.347619 Adjusted R-squared 0.033226 S.D. dependent var 4.632992 S.E. of regression 4.555374 Akaike info criterion 5.960885 Sum squared resid 394.2773 Schwarz criterion 6.060364 Log likelihood -60.58929 F-statistic 1.687359 Durbin-Watson stat 1.175297 Prob(F-statistic) 0.209493 NHAT = 5.215151515 + 0.2132467532*NAMMOHINH Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Nhật tăng thêm 0.213%. pháp Dependent Variable: PHAP Method: Least Squares Date: 05/14/10 Time: 21:00 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 1.853247 0.832871 2.225130 0.0384 NAMMOHINH 0.486104 0.071244 6.823112 0.0000 R-squared 0.710166 Mean dependent var 6.714286 Adjusted R-squared 0.694912 S.D. dependent var 3.579146 S.E. of regression 1.976933 Akaike info criterion 4.291363 Sum squared resid 74.25703 Schwarz criterion 4.390842 Log likelihood -43.05931 F-statistic 46.55486 Durbin-Watson stat 0.961869 Prob(F-statistic) 0.000002 PHAP = 1.853246753 + 0.4861038961*NAMMOHINH Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Pháp tăng thêm 0.486%. Hoa Kì Dependent Variable: US Method: Least Squares Date: 05/14/10 Time: 21:02 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C -0.164502 0.734285 -0.224030 0.8251 NAMMOHINH 0.528831 0.062811 8.419444 0.0000 R-squared 0.788624 Mean dependent var 5.123810 Adjusted R-squared 0.777499 S.D. dependent var 3.694984 S.E. of regression 1.742926 Akaike info criterion 4.039401 Sum squared resid 57.71804 Schwarz criterion 4.138879 Log likelihood -40.41371 F-statistic 70.88704 Durbin-Watson stat 1.131804 Prob(F-statistic) 0.000000 US = -0.1645021645 + 0.5288311688*NAMMOHINH Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Hoa Kì tăng thêm gần 0.529%. Ươc lượng mô hình hồi qui: Lạm phát của từng quốc gia theo tỉ lệ lạm phát của Mỹ (Lamphat)i = 1 + 2 (lamphat-USA)i + Ui Đọc và đánh giá từng mô hình ước lượng? Đưa ra kết luận tổng quát về tác động lạm phát tại từng quốc gia so với lạm phát của USA ? Dependent Variable: ANH Method: Least Squares Date: 05/14/10 Time: 21:04 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 3.942998 1.029230 3.831018 0.0011 ANHLP 1.344882 0.199758 6.732569 0.0000 R-squared 0.704636 Mean dependent var 8.547619 Adjusted R-squared 0.689091 S.D. dependent var 6.321046 S.E. of regression 3.524566 Akaike info criterion 5.447784 Sum squared resid 236.0287 Schwarz criterion 5.547263 Log likelihood -55.20174 F-statistic 45.32748 Durbin-Watson stat 0.439091 Prob(F-statistic) 0.000002 ANH = 3.942998281 + 1.344882282*ANHLP Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Anh tăng thêm 1.345% Dependent Variable: DUC Method: Least Squares Date: 05/14/10 Time: 21:05 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 4.860462 0.627216 7.749263 0.0000 DUCLP 0.457815 0.142581 3.210916 0.0046 R-squared 0.351757 Mean dependent var 4.638095 Adjusted R-squared 0.317639 S.D. dependent var 3.458248 S.E. of regression 2.856691 Akaike info criterion 5.027598 Sum squared resid 155.0530 Schwarz criterion 5.127076 Log likelihood -50.78978 F-statistic 10.30998 Durbin-Watson stat 1.202348 Prob(F-statistic) 0.004600 DUC = 4.860462352 + 0.4578146464*DUCLP Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Đức tăng thêm 0.46% Dependent Variable: NHAT Method: Least Squares Date: 05/14/10 Time: 21:06 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 5.795073 0.866538 6.687612 0.0000 NHATLP 0.698147 0.177928 3.923768 0.0009 R-squared 0.447610 Mean dependent var 7.347619 Adjusted R-squared 0.418536 S.D. dependent var 4.632992 S.E. of regression 3.532831 Akaike info criterion 5.452469 Sum squared resid 237.1370 Schwarz criterion 5.551947 Log likelihood -55.25092 F-statistic 15.39596 Durbin-Watson stat 0.534453 Prob(F-statistic) 0.000912 NHAT = 5.795072835 + 0.6981471192*NHATLP Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Nhật tăng thêm khoảng 0.7% Dependent Variable: PHAP Method: Least Squares Date: 05/14/10 Time: 21:06 Sample: 1960 1980 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 6.251776 1.212106 5.157778 0.0001 PHAPLP 0.290800 0.574747 0.505961 0.6187 R-squared 0.013294 Mean dependent var 6.714286 Adjusted R-squared -0.038637 S.D. dependent var 3.579146 S.E. of regression 3.647635 Akaike info criterion 5.516428 Sum squared resid 252.7996 Schwarz criterion 5.615906 Log likelihood -55.92249 F-statistic 0.255996 Durbin-Watson stat 0.273299 Prob(F-statistic) 0.618704 PHAP = 6.25177575 + 0.2907996784*PHAPLP Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Pháp tăng thêm khoảng 0.29% nhận xét chung: Từ kết quả cho thấy có mối quan hệ khá chặt chẽ giữa tỉ lệ lạm phát của Anh với tỉ lệ lạm phát của Hoa Kì, tỉ lệ lạm phát của Anh chịu ảnh hưởng nhiều bởi tỉ lệ lạm phát của Hoa Kì, còn tỉ lệ lạm phát của Nhật và Đức, Pháp ít chịu ảnh hưởng bởi tỉ lệ lạm phát của Hoa Kì. Bài tập 2 : Nhà phân tích học viện nghiên cứu Anh ngữ đã thu thập dữ liệu từ 8 sinh viên khác nhau trong một lớp . Bảng dữ liệu gốc được trình bài như sau : Sinh viên Điểm tóan Điểm khoa học điểm Anh Văn 1 13.5 9.9 13.3 2 13.7 6.8 10 3 7 5.5 8.9 4 7.4 5.7 2.4 5 13.2 10.3 8.2 6 7.3 1.8 6.3 7 5.2 5.2 7.7 8 8.4 6.9 2.9 Người ta muốn xem xét xem là có mối quan hệ nào giữa điểm môn Anh văn và điểm môn Khoa học của sinh viên . Cụ thể là chúng ta có thể dựa vào điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh văn hay không - Cũng như dựa vào điểm môn Tóan của sinh viên có thể dự đóan điểm của môn Anh văn hay không ? Cho từng cặp môn học tương ứng , anh chị : Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? - Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát ? Dependent Variable: DIEMANHVAN Method: Least Squares Date: 05/14/10 Time: 21:13 Sample: 1 8 Included observations: 8 Variable Coefficient Std. Error t-Statistic Prob. C 3.762656 3.422463 1.099400 0.3137 DIEMKHOAHOC 0.568114 0.489567 1.160442 0.2900 R-squared 0.183299 Mean dependent var 7.462500 Adjusted R-squared 0.047182 S.D. dependent var 3.605130 S.E. of regression 3.519055 Akaike info criterion 5.566580 Sum squared resid 74.30247 Schwarz criterion 5.586440 Log likelihood -20.26632 F-statistic 1.346627 Durbin-Watson stat 1.325655 Prob(F-statistic) 0.289950 DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC Mô hình trên đây thể hiện mối quan hệ thuận giữa điểm Anh Văn và điểm Khoa Học. Cụ thể là khi điểm môn Khoa Học tăng thêm 1điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.57 điểm. Khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn là 3.76 điểm. Dependent Variable: DIEMANHVAN Method: Least Squares Date: 05/14/10 Time: 21:13 Sample: 1 8 Included observations: 8 Variable Coefficient Std. Error t-Statistic Prob. C 1.691257 3.486802 0.485045 0.6448 DIEMTOAN 0.609907 0.348935 1.747907 0.1311 R-squared 0.337396 Mean dependent var 7.462500 Adjusted R-squared 0.226962 S.D. dependent var 3.605130 S.E. of regression 3.169724 Akaike info criterion 5.357484 Sum squared resid 60.28290 Schwarz criterion 5.377344 Log likelihood -19.42994 F-statistic 3.055180 Durbin-Watson stat 2.104833 Prob(F-statistic) 0.131069 DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN Mô hình trên cũng thể hiện mối quan hệ thuận giữa điểm Anh Văn và điểm Toán. Cụ thể là khi điểm môn Toán tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.61 điểm. Khi điểm môn Toán bằng không thì về trung bình điểm môn Anh Văn là 1.69 điểm. Nhận xét tổng quát: Do hệ số tương quan của 2 mô hình là rất thấp (R2<0.5) cho thấy mức độ phù hợp của 2 mô hình là rất thấp. Các biến đưa vào mô hình hầu như không có tác động đến biến phụ thuôc, mô hình đưa ra không có ý nghĩa nhiều về mặt thống kê. Hay điểm môn Khoa Học hoặc môn Toán không có ảnh hưởng đến điểm của môn Anh văn. b. Giải thích ý nghĩa của hệ số tương quan ? Giải thích ý nghĩa của hệ số độ dốc và tung độ gốc của phương trình hồi qui ? ý nghĩa của hệ số tương quan: R2 đo lường mối tương quan giữa biến phụ thuộc (điểm Anh Văn) với biến độc lập (điểm Khoa Học, điểm Toán). R2 ở 2 mô hình trên đều rất nhỏ điều đó chứng tỏ điểm của môn Anh Văn không phụ thuộc vào môn khoa học hay môn toán. Ý nghĩa của hệ số độ dốc và tung độ gốc: DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC + b1= 3.762656345: khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn bằng 3.76 + b2 = 0.5681141889 : khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.57 điểm DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN + b1= 1.691256533: khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn bằng 1.69 + b2 = 0.6099068394: khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.61 điểm Bài tập 3: Ta có tập dữ liệu sau bao gồm 64 quan sát của các quốc gia với các biến số được giải thích bên dưới của bảng số liệu : obs CM FLR PGNP TFR obs CM FLR PGNP TFR 1 128 37 1870 6.66 33 142 50 8640 7.17 2 204 22 130 6.15 34 104 62 350 6.6 3 202 16 310 7 35 287 31 230 7 4 197 65 570 6.25 36 41 66 1620 3.91 5 96 76 2050 3.81 37 312 11 190 6.7 6 209 26 200 6.44 38 77 88 2090 4.2 7 170 45 670 6.19 39 142 22 900 5.43 8 240 29 300 5.89 40 262 22 230 6.5 9 241 11 120 5.89 41 215 12 140 6.25 10 55 55 290 2.36 42 246 9 330 7.1 11 75 87 1180 3.93 43 191 31 1010 7.1 12 129 55 900 5.99 44 182 19 300 7 13 24 93 1730 3.5 45 37 88 1730 3.46 14 165 31 1150 7.41 46 103 35 780 5.66 15 94 77 1160 4.21 47 67 85 1300 4.82 16 96 80 1270 5 48 143 78 930 5 17 148 30 580 5.27 49 83 85 690 4.74 18 98 69 660 5.21 50 223 33 200 8.49 19 161 43 420 6.5 51 240 19 450 6.5 20 118 47 1080 6.12 52 312 21 280 6.5 21 269 17 290 6.19 53 12 79 4430 1.69 22 189 35 270 5.05 54 52 83 270 3.25 23 126 58 560 6.16 55 79 43 1340 7.17 24 12 81 4240 1.8 56 61 88 670 3.52 25 167 29 240 4.75 57 168 28 410 6.09 26 135 65 430 4.1 58 28 95 4370 2.86 27 107 87 3020 6.66 59 121 41 1310 4.88 28 72 63 1420 7.28 60 115 62 1470 3.89 29 128 49 420 8.12 61 186 45 300 6.9 30 27 63 19830 5.23 62 47 85 3630 4.1 31 152 84 420 5.79 63 178 45 220 6.09 32 224 23 530 6.5 64 142 67 560 7.2 Trong đó: - CM : Tỉ lệ tử vong của trẽ sơ sinh (%) - FLR : Tỉ lệ biết chử của dân số (%) - PGNP : GNP bình quân đầu người (Đô la) - TFR : Tỉ lệ sinh chung của dân số (%) 1. Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic ? - Sau đó vẽ biểu đồ phân tán giữa CM và FLR; CM và PGNP; CM và TFR. Rồi từ đó đối chiếu đồ thị với các giải thích của anh chị lúc ban đầu ( nêu lên sự phù hợp và không phù hợp với lời giải thích ban đầu) Trả lời: Mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho: + Tỉ lệ biết chữ của dân số (FLR): đây là mối quan hệ tỉ lệ nghịch. Tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp. Khi dân trí cao thì người dân sẽ tiếp thu được nhiều tri thức hơn trong việc chăm sóc, bảo vệ sức khỏe cho trẻ sơ sinh, dân trí cao thì con người sẽ phá bỏ những phong tục tập quán lạc hậu, những điều lệ cổ hũ gây nguy hiểm đến tính mạng của trẻ sơ sinh, từ đó làm giảm tỉ lệ tử vong ở trẻ sơ sinh. + GNP bình quân đầu người (PGNP): đây cũng là mối quan hệ tỉ lệ nghịch. GNP bình quân đầu người càng cao thì người dân sẽ có điều kiện hơn trong việc chăm sóc, bảo vệ sức khỏe của trẻ sơ sinh. Khi thu nhập của người dân được tăng lên thì người ta sẽ quan tâm hơn đến vấn đề dinh dưỡng cho trẻ sơ sinh, họ sẽ có điều kiện hơn để đi khám chữa bệnh…. từ đó làm giảm tỉ lệ tử vong của trẻ sơ sinh. + Tỉ lệ sinh chung của dân số (TFR): đây là mối quan hệ tỉ lệ thuận. Khi tỉ lệ sinh chung càng cao thì số trẻ sơ sinh sinh ra càng nhiều, đây là một vấn đề khó khăn cho công tác chăm sóc và bảo vệ sức khỏe cho trẻ sơ sinh. Từ đó có thể làm tăng tỉ lệ tử vong ở trẻ sơ sinh. Qua đồ thị cho thấy tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp và ngược lại. Tuy nhiên có chỗ chưa phù hợp với nhận xét ở chỗ: có một số trường hợp, khi ti lệ biết chữ của dân số không phải là cao nhất nhưng tỉ lệ tử vong của trẻ sơ sinh là thấp nhất. Qua đồ thị cho thấy GNP bình quân đầu người càng cao thì tỉ lệ tử vong càng thấp. Mức độ phân tán của GNP bình quân đầu người thấp còn khá cao, điều này chứng tỏ GNP bình quân đầu người ở đây còn thấp và tỉ lệ tử vong của trẻ sơ sinh ở đây còn cao. Đây hoàn toàn phù hợp với nhận xét ban đầu Qua đồ thị ta thấy tỉ lệ sinh chung của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng cao. Tuy nhiên cũng có một số trường hợp, tỉ lệ sinh chung cao nhưng tỉ lệ tử vong của trẻ sơ sinh vẫn thấp, điều này cho thấy: mặc dù tỉ lệ sinh cao nhưng công tác chăm sóc và bảo vệ sức khỏe tốt hạn chế được tỉ lệ tử vong ở trẻ sơ sinh. 2. Anh chị hãy xây dựng mô hình hồi qui đơn cho CM va PGNP . Nhận xét các thông tin chính từ mô hình nầy như ý nghĩa thống kê của hệ số hồi qui, hệ số xác định R2 . Dependent Variable: CM Method: Least Squares Date: 05/14/10 Time: 21:15 Sample: 1 64 Included observations: 64 Variable Coefficient Std. Error t-Statistic Prob. C 157.4244 9.845583 15.98935 0.0000 PGNP -0.011364 0.003233 -3.515661 0.0008 R-squared 0.166217 Mean dependent var 141.5000 Adjusted R-squared 0.152769 S.D. dependent var 75.97807 S.E. of regression 69.93413 Akaike info criterion 11.36374 Sum squared resid 303228.5 Schwarz criterion 11.43120 Log likelihood -361.6396 F-statistic 12.35987 Durbin-Watson stat 1.931458 Prob(F-statistic) 0.000826 Mô hình hồi qui đơn:CM = 157.4244406 - 0.01136445358*PGNP Qua phương trình hồi qui ta thấy mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và GNP bình quân đầu người là mối quan hệ tỉ lệ nghịch. + Trong điều kiện GNP bình quân đầu người không đổi, về trung bình tỉ lệ tử vong của trẻ sơ sinh là 157.43%. + Khi GNP bình quân đầu người tăng thêm 1 USD thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm 0.114%. + R2 = 0.166217 cho thấy mô hình đưa ra không phù hợp, không có ý nghĩa thống kê, biến đưa vào không giải thích nhiều về biến phụ thuộc, hay nói cách khác tỉ lệ tử vong của trẻ sơ sinh ít chịu ảnh hưởng bởi GNP bình quân đầu người mà phụ thuộc vào nhiều nhân tố khác nữa. 3. Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và PGNP. Nhận xét thông tin chính từ mô hình nầy , như ý nghĩa thống kê của hệ số , hệ số xác định R2. Dependent Variable: CM Method: Least Squares Date: 05/14/10 Time: 21:16 Sample: 1 64 Included observations: 64 Variable Coefficient Std. Error t-Statistic Prob. C 263.6416 11.59318 22.74109 0.0000 FLR -2.231586 0.209947 -10.62927 0.0000 PGNP -0.005647 0.002003 -2.818703 0.0065 R-squared 0.707665 Mean dependent var 141.5000 Adjusted R-squared 0.698081 S.D. dependent var 75.97807 S.E. of regression 41.74780 Akaike info criterion 10.34691 Sum squared resid 106315.6 Schwarz criterion 10.44811 Log likelihood -328.1012 F-statistic 73.83254 Durbin-Watson stat 2.186159 Prob(F-statistic) 0.000000 CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP Phương trình hồi qui cho thấy: + Trong điều kiện GNP bình quân đầu người và tỉ lệ biết chữ của dân số không đổi thì về trung bình tỉ lệ tử vong của trẻ sơ sinh là 263.64% + Trong điều kiện GNP bình quân đầu người không đổi, khi tỉ lệ biết chữ của dân số tăng 1% thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm 2.23%. + Trong điều kiện tỉ lệ biết chữ của dân số không đổi, khi GNP bình quân đầu người tăng thêm 1 USD thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm 0.0056%. + R2 = 0.707665 cho thấy mức độ phù hợp của mô hình là khá cao. Các biến đưa vào mô hình đã giải thích được phần lớn biến phụ thuộc, hay nói cách khác tỉ lệ tử vong của trẻ sơ sinh chịu phần lớn vào tỉ lệ biết chữ của dân số và GNP bình quân đầu người. 4 . So sánh mô hình đơn và mô hình bội anh chị có nhận xét gì về hệ số hồi qui tìm được của biến PGNP, nếu phải chọn hệ số PGNP của mô hình nào để giải thích tác động của PGNP lên CM ? Tại sao? So sánh 2 mô hình hồi qui cho thấy: hệ số hồi qui của biến PGNP của phương trình hồi qui đơn nhỏ hơn hệ số hồi qui của phương trình hồi qui bội. Điều này cho thấy hệ số hồi qui của biến PGNP của phương trình hồi qui bội giải thích biến CM rõ hơn của phương trình hồi qui đơn. nếu phải chọn thì ta nên chọn hệ số PGNP của mô hình hồi qui bội để giải thích tác động của PGNP lên CM. Vì ở mô hình hồi qui bội hệ số của biến PGNP giải thích rõ hơn tác động của biến PGNP lên CM , R2 lớn cho thấy mô hình phù hợp hơn và có ý nghĩa thống kê. 5. Hồi qui CM cho tất cả các biến trong tập dữ liệu ? Nhận xét va cho ý kiến của anh chị? Dependent Variable: CM Method: Least Squares Date: 05/14/10 Time: 21:17 Sample: 1 64 Included observations: 64 Variable Coefficient Std. Error t-Statistic Prob. C 168.3067 32.89165 5.117003 0.0000 FLR -1.768029 0.248017 -7.128663 0.0000 PGNP -0.005511 0.001878 -2.934275 0.0047 TFR 12.86864 4.190533 3.070883 0.0032 R-squared 0.747372 Mean dependent var 141.5000 Adjusted R-squared 0.734740 S.D. dependent var 75.97807 S.E. of regression 39.13127 Akaike info criterion 10.23218 Sum squared resid 91875.38 Schwarz criterion 10.36711 Log likelihood -323.4298 F-statistic 59.16767 Durbin-Watson stat 2.170318 Prob(F-statistic) 0.000000 CM = 168.3066897 - 1.768029221*FLR - 0.00551122506*PGNP + 12.86863633*TFR Nhận xét: Qua phương trình hồi qui cho thấy tất cả các biến đưa vào (FLR, PGNP, TFR) đều giải thích được cho biến phụ thuộc (CM). Hệ số hồi qui của các biến trong mô hình này lớn hơn các mô hình trên, chứng tỏ các biến đưa ra ở mô hình này giải thích rõ biến phụ thuộc hơn so với các mô hình trên. R2 = 0.747372 cao hơn các mô hình trên, cho thấy mức độ phù hợp này khá cao, có ý nghĩa thống kê hơn cả các mô hình trên vì CM không chịu tác động riêng lẽ bởi bất kì yếu tố nào mà CM chịu tác động cộng gộp bởi các nhân tố: FLR, PGNP, TFR và nhiều nhân tố khác. + Mô hình này thể hiện giải thích rõ nhất tác động của các biến đến biến phụ thuộc cho nên mô hình này nên lựa chọn là mô hình giải thích nguyên nhân biến động của tỉ lệ tử vong của trẻ sơ sinh Bài 4 :Ta có tập dữ liệu sau: Baitap 4 – cau 2 - luan obs AGED ALCC EDU1 EDU2 HEXC INCC MORT PHYS POV TOBC URB 1 0.122 1.9 0.565 0.122 1620 10673 934.9 142 0.189 114.5 0.675 2 0.034 3.86 0.825 0.211 1667 18187 396.2 127 0.107 128.9 0.417 3 0.123 3.08 0.724 0.174 1473 12795 771.5 184 0.132 107.1 0.764 4 0.149 1.78 0.555 0.108 1552 10476 1022.8 136 0.19 125.8 0.397 5 0.106 3.19 0.735 0.196 2069 16065 766 235 0.114 102.8 0.957 6 0.09 3.09 0.786 0.23 1664 14812 625.7 196 0.101 112.4 0.817 7 0.133 2.8 0.703 0.207 1945 18089 888.4 275 0.08 111 0.926 8 0.114 3.17 0.686 0.175 1691 14272 880.2 185 0.119 144.5 0.659 9 0.122 5.34 0.671 0.275 3872 18168 1120.5 552 0.186 122.1 1 10 0.177 3.12 0.667 0.149 1886 13742 1065.6 191 0.135 124.2 0.908 11 0.1 2.48 0.564 0.146 1755 12543 814.3 159 0.166 128.8 0.648 12 0.097 2.97 0.738 0.203 1693 13814 554.2 212 0.099 69.8 0.763 13 0.112 2.43 0.737 0.158 1288 11120 708.7 118 0.126 100.7 0.2 14 0.12 2.77 0.665 0.162 1864 14738 886.5 199 0.11 121.6 0.825 15 0.119 2.19 0.664 0.125 1625 12446 876.3 142 0.097 135.3 0.681 16 0.145 2.09 0.715 0.139 1758 12594 966.1 136 0.101 109.4 0.434 17 0.134 1.95 0.733 0.17 1820 13775 900.3 162 0.101 115.7 0.534 18 0.12 1.85 0.531 0.111 1404 10824 935 149 0.176 182.4 0.461 19 0.101 2.63 0.577 0.139 1716 11274 825.4 173 0.186 125 0.692 20 0.133 2.57 0.687 0.144 1641 11887 979.4 165 0.13 127.9 0.361 21 0.106 2.84 0.674 0.204 1732 15864 833.6 303 0.098 121.9 0.929 22 0.136 3.04 0.722 0.2 2289 16380 955.4 300 0.096 117.2 0.906 23 0.114 2.6 0.68 0.143 1996 13608 866.2 174 0.104 126.6 0.799 24 0.125 2.68 0.731 0.174 1888 14087 830.2 203 0.095 113 0.666 25 0.12 2.06 0.548 0.123 1519 9187 944.6 117 0.239 115.3 0.305 26 0.137 2.27 0.635 0.139 1858 13244 1000.4 179 0.122 129.2 0.66 27 0.121 2.95 0.744 0.175 1494 10974 815 136 0.123 103.6 0.242 28 0.136 2.41 0.734 0.155 1766 13281 928.5 156 0.107 105.1 0.476 29 0.103 5.19 0.755 0.144 1946 14488 772.3 155 0.087 146.7 0.826 30 0.116 4.91 0.723 0.182 1417 14964 849.1 179 0.085 201.1 0.563 31 0.129 2.83 0.674 0.183 1702 17211 940.7 219 0.095 116.9 1 32 0.098 2.75 0.689 0.176 1385 10914 672.8 161 0.176 88 0.489 33 0.128 2.67 0.663 0.179 2412 16050 969.9 287 0.134 115.9 0.912 34 0.115 2.13 0.548 0.132 1380 11617 846.3 168 0.148 156.3 0.554 35 0.13 2.55 0.664 0.148 1872 12052 821.6 157 0.126 103.2 0.384 36 0.123 2.26 0.67 0.137 1833 13228 920.6 182 0.103 126.7 0.789 37 0.124 1.91 0.66 0.151 1644 12232 900.8 138 0.134 124.2 0.588 38 0.134 2.63 0.756 0.179 1654 12622 889.7 189 0.107 118.6 0.677 39 0.146 2.25 0.647 0.136 1894 13437 1043.9 214 0.105 115.8 0.848 40 0.146 2.92 0.611 0.154 2054 13906 997.6 223 0.103 133.4 0.926 41 0.105 2.5 0.537 0.134 1341 10586 812.6 146 0.166 125.4 0.605 42 0.139 2.33 0.679 0.14 1617 11161 932.6 130 0.169 104.4 0.291 43 0.123 1.95 0.562 0.126 1671 11243 906.8 176 0.165 128.7 0.671 44 0.095 2.82 0.626 0.169 1577 13483 722.2 160 0.147 115.9 0.813 45 0.08 1.53 0.8 0.199 1203 10493 550.1 171 0.103 66.5 0.774 46 0.119 3.12 0.71 0.19 1481 12117 871.4 232 0.121 144.5 0.232 47 0.105 2.55 0.624 0.191 1498 14542 794.1 194 0.118 134.6 0.722 48 0.117 2.71 0.776 0.19 1660 13876 782.8 196 0.098 96.5 0.816 49 0.136 1.68 0.56 0.104 1542 10193 1003.8 156 0.15 109.1 0.365 50 0.13 3.19 0.696 0.148 1862 13154 868.8 172 0.087 107 0.665 51 0.084 2.86 0.779 0.172 1453 13223 642.9 125 0.079 125.7 0.292 Trong đó : - MORT : Tỉ lệ tử vong chung trên 100.000 dân số INCC : Thu nhập đầu người tính bằng USD POV : Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó EDU1 : Tỉ lệ dân số đã học trung học EDU2 : Tỉ lệ dân số đã học trung học và đại học. ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người. TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao HEXC : Chi tiêu y tế bình quân đầu người (USD) URB : Tỉ lệ dân số sống tại các khu vực thành thị AGED : Tỉ lệ dân số có độ tuồi trên 65 PHYS : Các cán bộ y tế trên 1000.000 dân Yêu cầu : Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích, hãy lý giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể và chỉ ra hướng tác động nầy? + Đối với INCC: thu nhập đầu người càng thấp thì tỉ lệ tử vong chung trên 100.000 dân số càng cao, do thu nhập thấp thì người dân có ít điều kiện hơn trong việc chăm sóc sức khỏe cho bản thân và gia đình về dinh dưỡng, y tế… từ dó có thể làm tăng khả năng tỉ lệ tử vong. + POV: Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó càng cao thì việc chăm lo của người dân đến dinh dưỡng và tiếp cận đến các dịch vụ y tế.. càng thấp, làm cho tỉ lệ suy dinh dưỡng cao, nếu người dân mắc các bệnh tật thì cũng ít có khả năng chạy chữa, từ đó có thể làm tỉ lệ tử vong chung trên 100.000 dân số càng cao, + EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã học trung học và đại học càng cao cho thấy trình độ dân trí của người dân càng cao, dân trí cao thì người dân mới tiếp thu được những kiến thức tiến bộ về sức khỏe, y tế, khoa học….từ đó có thể giảm bớt được tỉ lệ tử vong chung trên 100.000 dân số do họ có thể bỏ nhưng hủ thục lạc hậu, những cách chữa bệnh không khoa học… có thể ảnh hưởng đến sức khỏe người dân. nhưng EDU2 tác động mạnh hơn. + ALCC v à TOBC : khi tiêu dùng cồn ( rượu) tính bằng lít trên đầu người và tiêu dùng thuốc lá đầu người càng cao thì người dân sẽ dễ bị mắc các bệnh dạ dày, ung thư phổi…. nhiều từ đó tỉ lệ tử vong chung trên 100.000 dân số càng cao HEXC : Chi tiêu y tế bình quân đầu người càng cao thì, Chi tiêu y tế bình quân đầu người càng cao nghĩa là người dân sẽ chi cho khám chữa bệnh cao, từ đó có thể phát hiện ra bệnh sớm, phòng ngừa và chữa trị bệnh kịp thời dẫn đến tỉ lệ tử vong chung trên 100.000 dân số càng thấp URB : Tỉ lệ dân số sống tại các khu vực thành thị cao nghĩa là nhiều người sống ở khu vực thành thị, nơi có đầy đủ cơ sở vật chất hạ tầng, có đủ lực lượng y tế khám chữa bệnh cho người dân từ đó có thể làm giảm tỉ lệ tử vong chung trên 100.000 dân số AGED : Tỉ lệ dân số có độ tuồi trên 65càng cao, tức là số người cao tuổi cao dẫn đến tỉ lệ tử vong chung trên 100.000 dân số cao do người già thì sức khỏe yếu, dễ mắc bệnh…. PHYS : Các cán bộ y tế trên 1000.000 dân càng cao nghĩa là số người được 1 cán bộ y tế chăm sóc càng ít,khi mà 1 cán bộ y tế chỉ chăm sóc ít bệnh nhân hơn thì người cán bộ y tế đó sẽ dồn hết tâm sức của mình cho người bệnh đó để mà khám chữa bệnh, từ đó có thể làm giảm tỉ lệ tử vong chung trên 100.000 dân số Ước lượng mô hình hồi qui đa biến bao gồm tất cả những biến giải thích đang có? Thực hiện kiểm định cho mức ý nghĩa tổng quát – Nhận xét sự thích hợp ? Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn bỏ qua. Dependent Variable: MORT Method: Least Squares Date: 05/14/10 Time: 21:19 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 46.59555 168.2097 0.277009 0.7832 AGED 4126.895 322.3451 12.80272 0.0000 ALCC -25.91511 11.09681 -2.335366 0.0246 EDU1 68.77913 196.8405 0.349415 0.7286 EDU2 -1180.217 548.8868 -2.150201 0.0376 HEXC 0.073889 0.034127 2.165088 0.0364 INCC 0.004511 0.005817 0.775551 0.4426 PHYS 0.640384 0.263636 2.429044 0.0197 POV 549.8647 308.5540 1.782069 0.0823 TOBC 1.470480 0.353504 4.159732 0.0002 URB -32.45556 35.64423 -0.910542 0.3680 R-squared 0.948570 Mean dependent var 855.0059 Adjusted R-squared 0.935713 S.D. dependent var 137.9660 S.E. of regression 34.98117 Akaike info criterion 10.13592 Sum squared resid 48947.30 Schwarz criterion 10.55259 Log likelihood -247.4660 F-statistic 73.77592 Durbin-Watson stat 1.597995 Prob(F-statistic) 0.000000 MORT = 46.59554973 + 4126.895059*AGED - 25.91510605*ALCC + 68.7791315*EDU1 - 1180.217201*EDU2 + 0.07388858751*HEXC + 0.00451136983*INCC + 0.6403836367*PHYS + 549.8646857*POV + 1.470480259*TOBC - 32.45555872*URB Kiểm định cho mức ý nghĩa tổng quát Giả thiết: Ho: R2 = 0 H1: R2 > 0 FR = 73.77592 Với mức ý nghĩa 10%, tra bảng phân phối Fisher: F > F0.05(9,41) ---à bác bỏ giả thiết Ho, tức là mô hình có ý nghĩa thống kê ở mức 10%. Qua mô hình ta thấy: R2 = 0.948570 à mức độ phù hợp của mô hình này cao, mô hình có ý nghĩa thống kê. Kiểm định mức ý nghĩa đối với từng hệ số hồi qui: Giả thiết: Ho: bi = 0 H1: bi # 0 Với mức ý nghĩa 10%, tra bảng phân phối student: T0.05(40) = 1.684 Hệ số hồi qui Trị thống kê So sánh Kết luận b2 12.80272 T > T0.05(40) Bác bỏ Ho b3 -2.335366 T > T0.05(40) Bác bỏ Ho b4 0.349415 T < T0.05(40) Chấp nhận Ho b5 -2.150201 T > T0.05(40) Bác bỏ Ho b6 2.165088 T > T0.05(40) Bác bỏ Ho b7 0.775551 T < T0.05(40) Chấp nhận Ho b8 2.429044 T > T0.05(40) Bác bỏ Ho b9 1.782069 T > T0.05(40) Bác bỏ Ho b10 4.159732 T > T0.05(40) Bác bỏ Ho b11 -0.910542 T < T0.05(40) Chấp nhận Ho Chấp nhận Ho: tức là các biến đưa vào mô hình không ảnh hưởng đến biến phụ thuộc MORT Bác bỏ Ho: tức là các biến đưa vào có ảnh hưởng đến biến phụ thuộc. Mô hình gồm các biến này có ý nghĩa thống kê. Các biến có thể bỏ qua: EDU1, INCC, URB Đầu tiên hãy thực hiện một kiểm định WALD đối với việc bỏ tất cả những biến nầy. Sau đó, bỏ tất cả chúng và ước lượng lại mô hình . hãy đánh giá chất lượng của phép hồi qui mới nầy ? Kiểm định WALD giả thiết: Ho: R2 = 0 H1: R2 # 0 Wald Test: Equation: EQ01 Test Statistic Value df Probability F-statistic 0.432276 (3, 40) 0.7310 Chi-square 1.296829 3 0.7299 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(4) 68.77913 196.8405 C(7) 0.004511 0.005817 C(11) -32.45556 35.64423 Restrictions are linear in coefficients. Theo kết quả của bảng trên: F(3,40)=2.84 > 0.432276; 0.731>0.1 ---à chấp nhận giả thiết Ho: R2=0. tức là mô hình không có ý nghĩa thống kê, hay các biến: EDU1, INCC, URB đưa vào mô hình không ảnh hưởng đến biến phụ thuộc MORT. Vì vậy ta không nên đưa 3 biến này vào mô hình. Ước lượng lại mô hình Dependent Variable: MORT Method: Least Squares Date: 05/14/10 Time: 21:22 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 73.76836 94.44515 0.781071 0.4390 AGED 4167.319 307.4568 13.55416 0.0000 ALCC -25.25888 10.23731 -2.467337 0.0177 EDU2 -843.8800 352.4100 -2.394597 0.0211 HEXC 0.089816 0.027059 3.319302 0.0018 PHYS 0.479654 0.193828 2.474637 0.0174 POV 452.7655 161.4134 2.805006 0.0075 TOBC 1.563512 0.286509 5.457105 0.0000 R-squared 0.946903 Mean dependent var 855.0059 Adjusted R-squared 0.938259 S.D. dependent var 137.9660 S.E. of regression 34.28140 Akaike info criterion 10.05018 Sum squared resid 50534.21 Schwarz criterion 10.35321 Log likelihood -248.2797 F-statistic 109.5479 Durbin-Watson stat 1.610035 Prob(F-statistic) 0.000000 MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC - 843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC - Việc đưa 3 biến không có tác động đến biến phụ thuộc MORT gây ra hiện tượng đa cộng tuyến, làm cho mô hình ban đầu (bao gồm tất cả các biến) có R2 cao (cao hơn cả mô hình sau khi ước lượng lại), trị thống kê mất ý nghĩa, làm cho chúng ta có đánh giá sai lầm về mô hình: chúng ta chấp nhận mô hình có ý nghĩa thống kê, các biến đưa vào đều có tác động đến biến phụ thuộc. - Sau khi bỏ 3 biến không làm ảnh hưởng đến MORT, ta thấy mô hình phù hợp hơn (R2 = 0.946903), tức là mô hình đưa ra có ý nghĩa thống kê, các biến đưa vào giải thích hầu hết biến phụ thuộc MORT (với mức ý nghĩa 10%, trị thống kê của các hệ số hồi qui ở các biến đều lớn hơn mức tra bảng). Trở lại với mô hình gốc ban đầu ( Mô hình không giới hạn U) , lần lượt mỗi lần bỏ một biến có ít ý nghĩa nhất và ước lượng lại . Đánh giá chất lượng của phép hồi qui mới ? Bỏ EDU1 Dependent Variable: MORT Method: Least Squares Date: 05/14/10 Time: 21:23 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 92.81956 102.7758 0.903127 0.3717 AGED 4144.662 314.8831 13.16254 0.0000 ALCC -24.63643 10.36327 -2.377283 0.0222 EDU2 -1057.359 416.9455 -2.535966 0.0151 HEXC 0.078052 0.031636 2.467190 0.0179 INCC 0.004070 0.005617 0.724592 0.4728 PHYS 0.591597 0.221220 2.674242 0.0107 POV 469.5791 203.7221 2.304998 0.0263 TOBC 1.426362 0.326631 4.366888 0.0001 URB -35.97989 33.81937 -1.063884 0.2936 R-squared 0.948413 Mean dependent var 855.0059 Adjusted R-squared 0.937089 S.D. dependent var 137.9660 S.E. of regression 34.60463 Akaike info criterion 10.09976 Sum squared resid 49096.70 Schwarz criterion 10.47854 Log likelihood -247.5438 F-statistic 83.75303 Durbin-Watson stat 1.585340 Prob(F-statistic) 0.000000 MORT = 92.8195617 + 4144.66192*AGED - 24.63643081*ALCC - 1057.359357*EDU2 + 0.07805159076*HEXC + 0.004070138276*INCC + 0.5915970828*PHYS + 469.5791064*POV + 1.426361908*TOBC - 35.97989484*URB Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do xảy ra hiện tượng đa cộng tuyến vì mô hình vẫn còn đưa vào mô hình biến không có ảnh hưởng đến MORT, nếu chấp nhận mô hình thì ta sẽ có những kết luận sai lầm. Với mô hình mới có K-1 biến giải thích, tiếp tục như câu 4 và yêu cầu như trên ? Bỏ EDU1 Và INCC 5 Dependent Variable: MORT Method: Least Squares Date: 05/14/10 Time: 21:24 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 103.0909 101.2163 1.018521 0.3143 AGED 4127.928 312.2544 13.21976 0.0000 ALCC -25.19964 10.27548 -2.452404 0.0184 EDU2 -911.4815 363.0489 -2.510630 0.0160 HEXC 0.089616 0.027160 3.299569 0.0020 PHYS 0.550671 0.212676 2.589252 0.0132 POV 396.2853 175.8333 2.253755 0.0295 TOBC 1.533024 0.289927 5.287621 0.0000 URB -24.63730 29.80849 -0.826520 0.4132 R-squared 0.947753 Mean dependent var 855.0059 Adjusted R-squared 0.937801 S.D. dependent var 137.9660 S.E. of regression 34.40841 Akaike info criterion 10.07326 Sum squared resid 49725.42 Schwarz criterion 10.41417 Log likelihood -247.8682 F-statistic 95.23350 Durbin-Watson stat 1.629472 Prob(F-statistic) 0.000000 MORT = 103.0909379 + 4127.928148*AGED - 25.19963943*ALCC - 911.4814852*EDU2 + 0.08961614111*HEXC + 0.5506708875*PHYS + 396.2853088*POV + 1.533024196*TOBC - 24.63729751*URB Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do vẫn còn hiện tượng đa cộng tuyến, mô hình này không phải là mô hình đánh giá đúng đắn tác động của một số biến có ý nghĩa đến biến phụ thuộc Tiếp tục quá trình nầy cho đến khi tất cả các biến còn lại đều có ý nghĩa. Mô hình cuối nầy có giống như mô hình giới hạn R mà các bạn thu được từ kết quả câu 3 hay không ? từ kết quả đó bạn có suy gẫm gì? bỏ EDU1 Và INCC và URB 6 Dependent Variable: MORT Method: Least Squares Date: 05/14/10 Time: 21:25 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 73.76836 94.44515 0.781071 0.4390 AGED 4167.319 307.4568 13.55416 0.0000 ALCC -25.25888 10.23731 -2.467337 0.0177 EDU2 -843.8800 352.4100 -2.394597 0.0211 HEXC 0.089816 0.027059 3.319302 0.0018 PHYS 0.479654 0.193828 2.474637 0.0174 POV 452.7655 161.4134 2.805006 0.0075 TOBC 1.563512 0.286509 5.457105 0.0000 R-squared 0.946903 Mean dependent var 855.0059 Adjusted R-squared 0.938259 S.D. dependent var 137.9660 S.E. of regression 34.28140 Akaike info criterion 10.05018 Sum squared resid 50534.21 Schwarz criterion 10.35321 Log likelihood -248.2797 F-statistic 109.5479 Durbin-Watson stat 1.610035 Prob(F-statistic) 0.000000 MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC - 843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC Sau khi bỏ tất cả các biến không có tác động đến MORT, ta thấy mô hình thu được hoàn toàn giống mô hình đã ước lượng lại ở câu 3. Qua kết quả này ta thấy: hậu quả của hiện tượng đa cộng tuyến là rất lớn, nó làm cho chúng ta lầm tưởng rằng mô hình không giới hạn ban đầu có ý nghĩa thống kê, các biến đưa vào mô hình đều có tác động đến biến phụ thuộc do R2 rất lớn. Nếu chúng ta chấp nhận mô hình thì chúng ta sẽ có những kết luận vội vã và không chính xác tác động của các biến đến MORT. Bài 5: ( baitâp 6 – bang câu 4) Tổng cục thống kê quốc gia của Đài Loan đưa ra một số dữ liệu về GDP thực của khu vực nông nghiệp từ năm 1958 đến 1972 như sau : Y : GDP thực của khu vực nông nghiệp ( triệu USD) X2 : Số ngày lao động hằng năm của khu vực nông nghiệp ( triệu ngày công lao động ) X3 : Vốn thực của khu vực nông nghiệp hằng năm ( triệu USD) YEAR Y X2 X3 1958 16607.7 275.5 17803.7 1959 17511.3 274.4 18096.8 1960 20171.2 269.7 18271.8 1961 20932.9 267 19167.3 1962 20406 267.8 19647.6 1963 20831.6 275 20803.5 1964 24806.3 283 22076.6 1965 26465.8 300.7 23445.2 1966 27403 307.5 24939 1967 28628.7 303.7 26713.7 1968 29904.5 304.7 29957.8 1969 27508.2 298.6 31585.9 1970 29035.5 295.5 33474.5 1971 29281.5 299 34821.8 1972 31535.8 288.1 41794.3 Hãy ước lượng hàm Cobb-Duoglas có dạng như sau : Y= A.eR.T.X21. X3 2 Trong đó T là biến xu thế theo thời gian Trả lời: Lấy ln hai vế ta được lnY = lnA + RT + 1lnX2 + 2lnX3 đặt Y* = lnY X2* = lnX2 X3* = lnX3 b1* = lnA ta có phương trình: Y* = b1* + RT + 1X2 + 2X3 (1) T = năm - 1958 ước lượng phương trình (1) ta được: Dependent Variable: LNGDP Method: Least Squares Date: 05/26/10 Time: 18:54 Sample: 1958 1972 Included observations: 15 Variable Coefficient Std. Error t-Statistic Prob. C 9.412886 4.129936 2.279185 0.0436 T 0.064795 0.018935 3.421919 0.0057 LNLAODONG 0.878171 0.432277 2.031500 0.0671 LNVON -0.468799 0.289806 -1.617632 0.1340 R-squared 0.946249 Mean dependent var 10.09653 Adjusted R-squared 0.931589 S.D. dependent var 0.207914 S.E. of regression 0.054381 Akaike info criterion -2.762431 Sum squared resid 0.032530 Schwarz criterion -2.573617 Log likelihood 24.71823 F-statistic 64.54878 Durbin-Watson stat 1.938628 Prob(F-statistic) 0.000000 LNGDP = 9.412886114 + 0.06479543845*T + 0.8781710093*LNLAODONG - 0.4687993113*LNVON lấy e mũ 2 vế ta được: GDP = e 9.412886114*e 0.06479543845*T *LAODONG 0.8781710093*VON -0.4687993113 (2) Phương trình (2) là phương trình hồi qui ước lượng từ hàm Cobb-Duoglas có dạng: Y= A.eR.T.X21. X3 2 Trong đó: A = e 9.412886114 R = 0.06479543845 hệ số 1 = 0.8781710093 hệ số 2 = -0.4687993113 Hãy giải thích các hệ số ước lượng R , 1 và 2 theo ý nghĩa kinh tế. Ý nghĩa của các hệ số ước lượng: + Hệ số ước lượng R: trong điều kiện vốn và số ngày lao động hằng năm của khu vực nông nghiệp không thay đổi, qua mỗi năm năng suất trung bình R tăng them 1 đơn vị thì về trung bình GDP thực của khu vực nông nghiệp ở Đài Loan tăng e0.06479543845 triệu USD. + Hệ số ước lượng 1: trong điều kiện vốn và năng suất trung bình không thay đổi (tức là không có sự đầu tư thêm hoặc rút vốn ở khu vực nông nghiệp của Đài Loan) khi Số ngày lao động hằng năm tăng thêm 1 triệu ngày công lao động thì về trung bình GDP thực của khu vực nông nghiệp tăng thêm 10.8781710093 triệu USD. + Hệ số ước lượng 2: trong điều kiện số ngày lao động hằng năm không thay đổi, khi đàu tư thêm 1 triệu USD vào khu vực nông nghiệp thì về trung bình GDP giảm 1/10.4687993113 triệu USD. Chỉ ra rằng khu vực nông nghiệp Đài loan có phát triển hiệu quả không ? Giải thích tại sao anh chị có nhận định như vậy? Ngòai những lý do về vốn, lao động , anh chị còn có giả thiết nào khác về nguyên nhân tác động đến sự phát triển của khu vực Đài loan ? Mô hình trên cho thấy khu vực nông nghiệp Đài Loan phát triển không hiệu quả. Bởi vì qua mô hình ta thấy: khi vốn đầu tư càng tăng thêm thì GDP lại giảm đi, điều này cho thấy vốn đầu tư cho nông nghiệp của Đài Loan được sử dụng chưa hiệu quả do chưa đầu tư đúng, hợp lý, chưa chú trọng đầu tư vào công nghệ, giống, kĩ thuật sản xuất… Nông nghiệp Đài Loan không phát triển một phần là do khí hậu và thổ nhưỡng ở đây không phù hợp để sản xuất một số loại giống cây trồng. Việc đầu tư thêm vốn chỉ làm gia tăng thêm chi phí sản xuất, từ đó đẩy giá thành sản phẩm lên cao khó cạnh tranh được với các mặt hàng nông sản nhập khẩu. Vì vậy việc đầu tư vào khu vực nông nghiệp cần chú trọng hơn trong việc nghiên cứu sản xuất những giống cây trồng năng suất cao, phù hợp với điều kiện tự nhiên ở đây, đưa công nghệ vào sản xuất,… không nên đầu tư dàn trãi, đầu tư vào sản xuất giống cây trồng mang lại năng suất không cao. Ngoài những lý do về vốn và lao động nông nghiệp Đài Loan cần chú trọng đến việc đầu tư về công nghệ trong sản xuất, giống… từ đó có thể làm tăng năng suất lao động, ngoài ra còn có các yếu tố khác cũng ảnh hưởng đến nông nghiệp Đài Loan như đất đai, khí hậu, kĩ thuật sản xuất…đây là những yếu tố thiết yếu nhất đối với sự phát triển nông nghiệp. Bài tập 6: (baitap 5- cau 4 - luan) Một quốc gia có dữ liệu về tiết kiệm và tiêu dùng như sau : YEAR SAVINGS INCOME YEAR SAVINGS INCOME 1970 61 727.1 1983 167 2522.4 1971 68.6 790.2 1984 235.7 2810 1972 63.6 855.3 1985 206.2 3002 1973 89.6 965 1986 196.5 3187.6 1974 97.6 1054.2 1987 168.4 3363.1 1975 104.4 1159.2 1988 189.1 3640.8 1976 96.4 1273 1989 187.8 3894.5 1977 92.5 1401.4 1990 208.7 4166.8 1978 112.6 1580.1 1991 246.4 4343.7 1979 130.1 1769.5 1992 272.6 4613.7 1980 161.8 1973.3 1993 214.4 4790.2 1981 199.1 2200.2 1994 189.4 5021.7 1982 205.5 2347.3 1995 249.3 5320.8 Saving :Tiết kiệm quốc gia tính bằng tỉ USD Income: Thu nhập quốc gia tính bằng tỉ USD Yêu cầu : Giai đọan 1970-1981 chính sách tiền tệ thắt chặt và mưc lãi suất rất cao , anh chi xác định Dum = 0 cho giai đọan nầy . Và Dum = 1 cho giai đọan 1982-1995 đây là giai đọan chính sách tiền tệ nới lỏng và lãi suất thấp . Xây dựng hàm hồi qui đơn tuyến tính cho từng giai đọan nói trên theo mô thức : Saving = 1 + 2* Income + u Có nghĩa là anh chị xây dựng dạng hàm nầy cho giai đọan 1970-1981 và giai đọai 1982-1995. ý nghĩa kinh tế của 2 đo lường đại lượng gì trong hàm hồi qui? Giai đọan 1970-1981: Dependent Variable: SAVINGS Method: Least Squares Date: 05/14/10 Time: 21:34 Sample: 1970 1981 Included observations: 12 Variable Coefficient Std. Error t-Statistic Prob. C 1.016117 11.63771 0.087313 0.9321 INCOME 0.080332 0.008367 9.601576 0.0000 R-squared 0.902143 Mean dependent var 106.4417 Adjusted R-squared 0.892358 S.D. dependent var 40.72222 S.E. of regression 13.36051 Akaike info criterion 8.173495 Sum squared resid 1785.032 Schwarz criterion 8.254313 Log likelihood -47.04097 F-statistic 92.19026 Durbin-Watson stat 0.864230 Prob(F-statistic) 0.000002 SAVINGS = 1.016117401 + 0.08033187867*INCOME Giai đọan 1982-1995: Dependent Variable: SAVINGS Method: Least Squares Date: 05/14/10 Time: 21:35 Sample: 1982 1995 Included observations: 14 Variable Coefficient Std. Error t-Statistic Prob. C 153.4947 32.71227 4.692266 0.0005 INCOME 0.014862 0.008393 1.770773 0.1020 R-squared 0.207169 Mean dependent var 209.7857 Adjusted R-squared 0.141100 S.D. dependent var 31.15670 S.E. of regression 28.87505 Akaike info criterion 9.695396 Sum squared resid 10005.22 Schwarz criterion 9.786690 Log likelihood -65.86777 F-statistic 3.135639 Durbin-Watson stat 1.786588 Prob(F-statistic) 0.101972 SAVINGS = 153.49467 + 0.01486243404*INCOME Ý nghĩa của hệ số hồi qui 2: cho thấy mối quan hệ tỉ lệ thuận giữa tiết kiệm quốc gia với thu nhập quốc gia. hệ số 2 đo lường đại lượng tiết kiệm quốc dân, nó cho biết mức độ tiết kiệm quốc dân tăng thêm khi thu nhập quốc dân tăng thêm 1 tỉ USD + Trong giai đoạn 1970-1981: Khi thu nhập quốc gia tăng thêm 1 tỉ USD thì về trung bình tiết kiệm quốc gia tăng thêm 0.08 tỉ USD + Trong giai đoạn 1982-1995: Khi thu nhập quốc gia tăng thêm 1 tỉ USD thì về trung bình tiết kiệm quốc gia tăng thêm 0.015 tỉ USD Hãy xây dựng hàm hồi qui dạng bội (đa biến) có dạng sau đây cho giai đọan 1970-1995: Saving = 1 + 2* Dum + 3* Income + u ý nghĩa kinh tế của 3 đo lường đại lượng gì trong hàm hồi qui? Dependent Variable: SAVINGS Method: Least Squares Date: 05/14/10 Time: 21:36 Sample: 1970 1995 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 71.70587 13.54567 5.293639 0.0000 DUM 37.83347 22.90507 1.651751 0.1122 INCOME 0.026468 0.007925 3.339604 0.0028 R-squared 0.791900 Mean dependent var 162.0885 Adjusted R-squared 0.773804 S.D. dependent var 63.20446 S.E. of regression 30.06008 Akaike info criterion 9.752440 Sum squared resid 20783.00 Schwarz criterion 9.897605 Log likelihood -123.7817 F-statistic 43.76180 Durbin-Watson stat 1.045517 Prob(F-statistic) 0.000000 SAVINGS = 71.70587083 + 37.83347007*DUM + 0.026467889*INCOME Ý nghĩa kinh tế của đại lượng 3 : cho thấy mối quan hệ tỉ lệ thuận giữa tiết kiệm quốc gia với thu nhập quốc gia. đại lượng 3 đo lường đại lượng tiết kiệm quốc dân trong các giai đoạn với các chính sách tiền tệ khác nhau, nó cho biết mức độ tiết kiệm quốc dân tăng thêm 0.0265 Tỉ USD khi thu nhập quốc dân tăng thêm 1 tỉ USD trong điều kiện không có sự thay đổi gì về chính sách tiền tệ của quốc gia. Từ câu 2 anh chị hãy viết phương trình hồi qui cho truờng hợp Dum=1 và Dum = 0 . So sánh kết quả nầy với kết quả mà anh chị đã tìm ra ở câu 1 . Nêu nhận xét của anh chị về kết quả tìm được ? kết quả hồi qui 2 trường hợp dum = 0 và dum = 1 giai đoạn 1970 – 1995: Dependent Variable: SAVINGS Method: Least Squares Date: 05/16/10 Time: 22:24 Sample: 1970 1995 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 62.42267 12.76075 4.891772 0.0001 INCOME 0.037679 0.004237 8.893776 0.0000 R-squared 0.767215 Mean dependent var 162.0885 Adjusted R-squared 0.757515 S.D. dependent var 63.20446 S.E. of regression 31.12361 Akaike info criterion 9.787614 Sum squared resid 23248.30 Schwarz criterion 9.884391 Log likelihood -125.2390 F-statistic 79.09925 Durbin-Watson stat 0.859717 Prob(F-statistic) 0.000000 SAVINGS = 62.42267117 + 0.03767912963*INCOME Trường hợp dum=0 (1970 – 1995) hàm hồi qui có dạng: SAVINGS = 1 + 2* INCOME + u SAVINGS = 62.42267117 + 0.03767912963*INCOME + So với trường hợp dum = 0 giai đoạn năm 1970 – 1981 của câu 1 ta thấy: Mức tiết kiệm trung bình giai đoạn 1970 – 1995 ít hơn hơn mức tiết kiệm trong giai đoạn 1970 – 1981 khi thu nhập quốc dân tăng thêm 1 tỉ USD, bởi vì giai đoạn 1970 – 1995 do ảnh hưởng của chính sách tiền tệ mở rộng, lãi suất thấp (1982 – 1995) nên người dân có xu hướng đầu tư do vay được tiền với lãi suất thấp kéo theo cả giai đoạn 1970 – 1995 tiết kiệm quốc dân giảm. Cụ thể là: khi thu nhập tăng 1 tỉ USD thì về trung bình tiết kiệm tăng thêm 0.08 tỉ USD (1970 – 1981), gần 0.04 tỉ USD (1970 – 1995) Trường hợp dum=1 (1970 – 1995): hàm hồi qui có dạng: SAVINGS = (1 + 2) + 3* INCOME + u SAVINGS = 100.2561412 + 0.03767912963*INCOME Hệ số b1 = 1 + 2 = 62.42267117 + 37.83347007 = 100.2561412 + So với trường hợp dum = 1 giai đoạn năm 1982 – 1995 của câu 1 ta thấy: Mức tiết kiệm trung bình giai đoạn 1970 – 1995 nhiều hơn hơn mức tiết kiệm trong giai đoạn 1982 – 1995 khi thu nhập quốc dân tăng thêm 1 tỉ USD. bởi vì giai đoạn 1970 – 1995 do ảnh hưởng của chính sách tiền tệ thắt chặt, lãi suất cao (1970 – 1981) kéo theo cả giai đoạn 1970 – 1995 mức tiết kiệm tăng do người dân có xu hướng gửi tiết kiệm nhiều (bởi vì lãi suất cao kéo theo chi phí cơ hội của việc giữ tiền cao). Cụ thể là: khi thu nhập tăng 1 tỉ USD thì về trung bình tiết kiệm tăng thêm khoảng 0.015 tỉ USD (1982 – 1995), khoảng 0.04 tỉ USD (1970 – 1995) Hãy xây dựng hàm hồi qui dạng bội ( đa biến ) có dạng sau đây cho giai đọan 1970-1995: Saving = 1 + 2* Dum + 3.Income + 4* Dum* Income + u Dependent Variable: SAVINGS Method: Least Squares Date: 05/14/10 Time: 21:56 Sample: 1970 1995 Included observations: 26 Variable Coefficient Std. Error t-Statistic Prob. C 1.016117 20.16483 0.050391 0.9603 DUM 152.4786 33.08237 4.609058 0.0001 INCOME 0.080332 0.014497 5.541347 0.0000 DUM_X_INCOME -0.065469 0.015982 -4.096340 0.0005 R-squared 0.881944 Mean dependent var 162.0885 Adjusted R-squared 0.865846 S.D. dependent var 63.20446 S.E. of regression 23.14996 Akaike info criterion 9.262501 Sum squared resid 11790.25 Schwarz criterion 9.456055 Log likelihood -116.4125 F-statistic 54.78413 Durbin-Watson stat 1.648454 Prob(F-statistic) 0.000000 SAVINGS = 1.016117401 + 152.4785526*DUM + 0.08033187867*INCOME - 0.06546944463*DUM_X_INCOME 5. Từ kết quả của câu 4 hãy cho biết giữa 2 giai đọan có sự khác biệt ý nghĩa thống kê của hệ số hồi qui 4 hay không ? Sự khác biệt nầy được giải thích bằng ý nghĩa kinh tế là 2 giai đọan chính sách khác nhau ảnh hưởng thế nào đến hành vi tiết kiệm của công chúng Từ kết quả câu 4 ta thấy: giữa 2 giai đoạn có sự khác biệt ý nghĩa thống kê của hệ số hồi qui 4 : cho thấy mối quan hệ tỉ lệ nghich gữa tiết kiệm với thu nhập. Trong trường hợp dum = 0, khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm tăng thêm 0.08 USD Trong trường hợp dum = 1: khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm giảm đi (0.08 – 0.065) = 0.015 USD do sự tác động của 2 chính sách tiền tệ khác nhau: + Đối với giai đoạn 1970 – 1981: khi chính phủ thực hiện chính sách tiền tệ thắt chặt, với mức lãi suất cao thì người dân sẽ gia tăng gửi tiết kiệm, hạn chế đầu tư vì vậy mà làm cho tiết kiệm quốc gia tăng lên. + Đối với giai đoạn 1982 – 1995: khi chính phủ thực hiện chính sách tiền tệ nới lỏng, với mức lãi suất thấp làm cho người dân vay tiền nhiều hơn để đầu tư, tái sản xuất mở rộng, với mức lãi suất thấp không hấp dẫn người dân, người dân sẽ hạn chế gửi tiết kiệm vì vậy mà làm cho tiết kiệm quốc gia giảm đi. Bài tập 7: Các dữ liệu hằng năm về sản xuất cá Ngừ Trắng tại vùng Basque Tây Ban Nha trong giai đọan 1961-1994 . Trong đó : CATCH – Tổng lượng cá đánh bắt tính bằng đơn vị 1000 Tấn EFFORT - Tổng số ngày đánh cá theo đơn vị Ngàn ngày obs CATCH EFFORT obs CATCH EFFORT 1 41.4 45.03512 18 35.804 31.36205 2 51.8 50.05673 19 38.95 25.68735 3 44.3 44.3 20 29.157 19.38004 4 48 44.54 21 23.748 21.78884 5 44.826 59.97878 22 28.333 20.1047 6 39.208 45.37687 23 31.945 27.18085 7 48.278 46.60833 24 18.434 17.92367 8 37.819 52.24526 25 22.531 18.97028 9 31.992 54.11967 26 25.587 22.37778 10 29.894 35.60816 27 29.777 16.89844 11 39.406 61.24754 28 27.906 20.19613 12 34.279 54.76161 29 25.757 16.42839 13 27.958 46.56643 30 24.503 15.57284 14 36.407 28.51477 31 16.608 17.14402 15 27.827 27.16532 32 18.162 15.78574 16 33.71 38.83327 33 18.371 12.12064 17 32.888 22.07106 34 16.993 10.31185 Yêu cầu : Ước lượng mô hình tuyến tính đơn : Catchi = 1 + 2* Efforti + ui ước lượng mô hình: Dependent Variable: CATCH Method: Least Squares Date: 05/14/10 Time: 21:41 Sample: 1 34 Included observations: 34 Variable Coefficient Std. Error t-Statistic Prob. C 16.72586 2.447216 6.834648 0.0000 EFFORT 0.473070 0.069201 6.836215 0.0000 R-squared 0.593567 Mean dependent var 31.83994 Adjusted R-squared 0.580866 S.D. dependent var 9.449949 S.E. of regression 6.117947 Akaike info criterion 6.517353 Sum squared resid 1197.737 Schwarz criterion 6.607139 Log likelihood -108.7950 F-statistic 46.73384 Durbin-Watson stat 1.135208 Prob(F-statistic) 0.000000 CATCH = 16.72586416 + 0.4730703715*EFFORT + Khi tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt tăng thêm 0.473 ngàn tấn + Khi tổng ngày đánh cá không thay đổi thì trung bình tổng lượng các đánh bắt là 16.72586416 ngàn tấn Ước lượng mô hình tuyến tính bội : Catchi = 1 + 2* Efforti + 3* (Efforti )2 + ui Dependent Variable: CATCH Method: Least Squares Date: 05/16/10 Time: 22:38 Sample: 1 34 Included observations: 34 Variable Coefficient Std. Error t-Statistic Prob. C 2.339564 5.785686 0.404371 0.6887 EFFORT 1.491794 0.383074 3.894275 0.0005 EFFORT2_MU -0.014521 0.005386 -2.696384 0.0112 R-squared 0.670780 Mean dependent var 31.83994 Adjusted R-squared 0.649540 S.D. dependent var 9.449949 S.E. of regression 5.594338 Akaike info criterion 6.365484 Sum squared resid 970.1953 Schwarz criterion 6.500163 Log likelihood -105.2132 F-statistic 31.58097 Durbin-Watson stat 1.453119 Prob(F-statistic) 0.000000 CATCH = 2.339564155 + 1.491794483*EFFORT - 0.0145214702*EFFORT2_MU 3. Giải thích các hệ số 2, 3 tìm được trong câu trên? Ý nghĩa của hệ số ước lượng: + hệ số 2: trong điều kiện bình phương tổng ngày đánh cá không thay đổi, khi tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt tăng thêm 1.492 ngàn tấn + hệ số 3: trong điều kiện tổng ngày đánh cá không thay đổi, khi bình phương tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt giảm 0.0145 ngàn tấn. 4. Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó anh chị lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn gì? Hãy giải thích và thực hiện những kiểm định cần thiết ? Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn: chúng ta không đánh giá đúng tình hình đánh bắt cá ở đây từ đó sẽ đưa ra những chính sách không đúng về việc đánh bắt cá ở đây do xảy ra hiện tượng phương sai sai số thay đổi, do lượng đánh bắt cá ở thời điểm khác nhau thì khác nhau. Kiểm định lại mô hình 1 giả thiết: Ho: e1=e2=…=en H1: ei # ej White Heteroskedasticity Test: F-statistic 2.883619 Prob. F(2,31) 0.071033 Obs*R-squared 5.333174 Prob. Chi-Square(2) 0.069489 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/25/10 Time: 22:57 Sample: 1 34 Included observations: 34 Variable Coefficient Std. Error t-Statistic Prob. C -9.028710 38.31446 -0.235648 0.8153 EFFORT 1.877263 2.536823 0.740005 0.4649 EFFORT^2 -0.012570 0.035665 -0.352450 0.7269 R-squared 0.156858 Mean dependent var 35.22756 Adjusted R-squared 0.102462 S.D. dependent var 39.10480 S.E. of regression 37.04730 Akaike info criterion 10.14637 Sum squared resid 42547.57 Schwarz criterion 10.28104 Log likelihood -169.4882 F-statistic 2.883619 Durbin-Watson stat 2.444300 Prob(F-statistic) 0.071033 với mức ý nghĩa 10% nR2 > Chi-Square(2) -----à bác bỏ Ho -----à có hiện tượng phương sai sai số thay đổi -------à mô hình câu 1 không có ý nghĩa thống kê. Bài tập 8 : Dữ l iệu sau đây cho thấy về thu nhập cá nhân và chi tiêu cho đi lại trong nước năm 199… cho 50 tiểu bang vả Thủ đô của USA . Các Biến trong tập dữ liệu nầy là : - Exptrav : Chi tiêu cho đi lại tính bằng tỉ USD Income : Thu nhập cá nhân tính bằng tỉ USD POP : Dân số tính bằng triệu người EXPTRAV INCOME POP EXPTRAV INCOME POP 1.142 9.3 0.47 6.122 76.6 3.564 1.03 11.2 0.576 4.831 61.2 3.63 3.169 17.1 0.579 3.567 64.1 3.794 1.085 13.8 0.598 5.525 71.3 3.945 0.828 10.9 0.637 3.682 71.6 4.181 0.836 15.3 0.698 4.848 71.3 4.29 0.834 12.8 0.716 4.492 94.9 4.524 1.434 14.6 0.841 4.922 118.5 4.958 0.708 21.2 1 4.453 99.9 5.044 1.462 19.3 1.1 6.779 93.9 5.094 1.408 25.1 1.124 6.215 102.4 5.235 5.866 27.4 1.166 5.318 114.5 5.259 1.483 23.3 1.24 4.22 109.6 5.706 12.539 31.6 1.382 7.452 146.9 6.018 1.751 31.7 1.613 9.076 140.2 6.473 2.695 26.4 1.616 9.186 132.9 6.902 1.371 29.4 1.818 7.884 129.8 6.952 2.712 30 1.86 11.134 211.2 7.859 2.745 38.8 2.426 7.498 194.7 9.46 2.457 50.3 2.535 8.546 217.9 11.061 2.236 38.9 2.64 13.804 263.6 11.686 2.746 51.6 2.821 10.06 256 12.03 3.795 59 3.035 28.629 283.4 13.726 2.698 55 3.233 20.215 345 18.022 3.458 92.3 3.278 19.95 450.6 18.153 42.48 683.5 31.217 Yêu cầu : Thực hiện mô hình đơn giản xác định rằng Exptrav là một hàm tuyến tính theo Income ? Dependent Variable: EXPTRAV Method: Least Squares Date: 05/14/10 Time: 21:44 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 0.498120 0.535515 0.930170 0.3568 INCOME 0.055573 0.003293 16.87558 0.0000 R-squared 0.853199 Mean dependent var 6.340706 Adjusted R-squared 0.850203 S.D. dependent var 7.538343 S.E. of regression 2.917611 Akaike info criterion 5.017834 Sum squared resid 417.1103 Schwarz criterion 5.093591 Log likelihood -125.9548 F-statistic 284.7850 Durbin-Watson stat 2.194928 Prob(F-statistic) 0.000000 EXPTRAV = 0.4981199552 + 0.05557310647*INCOME Vẽ đồ thị phần dư ( u) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ? Phương sai của sai số thay đổi do xuất hiện các quan sát ngoại lai, giữa ei2 và income có một mối liên hệ theo một dạng thức nào đó Vẽ đồ thị bình phương phần dư (u2) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ? Phương sai của sai số thay đổi do xuất hiện các quan sát ngoại lai, giữa ei2 và income có một mối liên hệ theo một dạng thức nào đó hãy tiến hành kiểm định hiện tượng phương sai của sai số thay đổi trong mô hình câu 1 với mức ý nghĩa = 10% theo các cách thức đã đuợc giới thiệu . Các kết luận có mâu thuẩn nhau hay không ? kiểm định White giả thiết: Ho: e1=e2=…=en H1: ei # ej White Heteroskedasticity Test: F-statistic 2.537633 Prob. F(2,48) 0.089614 Obs*R-squared 4.876820 Prob. Chi-Square(2) 0.087300 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 05/14/10 Time: 21:46 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C -1.689561 5.950486 -0.283937 0.7777 INCOME 0.126986 0.073163 1.735656 0.0890 INCOME^2 -0.000132 0.000127 -1.039498 0.3038 R-squared 0.095624 Mean dependent var 8.178634 Adjusted R-squared 0.057942 S.D. dependent var 26.00254 S.E. of regression 25.23798 Akaike info criterion 9.351600 Sum squared resid 30573.88 Schwarz criterion 9.465237 Log likelihood -235.4658 F-statistic 2.537633 Durbin-Watson stat 2.147294 Prob(F-statistic) 0.089614 n.R2=4.876820 > Chi-Square(2) = 0.210720 ---à bác bỏ Ho --àcó hiện tượng phương sai thay đổi qua đồ thị và qua kiểm định ta thấy mô hình đưa ra có hiện tượng phương sai sai số thay đổi kiểm định Goldseld - Quant giả thiết: Ho: e1=e2=…=en H1: ei # ej Chia mẫu thành ba nhóm Nhóm 1: từ n1 – n17 Nhóm 2: từ n18 –n34 (loại bỏ) Nhóm 3 : từ n35 – n51 Ước lượng phương trình hồi quy nhóm 1và 3 Nhóm 1: Dependent Variable: EXPTRAV Method: Least Squares Date: 05/14/10 Time: 21:55 Sample: 1 17 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. C -1.765089 1.793694 -0.984052 0.3407 INCOME 0.204605 0.084089 2.433181 0.0279 R-squared 0.282996 Mean dependent var 2.331824 Adjusted R-squared 0.235195 S.D. dependent var 2.914951 S.E. of regression 2.549216 Akaike info criterion 4.819579 Sum squared resid 97.47750 Schwarz criterion 4.917604 Log likelihood -38.96642 F-statistic 5.920371 Durbin-Watson stat 2.587301 Prob(F-statistic) 0.027949 Ta có: RSS1 = 97,4775 Nhóm 3: Dependent Variable: EXPTRAV Method: Least Squares Date: 05/14/10 Time: 22:00 Sample: 35 51 Included observations: 17 Variable Coefficient Std. Error t-Statistic Prob. C -0.763340 1.862588 -0.409827 0.6877 INCOME 0.059705 0.006856 8.708565 0.0000 R-squared 0.834873 Mean dependent var 12.84976 Adjusted R-squared 0.823864 S.D. dependent var 9.949654 S.E. of regression 4.175722 Akaike info criterion 5.806583 Sum squared resid 261.5498 Schwarz criterion 5.904608 Log likelihood -47.35595 F-statistic 75.83910 Durbin-Watson stat 2.250119 Prob(F-statistic) 0.000000 Ta có RSS2 = 261,5498 Fc= = 0.373 Tra bảng phân phối Fisher với mức ý nghĩa 10% F(15;32)=1,72 Ta có Fc < F è bác bỏ Ho ---àcó hiện tượng phương sai thay đổi Nếu phần dư ở mô hình 1 có hiện tuợng phương sai của sai số thay đổi hãy sử dụng thủ tục bình phương có trọng số theo White để ước lượng lại phương trình hồi qui ? ước lượng lại phương trình hồi qui bằng phương pháp bình phương có trọng số theo White. 1. Hồi quy Exptrav theo Income Dependent Variable: EXPTRAV Method: Least Squares Date: 05/14/10 Time: 22:05 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 0.498120 0.535515 0.930170 0.3568 INCOME 0.055573 0.003293 16.87558 0.0000 R-squared 0.853199 Mean dependent var 6.340706 Adjusted R-squared 0.850203 S.D. dependent var 7.538343 S.E. of regression 2.917611 Akaike info criterion 5.017834 Sum squared resid 417.1103 Schwarz criterion 5.093591 Log likelihood -125.9548 F-statistic 284.7850 Durbin-Watson stat 2.194928 Prob(F-statistic) 0.000000 2. Tính các phần dư ei 3. Chạy mô hình hồi quy e2 theo Income Dependent Variable: SIGMA2_MU Method: Least Squares Date: 05/14/10 Time: 22:13 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C 2.192914 4.636127 0.473006 0.6383 INCOME 0.056935 0.028510 1.997036 0.0514 R-squared 0.075265 Mean dependent var 8.178634 Adjusted R-squared 0.056393 S.D. dependent var 26.00254 S.E. of regression 25.25872 Akaike info criterion 9.334646 Sum squared resid 31262.14 Schwarz criterion 9.410404 Log likelihood -236.0335 F-statistic 3.988154 Durbin-Watson stat 2.126292 Prob(F-statistic) 0.051391 SIGMA2_MU= 2.192914408 + 0.05693455557*INCOME ước lượng lại phương trình hồi qui với trọng số SIGMA Dependent Variable: EXPTRAV Method: Least Squares Date: 05/14/10 Time: 22:17 Sample: 1 51 Included observations: 51 Weighting series: SIGMA Variable Coefficient Std. Error t-Statistic Prob. C -0.199715 0.784310 -0.254638 0.8001 INCOME 0.058860 0.002715 21.67839 0.0000 Weighted Statistics R-squared 0.905579 Mean dependent var 8.803754 Adjusted R-squared 0.903652 S.D. dependent var 16.34141 S.E. of regression 4.053436 Akaike info criterion 5.675433 Sum squared resid 805.0867 Schwarz criterion 5.751191 Log likelihood -142.7235 F-statistic 469.9526 Durbin-Watson stat 2.291150 Prob(F-statistic) 0.000000 Unweighted Statistics R-squared 0.847987 Mean dependent var 6.340706 Adjusted R-squared 0.844884 S.D. dependent var 7.538343 S.E. of regression 2.968956 Sum squared resid 431.9203 Durbin-Watson stat 2.101548 EXPTRAV = -0.1997152197 + 0.05886047842*INCOME Hãy kiểm định White về hiện tượng phương sai của sai số thay đổi trong mô hình của câu 5 với mức ý nghĩa = 10% giả thiết: Ho: e1=e2=…=en H1: ei # ej White Heteroskedasticity Test: F-statistic 5.527501 Prob. F(4,46) 0.001017 Obs*R-squared 16.55572 Prob. Chi-Square(4) 0.002357 Test Equation: Dependent Variable: WGT_RESID^2 Method: Least Squares Date: 05/16/10 Time: 22:19 Sample: 1 51 Included observations: 51 Variable Coefficient Std. Error t-Statistic Prob. C -13.29557 375.3913 -0.035418 0.9719 WGT 246.7482 1257.745 0.196183 0.8453 WGT^2 -374.0439 1135.303 -0.329466 0.7433 INCOME*WGT 1.643537 2.944241 0.558221 0.5794 INCOME^2*WGT^2 -0.000408 0.000364 -1.122599 0.2674 R-squared 0.324622 Mean dependent var 15.78601 Adjusted R-squared 0.265893 S.D. dependent var 57.33304 S.E. of regression 49.12296 Akaike info criterion 10.71942 Sum squared resid 111001.0 Schwarz criterion 10.90882 Log likelihood -268.3453 F-statistic 5.527501 Durbin-Watson stat 2.649477 Prob(F-statistic) 0.001017 nR2=2.352386 > Chi-Square(4) = 1.063623---à bác bỏ Ho --àphương sai thay đổi Bài tập 9 : Dữ liệu nầy nói về doanh số và tồn kho của công nghiệp một quốc gia Châu Au trong giai đọan 1950-1991 : YEAR SALES INVENTORIES 1950 38596 59822 1951 43356 70242 1952 44840 72377 1953 47987 76122 1954 46443 73175 1955 51694 79516 1956 54063 87304 1957 55879 89052 1958 54021 87055 1959 59729 92097 1960 60827 94719 1961 61159 95580 1962 65662 101049 1963 68995 105463 1964 73682 111504 1965 80283 120929 1966 87187 136824 1967 90918 145681 1968 98794 156611 1969 105812 170400 1970 108352 178594 1971 117023 188991 1972 131227 203227 1973 153881 234406 1974 178201 287144 1975 182412 288992 1976 204386 318345 1977 229786 350706 1978 260755 400929 1979 298328 452636 1980 328112 510124 1981 356909 547169 1982 348771 575486 1983 370501 591858 1984 411427 651527 1985 423940 665837 1986 431786 664654 1987 459107 711745 1988 496334 767387 1989 522344 813018 1990 540788 835985 1991 533838 828184 --------------------------------------------- Sales : Doanh Số của ngành công nghiệp (triệu $ ) Inventories : Giá trị tồn kho của ngành công nghiệp (triệu $ ) Yêu cầu : a.Thực hiện một mô hình đơn giản xác định rằng số sales là một hàm tuyến tính theo Inventories. Dependent Variable: SALES Method: Least Squares Date: 05/14/10 Time: 22:01 Sample: 1950 1991 Included observations: 42 Variable Coefficient Std. Error t-Statistic Prob. C -911.6914 1165.337 -0.782342 0.4386 INVENTORIES 0.642845 0.002889 222.5282 0.0000 R-squared 0.999193 Mean dependent var 199479.4 Adjusted R-squared 0.999173 S.D. dependent var 166654.0 S.E. of regression 4793.439 Akaike info criterion 19.83433 Sum squared resid 9.19E+08 Schwarz criterion 19.91708 Log likelihood -414.5210 F-statistic 49518.79 Durbin-Watson stat 1.374931 Prob(F-statistic) 0.000000 SALES = -911.691393 + 0.6428449796*INVENTORIES b.Vẽ đồ thị phần dư của mô hình hồi qui ở câu a theo Inventories. Dựa vào đồ thị trên anh chị có ý kiến gì vế tương quan chuỗi ? Qua đồ thị ta thấy: c. Hãy trình bày kiểm định Durbin – Watson xem phần dư của phương trình trên có tương quan chuỗi bậc nhất hay không ? giả thiết: Ho: p =0 H1: p # 0 theo kết quả chạy hồi qui ở câu a ta có: d = 1.374931 với mức ý nghĩa 5%, tra bảng Durbin – Watson với n = 40, k=1 ta có: dL = 1.442 dU = 1.544 d < dL ----à bác bỏ Ho, tức là có hiẹn tượng tự tương quan chuỗi bậc nhất d. Hãy giải thích các hậu quả của tương quan chuổi bậc nhất với hàm ước lượng OLS . Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên nếu có ? hậu quả của tương quan chuỗi bậc nhất với hàm ước lượng OLS : - phương sai ước lượng được của các ước lượng bình phương bé nhất thông thường là không chệch. - kiểm định t và F nói chung không đáng tin cậy. - Kết quả là R2 được tính toán như đã biết có thể là đo lượng không đáng tin cậy cho R2 thực. - cho các phương sai và các sai số chuẩn của dự toán đã tính được cũng có thể không hiệu quả. Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên: Khi cấu trúc tự tương quan là đã biết vì các nhiễu của các Ut không quan sát được nên tính chất của tương quan chuổi thường là vấn đề suy đoán hoặc là do những đồi hỏi cấp bách của thực tiển.trong thực hành người ta thường sử dụng mô hình tự hồi quy bậc nhất Khi cấu trúc tự tương quan là chưa biết thì ta sử dụng phương pháp sai phân cấp 1,ước lượng p dựa theo thống kê d_Durbin_Watson, thủ tục Cochrane_Orcutt để ước lượng p, thủ tục Cochrane_Orcutt 2 bước để ước lượng p, phương pháp d_Durbin_Watson 2 bước để ước lương p và các * khắc phục Ước lượng p dựa trên thống kê Durbin – Watson p^= 1 - d/2 = 1 - 1.374931/2 = 1 - 0.6874655 = 0.3125345 phương trình hồi qui SALES phụ thuộc vào INVENTORIES viết lại: SALES = b`1 + b`2*INVENTORIES + et với b`1 = b1*(1-p) = -911.691393*(1-0.3125345) = -626.7563793 b`2 = b2 = 0.6428449796 hay : SALES = -626.7563793 + 0.6428449796* INVENTORIES Bài Tập 10 : Một quan sát thú vị về việc thuê bao truyền hình cáp , người ta đưa ra những dữ liệu sau đây : AGE AIR HOME INST SUB SVC TV Y 11.83 13 350 14.95 105 10 16 9839 11.42 11 255.631 15 90 7.5 15 10606 7.33 9 31 15 14 7 11 10455 6.92 10 34.84 10 11.7 7 22 8958 26 12 153.434 25 46 10 20 11741 8.83 8 26.621 15 11.217 7.66 18 9378 13.08 8 18 15 12 7.5 12 10433 5.58 7 9.324 15 6.428 7 17 10167 12.42 8 32 10 20.1 5.6 10 9218 4.92 6 28 15 8.5 6.5 6 10519 4.08 6 8 17.5 1.6 7.5 8 10025 4.25 9 5 15 1.1 8.95 9 9714 10.67 7 15.204 10 4.355 7 7 9294 17.58 7 97.889 24.95 78.91 9.49 12 9784 8.08 7 93 20 19.6 7.5 9 8173 0.17 6 3 9.95 1 10 13 8967 13.25 5 2.6 25 1.65 7.55 6 10133 12.67 5 18.284 15.5 13.4 6.3 11 9361 5.25 6 55 15 18.708 7 16 9085 15 6 1.7 20 1.352 5.6 6 10067 17 5 270 15 170 8.75 15 8908 6.83 6 46.54 15 15.388 8.73 9 9632 5.67 6 20.417 5.95 6.555 5.95 10 8995 7 5 120 25 40 6.5 10 7787 11.25 7 46.39 15 19.9 7.5 9 8890 2.92 4 14.5 9.95 2.45 6.25 6 8041 2.17 5 9.5 20 3.762 6.5 6 8605 7.08 4 81.98 18 24.882 7.5 8 8639 12.17 4 39.7 20 21.187 6 9 8781 13.08 4 4.113 10 3.487 6.85 11 8551 0.17 6 8 10 3 7.95 9 9306 7.67 5 99.75 9.95 42.1 5.73 8 8346 10.33 4 33.379 15 20.35 7.5 8 8803 12.25 5 35.5 17.5 23.15 6.5 8 8942 2 4 34.775 15 9.866 8.25 11 8591 13.08 6 64.84 10 42.608 6 11 9163 1 6 30.556 20 10.371 7.5 8 7683 4 5 16.5 14.95 5.164 6.95 8 7924 4.67 4 70.515 9.95 31.15 7 10 8454 3 4 42.04 20 18.35 7 6 8429 Trong đó: SUB : số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua Inst : phí lắp đặt ( USD/Lần) SVC : Phí dịch vụ cho mỗi hệ thống (USD/tháng ) TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp ) Age : thời gian hệ thống đã họat động ( năm ) Air : số kêng truyền hình mà hệ thống nhận được từ hệ thống cáp Y : thu nhập bình quân đầu người (USD/ người ) Hãy phân tích quan hệ kỳ vọng của số đăng ký thuê bao (SUB) với các nhân tố ảnh hưởng có sẳn trong dữ liệu ? Dependent Variable: SUB Method: Least Squares Date: 05/15/10 Time: 13:22 Sample: 1 40 Included observations: 40 Variable Coefficient Std. Error t-Statistic Prob. C -6.807726 26.65981 -0.255355 0.8001 AGE 1.193511 0.502651 2.374434 0.0237 AIR -5.111142 1.518459 -3.366005 0.0020 HOME 0.405549 0.035003 11.58599 0.0000 INST -0.526420 0.476074 -1.105751 0.2771 SVC 2.038732 2.126968 0.958516 0.3450 TV 0.756508 0.687811 1.099877 0.2796 Y 0.001655 0.003469 0.477101 0.6365 R-squared 0.887748 Mean dependent var 24.50850 Adjusted R-squared 0.863193 S.D. dependent var 33.53720 S.E. of regression 12.40453 Akaike info criterion 8.050857 Sum squared resid 4923.914 Schwarz criterion 8.388633 Log likelihood -153.0171 F-statistic 36.15343 Durbin-Watson stat 2.182694 Prob(F-statistic) 0.000000 SUB = -6.807725633 + 1.193511207*AGE - 5.111142311*AIR + 0.40554886*HOME - 0.5264195572*INST + 2.038732364*SVC + 0.7565077307*TV + 0.001655168974*Y Phân tích quan hệ kỳ vọng của số đăng ký thuê bao: trong điều kiện các yếu tố khác không thay đổi: + Age: khi thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình sẽ tăng thêm 1.19 số thuê bao + Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình sẽ giảm 5.1 thuê bao + Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình sẽ tăng thêm 0.4 thuê bao + Inst : phí lắp đặt ( USD/Lần) giảm 1 USD/Lần thì về trung bình sẽ tăng thêm 0.526 thuê bao + SVC: Phí dịch vụ cho mỗi hệ thống (USD/tháng ) tăng thêm 1 USD/tháng thì về trung bình sẽ tăng thêm 2.039 thuê bao + TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp ) tăng thêm 1 kênh thì về trung bình sẽ tăng thêm 0.756 thuê bao + Y : thu nhập bình quân đầu người (USD/ người ) tăng thêm 1 USD/Người thì về trung bình sẽ tăng thêm được 0.00165 thuê bao. Có ý kiến cho rằng mô hình ở câu 1 cần phải bổ sung thêm các biến độc lập là bình phương các biến độc lập . Anh chị cần có kiểm định nào để chấp nhận ý kiến nầy ? + ước lượng mô hình với các biến bổ sung Dependent Variable: SUB Method: Least Squares Date: 05/15/10 Time: 13:31 Sample: 1 40 Included observations: 40 Variable Coefficient Std. Error t-Statistic Prob. C -488.2440 264.2862 -1.847406 0.0766 AGE -1.357140 1.462274 -0.928102 0.3622 AGE2_MU 0.139275 0.073366 1.898355 0.0693 AIR 18.71175 5.239156 3.571519 0.0015 AIR2_MU -1.582278 0.373179 -4.239994 0.0003 HOME 0.439400 0.083881 5.238396 0.0000 HOME2_MU 0.000221 0.000284 0.777523 0.4441 INST 0.391969 2.124189 0.184526 0.8551 INST2_MU -0.021041 0.065512 -0.321175 0.7507 SVC 12.14427 19.19417 0.632706 0.5327 SVC2_MU -0.778979 1.285439 -0.606002 0.5500 TV -0.661471 2.654203 -0.249216 0.8052 TV2_MU 0.048444 0.101687 0.476402 0.6379 Y 0.084534 0.052575 1.607864 0.1204 Y2_MU -4.55E-06 2.83E-06 -1.603944 0.1213 R-squared 0.949466 Mean dependent var 24.50850 Adjusted R-squared 0.921167 S.D. dependent var 33.53720 S.E. of regression 9.416297 Akaike info criterion 7.602757 Sum squared resid 2216.666 Schwarz criterion 8.236087 Log likelihood -137.0551 F-statistic 33.55130 Durbin-Watson stat 2.246892 Prob(F-statistic) 0.000000 kiểm định WALD: giả thiết: Ho: R2 = 0 H1: R2 # 0 Wald Test: Equation: Untitled Test Statistic Value df Probability F-statistic 4.336042 (7, 25) 0.0029 Chi-square 30.35229 7 0.0001 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(3) 0.139275 0.073366 C(5) -1.582278 0.373179 C(7) 0.000221 0.000284 C(8) 0.391969 2.124189 C(11) -0.778979 1.285439 C(13) 0.048444 0.101687 C(15) -4.55E-06 2.83E-06 Restrictions are linear in coefficients. Theo kết quả của bảng trên: F(7;25)= 3.5 < 4.336042; 0.0029<0.1 ---à bác bỏ giả thiết Ho: R2=0. tức là mô hình có ý nghĩa thống kê, hay các biến đưa vào mô hình có biến ảnh hưởng đến biến phụ thuộc SUB. Vì vậy ta cần xem xét nên đưa biến nào vào và nên loại bỏ biến nào. Thực hiện ước lượng theo yêu cầu của câu 2 . Nhận xét mô hình nầy và căn cứ vào đó tìm ra mô hình tốt nhất bằng cách lọai bỏ các biến độc lập ít có ý nghĩa. Dependent Variable: SUB Method: Least Squares Date: 05/15/10 Time: 13:38 Sample: 1 40 Included observations: 40 Variable Coefficient Std. Error t-Statistic Prob. C -488.2440 264.2862 -1.847406 0.0766 AGE -1.357140 1.462274 -0.928102 0.3622 AGE2_MU 0.139275 0.073366 1.898355 0.0693 AIR 18.71175 5.239156 3.571519 0.0015 AIR2_MU -1.582278 0.373179 -4.239994 0.0003 HOME 0.439400 0.083881 5.238396 0.0000 HOME2_MU 0.000221 0.000284 0.777523 0.4441 INST 0.391969 2.124189 0.184526 0.8551 INST2_MU -0.021041 0.065512 -0.321175 0.7507 SVC 12.14427 19.19417 0.632706 0.5327 SVC2_MU -0.778979 1.285439 -0.606002 0.5500 TV -0.661471 2.654203 -0.249216 0.8052 TV2_MU 0.048444 0.101687 0.476402 0.6379 Y 0.084534 0.052575 1.607864 0.1204 Y2_MU -4.55E-06 2.83E-06 -1.603944 0.1213 R-squared 0.949466 Mean dependent var 24.50850 Adjusted R-squared 0.921167 S.D. dependent var 33.53720 S.E. of regression 9.416297 Akaike info criterion 7.602757 Sum squared resid 2216.666 Schwarz criterion 8.236087 Log likelihood -137.0551 F-statistic 33.55130 Durbin-Watson stat 2.246892 Prob(F-statistic) 0.000000 SUB = -488.2440184 - 1.357139585*AGE + 0.1392753913*AGE2_MU + 18.71174637*AIR - 1.582278197*AIR2_MU + 0.4394004589*HOME + 0.0002207113314*HOME2_MU + 0.3919688673*INST - 0.0210408497*INST2_MU + 12.14426735*SVC - 0.7789787661*SVC2_MU - 0.6614709744*TV + 0.04844376526*TV2_MU + 0.0845340609*Y - 4.546508689e-006*Y2_MU nhận xét: ta thấy Prob của một số biến đưa vào mô hình lớn hơn mức ý nghĩa 10%, điều này chứng tỏ một số biến đưa vào mô hình không có tác động gì đến SUB R2 = 0.949466 cao, trị thống kê thấp do xảy ra hiện tượng đa cộng tuyến. hay nói cách khác mô hình đưa ra bị sai lệch, không còn đúng với mô hình thực. * ước lượng lại mô hình bằng cách loại bỏ những biến ít có ý nghĩa: Dependent Variable: SUB Method: Least Squares Date: 05/27/10 Time: 10:50 Sample: 1 40 Included observations: 40 Variable Coefficient Std. Error t-Statistic Prob. C -60.49268 16.26712 -3.718709 0.0007 AGE2_MU 0.054963 0.014206 3.868916 0.0005 AIR 19.00283 4.529471 4.195376 0.0002 AIR2_MU -1.551656 0.306301 -5.065791 0.0000 HOME 0.496449 0.028582 17.36914 0.0000 R-squared 0.924209 Mean dependent var 24.50850 Adjusted R-squared 0.915547 S.D. dependent var 33.53720 S.E. of regression 9.746190 Akaike info criterion 7.508098 Sum squared resid 3324.587 Schwarz criterion 7.719208 Log likelihood -145.1620 F-statistic 106.6985 Durbin-Watson stat 2.585383 Prob(F-statistic) 0.000000 SUB = -60.49268428 + 0.05496300001*AGE2_MU + 19.00283309*AIR - 1.551655918*AIR2_MU + 0.4964486269*HOME Phương trình sau cùng mà anh chị lựa chọn như thế nào ? giải thích ý nghĩa ? Phương trình sau cùng bao gồm các biến: HOME, AIR và bình phương của AIR, AGE. + Prob của một số biến đưa vào mô hình nh ỏ hơn mức ý nghĩa 10%, điều này chứng tỏ c ác biến đưa vào mô hình đều có tác động gì đến SUB + R2=0.924209 cho thấy mô hình đưa ra có ý nghĩa thống kê cao, các biến đưa vào mô hình giải thích được 92.4% biến SUB. +trong điều kiện các yếu tố khác không thay đổi: + Age: khi b ình ph ư ơng thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình số đăng kí thuê bao sẽ tăng thêm 0.055 số thuê bao + Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ t ăng th êm 19 thuê bao + khi bình phương số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ gi ảm 1.55 thuê bao. Điều này cho thấy số lượng thuê bao đăng kí sẽ tăng them cùng với số kênh truyền hình nhưng đến một lúc nào đó người ta sẽ chú trọng hơn về chất lượng kênh truyền hình vì thế mà tốc độ tăng số đăng kí thuê bao sẽ giảm dần so với tốc độ tăng kênh truyền hình, đến lúc số kênh truyền hình tăng lên nhưng số đăng kí thuê bao không tăng nữa + Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình số đăng kí thuê bao sẽ tăng thêm 0.5 thuê bao

Các file đính kèm theo tài liệu này:

10 Bài tập môn Kinh tế lượng.doc