Tài liệu 10 Bài tập môn Kinh tế lượng: Bài 1
Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau :
ĐVT:%
Nam
US
Anh
Nhat
Duc
Phap
1960
1.5
1
3.6
1.5
3.6
1961
1.1
3.4
5.4
2.3
3.4
1962
1.1
4.5
6.7
4.5
4.7
1963
1.2
2.5
7.7
3
4.8
1964
1.4
3.9
3.9
2.3
3.4
1965
1.6
4.6
6.5
3.4
2.6
1966
2.8
3.7
6
3.5
2.7
1967
2.8
2.4
4
1.5
2.7
1968
4.2
4.8
5.5
18
4.5
1969
5
5.2
5.1
2.6
6.4
1970
5.9
6.5
7.6
3.7
5.5
1971
4.3
9.5
6.3
5.3
5.5
1972
3.6
6.8
4.9
5.4
5.9
1973
6.2
8.4
12
7
7.5
1974
10.9
16
24.6
7
14
1975
9.2
24.2
11.7
5.9
11.7
1976
5.8
16.5
9.3
4.5
9.6
1977
6.4
15.9
8.1
3.7
9.4
1978
7.6
8.3
3.8
2.7
9.1
1979
11.4
13.4
3.6
4.1
10.7
1980
13.6
18
8
5.5
13.3
Nguồn tin : khoa tóan thống kê – ĐHKT
Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho nhận xét tổng quát về lạm phát của 5 nước ?
Nhận xét: Tỉ lệ lạm phát của các nước Hoa Kì, Anh , Pháp có xu hướng n...
65 trang |
Chia sẻ: hunglv | Lượt xem: 1631 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu 10 Bài tập môn Kinh tế lượng, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Bài 1
Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau :
ĐVT:%
Nam
US
Anh
Nhat
Duc
Phap
1960
1.5
1
3.6
1.5
3.6
1961
1.1
3.4
5.4
2.3
3.4
1962
1.1
4.5
6.7
4.5
4.7
1963
1.2
2.5
7.7
3
4.8
1964
1.4
3.9
3.9
2.3
3.4
1965
1.6
4.6
6.5
3.4
2.6
1966
2.8
3.7
6
3.5
2.7
1967
2.8
2.4
4
1.5
2.7
1968
4.2
4.8
5.5
18
4.5
1969
5
5.2
5.1
2.6
6.4
1970
5.9
6.5
7.6
3.7
5.5
1971
4.3
9.5
6.3
5.3
5.5
1972
3.6
6.8
4.9
5.4
5.9
1973
6.2
8.4
12
7
7.5
1974
10.9
16
24.6
7
14
1975
9.2
24.2
11.7
5.9
11.7
1976
5.8
16.5
9.3
4.5
9.6
1977
6.4
15.9
8.1
3.7
9.4
1978
7.6
8.3
3.8
2.7
9.1
1979
11.4
13.4
3.6
4.1
10.7
1980
13.6
18
8
5.5
13.3
Nguồn tin : khoa tóan thống kê – ĐHKT
Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho nhận xét tổng quát về lạm phát của 5 nước ?
Nhận xét: Tỉ lệ lạm phát của các nước Hoa Kì, Anh , Pháp có xu hướng ngày càng tăng. Còn các nước Nhật và Đức thì tỉ lệ lạm phát tuy có những biến động qua các năm nhưng không lớn và không có xu hướng tăng.
Lạm phát nước nào biến thiên nhiều hơn giải thích ?
ANH
DUC
NHAT
PHAP
US
Mean
8.547619
4.638095
7.347619
6.714286
5.123810
Median
6.500000
3.700000
6.300000
5.500000
4.300000
Maximum
24.20000
18.00000
24.60000
14.00000
13.60000
Minimum
1.000000
1.500000
3.600000
2.600000
1.100000
Std. Dev.
6.321046
3.458248
4.632992
3.579146
3.694984
Skewness
0.941799
2.852530
2.603757
0.653541
0.784310
Kurtosis
2.866323
11.83415
10.29502
2.214858
2.672861
Jarque-Bera
3.120083
96.76612
70.29363
2.034298
2.246638
Probability
0.210127
0.000000
0.000000
0.361625
0.325199
Sum
179.5000
97.40000
154.3000
141.0000
107.6000
Sum Sq. Dev.
799.1124
239.1895
429.2924
256.2057
273.0581
Observations
21
21
21
21
21
Từ bảng tính các thống kê mô tả, ta thấy độ lệch chuẩn lạm phát của nước Anh là lớn nhất nghĩa là lạm phát của nước Anh biến thiên nhiều nhất.
Ươc lượng mô hình hồi qui: Lạm phát theo thời gian cho từng quốc gia theo giả địn: (Lamphat)i = 1 + 2 (Thoigian)i + Ui
Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát về tác động lạm phát tại từng quốc gia ? Vẽ đồ thị ?
Dependent Variable: ANH
Method: Least Squares
Date: 05/14/10 Time: 20:56
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.322944
1.612211
0.200311
0.8434
NAMMOHINH
0.822468
0.137908
5.963871
0.0000
R-squared
0.651809
Mean dependent var
8.547619
Adjusted R-squared
0.633483
S.D. dependent var
6.321046
S.E. of regression
3.826801
Akaike info criterion
5.612328
Sum squared resid
278.2437
Schwarz criterion
5.711806
Log likelihood
-56.92945
F-statistic
35.56776
Durbin-Watson stat
1.141176
Prob(F-statistic)
0.000010
ANH = 0.3229437229 + 0.8224675325*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Anh tăng thêm gần 0.823%.
Đức
Dependent Variable: DUC
Method: Least Squares
Date: 05/14/10 Time: 20:57
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.593939
1.468324
2.447648
0.0243
NAMMOHINH
0.104416
0.125600
0.831332
0.4161
R-squared
0.035098
Mean dependent var
4.638095
Adjusted R-squared
-0.015687
S.D. dependent var
3.458248
S.E. of regression
3.485266
Akaike info criterion
5.425359
Sum squared resid
230.7945
Schwarz criterion
5.524837
Log likelihood
-54.96626
F-statistic
0.691114
Durbin-Watson stat
2.328057
Prob(F-statistic)
0.416112
DUC = 3.593939394 + 0.1044155844*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Đức tăng thêm 0.104%.
Nhật
Dependent Variable: NHAT
Method: Least Squares
Date: 05/14/10 Time: 21:00
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
5.215152
1.919155
2.717421
0.0137
NAMMOHINH
0.213247
0.164164
1.298984
0.2095
R-squared
0.081565
Mean dependent var
7.347619
Adjusted R-squared
0.033226
S.D. dependent var
4.632992
S.E. of regression
4.555374
Akaike info criterion
5.960885
Sum squared resid
394.2773
Schwarz criterion
6.060364
Log likelihood
-60.58929
F-statistic
1.687359
Durbin-Watson stat
1.175297
Prob(F-statistic)
0.209493
NHAT = 5.215151515 + 0.2132467532*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Nhật tăng thêm 0.213%.
pháp
Dependent Variable: PHAP
Method: Least Squares
Date: 05/14/10 Time: 21:00
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.853247
0.832871
2.225130
0.0384
NAMMOHINH
0.486104
0.071244
6.823112
0.0000
R-squared
0.710166
Mean dependent var
6.714286
Adjusted R-squared
0.694912
S.D. dependent var
3.579146
S.E. of regression
1.976933
Akaike info criterion
4.291363
Sum squared resid
74.25703
Schwarz criterion
4.390842
Log likelihood
-43.05931
F-statistic
46.55486
Durbin-Watson stat
0.961869
Prob(F-statistic)
0.000002
PHAP = 1.853246753 + 0.4861038961*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Pháp tăng thêm 0.486%.
Hoa Kì
Dependent Variable: US
Method: Least Squares
Date: 05/14/10 Time: 21:02
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.164502
0.734285
-0.224030
0.8251
NAMMOHINH
0.528831
0.062811
8.419444
0.0000
R-squared
0.788624
Mean dependent var
5.123810
Adjusted R-squared
0.777499
S.D. dependent var
3.694984
S.E. of regression
1.742926
Akaike info criterion
4.039401
Sum squared resid
57.71804
Schwarz criterion
4.138879
Log likelihood
-40.41371
F-statistic
70.88704
Durbin-Watson stat
1.131804
Prob(F-statistic)
0.000000
US = -0.1645021645 + 0.5288311688*NAMMOHINH
Qua phương trình hồi qui ta thấy: qua một năm thì về trung bình tỉ lệ lạm phát của nước Hoa Kì tăng thêm gần 0.529%.
Ươc lượng mô hình hồi qui: Lạm phát của từng quốc gia theo tỉ lệ lạm phát của Mỹ
(Lamphat)i = 1 + 2 (lamphat-USA)i + Ui
Đọc và đánh giá từng mô hình ước lượng? Đưa ra kết luận tổng quát về tác động lạm phát tại từng quốc gia so với lạm phát của USA ?
Dependent Variable: ANH
Method: Least Squares
Date: 05/14/10 Time: 21:04
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.942998
1.029230
3.831018
0.0011
ANHLP
1.344882
0.199758
6.732569
0.0000
R-squared
0.704636
Mean dependent var
8.547619
Adjusted R-squared
0.689091
S.D. dependent var
6.321046
S.E. of regression
3.524566
Akaike info criterion
5.447784
Sum squared resid
236.0287
Schwarz criterion
5.547263
Log likelihood
-55.20174
F-statistic
45.32748
Durbin-Watson stat
0.439091
Prob(F-statistic)
0.000002
ANH = 3.942998281 + 1.344882282*ANHLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Anh tăng thêm 1.345%
Dependent Variable: DUC
Method: Least Squares
Date: 05/14/10 Time: 21:05
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
4.860462
0.627216
7.749263
0.0000
DUCLP
0.457815
0.142581
3.210916
0.0046
R-squared
0.351757
Mean dependent var
4.638095
Adjusted R-squared
0.317639
S.D. dependent var
3.458248
S.E. of regression
2.856691
Akaike info criterion
5.027598
Sum squared resid
155.0530
Schwarz criterion
5.127076
Log likelihood
-50.78978
F-statistic
10.30998
Durbin-Watson stat
1.202348
Prob(F-statistic)
0.004600
DUC = 4.860462352 + 0.4578146464*DUCLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Đức tăng thêm 0.46%
Dependent Variable: NHAT
Method: Least Squares
Date: 05/14/10 Time: 21:06
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
5.795073
0.866538
6.687612
0.0000
NHATLP
0.698147
0.177928
3.923768
0.0009
R-squared
0.447610
Mean dependent var
7.347619
Adjusted R-squared
0.418536
S.D. dependent var
4.632992
S.E. of regression
3.532831
Akaike info criterion
5.452469
Sum squared resid
237.1370
Schwarz criterion
5.551947
Log likelihood
-55.25092
F-statistic
15.39596
Durbin-Watson stat
0.534453
Prob(F-statistic)
0.000912
NHAT = 5.795072835 + 0.6981471192*NHATLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Nhật tăng thêm khoảng 0.7%
Dependent Variable: PHAP
Method: Least Squares
Date: 05/14/10 Time: 21:06
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
6.251776
1.212106
5.157778
0.0001
PHAPLP
0.290800
0.574747
0.505961
0.6187
R-squared
0.013294
Mean dependent var
6.714286
Adjusted R-squared
-0.038637
S.D. dependent var
3.579146
S.E. of regression
3.647635
Akaike info criterion
5.516428
Sum squared resid
252.7996
Schwarz criterion
5.615906
Log likelihood
-55.92249
F-statistic
0.255996
Durbin-Watson stat
0.273299
Prob(F-statistic)
0.618704
PHAP = 6.25177575 + 0.2907996784*PHAPLP
Qua phương trình hồi qui ta thấy: nếu tỉ lệ lạm phát ở nước Hoa Kì tăng thêm 1% thì về trung bình tỉ lệ lạm phát ở nước Pháp tăng thêm khoảng 0.29%
nhận xét chung: Từ kết quả cho thấy có mối quan hệ khá chặt chẽ giữa tỉ lệ lạm phát của Anh với tỉ lệ lạm phát của Hoa Kì, tỉ lệ lạm phát của Anh chịu ảnh hưởng nhiều bởi tỉ lệ lạm phát của Hoa Kì, còn tỉ lệ lạm phát của Nhật và Đức, Pháp ít chịu ảnh hưởng bởi tỉ lệ lạm phát của Hoa Kì.
Bài tập 2 :
Nhà phân tích học viện nghiên cứu Anh ngữ đã thu thập dữ liệu từ 8 sinh viên khác nhau trong một lớp . Bảng dữ liệu gốc được trình bài như sau :
Sinh viên
Điểm tóan
Điểm khoa học
điểm Anh Văn
1
13.5
9.9
13.3
2
13.7
6.8
10
3
7
5.5
8.9
4
7.4
5.7
2.4
5
13.2
10.3
8.2
6
7.3
1.8
6.3
7
5.2
5.2
7.7
8
8.4
6.9
2.9
Người ta muốn xem xét xem là có mối quan hệ nào giữa điểm môn Anh văn và điểm môn Khoa học của sinh viên . Cụ thể là chúng ta có thể dựa vào điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh văn hay không - Cũng như dựa vào điểm môn Tóan của sinh viên có thể dự đóan điểm của môn Anh văn hay không ?
Cho từng cặp môn học tương ứng , anh chị :
Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? - Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát ?
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/14/10 Time: 21:13
Sample: 1 8
Included observations: 8
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.762656
3.422463
1.099400
0.3137
DIEMKHOAHOC
0.568114
0.489567
1.160442
0.2900
R-squared
0.183299
Mean dependent var
7.462500
Adjusted R-squared
0.047182
S.D. dependent var
3.605130
S.E. of regression
3.519055
Akaike info criterion
5.566580
Sum squared resid
74.30247
Schwarz criterion
5.586440
Log likelihood
-20.26632
F-statistic
1.346627
Durbin-Watson stat
1.325655
Prob(F-statistic)
0.289950
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
Mô hình trên đây thể hiện mối quan hệ thuận giữa điểm Anh Văn và điểm Khoa Học. Cụ thể là khi điểm môn Khoa Học tăng thêm 1điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.57 điểm.
Khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn là 3.76 điểm.
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/14/10 Time: 21:13
Sample: 1 8
Included observations: 8
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.691257
3.486802
0.485045
0.6448
DIEMTOAN
0.609907
0.348935
1.747907
0.1311
R-squared
0.337396
Mean dependent var
7.462500
Adjusted R-squared
0.226962
S.D. dependent var
3.605130
S.E. of regression
3.169724
Akaike info criterion
5.357484
Sum squared resid
60.28290
Schwarz criterion
5.377344
Log likelihood
-19.42994
F-statistic
3.055180
Durbin-Watson stat
2.104833
Prob(F-statistic)
0.131069
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
Mô hình trên cũng thể hiện mối quan hệ thuận giữa điểm Anh Văn và điểm Toán. Cụ thể là khi điểm môn Toán tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.61 điểm.
Khi điểm môn Toán bằng không thì về trung bình điểm môn Anh Văn là 1.69 điểm.
Nhận xét tổng quát: Do hệ số tương quan của 2 mô hình là rất thấp (R2<0.5) cho thấy mức độ phù hợp của 2 mô hình là rất thấp. Các biến đưa vào mô hình hầu như không có tác động đến biến phụ thuôc, mô hình đưa ra không có ý nghĩa nhiều về mặt thống kê. Hay điểm môn Khoa Học hoặc môn Toán không có ảnh hưởng đến điểm của môn Anh văn.
b. Giải thích ý nghĩa của hệ số tương quan ? Giải thích ý nghĩa của hệ số độ dốc và tung độ gốc của phương trình hồi qui ?
ý nghĩa của hệ số tương quan:
R2 đo lường mối tương quan giữa biến phụ thuộc (điểm Anh Văn) với biến độc lập (điểm Khoa Học, điểm Toán). R2 ở 2 mô hình trên đều rất nhỏ điều đó chứng tỏ điểm của môn Anh Văn không phụ thuộc vào môn khoa học hay môn toán.
Ý nghĩa của hệ số độ dốc và tung độ gốc:
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
+ b1= 3.762656345: khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn bằng 3.76
+ b2 = 0.5681141889 : khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.57 điểm
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
+ b1= 1.691256533: khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn bằng 1.69
+ b2 = 0.6099068394: khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.61 điểm
Bài tập 3:
Ta có tập dữ liệu sau bao gồm 64 quan sát của các quốc gia với các biến số được giải thích bên dưới của bảng số liệu :
obs
CM
FLR
PGNP
TFR
obs
CM
FLR
PGNP
TFR
1
128
37
1870
6.66
33
142
50
8640
7.17
2
204
22
130
6.15
34
104
62
350
6.6
3
202
16
310
7
35
287
31
230
7
4
197
65
570
6.25
36
41
66
1620
3.91
5
96
76
2050
3.81
37
312
11
190
6.7
6
209
26
200
6.44
38
77
88
2090
4.2
7
170
45
670
6.19
39
142
22
900
5.43
8
240
29
300
5.89
40
262
22
230
6.5
9
241
11
120
5.89
41
215
12
140
6.25
10
55
55
290
2.36
42
246
9
330
7.1
11
75
87
1180
3.93
43
191
31
1010
7.1
12
129
55
900
5.99
44
182
19
300
7
13
24
93
1730
3.5
45
37
88
1730
3.46
14
165
31
1150
7.41
46
103
35
780
5.66
15
94
77
1160
4.21
47
67
85
1300
4.82
16
96
80
1270
5
48
143
78
930
5
17
148
30
580
5.27
49
83
85
690
4.74
18
98
69
660
5.21
50
223
33
200
8.49
19
161
43
420
6.5
51
240
19
450
6.5
20
118
47
1080
6.12
52
312
21
280
6.5
21
269
17
290
6.19
53
12
79
4430
1.69
22
189
35
270
5.05
54
52
83
270
3.25
23
126
58
560
6.16
55
79
43
1340
7.17
24
12
81
4240
1.8
56
61
88
670
3.52
25
167
29
240
4.75
57
168
28
410
6.09
26
135
65
430
4.1
58
28
95
4370
2.86
27
107
87
3020
6.66
59
121
41
1310
4.88
28
72
63
1420
7.28
60
115
62
1470
3.89
29
128
49
420
8.12
61
186
45
300
6.9
30
27
63
19830
5.23
62
47
85
3630
4.1
31
152
84
420
5.79
63
178
45
220
6.09
32
224
23
530
6.5
64
142
67
560
7.2
Trong đó: - CM : Tỉ lệ tử vong của trẽ sơ sinh (%)
- FLR : Tỉ lệ biết chử của dân số (%)
- PGNP : GNP bình quân đầu người (Đô la)
- TFR : Tỉ lệ sinh chung của dân số (%)
1. Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic ? - Sau đó vẽ biểu đồ phân tán giữa CM và FLR; CM và PGNP; CM và TFR. Rồi từ đó đối chiếu đồ thị với các giải thích của anh chị lúc ban đầu ( nêu lên sự phù hợp và không phù hợp với lời giải thích ban đầu)
Trả lời:
Mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho:
+ Tỉ lệ biết chữ của dân số (FLR): đây là mối quan hệ tỉ lệ nghịch. Tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp. Khi dân trí cao thì người dân sẽ tiếp thu được nhiều tri thức hơn trong việc chăm sóc, bảo vệ sức khỏe cho trẻ sơ sinh, dân trí cao thì con người sẽ phá bỏ những phong tục tập quán lạc hậu, những điều lệ cổ hũ gây nguy hiểm đến tính mạng của trẻ sơ sinh, từ đó làm giảm tỉ lệ tử vong ở trẻ sơ sinh.
+ GNP bình quân đầu người (PGNP): đây cũng là mối quan hệ tỉ lệ nghịch. GNP bình quân đầu người càng cao thì người dân sẽ có điều kiện hơn trong việc chăm sóc, bảo vệ sức khỏe của trẻ sơ sinh. Khi thu nhập của người dân được tăng lên thì người ta sẽ quan tâm hơn đến vấn đề dinh dưỡng cho trẻ sơ sinh, họ sẽ có điều kiện hơn để đi khám chữa bệnh…. từ đó làm giảm tỉ lệ tử vong của trẻ sơ sinh.
+ Tỉ lệ sinh chung của dân số (TFR): đây là mối quan hệ tỉ lệ thuận. Khi tỉ lệ sinh chung càng cao thì số trẻ sơ sinh sinh ra càng nhiều, đây là một vấn đề khó khăn cho công tác chăm sóc và bảo vệ sức khỏe cho trẻ sơ sinh. Từ đó có thể làm tăng tỉ lệ tử vong ở trẻ sơ sinh.
Qua đồ thị cho thấy tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp và ngược lại.
Tuy nhiên có chỗ chưa phù hợp với nhận xét ở chỗ: có một số trường hợp, khi ti lệ biết chữ của dân số không phải là cao nhất nhưng tỉ lệ tử vong của trẻ sơ sinh là thấp nhất.
Qua đồ thị cho thấy GNP bình quân đầu người càng cao thì tỉ lệ tử vong càng thấp. Mức độ phân tán của GNP bình quân đầu người thấp còn khá cao, điều này chứng tỏ GNP bình quân đầu người ở đây còn thấp và tỉ lệ tử vong của trẻ sơ sinh ở đây còn cao. Đây hoàn toàn phù hợp với nhận xét ban đầu
Qua đồ thị ta thấy tỉ lệ sinh chung của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng cao. Tuy nhiên cũng có một số trường hợp, tỉ lệ sinh chung cao nhưng tỉ lệ tử vong của trẻ sơ sinh vẫn thấp, điều này cho thấy: mặc dù tỉ lệ sinh cao nhưng công tác chăm sóc và bảo vệ sức khỏe tốt hạn chế được tỉ lệ tử vong ở trẻ sơ sinh.
2. Anh chị hãy xây dựng mô hình hồi qui đơn cho CM va PGNP . Nhận xét các thông tin chính từ mô hình nầy như ý nghĩa thống kê của hệ số hồi qui, hệ số xác định R2 .
Dependent Variable: CM
Method: Least Squares
Date: 05/14/10 Time: 21:15
Sample: 1 64
Included observations: 64
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
157.4244
9.845583
15.98935
0.0000
PGNP
-0.011364
0.003233
-3.515661
0.0008
R-squared
0.166217
Mean dependent var
141.5000
Adjusted R-squared
0.152769
S.D. dependent var
75.97807
S.E. of regression
69.93413
Akaike info criterion
11.36374
Sum squared resid
303228.5
Schwarz criterion
11.43120
Log likelihood
-361.6396
F-statistic
12.35987
Durbin-Watson stat
1.931458
Prob(F-statistic)
0.000826
Mô hình hồi qui đơn:CM = 157.4244406 - 0.01136445358*PGNP
Qua phương trình hồi qui ta thấy mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và GNP bình quân đầu người là mối quan hệ tỉ lệ nghịch.
+ Trong điều kiện GNP bình quân đầu người không đổi, về trung bình tỉ lệ tử vong của trẻ sơ sinh là 157.43%.
+ Khi GNP bình quân đầu người tăng thêm 1 USD thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm 0.114%.
+ R2 = 0.166217 cho thấy mô hình đưa ra không phù hợp, không có ý nghĩa thống kê, biến đưa vào không giải thích nhiều về biến phụ thuộc, hay nói cách khác tỉ lệ tử vong của trẻ sơ sinh ít chịu ảnh hưởng bởi GNP bình quân đầu người mà phụ thuộc vào nhiều nhân tố khác nữa.
3. Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và PGNP. Nhận xét thông tin chính từ mô hình nầy , như ý nghĩa thống kê của hệ số , hệ số xác định R2.
Dependent Variable: CM
Method: Least Squares
Date: 05/14/10 Time: 21:16
Sample: 1 64
Included observations: 64
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
263.6416
11.59318
22.74109
0.0000
FLR
-2.231586
0.209947
-10.62927
0.0000
PGNP
-0.005647
0.002003
-2.818703
0.0065
R-squared
0.707665
Mean dependent var
141.5000
Adjusted R-squared
0.698081
S.D. dependent var
75.97807
S.E. of regression
41.74780
Akaike info criterion
10.34691
Sum squared resid
106315.6
Schwarz criterion
10.44811
Log likelihood
-328.1012
F-statistic
73.83254
Durbin-Watson stat
2.186159
Prob(F-statistic)
0.000000
CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP
Phương trình hồi qui cho thấy:
+ Trong điều kiện GNP bình quân đầu người và tỉ lệ biết chữ của dân số không đổi thì về trung bình tỉ lệ tử vong của trẻ sơ sinh là 263.64%
+ Trong điều kiện GNP bình quân đầu người không đổi, khi tỉ lệ biết chữ của dân số tăng 1% thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm 2.23%.
+ Trong điều kiện tỉ lệ biết chữ của dân số không đổi, khi GNP bình quân đầu người tăng thêm 1 USD thì về trung bình tỉ lệ tử vong của trẻ sơ sinh giảm 0.0056%.
+ R2 = 0.707665 cho thấy mức độ phù hợp của mô hình là khá cao. Các biến đưa vào mô hình đã giải thích được phần lớn biến phụ thuộc, hay nói cách khác tỉ lệ tử vong của trẻ sơ sinh chịu phần lớn vào tỉ lệ biết chữ của dân số và GNP bình quân đầu người.
4 . So sánh mô hình đơn và mô hình bội anh chị có nhận xét gì về hệ số hồi qui tìm được của biến PGNP, nếu phải chọn hệ số PGNP của mô hình nào để giải thích tác động của PGNP lên CM ? Tại sao?
So sánh 2 mô hình hồi qui cho thấy: hệ số hồi qui của biến PGNP của phương trình hồi qui đơn nhỏ hơn hệ số hồi qui của phương trình hồi qui bội. Điều này cho thấy hệ số hồi qui của biến PGNP của phương trình hồi qui bội giải thích biến CM rõ hơn của phương trình hồi qui đơn.
nếu phải chọn thì ta nên chọn hệ số PGNP của mô hình hồi qui bội để giải thích tác động của PGNP lên CM. Vì ở mô hình hồi qui bội hệ số của biến PGNP giải thích rõ hơn tác động của biến PGNP lên CM , R2 lớn cho thấy mô hình phù hợp hơn và có ý nghĩa thống kê.
5. Hồi qui CM cho tất cả các biến trong tập dữ liệu ? Nhận xét va cho ý kiến của anh chị?
Dependent Variable: CM
Method: Least Squares
Date: 05/14/10 Time: 21:17
Sample: 1 64
Included observations: 64
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
168.3067
32.89165
5.117003
0.0000
FLR
-1.768029
0.248017
-7.128663
0.0000
PGNP
-0.005511
0.001878
-2.934275
0.0047
TFR
12.86864
4.190533
3.070883
0.0032
R-squared
0.747372
Mean dependent var
141.5000
Adjusted R-squared
0.734740
S.D. dependent var
75.97807
S.E. of regression
39.13127
Akaike info criterion
10.23218
Sum squared resid
91875.38
Schwarz criterion
10.36711
Log likelihood
-323.4298
F-statistic
59.16767
Durbin-Watson stat
2.170318
Prob(F-statistic)
0.000000
CM = 168.3066897 - 1.768029221*FLR - 0.00551122506*PGNP + 12.86863633*TFR
Nhận xét:
Qua phương trình hồi qui cho thấy tất cả các biến đưa vào (FLR, PGNP, TFR) đều giải thích được cho biến phụ thuộc (CM).
Hệ số hồi qui của các biến trong mô hình này lớn hơn các mô hình trên, chứng tỏ các biến đưa ra ở mô hình này giải thích rõ biến phụ thuộc hơn so với các mô hình trên.
R2 = 0.747372 cao hơn các mô hình trên, cho thấy mức độ phù hợp này khá cao, có ý nghĩa thống kê hơn cả các mô hình trên vì CM không chịu tác động riêng lẽ bởi bất kì yếu tố nào mà CM chịu tác động cộng gộp bởi các nhân tố: FLR, PGNP, TFR và nhiều nhân tố khác.
+ Mô hình này thể hiện giải thích rõ nhất tác động của các biến đến biến phụ thuộc cho nên mô hình này nên lựa chọn là mô hình giải thích nguyên nhân biến động của tỉ lệ tử vong của trẻ sơ sinh
Bài 4 :Ta có tập dữ liệu sau: Baitap 4 – cau 2 - luan
obs
AGED
ALCC
EDU1
EDU2
HEXC
INCC
MORT
PHYS
POV
TOBC
URB
1
0.122
1.9
0.565
0.122
1620
10673
934.9
142
0.189
114.5
0.675
2
0.034
3.86
0.825
0.211
1667
18187
396.2
127
0.107
128.9
0.417
3
0.123
3.08
0.724
0.174
1473
12795
771.5
184
0.132
107.1
0.764
4
0.149
1.78
0.555
0.108
1552
10476
1022.8
136
0.19
125.8
0.397
5
0.106
3.19
0.735
0.196
2069
16065
766
235
0.114
102.8
0.957
6
0.09
3.09
0.786
0.23
1664
14812
625.7
196
0.101
112.4
0.817
7
0.133
2.8
0.703
0.207
1945
18089
888.4
275
0.08
111
0.926
8
0.114
3.17
0.686
0.175
1691
14272
880.2
185
0.119
144.5
0.659
9
0.122
5.34
0.671
0.275
3872
18168
1120.5
552
0.186
122.1
1
10
0.177
3.12
0.667
0.149
1886
13742
1065.6
191
0.135
124.2
0.908
11
0.1
2.48
0.564
0.146
1755
12543
814.3
159
0.166
128.8
0.648
12
0.097
2.97
0.738
0.203
1693
13814
554.2
212
0.099
69.8
0.763
13
0.112
2.43
0.737
0.158
1288
11120
708.7
118
0.126
100.7
0.2
14
0.12
2.77
0.665
0.162
1864
14738
886.5
199
0.11
121.6
0.825
15
0.119
2.19
0.664
0.125
1625
12446
876.3
142
0.097
135.3
0.681
16
0.145
2.09
0.715
0.139
1758
12594
966.1
136
0.101
109.4
0.434
17
0.134
1.95
0.733
0.17
1820
13775
900.3
162
0.101
115.7
0.534
18
0.12
1.85
0.531
0.111
1404
10824
935
149
0.176
182.4
0.461
19
0.101
2.63
0.577
0.139
1716
11274
825.4
173
0.186
125
0.692
20
0.133
2.57
0.687
0.144
1641
11887
979.4
165
0.13
127.9
0.361
21
0.106
2.84
0.674
0.204
1732
15864
833.6
303
0.098
121.9
0.929
22
0.136
3.04
0.722
0.2
2289
16380
955.4
300
0.096
117.2
0.906
23
0.114
2.6
0.68
0.143
1996
13608
866.2
174
0.104
126.6
0.799
24
0.125
2.68
0.731
0.174
1888
14087
830.2
203
0.095
113
0.666
25
0.12
2.06
0.548
0.123
1519
9187
944.6
117
0.239
115.3
0.305
26
0.137
2.27
0.635
0.139
1858
13244
1000.4
179
0.122
129.2
0.66
27
0.121
2.95
0.744
0.175
1494
10974
815
136
0.123
103.6
0.242
28
0.136
2.41
0.734
0.155
1766
13281
928.5
156
0.107
105.1
0.476
29
0.103
5.19
0.755
0.144
1946
14488
772.3
155
0.087
146.7
0.826
30
0.116
4.91
0.723
0.182
1417
14964
849.1
179
0.085
201.1
0.563
31
0.129
2.83
0.674
0.183
1702
17211
940.7
219
0.095
116.9
1
32
0.098
2.75
0.689
0.176
1385
10914
672.8
161
0.176
88
0.489
33
0.128
2.67
0.663
0.179
2412
16050
969.9
287
0.134
115.9
0.912
34
0.115
2.13
0.548
0.132
1380
11617
846.3
168
0.148
156.3
0.554
35
0.13
2.55
0.664
0.148
1872
12052
821.6
157
0.126
103.2
0.384
36
0.123
2.26
0.67
0.137
1833
13228
920.6
182
0.103
126.7
0.789
37
0.124
1.91
0.66
0.151
1644
12232
900.8
138
0.134
124.2
0.588
38
0.134
2.63
0.756
0.179
1654
12622
889.7
189
0.107
118.6
0.677
39
0.146
2.25
0.647
0.136
1894
13437
1043.9
214
0.105
115.8
0.848
40
0.146
2.92
0.611
0.154
2054
13906
997.6
223
0.103
133.4
0.926
41
0.105
2.5
0.537
0.134
1341
10586
812.6
146
0.166
125.4
0.605
42
0.139
2.33
0.679
0.14
1617
11161
932.6
130
0.169
104.4
0.291
43
0.123
1.95
0.562
0.126
1671
11243
906.8
176
0.165
128.7
0.671
44
0.095
2.82
0.626
0.169
1577
13483
722.2
160
0.147
115.9
0.813
45
0.08
1.53
0.8
0.199
1203
10493
550.1
171
0.103
66.5
0.774
46
0.119
3.12
0.71
0.19
1481
12117
871.4
232
0.121
144.5
0.232
47
0.105
2.55
0.624
0.191
1498
14542
794.1
194
0.118
134.6
0.722
48
0.117
2.71
0.776
0.19
1660
13876
782.8
196
0.098
96.5
0.816
49
0.136
1.68
0.56
0.104
1542
10193
1003.8
156
0.15
109.1
0.365
50
0.13
3.19
0.696
0.148
1862
13154
868.8
172
0.087
107
0.665
51
0.084
2.86
0.779
0.172
1453
13223
642.9
125
0.079
125.7
0.292
Trong đó : - MORT : Tỉ lệ tử vong chung trên 100.000 dân số
INCC : Thu nhập đầu người tính bằng USD
POV : Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó
EDU1 : Tỉ lệ dân số đã học trung học
EDU2 : Tỉ lệ dân số đã học trung học và đại học.
ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người.
TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao
HEXC : Chi tiêu y tế bình quân đầu người (USD)
URB : Tỉ lệ dân số sống tại các khu vực thành thị
AGED : Tỉ lệ dân số có độ tuồi trên 65
PHYS : Các cán bộ y tế trên 1000.000 dân
Yêu cầu :
Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích, hãy lý giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể và chỉ ra hướng tác động nầy?
+ Đối với INCC: thu nhập đầu người càng thấp thì tỉ lệ tử vong chung trên 100.000 dân số càng cao, do thu nhập thấp thì người dân có ít điều kiện hơn trong việc chăm sóc sức khỏe cho bản thân và gia đình về dinh dưỡng, y tế… từ dó có thể làm tăng khả năng tỉ lệ tử vong.
+ POV: Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó càng cao thì việc chăm lo của người dân đến dinh dưỡng và tiếp cận đến các dịch vụ y tế.. càng thấp, làm cho tỉ lệ suy dinh dưỡng cao, nếu người dân mắc các bệnh tật thì cũng ít có khả năng chạy chữa, từ đó có thể làm tỉ lệ tử vong chung trên 100.000 dân số càng cao,
+ EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã học trung học và đại học càng cao cho thấy trình độ dân trí của người dân càng cao, dân trí cao thì người dân mới tiếp thu được những kiến thức tiến bộ về sức khỏe, y tế, khoa học….từ đó có thể giảm bớt được tỉ lệ tử vong chung trên 100.000 dân số do họ có thể bỏ nhưng hủ thục lạc hậu, những cách chữa bệnh không khoa học… có thể ảnh hưởng đến sức khỏe người dân.
nhưng EDU2 tác động mạnh hơn.
+ ALCC v à TOBC : khi tiêu dùng cồn ( rượu) tính bằng lít trên đầu người và tiêu dùng thuốc lá đầu người càng cao thì người dân sẽ dễ bị mắc các bệnh dạ dày, ung thư phổi…. nhiều từ đó tỉ lệ tử vong chung trên 100.000 dân số càng cao
HEXC : Chi tiêu y tế bình quân đầu người càng cao thì, Chi tiêu y tế bình quân đầu người càng cao nghĩa là người dân sẽ chi cho khám chữa bệnh cao, từ đó có thể phát hiện ra bệnh sớm, phòng ngừa và chữa trị bệnh kịp thời dẫn đến tỉ lệ tử vong chung trên 100.000 dân số càng thấp
URB : Tỉ lệ dân số sống tại các khu vực thành thị cao nghĩa là nhiều người sống ở khu vực thành thị, nơi có đầy đủ cơ sở vật chất hạ tầng, có đủ lực lượng y tế khám chữa bệnh cho người dân từ đó có thể làm giảm tỉ lệ tử vong chung trên 100.000 dân số
AGED : Tỉ lệ dân số có độ tuồi trên 65càng cao, tức là số người cao tuổi cao dẫn đến tỉ lệ tử vong chung trên 100.000 dân số cao do người già thì sức khỏe yếu, dễ mắc bệnh….
PHYS : Các cán bộ y tế trên 1000.000 dân càng cao nghĩa là số người được 1 cán bộ y tế chăm sóc càng ít,khi mà 1 cán bộ y tế chỉ chăm sóc ít bệnh nhân hơn thì người cán bộ y tế đó sẽ dồn hết tâm sức của mình cho người bệnh đó để mà khám chữa bệnh, từ đó có thể làm giảm tỉ lệ tử vong chung trên 100.000 dân số
Ước lượng mô hình hồi qui đa biến bao gồm tất cả những biến giải thích đang có? Thực hiện kiểm định cho mức ý nghĩa tổng quát – Nhận xét sự thích hợp ? Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn bỏ qua.
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:19
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
46.59555
168.2097
0.277009
0.7832
AGED
4126.895
322.3451
12.80272
0.0000
ALCC
-25.91511
11.09681
-2.335366
0.0246
EDU1
68.77913
196.8405
0.349415
0.7286
EDU2
-1180.217
548.8868
-2.150201
0.0376
HEXC
0.073889
0.034127
2.165088
0.0364
INCC
0.004511
0.005817
0.775551
0.4426
PHYS
0.640384
0.263636
2.429044
0.0197
POV
549.8647
308.5540
1.782069
0.0823
TOBC
1.470480
0.353504
4.159732
0.0002
URB
-32.45556
35.64423
-0.910542
0.3680
R-squared
0.948570
Mean dependent var
855.0059
Adjusted R-squared
0.935713
S.D. dependent var
137.9660
S.E. of regression
34.98117
Akaike info criterion
10.13592
Sum squared resid
48947.30
Schwarz criterion
10.55259
Log likelihood
-247.4660
F-statistic
73.77592
Durbin-Watson stat
1.597995
Prob(F-statistic)
0.000000
MORT = 46.59554973 + 4126.895059*AGED - 25.91510605*ALCC + 68.7791315*EDU1 - 1180.217201*EDU2 + 0.07388858751*HEXC + 0.00451136983*INCC + 0.6403836367*PHYS + 549.8646857*POV + 1.470480259*TOBC - 32.45555872*URB
Kiểm định cho mức ý nghĩa tổng quát
Giả thiết: Ho: R2 = 0
H1: R2 > 0
FR = 73.77592
Với mức ý nghĩa 10%, tra bảng phân phối Fisher: F > F0.05(9,41) ---à bác bỏ giả thiết Ho, tức là mô hình có ý nghĩa thống kê ở mức 10%.
Qua mô hình ta thấy: R2 = 0.948570 à mức độ phù hợp của mô hình này cao, mô hình có ý nghĩa thống kê.
Kiểm định mức ý nghĩa đối với từng hệ số hồi qui:
Giả thiết: Ho: bi = 0
H1: bi # 0
Với mức ý nghĩa 10%, tra bảng phân phối student: T0.05(40) = 1.684
Hệ số hồi qui
Trị thống kê
So sánh
Kết luận
b2
12.80272
T > T0.05(40)
Bác bỏ Ho
b3
-2.335366
T > T0.05(40)
Bác bỏ Ho
b4
0.349415
T < T0.05(40)
Chấp nhận Ho
b5
-2.150201
T > T0.05(40)
Bác bỏ Ho
b6
2.165088
T > T0.05(40)
Bác bỏ Ho
b7
0.775551
T < T0.05(40)
Chấp nhận Ho
b8
2.429044
T > T0.05(40)
Bác bỏ Ho
b9
1.782069
T > T0.05(40)
Bác bỏ Ho
b10
4.159732
T > T0.05(40)
Bác bỏ Ho
b11
-0.910542
T < T0.05(40)
Chấp nhận Ho
Chấp nhận Ho: tức là các biến đưa vào mô hình không ảnh hưởng đến biến phụ thuộc MORT
Bác bỏ Ho: tức là các biến đưa vào có ảnh hưởng đến biến phụ thuộc. Mô hình gồm các biến này có ý nghĩa thống kê.
Các biến có thể bỏ qua: EDU1, INCC, URB
Đầu tiên hãy thực hiện một kiểm định WALD đối với việc bỏ tất cả những biến nầy. Sau đó, bỏ tất cả chúng và ước lượng lại mô hình . hãy đánh giá chất lượng của phép hồi qui mới nầy ?
Kiểm định WALD
giả thiết: Ho: R2 = 0
H1: R2 # 0
Wald Test:
Equation: EQ01
Test Statistic
Value
df
Probability
F-statistic
0.432276
(3, 40)
0.7310
Chi-square
1.296829
3
0.7299
Null Hypothesis Summary:
Normalized Restriction (= 0)
Value
Std. Err.
C(4)
68.77913
196.8405
C(7)
0.004511
0.005817
C(11)
-32.45556
35.64423
Restrictions are linear in coefficients.
Theo kết quả của bảng trên: F(3,40)=2.84 > 0.432276; 0.731>0.1 ---à chấp nhận giả thiết Ho: R2=0. tức là mô hình không có ý nghĩa thống kê, hay các biến: EDU1, INCC, URB đưa vào mô hình không ảnh hưởng đến biến phụ thuộc MORT. Vì vậy ta không nên đưa 3 biến này vào mô hình.
Ước lượng lại mô hình
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:22
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
73.76836
94.44515
0.781071
0.4390
AGED
4167.319
307.4568
13.55416
0.0000
ALCC
-25.25888
10.23731
-2.467337
0.0177
EDU2
-843.8800
352.4100
-2.394597
0.0211
HEXC
0.089816
0.027059
3.319302
0.0018
PHYS
0.479654
0.193828
2.474637
0.0174
POV
452.7655
161.4134
2.805006
0.0075
TOBC
1.563512
0.286509
5.457105
0.0000
R-squared
0.946903
Mean dependent var
855.0059
Adjusted R-squared
0.938259
S.D. dependent var
137.9660
S.E. of regression
34.28140
Akaike info criterion
10.05018
Sum squared resid
50534.21
Schwarz criterion
10.35321
Log likelihood
-248.2797
F-statistic
109.5479
Durbin-Watson stat
1.610035
Prob(F-statistic)
0.000000
MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC - 843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC
- Việc đưa 3 biến không có tác động đến biến phụ thuộc MORT gây ra hiện tượng đa cộng tuyến, làm cho mô hình ban đầu (bao gồm tất cả các biến) có R2 cao (cao hơn cả mô hình sau khi ước lượng lại), trị thống kê mất ý nghĩa, làm cho chúng ta có đánh giá sai lầm về mô hình: chúng ta chấp nhận mô hình có ý nghĩa thống kê, các biến đưa vào đều có tác động đến biến phụ thuộc.
- Sau khi bỏ 3 biến không làm ảnh hưởng đến MORT, ta thấy mô hình phù hợp hơn (R2 = 0.946903), tức là mô hình đưa ra có ý nghĩa thống kê, các biến đưa vào giải thích hầu hết biến phụ thuộc MORT (với mức ý nghĩa 10%, trị thống kê của các hệ số hồi qui ở các biến đều lớn hơn mức tra bảng).
Trở lại với mô hình gốc ban đầu ( Mô hình không giới hạn U) , lần lượt mỗi lần bỏ một biến có ít ý nghĩa nhất và ước lượng lại . Đánh giá chất lượng của phép hồi qui mới ?
Bỏ EDU1
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:23
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
92.81956
102.7758
0.903127
0.3717
AGED
4144.662
314.8831
13.16254
0.0000
ALCC
-24.63643
10.36327
-2.377283
0.0222
EDU2
-1057.359
416.9455
-2.535966
0.0151
HEXC
0.078052
0.031636
2.467190
0.0179
INCC
0.004070
0.005617
0.724592
0.4728
PHYS
0.591597
0.221220
2.674242
0.0107
POV
469.5791
203.7221
2.304998
0.0263
TOBC
1.426362
0.326631
4.366888
0.0001
URB
-35.97989
33.81937
-1.063884
0.2936
R-squared
0.948413
Mean dependent var
855.0059
Adjusted R-squared
0.937089
S.D. dependent var
137.9660
S.E. of regression
34.60463
Akaike info criterion
10.09976
Sum squared resid
49096.70
Schwarz criterion
10.47854
Log likelihood
-247.5438
F-statistic
83.75303
Durbin-Watson stat
1.585340
Prob(F-statistic)
0.000000
MORT = 92.8195617 + 4144.66192*AGED - 24.63643081*ALCC - 1057.359357*EDU2 + 0.07805159076*HEXC + 0.004070138276*INCC + 0.5915970828*PHYS + 469.5791064*POV + 1.426361908*TOBC - 35.97989484*URB
Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do xảy ra hiện tượng đa cộng tuyến vì mô hình vẫn còn đưa vào mô hình biến không có ảnh hưởng đến MORT, nếu chấp nhận mô hình thì ta sẽ có những kết luận sai lầm.
Với mô hình mới có K-1 biến giải thích, tiếp tục như câu 4 và yêu cầu như trên ?
Bỏ EDU1 Và INCC 5
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:24
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
103.0909
101.2163
1.018521
0.3143
AGED
4127.928
312.2544
13.21976
0.0000
ALCC
-25.19964
10.27548
-2.452404
0.0184
EDU2
-911.4815
363.0489
-2.510630
0.0160
HEXC
0.089616
0.027160
3.299569
0.0020
PHYS
0.550671
0.212676
2.589252
0.0132
POV
396.2853
175.8333
2.253755
0.0295
TOBC
1.533024
0.289927
5.287621
0.0000
URB
-24.63730
29.80849
-0.826520
0.4132
R-squared
0.947753
Mean dependent var
855.0059
Adjusted R-squared
0.937801
S.D. dependent var
137.9660
S.E. of regression
34.40841
Akaike info criterion
10.07326
Sum squared resid
49725.42
Schwarz criterion
10.41417
Log likelihood
-247.8682
F-statistic
95.23350
Durbin-Watson stat
1.629472
Prob(F-statistic)
0.000000
MORT = 103.0909379 + 4127.928148*AGED - 25.19963943*ALCC - 911.4814852*EDU2 + 0.08961614111*HEXC + 0.5506708875*PHYS + 396.2853088*POV + 1.533024196*TOBC - 24.63729751*URB
Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do vẫn còn hiện tượng đa cộng tuyến, mô hình này không phải là mô hình đánh giá đúng đắn tác động của một số biến có ý nghĩa đến biến phụ thuộc
Tiếp tục quá trình nầy cho đến khi tất cả các biến còn lại đều có ý nghĩa. Mô hình cuối nầy có giống như mô hình giới hạn R mà các bạn thu được từ kết quả câu 3 hay không ? từ kết quả đó bạn có suy gẫm gì?
bỏ EDU1 Và INCC và URB 6
Dependent Variable: MORT
Method: Least Squares
Date: 05/14/10 Time: 21:25
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
73.76836
94.44515
0.781071
0.4390
AGED
4167.319
307.4568
13.55416
0.0000
ALCC
-25.25888
10.23731
-2.467337
0.0177
EDU2
-843.8800
352.4100
-2.394597
0.0211
HEXC
0.089816
0.027059
3.319302
0.0018
PHYS
0.479654
0.193828
2.474637
0.0174
POV
452.7655
161.4134
2.805006
0.0075
TOBC
1.563512
0.286509
5.457105
0.0000
R-squared
0.946903
Mean dependent var
855.0059
Adjusted R-squared
0.938259
S.D. dependent var
137.9660
S.E. of regression
34.28140
Akaike info criterion
10.05018
Sum squared resid
50534.21
Schwarz criterion
10.35321
Log likelihood
-248.2797
F-statistic
109.5479
Durbin-Watson stat
1.610035
Prob(F-statistic)
0.000000
MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC - 843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC
Sau khi bỏ tất cả các biến không có tác động đến MORT, ta thấy mô hình thu được hoàn toàn giống mô hình đã ước lượng lại ở câu 3.
Qua kết quả này ta thấy: hậu quả của hiện tượng đa cộng tuyến là rất lớn, nó làm cho chúng ta lầm tưởng rằng mô hình không giới hạn ban đầu có ý nghĩa thống kê, các biến đưa vào mô hình đều có tác động đến biến phụ thuộc do R2 rất lớn. Nếu chúng ta chấp nhận mô hình thì chúng ta sẽ có những kết luận vội vã và không chính xác tác động của các biến đến MORT.
Bài 5: ( baitâp 6 – bang câu 4)
Tổng cục thống kê quốc gia của Đài Loan đưa ra một số dữ liệu về GDP thực của khu vực nông nghiệp từ năm 1958 đến 1972 như sau :
Y : GDP thực của khu vực nông nghiệp ( triệu USD)
X2 : Số ngày lao động hằng năm của khu vực nông nghiệp ( triệu ngày công lao động )
X3 : Vốn thực của khu vực nông nghiệp hằng năm ( triệu USD)
YEAR
Y
X2
X3
1958
16607.7
275.5
17803.7
1959
17511.3
274.4
18096.8
1960
20171.2
269.7
18271.8
1961
20932.9
267
19167.3
1962
20406
267.8
19647.6
1963
20831.6
275
20803.5
1964
24806.3
283
22076.6
1965
26465.8
300.7
23445.2
1966
27403
307.5
24939
1967
28628.7
303.7
26713.7
1968
29904.5
304.7
29957.8
1969
27508.2
298.6
31585.9
1970
29035.5
295.5
33474.5
1971
29281.5
299
34821.8
1972
31535.8
288.1
41794.3
Hãy ước lượng hàm Cobb-Duoglas có dạng như sau :
Y= A.eR.T.X21. X3 2
Trong đó T là biến xu thế theo thời gian
Trả lời:
Lấy ln hai vế ta được
lnY = lnA + RT + 1lnX2 + 2lnX3
đặt Y* = lnY
X2* = lnX2
X3* = lnX3
b1* = lnA
ta có phương trình: Y* = b1* + RT + 1X2 + 2X3 (1)
T = năm - 1958
ước lượng phương trình (1) ta được:
Dependent Variable: LNGDP
Method: Least Squares
Date: 05/26/10 Time: 18:54
Sample: 1958 1972
Included observations: 15
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
9.412886
4.129936
2.279185
0.0436
T
0.064795
0.018935
3.421919
0.0057
LNLAODONG
0.878171
0.432277
2.031500
0.0671
LNVON
-0.468799
0.289806
-1.617632
0.1340
R-squared
0.946249
Mean dependent var
10.09653
Adjusted R-squared
0.931589
S.D. dependent var
0.207914
S.E. of regression
0.054381
Akaike info criterion
-2.762431
Sum squared resid
0.032530
Schwarz criterion
-2.573617
Log likelihood
24.71823
F-statistic
64.54878
Durbin-Watson stat
1.938628
Prob(F-statistic)
0.000000
LNGDP = 9.412886114 + 0.06479543845*T + 0.8781710093*LNLAODONG - 0.4687993113*LNVON
lấy e mũ 2 vế ta được:
GDP = e 9.412886114*e 0.06479543845*T *LAODONG 0.8781710093*VON -0.4687993113 (2)
Phương trình (2) là phương trình hồi qui ước lượng từ hàm Cobb-Duoglas có dạng: Y= A.eR.T.X21. X3 2
Trong đó:
A = e 9.412886114
R = 0.06479543845
hệ số 1 = 0.8781710093
hệ số 2 = -0.4687993113
Hãy giải thích các hệ số ước lượng R , 1 và 2 theo ý nghĩa kinh tế.
Ý nghĩa của các hệ số ước lượng:
+ Hệ số ước lượng R: trong điều kiện vốn và số ngày lao động hằng năm của khu vực nông nghiệp không thay đổi, qua mỗi năm năng suất trung bình R tăng them 1 đơn vị thì về trung bình GDP thực của khu vực nông nghiệp ở Đài Loan tăng e0.06479543845 triệu USD.
+ Hệ số ước lượng 1: trong điều kiện vốn và năng suất trung bình không thay đổi (tức là không có sự đầu tư thêm hoặc rút vốn ở khu vực nông nghiệp của Đài Loan) khi Số ngày lao động hằng năm tăng thêm 1 triệu ngày công lao động thì về trung bình GDP thực của khu vực nông nghiệp tăng thêm 10.8781710093 triệu USD.
+ Hệ số ước lượng 2: trong điều kiện số ngày lao động hằng năm không thay đổi, khi đàu tư thêm 1 triệu USD vào khu vực nông nghiệp thì về trung bình GDP giảm
1/10.4687993113 triệu USD.
Chỉ ra rằng khu vực nông nghiệp Đài loan có phát triển hiệu quả không ? Giải thích tại sao anh chị có nhận định như vậy? Ngòai những lý do về vốn, lao động , anh chị còn có giả thiết nào khác về nguyên nhân tác động đến sự phát triển của khu vực Đài loan ?
Mô hình trên cho thấy khu vực nông nghiệp Đài Loan phát triển không hiệu quả. Bởi vì qua mô hình ta thấy: khi vốn đầu tư càng tăng thêm thì GDP lại giảm đi, điều này cho thấy vốn đầu tư cho nông nghiệp của Đài Loan được sử dụng chưa hiệu quả do chưa đầu tư đúng, hợp lý, chưa chú trọng đầu tư vào công nghệ, giống, kĩ thuật sản xuất…
Nông nghiệp Đài Loan không phát triển một phần là do khí hậu và thổ nhưỡng ở đây không phù hợp để sản xuất một số loại giống cây trồng. Việc đầu tư thêm vốn chỉ làm gia tăng thêm chi phí sản xuất, từ đó đẩy giá thành sản phẩm lên cao khó cạnh tranh được với các mặt hàng nông sản nhập khẩu. Vì vậy việc đầu tư vào khu vực nông nghiệp cần chú trọng hơn trong việc nghiên cứu sản xuất những giống cây trồng năng suất cao, phù hợp với điều kiện tự nhiên ở đây, đưa công nghệ vào sản xuất,… không nên đầu tư dàn trãi, đầu tư vào sản xuất giống cây trồng mang lại năng suất không cao.
Ngoài những lý do về vốn và lao động nông nghiệp Đài Loan cần chú trọng đến việc đầu tư về công nghệ trong sản xuất, giống… từ đó có thể làm tăng năng suất lao động, ngoài ra còn có các yếu tố khác cũng ảnh hưởng đến nông nghiệp Đài Loan như đất đai, khí hậu, kĩ thuật sản xuất…đây là những yếu tố thiết yếu nhất đối với sự phát triển nông nghiệp.
Bài tập 6: (baitap 5- cau 4 - luan)
Một quốc gia có dữ liệu về tiết kiệm và tiêu dùng như sau :
YEAR
SAVINGS
INCOME
YEAR
SAVINGS
INCOME
1970
61
727.1
1983
167
2522.4
1971
68.6
790.2
1984
235.7
2810
1972
63.6
855.3
1985
206.2
3002
1973
89.6
965
1986
196.5
3187.6
1974
97.6
1054.2
1987
168.4
3363.1
1975
104.4
1159.2
1988
189.1
3640.8
1976
96.4
1273
1989
187.8
3894.5
1977
92.5
1401.4
1990
208.7
4166.8
1978
112.6
1580.1
1991
246.4
4343.7
1979
130.1
1769.5
1992
272.6
4613.7
1980
161.8
1973.3
1993
214.4
4790.2
1981
199.1
2200.2
1994
189.4
5021.7
1982
205.5
2347.3
1995
249.3
5320.8
Saving :Tiết kiệm quốc gia tính bằng tỉ USD
Income: Thu nhập quốc gia tính bằng tỉ USD
Yêu cầu :
Giai đọan 1970-1981 chính sách tiền tệ thắt chặt và mưc lãi suất rất cao , anh chi xác định Dum = 0 cho giai đọan nầy . Và Dum = 1 cho giai đọan 1982-1995 đây là giai đọan chính sách tiền tệ nới lỏng và lãi suất thấp .
Xây dựng hàm hồi qui đơn tuyến tính cho từng giai đọan nói trên theo mô thức :
Saving = 1 + 2* Income + u
Có nghĩa là anh chị xây dựng dạng hàm nầy cho giai đọan 1970-1981 và giai đọai 1982-1995. ý nghĩa kinh tế của 2 đo lường đại lượng gì trong hàm hồi qui?
Giai đọan 1970-1981:
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/14/10 Time: 21:34
Sample: 1970 1981
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.016117
11.63771
0.087313
0.9321
INCOME
0.080332
0.008367
9.601576
0.0000
R-squared
0.902143
Mean dependent var
106.4417
Adjusted R-squared
0.892358
S.D. dependent var
40.72222
S.E. of regression
13.36051
Akaike info criterion
8.173495
Sum squared resid
1785.032
Schwarz criterion
8.254313
Log likelihood
-47.04097
F-statistic
92.19026
Durbin-Watson stat
0.864230
Prob(F-statistic)
0.000002
SAVINGS = 1.016117401 + 0.08033187867*INCOME
Giai đọan 1982-1995:
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/14/10 Time: 21:35
Sample: 1982 1995
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
153.4947
32.71227
4.692266
0.0005
INCOME
0.014862
0.008393
1.770773
0.1020
R-squared
0.207169
Mean dependent var
209.7857
Adjusted R-squared
0.141100
S.D. dependent var
31.15670
S.E. of regression
28.87505
Akaike info criterion
9.695396
Sum squared resid
10005.22
Schwarz criterion
9.786690
Log likelihood
-65.86777
F-statistic
3.135639
Durbin-Watson stat
1.786588
Prob(F-statistic)
0.101972
SAVINGS = 153.49467 + 0.01486243404*INCOME
Ý nghĩa của hệ số hồi qui 2: cho thấy mối quan hệ tỉ lệ thuận giữa tiết kiệm quốc gia với thu nhập quốc gia. hệ số 2 đo lường đại lượng tiết kiệm quốc dân, nó cho biết mức độ tiết kiệm quốc dân tăng thêm khi thu nhập quốc dân tăng thêm 1 tỉ USD
+ Trong giai đoạn 1970-1981: Khi thu nhập quốc gia tăng thêm 1 tỉ USD thì về trung bình tiết kiệm quốc gia tăng thêm 0.08 tỉ USD
+ Trong giai đoạn 1982-1995: Khi thu nhập quốc gia tăng thêm 1 tỉ USD thì về trung bình tiết kiệm quốc gia tăng thêm 0.015 tỉ USD
Hãy xây dựng hàm hồi qui dạng bội (đa biến) có dạng sau đây cho giai đọan 1970-1995:
Saving = 1 + 2* Dum + 3* Income + u
ý nghĩa kinh tế của 3 đo lường đại lượng gì trong hàm hồi qui?
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/14/10 Time: 21:36
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
71.70587
13.54567
5.293639
0.0000
DUM
37.83347
22.90507
1.651751
0.1122
INCOME
0.026468
0.007925
3.339604
0.0028
R-squared
0.791900
Mean dependent var
162.0885
Adjusted R-squared
0.773804
S.D. dependent var
63.20446
S.E. of regression
30.06008
Akaike info criterion
9.752440
Sum squared resid
20783.00
Schwarz criterion
9.897605
Log likelihood
-123.7817
F-statistic
43.76180
Durbin-Watson stat
1.045517
Prob(F-statistic)
0.000000
SAVINGS = 71.70587083 + 37.83347007*DUM + 0.026467889*INCOME
Ý nghĩa kinh tế của đại lượng 3 : cho thấy mối quan hệ tỉ lệ thuận giữa tiết kiệm quốc gia với thu nhập quốc gia. đại lượng 3 đo lường đại lượng tiết kiệm quốc dân trong các giai đoạn với các chính sách tiền tệ khác nhau, nó cho biết mức độ tiết kiệm quốc dân tăng thêm 0.0265 Tỉ USD khi thu nhập quốc dân tăng thêm 1 tỉ USD trong điều kiện không có sự thay đổi gì về chính sách tiền tệ của quốc gia.
Từ câu 2 anh chị hãy viết phương trình hồi qui cho truờng hợp Dum=1 và Dum = 0 . So sánh kết quả nầy với kết quả mà anh chị đã tìm ra ở câu 1 . Nêu nhận xét của anh chị về kết quả tìm được ?
kết quả hồi qui 2 trường hợp dum = 0 và dum = 1 giai đoạn 1970 – 1995:
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/16/10 Time: 22:24
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
62.42267
12.76075
4.891772
0.0001
INCOME
0.037679
0.004237
8.893776
0.0000
R-squared
0.767215
Mean dependent var
162.0885
Adjusted R-squared
0.757515
S.D. dependent var
63.20446
S.E. of regression
31.12361
Akaike info criterion
9.787614
Sum squared resid
23248.30
Schwarz criterion
9.884391
Log likelihood
-125.2390
F-statistic
79.09925
Durbin-Watson stat
0.859717
Prob(F-statistic)
0.000000
SAVINGS = 62.42267117 + 0.03767912963*INCOME
Trường hợp dum=0 (1970 – 1995)
hàm hồi qui có dạng:
SAVINGS = 1 + 2* INCOME + u
SAVINGS = 62.42267117 + 0.03767912963*INCOME
+ So với trường hợp dum = 0 giai đoạn năm 1970 – 1981 của câu 1 ta thấy:
Mức tiết kiệm trung bình giai đoạn 1970 – 1995 ít hơn hơn mức tiết kiệm trong giai đoạn 1970 – 1981 khi thu nhập quốc dân tăng thêm 1 tỉ USD, bởi vì giai đoạn 1970 – 1995 do ảnh hưởng của chính sách tiền tệ mở rộng, lãi suất thấp (1982 – 1995) nên người dân có xu hướng đầu tư do vay được tiền với lãi suất thấp kéo theo cả giai đoạn 1970 – 1995 tiết kiệm quốc dân giảm. Cụ thể là: khi thu nhập tăng 1 tỉ USD thì về trung bình tiết kiệm tăng thêm 0.08 tỉ USD (1970 – 1981), gần 0.04 tỉ USD (1970 – 1995)
Trường hợp dum=1 (1970 – 1995):
hàm hồi qui có dạng:
SAVINGS = (1 + 2) + 3* INCOME + u
SAVINGS = 100.2561412 + 0.03767912963*INCOME
Hệ số b1 = 1 + 2 = 62.42267117 + 37.83347007 = 100.2561412
+ So với trường hợp dum = 1 giai đoạn năm 1982 – 1995 của câu 1 ta thấy:
Mức tiết kiệm trung bình giai đoạn 1970 – 1995 nhiều hơn hơn mức tiết kiệm trong giai đoạn 1982 – 1995 khi thu nhập quốc dân tăng thêm 1 tỉ USD. bởi vì giai đoạn 1970 – 1995 do ảnh hưởng của chính sách tiền tệ thắt chặt, lãi suất cao (1970 – 1981) kéo theo cả giai đoạn 1970 – 1995 mức tiết kiệm tăng do người dân có xu hướng gửi tiết kiệm nhiều (bởi vì lãi suất cao kéo theo chi phí cơ hội của việc giữ tiền cao). Cụ thể là: khi thu nhập tăng 1 tỉ USD thì về trung bình tiết kiệm tăng thêm khoảng 0.015 tỉ USD (1982 – 1995), khoảng 0.04 tỉ USD (1970 – 1995)
Hãy xây dựng hàm hồi qui dạng bội ( đa biến ) có dạng sau đây cho giai đọan 1970-1995:
Saving = 1 + 2* Dum + 3.Income + 4* Dum* Income + u
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/14/10 Time: 21:56
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.016117
20.16483
0.050391
0.9603
DUM
152.4786
33.08237
4.609058
0.0001
INCOME
0.080332
0.014497
5.541347
0.0000
DUM_X_INCOME
-0.065469
0.015982
-4.096340
0.0005
R-squared
0.881944
Mean dependent var
162.0885
Adjusted R-squared
0.865846
S.D. dependent var
63.20446
S.E. of regression
23.14996
Akaike info criterion
9.262501
Sum squared resid
11790.25
Schwarz criterion
9.456055
Log likelihood
-116.4125
F-statistic
54.78413
Durbin-Watson stat
1.648454
Prob(F-statistic)
0.000000
SAVINGS = 1.016117401 + 152.4785526*DUM + 0.08033187867*INCOME - 0.06546944463*DUM_X_INCOME
5. Từ kết quả của câu 4 hãy cho biết giữa 2 giai đọan có sự khác biệt ý nghĩa thống kê của hệ số hồi qui 4 hay không ? Sự khác biệt nầy được giải thích bằng ý nghĩa kinh tế là 2 giai đọan chính sách khác nhau ảnh hưởng thế nào đến hành vi tiết kiệm của công chúng
Từ kết quả câu 4 ta thấy: giữa 2 giai đoạn có sự khác biệt ý nghĩa thống kê của hệ số hồi qui 4 : cho thấy mối quan hệ tỉ lệ nghich gữa tiết kiệm với thu nhập. Trong trường hợp dum = 0, khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm tăng thêm 0.08 USD
Trong trường hợp dum = 1: khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm giảm đi (0.08 – 0.065) = 0.015 USD
do sự tác động của 2 chính sách tiền tệ khác nhau:
+ Đối với giai đoạn 1970 – 1981: khi chính phủ thực hiện chính sách tiền tệ thắt chặt, với mức lãi suất cao thì người dân sẽ gia tăng gửi tiết kiệm, hạn chế đầu tư vì vậy mà làm cho tiết kiệm quốc gia tăng lên.
+ Đối với giai đoạn 1982 – 1995: khi chính phủ thực hiện chính sách tiền tệ nới lỏng, với mức lãi suất thấp làm cho người dân vay tiền nhiều hơn để đầu tư, tái sản xuất mở rộng, với mức lãi suất thấp không hấp dẫn người dân, người dân sẽ hạn chế gửi tiết kiệm vì vậy mà làm cho tiết kiệm quốc gia giảm đi.
Bài tập 7:
Các dữ liệu hằng năm về sản xuất cá Ngừ Trắng tại vùng Basque Tây Ban Nha trong giai đọan 1961-1994 .
Trong đó : CATCH – Tổng lượng cá đánh bắt tính bằng đơn vị 1000 Tấn
EFFORT - Tổng số ngày đánh cá theo đơn vị Ngàn ngày
obs
CATCH
EFFORT
obs
CATCH
EFFORT
1
41.4
45.03512
18
35.804
31.36205
2
51.8
50.05673
19
38.95
25.68735
3
44.3
44.3
20
29.157
19.38004
4
48
44.54
21
23.748
21.78884
5
44.826
59.97878
22
28.333
20.1047
6
39.208
45.37687
23
31.945
27.18085
7
48.278
46.60833
24
18.434
17.92367
8
37.819
52.24526
25
22.531
18.97028
9
31.992
54.11967
26
25.587
22.37778
10
29.894
35.60816
27
29.777
16.89844
11
39.406
61.24754
28
27.906
20.19613
12
34.279
54.76161
29
25.757
16.42839
13
27.958
46.56643
30
24.503
15.57284
14
36.407
28.51477
31
16.608
17.14402
15
27.827
27.16532
32
18.162
15.78574
16
33.71
38.83327
33
18.371
12.12064
17
32.888
22.07106
34
16.993
10.31185
Yêu cầu :
Ước lượng mô hình tuyến tính đơn :
Catchi = 1 + 2* Efforti + ui
ước lượng mô hình:
Dependent Variable: CATCH
Method: Least Squares
Date: 05/14/10 Time: 21:41
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
16.72586
2.447216
6.834648
0.0000
EFFORT
0.473070
0.069201
6.836215
0.0000
R-squared
0.593567
Mean dependent var
31.83994
Adjusted R-squared
0.580866
S.D. dependent var
9.449949
S.E. of regression
6.117947
Akaike info criterion
6.517353
Sum squared resid
1197.737
Schwarz criterion
6.607139
Log likelihood
-108.7950
F-statistic
46.73384
Durbin-Watson stat
1.135208
Prob(F-statistic)
0.000000
CATCH = 16.72586416 + 0.4730703715*EFFORT
+ Khi tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt tăng thêm 0.473 ngàn tấn
+ Khi tổng ngày đánh cá không thay đổi thì trung bình tổng lượng các đánh bắt là 16.72586416 ngàn tấn
Ước lượng mô hình tuyến tính bội :
Catchi = 1 + 2* Efforti + 3* (Efforti )2 + ui
Dependent Variable: CATCH
Method: Least Squares
Date: 05/16/10 Time: 22:38
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.339564
5.785686
0.404371
0.6887
EFFORT
1.491794
0.383074
3.894275
0.0005
EFFORT2_MU
-0.014521
0.005386
-2.696384
0.0112
R-squared
0.670780
Mean dependent var
31.83994
Adjusted R-squared
0.649540
S.D. dependent var
9.449949
S.E. of regression
5.594338
Akaike info criterion
6.365484
Sum squared resid
970.1953
Schwarz criterion
6.500163
Log likelihood
-105.2132
F-statistic
31.58097
Durbin-Watson stat
1.453119
Prob(F-statistic)
0.000000
CATCH = 2.339564155 + 1.491794483*EFFORT - 0.0145214702*EFFORT2_MU
3. Giải thích các hệ số 2, 3 tìm được trong câu trên?
Ý nghĩa của hệ số ước lượng:
+ hệ số 2: trong điều kiện bình phương tổng ngày đánh cá không thay đổi, khi tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt tăng thêm 1.492 ngàn tấn
+ hệ số 3: trong điều kiện tổng ngày đánh cá không thay đổi, khi bình phương tổng ngày đánh cá tăng thêm 1000 ngày thì về trung bình tổng lượng cá đánh bắt giảm 0.0145 ngàn tấn.
4. Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó anh chị lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn gì? Hãy giải thích và thực hiện những kiểm định cần thiết ?
Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn: chúng ta không đánh giá đúng tình hình đánh bắt cá ở đây từ đó sẽ đưa ra những chính sách không đúng về việc đánh bắt cá ở đây do xảy ra hiện tượng phương sai sai số thay đổi, do lượng đánh bắt cá ở thời điểm khác nhau thì khác nhau.
Kiểm định lại mô hình 1
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:
F-statistic
2.883619
Prob. F(2,31)
0.071033
Obs*R-squared
5.333174
Prob. Chi-Square(2)
0.069489
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/25/10 Time: 22:57
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-9.028710
38.31446
-0.235648
0.8153
EFFORT
1.877263
2.536823
0.740005
0.4649
EFFORT^2
-0.012570
0.035665
-0.352450
0.7269
R-squared
0.156858
Mean dependent var
35.22756
Adjusted R-squared
0.102462
S.D. dependent var
39.10480
S.E. of regression
37.04730
Akaike info criterion
10.14637
Sum squared resid
42547.57
Schwarz criterion
10.28104
Log likelihood
-169.4882
F-statistic
2.883619
Durbin-Watson stat
2.444300
Prob(F-statistic)
0.071033
với mức ý nghĩa 10%
nR2 > Chi-Square(2) -----à bác bỏ Ho -----à có hiện tượng phương sai sai số thay đổi -------à mô hình câu 1 không có ý nghĩa thống kê.
Bài tập 8 :
Dữ l iệu sau đây cho thấy về thu nhập cá nhân và chi tiêu cho đi lại trong nước năm 199… cho 50 tiểu bang vả Thủ đô của USA . Các Biến trong tập dữ liệu nầy là :
- Exptrav : Chi tiêu cho đi lại tính bằng tỉ USD
Income : Thu nhập cá nhân tính bằng tỉ USD
POP : Dân số tính bằng triệu người
EXPTRAV
INCOME
POP
EXPTRAV
INCOME
POP
1.142
9.3
0.47
6.122
76.6
3.564
1.03
11.2
0.576
4.831
61.2
3.63
3.169
17.1
0.579
3.567
64.1
3.794
1.085
13.8
0.598
5.525
71.3
3.945
0.828
10.9
0.637
3.682
71.6
4.181
0.836
15.3
0.698
4.848
71.3
4.29
0.834
12.8
0.716
4.492
94.9
4.524
1.434
14.6
0.841
4.922
118.5
4.958
0.708
21.2
1
4.453
99.9
5.044
1.462
19.3
1.1
6.779
93.9
5.094
1.408
25.1
1.124
6.215
102.4
5.235
5.866
27.4
1.166
5.318
114.5
5.259
1.483
23.3
1.24
4.22
109.6
5.706
12.539
31.6
1.382
7.452
146.9
6.018
1.751
31.7
1.613
9.076
140.2
6.473
2.695
26.4
1.616
9.186
132.9
6.902
1.371
29.4
1.818
7.884
129.8
6.952
2.712
30
1.86
11.134
211.2
7.859
2.745
38.8
2.426
7.498
194.7
9.46
2.457
50.3
2.535
8.546
217.9
11.061
2.236
38.9
2.64
13.804
263.6
11.686
2.746
51.6
2.821
10.06
256
12.03
3.795
59
3.035
28.629
283.4
13.726
2.698
55
3.233
20.215
345
18.022
3.458
92.3
3.278
19.95
450.6
18.153
42.48
683.5
31.217
Yêu cầu :
Thực hiện mô hình đơn giản xác định rằng Exptrav là một hàm tuyến tính theo Income ?
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 21:44
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.498120
0.535515
0.930170
0.3568
INCOME
0.055573
0.003293
16.87558
0.0000
R-squared
0.853199
Mean dependent var
6.340706
Adjusted R-squared
0.850203
S.D. dependent var
7.538343
S.E. of regression
2.917611
Akaike info criterion
5.017834
Sum squared resid
417.1103
Schwarz criterion
5.093591
Log likelihood
-125.9548
F-statistic
284.7850
Durbin-Watson stat
2.194928
Prob(F-statistic)
0.000000
EXPTRAV = 0.4981199552 + 0.05557310647*INCOME
Vẽ đồ thị phần dư ( u) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ?
Phương sai của sai số thay đổi do xuất hiện các quan sát ngoại lai, giữa ei2 và income có một mối liên hệ theo một dạng thức nào đó
Vẽ đồ thị bình phương phần dư (u2) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ?
Phương sai của sai số thay đổi do xuất hiện các quan sát ngoại lai, giữa ei2 và income có một mối liên hệ theo một dạng thức nào đó
hãy tiến hành kiểm định hiện tượng phương sai của sai số thay đổi trong mô hình câu 1 với mức ý nghĩa = 10% theo các cách thức đã đuợc giới thiệu . Các kết luận có mâu thuẩn nhau hay không ?
kiểm định White
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:
F-statistic
2.537633
Prob. F(2,48)
0.089614
Obs*R-squared
4.876820
Prob. Chi-Square(2)
0.087300
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/14/10 Time: 21:46
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.689561
5.950486
-0.283937
0.7777
INCOME
0.126986
0.073163
1.735656
0.0890
INCOME^2
-0.000132
0.000127
-1.039498
0.3038
R-squared
0.095624
Mean dependent var
8.178634
Adjusted R-squared
0.057942
S.D. dependent var
26.00254
S.E. of regression
25.23798
Akaike info criterion
9.351600
Sum squared resid
30573.88
Schwarz criterion
9.465237
Log likelihood
-235.4658
F-statistic
2.537633
Durbin-Watson stat
2.147294
Prob(F-statistic)
0.089614
n.R2=4.876820 > Chi-Square(2) = 0.210720 ---à bác bỏ Ho --àcó hiện tượng phương sai thay đổi
qua đồ thị và qua kiểm định ta thấy mô hình đưa ra có hiện tượng phương sai sai số thay đổi
kiểm định Goldseld - Quant
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
Chia mẫu thành ba nhóm
Nhóm 1: từ n1 – n17
Nhóm 2: từ n18 –n34 (loại bỏ)
Nhóm 3 : từ n35 – n51
Ước lượng phương trình hồi quy nhóm 1và 3
Nhóm 1:
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 21:55
Sample: 1 17
Included observations: 17
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.765089
1.793694
-0.984052
0.3407
INCOME
0.204605
0.084089
2.433181
0.0279
R-squared
0.282996
Mean dependent var
2.331824
Adjusted R-squared
0.235195
S.D. dependent var
2.914951
S.E. of regression
2.549216
Akaike info criterion
4.819579
Sum squared resid
97.47750
Schwarz criterion
4.917604
Log likelihood
-38.96642
F-statistic
5.920371
Durbin-Watson stat
2.587301
Prob(F-statistic)
0.027949
Ta có: RSS1 = 97,4775
Nhóm 3:
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 22:00
Sample: 35 51
Included observations: 17
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.763340
1.862588
-0.409827
0.6877
INCOME
0.059705
0.006856
8.708565
0.0000
R-squared
0.834873
Mean dependent var
12.84976
Adjusted R-squared
0.823864
S.D. dependent var
9.949654
S.E. of regression
4.175722
Akaike info criterion
5.806583
Sum squared resid
261.5498
Schwarz criterion
5.904608
Log likelihood
-47.35595
F-statistic
75.83910
Durbin-Watson stat
2.250119
Prob(F-statistic)
0.000000
Ta có RSS2 = 261,5498
Fc= = 0.373
Tra bảng phân phối Fisher với mức ý nghĩa 10% F(15;32)=1,72
Ta có Fc < F è bác bỏ Ho ---àcó hiện tượng phương sai thay đổi
Nếu phần dư ở mô hình 1 có hiện tuợng phương sai của sai số thay đổi hãy sử dụng thủ tục bình phương có trọng số theo White để ước lượng lại phương trình hồi qui ?
ước lượng lại phương trình hồi qui bằng phương pháp bình phương có trọng số theo White.
1. Hồi quy Exptrav theo Income
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 22:05
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.498120
0.535515
0.930170
0.3568
INCOME
0.055573
0.003293
16.87558
0.0000
R-squared
0.853199
Mean dependent var
6.340706
Adjusted R-squared
0.850203
S.D. dependent var
7.538343
S.E. of regression
2.917611
Akaike info criterion
5.017834
Sum squared resid
417.1103
Schwarz criterion
5.093591
Log likelihood
-125.9548
F-statistic
284.7850
Durbin-Watson stat
2.194928
Prob(F-statistic)
0.000000
2. Tính các phần dư ei
3. Chạy mô hình hồi quy e2 theo Income
Dependent Variable: SIGMA2_MU
Method: Least Squares
Date: 05/14/10 Time: 22:13
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.192914
4.636127
0.473006
0.6383
INCOME
0.056935
0.028510
1.997036
0.0514
R-squared
0.075265
Mean dependent var
8.178634
Adjusted R-squared
0.056393
S.D. dependent var
26.00254
S.E. of regression
25.25872
Akaike info criterion
9.334646
Sum squared resid
31262.14
Schwarz criterion
9.410404
Log likelihood
-236.0335
F-statistic
3.988154
Durbin-Watson stat
2.126292
Prob(F-statistic)
0.051391
SIGMA2_MU= 2.192914408 + 0.05693455557*INCOME
ước lượng lại phương trình hồi qui với trọng số SIGMA
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/14/10 Time: 22:17
Sample: 1 51
Included observations: 51
Weighting series: SIGMA
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.199715
0.784310
-0.254638
0.8001
INCOME
0.058860
0.002715
21.67839
0.0000
Weighted Statistics
R-squared
0.905579
Mean dependent var
8.803754
Adjusted R-squared
0.903652
S.D. dependent var
16.34141
S.E. of regression
4.053436
Akaike info criterion
5.675433
Sum squared resid
805.0867
Schwarz criterion
5.751191
Log likelihood
-142.7235
F-statistic
469.9526
Durbin-Watson stat
2.291150
Prob(F-statistic)
0.000000
Unweighted Statistics
R-squared
0.847987
Mean dependent var
6.340706
Adjusted R-squared
0.844884
S.D. dependent var
7.538343
S.E. of regression
2.968956
Sum squared resid
431.9203
Durbin-Watson stat
2.101548
EXPTRAV = -0.1997152197 + 0.05886047842*INCOME
Hãy kiểm định White về hiện tượng phương sai của sai số thay đổi trong mô hình của câu 5 với mức ý nghĩa = 10%
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:
F-statistic
5.527501
Prob. F(4,46)
0.001017
Obs*R-squared
16.55572
Prob. Chi-Square(4)
0.002357
Test Equation:
Dependent Variable: WGT_RESID^2
Method: Least Squares
Date: 05/16/10 Time: 22:19
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-13.29557
375.3913
-0.035418
0.9719
WGT
246.7482
1257.745
0.196183
0.8453
WGT^2
-374.0439
1135.303
-0.329466
0.7433
INCOME*WGT
1.643537
2.944241
0.558221
0.5794
INCOME^2*WGT^2
-0.000408
0.000364
-1.122599
0.2674
R-squared
0.324622
Mean dependent var
15.78601
Adjusted R-squared
0.265893
S.D. dependent var
57.33304
S.E. of regression
49.12296
Akaike info criterion
10.71942
Sum squared resid
111001.0
Schwarz criterion
10.90882
Log likelihood
-268.3453
F-statistic
5.527501
Durbin-Watson stat
2.649477
Prob(F-statistic)
0.001017
nR2=2.352386 > Chi-Square(4) = 1.063623---à bác bỏ Ho --àphương sai thay đổi
Bài tập 9 :
Dữ liệu nầy nói về doanh số và tồn kho của công nghiệp một quốc gia Châu Au trong giai đọan 1950-1991 :
YEAR SALES INVENTORIES
1950 38596 59822
1951 43356 70242
1952 44840 72377
1953 47987 76122
1954 46443 73175
1955 51694 79516
1956 54063 87304
1957 55879 89052
1958 54021 87055
1959 59729 92097
1960 60827 94719
1961 61159 95580
1962 65662 101049
1963 68995 105463
1964 73682 111504
1965 80283 120929
1966 87187 136824
1967 90918 145681
1968 98794 156611
1969 105812 170400
1970 108352 178594
1971 117023 188991
1972 131227 203227
1973 153881 234406
1974 178201 287144
1975 182412 288992
1976 204386 318345
1977 229786 350706
1978 260755 400929
1979 298328 452636
1980 328112 510124
1981 356909 547169
1982 348771 575486
1983 370501 591858
1984 411427 651527
1985 423940 665837
1986 431786 664654
1987 459107 711745
1988 496334 767387
1989 522344 813018
1990 540788 835985
1991 533838 828184
---------------------------------------------
Sales : Doanh Số của ngành công nghiệp (triệu $ )
Inventories : Giá trị tồn kho của ngành công nghiệp (triệu $ )
Yêu cầu :
a.Thực hiện một mô hình đơn giản xác định rằng số sales là một hàm tuyến tính theo Inventories.
Dependent Variable: SALES
Method: Least Squares
Date: 05/14/10 Time: 22:01
Sample: 1950 1991
Included observations: 42
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-911.6914
1165.337
-0.782342
0.4386
INVENTORIES
0.642845
0.002889
222.5282
0.0000
R-squared
0.999193
Mean dependent var
199479.4
Adjusted R-squared
0.999173
S.D. dependent var
166654.0
S.E. of regression
4793.439
Akaike info criterion
19.83433
Sum squared resid
9.19E+08
Schwarz criterion
19.91708
Log likelihood
-414.5210
F-statistic
49518.79
Durbin-Watson stat
1.374931
Prob(F-statistic)
0.000000
SALES = -911.691393 + 0.6428449796*INVENTORIES
b.Vẽ đồ thị phần dư của mô hình hồi qui ở câu a theo Inventories. Dựa vào đồ thị trên anh chị có ý kiến gì vế tương quan chuỗi ?
Qua đồ thị ta thấy:
c. Hãy trình bày kiểm định Durbin – Watson xem phần dư của phương trình trên có tương quan chuỗi bậc nhất hay không ?
giả thiết: Ho: p =0
H1: p # 0
theo kết quả chạy hồi qui ở câu a ta có: d = 1.374931
với mức ý nghĩa 5%, tra bảng Durbin – Watson với n = 40, k=1 ta có:
dL = 1.442
dU = 1.544
d < dL ----à bác bỏ Ho, tức là có hiẹn tượng tự tương quan chuỗi bậc nhất
d. Hãy giải thích các hậu quả của tương quan chuổi bậc nhất với hàm ước lượng OLS . Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên nếu có ?
hậu quả của tương quan chuỗi bậc nhất với hàm ước lượng OLS :
- phương sai ước lượng được của các ước lượng bình phương bé nhất thông thường là không chệch.
- kiểm định t và F nói chung không đáng tin cậy.
- Kết quả là R2 được tính toán như đã biết có thể là đo lượng không đáng tin cậy cho R2 thực.
- cho các phương sai và các sai số chuẩn của dự toán đã tính được cũng có thể không hiệu quả.
Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên:
Khi cấu trúc tự tương quan là đã biết vì các nhiễu của các Ut không quan sát được nên tính chất của tương quan chuổi thường là vấn đề suy đoán hoặc là do những đồi hỏi cấp bách của thực tiển.trong thực hành người ta thường sử dụng mô hình tự hồi quy bậc nhất
Khi cấu trúc tự tương quan là chưa biết thì ta sử dụng phương pháp sai phân cấp 1,ước lượng p dựa theo thống kê d_Durbin_Watson, thủ tục Cochrane_Orcutt để ước lượng p, thủ tục Cochrane_Orcutt 2 bước để ước lượng p, phương pháp d_Durbin_Watson 2 bước để ước lương p và các
* khắc phục
Ước lượng p dựa trên thống kê Durbin – Watson
p^= 1 - d/2 = 1 - 1.374931/2 = 1 - 0.6874655 = 0.3125345
phương trình hồi qui SALES phụ thuộc vào INVENTORIES viết lại:
SALES = b`1 + b`2*INVENTORIES + et
với b`1 = b1*(1-p) = -911.691393*(1-0.3125345) = -626.7563793
b`2 = b2 = 0.6428449796
hay : SALES = -626.7563793 + 0.6428449796* INVENTORIES
Bài Tập 10 :
Một quan sát thú vị về việc thuê bao truyền hình cáp , người ta đưa ra những dữ liệu sau đây :
AGE
AIR
HOME
INST
SUB
SVC
TV
Y
11.83
13
350
14.95
105
10
16
9839
11.42
11
255.631
15
90
7.5
15
10606
7.33
9
31
15
14
7
11
10455
6.92
10
34.84
10
11.7
7
22
8958
26
12
153.434
25
46
10
20
11741
8.83
8
26.621
15
11.217
7.66
18
9378
13.08
8
18
15
12
7.5
12
10433
5.58
7
9.324
15
6.428
7
17
10167
12.42
8
32
10
20.1
5.6
10
9218
4.92
6
28
15
8.5
6.5
6
10519
4.08
6
8
17.5
1.6
7.5
8
10025
4.25
9
5
15
1.1
8.95
9
9714
10.67
7
15.204
10
4.355
7
7
9294
17.58
7
97.889
24.95
78.91
9.49
12
9784
8.08
7
93
20
19.6
7.5
9
8173
0.17
6
3
9.95
1
10
13
8967
13.25
5
2.6
25
1.65
7.55
6
10133
12.67
5
18.284
15.5
13.4
6.3
11
9361
5.25
6
55
15
18.708
7
16
9085
15
6
1.7
20
1.352
5.6
6
10067
17
5
270
15
170
8.75
15
8908
6.83
6
46.54
15
15.388
8.73
9
9632
5.67
6
20.417
5.95
6.555
5.95
10
8995
7
5
120
25
40
6.5
10
7787
11.25
7
46.39
15
19.9
7.5
9
8890
2.92
4
14.5
9.95
2.45
6.25
6
8041
2.17
5
9.5
20
3.762
6.5
6
8605
7.08
4
81.98
18
24.882
7.5
8
8639
12.17
4
39.7
20
21.187
6
9
8781
13.08
4
4.113
10
3.487
6.85
11
8551
0.17
6
8
10
3
7.95
9
9306
7.67
5
99.75
9.95
42.1
5.73
8
8346
10.33
4
33.379
15
20.35
7.5
8
8803
12.25
5
35.5
17.5
23.15
6.5
8
8942
2
4
34.775
15
9.866
8.25
11
8591
13.08
6
64.84
10
42.608
6
11
9163
1
6
30.556
20
10.371
7.5
8
7683
4
5
16.5
14.95
5.164
6.95
8
7924
4.67
4
70.515
9.95
31.15
7
10
8454
3
4
42.04
20
18.35
7
6
8429
Trong đó:
SUB : số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình
Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua
Inst : phí lắp đặt ( USD/Lần)
SVC : Phí dịch vụ cho mỗi hệ thống (USD/tháng )
TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp )
Age : thời gian hệ thống đã họat động ( năm )
Air : số kêng truyền hình mà hệ thống nhận được từ hệ thống cáp
Y : thu nhập bình quân đầu người (USD/ người )
Hãy phân tích quan hệ kỳ vọng của số đăng ký thuê bao (SUB) với các nhân tố ảnh hưởng có sẳn trong dữ liệu ?
Dependent Variable: SUB
Method: Least Squares
Date: 05/15/10 Time: 13:22
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-6.807726
26.65981
-0.255355
0.8001
AGE
1.193511
0.502651
2.374434
0.0237
AIR
-5.111142
1.518459
-3.366005
0.0020
HOME
0.405549
0.035003
11.58599
0.0000
INST
-0.526420
0.476074
-1.105751
0.2771
SVC
2.038732
2.126968
0.958516
0.3450
TV
0.756508
0.687811
1.099877
0.2796
Y
0.001655
0.003469
0.477101
0.6365
R-squared
0.887748
Mean dependent var
24.50850
Adjusted R-squared
0.863193
S.D. dependent var
33.53720
S.E. of regression
12.40453
Akaike info criterion
8.050857
Sum squared resid
4923.914
Schwarz criterion
8.388633
Log likelihood
-153.0171
F-statistic
36.15343
Durbin-Watson stat
2.182694
Prob(F-statistic)
0.000000
SUB = -6.807725633 + 1.193511207*AGE - 5.111142311*AIR + 0.40554886*HOME - 0.5264195572*INST + 2.038732364*SVC + 0.7565077307*TV + 0.001655168974*Y
Phân tích quan hệ kỳ vọng của số đăng ký thuê bao: trong điều kiện các yếu tố khác không thay đổi:
+ Age: khi thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình sẽ tăng thêm 1.19 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình sẽ giảm 5.1 thuê bao
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình sẽ tăng thêm 0.4 thuê bao
+ Inst : phí lắp đặt ( USD/Lần) giảm 1 USD/Lần thì về trung bình sẽ tăng thêm 0.526 thuê bao
+ SVC: Phí dịch vụ cho mỗi hệ thống (USD/tháng ) tăng thêm 1 USD/tháng thì về trung bình sẽ tăng thêm 2.039 thuê bao
+ TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp ) tăng thêm 1 kênh thì về trung bình sẽ tăng thêm 0.756 thuê bao
+ Y : thu nhập bình quân đầu người (USD/ người ) tăng thêm 1 USD/Người thì về trung bình sẽ tăng thêm được 0.00165 thuê bao.
Có ý kiến cho rằng mô hình ở câu 1 cần phải bổ sung thêm các biến độc lập là bình phương các biến độc lập . Anh chị cần có kiểm định nào để chấp nhận ý kiến nầy ?
+ ước lượng mô hình với các biến bổ sung
Dependent Variable: SUB
Method: Least Squares
Date: 05/15/10 Time: 13:31
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-488.2440
264.2862
-1.847406
0.0766
AGE
-1.357140
1.462274
-0.928102
0.3622
AGE2_MU
0.139275
0.073366
1.898355
0.0693
AIR
18.71175
5.239156
3.571519
0.0015
AIR2_MU
-1.582278
0.373179
-4.239994
0.0003
HOME
0.439400
0.083881
5.238396
0.0000
HOME2_MU
0.000221
0.000284
0.777523
0.4441
INST
0.391969
2.124189
0.184526
0.8551
INST2_MU
-0.021041
0.065512
-0.321175
0.7507
SVC
12.14427
19.19417
0.632706
0.5327
SVC2_MU
-0.778979
1.285439
-0.606002
0.5500
TV
-0.661471
2.654203
-0.249216
0.8052
TV2_MU
0.048444
0.101687
0.476402
0.6379
Y
0.084534
0.052575
1.607864
0.1204
Y2_MU
-4.55E-06
2.83E-06
-1.603944
0.1213
R-squared
0.949466
Mean dependent var
24.50850
Adjusted R-squared
0.921167
S.D. dependent var
33.53720
S.E. of regression
9.416297
Akaike info criterion
7.602757
Sum squared resid
2216.666
Schwarz criterion
8.236087
Log likelihood
-137.0551
F-statistic
33.55130
Durbin-Watson stat
2.246892
Prob(F-statistic)
0.000000
kiểm định WALD:
giả thiết: Ho: R2 = 0
H1: R2 # 0
Wald Test:
Equation: Untitled
Test Statistic
Value
df
Probability
F-statistic
4.336042
(7, 25)
0.0029
Chi-square
30.35229
7
0.0001
Null Hypothesis Summary:
Normalized Restriction (= 0)
Value
Std. Err.
C(3)
0.139275
0.073366
C(5)
-1.582278
0.373179
C(7)
0.000221
0.000284
C(8)
0.391969
2.124189
C(11)
-0.778979
1.285439
C(13)
0.048444
0.101687
C(15)
-4.55E-06
2.83E-06
Restrictions are linear in coefficients.
Theo kết quả của bảng trên: F(7;25)= 3.5 < 4.336042; 0.0029<0.1 ---à bác bỏ giả thiết Ho: R2=0. tức là mô hình có ý nghĩa thống kê, hay các biến đưa vào mô hình có biến ảnh hưởng đến biến phụ thuộc SUB. Vì vậy ta cần xem xét nên đưa biến nào vào và nên loại bỏ biến nào.
Thực hiện ước lượng theo yêu cầu của câu 2 . Nhận xét mô hình nầy và căn cứ vào đó tìm ra mô hình tốt nhất bằng cách lọai bỏ các biến độc lập ít có ý nghĩa.
Dependent Variable: SUB
Method: Least Squares
Date: 05/15/10 Time: 13:38
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-488.2440
264.2862
-1.847406
0.0766
AGE
-1.357140
1.462274
-0.928102
0.3622
AGE2_MU
0.139275
0.073366
1.898355
0.0693
AIR
18.71175
5.239156
3.571519
0.0015
AIR2_MU
-1.582278
0.373179
-4.239994
0.0003
HOME
0.439400
0.083881
5.238396
0.0000
HOME2_MU
0.000221
0.000284
0.777523
0.4441
INST
0.391969
2.124189
0.184526
0.8551
INST2_MU
-0.021041
0.065512
-0.321175
0.7507
SVC
12.14427
19.19417
0.632706
0.5327
SVC2_MU
-0.778979
1.285439
-0.606002
0.5500
TV
-0.661471
2.654203
-0.249216
0.8052
TV2_MU
0.048444
0.101687
0.476402
0.6379
Y
0.084534
0.052575
1.607864
0.1204
Y2_MU
-4.55E-06
2.83E-06
-1.603944
0.1213
R-squared
0.949466
Mean dependent var
24.50850
Adjusted R-squared
0.921167
S.D. dependent var
33.53720
S.E. of regression
9.416297
Akaike info criterion
7.602757
Sum squared resid
2216.666
Schwarz criterion
8.236087
Log likelihood
-137.0551
F-statistic
33.55130
Durbin-Watson stat
2.246892
Prob(F-statistic)
0.000000
SUB = -488.2440184 - 1.357139585*AGE + 0.1392753913*AGE2_MU + 18.71174637*AIR - 1.582278197*AIR2_MU + 0.4394004589*HOME + 0.0002207113314*HOME2_MU + 0.3919688673*INST - 0.0210408497*INST2_MU + 12.14426735*SVC - 0.7789787661*SVC2_MU - 0.6614709744*TV + 0.04844376526*TV2_MU + 0.0845340609*Y - 4.546508689e-006*Y2_MU
nhận xét: ta thấy Prob của một số biến đưa vào mô hình lớn hơn mức ý nghĩa 10%, điều này chứng tỏ một số biến đưa vào mô hình không có tác động gì đến SUB
R2 = 0.949466 cao, trị thống kê thấp do xảy ra hiện tượng đa cộng tuyến. hay nói cách khác mô hình đưa ra bị sai lệch, không còn đúng với mô hình thực.
* ước lượng lại mô hình bằng cách loại bỏ những biến ít có ý nghĩa:
Dependent Variable: SUB
Method: Least Squares
Date: 05/27/10 Time: 10:50
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-60.49268
16.26712
-3.718709
0.0007
AGE2_MU
0.054963
0.014206
3.868916
0.0005
AIR
19.00283
4.529471
4.195376
0.0002
AIR2_MU
-1.551656
0.306301
-5.065791
0.0000
HOME
0.496449
0.028582
17.36914
0.0000
R-squared
0.924209
Mean dependent var
24.50850
Adjusted R-squared
0.915547
S.D. dependent var
33.53720
S.E. of regression
9.746190
Akaike info criterion
7.508098
Sum squared resid
3324.587
Schwarz criterion
7.719208
Log likelihood
-145.1620
F-statistic
106.6985
Durbin-Watson stat
2.585383
Prob(F-statistic)
0.000000
SUB = -60.49268428 + 0.05496300001*AGE2_MU + 19.00283309*AIR - 1.551655918*AIR2_MU + 0.4964486269*HOME
Phương trình sau cùng mà anh chị lựa chọn như thế nào ? giải thích ý nghĩa ?
Phương trình sau cùng bao gồm các biến: HOME, AIR và bình phương của AIR, AGE.
+ Prob của một số biến đưa vào mô hình nh ỏ hơn mức ý nghĩa 10%, điều này chứng tỏ c ác biến đưa vào mô hình đều có tác động gì đến SUB
+ R2=0.924209 cho thấy mô hình đưa ra có ý nghĩa thống kê cao, các biến đưa vào mô hình giải thích được 92.4% biến SUB.
+trong điều kiện các yếu tố khác không thay đổi:
+ Age: khi b ình ph ư ơng thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình số đăng kí thuê bao sẽ tăng thêm 0.055 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ t ăng th êm 19 thuê bao
+ khi bình phương số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ gi ảm 1.55 thuê bao. Điều này cho thấy số lượng thuê bao đăng kí sẽ tăng them cùng với số kênh truyền hình nhưng đến một lúc nào đó người ta sẽ chú trọng hơn về chất lượng kênh truyền hình vì thế mà tốc độ tăng số đăng kí thuê bao sẽ giảm dần so với tốc độ tăng kênh truyền hình, đến lúc số kênh truyền hình tăng lên nhưng số đăng kí thuê bao không tăng nữa
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình số đăng kí thuê bao sẽ tăng thêm 0.5 thuê bao
Các file đính kèm theo tài liệu này:
- 10 Bài tập môn Kinh tế lượng.doc