Tài liệu Bài tập Kinh tế lượng: Bài 1
Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau :
ĐVT:%
Nam
US
Anh
Nhat
Duc
Phap
1960
1.5
1
3.6
1.5
3.6
1961
1.1
3.4
5.4
2.3
3.4
1962
1.1
4.5
6.7
4.5
4.7
1963
1.2
2.5
7.7
3
4.8
1964
1.4
3.9
3.9
2.3
3.4
1965
1.6
4.6
6.5
3.4
2.6
1966
2.8
3.7
6
3.5
2.7
1967
2.8
2.4
4
1.5
2.7
1968
4.2
4.8
5.5
18
4.5
1969
5
5.2
5.1
2.6
6.4
1970
5.9
6.5
7.6
3.7
5.5
1971
4.3
9.5
6.3
5.3
5.5
1972
3.6
6.8
4.9
5.4
5.9
1973
6.2
8.4
12
7
7.5
1974
10.9
16
24.6
7
14
1975
9.2
24.2
11.7
5.9
11.7
1976
5.8
16.5
9.3
4.5
9.6
1977
6.4
15.9
8.1
3.7
9.4
1978
7.6
8.3
3.8
2.7
9.1
1979
11.4
13.4
3.6
4.1
10.7
1980
13.6
18
8
5.5
13.3
Nguồn tin : khoa tóan thống kê – ĐHKT
Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho nhận xét tổng quát về lạm phát của 5 nước ?
Nhận xét: NHìn chung tỷ lệ lạm phát của có đều có xu hướng tăng lên, n...
70 trang |
Chia sẻ: hunglv | Lượt xem: 1695 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Bài tập Kinh tế lượng, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Bài 1
Thống kê số liệu tỉ lệ lạm phát tại 5 nước trong giai đọan 1960-1980 như sau :
ĐVT:%
Nam
US
Anh
Nhat
Duc
Phap
1960
1.5
1
3.6
1.5
3.6
1961
1.1
3.4
5.4
2.3
3.4
1962
1.1
4.5
6.7
4.5
4.7
1963
1.2
2.5
7.7
3
4.8
1964
1.4
3.9
3.9
2.3
3.4
1965
1.6
4.6
6.5
3.4
2.6
1966
2.8
3.7
6
3.5
2.7
1967
2.8
2.4
4
1.5
2.7
1968
4.2
4.8
5.5
18
4.5
1969
5
5.2
5.1
2.6
6.4
1970
5.9
6.5
7.6
3.7
5.5
1971
4.3
9.5
6.3
5.3
5.5
1972
3.6
6.8
4.9
5.4
5.9
1973
6.2
8.4
12
7
7.5
1974
10.9
16
24.6
7
14
1975
9.2
24.2
11.7
5.9
11.7
1976
5.8
16.5
9.3
4.5
9.6
1977
6.4
15.9
8.1
3.7
9.4
1978
7.6
8.3
3.8
2.7
9.1
1979
11.4
13.4
3.6
4.1
10.7
1980
13.6
18
8
5.5
13.3
Nguồn tin : khoa tóan thống kê – ĐHKT
Vẽ đồ thị phân tán về tỉ lệ lạm phát cho mỗi quốc gia theo thời gian . Cho nhận xét tổng quát về lạm phát của 5 nước ?
Nhận xét: NHìn chung tỷ lệ lạm phát của có đều có xu hướng tăng lên, nhưng trong đó Đức và Nhật chỉ tăng chậm.
Lạm phát nước nào biến thiên nhiều hơn giải thích ?
ANH
DUC
NHAT
PHAP
US
Mean
8.547619
4.638095
7.347619
6.714286
5.123810
Median
6.500000
3.700000
6.300000
5.500000
4.300000
Maximum
24.20000
18.00000
24.60000
14.00000
13.60000
Minimum
1.000000
1.500000
3.600000
2.600000
1.100000
Std. Dev.
6.321046
3.458248
4.632992
3.579146
3.694984
Skewness
0.941799
2.852530
2.603757
0.653541
0.784310
Kurtosis
2.866323
11.83415
10.29502
2.214858
2.672861
Jarque-Bera
3.120083
96.76612
70.29363
2.034298
2.246638
Probability
0.210127
0.000000
0.000000
0.361625
0.325199
Sum
179.5000
97.40000
154.3000
141.0000
107.6000
Sum Sq. Dev.
799.1124
239.1895
429.2924
256.2057
273.0581
Observations
21
21
21
21
21
Từ bảng tính các thống kê mô tả, ta thấy độ lệch chuẩn lạm phát của nước Anh là lớn nhất ( = 6.321046) do đó lạm phát của nước Anh biến thiên nhiều nhất.
Ươc lượng mô hình hồi qui: Lạm phát theo thời gian cho từng quốc gia theo giả định
(Lamphat)i = 1 + 2 (Thoigian)i + Ui
Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát về tác động lạm phát tại từng quốc gia ? Vẽ đồ thị ?
- Ước lượng mô hình hồi qui US:
Dependent Variable: US
Method: Least Squares
Date: 05/10/10 Time: 21:02
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.164502
0.734285
-0.224030
0.8251
NAMMOHINH
0.528831
0.062811
8.419444
0.0000
R-squared
0.788624
Mean dependent var
5.123810
Adjusted R-squared
0.777499
S.D. dependent var
3.694984
S.E. of regression
1.742926
Akaike info criterion
4.039401
Sum squared resid
57.71804
Schwarz criterion
4.138879
Log likelihood
-40.41371
F-statistic
70.88704
Durbin-Watson stat
1.131804
Prob(F-statistic)
0.000000
US = -0.1645021645 + 0.5288311688*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Mỹ tăng lên 0.52883%.
Tỷ lệ lạm phát tăng nhanh tác động mạnh mẽ đến nền kinh tế, làm cho giá cả các mặt hàng tăng lên nhanh chóng…
- Ước lượng mô hình hồi qui Anh:
Dependent Variable: ANH
Method: Least Squares
Date: 05/10/10 Time: 21:03
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.322944
1.612211
0.200311
0.8434
NAMMOHINH
0.822468
0.137908
5.963871
0.0000
R-squared
0.651809
Mean dependent var
8.547619
Adjusted R-squared
0.633483
S.D. dependent var
6.321046
S.E. of regression
3.826801
Akaike info criterion
5.612328
Sum squared resid
278.2437
Schwarz criterion
5.711806
Log likelihood
-56.92945
F-statistic
35.56776
Durbin-Watson stat
1.141176
Prob(F-statistic)
0.000010
ANH = 0.3229437229 + 0.8224675325*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Anh tăng lên 0.823%.
- Ước lượng mô hình hồi qui Nhật:
Dependent Variable: NHAT
Method: Least Squares
Date: 05/10/10 Time: 21:09
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
5.215152
1.919155
2.717421
0.0137
NAMMOHINH
0.213247
0.164164
1.298984
0.2095
R-squared
0.081565
Mean dependent var
7.347619
Adjusted R-squared
0.033226
S.D. dependent var
4.632992
S.E. of regression
4.555374
Akaike info criterion
5.960885
Sum squared resid
394.2773
Schwarz criterion
6.060364
Log likelihood
-60.58929
F-statistic
1.687359
Durbin-Watson stat
1.175297
Prob(F-statistic)
0.209493
NHAT = 5.215151515 + 0.2132467532*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Nhật tăng lên 0.21324%.
- Ước lượng mô hình hồi qui Đức:
Dependent Variable: DUC
Method: Least Squares
Date: 05/10/10 Time: 21:20
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.593939
1.468324
2.447648
0.0243
NAMMOHINH
0.104416
0.125600
0.831332
0.4161
R-squared
0.035098
Mean dependent var
4.638095
Adjusted R-squared
-0.015687
S.D. dependent var
3.458248
S.E. of regression
3.485266
Akaike info criterion
5.425359
Sum squared resid
230.7945
Schwarz criterion
5.524837
Log likelihood
-54.96626
F-statistic
0.691114
Durbin-Watson stat
2.328057
Prob(F-statistic)
0.416112
DUC = 3.593939394 + 0.1044155844*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Đức tăng lên 0.104415%.
- Ước lượng mô hình hồi qui Phap:
Dependent Variable: PHAP
Method: Least Squares
Date: 05/10/10 Time: 21:21
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.853247
0.832871
2.225130
0.0384
NAMMOHINH
0.486104
0.071244
6.823112
0.0000
R-squared
0.710166
Mean dependent var
6.714286
Adjusted R-squared
0.694912
S.D. dependent var
3.579146
S.E. of regression
1.976933
Akaike info criterion
4.291363
Sum squared resid
74.25703
Schwarz criterion
4.390842
Log likelihood
-43.05931
F-statistic
46.55486
Durbin-Watson stat
0.961869
Prob(F-statistic)
0.000002
PHAP = 1.853246753 + 0.4861038961*NAMMOHINH
Khi số năm tăng thêm 1 năm thì về trung bình tỷ lệ lạm phát của nước Pháp tăng lên 0.48610%.
Ươc lượng mô hình hồi qui: Lạm phát của từng quốc gia theo tỉ lệ lạm phát của Mỹ
(Lamphat)i = 1 + 2 (lamphat-USA)i + Ui
Đọc và đánh giá từng mô hình ước lượng ? Đưa ra kết luận tổng quát về tác động lạm phát tại từng quốc gia so với lạm phát của USA ?
- Anh và US:
Dependent Variable: ANH
Method: Least Squares
Date: 05/10/10 Time: 21:22
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.942998
1.029230
3.831018
0.0011
ANHLP
1.344882
0.199758
6.732569
0.0000
R-squared
0.704636
Mean dependent var
8.547619
Adjusted R-squared
0.689091
S.D. dependent var
6.321046
S.E. of regression
3.524566
Akaike info criterion
5.447784
Sum squared resid
236.0287
Schwarz criterion
5.547263
Log likelihood
-55.20174
F-statistic
45.32748
Durbin-Watson stat
0.439091
Prob(F-statistic)
0.000002
ANH = 3.942998281 + 1.344882282*ANHLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Anh sẽ tăng lên 1.345%
- Nhật và US:
Dependent Variable: NHAT
Method: Least Squares
Date: 05/10/10 Time: 21:22
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
5.795073
0.866538
6.687612
0.0000
NHATLP
0.698147
0.177928
3.923768
0.0009
R-squared
0.447610
Mean dependent var
7.347619
Adjusted R-squared
0.418536
S.D. dependent var
4.632992
S.E. of regression
3.532831
Akaike info criterion
5.452469
Sum squared resid
237.1370
Schwarz criterion
5.551947
Log likelihood
-55.25092
F-statistic
15.39596
Durbin-Watson stat
0.534453
Prob(F-statistic)
0.000912
NHAT = 5.795072835 + 0.6981471192*NHATLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Nhật sẽ tăng lên 0.7%.
-Đức va US:
Dependent Variable: DUC
Method: Least Squares
Date: 05/10/10 Time: 21:23
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
4.860462
0.627216
7.749263
0.0000
DUCLP
0.457815
0.142581
3.210916
0.0046
R-squared
0.351757
Mean dependent var
4.638095
Adjusted R-squared
0.317639
S.D. dependent var
3.458248
S.E. of regression
2.856691
Akaike info criterion
5.027598
Sum squared resid
155.0530
Schwarz criterion
5.127076
Log likelihood
-50.78978
F-statistic
10.30998
Durbin-Watson stat
1.202348
Prob(F-statistic)
0.004600
DUC = 4.860462352 + 0.4578146464*DUCLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Đức sẽ tăng lên 0.46%.
-Pháp Và US:
Dependent Variable: PHAP
Method: Least Squares
Date: 05/10/10 Time: 21:25
Sample: 1960 1980
Included observations: 21
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
6.251776
1.212106
5.157778
0.0001
PHAPLP
0.290800
0.574747
0.505961
0.6187
R-squared
0.013294
Mean dependent var
6.714286
Adjusted R-squared
-0.038637
S.D. dependent var
3.579146
S.E. of regression
3.647635
Akaike info criterion
5.516428
Sum squared resid
252.7996
Schwarz criterion
5.615906
Log likelihood
-55.92249
F-statistic
0.255996
Durbin-Watson stat
0.273299
Prob(F-statistic)
0.618704
PHAP = 6.25177575 + 0.2907996784*PHAPLP
Khi lạm phát của US tăng lên 1% thì về trung bình làm phát của Pháp sẽ tăng lên 0.29%.
Nhận xét chung:
Từ kết quả trên ta thấy tỉ lệ lạm phát của Anh chịu ảnh hưởng nhiều bởi tỉ lệ lạm phát của Hoa Kì ( tăng lên 1.345%) , còn tỉ lệ lạm phát của Nhật ( 0.7%) và Đức (0.46%), Pháp ( 0.29%) ít chịu ảnh hưởng bởi tỉ lệ lạm phát của Hoa Kì.
Bài tập 2 :
Nhà phân tích học viện nghiên cứu Anh ngữ đã thu thập dữ liệu từ 8 sinh viên khác nhau trong một lớp . Bảng dữ liệu gốc được trình bài như sau :
Sinh viên
Điểm tóan
Điểm khoa học
điểm Anh Văn
1
13.5
9.9
13.3
2
13.7
6.8
10
3
7
5.5
8.9
4
7.4
5.7
2.4
5
13.2
10.3
8.2
6
7.3
1.8
6.3
7
5.2
5.2
7.7
8
8.4
6.9
2.9
Người ta muốn xem xét xem là có mối quan hệ nào giữa điểm môn Anh văn và điểm môn Khoa học của sinh viên . Cụ thể là chúng ta có thể dựa vào điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh văn hay không - Cũng như dựa vào điểm môn Tóan của sinh viên có thể dự đóan điểm của môn Anh văn hay không ?
Cho từng cặp môn học tương ứng , anh chị :
Ươc lượng mô hình hồi qui tuyến tính cho tập dữ liệu nói trên? - Đọc và nhận xét phương trình hồi qui của anh chị? - Đưa ra kết luận tổng quát ?
Điểm môn Khoa học và của sinh viên có thể dự đóan điểm của môn Anh văn hay không:
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/11/10 Time: 21:13
Sample: 1 8
Included observations: 8
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
3.762656
3.422463
1.099400
0.3137
DIEMKHOAHOC
0.568114
0.489567
1.160442
0.2900
R-squared
0.183299
Mean dependent var
7.462500
Adjusted R-squared
0.047182
S.D. dependent var
3.605130
S.E. of regression
3.519055
Akaike info criterion
5.566580
Sum squared resid
74.30247
Schwarz criterion
5.586440
Log likelihood
-20.26632
F-statistic
1.346627
Durbin-Watson stat
1.325655
Prob(F-statistic)
0.289950
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
Khi điểm khoa học tăng lên một điểm thì về trung bình điểm môn anh văn sẽ tăng lên 0.56 điểm.
Điểm môn Tóan của sinh viên có thể dự đóan điểm của môn Anh văn hay không:
Dependent Variable: DIEMANHVAN
Method: Least Squares
Date: 05/11/10 Time: 21:13
Sample: 1 8
Included observations: 8
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.691257
3.486802
0.485045
0.6448
DIEMTOAN
0.609907
0.348935
1.747907
0.1311
R-squared
0.337396
Mean dependent var
7.462500
Adjusted R-squared
0.226962
S.D. dependent var
3.605130
S.E. of regression
3.169724
Akaike info criterion
5.357484
Sum squared resid
60.28290
Schwarz criterion
5.377344
Log likelihood
-19.42994
F-statistic
3.055180
Durbin-Watson stat
2.104833
Prob(F-statistic)
0.131069
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
Khi điểm toán tăng lên một điểm thì về trung bình điểm môn anh văn sẽ tăng lên 0.6 điểm.
è Kết Luận tổng quát: Ta thấy hệ số tương quan của 2 mô hình thấp (R2<0.5) do đó nó không giải thích dược tất cả các biến đưa váo trong mô hình. Có nghĩa là điểm môn Khoa Học và môn Toán ảnh hưởng rất ít đến điểm của môn Anh văn.
b. Giải thích ý nghĩa của hệ số tương quan ? Giải thích ý nghĩa của hệ số độ dốc và tung độ gốc của phương trình hồi qui ?
Ý nghĩa của hệ số tương quan:
R2 đo lường mối tương quan giữa biến phụ thuộc với biến độc lập. R2 ở 2 mô hình trên đều rất nhỏ (18.32 % và 33.74% ) chứng tỏ điểm của môn Anh Văn không phụ thuộc nhiều vào môn khoa học hay môn toán.
Ý nghĩa của hệ số độ dốc và tung độ gốc:
DIEMANHVAN = 3.762656345 + 0.5681141889*DIEMKHOAHOC
+ b1= 3.762656345: khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn bằng 3.76
+ b2 = 0.5681141889 : khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.57 điểm
DIEMANHVAN = 1.691256533 + 0.6099068394*DIEMTOAN
+ b1= 1.691256533: khi điểm môn Khoa Học bằng không thì về trung bình điểm môn Anh Văn bằng 1.69
+ b2 = 0.6099068394: khi điểm môn Khoa Học tăng thêm 1 điểm thì về trung bình điểm môn Anh Văn tăng thêm 0.61 điểm
Bài tập 3:
Ta có tập dữ liệu sau bao gồm 64 quan sát của các quốc gia với các biến số được giải thích bên dưới của bảng số liệu :
obs
CM
FLR
PGNP
TFR
obs
CM
FLR
PGNP
TFR
1
128
37
1870
6.66
33
142
50
8640
7.17
2
204
22
130
6.15
34
104
62
350
6.6
3
202
16
310
7
35
287
31
230
7
4
197
65
570
6.25
36
41
66
1620
3.91
5
96
76
2050
3.81
37
312
11
190
6.7
6
209
26
200
6.44
38
77
88
2090
4.2
7
170
45
670
6.19
39
142
22
900
5.43
8
240
29
300
5.89
40
262
22
230
6.5
9
241
11
120
5.89
41
215
12
140
6.25
10
55
55
290
2.36
42
246
9
330
7.1
11
75
87
1180
3.93
43
191
31
1010
7.1
12
129
55
900
5.99
44
182
19
300
7
13
24
93
1730
3.5
45
37
88
1730
3.46
14
165
31
1150
7.41
46
103
35
780
5.66
15
94
77
1160
4.21
47
67
85
1300
4.82
16
96
80
1270
5
48
143
78
930
5
17
148
30
580
5.27
49
83
85
690
4.74
18
98
69
660
5.21
50
223
33
200
8.49
19
161
43
420
6.5
51
240
19
450
6.5
20
118
47
1080
6.12
52
312
21
280
6.5
21
269
17
290
6.19
53
12
79
4430
1.69
22
189
35
270
5.05
54
52
83
270
3.25
23
126
58
560
6.16
55
79
43
1340
7.17
24
12
81
4240
1.8
56
61
88
670
3.52
25
167
29
240
4.75
57
168
28
410
6.09
26
135
65
430
4.1
58
28
95
4370
2.86
27
107
87
3020
6.66
59
121
41
1310
4.88
28
72
63
1420
7.28
60
115
62
1470
3.89
29
128
49
420
8.12
61
186
45
300
6.9
30
27
63
19830
5.23
62
47
85
3630
4.1
31
152
84
420
5.79
63
178
45
220
6.09
32
224
23
530
6.5
64
142
67
560
7.2
Trong đó: - CM : Tỉ lệ tử vong của trẽ sơ sinh (%)
- FLR : Tỉ lệ biết chử của dân số (%)
- PGNP : GNP bình quân đầu người (Đô la)
- TFR : Tỉ lệ sinh chung của dân số (%)
1. Hãy giải thích mối quan hệ giữa tỉ lệ tử vong của trẻ sơ sinh và các biến khác đã cho, bằng những lập luận mang tính cách kinh tế và lô gic ? - Sau đó vẽ biểu đồ phân tán giữa CM và FLR; CM và PGNP; CM và TFR. Rồi từ đó đối chiếu đồ thị với các giải thích của anh chị lúc ban đầu ( nêu lên sự phù hợp và không phù hợp với lời giải thích ban đầu)
- Tỷ lệ tử vong và tỷ lệ biết chữ: Hai biến này có mối quan hệ nghịch biến, nếu tỷ lệ biết chữ thấp thì tỷ lệ tử vong sẽ cao và ngược lại.
- Tỷ lệ tử vong và GNP bình quân đầu người: Khi GNP bình quân đầu người tăng lên thì tỷ lệ tử vong của trẻ sơ sinh sẽ giảm đi vì khi đó trẻ sẽ được chăm sóc tốt và toàn diện hơn. Ngược lại
- Tỷ lệ tử vong và tỷ lệ sinh chung của dân số: Nếu tỷ lệ sinh chung tăng lên thì-> dân số tăng lên-> gia đình sẽ đông con hơn->nghèo->không chăm sóc đầy đủ cho con cái->tỷ lệ tử vong tăng.
Biểu đồ phân tán giữa CM và FLR:
CM va PGNP
-Phù hợp với lời gải thích ban đầu.
CM va TFR
- Không phù hợp với lời giải thích ban đầu vì : qua biểu đồ cho thấy khi tỷ lệ sinh tăng ( giảm ) tỷ lệ tử cũng tăng ( giảm ) theo. Đây là mối quan hệ tỉ lệ thuận
CM và FLR
Qua đồ thị cho thấy tỉ lệ biết chữ của dân số càng cao thì tỉ lệ tử vong của trẻ sơ sinh càng thấp và ngược lại. Phù hợp với lời giải thích ban đầu.
2. Anh chị hãy xây dựng mô hình hồi qui đơn cho CM va PGNP . Nhận xét các thông tin chính từ mô hình nầy như ý nghĩa thống kê của hệ số hồi qui, hệ số xác định R2 .
Dependent Variable: CM
Method: Least Squares
Date: 05/11/10 Time: 23:05
Sample: 1 64
Included observations: 64
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
157.4244
9.845583
15.98935
0.0000
PGNP
-0.011364
0.003233
-3.515661
0.0008
R-squared
0.166217
Mean dependent var
141.5000
Adjusted R-squared
0.152769
S.D. dependent var
75.97807
S.E. of regression
69.93413
Akaike info criterion
11.36374
Sum squared resid
303228.5
Schwarz criterion
11.43120
Log likelihood
-361.6396
F-statistic
12.35987
Durbin-Watson stat
1.931458
Prob(F-statistic)
0.000826
CM = 157.4244406 - 0.01136445358*PGNP
Khi GNP bình quân đầu người tăng lên 1USD thì Tỷ lệ tử vong của trẻ sơ sinh giảm 1.1%.
Hệ số R2=16.62% là không tốt vì không giải thích được các biến đưa vào mô hình. Hay nói cách khác tỉ lệ tử vong của trẻ sơ sinh ít chịu ảnh hưởng bởi GNP bình quân đầu người mà phụ thuộc vào nhiều nhân tố khác nữa.
3. Hãy xây dựng mô hình hồi qui bội cho quan hệ CM; FLR và PGNP. Nhận xét thông tin chính từ mô hình nầy , như ý nghĩa thống kê của hệ số , hệ số xác định R2.
Dependent Variable: CM
Method: Least Squares
Date: 05/11/10 Time: 23:06
Sample: 1 64
Included observations: 64
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
263.6416
11.59318
22.74109
0.0000
FLR
-2.231586
0.209947
-10.62927
0.0000
PGNP
-0.005647
0.002003
-2.818703
0.0065
R-squared
0.707665
Mean dependent var
141.5000
Adjusted R-squared
0.698081
S.D. dependent var
75.97807
S.E. of regression
41.74780
Akaike info criterion
10.34691
Sum squared resid
106315.6
Schwarz criterion
10.44811
Log likelihood
-328.1012
F-statistic
73.83254
Durbin-Watson stat
2.186159
Prob(F-statistic)
0.000000
CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP
Trong điều kiện các yếu tố khác không đổi, khi GDP đấu người tăng lên 1 USD thì tỷ lệ tử vong của trẻ sơ sinh tăng giảm đi 5%.
Hệ số R2 = 70.76% được xem là không tốt vì không giải thích được tất cả các biến đưa vào mô hình.
4 . So sánh mô hình đơn và mô hình bội anh chị có nhận xét gì về hệ số hồi qui tìm được của biến PGNP , nếu phải chọn hệ số PGNP của mô hình nào để giải thích tác động của PGNP lên CM ? Tại sao?
CM = 157.4244406 - 0.01136445358*PGNP
CM = 263.6415856 - 2.231585732*FLR - 0.005646594817*PGNP
- Nhận xét: hệ số hồi quy của biến PGNP của mô hình đơn > hệ số hồi quy PGNP cảu mô hình đa biến.
- Chọn mô hình 2 vì: ta thấy hệ số của FLR < nên ta bác bỏ H0 tức hệ số FLR có ý nghĩa thống kê. ( Kiếm định hệ số Prob )
5. Hồi qui CM cho tất cả các biến trong tập dữ liệu ? Nhận xét va cho ý kiến của anh chị?
Dependent Variable: CM
Method: Least Squares
Date: 05/11/10 Time: 23:17
Sample: 1 64
Included observations: 64
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
168.3067
32.89165
5.117003
0.0000
FLR
-1.768029
0.248017
-7.128663
0.0000
PGNP
-0.005511
0.001878
-2.934275
0.0047
TFR
12.86864
4.190533
3.070883
0.0032
R-squared
0.747372
Mean dependent var
141.5000
Adjusted R-squared
0.734740
S.D. dependent var
75.97807
S.E. of regression
39.13127
Akaike info criterion
10.23218
Sum squared resid
91875.38
Schwarz criterion
10.36711
Log likelihood
-323.4298
F-statistic
59.16767
Durbin-Watson stat
2.170318
Prob(F-statistic)
0.000000
CM = 168.3066897 - 1.768029221*FLR - 0.00551122506*PGNP + 12.86863633*TFR
- Trong điều kiện các yếu tố khác không đổi thì khi FLR tăng lên 1% thì về trung bình CM giảm 1.768%, PGNP tăng lên 1usd thì về trung bình CM giảm 0.0055%, TFR tăng lên 1% thì về trung bình CM cũng tăng lên 12.8686%.
- R2 = 0.747372 cao hơn các mô hình trên, cho thấy mức độ phù hợp này khá cao, có ý nghĩa thống kê hơn cả các mô hình trên.
Bài 4 :Ta có tập dữ liệu sau:
obs
AGED
ALCC
EDU1
EDU2
HEXC
INCC
MORT
PHYS
POV
TOBC
URB
1
0.122
1.9
0.565
0.122
1620
10673
934.9
142
0.189
114.5
0.675
2
0.034
3.86
0.825
0.211
1667
18187
396.2
127
0.107
128.9
0.417
3
0.123
3.08
0.724
0.174
1473
12795
771.5
184
0.132
107.1
0.764
4
0.149
1.78
0.555
0.108
1552
10476
1022.8
136
0.19
125.8
0.397
5
0.106
3.19
0.735
0.196
2069
16065
766
235
0.114
102.8
0.957
6
0.09
3.09
0.786
0.23
1664
14812
625.7
196
0.101
112.4
0.817
7
0.133
2.8
0.703
0.207
1945
18089
888.4
275
0.08
111
0.926
8
0.114
3.17
0.686
0.175
1691
14272
880.2
185
0.119
144.5
0.659
9
0.122
5.34
0.671
0.275
3872
18168
1120.5
552
0.186
122.1
1
10
0.177
3.12
0.667
0.149
1886
13742
1065.6
191
0.135
124.2
0.908
11
0.1
2.48
0.564
0.146
1755
12543
814.3
159
0.166
128.8
0.648
12
0.097
2.97
0.738
0.203
1693
13814
554.2
212
0.099
69.8
0.763
13
0.112
2.43
0.737
0.158
1288
11120
708.7
118
0.126
100.7
0.2
14
0.12
2.77
0.665
0.162
1864
14738
886.5
199
0.11
121.6
0.825
15
0.119
2.19
0.664
0.125
1625
12446
876.3
142
0.097
135.3
0.681
16
0.145
2.09
0.715
0.139
1758
12594
966.1
136
0.101
109.4
0.434
17
0.134
1.95
0.733
0.17
1820
13775
900.3
162
0.101
115.7
0.534
18
0.12
1.85
0.531
0.111
1404
10824
935
149
0.176
182.4
0.461
19
0.101
2.63
0.577
0.139
1716
11274
825.4
173
0.186
125
0.692
20
0.133
2.57
0.687
0.144
1641
11887
979.4
165
0.13
127.9
0.361
21
0.106
2.84
0.674
0.204
1732
15864
833.6
303
0.098
121.9
0.929
22
0.136
3.04
0.722
0.2
2289
16380
955.4
300
0.096
117.2
0.906
23
0.114
2.6
0.68
0.143
1996
13608
866.2
174
0.104
126.6
0.799
24
0.125
2.68
0.731
0.174
1888
14087
830.2
203
0.095
113
0.666
25
0.12
2.06
0.548
0.123
1519
9187
944.6
117
0.239
115.3
0.305
26
0.137
2.27
0.635
0.139
1858
13244
1000.4
179
0.122
129.2
0.66
27
0.121
2.95
0.744
0.175
1494
10974
815
136
0.123
103.6
0.242
28
0.136
2.41
0.734
0.155
1766
13281
928.5
156
0.107
105.1
0.476
29
0.103
5.19
0.755
0.144
1946
14488
772.3
155
0.087
146.7
0.826
30
0.116
4.91
0.723
0.182
1417
14964
849.1
179
0.085
201.1
0.563
31
0.129
2.83
0.674
0.183
1702
17211
940.7
219
0.095
116.9
1
32
0.098
2.75
0.689
0.176
1385
10914
672.8
161
0.176
88
0.489
33
0.128
2.67
0.663
0.179
2412
16050
969.9
287
0.134
115.9
0.912
34
0.115
2.13
0.548
0.132
1380
11617
846.3
168
0.148
156.3
0.554
35
0.13
2.55
0.664
0.148
1872
12052
821.6
157
0.126
103.2
0.384
36
0.123
2.26
0.67
0.137
1833
13228
920.6
182
0.103
126.7
0.789
37
0.124
1.91
0.66
0.151
1644
12232
900.8
138
0.134
124.2
0.588
38
0.134
2.63
0.756
0.179
1654
12622
889.7
189
0.107
118.6
0.677
39
0.146
2.25
0.647
0.136
1894
13437
1043.9
214
0.105
115.8
0.848
40
0.146
2.92
0.611
0.154
2054
13906
997.6
223
0.103
133.4
0.926
41
0.105
2.5
0.537
0.134
1341
10586
812.6
146
0.166
125.4
0.605
42
0.139
2.33
0.679
0.14
1617
11161
932.6
130
0.169
104.4
0.291
43
0.123
1.95
0.562
0.126
1671
11243
906.8
176
0.165
128.7
0.671
44
0.095
2.82
0.626
0.169
1577
13483
722.2
160
0.147
115.9
0.813
45
0.08
1.53
0.8
0.199
1203
10493
550.1
171
0.103
66.5
0.774
46
0.119
3.12
0.71
0.19
1481
12117
871.4
232
0.121
144.5
0.232
47
0.105
2.55
0.624
0.191
1498
14542
794.1
194
0.118
134.6
0.722
48
0.117
2.71
0.776
0.19
1660
13876
782.8
196
0.098
96.5
0.816
49
0.136
1.68
0.56
0.104
1542
10193
1003.8
156
0.15
109.1
0.365
50
0.13
3.19
0.696
0.148
1862
13154
868.8
172
0.087
107
0.665
51
0.084
2.86
0.779
0.172
1453
13223
642.9
125
0.079
125.7
0.292
Trong đó : - MORT : Tỉ lệ tử vong chung trên 100.000 dân số
INCC : Thu nhập đầu người tính bằng USD
POV : Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó
EDU1 : Tỉ lệ dân số đã học trung học
EDU2 : Tỉ lệ dân số đã học trung học và đại học.
ALCC : Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người.
TOBC : Tiêu dùng thuốc lá đầu người tíng bằng bao
HEXC : Chi tiêu y tế bình quân đầu người (USD)
URB : Tỉ lệ dân số sống tại các khu vực thành thị
AGED : Tỉ lệ dân số có độ tuồi trên 65
PHYS : Các cán bộ y tế trên 1000.000 dân
Yêu cầu :
Chọn biến Mort là biến phụ thuộc – Đối với từng biến giải thích, hãy lý giải tại sao nó có thể có tác động lên tỉ lệ tử vong tổng thể và chỉ ra hướng tác động nầy?
- Thu nhập (INCC): nếu không có thu nhập sẽ dẫn đến nghèo đói, bệnh tật không có tiền mua thuốc…
- Tỉ lệ của những người dân trong nước sống dưới mức nghèo khó (POV): Không có thu nhập, nghèo đói -> thiều ăn, bệnh tật….
- Tỷ lệ EDU1 và EDU2: Tỉ lệ dân số đã học trung học và tỉ lệ dân số đã học trung học và đại học càng cao thi trình độ dân trí của người dân càng cao, mới tiếp thu được những kiến thức tiến bộ về sức khỏe, y tế, khoa học….từ đó có thể giảm bớt được tỉ lệ tử vong chung.
- Tiêu dùng cồn ( rượu) tính bằng lít trên đầu người(ALCC): Uống rượu sẽ dẫn đến tai nạn, bệnh tật-> tử vong
- Hút thuốc(TOBC): Dẫn tới các căn bênh về đường hô hấp
-Chi tiêu y tế: Khi bị bệnh cẫn phải tới bênh viên nhưng nếu chi tiêu cho y tế thấp sẽ dẫn đến không có thuốc chữa bệnh-> tử vong.
- Tỉ lệ dân số sống tại các khu vực thành thị(URB): Dân số sống ở thành thị sẽ mắc phải sống trong môi trường ô nhiễm, tiếng ồn-> mắc một số căn bệnh.
- Tỉ lệ dân số có độ tuồi trên 65(AGED): Những người cao tuổi khả năng chống lại bệnh tật, thời tiết kém-> dễ tử vong.
- Các cán bộ y tế(PHYS): Cán bộ y tế mà ít, kém chất lượng cũng sẽ dẫn đến tỷ lệ tử vong chung.
Ước lượng mô hình hồi qui đa biến bao gồm tất cả những biến giải thích đang có? Thực hiện kiểm định cho mức ý nghĩa tổng quát – Nhận xét sự thích hợp ? Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn bỏ qua.
Dependent Variable: MORT
Method: Least Squares
Date: 05/11/10 Time: 23:30
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
46.59555
168.2097
0.277009
0.7832
AGED
4126.895
322.3451
12.80272
0.0000
ALCC
-25.91511
11.09681
-2.335366
0.0246
EDU1
68.77913
196.8405
0.349415
0.7286
EDU2
-1180.217
548.8868
-2.150201
0.0376
HEXC
0.073889
0.034127
2.165088
0.0364
INCC
0.004511
0.005817
0.775551
0.4426
PHYS
0.640384
0.263636
2.429044
0.0197
POV
549.8647
308.5540
1.782069
0.0823
TOBC
1.470480
0.353504
4.159732
0.0002
URB
-32.45556
35.64423
-0.910542
0.3680
R-squared
0.948570
Mean dependent var
855.0059
Adjusted R-squared
0.935713
S.D. dependent var
137.9660
S.E. of regression
34.98117
Akaike info criterion
10.13592
Sum squared resid
48947.30
Schwarz criterion
10.55259
Log likelihood
-247.4660
F-statistic
73.77592
Durbin-Watson stat
1.597995
Prob(F-statistic)
0.000000
MORT = 46.59554973 + 4126.895059*AGED - 25.91510605*ALCC + 68.7791315*EDU1 - 1180.217201*EDU2 + 0.07388858751*HEXC + 0.00451136983*INCC + 0.6403836367*PHYS + 549.8646857*POV + 1.470480259*TOBC - 32.45555872*URB
Ta thấy hệ số Prob(F-statistic) < nên ta bác bỏ H0 có nghĩa là có ít nhất 1 biến có ý nghĩa thống kê trong mô hình này.
Nhận xét sự thích hợp:
Kiểm định mức ý nghĩa đối với từng hệ số hồi qui ở mức = 10% và xác định các biến mà anh chị có thể muốn bỏ qua.
Qua kiểm đinh hệ số Prob ta thấy tất cả các biến trong mô hình đếu có ý nghĩa thống kê, chỉ trừ 3 biến EDU1>, INCC>, URB> là không có ý nghĩa thống kê nên đây là các biến ta có thể bỏ qua.
3. Đầu tiên hãy thực hiện một kiểm định WALD đối với việc bỏ tất cả những biến nầy. Sau đó, bỏ tất cả chúng và ước lượng lại mô hình . hãy đánh giá chất lượng của phép hồi qui mới nầy ?
Mô hình thu hẹp:
Dependent Variable: MORT
Method: Least Squares
Date: 05/16/10 Time: 10:56
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
73.76836
94.44515
0.781071
0.4390
HEXC
0.089816
0.027059
3.319302
0.0018
EDU2
-843.8800
352.4100
-2.394597
0.0211
ALCC
-25.25888
10.23731
-2.467337
0.0177
AGED
4167.319
307.4568
13.55416
0.0000
PHYS
0.479654
0.193828
2.474637
0.0174
POV
452.7655
161.4134
2.805006
0.0075
TOBC
1.563512
0.286509
5.457105
0.0000
R-squared
0.946903
Mean dependent var
855.0059
Adjusted R-squared
0.938259
S.D. dependent var
137.9660
S.E. of regression
34.28140
Akaike info criterion
10.05018
Sum squared resid
50534.21
Schwarz criterion
10.35321
Log likelihood
-248.2797
F-statistic
109.5479
Durbin-Watson stat
1.610035
Prob(F-statistic)
0.000000
Mô hình đầy đủ:
Dependent Variable: MORT
Method: Least Squares
Date: 05/11/10 Time: 23:30
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
46.59555
168.2097
0.277009
0.7832
AGED
4126.895
322.3451
12.80272
0.0000
ALCC
-25.91511
11.09681
-2.335366
0.0246
EDU1
68.77913
196.8405
0.349415
0.7286
EDU2
-1180.217
548.8868
-2.150201
0.0376
HEXC
0.073889
0.034127
2.165088
0.0364
INCC
0.004511
0.005817
0.775551
0.4426
PHYS
0.640384
0.263636
2.429044
0.0197
POV
549.8647
308.5540
1.782069
0.0823
TOBC
1.470480
0.353504
4.159732
0.0002
URB
-32.45556
35.64423
-0.910542
0.3680
R-squared
0.948570
Mean dependent var
855.0059
Adjusted R-squared
0.935713
S.D. dependent var
137.9660
S.E. of regression
34.98117
Akaike info criterion
10.13592
Sum squared resid
48947.30
Schwarz criterion
10.55259
Log likelihood
-247.4660
F-statistic
73.77592
Durbin-Watson stat
1.597995
Prob(F-statistic)
0.000000
Ta có : UuR2= 0.9485
RR2= 0.9469
F= = 0.414239
Vậy F(tính toán)<F(tra bảng): nên ta chấp nhận H0 có nghĩa là 3 biến EDU1, INCC, URB không có ý nghĩa thống kê.
- Ước lượng lại mô hình:
Dependent Variable: MORT
Method: Least Squares
Date: 05/16/10 Time: 13:50
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
73.76836
94.44515
0.781071
0.4390
HEXC
0.089816
0.027059
3.319302
0.0018
EDU2
-843.8800
352.4100
-2.394597
0.0211
ALCC
-25.25888
10.23731
-2.467337
0.0177
AGED
4167.319
307.4568
13.55416
0.0000
PHYS
0.479654
0.193828
2.474637
0.0174
POV
452.7655
161.4134
2.805006
0.0075
TOBC
1.563512
0.286509
5.457105
0.0000
R-squared
0.946903
Mean dependent var
855.0059
Adjusted R-squared
0.938259
S.D. dependent var
137.9660
S.E. of regression
34.28140
Akaike info criterion
10.05018
Sum squared resid
50534.21
Schwarz criterion
10.35321
Log likelihood
-248.2797
F-statistic
109.5479
Durbin-Watson stat
1.610035
Prob(F-statistic)
0.000000
MORT = 73.76835504 + 0.08981575805*HEXC - 843.8800387*EDU2 - 25.2588845*ALCC + 4167.318921*AGED + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC
- Đánh giá chất lượng của phép hồi quy mới:
- Việc đưa 3 biến không có ảnh đến biến phụ thuộc MORT đã gây ra hiện tượng đa cộng tuyến, làm cho mô hình ban đầu có hệ số tương quan R2 cao, trị thống kê mất ý nghĩa, làm cho chúng ta có đánh giá sai lầm về mô hình.
- R2 = 94.69% được đánh giá là tốt, vì giải thích đầy đủ các biến đưa vào mô hình, tức là mô hình đưa ra có ý nghĩa thống kê
4.Trở lại với mô hình gốc ban đầu ( Mô hình không giới hạn U) , lần lượt mỗi lần bỏ một biến có ít ý nghĩa nhất và ước lượng lại . Đánh giá chất lượng của phép hồi qui mới ?
Bỏ EDU1
Dependent Variable: MORT
Method: Least Squares
Date: 05/16/10 Time: 13:57
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
92.81956
102.7758
0.903127
0.3717
AGED
4144.662
314.8831
13.16254
0.0000
ALCC
-24.63643
10.36327
-2.377283
0.0222
EDU2
-1057.359
416.9455
-2.535966
0.0151
HEXC
0.078052
0.031636
2.467190
0.0179
INCC
0.004070
0.005617
0.724592
0.4728
PHYS
0.591597
0.221220
2.674242
0.0107
POV
469.5791
203.7221
2.304998
0.0263
TOBC
1.426362
0.326631
4.366888
0.0001
URB
-35.97989
33.81937
-1.063884
0.2936
R-squared
0.948413
Mean dependent var
855.0059
Adjusted R-squared
0.937089
S.D. dependent var
137.9660
S.E. of regression
34.60463
Akaike info criterion
10.09976
Sum squared resid
49096.70
Schwarz criterion
10.47854
Log likelihood
-247.5438
F-statistic
83.75303
Durbin-Watson stat
1.585340
Prob(F-statistic)
0.000000
MORT = 92.8195617 + 4144.66192*AGED - 24.63643081*ALCC - 1057.359357*EDU2 + 0.07805159076*HEXC + 0.004070138276*INCC + 0.5915970828*PHYS + 469.5791064*POV + 1.426361908*TOBC - 35.97989484*URB
Mô hình mới vẫn được đánh giá là không tốt vì: R2 = 0.948413 cao do xảy ra hiện tượng đa cộng tuyến.
5.với mô hình mới có K-1 biến giải thích, tiếp tục như câu 4 và yêu cầu như trên ?
Bỏ EDU1 Và INCC
Dependent Variable: MORT
Method: Least Squares
Date: 05/16/10 Time: 14:02
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
103.0909
101.2163
1.018521
0.3143
AGED
4127.928
312.2544
13.21976
0.0000
ALCC
-25.19964
10.27548
-2.452404
0.0184
EDU2
-911.4815
363.0489
-2.510630
0.0160
HEXC
0.089616
0.027160
3.299569
0.0020
PHYS
0.550671
0.212676
2.589252
0.0132
POV
396.2853
175.8333
2.253755
0.0295
TOBC
1.533024
0.289927
5.287621
0.0000
URB
-24.63730
29.80849
-0.826520
0.4132
R-squared
0.947753
Mean dependent var
855.0059
Adjusted R-squared
0.937801
S.D. dependent var
137.9660
S.E. of regression
34.40841
Akaike info criterion
10.07326
Sum squared resid
49725.42
Schwarz criterion
10.41417
Log likelihood
-247.8682
F-statistic
95.23350
Durbin-Watson stat
1.629472
Prob(F-statistic)
0.000000
MORT = 103.0909379 + 4127.928148*AGED - 25.19963943*ALCC - 911.4814852*EDU2 + 0.08961614111*HEXC + 0.5506708875*PHYS + 396.2853088*POV + 1.533024196*TOBC - 24.63729751*URB
Sau khi ước lượng lại mô hình ta thấy: R2 = 0.948413 cao do vẫn còn hiện tượng đa cộng tuyến.
6.Tiếp tục quá trình nầy cho đến khi tất cả các biến còn lại đều có ý nghĩa. Mô hình cuối nầy có giống như mô hình giới hạn R mà các bạn thu được từ kết quả câu 3 hay không ? từ kết quả đó bạn có suy gẫm gì?
Bỏ EDU1 Và INCC và URB
Dependent Variable: MORT
Method: Least Squares
Date: 05/16/10 Time: 14:03
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
73.76836
94.44515
0.781071
0.4390
AGED
4167.319
307.4568
13.55416
0.0000
ALCC
-25.25888
10.23731
-2.467337
0.0177
EDU2
-843.8800
352.4100
-2.394597
0.0211
HEXC
0.089816
0.027059
3.319302
0.0018
PHYS
0.479654
0.193828
2.474637
0.0174
POV
452.7655
161.4134
2.805006
0.0075
TOBC
1.563512
0.286509
5.457105
0.0000
R-squared
0.946903
Mean dependent var
855.0059
Adjusted R-squared
0.938259
S.D. dependent var
137.9660
S.E. of regression
34.28140
Akaike info criterion
10.05018
Sum squared resid
50534.21
Schwarz criterion
10.35321
Log likelihood
-248.2797
F-statistic
109.5479
Durbin-Watson stat
1.610035
Prob(F-statistic)
0.000000
MORT = 73.76835504 + 4167.318921*AGED - 25.2588845*ALCC - 843.8800387*EDU2 + 0.08981575805*HEXC + 0.4796537478*PHYS + 452.7654879*POV + 1.563511835*TOBC
Sau khi bỏ tất cả các biến không có tác động đến MORT, ta thấy mô hình thu được giống mô hình đã ước lượng lại ở câu 3.
Qua kết quả trên cho ta thấy: hậu quả của hiện tượng đa cộng tuyến là nó làm cho chúng ta lầm tưởng rằng mô hình không giới hạn ban đầu có ý nghĩa thống kê, các biến đưa vào mô hình đều có tác động đến biến phụ thuộc do R2 rất lớn ( tức giải thích được tất cả các biển đưa vào mô hình ). Dễ làm cho chúng ta có những kết luận sai lầm về mô hình ban đầu.
Bài 5:
Tổng cục thống kê quốc gia của Đài Loan đưa ra một số dữ liệu về GDP thực của khu vực nông nghiệp từ năm 1958 đến 1972 như sau :
Y : GDP thực của khu vực nông nghiệp ( triệu USD)
X2 : Số ngày lao động hằng năm của khu vực nông nghiệp ( triệu ngày công lao động )
X3 : Vốn thực của khu vực nông nghiệp hằng năm ( triệu USD)
YEAR
Y
X2
X3
1958
16607.7
275.5
17803.7
1959
17511.3
274.4
18096.8
1960
20171.2
269.7
18271.8
1961
20932.9
267
19167.3
1962
20406
267.8
19647.6
1963
20831.6
275
20803.5
1964
24806.3
283
22076.6
1965
26465.8
300.7
23445.2
1966
27403
307.5
24939
1967
28628.7
303.7
26713.7
1968
29904.5
304.7
29957.8
1969
27508.2
298.6
31585.9
1970
29035.5
295.5
33474.5
1971
29281.5
299
34821.8
1972
31535.8
288.1
41794.3
Hãy ước lượng hàm Cobb-Duoglas có dạng như sau :
Y= A.eR.T.X21. X3 2
Ta lấy Ln 2 vế:
lnY=lnA + RT + 1lnX2 + 2lnX3
Trong đó T là biến xu thế theo thời gian
R là năng suất lao động trung bình thay đổi theo thời gian T.
đặt Y* = lnY
X2* = lnX2
X3* = lnX3
b1* = lnA
ta có phương trình: Y* = b1* + RT + 1X2 + 2X3 (1)
T = năm - 1958
ước lượng phương trình (1) ta được:
Dependent Variable: LNGDP
Method: Least Squares
Date: 05/16/10 Time: 14:14
Sample: 1958 1972
Included observations: 15
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
9.412886
4.129936
2.279185
0.0436
T
0.064795
0.018935
3.421919
0.0057
LNLAODONG
0.878171
0.432277
2.031500
0.0671
LNVON
-0.468799
0.289806
-1.617632
0.1340
R-squared
0.946249
Mean dependent var
10.09653
Adjusted R-squared
0.931589
S.D. dependent var
0.207914
S.E. of regression
0.054381
Akaike info criterion
-2.762431
Sum squared resid
0.032530
Schwarz criterion
-2.573617
Log likelihood
24.71823
F-statistic
64.54878
Durbin-Watson stat
1.938628
Prob(F-statistic)
0.000000
LNGDP = 9.412886114 + 0.06479543845*T + 0.8781710093*LNLAODONG - 0.4687993113*LNVON
lấy e mũ 2 vế ta được:
GDP = e 9.412886114*e 0.06479543845*T *LAODONG 0.8781710093*VON -0.4687993113 (2)
Phương trình (2) là phương trình hồi qui ước lượng từ hàm Cobb-Duoglas có dạng: Y= A.eR.T.X21. X3 2
Trong đó:
A = e 9.412886114
R = 0.06479543845
b 1 = 0.8781710093
b 2 = -0.4687993113
Hãy giải thích các hệ số ước lượng R , 1 và 2 theo ý nghĩa kinh tế.
+ Hệ số ước lượng R: trong điều kiện các yếu tố khác không thay đổi, qua mỗi năm năng suất trung bình R tăng thêm 1 đơn vị thì về trung bình GDP tăng lên e0.06479543845 triệu USD.
+ Hệ số ước lượng 1: trong điều kiện các yếu tố khác không thay đổi khi Số ngày lao động hằng năm tăng thêm 1 triệu ngày công lao động thì về trung bình GDP thực của khu vực nông nghiệp tăng thêm 10.8781710093 triệu USD.
+ Hệ số ước lượng 2: trong điều kiện các yếu tố khác không thay đổi, khi đàu tư thêm 1 triệu USD vào khu vực nông nghiệp thì về trung bình GDP giảm 1/10.4687993113 triệu USD.
Chỉ ra rằng khu vực nông nghiệp Đài loan có phát triển hiệu quả không ? Giải thích tại sao anh chị có nhận định như vậy? Ngòai những lý do về vốn, lao động , anh chị còn có giả thiết nào khác về nguyên nhân tác động đến sự phát triển của khu vực Đài loan ?
Mô hình trên cho thấy khu vực nông nghiệp Đài Loan phát triển không hiệu quả. Bởi vì: khi vốn đầu tư càng tăng thêm thì GDP lại giảm đi, do vốn đầu tư cho nông nghiệp chưa được sử dụng hiệu quả.
Ngoài những lý do về vốn và lao động nông nghiệp Đài Loan thì còn một số nguyên nhân tác động đến sự phát triển của khu vực Đài loan đó là: công nghệ trong sản xuất và giống… cũng có thể do các yếu tố khác như đất đai, khí hậu, kĩ thuật sản xuất…đây là một số yếu tố có thể ảnh hưởng đến sự phát triển nông nghiệp.
Bài tập 6:
Một quốc gia có dữ liệu về tiết kiệm và tiêu dùng như sau :
YEAR
SAVINGS
INCOME
YEAR
SAVINGS
INCOME
1970
61
727.1
1983
167
2522.4
1971
68.6
790.2
1984
235.7
2810
1972
63.6
855.3
1985
206.2
3002
1973
89.6
965
1986
196.5
3187.6
1974
97.6
1054.2
1987
168.4
3363.1
1975
104.4
1159.2
1988
189.1
3640.8
1976
96.4
1273
1989
187.8
3894.5
1977
92.5
1401.4
1990
208.7
4166.8
1978
112.6
1580.1
1991
246.4
4343.7
1979
130.1
1769.5
1992
272.6
4613.7
1980
161.8
1973.3
1993
214.4
4790.2
1981
199.1
2200.2
1994
189.4
5021.7
1982
205.5
2347.3
1995
249.3
5320.8
Saving :Tiết kiệm quốc gia tính bằng tỉ USD
Income: Thu nhập quốc gia tính bằng tỉ USD
Yêu cầu :
Giai đọan 1970-1981 chính sách tiền tệ thắt chặt và mưc lãi suất rất cao , anh chi xác định Dum = 0 cho giai đọan nầy . Và Dum = 1 cho giai đọan 1982-1995 đây là giai đọan chính sách tiền tệ nới lỏng và lãi suất thấp .
Xây dựng hàm hồi qui đơn tuyến tính cho từng giai đọan nói trên theo mô thức :
Saving = 1 + 2* Income + u
Có nghĩa là anh chị xây dựng dạng hàm nầy cho giai đọan 1970-1981 và giai đọai 1982-1995. ý nghĩa kinh tế của 2 đo lường đại lượng gì trong hàm hồi qui?
Giao đoạn 70-81:
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/16/10 Time: 14:26
Sample: 1970 1981
Included observations: 12
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.016117
11.63771
0.087313
0.9321
INCOME
0.080332
0.008367
9.601576
0.0000
R-squared
0.902143
Mean dependent var
106.4417
Adjusted R-squared
0.892358
S.D. dependent var
40.72222
S.E. of regression
13.36051
Akaike info criterion
8.173495
Sum squared resid
1785.032
Schwarz criterion
8.254313
Log likelihood
-47.04097
F-statistic
92.19026
Durbin-Watson stat
0.864230
Prob(F-statistic)
0.000002
SAVINGS = 1.016117401 + 0.08033187867*INCOME
B2 đo lường tiết kiệm của quốc gia. CÓ nghĩa là khi thu nhập quốc gia tăng lên 1usd thì vầ trung bình sẽ tiết kiệm được 0.08usd.
Giai đoạn 82-95
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/16/10 Time: 14:27
Sample: 1982 1995
Included observations: 14
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
153.4947
32.71227
4.692266
0.0005
INCOME
0.014862
0.008393
1.770773
0.1020
R-squared
0.207169
Mean dependent var
209.7857
Adjusted R-squared
0.141100
S.D. dependent var
31.15670
S.E. of regression
28.87505
Akaike info criterion
9.695396
Sum squared resid
10005.22
Schwarz criterion
9.786690
Log likelihood
-65.86777
F-statistic
3.135639
Durbin-Watson stat
1.786588
Prob(F-statistic)
0.101972
SAVINGS = 153.49467 + 0.01486243404*INCOME
B2 đo lường tiết kiệm của quốc gia. CÓ nghĩa là khi thu nhập quốc gia tăng lên 1usd thì vầ trung bình sẽ tiết kiệm được 0.01usd. Vì lãi suất thấp mọi người sẽ ít tiết kiệm hơn.
Hãy xây dựng hàm hồi qui dạng bội ( đa biến ) có dạng sau đây cho giai đọan 1970-1995:
Saving = 1 + 2* Dum + 3* Income + u
ý nghĩa kinh tế của 3 đo lường đại lượng gì trong hàm hồi qui?
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/16/10 Time: 14:29
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
71.70587
13.54567
5.293639
0.0000
DUM
37.83347
22.90507
1.651751
0.1122
INCOME
0.026468
0.007925
3.339604
0.0028
R-squared
0.791900
Mean dependent var
162.0885
Adjusted R-squared
0.773804
S.D. dependent var
63.20446
S.E. of regression
30.06008
Akaike info criterion
9.752440
Sum squared resid
20783.00
Schwarz criterion
9.897605
Log likelihood
-123.7817
F-statistic
43.76180
Durbin-Watson stat
1.045517
Prob(F-statistic)
0.000000
SAVINGS = 71.70587083 + 37.83347007*DUM + 0.026467889*INCOME
- Trong điều kiện các yếu tố khác không đổi, khi thu nhập tăng lên 1usd thì về trung bình sẽ tiết kiệm được 0.026usd.
Từ câu 2 anh chị hãy viết phương trình hồi qui cho truờng hợp Dum=1 và Dum = 0 . So sánh kết quả nầy với kết quả mà anh chị đã tìm ra ở câu 1 . Nêu nhận xét của anh chị về kết quả tìm được ?
kết quả hồi qui 2 trường hợp dum = 0 và dum = 1 giai đoạn 1970 – 1995:
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/16/10 Time: 22:24
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
62.42267
12.76075
4.891772
0.0001
INCOME
0.037679
0.004237
8.893776
0.0000
R-squared
0.767215
Mean dependent var
162.0885
Adjusted R-squared
0.757515
S.D. dependent var
63.20446
S.E. of regression
31.12361
Akaike info criterion
9.787614
Sum squared resid
23248.30
Schwarz criterion
9.884391
Log likelihood
-125.2390
F-statistic
79.09925
Durbin-Watson stat
0.859717
Prob(F-statistic)
0.000000
SAVINGS = 62.42267117 + 0.03767912963*INCOME
Trường hợp dum=0
hàm hồi qui có dạng:
SAVINGS = 1 + 2* INCOME + u
SAVINGS = 62.42267117 + 0.03767912963*INCOME
+ So trường hợp dum = 0( giai đoạn 1970 – 1995 ) với giai đoạn năm 1970 – 1981 của câu 1 ta thấy:
Mức tiết kiệm trung bình giai đoạn 1970 – 1995 ít hơn hơn mức tiết kiệm trong giai đoạn 1970 – 1981. Cụ thể là: khi thu nhập quốc gia tăng lên 1 tỉ USD thì về trung bình tiết kiệm quốc gia sẽ tăng lên 0.08 tỉ USD (1970 – 1981) và gần 0.04 tỉ USD (1970 – 1995)
Trường hợp dum=1
hàm hồi qui có dạng:
SAVINGS = (1 + 2) + 3* INCOME + u
SAVINGS = 100.2561412 + 0.03767912963*INCOME
Hệ số b1 = ( 1 + 2 ) = 62.42267117 + 37.83347007 = 100.2561412
+ So trường hợp dum = 1 (giai đoạn 1970 – 1995) với giai đoạn năm 1982 – 1995 của câu 1 ta thấy:
Mức tiết kiệm trung bình của giai đoạn 1970 – 1995 cao hơn mức tiết kiệm trong giai đoạn 1982 – 1995. Cụ thể là: khi thu nhập quốc gia tăng lên 1 tỉ USD thì về trung bình tiết kiệm quốc gia tăng lên gần 0.015 tỉ USD (1982 – 1995) và gần 0.04 tỉ USD (1970 – 1995), cao hơn rất nhiều so với giai đoạn giai đoạn (1982 – 1995)
Hãy xây dựng hàm hồi qui dạng bội ( đa biến ) có dạng sau đây cho giai đọan 1970-1995:
Saving = 1 + 2* Dum + 3.Income + 4* Dum* Income + u
Dependent Variable: SAVINGS
Method: Least Squares
Date: 05/16/10 Time: 14:35
Sample: 1970 1995
Included observations: 26
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1.016117
20.16483
0.050391
0.9603
DUM
152.4786
33.08237
4.609058
0.0001
INCOME
0.080332
0.014497
5.541347
0.0000
DUM_X_INCOME
-0.065469
0.015982
-4.096340
0.0005
R-squared
0.881944
Mean dependent var
162.0885
Adjusted R-squared
0.865846
S.D. dependent var
63.20446
S.E. of regression
23.14996
Akaike info criterion
9.262501
Sum squared resid
11790.25
Schwarz criterion
9.456055
Log likelihood
-116.4125
F-statistic
54.78413
Durbin-Watson stat
1.648454
Prob(F-statistic)
0.000000
SAVINGS = 1.016117401 + 152.4785526*DUM + 0.08033187867*INCOME - 0.06546944463*DUM_X_INCOME
5. Từ kết quả của câu 4 hãy cho biết giữa 2 giai đọan có sự khác biệt ý nghĩa thống kê của hệ số hồi qui 4 hay không ? Sự khác biệt nầy được giải thích bằng ý nghĩa kinh tế là 2 giai đọan chính sách khác nhau ảnh hưởng thế nào đến hành vi tiết kiệm của công chúng
Từ kết quả câu 4 ta thấy: giữa 2 giai đoạn có sự khác biệt ý nghĩa thống kê của hệ số hồi qui b4 : ta thấy mối quan hệ tỉ lệ nghich giữa tiết kiệm với thu nhập.
Trong trường hợp dum = 0, khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm tăng thêm 0.08 USD
Trong trường hợp dum = 1: khi thu nhập tăng thêm 1 USD thì về trung bình tiết kiệm giảm đi (0.08 – 0.065) = 0.015 USD
Tác động của 2 chính sách tiền tệ ảnh hưởng đến hành vi tiết kiệm của công chúng :
+ Đối với giai đoạn 1970 – 1981: khi chính phủ thực hiện chính sách tiền tệ thắt chặt, với mức lãi suất cao thì khi đó người dân sẽ gia tăng gửi tiết kiệm vào ngân hang để hưởng mức lãi suất cao và giảm đầu tư vì vậy làm cho tiết kiệm quốc gia tăng lên.
+ Đối với giai đoạn 1982 – 1995: khi chính phủ thực hiện chính sách tiền tệ nới lỏng, với mức lãi suất thấp do đó người dân sẽ vay tiền nhiều hơn để đầu tư, tái sản xuất mở rộng. Mặt khác, với mức lãi suất thấp người dân sẽ hạn chế gửi tiết kiệm mà giữ lại trong nhà hoặc đầu tư là chính.. Do đó làm cho tiết kiệm quốc gia giảm đi.
Bài tập 7:
Các dữ liệu hằng năm về sản xuất cá Ngừ Trắng tại vùng Basque Tây Ban Nha trong giai đọan 1961-1994 .
Trong đó : CATCH – Tổng lượng cá đánh bắt tính bằng đơn vị 1000 Tấn
EFFORT - Tổng số ngày đánh cá theo đơn vị Ngàn ngày
obs
CATCH
EFFORT
obs
CATCH
EFFORT
1
41.4
45.03512
18
35.804
31.36205
2
51.8
50.05673
19
38.95
25.68735
3
44.3
44.3
20
29.157
19.38004
4
48
44.54
21
23.748
21.78884
5
44.826
59.97878
22
28.333
20.1047
6
39.208
45.37687
23
31.945
27.18085
7
48.278
46.60833
24
18.434
17.92367
8
37.819
52.24526
25
22.531
18.97028
9
31.992
54.11967
26
25.587
22.37778
10
29.894
35.60816
27
29.777
16.89844
11
39.406
61.24754
28
27.906
20.19613
12
34.279
54.76161
29
25.757
16.42839
13
27.958
46.56643
30
24.503
15.57284
14
36.407
28.51477
31
16.608
17.14402
15
27.827
27.16532
32
18.162
15.78574
16
33.71
38.83327
33
18.371
12.12064
17
32.888
22.07106
34
16.993
10.31185
Yêu cầu :
Ước lượng mô hình tuyến tính đơn :
Catchi = 1 + 2* Efforti + ui
Dependent Variable: CATCH
Method: Least Squares
Date: 05/16/10 Time: 14:38
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
16.72586
2.447216
6.834648
0.0000
EFFORT
0.473070
0.069201
6.836215
0.0000
R-squared
0.593567
Mean dependent var
31.83994
Adjusted R-squared
0.580866
S.D. dependent var
9.449949
S.E. of regression
6.117947
Akaike info criterion
6.517353
Sum squared resid
1197.737
Schwarz criterion
6.607139
Log likelihood
-108.7950
F-statistic
46.73384
Durbin-Watson stat
1.135208
Prob(F-statistic)
0.000000
CATCH = 16.72586416 + 0.4730703715*EFFORT
Ước lượng mô hình tuyến tính bội :
Catchi = 1 + 2* Efforti + 3* (Efforti )2 + ui
Dependent Variable: CATCH
Method: Least Squares
Date: 05/16/10 Time: 14:40
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
2.339564
5.785686
0.404371
0.6887
EFFORT
1.491794
0.383074
3.894275
0.0005
EFFORT2
-0.014521
0.005386
-2.696384
0.0112
R-squared
0.670780
Mean dependent var
31.83994
Adjusted R-squared
0.649540
S.D. dependent var
9.449949
S.E. of regression
5.594338
Akaike info criterion
6.365484
Sum squared resid
970.1953
Schwarz criterion
6.500163
Log likelihood
-105.2132
F-statistic
31.58097
Durbin-Watson stat
1.453119
Prob(F-statistic)
0.000000
CATCH = 2.339564155 + 1.491794483*EFFORT - 0.0145214702*EFFORT2
3. Giải thích các hệ số 2, 3 tìm được trong câu trên?
- Trong điều kiện các yếu tố khác không đổi, khi số ngày đánh bắt tăng lên một ngày thì về trung bình sản lượng đánh bắt sẽ tăng lên 1.49 tấn.
- Trong điều kiện các yếu tố khác không đổi, khi số ngày đánh bắt tăng lên gấp đôi thì về trung bình sản lượng đánh bắt sẽ giảm xuống 0.0145 tấn so với
4. Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó anh chị lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn gì? Hãy giải thích và thực hiện những kiểm định cần thiết ?
Nếu mô hình đúng là mô hình của câu 2 , nhưng thay vì chọn mô hình đó lại chọn mô hình câu 1 để thực hiện phân tích về sản xuất Ngư nghiệp, thì lúc nầy ta gặp phải những khó khăn là: chúng ta không đánh giá đúng tình hình đánh bắt cá ở đây từ đó sẽ đưa ra những chính sách không đúng về việc đánh bắt cá ở đây do xảy ra hiện tượng phương sai sai số thay đổi.
Kiểm định lại mô hình 1
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:
F-statistic
2.883619
Prob. F(2,31)
0.071033
Obs*R-squared
5.333174
Prob. Chi-Square(2)
0.069489
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/25/10 Time: 22:57
Sample: 1 34
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-9.028710
38.31446
-0.235648
0.8153
EFFORT
1.877263
2.536823
0.740005
0.4649
EFFORT^2
-0.012570
0.035665
-0.352450
0.7269
R-squared
0.156858
Mean dependent var
35.22756
Adjusted R-squared
0.102462
S.D. dependent var
39.10480
S.E. of regression
37.04730
Akaike info criterion
10.14637
Sum squared resid
42547.57
Schwarz criterion
10.28104
Log likelihood
-169.4882
F-statistic
2.883619
Durbin-Watson stat
2.444300
Prob(F-statistic)
0.071033
với mức ý nghĩa 10%
nR2 > Chi-Square(2) à bác bỏ Ho à có hiện tượng phương sai sai số thay đổià mô hình câu 1 không có ý nghĩa thống kê.
Bài tập 8 :
Dữ l iệu sau đây cho thấy về thu nhập cá nhân và chi tiêu cho đi lại trong nước năm 199… cho 50 tiểu bang vả Thủ đô của USA . Các Biến trong tập dữ liệu nầy là :
- Exptrav : Chi tiêu cho đi lại tính bằng tỉ USD
Income : Thu nhập cá nhân tính bằng tỉ USD
POP : Dân số tính bằng triệu người
EXPTRAV
INCOME
POP
EXPTRAV
INCOME
POP
1.142
9.3
0.47
6.122
76.6
3.564
1.03
11.2
0.576
4.831
61.2
3.63
3.169
17.1
0.579
3.567
64.1
3.794
1.085
13.8
0.598
5.525
71.3
3.945
0.828
10.9
0.637
3.682
71.6
4.181
0.836
15.3
0.698
4.848
71.3
4.29
0.834
12.8
0.716
4.492
94.9
4.524
1.434
14.6
0.841
4.922
118.5
4.958
0.708
21.2
1
4.453
99.9
5.044
1.462
19.3
1.1
6.779
93.9
5.094
1.408
25.1
1.124
6.215
102.4
5.235
5.866
27.4
1.166
5.318
114.5
5.259
1.483
23.3
1.24
4.22
109.6
5.706
12.539
31.6
1.382
7.452
146.9
6.018
1.751
31.7
1.613
9.076
140.2
6.473
2.695
26.4
1.616
9.186
132.9
6.902
1.371
29.4
1.818
7.884
129.8
6.952
2.712
30
1.86
11.134
211.2
7.859
2.745
38.8
2.426
7.498
194.7
9.46
2.457
50.3
2.535
8.546
217.9
11.061
2.236
38.9
2.64
13.804
263.6
11.686
2.746
51.6
2.821
10.06
256
12.03
3.795
59
3.035
28.629
283.4
13.726
2.698
55
3.233
20.215
345
18.022
3.458
92.3
3.278
19.95
450.6
18.153
42.48
683.5
31.217
Yêu cầu :
Thực hiện mô hình đơn giản xác định rằng Exptrav là một hàm tuyến tính theo Income ?
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/16/10 Time: 14:43
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
0.498120
0.535515
0.930170
0.3568
INCOME
0.055573
0.003293
16.87558
0.0000
R-squared
0.853199
Mean dependent var
6.340706
Adjusted R-squared
0.850203
S.D. dependent var
7.538343
S.E. of regression
2.917611
Akaike info criterion
5.017834
Sum squared resid
417.1103
Schwarz criterion
5.093591
Log likelihood
-125.9548
F-statistic
284.7850
Durbin-Watson stat
2.194928
Prob(F-statistic)
0.000000
EXPTRAV = 0.4981199552 + 0.05557310647*INCOME
Vẽ đồ thị phần dư ( u) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ?
3. Vẽ đồ thị bình phương phần dư (u2) của mô hình hồi qui câu 1 theo income. Dựa trên đồ thị trên anh chị có kết luận gì về phương sai của sai số thay đổi ?
hãy tiến hành kiểm định hiện tượng phương sai của sai số thay đổi trong mô hình câu 1 với mức ý nghĩa = 10% theo các cách thức đã đuợc giới thiệu . Các kết luận có mâu thuẩn nhau hay không ?
Kiểm định White:
White Heteroskedasticity Test:
F-statistic
2.537633
Prob. F(2,48)
0.089614
Obs*R-squared
4.876820
Prob. Chi-Square(2)
0.087300
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 05/16/10 Time: 14:59
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.689561
5.950486
-0.283937
0.7777
INCOME
0.126986
0.073163
1.735656
0.0890
INCOME^2
-0.000132
0.000127
-1.039498
0.3038
R-squared
0.095624
Mean dependent var
8.178634
Adjusted R-squared
0.057942
S.D. dependent var
26.00254
S.E. of regression
25.23798
Akaike info criterion
9.351600
Sum squared resid
30573.88
Schwarz criterion
9.465237
Log likelihood
-235.4658
F-statistic
2.537633
Durbin-Watson stat
2.147294
Prob(F-statistic)
0.089614
n.R2=4.876820 > Chi-Square(2) = 0.210720 ---à bác bỏ Ho --àphương sai thay đổi
kiểm định Goldseld - Quant
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
Chia mẫu thành ba nhóm
Nhóm 1: từ n1 – n17
Nhóm 2: từ n18 –n34 (loại bỏ)
Nhóm 3 : từ n35 – n51
Ước lượng phương trình hồi quy nhóm 1và 3
Nhóm 1:
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/16/10 Time: 21:55
Sample: 1 17
Included observations: 17
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-1.765089
1.793694
-0.984052
0.3407
INCOME
0.204605
0.084089
2.433181
0.0279
R-squared
0.282996
Mean dependent var
2.331824
Adjusted R-squared
0.235195
S.D. dependent var
2.914951
S.E. of regression
2.549216
Akaike info criterion
4.819579
Sum squared resid
97.47750
Schwarz criterion
4.917604
Log likelihood
-38.96642
F-statistic
5.920371
Durbin-Watson stat
2.587301
Prob(F-statistic)
0.027949
Ta có: RSS1 = 97,4775
Nhóm 3:
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/16/10 Time: 22:00
Sample: 35 51
Included observations: 17
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.763340
1.862588
-0.409827
0.6877
INCOME
0.059705
0.006856
8.708565
0.0000
R-squared
0.834873
Mean dependent var
12.84976
Adjusted R-squared
0.823864
S.D. dependent var
9.949654
S.E. of regression
4.175722
Akaike info criterion
5.806583
Sum squared resid
261.5498
Schwarz criterion
5.904608
Log likelihood
-47.35595
F-statistic
75.83910
Durbin-Watson stat
2.250119
Prob(F-statistic)
0.000000
Ta có RSS2 = 261,5498
Fc=97.4775/261.5498 = 0.373
Tra bảng phân phối Fisher với mức ý nghĩa 10% F(15;32)=1,72
Ta có Fc < F è bác bỏ Ho ---àcó hiện tượng phương sai thay đổi
Nếu phần dư ở mô hình 1 có hiện tuợng phương sai của sai số thay đổi hãy sử dụng thủ tục bình phương có trọng số theo White để ước lượng lại phương trình hồi qui ?
`
Dependent Variable: EXPTRAV
Method: Least Squares
Date: 05/16/10 Time: 15:10
Sample: 1 51
Included observations: 51
Weighting series: E2_MU_CAN
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-0.199715
0.784310
-0.254638
0.8001
INCOME
0.058860
0.002715
21.67839
0.0000
Weighted Statistics
R-squared
0.905579
Mean dependent var
8.803754
Adjusted R-squared
0.903652
S.D. dependent var
16.34141
S.E. of regression
4.053436
Akaike info criterion
5.675433
Sum squared resid
805.0867
Schwarz criterion
5.751191
Log likelihood
-142.7235
F-statistic
469.9526
Durbin-Watson stat
2.291150
Prob(F-statistic)
0.000000
Unweighted Statistics
R-squared
0.847987
Mean dependent var
6.340706
Adjusted R-squared
0.844884
S.D. dependent var
7.538343
S.E. of regression
2.968956
Sum squared resid
431.9203
Durbin-Watson stat
2.101548
EXPTRAV = -0.1997152197 + 0.05886047842*INCOME
Hãy kiểm định White về hiện tượng phương sai của sai số thay đổi trong mô hình của câu 5 với mức ý nghĩa = 10%
giả thiết: Ho: e1=e2=…=en
H1: ei # ej
White Heteroskedasticity Test:
F-statistic
5.527501
Prob. F(4,46)
0.001017
Obs*R-squared
16.55572
Prob. Chi-Square(4)
0.002357
Test Equation:
Dependent Variable: WGT_RESID^2
Method: Least Squares
Date: 05/16/10 Time: 22:19
Sample: 1 51
Included observations: 51
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-13.29557
375.3913
-0.035418
0.9719
WGT
246.7482
1257.745
0.196183
0.8453
WGT^2
-374.0439
1135.303
-0.329466
0.7433
INCOME*WGT
1.643537
2.944241
0.558221
0.5794
INCOME^2*WGT^2
-0.000408
0.000364
-1.122599
0.2674
R-squared
0.324622
Mean dependent var
15.78601
Adjusted R-squared
0.265893
S.D. dependent var
57.33304
S.E. of regression
49.12296
Akaike info criterion
10.71942
Sum squared resid
111001.0
Schwarz criterion
10.90882
Log likelihood
-268.3453
F-statistic
5.527501
Durbin-Watson stat
2.649477
Prob(F-statistic)
0.001017
nR2=2.352386 > Chi-Square(4) = 1.063623---à bác bỏ Ho --àphương sai thay đổi
Bài tập 9 :
Dữ liệu nầy nói về doanh số và tồn kho của công nghiệp một quốc gia Châu Au trong giai đọan 1950-1991 :
YEAR SALES INVENTORIES
1950 38596 59822
1951 43356 70242
1952 44840 72377
1953 47987 76122
1954 46443 73175
1955 51694 79516
1956 54063 87304
1957 55879 89052
1958 54021 87055
1959 59729 92097
1960 60827 94719
1961 61159 95580
1962 65662 101049
1963 68995 105463
1964 73682 111504
1965 80283 120929
1966 87187 136824
1967 90918 145681
1968 98794 156611
1969 105812 170400
1970 108352 178594
1971 117023 188991
1972 131227 203227
1973 153881 234406
1974 178201 287144
1975 182412 288992
1976 204386 318345
1977 229786 350706
1978 260755 400929
1979 298328 452636
1980 328112 510124
1981 356909 547169
1982 348771 575486
1983 370501 591858
1984 411427 651527
1985 423940 665837
1986 431786 664654
1987 459107 711745
1988 496334 767387
1989 522344 813018
1990 540788 835985
1991 533838 828184
---------------------------------------------
Sales : Doanh Số của ngành công nghiệp (triệu $ )
Inventories : Giá trị tồn kho của ngành công nghiệp (triệu $ )
Yêu cầu :
a.Thực hiện một mô hình đơn giản xác định rằng số sales là một hàm tuyến tính theo Inventories.
Dependent Variable: SALES
Method: Least Squares
Date: 05/16/10 Time: 15:23
Sample: 1950 1991
Included observations: 42
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-911.6914
1165.337
-0.782342
0.4386
INVENTORIES
0.642845
0.002889
222.5282
0.0000
R-squared
0.999193
Mean dependent var
199479.4
Adjusted R-squared
0.999173
S.D. dependent var
166654.0
S.E. of regression
4793.439
Akaike info criterion
19.83433
Sum squared resid
9.19E+08
Schwarz criterion
19.91708
Log likelihood
-414.5210
F-statistic
49518.79
Durbin-Watson stat
1.374931
Prob(F-statistic)
0.000000
SALES = -911.691393 + 0.6428449796*INVENTORIES
b.Vẽ đồ thị phần dư của mô hình hồi qui ở câu a theo Inventories. Dựa vào đồ thị trên anh chị có ý kiến gì vế tương quan chuỗi ?
c. Hãy trình bày kiểm định Durbin – Watson xem phần dư của phương trình trên có tương quan chuỗi bậc nhất hay không ?
Giả thiết: Ho: p =0
H1: p # 0
Theo kết quả chạy hồi qui ở câu a ta có: d = 1.374931
với mức ý nghĩa 5%, tra bảng Durbin – Watson với n = 40, k=1 ta có:
dL = 1.442
dU = 1.544
d < dL à bác bỏ Ho, tức là có hiẹn tượng tự tương quan chuỗi bậc nhất
d. Hãy giải thích các hậu quả của tương quan chuổi bậc nhất với hàm ước lượng OLS . Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên nếu có ?
Hậu quả của tương quan chuỗi bậc nhất với hàm ước lượng OLS :
- phương sai ước lượng được của các ước lượng bình phương bé nhất thông thường là không chệch.
- kiểm định t và F nói chung không đáng tin cậy.
- Kết quả là R2 được tính toán như đã biết có thể là đo lượng không đáng tin cậy cho R2 thực.
- cho các phương sai và các sai số chuẩn của dự toán đã tính được cũng có thể không hiệu quả.
Đề nghị giải pháp khắc phục tương quan chuỗi trong phép hồi qui nói trên:
Khi cấu trúc tự tương quan là đã biết vì các nhiễu của các Ut không quan sát được nên tính chất của tương quan chuổi thường là vấn đề suy đoán hoặc là do những đồi hỏi cấp bách của thực tiển.trong thực hành người ta thường sử dụng mô hình tự hồi quy bậc nhất
Khi cấu trúc tự tương quan là chưa biết thì ta sử dụng phương pháp sai phân cấp 1,ước lượng p dựa theo thống kê d_Durbin_Watson, thủ tục Cochrane_Orcutt để ước lượng p, thủ tục Cochrane_Orcutt 2 bước để ước lượng p, phương pháp d_Durbin_Watson 2 bước để ước lương p và các
Kkhắc phục
Ước lượng p dựa trên thống kê Durbin – Watson
p^= 1 - d/2 = 1 - 1.374931/2 = 1 - 0.6874655 = 0.3125345
Phương trình hồi qui SALES phụ thuộc vào INVENTORIES:
SALES = b`1 + b`2*INVENTORIES + et
Với b`1 = b1*(1-p) = -911.691393*(1-0.3125345) = -626.7563793
b`2 = b2 = 0.6428449796
Hay : SALES = -626.7563793 + 0.6428449796* INVENTORIES
Bài Tập 10 :
Một quan sát thú vị về việc thuê bao truyền hình cáp , người ta đưa ra những dữ liệu sau đây :
AGE
AIR
HOME
INST
SUB
SVC
TV
Y
11.83
13
350
14.95
105
10
16
9839
11.42
11
255.631
15
90
7.5
15
10606
7.33
9
31
15
14
7
11
10455
6.92
10
34.84
10
11.7
7
22
8958
26
12
153.434
25
46
10
20
11741
8.83
8
26.621
15
11.217
7.66
18
9378
13.08
8
18
15
12
7.5
12
10433
5.58
7
9.324
15
6.428
7
17
10167
12.42
8
32
10
20.1
5.6
10
9218
4.92
6
28
15
8.5
6.5
6
10519
4.08
6
8
17.5
1.6
7.5
8
10025
4.25
9
5
15
1.1
8.95
9
9714
10.67
7
15.204
10
4.355
7
7
9294
17.58
7
97.889
24.95
78.91
9.49
12
9784
8.08
7
93
20
19.6
7.5
9
8173
0.17
6
3
9.95
1
10
13
8967
13.25
5
2.6
25
1.65
7.55
6
10133
12.67
5
18.284
15.5
13.4
6.3
11
9361
5.25
6
55
15
18.708
7
16
9085
15
6
1.7
20
1.352
5.6
6
10067
17
5
270
15
170
8.75
15
8908
6.83
6
46.54
15
15.388
8.73
9
9632
5.67
6
20.417
5.95
6.555
5.95
10
8995
7
5
120
25
40
6.5
10
7787
11.25
7
46.39
15
19.9
7.5
9
8890
2.92
4
14.5
9.95
2.45
6.25
6
8041
2.17
5
9.5
20
3.762
6.5
6
8605
7.08
4
81.98
18
24.882
7.5
8
8639
12.17
4
39.7
20
21.187
6
9
8781
13.08
4
4.113
10
3.487
6.85
11
8551
0.17
6
8
10
3
7.95
9
9306
7.67
5
99.75
9.95
42.1
5.73
8
8346
10.33
4
33.379
15
20.35
7.5
8
8803
12.25
5
35.5
17.5
23.15
6.5
8
8942
2
4
34.775
15
9.866
8.25
11
8591
13.08
6
64.84
10
42.608
6
11
9163
1
6
30.556
20
10.371
7.5
8
7683
4
5
16.5
14.95
5.164
6.95
8
7924
4.67
4
70.515
9.95
31.15
7
10
8454
3
4
42.04
20
18.35
7
6
8429
Trong đó:
SUB : số đăng ký thuê bao được yêu cầu lắp đặt cho mỗi hệ thống cáp truyền hình
Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua
Inst : phí lắp đặt ( USD/Lần)
SVC : Phí dịch vụ cho mỗi hệ thống (USD/tháng )
TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp )
Age : thời gian hệ thống đã họat động ( năm )
Air : số kêng truyền hình mà hệ thống nhận được từ hệ thống cáp
Y : thu nhập bình quân đầu người (USD/ người )
Hãy phân tích quan hệ kỳ vọng của số đăng ký thuê bao (SUB) với các nhân tố ảnh hưởng có sẳn trong dữ liệu ?
Dependent Variable: SUB
Method: Least Squares
Date: 05/25/10 Time: 13:22
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-6.807726
26.65981
-0.255355
0.8001
AGE
1.193511
0.502651
2.374434
0.0237
AIR
-5.111142
1.518459
-3.366005
0.0020
HOME
0.405549
0.035003
11.58599
0.0000
INST
-0.526420
0.476074
-1.105751
0.2771
SVC
2.038732
2.126968
0.958516
0.3450
TV
0.756508
0.687811
1.099877
0.2796
Y
0.001655
0.003469
0.477101
0.6365
R-squared
0.887748
Mean dependent var
24.50850
Adjusted R-squared
0.863193
S.D. dependent var
33.53720
S.E. of regression
12.40453
Akaike info criterion
8.050857
Sum squared resid
4923.914
Schwarz criterion
8.388633
Log likelihood
-153.0171
F-statistic
36.15343
Durbin-Watson stat
2.182694
Prob(F-statistic)
0.000000
SUB = -6.807725633 + 1.193511207*AGE - 5.111142311*AIR + 0.40554886*HOME - 0.5264195572*INST + 2.038732364*SVC + 0.7565077307*TV + 0.001655168974*Y
Phân tích quan hệ kỳ vọng của số đăng ký thuê bao: Trong điều kiện các yếu tố khác không thay đổi:
+ Age: khi thời gian hoạt động của hệ thống tăng thêm 1 năm thì về trung bình sẽ tăng thêm 1.19 số thuê bao
+ Air: số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình sẽ giảm 5.1 thuê bao
+ Home : số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình sẽ tăng thêm 0.4 thuê bao
+ Inst : phí lắp đặt ( USD/Lần) giảm 1 USD/Lần thì về trung bình sẽ tăng thêm 0.526 thuê bao
+ SVC: Phí dịch vụ cho mỗi hệ thống (USD/tháng ) tăng thêm 1 USD/tháng thì về trung bình sẽ tăng thêm 2.039 thuê bao
+ TV : số kênh truyền hình mà mỗi hệ thống cáp cung cấp (kênh /hệ thống cáp ) tăng thêm 1 kênh thì về trung bình sẽ tăng thêm 0.756 thuê bao
+ Y : thu nhập bình quân đầu người (USD/ người ) tăng thêm 1 USD/Người thì về trung bình sẽ tăng thêm được 0.00165 thuê bao.
Có ý kiến cho rằng mô hình ở câu 1 cần phải bổ sung thêm các biến độc lập là bình phương các biến độc lập . Anh chị cần có kiểm định nào để chấp nhận ý kiến nầy ?
+ ước lượng mô hình với các biến bổ sung:
Dependent Variable: SUB
Method: Least Squares
Date: 05/25/10 Time: 13:31
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-488.2440
264.2862
-1.847406
0.0766
AGE
-1.357140
1.462274
-0.928102
0.3622
AGE2_MU
0.139275
0.073366
1.898355
0.0693
AIR
18.71175
5.239156
3.571519
0.0015
AIR2_MU
-1.582278
0.373179
-4.239994
0.0003
HOME
0.439400
0.083881
5.238396
0.0000
HOME2_MU
0.000221
0.000284
0.777523
0.4441
INST
0.391969
2.124189
0.184526
0.8551
INST2_MU
-0.021041
0.065512
-0.321175
0.7507
SVC
12.14427
19.19417
0.632706
0.5327
SVC2_MU
-0.778979
1.285439
-0.606002
0.5500
TV
-0.661471
2.654203
-0.249216
0.8052
TV2_MU
0.048444
0.101687
0.476402
0.6379
Y
0.084534
0.052575
1.607864
0.1204
Y2_MU
-4.55E-06
2.83E-06
-1.603944
0.1213
R-squared
0.949466
Mean dependent var
24.50850
Adjusted R-squared
0.921167
S.D. dependent var
33.53720
S.E. of regression
9.416297
Akaike info criterion
7.602757
Sum squared resid
2216.666
Schwarz criterion
8.236087
Log likelihood
-137.0551
F-statistic
33.55130
Durbin-Watson stat
2.246892
Prob(F-statistic)
0.000000
Kiểm định WALD:
giả thiết: Ho: R2 = 0
H1: R2 # 0
Wald Test:
Equation: Untitled
Test Statistic
Value
df
Probability
F-statistic
4.336042
(7, 25)
0.0029
Chi-square
30.35229
7
0.0001
Null Hypothesis Summary:
Normalized Restriction (= 0)
Value
Std. Err.
C(3)
0.139275
0.073366
C(5)
-1.582278
0.373179
C(7)
0.000221
0.000284
C(8)
0.391969
2.124189
C(11)
-0.778979
1.285439
C(13)
0.048444
0.101687
C(15)
-4.55E-06
2.83E-06
Restrictions are linear in coefficients.
Theo kết quả của bảng trên: F(7;25)= 3.5 < 4.336042; 0.0029<0.1 ---à bác bỏ giả thiết Ho: R2=0. tức là mô hình có ý nghĩa thống kê, hay các biến đưa vào mô hình có biến ảnh hưởng đến biến phụ thuộc SUB.
Thực hiện ước lượng theo yêu cầu của câu 2 . Nhận xét mô hình nầy và căn cứ vào đó tìm ra mô hình tốt nhất bằng cách lọai bỏ các biến độc lập ít có ý nghĩa.
Dependent Variable: SUB
Method: Least Squares
Date: 05/25/10 Time: 13:38
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-488.2440
264.2862
-1.847406
0.0766
AGE
-1.357140
1.462274
-0.928102
0.3622
AGE2_MU
0.139275
0.073366
1.898355
0.0693
AIR
18.71175
5.239156
3.571519
0.0015
AIR2_MU
-1.582278
0.373179
-4.239994
0.0003
HOME
0.439400
0.083881
5.238396
0.0000
HOME2_MU
0.000221
0.000284
0.777523
0.4441
INST
0.391969
2.124189
0.184526
0.8551
INST2_MU
-0.021041
0.065512
-0.321175
0.7507
SVC
12.14427
19.19417
0.632706
0.5327
SVC2_MU
-0.778979
1.285439
-0.606002
0.5500
TV
-0.661471
2.654203
-0.249216
0.8052
TV2_MU
0.048444
0.101687
0.476402
0.6379
Y
0.084534
0.052575
1.607864
0.1204
Y2_MU
-4.55E-06
2.83E-06
-1.603944
0.1213
R-squared
0.949466
Mean dependent var
24.50850
Adjusted R-squared
0.921167
S.D. dependent var
33.53720
S.E. of regression
9.416297
Akaike info criterion
7.602757
Sum squared resid
2216.666
Schwarz criterion
8.236087
Log likelihood
-137.0551
F-statistic
33.55130
Durbin-Watson stat
2.246892
Prob(F-statistic)
0.000000
SUB = -488.2440184 - 1.357139585*AGE + 0.1392753913*AGE2_MU + 18.71174637*AIR - 1.582278197*AIR2_MU + 0.4394004589*HOME + 0.0002207113314*HOME2_MU + 0.3919688673*INST - 0.0210408497*INST2_MU + 12.14426735*SVC - 0.7789787661*SVC2_MU - 0.6614709744*TV + 0.04844376526*TV2_MU + 0.0845340609*Y - 4.546508689e-006*Y2_MU
Nhận xét:
Ta thấy Prob của một số biến đưa vào mô hình lớn hơn mức ý nghĩa 10%, điều này chứng tỏ một số biến đưa vào mô hình không có tác động gì đến SUB
R2 = 0.949466 cao, trị thống kê thấp do đó xảy ra hiện tượng đa cộng tuyến.
Ước lượng lại mô hình bằng cách loại bỏ những biến ít có ý nghĩa:
Dependent Variable: SUB
Method: Least Squares
Date: 05/25/10 Time: 14:50
Sample: 1 40
Included observations: 40
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
-60.49268
16.26712
-3.718709
0.0007
AGE2_MU
0.054963
0.014206
3.868916
0.0005
AIR
19.00283
4.529471
4.195376
0.0002
AIR2_MU
-1.551656
0.306301
-5.065791
0.0000
HOME
0.496449
0.028582
17.36914
0.0000
R-squared
0.924209
Mean dependent var
24.50850
Adjusted R-squared
0.915547
S.D. dependent var
33.53720
S.E. of regression
9.746190
Akaike info criterion
7.508098
Sum squared resid
3324.587
Schwarz criterion
7.719208
Log likelihood
-145.1620
F-statistic
106.6985
Durbin-Watson stat
2.585383
Prob(F-statistic)
0.000000
SUB = -60.49268428 + 0.05496300001*AGE2_MU + 19.00283309*AIR - 1.551655918*AIR2_MU + 0.4964486269*HOME
Phương trình sau cùng mà anh chị lựa chọn như thế nào ? giải thích ý nghĩa ?
Phương trình sau cùng bao gồm các biến: HOME, AIR và bình phương của AIR, AGE.
+ Prob của một số biến đưa vào mô hình nhỏ hơn mức ý nghĩa 10%, điều này chứng tỏ các biến đưa vào mô hình đều có tác động gì đến SUB
+ R2=0.924209 được đánh giá là tốt vìcác biến đưa vào mô hình giải thích được 92.4% biến SUB.
+ Age: Trong điều kiện các yếu tố khác không thay đổi khi bình phương thời gian hoạt động của hệ thống tăng thêm 1 năm thì trung bình số đăng kí thuê bao sẽ tăng thêm 0.055 số thuê bao
+ Air: Trong điều kiện các yếu tố khác không thay đổi khi số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ tăng thêm 19 thuê bao
+ Trong điều kiện các yếu tố khác không thay đổi khi bình phương số kênh truyền hình mà hệ thống nhận được từ hệ thống cáp tăng thêm 1 kênh thì về trung bình số đăng kí thuê bao sẽ gi ảm 1.55 thuê bao.
+ Home : Trong điều kiện các yếu tố khác không thay đổi khi số hộ gia đình mà mỗi hệ thống cáp truyền hình đi ngang qua tăng thêm 1 hộ thì về trung bình số đăng kí thuê bao sẽ tăng thêm 0.5 thuê bao
Các file đính kèm theo tài liệu này:
- Bài tập Kinh tế lượng (3).doc