Tài liệu Bài giảng Kinh tế lượng - Chương 2: Mô hình hồi qui hai biến (Khoảng tin cậy, r, R2 và kiểm định hệ số hồi quy) - Phạm Văn Minh: Chương 2
(tt)
MÔ HÌNH HỒI QUI HAI BIẾN
Khoảng tin cậy, r, R2 và
Kiểm định hệ số hồi quy
1
Phạm Văn Minh biên soạn
NỘI DUNG
1. Hệ số xác định R2
2. Hệ số tương quan (r)
3. Tính chất của hệ số tương quan
4. Phân phối xác suất của các ước lượng
5. Khoảng tin cậy của β1, β2 và σ2
6. Kiểm định giả thiết về các hệ số hồi qui
2
Phạm Văn Minh biên soạn
1. Hệ số xác định R2
3
Hàm hồi quy đặt ra nhằm xem xét biến phụ thuộc chịu ảnh
hưởng của biến độc lập như thế nào. Tuy nhiên, bên cạnh
biến độc lập, còn nhiều yếu tố khác cũng ảnh hưởng.
Một hàm hồi quy được coi là thực sự phù hợp khi biến độc
lập có ảnh hưởng thực sự đáng kể, ảnh hưởng một cách có
ý nghĩa khi so sánh với các yếu tố ngẫu nhiên khác. Bên
cạnh đó, với cùng một biến độc lập nhưng nếu dạng hàm
khác nhau thì mức độ ảnh hưởng cũng khác nhau.
Đại lượng để đo mức độ ảnh hưởng làm tương quan so
sánh với yếu tố ngẫu nhiên thì gọi là độ phù hợp của hàm
hồi quy. Đó chính là R2, hệ số xác định (Coefficient ...
29 trang |
Chia sẻ: putihuynh11 | Lượt xem: 991 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Bài giảng Kinh tế lượng - Chương 2: Mô hình hồi qui hai biến (Khoảng tin cậy, r, R2 và kiểm định hệ số hồi quy) - Phạm Văn Minh, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Chương 2
(tt)
MÔ HÌNH HỒI QUI HAI BIẾN
Khoảng tin cậy, r, R2 và
Kiểm định hệ số hồi quy
1
Phạm Văn Minh biên soạn
NỘI DUNG
1. Hệ số xác định R2
2. Hệ số tương quan (r)
3. Tính chất của hệ số tương quan
4. Phân phối xác suất của các ước lượng
5. Khoảng tin cậy của β1, β2 và σ2
6. Kiểm định giả thiết về các hệ số hồi qui
2
Phạm Văn Minh biên soạn
1. Hệ số xác định R2
3
Hàm hồi quy đặt ra nhằm xem xét biến phụ thuộc chịu ảnh
hưởng của biến độc lập như thế nào. Tuy nhiên, bên cạnh
biến độc lập, còn nhiều yếu tố khác cũng ảnh hưởng.
Một hàm hồi quy được coi là thực sự phù hợp khi biến độc
lập có ảnh hưởng thực sự đáng kể, ảnh hưởng một cách có
ý nghĩa khi so sánh với các yếu tố ngẫu nhiên khác. Bên
cạnh đó, với cùng một biến độc lập nhưng nếu dạng hàm
khác nhau thì mức độ ảnh hưởng cũng khác nhau.
Đại lượng để đo mức độ ảnh hưởng làm tương quan so
sánh với yếu tố ngẫu nhiên thì gọi là độ phù hợp của hàm
hồi quy. Đó chính là R2, hệ số xác định (Coefficient of
Determination)
Hệ số xác định R2 – Đại lượng đo “sự thích hợp”
(Goodness-of-fit)
Nếu tất cả các quan sát đều nằm trên đường hồi qui thì
sự thích hợp là “hoàn hảo”. Tuy nhiên, trường hợp này
rất hiếm. Điều chúng ta hy vọng là những phần dư xung
quanh đường hồi qui này càng nhỏ càng tốt.
Hệ số xác định r2 (trường hợp hai biến) hay R2 (trường
hợp đa biến) là đại lượng cho ta biết rằng đường hồi qui
mẫu thích hợp như thế nào đối với dữ liệu. (?)
Phương pháp đồ thị Venn, hay là Ballentine
Vòng tròn Y tượng trưng cho biến thiên trong biến phụ thuộc Y
Vòng tròn X tượng trưng cho biến thiên trong biến giải thích X
4
1. Hệ số xác định R2 (tt)
5Hệ số xác định R2 – Đại lượng đo “sự thích hợp”
(Goodness-of-fit)
1. Hệ số xác định R2 (tt)
Quan điểm Ballentine đối với R2: (a) R2 = 0; (f) R2 = 1.
Thước đo độ phù hợp của mô
hình đối với dữ liệu mẫu là R2
SRF
ii yYY ˆˆ =−
iii eYY =− ˆ
ii yYY =−
(TSS)
(RSS)
(ESS) i
Yˆ
Y
X
iY
Y
TSS = RSS + ESS
1. Hệ số xác định R2 (tt)
7TSS (Total Sum of Squares): Tổng bình phương tất cả các
sai lệch giữa các giá trị quan sát Yi với giá trị trung bình của
chúng.
ESS (Explained Sum of Squares): Tổng bình phương tất cả
các sai lệch giữa giá trị của biến Y tính theo MHHQ mẫu với
giá trị trung bình của chúng. (Đo độ chính xác của hàm HQ)
RSS (Residual Sum of Squares): Tổng bình phương tất cả
các sai lệch giữa các giá trị quan sát (giá trị thực tế) của biến
Y với các giá trị nhận được (giá trị lí thuyết) từ hàm HQ mẫu.
( )22 2( ) .iiTSS Y Y Y n Y= − = −∑ ∑
( ) ( )( )2 22 22ˆˆ(Y ) .iiESS Y X n Xβ= − = −∑ ∑
( )22 ˆYi i iRSS e Y= = −∑ ∑
1. Hệ số xác định R2 (tt)
∑∑
=
=
−=−==
n
i
i
n
i
i
y
e
TSS
RSS
TSS
ESSR
1
2
1
2
2 11
∑
∑
=
=
=
n
i
i
n
i
i
y
x
R
1
2
1
22
2
2
ˆβ
Với MHHQ 2 biến, người ta chứng minh được:
với
XXx ii −=
YYy ii −=
1. Hệ số xác định R2 (tt)
9 Có thể nói R2 phản ánh tỷ lệ mô hình lý thuyết
phản ánh thực tế.
Tính chất của R2 : 0 ≤ R2 ≤ 1
R2 = 0: thể hiện X và Y độc lập thống kê.
R2 = 1: đường hồi quy phù hợp hoàn hảo, nghĩa là
tất cả các sai lệch của Y so với giá trị trung bình
đều giải thích được bởi mô hình hồi quy.
Ví dụ: R2 = 0,95: có nghĩa biến độc lập X giải thích 95%
sự thay đổi của biến phụ thuộc Y. Trong trường hợp này,
mức độ phù hợp của SRF với tập dữ liệu mẫu là khá cao.
1. Hệ số xác định R2 (tt)
Phạm Văn Minh biên soạn
2. Hệ số tương quan (r)
10
Hệ số tương quan r: Hệ số tương quan r đo
lường mức độ phụ thuộc tuyến tính giữa 2 đại
lượng (hay biến) X và Y.
∑∑
∑
==
=
=
n
i
i
n
i
i
n
i
ii
xy
xy
r
1
2
1
2
1
Lưu ý:
r không có ý
nghĩa để mô
tả quan hệ
phi tuyến.
Phạm Văn Minh biên soạn
3. Tính chất của hệ số tương quan
11
r > 0: giữa X và Y có quan hệ đồng biến.
r ± 1: X và Y có quan hệ tuyến tính chặt chẽ.
r 0: X và Y có quan hệ tuyến tính không chặt chẽ.
r < 0: X và Y có quan hệ nghịch biến.
Hệ số tương quan có tính chất đối xứng: rXY = rYX
rXY cùng dấu với .
r độc lập với gốc toạ độ và các tỷ lệ, nghĩa là: với
a, c > 0, b, d là hằng số, và:
dcYYbaXX iiii +=+=
** & thì : rXY = rX*Y*
rXY = ± R
VD:
Với R2 = 0,81 r = ± 0,9 = 0,9
2
,
1
2
1
2
2
12
YXn
i
i
n
i
i
n
i
ii
r
yx
yx
R =
=
∑∑
∑
==
=
Nếu X, Y độc lập theo quan điểm thống kê thì hệ
số tương quan giữa chúng bằng 0.
r chỉ là đại lượng đo sự kết hợp tuyến tính hay
phụ thuộc tuyến tính. r không có ý nghĩa để mô tả
quan hệ phi tuyến.
ii XY 75,025,6ˆ +=
3. Tính chất của hệ số tương quan (tt)
4. Phân phối xác suất của các
ước lượng
13
Giả thiết 6: ui có phân phối N(0, δ2)
Với giả thiết nêu trên, các ước lượng
có các tính chất sau:
- Chúng là các ước lượng không chệch.
- Có phương sai cực tiểu.
- Khi số quan sát đủ lớn thì các ước lượng
này xấp xỉ với giá trị thực của phân phối.
2
21
ˆ
,
ˆ
,
ˆ δββ
),(~ˆ 21ˆ11 βδββ N ),(~ˆ 2 2ˆ22 βδββ N
Phạm Văn Minh biên soạn
5. Khoảng tin cậy của β1, β2 và σ2
14
Có 2 loại ước lượng:
Ước lượng điểm của một tham số tổng thể là
cách thức tính toán một giá trị đơn lẻ của tham số
tổng thể dựa trên dữ liệu mẫu.
Ước lượng khoảng của một tham số tổng thể
là cách thức tính toán 2 giá trị dựa trên dữ liệu
mẫu, từ đó tạo nên một khoảng được kỳ vọng
chứa tham số thống kê của tổng thể.
Ước lượng các tham số thống kê của tổng thể
Phạm Văn Minh biên soạn
5. Khoảng tin cậy của β1, β2 và σ2
Ước lượng (theo) khoảng
15
Ước lượng khoảng được xây dựng để cho khi lấy mẫu lặp
lại nhiều lần thì một tỷ lệ lớn các khoảng này sẽ bao quanh
tham số tổng thể mà chúng ta đang quan tâm. Tỷ lệ này là hệ
số tin cậy (confidence coefficient). Khoảng được tạo ra được
gọi là khoảng tin cậy (confidence interval).
Một khoảng tin cậy mẫu lớn với hệ số tin cậy (1-α)*100%
dựa trên một ước lượng không bị lệch (không chệch) có phân
phối chuẩn được tính như sau:
Ước lượng điểm ± tα/2 * Sai số chuẩn của ước lượng
(giới hạn tin cậy dưới, giới hạn tin cậy trên)
Phạm Văn Minh biên soạn
5. Khoảng tin cậy của β1, β2 và σ2
Ước lượng khoảng
16
Thông thường thể hiện khoảng tin cậy 95%. Có nghĩa:
Nếu lấy mẫu và phân tích được lặp đi lặp lại trong cùng
một điều kiện (cho ra bộ dữ liệu khác nhau), khoảng cách
giữa hai giá trị sẽ bao gồm giá trị thật (tổng thể) đạt 95%
giá trị trong tổng số các trường hợp có thể xảy ra.
Phạm Văn Minh biên soạn
5. Khoảng tin cậy của β1, β2
17
Ước lượng khoảng cho hệ số hồi quy với mức
ý nghĩa α như sau
)ˆ;ˆ( iiiii εβεββ +−∈ )ˆ()2/,2( ini Set βε α−=
Trong đó:
1 – α được gọi là độ tin cậy.
ε (>0) được gọi là độ chính xác của ước lượng.
là giới hạn tin cậy dưới.
là giới hạn tin cậy trên.
ii εβ −ˆ
ii εβ +ˆ
5. Khoảng tin cậy của β1, β2 (tt)
Với độ tin cậy 1−α, ta có
( )1 / 2 / 21 1 1 1. ( ); . ( )t se t seα αβ β β β β∈ − +
( )2 / 2 / 22 2 2 2. ( ); . ( )t se t seα αβ β β β β∈ − +
Trong đó tα/2 là giá trị của đại lượng ngẫu nhiên
T phân phối theo quy luật Student với (n – 2)
bậc tự do sao cho. ( )/ 2P T tα α> =
( )/ 2 1 / 21 1 1 1. ( ) . ( ) 1P t se t seα αβ β β β β α− ≤ ≤ + = −
( )/ 2 2 / 22 2 2 2. ( ) . ( ) 1P t se t seα αβ β β β β α− ≤ ≤ + = −
Để tim tα/2 , ta tra bảng (xem Phụ lục 2, tr.315 SGK)
hoặc dùng hàm TINV(α,df) trong Excel.
Ví dụ: Sử dụng số liệu VD2: với độ tin cậy 95%.
Tìm khoảng tin cậy của β1 , β2
Với độ tin cậy 95% tra bảng trang 315:
Vậy khoảng tin cậy của β1 là
hay
Vậy khoảng tin cậy của β2 là
hay
( 2, /2) (8;0,025) 2,306nt tα− = =
24,453 2,306 6,4109± ×
19,6695 39,2365β< <
0,5091 2,306 0,03572± ×
20,4267 0,5915β< <
Ý nghĩa: Trong điều kiện các yếu tố khác không
thay đổi, khi thu nhập tăng 1$/tuần thì chi tiêu tiêu
dùng trung bình của một gia đình tăng trong khoảng
từ 0,4267 đến 0,5914 $/tuần.
5. Khoảng tin cậy của β1, β2 (tt)
Excel:
=TINV(0.05,8)
5. Khoảng tin cậy của β1, β2 và σ2 (tt)
Phân phối
Student
21
Đối với σ2, ta có ước lượng khoảng:
2 2
2
2 2
/ 2 1 / 2
( 2 ) ( 2 )
;
n n
α α
σ σ
σ
χ χ
−
− − ∈
với xác suất
2 2
2
2 2
/ 2 1 / 2
( 2 ) ( 2 )
1
n n
P
α α
σ σ
σ α
χ χ
−
− − ≤ ≤ = −
trong đó là các giá trị của đại lượng
ngẫu nhiên phân phối theo quy luật “khi bình
phương” (hay “chi bình phương”) với n – 2 bậc tự
do, thỏa mãn điều kiện
α αχ χ −2 2/2 1 /2,
2χ
2 2
/ 2( ) / 2P αχ χ α> =
2 2
1 / 2( ) 1 / 2P αχ χ α−> = −
5. Khoảng tin cậy của σ2
Để tìm các giá trị này, ta tra bảng hoặc dùng hàm
CHIINV trong Excel.
6. Kiểm định giả thiết về các hệ số hồi qui
22
Trong thống kê, giả thiết phát biểu cần được kiểm định được gọi
là giả thiết không (H0). Giả thiết đối được ký hiệu là giả thiết H1.
Chú ý
Khi nói “chấp nhận giả thiết H0”, không có nghĩa H0 đúng mà
là “không có cơ sở để bác bỏ H0”.
Lựa chọn mức ý nghĩa α: α có thể tùy chọn, thường người ta
chọn mức 1%, 5%, hoặc 10%.
Các giả thiết cần kiểm định gồm:
Các giả thiết về hệ số hồi quy
Các giả thiết về phương sai của Ui
Các giả thiết về sự phù hợp của mô hình
Các cách kiểm định cơ bản:
Phương pháp kiểm định t (Student's t-test)
Phương pháp khoảng tin cậy
Phương pháp p-value (dùng máy vi tính)
6. Kiểm định giả thiết đối với β1, β2 (tt)
23
Ta có thể kiểm định giả thiết nào đó về β1 với mức ý
nghĩa α cho trước. Ta có bảng tóm tắt sau đây:
với là giá trị kiểm định.
*
11
1( )
t
se
β β
β
−
=
Lưu ý. Nếu đưa ra giả thiết thì điều này có nghĩa
là đưa ra giả thiết biến độc lập X không ảnh hưởng đến biến
phụ thuộc Y.
Tương tự cho β2
*
2 2 0β β= =
6. Kiểm định giả thiết đối với β1, β2 (tt)
Kiểm đinh t
24
Giả thuyết không:
Giả thuyết đối:
CÁCH 1
Bước 1: Tính giá trị
Bước 2: Tra bảng t-student tìm
Bước 3: Quy tắc ra quyết định
Nếu bác bỏ H0
Nếu không có cơ sở bác bỏ H0
*
0
*
1
:
:
ii
i i
H
H
β β
β β
=
≠
*
ˆ
ˆ( )
i i
i
i
t
s e
β β
β
−
=
)2/,2( α−> ntt
)2/,2( α−≤ ntt
( 2, /2)nt α−
Phân phối Student
6. Kiểm định giả thiết đối với β1, β2 (tt)
Kiểm đinh t
-4 -3 -2 -1 0 1 2 3 4
t
f(t)
α/2α/2
tα/2-tα/2
Miền
tới hạn
Miền
tới hạn
Kiểm định
Giả thiết H0: β2 = 0
(thu nhập không ảnh hưởng đến chi tiêu)
Giả thiết H1: β2 ≠ 0
(thu nhập có ảnh hưởng đến chi tiêu)
Ví dụ: Với mức ý nghĩa 5% (α=0,05), thu nhập
có ảnh hưởng đến chi tiêu không?
6. Kiểm định giả thiết đối với β1, β2 (tt)
Kiểm đinh t, Ví dụ
2 2
ˆ ˆ0,5091; ( ) 0,03572seβ β= =
0,5091 0 14,2525
0,03572
t
−
= =
Với mức ý nghĩa α = 5% và bậc tự do là n – 2 = 8
thì t(n-2;α/2) = 2,306
( 2, /2)nt t α−> ⇒ Bác bỏ giả thiết H0
Ý nghĩa: biến thu nhập thực sự có ảnh hưởng
đến chi tiêu.
6. Kiểm định giả thiết đối với β1, β2 (tt)
Kiểm đinh t, Ví dụ (tt)
Ta có:
Tính t:
6. Kiểm định giả thiết đối với β1, β2 (tt)
Kiểm đinh bằng khoảng tin cậy
28
CÁCH 2: Phương pháp khoảng tin cậy
Giả sử ta tìm được khoảng tin cậy của βi là:
,
với mức ý nghĩa α trùng với mức ý nghĩa của giả
thiết H0
Quy tắc quyết định
- Nếu “chấp nhận” H0
- Nếu bác bỏ H0
)ˆ;ˆ( iiiii εβεββ +−∈ )ˆ()2/,2( ini Set βε α−=
)ˆ;ˆ(* iiiii εβεββ +−∈
)ˆ;ˆ(* iiiii εβεββ +−∉
6. Kiểm định giả thiết đối với β1, β2 (tt)
Kiểm đinh bằng P-value
29
CÁCH 3: Phương pháp P-value
Tính
Quy tắc quyết định
- Nếu p ≤ α : Bác bỏ H0
- Nếu p > α : “chấp nhận” H0
(Phương pháp này thường dùng khi tiến hành
trên máy vi tính)
)ˆ(
ˆ *
i
ii
i Se
t β
ββ −
=
ptTP i => )(
Các file đính kèm theo tài liệu này:
- bai_giang_kinh_te_luong_t3_mhhq2b_ktc_r_r2_kiem_dinh_5741_1985299.pdf