Tài liệu Bài giảng Phương pháp box-Jenkins: KHOA KINH TẾ DỰ BÁO TRONG KINH DOANH BUSINESS FORECASTING Chương 7. PHƯƠNG PHÁP BOX-JENKINS (AutoRegressive Integrated Moving Average - ARIMA) Phương pháp Box-Jenkins Các mơ hình tự hồi qui (AR) Các mơ hình trung bình động (MA) Các mơ hình hồi qui và trung bình động (ARMA) Xây dựng mơ hình Box-Jenkins Các tiêu chí chọn lựa mơ hình San bằng số mũ đơn giản và mơ hình ARIMA Ưu và nhược điểm của các mơ hình ARIMA 1. Phương pháp Box-Jenkins Phương pháp luận dự báo theo mơ hình Box-Jenkins khác với nhiều mơ hình khác, vì khơng cần giả định bất kỳ một mơ hình cụ thể nào cho dữ liệu chuỗi thời gian cần dự báo. Phương pháp này lần lượt thử các mơ hình khác nhau cho đến khi tìm được mơ hình phù hợp. Mơ hình được cho là phù hợp nếu như phần dư là nhỏ nhất, phân phối ngẫu nhiên và độc lập lẫn nhau. 1. Phương pháp Box-Jenkins Yes No Xác định loại mơ hình tổng thể Chọn mơ hình để kiểm định thực nghiệm Ước lượng tham số khi kiểm định thực nghiệm Kiểm định mơ hình (phù hợp hay khơng?) Sử dụng mơ h...
34 trang |
Chia sẻ: haohao | Lượt xem: 2413 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu Bài giảng Phương pháp box-Jenkins, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
KHOA KINH TẾ DỰ BÁO TRONG KINH DOANH BUSINESS FORECASTING Chương 7. PHƯƠNG PHÁP BOX-JENKINS (AutoRegressive Integrated Moving Average - ARIMA) Phương pháp Box-Jenkins Các mơ hình tự hồi qui (AR) Các mơ hình trung bình động (MA) Các mơ hình hồi qui và trung bình động (ARMA) Xây dựng mơ hình Box-Jenkins Các tiêu chí chọn lựa mơ hình San bằng số mũ đơn giản và mơ hình ARIMA Ưu và nhược điểm của các mơ hình ARIMA 1. Phương pháp Box-Jenkins Phương pháp luận dự báo theo mơ hình Box-Jenkins khác với nhiều mơ hình khác, vì khơng cần giả định bất kỳ một mơ hình cụ thể nào cho dữ liệu chuỗi thời gian cần dự báo. Phương pháp này lần lượt thử các mơ hình khác nhau cho đến khi tìm được mơ hình phù hợp. Mơ hình được cho là phù hợp nếu như phần dư là nhỏ nhất, phân phối ngẫu nhiên và độc lập lẫn nhau. 1. Phương pháp Box-Jenkins Yes No Xác định loại mơ hình tổng thể Chọn mơ hình để kiểm định thực nghiệm Ước lượng tham số khi kiểm định thực nghiệm Kiểm định mơ hình (phù hợp hay khơng?) Sử dụng mơ hình để dự báo Hình 7.1. Sơ đồ chiến lược lựa chọn mơ hình theo mơ hình Box - Jenkins 1. Phương pháp Box-Jenkins 1. Phương pháp Box-Jenkins 1. Phương pháp Box-Jenkins 1. Phương pháp Box-Jenkins 1. Phương pháp Box-Jenkins Hình 7.4. Các hệ số tự tương quan và tự tương quan từng phần của mơ hình hỗn hợp ARMA(1,1). Mơ hình tự hồi qui tổng quát bậc p cĩ dạng: Yt = θ0 + θ1Yt-1 + θ2Yt-2 +…+ θpYt-p + εt Trong đĩ: Yt: Phản ứng (Biến phụ thuộc) tại thời điểm t. Yt-1, Yt-2, …, Yt-p: Phản ứng tại các giá trị của thời đoạn t-1, t-2,…, t-p tương ứng. θ0, θ1, θ2,…, θp: Các hệ số ước lượng. εt: Sai số, miêu tả ảnh hưởng của các tham số trong mơ hình. 2. Các mơ hình tự hồi qui (AR) Ví dụ: Bảng dự báo sử dụng mơ hình tự hồi qui AR (2) 2. Các mơ hình tự hồi qui (AR) Giả sử tại thời điểm t-1=75 cần phải dự báo về các quan sát cho giai đoạn tiếp theo t=76. Vì đại lượng sai số tối ưu là đại lượng mà giá trị trung bình của nĩ bằng 0, dự báo cho giai đoạn t=76 như sau: Đối với các mơ hình tự hồi qui, dự báo phụ thuộc vào dữ liệu quan sát trong quá khứ. Mơ hình AR(2), dự báo phụ thuộc vào giá trị quan sát trong 2 thời đoạn trước đĩ. Mơ hình AR(3), dự báo phụ thuộc vào giá trị quan sát trong 3 thời đoạn trước đĩ… 2. Các mơ hình tự hồi qui (AR) Mơ hình trung bình động bậc q cĩ dạng: Yt = μ + εt - ω1εt-1 - ω2εt-2 - … - ωqεt-q Trong đĩ: Yt: Phản ứng (biến phụ thuộc) tại thời điểm t. μ: Trung bình tĩnh của quá trình. ω1, ω2, …, ωq: Các hệ số ước lượng. εt: Sai số trong các thời đoạn trước, mà tại thời điểm t bao gồm Yt. Mơ hình MA dự báo giá trị Yt dựa trên phối hợp tuyến tính ràng buộc bởi các sai số trong quá khứ, trong khi đĩ mơ hình tự hồi qui AR dự báo trên cơ sở hàm tuyến tính ràng buộc bởi các giá trị Yt trong quá khứ. 3. Các mơ hình trung bình động (MA) Biểu thức trung bình động liên quan đến nhân tố làm sai lệch dự báo với trung bình của nĩ, Yt – μ là sự phối hợp tuyến tính giữa sai số hiện tại với sai số quá khứ, vì thời gian chuyển động về phía trước, nên các sai số trong sự phối hợp đĩ cũng sẽ dịch chuyển về phía trước. Yt – μ = εt - ω1εt-1 - ω2εt-2 - … - ωqεt-q Yt+1 – μ = εt+1 - ω1εt - ω2εt-1 - … - ωqεt-q+1 Tổng các trọng số ω1, ω2, …, ωq khơng nhất thiết phải bằng 1 và cĩ thể dương, cĩ thể âm. 3. Các mơ hình trung bình động (MA) Ví dụ: Bảng dự báo sử dụng mơ hình trung bình trượt MA (2) 3. Các mơ hình trung bình động (MA) Giả sử tại thời đoạn t-1=75, cần dự báo cho giai đoạn tiếp theo t=76. Vì với thời điểm t-1, sai số là đại lượng tối ưu, khi giá trị trung bình của nĩ bằng 0 và ước lượng tốt nhất giá trị sai số hiện tại và thời đoạn trước, đĩ là các phần dư tương ứng, thì dự báo cho giai đoạn t=76 sẽ như sau: 3. Các mơ hình trung bình động (MA) Cần chú ý rằng tính dự báo cho giai đoạn 76 hai phần dư e75 và e74 thay cho sai số ε75 và ε74. Khi tính dự báo bằng mơ hình MA, sai số tương ứng với các thời đoạn quá khứ được thay bằng các phần dư đối với các thời đoạn ấy. Số lượng phần dư trong mơ hình dự báo bằng số bậc của mơ hình MA. 3. Các mơ hình trung bình động (MA) Cĩ thể phối hợp mơ hình tự hồi qui và mơ hình trung bình động với nhau và kết quả là mơ hình “hỗn hợp”- Hồi qui-trung bình-động. Khi miêu tả mơ hình này, thường sử dụng kí hiệu ARMA(p,q), trong đĩ p - bậc của phần tự hồi qui, và q - bậc của phần trung bình động. Mơ hình ARMA(p,q) cĩ dạng: Yt = θ0 + θ1Yt-1 + θ2Yt-2 +…+ θpYt-p + εt - ω1εt-1 - ω2εt-2 - … - ωqεt-q Mơ hình ARMA(p,q) miêu tả một phạm vi rộng hành vi của chuỗi thời gian dừng. Mơ hình ARMA(p,q) làm dự báo vừa phụ thuộc vào giá trị hiện thời và giá trị quá khứ của Y, cũng như phụ thuộc vào giá trị hiện thời và quá khứ của sai số (phần dư) et. 4. Các mơ hình tự hồi qui và trung bình động (ARMA) 4. Các mơ hình hồi qui và trung bình động (ARMA) Hành vi của các hệ số tự tương quan và tự tương quan từng phần trong các mơ hình tự hồi qui và trung bình động. Giai đoạn 1. Xác định mơ hình 1. Trong giai đoạn nhận diện mơ hình cần làm rõ chuỗi dữ liệu cĩ phải là chuỗi dừng hay khơng. Thường thì chuỗi khơng dừng cĩ thể biến đổi thành chuỗi dừng bằng cách lấy sai phân. Trong trường hợp này mơ hình ARMA được xác định cho chuỗi sai phân. Giả sử chuỗi ban đầu Yt, cĩ xu thế tăng theo thời gian, nhưng sai phân bậc 1 của nĩ ΔYt = Yt - Yt-1, biến đổi xoay quanh một giá trị nhất định nào đĩ. Ví dụ: ΔYt =θ1ΔYt-1 + εt – ω1εt-1 Hoặc: (Yt - Yt-1) =θ1(Yt-1 - Yt-2) + εt – ω1εt-1. 5. Xây dựng mơ hình Box-Jenkins Trong một số trường hợp, để cĩ được chuỗi dừng, cần phải tìm sai phân của sai phân. Thủ tục lấy sai phân được thực hiện 2 lần, kết quả sẽ là chuỗi dữ liệu dừng. Δ2Yt = Δ(ΔYt) = Δ(Yt - Yt-1) =Yt -2Yt-1 + Yt-2. Về nguyên tắc, lấy sai phân cĩ thể tiến hành cho đến khi nào đồ thị dữ liệu khơng cho thấy chuỗi biến động lân cận một giá trị cố định nào đĩ, cịn tự tương quan mẫu tương đối giảm đột ngột. Số lần lấy sai phân cần thiết để cĩ chuỗi dữ liệu dừng được ký hiệu là d. Các mơ hình cho chuỗi dữ liệu khơng dừng gọi là mơ hình tự hồi qui trung bình động tích hợp và ký hiệu là ARIMA(p, d, q). Nếu chuỗi ban đầu là chuỗi dừng thì d=0 và mơ hình ARIMA trở thành ARMA. 5. Xây dựng mơ hình Box-Jenkins 2. Sau khi cĩ được chuỗi dừng, cần phải xác định đặc điểm chung của mơ hình. Việc chọn mơ hình phụ thuộc vào việc so sánh các kiểu chuyển vận của hệ số tự tương quan và tự tương quan từng phần. - Nếu hàm tự tương quan mẫu giảm mạnh tại một vài điểm, cịn tự tương quan từng phần giảm đều về 0, ví dụ tại q giá trị, khi đĩ mơ hình phù hợp là MA(q). - Nếu hàm tự tương quan mẫu giảm đều theo dạng hàm mũ, cịn tự tương quan từng phần giảm mạnh tại một vài điểm, ví dụ sau p giá trị, mơ hình phù hợp là AR(p). - Nếu cả 2 hàm tự tương quan và tự tương quan từng phần khơng giảm mạnh mà dần tiến về 0, khi đĩ chọn mơ hình ARMA(p, q). 5. Xây dựng mơ hình Box-Jenkins Giai đoạn 2. Ước lượng mơ hình 1. Ước lượng các tham số của mơ hình. Trong mơ hình ARIMA giá trị các tham số được chọn bằng cách tối thiểu hố tổng bình phương sai số (phương pháp bình phương phi tuyến bé nhất). Ví dụ: Giả sử mơ hình ARIMA(1,0,1) được đối chiếu với chuỗi 100 quan sát và phương trình thực cĩ dạng sau: (7,02) (0,17) (0,21) Vì tỉ số t đối với hệ số đứng trước số hạng tự hồi qui sẽ là t=0,25/0,17=1,47 (với p=0,14), giả thuyết H0: θ1=0 chấp nhận và số hạng này cĩ thể loại khỏi mơ hình. Khi đĩ ta áp dụng mơ hình ARIMA(0,0,1), nghĩa là MA(1). 5. Xây dựng mơ hình Box-Jenkins 2. Tính sai số phần dư bình phương trung bình s2 và ước lượng sự thay đổi sai số εt. Sai số phần dư bình phương trung bình được xác định theo cơng thức: Trong đĩ: : phần dư tại thời điểm t; n: số lượng phần dư; r: tổng số số tham số được ước lượng. Sai số phần dư bình phương trung bình dùng để so sánh và đánh giá các mơ hình khác nhau. Ngồi ra nĩ cịn được sử dụng để xác định giới hạn sai số của dự báo. 5. Xây dựng mơ hình Box-Jenkins Giai đoạn 3. Kiểm định mơ hình 1. Phần lớn các đồ thị phần dư, áp dụng trong phân tích hồi qui, cĩ thể sử dụng để phân tích phần dư trong mơ hình ARIMA. Biểu đồ tần xuất phần dư và đồ thị phân phối chuẩn của chúng đặc biệt hữu ích (Để kiểm định tính chuẩn), cũng như đồ thị trình tự của chúng theo thời gian (để kiểm định độ phân tán của các giá trị). 2. Các hệ số tự tương quan phần dư riêng lẻ rk(e) phải nhỏ và phải nằm trong lân cận 0 bên trong khoảng ± . Tự tương quan phần dư lớn đáng kể ở các thời đoạn trễ nhỏ hoặc cĩ tính mùa vụ, nghĩa là mơ hình lựa chọn khơng phù hợp và cần phải chọn mơ hình khác hoặc thay đổi mơ hình hiện tại. 5. Xây dựng mơ hình Box-Jenkins 3. Hành vi của hàm tự tương quan phần dư, nĩi chung phải tương ứng với tự hồi qui nhận được đối với tập hợp sai số ngẫu nhiên. Kiểm định chung tính phù hợp của mơ hình được thực hiện nhờ test χ2, dựa trên thống kê Q Ljung-Box. Đây là test kiểm định qui mơ chung của các hệ số tự tương quan phần dư. Test thống kê Q cĩ dạng: Trong đĩ: - rk(e): tự hồi qui phần dư trong khoảng k; - n: số phần dư; - m: số thời đoạn trong kiểm định. Thống kê Q cĩ phân phố gần giống phân phối ngẫu nhiên χ2 với n-r bậc tự do, trong đĩ r- tổng số số tham số phù hợp của mơ hình ARIMA. 5. Xây dựng mơ hình Box-Jenkins Giai đoạn 4. Dự báo dựa vào mơ hình lựa chọn 1. Khi tìm được mơ hình phù hợp cĩ thể tiến hành dự báo cho một hoặc vài thời đoạn tiếp theo. 2. Khi vừa cĩ dữ liệu quan sát mới, mơ hình ARIMA cĩ thể áp dụng để thay đổi dự báo, với thời điểm tính thời gian khác. 3. Nếu đặc điểm hành vi của chuỗi bị thay đổi, dữ liệu mới cĩ thể dùng để ước lượng lại các tham số mơ hình, hoặc khi cần thiết xây dựng mơ hình mới. 5. Xây dựng mơ hình Box-Jenkins Nếu như các mơ hình cĩ chứa cùng một lượng tham số như nhau, thì thường sẽ ưu tiên chọn mơ hình cĩ sai số bình phương trung bình (s2) nhỏ nhất. Tuy nhiên, các mơ hình cĩ số lượng tham số nhiều hơn cĩ thể cĩ sai số bình phương trung bình nhỏ. Mơ hình được lựa chọn là mơ hình cĩ AIC hoặc BIC tối thiểu. Tiêu chuẩn thơng tin Akaike (AIC) Trong đĩ: ln: lơ-ga-rít tự nhiên; : tổng bình phương phần dư, chia cho tổng số quan sát; n: số lượng quan sát (phần dư); r: tổng số các số hạng trong mơ hình ARIMA (kể cả số hạng là hằng số). 6. Các tiêu chí chọn lựa mơ hình Tiêu chuẩn thơng tin Bayes (BIC) Đại lượng thứ 2 trong hai cơng thức trên là “nhân tố phạt”, tính khi đưa vào tham số bổ sung vào mơ hình. Tiêu chuẩn BIC đặt lên hạn chế lớn số lượng các tham số so với tiêu chuẩn AIC. Như vậy tối thiểu hố tiêu chuẩn BIC khi lựa chọn mơ hình bao giờ cũng cho số lượng tham số, khơng lớn hơn số lượng tham số thiết lập theo tiêu chuẩn AIC. Thường thì cả 2 tiêu chuẩn này đều cho cùng một kết quả. 6. Các tiêu chí chọn lựa mơ hình 6. Các tiêu chí chọn lựa mơ hình Trong các mơ hình ARIMA riêng biệt để dự báo, cũng gần giống như khi sử dụng phương pháp san bằng số mũ. Để minh hoạ cho khẳng định trên, ta xem xét mơ hình ARIMA(0,1,1). Giả sử, điểm dự báo đầu tiên là t và cần phải dự báo cho Yt+1. Thay t bằng t+1 vào phương trình trên ta cĩ: Vì trong thời đoạn t, giả thuyết tốt nhất về đại lượng εt+1 là khơng và được ước lượng nhờ phần dư , phương trình dự báo cĩ dạng: 7. San bằng số mũ đơn giản và mơ hình ARIMA Giả sử α=1-ω1, thì phương trình trên tương tự như phương trình san bằng số mũ: Dự báo bằng phương pháp san bằng số mũ đơn giản, tương đương với dự báo trên cơ sở mơ hình ARIMA(0,1,1) với tham số ω1=1-α. Cần lưu ý rằng, mơ hình ARIMA(0,1,1) miêu tả một quá trình khơng dừng. Phương pháp san bằng số mũ bình thường sẽ làm việc tốt với chuỗi dữ liệu, mà cĩ thể miêu tả phù hợp bằng mơ hình ARIMA(0,1,1). Ngược lại, đối với các chuỗi thời gian khơng miêu tả phù hợp với mơ hình ARIMA(0,1,1), thì dự báo được xây dựng bằng phương pháp san bằng số mũ là khơng thể đủ tốt. 7. San bằng số mũ đơn giản và mơ hình ARIMA Phương pháp Box-Jenkins trong phân tích chuỗi thời gian là một cơng cụ rất mạnh để xây dựng dự báo chính xác với độ xa của dự báo nhỏ. Mơ hình ARIMA tương đối mềm dẻo và cĩ thể miêu tả một phạm vi rộng đặc điểm của chuỗi thời gian thường gặp trong thực tế. Các thủ tục hình thức kiểm định mơ hình tương đối đơn giản và dễ tiếp cận. Ngồi ra, các dự báo và khoảng dự báo cĩ thể thực hiện trực tiếp từ mơ hình đã lựa chọn. 8. Ưu và nhược điểm của các mơ hình ARIMA Nhược điểm: Cần phải cĩ số lượng dữ liệu ban đầu đủ lớn. Khi sử dụng mơ hình ARIMA, với dữ liệu khơng cĩ tính mùa vụ cần phải cĩ khơng ít hơn 40 quan sát. Khi xây dựng mơ hình ARIMA cho dữ liệu cĩ tính mùa vụ cần phải cĩ số quan sát vào khoảng 6-10 năm, phụ thuộc vào số thời đoạn của mùa vụ. Khơng tồn tại một phương pháp đơn giản nào để điều chỉnh các tham số của mơ hình ARIMA (như trong một số phương pháp san bằng số mũ) khi cập nhật dữ liệu mới. Mơ hình buộc phải xây dựng lại hồn tồn theo định kỳ, đơi khi phải chọn mơ hình mới hồn thiện hơn. Xây dựng mơ hình ARIMA phù hợp thường mất nhiều thời gian và chi phí. 8. Ưu và nhược điểm của các mơ hình ARIMA
Các file đính kèm theo tài liệu này:
- Ch7-_PP_Box_Jenkins.ppt