Tài liệu Kết hợp mạng nơron FIR và mô hình arima theo hình thức động để nâng cao hiệu quả dự báo chuỗi thời gian - Nguyễn Chí Thành: Công nghệ thông tin
N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 170
KẾT HỢP MẠNG NƠRON FIR VÀ MÔ HÌNH ARIMA
THEO HÌNH THỨC ĐỘNG ĐỂ NÂNG CAO HIỆU QUẢ
DỰ BÁO CHUỖI THỜI GIAN
Nguyễn Chí Thành*1, Hà Gia Sơn2
Tóm tắt: Nội dung bài báo viết về một giải pháp để nâng cao hiệu quả dự báo
chuỗi thời gian bằng việc kết hợp giữa mạng nơron FIR và mô hình ARIMA, các
trọng số sẽ được biến đổi theo thời gian. Kết quả dự báo được đánh giá dựa trên
tiêu chí MAE. Phần ứng dụng dựa vào dữ liệu về giá 5 mặt hàng cơ bản bán ra của
thị trường tài chính Forex (Foreign Exchange). Kết quả cho thấy, việc kết hợp này
có hiệu xuất cao hơn việc kết hợp thông thường.
Từ khóa: Mô hình dự báo, ARIMA, Chuỗi thời gian, Mạng nơron FIR.
1. ĐẶT VẤN ĐỀ
Dự báo đó chính là dự kiến, tiên đoán về những sự kiện, hiện tượng, trạng thái
nào đó có thể sẽ xảy ra trong tương lai. Dự báo có thể là một dự đoán chủ quan
hoặc trực giác về tương lai. Nhưng để dự báo được h...
10 trang |
Chia sẻ: quangot475 | Lượt xem: 552 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Kết hợp mạng nơron FIR và mô hình arima theo hình thức động để nâng cao hiệu quả dự báo chuỗi thời gian - Nguyễn Chí Thành, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Công nghệ thông tin
N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 170
KẾT HỢP MẠNG NƠRON FIR VÀ MÔ HÌNH ARIMA
THEO HÌNH THỨC ĐỘNG ĐỂ NÂNG CAO HIỆU QUẢ
DỰ BÁO CHUỖI THỜI GIAN
Nguyễn Chí Thành*1, Hà Gia Sơn2
Tóm tắt: Nội dung bài báo viết về một giải pháp để nâng cao hiệu quả dự báo
chuỗi thời gian bằng việc kết hợp giữa mạng nơron FIR và mô hình ARIMA, các
trọng số sẽ được biến đổi theo thời gian. Kết quả dự báo được đánh giá dựa trên
tiêu chí MAE. Phần ứng dụng dựa vào dữ liệu về giá 5 mặt hàng cơ bản bán ra của
thị trường tài chính Forex (Foreign Exchange). Kết quả cho thấy, việc kết hợp này
có hiệu xuất cao hơn việc kết hợp thông thường.
Từ khóa: Mô hình dự báo, ARIMA, Chuỗi thời gian, Mạng nơron FIR.
1. ĐẶT VẤN ĐỀ
Dự báo đó chính là dự kiến, tiên đoán về những sự kiện, hiện tượng, trạng thái
nào đó có thể sẽ xảy ra trong tương lai. Dự báo có thể là một dự đoán chủ quan
hoặc trực giác về tương lai. Nhưng để dự báo được hiệu quả hơn, người ta cố loại
trừ những tính chủ quan việc dùng các giải pháp kỹ thuật có độ chính xác cao.
Việc nâng cao hiệu quả dự báo là việc làm cần thiết trong một xã hội hiện đại.
Chính vì vậy, ở nước ngoài , có nhiều công trình nghiên cứu về vấn đề này, đã có
1 hệ thống lý thuyết gồm nhiều phương pháp, qui trình cũng như nhiều mô hình
để dự báo tương lai như tài liệu [12-13], [15]. Hiện tại, trong lĩnh vực này, đã có
xu hướng kết hợp các lý thuyết hiện đại vào dự báo như ứng dụng các loại mạng
nơron đặc biệt là nơron lai (sự kết hợp của mạng nơron thông thường với các mô
hình khác) như các tài liệu [7-11]. Điều này chứng tỏ sự kết hợp các mô hình, các
công cụ có vai trò rất lớn trong việc dự báo. Trong thời gian gần đây, ở trong
nước, chúng ta đã quan tâm nhiều hơn tới lĩnh vực dự báo, đã có nhiều đề tài các
cấp, với những mục đích và cách tiếp cận khác nhau về dự báo, điển hình là các
công trình [1-4].
Tổng hợp các công trình nghiên cứu cho thấy, ngày càng xuất hiện những mô
hình có hiệu quả cao, tuy nhiên, khi dự báo, có nhiều mô hình được thiết lập và
người ta thường chọn mô hình có hiệu quả cao nhất và bỏ qua các mô hình khác,
điều này gây ra một sự lãng phí, rõ ràng là việc kết hợp các giá trị dự báo cũng
phải được quan tâm. Có một số công trình đã chú ý tới điều này, ví dụ như các
công trình [5-6]. Tuy nhiên, hiệu quả dự báo vẫn chưa được nâng cao do các trọng
số kết hợp giữa các mô hình là một hằng số, không phù hợp với sự biến động của
chuỗi thời gian. Để nâng cao hơn nữa hiệu quả dự báo, tác giả bài viết này sẽ đưa
ra giải pháp kết hợp giữa kết quả dự báo của mạng nơron FIR với mô hình ARIMA
mà các trọng số sẽ thay đổi để thích nghi với sự biến đổi của chuỗi thời gian,
nhằm đạt hiệu quả cao nhất.
Trong bài viết, phần đầu là cơ sở lý thuyết chung và các mô hình về dự báo, ở
mục tiếp theo, tác giả đưa ra giải pháp để phối hợp 2 mô hình FIR và ARIMA theo
hình thức động. Phần sau là một ứng dụng dựa vào dữ liệu của thị trường tài chính
Forex . Kết quả cho thấy, giải pháp phối hợp các mô hình dự báo mà tác giả đưa ra
có hiệu quả cao hơn các mô hình dự báo thông thường mà bài báo [5,6] đã trình bày.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 171
2. NỘI DUNG CẦN GIẢI QUYẾT
2.1. Xây dựng lý thuyết
2.1.1. Các giá trị thích hợp, dự báo kiểm định và tiên nghiệm
Theo ([15]) trong môi trường dự báo có ba thời đoạn là dùng dữ liệu trong thời
đoạn n1 đến n2 để ước lượng một vài mô hình, các thời đoạn từ n2 + 1 đến n3 để kiểm
định các mô hình, lựa chọn mô hình tốt nhất, hay cũng có thể dùng để kết hợp các
mô hình; và thời đoạn n3 + 1 trở đi được gọi là các giá trị dự báo tiên nghiệm.
2.1.2. Tiêu chuẩn sai số trung bình để đánh giá mô hình
Theo ([15]), tiêu chuẩn sai số trung bình MAE để đánh giá mô hình dự báo là:
Sai số trung bình:
n
i
ii yy
n
MAE
1
1
(2.1)
Trong đó, yi là giá trị thực tế và iy
là giá trị được dự báo, n là số các quan sát
2.1.3. Các phương pháp thường sử dụng trong dự báo
Theo ([15]), có hai phương pháp dự báo: dự báo định tính, dự báo định lượng.
-Dự báo định tính: Là dự báo dựa trên phán đoán chủ quan, trực giác của người
ra quyết định. Phương pháp phổ biến là lấy phiếu thăm dò và thu thập ý kiến như
lấy ý kiến các nhà phân phối, người tiêu dùng, chuyên gia Nhược điểm chung
của phương pháp này là mang tính chủ quan, kinh nghiệm và cảm tính.
-Dự báo định lượng: Các mô hình này sẽ khắc phục được tính chủ quan và cảm
tính trong dự báo bằng cách sử dụng các công cụ toán học. Phương pháp dự báo
định lượng thường dùng phổ biến là dự báo chuỗi thời gian sử dụng các mô hình tự
hồi quy.
Theo [13], [14] và [15] ta có mô hình chuỗi thời gian tự hồi quy hoàn toàn có
cấu trúc như sau:
Yt = α1Yt-1+ α2Yt-2 + + αpYt-p+ ut (2.2)
Trong đó, Yt là quan sát thứ t đối với biến phụ thuộc và ut là thành phần sai số.
+ Mô hình trung bình trượt MA (Moving Average- Trung bình trượt) :
Yt = νt – β1νt-1– β2 νt-2– – βq νt-q (2.3)
Với νt là chuỗi sai số nhiễu trắng. Do đó, Yt là tổ hợp tuyến tính của các biến
ngẫu nhiên nhiễu trắng.
Hình 1. Mạng nơron truyền thẳng, hình trái là một tế bào nơron
và bên phải là mạng truyền thẳng.
+ Các mô hình ARMA (Auto Regressive Moving Average - Trung bình trượt
kết hợp tự hồi qui), phối hợp giữa các công thức tự hồi quy và trung bình trượt tạo
ra mô hình ARMA. Do đó, mô hình ARMA (p, q) có dạng tổng quát:
Yt = α1Yt-1+ α2Yt-2 + + αpYt-p+ ut + νt – β1νt-1– β2 νt-2– – βq νt-q ( 2.4)
Công nghệ thông tin
N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 172
+ Mô hình ARIMA: Giả sử rằng, một chuỗi thời gian không dừng có thể được
chuyển thành một chuỗi dừng bằng cách lấy sai phân d sau đó sẽ có thể được mô hình
hoá theo ARMA (p, q). Tích hợp MA và mô hình ARMA được mô hình ARIMA.
+ Sử dụng mạng nơron trong dự báo:
- Mạng nơ ron: Mạng nơron nhân tạo, gọi tắt là mạng nơron, là một mô hình xử
lý thông tin phỏng theo cách thức của các hệ nơron sinh học (hình 1).
Xét một tế bào nơron duy nhất được trích từ lớp l của một mạng L lớp . Đầu
vào lix tới nơron sẽ được nhân với 1 hệ số
l
ijw gọi là trọng số đại diện cho các kết
nối khớp thần kinh giữa nơron i trong lớp trước đó và nơron j trong lớp l. Và đầu
ra của nơron , 1ljx , là một hàm sigmoid là tổng trọng số đầu vào của nó:
)(1
i
l
i
l
i
l
j xwfx
(2.5)
- Mạng nơron FIR (Finite impulse response- mạng đáp ứng xung hữu hạn) :
theo [8-9], trong tế bào nơron của mạng này, khớp tĩnh thay bằng một bộ lọc tuyến
tính FIR. Bộ lọc này có thể được mô hình hóa với một đường trễ phân nhánh như
minh họa trong hình 2. Trong bộ lọc này, đầu ra y(k) sẽ tương ứng với tổng trọng
số giá trị trễ của đầu vào.
T
n
nkxnwky
0
)()()( (2.6)
Điều này tương ứng với các thành phần trung bình trượt của mô hình tự hồi qui
(ARMA-công thức 2.4). Bộ lọc FIR, trên thực tế, là một trong số mạng nơron tốt
nhất có phần tử thích nghi cơ bản để áp dụng vào mô hình ARMA này.
Hình 2. mô hình bộ lọc FIR.
Đầu ra )(1 kxlj
của lớp l tại thời điểm k bây giờ được tính bằng hàm sigmoid
của tổng của tất cả các kết quả đầu ra l của bộ lọc cung cấp cho nơron (Hình 3):
))(.()( ,
1 kxwfkx li
i
l
ji
l
j (2.7)
Hình 3. Nơron FIR và mạng nơron FIR.
FIR là một trong những sự lựa chọn tốt nhất trong việc dự báo chuỗi thời gian vì
kích thước nhỏ gọn, lại mang ưu điểm của mạng nơron lai, và đặc biệt đầu ra sẽ
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 173
tương ứng với tổng trọng số giá trị của đầu vào và tương ứng với các thành phần
của mô hình tự hồi quy ARIMA (Theo [8-10]).
2.1.4. Phối hợp các mô hình dự báo
Giả sử ta đã có kết quả dự báo từ các mô hình FIR và ARIMA, nhiệm vụ
đặt ra là phải kết hợp 2 mô hình này. Theo [6], việc kết hợp được làm như sau:
Đầu tiên, dùng dữ liệu trong thời kỳ mẫu để ước lượng các mô hình, sau đó, dự báo
các giá trị của biến phụ thuộc, dùng các giá trị này để xây dựng tập các trọng số,
tạo các giá trị dự báo ngoài mẫu từ các mô hình riêng biệt và sử dụng các trọng số
đã tìm được. Nếu gọi tY là giá trị thực tại thời điểm t của biến phụ thuộc, và
tktt fff ......,,, 21 là các giá trị dự báo được tạo ra bởi k mô hình khác nhau. Phương
pháp đương nhiên là tạo ra giá trị trung bình có trọng số của các giá trị dự báo này.
Do vậy, giá trị dự báo kết hợp sẽ là:
tkkttt ffff
.....22110 (2.8)
Trong đó,
0ˆ , 1ˆ , .. kˆ - Các trọng số cần xác định. Xác định các trọng số bằng
phương pháp Ước lượng tham số của mô hình hồi qui bội, cụ thể như sau:
Theo[15] và [6], trong thực tế chúng ta thường chỉ có dữ liệu từ mẫu. Từ số liệu
mẫu chúng ta ước lượng hồi qui tổng thể. Hàm hồi qui mẫu:
iikkiii
eXXXY ,,33,221
ˆ...ˆˆˆ (2.9)
ikkiiiiii XXXYYYe ,,33,221
ˆ...ˆˆˆˆ (2.10)
Hay viết dưới dạng ma trận eXY ˆ trong đó:
k
ˆ.
...
ˆ
ˆ
ˆ 2
1
;
ke
e
e
e
.
...
2
1
= ˆXY
Với các
mˆ là ước lượng của tham số m . Chúng ta trông đợi mˆ là ước lượng
không chệch của
m , hơn nữa phải là một ước lượng hiệu quả. Áp dụng phương
pháp bình phương tối thiểu, chọn
k ...,, 21 sao cho:
2
1
,,33,221
1
2 ˆ...ˆˆˆ
n
i
ikkiii
n
i
i XXXYe
(2.11)
đạt cực tiểu. Điều kiện cực trị của (2.10) là:
0ˆ...ˆˆˆ2
...
0ˆ...ˆˆˆ2
0ˆ...ˆˆˆ2
,
1
,,33,221
1
2
,2
1
,,33,221
2
1
2
1
,,33,221
1
1
2
ik
n
i
iKKiii
k
n
i
i
i
n
i
iKKiii
n
i
i
n
i
iKKiii
n
i
i
XXXXY
e
XXXXY
e
XXXY
e
(2.12)
Hệ phương trình (2.11) được gọi là hệ phương trình chuẩn của hồi qui mẫu
(2.8). Viết hệ dưới dạng ma trận là:
Công nghệ thông tin
N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 174
YXXX TT ˆ )()(ˆ 1 YXXX TT (2.13)
iki
i
i
T
YX
iYX
Y
YX
.
.
.
2
kikiikiikiki
kiiiiiii
kiii
T
XXXXXXX
XXXXXXX
XXXn
XX
......
.
.
......
....
32
232222
32
(2.14)
Giải thuật hồi qui bội (theo [6]) để xác định các hệ số này là:
Input matran(n,k) // bảng kết quả trên
Ouput mangbeta // mangbeta chứa các giá trị n ...., 10 .
Giải thuật:
1. Xây dựng ma trận XTY //theo công thức (2.14)
2. Xây dựng ma trận XTX //theo công thức (2.14)
3. Tính giá trị định thức XTX
4. Tính ma trận nghịch đảo của (XTX)
5. Tính tích )()(ˆ 1 YXXX TT để xác định hệ số
n ...., 10
Có 1 ý tưởng mà bài viết đưa ra là kết hợp FIR với 1 mô hình dự báo chuỗi thời
gian khác (đơn giản nhất là ARIMA), tuy nhỉên, sự kết hợp này cần phải “động”.
Cụ thể: thông thường, các hệ số
110 ,......, nn khi tìm đuợc luôn là một hằng số,
tuy nhiên, trong trường hợp “động”, các hệ số này sẽ thay đổi theo thời gian.
Theo [15], trong dự báo kinh tế, người ta thường sử dụng 10 hàm thông dụng là:
bậc một, bậc hai, logarit – tuyến tính, nghịch đảo, tương tác, tuyến tính-logarit,
nghịch đảo – logarit, bậc hai – logarit, log-hai lần, logistic. Để đơn giản, ta sẽ sử
dụng hàm bậc nhất trong phần ứng dụng minh họa. Giả định rằng trong mô hình
trên, tiii 10 với t thể hiện thời gian từ 1 đến n, và i = 0, 1,..., k (k là các mô
hình phối hợp). Điều này dẫn đến mô hình cải biến:
ttkktkkottt utfftfftY )(.....)( 11111100100 (2.15)
Nếu đặt :
kkkkk AAAAAt 21111111000100 ....,.....,
Và
ktkt FfFf ,....11 , ktkkt FtfFtf 211 ),...()( ta sẽ có phương trình:
kkkkkkt FAFAFAFAFAAY 221122110 ..............
Nếu đặt kn 2 ta có phương trình :
nnt FAFAAY .....110 . (2.16)
Đây chính là phương trình hồi qui cơ bản (2.8), có thể dùng giải thuật trên để
xác định các hệ số nAAA ....,, 10 này.
2.2. Ứng dụng: Dự báo giá bán ra của 5 mặt hàng cơ bản trên thị trường tài
chính Forex
- Dữ liệu: Trong ứng dụng này, luận án lấy dữ liệu về giá 5 mặt hàng cơ bản là
dầu thô WTI, khí tự nhiên, vải Cotton Hoa kỳ loại 2, cà phê Luân Đôn, thóc bán ra
ở trang web trang của thị trường tài chính Forex. Dữ
liệu bắt đầu từ 17/06/2010 đến 10/05/2017, gồm 1780 trường hợp. Biểu đồ dữ liệu
như hình 4.
- Dự báo bằng việc sử dụng mạng nơron FIR và sử dụng mô hình chuỗi thời
gian (dùng mô hình ARIMA) cho từng biến.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 175
+ Dự báo bằng ARIMA: Sau khi đã thử nghiệm, các thông số về mô hình tối ưu
lựa chọn theo tiêu chuẩn MAE của các biến là: Dầu có mô hình ARIMA(1,1,2),
Khí có mô hình ARIMA(1,1,1), Vải có mô hình ARIMA(1,2,1), Cà phê có mô
hình ARIMA(1,1,2) và Thóc có mô hình ARIMA(2,1,2).
Hình 4. Biểu đồ biến động giá 5 mặt hàng cơ bản.
+ Dự báo bằng mạng nơron FIR: Dữ liệu huấn luyện là tập các cặp (Xh, Dh),
Xh trong đó là thông số giá vàng lúc mở, lúc cao nhất và thấp nhất của ngày h, Dh
là thông số giá vàng của ngày h+1. Tức là Dh =Xh1. Quá trình huấn luyện thực
hiện theo giải thuật lan truyền ngược. Do số nơron đầu vào và đầu ra là 1 nên kích
thước của FIR rất nhỏ gọn, tuy nhiên, phải chọn số lớp ẩn là 2, kính thước mạng đã
thử nghiệm là 1x3x4x1, 1x4x5x1, 1x5x6x1 nhận được để dự báo các biến, thông số
mạng nơron sau khi đã thử nghiệm có MAE nhỏ nhất là 1x3x4x1, Áp dụng mạng
nơron FIR để dự báo các biến, thông số mạng nơron sau khi đã thử nghiệm có
MAE nhỏ nhất là 1x3x4x1, Số mẫu trong thời kỳ ước lượng từ 1-1100, kiểm định
là 1101 tới 1400 và tiên nghiệm là 1401-1580.
- Kết hợp giữa dự báo bằng FIR và dự báo bằng mô hình ARIMA:
+ Phân bố dữ liệu: Với 580 dữ liệu còn lại, ta sẽ phân bổ như sau:
400 dữ liệu đầu, dùng trong thời kỳ ước lượng dự báo trong mẫu: sử dụng dữ
liệu trong thời đoạn này để ước lượng một hoặc một vài mô hình.
Thời kỳ dự báo kiểm định: từ 401 đến 490, trong đó, giá trị thực tế của Y và
tất cả các sX đều đã biết. Nếu trong thời đoạn này, MAE nhỏ hơn thì mô
hình được đánh giá là tốt hơn và được lựa chọn.
Thời kỳ dự báo tiên nghiệm: thời đoạn 491 tới 580 dùng để chứng minh các
tham số được chọn là đúng.
+ Kết hợp tĩnh: nếu sử dụng giải thuật hồi qui bội (ở mục 2.1.4) để xác định các
hệ số
210 ,, , ta sẽ có kết quả cụ thể 210 ,, của dầu tương ứng là -0.93887,
1.01218 và 0.00588; của mặt hàng khí là :-0.25108, 1.09152, -0.00427; Vải: -
6.54752, 1.10957, 0.00189; cà phê: -0.33732, 1.15558, 0.01981 và thóc là : -
1072.73918, 0.87007, 98.31207. Các hệ số này sẽ không thay đổi theo thời gian
nên ta gọi phương pháp này là “Kết hợp tĩnh”. Sai số trung bình MAE của các mặt
hàng này được nêu tại bảng 1.
Dầu thô
0
20
40
60
80
100
120
1 163 325 487 649 811 973 1135 1297 1459 1621
Dầu thô
Khí tự nhiên
0,000
1,000
2,000
3,000
4,000
5,000
6,000
7,000
1 173 345 517 689 861 1033 1205 1377 1549 1721
Khí tự nhiên
Vải c o ton
0
50
100
150
200
250
1 171 341 511 681 851 1021 1191 1361 1531 1701
Vải c oton
Cà phê luân đôn
0,00
0,50
1,00
1,50
2,00
2,50
3,00
1 187 373 559 745 931 1117 1303 1489 1675
Cà phê luân đôn
Thóc
0,00
2,00
4,00
6,00
8,00
10,00
12,00
14,00
16,00
18,00
20,00
1 163 325 487 649 811 973 1135 1297 1459 1621
Thóc
Công nghệ thông tin
N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 176
+ Kết hợp động: Gọi mô hình ARIMA của từng biến là 1f và FIR của từng
biến là 2f . Nếu kết hợp với nhau, ta sẽ có mô hình mới tY theo công thức:
22110 ffYt
Nhưng do hệ số
1 thay đổi theo thời gian, còn 2 là hệ số của mô hình FIR
chính xác hơn so với mô hình ARIMA nên giữ nguyên, không đổi. (Tuy nhiên, có
thể mở rộng bằng việc cho
2 thay đổi theo thời gian).
Ta có : t10000 và t11011 .
Phương trình trên sẽ trở thành :
22111101000 )( ffttYt
221111101000 ftfftYt
Đặt
223131111010000 ,,,, AftfAAtA ta sẽ có một phương trình hồi qui
đầy đủ là :
3322110 fAfAfAAYt
Để kết hợp các mô hình trong dự báo, phải xác định chính xác các hệ số A0, A1,
A2, A3. Nhưng trước tiên, ta sẽ xác định giá trị 13 tff . Ta có thể tính 3f bằng tích
giữa biến ARIMA này với thời gian t .
Sử dụng giải thuật kết hợp các mô hình bằng phương pháp hồi qui bội, cụ thể là:
Input: matran(1080,5) // ma trận chứa bảng số liệu
Output:MAEFIR, MAEARIMA, MAEkethop, R
2, giá trị kết hợp.
Thuật toán
1. Tinh tf1
2. Matran(i,5)=matran(i,4)*matran(i,1)
3. Xây dựng ma trận XTX
4. Xây dựng ma trận XTY
5. Tính định thức
xxt
D bằng phương pháp Gaus
6. Tính ma trận nghịch đảo của (XTX)
7. Tính tích 2 ma trận để xác định hệ số A0,A1.A3
8. Tính độ lệch trung bình Ytb
9. Xác định các giá trị MAE Và R2: duyệt toàn bộ miền kiểm định tính giá trị
kết hợp
Ta sẽ xác định được các hệ số A0, A1, A2, A3 tương ứng của từng biến. Kết quả
khi sử dụng giải thuật này được đánh giá bằng tiêu chuẩn MAE cho tại bảng 1.
Bảng 1. Các tham số MAE tại miền kiểm định và tiên nghiệm.
TT
Tên mô hình
dự báo
Dầu Khí Vải Cà phê Thóc
Miền kiểm định
1. ARIMA 7.4069 0.1416 30.7849 0.1416 3.6665
2. FIR 0.8161 0.0415 1.0935 0.0415 4.9045
3. Kết hợp tĩnh 0.8231 0.0774 0.1488 0.0246 1.9294
4. Kết hợp động 0.8059 0.0246 0.1684 0.0240 1.3259
5. MAE nhỏ nhất 0.8059 0.0246 0.1684 0.0246 1.3259
6. Mô hình có
MAE nhỏ nhất
Kết hợp
động
Kết hợp
động
Kết hợp
động
Kết hợp
động
Kết hợp
động
Miền tiên nghệm
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 177
7. ARIMA 12.0432 0.0470 36.3148 0.0470 3.9577
8. FIR 0.6002 0.0767 1.5961 0.0767 4.5863
9. Kết hợp tĩnh 0.6122 0.0609 0.1735 0.0295 3.4323
10. Kết hợp động 0.5944 0.0250 0.1222 0.0250 3.5458
11. MAE nhỏ nhất 0.5944 0.0250 0.1222 0.0250 3.5458
12. Mô hình có MAE
nhỏ nhất
Kết hợp
động
Kết hợp
động
Kết hợp
động
Kết hợp
động
Kết hợp
động
Đồ thị giữa kết quả, dự báo của FIR và dự báo ARIMA và kết hợp cả hai mô
hình theo hình thức tĩnh và động tại miền kiểm định và miền tiên nghiệm của từng
biến sẽ như sau:
Hình 5. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động
của mặt hàng “dầu” trong miền kiểm định (trái) và tiên nghiệm (phải).
Hình 6. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động
của mặt hàng “khí” trong miền kiểm định (trái) và tiên nghiệm (phải).
Hình 7. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động
của mặt hàng “cà phê” trong miền kiểm định (trái) và tiên nghiệm (phải).
Hình 8. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động
của mặt hàng “vải” trong miền kiểm định (trái) và tiên nghiệm (phải).
0
10
20
30
40
50
60
70
80
90
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
ket hop dong
arima
Fir
ket hop tinh
0
10
20
30
40
50
60
70
80
90
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
ket hop dong
arima
Fir
ket hop tinh
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
ket hop dong
arima
Fir
ket hop tinh
0
0,5
1
1,5
2
2,5
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
ket hop dong
arima
Fir
ket hop tinh
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
ket hop dong
arima
Fir
ket hop tinh
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
ket hop dong
arima
Fir
ket hop tinh
0
10
20
30
40
50
60
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ket qua
ket hop dong
arima
Fir
ket hop tinh
0
10
20
30
40
50
60
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
kethop dong
arima
fir
ket hop tinh
Công nghệ thông tin
N. C. Thành, H. G. Sơn, “Kết hợp mạng nơron FIR và mô hình chuỗi thời gian.” 178
Hình 9. Đồ thị so sánh giữa kết quả, dự báo ARIMA, FIR và kết hợp tĩnh, động
của mặt hàng “thóc” trong miền kiểm định (trái) và tiên nghiệm (phải).
Nhận xét: Trong 5 trường hợp của cả 2 miền, ta thấy rằng:
+Phương pháp kết hợp bình thường (kết hợp tĩnh) chưa mang lại hiệu quả cao (ở
miền kiểm định, mặt hàng dàu và khí có MAE thậm chí còn thấp hơn so với FIR).
+Sự kết hợp giữa FIR và ARIMA theo hình thức động đều mang lại hiệu quả tốt
nhất (MAE nhỏ nhất) tại cả 2 miền kiểm định và tiên nghiệm.
+Do trong khuôn khổ một bài báo, chỉ sử dụng 5 ví dụ ứng dụng, khi mở rộng
các ứng dụng dự báo, ta còn giai đoạn kiểm định mô hình, nếu việc kết hợp theo
hình thức “động” không mạng lại kết quả tốt hơn, thì vẫn có quyền lựa chọn lại
kết quả mà FIR, ARIMA hoặc kết hợp tĩnh có MAE bé nhất làm kết quả dự báo.
3. KẾT LUẬN
Trong nghiên cứu thực tế, quy trình phổ biến được các nhà phân tích chấp nhận
là ước lượng một số các mô hình, và cuối cùng chọn lấy mô hình nào là “tốt nhất”
theo mục tiêu. Tuy nhiên, các mô hình bị bỏ đi vẫn chứa những thông tin về các
động thái rõ nét của biến phụ thuộc và lập luận rằng việc kết hợp dự báo từ nhiều
mô hình sẽ tốt hơn là từ một mô hình duy nhất. Bài báo này đã tổng hợp được các
tài liệu để có cái nhìn tổng quan về dự báo, đưa ra giải pháp xây dựng một mô hình
kết hợp giữa mạng nơron FIR và ARIMA để nâng cao hiệu quả dự báo dựa vào
việc giải thuật hồi qui bội để tìm ra được các trọng số kết hợp thay đổi theo thời
gian. Bài báo này là một hướng nghiên cứu mở, có thể tiếp tục phát triển bằng việc
sử dụng các hàm khác ngoài hàm bậc 1 đã nêu để nâng cao hiệu quả dự báo.
Lời cảm ơn: Tác giả xin chân thành cám ơn tập thể cán bộ, nhân viên Viện CNTT, và
đặc biệt là 02 TS Ngô Trọng Mại và Tôn Thiện Chiến đã giúp đỡ tận tình về mặt ý tưởng
cũng như khi thực hiện chi tiết bài báo.
TÀI LIỆU THAM KHẢO
[1]. Đỗ Quang Giám, Vũ Thị Hân (2012), “Xây dựng mô hình Arima cho dự báo
khách du lịch quốc tế đến Việt Nam”, Tạp chí Khoa học và Phát triển : Tập
10, số 2: 364 - 370 , Trường ĐH Nông Nghiệp Hà Nội
[2]. Vũ Thị Gương ( 2012 ), “Kỹ thuật khai phá dữ liệu chuỗi thời gian áp dụng
trong dự báo chứng khoán”, luận án Thạc sĩ khoa học CNTT, Học viện Bưu
chính Viễn Thông, Hà nội
[3]. Nguyễn Khắc Hiếu, 2014. "Mô hình ARIMA và dự báo lạm phát 6 tháng cuối
năm 2014" . Tạp chí Kinh Tế và Dự Báo số 16, tháng 8-2014 .
[4]. Phạm Văn Khánh (2008) , “Phân tích thống kê dự báo và mô phỏng một số
chuỗi thời gian ”, Luận án Tiến sỹ Toán ứng dụng , ĐH QG Hà Nội, Hà Nội.
[5]. Hà Gia Sơn, Một giải pháp phối hợp mô hình trong dự báo, Tạp chí Nghiên
cứu Khoa học và Công nghệ quân sự số 39 tháng 10 năm 2015, tr 82-89.
0
5
10
15
20
25
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
ket hop dong
fir
arima
ket hop tinh
0
5
10
15
20
25
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82 85 88
ketqua
ket hop dong
fir
arima
ket hop tinh
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Đặc san CNTT, 12 - 2017 179
[6]. Hà Gia Sơn, Đỗ Văn Đỉnh, “Ứng dụng phương pháp hồi qui bội để kết hợp
các mô hình dự báo”, Tạp chí Khoa học và Công nghệ số 13 tháng 8 năm
2017, tr 69-Trường ĐH Sao Đỏ (ISSN-2354-0575).
[7]. C. Lee Giles, Steve Lawrence, A. C. Tsoi (2001)- “Noisy Time Series
Prediction using a Recurrent Neural Network and Grammatical Inference” -
Machine Learning, Volume 44, Number 1/2, July/August, pp. 161–183,
[8]. Eric A Wan ( 2003), “Finite Impulse Response Neural Networks for
Autoregressive Time Series Prediction”, Proceedings of the NATO Advanced
Workshop on Time Series Prediction and Analysis, Sante Fe, NM.
[9]. Eric A Wan (2004), “Finite Impulse Response Neural Networks With
Application In Time Series Prediction” - a dissertation submitted to the
department of electrical engineering and the committee on graduate studies of
stanford university in partial fulfillment of the requirements for the degree of
doctor of philosophy.
[10]. Ho Joon Kim(2005), “Time Series Prediction Using an Interval Arithmetic
FIR Network”, Neural Information Processing - Letters and Reviews Vol.8,
No.3, September
[11]. Luis Aburto, Richard Weber (2012), “Demand Forecast in a Supermarket
using a Hybrid Intelligent System”, Department of Industrial Engineering,
University of Chile, pp 143-151.
[12]. Michael Falk , Frank Marohn (2012), “A First Course on Time Series Analysis
- Examples with SAS”, by Chair of Statistics, University of Wurzburg.
[13]. Michael K. Evans (2002), “Practical Bususiness Forecasting”, Blackwell
Publishers Ltd, a Blackwell Publishing company. Bodmin, Cornwall.
[14]. Marek Hlav’acek (2009), “Seasonal Time Series Modeling Via Neural
Networks With Swithching Units”, PHD Czech Technical University Prague
[15]. N.Gujarati (2004), “Basic Econometrics”, Fourth Edition-The McGraw−Hill
Companies.
ABSTRACT
FIRST ARRIVAL AND ARIMA MODEL COMPLETES TO IMPROVE
TIME EFFICIENCY FOR TIME.
The article is about a solution to improve the efficiency of time series
forecasting by combining FIR neural networks and ARIMA models, the
weights will be varied over time. The results are based on the MAE criteria.
The application is based on data on prices of five basic commodities sold in
the Forex market (Foreign Exchange). The results show that this
combination is more effective than conventional combination.
Keywords: Model of forecast, ARIMA method, Combined method, Time series.
Nhận bài ngày 16 tháng 8 năm 2017
Hoàn thiện ngày 26 tháng 11 năm 2017
Chấp nhận đăng ngày 28 tháng 11 năm 2017
Địa chỉ: 1 Viện CNTT- Viện KH&CN Quân sự;
2 Trường Đại học Công nghiệp Việt-Hung.
* Email : Thanhnc80@gmail.com.
Các file đính kèm theo tài liệu này:
- 17_1805_2151888.pdf