Tài liệu Luận văn Mô hình chuỗi thời gian mờ trong dự báo chuỗi thời gian: Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
---------------------------------
NGUYỄN THỊ KIM LOAN
MÔ HÌNH CHUỖI THỜI GIAN MỜ
TRONG DỰ BÁO CHUỖI THỜI GIAN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01
Giáo viên hướng dẫn: TS. NGUYỄN CÔNG ĐIỀU
THÁI NGUYÊN - 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC
MỞ ĐẦU ........................................................................................................ 1
CHƢƠNG 1. CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN ............ 5
1. Chuỗi thời gian và quá trình ngẫu nhiên ................................................... 5
1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên ............................ 5
1.2. Quá trình ngẫu nhiên dừng ................................................................ 6
1.3. Hàm tự tƣơng quan ....................................................................
68 trang |
Chia sẻ: hunglv | Lượt xem: 1319 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Mô hình chuỗi thời gian mờ trong dự báo chuỗi thời gian, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
---------------------------------
NGUYỄN THỊ KIM LOAN
MÔ HÌNH CHUỖI THỜI GIAN MỜ
TRONG DỰ BÁO CHUỖI THỜI GIAN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01
Giáo viên hướng dẫn: TS. NGUYỄN CÔNG ĐIỀU
THÁI NGUYÊN - 2009
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC
MỞ ĐẦU ........................................................................................................ 1
CHƢƠNG 1. CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN ............ 5
1. Chuỗi thời gian và quá trình ngẫu nhiên ................................................... 5
1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên ............................ 5
1.2. Quá trình ngẫu nhiên dừng ................................................................ 6
1.3. Hàm tự tƣơng quan ............................................................................ 7
1.4. Toán tử tiến, toán tử lùi...................................................................... 8
2. Quá trình ARMA ...................................................................................... 9
2.1. Quá trình tự hồi quy ........................................................................... 9
2.2. Quá trình trung bình trƣợt ................................................................ 11
2.3. Quá trình tự hồi quy trung bình trƣợt ............................................... 13
3. Ƣớc lƣợng tham số mô hình ARMA ....................................................... 15
4. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính ....... 16
CHƢƠNG 2. LÝ THUYẾT TẬP MỜ VÀ CHUỖI THỜI GIAN MỜ ........... 23
1. Lý thuyết tập mờ .................................................................................... 23
1.1. Tập mờ ............................................................................................ 23
1.2. Các phép toán trên tập mờ ............................................................... 25
2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ .......................................... 30
2.1. Quan hệ mờ ..................................................................................... 30
2.2. Suy luận xấp xỉ và suy diễn mờ ....................................................... 31
3. Hệ mờ ..................................................................................................... 33
3.1. Bộ mờ hoá ....................................................................................... 33
3.2. Hệ luật mờ ....................................................................................... 34
3.3. Động cơ suy diễn ............................................................................. 35
3.4. Bộ giải mờ ....................................................................................... 36
3.5. Ví dụ minh hoạ ................................................................................ 37
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
CHƢƠNG 3. MỘT SỐ THUẬT TOÁN CƠ BẢN TRONG CHUỖI THỜI
GIAN MỜ VÀ MỘT SỐ THUẬT TOÁN CẢI TIẾN ................................... 39
1. Một số khái niệm .................................................................................... 39
1.1. Định nghĩa tập mờ và chuỗi thời gian mờ ........................................ 39
1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ........................ 40
2. Mô hình một số thuật toán dự báo trong mô hình chuỗi thời gian mờ ......... 41
2.1. Mô hình thuật toán của Song và Chissom ........................................ 41
2.2. Mô hình thuật toán của Chen ........................................................... 42
2.3. Thuật toán của Singh ....................................................................... 43
2.4. Mô hình Heuristic cho chuỗi thời gian mờ ....................................... 45
3. Ứng dụng trong dự báo chứng khoán ...................................................... 48
3.1. Bài toán chỉ số chứng khoán Đài Loan ............................................ 48
3.2. Xây dựng chƣơng trình .................................................................... 60
KẾT LUẬN ................................................................................................... 64
TÀI LIỆU THAM KHẢO ............................................................................. 65
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1
MỞ ĐẦU
Chuỗi thời gian đang được sử dụng như một công cụ hữu hiệu để phân
tích trong kinh tế, xã hội cũng như trong nghiên cứu khoa học. Chính do tầm
quan trọng của phân tích chuỗi thời gian, rất nhiều tác giả đã đề xuất các công
cụ để phân tích chuỗi thời gian.
Trong những năm trước, công cụ chủ yếu để phân tích chuỗi thời gian là
sử dụng các công cụ thống kê như hồi qui, phân tích Furie và một vài công cụ
khác. Nhưng hiệu quả nhất có lẽ là mô hình ARIMA của Box-Jenkins. Mô
hình này đã cho một kết quả khá tốt trong phân tích dữ liệu. Tuy nhiên sự phức
tạp của thuật toán đã gây khó khăn khi ứng dụng trong phân tích chuỗi số liệu,
nhất là khi chuỗi số liệu có những thay đổi phản ánh sự phi tuyến của mô hình.
Để vượt qua được những khó khăn trên, gần đây nhiều tác giả đã sử
dụng mô hình chuỗi thời gian mờ. Khái niệm tập mờ được Zadeh đưa ra từ
năm 1965 và ngày càng tìm được ứng dụng trong nhiều lĩnh vực khác nhau
nhất là trong điều khiển và trí tuệ nhân tạo. Trong lĩnh vực phân tích chuỗi thời
gian, Song và Chissom đã đưa khái niệm chuỗi thời gian mờ phụ thuộc vào
thời gian và không phụ thuộc vào thời gian để dự báo. Chen đã cải tiến và đưa
ra phương pháp mới đơn giản và hữu hiệu hơn so với phương pháp của Song
và Chissom. Trong phương pháp của mình, thay vì sử dụng các phép tính tổ
hợp Max- Min phức tạp, Chen đã tính toán bằng các phép tính số học đơn giản
để thiết lập mối quan hệ mờ. Phương pháp của Chen cho hiệu quả cao hơn về
mặt sai số dự báo và độ phức tạp của thuật toán.
Từ các công trình ban đầu về chuỗi thời gian mờ được xuất hiện năm
1993, hiện nay mô hình này đang được sử dụng để dự báo rất nhiều lĩnh vực
trong kinh tế hay xã hội như trong lĩnh vực giáo dục để dự báo số sinh viên
nhập trường, hay trong lĩnh vực dự báo thất nghiệp, trong lĩnh vực dân số,
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2
chứng khoán và trong nhiều lĩnh vực khác như tiêu thụ điện, hay dự báo nhiệt
độ của thời tiết…
Tuy nhiên xét về độ chính xác của dự báo, một số thuật toán trên còn
cho kết quả chưa cao. Để nâng cao độ chính xác của dự báo, một số thuật toán
cho moo hình chuỗi thời gian mờ liên tiếp được đưa ra. Chen sử dụng mô hình
bậc cao của chuỗi thời gian mờ để tính toán. Sah và Degtiarev thay vì dự báo
chuỗi thời gian đã sử dụng chuỗi thời gian là hiệu số bậc nhất để nâng cao độ
chính xác. Đây cũng là một phương pháp hay được sử dụng trong mô hình
Box-Jenkins để loại bỏ tính không dừng của chuỗi thời gian. Huarng đã sử
dụng các thông tin có trước trong tính chất của chuỗi thời gian như mức độ
tăng giảm để đưa ra mô hình heuristic chuỗi thời gian mờ.
Trong thời gian gần đây, đề tài này vẫn luôn được một số tác giả nghiên
cứu. Các hướng hiện nay vẫn là tập trung nâng cao độ chính xác dự báo của
mô hình chuỗi thời gian mờ. Bài báo của I-Hong Kuo và các tác giả (2008) đưa
ra phương pháp tăng độ chính xác của dự báo bằng tối ưu các phần tử đám
đông (Particle swarm optimaization). Ching Hsue Cheng và các đồng tác giả
(2008) mở rông nghiên cứu bằng các phương pháp kỳ vọng (Exspectation
method) và Phương pháp lựa chọn mức (Grade Selection Method) thông qua
các ma trận chuyển dịch có trọng. Ngoài ra hiện nay có xu hướng sử dụng kết
hợp các phương pháp khác nhau với chuỗi thời gian mờ như phương pháp
mạng Nơ ron như Cagdas H. Aladag (2008) hay Medey Khascay (2008). Ngay
cả một nhà nghiên cứu sâu trong lĩnh vực này là Huarng cũng đã mở rộng theo
hướng này từ năm 2006. Thuật toán di truyền cũng tìm được ứng dụng trong
hướng nghiên cứu này. Năm 2007 có bài báo của Li-Wei Lee sử dụng mối
quan hệ mờ và thuật toán di truyền để dự báo nhiệt độ và chỉ số tài chính của
Đài Loan. Ngoài ra một số tác giả khác tìm những thuật toán khác đơn giản để
dự báo như bài báo của Singh (2007) hay thuật toán dựa vào trend của chuỗi
thời gian (Baldwin 2000).
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
3
Nghiên cứu dự báo chuỗi thời gian luôn là một bài toán gây được sự chú ý
của các nhà toán học, kinh tế, xã hội học,... Các quan sát trong thực tế thường
được thu thập dưới dạng chuỗi số liệu. Từ những chuỗi số liệu này người ta có thể
rút ra được những quy luật của một quá trình được mô tả thông qua chuỗi số liệu.
Nhưng ứng dụng quan trọng nhất là dự báo khả năng xảy ra khi cho một chuỗi số
liệu. Những thí dụ dẫn ra trong các bài báo đều đưa ra khả năng dự báo trong kinh
tế như dự báo chỉ số chứng khoán, mức tăng dân số, dự báo nhu cầu sử dụng điện,
dự báo số lượng sinh viên nhập học của một trường đại học... Các thí dụ này đều
có thể dẫn ra trong mỗi ngành kinh tế kỹ thuật.
Như đã trình bày ở phần trên, có khá nhiều phương pháp dự báo chuỗi thời
gian. Thông thường để dự báo, người ta sử dụng một công cụ khá mạnh của thống
kê là mô hình ARIMA. Mô hình này thích ứng hầu hết cho chuỗi thời gian dừng
và tuyến tính. Trong mỗi bộ chương trình xử lý số liệu đều có một phần để dự báo
chuỗi thời gian. Nhưng đối với các chuỗi số liệu phi tuyến, nhất là trong số liệu
kinh tế, sử dụng mô hình ARIMA kém hiệu quả. Chính vì vậy phải có những
phương pháp khác nhau để xử lý chuỗi số liệu phi tuyến. Đã có nhiều người sử
dụng công cụ mạng nơ ron để xử lý tính chất phi tuyên của chuỗi số liệu. Đây là
một hướng đi đã được nhiều người tiếp cận và đã có những sách chuyên khảo về
vấn đề này thí dụ như cuốn của Mandic và Chambers “ Recurrent neural network
and prediction” in vào năm 2001. Một hướng đi khác là sử dụng khái niệm mờ để
đưa ra thuật ngữ “ Chuỗi thời gian mờ”. Phương pháp sử dụng chuỗi thời gian mờ
đã được đưa ra từ năm 1994 và đến nay vẫn đang được tiếp tục nghiên cứu để làm
tăng độ chính xác của dự báo.
Trong đề tài này em trình bày phương pháp dự báo chỉ số chứng khoán
bằng công cụ chuỗi thời gian mờ đã được một số tác giả phát triển. Tư tưởng
chính của phương pháp là sử dụng một số khái niệm của Huarng và Chen, Hsu
để phát triển thuật toán mới. Dựa trên thuật toán đề ra, em đã tính toán một bài
toán thực tế dựa trên dữ liệu lấy từ thị trường chứng khoán Đài Loan để kiểm
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
4
chứng. Kết quả thu được rất khả quan. Độ chính xác của dự báo được nâng lên
khá nhiều so với các thuật toán trước đây đề ra.
Nội dung chính của luận văn nghiên cứu những khái niệm, tính chất và
những thuật toán khác nhau trong mô hình chuỗi thời gian mờ để dự báo cho
một số chuỗi số trong kinh tế xã hội, được trình bày trong 3 chương:
Chương 1: trình bày các kiến thức cơ bản về chuỗi thời gian.
Chương 2: trình bày Lý thuyết tập mờ và chuỗi thời gian mờ.
Chương 3: trình bày một số thuật toán cơ bản trong chuỗi thời gian mờ
và một số thuật toán cải tiến.
Luận văn này được hoàn thành dưới sự hướng dẫn tận tình của TS
Nguyễn Công Điều, tác giả xin bày tỏ lòng biết ơn chân thành của mình đối
với thầy. Tác giả xin chân thành cảm ơn các thầy giáo Viện công nghệ thông
tin, khoa Công nghệ thông tin Đại học Thái Nguyên đã tham gia giảng dạy
giúp đỡ em trong suốt qúa trình học tập nâng cao trình độ kiến thức. Tuy nhiên
vì điều kiện thời gian và khả năng có hạn nên luận văn không thể tránh khỏi
những thiếu sót. Tác giả rất mong các thầy cô giáo và bạn đóng góp ý kiến để
đề tài được hoàn thiện hơn.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
5
CHƢƠNG 1
CÁC KIẾN THỨC CƠ BẢN VỀ CHUỖI THỜI GIAN
Trong phần này, chúng ta sẽ tìm hiểu về một lớp mô hình chuỗi thời
gian hết sức thông dụng trong thực tế. Đó là mô hình quy trình trượt
ARMA(Autoregressive Moving Average). Ta sẽ nghiên cứu các đặc trưng của
quá trình ARMA, xem xét tổng quan về phương pháp ước lượng tham số của
lớp mô hình này và cũng thấy rõ được hạn chế của nó khi áp dụng vào chuỗi
thời gian tài chính. Ngoài ra, mô hình ARMA còn đóng vai trò quan trong như
là cơ sở để xây dựng mô hình ARCH sau này.
1. Chuỗi thời gian và quá trình ngẫu nhiên
Trước khi đi vào chi tiết tìm hiểu về mô hình ARMA, ta sẽ nhắc lại một
số khái niệm liên quan đến chuỗi thời gian và quá trình ngẫu nhiên. Dù là ta đi
vào chi tiết mô hình gì đi chăng nữa thì các khái niệm cơ bản này vẫn sẽ theo
chúng ta trong suốt quá trình nghiên cứu về chuỗi thời gian.
1.1. Khái niệm chuỗi thời gian và quá trình ngẫu nhiên
Một chuỗi thời gian là một dãy các giá trị quan sát X:={x1, x2,……… xn}
được xếp thứ tự diễn biến thời gian với x1 là các giá trị quan sát tại thời điểm
đầu tiên, x2 là quan sát tại thời điểm thứ 2 và xn là quan sát tại thời điểm thứ n.
Ví dụ: Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay
Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cường hay chỉ số
tiêu dùng đều là những thể hiện rất thực tế của chuỗi thời gian.
Bước đầu tiên của việc phân tích chuỗi thời gian là chọn một mô hình
toán học phù hợp với tập dữ liệu cho trước X:={x1, x2,……… xn}nào đó. Để có
thể nói về bản chất của những quan sát chưa diễn ra, ta giả thiết mỗi quan sát xt
là một giá trị thể hiện của biến ngẫu nhiên Xt với tT. Ở đây T được gọi là tập
chỉ số. Khi đó ta có thể coi tập dữ liệu X:={x1, x2,……… xn} là thể hiện của quá
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
6
trình ngẫu nhiên Xt, tT. Và vì vậy, ta có thể định nghĩa một quá trình ngẫu
nhiên như sau
Định nghĩa 1.1(Quá trình ngẫu nhiên)
Một quá trình ngẫu nhiên là một họ các biến ngẫu nhiên Xt, tT được
định nghĩa trên một không gian xác suất(, ,).
Chú ý:
Trong việc phân tích chuỗi thời gian, tập chỉ số T là một tập các thời điểm,
ví dụ như là tập {1,2..} hay tập (-,+). Tất nhiên cũng có những quá trình ngẫu
nhiên có T không phải là một tập con của R nhưng trong giới hạn của luận văn này
ta chỉ xét cho trường hợp TR. Và thường thì ta xem T là các tập các số nguyên,
khi đó ta sẽ sử dụng ký hiệu tập chỉ số là Z thay vì T ở trên. Một điểm chú ý nữa là
trong luận văn này chúng ta sẽ dùng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ
liệu cũng như quá trình có dữ liệu đó là một thể hiện.
1.2. Quá trình ngẫu nhiên dừng
Định nghĩa 1.2 (Hàm tự hiệp phƣơng sai)
Giả sử Xt, t Z là một quá trình ngẫu nhiên có var(Xt)< với mỗi t
Z. Khi đó hàm tự hiệp phương sai của Xt được định nghĩa theo công thức sau:
)],sX)(rX[(),cov(:),( EsXErXEsXrXsrx với r, s Z.
Định nghĩa 1.3 (Quá trình dừng)
Chuỗi thời gian Xt, t Z được gọi là dừng nếu nó thoả mãn 3 điều
kiện sau:
-
ZtE ,X
2
t
-
ZtmE ,X t
-
Zsrttstrsr xx ,,),,(),(
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
7
Định lý 1.1
Nếu Xt, t Z là một quá trình dừng, và nếu như at R, i Z thoả mãn
điều kiện
i
ia
thì hệ thức
ZtaY
i
it
,X: i-t
sẽ định nghĩa một quá dừng.
Chú ý: Cũng có tài liệu gọi “dừng” theo nghĩa trên là dừng yếu, đừng
theo nghĩa rộng hay dừng bậc hai. Tuy nhiên ở đây ta chỉ xem xét tính dừng
theo nghĩa đã định nghĩa ở trên
Khi chuỗi thời gian Xt, t Z là dừng thì
,,),0,(),( Zsrsrxsrxy
Và vì vậy, với một quá trình dừng thì có thể định nghĩa lại hàm tự hiệp
phương sai bằng cách chỉ thông qua hàm một biến. Khi đó, với quá trình
dừng Xt, t Z ta có:
ZhttXht
XCovhxhxy
,),,()0,()(
Hàm số
(.)xy
được gọi là hàm tự hiệp phương sai của Xt, còn x(h)là
giá trị của nó tại “trễ” h. Đối với một quá trình dừng thì ta thường ký hiệu hàm
tự hiệp phương sai bởi (.) thay vì x(.).
Với một quá trình dừng thì hàm hiệp phương sai có các tính chất
(0) 0, (h)(0), hZ
Và nó còn là một hàm chẵn nghĩa là:
(h) = (-h),hZ.
1.3. Hàm tự tƣơng quan
Định nghĩa 1.4
Hàm tự tương quan của quá trình ngẫu nhiên Xt, t Z được định
nghĩa tại trễ h như sau:
(h): = (h)/(0):=corr(Xt+h,Xt), t, hZ
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
8
Chú ý:
Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn X:={xt, t =
1,2,…n}của một chuỗi thời gian đừng nên về nguyên tắc ta không thể biết
chính xác được các hàm tự hiệp phương sai của chuỗi thời gian đó, muốn ước
lượng nó ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của thể hiện X.
Hàm tự hiệp phương sai mẫu của một thể hiện X được định nghĩa bởi
công thức
nhx
hj
xx
hn
j
jxnnhc
0),)(
1
(11:)(
Và
,0),(:)( hnhchc
trong đó
n
j
jxnx
1
1
là trung bình mẫu.
Khi đó thì hàm tương tự tương quan mẫu cũng định nghĩa thông qua
hàm tự hiệp phương sai mẫu như sau:
.),0(/)(:)( nhchchr
1.4. Toán tử tiến, toán tử lùi
Toán tử lùi B kết hợp với một quá trình ngẫu nhiên Xt, t Z là quá
trình ngẫu nhiên Yt, t Z sao cho
1:: ttt XBXY
Toán tử lìu B là toán tử tuyến tính va khả nghịch. Nghịch đảo của nó
B
-1:=F được gọi là toán tử tiến, định nghĩa bởi công thức:
FXt :=Xt+1
Các toán tử B, F thoả mãn hệ thức
B
n
Xt = Xt-n, F
n
Xt :=Xt+n
Và
i-t
X
0
tX
0
n
i
ia
n
i
iBia
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
9
Chú ý:
Một cách tổng quát, người ta có thể định nghĩa các chuỗi theo toán tử
tiến F hay toán tử lùi b và muốn thế chúng ta hạn chế trong trường hợp các quá
trình là dừng. Khi đó, giả sử ta có quá trình dừng Xt, t Z và một dãy {ai
,iZ tuyệt đối khả tổng, tức là
i i
a
, thì định lý 1.1, quá trình
ZtXaY it
i
it
,:
cũng là quá trình dừng. Ta ký hiệu
i
i
i Ba
là ánh xạ đặt
tương ứng quá trình dừng Xt, t Z với quá trình dừng Yt, t Z. Các
chuỗi theo B khi đó sẽ có những tính chất cho phép ta xử lý nó tương tự như
đối với chuỗi nguyên thông thường. Đặc biệt ta có thể thực hiện phép cộng,
phép nhân hay phép lấy nghịch đảo. Điều này có vai trò quan trọng trong các
phép biến đổi của đa thức tự hồi quy, đa thức trung bình trượt và các phép biến
đổi xử lý chuỗi thời gian khác.
2. Quá trình ARMA
2.1. Quá trình tự hồi quy
Định nghĩa 1.5 (Quá trình ồn trắng)
Quá trình ngẫu nhiên t tZ được gọi là một ồn trắng, ký hiệu
WN(0,2), khi nó thoả mãn các điều kiện sau:
Ets = 0 (t s)
22 tE
ttE ,0
Định nghĩa 1.6 (Quá trình tự hồi quy)
Người ta gọi quá trình ngẫu nhiên Xt, t Z là một quá trình tự hồi
quy cấp P, viết là Xt AR(p), là một quá trình dừng {Xt, tZ} thoả mãn
0,p-tX...2211
patpat
Xa
t
XatX
.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
10
với {} là một ồn trắng.
Ta có thể viết biểu thức của quá trình tự hồi quy ở trên bởi công thức
,0,p-tX....2211
patpat
Xa
t
XatX
Hay ở dạng
toán tử
ở đây a(z) được gọi là đa thức hồi quy.
Chú ý:
Nếu đa thức a(z) ở trên có nghiệm nằm ngoài đĩa tròn đơn
vị
)1( z
thì Xt được gọi là quá trình nhân quả tự hồi qui cấp p và nói chung ta
chỉ xét các quá trình nhân quả.
Các đặc trưng của quá trình tự hồi quy cấp p:
- E(Xt) = 0
-
p
t
i ia
1
2|)()0(
-
0,0)(
1
)(
hih
p
i
iah
Lần lượt cho h = 1,2,….p ta được
p
p
a
a
a
a
1
2
1
=
)(
)1(
......
)2(
)1(
p
p
Hệ phương trình gọi là hệ phương trình Jule – Walker, song tuyến đối
với a và .
1 (1) …. (p-2) (p-1)
(1) 1 …. (p-3) (p-1)
…. …. …. …... …..
(p-2)…. (p-3) 1 (1)
(p-1) (p-2) (1) 1
p
zpazazaza ...
2
21
1:)(
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
11
Nghĩa là nếu cho ta sẽ tính được a và ngược lại cho a ta cũng sẽ tính
được . Trong hệ phương trình Jule – Walker, nếu ta đặt pi = ai, i =1,…p thì
hệ phương trình Jule – Walker tương đương với
pjpjj p ,...,1),()( 1
Đại lượng pp ở trên được gọi là tự tương quan riêng cấp p của quá trình
{Xt, nó đóng vai trò rất quan trọng trong việc xác định bậc của quá trình tự
hồi quy cũng như việc ước lượng tham số mô hình tự hồi quy sau này.
Trong việc thực tế, khi cho chuỗi quan sát X:=x1, t = 1,2…,n thì ta
dùng công thức của tương quan mẫu để tính các r(i), là các giá trị xấp xỉ của
(i). Khi đã có các tự tương quan mẫu ta thay vào hệ phương trình Jule –
Walker và giải nó để tìm các tham số a1. Từ đây ta cũng xác định được tương
quan riêng p1….,pp.
2.2. Quá trình trung bình trƣợt
Định nghĩa1.7 (Quá trình trung bình trƣợt)
Một quá trình trung bình trượt cấp q, ký hiệu Xt MA(q), là một quá
trình Xt, t Z thoả mãn biểu thức
0,,...,
21
,....
111
qbRqbbbqtqbt
btX
với t là một ồn trắng.
Ta cũng có thể viết biểu thức trung bình trượt ở trên dưói dạng toán tử
lìu tương tự như đối với quá trình tự hồi quy như sau :
Xt = b(B)t,
Trong đó hàm b(.) định nghĩa bởi
b(z) : = 1+b1z+…+bqz
q.
Ở đây b(z) được gọi là đa thức trung bình trượt .
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
12
Chú ý:
Khác với quá trình AR, biểu thức trên luôn xác định duy nhất một quá
trình MA mà không đòi hỏi thêm điều kiện gì đối với các hệ số b1. Và với giả
thiết t là ồn trắng thì theo định lý 1.1 ta có
b(z)(z) = 1.
Và khi đó 1 có thể biểu diễn dưới dạng
j j
j
z
j j
z
j jt
Xjt ;)(;
Một chú ý nữa, cũng giống như trường hợp AR, nếu đa thức trung bình
trượt b(z) không có nghiệm có môđun bằng 1 thì ta có thể biểu diễn Xt dưới
dạng sau:
j
jtjt
j
jt XX ;
1
Và có thể xác định
i
bằng cách chia 1(theo luỹ thừa tăng) cho
b(z),
)1( 0
..
Khi quá trình
tX
có thể biểu diễn ở dạng trên, tức là khi b(z) chỉ có
nghiệm có môđun lớn hơn 1 thì ta nói
tX
là một quá trình khả nghịch. Và từ
nay về sau, nếu không nói gì thêm thì khi nói về các quá trình AR và MA
chúng ta hiểu đó là các quá trình nhân quả và khả nghịch.
Các đặc trưng của quá trình trung bình trượt:
Trước hết, ta dễ dàng thấy rằng
0tEX
,
Và
s
qiitsb
ts
ttXE
,0
1;,
1
2
,2
)(
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
13
Mặt khác ta có:
))
1111
(()(:)(
qhq
b
h
b
htt
XE
ht
XtXEh
Từ đó ta suy ra
qhh
qhbqbhq
b
h
bb
h
bh
,0)(
1;1:
0
),...
11
(2)(
Đặc biệt ta có
2...2
1
1(2var:)0( qbbtX
Từ công thức hiệp sai của quá trình trung bình trượt ta suy ra công thức
của tự tương quan như sau:
qh
qh
qbb
qbhq
b
h
bb
h
b
h
.,0
....2,1,
2....2
1
1
....
11
)(
2.3. Quá trình tự hồi quy trung bình trƣợt
Định nghĩa 1.8 (quá trình tự hồi quy trung bình trượt)
Một quá trình Xt, t Z được gọi là quá trình tự hồi quy trung bình
trượt cấp p,q , kí hiệu
tX
ARMA(p,q) là một quá trình Xt, t Z thỏa mãn
0,0,,...,
2
,
1
,,...
2
,
1
,
...
11
....
11
qbpaRqbbbpaaaqtqb
t
btptXpat
XatX
Trong đó
t
là ồn trắng, a(.) và b(.) lần lượt là đa thức tự hồi quy và đa
thức trung bình trượt có bậc tương ứng là p và q:
p
zpazaza ...1
1:)(
qzqbzbzb ...1
1:)(
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
14
Khi đó ta có thể viết quá trình ARMA ở dạng toán tử như sau
tBbtXBa )()(
Định nghĩa 1.9 (Quá trình nhân khả nghịch)
Một quá trình ARMA(p,q) được gọi là một quá trình nhân quả và khả nghịch
nếu có là một quá trình ARMA(p,q) có a(z) và b(z) thỏa mãn hai điều kiện:
i) a(z) và b(z) không có nghiệm chung
ii) a(z) và b(z) không có nghiệm có môđun không vượt quá 1
Chú ý:
Do tính nhân quả và khả nghịch cộng với tính chất khả đảo của đa
thức toán tử, ta có thể biểu diễn một quá trình
.
1
;1
0
,
0
i
i
i
itit
X
Và có thể tính các hệ số
t
bằng cách chia theo lũy thừa tăng a(z) cho b(z).
Các đặc trưng của quá trình ARMA:
Trước hết ta có
)(
.1
)(
1 .
)(
1
)()( ih
X
q
i
i
bh
p
t X
iha
ht
XtXEh
Với
kt
XtEkX
(:)(.
Mặt khác ta có thể biểu diễn
ikti
ikt
X
0
Và ta có
0,2
0,0
)(
. k
k
k
k
Xe
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
15
Lần lượt cho h = 0,1,...p trong các chương trình trên và chú ý đến tính
chẵn của hàm (h) ta có hệ phương trình tuyến tính đối với (0),..., (p) hay
với
).(),...1( p
p
i
i qhihah
1
),()(
Và vì thế
p
i
qhih
i
ah
1
.),()(
3. Ước lượng tham số mô hình ARMA
Giả sử ta cần ước lượng các tham số của mô hình ARMA(p,q)
,0,0,,...,
2
,
1
,,...,
2
,
1
,...
11
...
11
qbpaRqbbbpaaaqtqbt
btptXpat
XatX
trong đó
t
đóng vai trò là sai số.
Đối với mô hình ARMA cũng có nhiều phương pháp ước lượng tham số
hiệu quả và được nêu ra chi tiết trong P.Brockwell, R. David, 2001. Dưới đây,
ta sẽ xem xét phương pháp bình phương cực tiểu theo kiểu thuật toán Hannan
– Rissanen. Ý tưởng của thuật toán này là sử dụng hồi quy tuyến tính để ước
lượng các tham số. Nếu q>0 ta còn phải ước lượng các giá trị chưa biết
t
.
Thuật toán Hannan – Rissanen
Bước 1:
Dùng ước lượng Yule Walker để ước lượng các tham số mô hình
AR(m), với m > max(p,q).
Bước 2:
Ước lượng vecto tham số
t
qbbpaa )....,1
,,...,
1
(
trên cơ sở cực tiểu
hóa hàm
.,...,1,...
11
nmttmtXmat
XatX
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
16
.2)...
21
...
22111
()( theoqtqbtbptxpatxatxan qmt txS
Giải hệ Gauss-Markov, kết quả thu được ở dạng sau:
,1)( nX
tZZtZ
Ta cũng có thể dùng phương pháp trực giao hóa Househoder để tìm
Ở đây,
nXqm
XnX ,...,1
(
)
Và
qnnnpn
X
n
X
n
X
mqmqmpqm
XqmXqm
X
mqmqmpqm
X
qm
XqmX
Z
...
22
....
21
.......
2
...
12
...
1
1
...
11
...
1
Ước lượng phương sai
t
theo công thức
.
)(2
qmn
S
HR
4. Những hạn chế của mô hình ARMA trong chuỗi thời gian tài chính
Mô hình ARMA thu được thành công lớn khi áp dụng cho các chuỗi
thời gian xuất phát từ các lĩnh vực khoa học tự nhiên và kỹ thuật nhưng thất
bại khi áp dụng cho các chuỗi thời gian kinh tế và tài chính. Nguyên nhân
chính là giả thiết về mặt toán học phương sai của các chuỗi thời gian tài chính
không thay đổi theo thời gian là không phù hợp. Và vì vậy mô hình ARMA có
thể dự báo được kỳ vọng nhưng thất bại khi dự báo phương sai của chuỗi thời
gian tài chính. Sau đây ta sẽ xem xét một ví dụ cụ thể để thấy rõ sự không phù
hợp của mô hình ARMA đối với chuỗi thời gian tài chính.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
17
Xét chuỗi số chuỗi số liệu NYSE chứa giá trị của chỉ số chứng khoán
giao dịch hằng ngày trên thị trường NewYork từ tháng ngày 02/01/1990 đến
ngày 31/12/2001. Chuỗi gồm 3028 số liệu được lưu dưới tên file là NYSE.txt.
Tuy nhiên thay vì trực tiếp làm việc với chuỗi số liệu gốc, ta lấy logarit tự
nhiên của chuỗi gốc rồi lấy lại sai phân của nó để được một chuỗi mới mà
trong lĩnh vực kinh tế tài chính ta gọi là chuỗi tăng trưởng.
Từ số liệu ở trên, chuỗi giá và chuỗi tăng trưởng được minh họa bằng đồ
thị sau
Hình 1.1 Chuỗi giá
Hình 1.2 Chuỗi tăng trưởng
Nhìn vào đồ thị của chuỗi giá, rõ ràng ta thấy nó không có tính dừng.
Ngược lại, chuỗi tăng trưởng có đồ thị rất giống với một quá trình dừng. Khi
nhìn vào đồ thị của chuỗi tăng trưởng ta cũng thấy có xuất hiện những cụm
biến động, có vùng biến đổi về phương sai của chuỗi thời gian. Tiếp theo ta sẽ
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
18
khai thác đặc trưng tương quan riêng mẫu của chuỗi tăng trưởng ở trên. Kết
quả được minh họa bằng đồ thị sau:
Hình 1.3 Tự tương quan của chuỗi tăng trưởng
Hình 1.4 Tự tương quan riêng của chuỗi tăng trưởng
Ta thấy rằng tương quan riêng của chuỗi tăng trưởng biến đổi trong một
khoảng tương đối hẹp khá giống với tự tương quan riêng của một quá trình
dừng. Tuy nhiên ta lại không thấy được dấu hiệu triệt tiêu của tự tương quan
riêng mặc dù ta đã lấy đến trễ 100. Điều này cho thấy cho chuỗi tăng trưởng
chắc chắn không thể là một quá trình tự hồi quy. Ta cũng biết rằng, về mặt lý
thuyết có thể xấp xỉ mô hình AR nhiều tham số bằng mô hình ARMA với ít
tham số hơn. Điều này cũng cho thấy mô hình ARMA nhiều khả năng không
phù hợp với chuỗi tăng trưởng của chúng ta.
Bây giờ ta lấy bình phương chuỗi tăng trưởng, kết quả cho bởi đồ thị
dưới đây
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
19
Hình 1.5 Bình phương chuỗi tăng trưởng
Nhìn vào đồ thị ta có thể ta có thể thấy được việc tạo thành các cụm biến
động trong đó các thời kỳ và biến động mạnh xen kẽ nhau. Ta tính tiếp các đặc
trưng mẫu của bình phương chuỗi tăng trưởng. Kết quả được thể hiện bằng các
đồ thị sau
Hình 1.6 Tự tương quan của bình phương chuỗi tăng trưởng
Hình 1.7 Tự tương quan riêng của bình phương chuỗi tăng trưởng
Mặc dù chuỗi tăng trưởng ít tương quan nhưng bình phương của nó lại
thể hiện sự tương quan mạnh. Những dấu hiệu đó cho ta thấy rằng mô hình
ARMA không thực sự phù hợp với chuỗi thời gian qua sát này.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
20
Bây giờ giả sử bằng cách nào đó ta tìm được mô hình ARMA gần nhất
với chuỗi quan sát và đó là mô hình ARMA(1,1). Mục đích ở đây là chúng ta
sẽ thấy rõ ràng sau khi ước lượng, nhiễu thu được sẽ không phải là một ồn
trắng như ta mong muốn nữa. Thật vậy, kết quả ước lượng theo mô hình
ARMA(1,1) là
tty 00049332.0
Nhiễu khi đó được tính toán và biểu diễn bởi đồ thị sau
Hình 1.8 Nhiễu
Khi đó tự tương quan và tự tương quan riêng của nhiễu cho bởi đồ thị
dưới đây
Hình 1.9 Tự tương quan của nhiễu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
21
Hình 1.10. Tự tương quan riêng của nhiễu
Ban đầu, do tính ít tương quan của nhiễu ước lượng được nên ta thấy nó
giống với một quá trình ồn trắng. Tuy nhiên khi lấy bình phương nhiễu ta lại
thấy khác
Hình 1.11. Bình phương nhiễu
Hình 1.12 Tự tương quan bình phương nhiễu
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
22
Hình 1.13 Tự tương quan riêng bình phương nhiễu
Rõ ràng là nhiễu có hiện tượng tạo cụm biến động giống như chuỗi tăng
trưởng ban đầu. Còn khi nhìn vào đồ thị tự tương quan của bình phương nhiễu
ta thấy nó thể hiện sự tương quan mạnh nên ta có thể kết luận rằng nhiễu
không phải là một ồn trắng như mong muốn. Và như vậy mô hình ARMA sẽ
không phù hợp với chuỗi số liệu này.
Mặc dù mô hình ARMA tỏ ra không phù hợp với chuỗi thời gian tài
chính nhưng những kỹ thuật mà nó cung cấp là một cơ sở rất quan trọng và
mang lại nhiều gợi ý cho các công trình nghiên cứu về chuỗi thời gian sau
Box-Jenkins. Chính Box-Jenkins là những người đầu tiên đưa ra các kỹ thuật
lấy sai phân để khử khuynh tất định nhằm tăng khả năng dừng của một chuỗi
thời gian. Với những vận dụng sáng tạo khái niệm khuynh này, những người
nghiên cứu đi sau Box-jenkins đã cho ra đời hai lớp mô hình rất quan trọng đối
với chuỗi thời gian tài chính. Đó là mô hình cộng tích, Cointegration
(Granger,1981) và mô hình tự hồi quy biến động bất thường của chuỗi thời
gian tài chính. Mô hình ARCH là cống hiến mang tính khai phá của Engle, nó
có thể giải thích sự bất thường của phương sai mà chỉ sử dụng những thông tin
quá khứ của bản thân nhiễu. Mô hình GARCH (Generalized Autoregressive
Conditional Heteroschedasticity) đầu tiên được giới thiệu bởi Tim Bollerslev
năm 1986 đã làm cho lớp mô hình này có nhiều ứng dụng thực tế hơn trong
lĩnh vực kinh tế tài chính.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
23
CHƢƠNG 2
LÝ THUYẾT TẬP MỜ VÀ CHUỖI THỜI GIAN MỜ
Trong các bộ môn toán cơ bản, chúng ta đã rất quen thuộc với suy luận
logic nguyên thuỷ hay logic rõ với hai giá trị đúng/sai hay 1/0. Tuy nhiên, các
suy luận này không đáp ứng được hầu hết các bài toán phức tạp nảy sinh trong
thực tế như những bài toán trong lĩnh vực điều khiển tối ưu, nhận dạng hệ
thống,…mà các dữ liệu không đầy đủ, không được định nghĩa một cách rõ
ràng. Trong những năm cuối thập kỷ 20, một ngành khoa học mới đã được
hình thành và phát triển mạnh mẽ đó là hệ mờ. Đây là hệ thống làm việc với
môi trường không hoàn toàn xác định, với các tham số, các chỉ tiêu kinh tế kỹ
thuật, các dự báo về môi trường sản xuất kinh doanh chưa hoặc khó xác định
một cách thật rõ ràng, chặt chẽ. Khái niệm logic mờ được giáo sư Lofti
A.Zadeh đưa ra lần đầu tiên vào năm 1965 tại Mỹ. Từ đó lý thuyết mờ đã được
phát triển và ứng dụng rộng rãi.
Trong chương này chúng ta tập trung trình bày một số kiến thức
cơ bản về hệ mờ có liên quan tới mô hình mà chúng ta sẽ nghiên cứu.
1. Lý thuyết tập mờ
1.1. Tập mờ
Định nghĩa: Cho Ω( Ω ≠ ) là không gian nền, một tập mờ A trên
Ω được xác định bởi hàm thuộc( membership function):
A: Ω [0,1]
0 A(x) 1
A(x) : Chỉ độ thuộc (membership degree) của phần tử x vào tập mờ A
(để cho đơn giản trong cách viết, sau này ta ký hiệu A(x) thay cho hàm A(x))
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
24
Khoảng xác định của hàm A(x) là đoạn [0,1], trong đó giá trị 0
chỉ mức độ không thuộc về còn giá trị 1 chỉ mức độ thuộc về hoàn toàn.
Ví dụ 1: Hàm liên tục của tập mờ A “tập các số thực gần 1” được
định nghĩa như sau: A(x) = 2)1( xae
Hình 2.1. Hàm liên thuộc của tập mờ “x gần 1”
Ví dụ 2: Một số dạng hàm liên thuộc liên tục khác
Triangle(x, a, b, c) = max(min(
)0),,1,
bc
xc
ab
ax
Trapezoid(x, a, b, c ,d) = max(min(
)0),,1,
cd
xd
ab
ax
Gaussian(x,
,,c
)= 2))( cxe
Bell(x, a, b, c) =
b
a
cx
2
1
1
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
25
Hình 2.2. Một số dạng hàm liên thuộc của tập mờ
1.2. Các phép toán trên tập mờ
1.2.1 Phép bù của tập mờ
Định nghĩa 1: (Hàm phủ định): Hàm n: [0,1] không tăng thỏa mãn các
điều kiện n(0) = 1, n(1) = 0 được gọi là hàm phủ định (negation function).
Định nghĩa 2: (Phần bù của một tập mờ): Cho n là hàm phủ định, phần
bù A
c
của tập mờ A là một tập mờ với hàm thuộc được xác định bởi:
A
c
(x) = n(A(x)), với mỗi x
1.2.2. Phép giao hai tập mờ
Định nghĩa 3( T - chuẩn): Hàm T: [0,1]2 [0,1] là phép bội (T -
chuẩn) khi và chỉ khi thoả mãn các điều kiện sau:
1.T(1, x) = x, với mọi 0 x 1.
2.T có tính giao hoán : T(x,y) = T(y,x), với mọi 0 x, y 1.
3. T không giảm: T(x,y)=T(u,v), với mọi x u, y v.
4. T có tính kết hợp: T(x,T(y,z)) = T(T(x,y),z), với mọi 0 x,y, z 1.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
26
Định nghĩa 4 (Phép giao hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tương ứng. Cho T là một T-
Chuẩn. Phép giao của hai tập mờ A,B là một tập mờ (ký hiệu (ATB)) trên
với hàm thuộc cho bởi biểu thức:
(ATB)(x) = T(A(x), B(x)), với mỗi x
Ví dụ:
- Với T(x,y)=min(x,y)ta có: (ATB)(x) = min(A(x),B(x))
- Với T(x,y) = x,y ta có (ATB)(x) = A(x).B(x) (tích đại số)
Ta có thể biểu diễn phép giao của hai tập mờ qua hai hàm
T(x,y)=min(x,y) và T(x,y) = x.y theo các đồ thị hình 1.3 sau đây:
- Hình a: Hàm thuộc của hai tập mờ A và B
- Hình b: Giao của hai tập mờ theo T(x,y)=min(x,y)
- Hình c: Giao của hai tập mờ theo T(x,y)=x.y
Hình 2.3. Giao của hai tập mờ
1.2.3. Phép hợp hai tập mờ
Định nghĩa 5 (T - đối chuẩn): Hàm S:[0,1]2 được gọi là phép tuyển (
T-đối chuẩn) nếu thoả mãn các điều kiện sau:
1. S(0,x) = x, với mọi 0 x 1.
2. S có tính giao hoán : S(x,y)= S(y,x) với mọi 0 x , y 1.
3. S không giảm: S(x,y)= S(u,v), với mọi x u, y v.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
27
4. S có tính kết hợp: S(x,S(y,z)) = S(S(x,y),z) với mọi 0 x, y,
z1.
Định nghĩa 6 (phép hợp hai tập mờ): Cho hai tập mờ A, B trên cùng
không gian nền với hàm thuộc A(x), B(x) tương ứng. Cho S là một T - đối
chuẩn. Phép hợp của hai tập mờ A, B là một tập mờ ( kí hiệu ASB)) trên
với hàm thuộc cho bởi biểu thức:
(ASB)(x)=S(A(x),B(x)), với mỗi x
Ví dụ:
- Với S(x,y) = max(x,y): (ASB)(x)= max(A(x), B(x))
- Với S(x,y) = x + y – x.y: (ASB)(x)= A(x) + B(x) – A(x)
.B(x)
- Ta có thể biểu diễn phép hợp của hai tập mờ qua hai hàm
S(x,y)=max(x,y) và S(x,y)=x+y – x.y theo các đồ thị hình 2.4 sau đây:
- Hình a: Hàm thuộc của hai tập mờ A, B
- Hình b: Hợp của hai tập mờ theo S(x,y) = max(x,y)
- Hình c: Hợp của hai tập mờ theo S(x,y) = x + y – x.y
Hình 2.4. Phép hợp của hai tập mờ
1.2.4. Luật De Morgan
Cho T là T - chuẩn, S là T - đối chuẩn và n là phép phủ định mạnh.
Khi đó bộ ba(T, S,n) là bộ ba De Morgan nếu:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
28
n(S(x,y)) = T(n,(x),n(y))
Với phép phủ định n(n-1) = 1- x, chúng ta có một số cặp T-chuẩn
và T-đối chuẩn thoả mãn luật DeMorgan trong bảng 2.1
STT T(x,y) S(x,y)
1 Min(x,y) Max(x,y)
2 x.y x+ y – x.y
3 Max(x + y -1, 0) Min(x + y,1)
4
Min0(x,y)=
ifyx ),min(
0
x + y >1
Max1(x,y)=
ifyx ),max(
0
x + y <1
5 Z(x,y) =
ifyx ),min(
0
max(x,y)=1
Max1(x,y)=
ifyx ),max(
0
min(x,y)=0
6
0,
))(1(
.
),(
y
xyyx
yx
yxH
0,
.)1(1
.)2(
),(
y
yx
yxyx
yxH
7
0,)1(,1min1),(
1
pxyxY
PP
0,,1min(),( pyxyxY P PPP
Bảng 2.1 : Các cặp T - chuẩn và T - đối chuẩn.
1.2.5. Phép kéo theo
Cho (T, S, n) là một bộ ba De Morgan với n là phép phủ định,
phép kéo theo lS(x,y) hay xy được xác định trên khoảng [0,1]
2
được định
nghĩa bằng biểu thức sau đây:
lS(x,y) = S(T(x,y),n(x))
Else Else
Else Else
Else
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
29
Bảng 1.2 dưới đây sẽ liệt kê một số phép kéo theo mờ hay được sử
dụng nhất.
STT Tên Biểu thức xác định
1 Early Zadeh xy = max(1-x,min(x,y))
2 Lukasiewicz xy = min(1,1- x+y)
3 Mandani xy = min(x,y)
4 Larsen xy = x.y
5 Standard Strict xy =
yx
if
other
1
0
6 Godel xy =
yx
if
othery
1
7 Gaines xy =
yx
other
if
x
y
1
8 Kleene – Dienes xy = max(1 –x,y)
9
Kleene – Dienes –
Lukasiwicz
xy = 1- x + y
10 Yager xy = yx
Bảng 2.2. Một số phép kéo theo mờ thông dụng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
30
2. Các quan hệ và suy luận xấp xỉ, suy diễn mờ
2.1. Quan hệ mờ
2.1.1. Khái niệm về quan hệ rõ
Định nghĩa 7: Cho X , Y, R X Y là một quan hệ ( quan
hệ nhị nguyên rõ), khi đó
Khi X= Y thì R X Y là quan hệ trên X
Quan hệ R trên X được gọi là:
- Phản xạ nếu: R(x,x) = 1 với x X
- Đối xứng nếu: R(x,y) = R(y,x) với x, y X
- Bắc cầu nếu: (xRy)(yRz) (xRz) với x,y,z X
Định nghĩa 8: R là quan hệ tương đương nếu R là quan hệ nhị
nguyên trên X có tính chất phản xạ, đối xứng và bắc cầu.
2.1.2. Các quan hệ mờ
Các quan hệ mờ là cơ sở dùng để tính toán và suy diễn ( suy luận
xấp xỉ) mờ. Đây là một trong những vấn đề quan trọng trong các ứng dụng mờ
đem lại hiệu quả lớn trong thực tế, mô phỏng được một phần suy nghĩ của con
người. Chính vì vậy, mà các phương pháp mờ được nghiên cứu và phát triển
mạnh mẽ. Tuy nhiên chính logic mờ mở rộng được nghiên cứu và phát triển
mạnh mẽ. Tuy nhiên chính logĩ mờ mở rộng từ logic đa trị, do đó nảy sinh ra
rất nhiều các quan hệ mờ, nhiều cách định nghĩa các toán tử T-chuẩn, T-đối
chuẩn, cũng như các phương pháp mờ hoá, khử mờ khác nhau,…Sự đa dạng
này đòi hỏi người ứng dụng phải tìm hiểu để lựa chọn phương pháp thích hợp
nhất cho ứng dụng của mình.
0 if (x,y)R y)( xR
R(x,y) =
1 if(x,y) (x,y) R ( xRy)
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
31
Định nghĩa 9: Cho U ; V ; R là một tập mờ trên U V gọi là
một quan hệ mờ( quan hệ hai ngôi).
0 R (x,y) = R(x,y) 1
Tổng quát: RU1U2……..Un là quan hệ n ngôi
0 R(u1, u2,……un) = R(u1, u2,…..un) 1
2.1.3. Các phép toán của quan hệ mờ
Định nghĩa 10: Cho R là quan hệ mờ trên XY, S là quan hệ mờ trên
YZ, lập phép hợp thành SoR là quan hệ mờ trên XZ
Có R(x,y) với (x,y) XY, S(y,z) với (y,z)YZ. Định nghĩa phép hợp
thành:
Phép hợp thành max – min xác định bởi:
(S R)(x,z) =
Yy
Sup
(min(R(x,y),S(y,z))) (x,z)XZ
Phép hợp thành max – prod xác định bởi:
(S R)(x,z) =
Yy
Sup
(min(R(x,y) S(y,z))) (x,z)XZ
Phép hợp thành max – T ( với T là T - chuẩn) xác định bởi:
(S TR)(x,z) =
Yy
Sup
(T(R(x,y) , S(y,z))) (x,z)XZ
2.2. Suy luận xấp xỉ và suy diễn mờ
Suy luận xấp xỉ hay còn gọi là suy luận mờ - đó là quá trình suy ra
những kết luận dưới dạng các mệnh đề trong điều kiện các quy tắc , các luật,
các dữ liệu đầu vào cho trước cũng không hoàn toàn xác định.
Trong giải tích toán học chúng ta sử dụng mô hình sau để lập luận:
Định lý: “Nếu một hàm số là khả vi thì nó liên tục”
Sự kiện: Hàm khả vi
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
32
Kết luận: Hàm là liên tục
Đây là dạng suy luận dựa vào luật logic cổ điển Modus Ponens.
Căn cứ vào mô hình này chúng ta sẽ diễn đạt cách suy luận trên dưới dạng sao
cho nó có thể suy rộng cho logic mờ.
Gọi là không gian tất cả các hàm số, ví dụ ={g:RR}. A là các tập
các hàm khả vi, B là tập các hàm liên tục. Xét hai mệnh đề sau: P=’gA’ và Q
=’gB’. Khi đó ta có:
Luật (tri thức): PQ
Sự kiện: P đúng (True)
Kết luận: Q đúng (True)
Xét bài toán suy luận trong hệ mờ
Hệ mờ n biến vào x1, …..xn và một biến ra y
Cho Un, i= n..n là các không gian nền của các biến vào , V là không
gian nền của biến ra.
Hệ được xác định bởi m luật mờ”
R1: Nếu x1 là A11và x2 và ….xn là A1n thì y là B1
R2: Nếu x1 là A21 và x2 là A22 và…xn là A2n thì y là B2
.........................................................................................
Rm: Nếu x1 là Am1 và x2 là Am2 và ……xn là Amn thì y là Bm
Thông tin đầu vào:
X1 là A01 và x2 là A02 và….x0n là A0n
Tính: y là B0
Trong đó biến mờ ji,
mjni ,1,,1
xác định trên không gian nền U, biến
mờ Bj, (
),1( nj
xác định trên không gian nền V.
Để giải bài toán này chúng ta phải thực hiện qua các bước sau:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
33
1. Xác định các tập mờ của các biến đầu vào.
2. Xác định độ liên thuộc tại các tập mờ tương ứng.
3. Xác định các quan hệ mờ R(A.B)(u,v).
4. Xác định phép hợp thành.
Tính B’ theo công thức: B’ = A’R(A,B)(u,v).
3. Hệ mờ
Kiến trúc cơ bản của một hệ mờ gồm 4 thành phần chính: Bộ mờ
hoá, hệ luật mờ, động cơ suy diễn mờ và bộ giải mờ như hình 2.5 dưới đây
Hình 2.5 Cấu hình cơ bản của hệ mờ
Không làm mất tính tổng quát, ở đây ta chỉ xét hệ mờ nhiều đầu vào,
một đầu ra ánh xạ tập compact S Rn vào R. Các thành phần của hệ mờ được
miêu tả như sau.
3.1. Bộ mờ hoá
Thực hiện việc ánh xạ từ không gian đầu vào S vào các tập mờ xác định
trong S được cho bởi hàm thuộc : S [0,1]. Bộ phận này có chức năng chính
dùng để chuyển một giá trị rõ x X thành một giá trị mờ trong S U (U là
không gian nền). Có hai phương pháp mờ hoá như sau:
Bộ mờ hoá
Bộ giải hoá
(Dauzzifier)
Các tập mờ
đầu vào
Các tập mờ
đầu vào
Đầu ra rõ
Hệ luật mờ
(Fuzzy Rule Base)
Động cơ suy diễn mờ
(Fuzzy Interence Engine)
Đầu vào rõ
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
34
Singleton fuzzifiter: Tập mờ A với x1 và hàm liên
thuộc được định nghĩa như sau
No – Singleton fuzziffier: Với các hàm liên thuộc
nhận giá trị lớn nhất là 1 tạo x = xi và giảm dần từ 1 đến 0 với các
giá trị dịch chuyển x x1.
3.2. Hệ luật mờ
Gồm nhiều mệnh đề dạng:
IFTHEN<tập các hệ
quả>
Giả sử hệ luật gồm M luật Rj (j=
M,1
) dạng
R
j
: IF x1 is
andiA
x2 is
nxandA .....2
is j
nA
THEN y is B
j
Trong đó xi (i =
n,1
) là các biến đầu vào hệ mờ, y là biến đầu ra của hệ
mờ - các biến ngôn ngữ,
j
iA
là các tập mờ trong các tập đầu vào X và jB là
các tập mờ trong các tập đầu ra Y – các giá trị của biến ngôn ngữ (ví dụ: “Rất
nhớ”, “nhỏ”, “Trung bình”, “Lớn”, “Rất lớn”,)đặc trưng bởi các hàm thuộc
j
i
A
và
jB
. Khi đó jR là một quan hệ mờ từ các tập mờ đầu vào X = X1
X2 ...... Xn tới các tập mờ đầu ra Y.
0 if x xi
1 if x = xi
A(x) =
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
35
3.3. Động cơ suy diễn
Đây là một bộ phận logic đưa ra quyết định sử dụng hệ mờ để
thực hiện ánh xạ từ các tập mờ trong không gian đầu vào X thành tập mờ trong
không gian đầu ra Y.
Khi R
j
là một quan hệ mờ, thì Rj có thể là một tập con của tích
Decart X Y =
:),( yx ,, YyXx
với
T
nxxxx )......,,( ,21
. Vì vậy, quan hệ
R
j
là một hàm ánh xạ từ tập mờ trong X tới tập mờ trong
Y,
j
B
j
n
Ajj xAA ....21
được gọi là một dạng suy diễn mờ( để cho gọn, ta ký hiệu
A
j
=
j
n
A
j
xA
j
A ...
21
)
Giả sử A là một tập mờ trong X và là đầu vào của bộ suy diễn.
Khi đó mỗi luật Rj tạo ra một tập mờ Bj trong Y như sau:
B
j =
A Rj = sup (A*Rj)
Với * là một toán tử T - chuẩn được định nghĩa trong bảng 2.1. Do tính
kết hợp, ta có thể định nghĩa:
T
2
(x,y) = T(x,y)
T
3
(x,y,z) = T(x,T
2(y,z)) với 0 x, y, z1
........
Dùng quy nạp ta định nghĩa:
T
n
(x1,x2,..., .xn) = T(x1, T
n-1
(x2,....xn)) với 0 xi 1
Quan hệ Rj được định nghĩa thông qua hàm phụ thuộc sau:
)))(),((),(),( yjB
xjA
TyxjBA
yxjR
))()),(),...,
1
(
1
(( nx
nA
nxi
nA
xjA
nTT
Và hàm liên thuộc của tập A là
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
36
))(),...(),(()( 21 2 nAA
n
A xxxTx n
Do đó, hàm liên thuộc của tập mơg đầu ra được tính như sau:
),(*)(sup)( yx
j
R
x
A
Ux
y
j
B
3.4. Bộ giải mờ
Đây là một ánh xạ từ các từ các tập mờ trong R thành các giá trị
rõ ràng trong R. Có nhiều phép giải mờ, với mỗi ứng dụng sẽ có một phương
thức giải mờ khác nhau tuỳ thuộc yêu cầu ứng dụng. Dưới đây sẽ liệt kê một số
phương thức giải mờ thông dụng.
Phương pháp độ cao:
M
i
j
y
jB
M
i
j
y
jB
j
y
x
h
y
1
)(
'
1
)(
'
)(
Với j là chỉ số luật , y-j là điểm có độ liên thuộc lớn nhất trong
tập mờ đầu ra B’j , thứ j và
)(
,
j
yjB
được tính theo công thức
))(),...(),(()( 21 2 nAA
n
A xxxTx n
như sau:
)'(*....*)'
2
(
2
*)
1
'(
1
*)()(
'
nx
nA
x
A
x
A
j
yjB
j
yjB
Phương pháp độ cao biến đổi:
M
i
jj
yjB
M
i
jj
yjB
j
y
x
mh
y
1
2
/)(
'
1
2
/)(
'
)(
với j hệ số biến đổi của luật j
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
37
Phương pháp trọng tâm
N
i
iyB
N
i
iyBi
y
xcy
1
)(
1
)(
)(
Phương pháp tâm của các tập (Center – of – Sets):
phương pháp này mỗi luật được thay thế bởi tập singleton tâm cj
M
i
ixj
i
A
n
i
T
M
i
ixj
i
A
n
i
T
j
c
xy
1
)(
1
1
)(
1
)(cos
3.5. Ví dụ minh hoạ
Xét hệ mờ với hai luật mờ và các hàm liên thuộc của các tập mờ đầu
vào, đầu ra như biểu diễn tại hình 1.6. Mỗi luật mờ có hai đầu vào hình a1, a2,
b1,b2 và một đầu ra hình a3, b3. Giả sử chúng ta thử nghiệm với hai giá trị đầu
vào là x1 = 0.15 và x2 = 0.5, sử dụng dạng T-chuẩn MIN(T(x,y) = x.y)tính được
tổng hợp của các tập mờ phía IF và phía THEN hình (d). Sử dụng T- đối chuẩn
cho tất cả các đầu ra như hình (e).
- Phương pháp độ cao:
5556.0
1.08.0
11.05.08.0
h
y
- Phương pháp độ cao biến đổi: giả sử 1 = 0.4 và 2 =0.2. Ta có :
6667.0
22.0
1.0
24.0
8.0
22.0
11.0
24.0
)5.08.0(
h
y
- Phương pháp trọng tâm:
6333.0
1.08.0
9.01.06.08.0
h
y
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
38
Hình 2.6. Minh hoạ các phương pháp giải mờ
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
39
CHƢƠNG 3
MỘT SỐ THUẬT TOÁN CƠ BẢN TRONG CHUỖI THỜI GIAN
MỜ VÀ MỘT SỐ THUẬT TOÁN CẢI TIẾN
1. Một số khái niệm
1.1. Định nghĩa tập mờ và chuỗi thời gian mờ
Giả sử U là không gian nền. không gian nền này xác định một tập hợp
các đối tượng cần nghiên cứu. Nếu A là một tập con rõ của U thì ta có thể xác
định chính xác một hàm đặc trưng:
0 nếu x nằm ngoài A
A(x) =
1 nếu x nằm trong A
Nhưng với một tập mờ B trong không gian nền U thì phần tử x không
xác định chính xác được. Khi đó ta có định nghĩa:
A : U [0.1]
A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một
phần tử u nào của A thì hàm
A (u) được gọi là độ thuộc của u vào tập mờ A.
Giả sử Y(t) là chuỗi thời gian (t = 0, 1, 2,…)
U là tập nền chứa các khoảng giá trị của chuỗi thời gian từ nhỏ nhất đến
lớn nhất.
Xác định hàm thuộc
A : U [0.1] của tập mờ A, còn tập A trên không
gian nền U được viết như sau:
A = {(
A (u1 / u1,
A (u2 / u2,…
A (un / un),: ui U; I = 1, 2, …, n}
A (ui) là độ thuộc của ui vào tập A hay cách viết khác:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
40
A =
nu
)(uA
...
u
)(uA
u
)(uA n
2
2
1
1
1.2. Một số định nghĩa liên quan đến chuỗi thời gian mờ
Định nghĩa 1:
Y(t) (t = …0, 1, 2, …) là một tập con của R
1. Y(t) là tập nền trên đó xác
định các tập mờ fi(t). F(t) là tập chứa các tập fi(t) (I = 1, 2,…) khi đó ta gọi F(t)
là chuỗi thời gian mờ xác định trên tập nền Y(t).
Định nghĩa 2:
Tại các thời điểm t và t-1 có tồn tại một mối quan hệ mờ giữa F(t) và
F(t-1) sao cho F(t) = F(t-1) * R(t-1, t) trong đó * là kí hiệu của một toán tử xác
định trên tập mờ. R(t-1, t) là mối quan hệ mờ. Ta cũng có thể kí hiệu mối quan
hệ mờ giữa F(t) và F(t-1) bằng F(t-1)
F(t).
Nếu đặt F(t-1) = Ai và F(t) = Aj thì ta kí hiệu mối quan hệ logic mờ giữa
chúng như sau: Ai Aj.
Định nghĩa 3: Nhóm các mối quan hệ mờ
Các mối quan hệ logic có thể gộp lại thành một nhóm nếu trong ký hiệu
trên, cùng một vế trái sẽ có nhiều mối quan hệ tại vế phải. ví dụ nếu ta có các
mối quan hệ:
Ai Ak
Ai Am
Thì ta có thể gộp chúng thành nhóm các mối quan hệ logic mờ sau:
Ai Ak, Am
Định nghĩa 4:
Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * R(t-1, t) cho mọi t. Nếu
R(t-1, t) không phụ thuộc vào t thì F(t) được gọi là chuỗi thời gian mờ dừng,
còn ngược lại ta có chuỗi thời gian mờ không dừng.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
41
Định nghĩa 5:
Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),…, F(t-m) m>0 và là chuỗi
thời gian mờ dừng. Khi đó ta có phương trình quan hệ mờ sau:
F(t) = F(t-1) * R
w
(t-1, t)
Trong đó w>1 là thông số thời gian mà theo đó dự báo F(t) bị ảnh
hưởng.Như vậy, để dự báo giá trị F(t), ta cần tính được mối quan hệ mờ Rw(t-1, t).
Quá trình dự báo chuỗi thời gian mờ cũng dựa trên các bước của phương
pháp lập luận xấp xỉ mờ như sau:
1. Giải nghĩa các mệnh đề mờ điều kiện
2. Kết nhập các quan hệ mờ
3. Tính kết quả từ phép hợp thành
4. Khử mờ
2. Mô hình một số thuật toán dự báo trong mô hình chuỗi thời gian mờ
2.1. Mô hình thuật toán của Song và Chissom
Trong phần này, sử dụng khái niệm và phương pháp dự báo của chuỗi
thời gian mờ được Song et. al. và Chissom đưa ra để xây dựng thuật toán dự
báo cho chuỗi thời gian.
Giả sử U là không gian nền: U = u1,u2,....,un . Tập A là mờ trên không
gian nền U nếu A được xác định bởi hàm:
A : U [0.1]
A được gọi là hàm thuộc (Membership function). Còn với bất kỳ một
phần tử u nào của A thì hàm A (u) được gọi là độ thuộc của u vào tập mờ A.
Tập mờ A trên không gian nền U được viết như sau:
n
nAAA
u
u
u
u
u
u
A
)(
...
)()(
2
2
1
1
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
42
Mô hình thuật toán gồm một số bước sau:
Bước1: Xác định tập nền U trên đó các tập mờ được xác định.
Bước 2: Chia các tập nền U thành một số các đoạn bằng nhau
Bước 3: Xác định các biến ngôn ngữ để diễn tả các tập mờ trên các
khoảng đã chia của tập nền.
Bước 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian
Bước 5: Chọn tham số w >1 thích hợp và tính Rw (t,t-1) và dự báo theo
công thức sau:
F(t) = F(t - 1)。Rw(t, t - 1),
Trong đó F(t) là giá trị dự báo mờ tại thời điểm t còn F(t-1) là giá trị dự
báo mờ tại thời điểm t -1. Mối quan hệ mờ được tính như sau:
R
w
(t, t - 1) = F
T
(t – 2) × F(t - 1)∪FT(t - 3) × F(t - 2)∪…∪FT(t - w) ×
F(t – w + 1)
Trong đó T là toán tử chuyển vị, dấu “x” là toán tử tích Cartesian còn w
được gọi là “mô hình cơ sở” mô tả số lượng thời gian trước thời điểm t.
Bước 6: Giải mờ giá trị dự báo mờ.
2.2. Mô hình thuật toán của Chen
Thuật toán của Chen bao gồm một số bước sau:
Bước 1: Xác định tập nền U trên các giá trị lịch sử của chuỗi thời gian
Bước 2: Chia tập U thành các khoảng đều nhau
Bước 3: Xác định các tập mờ Aj
Bước 4: Mờ hoá các giá trị lịch sử của chuỗi thời gian
Bước 5: Xác định mối quan hệ mờ Aj → Ai
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
43
Bước 6: Xác định nhóm quan hệ mờ trên nguyên tắc cùng một vế trái
(xem định nghĩa nhóm quan hệ mờ) và sau đó tinh mối quan hệ mờ Ri
cho mỗi
tập mờ Aj
Bước 7: Dự báo và giải mờ các kết quả
2.3. Thuật toán của Singh
Singh đã đề ra thuật toán đơn giản dựa vào thông số thời gian w=3.
Thuật toán bao gồm các bước sau:
Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị
lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian và U =[fmin-f1, fmax+f2] trong
đó f1,f2 là những giá trị dương nào đó.
Bước 2: Chia đoạn U thành m khoảng con bằng nhau u1, u2,...um.
Bước 3: Xây dựng các tập mờ Ai tương ứng với các khoảng con như
trong trong bước 2 và sử dụng các hàm thuộc tam giác cho mỗi khoảng con
của phép chia.
Bước 4: Mờ hoá các giá trị của chuỗi thời gian và thiết lập mối quan hệ
mờ theo quy tắc: nếu Ai là giá trị mờ hoá tại thời điểm t và Aj là giá trị mờ hoá
tại thời điểm tiếp theo t+1 thì ta có mối quan hệ mờ Ai Aj như tại Định
nghĩa 2. Ai là trạng thái hiện thời còn Aj là trạng thái tiếp theo.
Bước 5: Các quy tắc dự báo
Một vài ký hiệu sau sẽ được sử dụng:
[
*
Aj ] là khoảng tương ứng uj mà hàm thuộc trong Aj đạt giá trị
Supremum
L[
*
Aj ] là giới hạn dưới của khoảng uj
U[
*
Aj ] là giới hạn trên của khoảng uj
l[
*
Aj ] là độ dài khoảng uj trong đó hàm thuộc của Aj đạt
Supremum
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
44
M[
*
Aj ] là giá trị trung bình của khoảng uj trong đó hàm thuộc của
Aj đạt Supremum
Đối với mối quan hệ mờ, em sẽ ký hiệu:
Ai là giá trị mờ tại thời điểm t
Aj là giá trị mờ tại thời điểm t+1
Ei là giá trị của chuỗi thời gian tại thời điểm t
Ei-1 là giá trị của chuỗi thời gian tại thời điểm t-1
Ei-2 là giá trị của chuỗi thời gian tại thời điểm t-2
Fj là giá trị dự báo của chuỗi thời gian tại thời điểm t+1
Mô hình của Singh sử dụng 3 giá trị quá khứ t-2, t-1, t để đưa ra quy luật
dự báo tại thời điểm t+1.
Quy luật dự báo:
Để dự báo thời điểm t+1 và tiếp theo ta theo thuật toán sau:
For k = 3 to ... K (giá trị cuối của chuỗi thời gian)
Nhận mối quan hệ mờ tại các thời diểm t và t+1
Ai Aj
Tính:
Di = (Ei - Ei-1) - (Ei-1 Ei-2)
Xi =Ei + Di /2
XXi =Ei – Di /2
Yi =Ei + Di
YYi =Ei – Di
For I=1 to 4
If Xi ≥ L[
*
Aj ] and Xi ≤ U[
*
Aj ]
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
45
Then P1 = Xi ; n=1
Else P1 = 0 ; n=0
Next I
If XXi ≥ L[
*
Aj ] and XXi ≤ U[
*
Aj ]
Then P2 = XXi ; m=1
Else P2 = 0 ; m=0
Next I
If Yi ≥ L[
*
Aj ] and Yi ≤ U[
*
Aj ]
Then P3 = Yi ; n=1
Else P3 = 0 ; p=0
Next I
If YYi ≥ L[
*
Aj ] and YYi ≤ U[
*
Aj ]
Then P4 = YYi ; q=1
Else P4 = 0 ; q=0
Next I
B=P1 + P2 + P3 + P4
If B = 0Then Fj = M[
*
Aj ]
Else Fj = (B + M[
*
Aj ])/ (m+n+p+q)
Next k
2.4. Mô hình Heuristic cho chuỗi thời gian mờ
Huarng đã sử dụng mô hình của Chen và đưa vào các thông tin có sẵn
của chuỗi thời gian để cải tiến độ chính xác và giảm bớt các tính toán phức tạp
của dự báo. Nhờ sử dụng những thông tin có trong chuỗi thời gian nên mô hình
của Huarng được gọi là mô hình Heuristic.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
46
Các bước thực hiện của mô hình Huarng cũng triển khai theo các bước
trên. Điều khác biệt là sử dụng một hàm h để xác định mối quan hệ logic mờ.
dưới đây là mô tả các bước thực hiện của mô hình Heuristic chuỗi thời gian mờ.
Bước 1: Xác định tập nền. Tập nền U được xác định như sau: lấy giá trị
lớn nhất fmax và nhỏ nhất fmin của chuỗi thời gian U = [fmax, fmin]. Đôi khi có thể
mở rộng khoảng này thêm một giá trị nào đó để dễ tính toán. Chia đoạn U
thành m khoảng con bằng nhau u1, u2, …, um.
Bước 2: Xác định tập mờ Ai và mờ hoá giá trị. Mỗi tập Ai gán cho một
biến ngôn ngữ và xác định trên các đoạn đã xác định u1, u2, …, um. Khi đó các
tập mờ A có thể biểu diễn như sau:
m
mAiAiAi
i
u
u
u
u
u
u
A
)(
...
)()(
2
2
1
1
Bước 3: Thiết lập mối quan hệ mờ và nhóm các mối quan hệ mờ. Như
định nghĩa ở trên, đối với chuỗi thời gian mờ ta có thể xác định được mối quan hệ
mờ tại mỗi thời điểm t và qua đó ta xác định được nhóm các mối quan hệ mờ.
Bước 4: Sử dụng hàm h để thiết lập các nhóm mối quan hệ logic mờ
Heuristic
AI → hj (x, Ap1, Ap2,…,) = Ap1, Ap2, …, Apk
Bước 5: Dự báo. Từ các nhóm quan hệ logic mờ Heuristic. Các giá trị
chủ yếu lấy từ điểm giữa hay trung bình các điểm giữa các khoảng cách trong
nhóm quan hệ mờ heuristic.
* Đề xuất mới cho chuỗi thời gian mờ Heuristic
Một số khái niệm
Trước hết ta cần một số khai niệm. Các tập mờ A1, A2, …, Ak có thể sắp
xếp được, có nghĩa là Af ≥ Ag khi f ≥ g. Nếu F(t – 1) = Aj và F(t) = Ai thì khi
đó ta có Aj → Ai. Ngoài ra cũng có thể xác định được nhóm quan hệ mờ như
định nghĩa 3:
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
47
Aj → Ap1, Ap2, …,Apk
Định nghĩa 5: Hàm hj phụ thuộc vào một tham số x được xác định như sau:
hj (x, Ap1, Ap2,…,) = Ap1, Ap2, …, Apk
nếu Ap1, Ap2, …, Apk ≥ j với x >0
và Ap1, Ap2, …, Apk ≤ j với x <0
Ngoài ra, để dự báo giá trị chuỗi thời gian, ta cần xác định hiệu số bậc
nhất và bậc 2 cho chuỗi thời gian. Giả sử các giá trị của chuỗi thời gian tại các
thời điểm tương ứng t, t-1, t-2 là f(t), f(t-1), f(t-2). Khi đó các hiệu số bậc nhât
và bậc 2 được xác định:
∆i = f(t) – f(t-1); ∆i
2
= (f(t) – f(t-1)) – (f(t-1) – f(t-2))
Tương tự khí xét đến một hàm số, nếu hiệu số bậc nhất là dương thì hàm
đó là hàm tăng, còn hiệu bậc nhất âm thì hàm đó là hàm giảm. Đưa cả khái
niệm hiệu số bậc hai vào và xét tính chất âm dương của nó để thêm thông tin
về hàm (giảm) tăng từ từ và tăng (giảm) nhanh phụ thuộc vào hiệu số bậc 2 âm
hay dương.
Ngoài ra còn xét đến điểm lấy giá trị trong khoảng phân chia. Phụ thuộc
vào độ tăng giảm của chuỗi thời gian, các điểm được lấy để tính toán trong
khoảng không phải là điểm giữa khoảng nữa mà trong thuật toán dưới đây, ta sẽ
lấy các điểm 0.25 (điểm dưới), 0.5 (điểm giữa) và 0.75 (điểm trên) của khoảng.
Thuật toán em đề xuất có những bước tương tự nhưng có những thay đổi
tại bước 1 trong chia khoảng giá trị, bước 3 trong việc xác định hàm h và tính các
điểm dự báo trong các khoảng trong nhóm các mối quan hệ mờ heuristic. Hàm hi
tính tại thời điểm t và dựa vào tham số hiệu bậc nhất. Điểm cải tiến cuối cùng là
các qui tắc dự báo. Các giá trị để tính dự báo không phải là tại điểm giữa của
khoảng nữa mà dựa trên các thông tin có sẵn về hiệu số bậc 1 và hiệu số bậc 2 để
tính giá trị tại các điểm dưới, điểm giữa và điểm trên của khoảng đã xác định.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
48
Như vậy, thông tin về chuỗi thời gian không chỉ lấy từ hiệu số bậc nhất nữa mà
thêm thông tin từ hiệu số bậc 2 của các giá trị chuỗi thời gian.
3. Ứng dụng trong dự báo chứng khoán
3.1. Bài toán chỉ số chứng khoán Đài Loan
Xét bài toán dự báo cho chuỗi dữ liệu chỉ số thị trường chứng khoán Đài
Loan TAIFEX. số liệu được đưa ra trong bảng dưới đây
Ngày
tháng
Giá trị
thực
Ngày
tháng
Giá trị
thực
Ngày
tháng
Giá trị
thực
03/08/1998 7552 26/08/1998 6790 17/09/1998 6906
04/08/1998 7560 27/08/1998 6835 18/09/1998 6842
05/08/1998 7487 28/08/1998 6695 19/09/1998 7039
06/08/1998 7462 29/08/1998 6728 21/09/1998 6861
07/08/1998 7515 30/08/1998 6566 22/09/1998 6926
10/08/1998 7365 01/09/1998 6409 23/09/1998 6852
11/08/1998 7360 02/09/1998 6430 24/09/1998 6890
12/08/1998 7320 03/09/1998 6200 25/09/1998 6871
13/08/1998 7291 04/09/1998 6403,2 28/09/1998 6840
14/08/1998 7320 05/09/1998 6697,5 29/09/1998 6806
15/08/1998 7300 07/09/1998 6722,3 30/09/1998 6787
17/08/1998 7219 08/09/1998 6859,4
18/08/1998 7220 09/09/1998 6769,6
19/08/1998 7285 10/09/1998 6709,75
20/08/1998 7274 11/09/1998 6726,5
21/08/1998 7225 14/09/1998 6774,55
24/08/1998 6955 15/09/1998 6762
25/08/1998 6949 16/09/1998 6952,75
Bảng 1. Giá trị chỉ số chứng khoán Đài Loan
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
49
Thuật toán cho chuỗi thời gian mờ bao gồm các bước sau đây và áp
dụng cho số liệu tại bảng trên.
Bước 1: Xây dựng tập nền U. xác định giá trị lớn nhất và nhỏ nhất của
chuỗi thời gian trên là 6200 và 7560 điểm. Do vậy tập nền U được xác định là
giá trị trong khoảng [6200, 7600]. Ta sẽ chia U thành 14 khoảng u1, u2, …, u14
với độ rộng là 10459+0, như vậy các khoảng sẽ là: u1 = [6200,6300], u2 =
[6300,6400], …, [7500,7600].
Bước 2: Xác định các tập Ai tương ứng với từng khoảng ui xác định tại
bước 1. Ta gán chúng với các biến ngôn ngữ. Thí dụ A1 = (Thấp nhất), A2 =
(rất thấp nhất), A3 = (rất thấp), A4 = (thấp), A5 = (hơi thấp), A6 = (dưới trung
bình), A7 = (trung bình), A8 = (trên trung bình), A9 = (trung bình cao), A10 =
(hơi cao), A11= (rất cao), A13 = (rất rất cao), A14 = (cao nhất). Với mỗi tập Ai
được xác định bởi một đoạn ui.
Bước 3: Chia lại khoảng. Tính phân bổ của các giá trị chuỗi thời gian rơi
vào các khoảng đã chia. Điều này thực hiện để biết các khoảng nào có nhiều giá trị
rơi vào để có thể phân khoảng tiếp làm tăng độ chính xác khi dự báo.
Bảng sau đây sẽ cho thấy sự phân bố các giá trị của chuỗi thời gian rơi
vào từng khoảng:
Khoảng Số lƣợng Khoảng Số lƣợng
6200-6300 1 6900-7000 5
6300-6400 0 7000-7100 1
6400-6500 3 7100-7200 0
6500-6600 1 7200-7300 6
6600-6700 2 7300-7400 5
6700-6800 9 7400-7500 2
9800-6900 9 7500-7600 3
Bảng 2. Phân bố giá trị trong từng khoảng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
50
Xem xét bảng trên ta thấy sự phân bố các giá trị tại các khoảng khác
nhau là không đều nhau. Có 47 giá trị trong 14 khoảng nên số lượng trung bình
rơi vào mỗi khoảng là hơn 3. Vì vậy có những khoảng nào có 5, 6 giá trị rơi
vào ta chia tiếp làm 2 khoảng con, còn những đoạn nào có 8, 9 giá trị rơi vào ta
tiếp tục chia thành 3 khoảng để sao cho mỗi khoảng con đó có xấp xỉ 3 giá trị
rơi vào. Kết quả sẽ hình thành 21 khoảng sau:
u1 = [6200-6300] u8 = [6766-6800] u15 = [7100-7200]
u2 = [6300-6400] u9 = [6800-6833] u16 = [7200-7250]
u3 = [6400-6500] u10 = [6833-6866] u17 = [7250-7300]
u4 = [6500-6600] u11 = [6866-6900] u18 = [7300-7350]
u5 = [6600-6700] u12 = [6900-6950] u19 = [7350-7400]
u6 = [6700-6733] u13 = [6950-7000] u20 = [7400-7500]
u7 = [6733-6766] u14 = [7000-7100] u21 = [7500-7600]
Bảng 3. Phân khoảng
Trong bước này ta xác định lại các tập mờ Ai tương ứng với từng
khoảng và có thể gán lại các giá trị ngôn ngữ cho từng tập mờ này. Các tập mờ
Ai i = 1,2,…,21 được định nghĩa thông qua các hàm thuộc để đơn giản có dạng
hình nón nhận 3 giá trị 0, 0.5 và 1 và được viết như sau:
A1 = 1/u1 + 0.5/u2 + 0/u3 + … + 0/u20 + 0/u21
A2 = 0.5/u1 + 1/u2 + 0.5/u3 + … + 0/u20 + 0/u21
A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 + … + 0/u20 + 0/u21
………………………………………………
A19 = 0/u1 + 0/u2 + … + 0.5/u18 + 1/u19 + 0.5/u20 + 0/u21
A20 = 0/u1 + 0/u2 + … + 0.5/u19 + 1/u20 + 0.5/u21
A21 = 0/u1 + 0/u2 + … + 0/u19 + 0.5/u20 + 1/u21
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
51
Bước 4: Xác định mối quan hệ mờ và nhóm quan hệ mờ
Theo định nghĩa phần trên ta lập chuỗi thời gian mờ tương ứng với các
tập mờ ở trên và xác định mối quan hệ mờ tại thời điểm t = 1,2,…,47. Có thể
thấy ngay được các mối quan hệ đầu tiên như sau: A21 → A21 , A21 → A20 , A20
→ A21, …, A9 → A8.
Từ đây xác định được nhóm các mối quan hệ mờ theo định nghĩa ở phần
trên. Thí dụ ta có thể nhận được một nhóm quan hệ mờ như sau: A21 → A19,
A20, A21. toàn thể các nhóm quan hệ mờ sẽ được thể hiện dưới bảng 4.
A1 → A3 A7 → A13 A12 → A8,A10 A18 → A10,A17,A18
A3 → A1,A3,A5 A8 → A6,A7,A10 A13 → A12 A19 → A18,A19
A4 → A3 A9 → A8 A14 → A11 A20 → A20,A21
A5 → A6 A10 →
A5,A8,A9,A11,A14
A16 →
A13,A16,A17
A21 → A19,A20,A21
A6 →
A4,A6,A8,A10
A11 → A10,A11,A12 A17 →
A16,A17,A18
Bảng 4. Nhóm mối quan hệ mờ
Bước 5: Lập mối quan hệ mờ tại mỗi thời điểm t
Sau đó, tính nhóm quan hệ mờ heuristic có sử dụng các tính chất của
hiệu số bậc 1 và hàm h đã được xác định theo định nghĩa 5, trong đó vai trò
của biến x chính là hiệu số bậc nhất tại thời điểm t. Như vậy nhóm quan hệ mờ
này phụ thuộc vào thời điểm t của chuỗi thời gian mờ. Thí dụ như cùng một
nhóm quan hệ A10 → A5,A8,A9,A11,A14 nhưng tại thời điểm t1 hiệu số bậc nhất
là âm thì:
h10(∆t1, A5,A8,A9,A11,A14 ) = A5,A8,A9
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
52
Còn tại thời điểm t2 hiệu số bậc nhất là dương thì hàm heuristic sẽ cho
giá trị
h10(∆t1, A5,A8,A9,A11,A14 ) = A11,A14
Sử dụng hàm heuristic này sẽ xác định được các nhóm mối quan hệ mờ
heuristic cho mỗi thành phần của chuỗi thời gian mờ.
Bước 6: Dự báo
Sử dụng hàm heuristic này để dự báo giá trị cho chuỗi thời gian. Nguyên
tắc dự báo như sau:
Giả sử tại thời điểm t, giá trị mờ tại thời điểm này được suy ra từ giá trị mờ
tại thời điểm t-1 theo công thức F(t) = F(t-1) * R(t-1, t), hay có thể viết Ai → Aj.
Như vậy theo các phương pháp truyền thống, phải tính được mối quan
hệ R(t-1, t). Trong phương pháp heuristic, mối quan hệ được sử dụng là nhóm
các quan hệ mờ. Trong phương pháp em đề xuất để dự báo giá trị mờ Aj, em sử
dụng hàm heuristic cho nhóm quan hệ mờ của Ai. Như vậy đối với mỗi thời
điểm t ta phải tính hàm h (theo định nghĩa 5) heuristic tại thời điểm t-1 tức là
mối quan hệ mờ của Ai. Nhóm mỗi quan hệ mờ và nhóm mối quan hệ mờ
heuristic tại mỗi thời điểm t được tính toán cụ thể theo bảng sau:
Actual
index
Giá
trị
mờ
Hiệu
số bậc
1
Hiệu
số
bậc 2
Nhóm quan hệ mờ
Nhóm quan
hệ heuristic
Điểm tính
7552 A21
7560 A21 8
7487 A20 -73 -81 A19,A20,A21 A19,A20 0.5,0.75
7462 A20 -25 48 A20,A21 A20 0.25
7515 A21 53 78 A20,A21 A20,A21 0.5,0.75
7365 A19 150 97 A19,A20,A21 A19,A20,A21 0.25,0.5,0.75
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
53
7360 A19 -5 -155 A18,A19 A18,A19 0.5,0.75
7330 A18 -30 -25 A18,A19 A18 0.75
7291 A17 -29 1 A16,A17.A18 A16,A17 0.5,0.75
7320 A18 29 58 A16,A17,A18 A18 0.75
7300 A18 -20 -49 A16,A17,A18 A16,A17,A18 0.25,0.5,0.75
7219 A16 -81 -61 A16,A17,A18 A16 0.75
7220 A16 1 82 A13,A16,A17 A16,A17 0.5,0.75
7283 A17 63 62 A13,A16,A17 A17 0.75
7274 A17 -9 -72 A16,A17,A18 A16,A17 0.5,0.75
7225 A16 -49 -40 A16,A17,A18 A16 0.75
6955 A13 -270 -221 A13,A16,A17 A13 0.75
6949 A12 -6 264 A12 A12 0.25
6790 A8 -159 -153 A8,A10 A8 0.75
6835 A10 45 204 A6,A7,A10 A10 0.75
6695 A5 -140 -185 A5,A8,A9,A11,A14 A5 0.75
6728 A6 33 173 A6 A6 0.75
6566 A4 -162 -195 A4,A6,A8,A10 A4 0.75
6409 A3 -157 5 A3 A3 0.25
6430 A3 21 178 A1,A3,A5 A3,A5 0.5,0.75
6200 A1 -230 -251 A1,A3,A5 A1 0.75
6403.2 A3 203.2 433.2 A3 A3 0.75
6697.5 A5 294.3 91.1 A1,A3,A5 A5 0.75
6722.3 A6 24.8 -269.5 A6 A6 0.25
6859.4 A10 137.1 112.3 A4,A6,A8,A10 A10 0.75
6769.6 A8 -89.8 -226.9 A5,A8,A9,A11,A14 A5,A8 0.5,0.75
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
54
6709.75 A6 -59.85 29.95 A6,A7,A10 A6 0.25
6726.5 A6 16.75 76.6 A4,A6,A8,A10 A6,A8,A10 0.25,0.5,0.75
6774.55 A8 48.05 31.3 A4,A6,A8,A10 A8,A10 0.5,0.75
6762 A7 -12.55 -60.6 A6,A7,A10 A6,A7 0.5,0.75
6952.75 A13 190.75 203.3 A13 A13 0.75
6906 A12 -46.75 -237.5 A12 A12 0.75
6842 A10 -64 -17.25 A8,A10 A8,A10 0.5,0.75
7039 A14 197 261 A5,A8,A9,A11,A14 A14 0.75
6861 A11 -178 -375 A11 A11 0.75
6926 A12 65 243 A10,A11,A12 A12 0.75
6852 A10 -74 -139 A8,A10 A8,A10 0.5,0.75
6890 A11 38 112 A5,A8,A9,A11,A14 A11,A14 0.5,0.75
6871 A11 -19 -57 A10,A11,A12 A10,A11 0.5,0.75
6840 A10 -31 -12 A10,A11,A12 A10 0.75
6806 A9 -34 -3 A5,A8,A9,A11,A14 A5,A8,A9 0.25,0.5,0.75
6787 A8 -19 15 A8 A8 0.25
Bảng 5. Nhóm quan hệ mờ và nhóm quan hệ mờ heuristic và điểm tính
để dự báo
Các qui tắc dự báo
Qui tắc 1: Nếu quan hệ mờ heuristic của Ai là rỗng Ai → thì giá trị dự
báo của F(t) là mi là giá trị điểm giữa của ui
Qui tắc 2: Nếu quan hệ mờ heuristic của Ai là một một, nghĩa là Ai →
Ak thì giá trị dự báo của F(t) là điểm giữa, điểm trên hoặc điểm dưới của đoạn
uk tuỳ thuộc theo tính chất của hiệu số bậc 1 và bậc 2 của chuỗi thời gian tại
thời điểm t (xem bảng 6, lấy giá trị cuối cùng bên phải).
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
55
Qui tắc 3: Nếu quan hệ mờ heuristic của Ai là một nhiều thì ta xác định theo
các giá trị khác nhau của các khoảng ui dựa vào thông tin chuỗi thời gian sau:
Đối với mỗi thời điểm t, ta cần các giá trị chuỗi thời gian f(t-2), f(t-1),
f(t). Tại thời điểm t, ta cũng cần xác định các hiệu số bậc nhất ∆ = f(t) – f(t-1)
và hiệu số bậc hai ∆2 = (f(t) – f(t-1)) – (f(t-1)- f(t-2)) của giá trị chuỗi thời gian.
dựa vào cách xác định hàm h(∆, Ap1, Ap2, …, Apm) để xác định mối quan hệ
mờ heuristic tại thời điểm t theo giá trị dương hay âm của ∆. Trong luận văn
này em sử dụng cả hiệu số bậc 2 để xác định thêm tính chất của chuỗi thời
gian. Tuỳ theo tính chất tăng, giảm của chuỗi thời gian tại thời điểm t để xác
định các giá trị dự báo tại các khoảng trong mối quan hệ mờ. Một khoảng ui ta
xác định các giá trị tại giữa khoảng (0.5),
4
3
khoảng (0.75) và
4
1
khoảng
(0.25). Các giá trị được xác định tương ứng với các giá trị mờ hoá Ai tương
ứng với khoảng ui. ta chỉ quan tâm đến 3 giá trị mờ hoá gần với Aj nhất. Các
giá trị khác lấy tại điểm gần nhất. Do vậy, ta có qui luật lấy giá trị tại các
khoảng tương ứng như sau:
Tính chất chuỗi Hiệu bậc nhất Hiệu bậc 2 Các điểm lấy giá trị
Giảm từ từ ∆ 0 0.75, …, 0.75, 0.5, 0.25
Giảm nhanh ∆ < 0 ∆2 < 0 0.25, …, 0.25, 0.5, 0.75
Tăng nhanh ∆ > 0 ∆2 > 0 0.25, …, 0.25, 0.5, 0.75
Tăng từ từ ∆ > 0 ∆2 < 0 0.75, …, 0.75, 0.5, 0.25
Bảng 6. Các điểm lấy giá trị dự báo trong khoảng
Giá trị dự báo của chuỗi thời gian tại thời điểm t là giá trị trung bình của
các giá trị dựa vào bảng trên.
Dựa vào bảng 6, ta có thể dự báo chuỗi thời gian tại thời điểm t. Em đưa
ra một trường hợp làm thí dụ.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
56
Ngày 10/9 và ngày 11/9 có các giá trị tương ứng tại bảng 1 là 6709,7 và
6726,5. Còn tại bảng 5 là hai hàng được bôi đen. Giá trị mờ của chuỗi thời gian
tương ứng là – 59.85 và 16.75 tức là một giá trị âm còn một giá trị dương. Mối
quan hệ ngày 10/9 là A8 → A6. Như vậy để dự báo ta cần nhóm quan hệ A8 →
A6,A7,A10. Để tính quan hệ mờ heuristic, ta sử dụng hàm heuristic
h6(∆,A6,A7,A10) = A6 vì ∆ âm nên chỉ lấy các chỉ số ≤ 6
Như vậy giá trị dự báo sẽ rơi vào giá trị mờ A6 tương ứng với khoảng u6
= [6700-6730]. Giá trị hiệu số bậc hai là dương, do vậy để xem lấy điểm nào
trong khoảng dự báo ta lại xem bảng 6: ∆ 0 nên theo bảng trên giá trị
này lấy ở điểm dưới của khoảng (0.25). Điểm này tương ứng với giá trị xấp xỉ
6708. Như vậy ta đã dự báo xong thời điểm ngày 10/9.
Tính tiếp dự báo cho ngày 11/9. Dự báo theo quan hệ F(10/9) → F(11/9)
hay A6 →A6. Nhóm quan hệ mờ của nó là A6 → A4,A6,A8,A10. Xác định nhóm
quan hệ mờ heuristic sử dụng hàm heuristic với hiệu số bậc nhất tại thời điểm
này có giá trị 16.75 tức là giá trị dương, ta thu được như sau:
h6(∆, A4,A6,A8,A10) = A6,A8,A10 vì ∆ dương nên chỉ lấy các chỉ số ≥ 6
Như vậy giá trị dự báo sẽ chỉ lấy trung bình trong các khoảng u6,u8,u10.
Điểm lấy giá trị tơng ứng trong khoảng lại xét dấu của hiệu số bậc nhất và hiệu
số bậc 2 tại thời điểm này. Tính toán cho thấy cả hai đều dương nên tính chất
của chuỗi số liệu là tăng nhanh nên các điểm tính tương ứng sẽ là 0.25, 0.5,
0.75 của ba khoảng trên và dự báo sẽ là giá trị trung bình của 3 giá trị trên.
Điểm 0.25 của khoảng u6 là 6708. Điểm 0.5 của u8 có giá trị là 6785, còn điểm
0.75 của khoảng u10 có giá trị là 6852. Như vậy giá trị dự báo f(11/9) sẽ là:
f(11/9) = (6708 +6785+6852)/3 = 6781.7 ≈ 6782.
Lập được bảng 6 ta dễ dàng tính được các giá trị dự báo.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
57
* Kết quả tính toán
Em đã sử dụng thuật toán trên để tính toán các chỉ số của thị trường
chứng khoán Đài Loan TAIFEX theo số liệu đưa ra. Kết quả tính toán này
được so sánh với các kết quả của thuật toán Chen và thuật toán heuristic hai
tham số và ba tham số của Huarng. Kết quả cho trong bảng sau:
Ngày
tháng
Actual
index
Chen Huarng1 Huarng2 Dự báo
03/08/1998 5552 7450 7450 7450 7550
04/08/1998 7560 7450 7450 7450 7550
05/08/1998 7487 7450 7450 7450 7425
06/08/1998 7462 7500 7450 7500 7425
07/08/1998 7515 7500 7500 7500 7512.5
10/08/1998 7365 7450 7450 7450 7464
11/08/1998 7360 7300 7350 7300 7355
12/08/1998 7330 7300 7300 7300 7334
13/08/1998 7291 7300 7350 7300 7255
14/08/1998 7320 7183.33 7100 7188.33 7334
15/08/1998 7300 7300 7350 7300 7275
17/08/1998 7219 7300 7300 7300 7234
18/08/1998 7220 7183.33 7100 7100 7255
19/08/1998 7283 7183.33 7300 7300 7284
20/08/1998 7274 7183.33 7100 7188.33 7255
21/08/1998 7225 7183.33 7100 7100 7234
24/08/1998 6955 7183.33 7100 7100 6984
25/08/1998 6949 6850 6850 6850 6916
26/08/1998 6790 6850 6850 6850 6790
27/08/1998 6835 6775 6650 6775 6850
28/08/1998 6695 6850 6750 6750 6675
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
58
29/08/1998 6728 6750 6750 6750 6720
30/08/1998 6566 6775 6650 6650 6575
01/09/1998 6409 6450 6450 6450 6425
02/09/1998 6430 6450 6550 6550 6562.5
03/09/1998 6193 6450 6350 6350 6275
04/09/1998 6403.2 6450 6450 6450 6475
05/09/1998 6697.5 6450 6550 6550 6675
07/09/1998 6722.3 6750 6750 6750 6710
08/09/1998 6859.4 6775 6850 6850 6850
09/09/1998 6769.6 6850 6750 6750 6720
10/09/1998 6709.75 6775 6650 6650 6708
11/09/1998 6726.5 6775 6850 6775 6782
14/09/1998 6774.55 6775 6850 6775 6818
15/09/1998 6762 6775 6650 6775 6734
16/09/1998 6952.75 6775 6850 6850 6984
17/09/1998 6906 6850 6950 6850 6934
18/09/1998 6842 6850 6850 6850 6816
19/09/1998 7039 6850 6950 6950 7075
21/09/1998 6861 6850 6850 6850 6886
22/09/1998 6926 6850 6950 6850 6934
23/09/1998 6852 6850 6850 6850 6816
24/09/1998 6890 6850 6950 6850 6978
25/09/1998 6871 6850 6850 6850 6866
28/09/1998 6840 6850 6750 6750 6850
29/09/1998 6806 6850 6750 6850 6743
30/09/1998 6787 6850 6750 6750 6780
MSE 9737 7905 5437 1700
Bảng 7. Kết quả tính toán
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
59
Cột cuối cùng là để tính sai số trung bình bình phương MSE theo công thức:
n
gf
MSE
n
i
ii
1
)(
Trong đó fi là giá trị thực còn gi là giá trị dự báo.
Ta có thể thấy rõ độ chính xác của phương pháo này chỉ bằng ⅓ phương
pháp tốt nhất của Huarng.
* Sau đây là một số các đồ thị so sánh các kết quả với nhau
Hình 3.1: Đồ thị kết quả dự báo so sánh với thuật toán 3 tham số của Huarng
Hình3. 2: So sánh vớikết quả thuật toán 2 tham số của Huarng
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
60
Hình 3.3: So sánh kết quả với thuật toán Chen
3.2. Xây dựng chƣơng trình
Chương trình chuỗi thời gian mờ dự báo tỷ giá chứng khoán Đài Loan
Chương trình có các tính năng: cập nhật số liệu, mở file dữ liệu cần tính
toán, mờ hóa, tạo nhóm, Heuristic, dự báo, đồ thị.
Hình 1. Bảng giá trị thực
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
61
Thực hiện lệnh mờ hóa sẽ cho ta cột kết quả mờ
Hình 1. Kết quả mờ
Thực hiện lệnh tạo nhóm sẽ tạo ra cho ta các nhóm giá trị
Hình 3. Tạo nhóm
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
62
Thực hiện lệnh Heuristic sẽ cho ta Bảng hỗ trợ
Hình 4. Bảng hỗ trợ
Thực hiện lệnh dự báo sẽ cho ta cột dự báo
Hình 5. Dự báo
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
63
Thực hiện lệnh đồ thị sẽ cho ta đồ thị so sánh giá trị thực và
giá trị dự báo
Hình 7. Đồ thị
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
64
KẾT LUẬN
Luận văn này chủ yếu giới thiệu các khái niệm cơ bản về chuỗi thời gian
và các mô hình xử lý chuỗi thời gian. Phương pháp chủ yếu để dự báo chỗi
thời gian được Box và Jenkins xây dựng từ những năm 70 của thế kỷ trước. Đó
là mô hình ARMA. Tuy nhiên mô hình ARMA chỉ thích ứng hầu hết cho chuỗi
thời gian dừng và tuyến tính, chính vì vậy những chuỗi thời gian có biến thiên
nhanh hoặc chuỗi số liệu lịch sử ngắn cho những kết quả chưa chính xác.
Chuỗi thời gian trong kinh tế do đặc điểm phát triển kinh tế phụ thuộc rất
nhiều vào các yếu tố khác nhau nên có nhiều biến thiên và mang tính phi
tuyến. Chính vì vậy mô hình ARMA không thể xử lý tốt trong lĩnh vực kinh tế.
Do đó em đã sử dụng phương pháp mới là xây dựng mô hình chuỗi thời gian
mờ được Song và Chilsom phát triển để giải quyết vấn đề trên.
Trong luận văn này em trình bày một số mô hình cơ bản hay được sử
dụng trong chuỗi thời gian mờ. Đó là các thuật toán của Chen, Huarng, Singh
và một số tác giả khác. Một số cải tiến các thuật toán trên cũng được đưa ra
trong Chương III của Luận văn. Cuối cùng em đã xây dựng phần mềm tính
toán trên cơ sở sử dụng một thuật toán của Chen trong dự báo chỉ số chứng
khoán Đài Loan. Kết quả tính toán cho thấy mức độ phù hợp của dự báo so với
số liệu thực tế. Chính vì vậy, mô hình chuỗi thời gian mờ đang được nhiều tác
giả nghiên cứu có nhiều triển vọng ứng dụng trong xử lý số liệu kinh tế.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
65
TÀI LIỆU THAM KHẢO
[1] Bùi Công Cường, N.D. Phước, Hệ mờ, Mạng Nơron và ứng dụng
(Tuyển tập các bài giảng, NXB Khoa học và Kỹ thuật, 2001.
[2] Nguyễn Công Điều, “Một thuật toán mới cho mô hình chuỗi thời
gian mờ heuristic trong dự báo chỉ số chứng khoán”, Báo cáo Đại hội Toán học
toàn quốc, Quy Nhơn, 2008.
[3] T. J. Ross, “Fuzzy Logic with engineering”, MacGraw Hill (1996).
[4] W. Ender, “Applied Econometrics Time Series”, Wiley & Son, (1995).
[5] R. S. Tsay, Analysis of finacial Time Series”, Wiley & Son, (2005).
[6] Q. Song, B.S. Chissom, “Fuzzy Time Series and its Model”, Fuzzy
set and system, vol. 54, pp. 269-277, 1993.
[7] Q. Song, B.S. Chissom, “Forecasting Enrollments with Fuzzy Time
Series – Part I,” Fuzzy set and system, vol. 54, pp. 1-9, 1993. – Part II,” Fuzzy
set and system, vol. 62, pp. 1-8, 1994
[8] S.M. Chen, “Forecasting Enrollments based on Fuzzy Time Series,”
Fuzzy set and system, vol. 81, pp. 311-319, 1996.
[9] S. M. Chen, C.C. Hsu, “A New Methods to Forecast Enrollments
Using Fuzzy Time Series”, Inter. Journal of Applied Science and Engineering,
V.2,N.3, pp. 234-244, 2004.
[10] K.Huarng, “Heuristic models of fuzzy time series forecasting”,
Fuzzy sets and Systems, V.123, pp 369-386, 2001.
[11] M. Sah, K.Y. Degtiarev, “Forecasting Enrollment Model Based on
First Order Fuzzy Time Series”, Transactions on Engineering, Computing and
technology. Enfomatika, v.IV,pp. 375-378, 2004.
[12] S.R. Singh, “A computational method of forecasting based on
high-order fuzzy time series”, Expert Systems with Applications, 36 (2009)
pp.10551–10559.
Các file đính kèm theo tài liệu này:
- 30LV09_CNTT_KHMTNguyenThiKimLoan.pdf