Tài liệu Luận văn Nghiên cứu và ứng dụng một số mô hình học máy trong việc hỗ trợ đánh giá rủi ro tài chính: i
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
-------***-------
HÀ VĂN SANG
NGHIÊN CỨU VÀ ỨNG DỤNG MỘT SỐ MÔ HÌNH HỌC MÁY
TRONG VIỆC HỖ TRỢ ĐÁNH GIÁ RỦI RO TÀI CHÍNH
Ngành: Công nghệ Thông tin
Chuyên ngành: Hệ thống Thông tin
Mã số: 60.48.05
LUẬN VĂN THẠC S
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. NGUYỄN HÀ NAM
HÀ NỘI – 2009
ii
LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả đạt được trong luận văn này là do tôi nghiên
cứu, tổng hợp và thực hiện. Toàn bộ những điều được trình bày trong luận văn là của
cá nhân hoặc được tham khảo và tổng hợp từ các nguồn tài liệu khác nhau. Tất cả các
tài liệu tham khảo, tổng hợp đều được trích dẫn với nguồn gốc rõ ràng.
Tôi xin chịu hoàn toàn trách nhiệm về lời cam đoan của mình. Nếu có gì sai
trái, tôi xin chịu mọi hình thức kỷ luật theo qui đinh.
Hà Nội, tháng 5 năm 2008
Học viên
Hà Văn Sang
iii
LỜI CẢM ƠN
Tôi muốn bày tỏ lòng biết ơn sâu sắc tới những người đã giúp đỡ tôi trong quá
trình làm lu...
82 trang |
Chia sẻ: haohao | Lượt xem: 1033 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Nghiên cứu và ứng dụng một số mô hình học máy trong việc hỗ trợ đánh giá rủi ro tài chính, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
i
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CƠNG NGHỆ
-------***-------
HÀ VĂN SANG
NGHIÊN CỨU VÀ ỨNG DỤNG MỘT SỐ MƠ HÌNH HỌC MÁY
TRONG VIỆC HỖ TRỢ ĐÁNH GIÁ RỦI RO TÀI CHÍNH
Ngành: Cơng nghệ Thơng tin
Chuyên ngành: Hệ thống Thơng tin
Mã số: 60.48.05
LUẬN VĂN THẠC S
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. NGUYỄN HÀ NAM
HÀ NỘI – 2009
ii
LỜI CAM ĐOAN
Tơi xin cam đoan những kết quả đạt được trong luận văn này là do tơi nghiên
cứu, tổng hợp và thực hiện. Tồn bộ những điều được trình bày trong luận văn là của
cá nhân hoặc được tham khảo và tổng hợp từ các nguồn tài liệu khác nhau. Tất cả các
tài liệu tham khảo, tổng hợp đều được trích dẫn với nguồn gốc rõ ràng.
Tơi xin chịu hồn tồn trách nhiệm về lời cam đoan của mình. Nếu cĩ gì sai
trái, tơi xin chịu mọi hình thức kỷ luật theo qui đinh.
Hà Nội, tháng 5 năm 2008
Học viên
Hà Văn Sang
iii
LỜI CẢM ƠN
Tơi muốn bày tỏ lịng biết ơn sâu sắc tới những người đã giúp đỡ tơi trong quá
trình làm luận văn, đặc biệt tơi xin cám ơn TS Nguyễn Hà Nam, với lịng kiên trì, thầy
đã chỉ bảo tơi chi tiết và cho tơi những lời nhận xét quí báu trong từng bước làm luận
văn. Đồng thời tơi cũng xin gửi lời cảm ơn tới các thầy cơ giáo khoa Cơng nghệ thơng
tin – Trường Đại học Cơng nghệ - Đại học Quốc gia Hà nội đã truyền đạt các kiến
thức cho tơi trong suốt thời gian học tập và nghiên cứu vừa qua.
Tơi cũng xin chân thành cảm ơn cơ quan, bạn bè, đồng nghiệp, gia đình và
những người thân đã cùng chia sẻ, giúp đỡ, động viên, tạo mọi điều kiện thuận lợi để
tơi hồn thành nhiệm vụ học tập và cuốn luận văn này.
Hà nội, tháng 5 năm 2009
Học viên
Hà Văn Sang
iv
MỤC LỤC
LỜI CAM ĐOAN ................................................................................................................... i
LỜI CẢM ƠN....................................................................................................................... iii
MỤC LỤC............................................................................................................................ iv
DANH MỤC CÁC KÝ HIỆU, TỪ VIẾT TẮT...................................................................... vi
DANH MỤC HÌNH VẼ....................................................................................................... vii
DANH MỤC BẢNG BIỂU.................................................................................................viii
MỞ ĐẦU............................................................................................................................... 1
1. Đặt vấn đề ...................................................................................................................... 1
2. Mục tiêu của nghiên cứu ................................................................................................ 2
3. Cấu trúc của luận văn ..................................................................................................... 2
Chương 1 - MỘT SỐ KIẾN THỨC CƠ BẢN VỀ TÀI CHÍNH.............................................. 3
1.1. Một số khái niệm tài chính .......................................................................................... 3
1.1.1 Phân tích tài chính ................................................................................................. 3
1.1.2 Báo cáo tài chính ................................................................................................... 4
1.1.3 Phương pháp phân tích tài chính ............................................................................ 5
1.1.4 Dự báo tình hình tài chính...................................................................................... 6
1.2. Rủi ro tài chính............................................................................................................ 7
1.2.1 Khái niệm.............................................................................................................. 7
1.2.2 Nguồn gốc của rủi ro tài chính ............................................................................... 7
1.2.3 Quy trình quản trị rủi ro tài chính........................................................................... 8
1.2.3 Quản trị rủi ro trong đầu tư chứng khốn ............................................................. 10
1.3 Phân tích kỹ thuật trong dự báo thị trường chứng khốn. ............................................ 11
1.3.1 Khái niệm............................................................................................................ 11
1.3.2 Ứng dụng của phân tích kỹ thuật.......................................................................... 12
1.3.3 Các cơng cụ cơ bản sử dụng trong Phân tích kỹ thuật........................................... 12
1.3.4 Các chỉ dẫn kỹ thuật cơ bản ................................................................................. 14
Chương 2 - TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU ......................................................... 16
2.1 Giới thiệu về khai phá dữ liệu (Data Mining).............................................................. 16
2.2 Phân lớp ..................................................................................................................... 18
2.2.1 Giới thiệu về phân lớp ......................................................................................... 18
2.2.2 Các phương pháp phân lớp .................................................................................. 20
2.3 Mạng Nơron............................................................................................................... 24
2.4 Hệ mờ (Fuzzy System) ............................................................................................... 28
2.4.1 Định nghĩa tập mờ ............................................................................................... 29
2.4.2 Phép suy diễn mờ ................................................................................................ 30
2.4.3 Phép hợp mờ ....................................................................................................... 32
2.4.4 Giải mờ ............................................................................................................... 34
2.4.5 Hệ suy diễn mờ.................................................................................................... 36
Chương 3 - MƠ HÌNH PHÂN TÍCH RỦI RO TÀI CHÍNH ................................................. 38
v
2.1 Sơ lược về mơ hình .................................................................................................... 38
2.2 Phân lớp dữ liệu - Thiết kế mạng nơron ...................................................................... 39
2.2.1 Chọn loại dữ liệu đầu vào .................................................................................... 39
2.2.2 Thu thập dữ liệu .................................................................................................. 39
2.2.3 Tiền xử lý dữ liệu ................................................................................................ 40
2.2.4 Phân hoạch dữ liệu .............................................................................................. 41
2.2.5 Thiết kế và huấn luyện mạng Nơron .................................................................... 41
2.2.6 Phân tích dữ liệu.................................................................................................. 41
2.3 Xây dựng tập luật từ phân tích kỹ thuật ...................................................................... 42
2.3.1 Phân kỳ và hội tụ của đường trung bình di động .................................................. 42
2.3.2 Chỉ số kênh giá hàng hố - The Commodity Channel Index (CCI) ....................... 43
2.3.3 Chỉ số cường độ tương đối - Relative Strength Index (RSI) ................................. 43
2.3.4 Dải băng Bollinger .............................................................................................. 44
2.4 Kết hợp phân tích kỹ thuật với logic mờ và mạng nơron ............................................. 44
2.4.1 Mơ đun chỉ số kỹ thuật ........................................................................................ 45
2.4.2 Mơ đun hội tụ ...................................................................................................... 46
2.4.3 Mơ đun hệ suy diễn mờ (FIS) .............................................................................. 46
2.4.4 Luật cơ sở............................................................................................................ 47
Chương 4 - THỰC NGHIỆM VÀ ĐÁNH GIÁ .................................................................... 49
4.1 Dữ liệu dùng trong thực nghiệm ................................................................................. 49
4.2 Thiết lập tham số cho thực nghiệm ............................................................................. 50
4.2.1 Các tham số của mạng nơron ............................................................................... 50
4.2.2 Các tham số của hệ hỗ trợ quyết định................................................................... 51
4.3 Kết quả mẫu ............................................................................................................... 54
4.3.1 Kết quả việc đánh giá và dự báo trong tương lai .................................................. 54
4.3.2 Kết quả việc hỗ trợ quyết định ............................................................................. 58
4.4 Đánh giá và phân tích ................................................................................................. 59
4.5 Kết luận...................................................................................................................... 63
KẾT LUẬN ......................................................................................................................... 64
TÀI LIỆU THAM KHẢO.................................................................................................... 65
PHỤ LỤC............................................................................................................................ 66
Phụ lục A – Giới thiệu về phần mềm FRPredictor ............................................................ 66
Phụ lục B – Cấu trúc các bảng cơ sở dữ liệu tài chính....................................................... 69
Phụ lục B – Dữ liệu dùng trong thực nghiệm.................................................................... 72
vi
DANH MỤC CÁC KÝ HIỆU, TỪ VIẾT TẮT
Từ viết tắt Tiếng Anh Tiếng Việt
BB Bollinger Band Dải bolinger
CCI The Commodity Channel Index Chỉ số kênh giá hàng hố
CK Chứng khốn
CNTT Cơng nghệ thơng tin
CP Cổ phiếu
CSDL Database Cơ sở dữ liệu
DN Doanh nghiệp
MA Moving Average Đường trung bình động
MACD MovingAverage
Convergence/Divergence
Phân kỳ và hội tụ của đường trung
bình động
MISO Multi Input Single Output Nhiều đầu vào – Một đầu ra
MLP Multi Layer Perceptron Mạng truyền thẳng nhiều lớp
PTTK Phân tích kỹ thuật
RSI Relative Strength Index Chỉ số cường độ tương đối
TTCK Thị trường chứng khốn
vi
DANH MỤC HÌNH VẼ
Hình 1-1 Biểu đồ dạng đường ............................................................................................. 12
Hình 1-2 Biểu đồ dạng then chắn ........................................................................................ 13
Hình 1-3 Biểu đồ dạng cây nến ........................................................................................... 13
Hình 2-1 Mơ hình phân lớp tiêu chuẩn ................................................................................ 19
Hình 2-2 Mơ hình một nơron perceptron ............................................................................. 24
Hình 2-3 Mơ hình mạng perceptron 3 lớp(MLP) ................................................................. 26
Hình 2-4 Các dạng hàm thuộc ............................................................................................. 30
Hình 2-5 Giải mờ bằng phương pháp cực đại ...................................................................... 35
Hình 2-6 Giải mờ bằng phương pháp điểm trọng tâm.......................................................... 35
Hình 2-7 Hệ suy diễn mờ .................................................................................................... 36
Hình 3-1 Mơ hình đề xuất ................................................................................................... 38
Hình 3-2 Mồ hình thực thể liên kết...................................................................................... 40
Hình 3-3 Hệ suy diễn mờ .................................................................................................... 45
Hình 3-4 Miền giá trị của đầu ra.......................................................................................... 47
Hình 4-1 Kết quả huấn luyện và kiểm tra ............................................................................ 55
Hình 4-2 Kết quả thực hiện phân tích .................................................................................. 57
Hình 4-3 Dự đốn Sp500..................................................................................................... 58
Hình 4-4 Hỗ trợ quyết định cho cơng ty IBM ...................................................................... 58
Hình 4-5 Tỷ lệ chính xác..................................................................................................... 61
Hình 4-6 Tỷ lệ chính xác theo quý ...................................................................................... 61
Hình 4-7 So sánh tỷ lệ chính xác ......................................................................................... 62
vi
DANH MỤC BẢNG BIỂU
Bảng 2-1 Ma trận hỗn hợp trong phân lớp ............................................................................ 20
Bảng 3-1 Miền giá trị của các tham số.................................................................................. 46
Bảng 4-1 Thiết lập tham số mạng......................................................................................... 51
Bảng 4-2 Các chỉ số kỹ thuật và luật mờ tương ứng ............................................................. 52
Bảng 4-3 Kết hợp Hạng, các chỉ số và luật mờ tương ứng .................................................... 53
Bảng 4-4 Mẫu dữ liệu huấn luyện ........................................................................................ 54
Bảng 4-5 Dữ liệu phân tích .................................................................................................. 56
Bảng 4-6 Kết quả phân tích và dự báo.................................................................................. 57
Bảng 4-7 Hỗ trợ quyết định cho các cơng ty......................................................................... 59
Bảng 4-8 Kết quả so sánh giữa quyết định từ MACD, mơ hình và thực tế ............................ 60
Bảng 4-9 So sánh việc ba chỉ số với hệ thống....................................................................... 62
1
MỞ ĐẦU
1. Đặt vấn đề
Thế giới ngày càng trở nên bất ổn hơn, những bất ổn trong giá cả hàng hố và
các biến số tài chính thay đổi theo những chiều hướng khĩ cĩ thể dự báo trước được.
Trước khi ban quản trị cĩ thể đưa ra bất kỳ một quyết định nào về phịng ngừa rủi ro,
trước tiên họ cần phải nhận diện được tất cả các rủi ro mà cơng ty cĩ thể gặp phải. Hầu
hết các tổ chức tài chính đều phải đối mặt với những rủi ro kinh doanh, là rủi ro thuộc
về bản chất của các hoạt động kinh doanh. Trên thế giới đã cĩ nhiều nghiên cứu về vấn
đề này và đã cĩ một số mơ hình cũng như phần mềm hỗ trợ việc đánh giá, dự báo rủi
ro tài chính. Tuy nhiên ở Việt nam, các tổ chức tài chính cũng như các cơng ty doanh
nghiệp chưa chú ý nhiều tới rủi ro tài chính. Một số doanh nghiệp cĩ thể tự đánh giá,
dự báo rủi ro hoặc đi thuê chuyên gia cố vấn tài chính. Cách làm này tương đối thủ
cơng và tốn kém về mặt nhân lực cũng như kinh phí.
Trong các lĩnh vực nghiên cứu của khoa học máy tính thì khai phá dữ liệu là
lĩnh vực đang phát triển mạnh mẽ và cĩ nhiều ứng dụng thực tiễn. Khai phá dữ liệu kết
hợp giữa học máy, cơng nghệ cơ sở dữ liệu và các chuyên ngành khác để tìm ra tri
thức từ những cơ sở dữ liệu rất lớn. Từ những tri thức này, ta cĩ thể sử dụng để xây
dựng mơ hình để đánh giá, dự báo.
Mục tiêu của luận văn là tìm hiểu về rủi ro tài chính và xây dựng mơ hình nhằm
đánh giá, dự báo rủi ro tài chính. Tuy nhiên, vấn đề rủi ro tài chính là tương đối lớn và
rộng nên phạm vi của luận văn chỉ dừng lại ở việc xây dựng mơ hình đánh giá, dự báo
rủi ro trong lĩnh vực đầu tư, kinh doanh chứng khốn. Luận văn tập trung vào việc tìm
hiểu một số mơ hình học máy tiên tiến và phân tích kỹ thuật trong lĩnh vực chứng
khốn. Phân tích kỹ thuật là một khoa học rất mới, nĩ đang phát triển mạnh mẽ và cĩ
những kết quả khả quan. Trong luận văn, tơi đã thực hiện việc kết hợp phương pháp
học máy sử dụng mạng nơron nhân tạo, phân tích kỹ thuật, hệ suy diễn mờ và ứng
dụng xây dựng mơ hình đánh giá, hỗ trợ quyết định mua hoặc bán một mã cổ phiếu cụ
thể nào đĩ. Tơi đã hồn thành phần mềm thử nghiệm và tiến hành thực nghiệm trên bộ
dữ liệu thực tế thu thập từ các sàn giao dịch chứng khốn trong và ngồi nước. Trong
luận văn này, tơi đã tìm hiểu, kết hợp và tìm cách ứng dụng phương pháp khai phá dữ
liệu nhằm phân tích và đánh giá rủi ro trong lĩnh vực tài chính. Các kết quả thực
nghiệm của phần mềm tuy chưa thực sự cao nhưng cũng đủ để cung cấp thơng tin và
định hướng ban đầu cho các nghiên cứu tiếp theo của chúng tơi.
2
2. Mục tiêu của nghiên cứu
Nghiên cứu của luận văn hướng tới các mục tiêu sau:
- Giúp đỡ ban quản trị doanh nghiệp đánh giá rủi ro trong lĩnh vực tài chính
- Giúp người kinh doanh và đầu tư chứng khốn trong việc dự báo, đưa ra quyết
định mua bán chứng khốn.
3. Cấu trúc của luận văn
Luận văn được chia thành 6 phần với các nội dung như sau:
Chương I trình bày các nội dung lý thuyết về lĩnh vực tài chính. Các khái niệm
liên quan tới tài chính, rủi ro tài chính, chứng khốn, phân tích dự báo trong đầu tư
chứng khốn đã được giới thiệu ngắn gọn nhằm mang lại những kiến thức căn bản
trong lĩnh vực tài chính.
Chương II giới thiệu về khai phá dữ liệu, sau đĩ chúng tơi giới thiệu chi tiết về
vấn đề phân lớp, mạng nơron, logic mờ. Các kỹ thuật được trình bày trong chương này
sẽ là cơ sở lý thuyết cho phương pháp giải quyết của chúng tơi ở các chương tiếp theo.
Chương III tập trung vào xây dựng mơ hình nhằm giải quyết bài tốn đã đặt ra.
Trong chương này chúng tơi đưa ra phương pháp sử dụng logic mờ, mạng nơ ron và
phân tích kỹ thuật nhằm xây dựng hệ hỗ trợ ra quyết định cho bài tốn dự báo dự đốn
rủi ro tài chính.
Chương IV mơ tả và phân tích những kết quả mà chúng tơi đã tiến hành thực
nghiệm. Mơ hình được huấn luyện bởi dữ liệu giao dịch chứng khốn trong quá khứ,
sau đĩ mơ hình sẽ được sử dụng để dự đốn độ rủi ro của doanh nghiệp tương ứng
nhằm kiểm chứng khả năng dự đốn của mơ hình. Đồng thời các kết quả này cũng
được so sánh với các mơ hình khác nhằm tìm ra điểm mạnh, yếu của mơ hình so với
các mơ hình đã được xây dựng.
Phần kết luận tổng kết những kết quả đạt được của luận văn và hướng nghiên
cứu tiếp theo.
Phần phụ lục giới thiệu về phần mềm dự báo rủi ro và hỗ trợ quyết định, đồng
thời hướng dẫn cách thức cơ bản sử dụng phần mềm.
3
Chương 1 - MỘT SỐ KIẾN THỨC CƠ BẢN VỀ TÀI
CHÍNH
Chương này cung cấp các kiến thức cơ sở về lĩnh vực tài chính. Đầu tiên sẽ là
các khái niệm chính về tài chính, rủi ro tài chính, các phương pháp dự báo, đánh giá
rủi ro. Mục tiếp theo sẽ giới thiệu về phân tích kỹ thuật trong việc đầu tư, kinh doanh
chứng khốn.
1.1. Một số khái niệm tài chính
1.1.1 Phân tích tài chính
Phân tích tài chính cơng cụ quản lý vĩ mơ của Nhà nước để đánh giá tình hình
kinh tế của đất nước, của từng ngành, từng địa phương mà trên cơ sở đĩ xác định được
nhu cầu vốn của xã hội. Cịn đối với các doanh nghiệp (DN) và các nhà đầu tư thì việc
đánh giá phân tích được kết quả hoạt động sản xuất kinh doanh, phân tích và dự đốn
tình hình tài chính của doanh nghiệp, giúp họ đưa ra những phương hướng, những
quyết định đúng đắn về hoạt động sản xuất cũng như hoạt động tài chính nhằm làm
doanh nghiệp tồn tại, phát triển và bảo đảm trạng thái cân bằng tài chính của mình.
Cĩ nhiều khái niệm về phân tích tài chính doanh nghiệp, nhưng khái niệm hay
dùng nhất là:
Phân tích hoạt động tài chính doanh nghiệp là quá trình thu thập, xử lý các
thơng tin kế tốn, nhằm xem xét, kiểm tra, đối chiếu, so sánh tài chính hiện hành với
quá khứ, giúp người sử dụng thơng tin cĩ thể đánh giá tình hình tài chính DN, đánh giá
về tiềm năng, hiệu quả kinh doanh cũng như rủi ro trong tương lai.
- Ý nghĩa:
Mỗi đối tượng quan tâm đến tình hình tài chính của DN với một gĩc độ khác
nhau. Đối với chủ DN và các nhà quản trị DN mối quan tâm hàng đầu của họ là tìm
kiếm lợi nhuận và khả năng tài trợ. Đối với chủ ngân hàng và các nhà cho vay tín
dụng, mối quan tâm chủ yếu của họ là khả năng trả nợ hiện tại và sắp tới của DN. Đối
với nhà đầu tư mối quan tâm của họ là các yếu tố rủi ro, thời gian hồn vốn, mức sinh
lãi và khả năng thanh tốn vốn...Nhìn chung họ đều quan tâm đến khả năng tạo ra
dịng tiền mặt, khả năng sinh lời, khả năng thanh tốn và mức sinh lời tối đa.
- Yêu cầu:
4
+ Phân tích hoạt động tài chính DN phải cung cấp đầy đủ thơng tin hữu ích cho
các nhà đầu tư, các tín chủ và những người sử dụng thơng tin khác nhau để giúp họ cĩ
quyết định đúng đắn khi ra các quyết định đầu tư, quyết định cho vay, quyết định sản
xuất...
+ Phân tích hoạt động tài chính DN phải cung cấp thơng tin cho các DN, các
nhà đầu tư, các nhà cho vay và những nhà sử dụng thơng tin khác nhau trong việc đánh
giá khả năng và tính chắc chắn của các dịng tiền mặt vào, ra và hiệu quả sử dụng vốn
kinh doanh, tình hình, khả năng thanh tốn của DN.
Như vậy, cĩ thể khẳng định, ý nghĩa tối cao và quan trọng nhất của phân tích tài
chính DN là giúp cho những người ra quyết định lựa chọn phương án kinh doanh tối
ưu và đánh giá chính xác thực trạng, tiềm năng của DN.
- Tài liệu phục vụ báo cáo tài chính
Phân tích tài chính sử dụng mọi nguồn thơng tin cĩ khả năng làm rõ mục tiêu
dự đốn tài chính. Từ khi pháp lệnh kế tốn tài chính được ban hành, hệ thống các báo
cáo tài chính đã được thống nhất và là tài liệu cơ sở, quan trọng cho các nhà phân tích
tài chính.
1.1.2 Báo cáo tài chính
Ở nước ta chủ yếu sử dụng hệ thống báo cáo tài chính gồm:
Bảng cân đối kế tốn: là báo cáo tổng hợp cho biết tình hình tài chính của đơn
vị tại những thời điểm nhất định dưới hình thái tiền tệ. Đây là một báo cáo tài chính cĩ
ý nghĩa rất quan trọng đối với mọi đối tượng cĩ quan hệ sở hữu, quan hệ kinh doanh
với DN.
Bảng cân đối kế tốn phản ánh hai nội dung cơ bản là nguồn vốn tài sản. Nguồn
vốn phản ánh nguồn vốn được huy động vào sản xuất kinh doanh. Về mặt pháp lý,
nguồn vốn cho thấy trách nhiệm của DN về tổng số vốn đã đăng ký kinh doanh với
Nhà nước, số tài sản đã hình thành bằng nguồn vốn vay ngân hàng, vay đối tượng
khác, cũng như trách nhiệm phải thanh tốn với người người lao động, cổ đơng, nhà
cung cấp, trái chủ, ngân sách... Phần tài sản phản ánh quy mơ và cơ cấu các loại tài sản
hiện cĩ đến thời điểm lập báo cáo thuộc quyền quản lý, sử dụng của DN, năng lực và
trình độ sử dụng tài sản. Về mặt pháp lý, phần tài sản thể hiện tiềm lực mà DN cĩ
quyền quản lý, sử dụng lâu dài, gắn với mục đích thu được các khoản lợi nhuận.
Bảng cân đối kế tốn là tài liệu quan trọng bậc nhất giúp cho nhà phân tích
nghiên cứu đánh giá một cách khái quát tình hình và kết quả kinh doanh, khả năng cân
bằng tài chính, trình độ sử dụng vốn và những triển vọng tài chính của DN.
Báo cáo kết quả hoạt động kinh doanh: Là báo cáo tài chính tổng hợp cho biết
tình hình tài chính của DN trong từng thời kỳ nhất định, phản ánh tĩm lược các khoản
thu, chi phí, kết quả hoạt động sản xuất kinh doanh của tồn DN, kết quả hoạt động
5
sản xuất kinh doanh theo từng hoạt động kinh doanh (sản xuất kinh doanh, đầu tư tài
chính, hoạt động bất thường).
Dựa vào số liệu trên báo cáo kết quả kinh doanh, người sử dụng thơng tin cĩ thể
kiểm tra, phân tích, đánh giá kết quả hoạt động kinh doanh của DN trong kỳ, so sánh
với kỳ trước và với DN khác để nhận biết khái quát hoạt động trong kỳ và xu hướng
vận động.
Báo cáo lưu chuyển tiền tệ: là báo cáo liên quan đến luồng tiền ra vào trong
DN, tình hình trả nợ, đầu tư bằng tiền của DN trong từng thời kỳ.
Báo cáo lưu chuyển tiền tệ cung cấp những thơng tin về những luồng vào, ra
của tiền và coi như tiền, những khoản đầu tư ngắn hạn cĩ tính lưu động cao, cĩ thể
nhanh chĩng và sẵn sàng chuyển đổi thành một khoản tiền biết trước ít chịu rủi ro lỗ
về giá trị do những sự thay đổi về lãi suất. Những luồng vào ra của tiền và những
khoản coi như tiền được tổng hợp thành ba nhĩm: lưu chuyển tiền tệ từ hoạt động kinh
doanh, lưu chuyển tiền tệ từ hoạt động đầu tư, lưu chuyển tiền tệ từ hoạt động tài chính
và lập theo phương pháp trực tiếp, gián tiếp.
Thuyết minh các báo cáo tài chính: nhằm cung cấp các thơng tin về tình hình
sản xuất kinh doanh chưa cĩ trong hệ thống các báo cáo tài chính, đồng thời giải thích
một số chỉ tiêu mà trong các báo cáo tài chính chưa được trình bày, giải thích thêm
một cách cụ thể, rõ ràng.
Các báo cáo tài chính trong DN cĩ mối quan hệ mật thiết với nhau, mỗi sự thay
đổi của một chỉ tiêu trong báo cáo này trực tiếp hay gián tiếp ảnh hưởng đến các báo
cáo kia, trình tự đọc hiểu được các báo cáo tài chính, qua đĩ họ nhận biết được và tập
trung vào các chỉ tiêu tài chính liên quan trực tiếp tới mục tiêu phân tích của họ.
1.1.3 Phương pháp phân tích tài chính
Để tiến hành phân tích hoạt động kinh doanh cũng như phân tích hoạt động tài
chính người ta khơng dùng riêng lẻ một phương pháp phân tích nào mà sử dụng kết
hợp các phương pháp phân tích với nhau để đánh giá tình hình DN một cách xác thực
nhất, nhanh nhất.
Phương pháp chủ yếu là phương pháp so sánh và phân tích tỷ lệ.
Phương pháp so sánh: Để áp dụng được phương pháp này cần phải đảm bảo
các điều kiện cĩ thể so sánh được của các chỉ tiêu (phải thống nhất về nội dung,
phương pháp, thời gian và đơn vị tính tốn của các chỉ tiêu so sánh) và theo mục đích
phân tích mà xác định gốc so sánh. Gốc so sánh cĩ thể chọn là gốc về mặt thời gian
hoặc khơng gian. Kỳ (điểm) được chọn để phân tích gọi là kỳ phân tích (hoặc điểm
phân tích). Các trị số của chỉ tiêu tính ra ở từng kỳ tương ứng gọi là trị số chỉ tiêu kỳ
gốc, kỳ phân tích. Và để phục vụ mục đích phân tích người ta cĩ thể so sánh bằng các
cách: so sánh bằng số tuyệt đối, so sánh bằng số tương đối, so sánh bằng số bình quân.
6
Phương pháp so sánh sử dụng trong phân tích tài chính DN là:
- So sánh giữa số thực hiện kỳ này với số thực hiện kỳ trước để thấy rõ xu
hướng thay đổi về tài chính của DN, thấy được sự cải thiện hay xấu đi như thế nào để
cĩ biện pháp khắc phục trong kỳ tới.
- So sánh giữa số thực hiện với số kế hoạch để thấy mức độ phấn đấu của
Doanh nghiệp.
- So sánh giữa số thực hiện kỳ này với mức trung bình của ngành để thấy được
tình hình tài chính của DN đang ở tình trạng tốt hay xấu, được hay chưa được so với
các DN cùng ngành.
- So sánh theo chiều dọc để thấy được tỷ trọng của từng loại trong tổng hợp ở
mỗi bản báo cáo. So sánh theo chiều ngang để thấy được sự biến đổi về cả số tương
đối và số tuyệt đối của một khoản mục nào đĩ qua niên độ kế tốn liên tiếp.
Phương pháp phân tích tỷ lệ: là phương pháp truyền thống, được sử dụng phổ
biến trong phân tích tài chính. Đây là phương pháp cĩ tính hiện thực cao với các điều
kiện áp dụng ngày càng được bổ sung và hồn thiện. Bởi lẽ:
Thứ nhất, nguồn thơng tin kế tốn và tài chính được cải tiến và được cung cấp
đầy đủ hơn. Đĩ là cơ sở hình thành các chỉ tiêu tham chiếu tin cậy cho việc đánh giá
một tỷ lệ tài chính của DN.
Thứ hai, việc áp dụng cơng nghệ tin học cho phép tích luỹ dữ liệu và thúc đẩy
nhanh quá trình tính tốn hàng loạt các tỷ lệ.
Thứ ba, phương pháp phân tích này giúp cho nhà phân tích khai thác cĩ hiệu
quả các số liệu và phân tích một cách cĩ hệ thống hàng loạt tỷ lệ theo chuỗi thời gian
liên tục hoặc theo từng giai đoạn.
Phương pháp này dựa trên ý nghĩa chuẩn mực các tỷ lệ của đại lượng tài chính
trong các quan hệ tài chính. Về nguyên tắc, phương pháp tỷ lệ yêu cầu phải xác định
được các ngưỡng, các định mức để nhận xét đánh giá tình hình tài chính DN, trên cơ
sở so sánh các tỷ lệ của DN với các tỷ lệ tham chiếu.
Trong phân tích tài chính Dn, các tỷ lệ tài chính được phân thành các nhĩm tỷ
lệ đặc trưng, phản ánh nội dung cơ bản theo mục tiêu hoạt động của DN. Đĩ là các
nhĩm tỷ lệ về nội dung thanh tốn, nhĩm tỷ lệ về cơ cấu vốn và nguồn vốn, nhĩm các
tỷ lệ về năng lực hoạt động, nhĩm các tỷ lệ về khả năng sinh lời.
1.1.4 Dự báo tình hình tài chính.
Dự báo tình hình tài chính là một yêu cầu cần thiết để kế hoạch hố tài chính
ngắn hạn cĩ hiệu quả. Thay cho việc phán quyết, các dự báo được dựa vào các nguồn
dữ liệu và các phương pháp dự báo khác nhau. Nhưng nhìn chung, chủ yếu vẫn sử
dụng các mơ hình kinh tế lượng, các tính tốn qua lại của các biến số kinh tế. Trong
7
các trường hợp khác, nhà dự báo tài chính cĩ thể sử dụng các phương pháp thống kê
trong việc phân tích và dự tính các chuỗi thời gian.
Nội dung dự kiến bao gồm:
Phân tích các lựa chọn về tài trợ và đầu tư của DN.
Dự tính các hiệu ứng tương lai của của các quyết định hiện tại.
Quyết định thực hiện phương án nào.
So sánh các kết quả hoạt động và các mục tiêu lập ra ban đầu.
Để làm được điều này, cần phải sử dụng các nhĩm chỉ tiêu tài chính đặc trưng
của DN trong quá khứ để làm căn cứ, cơ sở khoa học cho việc xây dựng một hệ thống
các báo cáo tài chính dự kiến.
Các dự báo tổng hợp cĩ tính nhất quán về doanh thu, luồng tiền, thu nhập và
các dự báo khác là rất phức tạp và tốn nhiều thời gian. Tuy nhiên, nhiều tính tốn cần
thiết cĩ thể được thực hiện một cách tự động bởi mơ hình kế hoạch. Bằng cách đĩ, sản
phẩm của nhà phân tích tài chính trong hoạch định tài chính sẽ là một hệ thống các
bảng cân đối tài sản, báo cáo thu nhập và báo cáo luồng tiền dự tính. Số liệu trong dự
báo cĩ thể là con số trung gian nào đĩ giữa số dự báo thực và số thực tế kỳ vọng đạt
tới.
1.2. Rủi ro tài chính
1.2.1 Khái niệm
Rủi ro chính là các khả năng gây ra tổn thất hay thiệt hại. Thơng thường, các rủi
ro khơng đứng riêng lẻ một mình mà chúng tiềm tàng trong mối quan hệ cĩ tính tương
tác lẫn nhau khiến cho việc dự đốn rủi ro càng trở nên khĩ khăn hơn.
1.2.2 Nguồn gốc của rủi ro tài chính
Rủi ro tài chính bắt nguồn từ vơ số các giao dịch liên quan trực tiếp đến tài
chính như mua bán, đầu tư, vay nợ và một số hoạt động kinh doanh khác hoặc là hệ
quả gián tiếp của các chính sách thay đổi trong quản lý, trong cạnh tranh, trong các
quan hệ quốc tế và thậm chí cĩ thể chỉ do sự thay đổi của thời tiết hay khí hậu. Nếu
quan sát kỹ các biến động về tài chính, cĩ thể nhận ra được 3 nguồn chính gây ra rủi ro
về tài chính bao gồm:
Rủi ro phát sinh từ sự thay đổi bên ngồi về giá cả trên thị trường như lãi suất,
tỷ giá hay giá của các loại hàng hố khác.
8
Rủi ro phát sinh từ các hoạt động hay giao dịch với các đối tác trong kinh doanh
như nhà cung cấp, khách hàng, các đối tác trong các giao dịch phát sinh hoặc trong các
liên doanh gĩp vốn đầu tư.
Rủi ro phát sinh từ ngay chính nội bộ doanh nghiệp, những thay đổi từ bên
trong liên quan đến nhân sự, cơ cấu tổ chức hoặc quy trình sản xuất kinh doanh.
1.2.3 Quy trình quản trị rủi ro tài chính
Rủi ro tài chính thường cĩ tác động dây chuyền và cộng hưởng. Do đĩ, doanh
nghiệp phải chủ động xây dựng cho mình quy trình đánh giá và quản trị rủi ro tài chính
phù hợp, nhằm tự vệ trước biến động khơn lường của thị trường tài chính.
Đơi lúc thiếu hợp lý, nhưng với một sức hấp dẫn đặc biệt, thị trường tài chính
vẫn đang sống với quy luật chung và riêng của nĩ, phát triển nhanh hơn mọi dự đốn
và phát sinh những tình huống hồn tồn chưa được đề cập đến trong bất kỳ lý thuyết
nào. Tồn tại như một cơ chế đáp ứng những nhu cầu đa dạng về cung cấp và sử dụng
vốn, thị trường tài chính luơn ẩn chứa nhiều rủi ro ảnh hưởng đến sự sống cịn của các
doanh nghiệp tham gia vào thị trường này. Với xu hướng tồn cầu hố tài chính, rủi ro
cĩ thể đang tiềm ẩn tại những thị trường tuy xa về khoảng cách địa lý nhưng cĩ khả
năng gây ra những biến động nghiêm trọng đối với thị trường tài chính trong nước,
gây nên thiệt hại khơn lường đối với hoạt động kinh doanh của doanh nghiệp.
Do những đổi thay khơng ngừng trên thị trường mà việc quản trị rủi ro cũng trở
thành một quá trình biến hố liên tục các phương pháp phịng chống rủi ro, dựa trên dự
báo về mức độ biến động của giá cả, mơi trường kinh doanh, điều kiện chính trị, kinh
tế xã hội trong nước và quốc tế. Mặc dù vậy, quy trình quản trị rủi ro khơng thể bỏ qua
những bước căn bản sau đây:
1. Nhận diện và phân loại rủi ro
Mọi rủi ro trên thị trường đều xuất phát từ những thay đổi về giá cả thị trường
như lãi suất, tỷ giá cũng như giá của các loại hàng hố khác. Ngồi ra cịn cĩ một số
rủi ro khác ảnh hưởng đến tài chính doanh nghiệp như rủi ro về tín dụng, rủi ro trong
hoạt động sản xuất, rủi ro trong thanh khoản và rủi ro mang tính hệ thống tác động
chung lên tồn thị trường. Những rủi ro trên đều cĩ tính liên kết và tác động qua lại lẫn
nhau nên khi thị trường đi xuống, sự cộng hưởng của chúng sẽ gây nên tổn thất khơn
lường đối với doanh nghiệp.
2. Tính tốn và cân nhắc các mức độ rủi ro và mức độ chịu đựng tổn thất khi rủi
ro xảy ra
Đo lường rủi ro là một quá trình gồm 2 bước. Bước đầu tiên là tính tốn mức
thu lợi cĩ thể đạt được hoặc quan trọng hơn cả trong quản trị rủi ro là tính tốn mức
tổn thất cĩ thể chấp nhận được trong trường hợp xảy ra biến động xấu về giá cả trên
thị trường. Nĩi cách khác, đo lường rủi ro chính là việc trả lời cho câu hỏi "Doanh
9
nghiệp cĩ thể chấp nhận tổn thất đến mức độ nào?". Để cĩ được câu trả lời thì việc
tính tốn khả năng và mức độ tổn thất phải được định lượng bằng những con số biết
nĩi. Tuỳ theo độ nhạy cảm của từng loại cơng cụ đo lường, kết quả cĩ được cĩ thể tính
bằng thời gian mất đi hoặc số tiền thiệt hại trên vốn hoặc lợi nhuận. Chẳng hạn, việc
sử dụng các cơng cụ phát sinh như Hợp đồng kỳ hạn (forwards), Hợp đồng tương lai
(options) và Hợp đồng hốn đổi (swaps) sẽ giúp doanh nghiệp tính tốn được mức độ
tổn thất này bằng các con số chính xác khi thị trường biến động theo hướng ngược
chiều với dự đốn. Chi phí bỏ ra khi sử dụng các cơng cụ này chính là cái giá mà
doanh nghiệp phải trả nếu rủi ro xảy ra.
Bước thứ hai của quá trình này là xác định các khả năng xảy ra tương ứng với
từng mức độ biến động trên thị trường. Dựa trên những khả năng biến động về giá
cũng như biên độ dao động giá, mức độ tổn thất cũng như mức thu lợi cĩ thể được tính
tốn chi tiết và cụ thể cho từng trường hợp.
3. Áp dụng các chính sách, cơng cụ phịng chống thích hợp đối với từng loại rủi
ro
Tuỳ thuộc vào mức độ và khả năng chấp nhận rủi ro, doanh nghiệp sẽ áp dụng
những biện pháp phịng chống khác nhau nhằm giảm thiểu mức độ thiệt hại khi rủi ro
xảy ra. Trên thực tế, doanh nghiệp cĩ thể cĩ một số chọn lựa. Một trong những chọn
lựa đơn giản nhất là khơng làm gì cả bằng cách chủ động hoặc thụ động chấp nhận
mọi rủi ro cĩ thể xảy ra. Điều này hồn tồn đúng với những khoản vay nhỏ vì chi phí
để phịng chống cĩ khi cịn cao hơn việc chấp nhận mức thiệt hại nếu thị trường cĩ
biến động. Tuy nhiên, phương pháp này lại tỏ ra rất nguy hiểm đối với những khoản
thanh tốn bằng ngoại tệ hoặc khoản vay lớn vì chỉ một biến động nhỏ về lãi suất hoặc
tỉ giá thì thiệt hại sẽ là một con số khơng thể thờ ơ. Khi đĩ, các cơng cụ phịng chống
rủi ro đặc biệt tỏ ra hữu hiệu nhằm ngăn chặn một phần tổn thất cĩ khả năng xảy ra
hoặc ngăn chặn khả năng xảy ra rủi ro cĩ thể lường trước.
4. Theo dõi, đánh giá và điều chỉnh phương pháp phịng chống nếu cần thiết
Sự vận động của thị trường sẽ khiến cho mọi phương pháp phịng chống dù là
tối ưu nhất cũng trở nên mất tác dụng nếu khơng được điều chỉnh cho phù hợp. Do
vậy, kết quả của việc sử dụng các phương pháp phịng chống rủi ro cần được ghi nhận
và xử lý kịp thời để việc ứng dụng phương pháp trên được thay đổi cho phù hợp với
nhu cầu của doanh nghiệp trong những tình huống mới.
Tuy nhiên, điều quan trọng hơn cả là doanh nghiệp cần nhận thức và chủ động
ứng dụng quy trình này trong thực tế, đặc biệt là khi thị trường Việt Nam vận động
trong một nền kinh tế hội nhập với thế giới đang dần tách khỏi sự bảo hộ của Ngân
hàng Nhà nước về tỉ giá và các chính sách mở cửa khác cho thị trường tài chính trong
nước. Nguy cơ về những biến động lớn trên thị trường tiền tệ và khủng hoảng tài chính
trong giai đoạn sắp tới sẽ buộc doanh nghiệp phải ý thức hơn trong việc xây dựng quy
trình quản trị rủi ro thích hợp nhằm bảo vệ tài sản của mình.
10
Rủi ro tài chính phát sinh từ 3 nguồn: sự thay đổi bên ngồi; hoạt động, giao
dịch với đối tác bên trong và từ chính nội bộ doanh nghiệp
1.2.3 Quản trị rủi ro trong đầu tư chứng khốn
Rủi ro trong đầu tư CK được định nghĩa là sự dao động của lợi nhuận mong
đợi, do vậy để đạt được tỷ lệ lợi nhuận cao trong đầu tư chứng khốn, vấn đề đặt ra là
phải quản lý được mức rủi ro này.
Các loại rủi ro trong đầu tư chứng khốn
Rủi ro hệ thống là rủi ro tác động đến tồn bộ hoặc hầu hết các CK. Sự bấp
bênh của mơi trường kinh tế nĩi chung như sự sụt giảm GDP, biến động lãi suất, tốc
độ lạm phát thay đổi... là những minh chứng cho rủi ro hệ thống, những biến đổi này
tác động đến sự dao động giá cả của các CK trên thị trường.
Trong rủi ro hệ thống trước hết phải kể đến rủi ro thị trường. Rủi ro thị trường
xuất hiện do phản ứng của các nhà đầu tư đối với các hiện tượng trên thị trường.
Những sự sút giảm đầu tiên trên thị trường là nguyên nhân gây sợ hãi đối với các nhà
đầu tư và họ sẽ cố gắng rút vốn. Phản ứng dây chuyền này làm tăng số lượng bán, giá
cả CK sẽ rơi xuống thấp so với giá trị cơ sở.
Tiếp đến là rủi ro lãi suất. Giá cả CK thay đổi do lãi suất thị trường dao động
thất thường gọi là rủi ro lãi suất. Giữa lãi suất thị trường và giá cả CK cĩ mối quan hệ
tỷ lệ nghịch. Khi lãi suất thị trường tăng, người đầu tư cĩ xu hướng bán CK để lấy tiền
gửi vào ngân hàng dẫn đến giá CK giảm và ngược lại.
Ngồi hệ quả trực tiếp đối với giá CK, lãi suất cịn ảnh hưởng gián tiếp đến giá
cổ phiếu (CP) thường. Khi lãi suất tăng làm giá CP giảm vì các nhà đầu cơ vay mua ký
quỹ sẽ bị ảnh hưởng. Nhiều cơng ty kinh doanh CK hoạt động chủ yếu bằng vốn đi
vay thì với mức lãi suất tăng cũng làm cho chi phí vốn tăng.
Rủi ro đầu tư CK
Rủi ro hệ thống
Rủi ro khơng hệ thống
Rủi ro kinh doanh
Rủi ro thị trường
Rủi ro tài chính
Rủi ro lãi suất
Rủi ro sức mua
11
Một yếu tố rủi ro hệ thống khác khơng kém phần quan trọng là rủi ro sức mua.
Rủi ro sức mua là tác động của lạm phát tới các khoản đầu tư. Lợi tức thực tế của CK
đem lại là kết quả giữa lợi tức danh nghĩa sau khi khấu trừ đi lạm phát. Như vậy, khi
cĩ tình trạng lạm phát thì lợi tức thực thế giảm. Giải thích theo lý thuyết hiện tại hố,
một đồng lợi tức của hơm nay thì trong tương lai khơng cịn giá trị một đồng do tác
động của lạm phát.
Rủi ro khơng hệ thống là rủi ro chỉ tác động đến một loại tài sản hoặc một nhĩm
tài sản, nghĩa là rủi ro này chỉ liên quan đến một loại CK cụ thể nào đĩ. Rủi ro khơng
hệ thống bao gồm rủi ro kinh doanh và rủi ro tài chính. Trong quá trình kinh doanh,
định mức thực tế khơng đạt được như theo kế hoạch gọi là rủi ro kinh doanh, chẳng
hạn lợi nhuận trong năm tài chính thấp hơn mức dự kiến.
Rủi ro kinh doanh được cấu thành bởi yếu tố bên ngồi và yếu tố nội tại trong
cơng ty. Rủi ro nội tại phát sinh trong quá trình cơng ty hoạt động. Rủi ro bên ngồi
bao gồm những tác động nằm ngồi sự kiểm sốt của cơng ty làm ảnh hưởng đến tình
trạng hoạt động của cơng ty như chi phí tiền vay, thuế, chu kỳ kinh doanh...
Rủi ro tài chính cũng là một loại rủi ro khơng hệ thống. Rủi ro tài chính liên
quan đến địn bẩy tài chính, hay nĩi cách khác liên quan đến cơ cấu nợ của cơng ty. Sự
xuất hiện các khoản nợ trong cấu trúc vốn sẽ tạo ra nghĩa vụ trả nợ trả lãi của cơng ty.
Cơng ty phải thực hiện nghĩa vụ trả nợ (gồm trả nợ ngân hàng và trả nợ trái phiếu)
trước việc thanh tốn cổ tức cho cổ đơng. Điều này ảnh hưởng khơng nhỏ đến giá cả
CP cơng ty. Rủi ro tài chính cĩ thể tránh được nếu cơng ty khơng vay nợ chút nào.
1.3 Phân tích kỹ thuật trong dự báo thị trường chứng khốn.
1.3.1 Khái niệm
PTKT là việc nghiên cứu giá, với cơng cụ cơ bản là biểu đồ, nhằm nâng cao
hiệu quả của hoạt động đầu tư. PTKT nghiên cứu các hành vi của các bên tham gia thị
trường thơng qua sự biến động của giá, khối lượng chứng khốn giao dịch nhằm xác
định được xu thế biến động giá và thời điểm đầu tư.
Phân tích kỹ thuật dựa trên lý thuyết DOW[2], với nội dung chủ yếu sau:
Thị trường phản ánh tất cả các thơng tin trong giá CK
3 xu thế của thị trường (xu thế sơ cấp, xu thế thứ cấp và các biến động hàng ngày)
PTKT sử dụng ba giả thiết sau:
Giá trị thị trường của bất kỳ sản phẩm hay dịch vụ nào đều được xác lập thơng
qua cung cầu của thị trường.
- Cung cầu của thị trường được xác lập dựa trên một hệ thống các yếu tố hợp l.
hoặc đơi khi phi l.. Và thị trường sẽ cân đối các trọng số này liên tục và tự động.
12
- Loại bỏ những dao động bất thường, giá cả của một chứng khốn đơn lẻ hay
tồn bộ giá cả của thị trường cĩ xu thế thay đổi theo một khuynh hướng (trend), và nĩ
tồn tại trong một khoảng thời gian nhất định.
- Sự thay đổi trong khuynh hướng đang thịnh hành là do sự thay đổi trong mối
quan hệ cung cầu. Và sự thay đổi của quan hệ cung cầu sẽ được nhận diện sớm hay
muộn thơng qua các phản ứng của chính thị trường.
1.3.2 Ứng dụng của phân tích kỹ thuật
- Xác định chiến lược kinh doanh cho ngắn hạn, trung hạn và dài hạn
- Xác định các đường tiệm cận giá để cĩ quyết định mua vào – bán ra cổ phiếu
một cách hợp lý
- Xác định các khoảng dao động của giá để xác định thời điểm nên hay chưa
nên tham gia vào thị trường
1.3.3 Các cơng cụ cơ bản sử dụng trong Phân tích kỹ thuật.
Biểu đồ thể hiện chuỗi dao động của giá trong một đơn vị thời gian.
Hiện nay trên Thị trường chứng khốn các chuyên viên phân tích dùng rất nhiều
các loại biểu đồ khác nhau để phân tích, trong đĩ cĩ 3 loại biểu đồ được dùng một
cách phổ biến nhất đĩ là: biểu đồ dạng đường (Line chart), biểu đồ dạng then chắn
(Bar chart), biểu đồ dạng cây nến (Candlestick chart).
Biểu đồ dạng đường (Line chart)[2]
Dạng biểu đồ này từ trước tới nay thường được sử dụng phổ biến trong các
ngành khoa học khác dùng để mơ phỏng các hiện tượng kinh tế và xã hội. Nhưng hiện
nay do khoa học kỹ thuật phát triển, diễn biến của thị trường chứng khốn ngày càng
phức tạp cho nên loại biểu đồ này ngày càng ít được sử dụng nhất là trên các thị
trường chứng khốn hiện đại.
Hình 1-1 Biểu đồ dạng đường
13
Nĩ chủ yếu được sử dụng trên các thị trường chứng khốn mới đi vào hoạt
động trong thời gian ngắn, khớp lệnh theo phương pháp khớp lệnh định kỳ theo từng
phiên. Ưu điểm của loại biểu đồ này là dễ sử dụng.
Hiện nay trên các Thị trường chứng khốn hiện đại đang dùng một số loại biểu
đồ trong Phân tích kỹ thuật mang lại hiệu quả cao đĩ là biểu đồ dạng then chắn (Bar
chart) và cây nến (Candlestick chart).
Biểu đồ dạng then chắn (Bar chart)[2]
Trên các Thị trường chứng khốn hiện đại trên thế giới hiện nay các chuyên
viên phân tích thường dùng loại biểu đồ này trong phân tích là chủ yếu lý do chính vì
tính ưu việt của nĩ đĩ là sự phản ánh rõ nét sự biến động của giá chứng khốn.
Hai kí tự mà dạng biểu đồ này sử dụng đĩ là:
Hình 1-2 Biểu đồ dạng then chắn
Loại biểu đồ này thường được áp dụng để phân tích trên các Thị trường chứng
khốn hiện đại khớp lệnh theo hình thức khớp lệnh liên tục, độ dao động của giá
chứng khốn trong một phiên giao dịch là tương đối lớn.
Biểu đồ cây nến (Candlestick chart)
Đây là dạng biểu đồ cải tiến của biểu đồ dạng then chắn (Bar chart), nĩ được
người Nhật Bản khám phá và áp dụng trên thị trường chứng khốn của họ đầu tiên.
Giờ đây nĩ đang dần được phổ biến hầu hết trên các thị trường chứng khốn hiện đại
trên tồn thế giới. Dạng biểu đồ này phản ánh rõ nét nhất về sự biến động của giá
chứng khốn trên thị trường chứng khốn khớp lệnh theo hình thức khớp lệnh định kỳ.
Hai kí tự mà loại biểu đồ này sử dụng là:
Hình 1-3 Biểu đồ dạng cây nến
14
1.3.4 Các chỉ dẫn kỹ thuật cơ bản
Đường trung bình trượt MA (Moving Average)
Ý nghĩa:
MA là chỉ báo hữu ích dùng để theo dõi khuynh hướng biến động giá chứng
khốn và sự đảo chiều của những khuynh hướng này.
MA cĩ tác dụng làm trơn sự biến động của giá CK trên TTCK nhằm loại bỏ
những biến động nhỏ và cho ta cái nhìn chính xác về xu thế chính của thị trường
Một số đường MA cơ bản:
- SMA : Đường trung bình trượt giản đơn
- WMA: Đường trung bình trượt tuyến tính cĩ trọng số
- EMA : Đường trung bình trượt theo hệ số mũ
- VMA : Đường trung bình trượt biến đổi
- TMA : Đường trung bình trượt hồi quy theo thời gian
Đường chuẩn MACD
Ý nghĩa:
MACD là chỉ báo cho thấy sự quy tụ hay phân kỳ của trung bình chuyển động.
MACD cho sự khẳng định dấu hiệu thị trường khi đường MA ngắn hạn giao
nhau với đường MA dài hạn.
Ứng dụng:
Thường sử dụng đường MACD với sự chênh lệnh của hai đường EMA 12 và
EMA 26 và một đường tín hiệu là EMA 9
Đường MACD - Histogram
Ý nghĩa:
MACD-H phản ánh độ lệch giữa hai đường MACD và đường tín hiệu của nĩ.
Khi nào MACD xuyên chéo qua đường tín hiệu thì MACD-H xuyên chéo qua đường
số khơng.
MACD-H được dùng để dự báo trước sự thay đổi trong khuynh hướng biến
động giá chứng khốn.
Chỉ số sức mạnh tương quan RSI
Ý nghĩa:
RSI là một chỉ số động lượng đo sức mạnh tương đối của một chứng khốn nhất
định hoặc của cả thị trường.
RSI được đo theo thang độ từ 0% đến 100% và lấy hai đường 30% và 70% làm
hai đường chỉ báo kỹ thuật.
Dải Bollinger Band
15
Ý nghĩa:
Là miền thể hiện sai lệch xung quanh giá trị trung bình và được xác định theo
một tỷ lệ phần trăm nhất định phía trên và phía dưới đường MA
Ứng dụng:
Mr_Bollinger gợi ý thời kỳ trễ của đường MA là 20 và tỷ lệ phần trăm là 2% sẽ
cho những kết quả tính tốn đáng tin cậy.
Kết luận
Các kiến thức về lĩnh vực tài chính rất nhiều, trên đây tơi mới chỉ giới thiệu
ngắn gọn về các kiến thức chung nhất. Các kiến thức này tuy chưa nhiều nhưng cũng
đủ để một người dùng cĩ thể hiểu được một cách căn bản về tài chính. Với các kiến
thức này người dùng cĩ thể sử dụng các ứng dụng phân tích tài chính, phân tích rủi ro
trong đầu tư chứng khốn.
16
Chương 2 - TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU
Trong những năm gần đây, sự phát triển mạnh mẽ của CNTT đã làm cho khả
năng thu thập và lưu trữ thơng tin của các hệ thống thơng tin tăng nhanh một cách
chĩng mặt. Bên cạnh đĩ, việc tin học hố một cách ồ ạt và nhanh chĩng các hoạt động
sản xuất, kinh doanh cũng như nhiều lĩnh vực hoạt động khác đã tạo ra cho chúng ta
một lượng dữ liệu lưu trữ khổng lồ. Hàng triệu CSDL đã được sử dụng trong các hoạt
động sản xuất, kinh doanh, quản lý..., trong đĩ cĩ nhiều CSDL cực lớn cỡ Gigabyte,
thậm chí là Terabyte. Sự bùng nổ này đã dẫn tới một yêu cầu cấp thiết là cần cĩ những
kỹ thuật và cơng cụ mới để tự động chuyển đổi lượng dữ liệu khổng lồ kia thành các
tri thức cĩ ích. Từ đĩ, các kỹ thuật khai phá dữ liệu đã trở thành một lĩnh vực thời sự
của nền CNTT thế giới hiện nay nĩi chung và Việt Nam nĩi riêng.
2.1 Giới thiệu về khai phá dữ liệu (Data Mining)
Khai phá dữ liệu đang được áp dụng một cách rộng rãi trong nhiều lĩnh vực
kinh doanh và đời sống khác nhau: marketing, tài chính, ngân hàng và bảo hiểm, khoa
học, y tế, an ninh, internet… Rất nhiều tổ chức và cơng ty lớn trên thế giới đã áp dụng
kỹ thuật khai phá dữ liệu vào các hoạt động sản xuất kinh doanh của mình và thu được
những lợi ích to lớn.
Khai phá dữ liệu được định nghĩa là quá trình trích xuất các thơng tin cĩ giá trị
tiềm ẩn bên trong lượng lớn dữ liệu được lưu trữ trong các cơ sở dữ liệu, kho dữ liệu.
Hiện nay, ngồi thuật ngữ khai phá dữ liệu, người ta cịn dùng một số thuật ngữ khác
cĩ ý nghĩa tương tự như: Khai phá tri thức từ CSDL, trích lọc dữ liệu (Konwlegde
extraction), phân tích dữ liệu/mẫu (data/pattern analysis), khảo cổ dữ liệu (data
archaeology), nạo vét dữ liệu (data dredredging). Nhiều người coi khai phá dữ liệu và
một số thuật ngữ thơng dụng khác là khám phá tri thức trong CSDL (Knowledge
Discovery in Databases-KDD) là như nhau. Tuy nhiên trên thực tế khai phá dữ liệu chỉ
là một bước thiết yếu trong quá trình Khám phá tri thức trong CSDL.
Quá trình này gồm các bước:
Làm sạch dữ liệu (data cleaning): Loại bỏ nhiễu hoặc các dữ liệu khơng
thích hợp.
Tích hợp dữ liệu (data integration): Tích hợp dữ liệu từ các nguồn khác
nhau như: CSDL, Kho dữ liệu, file text…
Chọn dữ liệu (data selection): Ở bước này, những dữ liệu liên quan trực
tiếp đến nhiệm vụ sẽ được thu thập từ các nguồn dữ liệu ban đầu.
17
Chuyển đổi dữ liệu (data transformation): Trong bước này, dữ liệu sẽ
được chuyển đổi về dạng phù hợp cho việc khai phá bằng cách thực hiện
các thao tác nhĩm hoặc tập hợp.
Khai phá dữ liệu (data mining): Là giai đoạn thiết yếu, trong đĩ các
phương pháp thơng minh sẽ được áp dụng để trích xuất ra các mẩu dữ
liệu.
Đánh giá mẫu (pattern evaluation): Đánh giá sự hữu ích của các mẫu
biểu diễn tri thức dựa vào một số phép đo.
Trình diễn dữ liệu (Knowlegde presentation): Sử dụng các kỹ thuật trình
diễn và trực quan hố dữ liệu để biểu diễn tri thức khai phá được cho
người sử dụng.
Các kỹ thuật khai phá dữ liệu thường được chia thành 2 nhĩm chính:
Kỹ thuật khai phá dữ liệu mơ tả: cĩ nhiệm vụ mơ tả về các tính chất hoặc
các đặc tính chung của dữ liệu trong CSDL hiện cĩ.
Kỹ thuật khai phá dữ liệu dự đốn: cĩ nhiệm vụ đưa ra các dự đốn dựa
vào các suy diễn trên dữ liệu hiện thời.
Dưới đây giới thiệu 3 phương pháp thơng dụng nhất là: phân cụm dữ liệu, phân
lớp dữ liệu và khai phá luật kết hợp.
Phân cụm dữ liệu: Mục tiêu chính của phương pháp phân cụm dữ liệu là
nhĩm các đối tượng tương tự nhau trong tập dữ liệu vào các cụm sao cho
các đối tượng thuộc cùng một lớp là tương đồng cịn các đối tượng thuộc
các cụm khác nhau sẽ khơng tương đồng.
Phân lớp dữ liệu và hồi quy: Mục tiêu của phương pháp phân lớp dữ liệu
là dự đốn nhãn lớp cho các mẫu dữ liệu. Quá trình phân lớp dữ liệu
thường gồm 2 bước: Thứ nhất, xây dựng mơ hình, một mơ hình sẽ được
xây dựng dựa trên việc phân tích các mẫu dữ liệu sẵn cĩ. Mỗi mẫu tương
ứng với một lớp, được quyết định bởi một thuộc tính gọi là thuộc tính
lớp. Thứ hai, sử dụng mơ hình để phân lớp dữ liệu, tính độ chính xác của
mơ hình. Nếu độ chính xác là chấp nhận được, mơ hình sẽ được sử dụng
để dự đốn nhãn lớp cho các mẫu dữ liệu khác trong tương lai.
Khai phá luật kết hợp: mục tiêu của phương pháp này là phát hiện và đưa
ra các mối liên hệ giữa các giá trị dữ liệu trong CSDL. Mẫu đầu ra của
giải thuật khai phá dữ liệu là tập luật kết hợp tìm được.
Khai phá luật kết hợp được thực hiện qua 2 bước: Thứ nhất, tìm tất cả các tập
mục phổ biến, một tập mục phổ biến được xác định qua tính độ hỗ trợ và thoả mãn độ
hỗ trợ cực tiểu. Thứ hai, sinh ra các luật kết hợp mạnh từ tập mục phổ biến, các luật
phải thoả mãn độ hỗ trợ cực tiểu và độ tin cậy cực tiểu.
18
2.2 Phân lớp
2.2.1 Giới thiệu về phân lớp
Phân lớp (Classification) là việc phân loại các mẫu thành một tập rời rạc của
các nhĩm cĩ thể. Phân lớp là một quá trình gồm hai bước. Ở bước thứ nhất, mơ hình
được học mơ tả một tập hợp được định trước của các lớp dữ liệu. Mơ hình này được
xây dựng bằng cách phân tích các thuộc tính của dữ liệu. Mỗi dữ liệu được giả thiết
rằng thuộc một lớp đã định nghĩa trước, và được xác định bởi nhãn của lớp (class
lable). Trong phân lớp, dữ liệu được phân tích để xây dựng một mơ hình tập hợp từ tập
dữ liệu huấn luyện (training data set). Dữ liệu riêng lẻ tạo ra tập huấn luyện cịn được
gọi là mẫu huấn luyện (training examples) và được chọn ngẫu nhiên. Nếu các mẫu
huấn luyện được đánh nhãn, bước này cịn được gọi là học cĩ giám sát (Supervised
learning). Nĩ đối lập với học khơng giám sát (unsupervised learning), thường được gọi
là phân cụm, trong đĩ nhãn cho mẫu huấn luyện là khơng biết và số lượng tập hợp của
các lớp được học cĩ thể khơng biết. Một số mơ hình học thơng dụng được sử dụng
nhiều trong thực tế là luật kết hợp, cây quyết định (Decision tree), mạng nơron, SVM
…
Bước thứ hai là sử dụng mơ hình đã được xây dựng ở bước một để phân loại
các mẫu dữ liệu chưa cĩ nhãn vào lớp tương ứng. Đầu tiên sẽ đánh giá sự chính xác
khi dự đốn. Cĩ một số cách để đánh giá sự chính xác. Cách thường được dùng là
phương pháp tiếp cận holdout, nĩ đánh giá sự chính xác dự báo của mơ hình bằng việc
đo độ chính xác trên một tập các mẫu mà tập này khơng được phép dùng khi xây dựng
mơ hình. Tập như vậy được gọi là tập thử (test data set). Những mẫu này được chọn
ngẫu nhiên và độc lập với tập huấn luyện. Sự chính xác của mơ hình dựa trên tập dữ
liệu kiểm tra là phần trăm của tập mẫu test mà phân loại chính xác bởi mơ hình. Với
mỗi mẫu thử, nhãn đã biết của lớp được so sánh với sự dự đốn của mơ hình học của
lớp. Thuật tốn học cĩ thể dẫn tới lạc lối bởi những lỗi ngẫu nhiên và sự trùng lặp bên
trong tập dữ liệu huấn luyện. Do đĩ, tập dữ liệu xác nhận cĩ thể được kỳ vọng để cung
cấp một sự kiểm tra an tồn chống lại việc over fitting các đặc trưng giả mạo của tập
dữ liệu huấn luyện (đĩ là, mơ hình học cĩ thể phân loại một số trường hợp dị thường
đặc biệt của dữ liệu thử mà chưa từng xuất hiện trong tập huấn luyện).
19
Hình 2-1 Mơ hình phân lớp tiêu chuẩn
Tất nhiên, điều quan trọng là tập huấn luyện là đủ lớn để mơ hình tự nĩ cĩ thể
học được phân bổ tốt nhất cĩ thể của dữ liệu. Để giải quyết vấn đề này, phương pháp
thường được áp dụng khi bộ dữ liệu khơng đủ lớn mà vẫn tăng khả năng phân lớp là sử
dụng xác nhận chéo. Trong xác nhận chéo k-fold, dữ liệu cĩ sẵn được phân thành k tập
riêng lẻ với kích cỡ xấp xỉ nhau. Thủ tục xác nhận chéo tạo ra k sự lặp lại trong đĩ
phương pháp học được đưa ra k-1 tập con để sử dụng như là dữ liệu huấn luyện, và nĩ
được kiểm tra trên tập bên trái. Độ chính xác của xác nhận chéo của thuật tốn đưa ra
thường đơn giản là trung bình cộng của các độ đo chính xác từ những fold riêng lẻ.
Nếu độ chính xác của mơ hình được coi như là chấp nhận được, mơ hình cĩ thể
được sử dụng để phân lớp các mẫu về sau mà nhãn lớp là chưa biết. Dữ liệu như vậy
cũng được biết đến trong học máy như là các dữ liệu chưa biết “unknown” hoặc dữ
liệu trước đây chưa tồn tại “previously unseen”.
Thực nghiệm 1
Thực nghiệm 2
Thực nghiệm 3
Thực nghiệm 4
Tổng số mẫu
Mẫu thử
20
Để cĩ thể đánh giá được khả năng của một thuật tốn phân lớp, người ta đã đề
ra một số phép so sánh bao gồm:
- Chất lượng phân lớp: cho biết khả năng mơ hình dự đốn chính xác nhãn lớp
của dữ liệu khơng cĩ nhãn.
- Tốc độ (Speed): cho biết chi phí tính tốn liên quan trong việc xây dựng và sử
dụng mơ hình.
- Sự tráng kiện của mơ hình (Robustness): cho biết khả năng mơ hình tạo ra các
dự đốn đúng với các dữ liệu nhiễu và dữ liệu với giá trị khơng đầy đủ.
- Tính khả chuyển (Scalability): cho biết khả năng xây dựng mơ hình một cách
hiệu quả với các dữ liệu khác nhau.
- Tính cĩ thể hiểu được (Interpretability): cho biết mức độ chi tiết của thơng tin
được cung cấp bởi mơ hình.
Trong luận văn này, chúng tơi đặc biệt quan tâm tới vấn đề chất lượng phân lớp
và tính cĩ thể hiểu được.
Độ đo chất lượng phân lớp tiêu chuẩn thể hiện thơng qua độ chính xác
(accuracy), độ hồi nhớ (recall) và độ đúng đắn (precision). Chúng được định nghĩa
dựa trên cơng thức như hình dưới. Chúng ta xem các lớp trong một vấn đề phân lớp
nhị phân như là lớp dương “possitive” và âm “negative” tương ứng.
Bảng 2-1 Ma trận hỗn hợp trong phân lớp
Mẫu Phân lớp dương Phân lớp âm
Lớp dương thực tế n00 n01
Lớp âm thực tế n10 n11
Trong đĩ:
accuracy =
11100100
1100
nnnn
nn
; recall =
0100
00
nn
n
; precision =
1000
00
nn
n
Tính cĩ thể hiểu được thường được tính trong kích thước của các bộ phân lớp.
2.2.2 Các phương pháp phân lớp
Cĩ rất nhiều phương pháp phân lớp, mỗi phương pháp phân lớp đều cĩ cách
tính tốn khác nhau. Sự khác nhau cơ bản của các phương pháp này là ở thuật tốn học
quy nạp. Tuy nhiên, nhìn một cách tổng quan thì các phương pháp đĩ đều phải thực
hiện một số bước chung như sau: đầu tiên, mỗi phương pháp sẽ dựa trên các thơng tin
của các mẫu để biểu diễn mẫu thành dạng vector; sau đĩ, tuỳ từng phương pháp mà ta
sẽ áp dụng cơng thức và phương thức tính tốn khác nhau để thực hiện việc phân loại.
21
Sau đây là một số cách tiếp cận mà theo thực nghiệm thì cĩ hiệu quả phân loại cao
cũng như những thuận lợi và bất tiện của mỗi cách.
Phương pháp k người láng giềng gần nhất (k-NN Algorithm):
Ý tưởng:
Là phương pháp nổi tiếng về hướng tiếp cận dựa trên xác suất thống kê. Khi
cần phân loại mẫu mới, thuật tốn sẽ tính khoảng cách (khoảng cách Euclide,
Cosine...) của tất cả các mẫu trong tập huấn luyện đến mẫu mới này để tìm ra k mẫu
gần nhất (gọi là k “láng giềng”) sau đĩ dùng các khoảng cách này đánh trọng số cho
tất cả các mẫu. Trọng số của một mẫu chính là tổng tất cả các khoảng cách ở trên của
mẫu trong k láng giềng cĩ cùng đặc trưng, đặc trưng nào khơng xuất hiện trong k láng
giềng sẽ cĩ trọng số bằng khơng. Sau đĩ các đặc trưng được sắp xếp theo mức độ
trọng số giảm dần và các đặc trưng cĩ trọng số cao sẽ được chọn là đặc trưng của mẫu
cần phân loại.
Ưu điểm:
Cĩ một vài thuận lợi khi thực thi giải pháp này. Giải thuật này được xem như
giải thuật tốt nhất để bắt đầu việc phân loại mẫu và là một giải thuật mạnh.
Một trong những thuận lợi của giải thuật này chính là sự rõ ràng và dễ dàng,
đơn giản và dễ thực hiện. Được dựa trên phương pháp trực tuyến với cách xử lý một số
hỗn hợp các mẫu. Đặc biệt, giải thuật này cịn kiểm tra các mẫu kề các mẫu mới, và
cần vài thơng số để làm việc này, nĩi cách khác giải thuật này hầu như khơng giới hạn.
Dựa vào các nhân tố này, giải thuật này hồn tồn hiệu quả thơng qua thực nghiệm và
dễ dàng áp dụng.
Một lợi ích nữa của k-NN là giải thuật này cĩ thể được vận dụng để cải tiến
hơn. Nĩi cách khác, giải thuật này nhanh chĩng chỉnh sửa và phù hợp với các trường
hợp khác. Ví dụ, giải thuật cĩ thể được áp dụng cho bất kỳ khoảng cách đo lường nào
khi nhập vào và các mẫu huấn luyện vì khoảng cách của các mẫu nhập vào cĩ thể được
giảm đi để cải tiến hiệu quả của giải thuật, do vậy k-NN cĩ thể được áp dụng cho mẫu
với bất kì khoảng cách nào trong mẫu đào tạo. Cũng vì thế mà hầu hết thời gian huấn
luyện địi hỏi cho phân loại mẫu trong giải thuật k-NN; giải thuật này được đánh giá là
kỹ thuật chi phí trong các kỹ thuật. cuối cùng, k-NN là giải thuật mạnh cĩ thể giám sát
các nguồn tiềm năng lỗi.
Nhược điểm:
Rất khĩ cĩ thể tìm ra k tối ưu. Hơn nữa với trường hợp mẫu cĩ nhiễu thì việc
phân loại là khơng tốt
22
Phương pháp Cây quyết định (Decision Tree Algorithm):
Ý tưởng:
Bộ phân lớp cây quyết định là một dạng cây mà mỗi nút được gán nhãn là một
đặc trưng, mỗi nhánh là giá trị trọng số xuất hiện của đặc trưng trong mẫu cần phân
lớp, và mỗi lá là nhãn của phân lớp. Việc phân lớp của một mẫu dj sẽ được duyệt đệ
qui theo trọng số của những đặc trưng cĩ xuất hiện trong mẫu dj. Thuật tốn lặp đệ qui
đến khi đạt đến nút lá và nhãn của dj chính là nhãn của nút lá tìm được. Thơng thường
việc phân lớp mẫu nhị phân sẽ tương thích với việc dùng cây nhị phân.
Ưu điểm:
- Dễ hiểu, dễ cài đặt.
- Cĩ thể chấp nhận trường hợp tập dữ liệu huấn luyện cĩ nhiễu, và cho hiệu quả
phân loại tương đối cao.
Nhược điểm:
Việc sử dụng giải thuật cây quyết định liên quan đến một số hạn chế quan
trọng, dựa vào trạng thái nguyên thuỷ của thuật tốn mà chia các vùng mẫu được đưa
vào các tập hợp con. Trước tiên, giải thuật này chia những tập mẫu tuỳ thuộc vào đặc
trưng (một bộ phận từ ) mọi lúc, bằng cách sử dụng các đặc trưng rõ ràng mọi lúc. Dựa
vào các nhân tố này, giải thuật này sẽ bị sai nếu một lỗi bị nhìn thấy tại bất cứ mức độ
nào, bởi vì cây con bên dưới cấp bậc sẽ bị sai. Do đĩ, giải thuật cây quyết định khơng
mạnh và nĩ dường như mạo hiểm để quyết định những nhánh phân loại.
Một vấn đề khác là khơng cĩ bảo vệ phù hợp giống như Support Vector
Machines, vì vậy chúng cĩ thể loại trừ các đặc trưng. Điều này cĩ nghĩa là chúng
khơng thể chấp nhận một mẫu với số lượng lớn đặc trưng như SVM, vì cĩ quá nhiều
đặc trưng tạo nên tràn phù hợp và làm cho khả năng học kém hơn.
Một trở ngại khác là thời gian huấn luyện phân loại cao bởi vì giải thuật này cần
so sánh tất cả những nhánh con cĩ thể, nên mất nhiều thời gian để chia và duyệt các
đặc trưng.
Phương pháp Nạve Bayes
Ý tưởng :
Ý tưởng cơ bản của phương pháp xác suất Bayes là dựa vào xác suất cĩ điều
kiện của từ hay đặc trưng xuất hiện trong mẫu với đặc trưng để dự đốn đặc trưng của
mẫu đang xét. Điểm quan trọng cơ bản của phương pháp này là các giả định độc lập:
- Các từ hay đặc trưng của mẫu xuất hiện là độc lập với nhau.
- Vị trí của các từ hay các đặc trưng là độc lập và cĩ vai trị như nhau.
Giả sử ta cĩ:
23
- n đặc trưng (lớp) đã được định nghĩa nccc ,,, 21
- Mẫu mới cần được phân loại jd
Để tiến hành phân loại mẫu jd , chúng ta cần phải tính được tần suất xuất hiện
của các lớp ),...,2,1( nici trong mẫu jd . Sau khi tính được xác suất của mẫu đối
với các đặc trưng, theo luật Bayes, mẫu sẽ được phân lớp vào đặc trưng ic nào cĩ xác
suất cao nhất.
Thuận lợi:
Là phương pháp đơn giản, cài đặt khơng phức tạp, tốc độ nhanh, với tập huấn
luyện lớn thì cho kết quả vẫn tương đối chính xác.
Nhược điểm:
Giải thuật Nạve Bayes cũng cĩ những điểm yếu riêng mặc dù được xem là
trình diễn tốt hơn giải thuật Cây quyết định.
Một trong những trở ngại là dựa trên luật gọi là các điều kiện độc lập. Cĩ thể
bị vi phạm bởi các trường hợp trong thực tế, bởi vì Nạve Bayes thừa nhận các đặc
trưng trong mẫu độc lập riêng rẽ và được biểu diễn một cách nghèo nàn khi những đặc
trưng này cĩ mối liên hệ với nhau. Hơn nữa, luật này khơng tạo được sự thường xuyên
cho việc xuất hiện các đặc trưng. Một bất lợi khác nữa là giải thuật sử dụng nhiều tính
tốn và vì vậy thời gian bị chi phối.
Phương pháp mạng Nơron (Neural Network):
Ý tưởng:
Mơ hình mạng neural gồm cĩ ba thành phần chính như sau: kiến trúc
(architecture), hàm chi phí (cost function), và thuật tốn tìm kiếm (search algorithm).
Kiến trúc định nghĩa dạng chức năng (functional form) liên quan giá trị nhập (inputs)
đến giá trị xuất (outputs).
Kiến trúc phẳng ( flat architecture ) : Mạng phân loại đơn giản nhất ( cịn gọi là
mạng logic) cĩ một đơn vị xuất là kích hoạt kết quả (logistic activation) và khơng cĩ
lớp ẩn, kết quả trả về ở dạng hàm (functional form) tương đương với mơ hình hồi quy
logic. Thuật tốn tìm kiếm chia nhỏ mơ hình mạng để thích hợp với việc điều chỉnh
mơ hình ứng với tập huấn luyện. Ví dụ, chúng ta cĩ thể học trọng số trong mạng kết
quả (logistic network) bằng cách sử dụng khơng gian trọng số giảm dần (gradient
descent in weight space) hoặc sử dụng thuật tốn interated-reweighted least squares là
thuật tốn truyền thống trong hồi quy (logistic regression).
24
Kiến trúc mơđun (modular architecture): Việc sử dụng một hay nhiều lớp ẩn
của những hàm kích hoạt phi tuyến tính cho phép mạng thiết lập các mối quan hệ giữa
những biến nhập và biến xuất. Mỗi lớp ẩn học để biểu diễn lại dữ liệu đầu vào bằng
cách khám phá ra những đặc trưng ở mức cao hơn từ sự kết hợp đặc trưng ở mức
trước.
2.3 Mạng Nơron
Một trong những kỹ thuật tiên tiến được sử dụng trong việc tạo quyết định tài
chính là mạng Nơron. Mục này sẽ giới thiệu về mạng nơron được tạo và hoạt động
như thế nào.
Các mạng nơron nhân tạo được tạo ra nhằm mục đích mơ phỏng lại bộ não của
con người. Cĩ thể coi bộ não là một máy tính hay một hệ thống xử lý thơng tin song
song, phi tuyến và cực kỳ phức tạp. Nĩ cĩ khả năng tự tổ chức các bộ phận cấu thành
của nĩ, như là các tế bào thần kinh (nơron) hay các khớp nối thần kinh (synapse),
nhằm thực hiện một số tính tốn như nhận dạng mẫu và điều khiển vận động nhanh
hơn nhiều lần các máy tính nhanh nhất hiện nay. Sự mơ phỏng bộ não con người của
mạng nơron là dựa trên cơ sở một số tính chất đặc thù rút ra từ các nghiên cứu về thần
kinh sinh học. Lý thuyết về Mạng nơ ron nhân tạo, hay gọi tắt là “Mạng nơ ron”, được
xây dựng xuất phát từ một thực tế là bộ não con người luơn luơn thực hiện các tính
tốn một cách hồn tồn khác so với các máy tính số.
2.3.1. Mơ hình một nơron perceptron
Một nơron perceptron là một phần tử xử lý gồm:
n đầu vào xi, mỗi đầu vào ứng với một giá trị thực wi gọi là trọng số.
Một giá trị thực b gọi là ngưỡng (bias).
Một hàm kích hoạt f.
Giá trị ra y.
Hình 2-2 Mơ hình một nơron perceptron
25
Giá trị ra của perceptron được tính theo quy tắc sau:
)(
1
ufy
bwxu
n
i
ii
(2.1)
Hàm kích hoạt được sử dụng phổ biến là hàm sigmoid (cịn gọi là hàm logistic)
do tính phi tuyến và khả vi:
ue1
1)u(f
(2.2)
Ngồi ra cịn cĩ một số hàm kích hoạt khác: hàm tang hyperbolic (tanh), hàm
softmax.
Khả năng tính tốn của một nơron perceptron khá hạn chế. Để cải thiện người
ta nối chúng thành mạng. Mơ hình mạng đơn giản nhất là mạng perceptron truyền
thẳng đa lớp MLP.
2.3.2. Mơ hình mạng nơron MLP
Mạng nơron MLP n đầu vào, m đầu ra cĩ mơ hình như sau:
Các nơron được chia thành các lớp: lớp sau được nối với lớp trước. Lớp đầu
tiên là lớp vào (input - nhận đầu vào), lớp cuối cùng là lớp ra (output - cho
đầu ra). Giữa lớp vào và lớp ra là các lớp ẩn (hidden). Thơng thường chỉ cĩ
một lớp ẩn.
Tất cả các nơron cùng một lớp sử dụng chung một vector đầu vào. Mỗi lớp
khi nhận một vector đầu vào sẽ tính đầu ra của mỗi nơron, kết hợp thành
một vector và lấy đĩ làm đầu vào cho lớp sau.
Mạng MLP nhận đầu vào là một vector n thành phần, lấy đĩ làm đầu vào
của lớp input và tính tốn cho đến khi lớp output cĩ đầu ra, lấy đĩ là đầu ra
của mạng: một vector m thành phần.
Tồn bộ các nơron của tồn mạng sử dụng chung một hàm kích hoạt,
thường là hàm logistic.
Ngồi lớp vào và lớp ra, mạng MLP thường cĩ một hay nhiều lớp ẩn. Thơng
thường người ta chỉ sử dụng một lớp ẩn. Vì vậy đơi khi người ta hay đồng nhất
MLP với MLP 3 lớp.
26
input layer
hidden layer
output layer
Hình 2-3 Mơ hình mạng perceptron 3 lớp(MLP)
Như vậy xét dưới gĩc độ tốn học mạng MLP biểu diễn một hàm phi tuyến từ
Rn vào Rm. Người ta cũng chứng minh được rằng: “một hàm phi tuyến liên tục bất kì
cĩ thể xấp xỉ với độ chính xác tuỳ ý bằng mạng MLP” (định lí Kolmogorov).
Mạng MLP npm (n đầu vào, m đầu ra, p nơron ẩn) được biểu diễn bằng 2 ma
trận trọng số w1 cỡ np, w2 cỡ pm và 2 vector ngưỡng b1 p phần tử, b2 m phần tử.
(Lớp input của MLP chỉ cĩ tác dụng nhận đầu vào, hồn tồn khơng thực hiện tính
tốn).
Khi đĩ tính tốn đầu ra y của mạng theo đầu vào x như sau:
)v(fy
bw.zv
)u(fz
bw.xu
22
11
(2.3)
Ở đây, u, v, z là các vector. Viết z=f(u) cĩ nghĩa là zi=f(ui) với mọi i.
Để biểu diễn được một hàm nào đĩ, mạng MLP cần được huấn luyện.
2.3.3. Huấn luyện mạng nơron MLP
Để mạng nơron biểu diễn được hàm f, ta cần một bộ dữ liệu gồm N cặp vector
(xi, ti), trong đĩ xi thuộc tập xác định của f và ti là giá trị của f tại xi:
ti = f(xi) (2.4)
Mạng MLP sẽ biểu diễn được hàm f nếu cho đầu vào của mạng là xi thì đầu ra
của mạng là ti. Thường thì MLP chỉ biểu diễn được xấp xỉ hàm f, do đĩ ta mong muốn
nếu mạng cho đầu ra thực tế là yi thì yi càng gần ti càng tốt.
27
Như vậy bài tốn huấn luyện mạng là cho bộ dữ liệu huấn luyện gồm N cặp
vector (xi, ti), cần điều chỉnh các trọng số của mạng sao cho tổng sai số của mạng trên
bộ dữ liệu là nhỏ nhất:
N
1i
ii minyt E (2.5)
Trong đĩ yi là đầu ra thực tế của mạng ứng với đầu vào xi.
Thuật tốn huấn luyện MLP phổ biến nhất là thuật tốn lan truyền ngược lỗi
(back-propagation training). Thuật tốn cĩ đầu vào là tập mẫu {(xi, ti)}, đầu ra là bộ
trọng số của mạng.
Các bước tiến hành huấn luyện như sau:
1/ Khởi tạo trọng số của mạng: wij được gán các giá trị ngẫu nhiên, nhỏ (nằm
trong miền [-, ]).
2/ Với mỗi cặp (x,t) trong bộ dữ liệu huấn luyện:
Giả sử x = (x1 , ..., xn). Ta thực hiện:
1. Lan truyền x qua mạng để cĩ y.
2. Tính sai số e của mạng: e=t-y.
3. Hiệu chỉnh các trọng số liên kết nơron dẫn tới lớp ra wij từ nơron j tại lớp ẩn
tới nơron i tại lớp ra:
wij = wij + wij (2.6)
wij là trọng số giữa nơron i ở lớp trước và nơron j ở lớp sau. wij được tính theo
cơng thức sau:
wij=jyi (2.7)
là hằng số tốc độ học (learning rate), thường lấy bằng .
yi là đầu ra của nơron i (nếu i là nơron lớp input thì thay yi bằng xi).
j là sai số tại nơron j. Nếu j là nơron lớp ra (output layer) thì j được tính
theo cơng thức
j = yj(1-yj)(tj-yj) (2.8)
Nếu j là nơron lớp ẩn thì được tính theo cơng thức:
j = yj(1-yj)
k
jkk w (2.9)
trong đĩ k là các các nơron của lớp sau lớp của j.
Việc đưa mẫu huấn luyện qua mạng, tính tốn và cập nhật trọng số được tiến
hành với tất cả phần tử trong bộ mẫu (cĩ thể chọn ngẫu nhiên hoặc tuần tự). Quá trình
sẽ dừng lại khi sai số trung bình (hoặc tổng sai số) nhỏ hơn một giá trị cho trước hoặc
thay đổi khơng đáng kể (tức là quá trình huấn luyện hội tụ).
28
2.3.4. Ưu điểm và nhược điểm của mạng nơron
Các nghiên cứu cả về mặt lí thuyết và thực tế cho thấy mạng nơron cĩ những ưu
điểm sau:
Cĩ thể xấp xỉ một hệ phi tuyến động (nonlinear dynamical system) với độ
chính xác bất kì.
Cĩ khả năng miễn nhiễu (robustness) và chịu sai hỏng (fault tolerance) cao.
Chẳng hạn mạng cĩ thể nhận các dữ liệu bị sai lệch hoặc khơng đầy đủ mà
vẫn hoạt động được.
Cĩ khả năng thích ứng: mạng nơron cĩ thể “học” (learn) và “điều chỉnh”
(adapt) trong quá trình hoạt động. Đây là điểm đáng chú ý nhất của mạng
nơron trong nhận dạng tiếng nĩi. Đặc điểm này của mạng cho phép ta hi
vọng xây dựng được một hệ nhận dạng cĩ thể “học tập” để nâng cao khả
năng nhận dạng trong khi hoạt động.
Cĩ khả năng tổng quát hố (generalize) tốt và phân lớp (classify) mạng.
Nhưng mạng nơron cũng khơng phải là cơng cụ vạn năng cho mọi vấn đề, vì
chúng cũng cĩ nhiều nhược điểm:
Chỉ xử lý được các dữ liệu số. Cần tích hợp thêm nhiều thành phần khác (ví
dụ: các hệ mờ, các bộ số hố...) để cĩ thể xử lí những dữ liệu phi số.
Hiệu năng của mạng phụ thuộc bộ dữ liệu huấn luyện. Để đảm bảo hiệu
năng, mạng cần được huấn luyện với lượng dữ liệu lớn. Quá trình huấn
luyện do đĩ rất dài. Mặt khác nếu bộ dữ liệu được chuẩn bị khơng tốt thì
mạng cĩ khả năng tổng quát hố thấp.
Mạng nơron gần như là một “hộp đen” đối với các phân tích. Rất khĩ xác
định được sự phân bố thơng tin và xử lý trên các phần tử của mạng.
Khơng cĩ một phương pháp chung nào để xác định cấu trúc mạng phù hợp
từng bài tốn. Nhà nghiên cứu phải tiến hành thử nghiệm hoặc dựa vào kinh
nghiệm để xác định.
Các thuật tốn huấn luyện hiện chưa đảm bảo tránh quá trình huấn luyện rơi
vào một cực trị địa phương. Hơn nữa sai số huấn luyện giảm khơng đồng
nghĩa với tăng hiệu năng hoạt động của mạng.
Mạng cấu trúc lớn cài đặt bằng phần mềm trên máy tính hoạt động rất chậm.
Việc xây dựng mạng nơron bằng phần cứng vẫn cịn đang được nghiên cứu.
2.4 Hệ mờ (Fuzzy System)
Trong vài thập kỷ qua, các hệ mờ đã cĩ những thành tựu đáng kể trong nhiều
lĩnh vực khác nhau của khoa học và cơng nghệ, đặc biệt là trong điều khiển và nhận
dạng. Với khả năng lập luận hết sức hiệu quả trên một số lượng nhỏ các tập luật, cĩ thể
nĩi Logic mờ là một cơng cụ đắc lực và hiệu quả của tiến trình tạo quyết định trong
29
lĩnh vực tài chính. Trong phần này, chúng tơi sẽ trình bày những vấn đề cơ bản liên
quan tới việc xây dựng và sử dụng hệ mờ từ đĩ cĩ thể áp dụng để giải quyết bài tốn
của chúng tơi ở chương tiếp theo.
2.4.1 Định nghĩa tập mờ
Tập hợp nhĩm các đối tượng phân biệt. Khái niệm tập hợp đã trở thành khái
niệm cơ bản trong tốn học. Ở đây chúng ta sẽ khơng nhắc lại các khái niệm cũng như
tính chất của tập hợp mà sẽ đi ngay vào tập mờ.
Trong lĩnh vực tài chính, chỉ số tài chính với các giá trị ngơn ngữ thấp, cao,
trung bình hay với việc mua bán chứng khốn ta cĩ mua nhiều, bán ít, bán mạnh…Các
giá trị này gây cảm giác phân vân cho người thiết kế bộ điều khiển nếu khơng đưa nĩ
vào khái niệm tập mờ. Vì sao vậy? Giả sử chỉ số RSI là 70 thì cĩ người cho rằng đĩ là
cao và quyết định mua nhiều, nhưng cĩ người thì cho rằng 70 chỉ là trung bình nên
quyết định giữ khơng bán.
Nhằm thống nhất hai quan điểm, ta sẽ đưa vào giá trị RSI một số thực trong
khoảng [0,1] để đánh giá mức độ phụ thuộc của nĩ vào hai quan điểm nĩi trên. Chẳng
hạn, giá trị 70 sẽ là cao với độ phụ thuộc 0.4 và trung bình với độ phụ thuộc là 0.6
Một cách tổng quát thì ta phải đưa thêm vào mỗi giá trị thực tế một số thực (x)
trong khoảng [0,1] để đánh giá độ phụ thuộc của nĩ ứng với từng giá trị ngơn ngữ.
Việc đưa thêm số thực (x) để đánh giá độ phụ thuộc như vậy được gọi là mờ hố giá
trị rõ x. Ta cĩ định nghĩa:
Định nghĩa:
Tập mờ là một tập hợp mà mỗi phần tử cơ bản x của nĩ được gán thêm một giá
trị thực (x)[0,1] để chỉ thị độ phụ thuộc của phần tử đĩ vào tập đã cho. Khi độ phụ
thuộc bằng 0 thì phần tử cơ bản đĩ sẽ hồn tồn khơng thuộc tập đã cho, ngược lại với
độ phụ thuộc bằng 1 thì phần tử cơ bản sẽ thuộc tập hợp với xác suất 100%.
Như vậy, tập mờ là tập của các cặp (x,(x)). Tập kinh điển U của các phần tử x
được gọi là tập nền của tập mờ. Cho x chạy khắp trong tập hợp U, ta sẽ cĩ hàm (x) cĩ
giá trị là số bất kỳ trong khoảng [0,1] tức là:
: U[0,1]
và hàm này được gọi là hàm thuộc
Việc (x) cĩ giá trị là số bất kỳ trong khoảng [0,1] là điều khác biệt cơ bản giữa
tập kinh điển và tập mờ. Ở tập hợp A, hàm thuộc (x) chỉ cĩ hai giá trị 0 hoặc 1 ứng
với x A hay khơng.
Chính do cĩ sự khác biệt đĩ mà ta cũng cĩ nhiều cơng thức khác nhau cùng mơ
tả cho một phép tính giữa các tập mờ. Đĩ là những cơng thức cĩ cùng một giá trị nếu
hàm thuộc (x) thoả mãn.
30
Bất cứ một hàm (x):U[0,1] cũng đều cĩ thể là hàm thuộc của một tập mờ nào đĩ.
Nhưng trong điều khiển, với mục đích sử dụng các hàm thuộc sao cho khả năng tích
hợp chúng là đơn giản, người ta chỉ quan tâm tới ba dạng hàm thuộc như trong hình 2-
4
Hình 2-4 Các dạng hàm thuộc
Thơng thường, để chỉ một tập mờ người ta hay sử dụng ngay hàm thuộc (x)
của tập mờ đĩ. Với việc đưa khái niệm tập mờ, mỗi một giá trị ngơn ngữ sẽ là một tập
mờ. Trong ví dụ về chỉ số RSI, ta sẽ cĩ các tập mờ sau:
Tập mờ cao(x) cho giá trị cao
Tập mờ trung bình(x) cho giá trị trung bình
Tập mờ thấp(x) cho giá trị thấp
2.4.2 Phép suy diễn mờ
2.4.2.1 Xác định giá trị của mệnh đề hợ thành
Sau khi đã mờ hố giá trị rõ x thơng qua tập mờ (x) thì bước tiếp theo là ta
phải thực hiện những nguyên tác điều khiển đã cho dưới dạng mệnh đề hợp thành.
Chẳng hạn ta cĩ:
IF RSI tăng trên 70 THEN BULLISH.
IF RSI giảm dưới 70 THEN BEARISH.
IF RSI tăng trên 50 THEN BULLISH.
IF RSI giảm dưới 50 THEN BEARISH.
IF RSI tăng trên 30 THEN BULLISH.
IF RSI giảm dưới 30 THEN BEARISH
(x) (x) (x)
m0 m1 m2 m3 m1 m2 m3 m4
Singleton Tam giác Hình thang
x x x
31
Chúng đều cĩ chung một cấu trúc đơn:
IF A=X THEN B=Y (2.1)
Gọi tập mờ của giá trị A là A(x) và của B là B(y) thì mệnh đề hợp thành chính
là phép suy diễn :
A B hay A(x) B(y) (2.2)
Phép suy diễn trên là một phép tính cĩ đối số x nên nĩ cũng phải cĩ một giá trị
cụ thể khi mà đối số x, tức là A(x) đã cho trước. Ký hiệu giá trị của phép suy diễn là
AB(y) thì trong logic mờ nĩ sẽ được tính từ A(x),B(y) như sau:
AB(y) = A(x).B(y) (2.3a)
hoặc
AB(y) = min{A(x),B(y)} (2.3b)
Cả hai cơng thức trên cùng được sử dụng cho tập thơng thường mà khơng gây
mâu thuẫn là vì x và y thoả mãn (x) = 1 nếu x A, cả hai cơng thức đều cho cùng
một giá trị, nĩi cách khác là chúng tương đương.
Với tập mờ A(x),B(y) thì điều đĩ cĩ khác đơi chút. Hai cơng thức sẽ cho hai
giá trị mờ cĩ cùng nền với tập mờ B nhưng với hai hàm thuộc khác nhau. Việc chọn
hàm nào là người dùng quyết định :
Nếu chọn cơng thức 2.3a thì ta nĩi phép suy diễn mờ đĩ là luật suy diễn Prod
Nếu chọn cơng thức 2.3b thì ta nĩi phép suy diễn mờ đĩ là luật suy diễn Min
Sau khi đã chọn được một cơng thức thực hiện phép suy diễn là Prod hay Min
thì khi cho trước giá trị rõ x0 ở đầu vào ta luơn cĩ được một giá trị cho phép suy diễn
AB. Giả sử giá trị đĩ là tập mờ cĩ hàm thuộc AB(y) cùng nền với B và được tính
như sau :
Nếu chọn luật Prod
AB(y)=H.B(y) (2.4a)
Nếu chọn luật Min
AB(y)=min{H,B(y)} (2.4b)
Trong đĩ H=A(x0) được gọi là độ thoả mãn đầu vào.
Ngồi cấu trúc đơn cịn cĩ cấu trúc dạng :
IF A1=X1 AND A2=X2...AND An=XnTHEN B=Y (2.5)
Cấu trúc này cĩ nhiều đầu vào- một đầu ra và cĩ tên là MISO
Ở mệnh đề đơn chỉ cĩ một đầu vào cịn ở mệnh đề MISO cĩ nhiều tập mờ đầu
vào. Điều này làm cho ta chưa thể sử dụng ngay một trong hai cơng thức 2.4a hoặc
2.4b để xác định giá trị mờ AB(y) vì chưa cĩ được một độ thoả mãn đầu vào H cụ
thể. Nĩi cách khác, trước khi sử dụng hai cơng thức suy diễn 2.4a hoặc 2.4b cho mệnh
32
đề hợp thành 2.5 ta phải cĩ được độ thoả mãn đầu vào H chung làm đại diện cho tất cả
m tín hiệu vào.
Gọi Ak(xk) là những hàm thuộc của tập mờ đầu vào Ak, k=1,2,…,m ứng với m
tín hiệu vào là k , k=1,2,..,m và B(y) là hàm thuộc của tập B ứng với đầu ra B của bộ
điều khiển MISO, trong đĩ xk là tín hiệu cĩ ở cổng vào k, tức là giá trị của nĩ sẽ thuộc
tập nền của tập mờ Ak. Giả sử rằng tại đầu vào của bộ điều khiển cĩ các giá trị rõ x0k,
k=1,2,...,m. Vậy thì mỗi một tập mờ Ak sẽ cĩ một độ thoả mãn riêng
Hk=Ak(x0k)
Độ thoả mãn đầu vào chung H cho cả mệnh đề hợp thành MISO (2.5) khi đĩ sẽ
được xác định theo nguyên tắc tình huống xấu nhất như sau :
H=min{H1,H2,...,Hm}=min Ak(x0k)
Khi đã cĩ độ thoả mãn đầu vào chung H thì tập mờ AB(y) của mệnh đề (2.5)
ứng với vector các giá trị rõ đầu vào x0k , k=1,2,..,m sẽ được tính theo cơng thức (2.4a)
hoặc (2.4b):
Nếu chọn luật Prod
AB(y) = min Ak(xk0).B(y) (2.6a)
Nếu chọn luật Min
AB(y)= min {min Ak(xk0), B(y)} (2.6b)
2.4.2.2 Phép tính suy diễn mờ
Ở trên ta đã làm quen với các cơng thức cho mệnh đề hợp thành SISO và cho
mệnh đề hợp thành MISO, phục vụ cho việc xác định kết quả của mệnh đề (phép suy
diễn)
Khơng bĩ buộc bởi các cơng thức đĩ, một cách tổng quá về phép tính suy diễn,
mọi ánh xạ AB :[0,1]2 [0,1], nếu thoả mãn:
AB(H, B) H với mọi H, B [0,1]
AB(H, B) AC(H, C) với mọi B C và H [0,1]
AB(H1, B) AC(H2, B) với mọi H1 H2 và B [0,1]
AB(H, B) = 0 với mọi B [0,1]
AB (0,1) = 0
đều cĩ thể sử dụng để làm hàm thuộc mơ tả cho phép tính suy diễn.
2.4.3 Phép hợp mờ
Ta cần phép hợp mờ của các tập mờ để cĩ thể xác định được giá trị của một tập
luật hợp thành gồm cĩ nhiều mệnh đề hợp thành.
33
2.4.3.1 Xác định giá trị của luật hợp thành
Xét luật hợp thành gồm n mệnh đề hợp thành:
R1: IF A1 = X11 AND … AND Am=X1m THEN B=Y1 hoặc
R2: IF A1 = X21 AND … AND Am=X2m THEN B=Y2 hoặc
…
Rn: IF A1 = Xn1 AND … AND Am=Xmn THEN B=Yn
Nếu vector các giá trị rõ đầu vào x0k, k=1,2,..,n là đã biết trước thì theo cơng
thức (2.6a) hoặc (2.6b), mỗi một mệnh đề hợp thành trong luật hợp thành trên sẽ cĩ
một giá trị là một tập mờ Ri với hàm thuộc Ri(y)=AiB(y), i=1,2,..,n. Vì luật hợp
thành đang xét cĩ n mệnh đề hợp thành nên ta cũng cĩ n tập mờ Ri. Vấn đề đặt ra là từ
n tập mờ Ri, i=1,2,..,n đĩ ta phải xác định được tập mờ kết quả chung R cho tồn bộ
luật hợp thành theo phép tính hợp các tập hợp Ri
n
i
RiR
1
(2.7)
Lý do cho việc sử dụng phép hợp là vì các mệnh đề hợp thành trong một luật
hợp thành được liên kết với nhau bằng tốn tử “hoặc”.
Giống như đã làm với phép suy diễn, để thực hiện cơng thức (2.7) cho n tập mờ
Rq, ta bắt đầu với tập kinh điển. Cho hai tập kinh điển A và B, gọi A(y) và B(y) là
những hàm thuộc của chúng. Tập AB là kết quả hợp của hai tập trên sẽ cĩ hàm thuộc
AB(y) =
0
1
nếu y A
bằng một trong hai cơng thức :
AB(y) =max(A(y), B(y) ) (2.8a)
AB(y) =min(A(y) + B(y) ) (2.8b)
vì chúng tương đương
Khi A và B khơng là tập kinh điển mà là hai tập mờ thì do các hàm thuộc
A(y)và B(y) của chúng khơng cịn là hàm hai trị tại 0 và 1 nên tính tương đuơng của
(2.8a) và (2.8b) cũng mất. Ta phải quyết định chọn sử dụng cơng thức nào:
Nếu sử dụng cơng thức (2.8a) thì ta nĩi phép hợp các tập mờ đã được thực hiện
theo luật Max.
Nếu sử dụng cơng thức (2.8b) thì ta nĩi phép hợp các tập mờ đã được thực hiện
theo luật Sum.
34
2.4.3.2 Phép tích hợp các tập mờ
Ở trên ta đã giới thiệu hai cơng thức tính hợp của các tập mờ. Một cách tổng
quát thì mọi hàm :[0,1]2 [0,1], đều cĩ thể được sử dụng để xác định hàm thuộc cho
AB nếu chúng thoả mãn :
a) (x,y)=(y,x)
b) (x,y)(u,v) nếu xu và yv
c) (x,(y,z)) = ((x,y,z))
d) (0,x) = x
trong đĩ x,y,u,v,z [0,1]
2.4.4 Giải mờ
Sau khi tính xong giá trị luật hợp thành ta thu được kết quả là tập mờ R(y). Kết
quả đĩ chưa thể là một giá trị thích hợp để điểu khiển. Cơng việc của chúng ta là phải
xác định một giá trị rõ y0 từ tập mờ R(y) của nĩ, đĩ là việc giải mờ. Giá trị rõ y0 xác
định được cĩ thể xem như "phần tử đại diện xứng đáng" cho tập mờ.
Căn cứ những quan niệm khác nhau về phần tử đại diện xứng đáng mà ta sẽ cĩ
các phương pháp giải mờ khác nhau. Người ta thường sử dụng hai phương pháp chính,
đĩ là: phương pháp điểm cực đại và phương pháp điểm trọng tâm.
2.4.4.1 Phương pháp điểm cực đại
Tư tưởng chính của phương pháp này là tìm trong tập mờ cĩ hàm thuộc R(y)
một phần tử rõ y0 với độ phụ thuộc lớn nhất( cĩ xác suất thuộc tập mờ lớn nhất trong
số những phần tử cịn lại), tức là :
y0=arg max R(y) (2.9)
Tuy nhiên, do việc tìm y0 theo 13 cĩ thể đưa đến vơ số nghiệm nên ta cần đưa
thêm những yêu cầu cho phép chọn trong số các nghiệm đĩ một giá trị y0 cụ thể chấp
nhận được. Như vậy, việc giải mờ theo phương pháp cực đại sẽ gồm hai bước :
Xác định miễn chứa giá trị rõ y0. Giá trị này là giá trị mà tại đĩ hàm thuộc đạt
giá trị cực đại G={y Y | R(y)=H}
Xác định y0 cĩ thể chấp nhận đc từ G
Trong trường hợp cĩ vơ số nghiệm thì để tìm y0 ta cĩ hai cách :
1) Xác định điểm trung bình
y0= 2
21 yy
35
Nếu các hàm thuộc đều cĩ dạng tam giác hoặc hình thang thì điểm y0 xác định
theo phương pháp này sẽ khơng quá bị nhạy cảm với sự thay đổi của giá trị rõ đầu vào
x0 do đĩ rất thích hợp với các bài tốn cĩ nhiều biên độ nhở ở đầu vào.
2) Xác định điểm cận trái hoặc phải
y0=inf(y) yG hoặc y0 = sup(y) yG
Theo phương pháp giải mờ này, nếu các hàm thuộc đều cĩ dạng tam giác hoặc
hình thang thì điểm y0 sẽ phụ thuộc tuyến tính(trong một lân cận) vào giá trị rõ x0 tại
đầu
vào
Hình 2-5 Giải mờ bằng phương pháp cực đại
2.4.4.2 Phương pháp điểm trọng tâm
Phương pháp điểm trọng tâm sẽ cho ra kết quả y0 là hồnh độ của điểm trọng
tâm miền được bao bởi trục hồnh và đường R(y)
y0=
S
R
S
R
dyy
dyyy
)(
)(
(2.10)
Với S=supR(y)={y|R(y)0} là miền xác định của tập mờ R
Hình 2-6 Giải mờ bằng phương pháp điểm trọng tâm
R(y) R(y)
y0 y0
y0 y1 y2
H
y
R(y)
y
R(y)
G
H
36
Đây là phương pháp hay được sử dụng nhất. Nĩ cho phép ta xác định giá trị y0
với sự tham gia của tất cả các tập mờ đầu ra của luật điều khiển một cách bình đẳng và
chính xác. Tuy nhiên phương pháp này lại khơng để ý được tới toạ độ thoản mãn của
mệnh đề điều khiển cũng như thời gian tính lâu. Ngồi ra nĩ cịn cĩ nhược điểm là
giảtị yo xác định lại cĩ độ thuộc nhỏ nhất, thậm chí bằng 0.
2.4.5 Hệ suy diễn mờ
Hình 2-7 Hệ suy diễn mờ
Hệ suy diễn mờ cịn được gọi là hệ dựa trên tập luật mờ, mơ hình mờ. Về căn
bản một hệ suy diễn mờ được hợp thành từ năm khối được mơ tả như hình trên.
1) Một bộ luật cơ sở bao gồm một số các luật dạng if-then
2) Cơ sở dữ liệu dùng để định nghĩa các hàm thuộc của các tập mờ được sử
dụng trong các luật mờ
3) Khối tạo quyết định thực hiện các thao tác suy diễn dựa trên các luật
4) Bộ mờ hố được dùng để chuyển các giá trị đầu vào sang các mức hợp với
với giá trị khơng rõ của ngơn ngữ
5) Bộ giải mờ chuyển các kết quả mờ của việc suy diễn sang các giá trị đầu ra
rõ
Thơng thường luật cơ sỏ và cơ sở dữ liệu được kết hợp và gọi chung là cơ sở tri
thức.
Các bước của suy diễn được thực hiện bởi hệ suy diễn mờ:
So sánh các biến đầu vào với các hàm thuộc dựa vào phần tiên đề để xác
định các giá trị thuộc của từng nhãn trong ngơn ngữ tự nhiên. (Bước này
thường được gọi là mờ hố)
Kết hợp các giá trị thuộc để cĩ được trọng lượng của từng luật
Khối tạo quyết(3)
Cơ sở tri thức
CSDL(2) Luật cơ sở(1)
Giải mờ(5) Mờ hố(4)
Đầu vào Đầu ra
(rõ) (rõ)
(mờ) (mờ)
37
Sinh các kết quả thoả mãn (cả mờ và rõ) cho từng luật dựa vào trọng
lượng.
Kết hợp các kết quả thoả mãn để cĩ được đầu ra rõ (bước này được gọi
là mờ hố).
Kết luận
Chương này đã giới thiệu tổng quan về khai phá dữ liệu, phân lớp và các
phương pháp phân lớp hay dùng hiện nay. Chúng tơi đã giới thiệu khá chi
tiết về mạng nơron và hệ mờ. Đây chính là các kiến thức chính để xây dựng
mơ hình ở các chương sau.
38
Chương 3 - MƠ HÌNH PHÂN TÍCH RỦI RO TÀI CHÍNH
2.1 Sơ lược về mơ hình
Chúng tơi đã xây dựng mơ hình dựa trên việc kết hợp phân lớp bằng mạng
nơron với logic mờ và phân tích kỹ thuật. Sự kết hợp này sẽ cho ta một hệ hỗ trợ quyết
định với kết quả cuối cùng là hành động mua, bán, hoặc giữ lại một loại cổ phiếu nào
đĩ. Sơ đồ tĩm tắt các thành phần chính của mơ hình của chúng tơi được trình bày
trong hình 3-1 dưới đây.
Hình 3-1 Mơ hình đề xuất
Dữ liệu
Luật cơ sở
Hành động mua bán
Lựa chọn đặc trưng
Phân lớp dữ liệu
Biểu đồ +
Phân tích kỹ thuật
Hệ hỗ trợ quyết định
39
Mơ hình đề xuất gồm hai mơ đun:
- Phân lớp dữ liệu nhằm đánh giá và dự báo rủi ro trong kinh doanh.
- Xây dựng hệ hỗ trợ quyết định nhằm đánh giá và hỗ trợ người dùng.
2.2 Phân lớp dữ liệu - Thiết kế mạng nơron
Cơng việc của chúng ta khơng đơn thuần chỉ là đánh giá và dự báo rủi ro của
một cơng ty duy nhất mà là đánh giá rủi ro một tập hợp các cơng ty. Do đĩ, trước hết
chúng ta thực hiện cơng việc phân lớp các cơng ty và dự báo rủi ro trong thời gian tiếp
theo. Việc thiết kế một mạng nơron dự báo thành cơng dữ liệu tài chính là một cơng
việc phức tạp bao gồm các bước sau:
- Chọn biến
- Thu thập dữ liệu
- Tiền xử lý dữ liệu
- Phân hoạch dữ liệu
- Thiết kế mạng nơron
- Huấn luyện mạng
- Thực hiện phân tích dữ liệu
2.2.1 Chọn loại dữ liệu đầu vào
Dữ liệu tài chính cĩ rất nhiều biến, trong phạm vi dự báo đánh giá rủi ro dựa
trên lĩnh vực kinh doanh chứng khốn chúng ta chỉ chọn một số biến sau:
- Ticker: mã cơng ty
- Date: Ngày giao dịch
- Open: giá mở cửa
- High: giá cao trong ngày
- Close: giá đĩng cửa
- Low: giá thấp nhất trong ngày.
Ngồi ra, cịn các biến đặc trưng trong báo cáo tài chính làm dữ liệu đầu vào và
một số thơng tin liên quan tới cơng ty như tên cơng ty, cơng ty thuộc ngành nào…
2.2.2 Thu thập dữ liệu
Thu thập dữ liệu: dữ liệu tài chính gồm các báo cáo tài chính như: bảng cân đối
kế tốn, báo cáo kết quả kinh doanh, báo cáo lưu chuyển tiền tệ, ngồi ra cịn các giao
dịch. Các dữ liệu này được cơng bố trên các sàn cũng như các trang giao dịch chứng
khốn. Các báo cáo tài chính cĩ số liệu đã được các tổ chức kiểm tốn kiểm tra. Trên
40
thế giới dữ liệu giao dịch cũng như báo cáo tài chính đã được chuẩn hố, tuy nhiên ở
việt nam dữ liệu này chưa được chuẩn hố. Do đĩ quá trình thu thập dữ liệu là tương
đối tốn kém thời gian.
2.2.3 Tiền xử lý dữ liệu
Trên thực tế, dữ liệu tài chính trên các thị trường chứng khốn là khơng minh
bạch. Khơng minh bạch ở đây cĩ nghĩa:
- Khơng đầy đủ: thiếu giá trị thuộc tính, thiếu thuộc tính cần quan tâm …
- Nhiễu: chứa lỗi hoặc thơng tin ngồi luồng
- Mâu thuẫn: chứa các mâu thuẫn giữa mã và tên
Do đĩ, chúng ta cần chuẩn hố dữ liệu trước khi khai thác và sử dụng dữ liệu
này: Dữ liệu tài chính được đưa vào cơ sở dữ liệu dưới dạng các bảng đã được chuẩn
hố cĩ cấu trúc được trình bày chi tiết trong phụ lục C
Trong đĩ, bảng Quotes chứa dữ liệu giao dịch trong từng này, luận văn đã thu
thập được dữ liệu giao dịch từ năm 2002 tới thời điểm hiện tại
Bảng Balances, Cashflows, Incomes chứ dữ liệu báo cáo tài chính theo quý
hoặc theo năm. Cụ thể:
Bảng cân đối kế tốn (Balances): cho biết nguồn vốn, tiền, tài sản cố định của
doanh nghiệp.
Bảng báo cáo kết quả hoạt động kinh doanh (Incomes): cho biết doanh thu và
chi phí trong hoạt động kinh doanh, bán hàng, quản lý doanh nghiệp…
Bảng báo cáo lưu chuyển tiền tệ (Cashflows): liên qua tới thơng tin luồng tiền
lưu chuyển như thế nào.
Bảng Cơng ty (Companies): Mơ tả các thơng tin về cơng ty như mã niêm yết
trên sàn chứng khốn, cơng ty thuộc ngành nào.
Hình 3-2 Mồ hình thực thể liên kết
41
2.2.4 Phân hoạch dữ liệu
Sau khi chuẩn hố dữ liệu, chúng ta chia dữ liệu thành ba tập: tập huấn luyện
(train set), tập validation và tập kiểm tra (test dataset). Tập huấn luyện là tập lớn nhất
được sử dụng bởi mơ hình để học các mẫu trong tập dữ liệu. Tập validation cĩ kích cỡ
chiếm khoảng 10%-30% của tập huấn luyện, nĩ được dùng để ước lượng khả năng
khái quát hố của một mạng theo giả thiết được huấn luyện. Việc kiểm tra cuối cùng
được thực hiện trên tập test.
Mơ hình phân lớp dữ liệu huấn luyện thành hai lớp: tốt và xấu.
Lớp tốt tương ứng với các giao dịch trong khoảng thời gian nhất định cĩ hiệu
suất tốt
Hiệu suất được tính theo cơng thức
Perfomance=(FurtureQuote-PresentQuote)/PresentQuote (3.1)
Trong đĩ:
PresentQuote là giá đĩng cửa hiện tại
FurtureQuote là giá đĩng cửa trong tương lai
Hiệu suất là “Tốt” nếu Performance >0
Hiệu suất là “Xấu” nếu Performance <0
Sau đĩ dữ liệu được phân hoạch cho các tập train và tập test
2.2.5 Thiết kế và huấn luyện mạng Nơron
Số lượng lớp ẩn: mạng đa lớp được chọn sử dụng 2 lớp
Việc huấn luyện dữ liệu cĩ nhiều phương pháp như đã giới thiệu ở chương 2. Ở
đây chúng ta sử dụng kỹ thuật mạng nơron và thuật tốn back-progapation được chọn
để sử dụng bởi nĩ cĩ nhiều ưu điểm. Mạng Nơron được sử dụng là mạng đa lớp gồm 2
perceptron. Các tham số của mạng gồm: tốc độ học, số lượng nút ẩn, số vịng lặp tối
đa.
Kết quả huấn luyện sẽ cho ra các độ chính xác: dự báo macro, micro, F1…
Sau khi chọn được kết quả huấn luyện tốt nhất, chúng ta chuyển sang phân tích
dữ liệu mẫu để dự báo
2.2.6 Phân tích dữ liệu
Dữ liệu cần phân tích là mẫu của các cơng ty chưa được gán nhãn trong quí tới.
Dữ liệu này cĩ thể là dữ liệu theo quí hoặc dữ liệu theo năm. Kết thúc phân tích dữ
liệu các mẫu sẽ được gán nhãn phân thành chia thành hai lớp: xấu và tốt.
42
Ngồi ra, chúng ta cịn lấy thêm thơng tin là hạng (rank) của từng cơng ty nhằm
phục vụ cho việc xây dựng tập luật cơ sở của hệ hỗ trợ quyết định trong mục sau.
2.3 Xây dựng tập luật từ phân tích kỹ thuật
Phân tích kỹ thuật tìm kiếm các mẫu, các xu thế và các hệ số khác trong các
chuỗi giá, từ đĩ cĩ thể dự đốn hiệu quả của trong tương lai và sau đĩ đưa ra quyết
định mua hay bán dựa trên các hệ số này. Các hệ số này thường cĩ được từ các dữ liệu
trong quá khứ theo một lý thuyết đặc biệt dựa trên kinh nghiệm. Mặc dù vẫn cĩ những
tranh cãi về hiệu quả của phân tích kỹ thuật, nhưng nhiều nghiên cứu đã chỉ ra rằng
phân tích kỹ thuật cĩ khả năng dự báo tương đối mạnh, hơn hẳn các chiến lược mua-
bán và các phương pháp thống kê. Mục đích của mục này là từ những kiến thức của
các chuyên gia trong lĩnh vực tài chính xây dựng nên một hệ thống thương mại cĩ hỗ
trợ quyết định. Hệ thống dùng phân tích kỹ thuật như là đầu vào. Bốn chỉ số kỹ thuật
được sử dụng cho việc dự báo là:
- Commodity Channel Index (CCI),
- Relative Strength Index (RSI),
- Moving Average Convergence and Divergence (MACD)
- Bollinger Band. Below.
2.3.1 Phân kỳ và hội tụ của đường trung bình di động
Cơng cụ chỉ báo MACD do Gernald Appel[10] phát triển, nĩ là một bộ tạo dao
động được cải tiến dựa trên cách tiếp cận sự trung bình di chuyển đơn giản. Đường
MACD được tính bằng cách lấy hai đường trung bình di chuyển mũ của giá đĩng cửa
Đường MACD tiêu chuẩn hình thành từ trung bình di động 12 ngày và trung
bình di động 26 ngày.Thơng thường, đường MACD 9 ngày được sử dụng như đường
so sánh. Giao của đường MACD với đường so sánh thường dùng để chỉ ra tín hiệu
mua-bán. Các luật cho MACD như sau:
1. IF MACD ở trên đường tín hiệu THEN BUY.
2. IF MACD ở dưới đường tín hiệu THEN SELL.
Tuy nhiên giá trị của đường MACD cũng dao động lên trên vào xuống dưới
đường zero. Đĩ là nơi nĩ bắt đầu tương đồng với một dao động. Tình trạng mua quá
mức được thể hiện khi đường này nằm trên đường zero và ngược lại nếu nĩ nằm dưới
đường zero thì đĩ là tình trạng bán quá mức.
Ta cĩ thể cĩ luật sau:
1. IF MACD trên 0 THEN OVERBUY.
2. IF MACD dưới 0 THEN OVERSELL.
43
2.3.2 Chỉ số kênh giá hàng hố - The Commodity Channel Index (CCI)
Chỉ số kênh giá hàng hố được xây dựng bởi Donal R.Lamber[10] bằng cách so
sánh giá cả hiện tại với trung bình di động trên một khoảng thời gian được chọn-
thường là 200 ngày. Sau đĩ chuẩn hố giá trị dao động bằng cách sử dụng một số chia
dựa trên độ lệch trung bình. Kết quả là, chỉ số CCI biến động trong một giới hạn
khơng đổi từ cận dưới -100 tới cận trên +100 (thỉnh thoảng cĩ thể là -200 và +200).
Các nhà phân tích kỹ thuật sử dụng chỉ số CCI như là dao động mua/bán quá mức
(oversold/overbought). Khi CCI vượt trên +100 thì được xem là mua quá mức, tương
tự khi CCI dưới -100 thì được xem là bán quá mức.
CCI được tính bằng cách sử dụng giá tiêu biểu (typical price-TP),đĩ là giá trị
trung bình của các giá cao, thấp và đĩng trên một giá ngày. Sau đĩ tính trung bình di
động của giá tiêu biểu cho khoảng thời gian N (MATP). Tiếp theo, trung bình sai
(MD) được tính bằng cách lấy trung bình giữa giá tiêu biểu trong khoảng thời gian N-
ngày và giá tiêu biểu khoảng thời gian mới nhất đã được làm trơn. Cuối cùng CCI
được tính bằng cơng thức: [8]
MDc
MATPTPCCI
3.2
Trong đĩ hằng số c thường được chọn là 0.015. Các luật phân lớp thị trường
với chỉ số CCI như sau:
1. IF CCI tăng trên 100 THEN BULLISH.
2. IF CCI giảm dưới 100 THEN BEARISH.
3. IF CCI tăng trên -100 THEN BULLISH
4. IF CCI giảm dưới -100 THEN BEARISH.
2.3.3 Chỉ số cường độ tương đối - Relative Strength Index (RSI)
Chỉ số cường độ tương đối được phát triển bởi J. Welles Wilder, cũng được
dùng như dao động mua/bán quá mức. Cơng thức tính như sau: [8]
'1
100
RS
RSRSI
3.3
trong đĩ RS trung bình giá đĩng cửa tăng và trung bình giá đĩng cửa giảm
trong khoảng thời gian N. Cơng thức tính RSI cho ta một khoảng giới hạn từ 0 đến
100, nĩ giải quyết vấn đề của những dịch chuyển bất thường và giải quyết nhu cầu về
một biên độ giới hạn trên và dưới khơng đổi.
RSI biểu diễn mặt chia đứng từ 0 tới 100. Những dịch chuyển ở trên mức 70
được xem là mua quá mức trong khi tình trạng bán quá mức là những dịch chuyển
dưới 30. Các luật phân lớp cho chỉ số này như sau:
44
1. IF RSI tăng trên 70 THEN BULLISH.
2. IF RSI giảm dưới 70 THEN BEARISH.
3. IF RSI tăng trên 50 THEN BULLISH.
4. IF RSI giảm dưới 50 THEN BEARISH.
5. IF RSI tăng trên 30 THEN BULLISH.
6. IF RSI giảm dưới 30 THEN BEARISH.
2.3.4 Dải băng Bollinger
Dải băng Bollinger so sánh các mức giá khơng ổn định và tương đối qua một
khoảng thời gian. Tính khơng ổn định được đo như dịch chuyển chuẩn của giá chứng
khốn. Ba tín hiệu của chỉ tiêu kỹ thuật này tạo nên một dải trùm lên các chuỗi thời
gian. Đường giữa của dải Bollinger được tính bằng việc lấy đường trung bình trượt
(MA) của chuỗi giá. Các mức giá được xem là mua quá mức khi chúng đụng lên dải
băng trên và được xem là bán quá mức nếu chúng đụng dải băng dưới.
Các luật phân lớp thị trường sử dụng dải Bollinger Bands như sau.
1. IF Price tăng trên đường Bollinger bên trên THEN BULLISH.
2. IF Price giảm xuống dưới đường Bollinger bên trên THEN BEARISH.
3. IF Price tăng lên trên đường Bollinger giữa THEN BULLISH.
4. IF Price giảm xuống dưới đường Bollinger giữa THEN BEARISH.
5. IF Price tăng lên trên đường Bollinger dưới THEN BULLISH.
6. IF Price giảm xuống dưới đường Bollinger dưới THEN BEARISH.
2.4 Kết hợp phân tích kỹ thuật với logic mờ và mạng nơron
Hệ thống dựa trên các luật mờ được xây dựng ở mục trên. Nhìn chung các luật
với ngưỡng cứng được thay bởi các luật với ngưỡng mờ. Hệ thống suy diễn mờ
Mamdani sẽ thực hiện việc này. Đầu vào của hệ thống là các chỉ số kỹ thuật và rank
của cơng ty, đầu ra của hệ thống sẽ là một tín hiệu mua hoặc bán và cĩ thể là giữ. Hệ
thống gồm một số mơ đun được minh hoạ trong hình.
45
Hình 3-3 Hệ suy diễn mờ
2.4.1 Mơ đun chỉ số kỹ thuật
Đầu vào của hệ thống là một chuỗi giá chứng khốn với tần suất tuần. Dữ liệu
này được đưa vào mơ đun chỉ số kỹ thuật, sau đĩ tính tốn các chỉ số như MACD,
RSI, CCI, BB cho các chuỗi dữ liệu này. Các kiến thức chuyên gia sau đây liên quan
tới các chỉ số kỹ thuật, chỉ số MACD là chỉ số quyết định cho việc mua và bán. Chỉ số
RSI và CCI sử dụng để xác định mức độ mua bán, chẳng hạn mua mạnh, bán mạnh,
hay đơn thuần chỉ là mua bán bình thường. Ngồi ra, chúng ta cịn sử dụng hạng của
cơng ty để kết quả được chính xác hơn.
Các tham số cho các chỉ số kỹ thuật được xác định theo nguyên tắc mặc định
trong phân tích kỹ thuật. Ví dụ với chỉ số MACD, 12 và 26 ngày được sử dụng như là
di chuyển trung bình ngắn hạn và dài hạn. Chỉ số RSI sử dụng khoảng thời gian là 20,
tương tự với chỉ số CCI và cĩ thêm c=0.015
Mơ đun chỉ tiêu kỹ thuật
Đầu vào FIS mới
Các chỉ số kỹ thuật
Giá chứng khốn
Hệ suy diễn mờ
Tín hiệu Mua/Bán
Luật
Hạng (Rank)
Mơ đun hội tụ
46
2.4.2 Mơ đun hội tụ
Mơ đun này cĩ nhiệm vụ chuyển các chỉ số kỹ thuật và hạng của cơng ty thành
các biến đầu vào của hệ suy diễn mờ. Ví dụ sự khác biệt của tín hiệu MACD với tín
hiệu so sánh được tính tốn để sử dụng như là đầu vào của hệ suy diễn mờ. Các biến
đầu vào cho hệ thống suy diễn mờ được tổng kết như sau:
Bảng 3-1 Miền giá trị của các tham số
Biến Ý nghĩa Miền giá trị
RANK Hạng của cơng ty [-1,1]
MACD Chỉ số MACD [-2,2]
RSI Chỉ số RSI tại thời điểm t [0,100]
RSI1 Chỉ số RSI tại thời điểm t-1 [0,100]
CCI Chỉ số CCI tại thời điểm t [-200,200]
CCI1 Chỉ số CCI tại thời điểm t-1 [-200,200]
BB Chỉ số BB tại thời điểm t [0,100]
BB1 Chỉ số BB tại thời
Các file đính kèm theo tài liệu này:
- LUẬN VĂN-NGHIÊN CỨU VÀ ỨNG DỤNG MỘT SỐ MÔ HÌNH HỌC MÁY TRONG VIỆC HỖ TRỢ ĐÁNH GIÁ RỦI RO TÀI CHÍNH.pdf