Khóa luận Hệ thống học thích nghi dựa trên kiến thức

Tài liệu Khóa luận Hệ thống học thích nghi dựa trên kiến thức: i ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Văn Huyên HỆ THỐNG HỌC THÍCH NGHI DỰA TRÊN KIẾN THỨC KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hướng dẫn: Thạc sĩ Nguyễn Việt Anh HÀ NỘI - 2009 ii TÓM TẮT NỘI DUNG Khoá luận có kết cấu gồm các phần như sau: Đầu tiên trình bày khái quát về đề tài của khoá luận: lý do lựa chọn đề tài, phạm vi, phương pháp thực hiện. Tiếp theo trình bày khái quát khái niệm về đào tạo điện tử, các đặc điểm của đào tạo điện tử. Vài nét phác thảo về lịch sử các thời kỳ phát triển của E-learning, cũng như xu hướng phát triển trong giai đoạn hiện nay cũng được đề cập. Sau đó trình bày lý thuyết về hoạt động thích nghi, cụ thể là trả lời cho câu hỏi “Thích nghi cái gì?” và “Cái gì có thể được thích nghi?”. Đây chính là cơ sở cho việc xây dựng mô hình học thích nghi. Tiếp theo trình bày các tìm hiểu về mô hình học thích nghi ACGS (Adaptive Course Generation System). Đây là phầ...

pdf49 trang | Chia sẻ: haohao | Lượt xem: 1310 | Lượt tải: 0download
Bạn đang xem trước 20 trang mẫu tài liệu Khóa luận Hệ thống học thích nghi dựa trên kiến thức, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
i ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ Nguyễn Văn Huyên HỆ THỐNG HỌC THÍCH NGHI DỰA TRÊN KIẾN THỨC KHOÁ LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY Ngành: Công nghệ thông tin Cán bộ hướng dẫn: Thạc sĩ Nguyễn Việt Anh HÀ NỘI - 2009 ii TÓM TẮT NỘI DUNG Khoá luận có kết cấu gồm các phần như sau: Đầu tiên trình bày khái quát về đề tài của khoá luận: lý do lựa chọn đề tài, phạm vi, phương pháp thực hiện. Tiếp theo trình bày khái quát khái niệm về đào tạo điện tử, các đặc điểm của đào tạo điện tử. Vài nét phác thảo về lịch sử các thời kỳ phát triển của E-learning, cũng như xu hướng phát triển trong giai đoạn hiện nay cũng được đề cập. Sau đó trình bày lý thuyết về hoạt động thích nghi, cụ thể là trả lời cho câu hỏi “Thích nghi cái gì?” và “Cái gì có thể được thích nghi?”. Đây chính là cơ sở cho việc xây dựng mô hình học thích nghi. Tiếp theo trình bày các tìm hiểu về mô hình học thích nghi ACGS (Adaptive Course Generation System). Đây là phần lý thuyết, bao gồm các khái niệm cơ bản, các thành phần cơ bản của mô hình. Sau đó trình bày một cách để triển khai thực tế mô hình. Cách thiết kế cơ sở dữ liệu, thuật toán, công nghệ được trình bày cụ thể, rõ ràng để có thể xây dựng một hệ thống sinh khoá học thích nghi thực sự. Phần kết luận nêu những kết quả chính và đánh giá kết quả đạt được. Phần tài liệu tham khảo liệt kê các bài báo, các tài liệu có liên quan trong quá trình làm khoá luận. iii LỜI CẢM ƠN Để hoàn thành bản khóa luận này, trước hết em xin bày tỏ lòng biết ơn sâu sắc tới thầy giáo, thạc sĩ Nguyễn Việt Anh đã tận tụy hướng dẫn, giúp đỡ trong quá trình làm khóa luận. Đồng thời em xin được cảm ơn các thầy giáo, cô giáo trong trường Đại học Công Nghệ - Đại học Quốc Gia Hà Nội đã cho em có được nhiều kiến thức bổ ích trong suốt thời gian học tập tại trường. Cuối cùng, xin gửi lời cảm ơn tới tất cả bạn bè, gia đình, và người thân, những người đã luôn luôn là chỗ dựa vững chắc nhất. iv Mục lục Mở đầu ....................................................................................................................................... 1 1. Tổng quan E-learning.............................................................................................................. 3 1.1. Khái niệm và lợi ích của E–learning ................................................................................. 3 1.1.1. Khái niệm .................................................................................................................. 3 1.1.2. Các đặc điểm chung của E-learning ........................................................................... 3 1.1.3. Lợi ích của E-learning ............................................................................................... 4 1.2. Quá trình hình thành và phát triển..................................................................................... 5 1.2.1. CBT (Computer Based Training) ............................................................................... 5 1.2.2. WBT (Web based Training)...................................................................................... 5 1.2.3. Chuẩn hóa E-learning ................................................................................................ 6 1.2.4. Sắp xếp và điều hướng E-learning.............................................................................. 6 1.3. Xu thế phát triển............................................................................................................... 7 2. Thích nghi siêu phương tiện .................................................................................................... 9 2.1. Tổng quan ........................................................................................................................ 9 2.1.1. Giới thiệu chung ........................................................................................................ 9 2.1.2. Phương thức và kỹ thuật .......................................................................................... 10 2.1.3. Ở đâu và tại sao AH có thể hữu ích .......................................................................... 11 2.2. Thích nghi cái gì............................................................................................................. 14 2.2.1. Kiến thức ................................................................................................................. 14 2.2.2. Mục tiêu .................................................................................................................. 15 2.2.3. Nền tảng và kinh nghiệm ......................................................................................... 16 2.2.4. Sở thích ................................................................................................................... 16 2.3. Cái gì có thể được thích nghi trong AH .......................................................................... 17 2.3.1. Thích nghi trình bày ................................................................................................ 17 2.3.2. Thích nghi trợ giúp điều hướng................................................................................ 18 3. Mô hình hệ thống học thích nghi ACGS [10] ........................................................................ 20 3.1. Các cấu trúc biểu diễn .................................................................................................... 20 3.1.1. Mô hình người học .................................................................................................. 21 3.1.2. Mô hình khái niệm................................................................................................... 21 3.1.3. Mô hình kiến thức phủ ............................................................................................. 22 3.1.4. Mô hình công việc ................................................................................................... 22 3.1.5. Mô hình miền khoá học ........................................................................................... 24 3.2. Mô hình mạng Bayes...................................................................................................... 26 3.2.1. Giới thiệu chung về mạng Bayes.............................................................................. 26 3.2.2. Sử dụng mạng Bayes trong hoạt động thích nghi ..................................................... 26 3.3. Thích nghi hoạt động học ............................................................................................... 29 v 4. Cài đặt thử nghiệm ................................................................................................................ 30 4.1. Tìm hiểu yêu cầu ............................................................................................................ 30 4.2. Phân tích thiết kế cơ sở dữ liệu ....................................................................................... 31 4.3. Môi trường phát triển ..................................................................................................... 35 4.3.1. Apache .................................................................................................................... 35 4.3.2. MySQL ................................................................................................................... 35 4.3.3. Java ......................................................................................................................... 36 4.3.4. Netica [6]................................................................................................................. 36 4.4. Cấu trúc và hoạt động của các trang web ........................................................................ 38 4.5. Thử nghiệm .................................................................................................................... 39 4.5.1. Dữ liệu thử nghiệm .................................................................................................. 39 4.5.2. Kết quả thử nghiệm ................................................................................................. 41 4.5.3. Đánh giá kết quả...................................................................................................... 42 Kết luận .................................................................................................................................... 43 Tài liệu tham khảo .................................................................................................................... 44 1 Mở đầu Hiện nay, phương pháp đào tạo điện tử E-learning đã trở nên phổ biến và được ứng dụng rộng rãi trong nhiều mô hình đào tạo khác nhau. Sở dĩ như vậy là do E-learning cung cấp những khoá học sinh động, phong phú (như có thể áp dụng đa phương tiện) so với cách học truyền thống. Ngoài ra, E-learning còn tận dụng được những ưu điểm của mạng Internet. E-learning là thế hệ tiếp theo của cách học truyền thống. Vậy, sau E- learning sẽ là gì? Có thể đó chính là cách học thích nghi. Đề tài này đang được nhiều nhà nghiên cứu quan tâm. Học thích nghi có nghĩa là tiến tới việc tạo ra các khoá học thích nghi, phù hợp với nhu cầu và trình độ của người học. Những người khi tham gia vào khóa học trực tuyến không phải ai cũng như ai. Mỗi người học có mục đích học tập khác nhau, có trình độ khác nhau, có sở thích khác nhau, có cách tiếp thu kiến thức cũng khác nhau. Do đó, một khoá học có khi là phù hợp đối với người này nhưng lại không phù hợp đối với người khác. Ví dụ, một khoá học với độ khó vừa phải sẽ tốt cho một người chưa có kinh nghiệm, nhưng lại chán ngắt và buồn tẻ với một người đã thành thạo với vấn đề đó. Nhu cầu của từng người học khi tham gia hệ thống là khác nhau. Liệu hệ thống có thể đưa ra các khóa học phù hợp với từng người học? Làm sao để đáp ứng nhu cầu của từng người học, đặc biệt là các khoá học trực tuyến với rất nhiều người tham gia. Học thích nghi là kiểu đầu tiên và phổ biến nhất của thích nghi siêu phương tiện. Nhiều người đã tập trung nghiên cứu, phát triển các mô hình học thích nghi và đã thu được các kết quả nhất định. Bạn có thể tham khảo một số hệ thống như ELM-ART của Gerhard Weber, InterBook của Peter Brusilovsky, Personal Reader của Nicola Henze, AHA! của Paul de Bra [12]. Khoá luận “Hệ thống sinh khoá học thích nghi dựa trên kiến thức ” được chọn với bốn mục tiêu sau: 1. Tìm hiểu về E-learning 2. Tìm hiểu học thích nghi 3. Nghiên cứu mô hình ACGS 4. Phân tích thiết kế và cài đặt thử nghiệm mô hình ACGS 2 Khoá luận sẽ đi từ những cái cơ bản nhất để làm nền móng cho những cái tiếp theo. Những kiến thức chung, phổ biến, dễ hiểu sẽ được trình bày một cách ngắn gọn. Tuy nhiên, nó vẫn cần thiết phải đưa ra ở đây để chúng ta có được một cái nhìn tổng quan, hệ thống. 3 1. Tổng quan E-learning E-learning (Giáo dục trực tuyến) là phương thức học ảo thông qua một máy vi tính nối mạng đối với một máy chủ ở nơi khác có lưu giữ sẵn giáo trình và phần mềm cần thiết để có thể hỏi/yêu cầu/ra đề cho học viên học trực tuyến từ xa. Các cá nhân hay các tổ chức đều có thể tự lập ra một trường học trực tuyến (E-school), mà nơi đó vẫn nhận đào tạo học viên, đóng học phí và có các bài kiểm tra như các trường học khác [12]. 1.1. Khái niệm và lợi ích của E–learning 1.1.1. Khái niệm Khái niệm E-learning hay đào tạo điện tử đã được rất nhiều học giả và các nhà nghiên cứu về giáo dục đưa ra, mỗi khái niệm lại thể hiện những đặc trưng riêng của E- learning. Dưới đây là một số định nghĩa được nhiều nhà nghiên cứu công nhận và sử dụng:  E-learning là quá trình học tập có sự trợ giúp của công nghệ Web và Internet (William Horton).  E-learning là một thuật ngữ dùng để mô tả việc học tập, đào tạo dựa trên công nghệ thông tin và truyền thông (Compare Infobase Inc).  E-learning là quá trình học tập hay đào tạo được chuẩn bị, truyền tải hoặc quản lý sử dụng nhiều công cụ của công nghệ thông tin, truyền thông khác nhau và được thực hiện ở mức cục bộ hay toàn cục (MASIE Center). 1.1.2. Các đặc điểm chung của E-learning Tuy có nhiều cách hiểu khác nhau, nhưng nói chung E-learning có những đặc điểm sau:  Dựa trên công nghệ thông tin và truyền thông. Cụ thể hơn là công nghệ mạng, kĩ thuật đồ họa, kĩ thuật mô phỏng, công nghệ tính toán…  Hiệu quả của E-learning cao hơn so với cách học truyền thống do E-learning có tính tương tác cao dựa trên multimedia, tạo điều kiện cho người học trao 4 đổi thông tin dễ dàng hơn, cũng như đưa ra nội dung học tập phù hợp với khả năng và sở thích của từng người. E-learning sẽ trở thành xu thế tất yếu trong nền kinh tế tri thức. Hiện nay, E-learning đang thu hút được sự quan tâm đặc biệt của các nước trên thế giới với rất nhiều tổ chức, công ty hoạt động trong lĩnh vực E-learning ra đời. 1.1.3. Lợi ích của E-learning E-learning có các lợi ích sau mà phương pháp học truyền thống không có:  Giảm chi phí. E-learning thường là một giải pháp tiết kiệm trong chi phí đào tạo, ví dụ: chi phí cho việc thuê các phòng học so với chi phí đào tạo trực tuyến. Mặc dù chi phí để phát triển nó thì đắt, nhưng thực hiện đào tạo thì lại rẻ, đặc biệt là với số lượng lớn người tham gia khoá đào tạo, thì chi phí sẽ giảm xuống nhiều.  Tiết kiệm thời gian từ 25-50% hoặc nhiều hơn.  Kiến thức thu được tương đương hoặc tốt hơn so với học thông thường. Nhưng quan trọng hơn, E-learning có thể mang đến một số lợi ích về tài chính cho các tổ chức trong các việc như:  Tăng cường thu hút nhân lực - nhiều người cho biết việc thiếu đào tạo và đầu tư vào họ là nguyên nhân cho việc ra đi của họ- tỉ lệ thay đổi nhân sự trong công nghiệp là khoảng 1-3% và vì thế sẽ làm doanh thu cũng giảm theo.  Đáp ứng các nhu cầu của khách hàng - đôi khi lên đến 10-15%.  Nâng cao năng suất - do việc tăng trình độ nghề nghiệp cho công nhân đã dẫn đến việc giảm các lỗi không đáng có. Chính vì những lợi ích trên mà E-learning ngày càng được sử dụng rộng rãi trong các doanh nghiệp từ quy mô nhỏ đến các doanh nghiệp quy mô lớn và trong giáo dục đại học. 5 1.2. Quá trình hình thành và phát triển Cùng với thời gian, nhờ sự đóng góp tích cực của cộng đồng những người quan tâm và yêu thích, E-learning đã phát triển từng bước qua các giai đoạn khác nhau. 1.2.1. CBT (Computer Based Training) Đây là hình thức đào tạo dựa trên máy tính. Học viên chỉ cần mua phần mềm đào tạo và có thể tự học bất cứ thời gian và địa điểm nào phù hợp với nhu cầu của họ. Khi tham gia vào hình thức đào tạo này, học viên phải phát huy tính độc lập, khả năng tự học ở mức tối đa. Học viên cũng không có bạn bè để trao đổi và giáo viên để hỏi thêm. Đây là phương pháp tiết kiệm chi phí và mang lại hiệu quả cao đối với những môn học cần hiệu ứng của công nghệ thông tin như tiếng anh, tin học. Tuy nhiên, quá trình tiếp xúc với màn hình máy tính trong một thời gian dài sẽ gây ra cảm giác buồn tẻ, chán nản cho học viên. Không có thầy giáo, lớp học, bạn học đồng nghĩa với việc không có tranh đua, mất đi một động lực để học viên học tập hết mình. Những yếu tố này làm giảm đáng kể hiệu quả và chất lượng đào tạo. 1.2.2. WBT (Web based Training) Đây là hình thức đào tạo dựa trên công nghệ web. WBT đã hội tụ những thế mạnh của đào tạo truyền thống và CBT cũng như khắc phục những điểm yếu trong cả hai phương thức này. Sự phát triển của công nghệ thông tin và mạng internet đã tạo ra một viễn cảnh mới cho công nghệ E-learning. Trên thế giới đã có nhiều tổ chức triển khai các lớp học trực tuyến. Trong đó, học viên được tham gia vào một môi trường ảo, mô phỏng đầy đủ tính chất của một lớp học truyền thống (có thầy giáo, bạn học, bảng đen, phấn trắng, các cuộc thảo luận,…) mà vẫn tận dụng được những thế mạnh của E-learning. Chỉ cần một máy tính nối mạng Internet, học viên có thể tham gia lớp học vào bất cứ thời điểm nào, ở bất cứ nơi đâu. Những khó khăn mà một số học viên thường gặp khi tham gia đào tạo truyền thống như phân biệt đối xử, phân biệt màu da không còn tồn tại trong E- learning. Những nhược điểm của CBT như buồn tẻ hay nhàm chán cũng được khắc phục với các lớp học ảo của WBT. Với rất nhiều lợi thế, WBT đang hỗ trợ và dần chiếm lĩnh vị trí của đào tạo truyền thống, đẩy mạnh quá trình phát triển E-learning về bề rộng. 6 1.2.3. Chuẩn hóa E-learning Kĩ thuật WBT phát triển tạo đà đưa E-learning vào hệ thống giảng dạy của các trường đại học, các tổ chức, đơn vị trên thế giới. Rất nhiều LMS (Learning Management System – hệ quản trị học tập), LCMS (Learning Management System – hệ quản trị nội dung) đã ra đời với những kho nội dung riêng biệt. Lúc này, một số tổ chức muốn sử dụng lại nội dung của tổ chức khác trên chính LMS của mình. Tuy nhiên, với những LMS có cấu trúc khác nhau thì điều này là không thể. Do đó, vấn đề tạo ra các bài giảng theo một quy tắc chung có khả năng tương thích với các LMS, LCMS hỗ trợ quy tắc đó được quan tâm và triển khai. Một số chuẩn nội dung đã được đưa ra và được sử dụng phổ biến trên thế giới như: IMS (Instructional Management Systems), AICC (Aviation Industry CBT Committee) và đặc biệt là chuẩn SCORM (Sharable Content Object Reference Model). Trong đó, SCORM là chuẩn được sử dụng rộng rãi nhất do ADL (Advance Distributed Learning) đã kết hợp các đặc tả của các chuẩn phổ biến trên thế giới để đưa ra đặc tả của SCORM. Việc xây dựng nội dung theo chuẩn cũng rất quan trọng để tạo ra một trung tâm cung cấp nội dung học chung trên thế giới. 1.2.4. Sắp xếp và điều hướng E-learning Cùng với sự phát triển của công nghệ thông tin, đòi hỏi của người học với E- learning tăng lên, các hệ thống E-learning thì linh động và hiệu quả hơn. Ý tưởng xây dựng các khóa học động trên công nghệ E-learning đã trở thành xu hướng và mục tiêu phát triển của E-learning thế kỉ 21. Khóa học động là các khóa học mà nội dung học luôn được cập nhật trong quá trình đào tạo và được định hướng theo yêu cầu, trình độ của người học. Ý tưởng này đã được hiện thực hóa ở một số tổ chức, nhưng chưa đồng bộ và chưa thực sự hiệu quả. Các chuẩn nội dung cũng được cập nhật liên tục để phù hợp với yêu cầu mới. Với chuẩn SCORM 2004, ADL đã đưa ra các giải pháp có tính hệ thống và khả năng thực thi cao. Tuy nhiên, hiện nay chuẩn SCORM cũng như hầu hết các chuẩn khác đang trong quá trình cập nhật, nâng cấp và nghiên cứu để phù hợp những yêu cầu luôn biến đổi của kĩ thuật E-learning. Mỗi phiên bản sau của chuẩn lại không tương thích với phiên bản trước. Do tính bất ổn định đó, việc áp dụng các chuẩn vào điều hướng và sắp xếp cho mỗi hệ thống cần có quá trình tìm hiểu, phân tích sâu sắc về đòi hỏi thực tế của hệ thống E-learning với những đặc tính của mỗi chuẩn để đưa ra quyết định thích hợp. 7 Phát triển E-learning là phương thức nâng cao chất lượng của giáo dục đào tạo rất hiệu quả. Ngoài ra, E-learning còn là giải pháp kinh tế cho giáo dục và đào tạo tương lai. Nó làm giảm đáng kể các loại chi phí liên quan đến quá trình đào tạo như chi phí đi lại, tài liệu, chi phí sinh hoạt,.. tiết kiệm thời gian và kích thích sự hứng thú của học viên. 1.3. Xu thế phát triển E-learning được tập trung phát triển ở hai khía cạnh: phát triển nội dung (Learning Content Management System – Hệ quản trị nội dung học tập) và phát triển về hệ thống (Learning Management System – Hệ quản trị học tập). Điều đó khiến cho E-learning đi theo 3 xu hướng:  Xây dựng khóa học điện tử hoàn chỉnh: Phát triển về mặt hệ thống, xây dựng LMS để phát triển mô hình WBT toàn diện, từ đó tạo ra các khóa học trực tuyến hoàn chỉnh, độc lập. Để tăng thêm hiệu quả cho những LMS này, nội dung các bài giảng phải dễ hiểu, dễ truyền đạt, sử dụng đa phương tiện để tăng chất lượng đào tạo.  Xây dựng khóa học theo chuẩn: Phát triển về mặt nội dung, nâng cấp các chuẩn nội dung, hướng tới một chuẩn phù hợp với yêu cầu chung của E-learning thế giới và mang đầy đủ các đặc tính thỏa mãn yêu cầu của thời đại đặt ra cho E-learning. Đó là khả năng sử dụng lại, tính tương thích, tính khả chuyển, tính thích nghi,… Một chuẩn nội dung mang lại đầy đủ các hiệu quả đó sẽ là động lực phát triển E-learning theo bề rộng bằng cách phân phối nội dung học trên toàn thế giới qua mạng Internet. Đây cũng là tiền đề để tạo ra trung tâm phân phối tri thức chung cho tất cả LMS, LCMS. Đến lúc đó, chi phí con người phải trả cho giáo dục và đào tạo sẽ giảm tối đa mà chất lượng, hiệu quả lại tăng rõ rệt.  Xây dựng khóa học theo nhu cầu người học: Phát triển về nội dung, cộng đồng E-learning thế giới đang xây dựng một mô hình chuẩn để sắp xếp và điều hướng nội dung học hiệu quả, tạo khóa học động phù hợp với đặc trưng của từng học viên. Trong quá trình phát triển các chuẩn nội dung, các tổ chức cũng đã đề xuất ra mô hình điều hướng và sắp xếp. Trong tương lai, khi các chuẩn nội dung phát triển đến giai đoạn ổn định và thích nghi, mô hình sắp xếp và điều hướng nội dung sẽ được chuẩn hóa và và tích hợp vào chuẩn nội dung. Hiện nay, chuẩn SCORM cũng đang chỉnh sửa và nâng cấp để đáp ứng 8 yêu cầu này, nhưng khả năng điều hướng trong SCORM vẫn chưa linh hoạt và chưa thực sự hiệu quả. Một trong những xu hướng mới đang thu hút sự chú ý của số lượng lớn các chuyên gia là E-learning – xây dựng khóa học theo nhu cầu người học. Xu hướng này gắn liền với sự thay đổi về chính bản chất của người dùng Internet. Đôi khi họ được gọi là “thế hệ số” hay “thế hệ n-gen”. Và thế hệ người dùng mới này tiếp cận cách làm việc, học tập và giải trí theo những cách thức mới. Họ nhanh chóng thu nhận thông tin, cả dưới dạng hình ảnh cũng như text, từ rất nhiều nguồn khác nhau. Họ xử lý chúng với một tốc độ “chớp giật” và trông chờ phản hồi lập tức. Họ thích được truy xuất tùy ý theo yêu cầu tới các tài nguyên đa phương tiện, luôn muốn được giao tiếp ngay với bạn bè của mình, tự tạo hoặc tải về các tài liệu đa phương tiện... Trong học tập, xu hướng này được thể hiện rõ ràng khi chúng được gọi là các thiết kế “hướng tới học viên” hay “tập trung vào sinh viên”. Điều này không chỉ là tập trung vào nhiều loại phong cách học tập khác nhau hay cho phép học viên có thể thay đổi kích thước font chữ hay màu nền, mà là chính học viên có thể quản lý được quá trình học tập của mình. Học tập không chỉ được thể hiện ở khía cạnh khả năng tự chủ lớn hơn của học viên mà còn ở sự lưu tâm nhiều hơn đến các hoạt động học tập tích cực, với việc tạo lập, liên lạc và giao tiếp đang đóng vai trò chính yếu, và còn ở trong sự thay đổi trong vai trò của giáo viên, mà thực tế, thậm chí là sự giảm đi nhanh chóng các khác biệt giữa giáo viên và học viên. Hiện nay, E-learning đã kết hợp với World Wide Web thành một thể thống nhất và sự thay đổi của nó đã đạt đến một mức độ để hình thành nên một tên gọi: E-learning 2.0. 9 2. Thích nghi siêu phương tiện Trong chương này, chúng ta sẽ tìm hiểu về các hệ thống thích nghi siêu phương tiện (Adaptive Hypermedia Systems) nói chung. Các hệ thống như Amazon.com là minh hoạ của thích nghi siêu phương tiện AH (Adaptive Hypermedia), vì nó giới thiệu các quyển sách dựa vào sở thích của người dùng và lịch sử trước đó. Các miền ứng dụng khác của AH là adaptive e-learning, adaptive e-commerce, và adaptive e-government. Nói chung, các hệ thống AH có thể hữu ích bất cứ đâu nơi mà siêu văn bản và siêu phương tiện được sử dụng. Hệ thống AH phổ biến nhất là các hệ thống dựa vào web [12]. Chương này được trình bày dựa trên các kết quả do Peter Brusilovsky công bố [5]. 2.1. Tổng quan 2.1.1. Giới thiệu chung Các hệ thống siêu phương tiện đang trở nên phổ biến như là công cụ để hướng người dùng đến với thông tin. AH là một hướng nghiên cứu trong lĩnh vực thích nghi dựa vào mô hình người dùng. Các hệ thống AH xây dựng một mô hình của từng người dùng riêng biệt và áp dụng nó cho việc thích nghi của người dùng đó. Ví dụ, có thể thích nghi nội dung của một trang siêu văn bản với kiến thức và mục tiêu của người dùng, hoặc giới thiệu các liên kết thích hợp nhất cho người dùng. Những người dùng khác nhau có thể quan tâm đến các phần khác nhau của thông tin trình bày trên một trang siêu phương tiện và có thể sử dụng các liên kết khác nhau để điều hướng. Các hệ thống AH có thể hỗ trợ người dùng trong việc điều hướng của họ bằng cách hạn chế không gian trình duyệt (hyperspace), gợi ý các liên kết phù hợp nhất để đi theo, hoặc cung cấp các chú thích thích nghi cho các liên kết. Do lĩnh vực nghiên cứu này còn khá mới, định nghĩa của các hệ thống AH chưa được xác định cụ thể. Để làm nền tảng cho các kiến thức sau này, chúng ta sẽ cùng sử dụng định nghĩa sau: Các hệ thống thích nghi siêu phương tiện là các hệ thống phản ánh một số đặc tính của người dùng trong mô hình người dùng và áp dụng mô hình này để thích nghi theo một số hướng khác nhau đối với người dùng. Nói cách khác, hệ thống cần thoả mãn ba tiêu chuẩn sau: 10  Nó là một hệ thống siêu văn bản hoặc siêu phương tiện.  Nó có một mô hình người dùng.  Nó có thể thích nghi bằng cách sử dụng mô hình này (ví dụ, cùng một hệ thống có thể trông khác nhau với các mô hình khác nhau). Các hệ thống AH bây giờ được sử dụng trong một số miền ứng dụng, nơi mà hyperspace tương đối lớn và các ứng dụng siêu phương tiện dự định sẽ được sử dụng bởi từng người với mục tiêu, kiến thức và nền tảng khác nhau. Chúng ta sẽ xem lại các công việc đang tồn tại trong AH, tập trung xung quanh một số các phương thức và kỹ thuật của AH. 2.1.2. Phương thức và kỹ thuật Kỹ thuật thích nghi đề cập đến các phương thức cung cấp sự thích nghi trong các hệ thống AH đang tồn tại. Mỗi kỹ thuật có thể đặc trưng bởi một kiểu chỉ định của cách biểu diễn kiến thức và bởi thuật toán thích nghi chỉ định. AH là một lĩnh vực nghiên cứu mới và hầu hết các kỹ thuật thích nghi vẫn là độc nhất. Tuy nhiên, một số kỹ thuật phổ biến đã được thực thi trong các hệ thống ban đầu. Phương thức thích nghi được định nghĩa là tổng quát hoá của các kỹ thuật thích nghi đang tồn tại. Mỗi phương thức dựa trên một ý tưởng thích nghi rõ ràng mà có thể được trình bày trên cấp độ định nghĩa. Ví dụ, “… chèn sự so sánh của định nghĩa hiện tại với định nghĩa khác nếu người dùng đã biết định nghĩa hiện tại rồi”, hoặc “… ẩn các liên kết tới các định nghĩa mà chưa sẵn sàng để học”. Cùng phương thức có thể được thực thi bởi các kỹ thuật khác nhau. Cùng một lúc, một số kỹ thuật được sử dụng để thực thi một số phương thức sử dụng cùng cách biểu diễn kiến thức. Tập hợp các phương thức và kỹ thuật hình thành một bộ công cụ của AH, và có thể được sử dụng như một nguồn tham khảo cho các thiết kế viên và người phát triển của các hệ thống AH. Để xem xét các hệ thống AH cần thành lập nền tảng cho sự phân loại các phương thức và kỹ thuật. Các mặt sau khá điển hình cho phân tích các hệ thống thích nghi nói chung.  Ở đâu các hệ thống AH có thể có ích. 11  Đặc tính nào của người dùng được sử dụng như là một nguồn của sự thích nghi.  Cái nào có thể được thích nghi (đặc tính nào của hệ thống có thể khác nhau với các user khác nhau).  Mục tiêu thích nghi (tại sao phương thức và kỹ thuật này được áp dụng, vấn đề nào mà chúng giải quyết). 2.1.3. Ở đâu và tại sao AH có thể hữu ích Không giống các kiểu hệ thống khác, bất kỳ hệ thống siêu phương tiện nào cũng thích nghi theo một vài kiểu: sử dụng trình duyệt tự do, những người dùng khác nhau có thể thích nghi hệ thống với thông tin họ cần. Phân tích của các hệ thống AH đang tồn tại cho phép chúng ta gọi tên sáu kiểu của hệ thống siêu phương tiện được sử dụng hiện tại như là miền ứng dụng trong hầu hết các dự án nghiên cứu trên AH. Chúng là: educational hypermedia, online help systems, information retrieval hypermedia systems, institutional information systems, và systems for managing personalized views. Trong mỗi lĩnh vực, các kỹ thuật AH có thể hữu ích bởi vì chúng giúp giải quyết các vấn đề được định nghĩa. Phần này sẽ miều tả tất cả các lĩnh vực ứng dụng, chỉ ra các đặc tính của nó và định nghĩa các vấn đề mà cần có sự thích nghi. Lĩnh vực phổ biến nhất cho nghiên cứu AH là educational hypermedia. Các hệ thống educational hypermedia đang tồn tại có hyperspace tương đối nhỏ, dùng để trình bày một khoá học nào đó hoặc một phần của học liệu trên một chủ đề nào đó. Mục tiêu của người học thường là học tất cả hoặc một phần tương đối. Tính năng quan trọng nhất trong educational hypermedia là kiến thức về chủ đề được dạy. Các kỹ năng AH có thể giải quyết một số vấn đề liên quan đến việc sử dụng educational hypermedia. Đầu tiên, kiến thức của những người dùng khác nhau có thể khác biệt rất lớn và kiến thức của một người dùng nào đó có thể tăng khác nhanh. Cùng một trang có thể chưa rõ ràng đối với một người chưa có kinh nghiệm, nhưng lại tầm thường và nhàn chán đối với một người đã thành thạo. Thứ hai, những người chưa có kinh nghiệm vào chủ đề mà hầu như không biết gì. Hầu hết các liên kết được đề nghị từ bất kỳ node gì đều dẫn đến tài liệu mà hoàn toàn mới với họ. Họ cần các trợ giúp điêu hướng để tìm đường đi qua không gian học. Không có các trợ giúp như thế, họ có thể “bị lạc”, thậm chí trong hyperspace khá nhỏ nếu sử dụng chiến lược duyệt không hiệu quả. 12 Một ứng dụng phổ biến khác cho AH là lĩnh vực online information systems, từ các hệ thống tài liệu trực tuyến cho đến các hệ thống từ điển bách khoa trực tuyến. Một ví dụ gần gũi hơn đó chính là các máy tìm kiếm như Google, Yahoo. Mục tiêu của các hệ thống này là cung cấp tham chiếu truy cập đến thông tin (sự giới thiệu không có hệ thống như trong educational hypermedia) cho những người dùng với các cấp độ kiến thức khác nhau của chủ đề. Mỗi node của hyperspace thường đại diện một khái niệm của chủ đề và chứa một vài trang thông tin. Tuỳ thuộc vào chủ đề, kích thước của hyperspace có thể từ khá nhỏ đến rất lớn. Tương tự educational hypermedia, online information system có các vấn đề với việc thoả mãn nhu cầu của những người dùng khác nhau. Những người với kiến thức và nền tảng khác nhau cần các thông tin khác nhau về một khái niệm và ở các cấp độ chi tiết khác nhau. Họ thông thường không có thời gian để duyệt toàn bộ thông tin về khái niệm để tìm phần thông tin yêu cầu. Những người dùng cũng có các mục tiêu khác nhau khi truy cập một hệ thống thông tin. Trong một số trường hợp, họ biết khái niệm nào để truy cập để đạt được mục tiêu và không cần hỗ trợ điều hướng. Tuy nhiên, khi mục tiêu không thể trực tiếp ánh xạ đến cấu trúc của hyperspace hoặc khi hyperspace là lớn, người dùng cần trợ giúp trong điều hướng tìm kiếm thông tin tương ứng. Để cung cấp trợ giúp như thế, hệ thống cần biết mục tiêu của người dùng. Gần gũi với online information systems là online help systems. Sự khác biệt với online information systems là online help systems không độc lập như online information systems mà được gắn với hệ thống ứng dụng của nó. Sự khác biệt nữa là hyperspace trong online help system đang tồn tại khá nhỏ. Ví dụ cho hệ này là MSDN Library, hệ thống trợ giúp trực tuyến cho những nhà phát triển của Microsoft. Online help systems và online information system chia sẻ vấn đề của phục vụ thông tin khác nhau cho những người dùng khác nhau. Trong khi đó, vấn đề của trợ giúp người dùng để tìm thông tin tương ứng thì dễ dàng hơn đối với online help systems vì hyperspace không lớn và vì hệ thống biết biết ngữ cảnh từ đó người dùng gọi trợ giúp. Ngữ cảnh trong công việc của một hệ thống ứng dụng cung cấp một nguồn thông tin đáng tin cậy cho sự thích nghi để quyết định mục tiêu của người dùng và đề nghị những mục trợ giúp phù hợp nhất. Ví dụ minh hoạ tác dụng của ngữ cảnh cho sự thích nghi là menu ngữ cảnh của Office 2007. Khi chúng ta chọn một đối tượng nào đó trong một văn bản Word 2007 (một đoạn, một ảnh…), tuỳ vào đối tượng được chọn, các biểu tượng khác nhau sẽ được hiển thị tương ứng với các lệnh mà chúng ta có thể sử dụng với đối tượng đó. 13 Ba miền ứng dụng liệt kê ở trên thuộc về các miền ứng dụng truyền thống cho siêu phương tiện. Phần lớn các hệ thống siêu phương tiện đang tồn tại thuộc về một trong ba lĩnh vực này. Không ngạc nhiên là hầu hết các hệ thống AH cũng thuộc về các lĩnh vực này. Ba lĩnh vực liệt kê sau là các lĩnh vực gần đây hơn. Information retrieval hypermedia systems (IRHS) là một lớp mới của các hệ thống Information Retrieval mà kết hợp các kỹ thuật thu hồi thông tin truyền thống (thuần văn bản) với việc sử dụng siêu văn bản. IRHS thích nghi có thể đề nghị một số trợ giúp thêm bằng cách giới hạn sự điều hướng và bằng giới thiệu các liên kết phù hợp nhất để theo. Tuy nhiên, nó khác với online information systems là người dùng của IRHS thường chuyên nghiệp hơn trong các lĩnh vực đang tìm kiếm. Một lĩnh vực mới khác của AH là institutional information systems (IIS), cái mà cung cấp tất cả thông tin yêu cầu hỗ trợ công việc của một cơ quan nào đó, ví dụ một bệnh viện. Hầu hết các cơ quan ở các nước phát triển đều có hệ thống riêng của mình. Ban đầu các kiểu hệ thống này được phát triển như là một tập của các cơ sở dữ liệu liên quan lỏng lẻo. Nhưng trong một số hệ thống gần đây các cơ sở dữ liệu đó được nối vào trong một hyperspace đơn tương đối lớn. Một tính năng cần xem xét của các hệ thống này là công việc hàng ngày của nhiều nhân viên cơ quan. Tuỳ theo công việc họ có thể chỉ luôn sử dụng một phần nào đó của hyperspace, và tuỳ theo mục tiêu công việc hiện tại họ có thể cần truy cập đến một tập con rất nhỏ của nó. Hầu hết người dùng không bao giờ cần truy cập các phần của hyperspace bên ngoài lĩnh vực của họ. Thêm vào đó, quá nhiều điều hướng một phần nào đó làm sao nhãng họ với công việc chính. Cùng lúc đó, những người dùng của IIS có thể cần sự trợ giúp trong việc tổ chức một truy cập cá nhân thuận tiện hơn với miền làm việc của họ. Lĩnh vực mới cuối cùng là systems for managing personalized views in information spaces, ví dụ như Information Islands [11] và Basar [7]. Nhiều người dùng cần truy cập đến các hyperspace lớn cho công việc hàng ngày. Để bảo vệ chính họ từ sự phức tạp của hyperspace, họ có thể quan tâm đến việc định nghĩa các góc nhìn cá nhân trên toàn bộ hyperspace. Mỗi góc nhìn có thể thoả mãn một trong các mục đích hoặc sở thích liên quan với công việc của người dùng. Tuỳ theo các góc nhìn khác nhau, sự thích nghi cũng xảy ra khác nhau. 14 Nó là quan trọng để nhấn mạnh rằng tất cả sáu lĩnh vực được liệt kê không phải là loại trừ lẫn nhau. Một số trong chúng là tương tự và chia sẻ cùng vấn đề. Đồng thời, sự khác biệt giữa các lĩnh vực láng giềng không phải luôn luôn rõ ràng và một số hệ thống thuộc về nhiều lĩnh vực. 2.2. Thích nghi cái gì Câu hỏi thứ hai được đặt ra khi nói về một kiểu hệ thống thích nghi là: các diện mạo nào của người dùng làm việc với hệ thống có thể cho vào tài khoản khi cung cấp sự thích nghi? Với đặc tính nào – cái có thể khác nhau với những người dùng khác nhau, và có thể khác nhau với cùng người dùng tại các thời điểm khác nhau - hệ thống có thể thích nghi? Nói chung, có nhiều đặc tính liên quan đến ngữ cảnh hiện tại của công việc người dùng mà có thể cho vào tài khoản. Nhưng để phục vụ cho việc thích nghi, năm đặc tính được sử dụng bởi các hệ thống AH đang tồn tại là: mục tiêu, kiến thức, nền tảng, kinh nghiệm, và sở thích. 2.2.1. Kiến thức Kiến thức của người dùng về một chủ đề được miêu tả trong hyperspace là đặc tính quan trọng nhất của người dùng cho các hệ thống AH. Nó được sử dụng bởi khoảng một phần ba các kỹ thuật thích nghi. Hầu hết tất cả các kỹ thuật thích nghi dựa trên kiến thức của người dùng như là một nguồn của sự thích nghi. Kiến thức người dùng là một biến cho một người dùng nào đó. Điều này có nghĩa là một hệ thống AH mà dựa trên kiến thức người dùng cần phải nhận ra sự thay đổi trong trạng thái kiến thức người dùng và cập nhật mô hình người dùng tương ứng. Kiến thức người dùng của một chủ đề thông thường nhất được diễn tả bằng một mô hình phủ. Ý tưởng của mô hình phủ là trình bày một kiến thức người dùng cá thể của chủ đề như một “phủ” của mô hình khái niệm. Với mỗi khái niệm mô hình khái niệm, một mô hình phủ cá thể chứa một vài giá trị mà là đánh giá của cấp độ kiến thức người dùng. Nó có thể chỉ là một giá trị nhị phân (biết – không biết), một độ đo chất lượng (good – average – poor), hoặc một độ đo số lượng, như một xác suất người dùng biết khái niệm. Một mô hình phủ của kiến thức người dùng có thể được miêu tả như một tập các cặp “khái niệm – giá trị”, một cặp cho mỗi khái niệm miền. 15 Đôi khi một mô hình người dùng khuôn mẫu đơn giản hơn được sử dụng để miêu tả kiến thức người dùng. Một mô hình người dùng khuôn mẫu phân biệt một số người dùng điển hình (hay “khuôn mẫu”). Hệ thống có thể có một tập các khuôn mẫu có thể. Một người dùng nào đó sẽ chỉ định vào một trong các khuôn mẫu sẵn có. Một mô hình người dùng khuôn mẫu cũng có thể được trình bày như một tập các cặp “khuôn mẫu – giá trị”, trong đó giá trị có thể không chỉ là “true” hoặc “false” (nghĩa là người dùng thuộc hoặc không thuộc vào khuôn mẫu), mà còn các một số các giá trị xác suất (miêu tả xác suất người dùng thuộc vào khuôn mẫu). Mô hình khuôn mẫu đơn giản hơn và không mạnh bằng mô hình phủ nhưng nó cũng tổng quát hơn và dễ hơn nhiều để khởi tạo và bảo trì. 2.2.2. Mục tiêu Mục tiêu người dùng hoặc công việc người dùng là một đặc tính liên quan đến ngữ cảnh của công việc người dùng trong siêu phương. Phụ thuộc vào kiểu của hệ thống, nó có thể là mục tiêu của công việc (trong các hệ thống ứng dụng), một mục tiêu tìm kiếm (trong các hệ thống thu nhận thông tin), và một giải quyết vấn đề hoặc mục tiêu học (trong các hệ thống giáo dục). Trong tất cả các trường hợp, mục tiêu là câu trả lời cho câu hỏi “Tại sao người dùng sử dụng hệ thống siêu phương tiện và người dùng thực sự muốn đạt được cái gì?” Mục tiêu người dùng là đặc tính hay thay đổi nhất: thông thường luôn luôn thay đồi từ phần này đến phần khác và thường thay đổi một vài lần trong một phần. Trong một số hệ thống, có khi cần thiết để phân biệt mục tiêu cấp độ thấp (cái mà có thể thay đổi khá thường xuyên) với mục tiêu cấp độ cao (cái mà ổn định hơn). Ví dụ, trong các hệ thống giáo dục, mục tiêu học là một mục tiêu cấp độ cao, trong khi mục tiêu giải quyết vấn đề là mục tiêu cấp độ thấp: nó thay đổi từ vấn đề này đến vấn đề khác một vài lần trong một phần. Mục tiêu người dùng có thể được xem là một đặc tính rất quan trọng của người dùng với các hệ thống AH. Gần như một phần ba của các kỹ thuật thích nghi dựa vào nó. Để mô tả mục tiêu hiện tại người dùng, mỗi hệ thống hỗ trợ một tập các khả năng mục tiêu mà nó có thể nhận ra. Người dùng hiện tại có thể có hoặc không đối với từng cái trong tập mục tiêu. Trong một vài trường hợp, tập các mục tiêu là khá nhỏ và các mục tiêu không liên quan đến nhau. 16 2.2.3. Nền tảng và kinh nghiệm Hai đặc trưng của người dùng mà tương tự với kiến thức người dùng của chủ đề nhưng khác chức năng là nền tảng và kinh nghiệm của người dùng. Với nền tảng người dùng chúng ta ám chỉ tất cả các thông tin liên quan đến kinh nghiệm trước đó của người dùng bên ngoài chủ đề của hệ thống thích nghi. Điều này bao gồm nghề nghiệp, kinh nghiệm làm việc trong các lĩnh vực liên quan, cũng như quan điểm của người dùng. Với kinh nghiệm người dùng trong hyperspace đã cho, chúng ta ám chỉ người dùng quen thuộc với cấu trúc của hyperspace bao nhiêu và người dùng có thể điều hướng dễ dàng bao nhiêu. Người dùng có thể khá quen thuộc với cấu trúc của hyperspace mà không có kiến thức sâu về chủ đề. Các đặc tính cá thể đó của một người dùng như là nền tảng và kinh nghiệm thường được mô hình bằng mô hình người dùng khuôn mẫu. Khuôn mẫu có thể là một khuôn mẫu kinh nghiệm, hoặc một khuôn mẫu nền tảng cho các mặt như nghề nghiệp, triển vọng, hoặc ngôn ngữ gốc. 2.2.4. Sở thích Cuối cùng, nhưng không phải là đặc trưng kém quan trọng nhất là sở thích của người dùng. Do nhiều lý do khác nhau, người dùng có thể thích một số node và liên kết hơn các cái khác và phần nào đó của một trang hơn các phần còn lại. Những sở thích này có thể là tuyệt đối hoặc tương đối. Ví dụ, nó có thể phụ thuộc vào node hiện tại, mục tiêu, và ngữ cảnh nói chung. Sở thích của người dùng khác với các thành phần mô hình người dùng khác theo nhiều cách. Không giống các thành phần khác, sở thích không thể được suy luận từ hệ thống. Người dùng cần phải thông báo với hệ thống trực tiếp hoặc gián tiếp (bằng một feedback đơn giản) về các sở thích đó. Điều này giống với tính thích nghi hơn là sự thích nghi. Các hệ thống AH có thể tổng quát sở thích người dùng và áp dụng nó cho sự thích nghi trong các ngữ cảnh mới. Một đặc trưng khác của mô hình sở thích là cách mô tả. Trong khi các phần khác của mô hình người dùng thường được mô tả một hoặc một tập các giá trị số, sở thích không thể mô tả như thế được. 17 2.3. Cái gì có thể được thích nghi trong AH Một câu hỏi quan trọng khi nói về bất cứ kiểu hệ thống thích nghi nào là: cái gì có thể được thích nghi trong hệ thống này? Tính năng nào của hệ thống có thể khác biệt với những người dùng khác nhau? Trong AH, hyperspace thích nghi khá giới hạn: có không quá nhiều tính năng mà có thể biến đổi. Tổng quát hoá, siêu phương tiện bao gồm một tập các node hoặc siêu tài liệu (để cho ngắn gọn chúng ta sẽ gọi chúng là “các trang”) kết nối bằng các liên kết. Mỗi trang bao gồm một số thông tin cục bộ và một bản đồ toàn thể mà cung cấp liên kết đến tất cả các trang có thể truy cập khác. Cái có thể được thích nghi trong AH là nội dung của các trang bình thường (sự thích nghi cấp độ nội dung) và các liên kết từ các trang bình thường, trang chỉ mục, và các bản đồ (sự thích nghi cấp độ liên kết). Chúng ta phân biệt cấp độ nội dung và cấp độ liên kết như là hai lớp của sự thích nghi, và gọi cái thứ nhất là thích nghi trình bày, cái thứ hai là thích nghi trợ giúp điều hướng. 2.3.1. Thích nghi trình bày Ý tưởng của các kỹ thuật thích nghi trình bày khác nhau là thích nghi nội dung của một trang được truy cập bởi một người dùng đặc biệt với kiến thức hiện tại, mục tiêu, và các tính chất khác của người dùng. Ví dụ, một người dùng thành thạo có thể được cung cấp thông tin chi tiết và sâu hơn, trong khi một người chưa có kinh nghiệm có thể nhận thêm các giải thích. Trong các hệ thống thích nghi, nội dung của một trang bình thường có thể chỉ là một văn bản nhưng cũng có thể là một tập các mục đa phương tiện khác nhau. Từ quan điểm này, chúng ta có thể phân biệt thích nghi văn bản và thích nghi đa phương tiện. Tuy nhiên, tại thời điểm hiện tại, tất cả các công việc trong thích nghi trình bày thực sự là thích nghi văn bản. Một số hệ thống đang tồn tại chứa các mục không phải văn bản, nhưng chưa thể trình bày các mục này một cách thích nghi. Thích nghi văn bản được nghiên cứu nhiều nhất trong thích nghi siêu phương tiện. Hầu hết các phần của thích nghi siêu phương tiện giai đoạn đầu tập trung xung quanh thích nghi trình bày văn bản [1, 2, 4]. 18 2.3.2. Thích nghi trợ giúp điều hướng Ý tưởng của các kỹ thuật thích nghi trợ giúp điều hướng khác nhau là giúp người dùng tìm đường đi của họ trong hyperspace bằng cách thích nghi cách trình bày các liên kết với kiến thức, mục tiêu, và các tính chất khác của một người dùng cá thể. Mặc dù miền nghiên cứu này còn rất mới, một số kỹ thuật thú vị đã được giới thiệu và thực thi. Các kỹ thuật này có thể được phân lớp vào năm nhóm theo cách chúng sử dụng trình bày thích nghi của các liên kết. Đó là: chỉ dẫn trực tiếp, thứ tự, ẩn, chú thích, và ánh xạ. Chỉ dẫn trực tiếp là kỹ thuật đơn giản nhất của hỗ trợ điều hướng thích nghi. Chỉ dẫn trực tiếp có thể được áp dụng trong bất cứ hệ thống nào mà có thể quyết định node tốt nhất tiếp theo cho người dùng. Để cung cấp chỉ dẫn trực tiếp, hệ thống có thể nhấn mạnh trình bày của đường dẫn tốt nhất, hoặc cung cấp một liên kết động (thường được gọi "Next") tới node tốt nhất. Cách đầu tiên rõ ràng hơn, trong khi cách sau thì mềm dẻo hơn, bởi vì nó có thể giới thiệu node mà không được kết nối trực tiếp với node hiện tại (và không được trình bày trong trang hiện tại). Chỉ dẫn trực tiếp rõ ràng và dễ dàng để thực thi. Vấn đề với chỉ dẫn trực tiếp là nó cung cấp hỗ trợ giới hạn: “theo tôi hoặc không trợ giúp!”. Chỉ dẫn trực tiếp ít khi là trợ giúp điều hướng chính vì nó không hỗ trợ những người dùng mà không muốn theo sự giới thiệu của hệ thống. Chỉ dẫn trực tiếp hữu ích nhưng nó cần được sử dụng với một kỹ thuật “hỗ trợ nhiều hơn”. Ý tưởng của kỹ thuật thứ tự thích nghi là sắp xếp tất cả các liên kết của một trang theo mô hình người dùng và tiêu chuẩn người dùng nào đó: càng gần đỉnh thì liên kết càng thích hợp. Thứ tự thích nghi có sự áp dụng hạn chế: nó có thể được sử dụng với các liên kết không văn bản, nhưng nó hiếm khi được sử dụng cho các trang chỉ mục và nội dung và có thể không bao giờ được sử dụng với các liên kết ngữ cảnh và bản đồ. Vấn đề với thứ tự thích nghi là kỹ thuật này làm thứ tự của các liên kết không ổn định: nó có thể thay đổi mỗi lần người dùng vào trang. Cùng lúc đó, một vài nghiên cứu gần đây chỉ ra rằng thứ tự ổn định của các tuỳ chọn trong các menu là quan trọng với những người chưa có kinh nghiệm. Tuy nhiên, kỹ thuật này có vẻ hữu ích cho các ứng dụng thu hồi thông tin. Các nghiên cứu thực hành chỉ ra rằng thứ tự thích nghi có thể giảm đáng kể thời gian điều hướng trong các ứng dụng thu hồi thông tin nơi mà mỗi trang có thể có nhiều các liên kết. 19 Ẩn là kỹ thuật được sử dụng thường xuyên nhất hiện tại cho hỗ trợ điều hướng thích nghi. Ý tưởng của kỹ thuật hỗ trợ điều hướng ẩn là hạn chế không gian điều hướng bằng cách ẩn các liên kết đến các trang “không thích hợp”. Trang có thể được coi là không thích hợp vì một số lý do: nếu nó không liên quan đến mục tiêu hiện tại của người dùng, hoặc nếu nó trình bày nội dung mà người dùng chưa chuẩn bị sẵn sàng để hiểu. Từ góc nhìn này, ẩn có vẻ như là kỹ thuật hiển nhiên nhất và dễ dàng thực thi nhất. Nó ngăn người dùng từ sự phức tạp của hyperspace không giới hạn và giảm đáng kể sự quá tải. Ẩn có sự ứng dụng rộng rãi: nó có thể được sử dụng với tất cả các loại liên kết phi ngữ cảnh, chỉ mục, và bản đồ bằng cách thực sự ẩn các node hoặc các mục menu, và ẩn các liên kết ngữ cảnh bằng cách chuyển các “hot words” có thể click được sang chữ thường. Ẩn cũng trong sáng hơn với người dùng và trông “ổn định” hơn so với thứ tự thích nghi. Ý tưởng của kỹ thuật chú thích thích nghi là thêm vào các liên kết dạng chú thích nào đó mà có thể nói cho người dùng nhiều hơn về trạng thái hiện tại của node. Các chú thích này có thể được cung cấp trong form văn bản hoặc sự gợi ý hình ảnh, ví dụ sử dụng các biểu tượng, màu sắc, hoặc cỡ chữ khác nhau. Chú thích liên kết được xem là một kỹ thuật hiệu quả của hỗ trợ điều hướng. Kiểu điển hình của chú thích là chú thích tĩnh (độc lập người dùng). Hỗ trợ điều hướng thích nghi có thể cung cấp các chú thích động. Kỹ thuật chú thích thường mạnh hơn kỹ thuật ẩn: ẩn chỉ có thể phân biệt hai trạng thái của node (phù hợp và không phù hợp), trong khi chú thích có thể phân biệt nhiều trạng thái. Kỹ thuật ánh xạ thích nghi kết hợp các cách khác nhau của thích nghi bản đồ toàn cục và cục bộ được trình bày cho người dùng. Các kỹ thuật như chỉ dẫn trực tiếp, ẩn, và chú thích cũng có thể được sử dụng để thích nghi ánh xạ, nhưng tất cả các kỹ thuật này không thay đổi dạng hoặc cấu trúc của ánh xạ. Nghiên cứu tương tác người - máy đưa ra một số kỹ thuật để thích nghi cấu trúc và dạng của một số kiểu mạng, bao gồm ánh xạ siêu phương tiện. Tuy nhiên, hầu hết các ý tưởng vẫn chưa được áp dụng trong các hệ thống thích nghi siêu phương tiện. Chỉ dẫn trực tiếp, thứ tự, ẩn, chú thích, và ánh xạ là các kỹ thuật thích nghi chính cho hỗ trợ điều hướng. Các kỹ thuật không mâu thuẫn nhau và có thể được sử dụng kết hợp. 20 3. Mô hình hệ thống học thích nghi ACGS [10] Hệ thống học thích nghi siêu phương tiện được phát triển với mục đích thay thế cách học truyền thống. Theo cách học truyền thống, người học được đề nghị, hoặc thậm chí bị bắt buộc theo một khung chương trình và nội dung có sẵn. Trái lại, hệ thống học thích nghi cho phép mỗi người học có một cách học riêng, tuỳ theo mục đích, khả năng, nhu cầu, sở thích, kiến thức về môn học. Nói cách khác, cách học “thích nghi” với người học. Hệ thống học thích nghi có lẽ là không phổ biến ở Việt Nam (theo kinh nghiệm của người viết). Tuy nhiên, có nhiều hệ thống thích nghi khác mà có thể bạn đã dùng nhưng không để ý đến. Ví dụ khi bạn đăng kí một tài khoản trên trang youtube.com, hệ thống sẽ theo dõi các hành động của bạn, xem bạn tìm kiếm cái gì và xem cái gì. Sau đó, nó sẽ có mục giới thiệu các video mà phù hợp với sở thích của bạn. Các video giới thiệu này là khác nhau tuỳ từng người dùng. Khoá luận chỉ tập trung vào vấn đề căn cứ vào kiến thức. Vấn đề ở đây là làm sao chúng ta có thể đánh giá được kiến thức của người dùng. Nếu chúng ta chỉ cho tương ứng mỗi khái niệm với một bài kiểm tra và dựa vào kết quả kiểm tra để đánh giá thì thật bình thường. Chúng ta có thể thấy rằng các khái niệm thường liên quan ảnh hưởng đến nhau. Ví dụ trong khoá học về SQL, để hiểu được khái niệm “bảng”, chúng ta phải hiểu khái niệm “thực thể” và “thuộc tính”. Do đó nếu người dùng đã hiểu được khái niệm “bảng”, nhiều khả năng ngươi đó cũng đã hiểu về “thực thể” và “thuộc tính”; và ngược lại, nếu người dùng không hiểu được khái niệm “thực thể” hay “thuộc tính”, rất có thể người đó chưa nắm rõ về khái niệm “bảng”. Để có thể mô hình được những mối quan hệ này, chúng ta sử dụng mạng Bayes. Đầu tiên, chúng ta sẽ tìm hiểu các cấu trúc biểu diễn được sử dụng bởi hệ thống sinh khoá học thích nghi (ACGS – Adaptive Course Generation System). Tiếp theo, chúng ta cũng tìm hiểu cách phát triển mô hình học mạng Bayes để quản lý sự phủ mô hình kiến thức. Cuối cùng, chúng ta sẽ đi vào chi tiết tiến trình thích nghi của hệ thống. Chương này được trình bày dựa trên các kết quả của bài báo [9] đưa ra năm 2008. 3.1. Các cấu trúc biểu diễn Hệ thống sử dụng các cấu trúc biểu diễn sau: 21  Mô hình người học  Mô hình khái niệm  Mô hình phủ  Mô hình công việc 3.1.1. Mô hình người học Mô hình người học mà biểu diễn các thông tin cần thiết về mỗi người học là thành phần không thể thiếu của hệ thống siêu phương tiện thích nghi nói chung và hệ thống học thích nghi nói riêng. Hệ thống sử dụng mô hình người học để theo dõi lịch sử trạng thái của người học về các công việc và các sự thực hiện tương ứng. Điều này là nhân tố quan trọng đối với sự lựa chọn thích nghi các công việc học tiếp theo để giới thiệu với người học. Trong mô hình người học, chúng ta biểu diễn các thông tin như kiến thức, nền tảng, mục đích học, sở thích, vv... của từng người học mà có ích để thích nghi. Không có mô hình người học, một hệ thống không thể thích nghi với người học. Để tạo và cập nhật mô hình học, hệ thống thu thập dữ liệu từ nhiều nguồn khác nhau mà bao gồm đầu vào người học yêu cầu cũng như tương tác của người học được hệ thống quan sát. Cho đến giờ, có nhiều tiếp cận để phát triển mô hình người học có thể kể tên: mô hình người học dựa vào chủ đề, mô hình người học dựa vào khái niệm, mô hình khái niệm tổng quát hoá, mô hình bao phủ tổng quát hoá. Mỗi tiếp cận nhằm tập trung vào một hoặc nhiều tính năng hữu ích của thông tin người học và nó có một số điểm mạnh cũng như điểm yếu. Ví dụ, mô hình người học dựa vào chủ đề dễ dàng cho người học và giáo viên để nắm được, để đánh chỉ mục nội dung và xoá giao diện trình bày nhưng mô hình học của tiếp cận này quá to cũng như sự chính xác của mô hình là thấp. Cách để xây dựng và quản lý mô hình người học để tiến trình thích nghi hiệu quả là một câu hỏi thử thách cho các nhà nghiên cứu. Mô hình người học cần dữ liệu lưu để đánh giá cấp độ kiến thức người học về khái niệm, cái mà là một phần của mô hình khái niệm. 3.1.2. Mô hình khái niệm Mô hình khái niệm là một mô hình đối tượng của miền vấn đề, là một tập các thành phần về miền giáo dục, mỗi thành phần là lớp đối tượng miền và mối quan hệ giữa chúng. Mô hình khái niệm phân tách kiến thức của môn học thành các phần như: chủ đề, chủ đề 22 con, khái niệm nguyên tử. Phụ thuộc vào miền, chiến lược thiết kế, có nhiều kiểu của cấu trúc mô hình khái niệm: mô hình vectơ, mô hình mạng, và bản thể học, vv. Hãy xem [3] để biết thêm các kiểu của nó, ở đây chúng ta chỉ tập trung vào mô hình mạng, cái mà được sử dụng để xây dựng mô hình khái niệm của ACGS. Trong mô hình mạng, có một số kiểu của liên kết để biểu diễn các kiểu quan hệ khác nhau giữa các khái niệm. Sự kết hợp và mối quan hệ phụ thuộc một phần là các kiểu phổ biến của liên kết mà được sử dụng trong nhiều hệ thống. Trong cái đầu, thành thạo các chủ đề con dẫn đến thành thạo chủ đề cha. Trong cái sau, thành thạo chủ đề cha dẫn đến thành thạo các chủ đề con. 3.1.3. Mô hình kiến thức phủ Trong mô hình phủ, chúng ta giả sử kiến thức của sinh viên là một tập con của kiến thức toàn bộ hệ thống của môn học. Khi sinh viên học, tập con tăng lên, và công việc của hệ thống là theo dõi bước tiến của tập con. Điều luật của mô hình phủ người học là với mỗi khái niệm của mô hình khái niệm, mô hình kiến thức người dùng cá thể lưu giữ dữ liệu biểu diễn giá trị đánh giá cấp độ kiến thức của người học về khái niệm này. Sự đánh giá này có thể là các giá trị cụ thể định lượng để biểu diễn cấp độ của kiến thức người học, hoặc các giá trị xác suất sử dụng kiểu quản lý không chắc chắn như lôgic mờ hoặc mạng Bayes để quản lý kiến thức người học. Do đó, trong thực hành, mô hình phủ của người học cá thể được lưu như là một tập của các cặp tên-giá trị trong đó tên biểu thị khái niệm thuộc mô hình khái niệm, giá trị biểu thị cấp độ kiến thức. 3.1.4. Mô hình công việc Một công việc đề cập đến một tập các hoạt động dính liền với nhau mà được thực hiện để đặt được mục tiêu cho trước. Kỹ thuật tách có tôn ty và đệ quy một vấn đề thành các vấn đề con là một trong những đặc tính cơ bản của mô hình công việc có tôn ty. Mô hình công việc lưu các kết quả của tiến trình phân tích công việc, cái mà không chỉ sử dụng để tìm ra một số điều về hoạt động mà còn sử dụng để thành lập các yêu cầu cho huấn luyện và cho tài liệu người dùng. Mô hình công việc là được sử dụng cho các công việc sau:  Làm tài liệu kết quả của một thiết kế công việc cho các hoạt động được đề nghị. 23  Hỗ trợ lựa chọn cá nhân.  Nhận biết yêu cầu cho huấn luyện. Trong mô hình công việc này, chúng ta định nghĩa hai kiểu công việc: công việc trừu tượng hay phương thức, và công việc cơ sở hay công việc hoạt động. Một công việc trừu tượng biểu diễn một hoạt động cấp cao được biết như là mục tiêu học cái mà được kết hợp bởi các công việc phụ. Trong khi đó, công việc cơ sở là công việc nguyên tử mà có thể đạt được bằng một thủ tục đơn giản, thực tế nó có vẻ là các hoạt động học mà người học cần nắm được để đạt được mục tiêu. Do đó, một công việc trừu tượng có thể được chia ra một cách đệ quy thành các công việc phụ cho đến khi có các công việc hoạt động. Biểu đồ công việc là một mô hình công việc có tôn ty [8] bao gồm một số công việc học và công việc học phụ mà là các hoạt động cụ thể để dạy người học cách nắm được chủ đề. Công việc học này có thể xảy ra thứ tự hoặc song song. Ví dụ, trích dẫn của biểu đồ công việc cho khoá học thiết kế cơ sở dữ liệu được minh hoạ trong hình sau, công việc trừu tượng “Thiết kế biểu đồ quan hệ thực thể” bao gồm ba phương thức: xác định thực thể, định nghĩa các thuộc tính của thực thể, và xác định mối quan hệ giữa các thực thể. Có một số công việc hoạt động để đạt được một phương thức. Ví dụ để đạt được phương thức “Xác định mối quan hệ giữa các thực thể” có bốn công việc cơ sở là:  Nêu bật các động từ mô tả mối quan hệ giữa các thực thể.  Mô tả ngắn gọn liên kết mối quan hệ.  Xác định số lượng tham gia mối quan hệ của mỗi thực thể.  Xác định mối quan hệ là sự tham gia hay tuỳ chọn. 24 Hình 1. Biểu đồ công việc với các phương thức để nắm được chủ đề và công việc hoạt động học cho khoá học thiết kế cơ sở dữ liệu [9]. 3.1.5. Mô hình miền khoá học Để có thể nắm được một khái niệm, người học cần làm một số công việc có liên quan. Mặt khác để kết thúc công việc học, người học cũng cần nắm được một số khái niệm tương ứng. Mô hình miền khoá học là sự kết hợp giữa mô hình khái niệm và mô hình công việc. Miền khoá học được trình bày như là một đồ thị có hướng không chu trình với một số node và cạnh kết nối giữa chúng. Node biểu diễn một đối tượng nguyên tử (có thể là khái niệm hay công việc) trong khi cạnh biểu diễn mối quan hệ tiên quyết giữa các đối tượng. Một cách rõ ràng, để làm được công việc, các khái niệm này của công việc cũng cần nắm được. Hình sau mô tả một phần đồ thị cho công việc “làm thế nào để chuẩn hoá dạng chuẩn 3 cho một bảng?”, với một số khái niệm như: chuẩn hóa, bảo toàn dữ liệu, 25 dạng chuẩn 1,… Ví dụ, để có thể chuẩn hoá được dạng chuẩn 2, dạng chuẩn 1 và phụ thuộc một phần khoá là các khái niệm tiên quyết mà người học cần biết. N o r m a l iz a t io n D a t a in t e g r i t y D a t a r e d u n d a n c y In t e g r i t y c o n s t r a in t s F u n c t i o n a l d e p e n d a n c ie s R e f e r e n t ia l in t e g r i t y E n t i t y in te g r i t y E n t i t y A t r ib u t ie s V a lu e s K e y s P r im a r y K e y s F o r e ig n K e y s F i r s t N o r m a l F o r m R e la t io n s h ip s d e c o m p o s e t h e r e la t i o n S e c o n d N o r m a l F o r m p a r t i a l k e y f u n c t io n a l d e p e n d e n c ie s t r a n s i t i v e f u n c t io n a l d e p e n d e n c ie s T h i r d N o r m a l F o r m C o m p o u n d k e y T a b le F ie ld R e c o r d s C o n s t r a in ts Q u e r y Hình 2. Một phần đồ thị khái niệm trong mô hình miền khoá học [9]. Nếu người học nắm được tất cả các khái niệm này, không đảm bảo anh/chị ấy đã biết cách để chuẩn hoá dạng chuẩn 2. Điều này hoàn toàn có thể xảy ra bởi vì người học có thể nắm được tất cả các khái niệm nhưng không thể sử dụng nó để làm được công việc. 26 3.2. Mô hình mạng Bayes 3.2.1. Giới thiệu chung về mạng Bayes Phần này sẽ chỉ giới thiệu về mạng Bayes một cách ngắn gọn. Kiến thức về mạng Bayes có thể xem thêm trong môn học trí tuệ nhân tạo. Một mạng Bayes là một đồ thị có hướng mà các node của nó biểu thị các biến không chắc chắn và các cạnh của nó là các liên kết nguyên nhân hay kết quả giữa các biến. Kết hợp với mỗi node là một bảng xác suất node (NPT – Node Probability Table). Đây là một tập của các giá trị xác suất có điều kiện mà mô hình quan hệ không chắc chắn giữa các node và cha của nó cùng với bất cứ sự không chắc chắn nào mà biểu thị mối quan hệ đó. Nếu node A có các node cha là B và C thì NPT cho node A biểu thị xác suất p(A | B, C) cho tất cả các sự kết hợp có thể của A, B, và C. Nếu A có x trạng thái, B có y trạng thái, và C có z trạng thái thì NPT sẽ có xyz ô. Giả sử Xi (i = 1..n) là các biến của mạng và pa(Xi) biểu diễn tập các cha của Xi. Khi đó ta có p(X1, X2,…, Xn) = ∏ p(Xi | pa(Xi)). Để định nghĩa một mạng Bayes, có một số công việc cần được chỉ định:  Xác định tập các biến.  Xác định tập các liên kết giữa các biến và mạng như là đồ thị có hướng không có chu trình.  Đưa ra bảng xác suất cho mỗi node. 3.2.2. Sử dụng mạng Bayes trong hoạt động thích nghi Sử dụng mạng Bayes để quản lý nhân tố không chắc chắn trong mô hình phủ là một tiếp cận tốt. Chúng ta cũng miêu tả một thực thi của mô hình này với một khoá học chủ đề: “Cách thiết kế cơ sở dữ liệu quan hệ?”. Chúng ta thấy, các khái niệm học có quan hệ với nhau. Ví dụ trong khoá học SQL, để hiểu về khái niệm Query chúng ta cần hiểu khái niệm Table, và để hiểu khái niệm Table chúng ta lại cần hiểu về khái niệm Entity. Mỗi khái niệm là một phần cơ bản của khoá học, tương ứng với một liên kết. Các khái niệm có quan hệ cha-con. Để biết về khái niệm cha cần phải biết về khái niệm con. Chúng ta dùng mạng Bayes để tính xác suất mà 27 người học nắm được với từng khái niệm, để từ đó đưa ra khung chương trình học phù hợp. Để phát triển mô hình người học mạng Bayes, chúng ta cần chỉ định một tập các biến để đo kiến thức của người học với ba trạng thái: chưa đạt (not acquired), đang học (in progress), đạt (acquired). P(not-acquired(C)) mô tả giá trị xác suất của trạng thái not- acquired cho khái niệm C, p(in-progress(C)) mô tả giá trị xác suất của trạng thái in- progresss cho khái niệm C, và p(acquired(C)) mô tả giá trị xác suất của trạng thái acquired cho khái niệm C. Ta có: p(not-acquired(C)) + p(in-progress(C)) + p(acquired(C)) = 1. Ví dụ, với người học, đo kiến thức về khái niệm “Thực thể” có thể có các giá trị như: p(not-acquired(C)) = 0.8, p(in-progress(C)) = 0.1, p(acquired(C)) = 0.1. Mô hình người học bao gồm một tập của các biến cho mỗi khái niệm. Với n khái niệm, mô hình người học cần 3*n biến để mô tả ba trạng thái của kiến thức người học. Mô hình ACGS chỉ mô hình mối quan hệ tiên quyết giữa các khái niệm cái mà quan trọng cho cả mục tiêu lập kế hoạch hướng dẫn và cho việc thu thập thông tin về trạng thái hiện tại của kiến thức người học. Nó có vẻ rõ ràng rằng nếu A là tiên quyết của B, nắm được A phải gây ra ảnh hưởng cho việc nắm được B, do đó:  Nếu A chưa nắm được, có vẻ như B cũng chưa nắm được.  Nếu B đã nắm được, có vẻ như A cũng đã nắm được. Trong trường hợp nếu A đã nắm được, p(acquired(B) | acquired(A)) là giá trị xác suất để đánh giá kiến thức người học về khái niệm B dựa trên khái niệm A. Ví dụ, p(acquired(B) | acquired(A)) = 0.75 có nghĩa là một người học nếu đã nắm được A thì rất có thể cũng nắm được B. Ví dụ, với mô hình khái niệm miền được cho trong hình sau, nếu p(acquired (First normal form)) = 0.2, và p(acquired (Transitive functional dependences)) = 0.1, thì p(acquired (Second normal form) | acquired (First normal form), acquired(Transitive functional dependences)) = 0.15. Trong hình sử dụng công cụ Netica để đánh giá các giá trị xác suất. 28 Hình 3. Công cụ Netica cho việc tính toán các giá trị xác suất của mạng Bayes. Nói chung, nếu C1, C2,…, Cn là các khái niệm tiên quyết của khái niệm C, giá trị để đánh giá một người học đã nắm được khái niệm C hay chưa được tính bằng: p(acquired(C) | acquired(C1), acquired(C2),…, acquired(Cn)) Để thu thập thông tin tương ứng với trạng thái kiến thức người học, chúng ta sử dụng một tập các công việc hoạt động liên quan đến các node khái niệm. Mỗi công việc hoạt động cũng có ba trạng thái: not-finish, in-progress, và finish. Kết quả khi người học làm xong một công việc hoạt động là nhân tố để đánh giá người học đã hoàn thành công việc hay chưa. Ví dụ, trong công việc “xác định các danh từ”, nếu một người học chỉ xác định được 6/10 danh từ trong tài liệu chỉ định, người học đang in-progress của công việc này. Một công việc thường bao gồm một số công việc hoạt động cái mà hoàn thành hay chưa dựa trên giá trị xác suất của chúng. Ví dụ, để đánh giá một người học hoàn thành công việc “xác định các thực thể” dựa trên trạng thái hoàn thành của hai công việc hoạt động: “xác định các danh từ” và “kiểm tra danh từ chung”. Tương tự các biến cho việc đánh giá kiến thức người học, nếu T1, T2,…, Tn là các công việc hoạt động cho công việc trừu tượng T, giá trị để đánh giá công việc T đã hoàn thành hay chưa được tính bằng: p(finish(T) | finish(T1), finish(T2), finish(T3),…, finish(Tn)) 29 3.3. Thích nghi hoạt động học Thích nghi là một tiến trình để chọn các công việc hoạt động cho mỗi người học dựa trên mô hình người học. Người học với trình độ kiến thức khác nhau cần làm công việc khác để kết thúc mục tiêu học. Điều này được kết hợp bằng một số công việc mà bao gồm công việc trừu tượng và công việc hoạt động. Tuỳ theo kỹ thuật điều hướng thích nghi, một hoặc nhiều kỹ thuật được chọn ví dụ như ẩn, chú thích, hoặc trợ giúp trực tiếp để hiển thị khoá học được chọn cho người học hiện tại. Do đó, giả sử T là một công việc, L là một người học, SL là tập trạng thái miêu tả kiến thức và trình độ hiểu biết của L. Tiến trình thích nghi là như sau:  Nếu SL không có một trạng thái cho công việc T, trạng thái tương ứng được thêm vào SL với giá trị: SL.T(not-finish) = 1 (công việc T chưa được làm).  Trong trường hợp SL có một giá trị xác suất cho trạng thái của công việc T, người học cần hoàn thành hay có thể bỏ qua công việc hoạt động T được quyết định bởi giá trị xác suất mà đo kiến thức người học về các công việc T1, T2,…, Tk là các công việc tiên quyết của T. Giá trị này được tính bằng ba công thức, tương ứng cho trạng thái “finish”: p(finish(T) | finish(T1), finish(T2),…, finish(Tk)), và tương ứng cho trạng thái “not-finish”: p(not- finish(T) | not-finish(T1), not-finish(T2),…, finish(Tk)), và “in-progress”: 1 – p(finish(T)) – p(not-finish(T)). Nếu các giá trị xác suất cho trạng thái kết thúc lớn hơn ngưỡng nào đó, người học có thể bỏ qua công việc T. Cuối cùng, các hoạt động của người học tương ứng sẽ được cập nhật trong mô tả của người đó, cái mà là nền tảng cho tiến trình thích nghi trong hoạt động học tiếp theo. 30 4. Cài đặt thử nghiệm Trong phần này, chúng ta sẽ đi thực hiện lần lượt các bước tương tự như khi làm một dự án phần mềm. Đó là: tìm hiểu yêu cầu, phân tích thiết kế, lập trình, và kiểm thử. 4.1. Tìm hiểu yêu cầu Hệ thống ACGS mà chúng ta sẽ xây dựng là một hệ thống dựa trên nền web. Hệ thống có các chức năng như sau:  Đăng nhập hoặc đăng ký. Người học muốn truy cập được vào hệ thống cần có một tài khoản. Khi đăng ký, người học sẽ được hệ thống cung cấp cho một tài khoản chứa tên, mật khẩu, và có thể có các thông tin khác. Khi đăng nhập, hệ thống sẽ kiểm tra tính hợp lệ của tài khoản, và sẽ chuyển tới trang chọn khoá học hoặc đưa ra một thông báo lỗi.  Chọn khoá học. Hệ thống có thể liệt kê nhiều khoá học khác nhau, và người học có thể chọn khoá học mà mình quan tâm. Tuy nhiên, trong giai đoạn thử nghiệm, chúng ta có thể chỉ tạo một khoá học.  Làm bài kiểm tra đánh giá ban đầu. Người học sẽ làm một bài kiểm tra dưới dạng trắc nghiệm. Sau khi người học làm xong (nhấn nút Submit), hệ thống sẽ tính kết quả. Kết quả ở đây không chỉ là người học đã làm đúng bao nhiêu câu trong tổng số bao nhiêu câu, mà còn là người học đã làm đúng bao nhiêu phần trăm của một khái niệm nào đó. Đây chính là các bằng chứng likelihood cho các khái niệm. Căn cứ vào đó, hệ thống sẽ tính ra các giá trị xác suất mà người học nắm được khái niệm cũng như công việc. Khi đó, mô tả trình độ kiến thức của người học được khởi tạo.  Làm các bài tập để xem người học đã nắm được kiến thức hay chưa. Người học sẽ làm các bài tập được giao để hoàn thành một công việc nào đó. Sau khi người dùng làm xong, hệ thống sẽ tính kết quả để xác định bằng chứng likelihood cho các node. Tiếp theo, giá trị xác suất cho toàn bộ các node của mạng được tính lại, và mô tả trình độ kiến thức của người học được cập nhật. 31  Chỉ ra các khái niệm và công việc cần học. Mỗi khái niệm, mỗi công việc đều có một thuộc tính gọi là threshold. Nếu xác suất người học nắm được một mục nào đó mà lớn hơn threshold thì người đó sẽ không cần phải học nữa. Khi đó, hệ thống sẽ có một cách biểu diễn nào đó để thông báo cho người học rằng mục đó đã xong, không cần phải học nữa (ví dụ, chúng ta có thể làm mờ liên kết đến mục cần học). 4.2. Phân tích thiết kế cơ sở dữ liệu Cơ sở dữ liệu có tên là AC. Bảng User để lưu thông tin của người dùng. Do đây chỉ là hệ thống sơ khai nên bảng này chứa khá ít thông tin, chỉ có định danh, tên, và mật khẩu. Bảng User Trường Kiểu dữ liệu Mô tả userid int Định danh của người dùng, tự động tăng dần. Là khoá chính của bảng. username varchar(32) Tên của người dùng. password varchar(32) Mật khẩu của người dùng khi đăng nhập. Bảng tiếp theo là bảng các khoá học (Course). Bảng này gồm có định danh và tên khoá học. Bảng Course Trường Kiểu dữ liệu Mô tả courseid int Định danh của khoá học, tự động tăng dần. Là khoá chính của bảng. coursename varchar(64) Tên của khoá học. 32 Mỗi khoá học có một file mạng Bayes riêng, có tên là .dne trong thư mục net. Các node của mạng có tên N, trong đó được lấy từ bảng Item. Bảng Item Trường Kiểu dữ liệu Mô tả itemid int Định danh của các mục, tự động tăng dần. Là khoá chính của bảng. itemname varchar(64) Tên của mục. content varchar(64) Nội dung của mục. Trong hệ thống xây dựng, giá trị của trường này chứa liên kết đến trang nội dung tương ứng. coursecode int Định danh của khoá học mà mục này thuộc về. Khoá ngoại đến trường courseid của bảng Course. threshold int Ngưỡng của mục. Nếu xác suất người học nắm được mục mà lớn hơn ngưỡng thì người học sẽ không cần học mục này nữa. Giá trị nằm trong đoạn [0, 100]. type int Kiểu của mục, có thể là 0 (khái niệm) hoặc 1 (công việc). Mỗi Item là một mục trong bảng mục lục. Chú ý rằng mỗi khoá học sẽ có một mục lục riêng (TOC - Table Of Contents). Các TOC được chứa ngay trong thư mục gốc của trang web, và có tên tương ứng với số thứ tự của khoá học, đuôi mở rộng là .htm. Trong file TOC, mỗi mục được chứa trong thẻ và một thẻ có định danh là li tương ứng. Thẻ này sẽ có tác dụng khi chúng ta có các cách trình bày khác nhau với các mục có xác suất khác nhau. Bảng Achieve lưu giữ tỉ lệ kiến thức nắm được của người dùng với từng khái niệm. Bảng Achieve 33 Trường Kiểu dữ liệu Mô tả itemcode int Định danh của mục tương ứng. Khoá ngoại đến trường itemid của bảng Item. usercode int Định danh của người học tương ứng. Khoá ngoại đến trường userid của bảng User. ratio int Tỷ lệ mà người học usercode nắm được mục itemcode. Giá trị nằm trong đoạn [0, 100]. Bảng Evidence lưu kết quả các bài kiểm tra, các bài tập tương ứng với các mục. Bảng Evidence Trường Kiểu dữ liệu Mô tả itemcode int Định danh của mục tương ứng. Khoá ngoại đến trường itemid của bảng Item. usercode int Định danh của người học tương ứng. Khoá ngoại đến trường userid của bảng User. ratio int Kết quả mà người học usercode đạt được đối với mục itemcode. Giá trị nằm trong đoạn [0, 100]. Bảng Evidence có cấu trúc giống như bảng Archieve. Tuy nhiên chúng ta cần cả hai bảng này. Hai bảng này thường bị hiểu nhầm là một khi tìm hiểu mạng Bayes. Bảng lưu các câu hỏi kiểm tra tương ứng với từng khái niệm. Hình thức kiểm tra là trắc nghiệm. Bảng Test Trường Kiểu dữ liệu Mô tả testid int Định danh của câu hỏi kiểm tra, tự động tăng. Là 34 khoá của bảng. question varchar(128) Câu hỏi. o1 varchar(32) Lựa chọn thứ nhất. o2 varchar(32) Lựa chọn thứ hai. o3 varchar(32) Lựa chọn thứ ba. o4 varchar(32) Lựa chọn thứ tư. answer int Đáp án đúng. Giá trị là 1, 2, 3, hoặc 4. itemcode int Định danh của mục mà câu hỏi liên quan đến. Khoá ngoại đến trường itemid của bảng Item. 35 Hình 4. Biểu đồ các bảng và mối quan hệ giữa chúng trong cơ sở dữ liệu. 4.3. Môi trường phát triển 4.3.1. Apache Hệ thống được xây dựng trên nền web với ngôn ngữ là PHP, chạy trên web server là Apache. 4.3.2. MySQL Hệ thống sử dụng cơ sở dữ liệu MySQL. 36 4.3.3. Java Các thao tác với mạng Bayes sẽ rất khó thực hiện với ngôn ngữ PHP. Tuy nhiên, công việc sẽ trở nên dễ dàng hơn nếu sử dụng ngôn ngữ Java. 4.3.4. Netica [6] a. Giới thiệu Netica Netica là một chương trình linh hoạt, nhanh, thân thiện mà bạn có thể sử dụng để tìm các mẫu hình trong dữ liệu, tạo các biểu đồ mã hoá kiến thứ hoặc mô tả các vấn đề quyết định, sử dụng những cái này để trả lời truy vấn và tìm quyết định tối ưu, và tạo ra các hệ chuyên gia xác suất. Nó là phù hợp cho các ứng dụng trong các lĩnh vực chuẩn đoán, dự đoán, phân tích quyết định, mô hình xác suất, quản lý rủi ro, xây dựng hệ chuyên gia. Netica được xây dựng và phát triển bởi tập đoàn phần mềm Norsys (Norsys Software Corp.). Netica là hệ thống phát triển mạng Bayes được sử dụng rộng rãi nhất hiện nay. Để thực hiện các thao tác với mạng Bayes, chúng ta sử dụng các API có sẵn được cung cấp bởi Netica. Có thể nói, Netica là trái tim của hệ thống. Không có nó, hệ thống chỉ là các trang PHP bình thường. Nhưng chúng ta có thể tạo mạng Bayes, thực hiện các thao tác trên mạng với Netica. Netica-J là một thư viện đầy đủ của các lớp Java để làm việc với mạng Bayes và đồ thị ảnh hưởng. Nó chứa các hàm để xây dựng, học từ dữ liệu, thay đổi, chuyển đổi, thực hiện kiểm tra, lưu và đọc các mạng. Nó có thể quản lý các “trường hợp” và một tập các trường hợp, và có thể kết nối trực tiếp với hầu hết phần mềm cơ sở dữ liệu. Ở đây, khoá luận không trình bày đầy đủ về các API của Netica mà chỉ những phần được sử dụng trong hệ thống. b. Các thao tác với mạng Bayes của chương trình Nếu chỉ tính riêng các thao tác liên quan đến mạng Bayes thì hệ thống có hai cái sau:  Thao tác đầu tiên là chúng ta cần tạo một mạng Bayes.  Thao tác thứ hai là cho vào các xác suất likelihood, chúng ta cần tính các giá trị xác suất cho tất cả các node trong mạng. c. Sử dụng công cụ Netica trong chương trình 37 Đầu tiên, chúng ta tạo tạo một mạng Bayes với giao diện đồ hoạ của Netica. Bạn không cần phải viết một dòng code nào cả. Các thao tác đều là kéo thả. Khi người dùng thực hiện các bài test sẽ nhận được các kết quả đánh giá. Đó chính là các “bằng chứng” cho mạng Bayes. Công việc đặt ra là cập nhật lại các xác suất cho các node của mạng. Sau đây là một giả mã để thực hiện công việc đó: // Khởi tạo ban đầu. Environ env = new Environ(null); Net net = new Net(new Streamer()); while () { Tìm node tương ứng, giả sử đó là biến n. Node n; Cho các xác suất vào mảng a. float[] a = new float[2]; // Tạo bằng chứng. n.finding().enterLikelihood(a); } // Dịch mạng, cập nhật các xác suất. net.compile(); // Thao tác với các xác suất vừa tính được. NodeList list = net.getNodes(); for (int i = 0; i < list.size(); i++) { Node node = list.getNode(i); float[] a = node.getBeliefs(); // Bạn có thể làm gì đó, ví dụ in ra file hoặc cập nhật cơ sở dữ liệu. } // Kết thúc. 38 env.finalize(); Chú ý rằng hiện tại chúng ta chỉ có thể sử dụng Netica với các ngôn ngữ Java và C, không làm được trên PHP. Tuy nhiên từ file PHP, chúng ta có thể thực hiện thao tác mà được viết bằng Java hoặc C với hàm EXEC. Một chú ý nữa là các bằng chứng ở đây thuộc kiểu likelihood. Trong trường hợp này, chúng ta nhận thông tin không chắc chắn về giá trị của một số node cụ thể. Nó có thể từ một bộ đo không hoàn hảo, hoặc từ một người nào đó người mà không phải luôn luôn đúng. Giả sử chúng ta có một cái cảm biến để đo nhiệt độ, và khi nhiệt độ cao thì nó sẽ bật sáng. Thực tế chúng ta thấy rằng khi nhiệt độ thấp, cảm biến không bao giờ sáng; khi nhiệt độ trung bình nó sáng 10% trong các lần như thế; và khi nhiệt độ cao nó luôn luôn sáng. Nếu trong một thời điểm cụ thể, chúng ta quan sát cảm biến đang sáng, và muốn nhập vào các bằng chứng cho node Temperature, thì chúng ta ta sử dụng bằng chứng likelihood. Một bằng chứng likelihood bao gồm một giá trị xác suất cho mỗi trạng thái của node. Đối với ví dụ của chúng ta, bằng chứng likelihood sẽ là (0, 0.1, 1). Một hiểu nhầm phổ biến là nghĩ rằng bằng chứng likelihood là xác suất của trạng thái được cho bởi quan sát (trong trường hợp đó tổng các giá trị sẽ bằng 1, nhưng tổng các bằng chứng likelihood không yêu cầu bằng 1). 4.4. Cấu trúc và hoạt động của các trang web Các trang web có cùng header và footer, được định nghĩa tương ứng trong các file header.php và footer.php. Cấu trúc các trang php khác là: <? // Content of the page. ?> Trong file header.php, chúng ta sẽ khởi tạo session PHP vì hầu hết các trang đều sử dụng session. Việc khởi tạo cần đặt ở phần đầu tiên của file, đây là yêu cầu của PHP. 39 Trong file header.php, chúng ta cũng khởi tạo bố cục của các trang. Ngoài ra, chúng ta cũng kiểm tra xem người dùng đã đăng nhập chưa. Nếu người dùng đã đăng nhập thì đưa ra lời chào, còn nếu chưa thì đưa ra tuỳ chọn đăng nhập hoặc đăng ký. Trong file footer.php, chúng ta sẽ kết thúc những gì đã khởi tạo trong trang header.php (ví dụ, thêm các thẻ đóng cho các thẻ mở tương ứng ở file header.php) để hoàn tất một trang web hoàn chỉnh. Trang đầu tiên, mặc định là index.php. Trang này chỉ đưa ra một số thông tin giới thiệu về hệ thống. Khi người dùng chọn đăng nhập thì sẽ được đưa đến trang login.php. Còn nếu người dùng chọn đăng ký thì sẽ được đưa đến trang register.php. Khi người dùng đã có đủ thẩm quyền để truy cập hệ thống thì trang tiếp theo sẽ là list.php. Trang này liệt kê các khoá học khác nhau sẵn có trong hệ thống. Sau khi đã vào được hệ thống, người dùng sẽ được đưa tới trang list.php. Trang này liệt kê các khoá học. Sau khi người dùng chọn một khoá học thì sẽ đến trang course.php. Trang này trình bày mục lục của khoá học, các liên kết đến từng mục, liên kết đến trang questionaire.php để làm bài kiểm tra đánh giá kiến thức ban đầu, liên kết đến trang assignment.php để làm các bài tập đánh giá quá trình học. Trang questionaire.php liệt kê các câu hỏi thuộc các khái niệm khác nhau. Dạng kiểm tra là trắc nghiệm. Trang check.php dùng để đánh giá điểm bài kiểm tra và cập nhật lại các giá trị đạt được của người dùng. 4.5. Thử nghiệm 4.5.1. Dữ liệu thử nghiệm Chúng ta sẽ đi xây dựng bộ test cho người học có userid trong cơ sở dữ liệu là một số nào đó, ví dụ . Việc kiểm thử gồm có hai loại: kiểm thử cho bài kiểm tra đánh giá ban đầu và kiểm thử cho việc làm các bài tập. 40 a. Kiểm thử bài kiểm tra đánh giá ban đầu Với mỗi người học, để đánh giá trình độ kiến thức ban đầu, chúng ta có một file bằng chứng có tên là question.txt, và có định dạng như sau: 18:* 10:* 21:55 20:62 23:45 12:42 14:88 15:* 16:* 34:44 39:47 40:* Mỗi dòng là một cặp node-bằng chứng cách nhau bằng dấu hai chấm. Ký tự * có nghĩa là node đó chưa có bằng chứng. Để có thể thử nghiệm hệ thống, chúng ta sẽ đưa ra các bộ test tự động và bằng tay. Tự động có nghĩa là chúng ta sinh ngẫu nhiên các bằng chứng trong file bằng chứng, còn bằng tay có nghĩa là chúng ta tự mình nhập từng bằng chứng vào file bằng chứng. b. Kiểm thử việc làm các bài tập Để tạo bộ test cho việc làm các bài tập, chúng ta cũng có thể tạo một bộ test tương tự như cho việc đánh giá ban đầu. Tuy nhiên, chúng ta cũng có thể thay đổi bộ test một chút. Ví dụ, chúng ta có thể chỉ có một file bằng chứng với các bài tập, nhưng chúng ta không tính các xác suất một lần dựa vào toàn bộ file đó, mà chúng ta sẽ chia thành các giai đoạn. Như vậy sẽ có vẻ giống thực tế hơn: người dùng sẽ làm từng bài assigment một cách tuần tự, và các xác suất sẽ được cập nhật ngay sau mỗi khi người học làm xong. 41 Ví dụ chúng ta có file kiểm thử cho người dùng , có tên là .txt và có dạng như sau: 18:45 10:78 21:55 20:62 23:45 12:42 14:88 34:44 39:47 Mỗi dòng vẫn là các cặp node-bằng chứng. Tuy nhiên, các dòng không liên tục mà có khi cách nhau bởi một dòng trắng. Mỗi dòng trắng thể hiện kết thúc một giai đoạn. Trong file ví dụ trên, việc cập nhật kiến thức của người dùng sẽ được thực hiện bốn lần, sau khi người học làm xong các bài tập tương ứng trong bốn giai đoạn: (18, 10), (21, 20, 23), (12, 14), (34, 39). 4.5.2. Kết quả thử nghiệm Bằng cách sử dụng công cụ Netica, chúng ta sẽ tính được giá trị xác suất của các node trong mạng để đánh giá kiến thức ban đầu của người học, và in ra file output dưới dạng như sau: 1: 85.0 2: 86.75 42 18: 85.56999 3: 79.121666 7: 47.68178 8: 48.145428 9: 50.923615 17: 48.876522 22: 85.0 5: 73.75 4: 85.0 Mỗi dòng ở đây là một cặp node-xác suất cách nhau bằng dấu hai chấm. Giá trị xác suất để đo mức độ kiến thức của người học về node tương ứng. 4.5.3. Đánh giá kết quả Hiện tại, các bảng xác suất có điều kiện cũng như các ngưỡng học đều dựa trên kinh nghiệm. Như vậy, nó có độ chính xác không cao lắm. Với các bộ test, chúng ta có thể điều chỉnh các giá trị này chính xác hơn. 43 Kết luận Trong phần mở đầu, khoá luận đã nêu lên bốn mục tiêu cần đạt được. Sau đây là các kết quả tương ứng. 1. Tìm hiểu về E-learning. Khoá luận đã nêu ra được khái niệm, đặc trưng, lợi ích, lịch sử phát triển, xu thế của E-learning. 2. Tìm hiểu học thích nghi. Khoá luận đã nêu ra khái niệm của học thích nghi, cũng như các phương thức và kỹ thuật thích nghi. Cụ thể, khoá luận đã đưa ra câu trả lời cho các câu hỏi mà người đọc có thể đưa ra đó là: “Thích nghi cái gì?” (kiến thức, mục tiêu, nền tảng, kinh nghiệm, sở thích) và “Cái gì có thể được thích nghi?” (trình bày, trợ giúp điều hướng). 3. Nghiên cứu mô hình ACGS. Khoá luận đã đưa ra các thành phần cơ bản của mô hình, và cách áp dụng của mạng Bayes vào trong mô hình. 4. Phân tích thiết kế và cài đặt thử nghiệm mô hình ACGS. Từng thành phần, từng thao tác của hệ thống được khoá luận trình bày chi tiết, rõ ràng. 44 Tài liệu tham khảo [1] Beaumont. User modeling in the interactive anatomy tutoring system. 1994. User Modeling and User-Adapted Interaction, volume 4, pages 21-45. [2] Boyle & Encarnacion. MetaDoc: an adaptive hypertext documentation. 1994. User Modeling and User-Adapted Interaction, volume 4, pages 1-19. [3] Brusilovsky & Millan. User models for adaptive hypermedia and adaptive educational systems. 2007. Lecture Notes in Computer Science, volume 4321, pages 3-53. [4] Brusilovsky. A framework for intelligent knowledge sequencing and task sequencing. 1992. Lecture Notes In Computer Science, volume 608, pages 499-506. [5] Brusilovsky. Methods and techniques of adaptive hypermedia. 1996. User Modeling and User-Adapted Interaction, volume 6, pages. 87-129. [6] Netica. [7] Thomas C. G. Basar: A framework for integrating agents in the World Wide Web. 1995. Computer, volume 28, pages 84-86. [8] Trichet & Tchounikine. Modeling the knowledge-based components of a learning environment within the task/method paradigm. 1998. Lecture Notes in Computer Science, volume 1452, pages 56-65. [9] Viet Anh Nguyen, Nguyen Viet Ha, Si Dam Ho, Hitoshi Sasaki. Bayesian network student model for adapting learning activity tasks in adaptive course generation system. 2008. Proceeding of Technology Enhanced Learning Conference 2008. [10] Viet Anh Nguyen, Si Dam Ho. ACGS: Adaptive Course Generation System- An efficient approach to build E-learning course. 2006. Proceeding of 6th IEEE International Conference on Computers and Information Tecnology, 2006, p 259- 265, Seoul, Korea. [11] Waterworth J. A. A pattern of island: exploring public information space in a private vehicle. 1996. Lecture Notes in Computer Science, volume 1077, pages 265-278. [12] Wikipedia.

Các file đính kèm theo tài liệu này:

  • pdfLUẬN VĂN- HỆ THỐNG HỌC THÍCH NGHI DỰA TRÊN KIẾN THỨC.pdf
Tài liệu liên quan