Đề tài Thiết kế phần mềm đưa vào và hiển thị chữ Thái Việt Nam

Tài liệu Đề tài Thiết kế phần mềm đưa vào và hiển thị chữ Thái Việt Nam: 1 THIẾT KẾ KỸ THUẬT Phần mềm đưa vào và hiển thị chữ Thái Việt Nam Phan Anh Dũng - Trung tâm Công nghệ phần mềm Huế - Hue CIT Ngô Trung Việt - Viện Công nghệ Thông tin 1. Giới thiệu vấn đề Dân tộc Thái là một dân tộc lớn của Việt Nam, có số lượng người đông trên một triệu người và đã cư trú từ hàng nghìn năm nay trên lãnh thổ Việt Nam. Về mặt ngôn ngữ, tiếng nói thuộc vào họ tiếng Thái, người dân tộc Thái ở Việt Nam nói và hiểu bình thường tiếng Thái Lan. Không những thế, mọi người nói tiếng Thái ở vùng các nước Thái Lan, Việt Nam, Lào, Myanmar, và Nam Trung Quốc đều có thể hiểu được nhau dễ dàng. Tuy nhiên về chữ viết thì có sự khác biệt đáng kể. Dân tộc Thái đã có chữ viết theo hệ chữ Pallava từ lâu đời, có thể từ thế kỉ thứ 10. Nhiều tác phẩm thơ ca, văn học, văn hoá, tâm linh của dân tộc Thái vẫn còn tới ngày nay ghi trong các văn bản cổ và phân tán rải rác trong các bản làng người Thái. Từ năm 1959, chữ Thái Việt Nam đã được nghiên cứu và cải tiến, và...

pdf12 trang | Chia sẻ: hunglv | Lượt xem: 1083 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Đề tài Thiết kế phần mềm đưa vào và hiển thị chữ Thái Việt Nam, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
1 THIẾT KẾ KỸ THUẬT Phần mềm đưa vào và hiển thị chữ Thái Việt Nam Phan Anh Dũng - Trung tâm Công nghệ phần mềm Huế - Hue CIT Ngô Trung Việt - Viện Công nghệ Thông tin 1. Giới thiệu vấn đề Dân tộc Thái là một dân tộc lớn của Việt Nam, có số lượng người đông trên một triệu người và đã cư trú từ hàng nghìn năm nay trên lãnh thổ Việt Nam. Về mặt ngôn ngữ, tiếng nói thuộc vào họ tiếng Thái, người dân tộc Thái ở Việt Nam nói và hiểu bình thường tiếng Thái Lan. Không những thế, mọi người nói tiếng Thái ở vùng các nước Thái Lan, Việt Nam, Lào, Myanmar, và Nam Trung Quốc đều có thể hiểu được nhau dễ dàng. Tuy nhiên về chữ viết thì có sự khác biệt đáng kể. Dân tộc Thái đã có chữ viết theo hệ chữ Pallava từ lâu đời, có thể từ thế kỉ thứ 10. Nhiều tác phẩm thơ ca, văn học, văn hoá, tâm linh của dân tộc Thái vẫn còn tới ngày nay ghi trong các văn bản cổ và phân tán rải rác trong các bản làng người Thái. Từ năm 1959, chữ Thái Việt Nam đã được nghiên cứu và cải tiến, và đã được Bộ giáo dục thông qua năm 1962 xem như chữ Thái Việt Nam thống nhất chính thức. Tuy có sự thống nhất của các loại chữ Thái ở những điểm chung, nhưng với từng khu vực địa lý cũng có những điểm dị biệt nên chữ các dân tộc nói tiếng Thái vẫn khác với chữ Thái Lan hiện đại. Nói riêng, chữ Thái thống nhất của Việt Nam khác với chữ Thái Lan hiện đại, vì có nhiều điểm kiến trúc đã tiếp thu cách thể hiện của chữ quốc ngữ Việt Nam. Những cải tiến chính của chữ Thái thống nhất là như sau: • các dấu thanh trước đây đặt trên nguyên âm thì nay đã chuyển thành một kí hiệu độc lập đứng bên cạnh nguyên âm, • hệ thống các phụ âm được cải tiến và hoàn thiện để phản ánh chính xác hai hệ thống thanh thấp và cao đi kèm với phụ âm. • Các âm tiết được Tiếng Thái Việt Nam hiện đại có 48 phụ âm, 20 nguyên âm, 2 dấu thanh và 4 kí tự đặc biệt và 9 kí hiệu dấu phụ cổ (tuy nhiên một nguyên âm o cũng đồng thời là phụ âm), do đó có tất cả 84 kí tự. Mô tả chi tiết hơn có thể xem các bài viết của Cầm Trọng và Ngô Trung Việt. Để đáp ứng nhu cầu bảo tồn văn hoá Thái cổ và nhu cầu học tập, giảng dạy chữ Thái cho học sinh người dân tộc cũng như việc nghiên cứu của các nhà chuyên môn Thái học, cần phát triển nhiều hệ thống phần mềm xử lí chữ Thái. Trong số những phần mềm cần xây dựng, trước mắt cần gấp rút hoàn chỉnh bộ phông chữ Thái thống nhất và phần mềm “Bàn phím chữ Thái VNTN” cho phép sử dụng máy tính để đánh chữ, in ấn sách báo tài liệu tiếng Thái VN v.v. 2 2. Thiết kế ngoài 2.1 Đặc tả yêu cầu Tình hình trong nước và quốc tế hiện tại đang thuận lợi và chín muồi cho việc triển khai phần mềm xử lí chữ Thái Việt Nam, vì kĩ thuật CNTT cùng với máy vi tính và bàn phím tiếng Anh hiện đã phổ cập trong nước, các chuyên viên lập trình phát triển đông đảo cả số lượng cũng như chất lượng. Chữ Thái Lan đã được phổ cập xử lí trên máy tính ở Thái lan, các ngôn ngữ họ hàng với tiếng Thái như Khmer, Lào cũng đã được đưa vào xử lí trên máy tính. Chữ Thái Việt Nam nằm trong mối tương quan thống nhất với hệ thống chữ Thái quốc tế và các hệ thống chữ cơ bản khác. Do vậy việc xử lí chữ Thái Việt Nam cần được xem xét trong mối quan hệ với chữ Thái Lan, chữ Việt và chữ tiếng Anh. Khâu đầu tiên của việc xử lí cho mọi ngôn ngữ bao giờ cũng là hiển thị và đưa thông tin vào máy tính. Cần thực hiện thiết kế bộ chữ Thái Việt Nam trong môi trường đa ngữ, có tính tới sự hài hoà của chữ Thái Việt Nam trong môi trường bộ kí tự phổ dụng quốc tế Unicode, để chữ Thái Việt Nam có thể tham gia vào việc trao đổi thông tin toàn cầu. Mặt khác, việc đưa chữ Thái Việt Nam vào máy tính cũng phải tính tới khung cảnh hoà trộn của nhiều thứ chữ mà hiện nay người dân tộc Thái phải làm chủ: sự hoà trộn của các văn bản chữ Thái Việt Nam, chữ Việt Nam, chữ tiếng Anh, chữ Thái Lan. Do đó chương trình bàn phím xem như công cụ đưa chữ Thái Việt Nam vào máy tính cũng cần được phân tích và thiết kế một cách đầy đủ. 2.1.1 Các yêu cầu chính đối với bộ phông chữ Thái Việt Nam là: 1. Thể hiện đầy đủ chữ Thái cải tiến thống nhất 2. Thể hiện đầy đủ các chữ Thái cổ, truyền thống 3. Cùng tồn tại với các chữ Việt, chữ Thái, v.v.. 2.1.2 Các yêu cầu chính đối với chương trình bàn phím chữ Thái là 1. Bàn phím chữ Thái cho người sử dụng chữ dân tộc Thái Việt Nam phải có khả năng gõ được cả chữ Thái thống nhất và chữ Thái cổ 2. Thân thiện với người sử dụng, hỗ trợ trực quan tối đa cho người dùng mới làm quen với chữ Thái thống nhất 3. Cho phép gõ được cả chữ Thái Lan khi cần 4. Cho phép khả năng chuyển đổi qua lại giữa các loại bàn phím: Anh (Việt) - Thái Lan - và Thái Việt. 2.2. Kiến trúc bộ font chữ Thái Việt Nam: Font chữ là độc lập với bộ gõ (bàn phím), nhưng cần phải được thiết lập trước để tạo điều kiện hiển thị cho chương trình xử lí bàn phím. Font chữ bao gồm tập hợp các hình chữ và mã số tương ứng của chúng. 3 Hình chữ Thái Việt Nam do Cầm Trọng và các chuyên gia chữ Thái thống nhất xây dựng và vẽ tay, dựa trên công trình thống nhất các chữ dân tộc Thái Việt Nam. Các nguyên tắc tạo từ Thái cũng được nhóm chuyên gia này biên soạn và chuẩn bị. Do chữ Thái VN đang trong quá trình xin đưa vào bộ kí tự chuẩn Unicode quốc tế nên hiện tại việc mã hoá cho chúng được thực hiện trong vùng người dùng tự do định nghĩa ở mặt phẳng mã hoá cơ sở. Cụ thể các chữ Thái Việt Nam được đặt vào các mã F021-F073 của mặt phẳng cơ sở số 0. Tuy nhiên cần chuẩn bị sẵn các giải pháp kỹ thuật để xử lý nếu sau này chữ Thái được đưa vào chuẩn Unicode quốc tế ở khu vực các mặt phẳng cao (thường được gọi là unicode surrogate). Bộ font chữ Thái Việt Nam thống nhất lấy bộ font Unicode tiếng Việt làm nền (tức là chứa luôn cả các kí tự tiếng Anh, tiếng Việt), sau đó bổ sung các hình chữ Thái Việt Nam, và nếu cần có thể bổ sung cả chữ Thái Lan, Khmer. Ngoài các chữ Thái Việt Nam thống nhất cơ bản đã được Bộ GD duyệt, bộ font còn bổ sung các kí tự “cổ” và các dạng viết khác nhau của cùng một con chữ, nhằm phục vụ riêng cho các nhà nghiên cứu chuyên sâu về Thái học. Các chữ bổ sung này được xếp mã nối tiếp liền sau khu vực mã cơ bản. 2.3 Phần mềm bàn phím chữ Thái Việt Nam: Hai khía cạnh cần nghiên cứu và chuẩn bị cho việc làm phần mềm bàn phím chữ thái Việt Nam là thiết kế bố trí bàn phím chữ Thái Viểt Nam và thiết kế chương trình bàn phím Thái Việt Nam. 2.3.1 Bố trí bàn phím chữ Thái Việt Nam Xuất phát từ đặc điểm có chung nguồn gốc và có tính đồng dạng khá cao của các hệ thống chữ Thái Đông Nam Á và cũng để thuận tiện cho việc giao lưu, phát triển quốc tế sau này, bàn phím chữ Thái Việt Nam cần được xây dựng dựa theo thiết kế của bàn phím Thái Lan và Lào đồng thời phải nghiên cứu về sự tương tự giữa các con chữ và cách dùng để có sự điều chỉnh hợp lý. Bố trí bàn phím Thái Việt Nam dựa trên công trình nghiên cứu “Tìm hiểu quan hệ giữa chữ Thái Việt Nam và chữ Thái Lan để xây dựng bàn phím chữ Thái Việt Nam Thông Nhất”của Yukti Mukdawijitra, NCS Viện Việt Nam học và khoa học phát triển. Sau đây là mấy nét lớn: + Đầu tiên phân tích nguồn gốc từng chữ Thái VN để xác định các chữ tương đương trong tiếng Thái Lan hiện đại, và đặt các chữ đó khớp với vị trí các chữ Thái Lan tương ứng trên bàn phím chữ Thái Lan phổ thông (tức là bàn phím Kedmanee). + Những chữ Thái Việt Nam tương đương với chữ Lào thì chọn vị trí trên bàn phím như của chữ Lào. + Sau đó xét tới các chữ không tương đương, tùy theo tần số xuất hiện mà xếp đặt vào các phím còn lại, phần này có một số chữ vốn chỉ có riêng trong chữ Thái Việt Nam thống nhất mà Yukti chưa đề cập đến, nhưng xét yêu cầu của các nhà nghiên cứu có lúc vẫn cần sử dụng nên chúng tôi lựa chọn đặt vào các mã phím khả kiến còn trống. 4 2.3.2. Các chức năng cơ bản của chương trình bàn phím - Có bộ gõ để đánh các chữ Thái VNTN vào văn bản, đây là chức năng cơ bản. - Có khả năng chuyển đổi giữa các bàn phím tiếng Anh, Thái Lan, Thái VNTN tránh xung đột với các bàn phím tiếng Việt. - Với học sinh dân tộc và người mới học chữ Thái có thêm hình bàn phím trực quan để người dùng có thể học cách bố trí phím. Người dùng có thể nháy chuột vào hình chữ để lấy chúng vào văn bản, tức là tiện ích bàn phím ảo . - Có khả năng đánh luôn cả chữ Thái và Khmer (chủ yếu để phục vụ các nhà chuyên môn). Một số khả năng mở rộng phần mềm gõ chữ và hiển thị chữ: - hỗ trợ hai tiện ích là bàn phím trực quan chữ Thái Việt và bàn phím trực quan chữ Thái Lan có thể dùng để đánh chữ vào Word. - Bổ sung thêm một số font chữ để phục vụ in ấn tài liệu cũng như in sách GK cho học sinh dân tộc. - Bổ sung các dạng viết chữ khác nhau để phục vụ giới chuyên môn. - Nghiên cứu phát triển các chức năng tra cứu từ điển chữ Thái - Việt - Anh. 2.4 Giao diện người dùng gõ chữ Thái Việt Nam Chương trình bàn phím chữ Thái Việt Nam được thể hiện bằng một hình tượng nổi trên màn hình khi được kích hoạt. Hình tượng này cũng đồng thời mang các thông tin thông báo về chế độ bàn phím hiện thời (tiếng Anh, chữ Thái Việt Nam hay chữ Thái Lan). Việc thay đổi các thông số bàn phím được thực hiện khi kích hoạt menu đi kèm hình tượng này. Để người dùng sử dụng được thuận tiện khi mà bàn phím vật lí gõ vào chưa được dán nhãn cho các kí tự Thái Việt Nam, giao diện người dùng sử dụng giải pháp xây dựng bàn phím ảo. Bàn phím ảo là một hình vẽ bàn phím chứa các kí tự bổ sung đó để người dùng có thể nháy chuột chọn từng chữ trực tiếp trên màn hình, chương trình sẽ đảm nhiệm việc chèn các chữ người dùng chọn vào văn bản. 3. Thiết kế trong 3.1 Thiết kế bộ font chữ Thái ViệtNam Xem phụ lục 2 5 3.2. Thiết kế bố trí các phím trên bàn phím chữ Thái Việt Nam: * Bố trí bàn phím chữ Thái Việt Nam thống nhất xem hình sau: (Bảng mã Unicode chữ Thái Việt và đối chiếu tương ứng với các các phím trên bàn phím tiếng Anh xin xem trong phụ lục 2) * Bố trí bàn phím chữ Thái Lan, chính là bàn phím Kedmanee phổ thông, xem hình sau: 3.3 Thiết kế chương trình bàn phím chữ Thái Việt Nam 3.3.1. Các yêu cầu cơ bản: - Chương trình phải biểu diễn được bàn phím Chữ Thái VN (vì chưa có bàn phím được khắc chữ); nhận các thao tác gõ từ bàn phím và biến đổi theo qui tắc ngôn ngữ; đưa các kí tự nhận được vào các ứng dụng, tức là phần hạt nhân mọi bộ gõ đều phải có. - Chương trình cần có thêm chức năng chuyển đổi các loại bàn phím Anh, Thái Lan, Thái Việt. Chức năng hiển thị hay tắt hiển thị bàn phím trực quan để giúp cho người dùng dễ sử dụng. - Về tốc độ: các hệ thống (máy vi tính) ngày nay đều có tốc độ và ổ đĩa lưu trữ vượt xa yêu cầu của các phần mềm đánh chữ nên đây không phải là vấn đề lớn. 6 - Vấn đề quan trọng hơn là tính ổn định, tránh xung đột với các bộ gõ tiếng Việt, trên nguyên tắc thì bộ gõ chữ Thái cũng có thể đánh cả tiếng Việt, phải tìm cách dùng chung với chúng. - Phương hướng chung là dùng Visual Basic để dễ phát triển bộ khung phần mềm, kết hợp với Visual C++ để xử lý các yêu cầu hệ thống. Tốc độ có chậm hơn dùng toàn C++ nhưng dễ phát triển về sau. - Trên cơ sở thiết kế cẩn thận, có thể chuyển thiết kế này lên phần mềm mã nguồn mở để không phụ thuộc vào các phần mềm sở hữu riêng. 3.3.2. Phân chia mô đun thực hiện: Chương trình bao gồm một mô đun quản lí chung, thực hiện việc tạo hình ảnh trực quan của chương trình trên màn hình và khởi đầu. Mô đun chuyển đổi bàn phím phụ trách việc chuyển đổi. Mô đun hiển thị chịu trách nhiệm hiển thị kĩ tự cũng như hiển thọi tình trạng bàn phím.. Tuỳ theo trạng thái lựa chọn bàn phím mà chương trình sẽ cho phép quan niệm bàn phím thực là tương ứng cho chữ Thái Việt Nam, chữ Thái Lan hay chữ tiếng Anh. Việc diễn giải các phím được gõ vào do mô đun bắt chữ thực hiện. Việc tạo ra các kí tự trong ngôn ngữ do mô đun ghép chữ thực hiện. Việc chuyển các kí tự đã gõ vào cho chương trình ứng dụng do mô đun xuất ra thực hiện. Các hỗ trợ người dùng do mô đun Trợ giúp thực hiện. Mô đun tra cứu được dự định để có thể móc nối với chương trình tra cứu từ điển. 3.3.2.1 Mô đun quản lý chung : - Môdul này là phần “thường trú”, làm các công việc khởi tạo, kết thúc chương trình và chuyển đổi kiểu gõ. Phần khởi tạo có thể thêm 2 thao tác sau, nếu thấy cần: + Nạp font hệ thống tiếng Việt, nếu muốn hiển thị tiếng Việt trên menu, tiêu đề... mà không cần biết máy khách đang cài ABC, VNI hay VIETWARE.v.v. + Đưa biểu tượng vào khay hệ thống, nếu không muốn dùng kiểu biểu tượng nổi. 3.3.2.2 Mô đun hiển thị : Biểu tượng chương trình sẽ đảm nhiệm luôn việc thông báo trạng thái bật tắt và chuyển đổi bàn phím (biểu thị bằng các hình khác nhau), bàn phím trực quan thì thích hợp khi cần học tập hoặc khi quên cách bố trí phím. Sử dụng Visual basic 6.0 để đơn giản việc hiển thị biểu tượng chương trình và hình đồ họa của bàn phím và tạo menu popup. Có thể dùng VC++ 6.0 kèm MFC cũng tốt, thực ra xử lý đồ họa thì VC++6 cũng không có ưu thế gì rõ rệt so với VB6. Vấn đề hiển thị chữ Thái Unicode surrogate (nếu sau này định mã surrogate) thì phức tạp hơn nhiều, xem phụ lục 1. 7 3.3.2.3 Mô đun bắt chữ (hook): Tức là Keyboard hook: Gọi trực tiếp các hàm API SetWindowsHookEx() để khởi tạo hook bàn phím và UnhookWindowsHookEx() để trả bàn phím về tiếng Anh. Hook sẽ chuyển các thông tin phím gõ cho Thủ tục xử lý phím gõ KeyboardProc() viết bằng VC++ 6.0, nằm trong file Thaihook.dll. 3.3.2.4 Mô đun ghép các chữ để tạo ra kí hiệu đúng Ở trên đã nói là chữ Thái VN gõ rất đơn giản, thấy sao gõ vậy, không có các tổ hợp phím phức tạp giống như bộ gõ tiếng Việt, vì vậy thực tế không có công đoạn ghép chữ từ nhiều phím như tiếng Việt. Mô đun này do đó chỉ gồm KeyboardProc() để đọc phím gõ (wParam, lParam, trạng thái Shift...), và một số hàm quy đổi để tính mã số Unicode của kí tự xuất ra theo thông tin phím gõ (chữ surrogate sẽ sinh 2 mã Unicode 2byte). Bảng đối ứng mã có ở phụ lục 2. Việc xuất kí tự surrogate ra văn bản thực tế chỉ là cho liên tiếp hai kí tự Unicode 2 byte tương ứng mã Low surrogate và Hight surrogate của nó ra văn bản. Toàn bộ chỉ cần một hàm dùng công thức mã hóa surrogate để tính ra hai mã low và hight. Việc hiển thị chữ surrogate trong văn bản đang đánh là nhiệm vụ của WinXP và OfficeXP. 3.3.2.5 Mô đun xuất ra: Đây là phần quan trọng nhất, thuật toán xử lý phụ thuộc vào việc xuất thẳng từ DLL, hay xuất từ cửa sổ chương trình, hay từ bàn phím ảo qua OLE automation. Nguyên tắc cơ bản là phải nhận diện được cửa sổ đang giữ focus, nếu dùng DLL xử lý xuất ra ở hậu trường thì khá đơn giản, chỉ cần gọi hàm Getfocus(), nhưng xuất từ các cửa sổ của chương trình, thì vì nó thuộc một mạch (thread) khác, sẽ phải xác định số ID của mạch đang giữ focus và gọi hàm AttachThreadInput() trước. Có thể gởi ký tự Unicode tới cửa sổ đang giữ focus bằng hàm PostMessage(). 3.3.2.6 Mô đun trợ giúp: Các bộ gõ thường yêu cầu gọn nhẹ nên thường không có file help chính quy đi kèm. Có thể thay bằng một bài viết dạng HTML nội dung như phần thiết kế ngoài ở trên. Nhưng nếu phát triển thêm từ điển thì sẽ phải viết Help chính quy dạng HTML . 3.3.2.7 Mô đun chuyển đổi bàn phím Mô đun này như một công tắc rađio kết hợp với các tổ hợp phím nóng, phím nóng là do Keyboard Hook quản lý. Có điểm quan trọng là khi trả bàn phím về English, sẽ hủy bỏ luôn Keyboard Hook để đảm bảo không “làm phiền” tới các bộ gõ tiếng Việt, tổ hợp phím nóng vì vậy không còn nữa ! Nên muốn bật chữ Thái lại bằng bàn phím thì phải khai báo phím bật trở lại với Window qua ngả khác (dùng chuột bật biểu tượng thì dễ thôi nhưng phải chú ý là focus nhảy qua biểu tượng của chương trình nên phải nháy chuột lại vào văn bản để trả focus lại văn bản). 8 3.3.2.8 Mô đun tra cứu: Gồm tra phiên âm và tra từ điển, mới để sẵn chỗ cho nó chứ hiện tại chưa phát triển, nhưng nếu phát triển về sau chủ yếu là phức tạp hóa mô đun này ! Tạm thời chưa đi sâu vào bên trong mô đun này. LƯỢC ĐỒ PHÂN CHIA MODUL MODUL MAIN (Khởi tạo, kết thúc, chuyển đổi trạng thái ) MODUL Hiển thị MODUL quản lý bàn phím (IME) MODUL Tra cứu MODUL help Tạo Hook Ghép chữ Xuất ra Phiên âm Từ điển - Nạp font hệ thống - Đặt biểu tượng lên SysTray Main Window Attach Thread Input Tìm cửa sổ Focus Gởi kí tự ra Browser Visual Keybo. Phím gõ tắt Xuất qua OLE Xuất từ DLL 9 4. Hướng dẫn sử dụng bàn phím chữ Thái Việt Nam - Đặc điểm của các bộ gõ là nên gọn nhẹ, có thể chạy mà không cần cài đặt, thường không hiển thị cửa sổ lớn chiếm nhiều diện tích màn hình mà chỉ hiện thị một biểu tượng nhỏ. Thời còn Windows3.x người ta cho biểu tượng nổi trên màn hình, Win98 trở về sau cung cấp khay hệ thống cho các chương trình có tính “thường trú”, nhưng hiện nay có quá nhiều chương trình đều muốn “thường trú” và đặt biểu tượng lên khay hệ thống, khay này trở nên chật hẹp, những biểu tượng ít động tới thường bị che khuất, do đó chúng tôi dự định trở lại thời Windows3.x là cho biểu tượng nổi trên màn hình ở góc trên bên phải, dạng như sau : - Khi nháy chuột vào giữa biểu tượng sẽ chuyển vòng tròn giữa 3 trạng thái đánh chữ Thái Việt (biểu tượng giống chữ “V”), đánh chữ Thái Lan (hình chữ “Th”) và đánh tiếng Anh nguyên thủy (hình chữ “En”). - Khi rê chuột lên mép phải màu xanh của biểu tượng sẽ xuất hiện menu chính của chương trình gồm các mục chọn như hình bên, có thể hiểu ngay không cần giải thích nhiều. - Nhấn chuột vào nút hình chữ “x” hoặc chọn close trong menu popup sẽ đóng toàn bộ chương trình, sau đó có thể đánh ngay tiếng Anh hay Việt unicode bình thường, không cần có các thao tác chuyển đổi gì vì vộ font chữ Thái VNTN vốn đã có sẵn chữ Việt unicode. - Cả chữ Thái Lan lẫn chữ Thái VNTN đều đánh theo nguyên tắc rất đơn giản là thấy sao đánh vậy, hai kí tự dấu của chữ Thái Việt bỏ ở sau âm tiết. Còn các dấu của chữ Thái Lan bản thân nó là một kí tự độc lập, đã được vẽ dịch về bên trái nên sẽ tự động nằm trên hay dưới kí tự cần bỏ dấu, nguyên tắc này giống như bộ font tiếng Việt unicode tổ hợp, cũng hơi giống các bộ font “pseudo 2byte” VNI Window hoặc VietWareX tiếng Việt. - Để chuyển nhanh sang gõ chữ Thái Việt dùng tổ hợp phím CTRL+Q, chuyển nhanh sang tiếng Anh dùng tổ hợp phím CTRL+E. Còn để hiển thị phiên âm Thái=>Việt và từ điển Thái Việt thì tô đen từ Thái rồi nhấn tổ hợp CTRL+C+W. (Hiện tại từ điển Thái Việt chưa biên soạn hoàn chỉnh, nhưng bên trong chương trình đã xây dựng sẵn các chức năng cơ bản của một phần mềm tự điển.) - Đối với các tiện ích “bàn phím trực quan”, sẽ hiển thị hình hai bàn phím gần như ở trên, nhưng nhỏ hơn để khỏi choán cửa sổ Word. Khi nhấn nút trái chuột vào hình phím nào là chọn chữ dưới của phím, nhấn nút phải chuột là chọn chữ trên (tương đương nhấn SHIFT trên bàn phím). Ngoài ra có vài nút soạn thảo cơ bản như Enter, Right, Left, Delete .v.v Để khởi động các bàn phím trực quan này ta rê chuột để mở menu popup và chọn “... VISUAL KEYBOARD“ trong menu, đóng bàn phím bằng nút close như các cửa sổ bình thường. - Để nhìn rõ các phím trên bàn phím trực quan, có thể bấm Ctrl và chuột phải ở phím chuột đang đứng. Hình ảnh phóng to của phím mang các chữ Thái sẽ hiện ra bên cạnh. 10 Phụ lục 1: Vấn đề hiển thị chữ Unicode surrogate Hiện tại chữ Thái Việt đang dùng tạm mã unicode 2byte trong vùng người dùng tự do định nghĩa, nhưng có khả năng sẽ chuyển qua unicode surrogate, mã lớn hơn 2 byte. Qua việc làm chữ Nôm, chúng tôi nắm được các phương án hiển thị: (1) Dùng thư viện Microsoft Form 2.0 Object Library (mf20.dll), như các trang WEB hướng dẫn lập trình tiếng Việt Unicode với VB6 trên mạng thường dạy, giống bộ phần mềm chữ Nôm Hanosoft2.0 của Tống Phước Khải. Nó hiển thị được cả chữ Nôm Surrogate trong WinXP, khả năng này thực ra không nằm trong bản thân thư viện mf20.dll, mà thuộc về nền Windows. Thực ra ngay với Win98 hay Win2000, sau khi cài Office XP thì mf20.dll cũng có thể hiển thị chữ Nôm surrogate, chú ý thêm là không nhất thiết phải cài đủ cả bộ OfficeXP mà chỉ cần qua bước cập nhật hệ thống của Office XP rồi ngừng lại không cài đặt tiếp cũng được. Ngoài ra có thể cài VS.NET workframe (phần nền tức là các thư viện RUN của VS.NET, khoảng 16 MB, không phải cả bộ VS NET 7 đĩa CD), là Win2000 hay thậm chí Win98 cũng có khả năng hỗ trợ surrogate . (2) Dùng thư viện đối tượng “richtextbox” của bộ VS6.0, nằm trong file richtx32.ocx. Nhưng nó cũng không thuận tiện lắm, vì ta phải nạp định dạng Richtext (RTF) cho nó mới hiển thị được đúng đắn chứ nếu chỉ gán 1 chuỗi Unicode cho tính chất Text của nó thì chưa được! Khả năng hỗ trợ surrogate của richtextbox thì cũng như trường hợp dùng thư viện mf20.dll. Mẫu hiển thị từ điển Thái Việt trong phiên bản đemo chúng tôi dùng phương án này. (3) Dùng Internet Explorer để hiển thị unicode surrogate, đây là công cụ hiển thị chủ lực, có nhiều khả măng rất mạnh, và vẫn đang được phát triển, chúng tôi dự định sẽ sử dụng để phát triển về sau. IE6.0 trở lên hỗ trợ tốt surrogate mà không cần phải có WinXP hay OfficeXP. (4) Gọi trực tiếp các hàm API ExtTextOutW, TextOutW, DrawTextW .v.v. để hiển thị chữ Unicode trong các cửa sổ. Phương pháp này chỉ dùng tới khi cần tốc độ xử lý hiển thị cao, nhưng ở trên đã trình bày rõ rằng tốc độ hiện nay không còn là vấn đề lớn. (5) Dùng môi trường phát triển VISUAL.NET của Microsoft, nó hỗ trợ surrogate từ đầu. nên việc xử lý rất nhẹ nhàng, nhưng cài đặt trên các hệ thống máy yếu (chạy Win9x, vẫn còn dùng nhiều ở VN) thì hơi cồng kềnh. 11 Phụ lục 2: BẢNG DỮ LIỆU TỔNG HỢP CHỮ THÁI VN GỒM CHỮ THÁI - QUI ƯỚC CHUYỂN TỰ - MÃ SỐ   Chuyển tự Mã tạm  b F021  B F022  c F023  C F024  ch F025  CH F026  z F027  Z F028  d F029  D F02A  f F02B  F F02C  g F02D  G F02E  h F02F  H F030  kh F031  KH F032  kh’ F033  KH’ F034  l F035  L F036  m F037  M F038  n F039  N F03A  ng F03B  NG F03C  nh F03D  NH F03E  o F03F   Chuyển tự Mã tạm  O F040  p F041  P F042  ph F043  PH F044  r F045  R F046  t F047  T F048  th F049  TH F04A  ts F04B  TS F04C  v F04D  V F04E  x F04F  X F050  a F051  ă F052  ơ F053  e F054  ê F055  i F056  oa F057  ô F058  u F059  w F05A  ay F05B  iê F05C  ua F05D  ưa F05E 12   Chuyển tự Mã tạm  au F05F  aư F060  oe F061  uê F062  â F063  s F064  j F065  một F066  người F067  sam F068  hohoi F069   Chuyển tự Mã tạm  F06A  F06B  F06C  F06D  F06E  F06F  F070  F071  F072  F073  F074 Tài liệu tham khảo 1. Unification of the Viet Tai script in Vietnam and Asian region, Cam Trong - Vietnam Program on Thai Studies, Ngo Trung Viet - Institute of Information Technology, James Do - Mentor Graphics 2. Study on the relationship between Vietnamese Tai script and Thailand script for designing the Vietnamese Tai keyboard, Yukti Mukdawijitra, candidate at the Institute of Vietnamese Studies

Các file đính kèm theo tài liệu này:

  • pdfPADung-ThietKeBanPhimChuThai.pdf
Tài liệu liên quan