Dùng chữ tiếng Việt bằng Unicode trong Windows
Việc chuyển đổi từ sử dụng các bảng mã riêng biệt sang dùng bảng mã chuẩn quốc tế để
soạn thảo và thể hiện Việt ngữ đang gây ra không ít bối rối cho người dùng. Dưới đây là
thông tin cơ bản về font chữ và cách xử lý tiếng Việt bằng font Unicode trong hệ điều hành
Windows.
1. Bảng mã và font chữ
Bảng mã, Font và Unicode
Về mặt cơ bản, máy tính làm việc với con số. Bản thân mỗi chữ cái (mỗi ký
tự) cũng được gắn cho một con số nào đó để máy tính có thể hiểu. Hệ
thống các con số dùng để thể hiện tất cả các chữ cái và ký hiệu của một
(hay nhiều) ngôn ngữ gọi là bảng mã.
Bảng mã chuẩn đầu tiên cho máy tính có tên là ASCII (American Standard
Code for Information Interchange). ASCII chuẩn 7-bit cho phép hiển thị
128 ký tự (bao gồm chữ cái, số và các ký tự đặc biệt khác như “?”, “.”, “*”
v.v.). Mỗi ký tự trong ASCII sử dụng một byte và khi tập hợp lại, ASCII
cho phép hiển thị thêm 128 ký tự khác nữa (tổng cộng là 256 ký tự). Phần
tập hợp này gọi là ASCII mở rộng (Extended ACSII) hay ASCII 8-bit.
Một tập hợp các chữ cái và ký hiệu thể hiện tất cả các ký tự trong một bảng
mã với cùng một kiểu hiển thị được gọi là font. Nói cách khác, font là hình
thức mà một bảng mã được thể hiện trên màn hình máy tính hoặc trên trang
giấy khi in ra. Bất cứ điều gì thuộc về ký hiệu ngôn ngữ được thể hiện trên
máy tính đều phải theo một font nào đó, thuộc một bảng mã nào đó.
Thường font bao giờ cũng có khả năng thể hiện dưới 4 dạng khác nhau:
bình thường, đậm, nghiêng và in hoa.
Unicode là một bảng mã mới (có thể gọi là dạng mở rộng (rất rộng) của
bảng mã ASCII), sử dụng 2 byte cho mỗi ký tự và có khả năng thể hiện
65.536 ký tự khác nhau, cho phép biểu đạt mọi ký tự của tất cả các ngôn
ngữ trên thế giới. Nói cách khác, với Unicode, mỗi ký tự của tất cả các
ngôn ngữ trên thế giới sẽ có một con số riêng cho mình trong bảng mã. Các
font chữ theo chuẩn Unicode được gọi là font Unicode.
Font tiếng Việt kiểu cũ
dụng Windows 2000 hoặc Windows XP.
Về bộ gõ, hiện thời phổ biến nhất là Vietkey và Unikey. Tuy nhiên, Unikey
tốt hơn bởi một số lý do chính sau:
- Unikey miễn phí và mã nguồn mở. Người dùng có thể tải mã nguồn về và
sửa chữa. Vietkey là chương trình thương mại và người dùng phải mua để
sử dụng.
- Unikey có kèm phần mềm chuyển mã và cho phép chuyển đổi rất nhiều
mã khác nhau
- Unikey (phiên bản 3.5) có tùy chọn để không sử dụng “clipboard” của
Windows khi gõ tiếng Việt bằng font Unicode. Điều này tránh được lỗi
cách chữ hoặc mất chữ mà Vietkey hay mắc phải.
Ngoài Unicode ra, cả Vietkey và Unikey đều hỗ trợ các bảng mã cũ khác.
Tương tự như Vietkey, Unikey không yêu cầu “cài đặt”. Để sử dụng chỉ
cần tải phần mềm này về và chạy file có tên UnikeyNT.exe. Hướng dẫn có
thể được tìm thấy tại trang web của tác giả Phạm Kim Long.
Lưu ý:
- Khi gõ tiếng Việt sử dụng bộ mã Unicode, cần đảm bảo font chữ đang
dùng phải là thuộc bảng mã Unicode. Tốt nhất là nên sử dụng các font
“Arial” hoặc “Times New Roman”.
- Không sử dụng các bộ gõ cũ (dành cho các hệ điều hành 16-bit như DOS
hay Windows 3x) cho các hệ điều hành 32-bit (Windows 9x/NT/2K/XP).
Các bộ gõ cũ (ví dụ: ABC 2.1) khi cài đặt thường thay đổi font hệ thống
của hệ điều hành (thường là Unicode) thành font hệ thống kiểu cũ (ASCII)
và khiến hệ điều hành không hỗ trợ được Unicode nữa.
3. Đọc tiếng Việt trên mạng với Unicode
Để đọc tiếng Việt (được soạn thảo bằng font Unicode) trên mạng Internet
cần có 2 điều kiện:
- Hệ điều hành hỗ trợ Unicode (xem phần trên).
- Trình duyệt (browser) hỗ trợ Unicode: Các trình duyệt phổ biến như
Internet Explorer 5.x (hoặc mới hơn), Netscape 4.7 (hoặc mới hơn) hỗ trợ
- Chọn để máy in “Download font” từ máy tính trước khi in.
- Chọn để máy in không thay thế (Substitute) font trước khi in.
- Chọn chức năng “Print Text as graphics”.
Ngoài ra, tải về trình điều khiển (driver) mới nhất và cài lại cho máy in
cũng sẽ giúp máy in hoạt động tốt với Unicode trong hầu hết các trường
hợp.
Đông Ngô