Các ӭng dөng Unicode trong web site tiӃng ViӋt 1
MӨC LӨC
Unicode cho chӳ ViӋt ......................................................................................................... 2
Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi Unicode............................................. 4
Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt................................................................ 8
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ thành tiêu chuҭn Unicode........................ 9
Dùng Frontpage 98/ 2000 viӃt webpage Unicode ViӋt ngӳ ............................................. 10
Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt Trong MS-WORD............................................. 16
Cách chӑn Settings trong OutLook Express (IE 5) ÿӇ ÿӑc chӳ ViӋt
gӱi bҵng VoviMail hay NCR 18
Cách chӑn Settings trong OutLook 2000 ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR 22
Cách ÿánh chӳ ViӋt trong Hotmail ................................................................................... 26
Cách ÿánh chӳ ViӋt trong Yahoo! Mail............................................................................ 28
Các ӭng dөng Unicode trong web site tiӃng ViӋt 2
Unicode cho chӳ ViӋt
Unicode là mӝt cách dùng chӳ ViӋt theo tiêu chuҭn quӕc tӃ cho tin hӑc. Ðһc
ÿiӇm chính cӫa nó là ngѭӡi ta dùng 2 bytes (16 bits) cho mӛi mүu tӵ nhѭ ô,
ѫ, ă. Cho ÿӃn nay có nhiӅu bӝ chӳ ViӋt Nam nhѭ VISCII, VPS, VNI... vv…
ÿang ÿѭӑc dùng rҩt thӏnh hành trong nhiӅu áp dөng phҫn mӅm khác nhau.
VISCII là mӝt chuҭn cӫa nhóm khoa hӑc gia Tricholor. Trong chuҭn nҫy
mӛi mүu tӵÿѭӧc biӇu diӉn bҵng mӝt byte (8 bits). Nhóm Tricholor dùng
các con sӕ trӕng cӫa bӝ chӳ ASCII ( cӫa Mӻ - A là viӃt tҳt cho American,
trong khi VI cho Vietnamese) ÿӇ biӇu diӉn các chӳ ViӋt Nam có dҩu. Vì con
sӕ lӟn nhҩt có thӇ biӇu diӇn bҵng 1 byte là 255, ÿó chính là tәng sӕ mүu tӵ
ViӋt Nam tӕi ÿa ta có thӇ dùng ÿѭӧc bҩt cӭ lúc nào. Rҩt tiӃc chӳ ViӋt Nam
cҫn hѫn 255 mүu tӵ nên ngѭӡi ta phҧi ÿһt thêm bӝ chӳ Hoa (thí dө nhѭ
UHoàiH 1.1) hay thay thӃ các dҩu hiӋu ít dùng, nhѭ dҩu ngoһc kép, bҵng
nhӳng mүu tӵ ViӋt Nam cҫn phҧi có. Tӭc là hӉ muӕn có ÿҫy ÿӫ bӝ chӳ ViӋt
ta phҧi hy sinh vài dҩu hiӋu ít dùng cӫa bӝ chӳ ASCII.
Bӝ chӳ VPS cӫa Hӝi Vietnamese Professionals Society cNJng dùng cùng mӝt
nguyên tҳc nhѭ VISCII. Có ÿiӅu khác là vì VPS ÿѭӧc triӇn khai ӣ Pháp, nên
VISCII
Hex
VNI
VNI
Hex
TCVN
TCVN
Hex
Unicode
Symbol
Unicode
Hex Dec
UTF-8 Hex
a' á E1 á E1 á
61
F9
¸ B8 á
00E1
225
C3 A1
a` à E0 à E0 à
61
F8
µ B5 à
00E0
224
C3 A0
a? ä E4 ä E4 ả
61
FB
7855
E1 BA AF
a(` ¢ A2 ¢ A2 ằ
61
E8
» BB ҵ
1EB1
7857
E1 BA B1
a(? £ A3 Ỉ C6 ẳ
61
FA
¼ BC ҷ
1EB3
7859
E1 BA B3
a(~ ¤ A4 Ç C7 ẵ
61
FC
½ BD ҹ
1EB5
7861
E1 BA B5
a(. ¥ A5 £ A3 ặ
61
EB
Ỉ C6 һ
1EB7
7863
E1 BA B7
61
E3
É C9 ү
1EAB
7851
E1 BA AB
a^. Ỉ C6 § A7 ậ
61
E4
Ë CB ұ
1EAD
7853
E1 BA AD
e' é E9 é E9 é
65
F9
Ð D0 é
00E9
233
C3 A9
e` è E8 è E8 è
65
F8
Ì CC è
00E8
232
C3 A8
e? È C8 ë EB ẻ
65
FB
7871
E1 BA BF
e^` Š 8A « AB ề
65
E0
Ị D2 Ӆ
1EC1
7873
E1 BB 81
e^? ‹ 8B ¬ AC ể
65
E5
Ĩ D3 Ӈ
1EC3
7875
E1 BB 83
e^~ Í CD AD ễ
65
E3
Ơ D4 Ӊ
1EC5
7877
E1 BB 85
e^. Œ 8C ® AE ệ
65
E4
Ư D6 Ӌ
1EC7
7879
E1 BB 87
F8
ß DF ò
00F2
242
C3 B2
o? Õ D5 ư F6 ỏ
6F
FB
á E1 ӓ
1ECF
7887
E1 BB 8F
o~ õ F5 õ F5 õ
6F
F5
â E2 õ
00F5
245
C3 B5
o. † 86 ÷ F7 ọ
6F
EF
ä E4 ӑ
1ECD
7885
E1 BB 8D
o^ ơ F4 ơ F4 ô
6F
E2
« AB ơ
E1 BB 97
o^. ¶ B6 µ B5 ộ
6F
E4
é E9 ӝ
1ED9
7897
E1 BB 99
o+ Ư D6 ½ BD ơ F4 ¬ AC ѫ
01A1
C6 A1
Các ӭng dөng Unicode trong web site tiӃng ViӋt 7
417
o+' § A7 ¾ BE ớ
F4
F9
í ED ӟ
1EDB
7899
E1 BB 9B
o+` © A9 ¶ B6 ờ
F4
F8
ê EA ӡ
1EDD
7901
E1 BB 9D
o+? ª AA · B7 ở
F4
FB
Khi bҥn thay ÿәi font trong
combo box: Font-Family,
Font-Size hay Font-Weight,
văn bҧn trong khung bên phҧi
cNJng sӁ thay ÿәi và dùng theo
font bҥn chӑn. Bҥn sӁ không
ÿӑc ÿѭӧc chӳ ViӋt nӃu font
bҥn chӑn không chӭa mүu tӵ
glyphs Unicode tiӃng ViӋt.
Trang web này giúp bҥn lӵa
ra nhӳng font Unicode trong
máy cӫa bҥn, font nào có thӇ
sӱ dөng ÿӇ trình bày Unicode
chӳ ViӋt và font nào không
thӇ dùng ÿӇ trình bày
Unicode chӳ ViӋt.
Font chӳ trong khung này thay
ÿәi theo thӇ Font trong combo
box bên trái Ðây là font chӳ
trong mӝt phҫn cӫa mӝt câu.
NӃu font chӳ nào không có
glyphs mүu tӵ chӳ ViӋt thì bҥn sӁ
không ÿӑc ÿѭѫc chӳ ViӋt mà chӍ
thҩy ô vuông.
Bҥn có thӇ dùng phѭѫng tiӋn này
ÿӇ set Default font ѭa chuӝng
cho browser ÿang dùng cӫa bҥn.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 9
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ
thành tiêu chuҭn Unicode
biӃn cҧi cӫa bҥn ÿӇ nhӳng sӵ thay ÿәi hӳu dөng khác có thӇÿѭӧc ÿѭa vào
trong các bҧn chѭѫng trình tѭѫng lai.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 10
Dùng Frontpage 98/ 2000
viӃt webpage Unicode ViӋt ngӳ
NӃu bҥn ÿang dùng Windows 2000 Professional/ Server thì bҥn có thӇ gõ
chӳ ViӋt Unicode (dùng các chѭѫng trình gõ chӳ ViӋt nhѭ VPS, VietKey,
VNI vv...) trong Notepad hay WordPad 2000 ÿӇ viӃt webpage chӳ ViӋt trӵc
tiӃp bҵng HTML.
Nhѭng nӃu bҥn ÿang dùng Windows 95.x hay Windows 98.x thì Fronpage là
công cө không thӇ thiӃu ÿѭӧc ÿӇ giúp bҥn viӃt webpage Unicode ViӋt ngӳ
mӝt cách dӉ dàng tiӋn lӧi. HiӋn nay (tháng Tѭ 2001) trên thӏ trѭӡng Web
Editors thì Frontpage 98/ 2000 là mӝt trong vài wysiwyg editors hӛ trӧ
Unicode.
Các web editors khác nhѭ Cold Fusion 4.x, Dreamweaver 4, Dreamweaver
UltraDev 4, NetOject Fusion 5 vân vân ÿӅu không hӛ trӧ Unicode. Dƭ nhiên
chúng ta vүn có thӇ dùng nhӳng web editors trên ÿӇ viӃt webpage ViӋt Ngӳ
nhѭng bҩt tiӋn ӣ chӛ là không ÿӑc ÿѭӧc tiӃng ViӋt và không thҩy ÿѭӧc lӛi
chính tҧÿӇ sӳa lӛi câu văn...
Bҥn có thӇ dùng các chѭѫng trình gõ chӳ ViӋt mӟi nhҩt cӫa VPS, VietKey,
VNI vân vân ÿӇ gõ chӳ ViӋt Unicode. Các chѭѫng trình trên có thӇ dùng
trong hҫu hӃt các ӭng dөng cӫa bӝ Office 97, Office 2000 và mӝt sӕӭng
dөng khác.
Trѭӟc kia Frontpage 97 và Frontpage 98 là chѭѫng trình ÿӝc lұp cӫa
Microsoft, nhѭng kӇ tӯ Frontpage 2000, Micorsoft ÿã nhұp nó vào thành
viên cӫa bӝ Office 2000. Tҩt cҧ các bӝ Frontpage nói trên ÿӅu hӛ trӧ
Unicode nhѭng dƭ nhiên là bӝ Frontpage 2000 là có hӛ trӧ Unicode ÿҫy ÿӫ
nhҩt.
Trong phҫn này chúng tôi chӍ bàn ÿӃn phҫn dùng Unicode cӫa Frontpage
2000 trong webpage ViӋt ngӳ và các bҥn có thӇ suy diӉn tӯ bӝ này cho bӝ