Chơng II ngôn ngữ siêu văn bản (HTML)
I Khái niệm chung
Ngôn ngữ siêu văn bản HTML (Hypertext Markup Langure) là một cách đa
vào văn bản nhiều thuộc tính cần thiết để có thể truyền thông quảng bá trên mạng
toàn cầu WWW (World Wide Web). HTML cho phép đa hình ảnh đồ hoạ vào văn
bản, và tạo những tài liệu siêu văn bản có khả năng đối thoại tơng tác với ngời dùng.
HTML chủ yếu xoay quanh khái niệm tiêu thức (tag) làm nền tảng. Để tạo
một siêu văn bản, ta có thể dùng bất cứ một chơng trình soạn thảo nào ví dụ nh NC,
EDIT của DOS, NotePad hay Write của Windows 3.x, WordPad của Win95. . . Và
chỉ cần nắm vững các tiêu thức của HTML, và chú ý khi cất lên đĩa thì cần lu dới
dạng TXT. Song có một hạn chế là dạng văn bản khi soạn với khi xem sau này trên
WWW là không giống nhau.
Ngày nay do sự phát triển của mạng toàn cầu, HTML cũng ngày càng trở nên
phức tạp và hoàn thiện hơn để đáp ứng đợc những yêu cầu mới nảy sinh trong quá
trình phát triển đó (nh âm thanh, hình ảnh động, hay điều khiển từ xa, hiện thực ảo. . .
). Ngời ta gọi đó là những phiên bản của HTML và đánh số để biểu thị.
Một trong những điểm mạnh của HTML là một văn bản bất kỳ nếu tuân thủ
tiêu chuẩn HTML đều có thể hiện đợc lên màn hình hay in ra, tóm lại là hiểu đợc, bởi
bất kỳ loại phần mềm hay máy tính nào mà ngời dùng có, không phân biệt Netscape
trên Windows, hay Lynx trên Unix, thậm chí cho ngời khiếm thị bằng phần mềm đặc
biệt.
II Đặc tả về HTML
Toàn bộ các thẻ của HTML đợc chia ra thành 7 nhóm thành phần nh sau và đợc
gọi là từ khoá :
Từ khoá xác lập cấu trúc tài liệu
Từ khoá tạo điểm móc nối
Từ khoá định dạng khối
Từ khoá khai báo danh sách
Từ khoá khai báo loại thông tin và định dạng mẫu chữ
Từ khoá đa hình ảnh vào tài liệu
Từ khoá lập mẫu biểu bảng
<ISINDEX> Cho phép tìm kiếm trong tài liệu theo từ khoá
<LINK> Chỉ ra mối quan hệ giữa các tài liệu
<NEXTID> Tạo tên gọi đồng nhất hoá tài liệu
<META>Cung cấp thông tin hữu ích cho chế độ Server/Client
Thẻ <BODY>. . .</BODY>:
Phần thân của trang Web chứa tất cả các thành phần khác cũng nh nội dung từ
lời văn đến hình ảnh cấu thành một tài liệu, song không dính dáng gì đến sự bài trí
của tài liệu đó.
II.2 Điểm móc nối <A>. . .</A>
Đánh dấu cụm từ chỉ đến một kết nối siêu văn bản (Hypertext link) mà khi trỏ
tới nó, bộ duyệt sẽ dẫn dắt đến một tài liệu hoặc một đoạn văn khác. Có nhiều thuộc
tính nhng hoặc NAME hoặc HREF là thuộc tính bắt buộc.
HREF
Nếu có thuộc tính HREF, cụm từ đứng giữa sẽ trở thành siêu văn bản, nghĩa là
nó trỏ đến một văn bản khác chứ không chỉ mang nội dung thuần tuý. Khi chọn vào
cụm từ đó, một tài liệu khác hoặc một đoạn tài liệu khác trong cùng tài liệu đang xem
mà địa chỉ đợc chỉ ra bởi thuộc tính HREF sẽ đợc hiện lên.
NAME
Dùng để đặt tên cho điểm móc nối và vì vậy phải là duy nhất trong nội bộ tài
liệu hiện thời mặc dù tên có thể đặt một cách tuỳ ý
Ví dụ:
<A Name=coffee>Cà phê</A> là một ví dụ về loại cây
Từ tài liệu khác có thể tham chiếu tới bằng cách đặt tên gọi vào sau địa chỉ, ngăn
cách bằng một dấu #.
TITLE
Thuộc tính này chỉ có ý nghĩa thông báo và đợc dùng để đặt đầu đề cho tài liệu
mà địa chỉ đó do HREF chỉ ra. Đầu đề cần phải là duy nhất đối với tài liệu đích.
Bộ duyệt có thể hiện đầu đề của tài liệu trớc khi lấy về, chẳng hạn nh một ghi
chú nhỏ bên lề hay trong một khung nhỏ khi con trỏ chuột di qua điểm móc nối (có
thể là một cụm từ hay một hình ảnh), hay khi đang tải tài liệu ra (nhất là khi qua đờng
có độ rộng ký tự không đổi. Nếu không có thuộc tính WIDTH đi cùng thì bề rộng
mặc định là 80 ký tự/dòng. Bề rộng 40,80,132 đợc thể hiện tối u, còn các bề rộng
khác có thể đợc làm tròn trong thành phần định dạng trớc:
Dấu xuống dòng sẽ có ý nghĩa chuyển sang dòng mới (chứ không còn là dấu
cách)
không dùng nếu có sẽ đợc coi nh là xuống dòng.
Đợc phép dùng các thành phần liên kết và nhấn mạnh.
Không đợc chứa các thành phần định dạng paragraph (tiêu đề, địa chỉ).
Ký tự TAB phải hiểu là số dấu cách nhỏ nhất sao cho đến ký tự tiếp theo ở vị trí
là bội của 8. Tuy nhiên không nên dùng.
Ví dụ:
<PRE WIDTH=50>
Nguyễn văn Trỗi - Cử nhân.
Nguyễn viết Xuân - Kỹ s.
</PRE>
<BLOCKQUOTE>. . .</BLOCKQUOTE> Trích dẫn nguồn tài liệu khác
Dùng để trích dẫn một đoạn văn bản,thờng đợc thể hiện bằng chữ nghiêng có căn lề
lùi vào trong và thờng có một dòng trống ở trên và dới.
II.4 Các từ khoá khai báo danh sách
HTML hỗ trợ nhiều kiểu loại danh sách, tất cả đều có thể lồng vào nhau và chỉ
nên dùng trong phần thân của tài liệu (<BODY>. . .</BODY>).
<DL>. . .</DL> Danh sách định nghĩa
Dùng để lập danh sách các thuật ngữ và định nghĩa tơng ứng
ví dụ
<DL COMPACT>
<DT> Mèo <DD> Là một loại động vật
<DT>Hoa Ngọc Lan<DD> Là một loài thực vật
</DL>
Trong ví dụ trên thì:
<DT> Chỉ tên thuật ngữ