Bài 2 Biến và Kiểu dữ liệu
Mục tiêu:
Kết thúc bài học này, bạn có thể:
Hiểu và sử dụng được biến (variables)
Phân biệt sự khác nhau giữa biến và hằng (constants)
Nắm vững và sử dụng các kiểu dữ liệu khác nhau trong chương trình C
Hiểu và sử dụng các toán tử số học.
Giới thiệu
Bất cứ chương trình ứng dụng nào cần xử lý dữ liệu cũng cần có nơi để lưu trữ tạm thời dữ liệu ấy. Nơi
mà dữ liệu được lưu trữ gọi là bộ nhớ. Những vị trí khác nhau trong bộ nhớ có thể được xác định bởi các
địa chỉ duy nhất. Những ngôn ngữ lập trình trước đây yêu cầu lập trình viên quản lý mỗi vị trí ô nhớ thông
qua địa chỉ, cũng như giá trị lưu trong nó. Các lập trình viên dùng những địa chỉ này để truy cập hoặc thay
đổi nội dung của các ô nhớ. Khi ngôn ngữ lập trình phát triển, việc truy cập hay thay đổi giá trị ô nhớ đã
được đơn giản hoá nhờ sự ra đời của khái niệm biến .
2.1 Biến (variable)
Một chương trình ứng dụng có thể quản lý nhiều loại dữ liệu. Trong trường hợp này, chương trình phải chỉ
định bộ nhớ cho mỗi đơn vị dữ liệu. Khi chỉ định bộ nhớ, có hai điểm cần lưu ý như sau :
1. Bao nhiêu bộ nhớ sẽ được gán
2. Mỗi đơn vị dữ liệu được lưu trữ ở đâu trong bộ nhớ.
Trước đây, các lập trình viên phải viết chương trình theo ngôn ngữ máy gồm các mã 1 và 0. Nếu muốn lưu
trữ một giá trị tạm thời, vị trí chính xác nơi mà dữ liệu được lưu trữ trong bộ nhớ máy tính phải được chỉ
định. Vị trí này là một con số cụ thể, gọi là địa chỉ bộ nhớ.
Các ngôn ngữ lập trình hiện đại cho phép chúng ta sử dụng các tên tượng trưng gọi là biến (variable), chỉ
đến một vùng bộ nhớ nơi mà các giá trị cụ thể được lưu trữ.
Kiểu dữ liệu quyết định tổng số bộ nhớ được chỉ định. Những tên được gán cho biến giúp chúng ta sử
dụng lại dữ liệu khi cần đến.
Chúng ta đã quen với cách sử dụng các ký tự đại diện trong một công thức. Ví dụ, diện tích hình chữ nhật
được tính bởi :
Diện tích = A = chiều dài x chiều rộng = L x B
Cách tính lãi suất đơn giản được cho như sau:
Tiền lãi = I = Số tiền ban đầu x Thời gian x Tỷ lệ/100 = P x T x R /100
Hệ điều hành hoạt động như một giao diện giữa các ô nhớ và lập trình viên. Lập trình viên không cần lưu
tâm về vị trí ô nhớ mà để cho hệ điều hành đảm nhiệm. Vậy việc điều khiển bộ nhớ (vị trí mà dữ liệu thích
hợp lưu trữ) sẽ do hệ điều hành đảm trách, chứ không phải lập trình viên.
2.2 Hằng (constant)
Trong trường hợp ta dùng biến, giá trị được lưu sẽ thay đổi. Một biến tồn tại từ lúc khai báo đến khi thoát
khỏi phạm vi dùng nó. Những câu lệnh trong phạm vi khối mã này có thể truy cập giá trị của biến, và
thậm chí có thể thay đổi giá trị của biến. Trong thực tế, đôi khi cần sử dụng một vài khoản mục mà giá trị
của chúng không bao giờ bị thay đổi.
Một hằng là một giá trị không bao giờ bị thay đổi. Ví dụ, 5 là một hằng, mà giá trị toán học luôn là 5 và
không thể bị thay đổi bởi bất cứ ai. Tương tự, ‘Black’ là một hằng, nó biểu thị cho màu đen. Khi đó, 5
được gọi là hằng số (numeric constant), ‘Black’ được gọi là hằng chuỗi (string constant).
2.3 Định danh (Identifier)
Tên của các biến (variables), các hàm (functions), các nhãn (labels) và các đối tượng khác nhau do người
dùng định nghĩa gọi là định danh. Những định danh này có thể chứa một hay nhiều ký tự. Ký tự đầu tiên
của định danh phải là một chữ cái hay một dấu gạch dưới ( _ ). Các ký tự tiếp theo có thể là các chữ cái,
các con số hay dấu gạch dưới.
Arena, s_count, marks40, và class_one là những định danh đúng. Các ví dụ về các định danh sai là 1sttest,
oh!god, và start... end.
Các định danh có thể có chiều dài tuỳ ý, nhưng số ký tự trong một biến được nhận diện bởi trình biên dịch
thì thay đổi theo trình biên dịch. Ví dụ, nếu một trình biên dịch nhận diện 31 con số có ý nghĩa đầu tiên
cho một tên định danh thì các câu sau sẽ hiển thị cùng một kết quả:
Đây là biến testing.... testing
Đây là biến testing.... testing ... testing
Các định danh trong C có phân biệt chữ hoa và chữ thường, cụ thể, arena thì khác ARENA.
2.3.1 Các nguyên tắc cho việc chỉ đ tặ tên
Các quy tắc đặt tên biến khác nhau tuỳ ngôn ngữ lập trình. Tuy nhiên, vài quy ước chuẩn được tuân theo
như :
Tên biến phải bắt đầu bằng một ký tự chữ cái.
Các ký tự theo sau ký tự đầu bằng một chuỗi các chữ cái hoặc con số và cũng có thể bao gồm ký tự
đặc biệt như dấu gạch dưới.
Giá trị luận lý.
Ví dụ : Y hay N.
Khi dữ liệu được lưu trữ trong các biến có kiểu dữ liệu khác nhau, nó yêu cầu dung lượng bộ nhớ sẽ khác
nhau.
Dung lượng bộ nhớ được chỉ định cho một biến tùy thuộc vào kiểu dữ liệu của nó.
Ðể chỉ định bộ nhớ cho một đơn vị dữ liệu, chúng ta phải khai báo một biến với một kiểu dữ liệu cụ thể.
Khai báo một biến có nghĩa là một vùng nhớ nào đó đã được gán cho biến. Vùng bộ nhớ đó sau này sẽ
được tham chiếu thông qua tên của biến. Dung lượng bộ nhớ được cấp cho biến bởi hệ điều hành phụ
thuộc vào kiểu dữ liệu được lưu trữ trong biến. Vì vậy, một kiểu dữ liệu sẽ mô tả loại dữ liệu phù hợp với
biến.
Dạng thức chung cho việc khai báo một biến:
Kiểu dữ liệu (Tên biến)
Kiểu dữ liệu thường được dùng trong các công cụ lập trình có thể được phân chia thành:
1 Kiểu dữ liệu số - lưu trữ giá trị số.
2 Kiểu dữ liệu ký tự – lưu trữ thông tin mô tả
Những kiểu dữ liệu này có thể có tên khác nhau trong các ngôn ngữ lập trình khác nhau. Ví dụ, một kiểu
dữ liệu số được gọi trong C là int trong khi đó tại Visual Basic được gọi là integer. Tương tự, một kiểu dữ
liệu ký tự được đặt tên là char trong C trong khi đó trong Visual Basic nó được đặt tên là string. Trong
bất cứ trường hợp nào, các dữ liệu được lưu trữ luôn giống nhau. Ðiểm khác duy nhất là các biến được
dùng trong một công cụ phải được khai báo theo tên của kiểu dữ liệu được hỗ trợ bởi chính công cụ đó.
C có 5 kiểu dữ liệu cơ bản. Tất cả những kiểu dữ liệu khác dựa vào một trong số những kiểu này. 5 kiểu
dữ liệu đó là:
int là một số nguyên, về cơ bản nó biểu thị kích cỡ tự nhiên của các số nguyên (integers).
float và double được dùng cho các số có dấu chấm động. Kiểu float (số thực) chiếm 4 byte và có thể
có tới 6 con số phần sau dấu thập phân, trong khi double chiếm 8 bytes và có thể có tới 10 con số
phần thập phân.
char chiếm 1 byte và có khả năng lưu một ký tự đơn (character).
void được dùng điển hình để khai báo một hàm không trả về giá trị. Ðiều này sẽ được nói rõ hơn trong
phần hàm.
Dung lượng nhớ và phạm vi giá trị của những kiểu này thay đổi theo mỗi loại bộ xử lý và việc cài đặt các