Phân tích dữ liệu bằng SPSS
CHƯƠNG 5: CÁC PHÉP BIẾN ĐỔI VÀ THAO TÁC TRÊN TẬP DỮ LIỆU
1. Mã hóa lại (Recode)
Recode là cơng cụ dùng để mã hóa lại các giá trị trong một biến thành các giá trị mã
hóa mới phù hợp với đòi hỏi của q trình phân tích dữ liệu. Ví dụ đối với câu hỏi
nguồn gốc nhận biết quảng cáo của sản phẩm X, người trả lời có thể trả lời cụ thể
trên báo Sài Gòn, Tuổi Trẻ, Tạp chí Sức Khỏe và Đời sống, Trên đài HTV7, Trên
đài VTV3, … Có thể ban đầu các nguồn quảng cáo được mã hóa một cách riêng
biệt. Tuy nhiên do nhu cầu xữ lý sau này, người nghiên cứu muốn nhóm các giá
trị được mã hóa riêng biệt này thành ba loại nguồn quảng cáo chính là Báo, Tạp
Chí và Tivi. Cơng cụ Recode cho phép ta định lại các giá trị riêng biệt về nguồn
quảng cáo ban đầu thành ba nguồn quảng cáo chung là Báo, Tivi và tạp chí.
SPSS cung cấp cho ta hai loại Recode là Recode trên cùng một biến (Recode into
same variables) và recode vào biến khác (Recode into different variable).
1.1. Mã hóa lại trên cùng một biến (Recode into same variables)
Recode trên cùng một biến là mã hóa lại những giá trị trong một biến hiện hữu thành
những giá trị mới và các giá trị mới này sẽ nằm ngay trong biến hiện hữu và thay thế
các giá trị củ trên biến đó. Khi sử dụng cơng cụ này ta sẽ mất đi các giá trị đã khai báo
ban đầu trong biến mà ta thực hiện lệnh Recode. Chú ý các giá trị vừa được tạo ra
chưa có nhãn, do đó sau khi thực hiện lệnh ta phải tiến hành khai báo nhãn cho giá trị
(đã đề cập trong phần khai báo biến). Phương pháp này được thực hiện qua các bước
sau:
- Chọn transform/recode từ thanh menu chính. Ở đây ta lựa chọn Recode into
same variable để tiến hành định lại giá trị của biến trên cùng một biến. Ta có
hộp thoại như hình 5-1:
Biên soạn: Đào Hoài Nam 19
Phân tích dữ liệu bằng SPSS
Hình 5-1
- Chuyển các biến cần mã hóa lại sang hộp thoại variables, nhấn thanh Old and
New Values để chuyển các giá trị củ cần thay đổi thành các giá trị mới. Ta có
hộp thoại Old and New values như hình 5-2:
Sử dụng phương pháp recode vào một biến mới máy tính sẽ tự động tạo ra một biến
mới trên cơ sở dữ liệu để chứa các giá trị mới vừa được tạo ra, đồng thời ta cũng vẫn
lưu giữ được biến củ với các giá trị mã hóa củ trên cơ sở dữ liệu. Chú ý các giá trị vừa
được tạo ra chưa có nhãn, do đó sau khi thực hiện lệnh ta phải tiến hành khai báo nhãn
cho giá trị (đã đề cập trong phần khai báo biến). Việc mã hóa lại các giá trị vào trong
một biến mới được thực hiện qua các bước sau:
- Chuyển tên biến cần định lại giá trị vào trong hộp thoại variables. Khai báo tên
biến mới và nhãn biến mới sẽ chứa các giá trị vừa được mã hóa lại trong hộp
thoại Output variable. Nhấn thanh change để xác nhận sự khái báo này.
- Các cơng cụ If và Old and New Values cũng có ý nghĩa và thao tác tương tự
như trường hợp định lại giá trị cho cùng một biến, đã được đề cập ở phần trên.
Cơng cụ này có ưa điểm là ta vừa tạo ra được một biến mới với các giá trị được mã
hóa theo cách mới nhưng đồng thời vẫn giữa được biến gốc với các giá trị mã hóa ban
đầu. Trong khi với phương pháp mã hóa lại dữ liệu trên cùng một biến, các giá trị mã
hóa mới sẽ chồng lên các giá trị củ và ta đã mất đi các giá trị mã hóa ban đầu trên biến
đó.
Biên soạn: Đào Hoài Nam 21
Phân tích dữ liệu bằng SPSS
2. Cơng cụ tự động mã hóa lại (Automatic Recode)
Là phương pháp mã hóa tự động các giá trị dạng chuổi sang dạng số vào trong một
biến mới. Biến mới này sẽ chứa các con số ngun liên tục, mỗi con số ngun trong
biến mới sẽ đại diện cho các giá trị dạng chuổi giống nhau .
Ví dụ khi ban đầu ta nhập dữ liệu địa bàn nghiên cứu (quận) như Bình Thạnh, Quận 1,
Quận 2, Tân Bình, … ở dạng chuổi. Ta có thể recode các giá trị này thành các giá trị
số như 1, 2, 3 một các tự động bằng cơng cụ Automatic Recode. Và mỗi con số
ngun này sẽ đại diện cho từng địa bàn nghiên cứu, như Quận 1 được chuyển thành
1, quận 2 là 2, …, Quận Tân Bình là 19. Đối với cách Recode này các giá trị ngun
thủy (quận 1, quận 2, …) sẽ được sữ dụng như là nhãn của giá trị đã được recode
trong biến mới được tạo ra từ lệnh Automatic Recode. Các giá trị dạng chuổi được mã
hóa theo thứ tự alphabe.
Để tiến hành chọn lựa các trường hợp ta có thể dùng các cách sau:
- Lựa chọn cơng cụ If conditions are satisfied (xem hình 5-6) cho phép ta lựa
chọn các trường hợp dựa trên các biểu thức điều kiện. Một biểu thức điều kiện
cho ta các giá trị đúng hoặc sai của các trường hợp. Nếu kết quả của biều thức
điều kiện là đúng, trường hợp đó được lựa chọn. Nếu kết quả này là sai hoặc
thiếu thì các trường hợp đó khơng được chọn. Ví dụ đối với biến giới tính
(GTinh)có hai giá trị là Nam: 1 và Nữ: 2. Ta tiến hành chọn các trường hợp là
Nam bằng cách chọn biến giới tính trong hộp bên trái và chuyển sang hộp bên
phải. Hiễn thị biểu thức điều kiện như sau Gtinh=1. Lúc đó các trường hợp nào
thỏa mãn điều kiện Gtinh=1 sẽ được lựa chọn. Các biểu thức điều kiện có thể
bao gồm tên biến, các hằng số, các tốn tử, các con số, các hàm số, …
- Cơng cụ random sample of cases (hình 5-7) cho phép chúng ta lựa chọn một
mẫu ngẫu nhiên dựa trên một tỷ lệ phần trăm hoặc một số chính xác các trường
hợp sẽ lựa chọn.
Biên soạn: Đào Hoài Nam 23