SP SS 16.0
GIỚI THIỆU VÀ THIẾT KẾ BẢNG CÂU HỎI
Phần mềm SPSS (nguyên gốc là từ viết tắt của Statistical Package for Social Sciences) được dùng
để phân tích các kết quả điều tra trong nhiều lĩnh vực từ xã hội, giáo dục, kinh tế, dịch vụ,
marketing, nông nghiệp, y khoa… Ngày nay SPSS for Windows đã trở thành một trong những phần
mềm phân tích số liệu thống kê hiệu quả, phổ biến nhất và được nhiều nhà nghiên cứu sử dụng để
phân tích dữ liệu trong nghiên cứu khoa học.
Phần mềm SPSS dễ dàng cài đặt cho mọi cấu hình của máy vi tính, với dung lượng thấp người sử
dụng không cần đến một máy vi tính có cấu hình thật mạnh. Việc cài đặt SPSS đơn giản và tương tự
như một số phần mềm ứng dụng khác.
Nhà nghiên cứu sử dụng chương trình SPSS trong máy vi tính để thực hiện các kỹ thuật thống kê,
nhưng việc làm cho các con số thống kê có ý nghĩa lại phụ thuộc vào cách diễn giải kết quả, suy
diễn và dự đoán để giải quyết mục tiêu của vấn đề nghiên cứu.
1. LÀM QUEN VỚI SPSS
Khởi động SPSS từ biểu tượng của chương trình trên Desktop hoặc từ Star/Program/SPSS
SPSS có 2 cửa sổ làm việc: Cửa sổ dữ liệu (Dataset) và Cửa sổ kết quả xử lý (Output)
- Cửa sổ dữ liệu có 2 giao diện: Giao diện mã hoá dữ liệu (Variable View) và Giao diện nhập liệu
(Data View). Thay đổi giao diện bằng cách nhấp chuột chọn ở gốc trái bên dưới màn hình, hoặc
bấm tổ hợp phím Ctrl+T.
Thành phần Menu của cửa sổ dữ liệu bao gồm:
File: giúp tạo tập tin SPSS mới, mở tập tin có sẵn, lưu, thoát …
Edit: xác lập các mặc định của chương trình (Option), cắt, dán, tìm kiếm, thay thế…
View: cho hiện dòng trạng thái, thanh công cụ, font chữ, giá trị nhập vào hay nhãn ý nghĩa
Data: bao gồm các lựa chọn chèn thêm biến, tìm nhanh một quan sát, sắp xếp thứ tự quan sát, chia
và ghép tập tin…
Transform: gồm các lệnh tính toán, chuyển đổi và mã hoá lại biến …
Analyze: chứa các công cụ phân tích số liệu như: thống kê mô tả, phân tích bảng chéo, các kiểm
định tham số và phi tham số, phân tích tương quan và hồi quy …
Graphs: bao gồm các công cụ liên quan đến biểu đồ và đồ thị
(4) Gas
Thang đo thứ tự (Ordinal scale)
Là thang đo thể hiện sự xếp hạng, thể hiện mối quan hệ so sánh thứ tự giữa các loại đối tượng để
chỉ ra phạm vi liên hệ đến một đặc tính nào đó. Thang đo này cũng không có ý nghĩa về mặt lượng
(không cho biết nhiều hơn hay ít hơn bao nhiêu, chỉ cho biết cấp độ chênh lệch). Ví dụ: Vui lòng
xếp thứ tự các loại chất đốt mà anh (chị) ưa thích?
( ) Củi
( ) Than đá
( ) Dầu
( ) Gas
Thang đo khoảng (Interval scale)
2
Là thang đo cũng có thể dùng để xếp hạng các đối tượng nghiên cứu nhưng khoảng cách bằng nhau
trên thang đo đại diện cho khoảng cách bằng nhau trong đặc điểm của đối tượng. Một thang đo
khoảng chứa đựng tất cả thông tin trong thang đo thứ tự nhưng nó cũng cho phép só sánh sự khác
biệt giữa các đối tượng. Ví dụ: sự khác biệt giữa “3” và “4” thì bằng sự khác biệt giữa “1” và “2”,
hoặc sự khác biệt giữa “2” và “4” thì gấp đôi sự khác biệt giữa “1” và “2”.
Thang đo tỷ lệ (Ratio scale)
Là loại thang đo cao nhất, nó chứa đựng tất cả nội dung của thang đo biểu danh, thang đo thứ tự và
thang đo khoảng. Trong thang đo tỷ lệ, ta có thể nhận dạng hoặc phân loại đối tượng, xếp hạng đối
tượng và so sánh sự khác biệt. Thang đo tỷ lệ không chỉ cho biết sự khác biệt giữa 2 và 5 thì bằng
sự khác biệt giữa giữa 14 và 17 mà nó còn cho biết thêm 14 thì gấp 7 lấn của 2.
2.2. Tiến trình thiết kế bảng câu hỏi
Thiết kế bảng câu hỏi là một kỹ năng đòi hỏi thông qua kinh nghiệm, và nó còn là một nghệ thuật.
Thiết kế bảng câu hỏi là một quá trình bao gồm 10 bước:
Bước 1: Xác định những thông tin cần thiết
Tên biến (Name): ngắn gọn cho biết đang đề cập đến câu hỏi nào trong bảng câu hỏi. Độ dài
tối đa là 8 ký tự, không sử dụng dấu cách hoặc các ký hiệu đặc biệt (như !, ?, *, và ‘). Tên
biến không được trùng lặp
-
Loại dữ liệu (Type): mặc định là dạng số, có thể thay đổi định dạng biến ở phần Variable
Type.
-
Số lượng con số hoặc chữ (With) tối đa có thể nhập vào, có thể thay đổi trong hộp Variable
Type ở trên.
-
Số lượng chữ số thập phân (Decimals), có thể thay đổi trong hộp Variable Type ở trên.
-
Nhãn biến (Lable): mô tả chi tiết cho tên biến, có thể dài đến 256 ký tự, có thể dùng ký hiệu
đặc biệt.
-
Nhãn trị số của biến (Value): dùng để mô tả cho từng trị số của biến (ví dụ mã số 1 đại diện
cho nhóm nam và 2 đại diện cho nữ).
-
tính (thang đo biểu danh hay thứ tự).
Ví dụ: Khi thu thập thông tin về độ tuổi của bệnh nhân, chúng ta sử dụng thang đo tỷ lệ
(dùng chính xác số tuổi của bệnh nhân: 52, 67, hay 81 tuổi…). Đến khi xử lý số liệu, nhà nghiên
cứu lại muốn sử dụng nhóm tuổi để phân tích và viết báo cáo:
1.
< 30 tuổi
2.
30 – 39 tuổi
3.
40 – 49 tuổi
4.
50 – 59 tuổi
5.
≥ 60 tuổi
Quy trình mã hoá lại biến như sau:
1. Vào menu Transform Recode into Different Variables…
Nếu chúng ta chọn Recode into Same Variables… thì biến cũ (số tuổi chính xác) sẽ mất đi
và được thay thế bằng một biến mới với các biểu hiện mới (là nhóm tuổi).
Thông thường ta sẽ chọn Recode into Different Variables… để tạo ra biến mới mà vẫn giữ
8. Khai báo value cho biến vừa tạo tại ô Value của cửa sổ Variable View như hình sau:
Tiếp tục thực hiện các phép thống kê mô tả hay kiểm định dựa trên biến mới vừa tạo nhằm phục vụ
cho mục tiêu nghiên cứu.
4.2. Làm sạch dữ liệu
Dữ liệu sau khi nhập xong có thể có sai sót do trong quá trình nhập liệu, nên việc làm sạch dữ liệu
là rất cần thiết. Có nhiều phương thức để làm sạch dữ liệu như: tìm ngay trên cửa sổ Data View,
dùng bảng tần số đơn giản, hay bảng phối hợp 2 hay 3 biến… Trong những cách trên, việc lập bảng
tần số để phát hiện lỗi trong quá trình nhập liệu là đơn giản nhất và hiệu quả cao.
Khi tiến hành lập bảng tần số (bằng lệnh Frequency – xem them phần tính tần số), có bảng kết quả
như sau:
Gioi tinh
Frequency
Valid
Percent
Valid Percent
Cumulative Percent
Nam
38
76.0
76.0
Nhìn vào bảng thấy có giá trị “12” xuất hiện trong bảng giới tính Nam và Nữ. Lỗi này có thể do quá
trình nhập liệu bị sai sót. Cách khắc phục là tìm ra chỗ nhập sai để chỉnh sửa lại cho hợp lý. Chúng
ta sẽ dùng thủ tục Find để tìm lỗi.
Trên cửa sổ Data View, chọn toàn bộ cột tương ứng với biến có giá trị bị lỗi. Vào menu Edit
Find để mở hộp thoại:
7
Nhập giá trị 12 vào ô Find rồi click chọn Find next thì vị trí chứa giá trị lỗi 12 xuất hiện trên màn
hình. Truy ngược lại số thứ tự bảng câu hỏi để chỉnh sửa lại cho đúng.
4.3. Tính toán giá trị biến mới từ biến có sẵn
Có thể sử dụng SPSS để cộng, trừ, nhân chia các biến đã có sẵn để trở thành 1 biến mới (thủ tục
TransformCompute). Tuy nhiên biến mới được tính toán này không tự động thay đổi nếu ta thay
đổi các biến thành phần như công cụ tính toán trong Excel. Vì vậy, thủ tục tính toán này thường
được tiến hành sau khi đã chỉnh lý dữ liệu.
Thủ tục tính toán này được sử dụng khá nhiều trong phân tích số liệu. Đặc biệt đối với những đề tài
có sử dụng phân tích nhân tố để gom nhóm.
8
CÁCH THỨC TIẾN HÀNH LỆNH FREQUENCIES
TÍNH TẦN SỐ
Tính tần số được áp dụng cho những câu hỏi sử dụng thang đo biểu danh hoặc thứ tự
(biến định tính) để đếm số lần và tính tỷ lệ xuất hiện của các biểu hiện. Thao tác thực hiện
trong SPSS như sau:
1. Sau khi mở file dữ liệu, vào menu Analyze Descriptive Statistics Frequencies
giá trị lớn nhất
S.E. mean:
sai số chuẩn khi ước lượng trị trung bình
10
CÁCH 2. DÙNG LỆNH DESCRIPTIVES
1. Vào menu Analyze Descriptive Statistics Descriptives…, xuất hiện hộp thoại
2. Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung bình đưa vào khung
Variable(s).
3. Click vào ô Options… để xuất hiện hộp thoại Descriptive Options. Chọn các đại
lượng thống kê muốn tính toán bằng cách click vào ô vuông cần thiết.
4. Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách biến (Variable list), thứ tự
Alphabetic của nhãn biến, thứ tự tăng dần (Ascending list), và thứ tự giảm dần
(Descending list).
5. Click Continue để trở về hộp thoại Descriptive Ok để thực hiện lệnh.
11
CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO
(CROSSTABULATION)
Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau
bằng cách dùng kiểm định Chi – bình phương (Chi-square). Cách thức tiến hành với SPSS
như sau:
1. Vào menu Analyze Descriptive Statistics Crosstabs…,
2. Xuất hiện hộp thoại sau:
p-value (sig.) ≤ α (mức ý nghĩa) bác bỏ giả thuyết H0. Có nghĩa là có mối quan hệ
có ý nghĩa giữa các biến cần kiểm định.
p-value (sig.) > α (mức ý nghĩa) chấp nhận H0. Không có mối quan hệ giữa các
biến cần kiểm định.
ĐỐI VỚI KIỂM ĐỊNH CHI – BÌNH PHƯƠNG
Hàng đầu tiên của bảng Chi-square tests thể hiện giá trị P
Chi-Square Tests
Value
df
Asymp. Sig. (2-sided)
p-value
16.217 a
8
.039
18.708
8
.017
Linear-by-Linear Association
.202
3.
4.
Đau hạ vị
Ra huyết âm đạo bất thường
Tự sờ thấy u
Siêu âm phát hiện
Ta giả định rằng, nếu xác suất lý do vào viện là như nhau thì xác suất xảy ra của mỗi
lý do vào viện bằng 1/4. Với tổng số quan sát là 88 bệnh nhân, thì xác suất xảy ra của mỗi lý
do = 1/4 x 88 = 22 trường hợp nhập viện.
Với giả thuyết H0: xác suất lý do vào viện của bệnh nhân là như nhau, ta sẽ thực hiện
kiểm định Chi – bình phương 1 mẫu.
1. Từ menu Analyze Nonparametric Tests Chi-square…, mở hộp thoại sau:
2. Đưa biến cần kiểm định sang khung Test Variable List Click chọn OK để hoàn tất
lệnh.
3. Kết quả xuất hiện ở cửa sổ Output như sau:
15
ly do vao vien
Observed N
Expected N
Residual
dau ha vi
Total
88
Test Statistics
ly do vao vien
136.909 a
Chi-Square
df
3
Asymp. Sig.
.000
p-value
a. 0 cells (.0%) have expected
frequencies less than 5. The
minimum expected cell frequency
is 22.0.
Không sử dụng bảng số liệu từ cửa sổ kết quả SPSS để trình bày báo cáo, nhà nghiên
cứu sẽ lập lại bảng theo mục đích và cách thức trình bày báo cáo như sau:
Kết hợp với kết quả phân tích tần số thông thường, ta có bảng kết quả sau
1.
2.
(78.4%), tiếp theo là do ra huyết âm đạo (14.8%), trong khi số bệnh nhân vào viện do tự sờ
thấy khối u hay do siêu âm phát hiện là ít nhất (3.4%).
16
CÁCH THỨC TIẾN HÀNH KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH
CỦA 2 TỔNG THỂ ĐỘC LẬP (Independent Samples T-test)
1. Vào menu Analyze Compare Means Independent-samples T-test
2. Chọn biến định lượng cần kiểm định trị trung bình đưa vào khung Test Variable(s).
Chọn biến định tính chia số quan sát thành 2 nhóm mẫu để so sánh giữa 2 nhóm này
với nhau đưa vào khung Grouping Variable.
3. Chọn Define Groups… để nhập mã số của 2 nhóm. Click Continue để trở lại hộp
thoại chính Click Ok để thực hiện lệnh
17
Trong kiểm định Independent-samples T-test, ta cần dựa vào kết quả kiểm định sự
bằng nhau của 2 phương sai tổng thể (kiểm định Levene). Phương sai diễn tả mức độ đồng
đều hoặc không đồng đều (độ phân tán) của dữ liệu quan sát.
Independent Samples Test
A.Cleanliness and comfort of
room
Equal
Equal
variances
448.100
.002
.003
-.231
-.231
.075
.076
95% Confidence Interval
Lower
-.379
-.380
of the Difference
Upper
-.083
-.082
5. Xem cách đọc kết quả kiểm định ở phần trên. Cũng dùng giá trị Sig.
ỨNG DỤNG TRONG Y HỌC
XEM CÁC CHỈ SỐ CẦN KIỂM ĐỊNH TRƯỚC VÀ SAU (PHẨU THUẬT) CÓ
KHÁC NHAU HAY KHÔNG
19
CÁCH THỨC TIẾN HÀNH PHÂN TÍCH PHƯƠNG SAI
(ANOVA – Analysis of Variance)
Phân tích phương sai ANOVA là phương pháp so sánh trị trung bình của 3 nhóm trở
lên. Có 2 kỹ thuật phân tích phương sai: ANOVA 1 yếu tố (một biến yếu tố để phân loại các
quan sát thành các nhóm khác nhau) và ANOVA nhiều yếu tố(2 hay nhiều biến để phân
loại). Ở phần thực hành cơ bản chỉ đề cập đến phân tích phương sai 1 yếu tố (One-way
ANOVA).
Một số giả định đối với phân tích phương sai một yếu tố:
-
Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
-
Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem
như tiệm cận phân phối chuẩn.
-
Phương sai của các nhóm so sánh phải đồng nhất.
Dựa vào sự chấp nhận hay bác bỏ giả thuyết H0 để quan tâm hay không quan tâm đến
kết quả kiểm định sâu ANOVA.
Phân tích sâu ANOVA – Xác định chỗ khác biệt
Có 2 phương pháp để phân tích sâu ANOVA, đó là kiểm định “trước” (kiểm định
Priori Contrasts) và kiểm định “sau” (kiểm định Post-Hoc test). Phương pháp kiểm định gần
với phương pháp nghiên cứu thực là Post-Hoc test. Nên trong phần này ta sẽ sử dụng PostHoc test để thực hiện kiểm định sâu ANOVA nhằm tìm ra chỗ khác biệt.
Các phương pháp kiểm định thống kê của Post-Hoc test thường được sử dụng:
-
LSD: đây là phép kiểm định dùng kiểm định t lần lượt cho từng cặp trung bình
nhóm, do vậy nhược điểm của nó là độ tin cậy không cao vì làm gia tăng mức độ
phạm sai lầm tương ứng với việc so sánh nhiều nhóm cùng một lúc.
-
Bonferroni: giống quy tắc của LSD nhưng điều chỉnh được mức ý nghĩa khi tiến
hành so sánh bội dựa trên số lần tiến hành so sánh. Đây là một trong những thủ
tục kiểm định đơn giản nhất và hay được sử dụng cho mục tiêu này.
21
-
Tukey: cũng được sử dụng phổ biến cho việc tìm kiếm các trung bình các nhóm
khác biệt. Nó sử dụng bảng phân phối Studentizze range distribution. Tukey hiệu
quả hơn Bonferroni khi số lượng các cặp trung bình cần so sánh khá nhiều.
-
Lower
Upper
Deviation
Error
Bound
Bound
Minimum
Maximum
Single
153
4.12
.811
.066
3.99
4.25
.192
3.72
4.54
3.00
5
Widowed
2
4.50
.707
.500
-1.85
10.85
4.00
5
511
Sig.
507
.273
22
3. Bảng thứ 3 thể hiện kết quả kiểm định ANOVA. Trong VD này sig. = 0.089 < mức ý
nghĩa 0.1 bác bỏ giả thuyết H0 có sự khác biệt có ý nghĩa về giá trị trung bình
của mức độ sẵn lòng giới thiệu của các nhóm tình trạng hôn nhân.
ANOVA
Willingness to introduce
Sum of Squares
Between Groups
df
Mean Square
3.228
3
1.076
Within Groups
249.523
Married/Living with partner
Married/Living with
partner
Divorced
Widowed
Difference (I-J) Std. Error
Sig.
Lower Bound
Upper Bound
-.167*
.068
.015
-.30
-.03
Divorced
.03
.30
Divorced
.151
.185
.415
-.21
.51
Widowed
-.216
.498
.665
-1.19
.76
.016
.67
Single
.382
.499
.444
-.60
1.36
Married/Living with partner
.216
.498
.665
-.76
1.19
Divorced
.367
2.
3.
4.
5.
6.
Tên phẫu thuật
Cắt viêm ruột thừa
Mổ lấy thai
Cắt tử cung
Phẫu thuật u buồng trứng
Viêm túi mật
Phẫu thuật khác
Đánh dấu và ghi chú (nếu có)
Đối với câu hỏi nhiều lựa chọn, mỗi một lựa chọn sẽ được mã hoá thành 1 biến. Theo
ví dụ trên ta sẽ mã hoá thành 6 biến.
Cách thức khai báo Value: có 2 cách thức
-
Cách 1: dùng dạng câu hỏi phân đôi Có – Không (Dạng biến Dichotomy)
-
Cách 2: dùng chính số thứ tự của biến để mã hoá. Nếu bệnh nhân nào có tiền sử
cắt viêm ruột thừa sẽ nhập vào số 1, có tiền sử mổ lấy thai sẽ nhập vào số 2.
(Dạng biến Category)
24
hoàn tất quá trình định dạng biến tổng hợp.
25