Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
1HƯỚNG DẪN SỬ DỤNG SPSS
CHO NGƯỜI MỚI BẮT ĐẦU
I/ Giới thiệu về SPSS
SPSS (viết tắt của Statistical Package for the Social Sciences) là một chương trình
máy tính phục vụ công tác phân tích thống kê. SPSS được sử dụng rộng rãi trong công
tác thống kê kinh tế - xã hội.
Thế hệ đầu tiên của SPSS được đưa ra từ năm 1968 và mới nhất là thế hệ 18 được giới
thiệu từ tháng 8 năm 2009, có cả phiên bản cho các hệ điều hành Windows, Mac, và
Linux / Unix.
SPSS được sử dụng bởi các nhà nghiên cứu thị trường, nghiên cứu y khoa, công ty
điều tra, chính phủ, các nhà nghiên cứu giáo dục và những lĩnh vực khác. Một số phần
mềm có chức năng thống kê khác như Microsoft Office Excel, STATA, SAS,
Eviews…
Các chức năng cơ bản:
* Thống kê mô tả (Descriptive statistics): tần số (Frequencies), các loại bảng số liệu
tổng hợp (Cross tabulation, Explore, Descriptive Ratio Statistics)
* Thống kê 2 biến số (Bivariate statistics): trung bình (Means), T-test, ANOVA,
tương quan (bivariate, partial, distances), kiểm định phi tham số (Nonparametric tests)
* Dự báo (Prediction): hồi quy (regression), phân tích nhân tố (Factor analysis),
cluster analysis (two-step, K-means, hierarchical), biệt thức (Discriminant).
Ưu điểm: dễ sử dụng, hỗ trợ thao tác thông qua menu kéo thả và câu lệnh, các bảng
biểu, báo cáo được trình bày đẹp, linh hoạt.
Choose “Yes” to replace files
7) Run II/ Thang đo, thu thập và mã hóa dữ liệu
1. Thang đo
Dữ liệu nghiên cứu có thể phân chia thành 2 loại chính là dữ liệu định tính và dữ
liệu định lượng.
Các dữ liệu này được thu thập bằng 4 thang đo cơ bản được thể hiện trên sơ đồ
như sau:
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
5
Dữ liệu định tính: loại dữ liệu này phản ánh tính chất, sự hơn kém, ta không tính
được trị trung bình của dữ liệu dạng định tính.
Dữ liệu định lượng: loại dữ liệu này phản ánh mức độ, mức độ hơn kém, tính
được trị trung bình.
Cần chú ý rằng các phép toán thống kê dùng cho dữ liệu định tính có những đặc
điểm khác với phép toán dùng cho dữ liệu định lượng.
i) Thang đo danh nghĩa (còn gọi là thang đo định danh hoặc thang đo phân
loại) – nominal scale: trong thang đo này các con số chỉ dùng để phân loại
các đối tượng, không mang ý nghĩa nào khác. Những phép toán thống kê
bạn có thể sử dụng được cho dạng thang đo danh nghĩa là: đếm, tính tần
suất của một biểu hiện nào đó, xác định giá trị mode, thực hiện một số
phép kiểm định.
6
kém hữu ích hơn). Vì vậy, SPSS gộp chung hai loại thang đo này thành một gọi là
Scale Measures.
2. Thu thập dữ liệu
* Các phương pháp thu thập số liệu
a. Phỏng vấn trực tiếp (Face to face interview)
- Phỏng vấn tại nhà (Door to door interview)
- Phỏng vấn tại một địa điểm cụ thể (Central location interview)
- Phỏng vấn chặng (Mall – Intercept interview)
b. Phỏng vấn qua điện thoại
c. Phỏng vấn qua thư
d. Phỏng vấn qua internet
e. Quan sát (Observation)
* Dạng câu hỏi
a. Câu hỏi mở
b. Câu hỏi đóng
- Câu hỏi phân đôi (Dichotomous)
Anh/chị có sử dụng điện thoại di động không?
1. Có 2. Không
- Câu hỏi liệt kê một lựa chọn (Single response)
Trong số các nhãn hiệu nước ngọt có gaz dưới đây bạn sử dụng thường xuyên
nhất nhãn hiệu nào?
Coca-Cola 1
Pepsi-Cola 2
7-Up 3
Fanta 4
- Câu hỏi liệt kê nhiều lựa chọn (Multiple responses)
Bạn đã từng viếng thăm địa điểm nào trong các thành phố dưới đây ở nước
Nhãn hiệu C ____
Nhãn hiệu D ____
* Lưu ý: Thông thường, đối với biến Ordinal, ta có thể định dạng thành Scale.
3. Mã hóa dữ liệu
Ví dụ: Nguyên tắc là chúng ta cần chuyển các thông tin từ dạng “chữ” sang dạng “số” để
tiến hành nhập liệu vào SPSS.
4. Xử lý dữ liệu
Quy trình xử lý dữ liệu
- Bước 1: kiểm tra, hiệu chỉnh bảng câu hỏi
- Bước 2: mã hóa dữ liệu trên bảng câu hỏi
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
8
- Bước 3: nhập dữ liệu vào máy tính
- Bước 4: làm sạch dữ liệu trên máy tính III/ Khai báo biến và nhập liệu trong SPSS
1. Giao diện
1- Thanh menu chức năng
2- Biểu tượng một số chức năng thông dụng
3- Cột hiển thị tên các biến
4- Số thứ tự các dòng
iii) Width: độ rộng kiểu dữ liệu, nếu type là string thì width là số ký tự
tối đa
iv) Decimals: lượng số thập phân
v) Label: nhãn biến (chú thích cho tên biến)
vi) Values: giá trị mã hóa dữ liệu
vii) Missing: khai báo giá trị khuyết
viii) Columns: độ rộng cột tên biến
ix) Align: vị trí dữ liệu nhập trong cột
x) Measure: loại thang đo của dữ liệu, Ordinary (thang đo thứ bậc),
Nominal (thang đo danh nghĩa), Scale (gồm cả Interval và Ratio).
xi) Role: vai trò của biến
Nhập liệu
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
10* Lưu ý: có thể dùng chức năng Copy/Paste để sao chép dữ liệu từ chương trình Excel
sang SPSS. Ngoài ra, SPSS cũng có thể import dữ liệu từ file .xls có sẵn bằng cách
vào File > Open > Data…> Chọn tập tin đuôi *.xls.
3. Một số xử lý trên biến
Mã hóa lại biến (Recode)
Vào Transform > Recode into Same Variables… hoặc Recode into Different
Variables…
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
Từ thanh Menu chọn
Analyze
Descriptive Statistics
Frequencies
Hộp thoại Frequencies xuất hiện,
Chọn các biến cần tính và đưa vào
khung Variable(s)
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
13
* Có thể copy bảng tần số sang word hoặc xuất kết quả sang file word/excel.
Tạo bảng thống kê mô tả
Cách 1.
Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
chi tieu trung binh mot
thang cho viec goi dien
thoai (ngan dong)
92
Nhấp nút Option nếu muốn tính
thêm các thống kê khác
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
14
Cách 2.
Bạn cũng có thể tính thống kê mô tả bằng cách Chọn Analyze\ Descriptive
Statistics\ Frequencies
- Đưa biến định lượng cần tính thống kê mô tả vào khung Variable(s)
- Nhấp Statistics và đánh dấu chọn các chỉ tiêu cần tính Đổ bảng chéo (phân tích hai biến): bảng Crosstabs
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
15
loai dien thoai di dong ma ban su dung chinh * gioi tinh Crosstabulation
Count
gioi tinh
Nu Nam
92
loai dien thoai di dong ma ban su dung chinh * gioi tinh Crosstabulation
% within loai dien thoai di dong ma ban su dung chinh
gioi tinh
Nu Nam
Total
Nokia
100.0%
100.0%
Samsung 78.6%
21.4%
100.0%
Motorola 100.0%100.0%
loai dien thoai di dong ma
ban su dung chinh
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
16
* Lưu ý: biến có nhiều thuộc tính nên đưa vào khung Column(s).
Tính giá trị trung bình của 1 biến định lượng phân theo 1 biến định tính
Từ thanh Menu chọn
Analyze
Compare Means
Means
Đưa biến định lượng vào
Dependent list
Đưa biến định tính vào
Independent List
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
17Report
muc do hai long
1.330
Bảng tần số cho câu hỏi nhiều lựa chọn
Đối với biến nhiều trả lời: trước khi đổ bảng ta phải tiến hành nhóm các biến chứa
đựng các giá trị trả lời có được (multiple responses).
Bước 1. Khai báo cho biến nhiều lựa chọn Từ thanh Menu chọn
Analyze
Multiple Response
Define Variable Sets
Đưa các biến mô tả các
thuộc tính của biến
định tính vào
Variables in Set
Chọn Dichotomies nếu
câu hỏi nhiều lựa chọn
được nhập theo cách
này, nhập giá trị 1 vào
ô Counted value (nếu 1
là có chọn)
Khai báo Name cho
$tinhnang Frequencies
Responses
N Percent
Percent of
Cases
nghe _ goi 59
22.3%
64.1%
tin nhan 56
21.2%
60.9%
nghe nhac 64
24.2%
69.6%
quay phim, chup hinh 43
16.3%
46.7%
Chọn biến đã được khai báo và đưa
vào khung Table(s) for Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
19
$tinhnang*gioi Crosstabulation
gioi tinh
Nu Nam
Total
nghe _ goi Count 34
25
59
tin nhan Count 37
19
56
nghe nhac Count 43
Percentages and totals are based on respondents.
a. Dichotomy group tabulated at value 1.
* Lưu ý: SPSS còn hỗ trợ xử lý đối với biến có nhiều câu trả lời trong menu Analyze
> Tables > Multiple Response Sets. Thủ tục khởi tạo tương tự như ở trên. Mặc dù
bạn đã khởi tạo biến có nhiều câu trả lời bằng cách này thì chức năng Multiple
Response Frequencies và Crosstabs ở trên không thể sử dụng được, thay vào đó
Analyze > Tables > Custom Tables sẽ hỗ trợ và nó được xem như một variable.
b. Mô tả dữ liệu bằng đồ thị
Đồ thị Bar dùng để thể hiện thông tin như trung bình, trung vị, tần số tích lũy, tần suất
tích lũy, số quan sát… của biến. Nó được sử dụng cho các dữ liệu thu thập bằng các
thước đo định danh, thứ tự, khoảng cách hoặc tỉ lệ với ít giá trị rời rạc.
Từ thanh Menu chọn
Analyze
Multiple Response
Crosstabs
Chọn biến nhiều câu trả lời
đưa vào khung Row(s), biến
phân loại đưa vào khung
Column(s), chú ý khai báo
Define Ranges cho biến phân
loại. Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ môn Toán-Thống kê kinh tế - ĐH Kinh tế-Luật
Bài tốn
Quy trình kiểm định
B1: Đặt hai giả thiết H
0
và H
1
▪ H
0
: Giả thiết đúng µ = µ
0
▪ H
1
: µ <> µ
0:
Hướng dẫn sử dụng SPSS cho người mới bắt đầu
Bộ mơn Tốn-Thống kê kinh tế - ĐH Kinh tế-Luật
22
Giả thiếùt sai
B2: Tìm mức ý nghóa của tổng thể mẫu (.sig)
B3: tìm miền bác bỏ H
0
(α)
B4: Ra quyết đònh H
0
nếu sig > α và ngược lại
3) Phân tích dữ liệu nghiên cứu với SPSS, Hồng Trọng, Chu Nguyễn Mộng Ngọc,
NXB Thống kê 2005.
4) Xử lý data với SPSS, Nguyễn Duy Tâm.
Và các tài ngun trực tuyến khác