THỐNG KÊ KINH DOANH
VÀ SPSS
I
Giới thiệu
chung về
SPSS
II
Các Màn
hình quản
lý dữ liệu
III
Khái quát
về phân
tich dữ
liệu
Bài 1
GiỚI THIỆU CHUNG VỀ SPSS
1. Giới thiệu chung về SPSS
Là phần mềm chuyên dụng xử lý
thông tin sơ cấp (thông tin được thu
thập trực tiếp từ đối tượng nghiên
cứu (người trả lời bảng câu hỏi)
thông qua một bảng câu hỏi được
thiết kế sẵn
2. Các màn hình quản lý
- Màn hình quản lý dữ liệu
- Màn hình quản lý biến
- Màn hình hiển thị kết quả
- Màn hình cú pháp
Màn hình quản lý dữ liệu
(data view)
(data view)
Là nơi lưu
trữ dữ liệu
nghiên cứu
với một cấu
trúc cơ sở
dữ liệu bao
gồm cột,
hàng và các
ô giao nhau
giữa cột và
hàng
Ô giao nhau giữa cột và hàng
(cell): Chứa đựng một kết quả trả lời
tương ứng với câu hỏi cần khảo sát
(biến) và một đối tượng trả lời cụ thể
(trường hợp quan sát). Ô là sự kết
hợp của đối tượng và biến. Các ô chỉ
chứa các trị số biến.
Màn hình quản lý dữ liệu
(data view)
Là nơi lưu
trữ dữ liệu
nghiên cứu
với một cấu
trúc cơ sở
dữ liệu bao
gồm cột,
hàng và các
ô giao nhau
(variables view)
Các qui tắc dưới đây được áp dụng cho tên biến:
•Tên phải bắt đầu bằng một chữ. Các ký tự còn lại có thể là bất kỳ
chữ nào, bất kỳ số nào, hoặc các biểu tượng như @, #, _, hoặc $.
•Tên biến không được kết thúc bằng một dấu chấm.
•Tránh dùng các tên biến mà kết thúc với một dấu gạch dưới cần
(để tránh xung đột với các biến được tự động lập bởi một vài thủ
tục)
•Độ dài của tên biến không vượt quá 8 ký tự.
•Dấu cách và các ký tự đặc biệt (ví dụ như !, ?, ‘, và *) không được
sử dụng
•Từng tên biến phải đơn chiếc/duy nhất; không được phép trùng
lặp. Không được dùng chữ hoa để đặt tên biến. Các tên NEWVAR,
NewVar, và newvar được xem là giống nhau.
Màn hình quản lý biến
(variables view)
Là nơi quản lý
các biến cùng
với các thông số
liên quan đến
biến. Trong màn
hình này mỗi
hàng trên màn
hình quản lý
một biến, và
mỗi cột thể hiện
các thông số
liên quan đến
biến đó
Loại biến (type): Thể hiện
hình quản lý
một biến, và
mỗi cột thể hiện
các thông số
liên quan đến
biến đó
Số lượng con số sau dấu
phẩy được hiễn thị
(Decimals
Màn hình quản lý biến
(variables view)
Là nơi quản lý
các biến cùng
với các thông số
liên quan đến
biến. Trong màn
hình này mỗi
hàng trên màn
hình quản lý
một biến, và
mỗi cột thể hiện
các thông số
liên quan đến
biến đó
Nhãn của biến (label): Tên
biến chỉ được thể hiện tóm tắc
bằng ký hiệu, nhãn của biến
cho phép nêu rõ hơn về ý nghĩa
của biến
Màn hình quản lý biến
các thông số
liên quan đến
biến đó
Giá trị khuyết (Missing): Do thiết
kế bảng câu hỏi có một số giá trị
chỉ mang tính chất quản lý, không
có ý nghĩa phân tích, để loại bỏ các
biến này ta cần khai báo nó như là
giá trị khuyết (user missing). SPSS
mặc định giá trị khuyết (system
missing) là một dấu chấm và tự
động loại bỏ các giá trị này ra khỏi
các phân tích thống kê.
Màn hình quản lý biến
(variables view)
Là nơi quản lý
các biến cùng
với các thông số
liên quan đến
biến. Trong màn
hình này mỗi
hàng trên màn
hình quản lý
một biến, và
mỗi cột thể hiện
các thông số
liên quan đến
biến đó
Kích thướt cột
(columns): Cho
hình quản lý
một biến, và
mỗi cột thể hiện
các thông số
liên quan đến
biến đó
Dạng thang đo
(measures): Hiễn thị
dạng thang đo của giá
trị trong biến
Màn hình hiện thị kết quả
(output)
Các phép phân
tích thống kê sẽ
cho ra các kết
quả như bảng
biểu, đồ thị và
các kết quả kiểm
định…., các kết
quả này sẽ được
truy xuất ra một
màn hình, và
được lưu giữ
dưới một tập tin
khác (có đuôi là
.SPO). Màn hình
này cho phép ta
xem và lưu giữ
các kết quả
phân tích
• Kiểm tra dữ liệu
• Thống kê mô tả
• Kiểm định thống kê
• Kiểm soát quá trình sản xuất
• Phân tích hồi quy
• Dãy số thời gian
3.1. Kiểm tra dữ liệu (Data Screening)
Xác định những giá trị vượt trội (Outliers) và các giá trị lỗi
(Roque values)
• Sử dụng công cụ bảng phân bổ tần xuất ngoài việc để đếm số lần
xuất hiện của từng giá trị riêng biệt, nó còn giúp ta tìm ra các giá
trị lỗi hoặc các giá trị mã hóa sai sót hoặc không mong đợi
• Khảo sát hai hay nhiều biến cùng một lúc. Đối với các biến dạng
định danh (nominal) hoặc thứ bậc (ordinal) sử dụng công cụ
bảng chéo ta có thế xác định được những sự kết hợp phi lý giữa
hai hoặc nhiều biến
3.2 Thống kê mô tả
(Descriptive Statistics)
• Mô tả dữ liệu (đo lường độ tập trung hay phân
tán, tỷ lệ %, mối quan hệ giữa các biến,…).
• Cần phải nắm được loại biến (loại thang đo
của biến)
3.3 Kiểm định các so sánh trung bình
mẫu (Tests for Comparing Means)
Kiểm định t cho một mẫu, cặp mẫu và hai mẫu ngẫu nhiên độc lập
• Sử dụng kiểm định t cho hai mẫu ngẫu nhiên độc lập (Independent
Samples T Test) so sánh giá trị trung bình của một biến riêng biệt
theo một nhóm có khác biệt hay không đối với giá trị trung bình của
biến riêng biệt đó theo một nhóm khác.
• Công cụ kiểm định t cho cặp mẫu (Paired-Samples T Test) kiểm