Tài liệu Bai giang SPSS 3,5, - Pdf 86

Nội dung : Chương 3
PHƯƠNG PHÁP PHÂN TÍCH DỮ
LIỆU
Xuất phát từ cách nhìn của
một nhà nghiên cứu muốn xác đònh
các phương pháp phân tích đưa vào
ứng dụng cho dữ liệu, chứ không
phải từ cách nhìn của một kỹ thuật
viên thống kê (có thể thấu hiểu đầy
đủ hơn bản chất các phương pháp
thống kê),
3.1 Bản chất và chức năng của phân tích thống kê
Phân tích thống kê có thể được hiểu là các phương
pháp chắt lọc dữ liệu để rút ra các suy luận
logic.
Các giai đoạn chủ yếu của phân tích thống kê gồm
có:
Sắp xếp dữ liệu thô vào các thứ bậc đã được đo
lường.
Tóm tắt dữ liệu.
Áp dụng các phương pháp phân tích để làm rõ các
mối quan hệ tương hỗ và các ý nghóa đònh lượng
giữa các dữ liệu.
3.2 Quá trình phân tích dữ liệu
Xếp dữ liệu theo thứ tự
(lập dãy, lập bảng, xếp loại, tính %)Tóm tắt
dữ liệu thống kêChọn phương pháp phân
tích thích hợp (chọn các tiêu chuẩn)Phân
tích các sai biệtNghiên cứu các mối liên
hệPhân tích dữ liệu thực nghiệm
a/ Xếp dữ liệu theo thứ tự

20
5 31.5 68.8
21
2 12.5 81.3
22
3 18.8 100.0
Tổng
cộng
16 100.0
Dạng bảng này thể hiện khá rõ ràng về phân bố dãy
dữ liệu theo các mức dữ liệu khác nhau
Tần số quan sát tuyệt đối ứng với từng mức dữ liệu khác
nhau.
Tần số quan sát tương đối tính theo tỷ lệ % của từng mức
dữ liệu so với toàn bộ mẫu quan sát.
Tần số tích lũy chỉ rõ tỷ lệ % của tất cả quan sát có giá trò
nhỏ hơn hay bằng giá trò mức dữ liệu đang xem xét.
Các giá trò dữ liệu bất thường (quá lớn hay quá nhỏ) để
kiểm chứng lại vì những giá trò dữ liệu sau có thể
làm lệch kết quả phân tích thống kê, hoặc những giá
trò đúng nhưng bất thường đôi khi cần một cách xử
lý đặc biệt khác.
Các giá trò mã hóa bất thường sẽ chỉ ra sai sót do việc
nhập liệu hay mã hóa.
d/ Lập bảng so sánh toàn diện (Cross-tabulation)
Nhiều vấn đề nghiên cứu có thể được giải quyết bằng
việc lập những bảng đơn giản. Tuy nhiên, bảng đơn
giản chỉ cho biết sự phân bố của một biến số tại một
thời điểm nào đó, và có thể không đem lại đầy đủ
thông tin cho dữ liệu. Hầu hết các dữ liệu đều có thể

1500
0
-
1999
9
20000
-
24999
Trên
25000
Tổ
ng
số
Giáo dục
phổ thông
trở xuống
232 136 61 48 40 46 16 13
592
Có từ 1-3
năm trung
học
145 99 46 80 51 61 26 33
541
Tốt nghiệp
trung học
196 217 137 187 217 220 164 139
147
7
Có từ 1-3
năm cao

nhân, tức là tính ngang qua biến phụ thuộc. Tuy nhiên, đôi khi
hướng của tác nhân không dễ xác đònh, nhà phân tích có thể xem
xét tính toán tỷ lệ % theo từng hướng vì điều này có thể cung cấp
những thông tin bổ ích kết hợp với bản chất vấn đề, giúp chúng ta
tìm được biến phụ thuộc và cách tính tỷ lệ % thích hợp.
Ta có thể thêm các biến vào một bảng so sánh toàn diện và có thể
biến mới sẽ làm xuất hiện mối quan hệ mà trước đó chưa thể thấy
ngay, hay có thể bổ sung cho kết luận rút ra được từ bảng 2 biến.
Việc đưa thêm biến số vào phụ thuộc số biến và số bậc có liên
quan giữa các biến. Về lý thuyết, bảng nhiều chiều có thể được
triển khai không giới hạn, nhưng trên thực tế đến một mức độ nào
đó bảng sẽ không thể đọc và diễn dòch được nữa. Vì vậy, hầu hết
các bảng này đều chứa không quá 3 hay 4 biến.
4- Đo lường khuynh hướng hội tụ
của dữ liệu

Ba cách đơn giản nhất để đo lường khuynh
hướng hội tụ của dãy dữ liệu là tính các giá
trò mode, giá trò trung vò (median) và giá trò
trung bình (mean).

Giá trò mode
Giá trò mode là giá trò dữ liệu có tần số quan sát lớn
nhất, hoặc thuộc lớp có tần suất xuất hiện lớn
nhất.

Giá trò trung vò
Giá trò trung vò của một dãy phân phối là giá trò mà
50% giá trò quan sát được của dãy nhỏ hơn nó
và 50% giá trò còn lại của dãy lớn hơn nó.

thích hợp
Khi cân nhắc lựa chọn phương pháp phân tích
dữ liệu thích hợp, chúng ta phải dựa trên
những cơ sở sau đây:
6.1 Kỹ thuật phân tích muốn chứng minh
điều gì ?
Nhà nghiên cứu thường phải trả lời các câu
hỏi: “Những kết quả có ý nghóa gì về mặt
thống kê ?”, hoặc “Liệu các kết quả có
xuất hiện một cách ngẫu nhiên do việc
chỉ sử dụng một mẫu duy nhất không ?”.
Dữ liệu tham số và dữ liệu phi tham số
Dữ liệu gọi là thuộc loại tham số (parametric) khi
chúng được phân phối xung quanh giá trò
trung bình hoặc giá trò trung tâm của chúng
một cách đối xứng tương tự đường cong xác
suất chuẩn tắc. Khi đó, chúng ta có thể dùng
những kiểm đònh xác suất để xác đònh ý
nghóa thống kê đối với bất kỳ mẫu nghiên
cứu nào lấy ra từ tổng thể.
Dữ liệu phi tham số (non parametric) không được
phân phối theo đường cong xác suất chuẩn
tắc nên ý nghóa thống kê học của chúng phải
được xem xét bằng những kiểm đònh khác với
loại kiểm đònh căn cứ trên xác suất.
Phương pháp đơn biến : chỉ phân tích 1 biến số
duy nhất.
Phương pháp hai biến : phân tích sự liên hệ giữa
2 biến số.
Phương pháp đa biến : phân tích sự liên hệ giữa

Các bước tổng quát cần thực hiện khi
kiểm đònh giả thuyết
Phát biểu giả thuyết “không” và giả
thuyết thay thế
Chọn mức ý nghóa mong
muốn
Chọn kiểm đònh
thống kê thích
hợp
Rút ra kết
luận thống kê
về giả thuyết
“không”
Tính trò số
thống kê của
kiểm đònh
thích hợp cho
phân phối lấy
mẫu
Xác đònh vùng
bác bỏ hay các
vùng tới hạn
4
4
1
1
2
2
3
3

“không” khi nó sai lại tăng lên, dẫn đến sai
lầm loại II, và ký hiệu là β. Trong thực tế khó
đạt được sự cân bằng giữa 2 loại sai số này.
Bước 3:
Việc chọn kiểm đònh thống kê thích hợp phụ
thuộc vào :
Bản chất vấn đề: phân tích sai biệt, hoặc
nghiên cứu các mối liên hệ.
Cấp độ đo lường.
Số mẫu : 1, 2 hay nhiều hơn.
Các mẫu độc lập hay có liên hệ với nhau.
Và nhà nghiên cứu phải biết phân phối xác
suất mà số thống kê của kiểm đònh được
tính toán sẽ có liên quan đến.


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status