Chương 4: Xữ lý dữ liệu
I. Các đại lượng đo lường sự phân tán
II. Ước lượng thông số đám đông từ mẫu
III.Một số phép kiểm định cơ bản
IV.Kiểm định phi tham số: Chi-square
V. Phân tích nhân tố (factor analysis)
VI.Phân tích tương quan (Regression
analysis)
Sử dụng các công cụ thống kê trong phân tích
Mục tiêu và kiểu của các câu hỏi nghiên cứu
Mục tiêu chung
Mục tiêu cụ thể
Kiểu câu hỏi/ giả thiết
Kiểu thống kê
Khác biệt Liên quan Mô tả
Mức độ liên
quan, các biến
liên quan
So sánh
nhóm
Tóm lược
dữ liệu
Quan hệ giữa các biến Mô tả
Thống kê khác biệt
(v.d. t-test, ANOVA)
Thống kê liên
quan
(v.d. tương
quan, hồi quy)
Thống kê mô
tả (v.d. trung
NXi
1
22
/)(
)1/()(
1
22
n
i
nXXis
2 2
2
2
ss
),(
2
NX
i
),(
2
X
i
2
2
pp
pp
2
2
ss
pp
• 5. Tỷ lệ
• 6. Phương sai
• 7. Độ lệch
• tiêu chuẩn
Phân phối chuẩn một đơn vị
Đo lường dạng hình của phân phối (Measures
of Shape)
• Độ lệch (skewness) đo lường độ lệch của phân phối về một
trong hai phía.
• Phân phối lệch trái (negative skew, left-skewed) khi đuôi phía
trái dài hơn, và phần lớn số liệu tập trung ở phía phải của
phân phối.
• Phân phối lệch phải (positive sknew, right-skewed) khi đuôi
phía phải dài hơn, và phần lớn số liệu tập trung ở phía trái
của phân phối.
• Khi lệch phải, giá trị sknewness dương; khi lệch trái, giá trị
– Chuyển phân phối chuẩn
tổng quát trở về phân
phối chuẩn một đơn vị
với biến ngẩu nhiên
– Tìm xác xuất P sao cho:
– Đối với phân phối chuẩn
một đơn vị, ta có
X
X
Z
)1()(
bZaP
)1()(
2/2/
ZZZP
30
n
II. Ước lượng thông số đám đông
n
n
XX
II. Ước lượng thông số đám đông
II.1.2 Ước lượng trung
bình đám đông
– Chuyển phân phối chuẩn
tổng quát trở về phân
phối t
– Tìm xác xuất P sao cho:
– Đối với phân phối t
(phân phối student), ta có
X
X
t
)1()(
btaP
t
X
t
X
n
X
n
tXtX
.,.,
)1(2)1(2
2
2
2
2
2
n
n
XX
II. Ước lượng thông số đám đông
S
II.2.1 Ước lượng tỷ lệ đám đông(Khi n nhỏhơn 30 phần tử)
– Chuyển phân phối
tổng quát về phân
phối student (t)
– Tỷ lệ đám đông sẽ
nằm trong khoảng
Ss
PnspPns
tPPtP
,
)1(,2)1(2
III. Một số phép kiểm định giả thuyết
III.1 Kiểm định trung bình và tỷ lệ đám đông
Mục đích
Phát hiện xem các giá trị trung bình/tỷ lệ của đám đông có sự
thay đổi hay không
Phương pháp tiến hành
– Lấy mẩu từ đám đông sau đó tính trung bình hoặc tỷ lệ mẩu
– Sử dụng trung bình hoặc tỷ lệ mẩu để kiểm định có sự thay
đổi về trung bình và tỷ lệ đám đông hay không
Các kỹ thuật kiểm định cơ bản
Các kỹ thuật kiểm định dùng theo loại dữ liệu và trắc nghiệm
- Sign test
- Wilcoxon
matched-pairs
test
-Median test
Mann-
Whitney U
- Kolmogorov-
Smirnov
Wald-
Wolfowitz
-Friedman
two-way
ANOVA
- Median
extension
- Kruskal-
Wallis one-
way ANOVA
Interval and Ratio - T-test
- Z test
- T-test for
paired
samples
- T-test
- Z test
- Repeated-
measured
ANOVA
- One-way
(p value > α,
không bác bỏ giả thiết H
0
).
Kiểm định ý nghĩa: các kiểu kiểm định
• Có hai loại: parametric (tham số) và
nonparametric (phi tham số).
– Parametric tests là công cụ mạnh vì xử lý các
dữ liệu dạng scale (interval, ratio).
– Nonparametric tests là công cụ xử lý các dữ
liệu dạng nominal và ordinal.
Kiểm định ý nghĩa: các kiểu kiểm định
• Parametric tests đòi hỏi một số giả định:
– Các quan sát phải độc lập với nhau.
– Các quan sát phải được rút ra từ các đám
đông có phân phối chuẩn.
– Các nhóm trong đám đông phải có phương
sai tương đương.
– Thang đo phải ở dạng scale để các tính toán
có thể thực hiện được.
Kiểm định ý nghĩa: các kiểu kiểm định
• Nonparametric tests ít đòi hỏi các giả định:
– Không đòi hỏi các quan sát phải được rút ra từ các
đám đông có phân phối chuẩn.
– Không đòi hỏi các nhóm phải có phương sai tương
đương.
– Là cách duy nhất để xử lý dữ liệu danh xưng
(nominal).
– Là cách đúng đắn để xử lý dữ liệu với thang đo thứ
tự (ordinal), mặc dù parametric có thể áp dụng được.
– Bước 2: Chọn alpha
– Bước 3: Xác định phép kiểm
định (Z hoặc t) trong trường
hợp kiểm định trung bình
III.1 Kiểm định trung bình và tỷ lệ đám đông
Trong trường hợp kiểm
định tỷ lệ đám đông,
chúng ta sẽ xác định Z
tt
hoặc t
tt
như sau
S
p
ps
tt
PP
Z
S
P
ps
tt
PP
t
],[
22/
ZZZ
tt
],[
)1(,2)1(,2/
nntt
ttt
],[
)1(,2)1(,2/
nntt
ttt