THỐNG KÊ CƠ BẢN VÀ
PHÂN TÍCH SỐ LIỆU
PGS. TS. Hoàng Văn Minh
Hà nội- 2013
NỘI DUNG
1. Khái niệm cơ bản về thống kê
2. Lựa chọn trắc nghiệm thống kê
3. Tính toán chỉ số nghiên cứu cơ bản
1
Trình bày và phiên giải?
Nam
n(%)
Nữ
n(%)
Chung
n(%)
Có bệnh
40 (66,7)
20 (33,3)
60 (100)
Thống kê
“Phân môn toán học có nhiệm vụ thu thập,
phân tích, phiên giải và trình bày số liệu”
Thống kê
3
Số liệu là đối tượng chính của thống kê
Biến số# Hằng số
Các dạng số liệu (biến số)
Số liệu định lượng
Rời rạc (discrete): không có giá trị thập phân
Liên tục (continuous): Có giá trị thập phân
Số liệu định tính
Danh mục (nominal, categorical)
Thứ hạng (ordinal)
Nhị phân (binominal)
4
Dạng số liệu ?
Biến số
Mẫu
Là 1 phần của quần thể, bao gồm những cá
thể mà chúng ta sẽ nghiên cứu
5
Thống kê mô tả- suy luận
Thống kê mô tả (Descriptive statistics):
Kỹ thuật dùng để mô tả các đặc tính
của mẫu
Thống
kê
suy
luận
(Inferential
statistics): Quá trình suy luận từ đặc
tính của mẫu ra đặc tính của quần thể
Thống kê
Quần thể
Chọn mẫu
Thống kê
suy luận
Mẫu
1, 5, 2, 10, 8, 7
1, 2, 5, 7, 8, 10
trung vị= ((5 + 7)/2 = 12/2 = 6)
Mode
Giá trị xuất hiện nhiều nhất
12, 12.5, 11,
13, 12.5
-> Mode = 12.5
8
Khoảng số liệu (biên độ)
120 140 120 150
130 160 180 165
170 150
Khoảng số liệu 120-180
Độ lệch chuẩn
SD
( x x)
2
- 1.5
- 1
3.5
(x -TB)2
0.25
1
0.25
2.25
1
12.25
17
SD = √ 17/(6-1) =1.84
Ví dụ
Điểm kiến thức
120
130
170
130
170
150
120
180
150
160
Chọn mẫu
Thống kê
suy luận
Mẫu
Thống kê mô tả
12
Ước lượng khoảng-khoảng tin cậy
(confidence interval)
Thường chọn khoảng tin cậy 95% (95%CI)
Khi thực hiện đo đạc 100 lần thì it nhất 95 lần
kết quả nằm trong khoảng tin cậy
95% tin tưởng rằng giá trị thực của quần thể
nằm trong khoảng tin cậy
95%CI= Trung bình± 1,96*sai số chuẩn
13
Sai số chuẩn (standard errors)
95%CI= Trung bình± 1,96*sai số chuẩn
Ví dụ: Khoảng tin cậy (CI)
Nghiên cứu về kiến thức SDT trên 150
người cho kết quả sau:
Điểm trung bình là 900 (sd=2.5)
Ví dụ
Giả thuyết Ho:
Giả thuyết Ha:
Sai lầm
Thực tế
H0 đúng
H0 sai
Sai lầm II ()
Sai lầm I ()
Quyết định
Chấp nhận H0
Loại bỏ H0
16
Mức ý nghĩa
thống kê ()
z (1-/2)
.01 (99)
2.576
.02 (98)
2.326
.05 (95)
1.960
.10 (90)
1.645
Độ mạnh
(1-)
z (1-)
.80
0.842
Mục tiêu
Xác định mối liên quan
Xác định sự khác biệt
So sánh điểm số thực hành
trước và sau can thiệp?
Điểm kiến thức liên quan đến
tuổi, trình độ, tuyến công tác?
Lựa chọn trắc nghiệm thống kê
MỤC TIÊU
BIẾN SỐ
Xác định sự khác biệt
1
Biến định lượng
2
3
Xác định liên quan
4
Biến định tính
test
ttest đlập
ttest g.cặp
Đ.lập:
MannWhitney
test
Gh. cặp:
Sign test
Wilcoxon
test
Ph bố
Chuẩn
ANOVA
(ph.sai đ
nhất)
Chuẩn &
K chuẩn
KruskalWallis test
Kiểm định phân bố số liệu
20
Tổng
Tỉnh
4
5
9
Huyện
3
3
6
Tổng
7
8
15
Giá trị mong đợi = (Tổng hàng * Tổng cột) / Tổng chung
Xác định mối liên quan
3. Biến định lượng:
tương quan yếu
tương quan TB
tương quan chặt chẽ
tương quan rất chặt chẽ
Hệ số tương quan (r)
23
Tương quan của 2 biến định tính
Khi muốn tìm cường độ mối liên quan giữa hai
biến định tính=> có thể sử dụng:
– Tỷ suất chênh: OR
– Nguy cơ tương đối: RR
Tốt
Không tốt
Tổng
Tỉnh
4
5
9
TK mô tả
(Đặc tính của
mẫu)
Định lượng
(Trung bình, trung vị,
mode, biên độ, độ lệch
chuẩn, phương sai)
Định tính
(Tần số, tỷ lệ %)
Định lượng
se= sd/sqrt(n)
Khoảng tin cậy
(Trung bình ± 1,96* SE)
Định tính
se=sqrt(p*(1-p)/n)
Phân tích
thống kê
Phân bố chuẩn
(ttest)
1 nhóm
Phân bố không chuẩn
(sign test, Wilcoxon test)
sai không đồng nhất
(Kruskal-Wallis test)
Định lượng
Phân tích tương quan
Định tính
(OR, RR, hồi quy logistic)
Phân bố chuẩn
(Hệ số tương quan
pearrson, hồi quy tuyến
tính)
Phân bố không chuẩn
(Kruskal-Wallis test)
Phân bố không chuẩn
(Hệ số tương quan
spearman, hồi quy tuyến
tính chuyển dạng)
25