1
THỐNG KÊ CƠ BẢN ỨNG DỤNG
THỐNG KÊ CƠ BẢN ỨNG DỤNG
TRONG NGHIÊN CỨU KHOA HỌC
TS. Hoàng Văn Minh, Đại học Y Hà nội
MỤC TIÊUMỤC TIÊU
Sau bài học, họcviêncókhả năng
Trình
bày
một
số
khái
niệm
cơ
bản
Trình
bày
một
số
khái
niệm
cơ
bản
về thống kê
Lựachọn đượctrắcnghiệmthống
kê phù hợpvớimục tiêu nghiên
cứu
2
Khái niệmKhái niệm
“Statistics is a mathematical science pertaining to
the
Số liệu, thông tin và bằng chứng
huyết
áp
của
từng
người
trong
một
nhóm đối tượng NC
Giá trị trung bình của chiều cao, cân
nặng, tỷ lệ cao huyết áp của cả
nhóm đối tượng NC
Số
liệu
Thông tin
Bằng chứng
Giá trị trung bình của chiều cao, cân
nặng, tỷ lệ cao huyết áp của một
cộng đồng so với các năm trước,
hoặc với cộng đồng khác.
CácCác dạngdạng sốsố liệuliệu((biếnbiếnsốsố))
Số liệu định lượng
(
ordinal
)
ạ g
()
Nhị phân (binominal)
5
Dạng số liệu ?Dạng số liệu ?
Biến sốĐịnh lượng Định tính
Rời rạcLiên tục Định
dh
Thứ
h
Nhị phân
d
an
h
h
ạng
Số răng
Tuổi
Hàm lượng
đường máu
Học vấn
C hết á
C
ao
h
uy
ết á
tính củamẫurađặctínhcủaquầnthể
Thống kêThống kê
Q
uần thể
Q
Chọn mẫu Thống kê
suy luận
Mẫu
Thống kê mô tả
7
Thống kê mô tả biến định lượngThống kê mô tả biến định lượng
Đolường độ tập trung (Location)
Trung
bình
(mean)
Trung
bình
(mean)
Trung vị (median)
Mode
Đolường độ phân tán (Spread )
Khoảng số liệu(range)
Độ lệch chuẩn (Standard deviation)
Phương sai (Variance)
Trung bìnhTrung bình
34 27 45 55 22 34
8
Trung vịTrung vị
Dãy số lẻ
1
120 140 120 150
130
160
180
165
130
160
180
165
170 150
Khoảng số liệu 120-180
Độ lệch chuẩnĐộ lệch chuẩn
)
(
2
1
)
(
2
−
−
=
∑
n
x
x
SD
i
10
Độ lệch chuẩnĐộ lệch chuẩn
Tính toán trun
g
bình, trun
g
vị, mode, khoản
g
số liệuvàđộ lệch chuẩn?
11
Thống kê mô tả biến định tínhThống kê mô tả biến định tính
Tầnsố
Tỷ
lệ
phần
trăm
Tỷ
lệ
phần
trăm
Bảng 2x2, nx n
Nguy cơ Kh. nguy cơ Tổng
Bệnh a b a+b
Không bệnh c d c+d
Tổng a+c b+d a+b+c+d
Thống kêThống kê
Q
uần thể
Q
Chọn mẫu Thống kê
suy luận
Mẫu
đ
đ
100
lầ
thì
it
hất
95
lầ
Khi
thự
c
hiệ
n
đ
o
đ
ạc
100
lầ
n
thì
it
n
hất
95
lầ
n
kếtquả nằm trong khoảng tin cậy
95% tin tưởng rằng giá trị thựccủaquầnthể
h ết
á
tối
đ
t
r
ị
s
ố
h
uy
ết
á
p
tối
đ
a
tỷ lệ cao huyếtáp
Phiên giảikếtquả???
KiểmKiểm địnhđịnh giảgiả thuyếtthuyết
sử dụng trắcnghiệm (test) thống kê để đưarakếtluậnvề
giả thuyếtcủa nhà nghiên cứulàchấpnhận đượchaykhông
Quần thể
Chọn mẫu
Ngoại suy
Trắcnghiệmthống kê
Mẫu NC
Chọn
mẫu
Loạibỏ sai lầmloạiI
α =0.05
á
ấ
ể
ả
ế
ú
p = probability= X
á
csu
ấ
t đ
ể
g
i
ả
thuy
ế
tHođ
ú
n
g
P<0.05 = Xác suất để giả thuyếtHođúng là < 5%
=Hoxảyrachỉ là may rủi
=Bácbỏ Ho
=Xácsuất để giả thuyếtHađúng là > 95%
=
Ha
xảy
z (1-α/2)
.01 (99) 2.576
.02 (98) 2.326
05 (95)
1 960
.
05 (95)
1
.
960
.10 (90) 1.645
Độ mạnh
(1-β)
z (1-β)
80
0 842
.
80
0
.
842
.85 1.036
.90 1.282
.95 1.645
Thống kêThống kê
Q
uần thể
Q
Chọn mẫu Thống kê
suy luận
u n
hậ
p
ở
2
x
ã
c
ủ
a
1 huyện
li
ê
n quan
đế
n
h
út
th
u
ố
c
l
á
,
chếđộăn như thế nào
Lựa chọn trắc nghiệm thống kêLựa chọn trắc nghiệm thống kê
MỤC TIÊU PHÂN TÍCH
BIẾNSỐ
tínhBiến
định
tính
4
19
Kiểm định giả thuyếtKiểm định giả thuyết
1. Hình thành giả thuyết
2. Đề xuấtmứcýnghĩathống kê
3. LựachọnTNTKthíchhợp
4. ThựchiệnTNTKvàtínhtoángiátrị p
5. Phiên giảikếtquả
6. Kếtluận
So sSo sánh, tánh, tìm sự khác biệt ìm sự khác biệt
bibiếnến địnhđịnh llượngượng
P.bố chuẩn+k.chuẩnP.bố chuẩn+k.chuẩnPhân bố chuẩnPhân bố chuẩn
1 1
nhnhómóm
>>22
nhnhómóm
1 1
nhnhómóm
ANOVA
22
nhnhómóm
>>22
nhnhómóm
Kruskal
So sSo sánh, ánh,
tìm tìm sự sự
khác biệt khác biệt
bibiếnến địnhđịnh
ÓÓ
1 NHÓM1 NHÓM CI, ZtestCI, Ztest
Giá trị mong đợi <Giá trị mong đợi <55Giá trị mong đợi >=5Giá trị mong đợi >=5
ttínhính
>1 NH
Ó
M>1 NH
Ó
M
Fisher's exact test Fisher's exact test Khi bKhi bìnhình phphươươngng
21
Phân tích tương quan
Biến định lượng:
Hệ số tương quan (r)
Hệ số tương quan (r)
pearson
spearman
Hồi quy tuyến tính
Biến định tính
Biến định tính
Tỷ suất chênh (OR), nguy cơ tương đối (RR)
Hồi quy logistic
Tương quan giữa 2 biến đ.lượng
• Nghiên cứu mối liên hệ giữa cân nặng của 20 trẻ 5 tuổi
• <0,3: tương quan yếu
•>=
0,3
-
0,5:
tương quan TB
0,3
0,5:
tương
quan
TB
• >=0,5-0,7: tương quan chặt chẽ
• >=0,7: tương quan rất chặt chẽ
23
Hệ số tương quan (r)
Tương quan của 2 biến định tính
Khi muốn tìm cường độ mối liên quan giữa hai
biến định tính=> có thể sử dụng:
biến
định
tính=>
có
thể
Nghiên cứu bệnh-chứng về mối liên quan giữa ăn thịt và
viêm ruộthoạitử
viêm
ruột
hoại
tử
25
Tỷ suất chênh - OR (tiếp)
•Nếu tỷ lệ ăn thịt ở nhóm bệnh (50/61) lớn hơn tỷ lệ này
ở nhóm chứng (16/57) có ý nghĩaTK
=>
có liên quan
ở
nhóm
chứng
(16/57)
có
ý
nghĩa
TK
–>1 Ö Yếu tố nguy cơ
–=1 Ö Không liên quan
–<1 Ö Yếu tố bảo vệ