26
CHỌN MẪU TRONG NGHIÊN CỨU KHOA HỌC
Đa số các nghiên cứu đều nhằm phục vụ hay đáp ứng cho từng quần thể rộng lớn,
song ta chỉ có thể chọn một số nào đó có thể đại diện cho quần thể đó là mẫu nghiên
cứu. Mẫu chọn được như thế nào, và cỡ mẫu là bao nhiêu? để có thể đại diện cho quần
thể song ít mắc sai số và kinh tế, hiệu quả.
Cách chọn mẫu dù là m
ẫu ngẫu nhiên đơn, mẫu phân tầng hay mẫu chùm đều
phải dựa vào quần thể.
Quần thể có quy mô nhỏ dần từ quần thể tổng quát, quần thể định danh, quần thể
có nguy cơ, quần thể có nguy cơ cao và cuối cùng là quần thể bị đe doạ.
Việc chọn mẫu nghiên cứu tuỳ thuộc vào mục tiêu nghiên cứu và khả năng
nghiên cứu, song người ta thường chọn m
ẫu trong khu vực quần thể bị đe doạ làm
nhóm chủ cứu để so sánh với nhóm chứng.
Thông thường mẫu được chọn dựa trên hai cơ sở quan trọng là kết quả nghiên
cứu trước đó hay kết quả ước định, kết quả nghiên cứu thử nghiệm và xác suất cho
trước do ta dự định.
Ví dụ: Ta có thể chọn mẫu trong nghiên cứu bệnh sất rét ở trẻ em dưới 5 tu
ổi khi
ta biết tỷ lệ bệnh sốt rét trong trẻ em tại vùng đó khoảng 20% và ước lượng có độ tin
cậy ở mức > 95%.
1. Các loại mẫu trong nghiên cứu
1.1 Mẫu không xác suất
- Mẫu mục đích: Là loại mẫu nghiên cứu không xác suất mà dựa vào mục đích
của nhà nghiên cứu. Không có các yêu cầu của chọn mẫu và tính cỡ mẫu (Mẫu chủ
đích).
- Mẫu kinh nghiệm: Là loại mẫ
u nghiên cứu không xác suất mà dựa vào kinh
Là cơ sở cho các kỹ thuật chọn mẫu khác.
Tốn kém và tốn thời gian
Không thuận tiện
Không thích h
ợp cho các bệnh phân bố theo tuổi, giới
1.4. Mẫu hệ thống
Định nghĩa: Là loại mẫu nghiên cứu giống như mẫu ngẫu nhiên đơn nhưng các
cá thể được chọn cách nhau một khoảng cách nhất định.
Cách tiến hành chọn:
Tính khoảng cách mẫu k = N/n
Chọn số ngẫu nhiên đầu tiên < k (theo bảng số ngẫu nhiên)
Tìm các số sau bằng số trước nó + k
Ví dụ: Chọn 7 cá thể trong số
70 người để nghiên cứu ta làm như sau:
Tính k = N/n = 70/7 = 10
Chọn trên bảng số được một số ngẫu nhiên nhỏ hơn 10, giả sử là 8 đó chính là cá
thể đầu tiên, cá thể thứ 2 là 8 + 10 = 18, cá thể thứ 3 là 28 cá thể cuối cùng là 68.
Ưu nhược điểm:
Dễ triển khai hơn mẫu ngẫu nhiên đơn
28
Không thích hợp cho các đặc trưng nghiên cứu phân bố theo chu kỳ.
1.5. Mẫu tầng
Định nghĩa: Là một mẫu nghiên cứu mà quần thể được chia làm nhiều tầng, riêng
biệt, mỗi tầng có số lượng cá thể nhất định được chọn vào mẫu nghiên cứu.
Cách tiến hành chọn:
Định nghĩa tầng: tầng là tập hợp các cá thể tương đối giống nhau về các đặc
trưng nghiên cứ
u.
Phân bổ các cá thể vào các tầng: cân xứng và không cân xứng.
nhà gần nhà.
Ví dụ:
Trong cuộc đánh giá tiêm chủng mở rộng tại huyện X năm 1988, mẫu chùm được
chọn để đánh giá tỷ lệ tiêm chủng đạt được cho trẻ dưới 10 tuổi. Người ta làm như ví
dụ
sau:
Tỉnh TN có 113 xã và phường thì các cụm điều tra nằm trong 113 xã đó. Từ số
lượng 113 xã, ta chọn một cách ngẫu nhiên 30 cụm mẫu đại diện cho 113 xã của toàn
tỉnh TN.
(1) Trước hết ta lập danh sách 113 xã, phường với số dân của từng xã.
Tương ứng với hàng ngang của xã, ta cộng dồn dân số lại cho đến hết.
Danh sách các cụm trong tỉnh TN (cả các trang bên)
TT Tên xã (viết tắt) Dân số Cộng dồn dân số Cụm mẫu
1
2
3
4
5
6
7
8
a
b
c
ơ
e
f
g
h
12.888
63.71 1
Cụm 3
11
12
l
m
1 1.520
13.767
75.231
88.998
Cụm 4
13
14
o
p
13.053
10.000
92.051
112.051
Cụm 5
15
16
17
q
r
s
2.207
621
3.193
120.654
123.436
126.721
131.137
134.325
135.504
136.116
139.309
Cụm 7
30
26 Q 17.808 157.117 Cụm 8
27
28
29
E
E
T
3.914
15.006
9.584
A
S
D
Đ
F
3.954
2.115
507
3.516
14.402
2.575
3.105
231.452
233.567
234.074
237.672
251.992
254.567
257.672
Cụm 11 Cụm 12 Cụm 13
40
41
42
G
C
V
4.670
757
12.037
2. 1 55
282.519
283.276
295.313
297.468
Cụm 15
50
51
52
53
54
55
56
B
N
M
qư
qe
qr
qt
3.702
2.262
3.154
322.024
324.222
334.113
337.267
Cụm 17
61
62
63
64
65
qp
qa
qd
qs
qf
2.548
1.034
2.415
4.325
13.233
339.815
840.849
343.264
347.589
360.822
31
71
72
qz
qx
784
3.423
375.951
379.374
Cụm 19
73
74
75
76
77
qc
qv
qb
qn
qm
4.0987
4.540
2.322
3.987
4.211
383.472
388.012
390.334
394.321
406.512
410.825
410.587
419.234
Cụm 21
85
86
ep
ea
2.530
16.983
421.764
438.747
Cụm 22
87
88
89
90
91
es
ed
ef
êg
Cụm 24
95
96
97
98
99
100
101
el
ez
ex
ec
ev
eb
en
747
4.451
4.425
3.860
2.835
1.725
3.988
479.292
483.743
488.168
492.028
494.863
496.588
500.576
Cụm 26
108 zy 23.447 544.008 Cụm 27
109 zy 13.689 557.697 Cụm 28
110
111
zu
zi
14.696
20.000
572.393
592.303
Cụm 29
112
113
zp
zx
3.990
4.754
596.383
601.137
Cụm 30
Số cộng dồn dân số 601.137
(2) Tính khoảng cách mẫu theo công thức sau đây:
2.1. Mẫu nghiên cứu cho một tỷ lệ
Theo thường lệ trước hết người ta phải ấn định một ngưỡng chính xác 2 cho tỷ lệ
p. Người ta thường lấy ngưỡng 0,05 hoặc 0,01. Với ngưỡng này giá trị “X”, tương ứ
ng
Z
1 -
α
/2
sẽ là 1,96 hoặc 2,33.
Công thức tính cỡ mẫu thông thường được ứng dụng như sau:
Trong đó:
33
P = tỷ lệ ước định
q = 1 - p
e = ngưỡng chính xác (có thể ký hiệu là d)
Số 1 của công thức là số dư
Mẫu nên có:
Số dư là để cho mẫu chắc chắn có xác suất < xác suất ấn định.
Trong công thức có p là tỷ lệ ước định trong quần thể. Ty lệ p có được là từ
nghiên cứu trước hoặc nghiên cứu thăm dò (Philot study). Nếu không có nghiên cứu
trước thì ta phải lấy cỡ mẫu tối đa bằng cách chọn p = 0,5
Ví dụ: Muốn tìm khả năng gây độc của một chất độc x có trong môi trường người
ta đã đem nghiên cứu trên chuột xem tỷ lệ sống sót sau 1 tuần với mức tin cậy là 95%.
Một nghiên cứu tương tự đã cho biết là tỷ lệ sống sót là 20%. (P = 0,2). Độ chính xác
được ấn định e = 0,03. Vậy cần có n chuột là bao nhiêu con?
Ứng dụng công thức ta có:
0,2(1-0,2)
nhiêu?) sau đó áp dụng công thức:
Trong đó:
S
2
: Phương sai ước định
e
2
: sai số ước định
Ví dụ: Cần n đủ để điều tra chiều cao thanh niên khu vực. Khi ta biết một điều tra
thăm dò cho thấy s = 5cm. Ta đặt độ chính xác của pháp đo e = 0,5cm và ngưỡng xác
suất là 0,05, ứng dụng trong công thức.
Vậy cần nghiên cứu với mẫu từ 385 thanh niên trở lên sẽ có kết quả có xác suất
p < 0,05. Như vậy muốn tăng độ chính xác lên 0,25 cm ta phải khám gấp 4 lần nhiều
hơn (trên 1537 người).
3.2. Mẫu nghiên cứu cho 2 quần thể hoặc 2 mẫu trong một quần thể
Tương tự với một mẫu ở một quần thể khi tính cỡ mẫu người ta cũng cần các
thông tin như vậy
ở hai khu vực. Thường thì hai mẫu có cỡ mẫu tương tự: nA = nB.
Công thức cỡ mẫu:
Trong đó:
S
2
A : Phương sai đối với quần thể A
S
2
B : Phương sai đối với quần thể B
Ví dụ: Cần tìm mẫu đủ để nghiên cứu thời gian phản ứng ở hai nhóm thanh niên,
o
hoặc OR ta có thể
tính giá trị chưa biết thông qua công thức sau:
5. Tính cỡ mẫu cho nghiên cứa thuần tập (Cohort study)
Công thức được áp dụng như sau:
Trong đó:
p
1
: Tỷ lệ các cá thể phơi nhiễm với yếu tố nguy cơ được ước lượng cho nhóm
bệnh.
p
o
: Tỷ lệ các cá thể phơi nhiễm với yếu tố nguy cơ được ước lượng cho nhóm
chứng (Giá trị pl và tro có thể được lấy từ kết quả từ các nghiên cứu trước đó hoặc
nghiên cứu thử).
ε: Mức độ chính xác mong đợi [chênh lệch cho phép giữa tỷ suất chênh (OR)
thực của quần thể và OR thu được từ mẫu ].
Chú ý: Trong trường hợp chỉ biết một trong hai giá trị
p
1
và p
o
hoặc OR ta có thể
tính giá trị chưa biết thông qua công thức sau:
p
1
= (RR) p
o
CSHQ%(B) ở nhóm đối chứng, không can thiệp, sau đó tính các hiệu số CSHQ% (A
i
)
CSHQ% (B
i
) để xác định hiệu quả thực sự cho từng giải pháp can thiệp đã áp dụng.
37
CÁCH THU THẬP VÀ TRÌNH BÀY SỐ LIỆU NGHIÊN CỨU
1. Thu thập số liệu
Những số liệu nghiên cứu và minh chứng có thể thu được từ nhiều nguồn, cách
khác nhau với các phương pháp nghiên cứu hồi cứu hoặc nghiên cứu hiện tại thông
qua điều tra ở thời điểm nào đó, đồng thời cũng có thể qua các loại xét nghiệm hoặc
thực nghiệm như: xét nghiệm máu, nước tiểu phỏng vấn đối tượng nghiên cứu, khám
đối tượng nghiên cứu, các,thông tin từ sổ sách, tạp chí, báo cáo bệnh án Tuy nhiên
phương pháp thường áp dụng ở cộng đồng với chi phí thấp là phương pháp “Điều tra
bằng phiếu hỏi”.
2. Điều tra bằng phiếu hỏi
Mỗi cuộc điều tra đều có mục tiêu riêng. Dựa vào mục tiêu nghiên cứu mà người
nghiên cứu sẽ soạn thảo những bộ câu hỏi để làm sao thu thập được đủ thông tin đ
áp
ứng được mục tiêu nghiên cứu. Câu trả lời cho các câu hỏi này chính là các chỉ số, các
biến số nghiên cứu.
Thông tin có thể thu thập theo cách trực tiếp (phỏng vấn) hoặc gián tiếp (qua thư,
điện thoại ). Thông thường có hai cách lập câu hỏi:
Câu hỏi có trả lời tự do tuỳ theo người được hỏi và câu hỏi có trả lời theo định
hướng của người nghiên cứu muốn biết. Bất kỳ loại nào thì câu h
ỏi cũng cần đạt các
yêu cầu sau:
nghiên cứu khác nhau Sai số của phỏng vấn trực tiếp tùy thuộc vào nghiên cứu viên
nhiều hơn, còn sai số của phỏng vấn gián tiếp lại tùy thuộc vào người trả lời nhiều
hơn.
Câu hỏi: Có 3 loại câu hỏi: Câu hỏi đóng, câu hỏi mở và câu hỏ
i nửa đóng (câu
hỏi bán cấu trúc)
Câu hỏi đóng: Câu hỏi kiểu này vừa đặt câu hỏi, vừa có câu trả lời sẵn để đối
tượng nghiên cứu trả lời. Loại câu hỏi này dùng cho điều tra hộ gia đình ở những nơi
dân trí thấp. Mục đích là để tìm kiếm “những điều ta cần biết” và những thông tin có
giới hạn, có tính chất phân loại, đo lườ
ng. Dạng câu hỏi này dễ xử lý và thường dùng
trong nghiên cứu y học.
Ví dụ: Chị có đủ sữa cho cháu bú không? có không
Câu hỏi mở: Câu hỏi không có câu trả lời sẵn. Dùng cho trường hợp điều tra các
cộng đồng có trình độ văn hóa cao, trong các điều tra về nhân chủng và xã hội. Câu
hỏi này dùng để tìm “những điều ta cần biết” và “những điều đối tượng nghiên cứu
muố
n nói cho ta biết”. Tuy nhiên, đối tượng nghiên cứu có thể đi chệch hướng nghiên
cứu của đề tài.
Ví dụ: Hãy cho biết lợi ích của việc nuôi con bằng sữa mẹ?
Câu hỏi nửa đóng: là câu hỏi đóng, nhưng ở cuối câu đặt câu hỏi mở.
Loại câu hỏi này thường dùng khi người nghiên cứu chưa thực sự biết hết liệu
những câu trả lời có thể sẽ là gì. Câu h
ỏi này dùng để thu thập các ý kiến, tìm hiểu thái
độ, thu lượm những ý kiến của đối tượng nghiên cứu hoặc được sử dụng khi tình
huống cần linh hoạt, ứng biến, thăm dò cho việc đặt câu hỏi đóng cho nghiên cứu diện
rộng của những nghiên cứu sau đó.
Ví dụ: Lý do chị không đến trạm y tế khám khi chị bị ốm là gì?
39
ương hay cách nói thông dụng hàng
ngày. Tránh dùng các thuật ngữ chuyên môn hoặc chữ viết tắt.
Một số lưu ý khi xây dựng bảng câu hỏi:
Tránh đặt những câu hỏi khó hiểu hoặc dễ bị hiểu sai ý: Cần thiết phải đặt câu
hỏi đó cho chính mình, cho một số người khác xem cách hiểu của họ có giống nhau
40
không, có thể trả lời được đúng vào câu hỏi như ý đồ thiết kế không. Không nên đặt
câu hỏi quá dài, vòng vo, không đi ngay vào vấn đề cần hỏi. Không nên dùng ngôn
ngữ khoa học trong giao tiếp. Cần thiết phải làm việc theo nhóm và thử lại nhiều lần
trước khi sử dụng bộ công cụ.
Ví dụ: Anh chị dự định bao lâu nữa thì sinh con?
Tránh đặt câu hỏi có tính chất gợi ý trả lời: Ví dụ: Nên tránh dùng câu hỏi “ Ch
ị
có cho rằng uống nước lã sẽ bị tiêu chảy không?”. Câu này nên hỏi lại là “uống nước
lã có thể gây bệnh gì?”
- Cần có một số câu hỏi kiểm tra lại những câu hỏi trước nếu thấy cần thiết.
- Cần sắp xếp các phần, mục, chủ đề theo những thứ tự nhất định: Thông thường,
bảng câu hỏi thường được cấu trúc theo thứ tự sau:
- Phần hành chính: các đặ
c điểm về nhân khẩu học như tuổi, giới, nghề nghiệp,
trình độ văn hóa, tình trạng hôn nhân, nơi ở, tình trạng kinh tế
- Phần các câu hỏi có tính chất mô tả: Cần lần lượt từ khái quát đến cụ thể, từ
kiến thức, thái độ đến thực hành.
- Phần các câu hỏi khai thác các thông tin có tính chất tìm nguyên nhân và các
câu hỏi có tính chất tế nhị cần để ở cuối bảng hỏi. Ví d
ụ như các câu hỏi về thu nhập,
thái độ chính trị, nguyện vọng, lòng tin, hành vi trong sức khỏe sinh sản, bệnh lây
truyền qua đường tình dục
- Độ dài của bộ câu hỏi: Nhìn chung bộ câu hỏi có độ dài hợp lý là mất khoảng
+ Tuổi
+ Giới (nam=1, nữ =2)
…
Sau này vào máy tính chỉ cần viết A1 có nghĩa là tuổi, A2 có nghĩa là giới.
2.2. Biểu mẫu thu thập thông tin (Check - list)
Có nhiều loại thông tin, mỗi loại thông tin sau này sẽ được thể hiện bằng các chỉ
số hoặc biến số
. Ngay cả một loại thông tin cũng có thể thu được từ nhiều nguồn khác
nhau. Cần có nhiều nguồn thông tin để so sánh.
Không có biểu mẫu sẵn, số liệu không thống nhất sẽ không tính toán, xử lý được
số liệu
Xuất phát từ mục tiêu nghiên cứu mà đưa ra các biểu mẫu khác nhau. Trình tự
xây dựng biểu mẫu cũng như xây dựng bảng câu hỏi. Chỉ khác là thông tin không phải
thu thập được bằng cách hỏ
i đối tượng mà bằng các số liệu có sẵn từ sổ sách hoặc
quan sát trực tiếp.
Một số lưu ý khi dùng biểu mẫu để thu thập thông tin:
Đối với các số liệu thống kê, do ít được chú ý nên việc ghi chép rất khác nhau
hoặc rất tản mạn, độ tin cậy thấp, nhiều số liệu bị giấu đi hoặc thổi phồng, nhiều số
liệu mâu thuẫn với nhau cách khắc ph
ục tốt nhất là cùng người điền số liệu vào mẫu
xem xét từng con số, kiểm tra nguồn, ghi lại nguồn số liệu nên làm nhiều lần, nếu số
liệu mâu thuẫn nhau phải hỏi lại từ đầu.
2.3. Bệnh án nghiên cứu
Bệnh án nghiên cứu là những hình thức phối hợp của hai dạng công cụ: bảng câu
hỏi và check-list. Bệnh án nghiên cứu có thể làm ngay từ đầu, trước khi thu thậ
p số
liệu nhưng cũng có thể thiết kế để phân tích lại số liệu sẵn có. Tuy nhiên, vẫn phải dựa
vào mục tiêu nghiên cứu để thiết kế bệnh án nghiên cứu.
Phần câu hỏi và phần check - list có thể xen kẽ nhau. Tuy nhiên, những câu hỏi
Y Hà Nội 2
Y Hải Phòng 3
Y Thái Bình 4
Y Huế 5
Y Tây Nguyên 6
Y Dược TP Hồ Chí Minh 7
Y Dược Cần Thơ 8
02. Mã số người được phỏng vấn:
03. Tên cán bộ
phỏng vấn:
04. Bộ môn/khoa phòng của cán bộ phỏng vấn:
05. Ngày phỏng vấn:
Điều tra viên khoanh tròn một hay nhiều tình huống trả lời mà người trả lời cho
là đúng
43
A. Những thông tin chung
STT Nội dung Trả lời
A1 Anh/chị bao nhiêu tuổi? Tuổi:
A2 Giới Nam
Nữ
1
2
A3 chuyên ngành đào tạo chính bậc đại
học của anh/chị là gì?
Đa khoa
Chuyên khoa truyền nhiễm
Chuyên khoa Da liễu
Chuyên khoa Nội
Chuyên khoa Nhi
Chuyên khoa Y tế công cộng và Y học Dự
phòng
Chuyên khoa Lao
Chuyên khoa khác (ghi rõ )
1
2
3
4
5
6
7
8
9
10
A6 Anh/chị tốt nghiệp sau đại học(bằng
cao nhất) năm nào?
Năm:
A7 Anh/chị hiện đang công tác ở bộ
môn/khoa/phòng nào?
Dịch tễ học
Sức khoẻ nghề nghiệp
Miễn dịch-sinh lý bệnh
Vi sinh
Truyền nhiễm
Huyết học
Sản
Điều dưỡng
Da liễu
STT Nội dung Trả lời
B1 Trong những nguồn thông tin dưới đây anh/chị dùng loại
nào nhiêu nhất để tìm hiểu về HIV/AIDS (chỉ chọn một)
Tài liệu chuyên môn
Bạn bè, đồng nghiệp
Sách giáo khoa
Các tạp chí văn học
Các thông tin trên mạng
Khác (ghi rõ ) 1
2
3
4
5
6 B2 Từ khi tham gia giảng dạy đến nay, anh/chị có tham gia
giảng dạy về HIV/AIDS không?
Có
Không 1
2
2
B4 Từ khi tốt nghiệp đại học đến nay, anh/chị có được tập
huấn thêm về HIV/AIDS không?
Có
Không 1
2
=>C1
B5 Nếu có, anh chị được tập huấn về vấn đề gì? (chọn nhiều
tình huống)
Dịch tễ học HIV/AIDS
Virus học HIV
Miễn dịch học HIV
Chẩn đoán nhiệm HIV/AIDS
Diễn tiến lâm sàng của nhiễm HIV
Phòng chống HIV/AIDS
Dự phòng phổ cập
Dự phòng và điều trị phơi nhiễm HIV nghề nghiệp
Khác (ghi rõ )
Có
1
1
1
1
45
STT Nội dung Trả lời
B7 Nếu có, những lớp tập huấn về các chủ đề gì?
Xét nghiệm
Giám sát
Tư vấn
Truyền thông GDSK
Dự phòng phơi nhiễm nghề nghiệp vớt HIV/AIDS
Chăm sóc/điều trị HIV/AIDS
Quản lý, lập kế hoạch
Sàng lọc máu
Khác (ghi rõ )
Số lần
….
….
….
….
….
….
….
….
….
Số ngày
….
….
….
….
….
….
ứng với mỗi hàng.
Phân phối chiều cao của 40 thanh niên
Danh giới nhóm Trị số trung tâm các nhóm Tần số
150,5 - 153,5cm 152 1
153,6 - 156,5 155 3
156,6 - 159,5 158 7
159,6 - 162,5 161 9
162,6 - 165,5 164 8
165,6 - 168,5 167 6
168,6 - 171,5 170 4
171,6 - 174,5 173 2
Cộng 40
46
3.2. Phương pháp trình bày bằng hình
Đây là phương pháp trình bày số liệu rất phong phú, song vẫn tạo ra cảm giác
trực quan đặc trưng dễ quan Bát Và làm nổi bật vấn đề cần xem xét. Các loại hình bao
gồm các biểu đồ, đồ thị, tranh ảnh
+ Biểu đồ hình chữ nhật tương ứng với bảng phân phối một chiều. Mỗi số liệu
được đại diện bằng hình chữ nhật. Chi
ều dài hình chữ nhật tỷ lệ thuận với số liệu
Chiều rộng của các hình chữ nhật phải bằng nhau. Chỉ dẫn về số liệu ghi trên trục tung
hoặc diện tích hình chữ nhật (hình l.1). A: Chuột 3 tháng tuổi
B: Chuột 6 tháng tuổi
C: Chuột ở tuổi sinh đẻ
đồ:
48
Trong Y học thường có bản đồ dịch tễ cho ta biết tình hình bệnh dịch định tính
hoặc bán định lượng tại khu vực nào đó (hình l.5).
Hình 1.5. Bản đồ dịch tễ học sốt rét ở huyện A
Ngoài các loại biểu thị trên người ta còn có thể biểu diễn số liệu nghiên cứu dưới
dạng giản đồ, đồ thị dồn, đồ thị hình gậy