Nghiên cứu khoa học - Chọn mẫu và tính toán có mẫu - Pdf 12

CHỌN MẪU VÀ
TÍNH TOÁN CỠ MẪU
Chọn mẫu?
 Nếu tất cả các cả thể của một quần thể đều
giống nhau, chúng ta có một quần thể thuần
nhất (homogenous). Khi đó, đặc tính của mỗi
cá thể cũng chính là của quần thể. Không có sự
khác nhau/ giao động tính chất giữa các cá thể.
Chọn mẫu?
 Khi các cá thể trong một quần thể khác nhau, chúng ta có
một quần thể hỗn tạp/ không thuần nhất (heterogeneous).
Khi đó đặc tính của một cá thể bất kỳ không mang tính đại
diện cho cả quần thể. Có sự khác nhau/ giao động giữa
các cá thể.
 Nếu muốn mô tả đặc tính quần thể, khi không thể quan sát
được tất cả các cá thể, người ta phải chọn một số lượng
cá thể ít hơn trong khả năng, đại diện “tốt” cho tất cả các
cá thể của quần thể để quan sát.
Chọn mẫu?
Quần thể
Mẫu
Sử dụng dữ liệu/ thông tin của một số ít
tiếp cận được để nói về số đông mà
không thể tiếp cận hết
Chọn mẫu
Là cái
chúng ta
muốn biết
Là cái mà
chúng ta
quan sát

thể, lựa chọn từ một quần thể trên một đặc tính mẫu quan tâm.
 Đặc tính mẫu: Là cơ sở để xác định, lựa chọn cá thể của quần
thể vào một mẫu, có số lượng cá thể ít hơn, ví dụ cá thể một
quần thể người có thể là cá thể người, hộ gia đình, làng/ xóm
 Danh sách/ khung mẫu: Là danh sách các cá thể của một
quần thể, giúp hỗ trợ kỹ thuật cho quá trình chọn mẫu
 Cỡ mẫu: Là số lượng cá thể được lựa chọn từ một số lượng
xác định/ không xác định cá thể của quần thể vào một tập hợp
mẫu.
 Sức mạnh mẫu: Là mức độ suy diễn kết quả thống kê trên mẫu
thành kết quả của quần thể
Phân loại các phương pháp
chọn mẫu
Chọn mẫu
Ngẫu nhiên
Ngẫu nhiên
đơn
Theo cụm
Hệ thống Phân tầng
Không ngẫu
nhiên
Chỉ tiêu
Chủ đích
Thuận tiện
Ném bóng
tuyết
Chọn mẫu ngẫu nhiên
 Chọn mẫu ngẫu nhiên ñơn
 Đảm bảo mỗi cá thể của quần thể ñược
lựa chọn với xác suất như nhau vào mẫu

 Chi phí hợp lý, hay ñược sử dụng
 Tính gía trị cao, xác ñịnh ñược sai số
thống kế
 Các cá thể dễ tiếp cận
 Hạn chế
 Sai số chu kỳ do bản thân danh sách cá
thể cũng có thể có tính chu kỳ
 Yêu cầu danh sách cá thể của quần thể
 Chọn mẫu phân tầng
Chia quần thể theo một đặc tính cụ thể thành các
nhóm/ tầng (strata) (Ví dụ: Chia quần thể sinh
viên trường ĐHY Hà Nội thành 3 nhóm/ tầng: học
viên tiến sĩ, học viên thạc sĩ và học viên đại học).
Các cá thể trong mỗi tầng đồng nhất, nhưng
không đồng nhất giữa các tầng.
Có thể áp dụng chọn mẫu ngẫu nhiên đơn hay
chọn mẫu hệ thống ở mỗi tầng (strata). Số mẫu
mỗi tầng tham gia vào tổng mẫu có thể bằng
nhau (chọn mẫu phân tầng không cân xứng) hay
tỷ lệ với số cá thể của mỗi tầng (chọn mẫu phân
tầng cân xứng)
Tầng 1
Tầng 2
N= 2000 N = 6000
Chọn mẫu phân tầng không cân xứng
1000 1000
Tầng 1
Tầng 2
N= 2000 N = 6000
Chọn mẫu phân tầng cân xứng

tiểu… cụm, và danh sách cá thể của ñơn vị cụm
cuối cùng
 Xác ñịnh ñược ñặc ñiểm của cả cụm và quần thể
 Ưu tiên dùng khi quần thể quá lớn, ví dụ như cả
một quốc gia.
 Hạn chế
 Sai số lớn hơn so với các phương pháp ngẫu
nhiên khác
Phân loại các phương pháp
chọn mẫu
Chọn mẫu
Ngẫu nhiên
Ngẫu nhiên
đơn
Theo cụm
Hệ thống Phân tầng
Không ngẫu
nhiên
Chỉ tiêu
Chủ đích
Thuận tiện
Ném bóng
tuyết
Chọn mẫu không ngẫu nhiên
 Chọn mẫu thuận tiện
 Cá thể ñược lựa chọn vào mẫu một cách
“thuận tiện”, sẵn có và dễ tiếp cận.
 Tại sao dùng: nhanh và chi phí thấp
 Phải giải trình và ñánh giá giá trị nếu
chọn mẫu thuận tiện.

 Không yêu cầu danh sách cá thể trong
quần thể
 Có phần nào tính chất của chọn mẫu
phân tầng
 Hạn chế
 Không ño lường và giải trình ñược biến
thiên và sai số
 Chọn mẫu “Ném bóng tuyết“
(Snowball sampling)
 Chọn mẫu bắt ñầu từ một cá thể, ñược
chọn một cách ngẫu nhiên hay không
ngẫu nhiên. Các cá thể tiếp theo ñược
chọn từ cá thể ban ñầu hay trước ñó,
giống như trò chơi ném bóng tuyết, ai
trúng thì ñược lựa chọn.
 Ưu ñiểm
 Chi phí thấp
 Hữu ích trong một số trường hợp cụ thể
 Dùng ñể xác ñịnh những quần thể hiếm
 Hạn chế
 Sai số do cá thể lựa chọn không hoàn
toàn ñộc lập
 Khó giải trình việc suy diễn kết quả thống
kê trên mẫu ra của quần thể.
Tính toán cỡ mẫu
 Thông tin/ dữ liệu cần thiết
 Loại nghiên cứu
 Các thuật toán thống kê sử dụng
 Đắc tính của cá thể - Thể hiện qua biến số (khác biệt cơ
bản giữa biến liên tục – biến phân hạng). Kết quả các

nghiệp
Giao diện chọn các thiết kế nghiên cứu trong phần
mền tính cỡ mẫu nâng cao
Giao diện tính toán cỡ mẫu
Ô tính ra
cỡ mẫu
Nhập giá trị
mong muốn
cho mẫu
Công thức máy
tính tính cỡ mẫu
cho thiết kế
Tính toán cỡ mẫu chuyên nghiệp
 Dựa vào phần mềm tính toán cỡ mẫu chuyên nghiệp,
trong gói SAS, hoặc chuyên nghiệp với n-query. Phần
mềm rất đắt (cỡ 1 triệu USD cho SAS, 1050 USD cho
nquery). Học viên có nhu cầu học thêm ứng dụng của
phần mềm nquery có thể liên hệ với giáo viên
 Nghiên cứu viên nhập thiết kế nghiên cứu, thuật toán
thống kê sử dụng và các dữ liệu liên quan đến biến số
vào phần mềm để tính ra cỡ mẫu. Nghiên cứu viên có
thể phân tích độ nhạy mối liên quan giữa Sức mạnh mẫu
và cỡ mẫu. Nghiên cứu viên phải có kiển thức chuyên
sâu về thiết kế nghiên cứu và các thuật toán thống kê để
có thể sử dụng được phần mềm cũng như phiên giải kết
quả.
Loại
thiết kế
Bước 1: Nhập
dữ liệu về thiết

mẫu từ các cỡ
mẫu và ngược
lại
4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp
Các ô kết
quả
Bước 4: Phân
tích độ nhạy của
mối quan hệ
Sức mạnh mẫu
– Cỡ mẫu
4 bước sử dụng phần mền nquery tính toán cỡ mẫu chuyên nghiệp
Biểu đồ của
phân tích độ
nhạy
Tính toán cỡ mẫu cơ bản
3 công thức cơ bản (phần in đậm là công thức gốc):
- Từ trung bình n = (ZS/E)
2
= (Z(d-c)/E)
2
= N(ZS/E)
2
/(N-1) =(ZS/E)
2
- Từ tỷ lệ n = Z
2
p(1-p)/ E
2
= Z

= 34,57
Ví dụ 1
Ví dụ 2
 VTV chuẩn bị phát sóng một chương trình giáo dục sức
khỏe buổi sáng.
 Kinh nghiệp từ VOV sức khỏe cho thấy, chương trình
giáo dục sức khỏe chỉ thu hút được 2 trên 10 người xem
truyền hình tại thời điểm buổi sáng.
 VTV muốn làm một nghiên cứu nhỏ để xác định được tỷ
lệ người xem chương trình của họ nếu phát sóng. Họ
muốn chọn một số người xem truyền hình để phỏng vấn.
Họ mong muốn kết quả thống kê trên mẫu phản ánh
được kết quả thực sự ở mức xê dịch +/- 5% và với độ tin
cậy 99%.
 Cỡ mẫu mà VTV cần để khảo sát là bao nhiêu?
 N = 2,58
2
x 0,2 x (1-0,2) / (2 x 0,05)
2
= 106,5
Ví dụ 3
 Xác định cỡ mẫu cần thiết để điều tra phụ nữ tại
một xã X biết về việc khám thai đủ 3 lần trước
sinh là cần thiết. Khoảng tin cậy là 95% với sai
số 5%.
 Một nghiên cứu tiến hành cách đây 2 năm cho
thấy 40% phụ nữ được hỏi nói biết khám thai đủ
3 lần trước sinh là cần thiết.
 N = 0,4 x (1-0,4) x (1,96/ (2 x 0,05))
2

- Học viên copy phần mềm “Sample Size
Determination in Health Studies”
Bài tập 1.1.1
Trung tâm y tế dự phòng huyện X muốn
xác định tỷ lệ hiện nhiễm của bệnh lao
trong nhóm trẻ em dưới 5 tuổi trên địa
bàn. Mẫu nghiên cứu cần bao nhiêu trẻ
khi kết quả của mẫu chỉ biến thiên dưới
10% so với giá trị thật của quần thể, với
95% độ tin cậy. Ngoài ra, tỷ lệ hiện nhiễm
được biết không vượt quá 10%.
Kết quả: 139
Bài tập 1.1.2
Viện vệ sinh dịch tễ trung ương muốn xác
định tỷ lệ trẻ em trong toàn quốc được
tiêm phòng đúng theo quy định. Mẫu
nghiên cứu cần bao nhiêu trẻ nếu muốn
kết quả của mẫu nghiên cứu xê dịch 5%
so với kết quả thực của quần thể, với độ
tin cậy là 95%
Kết quả: 385
Bài tập 1.3.1
Tỷ lệ thành công của một can thiệp tim mạch
ngoại khoa X được báo cáo trong y văn là 70%.
Một phương pháp mới Y được đề xuất mang
lại hiệu quả tương tự. Một cơ sở điều trị không
có năng lực ngoại khoa muốn áp dụng phương
pháp điều trị mới Y. Trước đó họ cần phải
nghiên cứu bao nhiêu bệnh nhân để kiểm định
giả thuyết phương pháp mới cũng có tỷ lệ


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status