Chương 6: Chọn mẫu
Chương này sẽ tập trung thảo luận 3 vấn đề
chính sau đây:
6.1-Tại sao lại lấy mẫu? Các khái niệm cơ
bản
6.2-Chọn mẫu xác suất và chọn mẫu phi xác
suất
6.3-Xác định kích thước mẫu
6.1-Tại sao lại lấy mẫu? Các khái niệm
cơ bản
Trong một cuộc bầu cử, chỉ một phần nhỏ cử tri
được hỏi về các ý định bỏ phiếu của họ, ngay cả
khi sự quan tâm cuối cùng của người thăm dò là
ở việc đánh giá kết quả lựa chọn cuối cùng hoàn
tất về những phiếu hợp lệ ủng hộ
Sử dụng thuật ngữ thống kê, mỗi cử tri được gọi
là đơn vị, các cử tri thực tế được thăm dò được
gọi là mẫu và tập hợp toàn bộ những người hợp
lệ cho bỏ phiếu được gọi là tổng thể (tổng số)
(population).
6.1-Tại sao lại lấy mẫu? Các khái niệm
cơ bản (tt)
Sự lưa chọn các ứng cử viên trong bầu cử tổng
thống có thể được xem xét như những giá trị của
Một số chọn mẫu phi chính thức bao gồm:
(1) chọn mẫu thuận tiện;
(2) chọn mẫu phán đóan; và
(3) chọn mẫu chỉ định
Chọn mẫu thuận tiện
Chọn mẫu thuận tiện, không cần chú ý đến tính
đại diện mà chỉ chú ý đến tính thuận tiện cho
người nghiên cứu.
Chẳng hạn chúng ta có thể phỏng vấn giám đốc
kinh doanh mà chúng ta quen biết
Chọn mẫu phán đoán
Chọn mẫu phán đoán là sự phán đoán của người
nghiên cứu về các nhóm đại diện để chọn số đơn
vị đại diện trong tổng số của các nhóm phán đoán
Đơn giản là chúng ta cố gắng để chọn số đối
tượng mà chúng ta nghĩ rằng số đối tượng đó có
thể đại diện cho tổng thể
Thí dụ, để nghiên cứu 3 lọai doanh nghiệp-khách
hàng có quy mô doanh nghiệp theo mức lớn, vừa
và nhỏ, ngườiø nghiên cứu sẽ chọn ra 3 nhóm
doanh nghiệp -khách hàng và phán đóan rằng đó
Hạn chế chính của chọn mẫu phi xác suất là chọn
mẫu này không đưa ra cơ sở để đánh giá quy mô
giao động của mẫu và sai số ước lượng
Chọn mẫu phi xác suất có thể áp dụng cho
nghiên cứu sơ bộ hay điều tra thử, điều tra làm
rõ cơ sở các giả thuyết….
Chọn mẫu xác suất
Chọn mẫu xác suất là dựa vào lý thuyết xác
suất để lấy mẫu ngẫu nhiên
Có một số cách lấy mẫu ngẫu nhiên đó là:
(1) lấy mẫu ngẫu nhiên đơn thuần;
(2) lấy mẫu ngẫu nhiên hệ thống, và
(3) lấy mẫu ngẫu nhiên phân tầng….
Lấy mẫu ngẫu nhiên đơn thuần
Lấy mẫu ngẫu nhiên đơn thuần là cách lấy mẫu
mà mọi đơn vị phần tử trong tổng thể đều có cơ
hội ngang nhau xuất hiện trong mẫu
Thí dụ: chúng ta có thể đánh số các phần tử của
tổng thể, tương ứng với mỗi số đã được ấn định
cho từng phần tử là một “nhãn hiệu”, sau đó ta
xáo trộn các nhãn hiệu và rút ngẫu nhiên theo số
chúng ta n sẽ là 90 hoặc 150 công ty;
THÍ DỤ CHỌN MẪU NGẪU NHIÊN ĐƠN
THUẦN (tt)
(
4)Tiếp theo ta sử dụng chương trình máy tính để
chọn ngẫu nhiên 90 hoặc 150 phần tử giữa các số
từ 1-900 hoặc từ 1-1500. Chúng ta có thể sử dụng
ba hoặc bốn cột tương ứng với số tổng thể là 900
hay 1500 từ bảng số ngẫu nhiên
Nhìn từ trên xuống từ một điểm bắt đầu tùy ý, ta
liệt kê tòan bộ những chữ số nhỏ hơn 901 hoặc
nhỏ hơn 1501, đảm bảo điều kiện ta chưa liệt kê
trước đó. Khi đó bảng liệt kê sẽ có 90 hoặc 150
con số, số mẫu công ty được chọn là công ty
tương ứng với con số trong bảng liệt kê.
Lấy mẫu có hệ thống
Lấy mẫu có hệ thống là cách lấy mẫu đầu tiên là
ngẫu nhiên sau đó cứ cách k đơn vị lại chọn một
phần tử (còn gọi là chọn nhảy cóc, trong đó k là
khoảng cách bước nhảy)
Thí dụ, ta chọn 90 phần tử (công ty) trong tổng số
900 phần tử (công ty), tỷ lệ lấy mẫu khi đó sẽ là
90/900=1/10. Như vậy khỏang cách bước nhảy k
=10. Các số thứ tự của công ty được xếp từ 1 đến
900. Ở đây cần phải xác định phần tử đầu tiên là
ngẫu nhiên.
Chẳng hạn phân nhóm cây trong rừng theo độ
tuổi để chọn mẫu khảo sát. Như tầng 1 gồm tổng
số cây trên 100 tuổi, tầng 2 gồm tổng số cây từ 50
tuổi đến 100 tuổi, tầng 3 gồm tổng số cây dưới 50
tuổi
Sau đó áp dụng phương pháp chọn mẫu ngẫu
nhiên đơn thuần cho mỗi tầng. Cách chọn mẫu
này có độ chính xác cao và có thể phân tích kết
quả theo các tầng so sánh sự khác biệt…
6.3-Xác định kích thước mẫu
Kích thước mẫu được tăng lên, trên tổng thể sẽ
hoàn thiện chất lượng kết quả thống kê
Nếu mục đích của điều tra là ước tính tham số
chưa biết, thì chất lượng của kết quả là quan hệ
nghịch với kích thước của sai số ước tính cho
phép
Sai số ước tính bằng giá trị tuyệt đối của khoảng
cách biệt giữa thông số chưa biết và thông số ước
tính. Nhưng khi tham số chưa biết thì sai số ước
tính cũng là chưa biết. Vì vậy xác định xác suất là
cần thiết.
6.3-Xác định kích thước mẫu (tt)
Sai số cho phép có thể tính bằng %, và thường
được ký hiệu là và độ tin cậy cho phép tính
bằng xác suất P
pqN
n
Z
Z
22
2
.
6.3-Xác định kích thước mẫu (tt)
Kích thước mẫu tối thiểu theo công thức trên là
lớn nhất khi mẫu số là nhỏ nhất và tử số là cao
nhất. Ta có thể thấy giá trị lớn nhất của tử trong
công thức trên xuất hiện khi p=q=1-p hay p=0,5,
như vậy n sẽ là:
(6.2)
22
25,05,015,0
Xác định kích thước mẫu trong điều tra mức
sống dân cư tại một huyện có 25.000 hộ dân, với
sai số cho phép là 1% và độ tin cậy là 95%
Có một số cách xác định kích thước mẫu trong
thí dụ này:
Cách thứ nhất: Ta không tính đến quy mô tổng
thể N. Tra bảng tính kích thước mẫu, với =0,01;
p= 0,95, ta có n=9.603.