CHƯƠNG 2
THU THẬP DỮ LIỆU
ThS. Nguyễn Tiến Dũng
Bộ môn Quản trị Kinh doanh, Viện Kinh tế và Quản lý
Email: [email protected]
MỤC TIÊU CỦA CHƯƠNG
● Sau khi kết thúc chương này, người học có
thể:
● Phân biệt được DL thứ cấp và DL sơ cấp
● Kể tên và nêu được đặc điểm, phạm vi ứng dụng
của các kỹ thuật lấy mẫu ngẫu nhiên và không
ngẫu nhiên
● Phân biệt được DL định tính và DL định lượng và ý
nghĩa của hai loại DL này trong phân tích TK.
© Nguyễn Tiến Dũng
Thống kê ứng dụng
2
CÁC NỘI DUNG CHÍNH
● 2.1 Xác định DL cần thu thập
● 2.2 DL thứ cấp
● 2.3 DL sơ cấp
4
2.2 DỮ LIỆU THỨ CẤP
● DL có sẵn
● Tiếp cận nguồn DL -> Lấy DL về -> Xử lý
thêm
● Nguồn bên trong DN
● Nguồn bên ngoài DN
● Các tổ chức chuyên TK của nhà nước: TCTK
(gso.gov.vn), Cục TK …
● Các tổ chức không chuyên TK
● Các tổ chức dịch vụ cung cấp thông tin: TNS, A.C.
Nielsen …
© Nguyễn Tiến Dũng
Thống kê ứng dụng
5
Dữ liệu bên trong DN
● TD: SV làm TTTN phải lấy các số liệu về DN mà SV đó
thực tập
● Phần 1: GT chung về DN
●
● NC định tính
● Phỏng vấn sâu
● Thảo luận nhóm
● NC định lượng
● Quan sát
● Nhật ký
● Điều tra chọn mẫu: PV trực tiếp, qua điện thoại, qua thư
© Nguyễn Tiến Dũng
Thống kê ứng dụng
7
2.4 CÁC PHƯƠNG PHÁP LẤY MẪU
Yêu cầu đối với lấy
mẫu
• Sai số
• Chi phí
• Thời gian
© Nguyễn Tiến Dũng
Các phương pháp
lấy mẫu ngẫu
nhiên
• Lấy mẫu ngẫu
nhiên đơn giản
• Lấy mẫu hệ
thống
phần tử
● Giả thiết (giả định): có ds N phần tử, được đánh số
từ 1 tới N
● Các kỹ thuật (p.pháp) cụ thể:
● Tra bảng số ngẫu nhiên
● Rút thăm ngẫu nhiên
● Khởi tạo số ngẫu nhiên trên máy tính:
● Excel: Hàm RANDBETWEEN(a;b)
© Nguyễn Tiến Dũng
Thống kê ứng dụng
9
Bảng số ngẫu nhiên (Table of Random Numbers)
© Nguyễn Tiến Dũng
Thống kê ứng dụng
10
2.4.1.2 Lấy mẫu hệ thống (systematic sampling)
● N = 49; n = 10
● Cách 1: Lấy mẫu không quay vòng
● Tính bước nhảy k = [N/n] = 4
● Chọn ngẫu nhiên p.tử đầu tiên trong [1;k] 3
● Tính ra các p.tử tiếp theo: 7, 11, 15, 19, 23, 27, ...
lệ).
● Quy trình rút mẫu như thế nào?
● Tỷ lệ rút mẫu trong các tầng có thể không đều
● Kích thước các nhóm
● Mục đích
© Nguyễn Tiến Dũng
Thống kê ứng dụng
12
2.4.1.4 Lấy mẫu theo cụm (cluster sampling)
● Tổng thể gồm nhiều nhóm (gọi là cụm), có đặc điểm
khác nhau, mỗi cụm lại có thể bao gồm các cụm con.
● Lấy mẫu theo cụm 1 giai đoạn
● Chọn ngẫu nhiên một số cụm
● Trong các cụm đã chọn, chọn ngẫu nhiên một số p.tử
● Lấy mẫu theo cụm 2 giai đoạn
● Chọn ngẫu nhiên một số cụm
● Trong các cụm đã chọn, lấy ngẫu nhiên một số cụm con
● Trong các cụm con đã chọn, lấy ngẫu nhiên một số p.tử
● TD: N = 20 nhà x 10 tầng x 10 hộ = 2000 hộ; n = 100
● Cách 1: 1 nhà x 10 tầng x 10 hộ
● Cách 2: 20 nhà x 5 tầng x 1 hộ
● Cách 3: 10 nhà x 5 tầng x 2 hộ
© Nguyễn Tiến Dũng
● DL định danh
● DL thứ bậc
● Dữ liệu định lượng (quantitative data)
● DL khoảng
● DL tỷ lệ
● Việc tính giá trị TB, phương sai và độ lệch chuẩn
của DL định tính là vô nghĩa
● Thang đo Dữ liệu Phương pháp PT DL
● TD: Mã hoá 1 = Nam; 2 = Nữ. Đã PV 100 người,
chạy ra kết quả biến giới tính = 1,5
© Nguyễn Tiến Dũng
Thống kê ứng dụng
15