Trêng cao ®¼ng y tÕ hµ ®«ng
Gi¸o tr×nh
NGUY£N Lý ThèNG K£
Tµi liÖu ®µo t¹o trung cÊp d©n sè y tÕ
Hµ Néi - N¨m 2011
Danh mục chữ viết tắt
DS : Dân số
DS - KHHGĐ : Dân số - Kế hoạch hoá gia đình
KHH : Kế hoạch hoá
KHHGĐ : Kế hoạch hoá gia đình
THCS : Trung học cơ sở
THPT : Trung học phổ thông
KT - XH : Kinh tế xã hội
SKSS : Sức khoẻ sinh sản
L
ỜI NÓI ĐẦU
Ngày nay, th
ống kê được coi là một trong những công cụ quản lý vĩ mô quan
tr
ọng, có vai tr
ò cung cấp các thông tin thống kê trung thực, khách quan, chính xác,
đ
ầy đủ, kịp thời phục vụ các cơ quan nhà nước trong việc đánh giá, dự báo tình
hình, ho
ạch định chiến lược, chính sách, xây dựng kế ho
ạch, chiến l
ược và chính
sách phát tri
ển kinh tế
- xã h
ội ngắn hạn và dài hạn, trong phạm vi một lĩnh vực hay
nh
ững chủ tr
ương, chính sách của Đảng và Nhà
nư
ớc về công tác dân số v
à kế
ho
ạch hóa gia đình
. Chúng tôi đ
ã tiến hành biên soạn cuốn sách này làm tài liệu học
t
ập cho các lớp đào tạo trung học Dân số
- Y t
ế.
Giáo trình
được biên soạn
theo Chương tr
ình môn học
Nguyên lý th
ống kê
đ
ã được phê duyệt. Cuốn sách gồm
6 bài:
Bài 1: Nh
ập môn thống k
ê
Bài 2: Thu th
ập dữ liệu thống kê
Bài 3: Mô t
ả dữ liệu bằng đặc tr
ược những
ý ki
ến đóng góp quý báu của các nhà khoa học, nhà quản lý và
đông đảo bạn đọc.
Th
ạc sỹ Đinh Thái H
à
M
ỤC LỤC
TT
Tên bài h
ọc
Trang
1
Nh
ập môn thống kê
1
2
Thu th
ập dữ liệu thống kê
13
3
Mô t
ả dữ liệu bằng đặc trưng đo lường
21
4
Tóm t
ắt v
à trình bày dữ liệu thống kê
27
loài ngư
ời
và là
m
ột trong những môn khoa học xã hội có lịch sử
phát tri
ển
lâu dài nh
ất. Đó là một
quá trình phát tri
ển không ngừng từ đ
ơn giản đến phức tạp, được đúc rút dần thành
lý lu
ận khoa học và ngày nay đã trở thành một môn khoa học độc lập.
Ngay t
ừ thời cổ đại, con người đã biết chú ý tới việc đăng ký, ghi chép và
tính toán s
ố người trong bộ tộ
c, s
ố súc vật, số người có thể huy động phục vụ các
cu
ộc chiến tranh giữa các bộ tộc, số người được tham gia ăn chia
, phân ph
ối của cải
thu đư
ợc
Nh
ững hoạt động n
ày xu
ất hiện rất sớm ở Trung Quốc từ thế kỷ
ác ho
ạt
đ
ộng đa
d
ạng của thống k
ê được thể hiện nhờ vào sự tích hợp nhiều nguyên lý, từ đó khoa
h
ọc thống kê được hình thành.
Nhi
ều nhận định cho rằng: Nền tảng của khoa học thống kê được xây dựng
b
ởi nhà kinh tế học Wiliam Petty (
1623- 1687). T
ừ các tác phẩm “Số
h
ọc chính trị”,
“S
ự khác biệt về tiền tệ” và mộ
t s
ố tác phẩm khác nữa, Kar Mark
đ
ã gọi Petty là
ngư
ời sáng lập ra môn Thống k
ê học. Petty đã thành lập một hướng nghiên cứu
khoa h
ọc gắn với “Số học chính trị”.
2
M
ấy trong các tác phẩm của M.B.
Lomonosov (1711 – 1765), trong
đó các v
ấn đề đưa ra xem xét là dân số, tài nguyên thiên nhiên, tài chính, của cải
hàng hóa. . . đư
ợc minh họa bằng các số liệu thống k
ê.
Hư
ớng
phát tri
ển n
ày của
th
ống kê được gọi là thống kê mô tả.
Giáo sư trường Đại học Tổng hợp Gettingen, A. Sliser (1736 – 1809) cho
r
ằng, thống kê không chỉ mô tả chế độ chính trị Nhà nước, mà
còn là toàn b
ộ xã hội.
S
ự phát triển tiếp theo của thống kê được vun đắp bởi nhiều nhà khoa học. Trong
đó, đáng quan tâm là nhà th
ống k
ê h
ọc A. Ketle (
1796 – 1874) đ
ã
đóng góp m
ột
công trình
ra nh
ững hệ số mà ngày nay
g
ọi là hệ số Pearson. Ông nghiên cứu lý thuyết tiến
hoá
theo mô hình Th
ống kê toán. Còn nhà toán học V. Gosset,
dư
ới danh hiệu Student
,
đ
ã đưa ra lý thuyết chọn mẫu nhỏ để rút ra kết luận xác đáng nhất từ hiện tượng
nghiên c
ứu. R. Fisher đã có công phân chia các phươ
ng pháp phân tích s
ố lượng,
phát tri
ển cá
c phương pháp th
ống kê để so sánh những trung bình của hai mẫu, từ
đó xác đ
ịnh sự khác biệt của chúng có ý nghĩa
th
ống k
ê
hay không. M. Mitrel đ
ã
đóng góp ý tưởng “Phong vũ biểu kinh tế”. Như vậy, đại diện cho khuynh hướng
này là cơ s
ở Lý thuyết xác suất t
3
“Kinh nghi
ệm về đối tượng, các đơn vị thống kê và kinh tế chính trị” đã nói rằng:
Th
ống k
ê trong r
ất nhiều trường hợp ngẫu nhiên đã phát hiện ra “Những tiêu chuẩn
hoá”. Nhà th
ống kê
D.P. Jurav (1810 – 1856) trong nghiên c
ứu “Về nguồn gốc và
ứng dụng của số liệu thống k
ê” đã cho rằng: “Thống kê là môn khoa học về các tiêu
chu
ẩn của việc tính toán”.
Trong nghiên c
ứu của giáo s
ư trường Đại học Bách khoa Peterbur
,
A.A.Truprov (1874 – 1926), th
ống kê được xem như phương pháp nghiên cứu các
hi
ện tượng tự nhiên và xã hội số lớn. Giáo sư I.U.E. Anson
(1835 – 1839), trư
ờng
Đ
ại học Tổng hợp Peterbur,
trong quy
ển “Lý thuyết thống kê” đã gọi thống kê là
môn khoa h
Ngày nay, th
ống kê được coi là một tron
g nh
ững công cụ quản lý vĩ mô quan
tr
ọng, có vai tr
ò cung cấp các thông tin thống kê trung thực, khách quan, chính xác,
đ
ầy đủ, kịp thời phục vụ các cơ quan nhà nước trong việc đánh giá, dự báo tình
hình, ho
ạch định chiến lược, chính sách, xây dựng kế hoạc
h phát tri
ển kinh tế
- xã
h
ội ngắn hạn và dài hạn. Đồng thời, các con số thống kê cũng là những cơ sở quan
tr
ọng nhất để kiểm điểm, đánh giá t
ình hình th
ực hiện các kế hoạch, chiến lược và
các chính sách đó. Trên giác độ quản lý vi mô, thống kê không những có vai trò đáp
ứng nhu cầu thông tin thống k
ê của các tổ chức, cá nhân trong xã hội, mà còn phải
xây d
ựng, cung cấp các phương pháp phân tích đánh giá về mặt lượng các hoạt
đ
ộng kinh tế
- xã h
ội của các tổ chức, đơn vị.
K
qu
ản lý xã hội.
Trên th
ực tế,
đ
ể
có thông tin chính xác, đ
ầy đủ cho lập kế hoạch về công tác
DS-KHHGĐ thì cán b
ộ dân số
c
ần
đư
ợc trang bị tốt
ki
ến thức thống k
ê, bao g
ồm
Nguyên lý th
ống kê
– môn cơ s
ở để nghiên cứu
th
ống kê kinh tế xã hội và
Th
ống kê
chuyên ngành – môn h
ọc
các phương pháp th
ống kê chu
và nhà
ở 1/4/2009,
T
ổng tỷ suất sinh của Việt Nam là 2,03 con/phụ nữ
.
Thực ra khi hỏi thống kê là gì, có nhiều cách trả lời, ví dụ trả lời như sau có
th
ể khó bắt bẻ
“Th
ống kê là công việc mà các nhà thống kê làm”.
Công vi
ệc của nhà
th
ống kê
g
ồm
r
ất nhiều
ho
ạt động trên một phạm vi rộng, có thể tóm tắt thành các
m
ục lớn nh
ư sau:
- Thu th
ập và xử lý số liệu.
- Đi
ều tra thống kế chọn mẫu.
- Nghiên c
ứu mối liên hệ giữa các hiện tượng
- D
có hai m
ặt ch
ất v
à lượng không tách rời nhau. K
hi
nghiên c
ứu
m
ột hiện tượng, điều ai cũng
mu
ốn
bi
ết
là b
ản chất c
ủa hiện t
ượng.
Nhưng m
ặt chất thường ẩn bên trong còn mặt lượng biểu hiện ra bên ngoài dưới
d
ạng các đại lượng ngẫu nhiên. Do đó phải thông qua các phương pháp
thu th
ập,
x
ử
lý và phân tích thích h
ợp tr
ên m
ặt lượng của số lớn đơn vị cấu thành hiện tượng, tá
c
ện tượng về đời sống vật chất, văn hóa của dân cư
- Các hi
ện tượng về
sinh ho
ạt chính trị xã hội.
2. Đ
ối tượng nghiên cứu của thống kê học
Nghiên c
ứu quá trình hình thành và phát triển của
th
ống kê
h
ọc
cho th
ấy:
th
ống kê học là một môn khoa học xã hội. Tuy nhiên, khác với các môn khoa học xã
h
ội khác,
th
ống k
ê
h
ọc không trực
ti
ếp nghi
ên cứu mặt chất của hiện tượng, mà chỉ
ph
ản ánh bản chất, tính quy luật của hiện tượng thông qua các con số, các biểu hiện
về lượng của hiện tượng. Điều đó có nghĩa là thống kê học phải sử dụng các con số
ối quan hệ đó, sự thay đổi về lượng quyết định sự biến đổi về chất. Quy
lu
ật l
ượng
- ch
ất của triết học đ
ã chỉ rõ: mỗi lượng cụ thể đều gắn với một chất nhất
đ
ịnh, khi lượng thay đổi và tích lũy đến một chừng
m
ực nhất định thì chất thay đổi
theo. Vì vậy, nghiên cứu mặt lượng của hiện tượng sẽ giúp cho việc nhận thức bản
ch
ất của hiện tượng.
Ví d
ụ:
Có th
ể đánh
giá công tác dân s
ố
c
ủa một
huy
ện
qua các
con s
ố
th
ống k
ê
ịu tác động của nhiều yếu tố, trong đó có cả những yếu tố tất nhi
ên và ng
ẫu nhiên.
M
ức độ và chiều hướng tác động của từng yếu tố này trên mỗi hiện tượng cá biệt rất
khác nhau. N
ếu chỉ thu thập
s
ố liệu trên một số ít hiện tượng thì khó có thể rút ra
6
b
ản chất chung của hiện tượng, mà nhiều khi người ta chỉ tìm thấy những yếu tố
ng
ẫu nhi
ên, không b
ản chất. Ngược lại, khi nghiên cứu trên một số lớn các hiện
tư
ợng cá biệt, các yếu tố ngẫu nhiên sẽ b
ù tr
ừ, triệt tiêu nhau và khi đó, bản chất,
quy lu
ật phát triển của hiện tượng mới được bộc lộ rõ. Chẳng hạn, nghiên cứu tình
hình sinh đ
ẻ trong một tổng thể dân c
ư, cho
th
ấy có nhiều cặp vợ chồng sinh to
àn
con trai, ngược lại cũng có nhiều gia đình chỉ có con gái. Nếu nghiên cứu trên một
s
ệt đủ bù trừ, triệt tiêu tác động của các yếu tố ngẫu nhiên. Giữa hiện tượng số lớn
(t
ổng thể) v
à các hi
ện tượng cá biệt (đơn vị tổng thể) luôn tồn tại mối quan hệ biện
ch
ứng. Muốn nghiên cứu tổng thể, phải dựa trên cơ sở nghiên cứu từng đơn vị
t
ổng
th
ể. Mặt khác, trong quá trình phát triển không ngừng của xã hội, luôn nảy sinh
nh
ững hiện t
ượng cá biệt mới, những điển hình tiên tiến hoặc lạc hậu. Sự nghiên
cứu các hiện tượng cá biệt này sẽ giúp cho sự nhận thức bản chất của hiện tượng
đ
ầy đủ, toà
n di
ện và sâu sắc hơn. Vì vậy trong thống kê, nhất là thống kê kinh tế
-
xã h
ội, người ta thường kết hợp nghiên cứu hiện tượng số lớn với việc nghiên cứu
hi
ện t
ượng cá biệt.
Đ
ối t
ư
ợng nghiên cứu của
th
có th
ể khác nhau giữa các giai đoạn, các thời kỳ, Thậm chí, giữa các bộ phận
trong cùng m
ột đ
ơn vị, nhiều khi c
ũng tồn tại những khác biệt đáng k
ể. V
ì vậy, các
con số về năng suất lao động của người công nhân trong từng doanh nghiệp dược,
t
ừng thời kỳ khác nhau cũng có ý nghĩa khác nhau. Như vậy, khi sử dụng các số
li
ệu
th
ống kê
ph
ải luôn gắn nó trong điều kiện thờ
i gian, đ
ịa điểm cụ thể của hiện
tư
ợng m
à số liệu phản ánh.
T
ừ các phân tích trên, c
ó th
ể rút ra kết luận:
Đ
ối tượng nghiên cứu của
th
ống
3.1. Quy lu
ật số lớn
Quy lu
ật số lớn là phạm trù của lý thuyết xác suất, ý nghĩa của quy luật này
là t
ổng hợp sự quan sát số lớn tới mức đầy đủ các sự kiện
cá bi
ệt
ng
ẫu nhiên thì
tính
t
ất nhiên của hiện tượng sẽ bộc lộ.
Quy lu
ật số lớn không giải thích bản chất của hiện tượng kinh tế
- xã h
ội
, hi
ện
tư
ợng dân số, nh
ưng vận dụng quy luật số lớn
ngư
ời ta có thể biểu hiện bản chất cụ
th
ể của hiện tượng kinh tế
- xã h
ội, hiện tượng dân số.
Th
ống kê vận dụng quy luật số lớn để
ố
bé trai là 180 cháu và số bé gái là 120 cháu, tỷ số là 150/100. Lý do, số lượng
trư
ờng hợp sinh
đư
ợc
đ
ếm quá nhỏ nên chưa thể hiện bản chất
c
ủa hiện tượng tỷ số
gi
ới sinh khi sinh
. Nhưng n
ếu ta đếm
t
ất cả số sinh của tỉnh
A, thì s
ố b
é trai là 5.300
cháu và s
ố bé gái là 5
.000 cháu, t
ỷ
s
ố là 106/100
. Khi s
ố
lư
ợng cá thể được
đ
ph
ụ thuộc vào phạm vi thời gian và không g
ian nh
ất định, tồn tại trong điều kiện
phát tri
ển cụ thể của hiện t
ượng.
Tính quy lu
ật thống k
ê không phải
là tác đ
ộng của một nguy
ên nhân mà là
toàn b
ộ các nguyên nhân kết hợp với nhau. Đó là biểu hiện tổng hợp của mối liên hệ
nhân qu
ả, là đặc trưng của h
i
ện tượng số lớn được tổng hợp lại qua các tổng thể
th
ống kê. Nhìn chung càng mở rộng phạm vi nghiên cứu về thời gian và không gian
thì tính quy lu
ật trong thống k
ê càng th
ể hiện rõ.
Ví d
ụ:
Ti
ếp theo ví
d
Ví d
ụ: Toàn bộ nhân khẩu
c
ủa
nư
ớc ta tại thời điểm
ngày 1/4/2009 là m
ột tổng
th
ế thống kê, bao gồm
nhi
ều
nhân
kh
ẩu với những đặc tr
ưng khác nhau.
- T
ổng thể có thể phân loại theo cách thể hiện:
+ T
ổng thể bộc lộ l
à t
ổng thể
g
ồm các đ
ơn v
ị cấu thành tổng thể có thể
th
ấy
đư
ợc bằng trực quan
ểm chủ yếu có liên quan đến mục đích nghiên cứu.
+ T
ổng thể
không đ
ồng nhất là tổng thể
g
ồm các đơn vị khác nhau về các đặc
đi
ểm, các loại hình.
- T
ổng thể cũng có thể phân loại theo tính chất
+ T
ổng thể chung là
t
ổng thể
g
ồm tất cả
đơn v
ị thuộc phạm vi nghiên cứu.
+ T
ổng thể bộ phận là tổng thể bao gồm chỉ những đơn vị thuộc bộ phận.
9
Đ
ịnh nghĩa tổng thể không những chỉ giới hạn về thực thể (tổng thể là gì
?)
mà c
ần phải giới hạn về thời gian v
à không gian (t
ổng thể
t
không bao g
ồm những phụ nữ tr
ên 50 tuổi.
Đơn v
ị tổng thể bao giờ cũng có đơn vị tính toán phù hợp. Xác định đơn vị
tổng thể là việc cụ thể hóa tổng thể. Cho nên xác định đơn vị tổng thể cũng quan
tr
ọng như xác định t
ổng thể.
3.4. Tiêu th
ức thống kê
Nghiên c
ứu thống kê phải dựa vào các đặc điểm của đơn vị tổng thể. Đơn vị
nghiên c
ứu có nhiều đặc điểm, n
ên tùy theo mục đích nghiên cứu mà chọn lựa một
s
ố đặc điểm. Các đặc điểm này gọi là các tiêu thức.
Ví d
ụ:
m
ột người t
rong t
ổng thể nhân khẩu có các tiêu thức: họ và tên, năm
sinh, gi
ới tính, trình độ văn hóa, tình trạng hôn nhân, nơi ở, nghề nghiệp
Đơn v
ị tổng thể được làm rõ đặc trưng của nó qua các tiêu thức: thực thể,
th
ời gian và không gian.
ữ.
Tiêu th
ức thuộc tính có thể biểu hiện gián tiếp. Các biểu hiện gián tiếp của
tiêu th
ức thuộc tính còn gọi là chỉ b
áo th
ống kê. Ví dụ: tiêu thức đời sống vật chất
có bi
ểu hiện gián tiếp: lượng tiêu dùng thịt, sữa theo đầu người.
+ Tiêu th
ức số lượng
là tiêu th
ức
có bi
ểu hiện trực tiếp
b
ằng các
con s
ố (gọi
là lư
ợng biến). Tiêu thức số lượng còn gọi là tiêu thức lượng
hóa. Ví d
ụ:
năng su
ất
lao đ
ộng
có bi
ểu hiện trực tiếp là số sản phẩm sản xuất ra trong một đơn vị thời gian
10
ện t
ượng kinh tế
- xã h
ội xuất hiện v
ào thời gian
nào. Nh
ững biểu hiện của tiêu thức thời gian là ngày, tháng, năm. Thời gian có giá
tr
ị
c
ủa các chỉ dẫn về đối tượng nghiên cứu và đơn vị tổng thể, về sự phân phối
chúng trong m
ột thời gian cũng như thay đổi từ thời kỳ này đến thời kỳ khác được
kh
ẳng định qua tiêu thức thời gian.
Ví d
ụ:
theo T
ổng điều tra dân số
và nhà
ở
vào 0 gi
ờ ng
ày
1/4/2009, dân s
ố
nư
ớc ta
là 85,8 tri
ệu người, Nam
có giá tr
ị trong thời kỳ 1999
-2009.
- Tiêu th
ức không gian:
nêu ph
ạm vi lãnh thổ bao trùm của đơn vị nghiên
c
ứu và sự xuất hiện theo địa điểm của các đơn vị tổng thể.
Nh
ững biể
u hi
ện của nó chỉ ra nhờ sự phân định về mặt quản lý hành chính
ho
ặc theo điều kiện tự nhi
ên, vùng kinh t
ế. Nghiên cứu thống kê theo tiêu thức
không gian có ý ngh
ĩa quan trọng, trước hết là gắn với tiêu thức thực tế để quan sát
phân ph
ối về mặt lãnh thổ củ
a các đơn v
ị tổng thể.
Ví d
ụ:
ngư
ời ta không chỉ quan tâm đến số lượng cơ cấu tuổi của người lao
đ
ộng mà còn phải chỉ ra số người lao động này ở đâu.
Các tiêu th
[không gian] t
ại
Vi
ệt Nam
[th
ời gian]
vào
thời điểm 0 giờ ng
ày 1/4/2009 là
85.789.573 [s
ố l
ư
ợng]
ngư
ời
[đơn v
ị tính]
.
- Theo n
ội dung phản ánh,
có ch
ỉ tiêu khối lượng và chỉ tiêu chất lượng:
+ Ch
ỉ tiêu khối lượng phản ánh quy mô
, kh
ối lượng của tổng
th
ể. Ví dụ
:
T
ằng
cái, s
ản lượng lương thực tính bằng tấn, hoặc đơn vị đo
lường quy ước như: vải tính bằng mét, nước mắm tính bằng lít, v.v
+ Ch
ỉ tiêu giá trị biểu hiện bằng đơn vị tiền tệ Đồng Việt Nam, ngoài ra còn
đư
ợc tính bằng ngoại tệ như đôla Mỹ, Euro Ví dụ:
Giá tr
ị sản
xu
ất công nghiệp
dư
ợc
, doanh thu tiêu th
ụ sản phẩm đ
ược t
ính b
ằng Đồng Việt Nam (ngh
ìn đồng,
tri
ệu đồng ); kim ngạch xuất, nhập khẩu được tính bằng đôla Mỹ.
- Theo đ
ặc điểm về thời gian,
có ch
ỉ tiêu thời điểm và chỉ tiêu thời kỳ:
+ Ch
ỉ tiêu thời điểm phản ánh quy mô của hiện tượng nghiên cứu tại một
thời điểm. Vì vậy, quy mô của hiện tượng nghiên cứu không phụ thuộc vào độ dài
th
ốc gia hoặc chung cho nhiều lĩnh vực, Hệ thống chỉ tiêu thống kê quốc gia
chung cho nhi
ều lĩnh vực là hệ thống chỉ tiêu có phạm vi rộng, phản ánh tình hìn
h
kinh t
ế
- xã h
ội chủ yếu của đất nước hoặc về các mặt sản xuất vật chất, dịch vụ, đời
s
ống văn hóa, xã hội.
_____________________
12
Bài 2. THU THẬP DỮ LIỆU THỐNG KÊ
M
ục ti
êu
1. Phân biệt được các loại dữ liệu thống kê
2. Nêu đư
ợc các phương pháp thu
th
ập dữ liệu thống kê
3. Nêu được các bước xây dựng phương án điều tra thống kê
4. Nêu đư
ợc các điểm chính của sai số trong điều tra thống kê
______________
Quá trình nghiên c
ứu thống k
ê các hi
ện tượng kinh tế
- xã h
càng c
ụ thể thì việc xác định dữ liệu cần thu thập càng dễ dàng.
Vi
ệc xác định nội dung điều tra, cần căn cứ vào các yếu tố sau:
- M
ục đích điều tra: Mục đích điều tra chỉ r
õ cần thu thập những
thông tin
nào đ
ể đáp ứng yêu cầu của nó. Mục đích điều tra khác nhau, nhu cầu thông tin
cũng khác nhau. Mục đích càng nhiều, nội dung điều tra càng phải rộng, càng phải
phong phú.
- Đ
ặc điểm của hiện tượng nghiên cứu: Tất cả những hiện tượng mà thống kê
nghiên c
ứu đều tồn tại trong những điều kiện cụ thể về thời gian v
à không gian. Khi
đi
ều kiện này thay đổi, đặc điểm của hiện tượng cũng thay đổi. Khi đó, các biểu
hi
ện cũng khác nhau
, do v
ậy
vi
ệc lựa chọn tiêu thức nghiên cứu cũng phải khác
nhau.
13
- Năng l
ực
, trình
ượng
thu th
ập bằng thang đo khoảng cách hay
thang đo t
ỷ lệ
.
D
ữ liệu định lượng thường cung cấp nhiều thông tin hơn
và d
ễ áp dụng nhiều
phương pháp phân tích hơn. Khi thực hiện nghiên cứu, trong giai đoạn lập kế hoạch,
ngư
ời nghiên cứu cần xác định trước các ph
ương pháp phân tích c
ần sử dụng để phục
v
ụ cho mục tiêu nghiên cứu của mình, và từ đó xác định loại dữ liệu cần thu thập.
1.3. D
ữ liệu thứ cấp v
à dữ liệu sơ cấp
D
ữ liệu thu thập đ
ược nếu chia theo nguồn là dữ liệu thứ cấp và dữ liệu sơ
c
ấp. Dữ liệu thứ cấp
là d
ữ liệu thu thập từ những nguồn số liệu có sẵn, đó chính là
nh
ững dữ liệu đã qua tổng hợp, xử lý. Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp,
ban đ
huy
ện cung cấp trong Niên giám thống kê hoặc công bố
s
ố liệu chính thức (có tính pháp lý duy nhất) của huyện. Chủ yếu các các dữ liệu
t
ổng quát về dân số, mức sống, lao động
+ Cơ quan chuyên môn: Cung c
ấp số li
ệu thống k
ê chuyên ngành mang tính
chi ti
ết hơn và đặc thù của ngành.
+ Báo, t
ạp chí: Số liệu mang tính thời sự, cập nhật cao, nhưng mức độ tin cậy
ph
ụ thuộc vào nguồn số liệu mà bài báo sử dụng.
+ Các ngu
ồn khác
- Thu th
ập dữ liệu sơ cấp
: D
ữ liệu sơ
c
ấp được thu thập thông qua điều tra
kh
ảo sát. Các điều tra khảo sát chia thành nhiều loại. Căn cứ vào tính chất liên tục
14
c
ủa điều tra, chia ra điều tra thường xuyên và không thời xuyên. Căn cứ vào phạm
vi thu th
ến hành thu thập, ghi chép dữ liệu trên tất cả các đơn vị
c
ủa tổng thể nghiên cứu. Ví dụ: Tổng điều tra dân số. Điều tra toàn bộ cung cấp dữ
li
ệu đầu đủ nhất cho nghiê
n c
ứu thống kê. Nó giúp ta tính toán các chỉ tiêu quy mô,
khối lượng một cách khá chính xác. Cho phép nghiên cứu cơ cấu, tình hình biến
đ
ộng, đánh giá thực trạng hiện tượng, dự đoán xu hướng biến động của hiện tượng
Đi
ều tra toàn bộ đòi hỏi chi phí lớn
v
ề nhân lực, thời gian và tiền bạc, vì vậy không
th
ể áp dụng cho tất cả các trường hợp nghiên cứu.
Đi
ều tra không toàn bộ
là ti
ến hành thu thập, ghi chép dữ liệu trên một số đơn
v
ị được chọn của tổng thể nghiên cứu. Tùy theo cách chọn đơn vị, điều tra khôn
g
toàn b
ộ chia ra 3 loại: điều tra chuyên đề, điều tra chọn mẫu và điều tra trọng điểm.
Đi
ều tra chuyên đề
là ti
ến hành thu thập dữ liệu trên một số rất ít các đơn vị
c
ộng th
ành cách đ
ặc trưng của tổng thể.
15
2. Các phương pháp thu th
ập
d
ữ liệu ban đầu
2.1. Thu th
ập trực tiếp.
Quan sát là thu th
ập dữ liệu bằng cách quan sát các hành động, thái độ của
đ
ối tượng khảo sát trong những tình huống nhất định. Ví dụ
: Quan sát s
ố lượng và
thái đ
ộ của khách đến
thăm khám t
ại
cơ s
ở y tế
; quan sát th
ứ tự hành động đi đến
các bàn khám c
ủa từng khách hàng đến khá
m.
Ph
ỏng vấn trực tiếp:
Ngư
l
ớn, nhất là chi phí về nhân lực và thời gian.
2.2. Thu th
ập gián tiếp.
Nhân viên đi
ều tra thu thập tài liệu qua trao đổi bằng điện thoại, hoặc thư gửi
qua bưu đi
ện với đơn vị điều tra hoặc qua chứ
ng t
ừ, sổ sách có sẵn ở đơn vị điều tra.
Ví d
ụ
: trong đi
ều tra hộ gia đình, nhân viên điều tra gặp đại diện hộ gia đình
trao phi
ếu điều tra, giải thích ý nghĩa điều tra, cách trả lời
Đ
ại diện hộ gia đình
xác đ
ịnh các dữ liệu cần thiết và tự ghi vào phiế
u đi
ều tra, rồi gửi cho nhân viên
điều tra. Trong điều tra về biến động dân số của một địa phương, nhân viên điều tra
có th
ể thu thập tài liệu qua sổ sách theo dõi của cơ quan địa phương, nhân viên điều
tra có th
ể thu thập tài liệu qua sổ sách theo dõi của
cơ quan đ
ịa phương về số sinh,
t
ư
ợc hiểu thống nhất, trình tự và phương pháp tiến hành
cu
ộc điều tra, những vấn đề thuộc về chu
ẩn bị v
à tổ chức toàn bộ cuộc điều tra.
Đ
ối với mỗi cuộc điều tra thống kê cần phải xây dựng kế hoạch điều tra phù
h
ợp.
Sau đây là nội dung c
ơ
b
ản của kế hoạch điều tra
.
3.1. Mô t
ả mục đích điều tra
M
ục đích điều tra là nội dung quan trọng đầu tiên của kế
ho
ạch điều tra, xác
đ
ịnh r
õ điều tra để tìm hiểu những khía cạnh nào của hiện tượng, phục vụ yêu cầu
nghiên c
ứu hoặc yêu cầu quản lý nào.
Bất kỳ một hiện tượng nào cũng có thể được quan sát, nghiên cứu từ nhiều
góc đ
ộ khác nhau. Nhưng với mỗi cuộc điều tra
ta không th
ứu, vạch rõ ranh giới của hiện tượng ngiên cứu với hiện tượng khác, giúp ta
xác đ
ịnh đúng
đ
ắn số đơn vị cần điều tra thực tế. Xác định chính xác đối tượng điều
tra giúp tránh đư
ợc nhầm lẫn khi thu thập dữ liệu, làm cho dữ liệu thu thập và tổng
h
ợp phản ánh đúng hiện tượng cần nghiên cứu.
Khi xác đ
ịnh đối tượng điều tra phải căn cứ mục đích điều
tra, đ
ồng thời phải
định nghĩa những tiêu chuẩn phân biệt rõ ràng, vì nhiều khi biểu hiện bên ngoài của
hi
ện tượng giống
nhau, nhưng th
ực chất lại khác
nhau. Ví d
ụ
: T
ổng điều tra dân số,
đ
ối t
ượng điều tra được xác định là “Nhân khẩu thường trú” trên lãnh
th
ổ Việt Nam.
Đ
ể phân biệt “nhân khẩu thường trú” với “nhân khẩu tạm trú” và với “nhân khẩu có
m
đi
ều tra. Đơn vị điều tra có thể là từng doanh nghiệp, từng của hàng, từng trường
h
ọc , nh
ưng cũng có thể là từng công nhân, từng học sinh Trong một cuộc điều
tra c
ũng có thể dùng nhiều loại đơn vị điều tra để đá
p
ứng những yêu cầu ngh
iên
c
ứu khác nhau. Ví dụ
: Tổng điều tra dân số th
ường dùng hai loại đơn vị điều t
ra là
t
ừng người dân và từng hộ
. Tuy nhiên, trong cu
ộc Tổng điều tra dân số 2009, người
ta đ
ã xác
đ
ịnh đơn vị điều tra là “hộ
dân cư” (hộ dân cư bao g
ồm
m
ột ng
ư
ời ăn, ở
riêng hoặc một nhóm người ăn chung, ở chung).
ề nhân lực, thời gian,
chi phí Cho nên n
ội dung điều tra chỉ nên bao gồm những tiêu thức hay đặc trưng
quan tr
ọng nhất có liên quan trực tiếp đến mục đích điều
tra và có quan h
ệ chặt chẽ
ho
ặc có thể bổ sung cho nhau, tạo điều kiện thuận lợi cho việc kiểm tra tính chất
chính xác các d
ữ liệu.
M
ỗi tiêu thức trong nội dung điều tra phải được diễn đạt thành câu hỏi ngắn
g
ọn, cụ thể, r
õ ràngđể cả người điều tra và ngư
ời đ
ư
ợc điều tra điều hiểu thống nhất.
3.4. Xác định thời điểm, thời kỳ điều tra
Tu
ỳ theo tính chất, đặt điểm của hiện t
ượng nghiên cứu cần phải xác định
đúng đ
ắn và chặt chẽ thời gia thu thập dữ liệu về hiện tượng.
Thời điểm điều tra: là mốc thời gian được xác định để thống nhất đăng ký dữ
li
ệu của toàn bộ các đơn vị điều tra. Xác định thời điểm điều tra là xác định cụ thể
ngày, gi
ờ để thống nhất đăng ký dữ liệu, tức là xác định ý muốn nghiên cứu trạng
ốt khoản thời gian đó (ngày, tuần, 10 ngày, 1 tháng,
3 tháng hay 1 năm ). Ví d
ụ điều tra số người sinh, chết, chuyển đi, chuyển đến
trong m
ột năm của một địa ph
ương; s
ố lần đi siêu thị trong vòng một tháng qua, số
lượng tập vỡ học sinh sử dụng trong năm học qua Thời kỳ điều tra có thể dài hay
ng
ắn phụ thuộc vào mục đích nghiên cứu.
Th
ời hạn điều tra:
Là th
ời gia
n dành cho vi
ệc đăng ký ghi chép tất cả các dữ
li
ệu điều tra, đ
ược tính từ khi bắt đầu cho đến khi kết thúc toàn bộ việc thu thập dữ
li
ệu. Ví dụ tổng điều tra dân số thời hạn điều tra là trong vòng 10 ngày đầu tháng 4.
Th
ời hạn điều tra dài hay ngắn tuỳ thuộc vào quy mô, tính chất phức tạp của
hi
ện tượng, vào nội dung nghiên cứu, lực lượng tham gia điều tra. Nhưng thời hạn
đi
ều tra không
nên quá dài.
3.5. Bi
ểu điều tra và
ớng dẫn cụ thể cách xác định và ghi dữ liệu vào biểu điều tra. Nó giúp cho nhân
viên đi
ều tra nhận thức
th
ống nhất các câu hỏi trong biểu điều tra. Nội dung, ý nghĩa
các câu h
ỏi phải đ
ược giải thích một cách khoa học và chính xác. Những câu hỏi
ph
ức tạp có nhiều khã năng trả lời cần có ví dụ cụ thể.
Ngoài nội dung chủ yếu trên, trong kế hoạch điều tra còn c ần đề cập và giải
thích m
ột số vấn đề thuộc phương pháp, tổ chức và tiến hành điều tra như:
- Cách th
ức chọn mẫu
;
19
- Phương pháp thu th
ập dữ liệu và ghi chép ban đầu
;
- Các bư
ớc và tiến độ tiến hành điều tra
;
- T
ổ chức và quy định nhiệm vụ của bộ phận tham
gia đi
ều tra
;
- B
ố trí lực l
cạnh đó chất lượng số liệu của điều tra chọn mẫu c
ũng còn nh
ững hạn chế nhất
định. Có một số ý kiến hiện nay đánh giá không công bằng và thiếu khách quan về
kết quả điều tra chọn mẫu, cho rằng số liệu chưa sát với thực tế vì chỉ điều tra một
bộ phận rồi suy rộng cho tổng thể.
Tất nhiên c
ũng ph
ải thấy rằng đ
ã là đi
ều tra chọn mẫu thì không thể tránh
khỏi sai số chọn mẫu nhưng mức độ sai số chọn mẫu của phần lớn những chỉ tiêu
trong các cuộc điều tra thống kê hiện nay thường là ở phạm vi cho phép nên chấp
nhận được. Hơn nữa khi cần thiết ta có thể chủ động giảm được sai số chọn mẫu
bằng cách điều chỉnh cỡ mẫu và tổ chức chọn mẫu một cách khoa học, tuân thủ
đúng nguyên tắc chọn mẫu.
Điều đáng nói và cần quan tâm hơn trong điều tra thống kê chính là sai số
phi chọn mẫu. Loại sai số này xảy ra ở cả ba giai đoạn điều tra, liên quan đến tất cả
các đối tượng tham gia điều tra thống kê và ảnh hưởng đáng kể đến chất lượng số
20
liệu thống kê.
Dưới đây sẽ đi sâu nghiên cứu về sai số phi chọn mẫu - sai số điều tra, xảy ra
trong cả ba giai đoạn nhưng chỉ đề cập đến sai số liên quan tới những công việc,
những đối tượng thường gặp nhiều hơn.
- Sai số trong quá trình chuẩn bị điều tra thống kê
+ Sai số điều tra liên quan đến xác định mục đích, nội dung, đối tượng điều tra.
+ Sai số liên quan đến xây dựng các khái niệm, định ngh
ĩa dùng trong đi
ều tra.
+ Sai số điều tra liên quan tới thiết kế bảng hỏi, xây dựng các bảng danh mục
ộn số (ví dụ 51 thành 15), v.v
+ Sai sót trong khâu nhập tin và khâu này c
ũng thư
ờng xuyên xảy ra sai số.
_______________________
21
Bài 3. MÔ T
Ả DỮ LIỆU BẰNG ĐẶC TRƯNG ĐO LƯỜNG
M
ục tiêu
1. Nêu đư
ợc khái niệm, ý nghĩa và phân loại số tu
y
ệt đối
2. Nêu đư
ợc khái niệm, ý nghĩa và phân loại số tương đối
3. Phân bi
ệt một số loại thường dùng trong thống kê dân số
- y t
ế
___________
1. S
ố tuyệt đối
1.1. Khái niệm và ý nghĩa
Số tuyệt đối là chỉ tiêu biểu hiện quy mô, khối lượng của hiện tượng hoặc
quá trình kinh tế - xã hội trong điều kiện thời gian và không gian cụ thể.
Số tuyệt đối trong thống kê bao gồm các con số phản ánh quy mô của tổng
thể hay của từng bộ phận trong tổng thể (số doanh nghiệp dược, số nhân khẩu, số
học sinh đi học, số lượng bác s
ĩ