Thử nghiệm phần mềm quản lý dữ liệu vi mô vào lưu trữ và quản lý dữ liệu của khảo sát mức sống hộ gia đình năm 2006 - Pdf 24


1

BỘ KẾ HOẠCH VÀ ĐẦU TƯ
TỔNG CỤC THỐNG KÊ CHUYÊN ĐỀ KHOA HỌC

THỬ NGHIỆM PHẦN MỀM QUẢN LÝ DỮ LIỆU VI MÔ VÀO
LƯU TRỮ VÀ QUẢN LÝ DỮ LIỆU CỦA KHẢO SÁT MỨC SỐNG HỘ
GIA ĐÌNH NĂM 2006
Người thực hiện: CN. Nguyễn Phương Anh

vụ được giao.
Trong chuyên đề này, chúng tôi xin giới thiệu một công cụ mới dành cho
thống kê đó là Microdata Managerment. Đây là phần mềm giúp lưu trữ, quản
lý và công bố số liệu thống kê, đặc biệt phù hợp với kết quả các cuộc điều tra
vi mô. Công tác lưu trữ và quản lý số liệu thống kê là một hoạt động khá quan
trọng của công tác thống kê, kết quả của các cuộc điều tra thống kê rất cần
được lưu trữ theo thời gian để giúp cho việc thiết kế các cuộc điều tra khác tốt
hơn đồng thời cũng cho phép so sánh kết quả thu được của các cuộc điều tra ở
các thời điểm khác nhau.
Hiện nay, cơ sở dữ liệu vi mô của Tổng cục thống kê có rất nhiều, từ các cuộc
tổng điều tra như: Tổng điều tra dân số và nhà ở tiến hành theo chu kỳ 10 năm
1 lần; 2 cuộc Tổng điều tra nông thôn, nông nghiệp và thủy sản và Tổng điều
tra các cơ sở kinh tế được tiến hành theo chu kỳ 5 năm 1 lần đến các cuộc
điều tra mẫu như Điều tra Khảo sát Mức sống hô gia đình được tiến hành 2
năm 1 lần; Điều tra Doanh nghiệp tiến hành hàng năm; .v.v… Với số lượng
lớn các cuộc điều tra, cùng rất nhiều các chỉ tiêu thống kê của mỗi cuộc điều
tra như vậy thì công tác xử lý, lưu trữ và quản lý số liệu là đặc biệt quan
trọng, đòi hỏi phải có các phần mềm chuyên dụng cũng như chương trình
quản trị dữ liệu thống nhất giữa các cuộc điều tra để giúp cho người dùng tin
dễ dàng truy cập, khai thác, sử dụng số liệu ở cấp vĩ mô cũng như vi mô. 3
Thử nghiệm Microdata Managerment để lưu trữ và quản lý
cơ sở dữ liệu của các cuộc điều tra của Tổng cục Thống kê.
Phần I. Giới thiệu sơ lược về phần mềm Microdata Managerment:
Microdata Managerment là một bộ công cụ bao gồm 4 module chính sau:
Metadata Editor được sử dụng để chuẩn hóa các tài liệu có liên quan theo
tiêu chuẩn quốc tế về dữ liệu vi mô (DDI và Dublin Core), công cụ này cho
phép người dùng có thể dưa vào số liệu vi mô của cuộc điều tra cùng các

Phía dưới “My Project” bạn có thể tạo các nhóm, dưới nhóm là các nghiên
cứu của từng nhóm. Để tạo một nhóm mới ta có thể kích chuột vào biểu tượng
add group khi đó một nhóm mới sẽ được tạo ra, bạn có thể vào label để
đổi tên nhóm. Khi đã tạo được một nhóm mới, dưới mỗi nhóm ta có thể tạo
một hoặc nhiều các nghiên cứu, mỗi nghiên cứu sẽ là một cuộc điều tra mẫu
hoặc tổng điều tra trong lĩnh vực của nhóm.

Một project/nghiên cứu có thể được tạo ra bằng 2 cách, nếu ta chưa có data
file, để tạo một nghiên cứu mới ta có thể vào File > Add new study hoặc kích
chuột vào biểu tượng ta sẽ tạo được một nghiên cứu mới.

Nếu ta đã có data files, ta có thể tạo một nghiên cứu mới bằng cách kích chuột
vào biểu tượng import dataset , Metadata hỗ trợ một số định dạng file như:
SPSS (.sav,.por), Stata 7 and Stata 8 (.dta), Statistica (.sta), SAS (.sp1), ASCII
delimited (.txt, .csv), and others (.dbf, .dif, .nsf)
Cơ sở dữ liệu vi mô của KSMS 2006 được lưu trữ dưới dạng SPSS, STATA,
và các files này có thể chiết xuất trực tiếp vào Metadata Editor

5
Chọn File > Import Study từ thanh công cụ chính hoặc kích và biểu tượng
tương tự phần trên. Khi cửa sổ chứa file dữ liệu dạng Stata hiện ra, chọn
các file cần đưa vào project, ta có thể chọn tất cả hoặc chọn từng file.

2.2. Khai báo về cuộc điều tra:
Trong mỗi Project/nghiên cứu, đều có chuẩn các mục cần khai báo cho mỗi cuộc
điều tra, phần này sẽ giúp người dùng hiểu được nội dung cuộc điều tra. Để khai
báo các tài liệu của một cuộc điều tra, trước hết ta phải chuẩn bị hết các tài liệu
có liên quan đến cuộc điều tra như: bộ cơ sở dữ liệu thô, quyết định điều tra,
phương án, bảng câu hỏi điều tra, sổ tay hướng dẫn điều tra viên, các chỉ tiêu
điều tra, qui trình thực hiện điều tra và các tài liệu khác có liên quan…. Khi đã

nơi cuộc điều tra không bao phủ toàn bộ đất nước. Trong phần
"Abbreviation" (chữ viết tắt) chúng ta được khuyến cáo vào 3 ký tự theo
mã chuẩn ISO của đất nước (Như Việt Nam ký hiệu theo chuẩn ISO là
VNM). Nếu như bộ số liệu được dẫn chứng bằng tài liệu bao phủ ngoài
một quốc gia (ở nhiều đất nước) thì ta có thể vào bằng nhiều dòng riêng
biệt; Mức độ bao phủ về mặt địa lý; phạm vi điều tra về dân số như đối
tượng ở độ tuổi nào thì điều tra, độ tuổi nào không điều tra…
- Nhà sản xuất và người bảo đảm (Producers and sponsors) bao gồm: người
chịu trách nhiệm điều tra chính của cuộc điều tra; nhà đồng tổ chức hoặc
chịu trách nhiệm hoặc có các công việc liên quan; chi phí cho cuộc điều

7
tra, nguồn chi phí lấy từ đâu trong nước hay quốc tế; các đơn vị khác có
liên quan.
- Chọn mẫu (Sampling): Phần này cần đưa vào các thông tin về cách chọn
mẫu, cỡ mẫu; sai số của thiết kế mẫu; xác định số lượng mẫu theo lý
thuyết chọn mẫu; quyền số suy rộng của từng chỉ tiêu.
- Thu thập số liệu (Data collection): Mô tả các thông tin cơ bản về cuộc điều
tra về ngày bắt đầu, ngày kết thúc, chu trình điều tra; kỳ lấy số liệu;
phương pháp thu thập số liệu; quá trình tổ chức thực hiện thu thập số liệu
từ khâu chuẩn bị địa bàn điều tra, tập huấn điều tra viên các cấp, tổ chức
điều tra, kiểm tra, thanh tra quá trình thực hiện điều tra ở cơ sở…; các loại
phiếu dùng trong điều tra, nêu rõ các loại dùng cho từng đối tượng, phạm
vi điều tra; đơn vị tổ chức thực hiện điều tra; giám sát viên các cấp được tổ
chức thế nào…
- Xử lý số liệu (Data processing): làm sạch số liệu được tổ chức theo một
qui trình gồm nhiều bước xử lý từ đầu đến khi có được bộ số liệu chính
thức, bao gồm:
a) Làm sạch thô, bằng tay và mã hóa
b) Làm sạch trong suốt quá trình vào số liệu

rồi nhập lại bộ số liệu. Tuy nhiên trong một số trường hợp sử dụng Metadata
Editor sẽ thuận tiện hơn.
Chương trình Metadata Editor có nhiều công cụ quản lý biến để có thể sắp
xếp lại, chèn thêm, sao chép, nhân đôi, tính toán, mã hóa lại và xóa biến.
2.3.1 Cách sắp xếp lại bộ số liệu:
1) Chọn biến (Variables) từ cửa sổ Project
2) Kiểm tra tất cả các biến trong danh sách biến để chắc chắn rằng độ rộng
của biến đã được xác định. Nếu biến chưa được gán độ rộng, thì chúng
ta không sử dụng được chức năng sắp xếp lại
3) Chọn biến (Variables) > chọn Resequence từ thanh Menu chính.
Chương trình Metadata Editor sẽ tính toán lại vị trí cột Start và End của
tất cả các biến trong bộ số liệu đang dùng.
2.3.2 Thêm và chèn các biến:
Thêm biến mới vào một bộ số liệu qua 2 mục: đó là Add Variable và Insert
Variable, biến được chọn phải từ cửa sổ project thì 2 mục trên mới xuất hiện

9
Cách thêm hoặc chèn 1 biến mới:
1) Chọn Variables ở thanh phía trên cửa sổ project
2) Chọn Variables > Add variable để thêm biến mới ở cuối của danh sách
biến hoặc chọn Variables > Insert Variables để chèn thêm biến mới lên
phía trên dòng đã được chọn trong danh sách biến.
3) Chọn các định dạng của biến mới: Kiểu số (numeric), ký tự chuỗi cố
định (fixed string), ký tự chuỗi động (dynamic string) hoặc kiểu ngày
tháng (date)
4) Nhập dự liệu cho biến mới
5) Có 2 cách đưa dữ liệu vào biến vừa mới tạo, thông tin có thể được đưa
vào bằng cách sử dụng màn hình Data Entry, đánh dấu Data Entry
trong ô điều hướng (dưới tên của dữ liệu được thiết lập). Màn hình
Data Entry làm việc giống như một worksheet, dữ liệu từ các ô, cũng

yêu tính toán các biến mới không thể thực hiện được ở ngoài
Tính toán các biến mới:

11
1) Chọn Variables ở thanh trên cửa sổ project
2) Chọn Variables > Compute Variable ở menu chính. Mẫu tính toán
được mở ra.

3) Nhập công thức
4) Kích OK. Biến mới sẽ xuất hiện ở cuối danh sách biến
5) Sắp xếp lại file dữ liệu và ghi lại quá trình
2.3.5 Mã hóa lại các biến:
Chương trình Metadata Editor dùng để thực hiện hoạt động mã hóa lại. Chức
năng này được sử dụng nhằm mã hóa lại các giá trị không hợp lệ, Ví dụ, nếu
file dữ liệu chứa biến “Giới tính” với các giá trị 1= Nam, 2= Nữ và 9= Các
giá trị thiếu (Missing) là các giá trị hợp lệ, nhưng một vài giá trị được nhập
sai, các giá trị không hợp lệ đó cần phải mã hóa lại thành giá trị 9. Cách sử
dụng khác là tính toán của 1 biến mới bằng cách má hóa lại dữ liệu sẵn có
thành biến khác (ví dụ: tạo một biến “Nhóm tuổi” từ 1 biến “Tuổi theo năm”).
Khi mã hóa lại một biến, giá trị hiện tại của biến có thể bị thay đổi hoặc bi lưu
lại trong một biến mới. Cần chú ý vì hoạt động mã hóa lại không thể bị quay
lai được
Nếu giá trị được mã hóa lại cập nhập biến đang tồn tại , thì tất cả dữ liệu vẫn
tồn tại. Nếu giá trị mã hóa tạo ra một biến mơi thì tất cả dữ liệu cho biến mới
sẽ cần được hướng dẫn nhập lại.

12
Sau khi mã hóa 1 biến, chúng ta nên đưa ra nhưng mô tả rõ ràng và hoàn
chỉnh về các bước mã hóa trong phần Recoding and Derivation ở mục mô tả
biến (Variable description)

Cách xóa biến:
1) Chọn Variables or Data entry tại thanh phía trên cửa sổ project
2) Chọn 1 hoặc nhiều biến
3) Chọn Variables > Delete variable hoặc đánh CTRL và DELETE
4) Hộp thư hỏi bạn có xác nhận chính xác sẽ xóa biến này không. Chọn
YES để xóa và NO để hủy lệnh
5) Sắp xếp và lưu quá trình vừa thực hiện lại
2.4 Sửa dữ liệu
Chương trình Metadata Editor cho phép người dùng xếp, xóa, bổ sung và di
chuyển dữ liệu.
2.4.1 Cách sắp đặt bản ghi trong một file dữ liệu:
1) Chọn Data Entry trên thanh thực đơn của màn hình outline
2) Chọn Data > Sort Cases từ menu chính
3) Chọn một biến từ danh sách Variable to Sort By và chọn ascending
hoặc descending từ danh sách Sort Order
4) Kích OK để xếp các bản ghi
2.4.2 Xóa bản ghi:
Có thể xóa các bản ghi trong chương trình Metadata Editor. Chức năng này
mô tả sự khác biệt giữa những file dữ liệu gốc và những dữ liệu được lưu trữ
và xuất bằng phần mềm Toolkit, cần cân nhắc khi sử dụng tính năng này.
Cách xóa bản ghi:
1) Chọn Data Entry trên thanh thực đơn của màn hình outline
2) Chọn Data > Delete Cases từ menu chính
3) Chỉ định trường hợp nào nên xóa. Chọn:

14
Current Case để xóa bản ghi được đánh dấu
All to xóa toàn bộ các bản ghi được chọn trong file dữ liệu
Selection để rời các bản ghi chứa các giá trị đặc trưng của biến đơn


sát mức sống 2006.

16
Nesstar Explorer cho phép người sử dụng xem và xuất các dữ liệu và siêu dữ
liệu về định dạng thống kê chung. Các dạng dữ liệu được tạo ra không những
bao gồm dữ liệu và siêu dữ liệu mà còn bao gồm cả những nguồn số liệu bên
ngoài và những tài liệu bổ sung.
4. Sử dụng CD-ROM Builder để tạo đĩa CD cơ sở dữ liệu vi mô Khảo sát
mức sống 2006.
CD-ROM Builder là một gói công cụ, nó xuất dữ liệu ra định dạng HTML cơ
bản có thể lưu trữ trên CD-ROM, DVD, mạng intranet hay mạng internet.
Mặc dù nó được thiết kế chủ yếu là công cụ để phổ biến vi dữ liệu, nó cũng
còn được sử dụng lưu trữ dữ liệu và siêu dữ liệu.
Khởi động CD-ROM Builder.
Nếu bạn đã cài bộ công cụ sử dụng những tham số mặc định, chọn Start >
Microdata Management Toolkit > CD-ROM Builder hoặc nhấp đúp chuột vào
biểu tượng của ứng dụng trên Destop

Khi ứng dụng được khởi động, một giao diện gồm 2 khung được hiển thị

17

Tạo một CD-ROM
Việc tạo CD-ROM hầu như được tiến hành 1 cách tự động. Đầu vào duy nhất
cần thiết là bộ dữ liệu ở định dạng của Nessta và lựa chọn nhãn hiệu. Các tùy
chọn được cung cấp để bạn chỉnh sửa nội dung và mẫu thiết kế của sản phẩm
đầu ra nếu bạn muốn.
Một file Nessta là file kết quả lưu trữ bộ dữ liệu sử dụng Metadata Editor.
Nhãn hiệu bao gồm những tựa đề lớn được thiết kế tuỳ biến sẽ xuất hiện trên
đầu mỗi trang của CD-ROM. Nhãn hiệu có thể bao gồm logo, tên và các phần

file dữ liệu sang các định dạng khác (SPSS, STATA, SAS, Statistica,
DBF, ASCII, ).
 Open generated output in external browser sẽ làm cho ứng dụng mở
trình duyệt web và hiển thị trang chủ của CD-ROM ngay sau khi ứng
dụng kết thúc việc tạo CD-ROM. Nếu không chọn tuỳ chọn này, có
thể xem CD-ROM bằng cách click đúp chuột vào file index.html trên
thư mục đã chọn để lưu CD-ROM.

4. Nếu thư mục đích để lưu CD-ROM không tồn tại, bạn sẽ được yêu cầu xác
nhận việc tạo ra thư mục đó

5. Bạn sẽ được nhắc rằng những nét phác thảo chính của CD-ROM chưa
được lưu. Lưu phác thảo cho phép bạn tạo ra CD-ROM sau này. File lưu
có phần mở rộng [.Outline]. Chọn Yes hoặc No, CD-ROM sẽ được tạo ra.

20

Chú ý: nếu file Nessta dùng để tạo CD-ROM đang được mở bởi 1 ứng
dụng khác (ví dụ Metadata Editor), 1 thông báo lỗi sẽ hiện ra. Đóng các
chương trình đang chạy file Nessta, và thử lại.
6. Nếu tùy chọn Open generated output in external browser được chọn, trình
duyệt web sẽ mở ra và hiển thị trang chủ của CD-ROM.
Phần mềm cho phép tạo ra phiên bản CD-Rom trên đĩa cứng, sau đó ta sẽ
dùng các ứng dụng ghi đĩa của windows để sao chép thành đĩa CD-Rom
VHLSS 2006


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status