TRƯỜNG ĐẠI HỌC Y TẾ CÔNG CỘNG
BỘ MÔN TIN HỌC – THỐNG KÊ
TÀI LIỆU GIẢNG DẠY MÔN KỸ THUẬT MÁY TÍNH
P
P
H
H
Ầ
Ầ
N
NM
M
Ề
Ề
M
ME
E
P
CHỦ BIÊN
Kỹ sư Phạm Việt Cường NHÓM BIÊN SOẠN
Cử nhân Mạc Văn Huy
Cử nhân Chử Việt Anh
Cử nhân Trương Đức Tùng THƯ KÝ BIÊN SOẠN
Cử nhân Mạc Văn Huy OOOOOOOOOOOOOOOOOOOOOOOOOOOOO
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
3
MỤC LỤC
BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU 6
BÀI 5: GHÉP VÀ CHUYỂN ĐỊNH DẠNG TỆP SỐ LIỆU 82
1. Ghép tệp số liệu 82
2. Xuất nhập tệp số liệu 87
2.1 Xuất tệp số liệu 87
2.2 Nhập tệp số liệu 88
BÀI 6: CÁC CHỨC NĂNG TIỆN ÍCH 90
1. Sửa tên trường 90
2. Sao chép cấu trúc tệp REC 91
3. Đếm bản ghi theo trường dữ liệu 93
4. So sánh hai tệp dữ liệu 95
5. Đóng gói tệp số liệu 96
6. Tạo tệp QES từ tệp REC 97
BÀI TẬP TỔNG KẾT 98
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
5 LỜI GIỚI THIỆU
Tài liệu này được viết bởi các cán bộ Bộ môn Tin học – Thống kê, Trường Đại học Y
tế công cộng, được sử dụng làm giáo trình phục vụ cho giảng dạy và là tài liệu tham
BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
Sẽ rất khó để có thể hình dung về mục đích, ý nghĩa của các công việc mà chúng ta
thực hiện với Epidata, nếu như chúng chỉ được hướng dẫn thực hành với phần mềm.
Vì vậy, mục tiêu của bài học này là giới thiệu về phần mềm Epidata, quá trính thu thập
xử lý số liệu và những kiến thức liên quan đến dữ liệu (số liệu).
1.
Phần mềm Epidata là gì?
EpiData là phần mềm hỗ trợ nhập và quản lý số liệu, được lập trình bởi Bác sĩ Jens
M.Lauritsen, người Đan Mạch. Phần mềm này đã được sử dụng lần đầu tiên cho một
nghiên cứu dịch tễ học “Phòng chống tai nạn”.
2.
Đặc điểm của phần mềm Epidata
Trước khi EpiData ra đời, đã có những phần mềm được sử dụng để nhập liệu và thực
hiện các công việc thống kê số liệu như EpiInfo (do Tổ chức Y tế Thế giới xây dựng)
và những sản phẩm thương mại có sẵn khác. Tuy nhiên, những phần mềm đó không có
nhiều ưu điểm như phần mềm Epidata. Phần mềm Epidata đơn giản, dễ sử dụ
ng, có
khả năng kiểm tra và hạn chế lỗi số liệu, đặc biệt là khả năng hỗ trợ tạo ra công cụ
nhập liệu nhanh hơn nhiều so với các phần mềm khác.
Ý tưởng của người phát triển phần mềm EpiData là việc tạo ra một phần mềm nhập
liệu miễn phí, giao diện người dùng thân thiện, dễ sử dụng. Với Epidata, người sử
dụng có thể
nhập số liệu dưới dạng văn bản đơn giản và sau đó chuyển đổi số liệu
sang các dạng khác nhau để phục vụ cho việc phân tích thống kê số liệu bằng các
phần mềm khác nhau. Phần mềm Epidata có những đặc điểm sau:
Epidata được phát triển nhằm phục vụ cho mục đích nghiên cứu và học tập, hỗ
trợ cho quy trình quản trị số liệu.
Epidata có giao diện người dùng thân thiện và tạo ra tiến trình làm việc đơn
giản. Những người sử dụng có trình độ Tin học khác nhau đều có thể dễ dàng
học tập và sử dụng được phần mềm này trong một thời gian rất ngắn.
liệu và sửa lỗi.
7. Kiểm tra ràng buộc số liệu. Tính ràng buộc của số liệu thể hiện nhữn
g
quy luật của thông tin. Số liệu không thỏa mản các ràng buộc thì số liệu đ
ó
là không chính xác. Ví dụ, thông tin về một sự kiện man
g
thai phải thuộ
c
vào những cá nhân có giới tính là nữ. Tuy nhiên, trong cơ sở dữ liệu lại c
ó
những trường hợp cá nhân có giới tính là nam có thông tin về việc man
g
thai và sinh đẻ. Đây chính là những số liệu không thỏa mãn ràng buộc s
ố
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
8
liệu.
8. Tạo các biến (biến số liệu còn gọi là trườn
g
số liệu) mới từ các biến c
ó
sẵn trong cơ sở dữ liệu (cơ sở dữ liệu là một tệp hoặc một tập hợp các tệp
lưu trữ thông tin về số liệu và lưu trữ số liệu). Việc tạo ra biến mới thự
c
chất là tạo ra các thông tin mới trong cơ sở dữ liệu từ nhữn
g
thôn
g
Mỗi bản ghi thường là một tập hợp các số liệu trên một bộ câu hỏi, được lưu liền kề
nhau và được gắn kết l
ại với nhau thành một khối trong cơ sở dữ liệu.
Hinh 2: Mô tả tệp số liệu
Tệp số liệu
Bản ghi 2
Bản ghi 3
Bản ghi 1 Mã số : ………….
Họ và tên:………………
N
gày sinh:………………
Giới tính:……………
Tình trạng hôn nhân:…
Biến 1
Nhóm biến
Một bản ghi
(1 case)
Biến 2
Biến 3
Biến 4
Biến 5
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
trường số liệu (biến)
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
11 Hình 3: Kiểu dữ liệu trong Epidata
Epidata hỗ trợ các kiểu dữ liệu gồm Numeric, ID Number, Text, Date, Boolean và
Soundex. Những người sử dụng Epidata cần nắm được đặc điểm và cách sử dụng các
kiểu dữ liệu này.
5.1.1. Kiểu ID number
Kiểu ID number là kiểu dữ liệu số tự động và có các đặc điểm sau:
Chuỗi định dạng là <IDNUM>
Một trường số liệu được khai báo kiể
u ID number thì giá trị số liệu của trường
sẽ được tự động nhập khi nhập số liệu. Người sử dụng không được nhập giá trị
cho trường này.
Kiểu ID number thường được sử dụng để khai báo cho trường khóa. Trường
khóa là trường chứa số liệu định danh cho bản ghi. Đặc điểm của trường khóa
là trong tất cả các bản ghi của một tệp dữ liệ
u sẽ không có cặp bản ghi nào có
cùng giá trị tại trường khóa. Dựa vào số liệu của trường khóa, ta luôn tìm được
bản ghi duy nhất tương ứng với nó trong tệp số liệu.
Ví dụ:
Kiểu biến
Auto ID
Number
Text
Numeric
khai báo cho các trườ
ng số liệu dạng văn bản như họ và tên, địa chỉ, ghi chú .v.v.
Chuỗi định dạng là sử dụng ký tự “_” hoặc <E >
Chuỗi văn bản nhập vào có thể gồm các ký tự a, b, c, … và kể cả các chữ số.
Độ rộng của trường lớn nhất là 80 kí tự.
Khi khai báo mỗi dấu “_” tương ứng với khai báo cho một kí tự.
Ví dụ 1:
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
13
Khi khai báo trường họ tên với độ rộng 25 ký tự thì sẽ có 25 dấu “_” trong
phần khai báo:
V2 Ho ten _________________________
Ví dụ 2:
Khi muốn khai báo trường V3 kiểu Text, có 7 ký tự, dữ liệu nhập được mã hóa
và bảo mật, ta khai báo như sau:
V3 “Mat khau” <E >
Số dấu cách (ký tự trắng) trong cặp “<E” và “>” là 7 tương ứng khai báo cho
giá trị mật khẩu 7 kí tự.
5.1.4. Kiểu Upper-case text
Đây cũng là một kiểu dữ liệu văn bản, kiểu này có các đặc tính sau:
Chuỗi định dạng là <A>, hoặc <A >
Trường được khai báo kiểu Upper-case text thì số liệu nhập vào trường này
được hiểu là dạng văn bản và được tự động chuyển sang dạng kí tự viết hoa.
Độ rộng của trường tương ứng với số kí tự “trống” (dấu cách) giữa hai dấu “<”
và “>”.
5.1.5. Kiểu Boolean
Đây là kiểu dữ liệu logic. Trường được khai báo kiểu này chỉ chấp nhậ
n giá trị Y hoặc
V6 “Ngay nhap lieu” <today-dmy>
5.1.8. Kiểu soundex
Kiểu Soundex là kiểu dữ liệu mã hóa. Số liệu nhập vào trường này sẽ
được Epidata tự
động mã hóa (chuyển sang một giá trị khác) theo quy luật mã hóa của Epidata trước
khi lưu vào cơ sở dữ liệu.
Chuỗi định dạng là <S >
Trường số liệu kiểu Soundex chấp nhận tất cả các kí tự. Trừ kí tự đầu tiên, các
kí tự còn lại sẽ được tự động mã hóa.
Khuôn dạng của chuỗi mã hóa là A-999, tức là chuỗi mã hóa gồm một kí tự đầu
và tiếp theo là dấu “-“ và ba chữ số. Khi chuỗi nhập vào là HOLMES, chữ H
được giữ lại và chuỗi “OLMES” được mã hóa thành 452 và ta có chuỗi sau mã
hóa là H-452.
Ví dụ:
Khai báo biến tên tỉnh có tên biến là V7, viết như sau:
[Bộ môn Tin học – Đại học YTCC] | BÀI 1: EPIDATA VÀ QUÁ TRÌNH THU THẬP XỬ LÝ SỐ LIỆU
15
V7 “Ten tinh” <S >
5.1.9. Chỉ định Tabulator code
Chỉ định Tabulator code được sử dụng khi khai báo trường câu hỏi, nhằm chỉ dẫn cho
Epidata về việc thực hiện căn lề cho các thành phần trên Mẫu biểu (cửa sổ nhập liệu)
nhập liệu.
Ký tự định dạng là @
Bình thường thì trên Mẫu biểu nhập liệu các thành phần (các câu hỏi) không
được căn lề. Tabulator code sẽ giúp giải quyết vấn
đề trên.
Ví dụ:
Có thể khai báo các cho các câu hỏi được căn lề đều theo lề trái như sau:
V1 “Ma so” @<IDNUM>
Bước 1: Mở cửa sổ trình duyệt Internet Explorer hoặc Netscape explorer, vào trang
web www.epidata.dk
, vào mục Download (get files).
Hình 4: Hình ảnh trang web www.epidata.dk
Bước 2:
Chọn liên kết Epidata Entry để nhảy đến phần Epidata Entry, hình ảnh trên
trang web như sau:
[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA
17 Hình 5: Hình ảnh trang web download của website Epidata software
Bước 3:
Chọn mục Complete setup để bắt đầu tải tệp chương trình cài đặt về máy tính.
Hình ảnh trên trang web như sau:
Hình 6: Hình ảnh chọn bộ cài của phiên bản Epidata tiếng Anh
Trên trang web, có nhiều bộ cài đặt EpiData của các phiên bản chương trình sử dụng
ngôn ngữ khác nhau như tiếng Anh, Trung Quốc, .v.v. Nếu muốn sử dụng ngôn ngữ
nào thì người sử dụng phải tải về bộ cài đặt của phiên bản chương trình sử dụng ngôn
ngữ đó. Ở đây, chúng ta sẽ chọn phiên bản chương trình sử dụng tiếng Anh nên mụ
c
Complete Setup được chọn như ở hình ảnh trên.
Bước 4:
Sau khi chọn Complete Setup, hộp thoại File Download xuất hiện, chọn nút
lệnh Save trên hộp thoại để tải tệp chương trình cài đặt về máy tính.
[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA
18
1.2 Cài đặt chương trình
Khi ta chạy chương trình cài đặt từ bộ cài đặt, các tệp chương trình Epidata được tải
nén từ bộ cài và copy vào thư mục được chỉ định trước. Các bước cài đặt Epidata như
sau:
Bước 1:
Mở thư mục chứa bộ cài vừa được tải về và kích đúp chuột trái vào tệp cài đặt
để chạy tệp chương trình cài đặt setup_epidata.exe. Chúng ta cũng có thể chạy chương
trình cài đặt từ hộp thoại thông báo tiến độ tải bộ cài, bằng cách nhấn nút Run khi tiến
trình tải bộ cài kết thúc. Với nhiều phần mềm khác, bộ cài có thể có nhiều tệp thành
phần. Tuy nhiên, bộ cài của Epidata chỉ có mộ
t tệp setup_epidata.exe là duy nhất. Khi
chương trình cài đặt được kích hoạt, hộp thoại Setup – Epidata Entry xuất hiện, bắt
đầu cho tiến trình cài đặt. Hộp thoại cài đặt có hình ảnh như sau:
Hình 11: Hộp thoại cài đặt Epidata bước 1
Hộp thoại trên đưa ra lời chào người sử dụng chương trình, để chuyển sang bước tiếp
theo của tiến trình cài đặt, chọn nút lệnh Next.
Bước 2:
Chương trình cài đặt đưa ra một số thông tin về tác giả và nguồn gốc của phần
mềm. Để có thể chuyển qua bước này, ta tích vào mục “I accept the agreement” và
chọn Next.
[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA
21 Hình 12: Hộp thoại cài đặt Epidata bước 2
Bước 3:
Thư mục Program Files được chương trình cài đặt mặc định là nơi các tệp
chương trình Epidata sẽ được cài đặt. Nếu người sử dụng muốn cài đặt chương trình vào
khai báo, và nếu được chọn là “Automatic field naming” thì 10 ký tự đầu tiên
của dòng khai báo sẽ là tên biến.
Sau khi chọn các tùy chọn, ta chọn Next để chuyển sang bước tiếp theo. Hộp thoại của
chương trình cài đặt ở bước này có hình ảnh như sau:
Hình 15: Hộp thoại cài đặt Epidata bước 5
Bước 6:
Sau khi các tùy chọn đã được người sử dụng xác định, chương trình cài đặt
đưa ra thông báo là đã sẵn sàng để cài đặt Epidata và yêu cầu người sử dụng nhấn nút
Install để cài đặt chương trình. Hộp thoại cài đặt ở bước này có hình ảnh như sau:
[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA
24 Hình 16: Hộp thoại cài đặt Epidata bước 6.
Bước 7: Khi tiến trình cài đặt Epidata kết thúc, chương trình cài đặt đưa ra các thông
tin cần lưu ý về chương trình Epidata như địa chỉ trang web Epidata, đại chỉ Email của
tổ chức cung cấp phần mềm Epidata. Để chuyển qua bước tiếp theo, người sử dụng
phải nhấn nút lệnh Next. Hình ảnh hộp thoại cài đặt ở bước này như sau:
Hình 17: Hộp thoại cài đặt Epidata bước 6
[Bộ môn Tin học – Đại học YTCC] | BÀI 2: CÀI ĐẶT VÀ LÀM QUEN VỚI EPIDATA
25
Bước 7:
Tiến trình cài đặt phần mềm Epidata đã kết thúc, chương trình cài đặt đưa ra
thông báo hoàn thành tiến trình cài đặt. Nếu người sử dụng muốn xem tài liệu hướng
dẫn sử dụng chương trình thì tích vào mục “See intro” và nếu muốn chương trình cài
đặt khởi động chương trình Epidata thì tích vào “Launch Epidata”. Sau cùng chọn nút
Finish để kết thúc cài đặt.