BỘ CÔNG THƯƠNG
TRUNG TÂM THÔNG TIN CÔNG NGHIỆP VÀ THƯƠNG MẠI
BÁO CÁO TỔNG HỢP ĐỀ TÀI NGHIÊN CỨU NGHIÊN CỨU LÝ THUYẾT VÀ PHƯƠNG PHÁP LUẬN
XÂY DỰNG CSDL THEO MÔ HÌNH DATA WARE HOUSE
VÀ METADATA CNĐT : ĐỖ VĂN CHIẾN
2.Mụcđíchcủakhảosátnhucầusửdụngthôngtin 24
3.Phươngphápkhảosát 24
4.Xửlývàphântíchkếtquảđiềutra 26
I.3. Nghiên cứu cơ sở lý thuyết khảo sát yêu cầu và phương thức cung cấp
thông tin 26
1.Nhucầuthôngtinvàcácđốitượngdùngtin 26
2.Cácphươngthứctruyềnvàcungcấpthôngtin 27
3.Phươngphápvàmụctiêukhảosát 28
I.4. Nghiên cứu cơ sở lý thuyết của tổng hợp và viết tài liệu khảo sát 29
1.Cấutrúccủabáocáonghiêncứu,khảosát 29
2.Xâydựngcácnguyêntắcphânloạivàbiêntậpthôngtinkhảosát 30
3.Xâydựngcáctiêuchítrongkếtquảkhảosát.Lậpbáocáokhảosát 35
CHƯƠNG II. Nghiên cứu cơ sở lý thuyết và công nghệ về thiết kế hệ
thống kho dữ liệu và ứng dụng BI 36
II.1. Nghiên cứu cơ sở lý thuyết và công nghệ về thiết kế kho dữ liệu nguồn36
1.Giớithiệu. 36
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
2
2.Địnhnghĩakhod ữliệunguồn. 36
3.Cấutrúccủamộtkhodữliệunguồn. 37
II.2. Nghiên cứu cơ sở lý thuyết và công nghệ về thiết kế kho dữ liệu và
datamart 39
1.ĐịnhnghĩakhodữliệuvàDatamart 39
2.TạisaocầnthiếtkếDataMart 42
II.3. Nghiên cứu cơ sở lý thuyết và công nghệ về thiết kế ETL - Extract -
Transformation - Load 42
1.Kháiniệmchuẩnhóadữliệu 68
2.Cácdạngchuẩnhóadữliệu 68
3.Làmsạchdữliệu 70
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
3
II.8. Nghiên cứu cơ sở lý thuyết và công nghệ về thiết kế Giải pháp xây dựng
cơ sở dữ liệu đa chiều với OLAP 72
1.OLAPlàgì? 72
2.Môhìnhdữliệuđachiềulàgì 73
3.GiớithiệudịchvụOLAP(OLAPServices)củaMicrosoftSQLServer 74
4.SosánhOLAPvớiOLTP 75
5.CácmôhìnhlưutrữhỗtrợOLAP 76
6.Kiếntrúckhối(cube)củaOLAP 79
7MôhìnhkiếntrúcdịchvụOLAP 80
II.9. Nghiên cứu cơ sở lý thuyết và công nghệ về thiết kế Giải pháp cung cấp
thông tin đến từng đối tượng sử dụng 83
1.Cácđốitượngngườisửdụng 83
2.Cácgiảiphápcungcấpthôngtin 84
II.10. Nghiên cứu cơ sở lý thuyết và công nghệ về thiết kế Giải pháp để người
sử dụng tự truy cập, khai thác, tìm kiếm và phân tích và dự báo thông tin. 89
1.Nhucầukhaithác,tìmkiếm,phântíchvàdựbáothôngtin 89
2.Cácgiảiphápcôngnghệchungphụcvụpháthiệntrithứcvàkhaiphádữliệu 91
3.Mộtsốnguyêntắcchungtrongthiếtkếgiảiphápkhaithácthôngtinthuậntiệncho
ngườisửdụng 104
4.Giảiphápcủamộtsốhãngphầnmềmlớn 107
6.Biệnpháptriểnkhai,ápdụngvàothựctiễn 133
III.5. Nghiên cứu cơ sở lý thuyết và công nghệ về xây dựng các module để
làm sạch và tích hợp dữ liệu 137
1.Tìmhiểuchungvềmoduleđểlàmsạchvàtíchhợpdữliệu 137
2.Sựcầnthiếtcủalàmsạchdữliệuvàtíchhợpdữliệutronghệthốngthôngtin 139
3.Cơsởcôngnghệ. 140
CHƯƠNG IV. Nghiên cứu cơ sở lý thuyết và công nghệ về xây dựng
CSDL đa chiều với OLAP 147
IV.1. Nghiên cứu cơ sở lý thuyết và công nghệ về xác định các chiều dữ liệu
từ thiết kế thi công 147
1.Kháiniệmchung 147
2.Phântíchđachiều 148
3.Địnhhướngcôngnghệ 150
4.Cáchxácđịnhchiều 151
IV.2. Nghiên cứu cơ sở lý thuyết và công nghệ về xác định các thông tin số
liệu từ thiết kế thi công 151
1.TriểnkhaiOLAPtrongSQLSERVER 152
IV.3. Nghiên cứu cơ sở lý thuyết và công nghệ về xác định các nấc phân cấp
thông tin trên cơ sở thiết kế thi công 162
1.Xácđịnhkhối 162
2.Xửlýcáckhối 163
3.Khốiảo 163
4.Xácđịnhcácchiều 163
5.Chiềucóphâncấp 164
6.Facttable(Fact) 164
V.3. Nghiên cứu cơ sở công nghệ về cách dùng BI để Lập báo cáo tổng hợp.
187
1.BusinessIntelligence(BI)làgì 187
2.CáchoạtđộngchínhcủaBI 188
3.BIdànhchoai 190
4.MộtsốbướccơbảnđểtạolậpbáocáotừhệthốngBI 190
5.TạolậpbáocáotrongmộtsốhệthốngBI 192
V.4. Nghiên cứu cơ sở công nghệ về cách dùng BI để lập báo cáo phân tích
194
1.Kháiniệmbáocáophântích 194
2.Kỹthuậtphântíchdữliệu 196
3.Truyvấnvàbáocáo 198
4.Côngnghệphântíchnhiềuchiều 198
5.MôhìnhhóacácchiềuvớiInfoSphereDataArchitectcủaIBM‐Kỹthuậtxuôichiều
trongInfoSphereDataArchitect 199
V.5. Nghiên cứu cơ sở công nghệ về cách dùng BI để dự báo thông tin 205
1.BIvàdựbáothôngtin 205
2.Phântíchdựđoán 207
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
6
3.Phântíchdựđoán(PredictiveAnalysis)vàdựbáokinhdoanhthôngminh(Business
Forecasting) 209
4.Dựbáovàkhaikhoángdữliệu 212
5.Thamkhảomộtsốthuậttoán 215
V.6. Nghiên cứu cơ sở công nghệ về phương pháp nhúng các ứng dụng BI
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
7
A. MỤC TIÊU ĐỀ TÀI
Với mục đích tạo lập một hệ thống thông tin chính thống, nền tảng, đầy đủ,
chuyên ngành - là hệ thống những thông tin, chỉ tiêu, thông số cơ bản và
chuyên sâu, đặc thù về thực trạng các loại sản phẩm, nguồn lực, hoạt động,
tiềm lực phát triển và các yếu tố liên quan trực tiếp của ngành cơ khí Việt
nam, phục vụ xây dựng chiến lược, hoạch định chính sách,
điều hành, quản lý
Nhà nước và phát triển kinh tế công nghiệp, thương mại Việt nam, phục vụ
chuyển dịch cơ cấu kinh tế và công nghiệp hoá, hiện đại hoá đất nước, Trung
tâm thông tin Công nghiệp và Thương mại được giao thực hiện nhiệm vụ
“Xây dựng cơ sở dữ liệu ngành cơ khí Việt Nam”.
Có thể nói, cơ khí là một ngành có mối liên quan với hầu hết tất cả các ngành
trong nền kinh tế
. Chính vì vậy, để có thể thu thập, xử lý dữ liệu ngành cơ khí,
dữ liệu sẽ đến từ rất nhiều nguồn, với rất nhiều chủng loại thông số. Hơn nữa,
để đánh giá đúng, đủ về ngành cơ khí, cần có các công cụ cho phép khai thác
thông tin đa chiều, đa tầng và nhanh chóng.
Để đáp ứng các yêu cầu xử lý hệ thống thông tin như trên, nhóm thực hiện đề
xuất nghiên cứ
u công nghệ nhà kho dữ liệu (Data Ware House) với các mô
hình BI (Business Intelligence), OLAP (Online Analytical Processing) và đặt
ra mục tiêu nghiên cứu các vấn đề lý thuyết và công nghệ liên quan trực tiếp
đến các mô hình này.
B. TÌNH HÌNH NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC
Trên thế giới, đặc biệt là ở các nước có trình độ công nghệ phát triển, việc
C. PHƯƠNG PHÁP NGHIÊN CỨU
Đây là đề tài có nội dung thuần túy về các vấn đề lý thuyết nên phương pháp
nghiên cứu được sử dụng sẽ là tham khảo các tài liệu về các vấn đề liên quan
để từ đó rút ra các nội dung chính là:
+ Khái niệm của vấn đề nghiên cứu
+ Ứng dụng của vấn đề trong thực tế
+ Đề xuất về việc áp dụng vấn đề trong thực hiện nhiệm vụ xây dựng CSDL
ngành cơ khí Vi
ệt Nam
D. NỘI DUNG NGHIÊN CỨU
CHƯƠNG I. Nghiên cứu lý thuyết và phương pháp luận của
công tác khảo sát, nội dung và nhiệm vụ của khảo sát
I.1. Nghiên cứu cơ sở lý thuyết về Khảo sát dữ liệu nguồn1. Khái niệm dữ liệu nguồn. Tại sao cần khảo sát dữ liệu nguồn
Dữ liệu đóng vai trò không thể thiếu được trong các cuộc điều tra nghiên cứu,
khảo sát. Từ các dữ liệu thu thập được, qua quá trình xử lý, có thể rút ra được
các kết quả quan trọng của cuộc khảo sát. Để phục vụ điều tra, khảo sát,
người ta chia các loại dữ liệu thành hai loại: dữ
liệu thứ cấp và dữ liệu sơ cấp.
a. Dữ liệu thứ cấp
Dữ liệu thứ cấp là dữ liệu do người khác thu thập, sử dụng cho các mục đích
có thể là khác với mục đích nghiên cứu của chúng ta. Dữ liệu thứ cấp có thể
là dữ liệu chưa xử lý (còn gọi là dữ liệu thô) hoặc dữ liệu đã xử lý. Như vậ
cấp và nếu có điều kiện, nên kiểm tra dữ liệu gốc.
b. Các nguồn dữ liệu thứ cấp
Là những tường trình không trực tiếp đối với một sự kiện. Nguồn thứ cấp có
thể dựa trên nội dung nguồn chính hoặc các nguồn thứ cấp khác nhằm tạo ra
một cái nhìn tổng quan, hoặc để đưa ra các khẳng định có tính phân tích hoặc
tổng hợp. Các nguồn th
ứ cấp có thể là:
+ Danh mục và thư mục: Trên cơ sở bộ danh mục và thư mục của các thư
viện, chúng ta có thể tìm kiếm dữ liệu cần thiết theo tác giả, chủ đề, thời gian
+ Tự điển: Dùng để xác định nghĩa của các từ chuyên môn trong nghề. Ngoài
ra, có thể dùng để xác định các sự liện trong ngành, tên tuổi các nhân vật cũng
như các tổ chức có tầm ảnh hưở
ng trong lĩnh vực quan tâm
+ Bách khoa toàn thư: Dùng để tìm hiểu các thông tin cơ sở hay lịch sử cũng
như tìm hiểu các thời điểm quan trọng, những sự kiện có ý nghĩa đối với
chuyên ngành quan tâm
+ Cẩm nang: Dùng để tìm hiểu các sự kiện cũng như các cá nhân liên quan,
có tầm ảnh hưởng đến vấn đề đang quan tâm
+ Danh bạ: Dùng để xác định các tổ chức và các nhân vật liên quan, qua đó
xác định các thông tin cơ bản như
địa chỉ, email để liên lạc
+ Internet: các trang web
+ Các nguồn của chính phủ: các tổ chức chính phủ, các văn bản luật, qui định
và từ các cục, tổng cục thống kê
c. Đánh giá các nguồn dữ liệu thứ cấp
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
trong phòng thí nghiệm hoặc ngoài thực địa, các thí nghiệm hoặc quan sát,
các kết quả thí nghiệm đã được công bố bởi những người thực sự tham gia
nghiên cứu; hồi ký tự truyện, tác phẩm triết học gốc, kinh sách của các tôn
giáo, văn bản của cơ quan quản lý, các tác phẩm nghệ thuật và giả tưởng như
thơ, kịch bản, kịch bản phim, tiểu thuyết, phim, video, và chương trình truyền
hình.
Các thông tin thu đượ
c từ các cuộc điều tra, căn cứ vào phạm vi điều tra có
thể được chia thành hai loại: điều tra toàn bộ và điều tra chọn mẫu.
+ Điều tra toàn bộ: Là tiến hành thu thập thông tin trên tất cả các đơn vị thuộc
tổng thể nghiên cứu.
Ưu điểm của điều tra toàn bộ là thu thập được thông tin về tất cả các đơn vị
tổng thể. Tuy nhiên lo
ại điều tra này có một số nhược điểm sau:
- Số lượng đơn vị thuộc tổng thể chung thường rất lớn nên quá trình điều
tra thường mất nhiều thời gian và tốn kém.
- Trong một số trường hợp do thời gian kéo dài dẫn đến số liệu kém
chính xác do hiện tượng tự biến động theo thời gian
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
11
- Trong một số trường hợp, điều tra toàn bộ sẽ không thực hiện được ví
dụ như kiểm tra chất lượng sản phẩm phải phá hủy các đơn vị thuộc đối tượng
nghiên cứu
+ Điều tra chọn mẫu: Để nghiên cứu tổng thể, ta chỉ cần lấy ra một số phần
tử đại diện để nghiên cứu và từ
đó suy ra kết quả cho tổng thể bằng các
phương pháp thống kê.
Điều tra chọn mẫu thường được sử dụng vì các lý do sau:
- Tiết kiệm chi phí
+ Hình thành cơ sở xây dựng các chuẩn dữ liệu
+ Xác định phương pháp thu thập dữ liệu
4. Xác định phương pháp khảo sát
Như đã phân tích ở các phần trên, nguồn dữ liệu bao gồm hai loại: nguồn dữ
liệu thứ cấp và nguồn dữ liệu sơ cấp. Đối với từng loại nguồn dữ liêu, chúng
ta cần có những phương pháp khảo sát khác nhau.
a. Đối với các nguồ
n dữ liệu thứ cấp.
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
12
+ Xác định thông tin nào có thể thu thập được từ các nguồn thứ cấp. Trong
nhiệm vụ xây dựng CSDL ngành cơ khí, một số thông tin có thể cung cấp
từ nguồn dữ liệu thứ cấp như: tổng sản lượng các sản phẩm ngành cơ khí
hàng năm, tổng kim ngạch xuất/nhập khẩu các sản phẩm ngành cơ khí,
tổng số lao động làm việc trong ngành cơ khí … Các số liệu này đều có
thể
lấy từ các báo cáo thông kê hàng năm của tổng cục thống kê.
+ Đánh giá chất lượng các nguồn dữ liệu thứ cấp theo các tiêu chí
+ Xây dựng chuẩn cho dữ liệu từ các nguồn thứ cấp
+ Xây dựng qui trình cung cấp dữ liệu từ các nguồn thứ cấp
Đối với các nguồn dữ liệu thứ cấp, nhóm nghiên cứu sử dụng phương pháp
đánh giá trực tiếp đối với từng nguồ
n dữ liệu.
b. Đối với các nguồn dữ liệu sơ cấp
+ Xác định các nguồn dữ liệu sơ cấp.
+ Xây dựng kế hoạch khảo sát, đánh giá chất lượng các nguồn dữ liệu sơ
cấp.
câu trả lời.
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
13
Nhược điểm của phương pháp này là:
- Phí tổn cao, di chuyển nhiều, mất nhiều thời gian để đến được đối tượng
phỏng vấn.
- Người được phỏng vấn có thể không bố trí được nhiều thời gian để trả lời.
- Sự có mặt của người phỏng vấn, thái độ cứng nhắc của người hỏi có thể làm
người trả lời né tránh câu hỏ
i hoặc trả lời không thật.
5. Xác định qui mô và đối tượng khảo sát
a. Đối với các nguồn dữ liệu thứ cấp
+ Xây dựng form mẫu cho khảo sát nguồn dữ liệu thứ cấp
+ Khảo sát các nguồn dữ liệu từ các website của các cơ quan chính phủ
trên Internet
+ Khảo sát các nguồn dữ liệu từ các kho tư liệu của các cơ quan chức năng
như: thư viện khoa học kỹ
thuật, thư viện quốc gia, cục thông tin khoa học
và công nghệ quốc gia, tổng cục tiêu chuẩn đo lường chất lượng, các vụ
chức năng thuộc Bộ Công Thương, Trung tâm thông tin …
+ Khảo sát nguồn dữ liệu từ các tạp chí, ấn phẩm chuyên ngành
+ Phỏng vấn trực tiếp một số chuyên gia trong ngành
b. Đối với các nguồn dữ liệu sơ cấp
+ Xây dựng bảng hỏi cho khảo sát nguồ
n dữ liệu sơ cấp
+ Gửi phiếu điều tra cho tất cả các sở công thương các tỉnh/thành trên cả
nước
+ Gửi phiếu điều tra cho các viện nghiên cứu, hiệp hội ngành nghề liên
- Khuyến khích người được phỏng vấn hợp tác.
- Hướng dẫn rõ ràng những điều người được hỏi muốn biết và cách trả
lời.
- Xác định những nhu cầu cần biết để phân loại và kiểm tra lại cuộc
phỏng vấn.
Để thực hiện được các nhiệm vụ trên, phiếu khảo sát phải được lập sao cho
người đi phỏng vấn dễ thực hiện, đồng thời, đáp ứng những yêu cầu để việc
xử lý thông tin được hiệu quả.
b. Các bước thiết kế một phi
ếu khảo sát
Do sự chính xác và thích hợp của các dữ liệu thu thập được phụ thuộc chủ yếu
vào phiếu khảo sát, việc thiết kế một bảng câu hỏi tốt sẽ có tác dụng rất lớn
đến thành công của dự án nghiên cứu.
Người ta đã tổng kết được 8 bước cơ bản về trình tự thiết kế một bảng câu hỏi
Bước 2: Xác định phương pháp phỏng vấn
Trong bước này, người nghiên cứu cần quyết định dùng phương pháp nào để
tiếp xúc với người được phỏng vấn (phỏng vấn trực tiếp, gọi điện thoại, gửi
thư hay internet…). Các phương pháp khác nhau sẽ yêu cầu nội dung, hay cấu
trúc bảng câu hỏi là khác nhau.
- Phỏng vấn bằng thư tín là hình thức gửi phiếu khảo sát qua b
ưu điện cho
người trả lời theo hình thức truyền thống. Trong trường hợp này, những câu
hỏi trong phiếu khảo sát phải thật đơn giản và những câu hướng dẫn cho
người trả lời phải hết sức chi tiết, rõ ràng.
- Phỏng vấn qua điện thoại là hình thức phỏng vấn giao tiếp bằng lời và người
trả lời trả lời các câu hỏi của người ph
ỏng vấn thông qua điện thoại mà không
thấy người hỏi và phiếu khảo sát. Hình thức này cho phép các phỏng vấn viên
giải thích các câu hỏi phức tạp cho người trả lời nhằm đáp ứng nội dung
phỏng vấn. tuy nhiên không thể trình bày chi tiết, dẫn đến việc kéo dài thời
gian.
- Phỏng vấn trực tiếp là hình thức phỏng vấn hoàn thiện nhất trong việc trao
đổi trực tiếp giữa người trả lờ
i và phỏng vấn viên. Phỏng vấn viên có thể giải
thích một cách chi tiết các câu hỏi. Do vậy, những câu hỏi dài và phức tạp
cũng có thể được sử dụng. Ngoài ra, hình thức này còn tạo được mối quan hệ
trong chừng mực nhất định giữa phỏng vấn viên và người trả lời để kích thích
người trả lời sẵn lòng trả lời trong quá trình phỏng vấn. Tuy nhiên để thực
hiên hình thức này cần phả
i tốn một khoản chi phí khá cao vì nhân viên phỏng
vấn phải di chuyển nhiều.
- Một hình thức mà hiện nay trên thế giới thường dùng là phỏng vấn bằng thư
điện tử (email). Trong trường hợp này những câu hỏi phức tạp có thể dễ dàng
nguyên nhân:
Thiếu kiến thức về vấn đề được hỏi.
Người trả lời không muốn cung cấp các thông tin
Để khắc phục, cần gửi phiếu khảo sát đúng đối tượng và chuẩn bị các câu hỏi
đúng mục đích
Bước 4 Xác
định dạng câu hỏi và câu trả lời
Có hai dạng câu hỏi chính sau:
Câu hỏi mở:
Đây là dạng câu hỏi trong đó câu hỏi được cấu trúc còn câu trả lời thì không.
Người trả lời có thể trả lời với bất kỳ thông tin nào và bất cứ câu nào được coi
là thích hợp. Người phỏng vấn sẽ có nhiệm vụ viết lại chính xác những gì có
thể thu thập được. Có ba loại câu hỏi mở.
(1) Câu hỏ
i tự do trả lời
Theo câu hỏi này, người trả lời có thể tự do trả lời câu hỏi theo ý mình tùy
theo phạm vi tự do trong nội dung câu hỏi đặt ra cho họ. Những thuận lợi của
câu hỏi tự do trả lời:
- Cho phép người nghiên cứu thu được những câu trả lời bất ngờ, không
dự liệu trước.
- Người trả lời có thể bộc lộ rõ ràng hơn những quan
điểm của mình về
một vấn đề nào đó, mà không bị gò bó bởi nội dung câu hỏi
- Giảm bớt sự thất vọng của người trả lời so với câu hỏi đóng là không
có cơ hội phát biểu ý kiến, chỉ lựa chọn trong tình huống có sẵn.
- Có tác dụng tốt lúc mở đầu cuộc phỏng vấn, tạo mối quan hệ với người
được hỏ
i.
Những khó khăn khi sử dụng câu hỏi tự do trả lời:
- Dạng kỹ thuật dựng hình: Theo kỹ thuật này, người được hỏi được cho
xem một số tình huống gợi mở nào đó, sau đó đề nghị họ viết lại câu chuyện
hay phát họa diễn tả vấn đề cần nghiên cứu.
- Dạng kỹ thuật hoàn tất: Đây là dạng được dùng nhiều nhất, ở đây,
người trả lờ
i sẽ “hoàn tất” những câu hỏi còn “dở dang” (chưa hoàn chỉnh) và
họ sẽ điền thêm vào bất kỳ nội dung gì mà họ chọn.
Ví dụ: Chúng tôi có nhu cầu sử dụng thông tin chuyên sâu này:……………
Câu hỏi thuộc dạng “kỹ thuật hiện hình” có những ưu thế: (1) có thể thu thập
được các thông tin mà có thể sẽ không thể thu thập được nếu phỏng vấn trực
tiếp bằng các phương pháp khác, (2) có thể tìm được những ý tưởng n
ội tại,
sâu xa của người trả lời. Tuy nhiên, cũng có những nhược điểm sau: (1) đòi
hỏi người phỏng vấn phải được huấn luyện kỹ lưỡng trước khi phỏng vấn, (2)
đòi hỏi phân tích viên phải được đào tạo cận thận để diễn dịch các kết quả.
Câu hỏi đóng:
Câu hỏi đóng là dạng câu hỏi mà cả câu hỏi lẫn câu trả
lời đều được cấu trúc.
Dựa trên cấu trúc câu trả lời người ta chia ra câu hỏi đóng sau:
(1) Câu hỏi phân đôi:
Là dạng câu hỏi mà người được hỏi chỉ có thể chọn một trong hai câu trả lời
như “có hoặc không”, “đồng ý hoặc không đồng ý”.
Ưu điểm:
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
18
- Thiết kế nhanh chóng và dễ dàng, rất tiện lợi trong những câu hỏi có
nhiều chi tiết.
- Dễ dàng cho người trả lời.
(3) Câu hỏi đánh dấu tình huống theo danh sách
Về cấu trúc, nó tương tự như câu hỏi xếp hạng thứ tự, tuy nhiên khác biệt là
người được hỏi sẽ đánh dấu một hay nhiều lo
ại trả lời được liệt kê. (4) Câu hỏi bậc thang:
•Ví dụ: Đơn vị có thể cung cấp được những thông tin doanh nghiệp nào:
Tên doanh nghiệp
Sản phẩm doanh nghiệp
Kim ngạch xuất khẩu hàng năm
Kim ngạch nhập khẩu hàng năm
•
đ
ịnh vấn đề
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
19
Thực chất loại câu hỏi này là áp dụng loại câu hỏi đánh giá theo khoản mục,
thể hiện mức độ ưa thích hoặc không ưa thích, đồng ý hoặc không đông ý của
người trả lời. Loại câu hỏi này cho phép biến đổi những thông tin định tính
thành thông tin định lượng.
Ví dụ: Mức độ cần thiết phải thực hiện chỉ tiêu “Phát triển bền vững” để đánh
Có tác dụng mở đầu cuộc phỏng vấn thuận tiện, khởi đầu cho chuỗi
những câu trả lời và gây thiện cảm với người được phỏng vấn.
(2) Câu hỏi định tính:
Có tác dụng chỉ rõ đối tượng cần được phỏng vấn, tránh ph
ỏng vấn
những người không có kiến thức về vấn đề đang điều tra.
(3) Câu hỏi hâm nóng:
Có tác dụng gợi nhớ thông tin và tập trung vào chủ đề nghiên cứu, tránh các
cảm xúc đột ngột khi đi vào chủ đề quá nhanh, người trả lời có thể chưa tạo
được hứng thú và hồi tưởng thông tin kịp.
(3) Các câu hỏi đặc thù:
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
20
Là những câu hỏi đi vào chủ đề nghiên cứu
(4) Các câu hỏi phụ:
Được sử dụng để thu nhận thêm các thông tin về đặc điểm nhân khẩu của
người trả lời (giới tính, tuổi tác, nghề nghiệp…)
Ngoài những phần chính trên, bảng câu hỏi cần có những chỉ dẫn rõ ràng,
phần này mô tả những thủ tục mà người phỏng vấn cần phải theo để thu thập
thông tin được dễ dàng nhanh chóng. Một bảng mẫu câu hỏi điển hình cần
phải có những khoản trống thích hợp để:
- Ghi tên, họ, địa chỉ, số điện thoại của người trả lời, ngày phỏng vấn.
- Thời gian bắt đầu và kết thúc phỏng vấn.
- Chữ ký của người phỏng vấn.
- Chữ ký của các cá nhân có liên quan.
- Ngày, giờ cu
ộc phỏng vấn có hiệu lực.
Bước 7: Xác định các đặc tính vật lý của bảng câu hỏi
+ Tổng số đối tượng được điều tra
+ Các nhóm đối tượng được điều tra
Nghiên cứu lý thuyết và phương pháp luận xây dựng CSDL theo mô hình Data Ware House và Metadata
21
+ Các nhóm thông tin dự định cung cấp
+ Các nhóm thông tin dữ liệu nguồn
+ Tần xuất cung cấp thông tin
+ Đánh giá chất lượng các nguồn thông tin
+ Đề xuất giải pháp xây dựng nguồn dữ liệu ổn định, phù hợp với mục tiêu
của dự án
I.2. Nghiên cứu cơ sở lý thuyết về Khảo sát nhu cầu thông tin của người
sử dụng
1. Thông tin và nhu cầu thông tin
1. Khái niệm thông tin
Mỗi khoa học đều quan niệm về thông tin theo cách lý giải phù hợp nhất cho
các sự kiện và hiện tượng xảy ra trong quá trình nghiên cứu của mình. Bởi
vậy, có rất nhiều định nghĩa khác nhau về thông tin. Thông thường trong cuộc
sống, thông tin được coi là tập hợp tin tức về các sự vật, hiện tượng hay quá
trình mà gây được sự quan tâm và được xử lý hoặc là tin tức được ai đó thông
báo hay thu nhận được qua nghiên cứu, phân tích, học tập,…Trong sách báo
khoa học, thông tin là “ý nghĩa mà con người gán cho dữ liệu trên cơ sở
những quy tắc đã biết để thể hiện các sự kiện, ý tưởng, thông báo trong các dữ
liệu đó”. Ý nghĩa thể chất của thông tin là kết quả tương tác của các vật thể
được truyền tải theo một kênh vật chất. Thông tin là cái có trước trong mối
quan hệ với hiểu biết, thông tin mang trong nó mọi cái cần thiết cho hiểu biết.
Trong khoa học v
iều khiển học: Thông tin là tính trật tự của các đối tượng vật
chất có những mối liên hệ biện chứng. Theo quan điểm hệ thống : Thông tin
là sự hạn chế tính đa dạng của mỗi hệ thống sự vật đối với môi trường. Theo
quan điểm triết học: Thông tin là một phạm trù triết học phản ánh sự vận động
và tương tác của các hiện t
ượng, sự vật của thế giới tự nhiên, xã hội và tư duy.
Theo tiêu chuẩn Việt Nam 5453 - 1991: Thông tin là các dữ liệu, tin tức được
xem xét trong quá trình tồn tại và vận động trong không gian và thời gian.
Như vậy, khái niệm thông tin được hiểu là các tin tức, dữ liệu phản ánh các
hiện tượng, sự vật của thế giới tự nhiên, xã hội và tư duy được xem xét trong
quá trình tồn tại và vận động của chúng trong không gian và thời gian, là tập
h
ợp các dữ kiện, số liệu, vận động trong không gian, theo thời gian, có khả
năng truyền và nhận giữa các đối tượng.
2. Phân loại thông tinCó rất nhiều cách phân loại thông tin
2.1. Theo giá trị và qui mô sử dụng
+ Thông tin chiến lược (dành cho các nhà quản lý)
+ Thông tin tác nghiệp (dành cho cán bộ chuyên sâu)
+ Thông tin thường thức (dành cho quảng đại quần chúng)
2.2. Theo nội dung thông tin
+ Thông tin pháp luật
+ Thông tin kinh tế
+ Thông tin khoa học kỹ thuật
+ Thông tin văn hóa xã hội
+ Thông tin thể thao
2.3. Theo đối tượng sử dụng
dụng thông tin. Tuy nhiên, những người không dùng tin lại chính là những
người dùng tin tiềm năng. Do những nguyên nhân khách quan hoặc chủ quan
mà hiện tại những người không dùng tin không cảm thấy sự cần thiết của
thông tin và không tin vào những lợi ích mà thông tin mang lại.
Như vậy, để xây dựng chính sách, hoạch định chiến lược cho các hoạt động
của mình, các đơn vị cung cấ
p thông tin cần trả lời ít nhất các câu hỏi sau:
+ Đối tượng sử dụng thông tin của mình là ai
+ Họ cần sử dụng loại thông tin nào
+ Sử dụng phương pháp cung cấp thông tin nào là phù hợp
5. Nhu cầu thông tin
Theo quan điểm của các nhà tâm lý học, nhu cầu là sự đòi hỏi tất yếu mà con
người thấy cần được thỏa mãn để tồn tại và phát triển. Theo quan điểm của
các nhà thông tin học hiện đại, nhu cầu tin là loại nhu cầu tinh thần đặc biệt,
đòi hỏi khách quan của con người (cá nhân, nhóm xã hội, cộng đồng xã hội
) đối với sự tiếp nhận và sử dụng thông tin nhằm duy trì hoạt
động sống của
con người.
Như vậy, nhu cầu tin là nhu cầu về sự hiểu biết thế giới khách quan (tự nhiên,
xã hội, con người) để con người có thể tồn tại và phát triển với tư cách là một
con người thực sự và để làm tròn chức năng, nhiệm vụ do xã hội phân công
và giao cho.
Nhu cầu thông tin thay đổi theo công việc và nhiệm vụ mà người dùng tin
phải thực hiện.
Các loại nhu cầu thông tin tổ
ng quát nhất đã được nhà thông tin học người
Mỹ xác định trong những năm 60 của thế kỷ XX bằng cách đặt câu hỏi cho
các nhà khoa học thuộc lĩnh vực hóa lý và sinh học. Ông xác định rằng họ sử
đem lại lợi ích thiết thực cho cả hai đối tượng. Các chương
trình này có thể được xây dựng cụ thể cho từng nhóm người sử dụng, từng địa
phương hay khu vực, hoặc trong một lĩnh vực thông tin cụ thể
Đối với các tổ chức cung cấp thông tin nói chung, việc đánh giá, xác định nhu
cầu thông tin nhằm phát hiện nhu cầu tiềm năng đối với các dịch vụ thông tin
hiện chưa thự
c hiện hoặc triển khai chưa sâu rộng. Qua đó, các nhà cung cấp
thông tin sẽ khám phá được các cơ hội thị trường mới cho hoạt động thu phí
dịch vụ thông tin.
Đối với người sử dụng cuối cùng: Hoạt động xác định nhu cầu thông tin do
các tổ chức cung cấp thông tin tiến hành sẽ tạo điều kiện cho những người sử
dụng có cơ hội thể hiện những yêu cầ
u, mong muốn về thông tin và góp ý về
các dịch vụ cung cấp thông tin. Việc đánh giá nhu cầu thông tin cũng có thể
coi là điểm khởi đầu cho những bước hợp tác tiếp theo của các tổ chức cung
cấp thông tin đối với người sử dụng cuối cùng, do vậy những yêu cầu về
thông tin của người sử dụng cuối cùng được chú trọng hơn.
3.Phương pháp khảo sát
Việc sử dụng mộ
t mẫu bảng câu hỏi thống nhất chung rất cần thiết để có thể
thu thập và xử lý dữ liệu một cách hệ thống về nhu cầu thông tin của các
doanh nghiệp. Điều đó cũng tạo thuận lợi cho việc phân loại thông tin và tạo
cơ sở cho việc trao đổi về thông tin đối với những cá nhân không quen với
những khái niệm thông tin này.