ĐẠI HỌC QUỐC GIA TP.HCM
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC
ỨNG DỤNG VÀO
XÂY DỰNG NỀN TẢNG TRÍ TUỆ KINH DOANH TRÊN ĐÁM MÂY MÃ
NGUỒN MỞ
TIỂU LUẬN PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC
GVHD: GS.TSKH HOÀNG KIẾM
SINH VIÊN: BÙI ĐẮC THỊNH
MÃ SỐ: 1212037
LỚP: CAO HỌC KHOÁ K22
TP.HCM, 2012
LỜI CÁM ƠN
Chúng em xin chân thành cảm ơn Khoa Công Nghệ Thông Tin, trường Đại
Học Khoa Học Tự Nhiên, Tp.HCM đã tạo điều kiện tốt cho em tiếp cận môn học
“Phương pháp nghiên cứu khoa học”.
Chúng em xin chân thành cảm ơn thầy Hoàng Kiếm, là người đã tận tình
truyền đạt kiến thức, hướng dẫn, chỉ bảo chúng em trong suốt thời gian thực hiện
báo cáo môn học.
Em cũng xin gửi lời cảm ơn sâu sắc đến quý thầy cô trong Khoa Công nghệ
LUẬN 1
1.2
NỘI
DUNG
TIỂU
LUẬN 1
CHƯƠNG 1.
KHOA HỌC VÀ CÁC NGUYÊN TẮC SÁNG TẠO 2
1.1
K
HOA
H
ỌC
2
1.2
N
GHIEN
C
2.1.2
TRIZ và các 40 Nguyên tắc Sáng Tạo 5
2.2
C
ÁC
N
GUYÊN TẮC
S
ÁNG
T
ẠO
T
HÔNG
D
ỤNG
T
RONG
T
IN
H
ỌC
6
2.2.1
Nguyên tắc phân nhỏ 7
Nguyên tắc rẻ thay cho đắt 10
2.2.10
Nguyên tắc đồng nhất 11
CHƯƠNG 3.
TRÍ TUỆ KINH DOANH 12
3.1
G
IỚI
T
HIỆU
T
RÍ
T
UỆ
K
INH
D
OANH
12
3.1.1
Kho Dữ Liệu 13
Đ
IỆN
T
OÁN
Đ
ÁM
M
ÂY
16
ii
3.3.1
Điện Toán Đám Mây 16
3.3.2
Trí Tuệ Kinh Doanh trên Điện Toán Đám Mây 18
CHƯƠNG 4.
NGUYÊN TẮC SÁNG TẠO TRONG TRÍ TUỆ KINH DOANH 20
4.1
P
HÂN
T
ÍCH
S
Dự Phòng – Sao Chép 23
4.1.3
Tự Phục Vụ - Linh Động 23
4.1.4
Rẻ thay cho đắt 23
4.1.5
Đồng nhất 24
4.2
P
HÂN
T
ÍCH
G
IẢI
P
HÁP
K
ẾT
H
ỢP
T
iii
DANH MỤC CÁC HÌNH
Hình 1-1: Mối quan hệ giữa các loại hình nghiên cứu [1] 3
Hình 2-1: TRIZ kế thừa từ nhiều nguồn khoa học [1] 5
Hình 3-1:Mô hình dữ liệu MOLAP 14
Hình 3-2: Mô hình dữ liệu ROLAP 14
Hình 3-3: Mô hình dữ liệu HOLAP 15
Hình 3-4: Mô hình định nghĩa đám mây của NIST [3] 17
Hình 3-5: Ba mô hình dịch vụ: IaaS - PaaS – SaaS 18
Hình 4-1: Mô hình kiến trúc tổng quan dịch vụ trí tuệ kinh doanh 21
Hình 4-2: Minh hoạ cho mô hình dữ liệu hệ thống BI [8] 22
Hình 4-3: Đề xuất giải pháp cho mô hình BI trong đám mây mã nguồn mở [8] 24DANH MỤC CÁC BẢNG
Bảng 2-1: Danh sách các nguyên tắc hay sử dụng chung với nhau 6
1
TỔNG QUAN
hình dung thực tế về các sự vật, biết cách phản ứng trước tự nhiên, biết ứng xử
trong các quan hệ xã hội. Tri thức kinh nghiệm ngày càng trở nên phong phú, chứa
đựng những mặt đúng đắn, nhưng riêng biệt chưa thể đi sâu vào bản chất các sự vật,
và do vậy tri thức kinh nghiệm chỉ giúp cho con người phát triển đến một khuôn
khổ nhất định. Tuy nhiên, tri thức kinh nghiệm luôn là một cơ sở quan trọng cho sự
hình thành các tri thức khoa học [1].
Tri thức khoa học là những hiểu biết được tích lũy một cách hệ thống nhờ
hoạt động nghiên cứu khoa học, là loại hoạt động được vạch sẳn theo một mục tiêu
xác định và được tiến hành dựa trên những phương pháp khoa học. Tri thức khoa
học không phải là sự kế tục giản đơn các tri thức kinh nghiệm, mà là sự tổng kết
những tập hợp số liệu và sự kiện ngẫu nhiên, rời rạc để khái quát hóa thành cơ sở
lý thuyết về các liên hệ bản chất.
1.2 Nghiên Cứu Khoa Học
Nghiên cứu khoa học là một hoạt động xã hội, hướng vào việc tìm kiếm
những điều mà khoa học chưa biết hoặc là phát hiện bản chất sư vật, phát triển nhận
3
thức khoa học về thế giới hoặc là sáng tạo phương pháp mới và phương tiện kỹ
thuật mới để cải tạo thế giới [1].
Có nhiều cách phân loại nghiên cứu khoa học. Ở đây ta đề cập đến phân loại
theo chức năng nghiên cứu và theo tính chất của sản phẩm tri thức khoa học thu
được nhờ kết quả nghiên cứu, được mô tả như Hình 1-1.
Hình 1-1: Mối quan hệ giữa các loại hình nghiên cứu [1]
4
CHƯƠNG 2. PHƯƠNG PHÁP SÁNG TẠO KHOA HỌC TRONG
TIN HỌC VÀ CÁC NGUYÊN TẮC SÁNG TẠO THÔNG
DỤNG
| Chương này giới thiệu về phương pháp luận sáng tạo TRIZ và áp dụng
trong lĩnh vực tin học. Bên cạnh đó, đưa ra các nguyên tắc sáng tạo thông dụng
kỹ thuật.
Dựa trên những nhận xét trong [2], em thống kê lại danh sách các nguyên tắc
thường được sử dụng chung với nhau, mô tả như Bảng 2-1.
6
Nhóm các nguyên tắc thường sử dụng
chung với nhau
Ý nghĩa
Nguyên tắc phân nhỏ, tách khỏi, phẩm
chất cục bộ, kết hợp, vạn năng, linh động.
Chia đối tượng thành các thành phần độc lập với
nhau, từ đó tách các tính chất riêng biệt khỏi đối
tượng, làm cho mỗi phần nhỏ của đối tượng có những
tính chất khác nhau. Các thành phần rời rạc linh động
có thể tháo ghép với nhau làm cho sự kết hợp trở nên
đa dạng.
Nguyên tắc chứa trong, phân nhỏ, tách
khỏi, kết hợp, đẳng thế, liên tục tác động
có ích.
Đặt một đối tượng bên trong đối tượng khác, có thể
phân nhỏ các đối tượng ra và xem chúng ngang bằng
nhau. Thông qua các đối tượng liên tục tác động với
nhau để tạo ra lợi ích.
Nguyên tắc vượt nhanh, tác động theo chu
kì, thay thế sơ đồ cơ học, phân huỷ hoặc
tái sinh, sử dụng chuyển pha.
Vượt nhanh các giai đoạn nguy hiểm hoặc cần thiết
trong chu kì tác động đến đối tượng. Tuỳ theo sự vượt
nhanh mà ta sử dụng các sơ đồ khác nhau, các pha
khác nhau…
[2].
- Ứng dụng trong tin học:
1.
Chương trình phần mềm được chia nhỏ ra làm nhiều module, mỗi
module có nhiều chức năng, mỗi chức năng được minh hoạ bởi nhiều
hàm riêng biệt. Các module có tính lỏng lẻo cao có thể tháo ráp được.
2.
Các thuật toán tìm kiếm nhị phân, sắp xếp dãy Quicksort,… chia nhỏ và
phân hoạch đối tượng ra làm nhiều phần riêng biệt nhằm giảm độ phức
tạp thuật toán.
3.
Phân hoạch ngôn ngữ chính quy L thành các tập con phân biệt nhằm tối
tiểu automat hữu hạn đơn định biễu diễn ngôn ngữ đó.
2.2.2 Nguyên tắc tách khỏi
- Nội dung: tách phần gây “phiền phức” (tính chất “phiền phức”) hay ngược lạ,
tách phần duy nhất “cần thiết” (tính chất “cần thiết”) ra khỏi đối tượng [2].
- Ứng dụng trong tin học:
1.
Hệ thống ERP bao gồm nhiều module, mỗi module có thể sử dụng riêng
cho từng yêu cầu như: module Kế toán có thể dùng riêng cho lãnh vực
kế toán, module Nguồn nhân lực,… Khi đó công ty có thể dùng toàn bộ
hệ thống cho công việc của mình, nhưng cũng có thể dùng một hay một
vài module nào đó cần thiết cho công việc của mình thôi để giảm bớt chi
phí
8
2.2.3 Nguyên tắc kết hợp
- Nội dung: kết hợp các đối tượng đồng nhất hoặc các đối tượng dành cho các
đối tượng kế cận hoặc kết hợp về mặt thời gian các hoạt động đồng nhất hoặc
kế cận. Đối tượng mới được tạo nên do sự kết hợp, thường có những tính chất,
khả năng mà đối tượng riêng rẽ chưa từng có. Điều này có nguyên nhân sâu xa
cần phải tiên liệu trước những mạo hiểm, rủi ro, tai nạn, ốm đau, bệnh tật, thiên
tai có thể xảy ra mà có phương pháp phòng ngừa từ trước. Nguyên tắc dự
phòng bù đắp độ tin cậy không lớn của đối tượng bằng cách chuẩn bị các
phuơng tiện báo động, ứng cứu, an toàn [2].
- Ứng dụng trong tin học:
1.
Thiết bị UPS : Dùng cho việc dự phòng khi cúp điện đột ngột, thì lúc đó
máy vẫn làm việc bình thường trong một khoảng thời gian nhật định nào
đó đủ để chúng ta có những thao tác sao lưu dữ liệu, tắt máy đúng qui
trình … tránh những lỗi gây ra do mất điện đột ngột.
2.
Các ứng dụng đều có chức năng backup dữ liệu theo định kỳ hoặc do
người dùng tự backup
3.
Các phần mềm SVN giúp sao lưu phiên bản
2.2.6 Nguyên tắc sao chép
- Nội dung: thay vì sử dụng cái không được phép, phức tạp đắt tiền, không tiện
lợi dễ vỡ, nguyên tắc sao chép sử dụng bản sao để thay thế đối tượng hay hệ
các đối tượng. Từ “sao chép” cần hiểu theo nghĩa rộng: phản ánh những cái
chính của đối tượng, cần thiết cho việc giải bài toán, nếu như làm trực tiếp đối
tượng gặp khó khăn [2].
- Ứng dụng trong tin học:
1.
Phần mềm tìm đường đi ngắn nhất được thực hiện trên trên bản đồ (sao
chép theo tỉ lệ xích phù hợp) sẽ dễ dàng hơn.
2.
Các phần mềm giả lập các mô hình thực tế như mô hình lái máy bay,
các dây chuyền sản xuất, cách cài đặt phần mềm.
10
2.2.7 Nguyên tắc đảo ngược
chất lượng và giá cả khác nhau để phù hợp với từng đối tượng người
dùng.
11
2.
Một số loại máy tính cá nhân được giản lược đi những phần cứng không
cần thiết để tập trung tối ưu hoá chức năng mà giá tiền không đổi: phần
cứng không cần thiết sử dụng loại rẻ, phần cần thiết sử dụng loại đắt.
2.2.10 Nguyên tắc đồng nhất
- Nội dung: những đối tượng, tương tác với các đối tượng cho trước, phải được
làm từ cùng vật liệu (hoặc từ vật liệu gần về các tính chất) với các vật liệu để
tạo đối tượng cho trước [2].
- Ứng dụng trong tin học:
1.
Trong phần mềm ứng dụng, các form nhập liệu phải có giao diện chuẩn
như: màu sắc, cách bố cục các nút, textbox, label … phải giống nhau.
Các form thông báo phải đống nhất như : Thông báo cần chú ý phải có
màu đỏ, các form hỏi đáp phải có các biểu tượng như dấu “?” phải giống
nhau… để tránh gây nhập nhằng cho người dùng.
2.
Các chương trình phần mềm 32 bit/ 64 bit phải được cài đặt trên hệ điều
hành 32 bit/ 64 bit tương ứng.
12
CHƯƠNG 3. TRÍ TUỆ KINH DOANH
| Nội dung chương này giới thiệu lý thuyết tổng quan về trí tuệ kinh doanh
và sự phát triển của kĩ thuật này qua các thời kì.
3.1 Giới Thiệu Trí Tuệ Kinh Doanh
Trí tuệ kinh doanh (Business Intelligence – BI) là lĩnh vực ứng dụng các kỹ
thuật phân tích, thống kê cũng như khai phá dữ liệu từ nhiều nguồn khác nhau để
phân tích dữ liệu trực tuyến, kết xuất ra những báo biểu, rút trích thông tin có ý
tại cố định một thời gian và dựa vào biến thời gian [4].
- Dữ liệu tích hợp (Integrated): dữ liệu từ kho dữ liệu được tích hợp từ nhiều
nguồn dữ liệu khác nhau có cấu trúc khác nhau, được xây dựng và khai thác
với những hệ quản trị cơ sở dữ liệu khác nhau.
- Hướng chủ đề (Subject-Oriented): kho dữ liệu tập trung vào nhu cầu phân
tích ở nhiều cấp độ khác nhau trong quá trình ra quyết định, có nghĩa là
hướng về các chủ đề cần phân tích, cung cấp một khung nhìn đơn giản và súc
tích xung quanh các sự kiện của chủ đề. Những chủ đề này sẽ thay đổi khác
nhau ở từng doanh nghiệp, tổ chức và ở từng lĩnh vực.
- Dữ liệu cố định (Non-volatile): dữ liệu trong kho dữ liệu tồn tại cố định trong
một thời gian. Thời gian hoạt động và tồn tại của dữ liệu trong kho dữ liệu
dài hơn so với dữ liệu tác nghiệp thông thường. Dữ liệu không bị xoá, cập
nhật hay chèn liên tục theo biến động của nghiệp vụ hằng ngày mà chỉ được
làm mới dữ liệu định kì. Dữ liệu được lưu trữ lâu dài trong kho dữ liệu
- Biến thời gian (Time-variant): bản chất dữ liệu trong kho dữ liệu là dữ liệu
tổng hợp, được tính toán từ dữ liệu thô của các hệ thống nghiệp vụ. Dữ liệu
gắn liền với yếu tố thời gian và phụ thuộc vào thời gian.
3.1.2 Kỹ Thuật Khai Thác Dữ Liệu
3.1.2.1 Phân Tích Trực Tuyến (OLAP)
OLAP là một kỹ thuật được sử dụng để phân tích dữ liệu hiệu quả thông qua
14
các biểu kết xuất, biểu đồ. Trong khi kho dữ liệu và dữ liệu chủ đề là phương pháp
lưu trữ dữ liệu hiệu quả cho phân tích, thì OLAP cho phép các ứng dụng truy xuất
hiệu quả dữ liệu này. Các mô hình khối dữ liệu của OLAP bao gồm: MOLAP (Hình
3-1), ROLAP (Hình 3-2) và HOLAP (Hình 3-3).
Hình 3-1:Mô hình dữ liệu MOLAP
Hình 3-2: Mô hình dữ liệu ROLAP
15
- Chi phí trung bình hàng năm cho các phần mềm trí tuệ kinh doanh: khoảng
1.1 tỉ USD cho công ty có hơn 1000 nhân viên.
- Tỉ lệ thành công của dự án: khoảng 31%.
- Khả năng phù hợp: chỉ khoảng 36% khả năng các báo biểu trình bày đúng dữ
liệu đến đúng người vào đúng thời điểm.
Những hạn chế trên đã dẫn tới yêu cầu cấp thiết là cần có một giải pháp công nghệ
khác cho bài toán trí tuệ kinh doanh.
3.3 Trí Tuệ Kinh Doanh và Điện Toán Đám Mây
3.3.1 Điện Toán Đám Mây
3.3.1.1 Định nghĩa
Khái niệm điện toán đám mây có thể được xuất phát từ việc dùng hình ảnh đám
mây làm đại diện cho Internet hay các môi trường mạng có quy mô lớn. Theo NIST:
“Điện toán đám mây là một mô hình điện toán cho phép truy cập đến các tài nguyên
tính toán chia sẻ, điều chỉnh được, theo nhu cầu và một cách tiện lợi (như mạng
máy tính, các máy chủ, thiết bị lưu trữ, ứng dụng và dịch vụ). Những tài nguyên này
có thể được cấp phát và thu hồi một cách nhanh chóng, mà không tốn nhiều công
sức quản lý hay tương tác với nhà cung cấp dịch vụ” [3].
17
Hình 3-4: Mô hình định nghĩa đám mây của NIST [3]
3.3.1.2 Tính chất
NIST nêu 5 tính chất thiết yếu của công nghệ điện toán đám mây:
- Dịch vụ theo nhu cầu: người dùng có thể yêu cầu tăng thêm hay cắt giảm tài
nguyên tính toán bất cứ khi nào họ muốn.
- Tính truy cập rộng rãi: cho phép người dùng có thể thực hiện các công việc
liên quan đến tài nguyên tính toán trên bất kì môi trường, nền tảng hay thiết
bị nào, miễn là có kết nối Internet.
- Các tài nguyên tính toán được dùng chung: cùng một tài nguyên vật lý có
thể được chia sẻ, sử dụng bởi nhiều khách hàng khác nhau.
- Tính co giãn nhanh chóng: các tài nguyên tính toán có thể được tăng hay
hệ thống trí tuệ kinh doanh phải được thay đổi cho phù hợp với nhu cầu và mục
đích sử dụng. Hơn nữa, các hệ thống này thường khó mở rộng khi nhu cầu sử dụng
tăng lên. Bên cạnh đó, giải pháp trí tuệ kinh doanh đến nay vẫn chưa đáp ứng được
nhu cầu “quan sát” dữ liệu theo nhiều góc nhìn khác nhau ứng với từng đối tượng
sử dụng, cũng như hạn chế khả năng chia sẻ thông tin.
Sự phổ biến rộng rãi của Internet đã giúp cho người dùng có thể làm việc bất
cứ lúc nào và ở bất cứ đâu. Do đó, nhu cầu cho các ứng dụng hoạt động trên môi
trường web, dạng phần mềm như là một dịch vụ (Software as a Service – SaaS)
ngày càng gia tăng nhanh chóng, đòi hỏi các ứng dụng phải được nâng cấp, phát
triển để nâng cao tính linh động, tính sẵn sàng đáp ứng bất cứ lúc nào người dùng
có yêu cầu.
Theo IDC, nhà cung cấp thông tin toàn cầu, 43,2% các công ty cho rằng trí
tuệ kinh doanh là phù hợp nhất với mô hình SaaS so với 11 công nghệ khác [6,7].
Mặc dù vậy, vẫn còn nhiều thách thức cho việc triển khai thành công, chủ yếu là hệ
thống quy mô lớn và các kho dữ liệu phức tạp. Theo kết quả khảo sát của Gartner,
điều quan trọng nhất thu hút việc đầu tư vào trí tuệ kinh doanh liên quan đến việc
đáp ứng nhanh nhu cầu của người dùng đối với dữ liệu, giảm thiểu chi phí, nâng cao
cách thức người dùng chia sẻ dữ liệu và dịch vụ tự phục vụ.
20
CHƯƠNG 4. NGUYÊN TẮC SÁNG TẠO TRONG TRÍ TUỆ
KINH DOANH
| Nội dung chương này trình bày những phân tích về sự áp dụng những
quy tắc sáng tạo vào kĩ thuật Trí Tuệ Kinh Doanh. Qua đó, cho thấy tính hợp lý,
khả thi, những ưu điểm nổi trội và một số lưu ý cần phải cân nhắc của giải pháp kết
hợp trí tuệ kinh doanh và điện toán đám mây.
4.1 Phân Tích Sự Áp Dụng Các Quy Tắc Sáng Tạo vào Trí Tuệ Kinh Doanh
Dựa trên những kiến thức tìm hiểu được về trí tuệ kinh doanh và những
infographic thu thập được từ [8], ta nhận thấy được sự phát triển của kỹ thuật Trí