Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 1
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA KHOA HỌC MÁY TÍNH
MÔN HỌC: ĐIỆN TOÁN LƯỚI VÀ ĐÁM MÂY
ĐỀ TÀI: NGHIÊN CỨU XÂY DỰNG ỨNG DỤNG THỐNG KÊ PHẢN HỒI
CỦA NHÂN VIÊN TRÊN CLOUD COMPUTING
CBHD: PGS. TS. NGUYỄN PHI KHỨ
HỌC VIÊN: TRẦN MẠNH TƯỞNG CH1301070
TP HCM 05-2014
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 2
Mục Lục
I. ĐẶT VẤN ĐỀ 3
II. KHÁI NIỆM VỀ CLOUD COMPUTING 5
1. Định nghĩa 5
2. Các ưu điểm 6
3. Các khuyết điểm 7
4. Mô hình các lớp dịch vụ 8
chất lượng cao thì lại chưa thể đáp ứng kịp. Do vậy các công ty phần mềm ngoài vấn
đề cạnh tranh tìm khách hàng trong nước cũng như ngoài nước, thì vấn đề nguồn lực
cũng là một vấn đề cạnh tranh rất nóng bỏng. Các công ty luôn đưa ra các chính sách
cao cho việc chiêu mộ nhân viên mới, cũng như chính sách đãi ngộ cho các nhân
viên đang làm việc. Hàng năm FPT Software chi cả chục tỷ đồng cho việc trả hoa
hồng cho việc chiêu mộ nhân viên mới cũng như các đãi ngộ cho nhân viên: nghỉ mát,
FPT care, các chương trình đào tạo… Tất cả những việc làm đó đều mục đích là kích
thích tinh thần, động lực của nhân viên, để giữ chân nhân viên ở lại.
Một đội ngũ nhân viên được động viên tốt sẽ đem lại những sản phẩm và dịch vụ ưu
việt, làm hài lòng khách hàng và tăng kết quả bán hàng.
Vì vậy, ngày càng có nhiều doanh nghiệp quan tâm đến động viên nhân viên và thực
hiện các cuộc khảo sát để tìm hiểu phản hồi của nhân viên về động cơ làm việc và sự
gắn bó của họ đối với tổ chức, từ đó định hướng cho các mục tiêu, các đề xuất về vấn
đề nhân sự…FPT Software hàng năm thường định kỳ tổ chức khảo sat hai lần, ngoài
những câu hỏi có lựa chọn đáp án, thì có phần ghi cảm nghĩ của bản thân nhân viên
của công ty là khá quan trọng, nhưng công ty với quy mô lớn, làm sao có thể tổng
hợp hết được nội dung, ý nghĩa bao quát những cảm nghĩ đó, làm sao biết được đa số
nhân viên đang nghĩ gì về công ty, mong muốn của họ là gì? Từ đó tôi đã có ý tưởng
xây dựng ứng dụng để thống kê những ý kiến phản hồi của nhân viên FPT Software
nói riêng và các công ty khác nói chung. Mục tiêu của ứng dụng là với đầu vào là các
dữ liệu của khảo sát, cho ra kết quả là bao nhiêu phần trăm nhân viên có cùng suy
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 4
nghĩ, và suy nghĩ đó là gì? Hiện tại ý tưởng chỉ là thống kế phản hồi nhân viên, nếu
xây dựng thành công với độ chính xác chấp nhận được, ứng dụng sẽ được dùng cho
thống kê các tin tức của trang web, nội dung của siêu văn bản, thống kê comment của
các trang mạng xã hội.
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
phải có một máy tính với cấu hình quá “khủng” khi sử dụng những ứng dụng kiểu
này. Chẳng hạn, chúng ta hoàn toàn có thể tiếp cận những dịch vụ điện toán đám
mây chỉ với một chiếc netbook, phiên bản thu nhỏ của laptop, với mức giá không
quá 250 USD.
3. Di động
Chúng ta muốn cho bạn bè của mình xem một văn bản trong máy tính của mình?
Điều này không hề khó. Họ chỉ cần đăng nhập và nhận văn bản này qua dịch vụ điện
toán đám mây. Nếu cần một tài liệu trình chiếu và sử dụng trong một hội thảo quan
trọng, nhưng không may là chiếc laptop của chúng ta lại đột ngột dở chứng trên
đường ra sân bay? Điều này sẻ không thành vấn đề khi sử dụng điện toán đám mây,
vì bất kỳ máy tính nào cũng có thể truy cập tài liệu trình chiếu này.
4. Linh hoạt
Khi sử dụng dịch vụ điện toán đám mây, chúng ta sẽ không còn chịu cảnh gò bó khi
chỉ có thể thao tác các tài liệu số trên các thiết bị thông dụng như desktop hay laptop
nữa. Có rất nhiều thiết bị có khả năng truy cập Internet hiện đã có thể sử dụng được
các dịch này, và chúng ta có thể thoải mái tải xuống các bức ảnh từ Flickr với chú
dế Blackberry, hay sử dụng ứng dụng trên iPhone để “quảng cáo” cuốn tiểu thuyết
đang viết dở cho bạn bè mình xem.
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 7
5. Yên tâm tuyệt đối
Chắn chắn không ít lần chúng ta đã để mất những dữ liệu quý giá chỉ bởi đã lỡ tay
xóa nó đi mất, hay chiếc máy tính thân yêu bất ngờ bị cháy ổ cứng? Một điểm rất
tuyệt khi sử dụng các dịch vụ điện toán đám mây là nó sẽ trở thành một mạng lưới
thực sự an toàn. Nếu chúng ta tải một ảnh của mình lên trang Flickr, chúng ta hãy cứ
yên tâm răng dù ổ cứng của chúng ta có bị cháy nổ bao nhiêu lần đi nữa, thì bức ảnh
mà chúng ta tải lên sẽ vẫn an toàn tuyệt đối. (Tất nhiên là cho đến khi nào Flickr còn
tồn tại.).
3. Các khuyết điểm
ứng dụng kế toán … Các dịch vụ cũng được phân loại khá da dạng, nhưng các mô
hình dịch vụ Cloud Computing phổ biến nhất có thể được phân thành 3 nhóm: Dịch
vụ hạ tầng (IaaS), Dịch vụ nền tảng (PaaS) và Dịch vụ phần mềm (SaaS).
Dịch vụ hạ tầng IaaS (Infrastructure as a Service)
Dịch vụ IaaS cung cấp dịch vụ cơ bản bao gồm năng lực tính toán, không gian lưu
trữ, kết nối mạng tới khách hàng. Khách hàng (cá nhân hoặc tổ chức) có thể sử dụng
tài nguyên hạ tầng này để đáp ứng nhu cầu tính toán hoặc cài đặt ứng dụng riêng
cho người sử dụng. Với dịch vụ này khách hàng làm chủ hệ điều hành, lưu trữ và
các ứng dụng do khách hàng cài đặt. Khách hàng điển hình của dịch vụ IaaS có thể
là mọi đối tượng cần tới một máy tính và tự cài đặt ứng dụng của mình.
Ví dụ điển hình về dịch vụ này là dịch vụ EC2 của Amazon. Khách hàng có thể
đăng ký sử dụng một máy tính ảo trê dịch vụ của Amazon và lựa chọn một hệ thống
điều hành (ví dụ, Windows hoặc Linux) và tự cài đặt ứng dụng của mình.
Dịch vụ nền tảng PaaS (Platform as a Service)
Dịch vụ PaaS cung cấp nền tảng điện toán cho phép khách hàng phát triển các phần
mềm, phục vụ nhu cầu tính toán hoặc xây dựng thành dịch vụ trên nền tảng Cloud
dó. Dịch vụ PaaS có thể được cung cấp dưới dạng các ứng dụng lớp giữa
(middleware), các ứng dụng chủ (application server) cùng các công cụ lập trình với
ngôn ngữ lập trình nhất định để xây dựng ứng dụng. Dịch vụ PaaS cũng có thể được
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 9
xây dựng riêng và cung cấp cho khách hàng thông qua một API riêng. Khách hàng
xây dựng ứng dụng và tương tác với hạ tầng Cloud Computing thông qua API đó. Ở
mức PaaS, khách hàng không quản lý nền tảng Cloud hay các tài nguyên lớp như hệ
điều hành, lưu giữ ở lớp dưới. Khách hàng điển hình của dịch vụ PaaS chính là các
nhà phát triển ứng dụng (ISV).
Dịch vụ App Engine của Google là một dịch vụ PaaS điển hình, cho phép khách
hàng xây dựng các ứng dụng web với môi trường chạy ứng dụng và phát triển dựa
trên ngôn ngữ lập trình Java hoặc Python.
tài nguyên tính toán, mạng và lưu trữ. Do vậy, hạ tầng Cloud Computing được tiết
kế để đảm bảo cô lập về dữ liệu giữa các khách hàng và tách biệt về truy cập.
Đám mây “doanh nghiệp”
Đám mây doanh nghiệp (Private Cloud) là mô hình trong đó hạ tầng đám mây được
sở hữu bởi một tổ chức và phục vụ cho người dùng của tôt chức đó. Private Cloud
có thể được vận hành bởi một bên thứ ba và hạ tầng đám mây có thể được đặt bên
trong hoặc bên ngoài tổ chức sở hữu (tại bên thứ ba kiêm vận hành hoặc thậm chí là
một bên thứ tư).
Đám mây “chung”
Đám mây chung (Community Cloud) là mô hình trong đó hạ tầng đám mây được
chia sẻ bởi một số tổ chức cho cộng đồng người dùng trong các tổ chức đó. Các tổ
chức này do đặc thù không tiếp cận với các dịch vụ Public Cloud và chia sẻ chung
một hạ tầng Cloud Computing để nâng cao hiệu quả đầu tư và sử dụng.
Đám mây “lai”
Mô hình đám mây lai (Hybrid Cloud) là mô hình bao gồm hai hoặc nhiều hơn các
đám mây trên tích hợp với nhau. Mô hình Hybrid Cloud cho phép chia sẻ hạ tầng
hoặc đáp ứng nhu cầu trao đổi dữ liệu.
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 11 III. KHÁI NIỆM VỀ DATA MINING
1. Khái niệm về Data Mining
Khái niệm về khai phá dữ liệu (Data Mining) hay phát hiện tri thức (Knowledge
Discovery) có rất nhiều cách diễn đạt khác nhau nhưng về bản chất đó là quá trình
tự động trích xuất thông tin có giá trị (thông tin dự đoán – Predictive Information)
ẩn chứa trong khối lượng dữ liệu khổng lồ trong thực tế ) nhằm mục đích dự đoán
các xu thế, các hành vi trong tương lai, hoặc tìm kiếm những tập thông tin hữu ích
mà bình thường không thể nhận diện được.
Khai thác dữ liệu (data mining) là quá trình khám phá các tri thức mới và các tri
Visualization: Trực quan hóa (giúp dữ liệu dễ hiểu, dễ sử dụng)
2. Các giai đoạn của quá trình khai phá dữ liệu
Quá trình khai phá dữ liệu được bắt đầu bằng việc hiểu được ứng dụng chúng ta
đang chuẩn bị khai phá. Bên dưới là hình ảnh phác họa các giai đoạn của quá trình
khai phá dữ liệu:
Hình 4: Các giai đoạn trong quá trinh khai phá dữ liệu.
Giai đoạn tìm hiểu lĩnh vực áp dụng: Giai đoạn này là giai đoạn quan trọng, quyết
định cho việc trích rút tri thức và lựa chọn Phương pháp khai phá dữ liệu hợp lý phù
hợp bản chất của dữ liệu. Ví dụ như Đề tài đang tìm hiểu lĩnh vực công nghệ phần
mềm.
Giai đoạn thu thập và tiền xử lý dữ liệu: Giai đoạn này thu thập và tiền xử lý dữ liệu,
chọn lọc dữ liệu nguồn, loại bỏ các dữ liệu không cần thiết, xử lý dữ liệu lỗi, giai
đoạn này chiếm nhiều thời gian nhất của khai phá dữ liệu.
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 14
Giai đoạn khai phá dữ liệu, trích rút tri thức: Giai đoạn này sẽ sử dụng các kỹ thuật
khai phá để trích rút ra các mẫu, các mô hình ẩn dấu trong dữ liệu, hoặc tích lũy các
thông tin thống kê.
Giai đoạn phân tích và kiểm định kết quả: Giai đoạn này làm sáng tỏ các tri thức,
đặc biệt làm sáng tỏ phạm vi mô tả và dự báo, một cách chuẩn để đánh giá là chia
dữ liệu thành hai tập: một tập để nghiên cứu, một tập để kiểm thử. Một tập có thể
trải qua các quá trình phân tách khác nhau và kết quả trung bình sẽ dùng làm ước
lượng luật thực thi.
Giai đoạn cuối là giai đoạn sử dụng các tri thức được phát hiện: Giai đoạn này sẽ
đưa các tri thức khai phá được vào thực tế. Giai đoạn này có thể sử dụng các tri thức
khám phá được mà chưa cần đưa vào máy tính, việc đưa kết quả vào thực tế là cái
đích cuối cùng của quá trình khai phá dữ liệu.
3. Các kỹ thuật khai phá dữ liệu
3.4 Hồi quy
Thuộc loại khai phá dữ liệu dự đoán. Phương pháp hồi quy khác với phương pháp
phân loại dữ liệu ở chỗ, hồi qui dùng để
dự đoán về các giá trị liên tục còn phân loại dữ liệu chỉ dùng để dự đoán về các giá
trị rời rạc.
Hồi quy là một hàm học ánh xạ mục dữ liệu thành một biến dự đoán có giá trị thực.
4. Ứng dụng của Data Mining
Các lĩnh vực hiện tại có ứng dụng Khai thác dữ liệu bao gồm:
Thiên văn học: dự báo thời tiết, thiên tai hiểm họa.
Tin sinh học: phát triển các giải thuật, lý thuyết và các kĩ thuật thống kê và tính toán
để giải quyết các bài toán bắt nguồn từ nhu cầu quản lí và phân tích dữ liệu sinh học.
Bào chế thuốc: trong y học bào chế các loại thuốc đặc trị
Thương mại điện tử: buôn bán qua mạng, tìm hiểu tâm lý tiêu dùng: Amazon.
Phát hiện lừa đảo: xây dựng chương trình phát hiện lừa đảo qua mạng
Quảng cáo: hệ thống quảng cáo
Marketing: quảng bá thương hiệu của các sản phẩm
Quản lý quan hệ khách hàng: phân tích tâm lý, thị hiếu khách hàng.
Chăm sóc sức khỏe: tư vấn, hướng dẫn chăm sóc sức khỏe.
Viễn thông
Thể thao, giải trí
Đầu tư
Máy tìm kiếm (web)
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 17
IV. NGHIÊN CỨU XÂY DỰNG ỨNG DỤNG THỐNG KÊ
PHẢN HỒI NHÂN VIÊN TRÊN CLOUD COMPUTING
Để xây dựng ứng dụng này cần trải qua các bước, giai đoạn như bên dưới:
1. Thu thập dữ liệu
cú pháp.
Tích hợp văn bản - Ngữ nghĩa của một câu riêng biệt có thể phụ thuộc vào những
câu đứng trước, đồng thời nó cũng có thể ảnh hưởng đến các câu phía sau.
Phân tích thực nghĩa - Cấu trúc thể hiện điều được phát ngôn sẽ được thông dịch lại
để xác định nó thật sự có nghĩa là gì.
Tiếp theo dùng luật kết hợp để khai phá dữ liệu, kết quả là đưa ra các dạng luật.
Thuật toán dùng để khai phá luật kết hợp là Apriori-Tid.
3. Xây dựng ứng dụng: chọn ngôn ngữ lập trình, môi trường, kiểu phần
mềm ứng dụng
Khi đã có dữ liệu, có ý tưởng là dùng phương pháp nào để khai phá dữ liệu thì
chúng ta bắt đầu vào lập trình để xây dựng ứng dụng. Ứng dụng có thể xây dựng là
một website và cho phép nhân viên công ty đăng nhập để làm khảo sát. Hoặc ứng
dụng có thể là một phần mềm nhúng vào nền web. Phần mềm này nhận dữ liệu là
kết quả của cuộc khảo sát, có thể là một bảng dữ liệu, một file dữ liệu…Sau đó phần
mềm sẽ tiến hành xử lý và trả ra kết quả là bao nhiêu phản hồi của nhân viên trùng
lặp, và những phản hồi riêng lẻ, và nội dung chính của phản hồi đó là gì.
Về ngôn ngữ lập trình thì không quá quan trọng, khi đã kết luận cuối cùng về ý
tưởng, cách xây dựng chúng ta tiến hành chọn ngôn ngữ lập trình. Nhưng ngôn ngữ
lập trình cũng cần xem xét đến việc kế thừa các services đã có, cũng như thế mạnh
khi xử lý với dữ liệu lớn.
Khoa Khoa Học Máy Tính Môn học Điện Toán Lưới Và Đám Mây
Nghiên cứu xây dựng ứng dụng Thống kê phản hồi nhân viên trên Cloud Computing Trang 19
4. Làm sao để ứng dụng trở thành một SaaS
Sau khi có ứng dụng, câu hỏi là làm sao đưa nó lên Cloud Computing. Vì ứng dụng
có thể cung cấp cho nhiều công ty, vì ứng dụng chỉ quan tâm đến input đầu vào là
dữ liệu mà thôi. Đa phần các công ty thường quan tâm đến vấn đề bảo mật, do vậy
có thể mua các services của các nhà cung cấp lớn như Microsoft hoặc Google.
TÀI LIỆU THAM KHẢO
1. Tài liệu môn học Điện toán lưới và đám mây của Thầy PGS. TS. NGUYỄN PHI
KHỨ
2. Data Mining:Practical Machine Learning Tools and Techniques. Mark Hall, Ian
Witten, Eibe Frank
3. Data Mining:Concepts and Techniques. Jiawei Han and Micheline Kamber
4. Data Mining and Analysis: Fundamental Concepts and Algorithms. Mohammed
Zaki and Wagner Meira Jr.
5. http://timtailieu.vn/tai-lieu/de-tai-nghien-cuu-va-ap-dung-mot-so-ky-thuat-khai-
pha-du-lieu-voi-co-so-so-du-lieu-nganh-thue-viet-nam-6231/
6. http://www.eecs.wsu.edu/~cook/dm/lectures/l2/sld014.htm
7. http://associationrule.blogspot.com/2008/09/apriori-aprioritid-and-apriori-
hybrid.html
8. http://www.ibm.com/developerworks/vn/library/data/2013Q1/ba-data-mining-
techniques/
9. http://tuvanphanmem.vn/10-cau-hoi-pho-bien-nhat-ve-phan-mem-dich-vu-
saas.html
10. http://en.wikipedia.org/wiki/Cloud_computing
11. http://msdn.microsoft.com/en-us/library/dd430340.aspx