LỜI CÁM ƠN
Trong cuộc sống, bất cứ thành quả nào chúng ta đạt được thì cũng không
thể thiếu bóng dáng và giúp đỡ từ mọi người trong hành trình đi đến thành quả
đó. Và trong quá trình thực hiện đề tài luận văn tốt nghiệp “Tìm hiểu hệ thống
internet marketing, công nghệ big data và demo trên website
“deptuthiennhien.net” chúng tôi đã nhận được sự giúp đỡ rất nhiều từ gia đình,
thầy cô , bạn bè. Không biết nói gì hơn với lòng biết ơn sâu sắc và cảm tạ nhất,
trước tiên chúng tôi xin gửi lời cảm ơn ThS Nguyễn Văn Diêu là người đã hưỡng
dẫn cũng như đã tận tình giúp đỡ, truyền đạt những kinh nghiệm quý báu cho
chúng tôi để hoàn thành luận văn tốt nghiệp này.
Tiếp theo, chúng tôi xin gửi lời cảm ơn đến các thầy cô trong Khoa cũng
như xin gửi lời cảm ơn đến bạn bè đã không quản ngại giúp đỡ, giới thiệu, tư
vấn, hỗ trợ để chúng tôi có thêm kiến thức trong quá trình hoàn thành luận văn.
Mặc dù cố gắng hoàn thành luận văn trong phạm vi và khả năng cho phép,
bài luận văn của chúng tôi chắc chắn sẽ không tránh khỏi những thiếu sót. Chúng
tôi rất mong nhận được sự thông cảm góp ý và tận tình chỉ bảo của quý thầy cô
và các bạn để bài luận văn tốt nghiệp của chúng tôi được hoàn thiện hơn.
Nhóm sinh viên
Trần Thị Hồng
Đặng Ngọc Thất
i
LỜI CAM ĐOAN
Luận văn tốt nghiệp này đã được chúng tôi hoàn thành đúng thời gian quy
định và đáp ứng được yêu cầu đề ra nhờ sự cố gắng nghiên cứu, tìm tòi và phát
triển dưới sự hướng dẫn trực tiếp của Th.s Nguyễn Diêu. Chúng tôi đã tham
khảo một số tài liệu trong phần “Tài liệu tham khảo“. Chúng tôi cam đoan
không hề sao chép nội dung từ bất kỳ đồ án nào khác. Mọi sao chép sai quy định,
vi phạm quy chế đào tạo, chúng tôi xin chịu hoàn toàn trách nhiệm trước hội
đồng.
Nhóm sinh viên
Trần Thị Hồng
Hình 17 Quảng bá trên Facebook.com 79
Hình 18 Quảng bá trên Youtube.com 80
Hình 19 Quảng bá trên Google place 81
Hình 20 Kết quả SEO 82
Hình 21 Kết quả search từ khóa 83
DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt Ý nghĩa
iv
MPP Massively Parallel Processing
SEO Search Engine Optimization
v
LỜI MỞ ĐẦU
“Trong năm đến mười năm nữa, bạn chỉ có hai sự lựa chọn hoặc là kinh
doanh cùng internet hoặc không nên kinh doanh gì nữa”. Câu nói nổi tiếng đó
của Bill Gates đã làm cho cả thế giới nhận ra làm kinh doanh trực tuyến chính là
xu hướng của thời đại.
Theo trung tâm Internet Việt Nam, tính tới tháng 10/2012, Việt Nam đã có
hơn 31 triệu người dùng internet, chiếm 35,4% dân số cả nước, với 66% sử dụng
internet hàng ngày. Internet tác động rất lớn tới khả năng tiếp cận thông tin cũng
như hành vi mua hàng của hơn 35% dân số Việt Nam. Cùng với sự bùng nổ và
phát triển của internet thì Internet Marketing cũng chính là một trong các
công cụ hữu hiệu để cho các doanh nghiệp tiếp cận trực tiếp, giới thiệu sản
phẩm của mình đến khách hàng một cách rộng rãi.
Cũng trong năm 2012, cụm từ "Big Data" là một trong những từ khoá
tìm kiếm nhiều nhất trên Internet. Việc sử dụng Big Data ngày càng phổ
biến hơn trong năm 2013, khi mà các doanh nghiệp từ lớn tới nhỏ đều sử
dụng Big Data để phân tích các thông số dữ liệu, tạo ra lợi thế cạnh tranh
đáng kể so với thị trường chung. Việc đầu tư vào Big Data sẽ mang lại
doanh thu xứng đáng cho doanh nghiệp. Các dữ liệu và các phân tích từ Big
Data sẽ giúp đưa ra được những quyết định chính xác hơn, mang lại lợi
lược cho sản phẩm của doanh nghiệp.
- Hiểu được Internet Marketing và sơ đồ, quy trình và kỹ thuật làm
marketing hiệu quả trên internet, mấu chốt vấn đề làm Internet Marketing và
đâu là giải pháp và hướng đi đúng đắn.
- Tăng thứ hạng trên công cụ tìm kiếm hàng đầu Google cho website
Deptuthiennhien.net.
4. Nhiệm vụ nghiên cứu.
- Công nghệ mới Big Data về khái niệm, cách hoạt động và công nghệ hỗ
trợ, ứng dụng to lớn của Big Data.
- Hệ thống hóa cơ sở lý luận về Internet Marketing và triển khai các kênh
Internet Marketing :
• Nắm được cơ sở lý thuyết chung về quảng cáo trực tuyến và các vấn
đề trong quảng bá website.
• Tìm hiểu công cụ tìm kiếm và nghiên cứu những tiêu chí của việc
nâng cao thứ hạng trên công cụ tìm kiếm Google (SEO).
- Đánh giá thực trạng, hiệu quả Internet Marketing của deptuthiennhien.net
trên các khía cạnh:
Trang 3
• Tìm hiểu thực trạng tình hình quảng bá website của
deptuthiennhien.net
• Ưu điểm, thành tựu, hạn chế và nguyên nhân của những hạn chế.
• Lập kế hoạch Internet Marketing cho website.
- Đề xuất những giải pháp để nâng cao hiệu quả Internet Marketing của
Deptuthiennhien.net:
• Hướng tới việc hoàn thiện hơn cho website.
• Có những đề xuất và hướng phát triển lâu dài một cách tiềm năng cho
website deptuthiennhien.net về chất lượng sản phẩm, chất lượng phục
vụ, việc nắm bắt nhu cầu thị trường.
Phương pháp nghiên cứu.
Nghiên cứu, tìm hiểu lý thuyết chung của vấn đề. Tiếp đến xem xét thực trạng
thông tin tiếp tục sử dụng mô hình “3V” này để định nghĩa nên Big Data. Đến
năm 2012, Gartner bổ sung thêm rằng Big Data ngoài ba tính chất trên thì còn
phải cần đến các dạng xử lí mới để giúp đỡ việc đưa ra quyết định, khám phá sâu
vào sự vật/sự việc và tối ưu hóa các quy trình làm việc.
Trang 5
Ví dụ về Big Data ta có thể kể đến công tác giải mã di truyền của con người
chẳng hạn. Trước đây công việc này mất đến 10 năm để xử lí, còn bây giờ người
ta chỉ cần một tuần là đã hoàn thành. Còn Trung tâm giả lập khí hậu của NASA
thì đang chứa 32 petabyte dữ liệu về quan trắc thời tiết và giả lập trong siêu máy
tính của họ. Việc lưu trữ hình ảnh, văn bản và các nội dung đa phương tiện khác
trên Wikipedia cũng như ghi nhận hành vi chỉnh sửa của người dùng cũng cấu
thành một tập hợp Big Data lớn.
Hoạt động của người dùng Wikipedia được mô hình hóa và với kích thước
hàng terabyte, đây cũng có thể được xem là một dạng Big Data.
1.1.2 Vài thông tin về tình hình Big Data hiện nay
Theo tài liệu của Intel vào tháng 9/2013, hiện nay thế giới đang tạo ra 1
petabyte dữ liệu trong mỗi 11 giây và nó tương đương với một đoạn video HD
dài 13 năm. Bản thân các công ty, doanh nghiệp cũng đang sở hữu Big Data của
riêng mình, chẳng hạn như trang bán hàng trực tuyến eBay thì sử dụng hai trung
tâm dữ liệu với dung lượng lên đến 40 petabyte để chứa những truy vấn, tìm
kiếm, đề xuất cho khách hàng cũng như thông tin về hàng hóa của mình.
Nhà bán lẻ online Amazon.com thì phải xử lí hàng triệu hoạt động mỗi ngày
cũng như những yêu cầu từ khoảng nửa triệu đối tác bán hàng. Amazon sử dụng
một hệ thống Linux và hồi năm 2005, họ từng sở hữu ba cơ sở dữ liệu Linux lớn
nhất thế giới với dung lượng là 7,8TB, 18,5TB và 24,7TB.
Tương tự, Facebook cũng phải quản lí 50 tỉ bức ảnh từ người dùng tải lên,
YouTube hay Google thì phải lưu lại hết các lượt truy vấn và video của người
dùng cùng nhiều loại thông tin khác có liên quan.
Trang 6
Theo tập đoàn SAS, chúng ta có một vài số liệu thú vị về Big Data như sau:
toán đám mây (bao gồm ứng dụng, nguồn lực tính toán cũng như không gian lưu
trữ) và bản thân internet cũng là những công cụ đắc lực phục vụ cho công tác
nghiên cứu và trích xuất thông tin từ Big Data. Hiện nay cũng có vài cơ sở dữ
liệu theo dạng quan hệ (bảng) có khả năng chứa hàng petabyte dữ liệu, chúng
cũng có thể tải, quản lí, sao lưu và tối ưu hóa cách sử dụng Big Data nữa.
Những người làm việc với Big Data thường cảm thấy khó chịu với các hệ
thống lưu trữ dữ liệu vì tốc độ chậm, do đó họ thích những loại ổ lưu trữ nào có
thể gắn trực tiếp vào máy tính (cũng như ổ cứng gắn trong máy tính của chúng ta
vậy). Ổ đó có thể là SSD cho đến các đĩa SATA nằm trong một lưới lưu trữ cỡ
lớn. Những người này nhìn vào ổ NAS hay hệ thống lưu trữ mạng SAN với góc
nhìn rằng những thứ này quá phức tạp, đắt và chậm. Những tính chất nói trên
không phù hợp cho hệ thống dùng để phân tích Big Data vốn nhắm đến hiệu
năng cao, tận dụng hạ tầng thông dụng và chi phí thấp. Ngoài ra, việc phân tích
Big Data cũng cần phải được áp dụng theo thời gian thực hoặc cận thời gian
thực, thế nên độ trễ cần phải được loại bỏ bất kì khi nào và bất kì nơi nào có thể.
Trang 8
1.1.4 Khó khăn khi nghiên cứu về Big Data
Big Data là những dữ liệu cực kì lớn, vượt ngoài khả năng xử lý truyền
thống. Do đó, để nghiên cứu về Big Data phải có lượng dữ liệu cực kì lớn, hơn
thế nữa phải có chỗ để lưu trữ. Hiện tại, chỉ có hạ tầng về công nghệ thông tin tại
các công ty lớn trong nước mới đáp ứng được về mặt lưu trữ cũng như lượng dữ
liệu, ví dụ: FPT, VCCorp, CoopMart… Hạ tầng công nghệ thông tin tại các
trường đại học hầu như không đủ mạnh để nghiên cứu về Big Data. Xuất hiện
một nghịch lý ở đây, các đơn vị nghiên cứu như trường đại học thì không có dữ
liệu thực để nghiên cứu, trong khi đó các đơn vị có dữ liệu lại không có đủ
chuyên gia.
1.1.5 Những ý kiến về công nghệ Big Data
Có hai hướng chỉ trích chính đối với Big Data, một là về cách mà người ta
sử dụng Big Data, cái còn lại thì liên quan đến việc tiến hành lấy thông tin từ Big
Data mà thế giới đang làm.
và công nghệ cũng cần phải phát triển theo thì điều này mới có thể trở thành hiện
thực trong tương lai được.
Còn theo Ankur Jain, nhà sáng lập và CEO của Humin, ngữ cảnh phát sinh
ra dữ liệu sẽ trở nên quan trọng hơn. “Chúng ta sẽ bắt đầu định tuyến dữ liệu vào
Trang 10
các đối tượng, sự vật, sự việc trong đời thực và chuyện đó giúp chúng ta xử lí
công việc tốt hơn”.
Trong khi đó, Daniel Kaufman, giám đốc đổi mới về thông tin của cơ quan
nghiên cứu thuộc Bộ quốc phòng Mỹ thì cho rằng dữ liệu sinh học sẽ ngày càng
được quan tâm hơn, và rồi người ta sẽ dùng dữ liệu này để đưa ra những lời
khuyên có ảnh hưởng lớn đến lối sống và cuộc đời của con người. Ví dụ, ta có
nên ăn thêm một dĩa cơm tấm sườn nữa không, hay là nên ăn thêm một dĩa cơm
gà? Bộ quốc phòng Mỹ muốn sử dụng kiểu suy nghĩ như thế (thay cơm bằng
pizza nhé) để áp dụng cho binh lính của mình và hiện họ đang thử nghiệm trên
chuột.
Giám đốc Swan còn suy nghĩ thêm rằng các công ty chuyên cung cấp giải
pháp Big Data sẽ không còn bán dữ liệu và phân tích cho từng doanh nghiệp hay
công ty riêng lẻ để phục vụ cho những mục đích quá chuyên biệt. Thay vào đó,
họ sẽ mở rộng nó và áp dụng Big Data nhằm giải quyết những vấn đề trong đời
thường và trả lời cho các nhu cầu cơ bản của con người. Đó sẽ là sự thay đổi về
tính ứng dụng của Big Data.
Trong tương lai, chúng ta sẽ còn tiếp tục chứng kiến sự tăng trưởng của
Big Data. Hiện nay có thể ta cũng đã nghe đến khái niệm Internet of Things, tức
là mang Internet đến với mọi thứ trong đời sống hằng ngày. Dữ liệu từ Internet
of Things thực chất cũng là được thu thập từ một mạng lưới rất nhiều các cảm
biến và thiết bị điện tử, và nó cũng là một trong những nguồn của Big Data.
Lượng dữ liệu khổng lồ này có thể cho các nhà nghiên cứu biết được hành vi tiêu
dùng của khách hàng, từ đó tinh chỉnh những thiết bị Internet of Things cho phù
hợp hơn, bắt chúng phục vụ đời sống hằng ngày của chúng ta một cách hiệu quả
Trang 11
- Đối với các kỹ sư: Hadoop là một môi trường song song thực thi
MapReduce dựa trên Java, không chia sẻ gì cả. Hãy nghĩ đến hàng trăm,
hàng ngàn máy tính đang làm việc để giải quyết cùng một vấn đề, có khả
năng khôi phục lỗi dựng sẵn. Các dự án trong hệ sinh thái Hadoop cung
cấp khả năng tải dữ liệu, hỗ trợ ngôn ngữ cấp cao, triển khai trên đám mây
tự động và các khả năng khác.
Trang 13
1.3.2 Các thành phần của Hadoop
Dự án Hadoop của Apache có hai thành phần cốt lõi, kho lưu trữ tệp gọi là
Hadoop Distributed File System (HDFS – Hệ thống tệp phân tán Hadoop) và
khung công tác lập trình gọi là MapReduce. Có một số dự án hỗ trợ để sử dụng
HDFS và MapReduce.
1.3.2.1 HDFS
Nếu ta muốn có hơn 4000 máy tính làm việc với dữ liệu của mình, thì tốt
hơn ta nên phổ biến dữ liệu của mình trên hơn 4000 máy tính đó. HDFS thực
hiện điều này cho chúng ta. HDFS có một vài bộ phận dịch chuyển. Các
Datanode (nút dữ liệu) lưu trữ dữ liệu của mình và Namenode (nút tên) theo dõi
nơi lưu trữ các thứ.
1.3.2.2 MapReduce
MapReduce là một phương thức thực thi để giúp các ứng dụng có thể xử lý
nhanh một lượng dữ liệu lớn. Các dữ liệu này được đặt tại các máy tính phân tán.
Các máy tính này sẽ hoạt động song song độc lập với nhau. Điều này làm rút
ngắn thời gian xử lý toàn bộ dữ liệu. Một đặc điểm đáng chú ý của MapReduce
là dữ liệu đầu vào có thể là dữ liệu có cấu trúc (dữ liệu lưu trữ dạng bảng quan
hệ 2 chiều) hoặc dữ liệu không cấu trúc (dữ liệu dạng tập tin hệ thống).
1.3.2.3 Hive và Hue
Ta có thể viết SQL và yêu cầu Hive chuyển đổi nó thành một tác vụ
MapReduce. Đúng là ta chưa có một môi trường ANSI-SQL đầy đủ, nhưng ta có
4000 ghi chép và khả năng mở rộng quy mô ra nhiều Petabyte. Hue cung cấp cho
ta một giao diện đồ họa dựa trên trình duyệt để làm công việc Hive của mình.
Người dùng cuối như mình và các ta sẽ được hưởng lợi cũng từ việc tối ưu
hóa như thế, chứ bản thân chúng ta thì khó mà tự mình phát triển hay mua các
giải pháp để khai thác Big Data bởi giá thành của chúng quá đắt, có thể đến cả
trăm nghìn đôla. Ngoài ra, lượng dữ liệu mà chúng ta có được cũng khó có thể
xem là “Big” nếu chỉ có vài Terabyte sinh ra trong một thời gian dài.
Xa hơi một chút, ứng dụng được Big Data có thể giúp các tổ chức, chính
phủ dự đoán được tỉ lệ thất nghiệp, xu hướng nghề nghiệp của tương lai để đầu
tư cho những hạng mục đó, hoặc cắt giảm chi tiêu, kích thích tăng trưởng kinh
tế, vv thậm chí là ra phương án phòng ngừa trước một dịch bệnh nào đó, giống
như trong phim World War Z, nước Israel đã biết trước có dịch zombie nên đã
nhanh chóng xây tường thành ngăn cách với thế giới bên ngoài.
Bia Data đề cập đến việc ngày càng tăng khối lượng, vận tốc, đa dạng,
biến đổi và phức tạp của thông tin. Đối với các tổ chức tiếp thị, Big Data là nền
tảng cơ bản của tiếp thị hiện đại, sinh ra từ thế giới kỹ thuật số chúng ta đang
sống bây giờ. Thuật ngữ "Big Data" không chỉ đề cập đến các dữ liệu của chính
nó, mà nó cũng đề cập đến những thách thức, khả năng và năng lực liên quan
đến lưu trữ và phân tích dữ liệu lớn như vậy đặt ra để hỗ trợ mức độ đưa ra quyết
Trang 16
định đó là chính xác hơn và kịp thời hơn so với bất cứ điều gì cố gắng trước đó -
đưa ra quyết định lớn dữ liệu.
Có Big Data không tự động dẫn đến việc tiếp thị sẽ tốt hơn, nhưng điều đó
có nghĩa là ta đang sở hữu một tiềm năng to lớn. Hãy suy nghĩ về Big Data như
thành phần bí mật, nguyên liệu, yếu tố cần thiết của mình.Vì thế những hiểu biết
bắt nguồn từ Big Data, các quyết định ta thực hiện và hành động của chúng ta
mà sẽ làm nên sự khác biệt rất lớn trong chiến dịch marketing.
Bằng cách kết hợp Big Data với một chiến lược quản lý tiếp thị tích hợp,
tổ chức tiếp thị có thể làm cho một tác động đáng kể trong các lĩnh vực chính:
- Sự ràng buộc với khách hàng: Big Data có thể cung cấp cái nhìn sâu sắc
không chỉ về việc khách hàng của mình là ai, mà còn về những gì họ đang có,
những gì họ muốn, họ muốn được liên lạc như thế nào và khi nào thì thích hợp.
đo lường chất lượng của quá trình tiếp thị liên quan đến hoạt động tiếp thị, phân
bổ nguồn lực, quản lý tài sản, kiểm soát ngân sách,…
Trang 18
- Tài chính: Thông thường nằm trong hệ thống tài chính của một tổ chức,
loại này Big Data có thể bao gồm bán hàng, doanh thu, lợi nhuận và các kiểu dữ
liệu khách quan khác để đo lường tình trạng tài chính của tổ chức.
1.4.3 Giải pháp Big Data mang lại trong Internet Marketing
1.4.3.1 Phân tích dữ liệu để xác định cơ hội có giá trị
Để phát hiện ra những cơ hội thành công, đòi hỏi phải xây dựng một lợi
thế về dữ liệu, bằng cách tập hợp các dữ liệu có liên quan từ cả bên trong và bên
ngoài công ty. Dựa trên việc phân tích khối lượng dữ liệu khổng lồ, những nhà
lãnh đạo dành thời gian để phát triển “tư duy điểm đến”, bằng cách việc ra
những vấn đề kinh doanh họ muốn giải quyết, hoặc những câu hỏi họ muốn được
trả lời. Nhưng cần phải đặt ra những câu hỏi có tầm nhìn xa và rộng lớn hơn để
có thể nhận được những câu trả lời có ý nghĩa đặc biệt.
Cách tiếp cận này có nghĩa là phải thoát khỏi lối suy nghĩ thông thường
trong công việc. Hầu hết các nhà lãnh đạo triển khai các nguồn lực dựa trên cơ
sở hiệu suất hiện tại hoặc trong quá khứ của một khu vực bán hàng nhất định. Sử
dụng Big Data đòi hỏi phải xem xét dữ liệu theo một cách mới rộng lớn hơn.
1.4.3.2 Tìm hiểu về quá trình ra quyết định của người tiêu dùng
Người tiêu dùng giờ đây được thoải mái lựa chọn những thiết bị, công cụ,
công nghệ theo nhu cầu của họ. Vì vậy hiểu biết về quá trình ra quyết định của
khách hàng là rất quan trọng, để có thể giành được sự lựa chọn của những khách
hàng mới hoặc giữ chân những khách hàng truyền thống. Khoảng 35% khách
hàng B2B (khách hàng doanh nghiệp) tìm hiểu các sản phẩm của nhiều nhà cung
cấp khác nhau trước khi quyết định mua chúng. Vì vậy các doanh nghiệp cần đầu
Trang 19
tư vào website và các kênh giao tiếp khách hàng, SEO web để đảm bảo sản phẩm
của mình xuất hiện khi khách hàng tiềm năng tìm kiếm dòng sản phẩm đó.
Các nhà quản lí tiếp thị và bán hàng cần phải tạo được bức tranh hoàn