Nghiên cứu, xây dựng hệ thống gợi ý quảng cáo trong các dịch vụ chia sẻ hình ảnh trực tuyến - Pdf 29


BỘ KHOA HỌC VÀ CÔNG NGHỆ
CHƯƠNG TRÌNH KH&CN TRỌNG ĐIỂM CẤP NHÀ NƯỚC
KC.01/11-15

BÁO CÁO TỔNG HỢP
KẾT QUẢ KHOA HỌC CÔNG NGHỆ ĐỀ TÀI NGHIÊN CỨU, XÂY DỰNG HỆ THỐNG GỢI Ý QUẢNG CÁO
TRONG CÁC DỊCH VỤ CHIA SẺ HÌNH ẢNH TRỰC TUYẾN
Mã số KC.01.TN10/11-15
Cơ quan chủ trì đề tài:
Chủ nhiệm đề tài:
Công ty CP DV CNTT Naiscorp
KS. Nguyễn Khánh Toàn 9809

Cơ quan chủ trì đề tài/dự án: Nguyễn Xuân Tài
Ban chủ nhiệm chương trình Bộ Khoa học và Công nghệ

CÔNG TY CP DV CNTT
NAISCORP
__________________
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập - Tự do - Hạnh phúc

Hà nội, ngày tháng 12năm 2012 BÁO CÁO THỐNG KÊ
KẾT QUẢ THỰC HIỆN ĐỀ TÀI


- Theo Hợp đồng đã ký kết:từ 10 tháng 1 năm 2012 đến 10 tháng 1 nă
m 2013
- Thực tế thực hiện:từ 10 tháng 1 năm 2012 đến 10 tháng 1 năm 2013
- Được gia hạn (nếu có):
- Lần 1 từ tháng…. năm…. đến tháng…. năm….
2. Kinh phí và sử dụng kinh phí:
a) Tổng số kinh phí thực hiện:950 tr.đ, trong đó:
+ Kính phí hỗ trợ từ SNKH: 950 tr.đ.
+ Kinh phí từ các nguồn khác:0 tr.đ.
+ Tỷ lệ và kinh phí thu hồi đối với dự án (nếu có): 0

b) Tình hình cấp và sử dụng kinh phí từ nguồn SNKH:
Theo kế hoạch Th
ực tế đạt được
Số
TT
Thời gian
(Tháng, năm)
Kinh phí
(Tr.đ)
Thời gian
(Tháng, năm)
Kinh phí
(Tr.đ)
Ghi chú
(Số đề nghị
quyết toán)
1
03/2012 285 03/2012 285
2

Tổng cộng: 950 950 938 938
- Lý do thay đổi (nếu có):Do đề tài chậm trong việc tổ chức đấu thầu hạng
mục thuê chỗ server nên tiền chi cho khoản mục này giảm xuống. Thời gian thuê
chỗ theo thuyết minh là 10 tháng *12 triệu = 120 triệu. Thực tế thực hiện là 9 tháng
* 12 triệu =108 triệu.
3. Các văn bản hành chínhtrong quá trình thực hiện đề tài/dự án:
(Liệt kê các quyết định, văn bản của cơ quan quản lý từ công đoạn xác định
nhiệm vụ, xét chọn, phê duyệt kinh phí, hợp đồng, điều chỉnh (thời gian, nội dung,
kinh phí thực hiện nếu có); văn bản của tổ chức chủ trì đề tài, dự án (đơn, kiến
nghị điều chỉnh nếu có)

TSTT
Số, thời gian ban
hành văn bản
Tên văn b
ản
Ghi
chú
1 15/12/2011 Quyết định số 3853/QĐ-BKHCN ngày
15/12/2011 của Bộ trưởng Bộ Khoa học và
Công nghệ về việc phê duyệt kinh phí, tổ
chức và cá nhân chủ trì các nhiệm vụ khoa
học và công nghệ bắt đầu thựchiện trong kế
hoạch 2011 của Chương trình: “Nghiên cứu
ứng dụng và phát triển công nghệ Thông tin
và Truyền thông”, mã số KC.01/11-15

2 10/01/2012 Hợp đồng Nghiên cứu khoa học và phát
triển công nghệ số 19/2011/HĐ-ĐTTN-
KC.01/11-15 và Thuyết minh đề tài

Trung tâm
nghiên cứu quốc
tế MICA

Nghiên cứu
công nghệ
nhận dạng
ảnh
Module
nhận dạng
ảnh

- Lý do thay đổi (nếu có):

5. Cá nhân tham gia thực hiện đề tài, dự án:
(Người tham gia thực hiện đề tài thuộc tổ chức chủ trì và cơ quan phối hợp,
không quá 10 người kể cả chủ nhiệm)
Số Tên cá nhân Tên cá nhân Nội dung tham Sản phẩm chủ yếu Ghi
TT đăng ký theo
Thuyết minh
đã tham gia
thực hiện
gia chính đạt được chú
*
1 Nguyễn Khánh
Toàn
Nguyễn Khánh
Toàn
Chủ nhiệm đề tài
Nghiên cứu

ảnh và gắn
Watermark vào
ảnh
Module gợi ý
quảng cáo trong
dịch vụ chia sẻ
hình ảnh trực
tuyến Upanh

4 Lê Thị Lan Lê Thị Lan Trích chọn thông
tin cho bài toán
nhận dạng đối
tượng
Chương trình
phần mềm nhận
dạng đối tượng/
khung cảnh trong
ảnh

5 Trần Thị Thanh
Hải
Trần Thị
Thanh Hải
Phương pháp
học cho bài toán
nhận dạng đối
tượng
Chương trình
phần mềm nhận
dạng đối tượng/

nghiệm hệ thống

gợi ý quảng cáo,
module gợi ý
quảng cáo trong
dịch vụ chia sẻ
hình ảnh trực
tuyến Upanh
9 Nguyễn Văn
Trường
Nguyễn Văn
Trường
Thiết lập hệ
thống kho lưu
trữ
Website thử
nghiệm hệ thống
gợi ý quảng cáo

10 Phạm Quốc
Hiệp
ThS. Trần Thị
Hoàn
Tích hợp vào hệ
thống
Website thử
nghiệm hệ thống
gợi ý quảng cáo

- Lý do thay đổi ( nếu có): Vì lý do cá nhân, KS. Phạm Quốc Hiệp xin rút

1 01 Hội nghị khoa học ở
Naiscorp năm 2012,
Hội thảo: “Quảng cáo trên
hình ảnh và xử lý các đối
tượng trong ảnh” ngày
18/12/2012 tại Trung tâm
nghiên cứu quốc tế MICA
Thực hiện
theo kế hoạch
2 01 Hội nghị khoa học ở MICA
năm 2012
Hội thảo: “Các công nghệ
được sử dụng để xây
dựng hệ thống quảng cáo
trên hình ảnh” ngày
24/12/2012 tại Công ty cổ
phần dịch vụ Công nghệ
Thực hiện
theo kế hoạch
thông tin Naiscorp.
- Lý do thay đổi (nếu có): Không


III. SẢN PHẨM KH&CN CỦA ĐỀ TÀI, DỰ ÁN
1. Sản phẩm KH&CN đã tạo ra:
a) Sản phẩm Dạng II:
Yêu cầu khoa họccần đạt
Ghi
chú
Số

-Hiện thị ảnh và phần quảng cáo -Hiện thị ảnh và phần quảng cáo
1
Website thử
nghiệm hệ thống
gợi ý quảng cáo
-Thời gian thực hiện gần với thời gian thực
(khoảng 1 giây)
-Thời gian thực hiện gần với thời gian thực
(khoảng 1 giây)

Nhận dạng đối tượng trong ảnh/khung cảnh
của ảnh với 10 lớp đối tượng hoặc 05 khung
hình (trong trường hợp không có đối tượng
trong lớp quan tâm) với độ chính xác 80%
Nhận dạng đối tượng trong ảnh/khung cảnh
của ảnh với 10 lớp đối tượng hoặc 05 khung
hình (trong trường hợp không có đối tượng
trong lớp quan tâm) với độ chính xác 80%
Đưa ra các gợi ý quảng cáo dựa vào các nhãn
được gán, sinh các quảng cáo dưới dạng
watermark gán vào ảnh dưới dạng text hoặc
banner cho các trang Web chia sẻ hình ảnh thế
hệ mới.
Đưa ra các gợi ý quảng cáo dựa vào các nhãn
được gán, sinh các quảng cáo dưới dạng
watermark gán vào ảnh dưới dạng text hoặc
banner cho các trang Web chia sẻ hình ảnh thế
hệ mới.
Đáp ứng được 100.000 lượt người dùng đồng
thời, 100.000.000 lượt truy xuất ảnh có quảng

các thông tin về đối tượng như vị trí, kích
thước, sự quan trọng của đối tượng
-Đầu ra là các đối tượng tồn tại ở trong ảnh và
các thông tin về đối tượng như vị trí, kích
thước, sự quan trọng của đối tượng
-Có khả năng hoạt động trong trường hợp trong
cùng một ảnh có nhiều đối tượng quan tâm
-Có khả năng hoạt động trong trường hợp trong
cùng một ảnh có nhiều đối tượng quan tâm
-Cho phép nhận dạng 05 khung cảnh đối với
ảnh không có đối tượng quan tâm.
-Cho phép nhận dạng 05 khung cảnh đối với
ảnh không có đối tượng quan tâm.
phần mềm nhận
dạng
đốitượng/khung
cảnh trong ảnh
Hệ thống nhận dạng đối tượng/khung cảnh
được đánh giá dựa trên độ chính xác nhận dạng
và thời gian tính toán. Hệ thống được xây dựng
cần:
- Cho phép phát hiện 10 lớp đối tượng cơ bản
(người, nhà, xe cộ, ) với độ chính xác
(precision) 70% trên cơ sở dữ liệu xây dựng
để thử nghiệm.
- Cho phép nhận dạng 05 khung cảnh đối với
ảnh không có đối tượng quan tâm.
- Thời gian tính toán gần với thời gian thực
(10 ảnh/s).
Hệ thống nhận dạng đối tượng/khung cảnh


Được chấp nhận trình bày và
đăng tải trên kỷ yếu của hội
nghị, hội thảo

Được chấp nhận trình
bày và đăng tải trên kỷ
yếu của hội nghị, hội
thảo

Computing, Management &
Telecommunications Conference
(ComManTel 2013)
2 Nhận dạng ảnh đồi trụy
trong hệ thống chia sẻ
ảnh quy mô lớn

Được chấp nhận trình bày và
đăng tải trên kỷ yếu của hội
nghị, hội thảo
Được chấp nhận đăng tải
trên tạp chí
Tạp chí Khoa học và Công nghệ,
trường CĐ kĩ thuật Công nghệ
Thủ Đức, tp HCM, số quý 1/2013
3 Object detection and
classification for
advertising service
based on image content
Được chấp nhận trình bày và

Tốt
2 Module gợi ý quảng
cáo trong dịch vụ chia
sẻ hình ảnh trực tuyến
Upanh
9/2012 Website:
www.Quangcaoanh.com
Tốt
3 01 Chương trình phần
mềm nhận dạng
đốitượng/khung cảnh
trong ảnh
9/2012 Website:
www.Quangcaoanh.com
Tốt

2. Đánh giá về hiệu quả do đề tài, dự án mang lại:
a) Hiệu quả về khoa học và công nghệ:
(Nêu rõ danh mục công nghệ và mức độ nắm vững, làm chủ, so sánh với
trình độ công nghệ so với khu vực và thế giới…)
Tổng quan về cách nội dung nghiên cứu trong đề tài là:
Thiết lập nền tảng phục vụ cho hệ thống quảng cáo trên ảnh
Các vấn đề công nghệ phục vụ cho mụ
c tiêu là:
Vấn đề nghiên cứu 1: Công nghệ Webserver Portal phục vụ cho chia sẻ ảnh - cho
phép cân bằng tải, phục vụ cho hàng trăm triệu request về ảnh mỗi ngày.
Tình hình nghiên cứu thế giới:

- Áp dụng các công nghệ phân tán, công nghệ tính toán đám mây để tăng hiệu
năng của hệ thống, đáp ứng cho nhiều người sử dụng là những điều không mới.

đương với các kết quả nghiên cứu trên thế giới.

Vấn đề nghiên cứu 2: Công nghệ lưu trữ phân tán các file ảnh - cho phép phục
vụ hàng trăm triệu lượt download mỗi ngày.
Tình hình nghiên cứu thế giới và Việt Nam:

Cũng như vấn đề công nghệ Webserver Portal, vấn đề này được nghiên cứu
nhiều ở thế giới; tuy nhiên ở Việt Nam, trong lĩnh vực hẹp là xây dựng hệ thống
chia sẻ ảnh, công nghệ của các công ty xử lý ảnh vẫn còn đang hạn chế.
Kết quả nghiên cứu của đề tài:

Đề tài nghiên cứu thành công công nghệ này.Trình độ nghiên cứu tương
đương với các kết quả nghiên cứu trên thế giới.

Vấn đề nghiên cứu 3 : Phát hiện và nhận dạng các đối tượng trong ảnh
Phát hiện và nhận dạng đối tượng trên ảnh là xác định có hay không đối
tượng trong ảnh và xác định xem nó thuộc lớp đối tượng nào. Đây là bài toán hấp
dẫn thu hút sự quan tâm của nhiều nhà nghiên cứu trong và ngoài nước. Kết quả củ
a
bài toán này có thể áp dụng trong các hệ thống giám sát từ xa, hệ thống điều khiển,
trợ giúp, v.v.
Bài toán phát hiện và nhận dạng đối tượng thường được chia thành ba bài
toán con:
• Biểu diễn đối tượng: liên quan đến việc trích chọn các đặc trưng sẽ được sử
dụng và xác định mô hình biểu diễn đối tượng từ các đặc trưng này.
• Học cách phân lớp đối tượng: thông qua mô hình biểu diễn đối tượng, các bộ
phân lớp đối tượng sẽ được học từ các dữ liệ
u huấn luyện.
• Nhận dạng: cho phép nhận dạng dữ liệu mới từ các bộ phân lớp đã được học
từ trước.

người máy. Các giải thuật phát hiện tự động lớp đối tượng như bàn tay, gương mặt
trong ảnh/video trong thời gian thực đã cho những kết quả rất hứa hẹn. Những
nghiên cứu này có thể mở rộng để áp dụng vào việc phát hiện nhận dạng các loại
đối tượng khác như người, đồ vật trong phòng.

Nhận xét chung:
Mặc dù đã có rất nhiều kết quả nghiên cứu về phát hiện và nhận dạng đối
tượng và hiểu ảnh trên thế giới cũng như ở Việt Nam. Đây vẫn còn là một thách
thức trong lĩnh vực xử lý ảnh và thị giác máy vì mỗi lớp đối tượng có những tính
chất và thể hiện khác nhau. Ngoài ra các đối tượng trong cùng một lớp cũng rất đa
dạng vì th
ế một hệ thống nhận dạng không có tính khái quát sẽ khó hoạt động hiệu
quả. Một hệ thống phát hiện và nhận dạng tự động đối tượng ảnh hoạt động hiệu
quả là một hệ thống phải đáp ứng cả 2 yêu cầu: (1) cho độ chính xác cao với thời
gian chấp nhận được và (2) có khả năng hoạt động được trong môi trường thực với
sự
thay đổi của các yếu tố như độ sáng, phông nền, góc nhìn, thang đo v.v.

Vấn đề nghiên cứu 4:Tìm kiếm text quảng cáo phù hợp với nội dung của ảnh
Sau khi đã nhận dạng đối tượng và hiểu ảnh ở một mức chấp nhận được, bài
toán đặt ra ở đây là sử dụng thông tin về các đối tượng này để tìm ra xâu quảng cáo
phù hợp. Với mỗi yêu cầu quảng cáo của khách hàng, chúng tôi yêu c
ầu họ phải xác
định ra một số đối tượng, đặc trưng, thể loại mà họ muốn quảng cáo
Vấn đề cần nghiên cứu ở đây không chỉ là việc tìm kiếm xâu quảng cáo phù
hợp mà là việc thống kê các sự kiện quảng cáo.Bài toán tìm kiếm text quảng cáo đã
được chúng tôi giải quyết trong quy mô phòng thí nghiệm. Một hệ thống quảng cáo
trong thực tế sẽ phải nhận hàng nghìn các request về tìm text quảng cáo phù h
ợp,
đồng thời phải thống kê, tính toán chi phí online và chúng tôi chưa có điều kiện để

- Trên các website, forum có ảnh, bao gồm ảnh có hoặc không có chứa text.
Các website này gửi ảnh/link chứa ảnh thô đến công ty quảng cáo
- Công ty quảng cáo trả về Ảnh + text quảng cáo phù hợp.
- Các website, forum hiển thị ảnh + text quảng cáo trên website của mình
- Người dùng xem ảnh, click vào link quảng cáo (do các công ty cần quảng cáo
cung cấp)
b2. Quá trình thanh toán (Hình 13)
Hình 13: Minh họa quá trình thanh toán
Chú thích:
1. 10.000 công ty cần quảng cáo trả tiền cho công ty quảng cáo
2. Công ty quảng cáo chia sẻ doanh thu cho các website, forum

b3. Danh mục sản phẩm hàng hóa hình thành từ kết quả KH&CN

Sản phẩm hàng hóa chính của đề tài chính là dịch vụ tìm xâu quảng cáo
phù hợp với ảnh. Chúng tôi tạo ra các gói sản phẩm khác nhau để tạo thành các
sản phẩm khác nhau

T
T
Tên hàng
hóa
Tiêu chuẩn sản phẩm Đối tượng
khách
hàng
Ghi chú
1 View1 Cho phép View tối đa 1.000 lần

nghiệp
nhỏ
Gói cước giới
hạn về thời
gian vì có thể
xâu quảng cáo
5 Click2 Cho phép Click tối đa 5.000 lần
xâu quảng cáo trên các website
khác nhau
Thời hạn gói cước tối đa 1 tháng.
Các doanh
nghiệp
vừa
6 Click3 Cho phép Click tối đa 10.000 lần
xâu quảng cáo trên các website
khác nhau.
Thời hạn gói cước tối đa 1 tháng.
Các
doanh
nghiệp lớn
không hấp dẫn,
người dùng
xem ảnh
nhưng không
click vào link
7 ClickView
1
Cho phép View tối đa 1.000 lần
xâu quảng cáo trên các website
khác nhau.


Sản phẩm hướng đến một thị trường rất rộng lớn là các công ty có nhu cầu
quảng cáo. Tùy theo quy mô, nhu cầu quảng cáo… mà các công ty có thể lựa
chọn cho mình những gói cước phù hợp.
b5. Thiết bị trong dây chuyền công nghệ, nguyên vật liệu đảm bảo cho sản xuất :

Thiết bị chủ yếu trong dây chuyền công nghệ là các cụm server được đặt phân
tán trên các ISP khác nhau của Việt nam. Các cụm server sẽ được lập trình để có thể
liên lạc, kết nối và trao đổi dữ liệu với nhau, đảm bảo khả năng tính toán phân tán,
sử dụng lợi thế đường truyền nội mạng ISP để cung cấp dữ liệu nhanh nhất đến
người sử dụng.
Đầu vào cho sản xuấ
t là các thuật toán nhận dạng ảnh, server và đường
truyền.Cả 3 yếu tố trên đều cần phải được quan tâm, đầu tư đúng mức.Chúng tôi sẽ
đầu tư hệ thống server có cấu hình đủ mạnh để có thể xử lý được nhiều ảnh, đặt
server ở nhiều ISP khác nhau để tăng băng thông đường truyền. Các công việc sẽ
được xử lý cả online và offline để tăng hiệu năng của h
ệ thống

b6. Kế hoạch sản xuất kinh doanh trong 3-5 năm đầu tiênI.Nhu cầu thị trường
Số lượng có thể tiêu thụ trong
năm:

T
T
Tên sản
phẩm

hệ thống đạt 100% công suất.

b7. Doanh thu dự kiến(khi đạt 100% công suất)

II. Doanh thu dự kiến (lúc đạt 100% công suất)
Số lượng có thể tiêu thụ
trong năm:

Đơn vị tính 1000 đồng
TT
Tên sản
phẩm
Đơn
vị đo
Số
lượng
Đơn
giá Thành tiền Chú thích
1 2 3 4 5 6 8
1 View1 lượt 22,500 42 945,000 Cho phép View tối đa
1.000 lần
2 View2 lượt 11,250 105 1,181,250 Cho phép View tối đa
5.000 lần
3 View3 lượt 4,500 210 945,000 Cho phép View tối đa
10.000 lần
4 Click1 lượt 18,000 42 756,000 Cho phép Click tối đa
1.000 lần
5 Click2 lượt 9,000 105 945,000 Cho phép Click tối đa
5.000 lần
6 Click3 lượt 4,500 210 945,000 Cho phép Click tối đa

và độ ổn định hệ thống
b9. Các ràng buộc về bản quyền công nghệ

Các kết quả về nhận dạng đối tượng/khung cảnh trong ảnh nghiên cứu và
phát triển trong đề tài thuộc về bản quyền của Trung tâm nghiên cứu quốc tế
MICA, Trường Đại học Bách Khoa Hà Nội. Các kết quả chỉ được sử dụng
trong các sản phẩm đã đăng ký của đề tài phục vụ cho việc đánh giá, nghiệm thu
đề tài. Việc sử dụng kết quả này trong phát triển kinh doanh, xây d
ựng doanh
nghiệp khoa học cần phải được sự chấp nhận của Trung tâm nghiên cứu quốc tế
MICA, Trường Đại học Bách Khoa Hà Nội.

3. Tình hình thực hiện chế độ báo cáo, kiểm tra của đề tài, dự án:
Số
TT
Nội dung
Thời gian
thực hiện
Ghi chú
(Tóm tắt kết quả, kết luận chính,
người chủ trì…)
I Báo cáo định kỳ
Lần 1 01/10/2012
- Về số lượng: Đảm bảo đúng tiến độ
đã ký trong hợp đồng với bộ, một số
chuyên đề đã làm vượt so với thời hạn
ký trong hợp đồng
- Về chất lượng: Đảm bảo các chương
trình, module chạy ổn định, đạt yêu
cầu

1.4.1. Khoảnh 36
1.4.2. Khotextquảngcáo 36
1.4.3. Enginenhậndạngảnh 37
1.5. ModuleQuảngcáo 37
Chương2:TỔNGQUANVỀHỆTHỐNGGỢIÝQUẢNGCÁOTRÊNẢNH 40
2.1. Giớithiệuhệthốnggợiýquảngcáotrênảnh 40
2.1.1. Hệthốngquảngcáoonline 40
2.1.2. Hệthốngquảngcáotrênảnh 40
2.2. Cácthànhphầntronghệthống 41
2.2.1. Websitecungcấpdịchvụgợiýquảngcáotrênảnh 41
2.2.2. Modulegợiýquảngcáo 41
2.2.3. Phầnmềmnhậndạngđố
itượng/khungcảnhtrongảnh 42
2.3. Cácvấnđềnghiêncứutronghệthống 42
2.3.1. CôngnghệWebserPortalphụcvụchochiasẻảnh 42
2.3.2. Côngnghệlưutrữphântáncácfileảnh 43
2.3.3. Pháthiệnvànhậndạngcácđốitượngtrongảnh 43
2.3.4. Tìmkiếmtextquảngcáophùhợpvớinộidungcủaảnh 44
2.4. Kếtquảđạtđược 44
Chương3:CÔNGNGHỆWEBSERVERPORTAL 46
3.1. TổngquanvềcôngnghệWebserverPortal 46
3.1.1. Đặcđiểm 46
3.1.2. Tìnhhìnhnghiêncứuthếgiới: 46
3.1.3. TìnhhìnhnghiêncứuViệtnam: 47
3.2.1. GiảithuậtRoundRobinDNS 49
3.2.2. KháiniệmAnycast 50
3.2.3. PhântíchhoạtđộngAnycast 50
3.2.4. ỨngdụngchohệthốngDNS 51
3.3. HệthốngcânbằngtảiLoadBalancer 53


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status