THẢO LUẬN MÔN TRUYỀN THÔNG ĐA PHƯƠNG TIỆN: Cơ sở dữ liệu đa phương tiện (tập trung vào video)? - Pdf 22

B GIO DC V ĐO TO
TRƯỜNG ĐI HỌC KINH TẾ-KĨ THUẬT CÔNG NGHIỆP
KHOA CÔNG NGHỆ THÔNG TIN
LỚP : ĐH TIN3A


ĐỀ TÀI: Cơ sở dữ liệu đa phương tiện (tập trung vào
video)?

Giảng viên: Trần Bích Thảo
Sinh viên thực hiện:
Nhóm 10:
1.Nguyễn Hữu Sáng
2.Nguyễn Thị Duyên
29, tháng 09 năm 2012
LỜI MỞ ĐẦU
Công nghệ multimedia liên quan tới việc mô tả sự kết hợp
các dạng thức thông tin khác nhau (văn bản, dữ liệu, hình
ảnh, âm thanh,video) dưới dạng tín hiệu số. Có thể nêu ra
đây một số ứng dụng multimedia như :
• E-learning.
• Hội thảo Video (Video Conferencing).
• Thư viện điện tử (Elibrary).
• Hiện tại ảo (Vitual Reality).
Các công nghệ chuyên dùng để thao tác, truyền phát, điều
khiển các dữ liệu multimedia đã và đang được nghiên cứu
một cách rất sôi động.Các hệ thống multimedia cần có một
hệ thống phân phối nhằm mục đích thu thập các đối tượng
multimedia và đưa chúng đến người dùng, một trong số các
phương tiện đầu tiên được dùng dến là đĩa từ và đĩa quang.
Ngày nay, Internet cũng như các giao thức khác như

• Video.
• Hoạt hình.
Các kiểu dữ liệu khác này đòi hỏi phải có các phương thức đặc biệt
nhằm mục đích tối ưu hóa cho việc lưu trữ, truy cập, chỉ số hoá và
khai thác. Một hệ quản trị cơ sở dữ liệu đa phương tiện( MDBMS)
phải cung cấp một môi trường thích hợp để quản lý và sử dụng
CSDL multimedia.Một MDBMS cần phải đảm bảo các tính năng cơ
bản của một DBMS, ngoài ra nó còn phải có các tính năng khác
như:
• Tích hợp các phương tiện khác (Media Intergration).
• Khả năng sắp xếp và mô tả thông tin.
• Khả năng khai thác dữ liệu
• Khả năng lưu trữ lớn.
• Giao diện multimedia.
• Hỗ trợ truy vấn tương tác multimedia.
Thông thường các đối tượng riêng lẻ của một hình ảnh hoặc một
khung hình video (video frame) sẽ có một vài mối liên hệ bộ phận
với các đối tượng khác. Các mối liên hệ này đưa đến một số các
ràng buộc trong quá trình tìm kiếm các đối tượng trong CSDL
multimedia. Căn cứ trên cơ sở này việc triển khai các ứng dụng
multimedia trên nền các hệ quản trị CSDL hướng đối tượng sẽ
thuận lợi hơn so với các hệ quản trị cơ sở dữ liệu quan hệ
(RDBMS) hiện thời.

2.Cơ sở dữ liệu đa phương tiện (CSDL Multimedia)
Dữ liệu multimedia được chia thành hai lớp là các dữ liệu liên tục
và các dữ liệu không liên tục. Các dữ liệu liên tục bao gồm các dữ
liệu âm thanh, video thay đổi theo thời gian. Các dữ liệu không liên
tục là các dữ liệu không phục thuộc vào thời gian, các loại dữ liệu
đặc trưng cho dạng này là các dữ liệu văn bản (có hoặc không có

truyền thông tĩnh và động (hoặc tính liên tục về thời gian).
Truyền thông tĩnh không bao hàm yếu tố thời gian, các nội dung
và nghĩa của chúng không phụ thuộc vào thời gian được biểu
diễn.Truyền thông tĩnh bao gồm các dữ liệu vần chữ cái, các đồ thị
và các ảnh tĩnh.
Truyền thông động bao hàm yếu tố thời gian, các nghĩa và tính
chính xác của chúng phụ thuộc vào loại được biểu diễn. Truyền
thông động gồm các hoạt hình, âm thanh và video.
Các truyền thông này có bản chất khoảng thống nhất hoặc tốc độ
riêng của chúng. Chẳng hạn, để truyền cảm giác chuyển động nhịp
nhàng video phải thực hiện 25 hình mỗi giây (hoặc 30 hình phụ
thuộc vào hệ thống video đang sử dụng). Tương tự, khi chúng ta
phát lại một lời nhắn hoặc đoạn nhạc đã được ghi âm, chỉ có một
loại thể hiện là thích hợp. Việc phát lại ở chế độ nhanh hơn hoặc
chậm hơn sẽ làm méo nghĩa hoặc chất lượng âm thanh. Vì những
truyền thông này phải được phát liên tục ở tốc độ cố định mà chúng
thường được gọi là truyền thông liên tục. Chúng cũng còn được gọi
truyền thông đẳng thời vì mối quan hệ cố định giữa mỗi đơn vị
truyền thông và thời gian.
Truyền thông đề cập đến một bộ sưu tập các kiểu truyền thông đã
sử dụng cùng nhau. Điều đó có nghĩa là ít nhất có kiểu truyền thông
dữ liệu là không theo ký tự chữ (nghĩa là ít nhất có một kiểu truyền
thông là ảnh, âm thanh hoặc truyền hình). Ở đây, “multimedia”
được sử dụng như một tính từ vì vậy chúng ta sẽ nói một cách đặc
trưng là thông tin multimedia, dữ liệu multimedia, hệ thống
multimedia, liên lạc multimedia,ứng dụng multimedia, Dữ liệu
multimedia chính là sự biểu diễn về các loại truyền thông
multimedia mà máy tính có thể đọc được. Thông tin multimedia là
thông tin đã truyền bằng các kiểu truyền thông multimedia. Đôi khi,
thông tin multimedia và dữ liệu multimedia được sử dụng có thể

• Âm thanh và video có chiều thời gian và chúng khi biểu diễn sẽ
chiếm tỷ lệ cố định để hoạt động có hiệu quả như đã yêu cầu.
• Âm thanh số, ảnh và video được trình diễn theo một loạt giá trị
đơn cá thể và thiếu cấu trúc ngữ nghĩa rõ ràng cho máy tính để tự
động hoá nhận biết nội dung.
• Nhiều ứng dụng multimedia đòi hỏi việc biểu diễn đồng thời các
kiểu truyền thông đa năng theo cách kết hợp không gian và thời
gian.
• Ý nghĩa của dữ liệu multimedia đôi khi rất mờ và có tính chủ
quan. Ví dụ, mỗi người có cách giải thích cùng 1 bức tranh theo
cách khác nhau hoàn toàn riêng.
• Dữ liệu multimedia là giàu về thông tin, nhiều tham số được đòi
hỏi mới trình diễn đủ nội dung của nó.
2.3. Các DBMS và vai trò của chúng trong việc xử lý dữ liệu
multimedia
Các DBMS ngày nay được xây dựng khá tốt và được sử dụng rộng
rãi đối với dữ liệu có cấu trúc. Các DBMS trội nhất là các hệ quản
trị dữ liệu quan hệ (RDBMS). Trong RDBMS, thông tin được tổ
chức thành bảng hoặc các quan hệ. Các dòng của bảng tương ứng
với các khoản mục thông tin hoặc các record (bản ghi), trong khi đó
các cột tương ứng với các thuộc tính.
Ví dụ như ngôn ngữ truy vấn có cấu trúc (SQL) được sử dụng để
tạo ra các bảng như thế và để chèn và truy xuất thông tin từ các
bảng đó.
Chúng ta dùng một ví dụ đơn giản để minh hoạ cách sử dụng SQL
để tạo lập một bảng và chèn, truy xuất thông tin từ đó. Giả sử chúng
ta muốn lập một bảng chứa các bản ghi về sinh viên bao gồm số
hiệu sinh viên (tương tự như mã sinh viên), tên và địa chỉ. Ta có
lệnh sau:
Create table STUDENT

Picture BLOB);
Các BLOB bình thường chỉ là xâu bit và hoạt động bằng việc so
sánh chứ không mang chúng ra ngoài. Đó là vì RDBMS không biết
nội dung hoặc ngữ nghĩa của một BLOB.Tất cả BLOB hiểu như
một khối dữ liệu. Một dạng khác của các DBMS là hệ thống quản trị
CSDL hướng đối tượng (OODBMS). Các OODBMS kết nối các
khả năng của cơ sở dữ liệu (như lưu trữ và tìm kiếm) và các đặc
trưng hướng đối tượng (tóm lược, sự thừa kế, tính đồng nhất đối
tượng). Một phương pháp tiếp cận chung là kết nối các đặc điểm
hướng đối tượng với cơ sở dữ liệu quan hệ. Hệ thống đã được kết
nối thì được gọi là một hệ thống cơ sở dữ liệu đối tượng quan hệ.
Trong một hệ thống như vậy, các đối tượng được xác định một
cách thích hợp trong hướng đối tượng. Trong đó mỗi đối tượng
chứa các đặc tính hoặc thuộc tính và các phương pháp hoặc các hàm
được sử dụng để chế tác ra các đặc tính khác. Ví dụ, chúng ta có thể
định nghĩa một loại ảnh sau:
Create type IMAGE(
Private
Size integer,
Resolution integer,
Content float[ ],
publlic

);
Sau đó khai báo các tranh bởi kiểu IMAGE có thể được sử dụng
trong một bảng
như sau:
Create table STUDENT(
Stu# integer,
Name char(20),

các loại dữ liệu mà chúng ta dự định. Nguyên lý này đảm bảo rằng
với mỗi loại dữ liệu (ảnh, video, văn bản) chúng đều được tổ chức
với một cách thức đặc trưng phù hợp với mỗi loại dữ liệu này.
Hình 2.1: Mô tả nguyên lý tự trị
2.4.2 Nguyên lý đồng nhất
Một nguyên lý kiến trúc khác mà chúng ta có thể lựa chọn là
nguyên lý đồng nhất,nguyên lý này giúp chúng ta tìm được một cấu
trúc tóm tắt chung cho tất cả các loại dữ liệu. Cấu trúc này có thể
được dùng trong việc chỉ số hóa tất cả các loại dữ liệu qua đó
tạo ra một “chỉ số thống nhất” mà chúng ta có thể dùng để truy cập
tới các đối tượng khác nhau. Hay nói một cách khác là chúng ta có
thể trình bầy tất cả các đối tượng khác nhau( ảnh, video, âm thanh,
văn bản) trong một cấu trúc dữ liệu duy nhất và qua đó phát triển
các thuật toán để truy vấn cấu trúc dữ liệu này.

Hình 2.2: Mô tả nguyên lý đồng nhất
2.4.3 Nguyên lý lai ghép
Ý tưởng của nguyên lý này là dựa trên sự kết hợp của 2 nguyên lý
đã trình bầy ở trên.Kết quả của nguyên lý này là một kiểu dữ liệu
nào đó sử dụng chỉ số (index) riêng của chúng, trong khi đó các kiểu
dữ liệu khác sẽ sử dụng một chỉ số (Index) “thống nhất”.
Hình 2.3: Mô tả nguyên lý lai ghép
Cả ba loại nguyên lý trên đều có những ưu điểm và nhược điểm
riêng của mình. Kiến trúc dựa trên nguyên lý tự trị đòi hỏi việc tạo
ra các thuật toán và cấu trúc dữ liệu của mỗi kiểu dữ liệu, ngoài ra
nó cũng đòi hỏi các kỹ thuật hỗ trợ cho việc liên kết chéo
giữa các cấu trúc dữ liệu khác nhau này. Các công việc này đòi hỏi
tính phức tạp cao và đòi hỏi một lượng thời gian lớn cho việc phát
triển. Bên cạnh các nhược điểm trên, việc xây dựng các cấu trúc
được đặc biệt hóa tối ưu cho việc truy xuất dến từng loại dữ liệu

nêu trên, đồng thời giảm thiểu được một số các nhược điểm của
chúng. Giả sử chúng ta muốn tạo ra một CSDL multimedia bao gồm
các kiểu dữ liệu M1,…….,Mn, chúng ta bắt đầu bằng việc phân chia
tập này thành 2 phần:
• Phần 1: bao gồm các loại dữ liệu kế thừa từ các nguồn dữ liệu có
sẵn, tồn tại sẵn các chỉ số và các thuật toán để thao tác với chỉ số.
Với việc bố trí này chúng ta đã tận dụng được lợi thế của các chỉ số
và mã nguồn sẵn có.
• Phần 2: bao gồm các dữ liệu không được kế thừa từ bất kỳ nguồn
nào và do đó không có sẵn các chỉ số của mình (điều này đồng
nghĩa với việc là cũng không có bất kỳ thuật toán nào để có thể thao
tác với tập chỉ số). Trong trường hợp này việc tiếp cận xây dựng hệ
thống theo nguyên lý đồng nhất là cách thức thích hợp nhất ngay cả
khi là cách tiếp cận này có thể nẩy sinh ra việc gây mất mát các
thông tin vật lý chi tiết.
Sau khi đã tiến hành xong việc phân chia, chúng ta bắt đầu tiến
hành việc xây dựng các thuật toán cần thiết để kết hợp các nguồn dữ
liệu khác nhau lại bằng việc sử dụng các tập chỉ sổ riêng của chúng.
Cách tiếp cận này giúp chúng ta thừa kế được tối đa các tài nguyên
có sẵn, đồng thời giảm thiểu được các công việc phải thực hiện
thêm bởi vì các tệp chỉ số riêng có sẵn đối với mỗi loại dữ liệu đã
được tận dụng.
Giả sử, một người dùng muốn đưa ra một câu hỏi “ Hãy tìm tất
cả các hình ảnh và các đọan video mà trong đó ông chủ của đối
tượng A có mặt và trao đổi với đối tượng B”. Câu hỏi này
bao gồm một sự kết hợp giữa các tệp chỉ số của các loại dữ liệu
khác nhau, chúng sẽ truy cập đến CSDL hình ảnh (thông qua tệp chỉ
số của dữ liệu hình ảnh), đến CSDL âm thanh (thông qua tệp chỉ số
âm thanh) và đến một CSDL quan hệ (thông qua tệp chỉ số
quan hệ), câu hỏi này có thể được diễn tả như sau:

Chúng ta sẽ tiến hành việc chỉ số hóa các metadata này với một
cách thức nhằm cung cấp các phương thức triển khai hiệu quả đối
với các yêu cầu truy cập từ phía người dùng.
Có thể rõ ràng thấy rằng, sự thành công của phương pháp này phụ
thuộc cơ bản vào việc chúng ta đảm bảo được rằng với mỗi đối
tượng media 0i thì metadata tương ứng của nó md(oi) là cô đọng và
phản ánh đúng chỉ những gì mà người dùng yêu cầu.
Với một số lượng tối thiểu các metadata được dùng rõ ràng là chúng
ta sẽ dễ dàng hơn trong việc chỉ số hóa cũng như là thực hiện các
thao tác khai thác dữ liệu, tuy nhiên bên cạnh đó nếu số lượng
metadata sử dụng ít thì có thể người sử dụng sẽ phải mất thời
gian hơn trong việc thiết lập các câu hỏi của mình.
Có thể lấy trường hợp sau làm ví dụ:
• Người dùng: hãy tìm cho tôi tất cả các đoạn video hoặc ảnh chụp
mà đối tượng A và đối tượng B (xem phần trên) trao đổi với nhau
một gói hành lý.
• Hệ thống: Không tìm được (mặc dù hệ thống đã có đoạn video ghi
lại đối tượng A và đối tượng B trao đổi với nhau một chiếc vali
nhưng hệ thống vẫn trả lời là không tìm thấy vì nó không hiểu rằng
một chiếc vali cũng có thể coi là một gói hành lý).
• Người dùng: hãy tìm cho tôi tất cả các đoạn video hoặc ảnh chụp
mà đối tượng A và đối tượng B (xem phần trên) trao đổi với nhau
một vật gì đó.
• Hệ thống: tìm thấy. frames 50-100 của đoạn video video1.mpg
thỏa mãn yêu cầu của bạn.
Mặc dù có một vài nhược điểm như sử dụng metadata không biểu
diễn hết được các khía cạnh của đối tượng media trong CSDL
nhưng cách tiếp cận dựa trên nguyên lý đồng nhất có một số ưu
điểm nổi trội sau:
• Metadata thường được lưu trữ dưới dạng các cấu trúc có liên quan

- Digital video
Video số về nguyên tắc đó là dữ liệu tạo ra từ giá trị màu của các
điểm ảnh (pixel) .Nói chung dữ liệu video tạo ra từ camera số có
chất lượng tốt hơn analog video tạo ra. Lý do vì chúng ta có thể
thay đổi độ phân giải ảnh. Trong khi đó về nguyên tắc video
tương tự có độ phân giải không hạn chế , song xét cho cùng ảnh
chúng ta nhìn thấy lại bị giới hạn bởi thiết bị.
+ Một số ưu điểm của video số :
- Dễ edit, dễ sửa lỗi để đổi nâng cao chất lượng
- Có thể tạo ra dạng mới vmail- một dạng email có gửi kèm
video, dễ truyền giữa các máy tính
- Dễ tích hợp text, audio, image
- Có thể chứa trên các thiết bị có dung lượng lớn dễ bảo quản
như CD-ROM, DVD trong khi đó analog video lưu trữ trên
băng từ rất khó bảo quản.
- Video số được ứng dụng trong nhiều lĩnh vực như camera
cảnh giới (surveillance camera, movie camera,…).
Ví dụ với camera cảnh giới người ta thu chỉ 5 ảnh/s khi đó ta có
5x 640x480 x12bit=18,438,000 bit/s tương đương với 2.3 triệu
byte/s nêu lưu vài ngày để kiểm tra thì dung tích chứa sẽ rất lớn.
2- Thiết bị hiển thị
- Thiết bị dùng để hiển thị dữ liệu video phổ biến hiện nay là tivi
(television) vì vậy ta tìm hiểu một số thông tin về nó.
- Tỉ lệ chuẩn giữa chiều rộng và chiều cao của màn hình tivi là
:w/h= 4/3 (aspect rate), tỉ lệ này do Thomas Edison đưa ra từ 1930.
Do yêu cầu về chất lượng của một số loại hình dịch vụ như phim,
phim màn ảnh rộng người ta đã chọn các tỉ lệ khác như :
- Trên thế giới hiện hiện dang sử dụng các hệ thống truyền hình sau
NTSC ở châu Mỹ ; PAL và SECAM ở châu Âu và các khu vực khác
trên thế giới.

Q = 0.211R_ − 0.523G_ + 0.311B_
Ở đầu nhận khối các màu R_,G_, B_ được xác định theo công
thức
R_ = Y + 0.956I + 0.621Q,
G_ = Y − 0.272I − 0.649Q,
B_ = Y − 1.106I + 1.703Q.
4.Cấu trúc tóm tắt media
Cấu trúc media tóm tắt được định nghĩa như sau:
Một cấu trúc media tóm tắt là một tập gồm 8 tuple (S, fe, ATTR, λ,
R, F, Var1, Var2)
Trong đó
• S là một tập các đối tượng gọi là các trạng thái.
• fe là một tập các đối tượng gọi là các đặc trưng.
• ATTR là một tập các đối tượng gọi là các giá trị thuộc tính.
• λ: S > 2fe là một ánh xạ từ các trạng thái sang tập các đặc trưng.
• R là một tập các quan hệ trên fei x ATTRj x S với i,j ≥ 0.
• F là một tập các quan hệ của S.
• Var1 là một tập các đối tượng gọi là các biến, thuộc S
• Var2 là một tập các biến, thuộc fe.
• Một trạng thái là đoạn (chunk) nhỏ nhất của dữ liệu media mà ta
mong muốn.
Ví dụ như trong một CSDL hình ảnh, mỗi ảnh có thể được xem như
là một trạng thái. Nếu quan điểm này được chấp nhận, chúng ta sẽ
coi như tất cả các ảnh như là các đối tượng đơn lẻ cơ bản và tất cả
các đặc tính của nó sẽ được quan tâm và khi đó chúng ta sẽ không
quan tâm đến các đặc tính đơn lẻ như là các đặc tính của từng điểm
ảnh.
Trong trường hợp dữ liệu video, một trạng thái có thể được xem là
một chuỗi liên tiếp các frame có dạng (10 x i, 10 x (i+1)) thể hiện
một đoạn gồm 10 frame bắt đầu từ frame có số thứ tự chia hết

được chụp trước bức ảnh 2 và tiếp tục như vậy.
Để nắm rõ hơn, chúng ta xem xét một số ví dụ áp dụng trên một số
loại đối tượng media sau.
5.Dữ liệu video như là một tóm tắt media.
• Tập các trạng thái bao gồm 5 frames video từ frame 1 đến frame 5.
• Tập các đặc trưng bao gồm Jane Shady, Denis Dopeman,
Dopemanhouse và briefcase.
• Ánh xạ rút gọn λ được mô tả ở bảng sau :

State Feature
Frame1 Dopemanhouse,briefcase,JaneShady
Frame2 Dopemanhouse,briefcase,JaneShady,DenisDopeman
Frame3
Dopemanhouse,briefcase,JaneShady,DenisDopeman
Frame4 Dopemanhouse_briefcase,JaneShady,DenisDopeman
Frame5 Dopemanhouse,JaneShady

Bảng 2.2: Liên hệ giữa đặc trưng và trạng thái cho video
Cũng giống như trường hợp áp dụng đối với CSDL hình ảnh, định
dạng cụ thể của ánh xạ λ có thể khác đi để tối ưu hoá cho quá trình
chỉ số hoá và khai thác.
• Chúng ta có thể có một số quan hệ phụ thuộc vào trạng thái sau:
o Quan hệ có (have) là một quan hệ phụ thuộc vào trạng thái xác
định chiếc valy (đối tượng) xuất hiện cùng với nhân vật nào ở trong
trạng thái nào? Quan hệ này có được mô tả như sau:

Person Object State
JaneShady Briefcase 1
JaneShady Briefcase 2
JaneShady Briefcase 3

dụng ảnh I,B, P)
4.2- Một số phương pháp nén trực quan đơn giản dữ liệu video
a/ phương pháp Subsampling
Bộ mã hóa (encoder )chọn ra các ảnh khác nhau và viết nó vào
dòng nén (compressed stream) cách làm này cho hệ số nén bằng 2.
Bộ giải mã đưa vào các ảnh và nhân nó lên thành hai ảnh.
b/ Differencing (mã các điểm khác nhau):
Ảnh được so với ảnh đứng trước nó, nếu sự khác nhau giữa chúng
nhỏ (một số ít điểm), khi đó bộ mã chỉ mã các điểm khác nhau bằng
cách viết 3 số vào dòng nén cho mỗi điểm, gồm tọa độ điểm ảnh và
giá trị khác nhau của hai điểm ảnh . Nếu sự khác nhau giữa hai ảnh
là lớn , trên ảnh hiện thời người ta ghi dòng ra nguyên dạng . Nếu
sự sai khác giữa cường độ điểm ảnh trong ảnh trước và ảnh hiện
thời nhỏ hơn ngưỡng nào đó, điểm được coi là không khác nhau.
c/ Block Differencing (mã các khối khác nhau)
Đây là phương pháp tốt hơn phương pháp differencing, ảnh được
chia thành nhiều khối , trong mỗi khối B của ảnh hiện thời được so
với khối P tương ứng ở ảnh đứng trước nó. Nếu hai khối khác nhau
nhiều hơn số nào đó , thì B được nén bằng cách ghi lai tọa độ ảnh
của khối, tiếp theo là các giá trị của các điểm ảnh hoặc phần sai
khác của các điểm ảnh vào dòng nén.
Ưu điểm của tọa độ khối nhỏ hơn ghi tọa độ điểm ảnh và tọa độ
khối chỉ ghi một lần, Ở bên trong giá trị của tất cả các điểm ảnh,
ngay cả khi các điểm ảnh không thay đổi cũng phải viết vào dòng
ra. Mặc dù các các giá trị này được coi là khác nhau nên chúng nhỏ.
Do đó phương pháp này làm nhỏ rất nhiều kích thước khối.
d/ Motion Compensation( bù chuyển động):
Chúng ta biết rằng sự khác nhau giữa các ảnh liên tiếp trong fiml
(movie) rất nhỏ vì nó là kết quả của chuyển động của camera quay
hoặc giữa hai ảnh, đặc tính này được khai thác để làm tốt hơn cho

là bội mũ của 2 để tiện xử lý trong phần mềm như 2,4,8,16
f/ Search Threshold (tìm theo ngưỡng):
Mỗi khối B trong ảnh hiện thời trước tiên được so với bản sao C
trong ảnh trước nó, nếu chúng giống nhau hoặc sự khác nhau giữa
chúng dưới ngưỡng qui định khi đó bộ mã hóa coi như khối không
có chuyển động.
- Block Search (tìm khối)
Đây là quá trình mất nhiều thời gian do vậy khi thiết kế thuật toán
cần lưu ý. Nếu khối B hiện thời trong ảnh hiện thời, lúc đó cần tìm
trong ảnh trước khối giống hoặc gần giống với B. Việc tìm kiếm
được hạn chế trong một vùng nhỏ (gọi là vùng tìm kiếm) quanh
khối B, vùng này được xác định bởi tham số di chuyển cực đại dx,
dy . các tham số này ấn định khoảng cách tính bằng pixel theo
chiều ngang và chiều thẳng đứng cực đại giữa khối B và khối bất kỳ
giống B trong ảnh trước.Nếu B là hình vuông cạnh b, thì vùng tìm
kiếm chứa (b + 2dx)(b + 2dy) pixel và sẽ có
(2dx+1)(2dy +1) hình khác nhau, chồng nhau bxb hình vuông. Số
khối cần tuyển chọn (candidate) trong vùng này tỉ lệ với dxdy. Hình
dưới đây minh họa vùng tìm kiếm.
- Distortion measure (Đo độ sai khác)
Đây là phần quan trọng đối với bộ mã hóa, độ đo sai lệch cho phép
chọn khối thích hợp nhất với khối B, nó phải đơn giản , nhanh và tin
cậy. Có một vài cách chọn dẽ đề cập ở section 4.14

Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

THẢO LUẬN MÔN TRUYỀN THÔNG ĐA PHƯƠNG TIỆN: Cơ sở dữ liệu đa phương tiện (tập trung vào video)? - Pdf 22

Tài liệu, ebook tham khảo khác

Học thêm