slike bài giảng cơ sở dữ liệu đa phương tiện - nguyễn thị oanh chương 2 truy nhập dữ liệu đa phương tiện - Pdf 23

Nguyễn Thị Oanh
Bộ môn HTTT – Viện CNTT & TT
[email protected]
Chương 2: Truy nhập dữ liệu đa
phương tiện
1
Đặt vấn đề
2
 Youtube:
– 2009: over 1 billion videos per day
– Bandwidth accounts for about 51% of expenses with a
run rate of $1 million per day with content licensing
accounting for 36%
http://www.wired.com/epicenter/2009/10/youtube-over-one-billion-videos-served-per-day/
http://www.multichannel.com/article/191223-
YouTube_May_Lose_470_Million_In_2009_Analysts.php
Đặt vấn đề
3
 YouTube Video Server (2010):
– May 2010, 2 Billion videos served per day
– More than 24 hours of video uploaded every minute (and
+) (2011: 48h /minute)
– Videos usually less than 10 minutes long
– Top videos ("Evolution of Dance", "Charlie Bit My Finger", and
Lady Gaga's "Bad Romance“) are approaching 200 million
views
 http://tech.fortune.cnn.com/2010/05/17/youtube-at-5-years-old-2-
billion-served-per-day/
Đặt vấn đề
4
 Dailymotion:

– Mỗi mặt đĩa được chia thành k vùng đều nhau
 Sector (C):
– Là phần giao của mỗi track và region
 Cluster (D): tập các sector
 Cylinder:
– Tập các tracks có cùng bán kính trên tất cả các mặt đĩa
Truy nhập đĩa từ
9
 2 bước:
– phép dịch (seek operations): tìm đến track có chứa địa chỉ cần
tìm kiếm
 seek time
 tăng tốc (acceleration phase)
 chạy ổn định (coast phase)
 giảm tốc độ (deceleration phase)
 ổn định vị trí (settle phase)
– phép quay (rotational operations)
rotational latency (spin time)
Thời gian = tgian dịch + tgian quay + tgian đọc DL
Truy nhập đĩa từ
10
 Transfer rate (bandwidth) (TR):
– MB/s
– Tốc độ ghi và đọc thường khác nhau
– Thường TR được ngầm hiểu là tốc độ đọc, còn tốc độ ghi
thì thường được chỉ rõ
 Vận tốc góc:
– hầu hết các đĩa có vận tốc góc quay không đổi (constant
angular veolocity - CAV)
– Thời gian chuyển từ sector x -> sector y là giống nhau

dtr
rd
jitimespinttSkjireadtime
ji
 ),(_),(),(
 
ssrnum
rnumjiabsjitimespin
1360
mod)(),(_ 
rv
ttabs
ttSk
ji
ji
)(
),(


Phương pháp lưu trữ phổ biến
13
 RAID: Redundant Array of Inexpensive Disks
– RAID-0
– RAID-1
– RAID-5
– RAID-2, RAID-3, RAID-4, RAID0+1, RAID1+0, …
 Nguyên tắc: ghép nhiều ổ đĩa cứng vật lý thành một
hệ thống ổ đĩa cứng
– gia tăng tốc độ đọc/ghi dữ liệu
– hoặc/và nhằm tăng thêm sự an toàn của dữ liệu

, c
3
, c
4
, c
5
với k = 4 bắt đầu từ đĩa 1
– Tổng quát: các block liên tiếp b
0
, b
1
, b
2
, , b
r-1
lưu trữ trong
RAID 0 với nhóm k đĩa bắt đầu ở đĩa j
 block b
i
sẽ được lưu vào đĩa (i+j) mod k
RAID-0
16
 Ưu điểm:
– Tốc độ đọc dữ liệu ra tăng lên do có thể đọc đồng thời từ
k đĩa, tuy nhiên có giới hạn, phụ thuộc vào:
 Kích thước bộ đệm
 Độ rộng băng thông của đường bus cho thiết bị ra
 Nhược điểm
– Không đảm bảo tính tin cậy: nếu 1 đĩa hỏng  mất dữ
liệu và ảnh hưởng toàn bộ hệ thống

.j: dữ liệu bít thứ j của đĩa i
 : phép hoặc loại trừ (exclusive-or)

jDjDjDjD
nn

2101 

RAID-5
21
– Giả sử D
2
hỏng, giá trị các bit j của D
1
, D
3
, D
p
lần lượt là
(1, 1, 0)  bit j của D
2
?
– Tổng quá hóa ?
D
1
D
2
D
3
D

0
1
0
0
1
1
0
0
0
0
RAID-5
22
 Lưu ý:
– Phần DL parity có thể được để trên nhiều đĩa khác nhau
RAID-5
23
 Ưu điểm: chỉ sử dụng 1 đĩa cho 1 cluster để phục hồi
dữ liệu khi có sự cố sảy ra
– Có thể đọc/ghi đồng thời trên nhiều đĩa
– Hiệu năng sử dụng cao
– Tăng độ tin cậy, an toàn của DL
 Nhược điểm:
– mỗi khi ghi dữ liệu trên 1 đĩa thì cũng phải cập nhật lại
đĩa parity
– không hoạt động hiệu quả khi nhiều hơn 1 đĩa gặp sự cố
đồng thời
– Ghi chậm hơn so với RAID-0 và RAID-1
QA
24
 Phân biệt các khái niệm sau và mục đích, tác dụng


Nhờ tải bản gốc
Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status