luận văn đề tài tìm hiểu kiến trúc vi xử lý intel xeon e7 family - Pdf 15

BÁO CÁO MÔN VI XỬ LÝ
Đề tài
Tìm hiểu kiến trúc vi xử lý
Intel Xeon E7 Family
Báo cáo môn Vi Xử Lý
Đề tài : Tìm hiểu kiến trúc vi xử lý Intel Xeon E7 Family
Thành viên :
Chế Đình Sơn
Bùi Hữu Tâm
Nguyễn Công Thắng
Nguyễn Đức Thành
Bùi Mạnh Thảo
Mục Lục
BÁO CÁO MÔN VI XỬ LÝ 1
Báo cáo môn Vi Xử Lý 1
Mục Lục 2
Cổng Intel® QPI: 7
+ Giới thiệu: 27
+ Phương thức hoạt động: 28
So sánh QPI với FSB: 29
Cấu trúc 05 lớp của QPI: 31
Sơ đồ khối sử dụng QPI kết nối giữa những CPU với I/O HUB 33
I. Giới Thiệu Chung
Ngày 5/4/2011, tại SANTA CLARA, bang California (Mỹ), tập đoàn Intel đã công bố họ bộ vi xử lý
dành cho máy chủ mới giúp tăng tốc những ứng dụng đòi hỏi khả năng xử lý cao đồng thời cũng
tăng độ tin cậy và bảo mật dữ liệu cho doanh nghiệp.
BXL Xeon thế hệ mới nhất dành cho máy chủ của Intel có hiệu năng cải thiện đáng kể và giảm
chí phí điện năng so với thế hệ trước.
Những họ bộ vi xử lý Intel Xeon E7-8800/4800/2800 tiếp nối các dòng Xeon thế hệ trước của
Intel và đặt ra một tiêu chuẩn mới cho những ứng dụng điện toán cao cấp bao gồm bảo mật,
phân tích dữ liệu thời gian thực và ảo hóa.

hỗ trợ bởi bộ xử lý mới.
- Sử dụng socket LGA1567
- Kiến trúc chip vi xử lý lên đến 10 lõi trên 1 socket
- Các lõi siêu phân luồng, 2 luồng
- Hỗ trợ 48-bit địa chỉ ảo và vật lý 44-bit địa chỉ vật lý
- 32 KB Level 1 hướng dẫn bộ nhớ cache với chỉnh sửa lỗi đơn bit, bộ nhớ cache dữ
liệu và L1: 32-KB Level 1 bộ nhớ cache dữ liệu với bảo vệ tính chẵn lẻ, hoặc 16 Cấp
KB 1 với sửa lỗi ECC và phát hiện trên dữ liệu và trên TAG
- 256 bộ đệm chỉ dẫn/ dữ liệu kB L2, ECC bảo vệ (SECDED).
- 30-LLC MB, bộ đệm chỉ dẫn/ dữ liệu, ECC được bảo vệ
- Hai chip điều khiển bộ nhớ cung cấp băng thông bộ nhớ phong phú và dung lượng
bộ nhớ cho các ứng dụng doanh nghiệp đòi hỏi. Tổng số bốn kênh Intel SMI
+ Hỗ trợ lên đến 16 DDR3 DIMM trên mỗi một socket
+ Hỗ trợ cho DDR III 800, 978, 1067 MHz tốc độ bộ nhớ
+ Hỗ trợ cho 1, 2 và 4 công nghệ Gigabit DRAM
+ Hỗ trợ lên đến 32 GB Quad Rank DIMM
- Bộ nhớ RAS bao gồm các tính năng:
+ Hỗ trợ cho x4 double chip-fail
+ Bộ nhớ ECC hỗ trợ bao gồm sửa chữa x4, x8 chip-fail
+ Chế độ chuyển đổi dự phòng để hoạt động với một sự thất bại làn đường duy nhất
cho mỗi kênh trong một hướng
+ Hỗ trợ cho việc chuyển đổi bộ nhớ
- Intel QuickPath Interconnect RAS
- Bảo mật nền tảng khả năng sử dụng công nghệ Intel ® Trusted Execution
- Intel® AES New Instructions (Intel® AES-NI)
- Chế độ quản lý hệ thống (SMM)
- Hỗ trợ cho Intel® Virtualization Technology (Intel® VT) cho IA-32 Intel®Architecture 2
(Intel® VT-x 2)
- Trực tiếp đính kèm phần mềm ổ cắm bộ xử lý thông qua giao diện flash nối tiếp.
Intel Xeon Processor E7-8800/4800/2800 family có đầy đủ đệm DIMM (FBD) cổng, mỗi cổng có hai

*256KB Cache L2 cho mỗi lõi
*8MB Cache L3
*Tập lệnh SSE 4.2 mới với 07 lệnh mới
*Hỗ trợ công nghệ HyperThreading
*Turbo Mode ( tự động Overclock )
*Nâng cấp vi cấu trúc ( hỗ trợ Maro-Fusion 64-bit , cải tiến Loop Stream Detector , 06 cổng gửi
dữ liệu – Dispatch …) .
*Cải tiến Bộ phận Dự đoán rẽ nhánh bằng cách thêm BTB thứ hai ( Branch Target Buffer )
*Tối ưu hoá những lệnh SSE không thẳng hàng .
*Cải thiện hiệu suất ảo hoá . Theo Intel thời gian trễ giảm đi 65% so với bộ vi xử lí 65nm Core 2
và giảm 20% so với 45nm Core 2 .
*Bus ngoài QPI ( QuickPath Interconnect ) mới .
*Bộ phận điều khiển năng lượng mới .
*Công nghệ sản xuất hiện tại là 45nm và những Model tương lai sẽ là 32nm có tên mã
“Westmere” .
*Socket mới với 1366 chân .
Một điều quan trọng nên nhớ đó là những bộ vi xử lí Core 2 được sản xuất dựa trên công nghệ
dưới 45nm sẽ có nhiều tính năng hơn những bộ vi xử lí được sản xuất trên công nghệ 65nm .
Tất cả những tính năng này đều có mặt trong bộ vi xử lí Nehalem đáng chú ý nhất đó là :
*Tập lệnh SSE 4.1 với 47 lệnh SSE mới .
*Công nghệ Deep Power Down ( chỉ có trong những CPU Mobile và được gọi là Trạng thái C6 –
State )
* Công nghệ Enhanced Intel Dynamic Acceleration Technology ( chỉ có trong những CPU
Mobile ) .
*Cải thiện FPU ( Bộ tính toán dấu phảy động ) bằng những phép chia theo hệ số 16 nhanh hơn “
Fast Radix-16 Divider “
*Cải thiện FPU ( Bộ tính toán dấu phảy động ) bằng “Super Shuffle Engine”
*Công nghệ Ảo hoá nâng cao “Enhanced Virtualization Technology” ( hiệu suất tăng 25 – 75%
khi chuyển trạng thái sang máy ảo ) .
Ngay từ khi bắt đầu những CPU của Intel sử dụng Bus ngoài có tên gọi FSB ( Front Side Bus ) để

- BW quy mô với lõi thêm / LLC vòng dừng
• Lên đến 120 yêu cầu xuất sắc được hỗ trợ
- Hỗ trợ lập bản đồ tất cả các yêu cầu bộ nhớ ổ cắm địa phương cho Numa tối ưu
hóa khối lượng công việc
• Lên đến 96 nổi bật yêu cầu bộ nhớ trên 2 bộ nhớ Controllers (MCs) Bộ điều khiển
(MC)
- MC hỗ trợ Out-of-Theo lịch trình trên các yêu cầu không mâu thuẫn
- Lập kế hoạch thực hiện tại granularity xếp hạng, mỗi quầy mất điện ngạch thực
thi DDR tuân thủ thời gian suy nghi
- Cặp khóa-Liên kết tăng cường kết nối giữa các khả năng mở rộng bộ nhớ mỗi MC
- Khóa kênh bước cho phép bộ nhớ tiên tiến RAS
• Core / Cache rộng thông qua một kiến trúc mô-đun, khả năng mở rộng kết nối
- Kích thước bộ nhớ cache để giảm thiểu nhu cầu tăng bộ nhớ BW từ lõi thêm
• Cho phép phục hồi từ 2 thất bại chip DRAM mỗi bộ nhớ X4 rank xếp hạng
• Native 6 lõi và 10 cores.
• Một tập mới hướng dẫn cho hơn tỷ lệ mã hóa và giải mã 3x (AES) các quy trình so với trước.
• Cung cấp các hướng dẫn mới (AES hướng dẫn thiết lập hoặc AES-NI) sẽ được sử dụng bởi
các thuật toán AES. Ngoài ra một lệnh gọi là PCLMULQDQ sẽ thực hiện thực hiện ít nhân để
sử dụng trong mật mã học cho phép bộ vi xử lý để thực hiện tăng tốc phần cứng mã hóa,
không chỉ kết quả thực hiện nhanh hơn mà còn bảo vệ chống lại phần mềm nhắm mục tiêu
tấn công.
• Đồ họa tích hợp, thêm vào các gói bộ vi xử lý(lõi kép Arrandale và Clarkdale ).
• Cải thiện ảo hóa độ trễ.
• Khả năng ảo hóa mới: "vmx không bị giới hạn chế độ hỗ trợ," cho phép khách hàng để chạy
16-bit (thực tế chế độ và phương thức thực sự lớn).
• Hỗ trợ cho "Các trang khổng lồ" có kích thước 1GB.
3. Tập lệnh
 MMX – Multimedia Extentions:.
Nâng cao hiệu quả về âm thanh hình ảnh và đồ họa
Gồm các lệnh:

- Lệnh chuyển đổi
- Lệnh trạng thái
- Lệnh Load/Store
- Lệnh Shuffling
- Lệnh cache control
 SSE2(Streaming SIMD Extensions 2 ):
SSE2 mở rộng các hướng dẫn MMX để hoạt động trên sổ đăng ký XMM, cho phép các
lập trình để hoàn toàn tránh tám MMX đăng ký 64-bit "biệt hiệu" trên IA-32 ngăn xếp
nổi điểm đăng ký ban đầu. Điều này cho phép trộn số nguyên SIMD và hoạt động vô
hướng nổi mà không có chế độ của điểm chuyển đổi giữa MMX và x87 hoạt động điểm
nổi. Tuy nhiên, điều này là quá mờ giá trị của việc có thể thực hiện các hoạt động MMX
đăng ký SSE rộng lớn hơn.
SSE2 mở rộng hướng dẫn MMX để hoạt động trên sổ đăng ký XMM. Vì vậy, nó có thể chuyển
đổi tất cả các mã hiện có MMX SSE2 tương đương. Kể từ khi một đăng ký XMM là gấp đôi thời
gian đăng ký MMX, quầy vòng lặp và truy cập bộ nhớ có thể cần phải được thay đổi để phù này.
Mặc dù một trong SSE2 hướng dẫn có thể hoạt động trên hai lần như nhiều dữ liệu như
một lệnh MMX, hiệu suất có thể không tăng đáng kể. Hai lý do chính là: truy cập SSE2 dữ
liệu trong bộ nhớ không phù hợp với một ranh giới 16-byte sẽ phải chịu hình phạt đáng
kể, và thông lượng của SSE2 hướng dẫn trong hầu hết x86 triển khai thường nhỏ hơn so
với các hướng dẫn MMX Intel gần đây đã giải quyết vấn đề đầu tiên bằng cách thêm
một hướng dẫn trong SSE3 để giảm chi phí truy cập dữ liệu unaligned, và vấn đề cuối
cùng bằng cách mở rộng các công cụ thực hiện trong họ vi kiến trúc Core.
SSE2 sau đó sẽ mở rộng việc sử dụng của XMM đăng ký bao gồm:
- 64-bit chính xác hai số điểm nổi hoặc
- hai số nguyên 64-bit hoặc
- bốn số nguyên 32-bit hoặc
- tám 16-bit số nguyên ngắn hoặc
- mười sáu byte 8-bit hoặc ký tự.
Tăng cường thêm 144 lệnh hỗ trợ đồ họa truyền thông đa phương tiện,kết nối mạng
trực tuyến. Cáclệnh này bao gồm các tác vụ số Nguyên SIMD 128-bit (128-bit SIMD

 SSE 4.1 :
Những lệnh này đã được giới thiệu với vi kiến trúc Penryn 45 nm thu nhỏ của vi kiến
trúc Core của Intel . Hỗ trợ được chỉ định thông qua các CPUID.01H: ECX.SSE41 [Bit 19]
cờ.
Là một nhóm gồm 70 lệnh được thiết kế thêm trên Bộ xử lý Pentium III nhằm tăng
cườngchất lượng thực thi các tác vụ đồ họa 3 chiều (3D graphics). Nó hỗ trợ khả năng
thực hiện tính toándấu chấm động và hình học - các tính năng cần thiết để hiển thị và di
chuyển hình ảnh 3 chiều trênmàn hình. Đây là tập hợp các lệnh tăng cường thứ 2 của
Intel nhằm cải tiến khả năng đồ họa của cácbộ vi xử lý (tập hợp đầu tiên chính là MMX).
SSE còn được gọi là KNI (Katmai New Instruction) do tênmã trước đây của CPU Intel
Pentium III là Katm
Mở rộng kiến trúc tập lệnh Intel 64, giành ưu thế trong sản xuất silicon 45nm
Mang lại hiệu năng cao hơn cho các phần mềm SIMD.
Gồm 7 lệnh:
- CRC32 : Accumulate CRC32 Value Tích lũy CRC32 giá trị gia tăng
- PCMPESTRI: Đóng gói So sánh chuỗi Length rõ ràng, Quay trở lại Index
- PCMPESTRM: Đóng gói So sánh chuỗi Length rõ ràng, Quay trở lại Mask
- PCMPISTRI: Đóng gói So sánh chuỗi Length Implicit, Quay trở lại Index
- PCMPISTRM: Đóng gói So sánh chuỗi Length Implicit, Quay trở lại Mask
- PCMPGTQ: So sánh dữ liệu đóng gói Lớn hơn
- POPCNT: Quay trở lại đếm số bit là 1
 SSE 4.2:
Những lệnh này lần đầu tiên được thực hiện trong các Nehalem dựa trên vi xử lý Intel
Core i7 dòng sản phẩm và hoàn thành các tập lệnh SSE4. Hỗ trợ được chỉ định thông qua
các CPUID.01H: ECX.SSE42 [Bit 20] cờ.
 Tập chỉ lệnh AES-NI (Advanced Encryption Standard New Instructions):
Là một phần mở rộng để thiết lập kiến trúc x86 hướng dẫn cho các bộ vi xử lý từ Intel và
AMD đề xuất của Intel tháng 3 năm 2008 . Nó cho biết thêm 7 hướng dẫn mới để cải
thiện tốc độ của các ứng dụng thực hiện mã hóa và giải mã bằng cách sử dụng Advanced
Encryption Standard (AES).

vi xử lý vật lý như là hai bộ vi xử lý luận lý (logic), tài nguyên vật lý được chia sẻ và có cấu trúc
chung giống hệt nhau cho cả hai bộ xử lý lôgic. Hệ điều hành và phần mềm ứng dụng sẽ
“tưởng” như đang chạy trên hai hay nhiều bộ xử lý, kết quả là tốc độ xử lý trung bình có thể
tăng lên xấp xỉ 40% đối với một bộ xử lý vật lý.

Công nghệ siêu luồng cho phép các phần mềm ứng dụng được viết cho những máy chủ đa
luồng có thể thực hiện các chỉ thị song song đồng thời trên mỗi bộ xử lý riêng, bằng cách này sẽ
cải thiện tức thì tốc độ giao dịch cũng như thời gian đáp ứng và các yêu cầu đặc thù khác của
phần mềm nghiệp vụ và thương mại điện tử. Công nghệ này tương thích với các phần mềm ứng
dụng và hệ điều hành sẵn có trên các máy chủ, nó cho phép hỗ trợ nhiều người dùng hơn và
tăng khối lượng công việc được xử lý trên một máy chủ. Với các máy trạm cao cấp, công nghệ
siêu phân luồng cũng sẽ tăng đáng kể tốc độ các phần mềm ứng dụng đòi hỏi năng lực tính toán
cao, ví dụ như phần mềm thiết kế 3 chiều, xử lý ảnh hay video… Trong thời gian tới sẽ xuất hiện
ngày càng nhiều phần mềm được thiết kế đặc biệt và tối ưu hoá cho công nghệ này
Cùng với công nghệ 32nm các bộ vi xử lý Intel Xeon mới có từ 6 nhân tới 10 nhân với công nghệ
Intel Hyper-Threading (siêu phân luồng), mang đến hiệu suất hoạt động cải thiện tới 40% so với
bộ vi xử lý Intel Xeon dòng 7500 cao cấp trước đây và cũng tiết kiệm điện hơn nhờ tính năng
tiết kiệm điện mới.
Ngoài ra các BXL Xeon E7 cũng sở hữu mức bộ nhớ đệm (cache) rất lớn, từ thấp nhất là 18MB
và cao nhất lên đến 30MB cùng khả năng quản lý bộ nhớ RAM đến 2TB.
Họ bộ vi xử lý mới bao gồm 18 bộ vi xử lý mới cho các máy chủ có 2, 6, và 8 socket, và có thể
mở rộng cho các máy chủ với 256 socket. Những bộ vi xử lý này cũng lập nhiều kỷ lục thế giới về
hiệu suất hoạt động. Việc cải thiện hiệu năng đến 40% giúp tăng tốc độ và độ chính xác của
những ứng dụng trong những lĩnh vực khác nhau như nghiên cứu khoa học và những dịch vụ tài
chính vốn tốc độ được đặt lên hàng đầu.
6. Công nghệ ảo hóa : virtualization technology
Những con chip mới cũng có hiệu suất cao nhất trong công nghệ ảo hóa khi cải thiện đến 25%
tốc độ những ứng dụng trên máy ảo. Công nghệ ảo hóa giúp máy chủ chạy đồng thời nhiều môi
trường hệ điều hành trên một bộ xử lý duy nhất, cho phép chia một chiếc máy tính thành nhiều
máy tính “ảo”.

Core i7, khi chỉ có 2 nhân hoạt động, bộ xử lý sẽ tự động nâng mức xung của 2 nhân hoạt động
này (thông qua hệ số nhân), trong khi tắt bớt 2 nhân kia đi để giữ mức TDP như cũ, tức trong
giới hạn cho phép. Nếu chỉ có một nhân hoạt động, xung nhịp còn có thể được đẩy lên cao hơn
1 hoặc 2 nấc hệ số nhân nữa (tương đương 133 – 266MHz). Khi 4 nhân cùng hoạt động, mức
xung nhịp trở về đúng giá trị ban đầu mà Intel đã định cho CPU đó. Công nghê Turbo Boost
được điều khiển hoàn toàn tự động bởi bios máy tính và chipset trên bo mạch chủ do đó có thể
nói nó an toàn tuyệt đối. CPU sẽ tự động thay đổi xung nhịp tùy theo tải, khi làm việc nặng sẽ tự
nâng xung nhịp lên và ngược lại, hạ xuống thấp nhất khi ở trạng thái nghỉ. .
9. Phiên bản 10 nhân :
Hiểu được những yêu cầu của các ứng dụng đòi hỏi khả năng tính toán cao như mô hình hóa khí
hậu, phân tích kinh doanh thời gian thực…, Intel đã đưa ra 10 phiên bản 10 nhân tiên tiến cho
con chip này, dẫn đầu là E7-8870, E7-4870 và E7-2870, tất cả đều đạt 2,4GHz với công suất tiêu
thụ tối đa (TDP) là 130W.
Intel cũng công bố những phiên bản chip kết hợp giữa hiệu suất hoạt động cao với điện áp
thấp, cũng như những phiên bản tối ưu hóa xung nhịp. Phiên bản E7-8867L 10 nhân điện áp
thấp đạt tốc độ ép xung 2,13 GHz với TDP bằng 105W, trong khi phiên bản E7-8837 8 nhân
nhưng xung nhịp được đẩy lên 2,67 GHz với TDP bằng 130W.
Những máy chủ sử dụng họ bộ vi xử lý Intel Xeon E7 có thể gắn RAM dung lượng lên đến 2TB
trong một hệ thống 4 socket. Hầu hết các chip mới đều được tích hợp các công nghệ như Intel
Turbo Boost , Intel Hyper-Threading và Intel Virtualization , cho phép tăng hiệu suất hoạt động
khi cần thiết, dễ dàng xử lý đa nhiệm và cải thiện độ tin cậy cũng như khả năng quản lý.
10. 30MB cho L3 Cache :
Dựa trên mô hình phân cấp thì L3 Cache được ra đời, giúp tăng tốc độ xử lí của CPU và giảm giá
thành sản phẩm.
Trong các kiến trúc hiện tại của CPU, bộ nhớ đệm L3 đóng vai trò như một trung tâm tiếp nhận
và điều phối thông tin giữa các nhân độc lập nằm trên cùng một khối CPU.
Với dung lượng L3 Cache lên tới 30 MB cho phép tăng tốc việc xử lí của CPU đáng kể , đặc biệt
là giúp hỗ trợ tăng tốc máy ảo.
11. Các công nghê bảo mật :
Ngoài ra Intel cũng tích hợp các công nghệ bảo mật như Intel Advanced Encryption Standard


Nhờ tải bản gốc

Tài liệu, ebook tham khảo khác

Music ♫

Copyright: Tài liệu đại học © DMCA.com Protection Status