Bên trong vi cấu trúc Intel Nehalem
Nehalem là tên mã của CPU Intel mới mà có tích hợp Bộ
phận điều khiển bộ nhớ bên trong và sẽ có mặt trên thị
trường trong tháng tới và sẽ có tên gọi Core i7 . Cấu
trúc này cũng sẽ được dùng cho những bộ vi xử lí trong
những hệ thống Máy chủ những năm tới và nó cũng sẽ
có mặt trong những CPU giá rẻ.
Những CPU dựa trên cấu trúc này sẽ tích hợp bộ phận điều khiển bộ
nhớ hỗ trợ tới Triple-Channel DDR3 , 03 mức Cache và quay trở lại với
công nghệ HyperThreading và có Bus ngoài mới có tên gọi QPI (
QuickPath ) . Trong bài này chúng tôi sẽ giải thích những gì mới trong
cấu trúc này .
Bên dưới là tóm lược những đặc điểm chính của Nehalem
• Dựa vào Vi cấu trúc Intel Core
• Có 02 tới 08 lõi
• Tích hợp Bộ phận điều khiển bộ nhớ , có thể hỗ trợ Triple-
Channel DDR3 .
• 256KB Cache L2 cho mỗi lõi
• 8MB Cache L3
• Tập lệnh SSE 4.2 mới với 07 lệnh mới
• Hỗ trợ công nghệ HyperThreading
• Turbo Mode ( tự động Overclock )
• Nâng cấp vi cấu trúc ( hỗ trợ Maro-Fusion 64-bit , cải tiến Loop
Stream Detector , 06 cổng gửi dữ liệu – Dispatch …) .
• Cải tiến Bộ phận Dự đoán rẽ nhánh bằng cách thêm BTB thứ hai (
Branch Target Buffer )
• Tối ưu hoá những lệnh SSE không thẳng hàng .
• Cải thiện hiệu suất ảo hoá . Theo Intel thời gian trễ giảm đi 65%
so với bộ vi xử lí 65nm Core 2 và giảm 20% so với 45nm Core 2 .
hợp Bộ phận điều khiển bộ nhớ bên trong và như vậy sẽ cung cấp hai
Bus ngoài : Bus bộ nhớ để nối CPU tới bộ nhớ và Bus I/O để nối CPU
với thế giới bên ngoài .
Việc thay đổi này sẽ nâng cao hiệu suất làm việc của hệ thống vì hai lí
do
• Có hai đường dữ liệu riêng biệt cho việc truy cập những thiết bị
I/O và bộ nhớ .
• Truy cập bộ nhớ nhanh hơn vì CPU không cần trao đổi thông tin
với bất kì những linh kiện bên ngoài CPU .
Trong Hình 1 và Hình 2 so sánh cấu trúc truyền thống dùng với những
CPU của Intel và cấu trúc mới sẽ được dùng với những CPU mà có tích
hợp Bộ phận điều khiển bộ nhớ .
Hình 1 : Cấu trúc dùng với những CPU Intel hiện tại
Hình 2 : Cấu trúc được dùng với những CPU mà có tích hợp Bộ phận
điều khiển bộ nhớ .
Bus ngoài mới dùng có tên gọi QPI ( QuickPath Interconnect ) và nó
cung cấp hai đường dữ liệu riêng biệt ( một để Truyền dữ liệu và một
để Nhận dữ liệu ) để CPU trao đổi thông tin với Chipset hoặc với những
CPU khác , trong trường hợp máy chủ có nhiều CPU . Như thế cũng dễ
dàng nhận thấy QPI có ý tưởng tương tự như với Bus HyperTransport
của hệ thống AMD . Thế hệ QPI đầu tiên sẽ làm việc với tốc độ 3.2GHz
, truyền hai dữ liệu 16-bit tương đương với tốc độ truyền dữ liệu lớn
nhất theo lí thuyết là 12.6 GB/s theo mỗi hướng . Chúng tôi đã có bài
viết về Bus QPI các bạn nên xem để biế
t thêm chi tiết .
Những CPU dùng cho máy tính để bàn sẽ chỉ có 01 đường QPI , trong
có thể tung ra thị trường những bộ vi xử lí Xeon dựa vào Nehalem mà
có nhiều Cache hơn ) . Bộ nhớ Cache L1 cũng tương tự như với Core 2
Duo bao gồm có 64KB trong đó 32KB cho Lệnh và 32KB cho Dữ liệu .
Những bộ vi xử lí Core 2 Duo chỉ có một bộ nhớ Cache L2 sử dụng
chung cho tất cả lõi bên trong CPU , nhưng những CPU Quad-Core của
Intel như Core 2 Quad và Core 2 Extreme có hai bộ nhớ Cache L2 ,
mỗi bộ nhớ Cache L2 lại sử dụng với 02 lõi . Để hiểu rõ hơn chúng tôi
minh hoạ theo Hình 3 và Hình 4 .
Hình 3 : So sánh những cấu trúc Cache
Hình 4 : So sánh những cấu trúc Cache
Cải tiến Pipeline CPU
Như đã đề cập trước đó , Nehalem ( Core i7) được dựa vào cấu trúc
dùng trong Core 2 Duo và với một số cải tiến với cách xử lí luồng dữ
liệu bên trong CPU . Trong phần này chúng ta sẽ xem nó cải tiến
những vấn đề gì .
Core 2 Duo được dựa vào cấu trúc bộ vi xử lí Pentium M , và chính là
sự quay trở lại với Pentium III . Tất cả những CPU này thuộc thế hệ
thứ 6 c
ủa CPU Intel . Pentium 4 là CPU của Intel thế hệ thứ 7 , sử
dụng Vi cấu trúc hoàn toàn khác – những bộ vi xử lí Core 2 và Core i7
không liên quan một chút gì với cấu trúc của Pentium 4 . Sở dĩ có vấn
đề như vậy vì cấu trúc CPU thế hệ thứ 7 không hiệu quả bằng cấu trúc
những CPU thuộc thế hệ thứ 6 .
Trong Hình 5 cho thấy mối liên quan của Vi cấu trúc Nehalem mới với
những bộ vi xử lí trước kia . Những sự thay đổi chính có trong mỗi CPU
mới và những CPU mới đều nâng cấp những tính năng từ những CPU
cũ .
Hình 5 : Mỗi liên quan trong “Cây gia phả “ với Vi cấu trúc Nehalem
Fetch ) và Bộ phận Giải mã ( Decode ) từ CPU.
Khi CPU đang chạy vòng lặp ( Loop – là một phần của chương trình
được lặp đi lặp lại vài lần ) , CPU không cần lấy những lệnh yêu cầu
một lần nữa từ Bộ nhớ Cache lệnh L1 : chúng
đã sẵn sàng gần bộ
phận Decode . Trên thực tế khi ấy CPU sẽ tắt Bộ phận Fetch và Dự
đoán rẽ nhánh để tiết kiệm năng lượng .
Với những bộ vi xử lí dựa vào Nehalem thì LSD được chuyển tới phái
sau Bộ phận Decode . Do vạy thay vì giữ những lệnh x86 như trong
những CPU Core 2 thì nó sẽ giữ những lệnh Micro-Ops ( 28 lệnh như
vậy ) . Như vậy hiệu suất làm việc
được cải tiến , bởi vì khi CPU đang
chạy vòng lặp : chúng đã được giải mã rồi và những lệnh đó nằm bên
trong LSD . Như vậy CPU giờ đây khi chạy vòng lặp nó có thể tắt thêm
cả Bộ phận Decode bên cạnh Fetch và Bộ phận dự đoán rẽ nhánh và
điều đó sẽ tiết kiệm điện năng hơn nữa .
Hình 6 : Vị trí của LSD trong những CPU Core và Nehalem
Cấu trúc Nehalem thêm một cổng Gửi dữ liệu ( Dispatch ) phụ và bây
giờ có 12 Bộ phận thự hiện lệnh ( Execution Unit ) , xem hình dưới .
Với những CPU d
ựa vào cấu trúc này có thể có nhiều Vi lệnh được thực
hiện cùng một lúc hơn so với những CPU trước kia .
Hình 7 : Những cổng Dispatch và những Bộ phận thực hiện lệnh (
Execution Unit )
Vi cấu trúc Nehalem cũng thêm hai bộ đệm phụ : TLB ( Translation
Look-aside Buffer) thứ hai với 512-Entry và BTB ( Brach Target Buffer
theo lí thuyết chúng sẽ không cho phép bất kì dòng điện nào đi qua ,
nhưng thực tế vẫn còn có dòng diện có cường độ nhỏ đi qua . Dòng
điện này gọi là hiện tượng dò điện và nếu cộng tất cả những dòng điện
dò này lại thì sẽ có một kết quả khá lớn và như vậy sẽ gây lãng phí
điện năng vào tạo ra những nhiệt lượng không cần thiết . Một trông
những thchs thức trong thiết kế CPU hiện nay đó là cố gắng loại trừ
dòng điện dò .
Nehalem có Bộ phận điều khiển năng lượng PCU ( Power Control Unit )
bên trong để quản lí năng lượng tốt hơn ( xem Hình 8 ) . Bộ phận này
làm giảm lượ
ng điện dò và cũng cho phép “Turbo Mode” mới . Về cơ
bản CPU có thể cung cấp những điện áp và tần số làm việc khác nhau
cho mỗi lõi , cho những Bộ phận bên ngoài lõi , cho Bộ phận điều khiển
bộ nhớ , cho bộ nhớ Cache và cho những Bộ phận I/O .
Những CPU trước kia của Intel , tất cả lõi phải chạy cùng một tốc độ
xung nhịp nhưng trong Nehalem mõi lõi có thể được lập trình để chạy
những tốc độ xung nhịp khác nhau để tiết kiệm năng lượng .
Hình 8 : Bộ phận điều khiển năng lượng - PCU
Vì tích hợp PCU nên bây giờ nó có thể tắt bất k
ì
lõi nào bên trong CPU ,
đó là một đặc điểm mà những CPU Core 2 không làm được . Như vậy
trong thực tế bây giờ CPU có thể cho bất kì lõi nào thành trạng thái
nguồn C6 ( “Deep Power Down” ) mà không cần phụ thuộc vào những
lõi khác . Như vậy điều đó sẽ cho phép tiết kiệm năng lượng khi đang
chạy PC trong khi đó một hoặc nhiều lõi được nghỉ thậm trí là tắt hẳn
nguồn .