Tài liệu Đề tài Tìm hiểu kiến trúc vi xử lý Intel Xeon E7 Family: Báo cáo môn Vi Xử Lý
Đề tài : Tìm hiểu kiến trúc vi xử lý Intel Xeon E7 Family
Thành viên :
Chế Đình Sơn
Bùi Hữu Tâm
Nguyễn Công Thắng
Nguyễn Đức Thành
Bùi Mạnh Thảo
Mục Lục
Giới Thiệu Chung
Ngày 5/4/2011, tại SANTA CLARA, bang California (Mỹ), tập đoàn Intel đã công bố họ bộ vi xử lý dành cho máy chủ mới giúp tăng tốc những ứng dụng đòi hỏi khả năng xử lý cao đồng thời cũng tăng độ tin cậy và bảo mật dữ liệu cho doanh nghiệp.
BXL Xeon thế hệ mới nhất dành cho máy chủ của Intel có hiệu năng cải thiện đáng kể và giảm chí phí điện năng so với thế hệ trước.Những họ bộ vi xử lý Intel Xeon E7-8800/4800/2800 tiếp nối các dòng Xeon thế hệ trước của Intel và đặt ra một tiêu chuẩn mới cho những ứng dụng điện toán cao cấp bao gồm bảo mật, phân tích dữ liệu thời gian thực và ảo hóa.
Để đơn giản hóa cách gọi tên và giúp dễ nhớ hơn, có thể phân dòng chip Xeon E7 mới ra thành 2 lớp nhỏ hơn: E7-2800 series và E7-4800 series. L3 cache sẽ được trải dài từ 18MB đến 30MB tùy từng phiên bả...
38 trang |
Chia sẻ: hunglv | Lượt xem: 1897 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu Đề tài Tìm hiểu kiến trúc vi xử lý Intel Xeon E7 Family, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Báo cáo môn Vi Xử Lý
Đề tài : Tìm hiểu kiến trúc vi xử lý Intel Xeon E7 Family
Thành viên :
Chế Đình Sơn
Bùi Hữu Tâm
Nguyễn Công Thắng
Nguyễn Đức Thành
Bùi Mạnh Thảo
Mục Lục
Giới Thiệu Chung
Ngày 5/4/2011, tại SANTA CLARA, bang California (Mỹ), tập đoàn Intel đã công bố họ bộ vi xử lý dành cho máy chủ mới giúp tăng tốc những ứng dụng đòi hỏi khả năng xử lý cao đồng thời cũng tăng độ tin cậy và bảo mật dữ liệu cho doanh nghiệp.
BXL Xeon thế hệ mới nhất dành cho máy chủ của Intel có hiệu năng cải thiện đáng kể và giảm chí phí điện năng so với thế hệ trước.Những họ bộ vi xử lý Intel Xeon E7-8800/4800/2800 tiếp nối các dòng Xeon thế hệ trước của Intel và đặt ra một tiêu chuẩn mới cho những ứng dụng điện toán cao cấp bao gồm bảo mật, phân tích dữ liệu thời gian thực và ảo hóa.
Để đơn giản hóa cách gọi tên và giúp dễ nhớ hơn, có thể phân dòng chip Xeon E7 mới ra thành 2 lớp nhỏ hơn: E7-2800 series và E7-4800 series. L3 cache sẽ được trải dài từ 18MB đến 30MB tùy từng phiên bản cụ thể trong khi công suất thiết kế của tản nhiệt tiêu chuẩn TDP sẽ nằm trong khoảng 95W đến 130W.
Loại chip 6 nhân có 2 phiên bản bao gồm Xeon E7-2803 và Xeon E7-4807 với xung nhịp vàTDP lần lượt là 1.73GHz -105W và 1.86GHz-95W. Cả 2 đều có L3 cache 18MB và chỉ số đường truyền Quick Path Interconnect (QPI) là 4.8GT/s.
CPU 8 nhân có 4 phiên bản, 2 thuộc lớp SKU E7-2800 và 2 thuộc SKU E7-4800. E7-2820 và E7-4820 có tốc độ 2GHz và hỗ trợ 18MB L3 cache. Trong khi đó, E7-2830 và E7-4830 sở hữu xung nhịp 2.13GHz với L3 cache là 24MB.
Cuối cùng là mảng chip 10 nhân với 7 đại diện, có tốc độ xung nhịp trải dài từ 2GHz đến 2.4GHz trong khi bộ nhớ L3 cache cũng thay đổi là 24MB hoặc 30MB tùy thuộc vào từng phiên bản cụ thể. Trong số đó có con chip này đều có TDP là 130W và chỉ số QPI là 6.4 GT/s. Đó là Xeon E7-2850, Xeon E7-2860, Xeon E7-2870, Xeon E7-4850, Xeon E7-4860 và Xeon E7-4870. Một phiên bản chip 10 nhân tiêu thụ ít điện năng hơn là Xeon E7-8867L với 105W TDP, tốc độ 2.13 GHz, L3 cache 30MB và 6.4GT/s QPI.
Kiến Trúc Vi Xử Lý
Khái quát vi xử lý
Phạm vi xử lý Xeon E7 bao gồm không ít hơn 18 mô hình CPU được chia thành ba loạt bộ xử lý khác nhau, được gọi là các E7-2800, 4800 và 8800, có thể được cài đặt trong các hệ thống kép, bốn và tám, tương ứng.
Các thành phần chính :
Bộ vi xử lý được xây dựng trên quy trình 0,032 micron High-K
10 nhân với 20 luồng xử lý
Sở hữu mức bộ nhớ đệm (cache) rất lớn, từ thấp nhất là 18MB và cao nhất lên đến 30MB cùng khả năng quản lý bộ nhớ RAM đến 2TB.
Dựa trên nền tảng thêm 2 Terabyte lớn của bộ nhớ trong một hệ thống bốn-socket hỗ trợ bởi bộ xử lý mới.
Sử dụng socket LGA1567
Kiến trúc chip vi xử lý lên đến 10 lõi trên 1 socket
Các lõi siêu phân luồng, 2 luồng
Hỗ trợ 48-bit địa chỉ ảo và vật lý 44-bit địa chỉ vật lý
32 KB Level 1 hướng dẫn bộ nhớ cache với chỉnh sửa lỗi đơn bit, bộ nhớ cache dữ liệu và L1: 32-KB Level 1 bộ nhớ cache dữ liệu với bảo vệ tính chẵn lẻ, hoặc 16 Cấp KB 1 với sửa lỗi ECC và phát hiện trên dữ liệu và trên TAG
256 bộ đệm chỉ dẫn/ dữ liệu kB L2, ECC bảo vệ (SECDED).
30-LLC MB, bộ đệm chỉ dẫn/ dữ liệu, ECC được bảo vệ
Hai chip điều khiển bộ nhớ cung cấp băng thông bộ nhớ phong phú và dung lượng bộ nhớ cho các ứng dụng doanh nghiệp đòi hỏi. Tổng số bốn kênh Intel SMI
+ Hỗ trợ lên đến 16 DDR3 DIMM trên mỗi một socket
+ Hỗ trợ cho DDR III 800, 978, 1067 MHz tốc độ bộ nhớ
+ Hỗ trợ cho 1, 2 và 4 công nghệ Gigabit DRAM
+ Hỗ trợ lên đến 32 GB Quad Rank DIMM
Bộ nhớ RAS bao gồm các tính năng:
+ Hỗ trợ cho x4 double chip-fail
+ Bộ nhớ ECC hỗ trợ bao gồm sửa chữa x4, x8 chip-fail
+ Chế độ chuyển đổi dự phòng để hoạt động với một sự thất bại làn đường duy nhất cho mỗi kênh trong một hướng
+ Hỗ trợ cho việc chuyển đổi bộ nhớ
Intel QuickPath Interconnect RAS
Bảo mật nền tảng khả năng sử dụng công nghệ Intel ® Trusted Execution
Intel® AES New Instructions (Intel® AES-NI)
Chế độ quản lý hệ thống (SMM)
Hỗ trợ cho Intel® Virtualization Technology (Intel® VT) cho IA-32 Intel®Architecture 2 (Intel® VT-x 2)
Trực tiếp đính kèm phần mềm ổ cắm bộ xử lý thông qua giao diện flash nối tiếp.
Intel Xeon Processor E7-8800/4800/2800 family có đầy đủ đệm DIMM (FBD) cổng, mỗi cổng có hai kênh FBD kết nối với Buffer-On-Board (BOB), bộ nhớ đệm Scalable Intel 7500. Có bốn cổng Intel QPI cho bộ xử lý thông tin liên lạc. Các lớp vật lý cho các nội bộ (FBD) và bên ngoài (Intel QPI) kênh / liên kết được thực hiện trong Pbox. Pbox thực hiện logic kỹ thuật số và kết thúc trước tương tự cho các giao diện này.
Cổng Intel® SMI:
Phát SB Failover Muxing logic mở rộng từ 40-bit 80-bit.
Nhận đường dữ liệu tăng gấp đôi từ 52-bit đến 104-bit.
Thế hệ logic Frame Boundary trên Tx và Rx thay đổi với chiều rộng
Cổng Intel® QPI:
Phát Nibble Muxing (điều chế độ rộng liên kết) mở rộng từ 40-bit 80-bit.
Hình 8-1 cho thấy giao diện của mỗi trường hợp với các hộp uncore khác Pbox. PZ0 và PZ1 các cổng trường hợp FBD Pbox và pr0 PR3 Pbox Intel QPI cổng trường. Không được hiển thị ở đây là PMISC giao diện với uncore.
Intel Xeon E7 Family được xây dựng với nền tảng vi kiến trúc Nehalem với bộ xử lý Westmere-EX
Kiến trúc Nehalem
Sơ đồ khối kiến trúc Nehalem
Cấu tạo:
4 nhân nằm chung trên 1 die
Bộ nhớ đệm L3 cache dạng Smart Cache được dùng chung cho 4 nhân,tùy nhu cầu từng nhân từng thời điểm.
Die xử lý tích hợp bộ điều khiển bộ nhớ MC
Trên die còn có đường truyền tôc độ cao QPI(Intel QuickPath Interconnect) liên lạc với chipset.Thay thế FSB.
Những CPU dựa trên cấu trúc này sẽ tích hợp bộ phận điều khiển bộ nhớ hỗ trợ tới Triple-Channel DDR3 , 03 mức Cache và quay trở lại với công nghệ HyperThreading và có Bus ngoài mới có tên gọi QPI ( QuickPath ).
*Dựa vào Vi cấu trúc Intel Core
*Có 02 tới 08 lõi
*Tích hợp Bộ phận điều khiển bộ nhớ , có thể hỗ trợ Triple-Channel DDR3 .
*256KB Cache L2 cho mỗi lõi
*8MB Cache L3
*Tập lệnh SSE 4.2 mới với 07 lệnh mới
*Hỗ trợ công nghệ HyperThreading
*Turbo Mode ( tự động Overclock )
*Nâng cấp vi cấu trúc ( hỗ trợ Maro-Fusion 64-bit , cải tiến Loop Stream Detector , 06 cổng gửi dữ liệu – Dispatch …) .
*Cải tiến Bộ phận Dự đoán rẽ nhánh bằng cách thêm BTB thứ hai ( Branch Target Buffer )
*Tối ưu hoá những lệnh SSE không thẳng hàng .
*Cải thiện hiệu suất ảo hoá . Theo Intel thời gian trễ giảm đi 65% so với bộ vi xử lí 65nm Core 2 và giảm 20% so với 45nm Core 2 .
*Bus ngoài QPI ( QuickPath Interconnect ) mới .
*Bộ phận điều khiển năng lượng mới .
*Công nghệ sản xuất hiện tại là 45nm và những Model tương lai sẽ là 32nm có tên mã “Westmere” .
*Socket mới với 1366 chân .
Một điều quan trọng nên nhớ đó là những bộ vi xử lí Core 2 được sản xuất dựa trên công nghệ dưới 45nm sẽ có nhiều tính năng hơn những bộ vi xử lí được sản xuất trên công nghệ 65nm . Tất cả những tính năng này đều có mặt trong bộ vi xử lí Nehalem đáng chú ý nhất đó là :
*Tập lệnh SSE 4.1 với 47 lệnh SSE mới .
*Công nghệ Deep Power Down ( chỉ có trong những CPU Mobile và được gọi là Trạng thái C6 – State )
* Công nghệ Enhanced Intel Dynamic Acceleration Technology ( chỉ có trong những CPU Mobile ) .
*Cải thiện FPU ( Bộ tính toán dấu phảy động ) bằng những phép chia theo hệ số 16 nhanh hơn “ Fast Radix-16 Divider “
*Cải thiện FPU ( Bộ tính toán dấu phảy động ) bằng “Super Shuffle Engine”
*Công nghệ Ảo hoá nâng cao “Enhanced Virtualization Technology” ( hiệu suất tăng 25 – 75% khi chuyển trạng thái sang máy ảo ) .
Ngay từ khi bắt đầu những CPU của Intel sử dụng Bus ngoài có tên gọi FSB ( Front Side Bus ) để chia xẻ việc truyền thông tin giữa Bộ nhớ và những yêu cầu I/O . Những bộ vi xử lí mới dựa trên lõi Nehalem sẽ tích hợp Bộ phận điều khiển bộ nhớ bên trong và như vậy sẽ cung cấp hai Bus ngoài : Bus bộ nhớ để nối CPU tới bộ nhớ và Bus I/O để nối CPU với thế giới bên ngoài .
Việc thay đổi này sẽ nâng cao hiệu suất làm việc của hệ thống vì hai lí do
*Có hai đường dữ liệu riêng biệt cho việc truy cập những thiết bị I/O và bộ nhớ .
*Truy cập bộ nhớ nhanh hơn vì CPU không cần trao đổi thông tin với bất kì những linh kiện bên ngoài CPU .
*Được thiết kế hướng tới Hiệu năng
Được thiết kế hướng tới Sự linh hoạt
Kiến trúc Westmere-EX
• Làm mới Boxboro-EX nền tảng tương thích với Xeon ® ® 7500 7500
• 10 lõi WSM, 20 chủ đề, chết bằng đá nguyên khối shared
• 10 lát Cấp Lần chia sẻ bộ nhớ cache
• 2 bộ điều khiển bộ nhớ tích hợp
• 4 con đường nhanh Interconnect (QPI) hệ thống interconnect links kết nối liên
• Khả năng mở rộng bộ nhớ hỗ trợ lên đến 8 kênh DDR
• Hỗ trợ 2, 4 và 8 trong ổ cắm configs glueless and larger systems using Node Controller (NC) và lớn hơn hệ thống sử dụng điều khiển Node (NC)
• Intel 32nm quy trình công nghệ
• Phân phối 10 lát, chia sẻ LLC (bộ nhớ cache L3)
- 10 cách vật lý Địa chỉ băm để tránh các điểm nóng
- 5 song song LLC truy cập yêu cầu cho mỗi đồng hồ
- 32B (một nửa bộ nhớ cache-line) rộng đường dữ liệu
Khả năng mở rộng kết nối vòng
- Ring dừng lại treo lên một phần cốt lõi / LLC, CA vòng
- LLC bỏ lỡ lưu lượng truy cập đổ qua CA0/CA1 – CA0 proxies slice0-4 and CA1 proxies slice5-9 - CA0 proxy slice0-4 và CA1 proxy slice5-9
- BW quy mô với lõi thêm / LLC vòng dừng
Lên đến 120 yêu cầu xuất sắc được hỗ trợ
- Hỗ trợ lập bản đồ tất cả các yêu cầu bộ nhớ ổ cắm địa phương cho Numa tối ưu hóa khối lượng công việc
Lên đến 96 nổi bật yêu cầu bộ nhớ trên 2 bộ nhớ Controllers (MCs) Bộ điều khiển (MC)
- MC hỗ trợ Out-of-Theo lịch trình trên các yêu cầu không mâu thuẫn
- Lập kế hoạch thực hiện tại granularity xếp hạng, mỗi quầy mất điện ngạch thực thi DDR tuân thủ thời gian suy nghi
- Cặp khóa-Liên kết tăng cường kết nối giữa các khả năng mở rộng bộ nhớ mỗi MC
- Khóa kênh bước cho phép bộ nhớ tiên tiến RAS
Core / Cache rộng thông qua một kiến trúc mô-đun, khả năng mở rộng kết nối
- Kích thước bộ nhớ cache để giảm thiểu nhu cầu tăng bộ nhớ BW từ lõi thêm
Cho phép phục hồi từ 2 thất bại chip DRAM mỗi bộ nhớ X4 rank xếp hạng
Native 6 lõi và 10 cores.
Một tập mới hướng dẫn cho hơn tỷ lệ mã hóa và giải mã 3x (AES) các quy trình so với trước.
Cung cấp các hướng dẫn mới (AES hướng dẫn thiết lập hoặc AES-NI) sẽ được sử dụng bởi các thuật toán AES. Ngoài ra một lệnh gọi là PCLMULQDQ sẽ thực hiện thực hiện ít nhân để sử dụng trong mật mã học cho phép bộ vi xử lý để thực hiện tăng tốc phần cứng mã hóa, không chỉ kết quả thực hiện nhanh hơn mà còn bảo vệ chống lại phần mềm nhắm mục tiêu tấn công.
Đồ họa tích hợp, thêm vào các gói bộ vi xử lý(lõi kép Arrandale và Clarkdale ).
Cải thiện ảo hóa độ trễ.
Khả năng ảo hóa mới: "vmx không bị giới hạn chế độ hỗ trợ," cho phép khách hàng để chạy 16-bit (thực tế chế độ và phương thức thực sự lớn).
Hỗ trợ cho "Các trang khổng lồ" có kích thước 1GB.
Tập lệnh
MMX – Multimedia Extentions:.
Nâng cao hiệu quả về âm thanh hình ảnh và đồ họa
Gồm các lệnh:
Lệnh quản lý trạng thái(State Management): enums
Lệnh trao đổi dữ liệu(Data movement): movd,movq
Lệnh logic
Lệnh tính toán số học
Lệnh so sánh
Lệnh đóng gói dữ liệu
SSE- Streaming SIMD Extensions: là một SIMD mới mở rộng bộ vi xử lý Intel Pentium III và AMD AthlonXP . Không giống như MMX và 3DNow! phần mở rộng, chiếm không gian giống như các thanh ghi FPU bình thường, SSE thêm một không gian riêng biệt để bộ vi xử lý. Bởi vì điều này, SSE chỉ có thể được sử dụng trên hệ điều hành hỗ trợ nó.
SSE được giới thiệu vào năm 1999, và còn được gọi là "Katmai New Hướng dẫn" (hoặc KNI) sau khi tên mã là cốt lõi của Pentium III.
SSE thêm 8 mới 128-bit, chia thành 4 32-bit (độ chính xác duy nhất) giá trị dấu chấm động.Những thanh ghi này được gọi là XMM0 - XMM7. Một đăng ký kiểm soát bổ sung, MXCSR , cũng có sẵn để kiểm soát và kiểm tra tình trạng của các hướng dẫn SSE .
SSE có chứa 70 hướng dẫn mới nhất của làm việc trên độ chính xác duy nhất điểm nổi dữ liệu. SIMD hướng dẫn rất có thể tăng hiệu suất chính xác khi nào hoạt động tương tự được thực hiện trên nhiều đối tượng dữ liệu. Ứng dụng điển hình là xử lý tín hiệu số và xử lý đồ họa.
SSE sử dụng chỉ là một kiểu dữ liệu duy nhất cho đăng ký XMM:
32-bit duy nhất chính xác dấu chấm động số
Hỗ trợ khả năng thực hiện tính toán dáu chấm động và hình học , hiện thị và di chuyển hình ảnh 3 chiều
Kiến trúc tập lệnh SSE gồm :
SSE — MXCSR.
SSE — OpCode List: các lệnh về toán học,logic,so sánh….
Gồm các lệnh :
Lệnh tính toán số học
Lệnh logic
Lệnh so sánh
Lệnh chuyển đổi
Lệnh trạng thái
Lệnh Load/Store
Lệnh Shuffling
Lệnh cache control
SSE2(Streaming SIMD Extensions 2 ):
SSE2 mở rộng các hướng dẫn MMX để hoạt động trên sổ đăng ký XMM, cho phép các lập trình để hoàn toàn tránh tám MMX đăng ký 64-bit "biệt hiệu" trên IA-32 ngăn xếp nổi điểm đăng ký ban đầu. Điều này cho phép trộn số nguyên SIMD và hoạt động vô hướng nổi mà không có chế độ của điểm chuyển đổi giữa MMX và x87 hoạt động điểm nổi. Tuy nhiên, điều này là quá mờ giá trị của việc có thể thực hiện các hoạt động MMX đăng ký SSE rộng lớn hơn.
SSE2 mở rộng hướng dẫn MMX để hoạt động trên sổ đăng ký XMM. Vì vậy, nó có thể chuyển đổi tất cả các mã hiện có MMX SSE2 tương đương. Kể từ khi một đăng ký XMM là gấp đôi thời gian đăng ký MMX, quầy vòng lặp và truy cập bộ nhớ có thể cần phải được thay đổi để phù này.
Mặc dù một trong SSE2 hướng dẫn có thể hoạt động trên hai lần như nhiều dữ liệu như một lệnh MMX, hiệu suất có thể không tăng đáng kể. Hai lý do chính là: truy cập SSE2 dữ liệu trong bộ nhớ không phù hợp với một ranh giới 16-byte sẽ phải chịu hình phạt đáng kể, và thông lượng của SSE2 hướng dẫn trong hầu hết x86 triển khai thường nhỏ hơn so với các hướng dẫn MMX Intel gần đây đã giải quyết vấn đề đầu tiên bằng cách thêm một hướng dẫn trong SSE3 để giảm chi phí truy cập dữ liệu unaligned, và vấn đề cuối cùng bằng cách mở rộng các công cụ thực hiện trong họ vi kiến trúc Core.
SSE2 sau đó sẽ mở rộng việc sử dụng của XMM đăng ký bao gồm:
64-bit chính xác hai số điểm nổi hoặc
hai số nguyên 64-bit hoặc
bốn số nguyên 32-bit hoặc
tám 16-bit số nguyên ngắn hoặc
mười sáu byte 8-bit hoặc ký tự.
Tăng cường thêm 144 lệnh hỗ trợ đồ họa truyền thông đa phương tiện,kết nối mạng trực tuyến. Cáclệnh này bao gồm các tác vụ số Nguyên SIMD 128-bit (128-bit SIMD integer arithmetic operations) vàcác tác vụ dấu chấm động với độ chính xác gấp đôi SIMD 128-bit (128-bit SIMD double-precisionfloating-point operations). Các lệnh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm thanh - hình ảnh, mã hóa, tài chính, thiết kế và nghiên cứu khoa học, kết nốimạng trực tuyến…Thiết kế cho Pentium 4.
SSE3( Streaming SIMD Extensions 3):
Là tập lệnh mở rộng của SSE2 với 13 lệnh mới : các câu lệnh dành riêng cho việc tăng tốc các ứng dụng tốn bộ VXl như biên tập video hay chơi game
Sự thay đổi đáng chú ý nhất là khả năng làm việc theo chiều ngang trong một đăng ký, như trái ngược với hoạt động nhiều hơn hoặc ít hơn đúng theo chiều dọc của tất cả các hướng dẫn SSE trước. Cụ thể hơn, hướng dẫn để thêm và trừ đi nhiều giá trị được lưu trữ trong một sổ đăng ký duy nhất đã được thêm vào. Những hướng dẫn này đơn giản hóa việc thực hiện một số hoạt động DSB và 3D. Ngoài ra còn có một hướng dẫn mới để chuyển đổi các giá trị dấu chấm động phải là số nguyên mà không cần phải thay đổi chế độ làm tròn số toàn cầu, do đó tránh tốn kém đường ống quầy hàng. Cuối cùng, mở rộng thêm LDDQU, một sự thay thế lệch số nguyên vector tải có hiệu suất tốt hơn trên nền tảng dựa trên NetBurst cho tải vượt qua ranh giới cacheline.
Cải thiện hoạt động của công nghệ HT, tăng cường chức năng multimedia và kết nối Internet
Ngoài các lệnh của SSE2, còn có các lệnh điều khiển tiến trình.
SSSE3(Supplemental Streaming SIMD Extentions):
Phiên bản thứ 4 của công nghệ SSE. SSE3 chỉ thêm 13 hướng dẫn mới, nhưng cho phép tính năng mới như hoạt động ngang (hoạt động trên một đăng ký duy nhất thay vì xuống thông qua đăng ký nhiều) và hướng dẫn truy cập một số unaligned. Ngoài ra còn có một vài quá trình hướng dẫn kiểm soát để tăng hiệu suất với HyperThreading tính năng của Intel .
SSSE3 lần đầu tiên được giới thiệu với các bộ vi xử lý Intel dựa trên vi kiến trúc Core vào ngày 26 Tháng Sáu, 2006 với "Woodcrest "Xeons.
SSSE3 đã được giới thiệu đến các Hướng dẫn mới tên mã Tejas(TNI) Hướng dẫn mới Merom(MNI) cho thiết kế bộ vi xử lý đầu tiên nhằm mục đích hỗ trợ nó .
Gồm 16 lệnh.Mỗi lệnh có thể hoạt động trên MMX-64 bit hoặc trên 128 bit XMM đăng kí.
SSE 4.1 :
Những lệnh này đã được giới thiệu với vi kiến trúc Penryn 45 nm thu nhỏ của vi kiến trúc Core của Intel . Hỗ trợ được chỉ định thông qua các CPUID.01H: ECX.SSE41 [Bit 19] cờ.
Là một nhóm gồm 70 lệnh được thiết kế thêm trên Bộ xử lý Pentium III nhằm tăng cườngchất lượng thực thi các tác vụ đồ họa 3 chiều (3D graphics). Nó hỗ trợ khả năng thực hiện tính toándấu chấm động và hình học - các tính năng cần thiết để hiển thị và di chuyển hình ảnh 3 chiều trênmàn hình. Đây là tập hợp các lệnh tăng cường thứ 2 của Intel nhằm cải tiến khả năng đồ họa của cácbộ vi xử lý (tập hợp đầu tiên chính là MMX). SSE còn được gọi là KNI (Katmai New Instruction) do tênmã trước đây của CPU Intel Pentium III là Katm
Mở rộng kiến trúc tập lệnh Intel 64, giành ưu thế trong sản xuất silicon 45nm
Mang lại hiệu năng cao hơn cho các phần mềm SIMD.
Gồm 7 lệnh:
CRC32 : Accumulate CRC32 Value Tích lũy CRC32 giá trị gia tăng
PCMPESTRI: Đóng gói So sánh chuỗi Length rõ ràng, Quay trở lại Index
PCMPESTRM: Đóng gói So sánh chuỗi Length rõ ràng, Quay trở lại Mask
PCMPISTRI: Đóng gói So sánh chuỗi Length Implicit, Quay trở lại Index
PCMPISTRM: Đóng gói So sánh chuỗi Length Implicit, Quay trở lại Mask
PCMPGTQ: So sánh dữ liệu đóng gói Lớn hơn
POPCNT: Quay trở lại đếm số bit là 1
SSE 4.2:
Những lệnh này lần đầu tiên được thực hiện trong các Nehalem dựa trên vi xử lý Intel Core i7 dòng sản phẩm và hoàn thành các tập lệnh SSE4. Hỗ trợ được chỉ định thông qua các CPUID.01H: ECX.SSE42 [Bit 20] cờ.
Tập chỉ lệnh AES-NI (Advanced Encryption Standard New Instructions):
Là một phần mở rộng để thiết lập kiến trúc x86 hướng dẫn cho các bộ vi xử lý từ Intel và AMD đề xuất của Intel tháng 3 năm 2008 . Nó cho biết thêm 7 hướng dẫn mới để cải thiện tốc độ của các ứng dụng thực hiện mã hóa và giải mã bằng cách sử dụng Advanced Encryption Standard (AES).
Số học:
PCLMULQDQ - nhân, một hình thức đơn giản của nhân được sử dụng cho mật mã.
Encryption/Decryption: Mã hóa / giải mã:
AESENC -Thực hiện một vòng mã hóa AES
AESDEC - Thực hiện một vòng giải mã AES
AESENCLAST - Thực hiện vòng cuối cùng mã hóa AES
AESDECLAST - Thực hiện vòng cuối cùng giải mã AES
AESKEYGENASSIST - vòng chính thế hệ
AESIMC - Cột Mix Inverse AES
Thực thi 1 số bước trong phần cứng
Gồm 1 số lệnh của AES để tối ưu hóa hiệu suất mã hóa.
Công nghệ 32nm
Với công nghệ 32 nm một bóng bán dẫn 32nm có thể bật và tắt hơn 300 tỷ lần trong một giây. So sánh với bộ vi xử lý đầu tiên của Intel là 4004, được giới thiệu vào năm 1971, một CPU 32nm chạy nhanh hơn gấp 4.000 lần và mỗi bóng bán dẫn cũng tiêu thụ năng lượng ít hơn khoảng 4.000 lần. Hiệu suất giá trên mỗi bóng bán dẫn đã giảm đi khoảng 100.000 lần.
Công nghệ 32nm sẽ giúp tăng tới 35% hiệu suất vận hành và giảm mức tiêu thụ năng lượng từ 30-50% trên các sản phẩm chip xử lý mới so với dòng chip 45nm đang được ứng dụng rất rộng rãi hiện nay.
Công nghệ siêu phân luồng : (Intel Hyper-Threading )
HyperThreading (HT) là khái niệm được Intel giới thiệu trong thời kỳ giữa của Pentium 4. Công nghệ này ngay khi được giới thiệu trên thị trường đã đạt được những thành công vang dội về khía cạnh… marketing. Nhưng lúc ấy thì khi với các thử nghiệm thực tế, đôi khi bật tính năng này lên còn làm cho CPU xử lý kém hiệu quả hơn trong một vài công việc. Bởi vì phần cứng lúc ấy chưa đạt được yêu cầu, chưa tạo được môi trường để công nghệ siêu phân luồng thể hiện được tính năng vượt trội của mình. Hiện nay để nâng cao tốc độ, phần mềm cần phải được “phân luồng” - các chỉ thị sẽ được chia thành nhiều dòng lệnh để có thể xử lý đồng thời trên nhiều bộ xử lý. Intel đã đưa ra công nghệ “phân luồng” cho phép nâng cao tốc độ và khả năng tính toán song song cho những ứng dụng đa luồng. Công nghệ mới của Intel mô phỏng mỗi bộ vi xử lý vật lý như là hai bộ vi xử lý luận lý (logic), tài nguyên vật lý được chia sẻ và có cấu trúc chung giống hệt nhau cho cả hai bộ xử lý lôgic. Hệ điều hành và phần mềm ứng dụng sẽ “tưởng” như đang chạy trên hai hay nhiều bộ xử lý, kết quả là tốc độ xử lý trung bình có thể tăng lên xấp xỉ 40% đối với một bộ xử lý vật lý.
Công nghệ siêu luồng cho phép các phần mềm ứng dụng được viết cho những máy chủ đa luồng có thể thực hiện các chỉ thị song song đồng thời trên mỗi bộ xử lý riêng, bằng cách này sẽ cải thiện tức thì tốc độ giao dịch cũng như thời gian đáp ứng và các yêu cầu đặc thù khác của phần mềm nghiệp vụ và thương mại điện tử. Công nghệ này tương thích với các phần mềm ứng dụng và hệ điều hành sẵn có trên các máy chủ, nó cho phép hỗ trợ nhiều người dùng hơn và tăng khối lượng công việc được xử lý trên một máy chủ. Với các máy trạm cao cấp, công nghệ siêu phân luồng cũng sẽ tăng đáng kể tốc độ các phần mềm ứng dụng đòi hỏi năng lực tính toán cao, ví dụ như phần mềm thiết kế 3 chiều, xử lý ảnh hay video… Trong thời gian tới sẽ xuất hiện ngày càng nhiều phần mềm được thiết kế đặc biệt và tối ưu hoá cho công nghệ này
Cùng với công nghệ 32nm các bộ vi xử lý Intel Xeon mới có từ 6 nhân tới 10 nhân với công nghệ Intel Hyper-Threading (siêu phân luồng), mang đến hiệu suất hoạt động cải thiện tới 40% so với bộ vi xử lý Intel Xeon dòng 7500 cao cấp trước đây và cũng tiết kiệm điện hơn nhờ tính năng tiết kiệm điện mới.Ngoài ra các BXL Xeon E7 cũng sở hữu mức bộ nhớ đệm (cache) rất lớn, từ thấp nhất là 18MB và cao nhất lên đến 30MB cùng khả năng quản lý bộ nhớ RAM đến 2TB.
Họ bộ vi xử lý mới bao gồm 18 bộ vi xử lý mới cho các máy chủ có 2, 6, và 8 socket, và có thể mở rộng cho các máy chủ với 256 socket. Những bộ vi xử lý này cũng lập nhiều kỷ lục thế giới về hiệu suất hoạt động. Việc cải thiện hiệu năng đến 40% giúp tăng tốc độ và độ chính xác của những ứng dụng trong những lĩnh vực khác nhau như nghiên cứu khoa học và những dịch vụ tài chính vốn tốc độ được đặt lên hàng đầu.
Công nghệ ảo hóa : virtualization technology
Những con chip mới cũng có hiệu suất cao nhất trong công nghệ ảo hóa khi cải thiện đến 25% tốc độ những ứng dụng trên máy ảo. Công nghệ ảo hóa giúp máy chủ chạy đồng thời nhiều môi trường hệ điều hành trên một bộ xử lý duy nhất, cho phép chia một chiếc máy tính thành nhiều máy tính “ảo”.
ưu điểm của ảo hóa là :trên 1 máy thật ảo hóa nhiều "máy ảo" nó thuận tiện , tận dụng tài nguyên tối ưu hơn so với dùng nhiều máy thật. Ví dụ như : thực tế cần nhiều máy thực hiện nhiều tác vụ khác nhau , chẳng hạn cần 1 máy làm DNS Server , 1 máy làm Web Server ... , nếu dùng nhiều máy thật yếu yếu , thì nhiều lúc xảy ra tình trạng máy DNS thì gần như chẳng hoạt động trong khi máy đặt Web quá tải , có thể thấy khá lãng phí tài nguyên . Bây giờ thay vì dùng nhiều máy thật yếu yếu người ta sử dụng 1 máy mạnh , trên cái máy mạnh đó "giả lập" những cái máy thật yếu yếu kia , dùng bao nhiêu máy thật cấp cho bây nhiêu tài nguyên được sử dụng triệt để hơn . Ngoài ra khi có vấn đề khẩn cấp cần nâng cấu hình của cái máy "yếu yếu" thực tế chẳng hạn , thì trên hệ thống thật cũng khó khăn trong khi trên hệ thống ảo lại rất dễ dàng . Vậy nên việc công nghệ ảo hóa ở chip máy chủ Xeon E7 Family thực sự phát huy được tác dụng.
Công nghệ Intel Intelligent Power
Các CPU dựa trên kiến trúc Core Microarchitecture có thể chia ra thành các thành phần nhỏ hơn và các thành phần này được cấp điện một cách riêng biệt. Khi có thành phần nào ở trạng thái idle thì CPU sẽ đưa thành phần đó vào trạng thái “ngủ đông” để giảm điện năng tiêu thụ. Công nghệ hiện tại đã cho phép Intel thiết kế cơ chế tắt mở cổng luận lý theo yêu cầu. Nhờ vậy, vi kiến trúc Core có khả năng tắt một hệ thống con trong bộ vi xử lý khi không cần dùng đến để tiết kiệm điện năng; nhưng vẫn đảm bảo kích hoạt ngay khi cần để không ảnh hưởng đến tốc độ chung của bộ vi xử lý. Bên cạnh đó, nhiều tuyến bus và vùng dữ liệu cũng đã được thiết kế tách biệt để có thể vẫn đảm bảo truyền tải dữ liệu ở mức điện áp thấp trong một số trạng thái.Những người phụ trách CNTT trong các doanh nghiệp đang tìm kiếm những giải pháp kinh tế hơn có thể thay thế 18 máy chủ xài chip dual core bằng một máy chủ sử dụng bộ vi xử lý Xeon E7. Nhằm giải quyết tình trạng chi phí cho điện năng tăng cao, những con chip Xeon được tích hợp công nghệ Intel Intelligent Power cho phép tự động giảm điện năng tiêu thụ dựa trên khối lượng công việc.
Công nghệ Turbo Boost: tự động ép xung
Với khối lượng công việc đồ sộ mà chip máy chủ phải xử lí thì không thể thiếu được công nghệ tự động ép xung.
Với CPU đa nhân, Intel quyết định “tận dụng” khối silicon của mình một cách thông minh hơn, với việc thay đổi xung của mỗi nhân tùy thuộc vào mức đòi hỏi của ứng dụng. Chẳng hạn trên Core i7, khi chỉ có 2 nhân hoạt động, bộ xử lý sẽ tự động nâng mức xung của 2 nhân hoạt động này (thông qua hệ số nhân), trong khi tắt bớt 2 nhân kia đi để giữ mức TDP như cũ, tức trong giới hạn cho phép. Nếu chỉ có một nhân hoạt động, xung nhịp còn có thể được đẩy lên cao hơn 1 hoặc 2 nấc hệ số nhân nữa (tương đương 133 – 266MHz). Khi 4 nhân cùng hoạt động, mức xung nhịp trở về đúng giá trị ban đầu mà Intel đã định cho CPU đó. Công nghê Turbo Boost được điều khiển hoàn toàn tự động bởi bios máy tính và chipset trên bo mạch chủ do đó có thể nói nó an toàn tuyệt đối. CPU sẽ tự động thay đổi xung nhịp tùy theo tải, khi làm việc nặng sẽ tự nâng xung nhịp lên và ngược lại, hạ xuống thấp nhất khi ở trạng thái nghỉ. .
Phiên bản 10 nhân :
Hiểu được những yêu cầu của các ứng dụng đòi hỏi khả năng tính toán cao như mô hình hóa khí hậu, phân tích kinh doanh thời gian thực…, Intel đã đưa ra 10 phiên bản 10 nhân tiên tiến cho con chip này, dẫn đầu là E7-8870, E7-4870 và E7-2870, tất cả đều đạt 2,4GHz với công suất tiêu thụ tối đa (TDP) là 130W.Intel cũng công bố những phiên bản chip kết hợp giữa hiệu suất hoạt động cao với điện áp thấp, cũng như những phiên bản tối ưu hóa xung nhịp. Phiên bản E7-8867L 10 nhân điện áp thấp đạt tốc độ ép xung 2,13 GHz với TDP bằng 105W, trong khi phiên bản E7-8837 8 nhân nhưng xung nhịp được đẩy lên 2,67 GHz với TDP bằng 130W.Những máy chủ sử dụng họ bộ vi xử lý Intel Xeon E7 có thể gắn RAM dung lượng lên đến 2TB trong một hệ thống 4 socket. Hầu hết các chip mới đều được tích hợp các công nghệ như Intel Turbo Boost , Intel Hyper-Threading và Intel Virtualization , cho phép tăng hiệu suất hoạt động khi cần thiết, dễ dàng xử lý đa nhiệm và cải thiện độ tin cậy cũng như khả năng quản lý.
30MB cho L3 Cache :
Dựa trên mô hình phân cấp thì L3 Cache được ra đời, giúp tăng tốc độ xử lí của CPU và giảm giá thành sản phẩm.
Trong các kiến trúc hiện tại của CPU, bộ nhớ đệm L3 đóng vai trò như một trung tâm tiếp nhận và điều phối thông tin giữa các nhân độc lập nằm trên cùng một khối CPU.
Với dung lượng L3 Cache lên tới 30 MB cho phép tăng tốc việc xử lí của CPU đáng kể , đặc biệt là giúp hỗ trợ tăng tốc máy ảo.
Các công nghê bảo mật :
Ngoài ra Intel cũng tích hợp các công nghệ bảo mật như Intel Advanced Encryption Standard New Instruction (AES-NI) Công nghệ Intel® Advanced Encryption Standards-New Instructions (AES-IN) , Intel Trusted Execution (Intel TXT) công nghệ bảo vệ dữ liệu trong các môi trường điện toán ảo.
AES-NI cho phép các hệ thống nhanh chóng mã hóa và giải mã dữ liệu đang chạy trên một loạt các ứng dụng và giao dịch khác nhau mà không làm chậm thời gian đáp ứng, theo Intel công nghệ này giúp cải thiện tốc độ mã hóa/giải mã đến 58% so với các chip không có công nghệ này trước đây. Intel TXT thì ngăn cản malware chèn vào trong suốt quá trình khởi động giúp hệ thống luôn chạy ở tình trạng tốt. Tóm lại những tính năng bảo mật này giúp đảm bảo rằng những môi trường ảo hóa có độ tin cậy cao hơn khi khởi động, chạy cũng như ở chế độ nghỉ và hiệu suất hoạt động cũng tốt hơn.
Intel® 64 Architecture :
Môi trường tính toán 64-bit đang trở thành xu thế tất yếu và sẽ dần thay thế môi trường tính toán 32-bit. Tuy các bộ xử lý (BXL) 64-bit đã hiện diện một thời gian nhưng việc chấp nhận chúng diễn ra khá chậm chủ yếu do thiếu phần mềm chạy trên nền 64-bit. Để khai thác hết khả năng của BXL 64-bit, phần mềm cần được xây dựng trên nền tảng 64-bit, điều này không thể diễn ra trong ngày một ngày hai, tuy nhiên nền tảng 64-bit đang có được lực đẩy nhờ nỗ lực kết hợp của cả các công ty phần cứng và phần mềm.
Một câu hỏi phổ biến: “Ứng dụng chạy trên hệ thống 64-bit có nhanh hơn so với hệ thống 32-bit?”.
Câu trả lời là: “Có thể”. Tốc độ ứng dụng phụ thuộc nhiều yếu tố. Công nghệ 64-bit cho phép các thiết kế phần mềm mới hơn để khai thác bộ nhớ lớn hơn mà BXL 64-bit hỗ trợ. Ứng dụng được thiết kế tận dụng bộ nhớ lớn hơn này sẽ có thể chạy nhanh hơn ứng dụng 32-bit.Tuy nhiên một bất lợi của 64-bit đó là file chương trình 64-bit thường có kích thước lớn hơn người anh em 32-bit của nó. Do đó, chương trình 64-bit có thể vượt quá dung lượng bộ nhớ đệm dùng cho việc dịch trước mã máy (lệnh tác động trực tiếp đến phần cứng) và dẫn đến kết quả làm giảm tốc độ thực thi chương trình.Ưu điểm của 64-bit thể hiện rõ ở một số ứng dụng. Những hệ thống database server (máy chủ cơ sở dữ liệu) sử dụng không gian địa chỉ lớn nhằm đảm bảo khả năng mở rộng, duy trì bộ nhớ đệm lớn để đảm bảo tốc độ truy xuất dữ liệu. Chúng cũng có thể cấp phát nhiều bộ nhớ hơn cho mỗi người dùng, hỗ trợ nhiều người dùng hơn và làm việc với các file lớn hơn. Các ứng dụng mô phỏng và tính toán nhiều cũng được lợi với việc lưu giữ khối dữ liệu lớn hơn trong bộ nhớ. Và việc họ vi xử lí Intel Xeon E7 là họ vi xử lí dành cho máy chủ (hệ thống cần sự tính toán mạnh mẽ, thao tác với databases) sử dụng kiến trúc Intel 64 đã tận dụng được điểm mạnh của kiến trúc này và giúp cho họ vi xử lí này là sự lựa chọn tốt cho chip máy chủ.
Kiến trúc Intel ® 64 cung cấp tính toán 64-bit trong các thiết kế nhúng khi kết hợp với hỗ trợ software.1 Intel kiến trúc 64 cải thiện hiệu suất bằng cách cho phép hệ thống để dùng nhiều hơn 4 GB bộ nhớ ảo và vật lý.
Intel ® 64 cung cấp hỗ trợ cho: 64-bit không gian địa chỉ ảo 64-bit con trỏ 64-bit ghi mục đích chung Hỗ trợ số nguyên 64-bit Lên đến một terabyte (TB) của nền tảng không gian địa chỉ
Họ vi xử lí Xeon ® E7 cung cấp khả năng mở rộng và độ tin cậy, là các đáp ứng quan trọng đặc biệt cho các dữ liệu yêu cầu của hầu hết các ứng dụng và các dự án ảo hóa.
Công nghệ Enhanced Intel SpeedStep
Công nghệ Enhanced Intel SpeedStep là một phương tiện tiên tiến cho phép hiệu suất rất cao trong khi cũng đáp ứng nhu cầu năng lượng bảo tồn các hệ thống di động. Thông thường Intel SpeedStep Công nghệ thiết bị chuyển mạch điện áp và tần số song song giữa các cấp cao và thấp trong phản ứng để tải bộ xử lý. Công nghệ Enhanced Intel SpeedStep xây dựng dựa trên kiến trúc đó bằng cách sử dụng các chiến lược thiết kế bao gồm:
Tách biệt giữa điện áp và tần số thay đổi. Bởi bước điện áp lên và xuống trong gia số nhỏ riêng biệt từ những thay đổi tần số, bộ vi xử lý có thể để giảm thời gian không có hệ thống (xảy ra trong quá trình thay đổi tần số). Như vậy, hệ thống có thể chuyển tiếp giữa điện áp và tần số các quốc gia thường xuyên hơn, cải thiện công suất / hiệu suất cân bằng. Đồng hồ phân vùng và phục hồi. Đồng hồ bus tiếp tục chạy trong quá trình chuyển đổ,
ngay cả khi đồng hồ chính và giai đoạn-bị khóa vòng lặp dừng lại, cho phép logic để duy trì hoạt động. Đồng hồ cốt lõi cũng có thể khởi động lại một cách nhanh chóng hơn rất nhiều theo công nghệ Enhanced Intel SpeedStep hơn theo kiến trúc trước.Bởi vì Enhanced Intel SpeedStep Công nghệ làm giảm độ trễ liên quan đến thay đổi cặp điện áp / tần số (gọi tắt là P-state), các quá trình chuyển đổi có thể được thực tế thực hiện thường xuyên hơn, cho phép chuyển đổi-tiết hơn dựa trên nhu cầu và tối ưu hóa của quyền lực / thực hiện cân bằng dựa trên nhu cầu.
Sử dụng Intel® QuickPath Interconnect :
+ Giới thiệu:
Công nghệ Intel® QPI được phát triển để thay thế công nghệ cũ FSB với sự vượt trội về tốc độ kết nối. QPI có tốc độ truyền dữ liệu vài Gtps, giao diện băng thông hẹp, hệ thống truyền tín hiệu theo nhiều hướng khác nhau liên kết kiểu Point – to – Point.Thế hệ QPI đầu tiên có tốc độ cao nhất lên tới 6.4 Gtps, cao gấp bốn lần so với tốc độ cao nhất 1.6Gtps của FSB 1600. Một đường Link của QPI có tốc độ 25.6MB/s, cao gấp hai lần so với 12.8GB/s với FSB 1600 và gần gấp 2.5 lần có với 10.7MB/s của FSB 1333.
QPI mang lại lợi ích lớn cho những CPU của Intel nhất là đối với những hệ thống Máy chủ / Máy trạm sử dụng nhiều CPU kết nối với nhau thông qua QPI.
+ Phương thức hoạt động:
QPI thực tế bằng thiết bị Tín hiệu Vi phân (Differential Signaling) được với với Point – to – Point cho phép truyền tốc độ tín hiệu cực kì cao. Trong phương thức truyền Tin hiệu Vi phân, phương pháp truyền tín hiệu bằng cách hai tín hiệu bù được gửi trên hai đường truyền dữ liệu riêng biệt. Như vậy tại điểu cuối của kết nối thiết bị Nhận đọc sự chênh lệch giữa hai tín hiệu, như vậy thiết bị Thu loại bỏ điện áp của dây dẫn đối với Đất và loại bỏ mức nhiễu khi truyền dữ liệu với tốc độ cao.
Trong QPI không có Xung đồ hồ đính kèm (Embedded Clock) mà Xung đồng hỗ lại đi theo đường truyền riêng biệt. Bất kì Bus Nối tiếp nào cũng gắn trực tiếp vào trong đó Xung nhịp đồng hồ.Giao diện nối tiếp PCI Express thực hiện việc truyền dữ liệu đi kèm theo xung nhịp đồng hồ, QPI có Đồng hồ truyền bằng liên kết tín hiệu khác khác với phương thức truyền dữ liệu trong Bus Serial.
Như vậy phương thức truyền dữ liệu của QPI cũng tương tự như HyperTransport của AMD. Cũng bằng cách như vậy những bộ vi xử lí chuyên dụng đều sử dụng phương thức như vậy như bộ vi xử lý Cell trong PS3, XCPU trong Xbox 360 cũng đều sử dụng truyền tín hiệu kiểu Vi sai với xung đồng hồ được truyền trên một đường riêng biệt
So sánh QPI với FSB:
Intel FSB
Intel QPI
Topology
Bus chia sẻ
Poit-to-Point
Độ rộng Bus vật lí
64
20
Độ rộng Bus vật lí
64
16
Số lượng chân kết nối
150
84
Clock / Bus
1
1
Xung nhịp đồng hồ đính kèm
No
No
Hướng Bus
Bi-directional
Uni-directionnal
Cấu trúc 05 lớp của QPI:
Cũng tương tự như PCIe và HyperTransport, QPI có liên kết của kết cấu tạo thành độ rộng trong giao diện với 03 kiểu: Full-Width với liên kết 20–bit, Hafl-Width với liên kết 10-bit và Quarter-Width với liên kết 5-bit.Thực tế đều sử dụng liên kết chuẩn trong kết nối bên trong của CPU là Full-Width với 20-bit.Mỗi tín hiệu dữ liệu dùng hai dây dẫn cho hệ thống tín hiệu Vi phân, cùng với hai dây cho Xung đồng hồ tổng cộng là 42 dây dẫn (20 x 2 + 2) cho kiểu Full-Width. Mỗi thiết bị có bộ phận Thu và Phát riêng biệt vì thế một liên kết sẽ là 84 chân kết nối. So với 150 chân của FSB 64-bit của Intel cũ khi QPI gần như giảm đi hơn một nửa. Như vậy độ phức tạp của dây dẫn kết nối giữa những liên kết giảm đi đáng kể.
Sơ đồ khối sử dụng QPI kết nối giữa những CPU với I/O HUB
Những cải tiến kĩ thuật so với các dòng máy trước đó
Các nhà sản xuất hàng đầu như Dell, Hewlett-Packard, IBM và Cray đã công bố máy chủ cao cấp mới thể thao 10-core của Intel Xeon E7 loạt các chip, được công bố hôm thứ ba.
Các máy chủ mới được thiết kế để chạy các ứng dụng doanh nghiệp cao cấp, bao gồm cả cơ sở dữ liệu, cũng như ứng dụng khoa học, các công ty cho biết. Các máy chủ được nhanh hơn, cung cấp lên đến gấp đôi dung lượng bộ nhớ và bao gồm cải thiện RAS (độ tin cậy, tính sẵn có và bảo trì) các tính năng sẵn có máy chủ cao.
Intel cho biết các chip Xeon E7 lên đến 40% nhanh hơn so với các loại chip trước đó như các chip Xeon 7500, được bộ vi xử lý tám lõi ra mắt năm ngoái. Với 10 lõi, E7 chip bao gồm nhiều lõi hơn bất kỳ bộ xử lý Intel khác. Chip E7 cũng hỗ trợ các dòng có 6-8 lõi, và hoạt động ở tốc độ từ 1.73GHz đến 2.4GHz.
Chip E7 càng nhiều lõi sẽ mang lại sức mạnh xử lý nhiều hơn đến các máy chủ, Nathan Brookwood, nhà phân tích chính của Insight 64 cho biết. Chip E7 cũng mang lại khả năng mở rộng đến các máy chủ với khả năng bao gồm nhiều bộ nhớ hơn, có thể tổng 2TB trong các máy chủ.
Intel cũng đã thông qua một số RAS và tính năng sửa lỗi mà các nhà sản xuất chip như IBM đã đưa vào chip cao cấp của họ, Brookwood nói. Ví dụ, Intel đang cung cấp đồng thời tự sửa chữa lên đến hai bộ nhớ (DRAM) lỗi. Những tính năng này thường được tìm thấy trên bộ xử lý Itanium RISC (giảm những hướng dẫn thiết lập máy tính) chip, và quan trọng đối với các máy chủ nhiệm vụ quan trọng.
Dell công bố ba máy chủ PowerEdge với chip Xeon E7, trong đó cung cấp một sự cải thiện 49% trong watt cho mỗi thực hiện so với người tiền nhiệm của họ, cho biết Brian Payne
Bốn-socket của Dell PowerEdge R910 4U máy chủ rack, khi cấu hình với 10 lõi Intel Xeon E7-4780 CPU chạy ở 2,4 GHz, có thể cung cấp lên đến 38% cải thiện trong máy chủ ứng dụng Oracle và hiệu suất cơ sở dữ liệu hơn thế hệ trước, tám- lõi vi xử lý Intel Xeon X7560 chạy ở 2.26GHz, công ty tuyên bố.
Giá nhập cho một máy chủ PowerEdge R910 là khoảng 9.000 USD, một phát ngôn viên của Dell cho biết.
Dell cũng thông báo rằng E7 chip sẽ được cung cấp với dòng máy chủ PowerEdge M910 và PowerEdge R810
HP thiết kế bốn máy chủ trong dòng ProLiant G7 của nó bao gồm các chip Xeon E7. Các ProLiant BL680c và ProLiant DL580 sẽ bao gồm Xeon E7-4800 Family, trong khi ProLiant BL620c và DL980 máy chủ ProLiant sẽ được dựa trên bộ vi xử lý Intel Xeon E7-2800 và bộ vi xử lý hàng loạt E7-4800.
Các máy chủ cung cấp lên đến một sự gia tăng 40% hiệu suất so với các dòng máy chủ ra đời trước đó, công ty cho biết. HP cũng nhấn mạnh công nghệ mới như bộ nhớ đệm khả năng mở rộng mà mở rộng bộ nhớ để cải thiện hiệu suất ứng dụng. Riêng biệt, chip bộ nhớ đệm có thể tạm thời lưu trữ dữ liệu cùng với bộ nhớ chính, có thể kết quả thực hiện nhanh hơn của các ứng dụng trong bộ nhớ. Các tính năng có thể giúp tiết kiệm điện năng lên đến 155 watt cho mỗi 256GB bộ nhớ, HP cho biết.
Các máy chủ mới sẽ có mặt trên kệ vào tháng 5/2011, trừ DL980 sẽ có mặt vào tháng 6. Giá cho các máy chủ sẽ bắt đầu từ $ 6.000, công ty cho biết.
IBM công bố X5 mới hệ thống x3850, x3690 X5, và các máy chủ BladeCenter HX5, đem đến 40% cải thiện hiệu suất của CPU từ thế hệ bộ xử lý trước đó, công ty cho biết. Một phát ngôn viên của IBM cho biết thêm thông tin và giá cả trên các máy chủ mới sẽ được phát hành vào một ngày sau đó.
Cray thông báo CX1000 S của nó sẽ bao gồm E7 bộ vi xử lý. Các cấu hình sẽ bao gồm đến 128 lõi và được thiết kế để chạy các ứng dụng điện toán hiệu suất cao, công ty cho biết. Máy chủ có giá dưới $ 100.000.
E7 chip trong tương lai sẽ được đọ sức với các chip máy chủ 16 lõi sắp tới có tên mã là Interlagos từ Advanced Micro Devices, Brookwood của Insight 64 cho biết. Các chip Interlagos, dựa trên kiến trúc Bulldozer mới, sẽ cung cấp hiệu suất nhanh hơn và tính năng tiết kiệm năng lượng. AMD đã cho biết các chip Interlagos sẽ xuất xưởng trong quý thứ ba.
Các file đính kèm theo tài liệu này:
- bao_cao_intel_xeon_e7_family_3696.doc