Tài liệu Đề tài Tìm hiểu kiến trúc VXL Intel core i5 thế hệ 2: Nhóm 7
Tìm hiểu kiến trúc VXL Intel core i5 thế hệ 2
Giảng viên: Hoàng Xuân Dậu
Sinh viên thực hiên:
1. Lê Đình Hiệp
2.Đinh Thế Hòa
3.Phạm Văn Hòa
4.Nguyễn Thị Hòa
5.Chu Đình Hoàn
6.Phạm Duy Hưng
Mục Lục
Phần I.Giới thiệu……………………………………………………………
Phần II.Kiến trúc tập lệnh………………………………………………….
Phần III.Đặc tính và công nghệ mới………………………………………
1. Đặc điểm kỹ thuật……………………………………………………
2. Memory………………………………………………….……………
3. Graphics………………………………………………………………
4. Công nghệ nâng cao……………………………………....................
Phần IV. Tổng kết…………………………………………………………
Phần V. Nguồn tài liệu…………………………………………………….
Phần I. Giới thiệu về vi xử lý intel core i5 thế hệ mới
1. giới thiệu lịch sử của intel core i5
Ngày 8-9-2009, Intel đã chính thức đưa ra thị trường thế hệ vi xử lý mới Intel Core i5 cho phân khúc mainstream-level dành cho người tiêu dùng rộng rãi.
Thật sự Core i5 là một phiên bản phổ cập của Core i7. Vào thời điểm ra đời (tháng 11-2008), Core i7 tên mã Bloomfield đượ...
37 trang |
Chia sẻ: hunglv | Lượt xem: 1760 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Đề tài Tìm hiểu kiến trúc VXL Intel core i5 thế hệ 2, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Nhóm 7
Tìm hiểu kiến trúc VXL Intel core i5 thế hệ 2
Giảng viên: Hoàng Xuân Dậu
Sinh viên thực hiên:
1. Lê Đình Hiệp
2.Đinh Thế Hòa
3.Phạm Văn Hòa
4.Nguyễn Thị Hòa
5.Chu Đình Hoàn
6.Phạm Duy Hưng
Mục Lục
Phần I.Giới thiệu……………………………………………………………
Phần II.Kiến trúc tập lệnh………………………………………………….
Phần III.Đặc tính và công nghệ mới………………………………………
1. Đặc điểm kỹ thuật……………………………………………………
2. Memory………………………………………………….……………
3. Graphics………………………………………………………………
4. Công nghệ nâng cao……………………………………....................
Phần IV. Tổng kết…………………………………………………………
Phần V. Nguồn tài liệu…………………………………………………….
Phần I. Giới thiệu về vi xử lý intel core i5 thế hệ mới
1. giới thiệu lịch sử của intel core i5
Ngày 8-9-2009, Intel đã chính thức đưa ra thị trường thế hệ vi xử lý mới Intel Core i5 cho phân khúc mainstream-level dành cho người tiêu dùng rộng rãi.
Thật sự Core i5 là một phiên bản phổ cập của Core i7. Vào thời điểm ra đời (tháng 11-2008), Core i7 tên mã Bloomfield được mệnh danh là “CPU nhanh nhất hành tinh”, với nhiều cải tiến và công nghệ vượt trội so với các thế hệ CPU từ Core 2 trở về trước. Nhưng dòng vi xử lý này có giá rất đắt (con Core i7-975 Extreme Edition 3,33GHz có giá xuất xưởng tới 999 USD cho đơn hàng 1.000 sản phẩm) và chỉ thích hợp cho các hệ thống mạnh và chuyên nghiệp. Giờ đây, với dòng Core i7 và Core i5 tên mã Lynnfield.
Core i5-750 là sản phẩm đầu tiên của thế hệ CPU Core i5. Nó cũng được chế tạo trên công nghệ 45nm, có 4 nhân và 8MB L3 cache (dạng SmartCache dùng chung cho tất cả các nhân). Cũng giống như Core i7, Core i5 là vi xử lý đa nhân có thiết kế nguyên khối (monolithic processor), nghĩa là tất cả 4 nhân cùng nằm chung một cách “bình đẳng” trên một die duy nhất. Ở thiết kế đa nhân của Core 2, một bộ vi xử lý 4 nhân được hình thành bằng cách gom 2 die vi xử lý 2 nhân vào chung một đóng gói. Nhờ cùng nằm chung một die, việc liên lạc giữa các nhân với nhau sẽ có băng thông lớn và độ trễ thấp. Còn trong thiết kế cũ, khi nhân này cần làm việc với nhân nằm trên die khác, lộ trình liên lạc sẽ phải đi vòng qua chip Northbridge trên mainboard.
Nhưng các CPU dòng Lynnfield dùng socket hoàn toàn mới LGA1156 (thay vì LGA1366 của Core i7-900 Series). Bạn sẽ phải ngạc nhiên trước tốc độ đưa ra socket CPU mới quá nhanh của Intel. Socket LGA775 được xài từ năm 2004. Mãi tới tháng 11-2008, với Core i7, Intel mới tung ra Socket LGA1366, và 10 tháng sau đã có thêm LGA1156.
2.Tìm hiểu về intel core i5- 2500k.
BXL Intel Core i5-2500K có đến 4 nhân thật, và kí hiệu K ở cuối cũng cho biết đây là BXL được mở hệ số nhân nên cho phép ép xung dễ dàng. Intel cũng cải tiến công nghệ Intel Turbo Boost lên 2.0 mang lại khả năng tăng tốc tối ưu hơn và đáng kể nhất là nhân đồ họa Intel HD3000 mới.Clarkdale với hai thành phần CPU và GPU tách biệt.Điểm cải tiến trong kiến trúc so với Clarkdale trước đây là nhân đồ họa trên Sandy Bridge được sản xuất trên dây chuyền 32nm, cùng dây chuyền với CPU thay vì 45nm như trước đây.
Hai thành phần CPU và GPU trong Sandy Bridge nằm chung một khối.Điều này giúp 2 thành phần CPU và GPU được tích hợp lại với nhau thành một con chip duy nhất chứ không nằm tách biệt như Clarkdale, điều này cũng giúp giảm độ trễ trao đổi dữ liệu giữa CPU và GPU, mang lại hiệu năng xử lý cao hơn.
BXL Core i5-2500K cũng hỗ trợ bộ nhớ kênh đôi DDR3 1333MHz, 16 làn trao đổi dữ liệu cho khe PCI Express 16x (1 card 16x hoặc 2 card 8x). Trên Core i5-2500K vẫn tồn tại hai tuyến bus là DMI cho CPU và chipset; FDI cho nhân đồ họa tích hợp. BXL mới cũng sử dụng chuẩn socket mới là 1155 trên các BMC chipset Intel 6 series (hiện tại là Intel P67 và H67).
Sử dụng kiến trúc Sandy Bridge thực sự là một kiến trúc theo kiểu hoàn toàn mới, hiệu suất xử lý tổng thế cũng thực sự khiến bạn chao đảo, sau khi chao đảo, bạn sẽ thấy kinh ngạc khi thâm nhập vào sâu bên trong, chúng tôi đã phát hiện ra một GPU được tích hợp (dẫu sao thì thực ra thì bản thân tôi thích gọi nó là một video processor hơn) với hiệu suất được nâng cao gấp đôi so với thế hệ cuối cùng chúng tôi thấy ở bộ vi xử lý Clarkdale. Dẫu cho ở đây không có sự thay đổi nhiều nhưng chắc chắn là sẽ có một sự cải tiến trong phân khúc low – end, dù sao thì chúng tôi vẫn nhận thấy ở đây có thiết lập hướng dẫn mở rộng mới của AVX mà thực sự sẽ giúp ích rất nhiều cho người dùng trong vấn đề chuyển mã, chúng tôi còn phát hiện ra một thiết bị update Turbo cho phép hiệu suất sử dụng và tần số clock ở mỗi lõi cao hơn và hiệu quả hơn và ở đây chúng tôi còn đặc biệt chú trọng đến việc điện năng tiêu thụ là cực tốt, nhất là khi ở chế độ idle, ngoài ra còn có chipset và một số công cụ mới nữa… vấn đề còn lại ở đây là cách nhìn nhận cũng như sự chào đón của công chúng, vì vậy, hãy cùng chúng tôi điểm qua một số khía cạnh quan trọng cần tìm hiểu.
+vi kiến trúc Westmere.
Vi xử lý hai nhân
"Clarkdale" (32 nm)
Các công nghệ được tích hợp: MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, Enhanced Intel SpeedStep Technology (EIST), Intel 64, XD bit, TXT, Intel VT-x, Intel VT-d, Hyper-Threading, Turbo Boost, Smart Cache và AES-NI
Core i5-655K có hệ số nhân mở.
Core i5-661 không hỗ trợ Intel TXT và Intel VT-d
FSB được thay thế bởi DMI.
Vi mạch có kích thước: 81 mm², số bóng bán dẫn: 382 triệu.
Vi mạch Đồ họa tích hợp và Bộ phận điều khiển bộ nhớ tích hợp: 114 mm², số bóng bán dẫn: 177 triệu.
Số bước nhảy: C2, K0
+ Vi kiến trúc Nehalem
Vi xử lý bốn nhân
"Lynnfield" (45 nm)
Các công nghệ được tích hợp: MMX, SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, Enhanced Intel SpeedStep Technology (EIST), Intel 64, XD bit, Intel VT-x, Turbo Boost, Smart Cache
FSB được thay thế bởi DMI.
Vi mạch có kích thước: 286 mm²
Số bước nhảy: B1
Hyper-Threading không hoạt động.
+ Kiến trúc Sandy Bridge
Trước đây, bộ vi xử lý Clarkdale đã sở hữu một GPU 45 nm và một lõi CPU 32 nm được đặt bên trong một con chip, còn giờ đây, kiến trúc Sandy Bridge kiểu mới đã tiến hành ghép hai bộ phận này cố định luôn trong đó, tất cả đều là 32 nm.
SB (Sandy Bridge) Core i5 là bộ vi xử lý với 4 lõi CPU vật lý, mỗi lõi lại được kết cấu với khả năng của công nghệ siêu phân luồng (tạo nên 4 lõi vật lý và 8 lõi logic siêu phân luồng), chúng đã được trang bị với việc tích hợp đồ họa và một bộ điều khiển bộ nhớ. Giống như thế hệ đầu tiên của dẫn xuất Nehalem, SB được đi kèm với tính năng Intel Turbo Boost và hứa hẹn sẽ còn được phát triển hơn nữa, hiện tại thì đây là phiên bản đã qua sửa đổi 2.0. Với thế hệ Sandy Bridge này, sẽ có một sự phân biệt rõ ràng cho mỗi phân khúc của bộ xử lý (i3/i5/i7). Dưới đây là danh sách những tính năng bạn nên biết và những hạn chế bạn cần lưu ý.
Desktop Core i7 processors have four cores / eight hyper-threads / Up to 8MB cache
Desktop Core i5 processors have four cores / NO hyper-threading / Up to 8MB cache
Desktop Core i3 processors have four cores / NO hyper-threading / Up to 3MB cache.
Tất cả các model ở trên đầu được trang bị với chế độ Turbo tương ứng, tuy vậy, sẽ chỉ có dòng series Core i7 mới có khả năng để xử lý được hai phần mềm độc lập trên mỗi lõi cũng như siêu phân luồng. Đây là một tính năng chúng tôi đánh giá rất cao với sự hữu hiệu thực sự của chúng để có thể đạt hiệu suất ở mức cao nhất, nó cũng sẽ cho phép một bộ vi xử lý có thể thực thi với hai dòng mã khác nhau tại thời điểm gần như là tương đương nhau.
Bộ vi xử lý Core i7 SB đặc trưng với 8MB trong Intel Smart Cache và một bộ điều khiển Integrated Memory Controller (IMC) để hỗ trợ cho hai kênh của bộ nhớ DDR3 với việc chính thức hỗ trợ cho tốc độ đạt tới 1333 MHz. Core i5 sẽ còn có hai bộ nhớ cache nhỏ L3, 6MB.
Nếu như bạn đi sâu hơn vào trong lõi thì chắc hẳn điều băn khoăn đầu tiên sẽ là những điều về cache L1 và L2, bộ nhớ cache Sandy Bridge bao gồm một cache 32KB L1 Data, cache 32KB Instruction ( = 64KB L1) và sau đó, chúng tôi còn phát hiện một cache 256KB L2 trên mỗi lõi. Tiếp theo, ở đây có một cache L3 được nằm cùng với các lõi CPU với 8MP bộ nhớ trong toàn bộ bộ vi xử lý 6MB cho Core i5 2500. Bộ nhớ cache L3 ở đây xuất hiện đi kèm với một điều khá kì lạ, xung quanh bên trong của phân đoạn, cache L3 được đặt ở vị trí trong phần kết cấu vật lý, chính vì vậy mà cache L3 có thể được sử dụng bởi các lõi xử lý cũng như các lõi đồ họa.
Phần II.TỔNG QUAN VỀ KIẾN TRÚC TẬP LỆNH
-khái quát kiến trúc phần mềm
-kiến trúc chung của tập lệnh
-tập lệnh 8086 intel ... .
Kiến trúc máy tính gồm 3 phần chính
1:lắp đặt phần cứng
2:tổ chức máy tính
3:kiến trúc phần mềm
Kiến trúc phần mềm của máy tính chủ yếu là kiến trúc phần mềm của bộ xử lý, bao gồm: tập lệnh, dạng các lệnh và các kiểu định vị.
+ Trong đó, tập lệnh là tập hợp các lệnh mã máy (mã nhị phân) hoàn chỉnh có thể hiểu và được xử lý bới bộ xử lý trung tâm, thông thường các lệnh trong tập lệnh được trình bày dưới dạng hợp ngữ. Mỗi lệnh chứa thông tin yêu cầu bộ xử lý thực hiện, bao gồm: mã tác vụ, địa chỉ toán hạng nguồn, địa chỉ toán hạng kết quả, lệnh kế tiếp (thông thường thì thông tin này ẩn).
+ Kiểu định vị chỉ ra cách thức thâm nhập toán hạng.
1.Kiến trúc chung của tập lệnh
Như đã nói ở trên:lệnh là từ (số) nhị phân thể hiện một thao tác xác định của bộ vi xử lý.
-các lệnh được lưu trong bộ nhớ
- các lệnh được nạp từ bộ nhớ vào cpu trong quá trình thực hiện
- mỗi lệnh có một chức năng riêng
a-Các lệnh được chia thành các nhóm chức năng riêng :
nhóm lệnh số học:ADD,SUB…;
nhóm lệnh chuyển số liệu:MOV.PUSH…;
nhóm lệnh vào ra:IN,OUT…;
b-Tập lệnh gồm nhiều nhóm lênh khác nhau.Trong mỗi nhóm lệnh bao gồm nhiều dạng lệnh có kiểu tương đồng.Mỗi lệnh của ngôn ngữ cấp cao được xây dựng bằng một lệnh mã máy hoặc một chuỗi lệnh mã máy;ví dụ:lệnh nhảy (GOTO) được thực hiện bằng các lệnh hợp ngữ về nhảy (JUMP) hoặc lệnh hợp ngữ về vòng.
c-Cấu trúc của một lệnh có thể có các dạng sau:
Mã lệnh(opcode)
Mã lệnh-địa chỉ toán hạng
Mã lệnh- địa chỉ toán hạng đích –địa chỉ toán hạng nguồn
Cụ thể hơn nó gồm 4 dạng:
+Toán hạng 3 địa chỉ: định dạng: opcode addr1,addr2,addr3 (addr 1,2,3 tham chiếu tới thanh ghi hay ô nhớ)
Vd:ADD R1,R2,R3;R1+R2 -->R3
+Toán hạng 2 địa chỉ: định dạng: opcode addr1,addr2
+Toán hạng 1 dịa chỉ: định dạng: opcode addr1
+Toán hạng 1 địa chỉ rưỡi: định dạng : opcode addr1 ,addr2(addr1 tham chiếu tới thanh ghi còn addr2 tham chiếu tới ô nhớ hoặc ngược lại)
+Toán hạng 0 địa chỉ :không sử dụng địa chỉ à dùng để thực hiện các thao tác ngăn xếp
*Mã lệnh:là phần chứa thông tin xác định các thao tác hoặc công việc cần được thực hiện
*Phần địa chỉ:là phần thông tin xác định nơi chứa toán hạng .Nó có thể : Nằm ngay trong lệnh(tức thời trong lệnh);Các thanh ghi của CPU ;Bộ nhớ
*Các thao tác có thể xảy ra giữa các toán hạng :
Thanh ghiß Tức thời Thanh ghi Thanh ghi
Bộ nhớ ß Tức thời Bộ nhớ Thanh ghi
d-Phương pháp xác định địa chỉ toán hạng(định vị toán hạng) cho phép xác định nơi chứa toán hạng .Có 3 nhóm chế độ định vị toán hạng.
+Định vị tức thời :Dữ liệu nằm ngay trong câu lệnh
Vd: MOV AX, 0F000h; đưa giá trị F000h vào AX
+Định vị thanh ghi:Dữ liệu chứa trong thanh ghi đa năng(địa chỉ hoặc đoạn)của CPU
+Định vị bộ nhớ :xác định địa chỉ offset(địa chỉ lệnh) của ô nhớ chứa toán hạng ,ô nhớ được mặc định nằm trong đoạn dữ liệu.
Có 6 phương pháp định vị bộ nhớ :
1.Định vị trực tiếp 2.Định vị gián tiếp 3.Định vị cơ sở
4.Định vị chỉ số 5.Định vị cơ sở chỉ số 6.Định vị đầy đủ
2.Sau đây chúng ta sẽ đi nghiên cứu về kiến trúc tập lệnh Intel 8086 (Thuộc thế hệ thứ 3 -1978-1982 vi xử lý 16 bít).Tập lệnh đa dạng với các lệnh nhân,chia và xử lý chuỗi.
Kiến trúc tập lệnh 8086
a.Dạng lệnh
-Một lệnh của vi xử lý 86 có dạng tổng quát như sau
Ví dụ: MOV AX,CX ;AXßCX (MOV :thuộc nhóm lệnh chuyển)
(chép toán hạng nguồn CX vào toán hạng đích AX)
-Mã lệnh :giúp cho người sử dụng biết hoạt động của lệnh.Mã gợi nhớ thường là các chữ tiếng anh viết tắt như:MOV là lệnh chuyển,ADD là lệnh cộng,AND là lệnh và luận lý,JMP là lệnh nhảy….
-Toán hạng đích:giữ kết quả(nếu có yêu cầu )sau khi thi hành lệnh.Toán hạng đích có thể là thanh ghi hay bộ nhớ.
-Toán hạng nguồn:có thể là thanh ghi ,bộ nhớ hay một số tức thời.
+Toán hạng thanh ghi là các thanh ghi của vi xử lý 86 gồm các thanh ghi tống quát(8bits lẫn 16bit)và các thanh ghi đoạn.
+Toán hạng số tức thời có thể là số trong các hệ đếm khác nhau và được viết theo qui định như sau:
*số hệ 2 : xxxxxxxxB(với x là bit nhị phân)
Ví dụ như: 01010101B,11110000B
*số hệ 10: xxxxx,hay xxxxxD(với x là một số thuộc hệ 10)
Ví dụ như: 12843,10300D
*số hệ 16: xxxxH và bắt đầu bằng số(x là một số thuộc hệ 16)
Ví dụ như: 1B2DH,820A1H
+Toán hạng bộ nhớ dùng trong tập lênh vi xử lý 86 sử dụng phương pháp định địa chỉ tổng hợp được gọi là địa chỉ hiệu dụng
Địa chỉ hiệu dụng :là tổ hợp của 3 nhóm sau được đặt trong dấu ngoặc vuông[]:
Gồm: *Nhóm thanh ghi chỉ số:SI,DI
*Nhóm thanh ghi nền:BX,BP
*Địa chỉ trực tiếp :số 16 bít
Nguyên tắc: Các thanh ghi trong cùng một nhóm không được xuất hiện trong cùng một địa chỉ hiệu dụng
-ví dụ
*Địa chỉ hiệu dụng hợp lệ:
[1000h],[SI],[DI],[BX],[BP],[SI+BX],[SI+BP],[SI][BX][1000h]…
*Địa chỉ hiệu dụng không hợp lệ:
[70000],[AX],[SI+DI+1000h]…
Địa chỉ hiệu dụng chính là thành phần offset của địa chỉ luận lý bộ nhớ.
Segment của địa chỉ hiệu dụng được mặc định như sau:
.Nếu không sử dụng BP trong địa chỉ hiệu dụng thì mặc định theo thanh ghi DS.
.Nếu có BP trong địa chỉ hiệu dụng thì mặc định theo thanh ghi SS.
-Các hoạt động thực hiện trên bộ nhớ thông qua địa chỉ hiệu dụng chia ra làm 2 trường hợp :hoạt động 8 bít và hoạt động 16 bít.
*Hoạt động bộ nhớ 8 bít làm việc trên 1 byte bộ nhớ ngay vị trí chỉ ra bởi địa chỉ hiệu dụng
*Hoạt động bộ nhớ 16 bít sẽ làm việc trên 2 byte bộ nhớ có địa chỉ kế tiếp nhau và nội dung của chúng được ghép lại thành dữ liệu 16 bít theo qui tắc “byte cao địa chỉ cao,byte thấp địa chỉ thấp”
Ví dụ: địa chỉ---> 1000h 1001h
Bộ nhớ 34 12
Dữ liệu 1234h
b.Trong kiến trúc trúc x86 những tập lệnh cơ bản ta có thể liệt kê như sau:
+Nhóm lệnh chuyển dữ liệu gồm :MOV;PUSH ;POP; XCHG;….
Ví dụ:lệnh MOV:
.Dạng lệnh: MOV reg,reg MOV reg ,immed
MOV mem,reg MOV reg,immed….
.Giải thích: toán hạng đích ß toán hạng nguồn
.Tác động cờ OF DF IF SF ZF AF FF CF
.Chép toán hạng nguồn vào toán hạng đích.
.ví dụ: MOV AX,CX ;AXßCX
MOV[SI+1000H],BP ; [SI+1001h,SI +1000h] ßBP
(Trong đó các từ viết tắt: reg=thanh ghi tổng quát; mem=bộ nhớ; immed=số tức thời)
+Nhóm lệnh số học:ADD;ADC…
+Nhóm lệnh luận lý:NOT;SHL/SAL…
+Nhóm lệnh xử lý chuỗi:REP;MOVS…
+Nhóm lệnh chuyển điều khiển:CALL;JMP…
+Nhóm lệnh điều khiển bộ xử lý:CLC;STC…
3.Tiếp nối kiến trúc 16 bít mà đại diện là vi xử lý 8086 intel ,là thế hệ thứ 4:vi xử lý 32 bít mà đại diện là 80386/80486,IA 32(intel) và thế hệ thứ 5:vi xử lý 64 bít đại diện là dòng coro i3,i5,i7.Nhìn chung kiến trúc tập lệnh trong vi xử lý 32 bít và 64 bít có nhiều điểm tương đồng với kiến trúc tập lênh vi xử lý 16 bít,dựa trên nền kiến trúc 16 bít để phát triển .Đa dạng và phức tạp hơn.
•Với dòng Core i5
* Clarkdale - nền tảng 32 nm
• Tất cả các tập lệnh hỗ trợ: MMX , SSE , SSE2 , SSE3 , SSSE3 , SSE4.1 , SSE4.2 , Enhanced Intel SpeedStep Technology (EIST), Intel 64 , XD bit (một bit NX thực hiện), TXT , Intel VT-x , Intel VT-d , Hyper-Threading , Turbo Boost , Smart Cache và AES-NI
• i5-661 không hỗ trợ Intel VT-d
• FSB đã được thay thế với DMI.
* Lynnfield - nền tảng 45 nm
•Dựa trên Nehalem
•Tất cả các tập lệnh hỗ trợ: MMX , SSE , SSE2 , SSE3 , SSSE3 , SSE4.1 , SSE4.2 , Enhanced Intel SpeedStep Technology (EIST), Intel 64 , XD bit (một bit NX thực hiện), Intel VT-x , Turbo Boost , Smart Cache
•Hyper-Threading bị vô hiệu hóa.
Tập lệnh MMX gồm có các nhóm lệnh chính MMX-The Registers (Thanh ghi MMX),State Management,Data Movement,Boolean Logic
Là một tập hợp mở rộng gồm 57 lệnh hỗ trợ đồ họa được xây dựng dành riêng cho CPU Intel Pentium nhằm mục đích giúp hệ thống xử lý các tác vụ đa phương tiện (multimedia operation) như âm thanh, phim, hình ảnh và modem (truyền nhận dữ liệu).
Nó gồm các lệnh:
ØLệnh quản lý trạng thái(State Management): enums
Ølệnh trao đổi dữ liệu(Data movement): movd,movq
ØLệnh logic
ØLệnh tính toán số học
ØLệnh so sánh
ØLệnh đóng gói dữ liệu
MMX được thiết kế sẵn trong các dòng CPU Pentium MMX và Pentium II (Tập lệnh MMX cho phép các tác vụ được thực hiện đồng thời trên nhiều đơn vị dữ liệu khác nhau. Các đối thủ cạnh của Intel (như AMD, Cyrix, Centaur) cũng phát triển các bộ xử lý tương thích MMX của họ (MMX-compliant chips) với các bộ lệnh riêng chuyên xử lý các tác vụ tính tóan hình học và dấu chấm động cần thiết khi di chuyển các hình ảnh 3D (3 Dimension - 3 chiều) trên màn hình .
Tập lện SSE Tập lệnh Sse: Một nhóm gồm 70 lệnh được thiết kế thêm trên Bộ xử lý Pentium III nhằm tăng cường chất lượng thực thi các tác vụ đồ họa 3 chiều (3D graphics). Kiến trúc tập lệnh SSE gồm :
SSE — MXCSR.
SSE — OpCode List: các lệnh về toán học,logic,so sánh….
Nó hỗ trợ khả năng thực hiện tính toán dấu chấm động và hình học - các tính năng cần thiết để hiển thị và di chuyển hình ảnh 3 chiều trên màn hình. Đây là tập hợp các lệnh tăng cường thứ 2 của Intel nhằm cải tiến khả năng đồ họa của các bộ vi xử lý (tập hợp đầu tiên chính là MMX). SSE còn được gọi là KNI (Katmai New Instruction) do tên mã trước đây của CPU Intel Pentium III là Katmai.Nó gồm có những lệnh sau: Lệnh tính toán số học
ØLệnh logic
ØLệnh so sánh
ØLệnh chuyển đổi
ØLệnh trạng thái
ØLệnh Load/Store
ØLệnh Shuffling
ØLệnh cache control
SSE2: Là tập lệnh được thiết kế cho Intel Pentium 4. Nó tăng cường thêm 144 lệnh hỗ trợ đồ họa, truyền thông đa phương tiện và kết nối mạng trực tuyến (true multimedia and online Internet).Các lệnh này bao gồm các tác vụ số Nguyên SIMD 128-bit (128-bit SIMD integer arithmetic operations) và các tác vụ dấu chấm động với độ chính xác gấp đôi SIMD 128-bit (128-bit SIMD double-precision floating-point operations). Các lệnh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm thanh - hình ảnh, mã hóa, tài chính, thiết kế và nghiên cứu khoa học, kết nối mạng trực tuyến...
1)
Tập lệnh SSE 4.1 với 47 lệnh SSE mới :
• Công nghệ Deep Power Down ( chỉ có trong những CPU Mobile và được gọi là Trạng thái C6 – State )
• Công nghệ Enhanced Intel Dynamic Acceleration Technology ( chỉ có trong những CPU Mobile ) .
• Cải thiện FPU ( Bộ tính toán dấu phảy động ) bằng những phép chia theo hệ số 16 nhanh hơn “ Fast Radix-16 Divider “
• Cải thiện FPU ( Bộ tính toán dấu phảy động ) bằng “Super Shuffle Engine”
• Công nghệ Ảo hoá nâng cao “Enhanced Virtualization Technology” ( hiệu suất tăng 25 – 75% khi chuyển trạng thái sang máy ảo ) .
Tập lệnh SSE 4.2 mới với việc thêm bảy lệnh mới để hỗ trợ cho xử lí văn bản , có tên gọi “Application Target Accelerator “ .
• MMX - MultiMedia eXtensions: Là một tập hợp mở rộng gồm 57 lệnh hỗ trợ đồ họa được xây dựng dành riêng cho CPU Intel Pentium nhằm mục đích giúp hệ thống xử lý các tác vụ đa phương tiện (multimedia operation) như âm thanh, phim, hình ảnh và modem (truyền nhận dữ liệu).. Tập lệnh MMX cho phép các tác vụ được thực hiện đồng thời trên nhiều đơn vị dữ liệu khác nhau. Các đối thủ cạnh của Intel (như AMD, Cyrix, Centaur) cũng phát triển các bộ xử lý tương thích MMX của họ (MMX-compliant chips) với các bộ lệnh riêng chuyên xử lý các tác vụ tính tóan hình học và dấu chấm động cần thiết khi di chuyển các hình ảnh 3D (3 Dimension - 3 chiều) trên màn hình.
à Kiến trúc tập lệnh MMX : MMX-The Registers (Thanh ghi MMX),State Management,Data Movement,Boolean Logic .
Nguồn :
•SSE - Single SIMD Extentions:
Một nhóm gồm 70 lệnh được thiết kế thêm trên Bộ xử lý Pentium III nhằm tăng cường chất lượng thực thi các tác vụ đồ họa 3 chiều (3D graphics). Nó hỗ trợ khả năng thực hiện tính toán dấu chấm động và hình học - các tính năng cần thiết để hiển thị và di chuyển hình ảnh 3 chiều trên màn hình. Đây là tập hợp các lệnh tăng cường thứ 2 của Intel nhằm cải tiến khả năng đồ họa của các bộ vi xử lý (tập hợp đầu tiên chính là MMX). SSE còn được gọi là KNI (Katmai New Instruction) do tên mã trước đây của CPU Intel Pentium III là Katmai.
àKiến trúc tập lệnh SSE gồm :
SSE — MXCSR.
SSE — OpCode List: các lệnh về toán học,logic,so sánh….
Nguồn :
•SSE2: Là tập lệnh được thiết kế cho Intel Pentium 4. Nó tăng cường thêm 144 lệnh hỗ trợ đồ họa, truyền thông đa phương tiện và kết nối mạng trực tuyến (true multimedia and online Internet).Các lệnh này bao gồm các tác vụ số Nguyên SIMD 128-bit (128-bit SIMD integer arithmetic operations) và các tác vụ dấu chấm động với độ chính xác gấp đôi SIMD 128-bit (128-bit SIMD double-precision floating-point operations). Các lệnh mới này làm tối ưu hóa khả năng thực hịên các ứng dụng như phim video, xử lý âm thanh - hình ảnh, mã hóa, tài chính, thiết kế và nghiên cứu khoa học, kết nối mạng trực tuyến...
• SSE3 : là phiên bản thứ ba của SSE đặt cho kiến trúc IA-32.Hỗ trợ làm tăng kết nội mạng, đa phương tiện… SSE3 thêm vào 13 câu lệnh mới.
•SSE4
Instruction Description
MPSADBW Compute eight offset sums of absolute differences, four at a time (i.e., |x0−y0|+|x1−y1|+|x2−y2|+|x3−y3|,|x0−y1|+|x1−y2|+|x2−y3|+|x3−y4|, …, |x0−y7|+|x1−y8|+|x2−y9|+|x3−y10|); this operation is important for some HD codecs, and allows an 8×8 block difference to be computed in fewer than seven cycles.[5] One bit of a three-bit immediate operand indicates whether y0 .. y10 or y4 .. y14 should be used from the destination operand, the other two whether x0..x3, x4..x7, x8..x11 or x12..x15 should be used from the source.
PHMINPOSUW Sets the bottom unsigned 16-bit word of the destination to the smallest unsigned 16-bit word in the source, and the next-from-bottom to the index of that word in the source.
PMULDQ Packed signed multiplication on two sets of two out of four packed integers, the 1st and 3rd per packed 4, giving two packed 64-bit results.
PMULLD Packed signed multiplication, four packed sets of 32-bit integers multiplied to give 4 packed 32-bit results.
DPPS, DPPD Dot product for AOS (Array of Structs) data. This takes an immediate operand consisting of four (or two for DPPD) bits to select which of the entries in the input to multiply and accumulate, and another four (or two for DPPD) to select whether to put 0 or the dot-product in the appropriate field of the output.
BLENDPS, BLENDPD, BLENDVPS, BLENDVPD, PBLENDVB, PBLENDW Conditional copying of elements in one location with another, based (for non-V form) on the bits in an immediate operand, and (for V form) on the bits in register XMM0.
PMINSB, PMAXSB, PMINUW, PMAXUW, PMINUD, PMAXUD, PMINSD, PMAXSD Packed minimum/maximum for different integer operand types
ROUNDPS, ROUNDSS, ROUNDPD, ROUNDSD Round values in a floating-point register to integers, using one of four rounding modes specified by an immediate operand
INSERTPS, PINSRB, PINSRD/PINSRQ, EXTRACTPS, PEXTRB, PEXTRW, PEXTRD/PEXTRQ The INSERTPS and PINSR instructions read 8, 16 or 32 bits from an x86 register memory location and insert it into a field in the destination register given by an immediate operand, EXTRACTPS and PEXTR read a field from the source register and insert it into an x86 register or memory location. For example, PEXTRD eax, [xmm0], 1; EXTRACTPS [addr+4*eax], xmm1, 1 stores the first field of xmm1 in the address given by the first field of xmm0.
PMOVSXBW, PMOVZXBW, PMOVSXBD, PMOVZXBD, PMOVSXBQ, PMOVZXBQ, PMOVSXWD, PMOVZXWD, PMOVSXWQ, PMOVZXWQ, PMOVSXDQ, PMOVZXDQ Packed sign/zero extension to wider types
PTEST This is similar to the TEST instruction, in that it sets the Z flag to the result of an AND between its operators: ZF is set, if DEST AND SRC is equal to 0. Additionally it sets the C flag if (NOT DEST) AND SRC equals zero.
This is equivalent to setting the Z flag if none of the bits masked by SRC are set, and the C flag if all of the bits masked by SRC are set.
PCMPEQQ Quadword (64 bits) compare for equality
PACKUSDW Convert signed DWORDs into unsigned WORDs with saturation.
MOVNTDQA Efficient read from write-combining memory area into SSE register; this is useful for retrieving results from peripherals attached to the memory bus.
• [edit] SSE4.2
• These instructions were first implemented in the Nehalem-based Intel Core i7 product line and complete the SSE4 instruction set. Support is indicated via the CPUID.01H:ECX.SSE42[Bit 20] flag.
Instruction Description
CRC32 Accumulate CRC32C value using the polynomial 0x11EDC6F41 (or, without the high order bit, 0x1EDC6F41).[6][7]
PCMPESTRI Packed Compare Explicit Length Strings, Return Index
PCMPESTRM Packed Compare Explicit Length Strings, Return Mask
PCMPISTRI Packed Compare Implicit Length Strings, Return Index
PCMPISTRM Packed Compare Implicit Length Strings, Return Mask
PCMPGTQ Compare Packed Signed 64-bit data For Greater Than
• EM64T (Intel ®( Extended Memory 64 Technology ) giúp tăng cường hiệu suất xử lý 2 nhân, hỗ trợ công nghệ điện toán 64bit hỗ trợ mạnh mẽ cho hệ điều hành Microsoft Windows Vista.
• Công nghệ nổi bật : EIST , HyperThreading XD bit (một bit NX thực hiện), TXT , Intel VT-x , Intel VT-d , Hyper-Threading , Turbo Boost , Smart Cache và AES-NI
• EIST(Intel SpeedStep® Technology) là công nghệ đặc biệt của Intel được áp dụng cho các sản phẩm vi xử lý của họ, EIST sẽ giúp các vi xử lý chạy với tốc độ phù hợp nhất trong các thời điểm khác nhau tuỳ theo trạng thái các ứng dụng đang chạy. Ta hãy hình dung một CPU có tốc độ 3.6GHz với công suất 110w có thể chạy chỉ với tốc độ 2.8GHz khi máy tính ở trạng thái nhàn rỗi và mức tiêu hao điện năng cũng như độ ồn hệ thống suy giảm đáng kể.Thực tế ta thấy trong suốt một buổi làm việc, các máy tính thường xuyên hoạt động dưới mức công suất tối đa vì thế nếu EIST được ứng dụng sẽ tiết kiệm được một lượng điện năng đáng kể, đặc biệt là với các nhà máy công sở có sử dụng máy vi tính với số lượng lớn.
Nguồn :
• HyperThreading (HT) Hyper-Threading công nghệ cung cấp 2 luồng (thread) trên mỗi nhân,tức là nhân đôi số tác vụ mà một bộ vi xử lý có thể thực thi.
HyperThreading là tên của Intel đặt cho công nghệ SMT (Simultaneous Multi-Threading). Công nghệ này cho phép một nhân xử lý có thể thực sự xử lý song song các thread do các ứng dụng tạo ra, bằng cách trang bị thêm một số thành phần của nhân xử lý, khiến hệ điều hành nghĩ rằng nó đang làm việc với nhiều nhân xử lý. Như vậy, với một hệ điều hành tương thích bộ xử lý nhiều nhân hay nhiều bộ xử lý, nó sẽ sắp xếp để nhiều thread cùng được gửi đến các bộ xử lý “ảo” đó. Về mặt lý thuyết, khi chúng ta chỉ có một nhân xử lý thì nó có xử lý song song được bao nhiêu thread cũng không thể tăng tốc độ xử lý chúng lên được. Tuy nhiên trong thực tế, không phải bất kỳ lúc nào mọi thành phần của nhân xử lý cũng được sử dụng đến, và những thành phần không được sử dụng đến này có thể dùng để xử lý thread thứ hai (hoặc thứ ba, thứ tư…). Công nghệ SMT còn giúp bộ xử lý làm việc hiệu quả hơn bằng cách giảm bớt số lần nhân xử lý phải chuyển qua chuyển lại giữa các thread ‘’song song”. Quá trình chuyển này, như đã nói ở trên, diễn ra rất nhanh và liên tục, nhưng không có nghĩa là không mất thời gian, và bằng việc giảm bớt lượng công việc này, bộ xử lý có thể được rảnh rang để tập trung vào chuyên môn hơn.
Nguồn :
Intel VT-x : Các kiến trúc x86 không phải là ảo hóa. Intel Virtualization Technology là một tập lệnh mở rộng giúp nâng cao hiệu suất và tạo điều kiện cho các văn bản của một hypervisor. Có hai loại của Intel VT, VT-x cho x86, Itanium-VT-i.
Vai trò chính của một hypervisor là để quản lý truy cập vào phần cứng để đảm bảo rằng nguồn tài nguyên có thể được chia sẻ bởi nhiều máy ảo. Một số vấn đề trong việc ảo hóa các kiến trúc x86 là:
• deprivileging nhẫn: một máy ảo chạy các ứng dụng như một hệ thống điều hành khách đang chạy ở mức đặc quyền rằng ông là không đúng.
• Vòng Aliasing: một số hướng dẫn không có đặc quyền được thực hiện trực tiếp trên bộ xử lý mà không có sự can thiệp của hypervisor.
• nén vòng: các máy ảo chạy trên hệ điều hành cùng một mức độ ứng dụng
Phần mở rộng được thiết kế bởi AMD và Intel cũng được sử dụng để vượt qua những vấn đề này. Ví dụ, VT-x x86 thêm vào hai loại mới của hoạt động: vmx gốc và vmx không phải root. Các loại đầu tiên được thiết kế cho các hypervisor, hành vi của nó là rất tương tự như IA-32 mà không có VT-x. Tuy nhiên, khác cho máy ảo. Cả hai vmx không vmx gốc rễ đó cho phép sử dụng 4 cấp độ của đặc quyền để chạy các phần mềm. VT-x cũng xác định hai cấp độ đặc quyền chuyển tiếp (từ root-không để gốc và ngược lại) và một cấu trúc dữ liệu gọi là một máy ảo kiểm soát cấu trúc (VMCS) có chứa các trạng thái của máy ảo và bộ xử lý của nó. Điều này giải quyết nhiều vấn đề được liệt kê ở trên và làm cho nó dễ nhất và nhanh nhất hypervisor
Inthel VT-d Intel Virtualization Technology dành cho Directed I / O (Intel VT-d). "Đối với ảo hóa máy tính để bàn, Intel VT-d tăng tốc độ chuyển dữ liệu và loại bỏ phần lớn tải trọng bất lợi ảnh hưởng đến hiệu suất bằng cách giảm sự cần thiết phải can thiệp vào việc quản lý của VMM I / O tốc độ giao thông Intel VT-d chuyển động dữ liệu và loại bỏ phần lớn tải trọng bất lợi ảnh hưởng đến hiệu suất bằng cách giảm sự cần thiết phải can thiệp vào việc quản lý của VMM I / O giao thông "
XD(một Bit NX) mà là viết tắt của Không thực hiện, là một công nghệ được sử dụng trong CPU để cô lập các khu vực bộ nhớ sử dụng bằng cách lưu trữ các hướng dẫn xử lý (hoặc mã) hoặc lưu trữ dữ liệu, một tính năng thường chỉ tìm thấy trong kiến trúc Harvard bộ vi xử lý. Tuy nhiên, các bit NX đang được ngày càng được sử dụng trong truyền thống của von Neumann kiến trúc bộ vi xử lý, vì lý do an ninh .
Một hệ thống điều hành với sự hỗ trợ cho các bit NX có thể đánh dấu một số khu vực của bộ nhớ không thực thi. Bộ xử lý sau đó sẽ từ chối thực hiện bất kỳ mã cư trú trong các khu vực này bộ nhớ. Các kỹ thuật nói chung, được gọi là bảo vệ không gian thực thi, được sử dụng để một số loại phần mềm độc hại dùng trên máy tính bằng cách chèn mã của họ vào khu vực lưu trữ khác của chương trình dữ liệu và chạy mã của họ từ bên trong phần này, này là được biết đến như là lỗi tràn bộ đệm tấn công.
AES (Advanced Encryption Standard) là một tiêu chuẩn mã hóa được thông qua bởi chính phủ Hoa Kỳ bắt đầu vào năm 2001. Nó được sử dụng rộng rãi trên toàn hệ sinh thái phần mềm để bảo vệ lưu lượng mạng, dữ liệu cá nhân, và cơ sở hạ tầng CNTT của công ty. AES là một thuật toán mã hóa khối đối xứng mã hóa / giải mã dữ liệu thông qua nhiều vòng. Năm 2010 mới của Intel ® Core ™ xử lý gia đình (tên mã Westmere) bao gồm một tập hợp các hướng dẫn mới, Intel ® Advanced Encryption Standard (AES) Hướng dẫn (AES-NI) . Các hướng dẫn được thiết kế để thực hiện một số bước chuyên sâu phức tạp và hiệu suất của thuật toán AES sử dụng phần cứng và do đó đẩy nhanh việc thực hiện các thuật toán AES. AES-NI có thể được sử dụng để đẩy nhanh tiến độ thực hiện của một thực hiện AES 3 đến 10 lần trên một phần mềm thực hiện hoàn toàn.
Các thuật toán AES làm việc bằng cách mã hóa kích thước khối cố định của 128 bit của văn bản đơn giản trong nhiều vòng để sản xuất các văn bản mật mã được mã hóa cuối cùng. Số lượng (10, 12, 14) đã sử dụng phụ thuộc vào độ dài chính (128b, 192b, hoặc 256b). Mỗi vòng thực hiện một chuỗi các bước trên nhà nước đầu vào, sau đó được đưa vào vòng sau. Mỗi vòng được mã hóa bằng cách sử dụng một khóa con được tạo ra bằng cách sử dụng một lịch trình quan trọng.
Tập lệnh AES-NI bao gồm sáu hướng dẫn mới thực hiện một số tính toán các bộ phận chuyên sâu của các thuật toán AES. Những hướng dẫn này có thể thực hiện bằng cách sử dụng các chu kỳ đồng hồ ít hơn đáng kể so với một giải pháp phần mềm. Bốn trong số những hướng dẫn mới để tăng tốc độ mã hóa / giải mã của vòng một và hai hướng dẫn mới cho thế hệ quan trọng vòng. Sau đây là một mô tả của các hướng dẫn mới.
• AESENC. Hướng dẫn thực hiện một vòng duy nhất của mã hóa. Hướng dẫn kết hợp bốn bước của thuật toán AES ShiftRows, SubBytes, MixColumns & AddRoundKe y vào một lệnh duy nhất .
• AESENCLAST. Hướng dẫn cho vòng cuối cùng của mã hóa. Kết hợp các ShiftRows, SubBytes AddRoundKey bước vào một hướng dẫn.
• AESDEC. Hướng dẫn một vòng duy nhất của giải mã. Điều này kết hợp bốn bước AES - InvShiftRows, InvSubBytes, InvMixColumns, AddRoundKey thành một lệnh đơn
• AESDECLAST. Thực hiện vòng cuối cùng của giải mã. Nó kết hợp InvShiftRows, InvSubBytes, AddRoundKey thành một trong những hướng dẫn.
• AESKEYGENASSIST được sử dụng để tạo ra các phím tròn được sử dụng để mã hóa.
• AESIMC được sử dụng để chuyển đổi các phím tròn mã hóa để có thể sử dụng một hình thức để giải mã bằng cách sử dụng các yếu tương đương Inverse.
Phần III. Đặc tính và Công nghệ mới của Intel
Bài viết sau sẽ cung cấp cái nhìn tổng quát về Sandy Brige, thế hệ vi xử lý mới của Intel. Cùng với Westmere, đây là kiến trúc đầu tiên của Intel được sản xuất trên tiến trình 32nm cùng với thế hệ 2 của Hi-K+ Metal Gate (Transitor cổng kim loại) mang lại hiệu xuất cao và tiêu thụ ít điện năng hơn.
Mục tiêu của Intel khi đưa ra sản phẩm của mình gồm:
Smart Performance
• Xung nhịp và hiệu năng cao. Giúp bạn hoàn thành công việc nhanh hơn với ít điện hơn
• Intel Turbo Boost 2.0 sẽ tự động đem đến hiệu năng cao hơn cho bạn nếu cần
• Hỗ trợ SMT 4-way và 8-way đưa đến khả năng multi-tasking ấn tượng
Seamless Visual Experience
•Mang đến khả năng tạo, quản lý và chia sẻ hình ảnh một cách nhah chóng
•IGP build-in cho hình ảnh sắc nét, hiệu ứng trung thực hơn
Vậy những công nghệ nào đã đem đến cho Intel core thế hệ thứ 2, với cấu trúc tương tự Core i5 (Lynnfield) trên nền tảng 1156 của Intel, vậy Core i5 Sandy Bridge có gì nổi bật hơn so với thế hệ trước đó:
I – Đặc điểm kỹ thuật
1. Đó là tiếng tock trong tiếng tick - tock của tiến trình 32nm. Vâng, thế hệ thứ 2 của Intel trên tiến trình 32nm giống như Westmere nhưng lại có kiến trúc hoàn toàn mới- kiến trúc Sandy Bridge. Thế hệ 2 của công nghệ Hi-K+ Metal Gate nhằm đem đến khả năng tiếp kiệm điện và giảm lượng điện thừa.
Tiến trình 32nm là một cải tiến quan trọng để mở rộng kích thước mạch tích hợp, tăng mật độ transitor trên chip, và tăng hiệu suất transitor, Công nghệ xử lý 32nm với thế hệ thứ hai high-k + metal gate cho phép thiết kế để tối ưu hóa hiệu suất, kích cỡ và sức mạnh cùng một lúc. Với những cải tiến so với các thế hệ trước, với công nghệ Hi-K+ Metal Gate, hiệu suất của transitor tăng lên 22%, rò rỉ điện giảm >5x cho các transitor NMOS, >10% cho các transitor PMOS trên tiến trình 45nm. Tóm lại, nhờ tiến trình này, ta có thể có được những vi xử lý có kích thước nhỏ, hiệu năng cao với mức tiêu thụ điện thấp đáng kinh ngạc
2. Các nhân xử lý được cải tiến với kết nối mạch vòng (Ring Interconnect) đột phá kết nối giữa các Core, Graphic, Last lever Cache và System Agent (tên gọi mới của Chip Cầu Bắc) tạo ra băng thông lên đến 384Gb/s
Vi kiến trúc của CPU Intel Core thế hệ thứ 2 được trang bị những nhân xử lý cải tiến có khả năng kết nối tốt hơn với công nghệ kết nối mạch vòng nhằm cung cấp băng thông dữ liệu cao hơn, hiệu suất hoạt động và khả năng tiết kiệm điện năng tốt hơn. Kết nối mạch vòng là một hệ thống ngay trên đế có cấu trúc mô-đun, độ trễ thấp, băng thông cao để kết nối giữa các thành phần của bộ vi xử lý (gồm các nhân xử lý được cải tiến, nhân đồ họa tích hợp và các thành phần tích hợp khác như hệ thống điều khiển bộ nhớ và hiển thị) nhằm nâng cao hiệu suất hoạt động.
3.Intel Smart Cache bộ nhớ chia sẻ tự động phân bố cho các lõi tùy vào khối lượng công việc, làm giảm đáng kể độ trễ, tăng hiệu suất
Cache của các dòng VXL cũ : Intel Smart Cache:
Phân chia tài nguyên cho các đơn vị tùy thuộc vào yêu cầu, khối lượng công việc
II - Memory
1.Tích hợp Integrate Memory Controller điều khiển bộ nhớ tích hợp, giúp nâng cao hiệu suất đọc/ghi thông qua các thuật toán tìm nạp hiệu quả, độ trễ thấp hơn, băng thông rộng hơn
2. Bộ nhớ kênh đôi DDR3-1333 gồm 2 kênh mỗi kênh 2 thanh RAM cùng hoạt động
III - Graphics
1.Nhân đồ hoạ IGP tích hợp trên cùng 1 đế với CPU và sẽ sử dụng chung bộ nhớ đệm trên chip mà ko phải kết nối trực tiếp với RAM
So sánh vs các dòng VXL thế hệ trước:
Từ trái qua: CPU vi kiến trúc Nehalem (Core i đầu tiên Socket LGA1366 chỉ có nhân xử lý); CPU thế hệ Westmere với chip đồ họa được tích hợp vào đế chung với nhân xử lý (Core i Socket LGA1156); và CPU thế hệ Sandy Bridge với IGP được tích hợp luôn vào nhân xử lý nên trên đế chỉ còn 1 con chip
2. IGP sử dụng công nghệ 32nm là một bước tiến khi so với các BXL Clarkdale vốn có nhân đồ hoạ dựa trên công nghệ 45nm. Nhờ vào tiến trình 32nm, Intel đã có thể đặt nhiều transistor hơn cho IGP này – Intel gọi là HD Graphics 2000 & 3000. IGP trên Westmere vẫn dùng tiến trình 45nm và ngốn nhiều điện hơn phiên bản 32nm
3. Nhân đồ họa tích hợp IGP, mà quan trọng hơn là tích hợp trên cùng 1 đế với x86. Nhờ việc trung 1 đế với x86 mà IGP còn thừa hưởng được cả tính năng Turbo Boost vốn đã có trên Nehalem. Thực tế có những tựa game nặng về đồ hoạ hơn năng lực tính toán chung, có nghĩa CPU có thể hoạt động ở xung thấp hơn mà chẳng ảnh hưởng mấy đến lượng fps xuất ra màn hình. Vì thế mà TDP toả ra trên CPU cũng ít hơn. Còn TDP trên GPU thì cần nhiều hơn. Với Turbo Boost, Intel tận dụng điều này để “nhường” phần TDP vốn dành cho nhân x86 sang các nhân đồ hoạ (Execution Unit – EU, cách gọi của Intel). Tức xét về tổng TPD toả ra trên con chip thì không đổi, nhưng có sự thay đổi “tỷ lệ ăn chia” giữa nhân x86 và IGP, mà kết quả là lượng fps (về lý thuyết) sẽ cao hơn so với không có Turbo Boost.
4. Điểm nhấn là tích hợp đồ hoạ trong CPU giúp bạn mua 1 được 2. Hiệu năng đã có sự cải thiện ấn tượng so với lần tích hợp đầu tiên trong Clarkdale. Nhưng cũng chỉ có 16 lines cho PCI-e để sử dụng card đồ hoạ với cấu hình 16x hoặc 8x-8x
5. Intel® Quick Sync Video Technology giúp chuyển đổi định dạng trên các thiết bị cầm tay và chia sẻ qua mạng một cách nhanh nhất.
Tốc độ chuyển mã trên Quick Sync phải nói cực kỳ ấn tượng. Nguyên nhân thì không khó hình dung lắm : IGP trên SnB nằm cùng đế với các nhân x86, chia sẻ chung L3 cache và được tăng cường băng thông lên mức 384 GB/s nhờ vào Ringbus. Bên cạnh đó việc kết hợp với tập lệnh AES giúp nâng cao tốc độ mã hóa và giải mã đáng kể.
6. Intel®Wireless Display cho phép hiển thị nội dung số ( phim DVD, Blu-ray ) từ máy tính xách tay ra TV qua kết nối ko dây với độ sắc nét và hình ảnh tuyệt vời chất lượng 1080p mà ko cần dung đến bộ phát sóng WiFi ( Only Mobile )
7. Là một trong các tính năng đồ họa của các bộ xử lý Intel® Core™ thế hệ 2, Công Nghệ Intel® InTru™ 3D cho phép xem phim Blu-ray âm thanh nổi 3D ở độ phân giải tối đa 1080p trên máy tính của bạn.
8. Intel Clear Video HD là một bộ phần cứng và phần mềm được xây dựng để xử lý âm thanh, hình ảnh. Tích hợp một loạt các kỹ thuật xử lý hình ảnh như kiểm soát màu sắc, độ tương phản thích ứng, bản đồ không gian màu thông minh.Công nghệ này cho phép bạn tận hưởng khả năng chiếu phim full HD 1080p, bao gồm cả Blu-ray và Web
IV – Công nghệ nâng cao
Công nghệ Turbo Boost thế hệ 2 đem đến những cú boost linh hoạt hơn:
Người dùng trước đây vẫn phải đau đầu lựa chọn giữa một CPU ít nhân nhưng xung cao, và một CPU nhiều nhân nhưng xung thấp, tùy thuộc vào ứng dụng người đó sử dụng nhiều nhất có tận dụng tốt số lượng nhân thêm vào đó hay không, và Turbo Boost đã giúp giải quyết được tất cả những vấn đề của 2 loại CPU trên.
Với CPU đa nhân, Intel quyết định “tận dụng” khối silicon của mình một cách thông minh hơn, với việc thay đổi xung của mỗi nhân tùy thuộc vào mức đòi hỏi của ứng dụng Chẳng hạn trên Core i7, khi chỉ có 2 nhân hoạt động, bộ xử lý sẽ tự động nâng mức xung của 2 nhân hoạt động này (thông qua hệ số nhân), trong khi tắt bớt 2 nhân kia đi để giữ mức TDP như cũ, tức trong giới hạn cho phép. Nếu chỉ có một nhân hoạt động, xung nhịp còn có thể được đẩy lên cao hơn 1 hoặc 2 nấc hệ số nhân nữa (tương đương 133 – 266MHz). Khi 4 nhân cùng hoạt động, mức xung nhịp trở về đúng giá trị ban đầu mà Intel đã định cho CPU đó.
Turbo Boost thế hệ kế tiếp trên Sandy Bridge:
Vạch dưới cùng trên hình là năng lượng tiêu thụ khởi điểm, khi CPU idle và Turbo Boost chưa được kích hoạt. Vạch trên cùng là mức TDP (Thermal Design Power – tạm dịch “công suất nhiệt”) mà Intel khống chế cho mỗi dòng CPU. Đây là mức công suất nhiệt năng cao nhất có thể hoạt động được, mà Intel cho rằng sẽ không ảnh hưởng tới hiệu năng hay tuổi thọ của CPU.
Ở bên tay trái, bạn thấy đường đồ thị thể hiện trạng thái xung nhân khi Turbo Boost được kích hoạt trên kiến trúc Nehalem cũ. Bộ điều khiển PCU (Power Control Unit) quyết định mức TDP vẫn nằm dưới mức giới hạn cho phép, và tăng xung cùng cường độ dòng điện lên mức tương ứng, giúp gia tăng hiệu năng và tận dụng triệt để mức TDP cao nhất có thể. PCU cũng “cho rằng” mức TDP mới của CPU sẽ đạt được ngay tức thì, cùng thời điểm khi mà xung nhịp và cường độ dòng điện tăng.
Đáng tiếc, trong thực tế mọi việc không diễn ra một cách trơn tru như vậy. Điều thực sự xảy ra là đường đồ thị “cong cong” như Turbo Boost của Sandy Bridge biểu hiện. Khi nhân CPU được cung cấp thêm năng lượng và đẩy xung lên 2.8GHz gần như tức thì, thì mức TDP không tăng cấp kì như vậy: TDP mất một thời gian để tăng và rồi ổn định ở mức mới. Turbo Boost mới của Sandy Bridge nhận biết điều này và lợi dụng khoảng thời gian này để tăng xung cùng cường độ dòng điện cao hơn nữa, trong khi TDP vẫn còn nằm trong mức cho phép.
Trong khoảng thời gian này (kí hiệu “s”), Intel đã quyết định họ sẽ tăng mức xung Turbo Boost thậm chí cao hơn cả mức mà TDP cao nhất cho phép. Có thể CPU TDP giới hạn mức xung cao nhất có thể là 2.8 GHz, nhưng Turbo Boost thậm chí tăng mức này lên tới 3.2GHz trong thời gian s, và giảm từ từ trong khi “chờ” TDP tăng đến giới hạn. Một khi TDP đã tới hạn, Turbo Boost lúc này cũng đã “kịp thời” giảm xung CPU xuống đúng 2.8 GHz như trước. Thời gian s chính là thời gian mà người dùng tận hưởng lợi ích mới mà mức xung Turbo Boost cao mang lại, và dù nó không dài lắm, tôi cảm tưởng tính năng này sẽ khá hiệu quả, vì hiếm khi CPU duy trì ở một mức xung cao liên tục do đòi hỏi phần mềm.
Khả năng hồi phục thông minh: Turbo Boost sẽ “lưu lại” các mức TDP khi hoạt động và quyết định xem, khi nào và bao lâu có thể kích hoạt lần “lên đỉnh” tiếp theo (chúng ta cứ tạm gọi đỉnh 2.8GHz là đỉnh 2, còn đỉnh 3.2GHz là đỉnh 1) . Trong các khoảng thời gian “x”, CPU tự biết nó đang chạy không tải, do đó nhiệt độ CPU đã giảm xuống gần hoặc ngang bằng với mức nhiệt độ thấp nhất có thể. Khi đó CPU sẽ tự thưởng cho mình bằng một cú “boost” trong lần load tiếp theo.
Intel® Hyper-Threading Technology giúp bạn sử dụng bộ xử lý có hiệu quả hơn nên bạn có thể chạy các ứng dụng nặng mà vẫn được đáp ứng tốt. Với công nghệ này, những người yêu thích đa phương tiện có thể tạo, chỉnh sửa và mã hóa các tập tin hình ảnh lớn đồng thời chạy các ứng dụng khác, mà không bị chậm máy.
• Chạy nhiều ứng dụng đòi hỏi cùng một lúc trong khi vẫn đáp ứng yêu cầu hệ thống
• Giữ hệ thống an toàn hơn, hiệu quả, và quản lý trong khi giảm thiểu tác động đến hiệu suất
• Với những người đam mê đa phương tiện, Intel® Hyper-Threading Technology có thể giúp bạn tạo, chỉnh sửa, mã hóa các tập tin đồ họa chuyên sâu trong khi chạy các ứng dụng nền mà ko làm ảnh hưởng đến hiệu suất hệ thống
3.Hỗ trợ mã hoá Advanced Encryption Standard (AES) từ phần cứng giúp các bạn giải mã và mã hoá dữ liệu nhanh nhất có thể.Intel ® AES-NI là một tập lệnh mã hóa mới giúp nâng bao hiệu suất, bảo vệ dữ liệu chi phí hợp lý và bảo mật cao hơn. Bao gồm bảy hướng dẫn mới, cải thiện các thuật toán được sử dụng rộng rãi tiêu chuẩn mã hóa nâng cao (AES) và mã hóa trong các lĩnh vực mà trước đây nó đã không khả thi. AES là một tiêu chuẩn mã hóa triển khai rộng rãi khi bảo vệ lưu lượng mạng, dữ liệu cá nhân, và cơ sở hạ tầng IT của công ty, và Intel ® AES-NI được sử dụng để đẩy nhanh tiến độ mã hóa AES. Điều này cho phép bạn tiếp tục giúp đỡ khách hàng của bạn thiết lập các tùy chọn linh hoạt, mạnh mẽ, và giá cả phải chăng, an toàn trước các mối đe dọa ngày càng tăng.
4.Intel VT kết hợp phần mềm dựa trên các giải pháp ảo hóa để cung cấp tối đa việc sử dụng hệ thống bằng cách củng cố nhiều môi trường vào một máy chủ hoặc PC. Bằng cách trừu tượng hóa phần mềm từ phần cứng cơ bản, một thế giới sử dụng mô hình mới có thể làm giảm chi phí, nâng cao hiệu quả quản lý và tăng cường an ninh trong khi làm cho hệ thống máy tính của bạn vững vành hơn trong trường hợp xảy ra thảm họa.
5.Intel ® Virtualization Technology For Directed I / O (VT-d) mở rộng lộ trình công nghệ ảo hóa (VT) của Intel bằng cách cung cấp hỗ trợ phần cứng cho giải pháp ảo hóa. VT-d cho những lợi ích chính:
Tiêu chuẩn hóa năng lực chia sẻ của các thiết bị vào/ra, từ đó cho phép việc sử dụng hiệu quả các tài nguyên trong hệ thống ảo.
Bảo vệ dữ liệu giữa các máy ảo trên cùng 1 máy chủ vật lý.
Chuyển đổi 1 máy ảo giữa các máy chủy vật lý 1 cách nhanh chóng, nhờ vậy, môi trường I/O có thể đc tự động cài đặp
6. Công nghệ Intel® vPro ™ cho phép việc bảo vệ, quản lý máy tính cá nhân, bảo mật dữ liệu 1 cách đơn giản, an toàn hơn. Công nghệ này là một bộ bảo mật và khác năng quản lý, được xây dựng trong vi xử lý Intel Core thế hệ thứ 2, Intel chipset và Adapter mạng
Tăng khả năng mã hóa/giải mã bằng cách sử dụng chuẩn mã hóa nâng cao AES New Instructions.
Giảm những truy cập ko mong muốn vào các dữ liệu quan trọng bằng các sử dụng Intel® Anti-Theft Technology
Cho phép các kỹ thuật viên CNTT để nhanh chóng triển khai các bản vá lỗi bảo mật trên máy tính, từ xa mở khóa ổ đĩa được mã hóa, thiết lập bảo mật dữ liệu, khắc phục sự cố và sửa chữa từ xa
7.Công nghệ Intel ® Trusted Execution là một tập hợp các phần cứng mở rộng của bộ vi xử lý và chipset nhằm nâng cao nền tảng văn phòng kỹ thuật số với khả năng bảo mật cao hơn chẳng hạn như khởi động và thực hiện bảo vệ. Intel Trusted Execution cung cấp phần cứng giúp bảo vệ, chống lại các cuộc tấn công dựa trên phần mềm, bảo vệ tính bảo mật và toàn vẹn của dữ liệu trên máy tính. Nó làm điều này bằng cách cho phép tạo ra một môi trường- nơi các ứng dụng có thể chạy trong không gian riêng của họ, được bảo vệ khỏi tất cả các phần mềm khác trên hệ thống. Những khả năng này cung cấp cơ chế bảo vệ, bắt nguồn từ phần cứng, đó là cần thiết để cung cấp môi trường thực thi cho ứng dụng 1 cách an toàn. Điều này có thể giúp bảo vệ dữ liệu quan trọng và các quá trình khỏi bị tổn hại bởi phần mềm độc hại
8. Intel® Fast Memory Access được nâng cấp từ Graphics Memory Controller Hub(GMCB) để cải thiện hiệu năng hệ thống bằng cách tối ưu hóa việc sử dụng băng thông bộ nhớ có sẵn và giảm độ trễ khi truy cập bộ nhớ.
9. Để mở rộng khả năng tính toán số thực của mình, Sandy Bridge có thêm một tập lệnh mới gọi là "Advanced Vector Extensions" (AVX). Các lệnh này là một dạng cải tiến của SSE. Đường dẫn dữ liệu sẽ được mở rộng từ 128-bit lên 256-bit, giới hạn lệnh hai toán hạng sẽ gia tăng lên thành bốn toán hạng, và các chức năng sắp xếp dữ liệu tiên tiến cũng được bổ sung. Các cải tiến của AVX cho phép CPU sở hữu khả năng tính toán số thực cao hơn gấp đôi so với trước đây.
Phần IV.Tổng kết
Tại sao dòng i lại dần chiếm ưu thế trước dòng core 2duo vốn bám trụ lâu đời như thế?
Với việc sở hữu kiến trúc Nehalem mới, các BXL Core i cho máy tính xách tay đang dần thắng thế so với Core 2, và đã hiện diện trên nhiều phân khúc khác nhau, từ dòng máy văn phòng, giải trí gia đình cho đến doanh nhân.
So với BXL Core 2 cho máy tính xách tay trước đây, các BXL Core i có kiến trúc hoàn toàn mới. Kế thừa từ kiến trúc Nehalem dòng Clarkdale cho máy để bàn, các BXL Core i5 cho máy tính xách tay cũng được sản xuất trên công nghệ 32nm (tên mã Arrandale), đồng thời cũng được tích hợp nhân đồ họa Intel GMA HD khá mạnh ngay trên BXL, giúp việc sử dụng năng lượng của toàn hệ thống được tối ưu hơn. Intel cũng đã tích hợp chip điều khiển bộ nhớ vào BXL, giúp việc truy xuất bộ nhớ của hệ thống hiệu quả hơn nhiều so với việc dùng tuyến FSB thông qua chipset cầu bắc như Core 2 trước đây. Và để tận dụng hiệu quả khả năng của BXL, Intel cũng bổ sung công nghệ Intel Turbo Boost, giúp hệ thống tự động đưa mức xung nhịp của BXL cao hơn thông thường khi chạy các tác vụ nặng, và công nghệ siêu phân luồng Intel Hyper Threading, giúp tăng số luồng xử lý đồng thời của BXL lên 4 (dù chỉ có 2 nhân) thay vì 2 như các BXL Core 2 trang bị 2 nhân trước đây. Các BXL mới cũng hỗ trợ bộ nhớ DDR3 hiệu năng cao hơn, Intel Smart Cache, công nghệ ảo hóa... Đặc biệt, với hiệu năng cao cùng nhiều công nghệ vượt trội, nhưng máy tính xách tay trang bị BXL Core i5 mới lại có giá thành không chênh lệch nhiều so với máy dùng Core 2, nên vị trí của Core i ngày càng chiếm ưu thế trên thị trường cũng là điều dễ hiểu.
Với thế hệ Sandy Bridge, dòng core i5 thế hệ thứ hai đã mang lại nhiều tiện ích hơn. Phải khẳng định rằng, đây quả là một bước đột phá đối với Intel. Điểm đáng chú ý nhất của vi kiến trúc này là việc kết hợp các hệ thống điện toán phụ trước đây vẫn nằm riêng rẽ với nhau. Trong Nehalem – vi kiến trúc của năm 2008, Intel đặt nhân xử lý đồ họa (GPU) và bộ xử lý trung tâm (CPU) trên 2 đế. Nhưng với Sandy Bridge, lần đầu tiên, cả 2 được tích hợp trên cùng một đế, goups hệ thống giảm được độ trễ khi trao đổi dữ liệu và tiết kiệm năng lượng hơn.
Bên cạnh đó, công nghệ tăng tốc Turbo Boots đư ợc nâng cấp đáng kể nhằm cải thiện hiệu suất. Đồ họa tích hợp trong Sandy Bridge cũng mạnh mẽ hơn các thế hệ trước, giúp người dùng có thể không cần đến card đồ họa rời cũng như mang đến khả năng phát videro Bluray 3D - điều mà các chip Intel trước đó chưa thực hiện được.
Tuy nhiên, Sandy Bridge không tương thích với socket LGA1156 "H1" được sử dụng trong thế hệ chip Westmere và Clarkdale mà đòi hỏi những bảng mạch mới hơn với socket LGA1155 "H2".
Intel sẽ giữ nguyên tên gọi Core cho các sản phẩm. Các chip vẫn được dán nhãn Core i3, i5 và i7 nhưng thêm số "2" để khẳng định đây là dòng Sandy Bridge dựa trên kiến trúc Core thế hệ hai, chẳng hạn Core i5-2500K hay Core i7-2600T. Ký tự cuối K, S, T nhằm nhấn mạnh CPU có thể ép xung (overclocking), được tối ưu cho điện toán thông thường hay được tối ưu cho việc tiết kiệm năng lượng, trong khi M (Mobile) và QM (Quad-core Mobile) để chỉ bộ vi xử lý dành cho các thiết bị di động...
Intel ® Virtualization Technology: Phần cứng hỗ trợ cho việc ảo hóa bộ xử lý hiệu quả, hỗ trợ cho công nghệ xử lý 2 luồng giúp máy tính làm việc nhanh hơn.
Intel ® Advanced Encryption Standard : Các hướng dẫn được thiết kế để thực hiện một số bước chuyên sâu phức tạp và hiệu suất của thuật toán AES sử dụng phần cứng và do đó đẩy nhanh việc thực hiện các thuật toán AES. AES-NI có thể được sử dụng để đẩy nhanh tiến độ thực hiện của một thực hiện AES 3 đến 10 lần trên một phần mềm thực hiện hoàn toàn.
Nếu phải so sánh giữa 3 dòng core i7, core i5 và core i3, chúng ta biết, core i7 là dòng dành cho thị trường cao cấp, core i5 là cho thị trường bậc trung và core i3 là cho thị trường bậc thấp hơn.
Phần V. nguồn tài liệu
Các file đính kèm theo tài liệu này:
- bao_cao_intel_core_i5_the_he_2_1242.docx