Tài liệu Luận văn Kỹ thuật FPGA áp dụng thực hiện cho bộ mã FEC trong hệ DVB: i
--------------------------------------------------------------------------------------------------------
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN KHÁNH THÀNH
KỸ THUẬT FPGA ÁP DỤNG THỰC HIỆN CHO BỘ
MÃ FEC TRONG HỆ DVB
LUẬN VĂN THẠC SĨ
Hà Nội - 2009
ii
--------------------------------------------------------------------------------------------------------
MỤC LỤC
MỤC LỤC.......................................................................................................................... i
THUẬT NGỮ VIẾT TẮT ................................................................................................. v
DANH MỤC HÌNH VẼ..................................................................................................viii
DANH MỤC BẢNG BIỂU ............................................................................................... x
MỞ ĐẦU..................................................................................................
89 trang |
Chia sẻ: haohao | Lượt xem: 1098 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Kỹ thuật FPGA áp dụng thực hiện cho bộ mã FEC trong hệ DVB, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
i
--------------------------------------------------------------------------------------------------------
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN KHÁNH THÀNH
KỸ THUẬT FPGA ÁP DỤNG THỰC HIỆN CHO BỘ
MÃ FEC TRONG HỆ DVB
LUẬN VĂN THẠC SĨ
Hà Nội - 2009
ii
--------------------------------------------------------------------------------------------------------
MỤC LỤC
MỤC LỤC.......................................................................................................................... i
THUẬT NGỮ VIẾT TẮT ................................................................................................. v
DANH MỤC HÌNH VẼ..................................................................................................viii
DANH MỤC BẢNG BIỂU ............................................................................................... x
MỞ ĐẦU........................................................................................................................... 1
CHƯƠNG 1: TỔNG QUAN VỀ FPGA ................................................................3
1.1. Mở đầu..............................................................................................................3
1.2. Tổng quan về FPGA..........................................................................................3
1.3. Xilinx FPGAs....................................................................................................5
1.3.1 Virtex-II CLB........................................................................................................ 5
1.3.2 Virtex-II IOB......................................................................................................... 7
1.3.3 Virtex-II Clock Tiles ............................................................................................. 7
1.3.4. VirtexII Pro .......................................................................................................... 8
1.4. VTsim ...............................................................................................................9
1.5. Các công trình liên quan tới VTsim: JHDL, JBits, JHDLBits và ADB...........10
1.5.1 JHDL................................................................................................................... 11
1.5.2 Cơ bản về JBits và ADB...................................................................................... 11
1.5.3 JHDLBits ............................................................................................................ 11
1.6. Những cải tiến JHDLBits và JBits ...................................................................12
1.7 Ứng dụng FPGA trong tính toán ô....................................................................14
1.7.1 Thiết kế mức cao tổng quát.................................................................................. 14
1.7.2. MULTIPLE........................................................................................................ 17
1.7.3 SINGLE .............................................................................................................. 19
1.7.4 BOOTH............................................................................................................... 21
1.7. 5 BIT..................................................................................................................... 23
1.8. Kết luận...........................................................................................................25
CHƯƠNG 2: MỘT SỐ ỨNG DỤNG CỦA FPGA..............................................27
2.1. Mở đầu............................................................................................................27
2.2. Ứng dụng FPGA cho trạm gốc 3G-UMTS.......................................................27
2.2.1. Tại sao lại lựa chọn FPGA .................................................................................. 27
2.2.1.1 Giảm rủi ro thiết kế....................................................................................... 27
2.2.1.2. Đáp ứng yêu cầu phát triển của BTS ............................................................ 27
2.2.2. Hạn chế của DSP ban đầu ................................................................................... 28
2.2.2.1 Thiết bị DSP ban đầu .................................................................................... 28
2.2.2.2. Các ưu điểm về hiệu năng của FPGA ........................................................... 28
2.2.3. Các tính năng chính của FPGA trong 3G ............................................................ 29
2.2.3.1. Tốc độ xử lý tín hiệu cao.............................................................................. 29
2.2.3.2 Kiểm tra lỗi đường truyền (FEC) .................................................................. 29
2.2.3.3. Chức năng bắc cầu và điều khiển ................................................................. 29
2.2.3.4. Các giao diện thích ứng với các chuẩn mạng khác nhau ............................... 30
2.2.4. Máy thu phát 3G................................................................................................ 30
2.2.4.1. Máy thu – phát ............................................................................................. 30
2.2.4.2 Máy thu Rake .............................................................................................. 31
2.2.5. Sơ đồ MUD ........................................................................................................ 31
2.2.6.1 Cơ sở ............................................................................................................ 32
2.2.6.2 Kiến trúc VLSI nhằm tới FPGA.................................................................... 35
2.2.6.3 Phương thức thực hiện ................................................................................. 39
2.2.6.4. Kết quả ........................................................................................................ 40
iii
--------------------------------------------------------------------------------------------------------
2.2.6. Phân vùng hệ thống ............................................................................................ 43
2.2.6.1. Phân vùng Mip cao ...................................................................................... 43
2.2.6.2. Phân vùng Mip thấp ..................................................................................... 44
2.2.6.3. Phân vùng quản lý hệ thống ......................................................................... 44
2.2.7. Mô hình FPGA với 64 kênh AMR ...................................................................... 44
2.3. Ứng dụng FPGA cho mã Turbo.......................................................................45
2.3.1. Bộ mã hóa TCC.................................................................................................. 45
2.3.1.1. Các tính năng ............................................................................................... 45
2.3.1.2. Ứng dụng ..................................................................................................... 45
2.3.1.3 Mô tả tổng quan ............................................................................................ 45
2.3.1.4. Hoạt động đa kênh ....................................................................................... 47
2.3.2. Bộ giải mã TCC.................................................................................................. 52
2.3.2.1. Giới thiệu:.................................................................................................... 52
2.3.2.2. Đặc tính: ...................................................................................................... 52
2.3.2.3. Ứng dụng ..................................................................................................... 52
2.3.2.4. Mô tả chung ................................................................................................ 52
2.4. Kết luận...........................................................................................................54
CHƯƠNG 3: KỸ THUẬT FPGA ÁP DỤNG THỰC HIỆN CHO BỘ MÃ FEC
HỆ DVB………........................................................................................................55
3.1. Mở đầu............................................................................................................55
3.2. Bộ mã hoá và giải mã FEC, hệ DVB ...............................................................55
3.2.1. Tổng quan về FEC .............................................................................................. 55
3.2.1.2. Tổng quan về truyền hình số mặt đất ........................................................... 56
3.3. Sơ đồ mô phỏng bộ mã hoá giải mã FEC trong hệ DVB ..................................60
3.3.1. Sơ đồ khối chung ................................................................................................ 60
3.3.2. Bộ mã hoá .......................................................................................................... 60
3.3.2.1 Bộ trễ........................................................................................................... 61
3.3.2.2 Bộ mã hoá ngoài .......................................................................................... 61
3.3.2.3 Khối mã hoá chập ........................................................................................ 61
3.3.2.4 Khối mã hoá trong ....................................................................................... 62
3.3.2.5 Khối đục lỗ .................................................................................................. 62
3.3.3. Bộ giải mã .......................................................................................................... 63
3.3.3.1 Bộ giải mã hoá ngoài ................................................................................... 63
3.3.3.2 Khối giải mã hoá chập .................................................................................. 63
3.3.3.3 Khối giải mã hoá trong................................................................................. 64
3.3.2.3 Khối giải đục lỗ ........................................................................................... 64
3.4. Thực hiện và kết quả thu được.........................................................................64
3.4.1. Các bước thực hiện.......................................................................................64
3.4.1.1 Thực hiện trong phần mềm Math lab............................................................ 64
3.4.1.1 Thực hiện trong ISE..................................................................................... 65
3.4.1.1 Thực hiện trong FUSE ................................................................................. 65
3.4.1. Kết quả thu được cho bộ mã hoá...................................................................65
3.4.1.1 Đầu vào mã hoá ........................................................................................... 65
3.4.1.2 Đầu ra sau khi mã hoá.................................................................................. 65
3.4.1. Kết quả thu được cho bộ giải mã ..................................................................65
3.4.1.2 Đầu ra sau khi giải mã hoá ........................................................................... 65
3.4.1.2 Đầu ra giải mã sẵn sàng FIFO ...................................................................... 66
KẾT LUẬN ..................................................................................................................... 67
TÀI LIỆU THAM KHẢO................................................................................................ 69
PHỤ LỤC........................................................................................................................ 70
iv
--------------------------------------------------------------------------------------------------------
1.Liên hệ giữa Matlab và FPGA.............................................................................70
1.1. Tích hợp thuật toán Matlab vào trong thiết kế FPGA. ............................................ 70
1.2. Matlab một môi trường phát triển cho thiết kế FPGA............................................. 75
v
--------------------------------------------------------------------------------------------------------
THUẬT NGỮ VIẾT TẮT
A
ADB Alternate Wire Database Cơ sở dữ liệu dây thay thế
AHB Advanced High- Performance Bus Bus hiệu năng cao tăng cường
AMR Adaptive Multi Rate Bộ thích ứng đa tốc độ
API Application Programming Interface Giao diện lập trình ứng dụng
ARIB Association of Radio Industries
and Businesses
ASIC Application Specific Intergrated
Circuit
Vi mạch tích hợp ứng dụng
ATSC Advanced Television System
Committee
B
BLER Block Error Rate Tỷ lệ lỗi khối
BST-
OFDM
Band Segmented OFDM
BTS Base Transceiver Station Trạm phát gốc
C
CC Convolutional Coding Mã hoá chập
CDMA Code Device Multiplex Access Đa truy nhập phân chia theo mã
CLB Configurable Logic Block Khối logic khả cấu hình
CM Core Module Modun lõi
D
DCI Digitally Controlled Impedance Trở kháng điều khiển kỹ thuật số
DCM Digital Clock Manager Bộ quản lý clock kỹ thuật số
DDR Dual Data Rate Công nghệ lưu dữ liệu kép
vi
--------------------------------------------------------------------------------------------------------
DIGEG Digital Broadcasting Expert Group
DSP Digital Signal Processing Xử lý tín hiệu số
DVB-T Digital Video Broadcasting-
Terrestrial
F
FPGA Field Programmable Gate Array Vi mạch mảng phần tử logic khả trình
FSM Finite State Machine Thiết bị trạng thái hạn chế
FEC Forward Error Correction Gửi bản tin tự sửa lỗi
G
GUI Graphical User Interface Giao diện đồ họa người dùng
H
HDL Hardware Description Languages Ngôn ngữ mô tả phần cứng
I
ISI Inter Symbols Interference Nhiễu xuyên ký tự
ITU International Telecommunication
Union
Tổ chức viễn thông toàn cầu
IOB Input/Output Block Khối vào ra
J
JHDL Java Hardware Desription language Ngôn ngữ mô tả phần cứng trên nền
Java
L
LUT Look Up Table Bảng dò tìm
LE Logical Element Phần tử logic
LM Logic Module Modun logic
M
MIMO Multi Input Multi Output Nhiều đầu vào nhiều đầu ra
vii
--------------------------------------------------------------------------------------------------------
MMSE Minimum-Mean-Square-Error Lỗi trung bình quân phương tối thiểu
MAI Multi-Access Interferences Nhiễu đa truy nhập
MUD Multi User Detection Bộ dò đa người dùng
O
OVSF Orthogonal Variable Spreading Factor Hệ số trải phổ khả biến trực giao
R
RTL Register Transfer Level Mức chuyển đổi thanh ghi
RTR Run Time Reconfiguration Đặt lại cấu hình thực
RAM Random Access Memory Bộ nhớ truy cập ngẫu nhiên
ROM Read Only Memory Bộ nhớ chỉ đọc
RS Reed-solomon
S
SEU Single Event Upset Nhiễu biến cố đơn
P
PE Processing Elements Thành phần xử lý
PLD Programmable Logic Device Thiết bị logic khả lập trình
X
XHWIF The Xilinx Hardware Interface Giao diện phần cứng Xilinx
U
UMTS Universal Mobile Telecommunications
Service
Dịch vụ viễn thông di động toàn cầu
W
WCDMA
Wideband Code Division Multiple
Access
Đa truy nhập phân chia theo mã băng
rộng
3GPP Third Generation Partnership Project Dự án hợp tác 3G
viii
--------------------------------------------------------------------------------------------------------
DANH MỤC HÌNH VẼ
Hình 1. 1 Bốn lĩnh vực thiết kế chính của FPGA .................................................................... 3
Hình 1. 2 Kết cấu bên trong FPGA......................................................................................... 4
Hình 1. 3 Sơ đồ tile Virtex-II FPGA....................................................................................... 5
Hình 1. 4 Bố trí chức năng của LE ......................................................................................... 6
Hình 1. 5 Bố trí chức năng của LE ......................................................................................... 7
Hình 1. 6 Cấu hình bộ đệm clock toàn cục ............................................................................. 8
Hình 1. 7 Cấu tạo của JHDL ................................................................................................ 10
Hình 1. 8 Dòng thiết kế JHDLBits ....................................................................................... 12
Hình 1. 9 Quá trình xác nhận dòng bits ................................................................................ 14
Hình 1. 10 Thuật toán thực thi FPGA ................................................................................... 15
Hình 1. 11 Cấu trúc FPGA mức cao ..................................................................................... 16
Hình 1. 12 Cấu trúc hàng ô................................................................................................... 17
Hình 1. 13 Luồng nóng tính toán, công thức cho kiến trúc MULTIPLE................................ 18
Hình 1. 14 Các bộ nhân nguyên được canh chỉnh ................................................................. 18
Hình 1. 15 Cấu trúc ô cho kiến trúc MULTIPLE .................................................................. 19
Hình 1. 16 Các phép toán luồng nóng phân vùng cho kiến trúc SINGLE.............................. 20
Hình 1. 17 Các cấu trúc của bộ điều khiển và ô cho kiến trúc SINGLE ................................ 20
Hình 1. 18 Phần cứng cho thuật toán Booth.......................................................................... 21
Hình 1. 19 Thuật toán Booth cho bộ nhân bù hai.................................................................. 22
Hình 1. 20 Các phép tính luồng nóng cho kiến trúc BOOTH ................................................ 22
Hình 1. 21 Cấu trúc ô và bộ điều khiển cho kiến trúc BOOTH ............................................. 23
Hình 1. 22 Tuyến đầu tiên của kiến trúc BIT cho tính toán luồng nóng................................. 24
Hình 1. 23 Cấu trúc ô và bộ điều khiển cho kiến trúc BIT .................................................... 25
Hình 2. 1 Sự phức tạp của thiết bị và quá trình phát triển của FPGA .................................... 27
Hình 2. 2 Bản thiết kế DSP ban đầu ..................................................................................... 28
Hình 2. 3 Khối thực thi FPGA.............................................................................................. 28
Hình 2. 4 Sơ đồ máy phát 3G ............................................................................................... 30
Hình 2. 5 Sơ đồ máy thu 3G ................................................................................................. 30
Hình 2. 6 Mô hình máy thu Rake ......................................................................................... 31
Hình 2. 7 Sơ đồ khối bộ dò đa người dùng (CF-MUD)......................................................... 32
Hình 2. 8 Nguyên lý của khối lấy dấu (a) và khối tách sóng cho k người dùng (b)................ 34
Hình 2. 9 Ước tính hiệu năng của phương pháp MUD.......................................................... 35
Hình 2. 10 Kiến trúc phần cứng đơn giản hoá của CF-MUD ................................................ 36
Hình 2. 11 Ánh xạ CF-MUD lên phần tử xử lý và bộ nhớ trong ........................................... 38
Hình 2. 12 Tiến trình xử lý pipeline trong tiến trình xử lý lấy dấu ........................................ 41
Hình 2. 13 Chiến lược đường ống (pipeline) trong tiến trình xử lý tách ................................ 41
Hình 2. 14 Mô hình FPGA với 64 kênh AMR ...................................................................... 44
Hình 2. 15 Các cổng vào ra bộ mã hóa TCC......................................................................... 46
Hình 2. 16 Cấu trúc bên trongbộ mã hóa TCC...................................................................... 46
Hình 2. 17 Cấu trúc TCC RSC ............................................................................................. 47
Hình 2. 18 Thông lượng bộ đệm kép .................................................................................... 48
Hình 2. 19 Định thời đầu vào ............................................................................................... 49
Hình 2. 20 Định thời đầu ra (Bits đuôi) ................................................................................ 50
Hình 2. 21 Định thời đầu ra ( Không bit đuôi) ...................................................................... 50
Hình 3. 1 Máy thu VSB........................................................................................................ 57
Hình 3. 2 Sơ đồ khối và giao diện đo trong hệ thống DVB-T................................................ 58
ix
--------------------------------------------------------------------------------------------------------
Hình 3. 3 Hệ thống thu phát truyền hình số mặt đất .............................................................. 59
Hình 3. 4 DVB-T Equipment by ITIS................................................................................... 59
Hình 3. 5. Sơ đồ khối và giao diện đo phía máy thu DVB-T................................................. 59
Hình 3. 6 Sơ đồ khối của bộ điều chế DVB-T ...................................................................... 60
Hình 3. 7 Sơ đồ khối mô phỏng bộ mã và giải mã FEC cho DVB với kênh giả nhiễu trắng .. 60
Hình 3. 8 Sơ đồ khối mã hoá ................................................................................................ 61
Hình 3. 9 Bộ trễ ................................................................................................................... 61
Hình 3. 10 Khối mã hoá ngoài.............................................................................................. 61
Hình 3. 11 Khối mã hoá chập ............................................................................................... 62
Hình 3. 12 Khối mã hoá trong .............................................................................................. 62
Hình 3. 13 Khối đục lỗ ......................................................................................................... 62
Hình 3. 14 Sơ đồ khối bộ giải mã ......................................................................................... 63
Hình 3. 15 Đầu ra sau khi giải mã hoá.................................................................................. 66
Hình p- 1 Bộ tạo hệ thống, giao diện AccelChip................................................................... 71
Hình p- 2 Kiến trúc bộ lọc ước tính Kalman......................................................................... 73
Hình p- 3 Sơ đồ khối bộ lọc Kalman .................................................................................... 73
Hình p- 4 Hệ thống Matlab công cụ đánh giá thuật toán ....................................................... 75
Hình p- 5 Matlab trên cơ sở RTL thiết kế luồng cho FPGA .................................................. 76
Hình p- 6 Chuỗi phát- thu HSDPA....................................................................................... 78
x
--------------------------------------------------------------------------------------------------------
DANH MỤC BẢNG BIỂU
Bảng 1.1: Kích cỡ và loại SelectRAM.................................................................................... 6
Bảng 2.1: Số người dùng hoạt động cùng lúc tối đa có thể phân biệt được............................ 41
Bảng 2.2: Tỷ lệ sử dụng phần cứng (%) tương ứng với số người dùng tối đa. ....................... 42
Bảng 2.3: Sử dụng tài nguyên và hiệu suất ........................................................................... 51
1
--------------------------------------------------------------------------------------------------------
MỞ ĐẦU
Sự thành công của công nghệ kỹ thuật mới phụ thuộc rất nhiều vào khả năng tích hợp,
hội tụ của các giải thuật, các thuật toán đã được nghiên cứu cho các vi mạch vào thực tế.
Các hệ thống ngày càng tiến đến xu hướng hội tụ lại và trở nên mềm dẻo hơn, dễ dàng cấu
hình cũng như khả năng phối kết hợp với các hệ thống khác.
Trong những năm gần đây đòi hỏi về sử dụng các dịch vụ di động tốc độ cao, băng
thông lớn đang ngày càng tăng. Yêu cầu về tốc độ dữ liệu cao dẫn tới lớp vật lý trở nên
phức tạp hơn. Đã có rất nhiều mô hình được nghiên cứu và đưa và sử dụng thực tế như là
MIMO, quá trình xử lý tín hiệu số tiên tiến, các mô hình sửa lỗi trước tiên tiến
(FEC)…Rất nhiều chuẩn như là WCDMA (HSDPA), CDMA2000(1xEV-DO), Wi-MAX
đã tích hợp các mô hình này. Cùng với đó các thuật toán phức tạp cũng được đề nghị để
cải tiến hiệu năng của máy phát – thu. Mặc dù rất nhiều thuật toán đã được đề nghị nhưng
không phải thuật toán nào cũng được đưa vào sử dụng trong thực tế do độ phức tạp của
thuật toán và hạn chế về công nghệ. Hơn nữa, đối với các thiết bị di động thì các thuật
toán này phải có khả năng trong việc sử dụng tài nguyên, gọn nhẹ và tiêu thụ ít năng
lượng.
FPGA cho phép cấu hình lại để thay đổi chức năng logic. Khả năng này cho phép nhà
thiết kế có thể thoải mái phát triển, dễ dàng thay đổi chức năng phần cứng giống như đang
thực hiện trên phần mềm.Thậm chí FPGA còn có thể tự động cấu hình để thực hiện các
chức năng khác nhau trong những khoảng thời gian khác nhau. Phù hợp cho việc triển
khai các thiết bị vô tuyến thông minh (Cognitive Radio System - CRS), vô tuyến định
nghĩa bằng phân mềm (Software – Defined Radio - SDR). Khả năng cho phép cấu hình
lại chức năng logic có thể ứng dụng trong nhiều kiểu hệ thống để cài đặt hệ thống tự khắc
phục lỗi, tạo hệ thống có thể được cấu hình cho nhiều môi trường hoạt động, hoặc cài đặt
thành phần cứng đa mục đích cho các ứng dụng khác nhau. Hơn nữa, sử dụng FPGA có
thể dễ thiết kế và kiểm tra phần cứng cũng như khả năng nhanh chóng tung sản phẩm ra
thị trường.
Với những ưu thế của FPGA nó cho thấy lựa chọn FPGA là một tất yếu vào thời điểm
hiện nay để đáp ứng các yêu cầu về thiết bị, làm cho khả năng triển khai các thuật toán
cũng như giải thuật mới được đưa vào thực tế.
Nhận thức được những vấn đề trên, cùng với sự định hướng của thầy giáo TS. TRỊNH
ANH VŨ, tôi đã lựa chọn đề tài nghiên cứu của mình là
“Kỹ thuật FPGA áp dụng thực hiện cho bộ mã hoá FEC
trong hệ DVB”
Theo đó, đồ án được tổ chức và trình bày trong ba chương
Chương 1: Tổng quan về FPGA
Trình bày chung về FPGA, Xilinx FPGAs, các cải tiến của JBits, các công trình trước
đây và hiện nay có liên quan tới VTsim, các công cụ ảnh hưởng tới VTsim.
Mô tả bốn kiến trúc tính toán ô thực hiện cho việc nghiên cứu, trình bày phần cứng
FPGA mức cao dùng cho mỗi từng kiến trúc để thuận tiện tương tác với hệ thống phân
loại dựa trên cách tính toán của mỗi kiến trúc. Bốn kiến trúc MULTIPLE, SINGLE,
BOOTH, và BIT được phân biệt dựa vào cách mà chúng tính toán giải quyết bằng các cấp
độ tương đương và bằng cách thực hiện các phép tính số học khác nhau. Phần cứng được
2
--------------------------------------------------------------------------------------------------------
thiết kế cụ thể cho từng vấn đề, bởi vậy mỗi kiến trúc bao gồm các khối số học rất nhỏ yêu
cầu để tính toán vấn đề. Do đó, mỗi khối số học được dùng chỉ trong mỗi xung đồng hồ.
Tính logic yêu cầu cho tương tác hệ thống được giảm nhỏ nhất để lưu trữ nhiều vùng chíp
có thể cho tính toán ô.
Chương 2: Một vài ứng dụng của FPGA
Trình bày một số lý do tại sao sử dụng FPGA cho trạm gốc, một số tính năng chính của
FPGA ứng dụng trong trạm gốc 3G, sơ đồ máy thu - phát, sơ đồ MUD, trình bày về hoạt
động của các mạch thực tế cho việc mã hóa và giải mã Turbo.
Chương 3: Ứng dụng FPGA trong bộ mã hoá FEC trong hệ DVB
Trình bày tổng quan về FEC, về hệ DVB, về sơ đồ thiết kế cụ thể bằng Mathlab được
cung cấp sẵn có bởi Xilinx mô phỏng bộ mã hoá FEC, các kết quả thu được.
Được sự quan tâm giúp đỡ chỉ bảo tận tình trong nghiên cứu và cung cấp tài liệu của
thầy giáo TS. Trịnh Anh Vũ và ý kiến đóng góp của các thầy cô giáo cùng với sự cố
gắng, nỗ lực của bản thân đồ án được hoàn thành với nội dung được giao ở mức độ và
phạm vi nhất định. Tuy nhiên do trình độ và thời gian có hạn, đồ án chắc chắn không
tránh khỏi những sai sót, kính mong các thầy cô giáo và các bạn sinh viên chỉ bảo đóng
góp ý kiến chỉnh sửa và định hướng nội dung cho hướng phát triển tiếp theo.
Tôi xin chân thành cảm ơn thầy giáo TS. Trịnh Anh Vũ đã tận tình giúp đỡ trong thời
gian học tập và làm đồ án tốt nghiệp.
Hà Nội, ngày…..tháng…..năm 2009
Người làm đồ án
HV. Trần Khánh Thành
3
--------------------------------------------------------------------------------------------------------
CHƯƠNG 1: TỔNG QUAN VỀ FPGA
1.1. Mở đầu
Để đi đến việc trình bày ứng dụng FPGA trong thông tin vô tuyến cũng như 3G, cần
có cái nhìn tổng quan về FPGA, các ưu việt của nó cũng như khả năng ứng dụng của
FPGA. Muốn vậy, chương sẽ được tổ chức trình bày như sau:
Tổng quan về FPGA.
Xilinx FPGAs.
VTsim.
Các công trình liên quan tới VTsim: JHDL, JBits, JHDLBits và ADB.
Những cải tiến JHDLBits và Jbits.
1.2. Tổng quan về FPGA
FPGAs xuất hiện lần đầu tiên vào giữa những năm 1980 nhằm mục đích thay thế
cho các mạch logic đa chip bằng giải pháp tự tái cấu hình đơn. FPGAs đã có những
phát triển mạnh, vượt lên trên vai trò thay thế cho vi mạch logic đa chip. Hiện nay,
các ứng dụng FPGA bao gồm: Xử lý tín hiệu và hình ảnh, tăng tốc đồ hoạ, nhận
dạng/phân tích mục tiêu quân sự, mã hoá, tính toán tái cấu trúc, đồng xử lý bộ nhớ off-
chip. FPGAs được ứng dụng trong bốn lĩnh vực thiết kế chính: Tạo nguyên mẫu
nhanh, mô phỏng, trước đặc chế, và đặc chế hoàn toàn. Hình 1.1 minh hoạ phạm vi
ứng dụng FPGAs chia theo bốn lĩnh vực thiết kế.
30%
3%
30%
37%
Tạo khuôn
mẫu nhanh
Mô phỏng
Trước đặc chế
Đặc chế hoàn
toàn
Hình 1. 1 Bốn lĩnh vực thiết kế chính của FPGA
FPGAs là kết quả của việc kết hợp hai công nghệ khác nhau: Thiết bị logic khả
trình (PLDs) và vi mạch bán dẫn chuyên dụng (ASICs). Một bộ PLD đơn giản bao
gồm một mảng các cổng AND và OR để tạo ra các mạch cơ bản. ASICs là các loại
chip do người dùng tạo ra, thường được sử dụng trong các ứng dụng lớn do chi phí kỹ
thuật không đệ quy (NREs) cao hơn nhiều so với một chu kỳ FPGAs. FPGAs có cấu
tạo bao gồm hàng ngàn cho tới hàng triệu cổng cùng nhiều tổ hợp, khối logic và công
nghệ xử lý khác nhau.
Cấu trúc bên trong của FPGA thường được xây dựng theo dạng tile đối xứng, bao
4
--------------------------------------------------------------------------------------------------------
gồm một mạng lưới các khối chuyển mạch, logic, kênh dây dẫn, khối vào ra. Hình 1.2
minh hoạ một ma trận gồm các khối chuyển mạch (SB), kênh dây dẫn và khối logic.
Khối chuyển mạch trong kết cấu FPGA là bộ phận nối các dây dẫn bên trong với nhau.
Khối chuyển mạch cho phép các đoạn dây ngang chuyển sang các đoạn dây dọc và
ngược lại. Khối chuyển mạch cũng cho phép các đoạn dây ngang kết nối với các dây
ngang khách cũng như dây dọc kết nối với nhau.
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
SB
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
Logic
Block
SB SB SB SB SB
SB SB SB SB SB
Hình 1. 2 Kết cấu bên trong FPGA
Kích cỡ và thành phần của một khối logic rất khác nhau, tuỳ theo nhà sản xuất và
nhu cầu thị trường. Ví dụ, FPGAs hướng đến các giải pháp đem lại hiệu quả về chi
phí, thường có các khối logic đơn giản hơn là FPGA dành cho các ứng dụng hiệu năng
cao. Mặc dù thành phần bên trong các khối logic có thể thay đổi theo cấu trúc, nhưng
có hai khối cơ bản bên trong khối logic: Phần tử nhớ và bộ tạo hàm. Phần tử nhớ giúp
cho các nhà thiết kế lưu trữ tạm thời dữ liệu cho đến khi đạt được điều kiện mong đợi.
Bộ tạo hàm có thể đặt cấu hình để tạo hàm bất kỳ cho đến số đầu vào của bộ tạo hàm.
Tuỳ thuộc vào cấu trúc, một số bộ tạo hàm có thể hoạt động ở các chế độ khác nhau
như bộ nhớ truy cập ngẫu nhiên (RAM), bộ nhớ chỉ đọc (ROM), hoặc một số chế độ
phức tạp hơn như thanh ghi thay đổi. FPGAs được đặt cấu hình thông qua một dòng
bits nạp trong thiết bị. Dòng bits là một file tạo ra bởi các nhà sản xuất FPGA, đặt cấu
hình cho các khối chuyển mạch, các khối logic và các mạch logic khác bên trong
FPGA.
FPGAs đã làm thay đổi ranh giới về điện tử kỹ thuật số khi cho phép nhà thiết kế
xây dựng từng mảng. Nhiều nhà thiết kế có thể nhanh chóng kiểm tra và xác nhận
chức năng của mỗi mảng trong hệ thống để bảo đảm chính xác nhiệm vụ của chúng
5
--------------------------------------------------------------------------------------------------------
khi kết hợp với phần còn lại của hệ thống. Trong bối cảnh kỹ thuật thiết lập lại cấu
hình ngày càng được quan tâm nhiều hơn, FPGAs được thừa nhận là giải pháp khả thi
và kinh tế nhất. Cho dù thiết kế có thể đặt cấu hình là ổn định hay linh hoạt thì với
FPGAs, đều có thể thực hiện chu kỳ thiết kế nhanh chóng, linh hoạt, hiệu quả cao [4].
1.3. Xilinx FPGAs
Xilinx là công ty dẫn đầu trong thị trường FPGA, được thành lập năm 1984, sản
phẩm FPGA đầu tiên của họ được thương mại hoá năm 1985. Hiện nay, Xilinx hướng
cho họ sản phẩm Virtex-II FPGAs đến cấp thiết kế với mật độ và hiệu năng cao. Trong
đồ án này trình bày về mạch logic khả trình, Virtex-II FPGAs là loại FPGAs tiên tiến,
mang đến sự lựa chọn mật độ phong phú nhất trong lĩnh vực này, bao gồm mười một
loại thiết bị từ 40 ngàn đến tám triệu cổng hệ thống .
Virtex-II FPGA đã dành bộ nhân 18 bit x 18 bit, bộ cộng chuỗi bộ cộng nhớ nhanh
và số lượng lên tới 93,184 thanh ghi bên trong. Các thiết bị Virtex-II được phân vào
một ma trận tile đối xứng như đã mô tả trong phần trên. Sáu loại tile chính trong
Virtex-II là: Khối vào/ra (IOBs), Khối logic cho phép đặt cấu hình (CLBs), bộ nhân
phần cứng, SelectRAM khối 18Kbit và Mô-đun clock KTS (DCMs) [8]. Hình 1.3
minh hoạ sơ đồ tile của Virtex-II FPGA.
Mỗi họ Virtex FPGA đều có một tập hợp các sản phẩm có thể lập trình lại lớn, bắt
đầu với phiên bản Virtex đầu tiên được giới thiệu vào năm 1998. Virtex và Virtex-E đã
trở thành sản phẩm đi đầu trong nền công nghiệp lúc đó ngay từ lần đầu giới thiệu.
DCM DCM IOB
Đồng hồ ghép kênh
CLB Khối lựa chọn RAM Multiplier
Logic khả cấu hình
Các cổng vào ra khả lập
trình
Hình 1. 3 Sơ đồ tile Virtex-II FPGA
1.3.1 Virtex-II CLB
Thành phần cho phép đặt cấu hình chính trong Virtex-II FPGA là CLB. CLBs
chiếm phần lớn các tile trong thiết bị. Mỗi CLB bao gồm bốn slice và hai bộ đệm ba
trạng thái.
6
--------------------------------------------------------------------------------------------------------
Bộ tạo hàm
(Function
Generator)
Chuỗi
chạy
Chuỗi
mang
Phần tử
nhớ
(Memory
Element)
Hình 1. 4 Bố trí chức năng của LE
Mỗi bộ tạo hàm có thể đặt cấu hình theo bốn cách khác nhau: Bốn bảng dò đầu vào
(LUT), thanh ghi chuyển, SelectRAM phân tán 16 bit, hoặc ROM 16 bit. Trong chế độ
LUT bốn đầu vào, bộ tạo hàm có thể thực thi hàm logic tổ hợp bất kỳ lên tới 4 đầu
vào. Bộ tạo hàm nhân có thể xếp tầng hoặc sử dụng song song để tạo ra các hàm hoặc
kích cỡ đầu vào tuỳ ý. Chế độ thanh ghi chuyển 16 bit có thể sử dụng độc lập với các
bộ tạo hàm khác hoặc xếp tầng cùng nhau để tạo thành các thanh ghi chuyển dài hơn
[8].
Có hai chế độ hoạt động dành cho bộ tạo hàm, hoạt động như một SelectRAM:
SelectRAM đơn cổng và SelectRAM cổng kép. Một SelectRAM cổng đơn chỉ có một
địa chỉ cổng, trong khi SelectRAM cổng kép có một cổng dành cho việc ghi đồng bộ,
một cổng dành cho đọc không đồng bộ. Cổng thứ hai chuyên dùng cho việc đọc không
đồng bộ. Thiết lập cấu hình cổng kép cho phép đọc và ghi đồng thời trên cùng
SelectRAM. Mỗi CLB có thể đặt trong bảy cấu hình SelectRAM khác nhau như trong
bảng 1.1. Chế độ bộ tạo hàm ROM khá giống với chế độ SelectRAM đơn cổng. Một
LUT đơn có thể thực hiện một ROM 16x1 hoặc LUTs bội có thể xếp tầng cùng nhau
để tạo thành một ROM có độ dài tuỳ ý [8].
Bảng 1.1: Kích cỡ và loại SelectRAM
Loại SelectRAM Cỡ RAM
Đơn cổng 16 x 8 bit
Đơn cổng 32 x 4 bit
Đơn cổng 64 x 2 bit
Đơn cổng 128 x 1 bit
Cổng kép 16 x 4 bit
Cổng kép 32 x 2 bit
Cổng kép 64 x 1 bit
Hai phần tử nhớ trong một slice có thể thiết lập làm một flip flop loại D hoạt động
theo cạnh hoặc chốt nhạy mức. Với mỗi phần tử nhớ, có sáu chế độ hoạt động khác
nhau:
7
--------------------------------------------------------------------------------------------------------
Set và reset không đồng bộ (preset và clear/đặt trước và xoá).
Reset không đồng bộ (xoá).
Set không đồng bộ (đặt trước).
Reset đồng bộ.
Set đồng bộ .
Không set hoặc reset.
1.3.2 Virtex-II IOB
Khối vào/ra (IOBs) là các tile trong FPGAs, tạo điểm truy cập đến và đi khỏi kết
cấu bên trong của FPGA. IOBs được đặt xung quanh đường bao của kết cấu FPGAs,
xem Hình 2.3, IOBs thường được sử dụng để nối các clock bên ngoài, tuyến dữ liệu
vào/ra, và là bộ dò test trong các ứng dụng sửa lỗi. Mỗi IOB bên trong Virtex-II FPGA
truy cập tới bốn bộ đệm bên ngoài. Hai bộ đệm có thể sử dụng cùng nhau để tạo thành
cặp vi phân, độc lập như là bộ đệm một đầu hoặc trở kháng điều khiển kỹ thuật số
(DCI). Virtex-II FPGA có một số chuẩn I/O khác nhau: Hai mươi lăm chế độ I/O một
đầu, tám chế độ tín hiệu vi phân và hai mươi sáu chế độ DCI [8].
Ở bên trong, một IOB bao gồm sáu phần tử nhớ và một số bộ nhân để đặt cấu hình
vào/ra tối đa. Các phần tử nhớ bên trong IOBs có chức năng tương tự như các phần tử
nhớ trong CLB. Có ba đường dẫn riêng trong IOB: Một dành cho đầu vào, một cho
đầu ra và có khả năng đặt đầu ra hoạt động ở chế độ ba trạng thái. Bên cạnh đó, tổ hợp
hai đầu vào hoặc các flip-flop đầu ra cho phép sử dụng các thanh ghi DDR. IOBs được
chia thành bảy vùng, như trong Hình 1.5. Hình bên trái trong Hình 1.5 thể hiện góc
quan sát từ bên trên đối với gói nối dây, hình bên phải là góc nhìn từ bên trên đối với
gói flip chip. Có một số quy tắc tổ hợp các chuẩn vào/ra khác nhau trong một vùng
IOBs. Chi tiết về chế độ hoạt động và cấu hình IOB có trong phần bảng dữ liệu Virtex-
II của Xilinx [8].
Dãy 0 Dãy 1
Dãy 4 Dãy 5
D
ãy
2
D
ãy
3
D
ãy
6
D
ãy
7
Dãy 1 Dãy 0
Dãy 5 Dãy 4
D
ãy
7
D
ãy
6
D
ãy
3
D
ãy
2
Hình 1. 5 Bố trí chức năng của LE
1.3.3 Virtex-II Clock Tiles
Virtex-II FPGAs chứa hai tile đệm clock toàn cục riêng biệt: CLKT và CLK. CLKT
được đặt ở hàng trên của FPGA, xem hình 1.3, và chứa tám bộ đệm nhân clock toàn
cục; tile CLKB được đặt ở giữa của hàng bên dưới. Tile clock được đặt ở giữa của cả
hàng trên và hàng dưới, tạo cho thiết bị có sự phân bố clock low-skew đều. Trong mỗi
8
--------------------------------------------------------------------------------------------------------
góc phần tư, chỉ có tám trong tổng số các clock toàn cục được sử dụng (trên cùng bên
trái, trên cùng bên phải, dưới cùng bên trái và dưới cùng bên phải) trong thiết bị. Các
clock toàn cục có thể được sử dụng kết hợp với DCMs hoặc điều khiển trực tiếp từ bộ
đệm đầu vào clock [8].
Mỗi bộ đệm nhân clock toàn cục có thể đặt cấu hình là BUFG (bộ đệm tổng), một
BUFGCE (global buffer with clock enable - bộ đệm tổng có clock), hoặc là
BUFGMUX (bộ nhân lựa chọn clock) như minh hoạ trong Hình 1.6. Cấu hình đơn
giản và phổ biến nhất dành cho clock toàn cục là bộ đệm đơn giản (BUFG). Có thể lập
một clock cổng sử dụng cấu hình BUFGCE. Chế độ BUFMUX cho phép chuyển giữa
hai clock không đồng bộ riêng biệt hoặc đồng bộ và bảo đảm thời gian cao hoặc thấp
khi clock chuyển không bao giờ ngắn hơn thời gian cao hoặc thấp ngắn nhất [8].
I
Hình 1. 6 Cấu hình bộ đệm clock toàn cục
1.3.4. VirtexII Pro
Giải pháp Platform FPGA VirtexII Pro được cho là một kỹ thuật silicon phức tạp
nhất và sản phẩm phần mềm trong công nghệ logic có thể lập trình lại được. Mục đích
trong phát triển Virtex-II pro FPGA đưa ra một kiến trúc vượt trội, và được xây dựng
lại từ đầu. Để đạt được điều này, các kỹ sư mạch và kiến trúc sư hệ thống từ IBM,
MindSpeed và Xilinx cùng phát triển những tính năng tiên tiến của FPGA. Các đội kỹ
sư từ các công ty phần mềm nhúng hàng đầu trên thế giới đã hợp tác để thiết kế.
Các tính năng họ Virtex-II Pro
Có 5 họ chính với các ô logic 3168 tới 50832 và 216 tới 3888 Kb trên một
Khối RAM.
Dựa trên kiến trúc nhúng IP Virtex-II.
Khối thu phát nối tiếp tốc độ cao lên tới hàng Gigabit, tới hơn 16 thiết bị.
Bộ xử lý nhúng, lên tới 4 thiết bị.
Điểm nổi bật nhất của họ Virtex-II Pro
Họ Virtex-II Pro bao gồm năm thành viên, bốn thành viên là 16RocketIOTM trên
công nghệ Mindspeed SkyRailTM. Mạch này bao gồm bộ mã hóa và giải mã theo
chuẩn 8B/10B cho băng tần cao hơn sử dụng đa kênh, và hỗ trợ tăng toàn bộ tính toàn
vẹn tín hiệu thông qua sự biến đổi PCB. Thêm vào đó, RocketIO là khối thu phát
FPGA nhúng đầu tiên để đạt được tốc độ báo lên tới 3.125 Gb/s. Bốn khối RocketIO
cho phép PCB hỗ trợ song công tốc độ dữ liệu 10 Gbps. Công nghệ RocketIO cho
phép băng tần hệ thống cao hơn và giảm tối đa chi phí theo thời gian đưa ra thị trường,
giảm kích thước mạch và số thiết bị [8].
9
--------------------------------------------------------------------------------------------------------
Các thành viên Virtex-II Pro cùng thiết kế tạo ra một vi xử lý chính PowerPC có
tính năng mạnh. Mỗi chúng có dung lượng lớn hơn 300Mhz về tần số clock. PowerPC
405 hoàn toàn nhúng trong khung FPGA, tại tất cả các node xử lý được kết nối bởi tài
nguyên định tuyến FPGA. Nó cung cấp công suất kiến trúc tối đa, tại đó các ứng dụng
phức tạp có thể dễ dàng phân nhỏ với tốc độ cao theo logic và mềm dẻo khi thực thi
phần mềm [8].
Sản phẩm Virtex-II Pro xây dựng trên kiến trúc Virtex-II với công nghệ nhúng IP.
Các tính năng chung trên hệ Virtex-II với họ Virtex-II Pro – bao gồm SystemIOTM,
XCITETM, bao hàm các giải pháp đánh xung đồng hồ, kiến trúc liên kết động tốc độ
cao, mã hóa dòng bits [8].
1.4. VTsim
Bộ công cụ vi mạch mảng phần tử logic khả trình hiện đại (FPGA) được dùng để
kiểm soát sự phức tạp của các thiết kế lớn bằng cách sử dụng môi trường thiết kế tích
hợp đơn. Nhiều bộ công cụ bao gồm các bộ mô phỏng dáng điệu, thường dựa trên một
mô hình kiến trúc độc lập, cho phép người dùng thay đổi chức năng của thiết kế. Bộ
công cụ tiêu biểu: Xilinx ISE với với bộ mô phỏng tuỳ chọn ModelSim và Altium’s
Nexar2004. Các dòng này dựa trên quan điểm cho rằng một thiết kế được xác nhận
chức năng sẽ làm việc với phần cứng đúng theo theo chủ định và dự kiến của người
dùng.
Nếu chức năng của thiết kế không hoạt động đúng trong phần cứng, có thể sẽ gây ra
một số vấn đề: FPGA bị lỗi, các công cụ thực thi có thể tính toán (inferred), đặt
(placed), và định tuyến logic sai khác so với chủ định, hoặc không phát hiện được lỗi
trong khâu kiểm tra.
VTsim cung cấp cho các kỹ sư thiết kế Virtex-II FPGA một hệ biến hoá (paradigm):
Mô phỏng luồng bits. Đầu vào cần thiết duy nhất của VTsim để hoạt động là dòng bits
hợp lệ, cho phép bộ mô phỏng hoạt động độc lập trong quá trình thiết kế. VTsim là
một bộ mô phỏng theo biến cố, cho đáp ứng tức thời, sử dụng bộ nhớ hiệu quả và hỗ
trợ miền clock bội. Vào khoảng thời gian thực hiện đồ án này, bộ mô phỏng bao phủ
xấp xỉ 90% thiết bị và mô hình hoá phần lớn logic thường dùng trong các mạch FPGA.
Bằng cách sử dụng một số kỹ thuật tối ưu, VTsim tăng hiệu năng hoạt động lên tới
9,000% . Cấu trúc API linh hoạt đã được phát triển để bảo đảm sự tương tác thuận lợi
và cho phép kết hợp các phần bổ sung trong tương lai.
VTsim được tích hợp vào trong bộ thiết kế JHDLBits, có sẵn trong
SourceForge.net, cho phép mô phỏng trong cả dòng JHDL và JBits, hoặc sử dụng như
một công cụ mô phỏng độc lập. Bằng cách sử dụng VTsim, một kỹ sư thiết kế có thể
truy cập và chỉnh sửa tất cả các giá trị nguồn trong FPGA ảo tại thời điểm bất kỳ, xem
tình trạng của các flip-flop và tra bảng, kiểm tra hoặc thay đổi giá trị trên dây định
tuyến. Để thực hiện các chức năng này, VTsim sử dụng hai công cụ bổ sung: JBits và
ADB. JBits là một API, chophép truy cập vào nguồn tài nguyên cấu hình trong một
Xilinx FPGA và được VTsim sử dụng cho thông tin cấu hình dòng bits và xử lý bit
dòng bits (bitstream bit-manipulation). ADB (Alternate wire DataBase – cơ sở dữ liệu
dây thay thế) là một công cụ hỗ trợ các dịch vụ định tuyến (routing) và tạo vết
(tracing), bao phủ hoàn toàn thiết bị, sử dụng bộ nhớ hiệu quả, và hỗ trợ Virtex,
Virtex-E, Virtex-II, and Virtex-II Pro FPGAs. Thông tin từ ADB được sử dụng để đặt
10
--------------------------------------------------------------------------------------------------------
cấu hình cho các kết nối của thiết bị ảo.
Bộ mô phỏng thiết bị được dùng trong thiết kế cho phép đặt cấu hình lại. Khi đó,
các khối logic được chèn và gỡ theo trạng thái đã biết của hệ thống. Trong các thiết kế
thực hiện cấu hình lại từng phần, việc bố trí các khối logic cho trước thường được giữ
nguyên/fixed. Phần lớn các bộ mô phỏng hiện nay không hỗ trợ đầy đủ cho các thiết
kế cho phép đặt cấu hình lại. Do VTsim hoạt động ở mức dòng bits thấp nên có thể mô
phỏng cả quá trình đặt cấu hình lại từng phần hoặc toàn bộ.
Với việc bao hàm FPGA trong các ứng dụng không gian mission-critical (tạm dịch:
nhiệm vụ tới hạn), như là FPGAs trong Phòng thí nghiệm phản lực (NASA/Jet
Propulsion Laboratory (JPL)) cho nhiệm vụ thám hiểm sao Hoả (Mars exploration
mission), việc phân tích và mô phỏng Single Event Upsets (SEUs) là một chủ đề quan
trọng, thu hút được rất nhiều sự chú ý. Để mô phỏng và phân tích kết quả của SEU,
một bộ mô phỏng cần phải có tri thức toàn diện và điều khiển các thông tin cấu hình
của tất cả FPGA. Phần lớn các bộ mô phỏng chính không dựa vào thông tin cấu hình
cấp thấp sử dụng bên trong FPGA vật lý, và không có khả năng thay đổi thông tin cấu
hình, các bộ mô phỏng này gần như không có khả năng mô phỏng SEUs trong cấu
hình FPGA. Đây là một vấn đề tạo cho VTsim một vị thế nổi bật hơn. Do VTsim cho
phép truy cập các tài nguyên cấu hình trong FPGA, nên có thể phân tích và mô phỏng
SEU một cách dễ dàng [4].
1.5. Các công trình liên quan tới VTsim: JHDL, JBits, JHDLBits
và ADB
Phần này trình bày về các công cụ thiết kế liên quan tới VTsim. Một số công cụ cần
sử dụng VTsim thực tế, một số được hỗ trợ hoặc hỗ trợ cho VTsim. Như đã đã đề cập,
VTsim là bộ phận của đề án mã nguồn mở JHDLBits, được xúc tiến nhằm hỗ trợ điều
khiển thao tác, đặt và định tuyến tài nguyên. JHDLBits là một công cụ dùng để chuyển
các thiết kế JHDL cấp cao thành các dòng bits sử dụng JBits cho tương tác dòng bits
và sử dụng ADB định tuyến. Cấu tạo của JHDLBits và mối quan hệ dự án JHDLBits
được mô trả trong hình 1.7.
VTsim dựa trên JBits để xử lý tất cả các thao tác dòng bits. Cần có kiến thức sơ bộ
về JBits để hiểu cách xử lý cấu hình và thao tác dòng bits. VTsim cung cấp thông tin
về định tuyến và thiết bị tuỳ thuộc vào ADB giống như một sơ đồ tile thiết bị và các vị
trí CLB. Thông tin định tuyến cấp bởi ADB được sử dụng để tạo ra một danh sách
mạng của các các kết nối bên trong. Ba phần dưới dây sẽ phác hoạ về JHDL, JBits và
ADB, và JHDLBits [4].
JHDL
JBits
ADB JHDLBits
Hình 1. 7 Cấu tạo của JHDL
11
--------------------------------------------------------------------------------------------------------
1.5.1 JHDL
Các nhà nghiên cứu tại Đại học Brigham Young đã phát triển một bộ thiết kế FPGA
ngôn ngữ mô tả cấu trúc phần cứng trên nền Java (JHDL). Do tính chất dễ sử dụng,
hướng đối tượng, có khả năng văn bản hoá đựng sẵn, tiện dụng và có tập Giao diện đồ
hoạ người dùng (GUI) API đa dạng, tích hợp vào ngôn ngữ nên Java đã được lựa chọn.
JHDL chứa API đơn, cho phép nhà thiết kế tạo ra cả thiết kế mạch cố định hoặc linh
hoạt.
Bộ mô phỏng JHDL có khả năng chạy trong cả chế độ phần cứng và mô phỏng.
Trong chế độ mô phỏng, mọi giá trị của mạch được tính toán sơ bộ. Trong chế độ phần
cứng, bộ mô phỏng lấy các giá trị phần tử nhớ từ một FPGA kích hoạt, như là flip flop,
từ phần cứng vật lý và lan truyền giá trị qua tất cả các phần tử không nhớ, như là các
cổng và bộ cộng. Tuy nhiên, bộ mô phỏng này không phải là một mô hình hoàn chỉnh
của phần cứng do các giá trị phần tử không nhớ vẫn được mô phỏng sơ bộ. Thông qua
việc sử dụng JHDLBits, VTsim đã được tích hợp vào trong JHDL để đóng vai trò như
một bộ mô phỏng tại chỗ của phần cứng thực/actual hardware. Điều này cho phép nhà
thiết kế mô phỏng phần cứng bằng cách sử dụng các bộ mô phỏng thiết bị [4].
1.5.2 Cơ bản về JBits và ADB
JBits là một API trên nền Java trợ giúp cho việc truy cập nguồn cấu hình bất kỳ
trong họ Virtex FPGAs. Nguồn thiết bị có thể lập trình và thử khi chạy ngay cả khi
FPGA đã kích hoạt trong hệ thống đang làm việc. JBits3 SDK hỗ trợ cho Virtex-II
FPGAs, không giống như phiên bản Virtex-based JBits2.8. JBits cho phép người dùng
thao tác với nguồn FPGA bằng hai phương pháp: getTileBits và setTileBits.
getTileBits lấy toạ độ tile, và tên nguồn và cho các bit cấu hình kết hợp. setTileBits thì
ngược lại. Trong phương pháp setTileBits, JBits cập nhật các bit cấu hình từ các tile
phối hợp, tên nguồn và các bits cấu hình mới do người dùng định nghĩa.
JBits3 là một API hoàn chỉnh để kiểm tra và chỉnh sửa cấu hình thiết bị, nhưng nó
không bao gồm một bộ mô phỏng thiết bị hay bộ định tuyến. Phiên bản JBits2.8 trước
đó bao gồm một bộ mô phỏng thiết bị, VirtexDS và một bộ định tuyến, JRoute - một
bộ định tuyến đặt cấu hình chạy thực. Việc thiếu một bộ mô phỏng thiết bị trong
JBits3 gây ra trở ngại đối với việc xác nhận thiết kế và sự phát triển của các hệ thống
tái cấu hình chạy thực.
Mặc dù JBits3 không có bộ định tuyến, nhưng một giao diện định tuyến đi kèm sẽ
giúp cho người dùng bổ sung thêm bộ định tuyến riêng. Một ví dụ về bộ định tuyến
plug-in là Alternate Wire Database - ADB. Hỗ trợ Virtex, Virtex-E, Virtex-II, và
Virtex-II Pro FPGAs. ADB không thực hiện định tuyến điều khiển theo thời gian;
nhưng sự đơn giản hoá này cho phép ADB định tuyến các mạng một cách nhanh
chóng. Không giống như JRoute trong JBits2.8, ADB bao phủ thiết bị hoàn toàn và
thực sự tiết kiệm bộ nhớ [4].
1.5.3 JHDLBits
JHDLBits là một đề án mã nguồn mở nhằm mục tiêu kết hợp điều khiển JBits cấp
thấp và thiết kế của JHDL. Đề án JHDLBits bao gồm một tập các thành phần tích hợp
chặt chẽ. Thông qua việc sử dụng ADB và JBits3, JHDLBits đã rút ngắn quá trình từ
file thiết kế đến dòng bits. Hình 1.8 minh hoạ dòng thiết kế JHDLBits.
12
--------------------------------------------------------------------------------------------------------
Thiết kế
JHDL
Bộ trích
Jbits
-trích thông tin
hình gốc
Bộ sắp đặt
(Placer)
Nets
Dimensions
Instances
Placement
Directives
Luồng Bit
(Bitstream)
ADB
Jbits
TechMapper
JBits
JHDLBits
Bộ định tuyến
ADB
Builder
-create Jbits
ULPrimitives
Hình 1. 8 Dòng thiết kế JHDLBits
Bước đầu tiên trong dòng thiết kế JHDLBits là tạo ra một thiết kế công tác trong
JHDL. Bước tiếp theo là tạo ra một file test cấp cao nhất đóng vai trò như một giao
diện cho JHDLBits. Trong khi chạy file test, JHDLBits lấy ra tất cả các thông tin ban
đầu và nets từ thiết kế JHDL rồi chuyển các nets, hình gốc vào trong JBits Nets và
hình gốc. Sau khi chuyển nets và gốc, JHDLBits tạo ra các dòng bits đầu ra và có thể
thoát hoặc tạo đối tượng/tạo nấc VTsim cho các test thiết kế sau này.
Bộ mô phỏng JHDL cho phép người dùng mô phỏng hành vi các thiết kế trong phần
mềm hoặc từ các phần tử nhớ trong phần cứng, mô phỏng hành vi các phần tử còn lại.
JHDLBits hợp với VTsim vào dòng thiết kế bằng cách mở rộng bộ mô phỏng JHDL
để thêm mô hình mô phỏng bổ sung. Trong mô hình này, bộ mô phỏng JDHL tương
tác với bộ mô phỏng thiết bị thay vì phần cứng vật lý, cho phép người dùng đạt được
các chức năng của phần cứng mà không cần đến phần cứng FPGA. Sử dụng VTsim
trong bộ mô phỏng JHDL gặp phải các vấn đề về phần cứng riêng: Các phần tử không
nhớ vẫn mặc định được tính. Nếu kết quả mô phỏng khác với dự kiến, nhà thiết kế
không thể dò ra giá trị bên trong của FPGA thực ngoài các phần tử nhớ khác. Đây là
một vấn đề thể hiện sự vượt trội về tính năng của VTsim. Các phiên bản JHDLBits
trong tương lai sẽ cung cấp mô hình mô phỏng mới cho phép các nhà thiết kế lựa chọn
VTsim là bộ mô phỏng thay cho bộ mô phỏng JHDL chuẩn. Lựa chọn VTsim giúp cho
việc kiểm tra và thác tác tất cả các tài nguyên bên trong theo khung hoạt động JHDL
chuẩn [4].
1.6. Những cải tiến JHDLBits và JBits
Mặc dù JBits3 là một API đầy đủ chức năng, nhưng nó có thể thân thiện hơn với
người dùng nếu có năm thành phần quan trọng như sau: Một bộ mô phỏng thiết bị, một
thư viện gốc, một cấu trúc liên kết mạch, một bộ đặt và một bộ định tuyến. Việc loại
bỏ một bộ mô phỏng thiết bị gây trở ngại lớn đến sự phát triển thiết kế và xác nhận các
thiết kế FPGA sử dụng JBits, đặc biệt là các thiết kế RTR. Thiếu một thư viện gốc sẽ
giảm kết cấu mạch xuống mức thấp, tạo ra khó khăn trong việc mô phỏng mạch bất kỳ
có nhiều cổng. Thiếu kết cấu kết nối sẽ loại bỏ công cụ đơn giản của nhà thiết kế để
nối các mạch logic, và mở rộng trên các mô-đun đã được tạo ra. Không có bộ đặt và
bộ định tuyến, người dùng không thể lập sơ đồ cho thiết kế của họ theo dạng mạch
logic FPGA. Việc test và xác nhận thiết kế JBits sẽ gặp khó khăn nếu không có các bộ
13
--------------------------------------------------------------------------------------------------------
mô phỏng thiết kế, thư viện gốc, kết cấu kết nối mạch, bộ đặt và bộ định tuyến.
Bước phát triển đầu tiên trong dự án JHDLBits là tạo ra thư viện gốc. Đây là tập
hợp của các khối xây dựng thường được nhà thiết kế sử dụng. Các ví dụ về gốc là
NAND, NOR và cổng logic đơn giản, flip flop bất kỳ với một enable (cho phép)
(FDE), các flip flop với xoá và cho phép (clear and an enable) (FDCE), bộ cộng nhanh
và các phần tử khác. Cấu trúc của thư viện gốc rất cần thiết để phát triển JHDLBits.
Để đơn giản hoá việc chuyển đổi JHDLBits từ JHDL thành JBits, mỗi JBits gốc được
thiết kế để phù hợp với gốc JHDL. Khi tìm được gốc JHDL trong quá trình phân tích
JHDLBits, JHDLBits ánh xạ (map) gốc trực tiếp sang gốc JBits, một cách đơn giản
hoá nâng cao tốc độ chuyển một cách mạnh mẽ và tiết kiệm bộ nhớ.
Ngoài đề án JHDLBits, cần thiết phải có thư viện gốc cho các nhà thiết kế Jbits.
Nhìn chung, người dùng JBits thường thiết kế ở mức gốc hoặc cao hơn. Việc loại bỏ
thư viện gốc đã giảm sự quan tâm của người dùng đối với phiên bản JBits mới nhất.
Không có thư viện gốc, việc thiết kế sẽ trở nên phức tạp hơn. VTsim đóng vai trò quan
trọng trong quá trình xác nhận gốc qua việc cung cấp các phản hồi nhanh chóng về các
gốc thiết kế mới mà không có nguy cơ hư hỏng các phần cứng đắt tiền.
Về vấn đề phát triển, kết nối, test gốc, cần phải phát triển hạ tầng liên kết, bổ sung
một số đặc tính hiện còn thiếu trong JBits3. Trong đó có lớp luồng bits, một đối tượng
bắc cầu cho phép các truy cập tắt đối với cả các đối tượng JBits và bộ định tuyến và
bổ trợ cho việc tạo gốc mà không phụ thuộc vào các lớp cấu trúc riêng. Bên cạnh đó,
có một lớp mạng để cho phép nối các gốc bằng cách duy trì một danh sách các nguồn
và các chân cắm chìm tạo nên mỗi mạng. Thông tin lớp mạng và dòng bits có thể đi
qua bộ đặt và bộ định tuyến.
Sau khi phát triển thư viện gốc và cấu trúc liên kết JHDLBits, cần phải thiết kế một
bộ đặt giao diện với JBits. Hiện nay JHDLBits có một bộ đặt đơn giản, đánh giá kích
cỡ của mỗi gốc và sắp xếp gốc vào các vị trí xác địn trong FPGA. Trong mô hình bộ
đặt đơn giản, mỗi thành phần được đặt liền sau thành phần trước. Hiện nay, đang phát
triển một bộ đặt phức tạp hơn, thông minh hơn, cấu trúc theo bậc. Mặc dù đơn giản
nhưng bộ đặt là lựa chọn phù hợp cho các thiết kế không phụ thuộc nhiều vào nguồn
định thời hoặc định tuyến. Trong giai đoạn test JHDLBits, một thiết kế định tuyến
khá phức tạp đã thất bại do sắp xếp không tốt, tuy nhiên, các thiết kế này đã tận dụng
được gần 100% tài nguyên của FPGA.
JBits3 không có bộ định tuyến nhưng phiên bản này có giao diện bộ định được
thiết kế, cho phép người dùng tạo và plug-in bộ định tuyến riêng. Một bộ định tuyến
được thiết kế để hoạt động với JBits3 là ADB. ADB hỗ trợ Xilinx Virtex, Virtex-E,
Virtex-II, và Virtex-II Pro FPGAs. Không giống như JRoute, phiên bản trước của nó,
ADB bao phủ toàn bộ thiết bị và có kích cỡ gọn nhẹ hơn so với các dòng định tuyến
khác. Một hạn chế của ADB là nó không tạo ra các tuyến dựa trên thông tin định thời;
tuy nhiên sự đơn giản hoá này của ADB cho phép định tuyến rất nhanh. ADB tích
hợp trong bộ thiết kế mã nguồn mở JHDLBits.
Để bảo vệ FPGAs vật lý, VTsim được mở rộng sử dụng để xác nhận chức năng của
các dòng bits phát JHDLBits. Ví dụ, một vi mạch được mô phỏng trong JHDL trải
qua quá trình trích JHDLBits để tạo ra một dòng bits. Thiết kế tương tự JHDL cũng
được chạy qua các công cụ chủ yếu để tạo ra một dòng bits thứ hai. Mỗi dòng bits
được nạp riêng rẽ vào VTsim và phân tích kỹ lưỡng như trong Hình 1.9. Nếu chức
14
--------------------------------------------------------------------------------------------------------
năng của hai dòng bits không khớp nhau, cần phải chỉnh sửa gốc JBits. Khi chức năng
của cả hai đã khớp nhau, gốc Jbits đã sẵn sàng để test trên phần cứng vật lý. Do đó,
VTsim được phát triển cùng với gốc JBits và các cải tiến để xác nhận cả các gốc mới
phát triển và bộ mô phỏng thiết bị.
Thiết kế
JHDL
Các công cụ
Xilinx ISE
JHDLBits VTsim
VTsim
So sánh
kết quả
Hình 1. 9 Quá trình xác nhận dòng bits
Với việc thiết kế các thành phần quan trọng này, có thể tạo ra các dòng bits JBits
mẫu bằng cách sử dụng các cải tiến trong mô hình cây JHDLBits. Tuy nhiên, không
thể xác nhận chức năng của các quá trình còn lại nếu không có bộ mô phỏng dòng
bits. Bước logic tiếp theo trong dự án JHDLBits là tạo ra một bộ mô phỏng thiết bị
[4].
1.7 Ứng dụng FPGA trong tính toán ô
1.7.1 Thiết kế mức cao tổng quát
Phần này mô tả các công việc được thực thi bởi FPGA. Chỉ có các phần thiết kế
FPGA nói chung của từng kiến trúc được trình bày trong phần này.
Các bước thực hiện bởi FPGA trong suốt một chu kì tính toán hoàn thành được chỉ
trong hình 2.1. Ngay sau khi nguồn được bật lên, dữ liệu cấu hình từ bộ nhớ flash
Logic Module (LM) được chuyển đến FPGA. Tại cùng thời điểm đó, Core Module
(CM) khởi tạo Integrator/AP motherboard và sau đó chờ đợi các tham số đầu vào để
gửi từ host PC. Sau khi CM nhận các tham số này, nó gửi chúng lên Bus hiệu năng cao
tăng cường của bo mạch chính (AHB-Advanced High-performance Bus) đến LM. Tại
thời điểm này, ghi lên không gian địa chỉ LM được chuyển tiếp đến LM SSRAM bởi
FPGA. Trước khi, FPGA bắt đầu tính toán, nó đang chờ các tham số đầu vào đến đầu
vào của LM SSRAM theo trật tự sau: iteration, result cell và đến lượt các tham số đầu
vào. Iteration là một số các vòng lặp để tính toán, mà là từng bước cho trường hợp
kiểm tra luồng nóng (heat flow). Nếu FPGA được cấu hình với N ô tính toán, sau đó
result cell là một số giữa 1 và N và dữ liệu của ô đó sẽ được lưu trữ trong SSRAM.
Cho vấn đề luồng nóng (heat flow), dữ liệu ô lưu trữ là một ma trận nhiệt độ tại từng
bước. Các tham số đầu vào chính là rõ ràng, cho vấn đề luồng nóng, chúng là nhiệt độ
áp dụng cho ô 1, nhiệt độ cho ô N, và tham số xử lý Γ. Bởi vì lược đồ số lượng được
sử dụng trong thiết kế này, các tham số đầu vào đó phải là các số nguyên với các mức
điểm cố định, Sau khi CM gửi đi các tham số đó, nó sẽ gửi đến FPGA một tín hiệu
start chỉ ra rằng tính toán đã sẵn sàng để xử lý. Sau khi FPGA nhận tín hiệu này, nó
lấy điều khiển của LM SSRAM và đọc các tham số đầu vào mô tả ở trên. Với các tham
số đầu vào, thì hàng các ô tính toán được chỉ thị bắt đầu tính toán, và khi một vòng lặp
được hoàn thành, kết quả ở trong result cell được ghi lên SSRAM ngay tức thì sau khi
các tham số đầu vào ở ngay đầu không gian bộ nhớ. Các kết quả vòng lặp tiếp tục
15
--------------------------------------------------------------------------------------------------------
được ghi lên SSRAM cho đến khi các kết quả iteration đã được lưu trữ. Tại điểm này,
FPGA giải phóng điều khiển của SSRAM và cho phép CM đọc các kết quả đã tính
toán thông qua bus AHB. Các giá trị ban đầu được thiết lập lại, và FPGA đã sẵn sàng
bắt đầu một chu kỳ tính toán mới. Nếu chu kì tính toán 1 giây nào đó bắt đầu, FPGA
viết đè các kết quả lưu trữ từ chu kỳ đầu tiên.
Bật nguồn
Lặp thu
Kết quả thu ô
Tham số thu còn lại
Đợi tín hiệu
bắt đầu
Lặp tìm nạp
Tìm kết quả ô
Tìm tham số còn lại
Thu từ CM và
chuyển tiếp tới LM
SSRAM
Lấy từ LM
SSRAM
Hàng ô bắt đầu
tính toán
Đợi quá trình lặp
hoàn thành
Chờ kết quả tới LM
SSRAM
Lặp lại? No Yes Thiết lập
tín hiệu
SSRAM đọc
yêu cầu của
CM
Hình 1. 10 Thuật toán thực thi FPGA
VHDL thực thi thủ tục mô tả ở trên được thiết lập có thể mở rộng bất kỳ vấn đề
song song ô mà tường tự nhu trường hợp kiểm tra luồng nóng. Có thể có một số các
tham số đầu vào theo sau iteration và result cell, và một số các ô bị hạn chế không
gian cho phép của FPGA. Thay đổi các tham số đầu vào hay số các ô yêu cầu tổng hợp
lại của thiết kế và cấu hình lại của FPGA, nhưng một số các vòng lặp tính toán bị hạn
chế bởi kích thước của bộ nhớ SSRAM.
Hình 1.11 chỉ ra cấu trúc của thiết kế FPGA mức cao mà thực thi thủ tục chỉ ra
trong hình 2.1
16
--------------------------------------------------------------------------------------------------------
Mạch điều khiển hàng ô
Mạch điều khiển ô
Mạch điều
khiển SSRAM
Bên trong FPGA
Duy nhất cho
mỗi kiến trúc
1 N
Hình 1. 11 Cấu trúc FPGA mức cao
Bộ điều khiển hàng của ô là một thiết bị trạng thái hạn chế FSM ( Finite State
Machine) mà chờ đợi tín hiệu start, đọc các tham số đầu vào SSRAM, bắt đầu tính
toán hàng và gửi các kết quả đến SSRAM, và kiểm tra số các vòng lặp mà được hoàn
thành. Một bộ điều khiển ô đơn FSM điều khiển tất cả các ô trong hàng và được phân
biệt nhau cho mỗi loại kiến trúc. Bộ điều khiển SSRAM cung cấp các tín hiệu điều
khiển chip và dễ dàng định thời đọc và viết. Các tuyến dữ liệu và điều khiển từ bus
AHB và bộ điều khiển hàng được ghép vào nhau lên SSRAM, dữ liệu từ bộ điều khiển
hàng và SSRAM được ghép với nhau đưa lên bus AHB. Tất cả các địa chỉ trong địa
chỉ LM là có tính logic mà giải mã các địa chỉ từ bus AHB. Tất cả các địa chỉ trong
không gian địa chỉ LM ngoại trừ một sẽ được đánh địa chỉ trong SSRAM. Một phép
ghi từ CM đến địa chỉ đơn 0x0DDC0DE ở trong không gian địa chỉ của LM sẽ ghi tín
hiệu start của FPGA, và một phép đọc của cùng địa chỉ đó sẽ đọc tín hiệu done của bộ
điều khiển hàng (row controller) (tín hiện này chỉ ra rằng khi nào CM có thể bắt đầu
đọc kết quả tính toán từ SSRAM. Phần không trình bày trong hình là khối logic điều
khiển xung khả lập trình của FPGA và đèn LED chỉ thị của LM.
Các ô tính toán trong FPGA chạy trong từng xung đồng hồ riêng biệt từ xung đồng
hồ bus AHB để mà chúng không bị ràng buộc vào tần số bus. Như vậy, dữ liệu được
chuyển tải giữa hai vùng có xung đồng hồ không đồng bộ, tuy nhiên, bắt tay được thực
hiện để đảm bảo chuyển dữ liệu một cách phù hợp. Bắt tay được thiết lập cho phép kết
hợp các tần số đồng hồ ô và bus kết hợp với nhau.
Nhìn một cách chi tiết của cấu trúc hàng ô được chỉ ra ở hình 2.3. Giải quyết phức
tạp ở trong công thức iji jmi jmi jmi jm cTTbaTT 1 1,1 1,,, chỉ thị cấu trúc này, và nó yêu
17
--------------------------------------------------------------------------------------------------------
cầu mà mỗi ô kết nối đến các hàng xóm bên trái hay bên phải của nó và nó cho phép
truy cập đến các dữ liệu đã được tính trong vòng lặp trước. Mỗi ô tính toán các công
thức ,11. 1111 ijijijijij Kta 1.1,, .1 i jmi jpi jp TttTT ,
37.2,0
37.2,37.299,25
1
,
1
,
21
,
,2,1 i
jm
i
jm
i
jm
approx
T
TT
K và lưu trữ vào ma trận và các nhiệt độ
nhỏ cho từng bước đơn. Nói chung, các giá trị lưu trữ trình bày nhiệt độ phân tán qua
các phần của vật liệu của các ô. Tất cả các ô được cập nhật song song nhau, và tốc độ
tính toán không phụ thuộc vào số các ô, N. Kết quả được lấy từ các ô tính toán nhỏ có
thể bằng cách đưa hầu hết các điều khiển ra bên ngoài ô mặc dù là có một bộ điều
khiển tập trung trái ngược. Các ô này được tái tạo cho đến khi toàn vùng FPGA được
sử dụng [4].
Đặt nhiệt
độ phải
Đặt nhiệt
độ trái
1 2 N-1 N
Hình 1. 12 Cấu trúc hàng ô
1.7.2. MULTIPLE
Phần này thảo luận về bộ điều khiển ô và tính toán cấu trúc ô của kiến trúc
MULTIPLE.
Kiến trúc có tên là MULTIPLE vì mỗi ô tính toán xảy ra nhiều bộ cộng và bộ
nhân: một trong số mỗi bộ cộng và nhân xảy ra trong các công thức dưới đây được
tính toán. Các phép tính được hoàn thành bằng kết hợp các phép tính logic, vì vậy các
giá trị mới được khởi tạo trong mỗi xung đồng hồ. Tuy nhiên, do bắt tay cần để viết
các kết quả đến SSRAM, mỗi vòng lặp làm trong hai xung đồng hồ. Do vậy, bộ điều
khiển ô là vô cùng đơn giản FSM mà kết nối hai trạng thái. Trong từng trạng thái, giá
trị được tính, và trong suốt trạng thái khác, giá trị được lưu trữ trong bộ nhớ. Kiến trúc
MULTIPLE chiếm lấy một số không gian chip lớn vì vậy nó không hữu ích so với các
kiến trúc khác.
VHDL hỗ trợ các phép toán số học chuẩn, vì vậy các phép toán cần thiết cho tính
hoán có thể được viết trực tiếp trong phần cứng. Tuy nhiên, thật sự thoải mái để đặt
các phép toán trong dạng các số các phép nhân vì nhiều phần cứng chiếm tốn nhiều
vùng hơn phép cộng. Do vậy, luồng nóng tính toán cho kiến trúc MLTIPLE được thực
thi chỉ ra ở hình 2.4. Các biến tạm vàtt 21, được dùng để đảm bảo rằng phần mềm
tổng hợp làm các phép toán logic không cần thiết. Để kiểm tra, kiến trúc MULTIPLE
thực thi theo chiều rộng so với phần cứng.
18
--------------------------------------------------------------------------------------------------------
2
1
,,
1
,
1
1,
1
1,22
1
,,
1
1
,
1
,2
1
,
11
21
1
,
1
,1
2
,)1(.
)(,0
)(
tTT
TTT
x
ttTT
TTtt
CTCttt
CT
CTt
i
jp
i
jp
i
jm
i
jm
i
jm
i
jm
i
jm
i
j
i
j
i
jm
i
jp
b
i
jm
i
j
i
ja
b
i
jm
b
i
jm
Hình 1. 13 Luồng nóng tính toán, công thức cho kiến trúc MULTIPLE
Tất cả các biến và tham số trong hình 2.4 là các số nguyên W-bit theo thang đo có
dấu phẩy cố định, vì thế các kết quả của các phép nhân phải đúng đơn vị đo như thế.
Đầu tiên, một phép nhân VHDL chuẩn được thực hiện sẽ tạo ra một kết quả là 2W-bit.
Kết quả số nguyên theo thang đo của phép nhân này nằm trong kết quả 2W bit như
trình bày trong hình 2.5 với S bit số nguyên. Đối với kiến trúc này và các kiến trúc
khác, W=25 và S=5. W được chọn theo đồ thị nhiệt độ sử dụng các tính toán theo dấu
phẩy cố định và dấu phẩy động và W tăng cho tới khi đồ thị theo thang dấu phẩy cố
định bị “khoá” chính xác.
2W 1 WW+1
W-S 2W-S
Kết quả nhân nguyên được căn chỉnh
Kết quả nhân VHDL
Hình 1. 14 Các bộ nhân nguyên được canh chỉnh
Cấu trúc ô cho kiến trúc MULTIPLE được chỉ ra ở hình 2.6. Số lượng các khối
cộng và nhân ở trong hình chỉ ra tại sao mỗi ô chiếm nhiều vùng chip. Mỗi khối nhân
thực hiện phép toán chỉ ra ở hình 2.5. Tín hiệu enable cho phép các kết quả mới để
gắn các thanh ghi và khởi tạo bởi trạng thái 2 FSM trong bộ điều khiển ô [6].
19
--------------------------------------------------------------------------------------------------------
+
2X
scaled
+
scaled
+
scaled
scaled
scaled
Y
N
0
+
+ Tm
Tp
+
+
- aCt.
scaled
-1
-Cb
Cb
2/ xt
t
scaled
α
Thanh ghi
To
neighbors
Tm,j+1
Tm,j-1
Cell
Clock Reset Enable W
W
W
Hình 1. 15 Cấu trúc ô cho kiến trúc MULTIPLE
1.7.3 SINGLE
Phần này thảo luận bộ điều khiển ô và tính toán cấu trúc ô của kiến trúc SINGLE
Kiến trúc có tên là SINGLE bởi vì mỗi một ô chia sẻ theo thời gian một bộ nhân
hoặc một bộ cộng theo một chuỗi các phép toán mà thực thi các phép toán luồng nóng.
Do vậy, nó dùng ít vùng hơn so với MULTIPLE nhưng nhiều chu kỳ xung đồng hồ
hơn, mặc dù tốc độ bit có thể cao hơn vì các tín hiệu chỉ là ở mức bộ nhân để truyền
thông thay vì đa mức như trong MULTIPLE. Mỗi chu trình hoạt động đơn bao gồm
phép nhân và phép cộng. Thời gian chia sẻ các tài nguyên số học đạt được thông qua
nhiều trạng thái FSM, để bộ điều khiển cho SINGLE phức tạp hơn bộ điều khiển của
bộ MULTIPLE [6].
Nếu một phép cộng không được làm để thực thi phép toán nào đó, thì tài nguyên
bộ cộng ở trạng thái rỗi và tiêu tốn chu kỳ xung đồng hồ. Trạng thái tương tự giữ mặc
dù phép nhân không cần thiết. Do vậy, thật sự thoải mái để phân vùng các phép toán
trong các phép toán phụ mà bao gồm cả nhân lẫn cộng, như chỉ ra ở hình 2.7. Các biến
tạm 21 tvàt là chủ yếu và cộng đến một số các bit nguyên yêu cầu bởi mỗi cell, mặc dù
thật sự không hữu ích trong vấn đề cho các flip-flop-rich của FPGA. Một vài các phép
toán đặc biệt được làm theo trật tự hiệu năng ô cao nhất. Tuyến 5 và 11 ở trong hình
2.7 làm hai phép gán đồng thời cho mục đích lưu lại xung đồng hồ. Hai số A và B có
thể trừ bởi thực phép toán như là -1xB+A=A-B, nhưng phần cứng không hỗ trợ trực
tiếp phép trừ như là AxB-C.
20
--------------------------------------------------------------------------------------------------------
11,,
1,
1
,1
1
1
,21
1221
1
1,
1
1,2
1
1
,1
11
211
1
21
11
2
1
,1
1
,
1
111
1
,1
112
,011
2110
9
18
7
06
,5
)1(4
)(,0.
)(,0
3
02
11
tTtT
tTTtt
tTt
x
tt
tt
x
tt
TTt
tTtt
tt
ttttt
t
CTtCt
CT
t
ttt
CTt
i
jp
i
jp
i
jm
i
jm
i
jm
i
jm
i
jm
i
jp
i
j
i
j
i
j
i
j
b
i
jma
b
i
jm
b
i
jm
Hình 1. 16 Các phép toán luồng nóng phân vùng cho kiến trúc SINGLE
Các cấu trúc bộ điều khiển và ô cho kiến trúc SINGLE được chỉ ra ở hình 2.8. Các
khối cộng và nhân thì giống như mà dùng bởi MULTIPLE, nhưng đó chỉ là một trong
số của kiến trúc này. Mỗi trạng thái trong 12 trạng thái FSM của bộ điều khiển ô xác
định các đầu vào được dùng cho bộ nhân và bộ cộng cũng như các thanh ghi đích mà
sẽ gắn chặt kết quả của phép toán nhân và cộng. Bộ điều khiển cũng phân tán các đầu
vào tham số cố định đến tất cả các ô. Mặc dù không được chỉ ra ở hình 2.8, mỗi ô bao
gồm một bộ so sánh giống nhau như là MULTIPLE [6].
scaled
+
Tp α Tm T1 T2
Điều khiển ô
12-State FSM
Tm,j+1 Tm,j-1
Tham số bộ nhân nguồn
Cộng tham số nguồn
Lựa chọn nguồn
nhân
Lựa chọn nguồn
cộng
Lựa chọn đích
Thanh ghi
ô
W W
W
Lân cận
Hình 1. 17 Các cấu trúc của bộ điều khiển và ô cho kiến trúc SINGLE
21
--------------------------------------------------------------------------------------------------------
1.7.4 BOOTH
Phần này thảo luận về bộ điều khiển ô và tính toán các cấu trúc ô của kiến trúc
BOOTH.
Chiếc lược giảm tải tiêu tốn thời gian có thể đạt được hơn nữa bởi loại trừ ra một
số lượng lớn khối phép nhân trong SINGLE và làm tất cả các phép toán với một bộ
cộng W bit đơn. Cách để thực hiện phép nhân với số đã được gán dùng một bộ công là
thuật toán Booth, mà là phương pháp dùng cho kiến trúc này và lý do đó nó đặt tên là
BOOTH. Dùng phương pháp này, mỗi phép toán nhân làm trong nhiều chu kỳ đồng hồ
W, nhưng các phép toán cộng có thể được làm trong một chu kỳ. Tần số đồng hồ có
thể đạt được cao hơn cho SINGLE vì các tín hiệu trong kiến trúc BOOTH đi thông qua
một bộ cộng hơn một bộ nhân theo sau bởi một bộ cộng. Như SINGLE, kiến trúc
BOOTH yêu cầu điều khiển phức tạp theo trật tự trải dài các phép toán vượt quá thời
gian theo một trật tự đúng.
Một chuỗi W bit 0121 ..... aaaa ww trình bày phần bù bởi:
2
0
1
0
1
1
1 2.2.2.
w
i
w
i
i
ii
i
i
w
w aaaaA
Nếu a-1=0. Do đó, nếu A được nhân bởi số nguyên bù B:
1
0
1 ,.2..
w
i
i
ii BaaBA
Ở đây mỗi phép cộng A, phép trừ B, hay cộng 0 để mỗi phần tổng phụ thuộc trên
nếu ai-1ai là 10, 01, hay 00/11. Thuật toán Booth dùng các sự kiện này và sự kiện mà
nhân bởi 2i có thể được dịch chuỗi bits. Thuật toán Booth và phần cứng yêu cầu được
chỉ ra ở hình 2.9 và hình 3.10. A và B là hai toán tử để nhân và C tích lũy thành phép
cộng từng phần. Phép nhân bởi 2i được làm bởi phép dịch C và A sang phải. Bộ cộng
chứa phần cứng them vào cho bộ trừ B và cho cộng ). Kết quả thông thường của bộ
nhân là một số nguyên bù hai mà tập trung trong vào các thanh ghi C và A, nhưng bởi
vì các số nguyên canh chỉnh được dùng, kết quả không coi là hợp lệ ở trong C và A tại
điểm chỉ ra ở hình 2.5.
+
B
C A ai ai-1
W
W
Bộ nhân
Cộng B, -B hoặc 0
Số nhân
Kết quả sau w chu kỳ
Hình 1. 18 Phần cứng cho thuật toán Booth
22
--------------------------------------------------------------------------------------------------------
A Bộ nhân
B Số nhân
C 0
ai-1 0
i W
C C+B C C-B
Chuỗi số học bên phải C A ai-1
i i-1
Kết quả tại C A
i=0 N Y
ai-1 ai 01 10
00/11
Hoạt động nhân
Hình 1. 19 Thuật toán Booth cho bộ nhân bù hai
Giống như kiến trúc MULTIPLE, ưu điểm để tính toán các phép toán luồng nóng
dùng ít nhất các phép toán nhân, nhưng không giống như MULTIPLE, lý do này là
không thể bởi vì kích thước nhưng bởi vì thời gian: các phép toán nhân là W lần dài
hơn phép cộng ở trong kiến trúc BOOTH. Do vậy, các phép toán luồng nóng cho kiến
trúc BOOTH là phần được chỉ ra ở hình 2.11. Tuyến 11 và 12 thực thi và làm trong hai
phép toán cộng trong hai chu kỳ xung đồng hồ hơn phép nhân, mà làm trong W xung
đồng hồ, như với SINGLE, các biến tạm 21 tvàt là chủ yếu và cộng đến thanh ghi đếm
trong mỗi ô.
2
1
,,
21,
22
1
,
1
,2
211
222
1
.22
1
,22
1
1,
1
1,2
18
17
16
15
14
13
12
11
10
tTT
ttT
ttt
TTt
ttt
x
ttt
Ttt
Ttt
TTt
i
jp
i
jp
i
jm
i
jm
i
jp
i
jm
i
jm
i
jm
i
jm
Hình 1. 20 Các phép tính luồng nóng cho kiến trúc BOOTH
Các cấu trúc bộ điều khiển và ô cho kiến trúc BOOTH được chỉ ra ở hình 2.12.
Mỗi ô dùng một bộ cộng đơn, nhưng các thanh ghi C và A cần cho thuật toán Booth
1
,11
11
1
1
211
22
11
2
11
1
,21
1
,
1
1
.,1
9
8
7
6
15
4
.3
)(,
)(,0
2
)(1
i
jm
i
j
i
j
i
j
i
j
a
b
i
jm
b
i
jm
b
i
jm
Ttt
tt
t
ttt
tt
t
Cttt
CTtt
CT
t
CTt
23
--------------------------------------------------------------------------------------------------------
tăng bộ đếm thanh ghi của ô. Thanh ghi B của thuật toán Booth là không rõ ràng
nhưng là thanh ghi ô mà vượt qua phép chọn logic đầu vào 2. Điều này yêu cầu bộ
điều khiển ở trạng thái giữ các tuyến được chọn phù hợp cho đến khi phép nhân được
hoàn thành. Mỗi một trạng thái trong bộ điều khiển ô 18 trạng thái FSM xác định cả
các đầu vào bộ cộng và thanh ghi đến mà gắn chặt vào kết quả phép toán. Bộ điều
khiển cũng phân tán một đầu vào tham số đến tất cả các ô và chọn phép toán cộng hay
là phép toán nhân. Bộ điều khiển ô có khả năng chọn phép toán trừ như A-B có thể
được thực hiện. Mặc dù không chỉ ra ở hình 2.12, mỗi ô bao gồm một khối bitwise
less-than và chỉ ra việc kiểm tra trong suốt tuyến 2 ở hình 2.11, mà phép toán nhân có
cùng số chu kỳ đồng hồ như kiểm tra less-than. Dùng kếp như thế này trong các chu
kỳ đồng hồ W tiết kiệm không gian mà giành bởi khối less-than. Bộ đếm trong bộ điều
khiển ô đếm W chu kỳ cho phép tính nhân và được thực thi thanh ghi dịch dịch đơn
gian hơn và làm tăng tốc độ. Trong phần thực thi này, các phép tính nhân làm W+2
chu kỳ yêu cầu khởi tạo, nhưng nó có thể xây dựng một thiết kế như là chúng lấy W
chu kỳ. Khởi tạo -B bằng phép toán nghịch, B được cung cấp và +1 được khởi tạo
trong phép logic, mà cộng lẫn nhau để tạo ra B phủ định [6].
Tp α Tm T1 T2
Lân cận
C A ai
+ Carry Logic
Logic
chọn
đầu vào 2
ai-1
Logic
chọn
đầu vào 1
Tín hiệu điều
khiển khác
W W
W
ô
Kết quả lựa chọn
Lựa chọn đích
Lựa chọn nguồn
Tham số đầu vào
Bộ nhân
Tm,j-1 Tm,j+1
Bộ điều khiển ô
18-State FSM
Counter i
Hình 1. 21 Cấu trúc ô và bộ điều khiển cho kiến trúc BOOTH
1.7. 5 BIT
Phần này thảo luận bộ điều khiển ô và tính toán cấu trúc ô của kiến trúc BIT.
Kiến trúc MULTIPLE là một kiến trúc yêu cầu ít không gian và tiêu tốn thời gian
lớn. Để đạt được điều này bằng cách thực hiện các phép toán một bit tại một thời điểm,
mà kiến trúc BIT được dùng, do đó mới được đặt tên là như thế. Giống như BOOTH,
kiến trúc BIT dùng thuật toán Booth để thực thi nhiều phép nhân, nhưng mỗi phép
cộng là một chuỗi bits nối tiếp. Do vậy, nhiều phép nhân làm nhiều chu kỳ W2 và phép
24
--------------------------------------------------------------------------------------------------------
cộng thực thi W chu kỳ mặc dù tần số chu kỳ có thể cao hơn so với BOOTH bởi vì các
tín hiệu của kiến trúc BIT đi tới bộ cộng 1 bit hơn bộ cộng toàn bộ. Mặc dù kiến trúc
BIT chiếm ít không gian của ô, mô tả VHDL của nó là phức tạp nhất trong bốn kiến
trúc do yêu cầu của bộ điều khiển thời gian.
Bởi vì kiến trúc BIT tương tự với BOOTH, các phép toán luồng nóng được phân
vùng gần với cái cách của kiến trúc BOOTH. Sự khác nhau giữa phần BOOTH được
chỉ ra ở hình 2.11 và phần BIT là bốn tuyến đầu tiên. Bốn phép toán đầu tiên của kiến
trúc BIT được chỉ ra ở hình 2.13. Lý do cho sự khác biệt này ở trong các tuyến này là
do sự ràng buộc quan trọng mà các phép toán nhân có thể được thực thi bởi kiến trúc
BIT. Hai toán tử của phép nhân được dịch thông qua phần cứng một bit tại một thời
điểm nhưng tốc độ khác nhau: toán tử phải quay sau mỗi chu kỳ xung đồng hồ, trong
khi toán tử trái quay với thanh ghi đích mỗi W chu kỳ đồng hồ. Do vậy, toán tử phải
không có cùng thanh ghi đích, tại sao cả hai biến 21 tvàt được gán cho tuyến 1 và tại
sao 2t được thiết lập ở tuyến 3: để các phép toán ở trong tuyến 2 và 4 có thể được thực
thi. Cũng như SINGLE và MULTIPLE, 21 tvàt là các biến tạm chủ yếu.
1
22
1
211
211
1
,
1
,
1
,
21
4
,.3
2
,
,0
,1
i
j
i
ja
b
i
jmb
i
jm
b
i
jm
tt
tCttt
ttt
CTCT
CT
tt
Hình 1. 22 Tuyến đầu tiên của kiến trúc BIT cho tính toán luồng nóng
Các cấu trúc của ô và bộ điều khiển cho kiến trúc BIT được chỉ ra ở hình 3.14. Tất
cả các thanh ghi được dịch để mà có thể được đọc và viết một bit tại một thời điểm,
nhưng chỉ có các thanh ghi C và Tm được thực thi với flip-flop. Các thanh ghi khác
được thực thi như các thanh ghi dịch LUT, nói khác chúng chiếm nhanh tất cả các flip-
flop FPGA do số lượng lớn các ô mà có thể phù hợp trên chip. Giống như BOOTH,
thanh ghi B của thuật toán Booth ngăn chặn, nhưng thanh ghi A cũng bị chặn trong
kiến trúc BIT bởi vì các bit kết quả có thể được dịch đến thanh ghi đích của chúng như
chúng được khởi tạo. Không giống như BOOTH, chọn các bit kết quả chính xác yêu
cầu điều khiển định thời phức tạp trong bộ định khiển ô. Bởi vì thanh ghi B bị chặn, bộ
điều khiển ô phải giữ các tuyến chọn đầu vào 2 thông qua phép nhân và quay tổng
cộng W2lần. Yêu cầu định thời đạt được dùng 2 bộ đế m chu kỳ W, mỗi phần thực thi
như là thanh ghi dịch đơn giản để tiết kiệm không gian và tăng tốc độ. Trong phần
thực thi này, các phép toán cộng và nhân làm W2+W và W+1 chu kỳ, do yêu cầu khởi
tạo, nhưng nó có thể xây dựng một thiết kế mà chúng lấy W2 và W chu kỳ. Mỗi trạng
thái trong các bộ điều khiển ô 19 trạng thái FSM xác định các đầu vào bộ cộng 1bit và
thanh ghi đích sẽ quay các bit kết quả như chúng được khởi tạo. Bộ điều khiển được
phân tán đầu vào tham số hằng số một bit tại một thời điểm đến tất cả các ô và chọn
phép toán để cộng hay là nhân. Bộ điều khiển ô có khả năng hoạt động phép trừ để
hoạt động như A-B có thể được thực thi. Kiến trúc BIT yêu cầu 19 trạng thái thay vì
18 trong BOOTH bởi vì kiểm tra bitwise less-than yêu cầu một phép toán riêng biệt,
mà xảy ra trước khi tuyến 1 trong hình 2.13. Các trạng thái khác yêu cầu cho việc khởi
25
--------------------------------------------------------------------------------------------------------
tạo và đồng bộ với SSRAM, nhưng một vài chúng xảy ra một khi tại điểm bắt đầu chu
kỳ tính toán [6].
Lân cận
TP Tm α t1 t2
+
Logic lựa
chọn
đầu vào 2
ai ai-1
0
Lựa chọn nguồn
Tham số đầu vào
Bộ nhân
Tín hiệu điều
khiển khác
Bộ điều khiển ô
18-State FSM
Counter i
Counter j
Lựa chọn đích
Chấp nhận xoay
Ô
Tm,j-1 Tm,j+1
Carry
Logic
Logic lựa
chọn
đầu vào 1
Chuỗi
Logic
Hình 1. 23 Cấu trúc ô và bộ điều khiển cho kiến trúc BIT
1.8. Kết luận
Trong chương đã trình bày được về tổng quan và cấu trúc căn bản của FPGA, về
các cải tiến của Jbits bổ sung cho khung hoạt động JHDLBits bao gồm một thư viện
gốc, một cấu trúc liên kết và một số lớp nối nhằm mục đích đơn giản hoác quá trình
thiết kế JHDLBits. Các cải tiến JHDLBits và JBits quá trình từ JHDL cho đến Jbits.
Trình bày các vấn đề cơ bản liên quan tới VTsim, tập trung vào các công cụ ảnh
hưởng đến VTsim và giới thiệu một số thuật ngữ mô phỏng phổ biến.
Mô tả bốn kiến trúc tính toán ô thực hiện cho việc nghiên cứu, nhưng chương cũng
trình bày phần cứng FPGA mức cao dùng cho mỗi từng kiến trúc để thuận tiện tương
tác với hệ thống. Bốn kiến trúc MULTIPLE, SINGLE, BOOTH, và BIT được phân
biệt dựa vào cái cách mà chúng tính toán giải quyết bằng các cấp độ tương đương và
bằng cách thực hiện các phép tính số học khác nhau. Phần cứng được thiết kế cụ thể
cho từng vấn đề, bởi vậy mỗi kiến trúc bao gồm các khối số học rất nhỏ yêu cầu để
tính toán vấn đề. Do đó, mỗi khối số học được dùng chỉ trong mỗi xung đồng hồ. Tính
logic yêu cầu cho tương tác hệ thống được giảm nhỏ nhất để lưu trữ nhiều vùng chíp
có thể cho tính toán ô. Ngoài trừ tính logic mà điều khiển tần số đồng hồ của FPGA,
26
--------------------------------------------------------------------------------------------------------
thì giao diện logic hệ thống giống nhau cho cả bốn kiến trúc. Theo đó chương được tổ
chức như sau:
Thiết kế mức cao tổng quát.
Kiến trúc MULTIPLE.
Kiến trúc SINGLE.
Kiến trúc BOOTH.
Kiến trúc BIT.
Chương đã mô tả bốn kiến trúc tính toán ô thực hiện cho việc nghiên cứu, cũng như
trình bày phần cứng FPGA mức cao dùng cho mỗi từng kiến trúc để thuận tiện tương
tác với hệ thống. Bốn kiến trúc MULTIPLE, SINGLE, BOOTH, và BIT được phân
biệt dựa vào cái cách mà chúng tính toán giải quyết vấn đề bằng cách dùng các cấp độ
tương đương và bằng cách thực hiện các phép tính số học khác nhau. Phần cứng được
thiết kế cụ thể cho từng vấn đề, bởi vậy mỗi kiến trúc bao gồm chỉ là các khối số học
rất nhỏ yêu cầu để tính toán vấn đề. Ngoài trừ tính logic mà điều khiển tần số đồng hồ
của FPGA, thì giao diện logic hệ thống giống nhau cho cả bốn kiến trúc.
27
--------------------------------------------------------------------------------------------------------
CHƯƠNG 2: MỘT SỐ ỨNG DỤNG CỦA FPGA
2.1. Mở đầu
Mục tiêu của chương là tìm hiểu và trình bày về một số ưu điểm nổi bật của FPGA,
tính khả thi của nó trong hệ thống 3G-UMTS. Chương được tổ chức trình bày như sau:
Ứng dụng FPGA cho trạm gốc 3G- UMTS.
Ứng dụng FPGA cho mã Turbo.
2.2. Ứng dụng FPGA cho trạm gốc 3G-UMTS
2.2.1. Tại sao lại lựa chọn FPGA
2.2.1.1 Giảm rủi ro thiết kế
Platform FPGA cho phép “phân hệ mềm” của các hệ thống, có khả năng thiết kế
phần mềm và phần cứng song song. Trong khi đó, BTS lại là một phần mềm mức cao,
gồm mã DSP và lớp logic tốc độ cao. Khi đó, chúng có thể được thiết kế song song, do
vậy tiết kiệm tối đa chi phí.
FPGA cho phép kiểm lỗi thông minh và có nhiều ứng dụng cho tương lai, do vậy
các chức năng này có thể được thêm vào trong sản phẩm nhằm ứng dụng cho phát
triển sau này. Mặt khác một BS thực sự phức tạp, và rất có thể bị thay đổi tất cả mọi
thứ kể từ phiên bản đầu tiên.
2.2.1.2. Đáp ứng yêu cầu phát triển của BTS
Hình dưới đây mô tả hệ thống phát triển của các kiến trúc của FPGA. Sự phát triển
của họ kiến trúc đáp ứng từng giai đoạn phát triển của hệ thống viễn thông. Thế hệ 1G
là hệ kiến trúc XC2000-XC3000; 2G là XC4000, Virtex; 3G là VirtexII và phân hệ
đáp ứng cho tương lai 3G+ là VirtexII Pro.
1G 2G 3G
Glue Logic
Khối chức năng
mức hệ thống
Nền tảng FPGAs
Nền tảng hệ thống
khả lập trình
DLLs
High Part.VO
Khối RAM
Bộ nhớ phân tán
IP Immersion
840 Mbps LVDS
TripleDES
XCITE
Multiplier
DCM
PowerPC
RocketIO
Đ
ộ
p
hứ
c
tạ
p
c
ủ
a
th
iế
t
b
ị
XC 2000-XC 3000 XC 4000, Virtex Virtex-II Virtex-II Pro
1985 1992 2000 2002 2004
Hình 2. 1 Sự phức tạp của thiết bị và quá trình phát triển của FPGA
28
--------------------------------------------------------------------------------------------------------
2.2.2. Hạn chế của DSP ban đầu
2.2.2.1 Thiết bị DSP ban đầu
Kiến trúc DSP ban đầu được thiết kế trên công nghệ Von Neumann. Dạng thiết kế
được cho như hình 3.2.
Reg
Dữ liệu vào
Dữ liệu ra
Khối MAC
Thuật toán
lặp 256 lần
Hình 2. 2 Bản thiết kế DSP ban đầu
Theo kiến trúc này, sau khi dòng dữ liệu vào sẽ đi qua cổng dữ liệu sẽ đi qua khối
xử lý Mac, thuật toán lặp 256 lần. Ví dụ, nếu có 256 điểm lọc xung thì ta cần 256 phép
toán cộng và nhân MAC trên một mẫu dữ liệu.
Những hạn chế còn tồn tại trên thiết bị DSP ban đầu này:
Kiến trúc cố định, không linh hoạt. Số khối hoạt động MAC ít, 1-4 khối; băng
thông cố định.
Việc xử lý nối tiếp làm giới hạn thông lượng dữ liệu. Việc xử lý này dựa trên
việc chia sẻ thời gian làm việc, chính vì vậy tốc độ xử lý càng cao khi tần số
thực hiện càng lớn. Nhưng do giới hạn của công nghệ hiện tại nên việc phát
triển hệ thống là khá khó khăn.
2.2.2.2. Các ưu điểm về hiệu năng của FPGA
Hiệu năng của FPGA có sự phát triển vượt bậc so với DSP, khi công việc thực hiện
có thể được phân ra thành nhiều khối thực hiện nhỏ, như hình 2.3 sau:
Reg0 Reg1 Reg2 Reg255
C0 C1 C2 C255
Dữ liệu vào
Dữ liệu ra
Thực hiện 256 MAC trong
một chu kỳ clock
Hình 2. 3 Khối thực thi FPGA
29
--------------------------------------------------------------------------------------------------------
Như vậy, nếu như trong khối DSP ban đầu, công việc thực hiện sẽ phải thực hiện
256 clock, thì tại thiết kế FPGA này chỉ cần 1 clock có thể thực hiện xong toàn bộ khối
việc phải xử lý.
Các ưu điểm của FPGA so với DSP là:
Kiến trúc mềm dẻo, phân tán về tài nguyên, việc xử lý và bộ nhớ.
Xử lý song song cùng lúc nhiều phép tính, do vậy tối đa về thông lượng dữ
liệu.
FPGA cũng hỗ trợ xử lý nối tiếp.
2.2.3. Các tính năng chính của FPGA trong 3G
Một trong các tính năng quan trọng của trạm thu phát sóng 3G là card xử lý băng cơ
bản. Card này đưa ra tín hiệu vô tuyến được số hóa và điều khiển trạm và tín hiệu đầu
vào; sau đó sẽ tạo ra đồng thời nhiều kênh cho cùng lúc nhiều người sử dụng bao gồm
cả kênh dữ liệu và thoại.
Xử lý băng tần có thể dựa vào tốc độ xử lý ký hiệu và tốc độ xử lý chíp. Việc thực
thi tốc độ ký hiệu cho người dùng thoại khác rất nhiều so với người sử dụng dữ liệu.
Tốc độ ký hiệu cho thoại có thể dùng bộ mã hóa/ giải mã Viterbi, trộn/ giải trộn. Xử lý
ký hiệu sử dụng chức năng mã hóa Turbo và tăng tốc độ chip.
2.2.3.1. Tốc độ xử lý tín hiệu cao
Kỹ thuật xử lý tín hiệu như bộ lọc FIR, FFT/IFFT và mã xoắn, mã Turbo và xử lý
tín hiệu băng cơ sở. Có rất nhiều phép tính phức tạp và yêu cầu đến hàng triệu phép
tính nhân và cộng trên một giây.
Tính năng ưu việt của FPGA là đó là có thể xử lý cùng lúc rất nhiều kênh, tốc độ xử
lý cao hơn rất nhiều so với bộ xử lý DSP, trong khi giá thành lại rẻ hơn nhiều.
2.2.3.2 Kiểm tra lỗi đường truyền (FEC)
Việc xây dựng chương trình FPGA và hiệu năng DSP cao có thể đạt được nhờ việc
xử lý song song. Và tốc độ xử lý FEC cao còn tùy thuộc vào tốc độ xử lý băng tần. Sự
mềm dẻo và lập trình mở cũng yêu cầu việc tính toán tỷ lệ lỗi bit cho nhiều lược đồ
khác nhau.Việc lập trình mở cho phép nhà phát triển download nhiều lược đồ FEC
khác nhau trên cùng một platform phần cứng để kiểm tra và đánh giá hiệu năng của
lược đồ FEC trên môi trường hệ thống. Điều này cho phép tính toán IP trước khi thực
thi hệ thống.
Mã xoắn Turbo (TCC) cung cấp hiệu năng cao về độ tin cậy truyền dẫn thông qua
môi trường nhiều tạp âm. Mã TCC hoạt động tốt dưới điều kiện tỷ số tín trên tạp thấp
và cng cấp hiệu năng gần như tối ưu theo định nghĩa giới hạn của Shannon. Mã xoắn
Turbo hỗ trợ thay đổi kích thước động, cho phép sự mềm dẻo, chỉnh sửa lỗi chuyển
tiếp hiệu năng cao.
Trong hệ thống 4G, xử lý MIMO tăng đáng kể băng tần truyền thông giữa máy phát
và máy thu bằng sử dụng nhiều anten để tạo ra nhiều kênh vô tuyến song song.
2.2.3.3. Chức năng bắc cầu và điều khiển
Có khả năng kết nối ASSP, ASIC, các bộ xử lý và bộ nhớ với nhau.
30
--------------------------------------------------------------------------------------------------------
2.2.3.4. Các giao diện thích ứng với các chuẩn mạng khác nhau
Tối ưu hóa các thay đổi thiết kế hệ thống để cho phép các sản phẩm phù hợp với các
giao thức và chuẩn mạng khác nhau.
2.2.4. Máy thu phát 3G
2.2.4.1. Máy thu – phát
Sơ đồ các khối của máy phát – thu 3G cơ sở, nguyên lý làm việc được thể hiện trên
hình vẽ [2].
CRCTurbo/
Mã hóa xoắn Bộ trộn
Mã định kênh
(OVSF)
Mã trộn Polyphase RRC
and Halfband Filter
Polyphase RRC
and Halfband Filter
NCO S CRC
p/2
DAC
Reference)
Reference)
Multiply
Hình 2. 4 Sơ đồ máy phát 3G
Bộ xử lý
DSP
Backplane
•LVDS
•PCI
•Gigabit Serial
Phần mềm điều khiển nhúng
Filtering
Down-
Conversion
Beam
Former
Máy thu
RAKE
Bộ phân
tập anten
Bộ dò đa
người dùng
Giải mã
FEC RFFE
Chức năng
điều khiển
và
giao diện hệ
thống
Matched
Filter
Acquire
Tracking
De-spread
Channel estimation
maximum ratio combining
Equal ratio combining
FPGA
Hình 2. 5 Sơ đồ máy thu 3G
31
--------------------------------------------------------------------------------------------------------
2.2.4.2 Máy thu Rake
Rake
Hình 2. 6 Mô hình máy thu Rake
Trong các hệ thống di động, có hiện tượng đa đường do máy thu nhận được nhiều
phiên bản của tín hiệu đến trên nhiều đường với thời gian khác nhau. Những tín hiệu
này thường có thể đến tại một máy thu, “đối pha” (180o) với nhau và có thể gây triệt
tiêu nhiễu.
Các hệ thống 3G sử dụng các máy thu để chống suy yếu đa đường. Các máy thu
này được thiết kế để nhận các tín hiệu đa đường đến tại một anten thu với những độ
lệch thời gian khác nhau, tương quan với chúng, rồi tổng hợp chúng lại thành một tín
hiệu đồng bộ đơn. Điều này đã cải tiến chất lượng cuộc gọi và vùng phủ tốt hơn [2].
2.2.5. Sơ đồ MUD
Thế hệ di động thứ 3 được thông qua cho các dịch vụ tốc độ cao và hiệu quả sử
dụng tài nguyên phổ. Trong hệ thống UMTS, giản đồ đa truy nhập phân chia theo mã
băng rộng được sử dụng. Thông lượng mong đợi cho hệ thống 3G là 144 kbps với
phương tiện di chuyển, 384 kbps với người đi bộ và 2 Mbps với môi trường trong nhà.
Bộ thu trong hệ thống 3G phải đựa vào tính toán không chỉ nhiễu liên ký hiệu (ISI) mà
quan trọng hơn là nhiễu đa truy nhập (MAI) tăng nhanh theo số lượng người dùng và
tốc độ dữ liệu. Các bộ dò đa người dùng (MUD) được áp dụng để loại trừ MAI và trở
nên thật sự có ý nghĩa để triển khai một mạng 3G có hiệu quả. Khía cạnh thuật toán
của MUD trở thành một vấn đề nghiên cứu quan trọng trong hàng thập kỉ trước. Mô
hình hướng tới FPGA cũng được đề xuất. Các công trình nghiên cứu trước đây đã
chứng minh một số giới hạn trong các hệ thống thực theo các ràng buộc phần cứng,
theo định thời và theo thuật toán (thuật toán phức tạp, yêu cầu truy nhập bộ nhớ, luồng
dữ liệu). Thêm vào đó, không có công trình nghiên cứu nào thực hiện để tối đa hóa số
người dùng trên một chíp (hay trên một thiết bị trong trường hợp của FPGA). Tối đa
hóa số người dẫn đến việc tăng dung lượng cell và xử lý đa anten.
Bởi vì bộ thu dựa trên lỗi trung bình quân phương tối thiểu (MMSE) cho phép độ
lợi đáng kể về mặt hiệu suất, bộ lọc hai tầng tuyến tính tương thích MUD (CF-MUD)
dựa trên bộ thu MMSE được đề xuất cung cấp sự cân bằng giữa hiệu suất và tính phức
tạp. Thuật toán này thể hiện tính phức tạp thấp và tính cân đối hợp lý ảnh hưởng đến
việc thực thi FPGA. CF-MUD dựa trên hai khối, khối dấu và khối dò. Mỗi khối hoạt
động như một bộ lọc để triệt ISI và MAI. Trong các nghiên cứu trước, các thực thi
FPGA của khối dấu được trình bày. Dựa trên thuật toán CF-MUD, mô tả một kiến trúc
thiết kế đầy đủ dành cho các thành phần FPGA hiện thời - Virtex-II and Virtex-II Pro
của Xilinx bao gồm các khối dấu và khối dò [2].
32
--------------------------------------------------------------------------------------------------------
Channel baseband model
Lấy dấu 1
Lấy dấu K
Khối lấy dấu Khối dò
Dò
rtrain btrain
r ̃
ŷ1
ŷK
b1
bK
Hình 2. 7 Sơ đồ khối bộ dò đa người dùng (CF-MUD)
2.2.6.1 Cơ sở
a. Mô hình DS-CDMA cơ sở
Trong mô hình hệ thống DS-CDMA, ta xem số ký tự truyền dẫn người dùng di động K
từ E={-1,1}. Ký hiệu của mỗi người dùng được trải phổ bởi chuỗi mã PN với chiều dài
cN gọi là mã dấu. T chỉ chu kỳ ký hiệu và cT chỉ chu kỳ chíp, trong đó
c
c T
TN là
một số tự nhiên. Người dùng thứ k phát ký hiệu )(nkb
Trạm BTS nhận tín hiệu băng cơ sở có thể viết như sau :
1
0 1 1
,
)()(
,
)(
~
)()()(
b kN
n
K
k
L
l
lk
n
k
n
lk
n
kk tnTtshbAtr (2.1)
Trong đó t là thời gian, kL là số tuyến truyền dẫn, )( ,nlkh và lk , tương ứng là độ lợi
phức và trễ truyền dẫn của tuyến l cho người dùng k. bN thể hiện số ký hiệu phát. kA
là biên độ phát của người dùng k. )(nkS là dấu riêng của người dùng k; và )(t là nhiễu
Gauss trắng cộng với phương sai 2n .
Để tăng hiệu suất và dung lượng của hệ thống truyền thông, ISI và MAI phải được
tối thiểu hóa. Vì thế việc thiết kế MUD có khả năng xử lý để triệt nhiễu là vấn đề rất
quan trọng. Phần sau mô tả tổng quan về CF-MUD [2].
b. Bộ dò đa người dùng bộ lọc phân tầng.
Sơ đồ khối của bộ dò đa người dùng CF-MUD để thực hiện một FPGA được mô tả
trong hình 2.7. Ta có thể phân biệt hai khối : Dấu và dò. Mỗi khối hoạt động như một
bộ lọc tương thích để triệt ISI và MAI. MUD tương thích tuyến tính được đề xuất là
dựa trên phương thức tương thích trung bình quân phương tối thiểu (LMS). Bộ lọc
này, tuy nhiên, cần chuỗi training để phỏng theo hệ số bộ lọc. So sánh với TDMA
được sử dụng trong GSM, hệ thống UMTS không cung cấp truy nhập đến dữ liệu đã
33
--------------------------------------------------------------------------------------------------------
biết trừ bits hoa tiêu – để điều chỉnh hệ số của bộ lọc. Một điều quan trọng cần chú ý là
để đảm bảo hội tụ, cả hai khối bộ lọc cần nhiều bits hoa tiêu hơn trong trường hợp
phading nhanh. Chuỗi training biết trước
train
r
~
được tạo ra cục bộ dựa trên các tham số
kênh (biên độ và trễ) từ kỹ thuật đánh giá kênh.
Nguyên tắc của CF-MUD được mô tả tổng quan trong hình 2.8. Chuyển mạch này
mô hình hóa pha training và pha dò. Khối đầu tiên của CF-MUD là khối dấu, phỏng
theo dấu của người dùng mà không nhận biết độ ưu tiên mã PN của họ, Trong bước
thứ nhất, đồng bộ tín hiệu nhận được )(
~
nr dựa trên trễ truyền dẫn được đánh giá cho
mỗi người dùng.
Trong pha training, ta sẽ sử dụng phương trình sau cho người dùng k (k=1,2…K) :
,0)0()),()(()(
^~^^
k
train
H
kk WnrnWny (2.2)
),()()(
^
nynbna k
train
kk (2.3)
,)()()()1( *
~^^
nanrnWnW k
train
kk (2.4)
Với:
,))1((),...,2(),(),()(
,...,),(),()(
~~~~~
)(1,
^
1,
^
0,
^^
T
cccc
T
nNkkk
TNnTrTnTrTnTrnTrnr
vàwnwnwnW c
(2.5)
Trong đó )(,1)dim()dim(
~^
c
train
k NrW định nghĩa giá trị thực của số phức, H)(
định nghĩa hoạt động Hermitian và * là phép hợp.
Các ký hiệu sau được sử dụng :
^
x là giá trị được đánh giá của x, )(
^
ny k là đầu ra
tương thích của người dùng k, )(
^
nW k là vector của hệ số bộ lọc của người dùng k,
)(nb traink là chuỗi dữ liệu training phát tổng hợp, )(
~
nr
train
là vector dữ liệu training thu
tổng hợp từ chuỗi dữ liệu phát )(nb traink được truyền thông qua các tham số kênh được
đánh giá; )(nak là bước tương thích của bộ lọc tương thích trong khối dấu.
Khối dò để triệt phần dư của MAI và ISI dựa trên dữ liệu của tất cả người dùng
được đánh giá sử dụng tín hiệu đầu ra của khối dấu. Từ tất cả người dùng, ta sẽ tạo ra
vector )(
^
nyT ở đầu ra khối dấu như sau :
T
KKKT nynynynynynyny
)1(),...,1(),(),....,(),1(),....,1()(
^
1
^^
1
^^
1
^^
(2.6)
Trong pha training, ta sử dụng phương trình sau cho người dùng k (k= 1,2,…k) :
34
--------------------------------------------------------------------------------------------------------
,)()()()1(
),()()(
,0)0(),()()(
*
^^^
^
^^^^
nnynvnv
nonbn
vnynvno
kTTkTk
k
train
kk
TkT
H
Tkk
(2.7)
Trong đó )(,13))(dim())(dim(,)(),...,(),()(
^^^
,3
^
,2
^
,1
^^
noKnynvnvnvnvnv kTTk
T
kKkkTk
,
là đầu ra tương thích của người dùng k tương ứng với đầu ra của bộ lọc tương thích
tương ứng tương, )(
^
nvTk là vector hệ số bộ lọc của người dùng k, )(nk là lỗi tương
thích của việc dò và v là bước tương thích của bộ lọc tương thích trong khối dò.
Channel baseband model
Dấu
w
1
Dấu
w
k
Dấu
w
K
G
hép
)(1 nb
train
+
- )(1 ny
)(nbtraink
+
- )(nyk
)(nbtrainK
+
- )(nyK
Dò
v
1
Dò
v
k
Dò
v
K
)(1 nb
train
+
- )(1 ny
)(nbtraink
+
- )(nyk
)(nbtrainK
+
- )(nyK
)(nbtrain r ̃train(n)
r(̃n)
ô1(n)
ôk(n)
ôK(n)
(a) (b)
Hình 2. 8 Nguyên lý của khối lấy dấu (a) và khối tách sóng cho k người dùng (b)
Trong pha dò, dữ liệu được truyền dẫn của người dùng d
Các file đính kèm theo tài liệu này:
- LUẬN VĂN-KỸ THUẬT FPGA ÁP DỤNG THỰC HIỆN CHO BỘ MÃ FEC TRONG HỆ DVB.pdf