Thiết kế kiến trúc phần cứng bộ tách tín hiệu FSD cho hệ thống Mimo-Hrsm

Tài liệu Thiết kế kiến trúc phần cứng bộ tách tín hiệu FSD cho hệ thống Mimo-Hrsm: Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 39 THIẾT KẾ KIẾN TRÚC PHẦN CỨNG BỘ TÁCH TÍN HIỆU FSD CHO HỆ THỐNG MIMO-HRSM Nguyễn Xuân Nghĩa1,2*, Trần Sơn Tùng1, Lê Minh Tuấn2, Ngơ Vũ Đức1 Tĩm tắt: Trong bài báo này, chúng tơi đề xuất một kiến trúc phần cứng nhằm làm giảm độ phức tạp của các máy thu hợp lý cực đại (ML: Maximum Likelihood) trong hệ thống điều chế khơng gian tốc độ cao (HRSM: High Rate Spatial Modulation). Dựa trên mơ hình kết hợp thuật tốn giải mã cầu và phân rã ma trận cĩ sắp xếp (Sorted QR decomposition), chúng tơi xây dựng kiến trúc phần cứng cho hệ thống 4x4 ăng ten, điều chế 16QAM. Kết quả triển khai thiết kế cho thấy mơ hình chúng tơi đề xuất đạt được thơng lượng cao hơn so với các mơ hình truyền dẫn SM hay GSM cĩ cùng cấu hình ăng ten thu/phát, trong khi vẫn giữ độ trễ thấp và sử dụng lượng tài nguyên phần cứng hợp lý. Từ khĩa: MIMO; HRSM; FSD; VLSI. 1. MỞ ĐẦU Trong lĩnh vực viễn thơng, MIMO là một c...

15 trang | Chia sẻ: quangot475 | Lượt xem: 445 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Thiết kế kiến trúc phần cứng bộ tách tín hiệu FSD cho hệ thống Mimo-Hrsm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 39 THIẾT KẾ KIẾN TRÚC PHẦN CỨNG BỘ TÁCH TÍN HIỆU FSD CHO HỆ THỐNG MIMO-HRSM Nguyễn Xuân Nghĩa1,2*, Trần Sơn Tùng1, Lê Minh Tuấn2, Ngơ Vũ Đức1 Tĩm tắt: Trong bài báo này, chúng tơi đề xuất một kiến trúc phần cứng nhằm làm giảm độ phức tạp của các máy thu hợp lý cực đại (ML: Maximum Likelihood) trong hệ thống điều chế khơng gian tốc độ cao (HRSM: High Rate Spatial Modulation). Dựa trên mơ hình kết hợp thuật tốn giải mã cầu và phân rã ma trận cĩ sắp xếp (Sorted QR decomposition), chúng tơi xây dựng kiến trúc phần cứng cho hệ thống 4x4 ăng ten, điều chế 16QAM. Kết quả triển khai thiết kế cho thấy mơ hình chúng tơi đề xuất đạt được thơng lượng cao hơn so với các mơ hình truyền dẫn SM hay GSM cĩ cùng cấu hình ăng ten thu/phát, trong khi vẫn giữ độ trễ thấp và sử dụng lượng tài nguyên phần cứng hợp lý. Từ khĩa: MIMO; HRSM; FSD; VLSI. 1. MỞ ĐẦU Trong lĩnh vực viễn thơng, MIMO là một cơng nghệ truyền dẫn khơng dây tiên tiến sử dụng nhiều ăng ten trên cả máy phát và máy thu. Các hệ thống MIMO cĩ thể tăng hiệu suất phổ tần bằng cách truyền nhiều luồng dữ liệu đồng thời trong cùng một dải tần số [1, 2]. Vấn đề đặt ra khi triển khai hệ thống MIMO trên thực tế đĩ là phải đảm bảo sự cân bằng giữa hiệu suất và độ phức tạp của hệ thống. Bộ tách sĩng hợp lý cực đại (ML: Maximum Likelihood) cho phẩm chất lỗi bít tối ưu nhưng cĩ độ phức tạp quá lớn nên rất khĩ khăn để triển khai trong thực tế. Chính vì thế, các bộ tách sĩng cĩ độ phức tạp thấp như bộ tách cưỡng bức bằng khơng (ZF: Zero Forcing) hay bộ tách sai số bình phương trung bình nhỏ nhất (MMSE: Minimum Mean Square Error) thường được sử dụng trong các hệ thống MIMO ghép kênh theo khơng gian (SDM MIMO) bởi vì chúng cĩ độ phức tạp tính tốn rất thấp. Tuy nhiên, nhược điểm của các bộ tách tín hiệu này lại là tỉ lệ lỗi bit (BER) cao do nhiễu liên kênh cịn sĩt lại khi tách lần lượt các tín hiệu, đặc biệt là trong trường hợp hệ thống cĩ số lượng ăng ten lớn. Vì vậy, kỹ thuật triệt nhiễu nối tiếp (SIC: Successive Interference Cancellation) đã được sử dụng trong các bộ tách tín hiệu để khắc phục điểm yếu này. Hệ thống Khơng gian-thời gian tuần tự theo lớp của phịng thí nghiệm Bell (V-BLAST: Vertical-Bell Laboratories Layered Space-Time) được phát minh trong [3] là một trong số các hệ thống như vậy. Hệ thống này sử dụng bộ tách tín hiệu ZF- BLAST, thực chất là một bộ tách tín hiệu ZF kết hợp cùng với chương trình triệt nhiễu nối tiếp SIC. Ngồi ra, trong [4, 5], một bộ tách tín hiệu nữa sử dụng SIC được đề xuất là ZF- SQRD. Bộ tách này thiết kế dựa trên thuật tốn SQRD và áp dụng phương pháp giảm độ trễ, đã làm giảm được độ phức tạp giảm ở phía thu, tuy nhiên phẩm chất BER của hệ thống này bị suy giảm so với các bộ tách ZF-VBLAST. Trong [6, 7] các tác giả đề xuất hai bộ tách sĩng mới cho hệ thống VBLAST là MMSE-BLAST và MMSE-SQRD. Kết quả tính tốn và mơ phỏng cho thấy, bộ tách MMSE-BLAST cung cấp phẩm chất BER tốt hơn SQRD-BLAST với cùng độ phức tạp tính tốn. Gần đây, hệ thống điều chế khơng gian tốc độ cao (HRSM: High Rate Spatial Modulation) đã được Nguyễn Thu Phương và các cộng sự đề xuất trong [8]. Hệ thống này cung cấp hiệu suất phổ tần cao hơn đáng kể so với phương pháp điều chế khơng gian trong [9] và điều chế khơng gian tổng quát (GSM) trong [10, 11]. Nguyên lý làm việc của HRSM dựa trên sự kết hợp kỹ thuật điều chế khơng gian SM với từ mã chịm sao khơng gian (SC: Spatial Constellation). Cụ thể là HRSM đưa các bit thơng tin vào chỉ số của ăng ten và truyền từ mã thơng qua điều chế biên độ cầu phương (QAM) hoặc điều chế pha Kỹ thuật điều khiển & Điện tử N. X. Nghĩa, , N. V. Đức, “Thiết kế kiến trúc phần cứng hệ thống MIMO-HRSM.” 40 PSK (Phase-shift keying). Vì vậy, hệ thống HRSM cĩ hiệu suất BER tốt hơn do ít nhiễu ICI và IAS hơn các hệ thống MIMO thơng thường, như hệ thống STBC-SM [12]. Gần đây, nhiều bộ tách tín hiệu phức tạp cho hệ thống HRSM được phát triển trong [13], gồm các bộ tách tín hiệu MSQRD, MBLAST, và ISQRD. Cả 3 bộ tách tín hiệu này cĩ độ phức tạp thấp nhưng phẩm chất BER bị suy giảm đáng kể so với bộ tách tín hiệu tối ưu ML. Bên cạnh các bộ tách tín hiệu đã nêu trên, thuật tốn giải mã cầu (SD: Sphere decoding) - một thuật tốn tìm kiếm điểm dàn gần nhất tới vector nhận được - cũng được coi là một cách tiếp cận đầy hứa hẹn. Bộ tách SD được đề xuất đầu tiên trong [14] bằng cách sử dụng phương pháp liệt kê Fincke-Pohst (PE-SD). Sau đĩ phương pháp PE-SD đã được chứng minh là kém hơn phương pháp liệt kê Schnorr-Euchner (SE-SD: Schnorr- Euchner Sphere Decoding) trong [15] do SE-SD cĩ độ phức tạp khơng phụ thuộc vào bán kính cầu ban đầu. Tuy nhiên, SE-SD lại khơng thể triển khai thiết kế phần cứng theo phương pháp pipelining do thuật tốn địi hỏi phải tìm kiếm đầy đủ tất cả các bộ giá trị thỏa mãn điều kiện nằm trong bán kính hình cầu. Chính vì vậy, thuật tốn SD cĩ độ phức tạp biến thiên theo đa thức. Điều này trở thành nút thắt trong việc triển khai thiết kế phần cứng. Để khắc phục vấn đề này, Barbero và cộng sự đã giới thiệu một phương pháp tiếp cận mới trong [16] gọi là phương pháp Giải mã cầu cố định (FSD: Fixed Sphere Decoding). Phương pháp này đạt được thơng lượng cố định và sử dụng tài nguyên phần cứng hiệu quả trong khi vẫn duy trì phẩm chất BER gần với bộ tách tín hiệu tối ưu ML. Trong bài báo này, chúng tơi đề xuất một thiết kế kiến trúc phần cứng cĩ hiệu suất cao cho bộ tách tín hiệu của hệ thống HRSM, sử dụng phương pháp Modified Gram Schmidt SQRD (MGS-SQRD) và FSD. So với các thiết kế tương tự được nêu trong phần tài liệu, cụ thể là thiết kế của Nguyễn (phần SQRD) trong [17], thiết kế của Barbero (phần FSD) trong [16], và thiết kế của Chu (phần FSD) trong [18], thiết kế mà chúng tơi đề xuất đạt được thơng lượng lớn hơn đáng kể trong khi sử dụng lượng tài nguyên phần cứng hợp lý. Ngồi ra, các khối trong kiến trúc phần cứng được thiết kế linh hoạt cho phép phát triển hơn nữa trong các cơng trình nghiên cứu trong tương lai. Phần tiếp theo của bài báo này được trình bày như sau: Mục 2 trình bày mơ hình hệ thống HRSM và nguyên lý làm việc của hai thuật tốn SQRD, FSD. Thiết kế phần cứng được trình bày chi tiết trong mục 3. Mục 4 là kết quả thực thi trên phần cứng và cuối cùng, kết luận của bài báo được trình bày trong mục 5. 2. MƠ HÌNH HỆ THỐNG 2.1. Hệ thống HRSM Hình 1. Mơ hình hệ thống HRSM. Xét hệ thống HRSM gồm ăng ten phát và ăng ten thu làm việc trong mơi trường kênh truyền fading Rayleigh cận tĩnh như hình 1. Trong mỗi chu kỳ phát tín hiệu, máy phát phát đi một từ mã HRSM, , cĩ độ dài + bít. Từ mã HRSM được tạo ra như sau: luồng dữ liệu phát nối tiếp ( + ) bít được chuyển đổi thành hai luồng dữ liệu song song cĩ chiều dài lần lượt là m và l bít. Sau đĩ = 2 × ( − 1) bít được ánh xạ thành một từ Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 41 mã khơng gian (SC codeword) và bít được điều chế bởi bộ điều chế tín hiệu truyền thống M-QAM/PSK để tạo ra ký hiệu điều chế , ( = 2). Cuối cùng từ mã HRSM được tạo ra bằng cách nhân từ mã SC với như sau: = × . Để máy, thu cĩ thể tách được các tín hiệu đã phát một cách dễ dàng, phần tử đầu tiên của s luơn được cố định là 1, các phần tử cịn lại được lựa chọn trong tập ±1,± phụ thuộc vào giá trị của bít đầu vào. Ở phía thu, vector tín hiệu nhận được được cho bởi cơng thức: = . + , (1) trong đĩ, H là ma trận kênh truyền cĩ kích thước × , là vector tạp âm cĩ kích thước × 1. Các phần tử của ma trận kênh truyền H và véc tơ nhiễu n được giả thiết là các biến ngẫu nhiên đồng nhất, cùng phân bố (i.i.d) cĩ trung bình bằng 0 và phương sai . là năng lượng trung bình của tín hiệu điều chế và là tỷ số cơng suất tín hiệu trên tạp âm (SNR: signal to noise ratio) trung bình tại mỗi ăng ten thu. Phương trình mơ tả hệ thống trong cơng thức (1) cĩ thể được biểu diễn dưới dạng hệ thống tương đương mở rộng như sau: = + , (2) trong đĩ, , và lần lượt là véc tơ tín hiệu thu, ma trận kênh truyền và véc tơ tạp âm của hệ thống HRSM tương đương mở rộng. Chúng được xác định như sau: = 0 , = 1 , = − 1 (3) 2.2. Thuật tốn SQRD Trong phương pháp phân tích QR thơng thường, ma trận kênh được thực hiện phân tách theo phương trình: = (4) trong đĩ, là ma trận unita kích thước ( + ) × cĩ tính chất *Q = I, là ma trận tam giác trên cĩ kích thước × . Nhân hai vế của phương trình (4) với ta được: = + (5) trong đĩ, = và = . Do tính chất của ma trận tam giác trên , khối triệt nhiễu nối tiếp SIC được thực hiện bằng cách ước lượng vector tín hiệu thu bắt đầu từ lớp dưới cùng. Cụ thể, đầu tiên ta ước lượng từ = + , sau đĩ giá trị ước lượng này được dùng để triệt ảnh hưởng của nĩ và tách symbol tiếp theo, ̂. Quá trình này lặp lại cho đến khi tất cả các phần tử của tín hiệu phát c được khơi phục. Kỹ thuật SIC nêu trên chịu ảnh hưởng mạnh bởi hiện tượng lan truyền lỗi (error propagation) gây ra tại lớp thứ i do việc tách các symbol các lớp trước đĩ khơng hồn tồn chính xác. Để khắc phục hiện tượng này, kỹ thuật phân rã QR cĩ sắp xếp trước thực hiện sắp xếp lại ma trận và Q bằng cách sử dụng một ma trận hốn vị. Cơng thức (4) được viết lại thành: = (6) trong đĩ, là một ma trận hốn vị × với các phần tử dùng để thể hiện chỉ số cột của ma trận , và = . Các cột của ma trận sẽ được sắp xếp theo thứ tự tăng dần của giá trị độ lớn (norm) vector cột R(0 ≤ < ) để tối thiểu hĩa xác suất lỗi truyền tín hiệu. Điều này cũng cĩ nghĩa là tín hiệu được tách từ lớp dưới cùng sẽ cĩ khuếch đại tạp âm nhỏ nhất. Tuy nhiên, trong thuật tốn giải mã cầu cố định FSD sẽ nêu trong mục tiếp Kỹ thuật điều khiển & Điện tử N. X. Nghĩa, , N. V. Đức, “Thiết kế kiến trúc phần cứng hệ thống MIMO-HRSM.” 42 theo, lớp dưới cùng hoặc bất kỳ lớp nào được thực hiện tìm kiếm Full-Search (FS) thì phải được sắp xếp với kênh cĩ khuếch đại tạp âm lớn nhất. Các lớp khác được thực hiện tìm kiếm Single-Search (SS) cĩ thể sắp xếp theo sơ đồ sắp xếp thơng thường. Việc thực hiện SQRD trong nghiên cứu này sử dụng cách tiếp cận Gram-Schmidt được sửa đổi để tối ưu hĩa hơn trong việc triển khai phần cứng [17]. 2.3. Thuật tốn FSD Bộ tách tín hiệu cầu SD là một phương pháp khắc phục nhược điểm về độ phức tạp của bộ tách tín hiệu ML bằng cách sử dụng phương pháp tree-search để giảm số lượng trường hợp cĩ thể xảy ra [14]. Nguyên lý của thuật tốn SD là chỉ xét các điểm dàn tồn tại bên trong một mặt cầu (, ), với vector thu là tâm hình cầu, là bán kính. Trong bộ tách SD nguyên thủy, thuật tốn này sẽ lặp lại việc kiểm tra với tất cả các kết quả hợp lệ trong bán kính hình cầu để tìm ra vector cĩ giá trị khoảng cách Euclide tích lũy (APED) nhỏ nhất tới vector , giá trị này chính là tổng của tất cả các giá trị khoảng cách euclide (PED) trong mỗi lớp và được cho bởi cơng thức: = − − (7) trong đĩ, = , ,1. Cơng thức cĩ thể được viết lại như sau: ̂ = min ‖ − ‖ ≤ (8) Trong thuật tốn SD, rất khĩ để ước tính cĩ bao nhiêu nhánh cần phải được tìm kiếm trước và vì thế độ phức tạp của SD khơng cố định. Hình 2. Ví dụ cách liệt kê (duyệt điểm) của thuật tốn FSD trong hệ thống 4 × 4 điều chế 16-QAM. Một thuật tốn tách tín hiệu cầu hiệu quả là FSD (Fixed Sphere Decoder) được các tác giả đề xuất trong [16]. Thuật tốn này cải tiến khái niệm giải mã cầu ban đầu cho các hệ thống MIMO để phù hợp hơn trong việc triển khai thiết kế phần cứng tốc độ cao nhưng cĩ nhược điểm là phẩm chất BER của hệ thống bị suy giảm. Ý tưởng cơ bản là xác định trước số lượng các điểm chịm sao cần xem xét khi tính các chỉ số khoảng cách Euclide cho mỗi ăng ten phát. Chính vì vậy, số trường hợp thực hiện các bước được cố định khi triển khai thuật tốn FSD. Hơn nữa, độ phức tạp và thơng lượng cũng cĩ thể xác định ngay từ khi bắt đầu thực hiện thuật tốn. Ngồi ra, việc cập nhật bán kính và duyệt lặp lại các điểm như trong thuật tốn SD cũng khơng cần phải thực hiện để tối ưu hiệu suất hệ thống và đơn giản hơn trong việc triển khai thiết kế. Điều này làm cho thuật tốn FSD phù hợp hơn đối Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 43 với việc triển khai kiến trúc pipelining so với kỹ thuật tree-search tuần tự được sử dụng trong thuật tốn SD. Trong thuật tốn FSD, Full-Search (FS) hoặc Single-Search (SS) sẽ được lựa chọn để thực hiện ở mỗi lớp. FS liệt kê đầy đủ tất cả các trường hợp (điểm) của các lớp cĩ điều kiện kênh kém nhất, trong khi SS chỉ tìm kiếm các trường hợp giống nhất của các lớp khác với khuếch đại tạp âm ít hơn [19]. Số lượng điểm được đánh giá ở lớp phải thỏa mãn mối quan hệ sau: [20] [] ≥ [] ≥ ⋯ ≥ [] (9) Do đĩ, tổng số vector cần phải tính tốn là = ∏ , và vector ước lượng ̂ là vector cĩ giá trị APED nhỏ nhất. Hình 3. So sánh phẩm chất BER giữa bộ tách tín hiệu FSD và SESD trong hệ thống MIMO 4 × 4 sử dụng điều chế 16-QAM. Hình 4. So sánh độ phức tạp giữa bộ tách tín hiệu FSD và SESD trong hệ thống MIMO 4 × 4 sử dụng điều chế 16-QAM. Để đánh giá rõ hơn khả năng cân bằng giữa phẩm chất hệ thống với độ phức tạp tính tốn của thuật tốn FSD, chúng tơi đã tiến hành so sánh hai thơng số này của bộ tách tín Kỹ thuật điều khiển & Điện tử N. X. Nghĩa, , N. V. Đức, “Thiết kế kiến trúc phần cứng hệ thống MIMO-HRSM.” 44 hiệu FSD với bộ tách tín hiệu SESD [21] với cùng hệ thống MIMO 4 × 4, điều chế 16- QAM. Kết quả so sánh được thể hiện lần lượt trong hình 3 và hình 4. Kết quả mơ phỏng cho thấy khi tỉ lệ tín hiệu trên tạp âm càng cao và số điểm cố định trong mỗi lớp FSD càng lớn thì phẩm chất BER càng tốt và tiến gần tới đường BER của bộ tách tín hiệu SESD. Trong khi đĩ, độ phức tạp tính tốn lại biến thiên theo chiều hướng ngược lại. Như vậy, việc đánh giá chất lượng kênh truyền, chất lượng tín hiệu rất quan trọng trong việc xác định số điểm cố định trong mỗi lớp FSD nhằm mang lại sự cân bằng hợp lý nhất giữa phẩm chất hệ thống và độ phức tạp tính tốn. 3. KIẾN TRÚC ĐỀ XUẤT Để cĩ thể triển khai thuật tốn tách tín hiệu trong thiết kế phần cứng, chúng tơi sử dụng cơng thức (10) dưới đây nhằm thực hiện biến đổi từ hệ thống phức sang hệ thống thực tương đương: ℜ() ℑ() = ℜ() −ℑ() ℑ() ℜ() ℜ() ℑ() + ℜ() ℑ() (10) Tuy nhiên, theo cách tiếp cận trong [22], việc sử dụng cơng thức trên trong thiết kế thời gian thực full-pipelined sẽ khơng làm giảm độ phức tạp tính tốn bởi vì: 1) cách tiếp cận này chỉ áp dụng cho các chịm sao QAM và 2) khi số điểm dàn trên mỗi lớp giảm đi một nửa, phương pháp này tăng gấp đơi kích thước của các ma trận và vector. Vì số lượng các giai đoạn trong SQRD và số lớp trong FSD lại bằng với số cột và các hàng của ma trận kênh truyền , nên trong trường hợp này, thiết kế sẽ cần phải cĩ thêm một lượng đáng kể các flip-flop cho bộ đệm trễ. Cũng đồng nghĩa với việc trễ của hệ thống sẽ tăng lên. Trong khi đĩ, mục đích của chúng tơi là đề xuất một thiết kế tối ưu hĩa thơng lượng và cĩ thể được áp dụng cho bất kỳ phương pháp điều chế nào. Vì vậy, chúng tơi ưu tiên phương pháp tiếp cận tối ưu độ phức tạp tính tốn. Sơ đồ thiết kế tổng thể của bộ tách tín hiệu FSD trong hệ thống MIMO 4 × 4 sử dụng điều chế 16-QAM mà chúng tơi đề xuất được thể hiện trong hình 5. Hình 5. Sơ đồ thiết kế tổng thể của bộ tách tín hiệu. 3.1. Kiến trúc SQRD Ở phía thu, bước đầu tiên là thực hiện phân rã QR cĩ sắp xếp ma trận kênh truyền . Mỗi phần tử của ma trận là một số phức 24 bít được tạo thành bởi hai số thực 12 bít đại diện cho phần thực và phần ảo. Mỗi số thực cĩ 4 bít cho phần nguyên và 8 bít cho phần thập phân. Kiến trúc của phần SQRD được mơ tả trong hình 6 với năm khối kết nối liên tiếp, bao gồm: một khối tính tốn chuẩn (norm) và bốn khối xử lý tương ứng với 4 giai đoạn chính (main stages). Mỗi giai đoạn chính lần lượt cĩ nhiệm vụ tính tốn ra giá trị hàng của ma trận R từ 1 đến 4 và sắp xếp lại giá trị cột của các Q, P sau mỗi giai đoạn. Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 45 Hình 6. Kiến trúc tổng thể khối SQRD. Kiến trúc của ba giai đoạn đầu tiên được mơ tả trong hình 7. Ba giai đoạn này chia sẻ kiến trúc và tài nguyên giống nhau, ngoại trừ số lượng khối Updater (hình 8) - khối chịu trách nhiệm cập nhật các ma trận sau khi chia. Cụ thể, bắt đầu cĩ ba khối Updater được sử dụng trong giai đoạn đầu tiên (), sau đĩ số lượng này giảm đi một sau mỗi giai đoạn hai và ba. Đến giai đoạn thứ tư được mơ tả trong hình 9 và khơng cĩ bất kỳ khối Updater nào cần sử dụng. Hình 7. Kiến trúc SQRD giai đoạn , với X ∈ {1, 2, 3}. Hình 8. Kiến trúc khối Updater. Hình 9. Kiến trúc SQRD giai đoạn 4. Kỹ thuật điều khiển & Điện tử N. X. Nghĩa, , N. V. Đức, “Thiết kế kiến trúc phần cứng hệ thống MIMO-HRSM.” 46 Tất cả các bộ đệm thời gian trong thiết kế đều cĩ chu kỳ cập nhật 4 chu kỳ đồng hồ cho mỗi giai đoạn, tương ứng với thơng lượng hệ thống. Biểu đồ thời gian của khối SQRD được mơ tả chi tiết trong hình 10. Để giảm chi phí tài nguyên phần cứng cần cho việc thực hiện phép chia 8×1 vector phức () với một số thực (, ), phương án được đưa ra là tính nghịch đảo của số chia, sau đĩ lần lượt nhân với số bị chia trong khi thực hiện đồng thời phép dịch kết quả. Bên cạnh đĩ, các vector được chia thành hai phần bằng nhau sẽ cho độ trễ lan truyền ít hơn đáng kể và thơng lượng mạnh hơn. Đổi lại là cần sử dụng một số bộ đệm thời gian cũng như các đơn vị DSP cần cho phép nhân trong giới hạn cĩ thể chấp nhận được. Tồn bộ bước thực hiện trên được thực hiện bởi khối Divider và chỉ mất 28 cycles cho mỗi vector (xem hình 11). Hình 11. Kiến trúc khối Divider. 3.2. Kiến trúc FSD Sơ đồ thiết kế tổng thể của khối tách tín hiệu FSD được mơ tả trong hình 12. Để so sánh chính xác hơn với các cơng trình nghiên cứu khác, chúng tơi khơng xét đến ma trận nhân sử dụng để tiền xử lý vector tín hiệu thu. Hình 12. Kiến trúc sơ đồ thiết kế tổng thể của khối FSD. Đối với các hệ thống 4 × 4 MIMO sử dụng điều chế 16- QAM cùng với phương pháp liệt kê trong hình 2, cần tính bốn thành phần khoảng cách Euclide (PED) để giải phương trình số (7). Bốn thành phần này được xử lý, tính tốn bởi 4 khối PED tương ứng trong thiết kế ở hình 12. Đầu tiên, khối H ìn h 1 0. B iểu đồ thờ i g ia n củ a khối SQ R D . Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 47 PED 4 sẽ tính 16 giá trị PED từ tập hợp các giá trị ký hiệu trên bản đồ chịm sao 16-QAM của lớp thứ 4. Từ mỗi ký hiệu sau đĩ sẽ bắt đầu một nhánh mở rộng đến lớp dưới cùng. Trong mỗi lớp tiếp theo, 16 giá trị ký hiệu cĩ khoảng cách euclide từng phần nhỏ nhất tương ứng với mỗi nhánh sẽ được đề xuất. Trong suốt quá trình, khoảng cách euclide tích lũy của mỗi nhánh được lưu trữ trong bộ đệm riêng biệt và được đưa vào giai đoạn so sánh một khi việc liệt kê kết thúc. Sau đĩ, nhánh cĩ khoảng cách euclide tích lũy nhỏ nhất sẽ cĩ vector ký hiệu tương ứng được chọn làm kết quả cuối cùng. Vì Full-Search được áp dụng trong lớp trên cùng, nên các ký hiệu đầu ra của khối PED 4 chuyển đến cho khối PED 3 đã được xác định trước và cĩ thể tập hợp lại thành một bảng. Điều này cho phép khối PED 3 cĩ thể thực hiện hồn tồn độc lập với khối PED 4. Tận dụng đặc điểm này, hai khối PED 3 và PED 4 được thiết kế để chạy song song nhằm giảm độ trễ của hệ thống và giảm số lượng các giai đoạn pipeline. Kiến trúc chi tiết của các khối PED được mơ tả lần lượt trong các hình 13, hình 14, hình 15 và hình 16. Hình 13. Kiến trúc khối PED 4. Hình 14. Kiến trúc khối PED 3. Kỹ thuật điều khiển & Điện tử N. X. Nghĩa, , N. V. Đức, “Thiết kế kiến trúc phần cứng hệ thống MIMO-HRSM.” 48 Hình 15. Kiến trúc khối PED 2. Hình 16. Kiến trúc khối PED 1. Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 49 Trong khi tất cả các khối PED từ 3 đến 1 tương đương nhau (xem hình 14, hình 15 và hình 16), đều cần 16 bộ nhân phức để tính tốn giá trị chuẩn như trong cơng thức (7), thì khối PED 4 chỉ yêu cầu 3 bộ nhân thực (xem hình 13) vì phương trình của nĩ cĩ thể được đơn giản hĩa theo kết quả nghiên cứu trong [23]. Cách tiếp cận này cũng làm giảm đáng kể chi phí phần cứng, nhưng khơng thể áp dụng cho các lớp khác do vấn đề cân bằng giữa tính hiệu quả với chi phí cho độ phức tạp phần cứng. Để giảm chi phí tài nguyên phần cứng, ta cĩ thể tránh việc lặp lại phép nhân giữa thơng tin tín hiệu và phần tử của ma trận trên mỗi nhánh bằng cách triển khai bảng tra cứu chứa tất cả các giá trị cĩ thể xảy ra. Trên mỗi nhánh của lớp , kết quả được tính trước tương ứng cĩ thể được trích xuất bằng cách sử dụng phép nhân với thơng tin tín hiệu của lớp trước làm bộ chọn đầu vào. Từ đĩ, khối ̂ được sử dụng để ước lượng giá trị của ký hiệu hiện tại bằng cách làm trịn giá trị ký hiệu đến giá trị phức và và giá trị nguyên gần nhất trên bản đồ chịm sao tín hiệu. Kết quả được thể hiện như sau: = ; = − (11) Đối với phương pháp điều chế 16-QAM, tập các giá trị ký hiệu trên bản đồ chịm sao là {±1,±3}. Vì vậy, việc ước lượng cĩ thể được thực hiện bằng cách sử dụng hai bộ so sánh ngưỡng cĩ các giá trị biên thuộc {0,±2}. Bên cạnh đĩ, để tiết kiệm tài nguyên phần cứng cho việc thực hiện phép chia trong cơng thức (11), ta cĩ thể thực hiện bằng cách nhân cả hai bên với . Do đĩ, các giá trị biên cuối cùng được sử dụng là {0, ±2}. Cuối cùng, giá trị PED tính được bằng cách sử dụng để lấy chuẩn trên tổng kết tất cả các kết quả trước đĩ. Việc này cần sử dụng lượng tài nguyên phần cứng là 2 DSPs. Tồn bộ bước thực hiện trên của khối FSD cần 16 chu kỳ đồng hồ cho mỗi vector. Sơ đồ thiết kế pipeline các khối PED của module FSD đuợc thể hiện trong hình 17. Hình 17. Sơ đồ pipeline khối FSD. 4. KẾT QUẢ TRIỂN KHAI THIẾT KẾ Kết quả thực hiện của SQRD và FSD trên nền tảng Virtex 6 VLX75T speed grade-3 được thể hiện tương ứng trong bảng 1 và bảng 2. Trong thiết kế phần cứng trên nền tảng FPGA, thơng lượng hệ thống được tính dựa trên cơng thức: TLHT = × , (12) trong đĩ, là số bit của dữ liệu đầu vào, là tần số cực đại và là số chu kỳ đồng hồ tối thiểu giữa hai đầu vào liên tiếp. Kết quả triển khai thiết kế cho phần SQRD được tổng hợp trong bảng 1. Kỹ thuật điều khiển & Điện tử N. X. Nghĩa, , N. V. Đức, “Thiết kế kiến trúc phần cứng hệ thống MIMO-HRSM.” 50 Bảng 1. So sánh kết quả triển khai thiết kế khối SQRD. Work [17] This work Max freq. 429.9 Mhz 449.9 Mhz Hardware usage 14184 slices 10948 LUTs 141 DSPs 12117 slices 10093 LUTs 151 DSPs QRDs throughput (Milion matrices/s) 53.73 112.48 Latency 269 cycles 212 cycles Theo [17], nhĩm nghiên cứu của Nguyễn đề xuất một thiết kế cĩ kết quả tổng thể tốt hơn so với tất cả các thiết khác được đề cập trong bài báo này. Do đĩ chúng tơi sẽ chỉ so sánh kết quả triển khai khối SQRD trong thiết kế của chúng tơi với thiết kế của Nguyễn. Như mơ tả trong bảng 1, thiết kế mới mà chúng tơi đề xuất chỉ cần thêm 10 DSPs, trong khi chi phí tài nguyên phần cứng giảm xuống và hiệu suất hệ thống được cải thiện đáng kể. Sự gia tăng DSP này là kết quả khi triển khai kiến trúc xử lý song song trong một số phần của thiết kế. Cùng với lý do đĩ, số lượng LUT và slide cũng cĩ thể tăng lên, tuy nhiên, bằng cách sử dụng phương pháp chia đơi vector dữ liệu, lượng tài nguyên phần cứng tiết kiệm được đáng kể hơn nhiều so với lượng tài nguyên phần cứng cần cho pipeline. Trong khi đĩ, khơng chỉ độ trễ input-output được giảm hơn 20% mà cịn tần số cực đại cũng được tăng lên. Đồng thời thơng lượng hệ thống cĩ thể đạt tới khoảng 112 triệu matrices mỗi giây, gần như là gấp đơi so với thiết kế được so sánh. Vì các thiết kế khác nhau cĩ thể sử dụng kích thước dữ liệu đầu vào khác nhau, nên việc so sánh thơng lượng bằng / cĩ thể chưa hồn tồn chính xác. Do đĩ, đơn vị / được đưa vào trong bảng để cĩ kết quả so sánh chính xác hơn. Kết quả triển khai thiết kế cho phần FSD và so sánh kết quả với các thiết kế tương tự được thể hiện trong bảng 2. Bảng 2. So sánh kết quả triển khai thiết kế khối FSD. Work [16] [18] This work Scheme 4 × 4 16-QAM FSD 4 × 4 16-QAM R/FSD 4 × 4 16-QAM FSD Platform Virtex 2 XC2VP70 Virtex 5 VSX240T Virtex 6 VLX75T Max freq. 150 Mhz / 120 MHz 265 Mhz / 175.6 MHz 302.7 Mhz Hardware usage 12721 slices/ 18631 slices 16119 LUTs/ 32030 LUTs 160 DSPs/ 99 DSPs 82 BRAMs/ - - / 7865 slices 23728 LUTs / 22921 LUTs 204 DSPs / 99 DSPs 9778 slices 20891 LUTs 99 DSPs Throughput 600 Mbps / 1.92 Gbps 513.5 Mbps / 2.81 Gbps 4.84 Gbps In-In delay 4 cycles / 1 cycles - 1 cycles Latency - 121 cycles 16 cycles In đậm là kết quả được tổng hợp lại trong cùng một nền tảng với các thiết kế được so sánh. Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 51 Đánh giá tổng quát cho thấy, bộ tách tín hiệu mà chúng tơi đề xuất duy trì một sự cân bằng hợp lý trong việc sử dụng chi phí tài nguyên phần cứng để đạt được các thơng số thiết kế rất vượt trội, đặc biệt là về thơng lượng. So với thiết kế trong [16] và [18], mặc dù thiết kế chúng tơi đề xuất sử dụng số lượng slide nhiều hơn, nhưng số lượng DSP lại giảm xuống, kéo theo độ trễ giảm xuống và thơng lượng hệ thống tăng lên. Bên cạnh đĩ, ngồi việc đánh đổi về sự gia tăng chi phí phần cứng đã nĩi, các kỹ thuật: triển khai song song khối PED 3 và PED 4, tối giản số bộ nhân thực trong khối PED 4, triển khai bảng tra cứu tránh việc lặp lại phép nhân giữa thơng tin tín hiệu và phần tử của ma trận đều là những kỹ thuật thiết kế kiến trúc phần cứng gĩp phần quan trọng để thiết kế cĩ được kết quả vượt trội. Cụ thể là thơng lượng hệ thống tăng 228% so với thiết kế trong [16] và tăng 460% so với thiết kế trong [18] khi được tổng hợp trên cùng một nền tảng phần cứng. Bên cạnh đĩ, khi triển khai thiết kế của chúng tơi cho hệ thống HRSM 4 × 4 ăng ten điều chế 16-QAM trên nền tảng Virtex 6 VLX75T, kết quả đạt tần số cực đại là 302.7 Mhz, độ trễ 16 chu kỳ đồng hồ và thơng lượng lên tới 4.84 Gbps. 5. KẾT LUẬN Trong bài báo này, chúng tơi trình bày một thiết kế kiến trúc phần cứng tối ưu full- pipelined cĩ thơng lượng cao cho bộ tách tín hiệu FSD trong hệ thống HRSM 4 × 4, điều chế 16-QAM. Kiến trúc phần cứng mà chúng tơi đề xuất cĩ các thơng số vượt trội hơn tất cả các đề xuất tương tự được nêu trong phần tài liệu. Đồng thời, thiết kế này cĩ thể đạt được hiệu suất BER gần nhất với ML. Kiến trúc bộ tách tín hiệu được chúng tơi đề xuất phù hợp để ứng dụng cho các thế hệ hệ thống điều chế khơng gian tốc độ cao. Lời cảm ơn: Nhĩm tác giả xin cảm ơn sự quan tâm, giúp đỡ, hướng dẫn tận tình của quý thầy cơ Viện Điện tử - Viễn thơng, Trường Đại học Bách Khoa Hà Nội. TÀI LIỆU THAM KHẢO [1]. G. J. Foschini and M. J. Gans, "On limits of wireless communications in a fading environment when using multiple antennas", Wireless Per. Commun., 6, pp. 311- 335, 1998. [2]. E. Telatar, "Capacity of multi-antenna Gaussian channels", European Trans. Telecommun., vol. 10, no. 6, pp.558-595, Nov./Dec. 1999. [3]. P. W. Wolniansky, G. J. Foschini, G. D. Golden and R. Valenzuela, "VBLAST: an architecture for realizing very high data rates over the richscattering wireless channel", Proc. URSI International Symposium on Signals, Systems, and Electronics, pp. 295-300, 1998. [4]. D. Wübben, J. Rinas, V. Kühn and K. D. Kammeyer, "Efficient algorithm for decoding Layered Space-Time Codes", Proc. ITG Conference on Source and Channel Coding, Berlin, Germany, January 2002. [5]. J. H. Y. Fan, R. D. Murch and W. H. Mow, "Near Maximum Likelihood Detection Schemes for Wireless MIMO Systems", IEEE Trans. Wireless Commun., vol. 3, no. 5, pp. 1427¨ ı¿ ½ 1430, Sep. 2004. [6]. B. Hassibi, "An efficient square-root algorithm for BLAST", Proc. IEEE International Conference on Acoustics, Speech, and Signal Processing, vol.2, pp. II737-II740, 2000. [7]. D. Wübben, R. Bưhnke, V. Kühn and K. D. Kammeyer, "MMSE Extension of V- BLAST based on Sorted QR Decomposition", Proc. Veh. Technol. Conf., VTC- 2003, vol. 1, pp. 508-512, Oct. 2003. Kỹ thuật điều khiển & Điện tử N. X. Nghĩa, , N. V. Đức, “Thiết kế kiến trúc phần cứng hệ thống MIMO-HRSM.” 52 [8]. Thu-Phuong Nguyen, Minh-Tuan Le, Vu-Duc Ngo, Xuan-Nam Tran, Hae-Wook Choi, “Spatial Modulation for High-Rate Transmission Systems”, in Vehicular Technology Conference (VTC Spring), IEEE, pp. 1-5,May 2014. [9]. R. Mesleh, H. Haas, C. Ahn and S. Yun, "Spatial modulation - a new low complexity spectral efficiency enhancing technique", Proc. First International Conf. Commun. Netw., Beijing, China, pp. 1-5, Oct. 2006. [10]. A.Younis, N. Serafimovski, R.Mesleh and H. Haas, "Generalised spatial modulation", Signals, Systems and Computers (ASILOMAR), 2010 Conference Record of the Forty Fourth Asilomar Conference on, pp.1498-1502, Nov. 2010. [11]. J. Fu, C. Hou, W. Xiang, L. Yan and Y. Hou, "Generalised spatial modulation with multiple active transmit antennas", GLOBECOM Workshops (GC Wkshps), 2010 IEEE, pp.839-844, Dec. 2010. [12]. E. Basar, Ü. AygưlÜ, E.PanaYlrcl, and H. V. Poor, "Space-Time Block Coded Spatial Modulation", IEEE Trans. Commun., vol. 59, no. 3, pp.823-832, Mar. 2011. [13]. Dong Nguyen, Xuan-Nam Tran, Trung-Minh Do, Vu-Duc Ngo, and Minh-Tuan Le, “Low-Complexity Detectors for High-Rate Spatial Modulation", International Conf. on Advanced Technol. for Commun., ATC 2014 , Hanoi, Vietnam, pp. 652-656, Oct. 2014. [14]. M. Damen, H. Gamal, and G. Caire, "On maximum-likelihood detection and the search for the closest lattice point", IEEE Transactions on Information Theory , vol. 49, no. 10, pp. 2389 – 2402, October 2003. [15]. E. Agrell, T. Eriksson, A. Vardy and K. Zeger, "Closest point search in lattices", IEEE Transactions on Information Theory , vol. 48, no. 8, pp. 2201-2214, August 2002. [16]. L. G. Barbero and J. S. Thompson, "Rapid Prototyping of a Fixed-Throughput Sphere Decoder for MIMO Systems", IEEE International Conference on Communications , vol. 7, pp. 3082-3087, June 2006. [17]. Xuan-Nghia Nguyen, Van-Tu Nguyen, Minh-Tuan Le, Xuan-Nam Tran and Vu-Duc Ngo, "High Throughput Modified MMSE Hardware Detector for High-Rate Spatial Modulation System", IEEE Sixth International Conference on Communications and Electronics (ICCE) , Ha Long, Vietnam, July 2016. [18]. X. Chu and J. McAllister, "FPGA based soft-core SIMD processing: A MIMO- OFDM Fixed-Complexity Sphere Decoder case study", 2010 International Conference on Field-Programmable Technology , Beijing, China, Dec 2010. [19]. Kelvin Lee and Babak Daneshrad, "VLSI implementation of a quasi-ml, energy efficient fixed complexity sphere decoder for MIMO communication system", Proceedings of IEEE International Symposium on Circuits and Systems, Paris, France, May 2010. [20]. L. G. Barbero and J. S. Thompson, "A fixed-complexity MIMO detector based on the complex sphere decoder", IEEE 7th Workshop on Signal Processing Advances in Wireless Communications , Cannes, France, July 2006. [21]. C. P. Schnorr and M. Euchner, "Lattice basis reduction: Improved practical algorithms and solving subset sum problems", Math. Program. , vol. 66, no. 2, pp. 181191, 1994. [22]. C. Zheng, X. Chu, J. McAllister and R. Woods, "Real-Valued Fixed-Complexity Sphere Decoder for HighDimensional QAM-MIMO Systems", IEEE Transactions on Signal Processing , vol. 59, no. 9, pp. 4493-4499, 2011. Nghiên cứu khoa học cơng nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 61, 6 - 2019 53 [23]. M. S. Khairy, M. M. Abdallah and S. E. D. Habib, "Efficient FPGA Implementation of MIMO Decoder for Mobile WiMAX System", 2009 IEEE International Conference on Communications , Dresden, Germany, June 2009. ABSTRACT AN EFFICIENT MIMO DETECTOR ARCHITECTURE FOR THE HIGH RATE SPARTIAL MODULATION SYSTEM In this paper, a hardware architecture has been proposed to reduce the complexity of maximum logical receivers (ML: Maximum Likelihood) in the High Rate Spatial Modulation system (HRSM). By combining Sphere Decoding and Sorted QR Decomposition, we propose a hardware architecture of HRSM detector for 4x4 antenna system, 16QAM modulation. Implementation result shows that our design achieves higher throughput compare to other implementations, while still keep latency low and hardware usage acceptable. Keywords: MIMO; HRSM; FSD; VLSI. Nhận bài ngày 16 tháng 5 năm 2019 Hồn thiện ngày 06 tháng 6 năm 2019 Chấp nhận đăng ngày 17 tháng 6 năm 2019 Địa chỉ: 1 Trường Đại học Bách Khoa Hà Nội; 2 Tổng Cơng ty Viễn thơng MobiFone. * Email: nghia.nx@mobifone.vn.

Các file đính kèm theo tài liệu này:

5_nghia_1691_2150349.pdf