Tài liệu Mã hóa lai nguồn - kênh với băng thông mở rộng: Kỹ thuật điều khiển & Điện tử
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 66
MÃ HÓA LAI NGUỒN-KÊNH VỚI BĂNG THÔNG MỞ RỘNG
Nguyễn Minh Quang1, 2*, Nguyễn Đăng Tiến3
Tóm tắt: Kiến trúc mã hóa lai nguồn-kênh đã được sử dụng rộng rãi trong lĩnh
vực truyền thông, đặc biệt là truyền các loại dữ liệu âm thanh, tiếng nói và video.
Mã hóa lai nguồn kênh kết hợp ưu điểm của cả mã hóa số và mã hóa tương tự để
nâng cao chất lượng truyền dữ liệu trong nhiều điều kiện kênh khác nhau. Mặc dù
vậy, trong các nghiên cứu đã có, kiến trúc mã hóa nguồn-kênh chỉ áp dụng cho các
tín hiệu liên tục. Trong bài báo này, chúng tôi tiếp cận bài toán truyền thông tin từ
nguồn rời rạc, qua các loại kênh truyền nhiễu. Cụ thể, bài báo đề xuất mô hình
truyền thông tin dành cho dữ liệu tiếng nói với mã hóa PCM. Chúng tôi giới thiệu
hai mô hình cho phần mã hóa tương tự: mã hóa tuyến tính và mã hóa phi tuyến. Mô
hình mã hóa tuyến tính áp dụng cơ chế bảo vệ thông tin c...
12 trang |
Chia sẻ: quangot475 | Lượt xem: 295 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Mã hóa lai nguồn - kênh với băng thông mở rộng, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỹ thuật điều khiển & Điện tử
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 66
MÃ HÓA LAI NGUỒN-KÊNH VỚI BĂNG THÔNG MỞ RỘNG
Nguyễn Minh Quang1, 2*, Nguyễn Đăng Tiến3
Tóm tắt: Kiến trúc mã hóa lai nguồn-kênh đã được sử dụng rộng rãi trong lĩnh
vực truyền thông, đặc biệt là truyền các loại dữ liệu âm thanh, tiếng nói và video.
Mã hóa lai nguồn kênh kết hợp ưu điểm của cả mã hóa số và mã hóa tương tự để
nâng cao chất lượng truyền dữ liệu trong nhiều điều kiện kênh khác nhau. Mặc dù
vậy, trong các nghiên cứu đã có, kiến trúc mã hóa nguồn-kênh chỉ áp dụng cho các
tín hiệu liên tục. Trong bài báo này, chúng tôi tiếp cận bài toán truyền thông tin từ
nguồn rời rạc, qua các loại kênh truyền nhiễu. Cụ thể, bài báo đề xuất mô hình
truyền thông tin dành cho dữ liệu tiếng nói với mã hóa PCM. Chúng tôi giới thiệu
hai mô hình cho phần mã hóa tương tự: mã hóa tuyến tính và mã hóa phi tuyến. Mô
hình mã hóa tuyến tính áp dụng cơ chế bảo vệ thông tin cân bằng truyền thống,
trong khi mô hình mã hóa phi tuyến sử dụng chỉ số độ quan trọng của các giá trị
nguồn để áp dụng cơ chế bảo vệ thông tin bất cân bằng. Kết quả thực nghiệm cho
thấy, mô hình mã hóa nguồn kênh trong bài báo đưa ra kết quả tốt hơn so với hệ
thống mã hóa số truyền thống, trên nhiều điều kiện kênh truyền khác nhau.
Từ khóa: Mã hóa lai nguồn-kênh, Mã hóa số, Mã hóa tương tự, Truyền thông tin từ nguồn rời rạc.
1. GIỚI THIỆU
Trong bài báo này, chúng tôi đề xuất một mô hình truyền tín hiệu rời rạc qua kênh
không nhớ Gausian, rời rạc về thời gian. Cụ thể, hệ thống được đề xuất truyền dữ liệu
tiếng nói dưới dạng số giữa hai điểm để giải quyết một trong những vấn đề của các hệ
thống truyền âm thanh đó là đảm bảo chất lượng âm thanh ở mức độ tốt, đồng thời giới
hạn băng thông sử dụng.
Dựa trên lý thuyết Shannon về kết hợp mã hóa nguồn và mã hóa kênh, các hệ thống
truyền tin thông thường áp dụng mô hình mã hóa nguồn-kệnh độc lập. Nói cách khác, mã
hóa nguồn được lựa chọn mà không cần thông tin về mã hóa kênh và mã hóa kênh không
cần quan tâm đến phân bố đầu ra của mã hóa nguồn. Hơn nữa, trong một số hệ thống truyền
tin multimedia, một số phần thông tin được gán độ quan trọng cao hơn các phần thông tin
khác, nên được bảo vệ bằng các loại mã hóa kênh tốt hơn các thông tin khác. Chiến lược này
được gọi là bảo vệ bất cân bằng (UEP - Unequal error protection). Việc áp dụng chiến lược
này đem lại hiệu quả cao hơn so với hệ thống truyền thống, nhất là với các loại dữ liệu
multimedia. Trong các công trình đã được công bố, có hai hướng phát triển chính khi áp
dụng mô hình UEP: Bảo vệ theo vị trí dữ liệu (bit-wise UEP) và bảo vệ theo giá trị gói tin
(message-wise UEP) [1]. Với mô hình bảo vệ theo vị trí dữ liệu, các bit trong gói tin gửi đi
sẽ được chia thành các tập con, mỗi tập con được gán một độ quan trọng, ứng với các mức
độ bảo vệ khác nhau. Trong khi đó, mô hình bảo vệ theo gói tin, các gói tin được chia thành
các tập con. Mỗi tập con được gán các mức độ bảo vệ khác nhau.
Tuy nhiên, một nhược điểm của các hệ thống số với mô hình mã hóa nguồn-kênh là
hiệu ứng "chững lại" (leveling-off effect) [2], trong đó, hiệu năng của hệ thống dừng lại ở
một mức cố định, dù tỉ số tín hiệu trên nhiễu tiến đến vô cùng. Các hệ thống mã hóa lai
không có nhược điểm này, nhờ hoạt động của phần mã hóa tương tự. Cụ thể, trong mô
hình mã hóa lai số-tương tự, ta có thể sử dụng kết hợp mã hóa nguồn và mã hóa kênh ở
phần mã hóa số để bảo vệ dữ liệu và tăng hiệu quả truyền thông trong các điều kiện kênh
xấu. Thêm vào đó, bộ ánh xạ tương tự ở phần mã hóa tương tự giúp tăng hiệu năng của hệ
thống ở các kênh có chỉ số CSNR cao. Nhiều mô hình mã hóa lai số-tương tự đã được
nghiên cứu và giới thiệu trong các công trình đã được công bố. Trong các hệ thống truyền
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 67
thông giữa hai điểm, Mittal và Phamdo [3] đề xuất ba mô hình mã hóa lai để tăng chất
lượng truyền tin, đặc biệt là về vùng nhiễu có thể đạt được. Dựa trên các thiết kế đó,
Skoglund và đồng sự [4] đề xuất mô hình mã hóa tuyến tính và mã hóa phi tuyến tính cho
phần tương tự, có thể áp dụng vào mọi giá trị băng thông. Với dữ liệu tiếng nói, các công
trình được trình bày trong [5], [6], [7] đã áp dụng thiết kế mã hóa lai để tăng chất lượng
truyền tiếng nói so với mô hình mã hóa số trong một vài dải CSNR khác nhau. Matthias và
cộng sự [8], [9] đã công bố một vài phiên bản của hệ mã hóa lai có sử dụng điều chế
pulse-code và Adaptive DPCM. Tuy nhiên, thiết kế mã hóa tuyến tính và phi tuyến tính
của họ ở phần tương tự, sử dụng đường cong Archimedes [10], chỉ hoạt động với tín hiệu
liên tục. Rất ít các công trình đã công bố tập trung vào việc ứng dụng mã hóa lai cho tín
hiệu rời rạc.
Trong bài báo này, chúng tôi đưa ra mô hình truyền thông giữa hai điểm, trong đó, dữ
liệu tiếng nói được truyền qua kênh nhiễu Gaussian với sự hỗ trợ của mã hóa lai số-tương
tự. Chúng tôi quan sát thấy các lợi ích đạt được khi khai thác ưu điểm của mã hóa tương tự
khi truyền thông trong các kênh ở các dải CSNR cao. Cụ thể, bằng cách sử dụng một cách
mã hóa thích hợp, dữ liệu số đã được nén bằng phần số được truyền tải đồng thời với việc
truyền tải các giá trị lỗi, các giá trị biểu diễn thông tin mất mát khi thực hiện quá trình
nén/giải nén. Mặt khác, chúng tôi nhận thấy các giá trị lỗi với tần số xuất hiện lớn sẽ có độ
quan trọng lớn hơn các giá trị lỗi còn lại. Do đó, chúng cần được bảo vệ tốt hơn. Xuất phát
từ các quan sát trên, ý tưởng của bài báo này là áp dụng cơ chế bảo vệ bất cân bằng vào
phần tương tự để bảo vệ các giá trị lỗi quan trọng, qua đó, giảm được độ méo của dữ liệu
nhận được. Đóng góp trong bài báo này có thể tóm tắt như sau:
Ứng dụng kiến trúc mã hóa lai số-tương tự vào truyền thông cho nguồn rời rạc, trong
đó, các giá trị rời rạc được lấy từ dữ liệu tiếng nói.
Sử dụng mô hình mã hóa tuyến tính cho các giá trị lỗi rời rạc. Mô hình đề xuất trong
bài báo này là sự mở rộng của mô hình đã được công bố trong [4]. Chúng tôi cũng đề
xuất một mô hình mã hóa phi tuyến tính, trong đó sử dụng kĩ thuật bảo vệ theo gói tin
để tăng hiệu quả của bộ tương tự.
Xây dựng chương trình mô phỏng và chứng minh chất lượng truyền thông của mô
hình đề xuất.
Phần còn lại của bài báo được tổ chức như sau. Sau phần giới thiệu về mô hình mã hóa
số-tương tự ở mục II-A, bài báo mô tả hệ thống mã hóa lai số-tương tự cho dữ liệu tiếng
nói ở mục II-B. Ở mục III, chúng tôi mô tả chi tiết phương pháp mã hóa tuyến tính và phi
tuyến tính cho phần tương tự và sau đó, các kết quả thực nghiệm được mô tả ở mục IV.
Cuối cùng, các kết luận được đưa ra ở phần V.
2. KIẾN TRÚC MÃ HÓA LAI SỐ-TƯƠNG TỰ
2.1. Kiến trúc truyền thống
Hình 1. Mô hình tổng quát của hệ thống mã hóa số-tương tự.
Kỹ thuật điều khiển & Điện tử
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 68
Trong phần này, chúng tôi trình bày mô hình mã hóa lai số-tương tự cho truyền tín hiệu
tương tự qua kênh rời rạc không nhớ. Các phiên bản của mô hình này đã được công bố
trong [4], [11]. Hình 1 mô tả mô hình tổng quát của một hệ thống mã hóa số tương tự,
trong đó, phần số và phần tương tự được kết hợp với nhau. Dưới đây là mô tả chi tiết cách
thức hoạt động của hệ thống.
2.1.1. Phần truyền tin
Tại phần truyền tin, n mẫu iX từ nguồn rời rạc được nhóm lại thành một khối
nX . Bộ mã hóa nguồn, trong đó chứa một bộ mã gồm N vector 0,..., nS S , lấy
nX làm
đầu vào và ánh xạ nX tới một trong số các từ mã của nó. Mỗi từ mã là một nhóm gồm n
mẫu. Chú ý rằng, bộ mã hóa và giải mã cần thống nhất trước về danh sách từ mã trong bộ
mã. Đầu ra của bộ mã hóa nguồn, một chỉ số I của một từ mã, được đưa vào bộ mã hóa
kênh. Bộ mã hóa kênh này sẽ đưa ra kí hiệu kênh kIs , trong đó k n . Chỉ số I đồng thời
cũng được chuyển đến bộ giải mã nguồn. Tại đây, một từ mã IS được chọn ra tương ứng.
Tại phần tương tự, một vector chứa các giá trí lỗi nE được tính bằng cách thực hiện
phép trừ với IS từ
nX . Vector lỗi nE sau đó được gửi đến bộ mã hóa tương tự, trong đó,
nE được ánh xạ tới một vector k chiều 1( ,..., v )
k
kV v , trong đó ,1iv R i k . Hệ
thống thực hiện cộng đầu ra kIs của bộ mã hóa kênh và vector
kV và kết quả của phép tính
này, kR , được gửi đến nơi nhận qua kênh nhiễu.
Chú ý rằng, kí hiệu kênh kIs phải thỏa mãn || s || k (1 t) P
k
IE , trong đó P là tổng
năng lượng trong một lần sử dụng kênh và 0 ≤ t ≤ 1. Thêm vào đó, đầu ra của bộ mã hóa
kV phải thỏa mãn ràng buộc năng lượng || s || k (1 t) PkIE .
2.1.2. Phần nhận tin
Tại phần nhận tin, sau khi nhận được gói tin ˆ kR từ kênh, một bộ giải mã kênh lấy ˆ kR
làm đầu vào và đưa ra một giá trị chỉ số Iˆ ,là giá trị định giá của I ở phần truyền tin. Chỉ số
Iˆ sau đó được đưa vào bộ giải mã nguồn, nơi sẽ sử dụng Iˆ để đưa ra vector ˆ
ˆ n
I
X S ,
ˆ nX là ước lượng của nX ở phần mã hóa số.
Cùng lúc đó, chỉ số Iˆ cũng được truyền tới bộ giải mã kênh để tạo ra kí hiệu kênh ˆ
k
I
s .
Lúc này, ˆ
k
I
s được trừ từ ˆ kR để đưa ra vector 1
ˆ ˆ ˆ( ,..., v )k kV v , một ước lượng của
kV ở
phần gửi tin. Bộ giải mã tương tự sẽ ánh xạ ˆ kV tới ước lượng ˆ nE của vector chứa các giá
trị lỗi nE . Cuối cùng, ước lượng của nX đưa ra bởi hệ thống mã hóa lai được tính bằng
cách cộng ˆ nE vào
ˆ nX .
2.2. Hệ thống mã hóa lai cho dữ liệu tiếng nói
Ý tưởng chính trong bài báo này là mở rộng mô hình mã hóa lai số-tương tự và áp dụng
cho truyền thông với các nguồn rời rạc. Trong hệ thống đề xuất, phần mã hóa và giải mã
số làm việc tương tự như phần mã hóa/giải mã số của hệ thống truyền thống đã mô tả ở
phần trên. Cụ thể, chúng tôi sử dụng một bộ mã hóa AMR, một bộ mã hóa kênh turbo
code và một bộ điều chế pha nhị phân ờ phần số. Tại phần tương tự, chúng tôi nghiên cứu
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 69
và ứng dụng hai loại mã hóa: Mã hóa tương tự và mã hóa số, để ánh xạ từ vector kV tới
vector chứa giá trị lỗi kE . Mô hình hoạt động của hệ thống được mô tả trong hình 2.
Trong phần dưới đây, chúng tôi sẽ trình bày chi tiết cách thức hoạt động của hệ thống.
Hình 2. Mô hình hoạt động của hệ thống mã hóa lai cho dữ liệu tiếng nói.
2.2.1. Phần gửi tin
Trong hệ thống đề xuất, nguồn cần truyền là dữ liệu tiếng nói thô trong định dạng
PCM, với độ dài của mẫu là 16 bits trên một mẫu. Khác với loại nguồn liên tục được sử
dụng trong các hệ thống truyền thống, các mẫu được sử dụng là các giá trị số tự nhiên x,
với 15 152 2 1x . Một chuỗi Q giá trị liên tiếp của x được nhóm lại thành một khối
1 2( , ,..., )QX x x x và đưa vào bộ mã hóa AMR. Đầu ra của bộ mã hóa AMR là các frame
được nén với độ dài n bit, trong đó, giá trị của n phụ thuộc vào chế độ nén được sử dụng
trong bộ mã hóa AMR.
Bộ mã hóa kênh sử dụng mã turbo, với tỷ lệ r. Chúng tôi sử dụng giả thiết bộ mã hóa
kênh được sử dụng đủ thông minh để sửa tất cả các lỗi gây ra bởi kênh trong phần mã hóa
số. Đầu ra của bộ mã hóa kênh (có độ dài là M bit) được đưa vào bộ điều chế pha nhị
phân, tại đó tạo ra kí hiệu {-1,1}Mks . Tỷ lệ r được lựa chọn để thỏa mãn điều kiện:
/ , , 1M n r l P l N l (1)
Tại phần tương tự, chúng tôi sử dụng bộ một giải mã AMR để giải mã các frame nén và
đưa ra đầu ra là một vector khối 1 2( , ,..., )QX x x x , một ước lượng của vector X ở phần
gửi tin. Một vector chứa các giá trị lỗi E, trong đó bao gồm Q số tự nhiên, sẽ được tính
toán dựa trên đầu ra X của bộ giải mã AMR và X.
Tiếp theo, hệ thống cần tìm biểu diễn dưới dạng tương tự của E. Điều này được thực
hiện bằng cách ánh xạ mỗi giá trị số tự nhiên ie E với một bộ l phần tử 1(v ,..., v )i l i l l ,
trong đó , 1,...iv R i l . Hệ thống nhóm Q bộ l liên tiếp, tương ứng với Q giá trị tự nhiên
của vector E, tạo thành một biểu diễn tương tự 1( ,..., )Q lV v v của vector lỗi. Vì mức
năng lượng tại phần số là 1, nên vector V phải thỏa mãn điều kiện về mức năng lượng:
2|| V || (1 )E k P (2)
Vector đầu ra ở phần tương tự V và vector đầu ra S ở phần số được kết hợp với nhau để
tạo thành kí hiệu kênh 1( ,..., )MR r r trước khi được truyền tới nơi nhận, thông qua kênh
thời gian rời rạc, với nhiễu Gaussian W và phương sai 2 một phần:
Kỹ thuật điều khiển & Điện tử
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 70
0 ,
0 #
j j
j
v s j Q l
r
TH
(3)
2.2.2. Phần nhận tin
Tại phần số, một bộ giải mã AMR và một bộ giải mã turbo được sử dụng để tính ước
lượng của X (ở dạng số). Cụ thể, giả sử kí hiệu kênh nhận được là 1
ˆ ˆ ˆ( ,..., )MR r r , hệ
thống sẽ gửi Rˆ đến bộ giải mã turbo. Bộ giải mã này sẽ đưa ra đầu ra là một frame AMR
với độ dài n bit, và gửi frame tới bộ giải mã AMR. Đồng thời, frame cũng được mã hóa
bởi bộ mã hóa turbo và ánh xạ vào một kí hiệu BPSK bởi bộ điều chế. Đầu ra của bộ giải
mã AMR là một ước lượng Xˆ của X ở phần số, trong đó 1
ˆ ˆ ˆ(x ,..., x )QX .
Tại phần tương tự, một ước lượng của vector lỗi V là 1
ˆ ˆ ˆ(v ,..., v )MV , sẽ được tính
bằng cách trừ đầu ra của bộ điều chế từ kí hiệu kênh Rˆ . Bộ giải mã tương tự ánh xạ mỗi
tập con 1
ˆˆ ˆ(v ,..., v ) Vi l i l l vào một giá trị rời rạc iˆe . Lưu ý rằng, mỗi giá trị rời rạc iˆe là
một ước lượng của một phần tử rạc ie trong vector lỗi E. Ước lượng cuối cùng của X, là
1
ˆ ˆ ˆ(x ,..., )QX x , được tính bằng cách cộng vector 0
ˆ ˆ ˆ(e ,..., e )QE với ước lượng Xˆ
tạo
ra bởi bộ giải mã AMR:
ˆ ˆ 0
ˆ
ˆ #
j j
j
j
v s j Q l
r
v TH
(4)
Phần còn lại phải làm rõ trong mô hình này là bộ mã hóa và giải mã ở phần tương tự.
Chúng tôi nghiên cứu hai hệ thống, trong đó ứng dụng bộ mã hóa/giải mã tuyến tính và phi
tuyến tính. Hai hệ thống được trình bày chi tiết trong phần dưới đây.
3. BỘ MÃ HÓA/GIẢI MÃ TƯƠNG TỰ
3.1. Bộ mã hóa/giải mã tuyến tính
Ở hệ thống đầu tiên, chúng tôi sử dụng bộ mã hóa tuyến tính ở phần tương tự. Một cách
tóm tắt, có thể coi mỗi giá trị của vector E được gửi l lần tại đầu ra của bộ mã hóa tuyến
tính này. Nói cách khác, mỗi phần tử ie E được gửi l lần bởi l giá trị giống nhau của V:
1 1...i l i l i l l iv v v a e (5)
trong đó, a là hằng số chúng tôi sử dụng để điều chỉnh độ lớn của tín hiệu phần tương tự.
Để tính giá trị của a, chúng tôi sử dụng phương pháp được trình bày bởi Slokun [4]. Cụ
thể, một hệ số năng lương 0 < ∆ < 1 được gán vào phần tương tự. Hằng số a được chọn để
thỏa mãn điều kiện:
2
2
Qa E E
M Qa E E
(6)
Tại nơi nhận, sau khi nhận được vector con 1ˆ ˆ(v ,..., v )i l i l l , bộ giải mã tuyến tính sẽ
đưa ra ước lượng của mỗi phần tử ie của vector lỗi. Với giả thiết σ đã được biết trước tại
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 71
nơi nhận, chúng tôi mở rộng phương pháp đề xuất bởi Slokun [4] (được đề xuất để áp
dụng trong trường hợp l = 2) để áp dụng trong trường hợp tổng quát của giá trị l như sau:
2 0
1 1ˆ ˆ
1
l
i j
j
e v
l q
(7)
3.2. Bộ mã hóa/giải mã tuyến tính
Chúng tôi đề xuất một phương pháp mã hóa/giải mã ở phần tương tự, trong đó có sử
dụng phương pháp phi tuyến tính, dành cho các giá trị rời rạc và băng thông mở rộng.
Chúng tôi nhận thấy tại các hệ thống với các giá trị tại vector lỗi rời rạc, một số giá trị có
tần suất xuất hiện cao hơn các giá trị còn lại. Do đó, độ méo dữ liệu gây ra do các lỗi tại
các giá trị này nhiều hơn so với độ méo gây ra bởi các lỗi trên các giá trị còn lại. Từ quan
sát này, chúng tôi đưa ra ý tưởng một thiết kế có sử dụng kĩ thuật bảo vệ bất cân bằng,
trong đó, các giá trị quan trọng được bảo vệ tốt hơn các giá trị còn lại.
Trước hết, cần chọn ra K giá trị số tự nhiên ,1ie i K , xuất hiện thường xuyên nhất
trong vector giá trị lỗi. Mỗi giá trị ie được ánh xạ với một điểm trong không gian l chiều,
tức là tương ứng với một bộ gồm l số thực. Chú ý là với các loại nguồn tín hiệu liên tục,
Pal và đồng sự [10] đã chứng minh rằng, độ méo của thông tin qua quá trình truyền thông
có thể giảm bớt bằng cách kéo dãn đường cong tín hiệu (tức là đường cong biểu diễn tín
hiệu trong không gian l chiều). Nếu xem xét ràng buộc về mức năng lượng của kênh trong
không gian hai chiều, công trình của Pal và đồng sự [10] đề xuất sử dụng một đường xoắn
ốc Archimedes để biểu diễn đường cong tín hiệu. Dựa trên kết quả nghiên cứu đó, chúng
tôi đề xuất sử dụng đường cong tín hiệu là các hình chiếu của đường xoắn ốc Archimedes
trên các siêu mặt cầu khác nhau. Các hình chiếu được nối với nhau tại các điểm cực. Trên
đường biểu diễn tín hiệu được tạo thành, chúng tôi chọn ra K điểm để chia đường tín hiệu
thành K + 1 đoạn bằng nhau, mỗi điểm ứng với một trong K giá trị lỗi ie .
Hình 3. Đường cong tín hiệu tạo thành trên 3 mặt cầu.
Ví dụ, trong trường hợp không gian 3 chiều, đường cong tín hiệu được tạo thành bằng
cách nối các hình chiếu đường xoắn ốc Archimedes lên các hình cầu cùng tâm và bán kính
khác nhau. Phương trình của đường xoắn ốc Archimedes trong tọa độ cực là = , với
là hằng số. Cụ thể hơn, các tọa độ của một điểm trong không gian 3 chiều, (x, y, z), sẽ được
sử dụng để biểu diễn một giá trị lỗi e trong phần truyền tin. Hình 3 mô phỏng một đường
cong tín hiệu tạo thành trên ba mặt cầu, các điểm nối được tạo thành tại các điểm cực.
Kỹ thuật điều khiển & Điện tử
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 72
4. KẾT QUẢ MÔ PHỎNG VÀ THẢO LUẬN
Chúng tôi xây dựng một số thí nghiệm để kiểm chứng hiệu quả của mô hình đề xuất
với dữ liệu tiếng nói thô dạng số, dưới hai kịch bản: hệ thống sử dụng mã hóa tuyến tính
và phi tuyến tính. Trong phần sau, chúng tôi sẽ mô tả chi tiết chương trình mô phỏng ở
mục V-A, sau đó, sử dụng chương trình mô phỏng để so sánh hiệu quả của hệ thống đề
xuất và các hệ thống đã có ở mục V-B.
4.1. Chương trình mô phỏng
Chương trình mô phỏng đầu tiên được xây dựng cho dữ liệu tiếng nói, sử dụng thuật
toán nén tiếng nói AMR cho phần mã hóa nguồn, và một bộ mã hóa turbo cho phần mã
hóa kênh. Bộ mã hóa AMR tiến hành nén P = 380 giá trị số tự nhiên từ dữ liệu tiếng nói
dạng thô, tạo thành một frame AMR. Trong thí nghiệm, chúng tôi sử dụng chế độ nến 6.7
kbits/s, có nghĩa là một frame AMR chứa 144 bit (L = 144). Mã hóa kênh turbo với tỷ lệ r
= 1/3, sử dụng với bộ tạo (37, 21) và khối chèn bit ngẫu nhiên. Do đó, đầu ra của phần số
là các vector 432 chiều.
Chương trình mô phỏng thứ hai được thực hiện trên dữ liệu ảnh, sử dụng hệ thống mô
tả phía trên. Dữ liệu ảnh thô dưới định dạng png truyền đi từ phía nguồn. Thuật toán nén
JPEG được sử dụng tại bộ mã hóa nguồn. Các thông số cho các thành phần còn lại của hệ
thống tương tự thông số của chương trình mô phỏng với tiếng nói.
Trong phần mã hóa tuyến tính, mỗi phần tử của vector chứa giá trị lỗi được gửi l = 3
lần bởi V. Cụ thể, chúng tôi sử dụng bộ ba giá trị số thực giống nhau để biểu diễn một giá
trị lỗi, được tính bằng công thức (1) và (2). Giá trị ước lượng của lỗi được tính dựa trên
công thức (3) (lưu ý, tính toán được thực hiện với giả thiết nơi nhận tín hiệu biết trước giá
trị của 2 ).
Trong phần mã hóa phi tuyến tính, chúng tôi tạo ra đường cong tín hiệu bằng cách nối
các hình chiếu của một hình xoắn ốc Archimedes lên bốn mặt cầu. Sau đó, các giá trị lỗi
có tần suất xuất hiện cao nhất được biểu diễn bằng các điểm trên đường cong. Cụ thể,
chúng tôi sử dụng bốn đường cong với công thức sau:
2 2
cos ,
sin ,
z ,s
x c
y c
r c
(8)
trong đó:x, y và z là các biến, c là hằng số, sr , s = 1,2,3 là bán kính của các mặt cầu.
Chúng tôi chọn giá trị c = 0.065 và gán một hằng số ∆ cho phần tương tự, giá trị của sr
được tính từ công thức:
QE E
M QE E
(9)
Các giá trị quan trọng được chọn ra từ các giá trị lỗi theo tần suất xuất hiện của chúng
trong vector lỗi. Cụ thể, các giá trị có tần suất suất hiện cao nhất sẽ được chọn ra và biểu
diễn trên đường cong tín hiệu. Ví dụ, đồ thị trong hình 4 mô tả tần suất xuất hiện của 1000
giá trị lỗi trong khoảng (-500, 500) của dữ liệu âm thanh. Dựa vào đồ thị này, các giá trị
lỗi quan trọng sẽ được lọc ra.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 73
Hình 4. Tần suất xuất hiện của các giá trị lỗi với dữ liệu âm thanh.
4.2. Kết quả mô phỏng
Hình 5. Kết quả mô phỏng về chỉ số chất lượng trung bình (MOS).
Hình 5 và 6 mô tả kết quả mô phỏng của các hệ thống về chỉ số ý kiến chất lượng trung
bình MOS [12] và giá trị bình phương trung bình
2
10
ˆ10 logMSE E X X (10)
cho các hệ thống sau:
Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình tuyến tính.
Hai hệ thống này được đánh giá trên tỷ số năng lượng ∆ = 0.1 và ∆ = 0.4.
Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến
tính, trong đó 600 giá trị lỗi được biểu diễn bởi 600 điểm trong đường cong tín hiệu.
Tỷ số năng lượng sử dụng là ∆ = 0.1 và 0.4.
Kỹ thuật điều khiển & Điện tử
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 74
Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến
tính với 1000 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng,
giống như hai hệ thống trên, là ∆ = 0.1 và 0.4.
Một hệ thống bảo vệ bất cân bằng, trong đó sử dụng mã hóa nguồn là bộ mã hóa
AMR ở chế độ 6.7 bits/s, một bộ turbo code với tỷ số 1/ 5hr cho dữ liệu header
của các frame, và 8 / 23cr cho dữ liệu thuộc lớp A và B của các frame (chú ý,
trong chế độ 6.7 bits/s, các dữ liệu trong các frame AMR không có class C).
Hình 6. Kết quả mô phỏng về giá trị bình phương trung bình (MSE).
Hình 7 mô tả kết quả chương trình mô phỏng dựa trên chỉ số SSIM [13] với dữ liệu
ảnh, với các hệ thống:
Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến
tính với 600 giá trị lỗi được biểu diễn trong đường cong tín hiệu và ∆ = 0.1 và 0.4.
Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến
tính với 1000 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng, ∆ =
0.1 và 0.4.
Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến
tính với 600 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng, ∆ =
0.1 và 0.4.
Như được thể hiện trong Hình 5, xét trên chỉ số MOS, hệ thống lai số-tương tự cho kết
quả tốt hơn so với hệ thống chỉ sử dụng mã hóa số và mô hình bảo vệ bất cân bằng, trên tất
cả các điều kiện kênh thuộc dải CSNR từ 0 dB đến 25 dB. Cụ thể, hệ thống lai số-tương tự
với mã hóa tuyến tính hoạt động tốt hơn so với hệ thống số trên các dải CSNR từ 0 dB đến
12 dB và từ 17 dB đến 25 dB. Hơn thế nữa, hệ thống trang bị mã hóa phi tuyến tính ở phần
tương tự với 1000 điểm trên đường cong tín hiệu cũng đạt được chỉ số MOS tốt hơn sơ với
hệ thống sử dụng mã hóa số đơn thuần trong dải CSNR thấp (từ 0 dB đến 5 dB) và dải
CSNR cao (từ 10 dB đến 25 dB). Tương tự, ở Hình 6, có thể thấy hiệu quả đáng kể của mô
hình lai so với mô hình mã hóa số nếu xét trên chỉ số MSE. Ví dụ, xét chỉ số MSE, trong
trường hợp mã hóa tuyến tính và ∆ = 0.4, hệ thống mã hóa lai cho kết quả cao hơn so với
hệ thống số 6 db và 12 dB, tương ứng ở các giá trị CSNR = 0 dB và CSNR = 3 dB. Sự cải
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 75
tiến này thể hiện rõ rệt hơn ở dải CSNR cao, khi hệ thống lai tốt hơn hệ thống số ít nhất
22.5 dB trong dải CSNR từ 15 đến 15 dB. Điều này thể hiện ưu điểm của bộ mã hóa tương
tự trong truyền dữ liệu tiếng nói. Tương tự, ở hình 7, hệ thống lai số-tương tự sử dụng mô
hình phi tuyến tính cũng cho kết quả tốt hơn so với các hệ thống mã hóa số với kĩ thuật
bảo vệ bất cân bằng và mã hóa số-tương tự kết hợp mô hình tuyến tính. Cụ thể, hệ thống
số-tương tự với mã hóa phi tuyến cho kết quả tốt hơn hệ thống số-tương tự và mã hóa
tuyến tính trên một dải rộng của điều kiện kênh, từ CSNR = 8 dB đến CSNR = 23 dB, với
khác biết lớn nhất xét trên chỉ số SSIM là 0.225 tại CSNR = 11 dB.
Hình 7. Kết quả mô phỏng với chỉ số SSIM.
Chú ý rằng, hệ thống trang bị mã hóa phi tuyến tính sẽ có hiệu ứng "chững lại"
(leveling-off effect), tức là hiệu năng của hệ thống giữ nguyên tại một giá trị hằng số, dù
chỉ số CSNR tiếp tục tăng đến vô cùng. Ví dụ, hiệu năng của hệ thống với mã hóa phi
tuyến tính, 600 điểm trên đường tín hiệu và ∆ = 0.1 và 0.4 dừng ở MOS = 4.389, với tất cả
các giá trị CSNR lớn hơn 14 dB và 17 dB, tương ứng. Tương tự, nếu xét chỉ số MSE, các
hệ thống dừng lại ở MSE = 65.8 dB với tất cả các giá trị CSNR lớn hơn 15 dB và 18 dB.
Với chỉ số SSIM và dữ liệu ảnh, kết quả của hệ thống dừng lại tại SSIM = 0.829 và SSIM
= 0.839 tương ứng với hệ thống 600 điểm và 1000 điểm trên đường cong tín hiệu. Lý do vì
với các hệ thống phi tuyến tính, ta chỉ có thể truyền các giá trị xấp xỉ của lỗi, chứ không có
khả năng truyền tất cả các giá trị một cách chính xác. Như vậy, tại nơi nhận tin, không có
đủ cơ sở để khôi phục lại hoàn toàn gói tin đã truyền đi, kể cả trong trường hợp kênh
không có nhiễu. Ngược lại, hệ thống được trang bị cơ chế mã hóa tuyến tính khắc phục
hạn chế này. Nói cách khác, chỉ số MOS trong hệ thống với mã hóa tuyến tính sẽ tăng khi
chỉ số CSNR của kênh tăng. Lý do dẫn đến điều này là do nguyên lý hoạt động của mã hóa
tương tự tuyến tính, trong đó tất cả các giá trị lỗi đều có khả năng được ước chính xác,
miễn là điều kiện kênh đủ tốt.
Chúng tôi cũng chú ý rằng, trong với trường hợp mã hóa phi tuyến, đường cong tín
hiệu với 1000 điểm cho kết quả tốt hơn so với đường cong có 600 điểm trên dải CSNR
cao. Thêm vào đó, ngưỡng đạt được trong hiệu ứng "chững lại" của đường cong 1000
điểm cũng tốt hơn. Lý do cho hiện tượng này là đường cong với 1000 điểm có khả năng
biểu diễn tín hiệu tốt hơn các giá trị lỗi so với đường cong 600 điểm. Trong các điều kiện
kênh tốt, ứng với dải CSNR cao, nơi nhận có thể khôi phục các giá trị lỗi với độ méo thấp.
Từ đó, số giá trị lỗi ở đường cong 1000 điểm được khôi phục chính xác nhiều hơn số giá
trị lỗi được khôi phục ở trường hợp còn lại, dẫn đến kết quả tốt hơn.
Một điểm chú ý nữa được rút ra từ Hình 5 là hiệu quả của hệ thống mã hóa phi tuyến
tính tốt hơn so với hệ thống mã hóa tuyến tính trên dải CSNR cao. Ví dụ, xét chỉ số MOS,
Kỹ thuật điều khiển & Điện tử
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 76
mã hóa phi tuyến sử dụng đường cong 600 điểm đưa ra kết quả cao hơn so với mã hóa
tuyến tính trên dải CSNR từ 14 dB đến 24 dB, với các hệ thống có ∆ = 0.4. Hơn nữa, kết
quả này còn tốt hơn nếu xét trên chỉ số MSE. Cụ thể, trên dải CSNR từ 17 dB đến 25 dB,
mã hóa phi tuyến với đường cong tín hiệu 1000 điểm tốt hơn má hóa tuyến tính ít nhất
55.1 dB và 55.3 dB với ∆ = 0.4, tương ứng. Điều này chứng minh ưu điểm của việc áp
dụng kĩ thuật bảo vệ bất cân bằng trong phần tương tự đã được đề xuất trong bài báo.
Chúng tôi cũng nhận thấy rằng, mã hóa tuyến tính cho kết quả tốt hơn mã hóa phi tuyến ở
dải các giá trị CSNR thấp. Cụ thể, hệ thống trang bị mã hóa tuyến tính và ∆ = 0.4 đạt được
kết quả tốt hơn so với mã hóa phi tuyến trong khoảng CSNR từ 0 dB đến 10 dB, kết quả
tốt hơn ít nhất là 0.45 và 8.45 dB, xét trên chỉ số MOS và MSE tương ứng. Nguyên nhân
của hiện tương này là với điều kiện kênh tồi, nhiễu của kênh có thể đưa một điểm từ một
phần trên đường cong tin hiệu tới một phần khác cách xa phần ban đầu. Điều này dẫn tới
sai khác lớn khi nơi nhận khôi phục giá trị ban đầu của lỗi.
Cuối cùng, một điểm đáng chú ý là các hệ thống sử dụng giá trị ∆ lớn đạt chất lượng
truyền tin tốt hơn so với hệ thống sử dụng giá trị ∆ nhỏ. Lý do dẫn đến hiện tượng này là
quá trình khôi phục thông tin sẽ thực hiện tốt hơn với sự hỗ trợ của giá trị ∆ lớn, khi các
điểm trên đường cong tín hiệu có xu hướng cách xa nhau. Việc sử dụng giá trị ∆ nhỏ sẽ
làm cho hệ thống nhạy cảm hơn với nhiễu, làm giảm chất lượng khôi phục dữ liệu gốc.
5. KẾT LUẬN
Trong bài báo này, chúng tôi đã đề xuất một mô hình mã hóa lai số-tương tự, trong đó
ứng dụng kiến trúc mã hóa kết hợp nguồn-kênh ở phần số, tận dụng ưu điểm của bộ mã
hóa tương tự ở phần tương tự. Việc áp dụng cơ chế bảo vệ bất cân bằng ở phần tương tự
giúp nâng cao chất lượng truyền tin của hệ thống, giảm độ méo dữ liệu, nhờ tận dụng được
thông tin về xác suất phân bố của các giá trị trong vector lỗi. Kết quả thực nghiệm cho
thấy, hệ thống đề xuất đưa đến kết quả tốt hơn so với các hệ thống mã hóa lai số-tương tự
truyền thống và hệ thống mã hóa số đơn thuần.
TÀI LIỆU THAM KHẢO
[1]. S. Borade, B. Nakiboglu, and L. Zheng, “Unequal error protection: some
fundamental limits,” in IN PROC. OF THE INTERNATIONAL SYMPOSIUM ON
INFORMATION THEORY. Citeseer, 2008.
[2]. C. E. Shannon, “Communication in the presence of noise,” Proceedings of the IRE,
Vol. 37, no. 1, pp. 10–21, 1949.
[3]. U. Mittal and N. Phamdo, “Hybrid digital-analog (hda) joint sourcechannel codes
for broadcasting and robust communications,” IEEE Transactions on Information
Theory, Vol. 48, no. 5, pp. 1082–1102, 2002.
[4]. M. Skoglund, N. Phamdo, and F. Alajaji, “Hybrid digital–analog source–channel
coding for bandwidth compression/expansion,” IEEE Transactions on Information
Theory, Vol. 52, no. 8, pp. 3757–3763, 2006.
[5]. T. Miki, C.-E. Sundberg, and N. Seshadri, “Pseudo-analog speech transmission in
mobile radio communication systems,” IEEE transactions on vehicular technology,
Vol. 42, no. 1, pp. 69–77, 1993.
[6]. N. Phamdo and U. Mittal, “A joint source-channel speech coder using hybrid digital-
analog (hda) modulation,” IEEE transactions on speech and audio processing, Vol.
10, no. 4, pp. 222–231, 2002.
[7]. C. Hoelper and P. Vary, “Bandwidth-efficient mixed pseudo analoguedigital speech
and audio transmission,” in Multimedia Signal Processing, 2006 IEEE 8th
Workshop on. IEEE, 2006, pp. 141–145.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 77
[8]. M. Rungeler, J. Bunte, and P. Vary, “Design and evaluation of hybrid¨ digital-
analog transmission outperforming purely digital concepts,” IEEE Transactions on
Communications, Vol. 62, no. 11, pp. 3983–3996, 2014.
[9]. M. Rungeler, F. Kleifgen, and P. Vary, “Wideband speech coding with ¨ hybrid
digital-analog transmission,” in Signal Processing Conference (EUSIPCO), 2015
23rd European. IEEE, 2015, pp. 784–788.
[10]. P. A. Floor and T. A. Ramstad, “Optimality of dimension expanding shannon-
kotel’nikov mappings,” in Information Theory Workshop, 2007. ITW’07. IEEE.
IEEE, 2007, pp. 289–294.
[11]. P. Minero, S. H. Lim, and Y.-H. Kim, “A unified approach to hybrid coding,” IEEE
Transactions on Information Theory, Vol. 61, no. 4, pp. 1509–1523, 2015.
[12]. P.862: Perceptual evaluation of speech quality (pesq): “An objective method for end-
to-end speech quality assessment of narrowband telephone networks and speech
codes.” Available:
ABSTRACT
HYBRID SOURCE–CHANNEL CODING FOR BANDWIDTH EXPANSION
The structure of hybrid source–channel coding has extensively used in
telecommunication, especially in transmitting speed or video data. Hybrid source-
channel coding integrates the advantages of both digital-coding and analog-coding
to improve the quality of data transmission in different types of channels. However,
in existing works, hybrid source-channel coding has been only applied for
continuous signal. In this paper, an information transmission model for discrete
signals is proposed. Specifically, two different models for analog encoding: linear
analog coding and nonlinear analog encoding are introduced. Linear encoding
model utilizes equal error protection mechanism while the nonlinear coding model
uses unequal error protection mechanism with significant information from source.
The experimental result shows that our proposed methods outperform existing
works in terms of transmission quality.
Keywords: Hybrid source-channel coding, Digital Coding, Analog Coding, Information transmission from
discrete source.
Nhận bài ngày 10 tháng 5 năm 2017
Hoàn thiện ngày 5 tháng 9 năm 2017
Chấp nhận đăng ngày 25 tháng 10 năm 2017
Địa chỉ: 1Viện Công nghệ Thông tin và Truyền thông, Đại học Bách Khoa Hà Nội;
2SAMOVAR, Télécom SudParis, CNRS, Université Paris-Saclay,
9 rue Charles Fourier - 91011 Evry Cedex;
3Trường Đại học Kỹ thuật Hậu cần Công an Nhân dân, Bộ Công an.
*Email: quangnm@hnue.edu.vn.
Các file đính kèm theo tài liệu này:
- 09_tien_1344_2150434.pdf