Tài liệu Nâng cao hiệu quả phương pháp nhúng đánh dấu bit bằng kỹ thuật nhóm các đoạn tín hiệu không có dữ liệu nhúng - Vũ Văn Tâm: Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 93
NÂNG CAO HIỆU QUẢ PHƯƠNG PHÁP NHÚNG ĐÁNH DẤU BIT
BẰNG KỸ THUẬT NHÓM CÁC ĐOẠN TÍN HIỆU
KHÔNG CÓ DỮ LIỆU NHÚNG
Vũ Văn Tâm1*, Phan Trọng Hanh2
Tóm tắt: Tín hiệu audio thường biến đổi chậm, do đó khi thực hiện nhúng dữ
liệu mật vào tín hiệu audio bằng phương pháp đánh dấu bit (BM: Bit Marking) kết
hợp với kỹ thuật cửa sổ trượt (SW: Slingding Window) cho phẩm chất lỗi nhúng
(EE: Embedding Error) và tỉ số tín hiệu trên tạp âm (SNR: Signal-to-Noise Ratio)
của tín hiệu nhúng không đồng đều. Từ đó giảm tính 'trong suốt' của tín hiệu nhúng
khi truyền dẫn hoặc lưu trữ. Trong bài báo này, chúng tôi đề xuất cải tiến phương
pháp nhúng BM kết hợp với kỹ thuật SW bằng kỹ thuật nhóm đoạn (SG: Segment
Group). Việc giảm EE, tăng SNR được thực hiện bằng cách loại bỏ các bit dư
thừa, các đoạn tín hiệu nhúng liền kề không chứa dữ liệu mật sẽ được nhóm lại, chỉ
sử dụng 2 bit để đánh dấu không nhú...
8 trang |
Chia sẻ: quangot475 | Lượt xem: 480 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Nâng cao hiệu quả phương pháp nhúng đánh dấu bit bằng kỹ thuật nhóm các đoạn tín hiệu không có dữ liệu nhúng - Vũ Văn Tâm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 93
NÂNG CAO HIỆU QUẢ PHƯƠNG PHÁP NHÚNG ĐÁNH DẤU BIT
BẰNG KỸ THUẬT NHÓM CÁC ĐOẠN TÍN HIỆU
KHÔNG CÓ DỮ LIỆU NHÚNG
Vũ Văn Tâm1*, Phan Trọng Hanh2
Tóm tắt: Tín hiệu audio thường biến đổi chậm, do đó khi thực hiện nhúng dữ
liệu mật vào tín hiệu audio bằng phương pháp đánh dấu bit (BM: Bit Marking) kết
hợp với kỹ thuật cửa sổ trượt (SW: Slingding Window) cho phẩm chất lỗi nhúng
(EE: Embedding Error) và tỉ số tín hiệu trên tạp âm (SNR: Signal-to-Noise Ratio)
của tín hiệu nhúng không đồng đều. Từ đó giảm tính 'trong suốt' của tín hiệu nhúng
khi truyền dẫn hoặc lưu trữ. Trong bài báo này, chúng tôi đề xuất cải tiến phương
pháp nhúng BM kết hợp với kỹ thuật SW bằng kỹ thuật nhóm đoạn (SG: Segment
Group). Việc giảm EE, tăng SNR được thực hiện bằng cách loại bỏ các bit dư
thừa, các đoạn tín hiệu nhúng liền kề không chứa dữ liệu mật sẽ được nhóm lại, chỉ
sử dụng 2 bit để đánh dấu không nhúng cho một nhóm. Kết quả phân tích, tính
toán và thực nghiệm cho thấy kỹ thuật đề xuất đã cải thiện được phẩm chất của tín
hiệu nhúng.
Từ khóa: Nhúng tín hiệu, Group segment, Bit marking, Sliding window.
1. ĐẶT VẤN ĐỀ
Kỹ thuật nhúng dữ liệu mật (steganography) vào tín hiệu audio đang được ứng dụng
rộng rãi trong nhiều lĩnh vực, đặc biệt là lĩnh vực quốc phòng, an ninh [1]. Khi đó dữ liệu
mật được nhúng (embedded) vào tín hiệu audio và hầu như không làm ảnh hưởng tới chất
lượng của tín hiệu audio [1,2,3]. Tín hiệu nhúng được truyền dẫn với các thuộc tính của hệ
thống truyền dẫn có sẵn. Tại phía thu, người nhận thực hiện giải nhúng (de-embedded) để
nhận được dữ liệu mật.
Các phương pháp nhúng dữ liệu mật vào tín hiệu audio trước đây bao gồm: LSB
(Least Significant Bit) [1,3,4,5], echo coding [2,4], parity coding [2,4], phase coding [2,4],
kỹ thuật trải phổ [2,4], ELS (Embedding Large Sample) [5] thực hiện nhúng trực tiếp dữ
liệu mật vào tín hiệu audio. Vì vậy, dữ liệu mật làm ảnh hưởng đáng kể đến chất lượng của
tín hiệu audio. Do đó, khi truyền dẫn hoặc lưu trữ tín hiệu nhúng có thể làm đối phương
nghi ngờ [1,2,3].
Tại [6], chúng tôi đã đề xuất phương pháp nhúng BM và tại [7] chúng tôi cũng đã đề
xuất cải tiến BM bằng kỹ thuật SW. Trong đó, dữ liệu mật được nhúng gián tiếp vào tín
hiệu audio bằng cách tìm trong tín hiệu audio đoạn [bit] trùng với dữ liệu mật; Sử dụng
[bit] (với ) để đánh dấu vị trí của đoạn bit tìm được. Do đó, khi nhúng thành
công [bit] dữ liệu, sẽ giảm được bit ghi đè vào tín hiệu audio
bit (1)
Tuy nhiên, nếu nhúng không thành công, thì cần phải tốn một bit để đánh dấu (báo cho
phía thu) đoạn tín hiệu nhúng đang xét không chứa dữ liệu mật. Do vậy, tổng số bit dùng
để đánh dấu BM+SWS là:
BM+SW 0bit S q q (2)
với q là số đoạn dữ liệu mật, 0q là số bit đánh dấu không nhúng. Để giảm EE thì cần
phải giảm BM+SWS , sao cho:
Kỹ thuật điều khiển & Điện tử
V.V. Tâm, P.T. Hanh, “Nâng cao hiệu quả phương pháp nhúng dữ liệu nhúng.” 94
BM+SW S B (3)
với B là kích thước dữ liệu mật. q được tính theo công thức:
B
q
(4)
Do tín hiệu audio thường biến đổi chậm, nên các đoạn tín hiệu audio liền kề thường
khác nhau không đáng kể. Vì vậy khi nhúng bằng phương pháp BM+SW, thường có các
đoạn tín hiệu nhúng liền kề không chứa dữ liệu mật (do nhúng không thành công liên
tiếp), khi đó 0q sẽ tăng làm cho EE tăng và SNR giảm.
Trong bài báo này, chúng tôi đề xuất cải tiến phương pháp nhúng BM+SW bằng kỹ
thuật SG; Gộp đoạn tín hiệu nhúng liền kề không chứa dữ liệu mật thành một nhóm; Sử
dụng 2 bit để đánh dấu không nhúng cho nhóm (thay cho phải sử dụng bit như trước).
Kết quả tính toán và thực nghiệm cho thấy, phẩm chất EE, SNR của tín hiệu nhúng được
cải thiện đáng kể so với phương pháp nhúng BM+SW. Bài báo có những đóng góp sau:
Đề xuất kỹ thuật SG, để giảm được 2 bit ghi đè vào tín hiệu audio
cho một lần nhóm so với phương pháp nhúng BM+SW, với 2 ;
Phân tích, tính toán các tham số liên quan, thực nghiệm và so sánh kết quả với
phương pháp nhúng BM+SW.
Phần còn lại của bài báo có cấu trúc như sau: Mô hình nhúng, giải nhúng theo phương
pháp nhúng BM+SW+SG được trình bày trong mục 2; Mục 3 phân tích và tính toán các
tham số EE, SNR; Mục 4 là kết quả thực nghiệm và đánh giá so sánh với phương pháp
nhúng BM+SW; Các kết luận và định hướng nghiên cứu tiếp theo được trình bày trong
mục 5.
2. MÔ HÌNH HỆ THỐNG
2.1. Cấu trúc mô hình
Hình 1. Cấu trúc mô hình nhúng, giải nhúng BM+SW kết hợp kỹ thuật đề xuất (SG).
Hình 1 là mô hình nhúng, giải nhúng bằng phương pháp BM+SW+SG. Mô hình được
mô tả như sau:
Nhúng
BM +
SW
So sánh
và tách
đoạn
Khôi
phục
nhúng
Nhóm
đoạn
Mã hóa
nhóm
Ghép
~ ~
C
B
'
C
'
2C
'
1C
C 3C
'
3C
''
C
Phía thu
Giải
Nhúng
BM+SW
Tách
B
'
1C
'
3C
''
C
Người dùng thông thường
''
C
Phía phát
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 95
Tín hiệu audio gốc C được cho bởi (5,6,7,8). Trong đó jC là mẫu audio thứ j , n là
tổng số mẫu audio của C , C là đoạn audio thứ , p là tổng số đoạn C của C và là
số mẫu jC trong C .
; 1, 2, ... jC C j n (5)
C
p
(6)
; 1, 2, ... C C p (7)
; 1, 2, ... jC C j (8)
Dữ liệu mật B được cho bởi (9,10), với B là đoạn dữ liệu thứ , q là tổng số đoạn
B của B và là số bit của B .
; 1, 2, ... B B q (9)
bitB (10)
'C là kết quả nhúng B vào C theo [6,7]. C được mô tả bởi (11,12), với 'C là đoạn tín
hiệu nhúng thứ và 'jC là mẫu audio có nhúng thứ j .
' ' ; 1, 2, ... C C p (11)
' ' ; 1, 2, ... jC C j (12)
'
2C là đoạn tín hiệu nhúng không chứa B (hình 2), tuy nhiên do
'
2C có 1 bit bị ghi
đè nên lỗi nhúng 2EE trong đoạn '2C sẽ được tính theo công thức:
' 22EE 1 bitC C (13)
Khi khôi phục '2C trở về đoạn tín hiệu audio gốc ( 2
'C C ), thì lỗi nhúng trong đoạn
này được tính theo công thức:
' 22EE 0 bitkp C C C C (14)
[bit]
B
[bit]
B
đoạn '
2C liền kề
'
1C '1C
bit dư thừa
0
q
Hình 2. Mô tả đoạn tín hiệu audio '
1C ,
'
2C và các bít dư thừa 0q .
Kỹ thuật điều khiển & Điện tử
V.V. Tâm, P.T. Hanh, “Nâng cao hiệu quả phương pháp nhúng dữ liệu nhúng.” 96
'1C là đoạn tín hiệu nhúng có B (hình 2) [6] thì lỗi nhúng 1EE là:
' 11EE bitC C , (15)
với là số đoạn ' 2C ở giữa hai đoạn '1C . 3C là nhóm tín hiệu nhúng, gồm đoạn
'
2C liền kề,
23 ' ; 1, 2, ... C C . (16)
3
'C là nhóm tín hiệu nhúng 3C , đã được khôi phục nhúng ( '2C C ) và ghi đè 2 bit
đánh dấu ( 1g hoặc g ) để báo phía thu nhóm 3'C không có B (hình 3, 4):
23 ''' ; 1, 2, ... C C . (17)
"
C là tín hiệu nhúng được đưa vào hệ thống truyền dẫn hoặc lưu trữ ( ''C được ghép
nối tiếp từ
3
'C và '1C theo trình tự của
'C )
' '''
1 3 (serial) C C C . (18)
2.2. Hoạt động của mô hình
+ Quá trình nhúng: Dữ liệu mật B được nhúng vào tín hiệu audio C theo phương
pháp nhúng BM+SW [6,7] thành tín hiệu nhúng ( 'C ). Theo [6], EE được tính là:
BM+SW BM+SWEE S (19)
BM+SW 0EE q + q (20)
Trong đó q là tổng số bit đánh dấu cho q đoạn ' 1C có chứa B , 0q là tổng số bit
đánh dấu cho 0q đoạn
'
2C không chứa B . Để loại bỏ 0q chúng tôi thực hiện so sánh
'C
với C để tách ' 1C và
'
2C .
'
1C có chứa B được giữ nguyên, còn
'
2C được so sánh với C
của C để khôi phục nhúng.
'
2C C (21)
0 0q (22)
'
1C '1C '1C '1C
'
3C '3C
1
= 01g 0 0 g
Hình 3. Đánh dấu nhóm khi < . Hình 4. Đánh dấu nhóm khi .
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 97
Tuy nhiên, để báo phía thu biết không có B trong các đoạn
'
2C chúng tôi gộp
đoạn ' 2C liền kề thành một nhóm 3C theo (16) (với 2 và được chọn tối ưu bằng
cách nhóm thử sao cho EE là nhỏ nhất) và ghi đè 2 bit vào nhóm 3C thành 3
'C (hình 3)
tương ứng hai trường hợp sau:
(i). Khi < thì chuỗi 1 01g được ghi đè vào 3C (hình 3);
(ii). Khi thì chuỗi 00g được ghi đè vào 3C (hình 4).
1 bit bit 2g g (23)
' '
C được tạo thành theo (18), người dùng thông thường sử dụng ''C như C , mà không
cảm nhận được sự khác biệt.
+ Quá trình giải nhúng: Tại phía thu sẽ thực hiện quá trình xử lý tín hiệu ngược lại với
phía phát, đó là: Tách q đoạn '1C từ
''C (bỏ qua
3
'C vì không chứa B ), chỉ cần giải
nhúng q đoạn '1C để nhận được q đoạn B , ghép lại theo (9) để được B .
3. PHÂN TÍCH VÀ TÍNH TOÁN CÁC THAM SỐ
3.1. Lỗi nhúng BM+SW+SGEE
Từ công thức (19,20,23), BM+SW+SGEE được tính theo công thức:
0
1 2BM+SW+SG 1
1 1 1 1
EE
qq fe
z x
z x
EE EE g g
(24)
trong đó e là số lần sảy ra trường hợp (i), f là số lần sảy ra trường hợp (ii). Các đoạn
'
2C được khôi phục nhúng, nên 2 = 0xEE với x và kết hợp với (23) chúng ta có:
1BM+SW+SG
1
EE 0 2
q
z
z
EE e f
(25)
BM+SW+SGEE 2 q e f (26)
3.2. Tỉ số tín hiệu trên tạp âm BM+SW+SGSNR
Theo [6,7] thì BM+SWSNR được tính theo công thức sau:
2
1
10BM+SW
0
C
10 logSNR
n
j
j
q q
(27)
Với kỹ thuật đề xuất, khi kết hợp (20,26,27) thì BM+SW+SGSNR được tính như sau:
2
1
BM+SW+SG 10
C
SNR dB 10log 2
n
j
j
q e f
. (28)
Kết hợp (20,26,27) và (28) chúng ta có:
- Nếu 02 e f q thì BM+SW+SG BM+SWEE < EE và BM+SW+SG BM+SWSNR SNR ;
- Nếu 02 = e f q thì BM+SW+SG BM+SWEE = EE và BM+SW+SG BM+SWSNR = SNR ;
Kỹ thuật điều khiển & Điện tử
V.V. Tâm, P.T. Hanh, “Nâng cao hiệu quả phương pháp nhúng dữ liệu nhúng.” 98
- Nếu 02 > e f q thì BM+SW+SG BM+SWEE > EE và BM+SW+SG BM+SWSNR < SNR .
4. KẾT QUẢ THỰC NGHIỆM
4.1. Mô hình thực nghiệm
Để minh chứng cho tính ưu việt của kỹ thuật đề xuất, chúng tôi đã tiến hành thực
nghiệm với các tham số như sau: C là 50 file audio định dạng kiểu *.Wave:
testC ; test = 1, 2, .., 50 , có tiết tấu nhanh, chậm khác nhau; Tham số cơ bản của các file
wave đưa vào thực nghiệm được mô tả tại hình 5. B là 10 file text có dung lượng khác
nhau: textB ; tex = 1, 2, .., 10t . Công cụ thực nghiệm: Sử dụng ngôn ngữ lập trình Visual
Basic để cài đặt các thuật toán nhúng và giải nhúng theo phương pháp nhúng BM+SW và
phương pháp nhúng BM+SW+SG; Sử dụng ngôn ngữ Matlab để tính toán và vẽ biểu đồ so
sánh. Quy trình thử nghiệm: Mỗi file audio được nhúng với 10 file text, kết quả sẽ có 500
file tín hiệu nhúng test'C ; test = 1, 2, .., 500 . Lấy trung bình trung các tham số EE, SNR để
lập biểu đồ so sánh.
Hình 5. Chương trình thực nghiệm nhúng, giải nhúng với kỹ thuật đề xuất.
2.2. Phân tích kết quả
1). Hình 6 là đồ thị biểu diễn phẩm chất EE khi thực hiện nhúng B vào C tương ứng
hai trường hợp: (i) Nhúng BM+SW (không sử dụng kỹ thuật đề xuất); (ii) Nhúng
BM+SW+SG (có sử dụng kỹ thuật đề xuất). Kết quả cho thấy kỹ thuật đề xuất đã làm EE
giảm đáng kể, đó là do: Kỹ thuật đề xuất đã loại bỏ hoàn toàn các bit dư thừa 0q ; Đồng
thời chỉ sử dụng 2 bit để đánh dấu cho 1 nhóm tín hiệu nhúng, thay cho phải sử dụng
bitw như trước (hình 2, hình 3).
2). Kỹ thuật đề xuất sẽ phát huy hiệu quả cao khi B có dung lượng nhỏ hoặc quá lớn,
bởi vì: Khi B quá nhỏ thì B chủ yếu được nhúng ở phần đầu của file audio, khi B quá lớn
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 99
thì B sẽ được nhúng cả phần đầu và cuối của file audio; Do phần đầu và cuối của các file
audio thường là các khoảng trắng 0jC hoặc có tiết tấu rất chậm, nếu không sử dụng kỹ
thuật đề xuất thì 0q sẽ tăng nhanh và làm cho EE tăng theo. Cũng giải thích tương tự như
trên khi C có dung lượng nhỏ hoặc có tiết tấu chậm (bài hát, bản nhạc nhẹ) thì kỹ thuật đề
xuất cũng sẽ cho hiệu quả cao.
3). Hình 7 là đồ thị biểu diễn phẩm chất SNR [dB], kết quả cho thấy phẩm chất SNR
của tín hiệu nhúng tăng lên khi sử dụng thêm kỹ thuật đề xuất. Đó là do kỹ thuật đề xuất
đã làm EE giảm, mà vẫn giữ nguyên định dạng và cấu trúc của tín hiệu audio. Phẩm chất
EE, SNR [dB] của tín hiệu nhúng được cải thiện đã chứng tỏ tính ưu việt của kỹ thuật đề
xuất, 02 e f q và các tính toán ở nêu trên là đúng đắn.
4). Tuy nhiên, kỹ thuật đề xuất còn có hạn chế sau: Làm tăng độ phức tạp khi xử lý tín
hiệu tại phía phát, do vậy khi nhúng thời gian thực thì phải cần có phần cứng tốt; Khi C có
tiết tấu nhanh (nhạc Rock, Rap...) thì kỹ thuật đề xuất sẽ kèm hiệu quả; Việc nhóm thử để
tìm tối ưu sẽ làm tăng thời gian xử lý tại phía phát. Các hạn chế nêu trên sẽ là động lực
để chúng tôi tiếp tục nghiên cứu về lĩnh vực này.
5. KẾT LUẬN
Trong bài báo này, chúng tôi đã đề xuất cải tiến phương pháp nhúng BM+SW bằng kỹ
thuật nhóm đoạn tín hiệu nhúng không chứa dữ liệu mật. Kết quả thực nghiệm cho thấy,
kỹ thuật đề xuất đã cải thiện đáng kể phẩm chất EE, SNR của tín hiệu nhúng. Kỹ thuật đề
xuất đặc biệt hiệu quả khi: Dữ liệu mật có dung lượng nhỏ hoặc quá lớn hoặc khi tín hiệu
audio có tiết tấu chậm. Tuy còn một vài hạn chế, nhưng kỹ thuật đề xuất đã góp phần giải
quyết triệt để hơn bài toán nhúng dữ liệu mật vào tín hiệu audio.
TÀI LIỆU THAM KHẢO
[1] L. Babu, J. S. John, D. B. Parameshachari, C. Muruganantham C, H. S.
DivakaraMurthy, "Steganography method for data hiding in audio signal with LSB
&DCT," International Journal of Computer Science and Mobile Computing, Vol. 2,
No. 8 (2013), pp. 54-62.
[2] P. Dutta, D. Bhattacharyya, T. H. Kim, "Data hiding in audio signal-A review,"
International Journal of Database Theory and Application, Vol. 2, No. 2 (2009), pp.
1-8.
EE: Embeddeding Error
Hình 6. Phẩm chất EE. Hình 7. Phẩm chất SNR.
C
a
p
a
c
i
t
y
B
[
b
i
t
]
C
a
p
a
c
i
t
y
B
[
b
i
t
]
SNR: Signal-to-Noise Ratio
Kỹ thuật điều khiển & Điện tử
V.V. Tâm, P.T. Hanh, “Nâng cao hiệu quả phương pháp nhúng dữ liệu nhúng.” 100
[3] H. B. Kekre, A. Athawale, S. Rao, U. Athawale, "Information hiding in audio
signal," International Journal of Computer Applications (0975-8887), Vol. 7, No. 9
(2010), pp. 14-19.
[4] S. Malviya, K. K. Nayak, M. Saxena, A. Khare, "Audio steganography in a nutshell,"
International Journal of Electronics Communication and Computer Technology
(IJECCT), Vol. 2, No. 5 (2012), pp. 219-222.
[5] V. V. Tam, P. T. Hanh, "Một phương pháp mới nhúng dữ liệu vào tín hiệu audio,"
Tạp chí Nghiên cứu KH&CN quân sự, Vol. 33 (2014), pp. 58-64.
[6] V. V. Tam, T. D. Tan, N. D. Tien, N. T. Thuy, P. T. Hanh, "Data Embedding in
Audio Signal by a Novel Bit Marking Method," International Journal of
Advancements in Computing Technology (IJACT), Vol. 7, No. 1 (2015), pp.67-77.
[7] V. V. Tam, T. D. Tan, N. T. Thuy and P. T. Hanh, "Embedding Data into Audio
Signal by Combining Sliding Window Technique with a Novel Marking Bit Method,",
International Conference on Multimedia and Ubiquitous Engineering (MUE-15), pp.
191-197.
ABSTRACT
IMPROVING THE EFFICIENCY OF THE BIT MARKING METHOD BY THE
SEGMENT GROUP TECHNIQUE OF THE SIGNAL SEGMENTS WITHOUT
EMBEDDED DATA
The audio signal often changes slowly, so embedding confidential data in the
audio signal by the marking bit (BM) gives embedding error (EE) and signal-to-
noise ratio (SNR) of the unevenly embedded audio signal in transmission or storage.
In this paper, we propose the segment group technique (SG) for BM embedding
method combining with sliding window technique (SW) in which the number of bits
overwriting in the audio signal is reduced by: Discarding the excessive bits,
grouping the consecutive segments of the audio signal which contain confidential
data, using only 2 bits to mark no embedded for the grouped data segments. The
results of analysis, calculations and tests show that the proposed technique has
improved the quality of the embedded audio signal.
Keywords: Embeded signals, Group segment, Bit marking, Sliding window.
Nhận bài ngày 16 tháng 9 năm 2015
Hoàn thiện ngày 22 tháng 10 năm 2015
Chấp nhận đăng ngày 25 tháng 12 năm 2015
Địa chỉ: 1 Đại học Kỹ thuật - Hậu cần Công an nhân dân;
2 Học viện Kỹ thuật Quân sự.
*Email: tamt36bca@gmail.com
Các file đính kèm theo tài liệu này:
- 13_tam_0984_2149247.pdf