Nâng cao hiệu quả phương pháp nhúng đánh dấu bit bằng kỹ thuật nhóm các đoạn tín hiệu không có dữ liệu nhúng - Vũ Văn Tâm

Tài liệu Nâng cao hiệu quả phương pháp nhúng đánh dấu bit bằng kỹ thuật nhóm các đoạn tín hiệu không có dữ liệu nhúng - Vũ Văn Tâm: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 93 NÂNG CAO HIỆU QUẢ PHƯƠNG PHÁP NHÚNG ĐÁNH DẤU BIT BẰNG KỸ THUẬT NHÓM CÁC ĐOẠN TÍN HIỆU KHÔNG CÓ DỮ LIỆU NHÚNG Vũ Văn Tâm1*, Phan Trọng Hanh2 Tóm tắt: Tín hiệu audio thường biến đổi chậm, do đó khi thực hiện nhúng dữ liệu mật vào tín hiệu audio bằng phương pháp đánh dấu bit (BM: Bit Marking) kết hợp với kỹ thuật cửa sổ trượt (SW: Slingding Window) cho phẩm chất lỗi nhúng (EE: Embedding Error) và tỉ số tín hiệu trên tạp âm (SNR: Signal-to-Noise Ratio) của tín hiệu nhúng không đồng đều. Từ đó giảm tính 'trong suốt' của tín hiệu nhúng khi truyền dẫn hoặc lưu trữ. Trong bài báo này, chúng tôi đề xuất cải tiến phương pháp nhúng BM kết hợp với kỹ thuật SW bằng kỹ thuật nhóm đoạn (SG: Segment Group). Việc giảm EE, tăng SNR được thực hiện bằng cách loại bỏ các bit dư thừa, các đoạn tín hiệu nhúng liền kề không chứa dữ liệu mật sẽ được nhóm lại, chỉ sử dụng 2 bit để đánh dấu không nhú...

pdf8 trang | Chia sẻ: quangot475 | Lượt xem: 473 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Nâng cao hiệu quả phương pháp nhúng đánh dấu bit bằng kỹ thuật nhóm các đoạn tín hiệu không có dữ liệu nhúng - Vũ Văn Tâm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 93 NÂNG CAO HIỆU QUẢ PHƯƠNG PHÁP NHÚNG ĐÁNH DẤU BIT BẰNG KỸ THUẬT NHÓM CÁC ĐOẠN TÍN HIỆU KHÔNG CÓ DỮ LIỆU NHÚNG Vũ Văn Tâm1*, Phan Trọng Hanh2 Tóm tắt: Tín hiệu audio thường biến đổi chậm, do đó khi thực hiện nhúng dữ liệu mật vào tín hiệu audio bằng phương pháp đánh dấu bit (BM: Bit Marking) kết hợp với kỹ thuật cửa sổ trượt (SW: Slingding Window) cho phẩm chất lỗi nhúng (EE: Embedding Error) và tỉ số tín hiệu trên tạp âm (SNR: Signal-to-Noise Ratio) của tín hiệu nhúng không đồng đều. Từ đó giảm tính 'trong suốt' của tín hiệu nhúng khi truyền dẫn hoặc lưu trữ. Trong bài báo này, chúng tôi đề xuất cải tiến phương pháp nhúng BM kết hợp với kỹ thuật SW bằng kỹ thuật nhóm đoạn (SG: Segment Group). Việc giảm EE, tăng SNR được thực hiện bằng cách loại bỏ các bit dư thừa, các đoạn tín hiệu nhúng liền kề không chứa dữ liệu mật sẽ được nhóm lại, chỉ sử dụng 2 bit để đánh dấu không nhúng cho một nhóm. Kết quả phân tích, tính toán và thực nghiệm cho thấy kỹ thuật đề xuất đã cải thiện được phẩm chất của tín hiệu nhúng. Từ khóa: Nhúng tín hiệu, Group segment, Bit marking, Sliding window. 1. ĐẶT VẤN ĐỀ Kỹ thuật nhúng dữ liệu mật (steganography) vào tín hiệu audio đang được ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt là lĩnh vực quốc phòng, an ninh [1]. Khi đó dữ liệu mật được nhúng (embedded) vào tín hiệu audio và hầu như không làm ảnh hưởng tới chất lượng của tín hiệu audio [1,2,3]. Tín hiệu nhúng được truyền dẫn với các thuộc tính của hệ thống truyền dẫn có sẵn. Tại phía thu, người nhận thực hiện giải nhúng (de-embedded) để nhận được dữ liệu mật. Các phương pháp nhúng dữ liệu mật vào tín hiệu audio trước đây bao gồm: LSB (Least Significant Bit) [1,3,4,5], echo coding [2,4], parity coding [2,4], phase coding [2,4], kỹ thuật trải phổ [2,4], ELS (Embedding Large Sample) [5] thực hiện nhúng trực tiếp dữ liệu mật vào tín hiệu audio. Vì vậy, dữ liệu mật làm ảnh hưởng đáng kể đến chất lượng của tín hiệu audio. Do đó, khi truyền dẫn hoặc lưu trữ tín hiệu nhúng có thể làm đối phương nghi ngờ [1,2,3]. Tại [6], chúng tôi đã đề xuất phương pháp nhúng BM và tại [7] chúng tôi cũng đã đề xuất cải tiến BM bằng kỹ thuật SW. Trong đó, dữ liệu mật được nhúng gián tiếp vào tín hiệu audio bằng cách tìm trong tín hiệu audio đoạn  [bit] trùng với dữ liệu mật; Sử dụng  [bit] (với   ) để đánh dấu vị trí của đoạn bit tìm được. Do đó, khi nhúng thành công  [bit] dữ liệu, sẽ giảm được   bit ghi đè vào tín hiệu audio  bit    (1) Tuy nhiên, nếu nhúng không thành công, thì cần phải tốn một bit để đánh dấu (báo cho phía thu) đoạn tín hiệu nhúng đang xét không chứa dữ liệu mật. Do vậy, tổng số bit dùng để đánh dấu  BM+SWS là:  BM+SW 0bit S q q  (2) với q là số đoạn dữ liệu mật, 0q là số bit đánh dấu không nhúng. Để giảm EE thì cần phải giảm BM+SWS , sao cho: Kỹ thuật điều khiển & Điện tử V.V. Tâm, P.T. Hanh, “Nâng cao hiệu quả phương pháp nhúng dữ liệu nhúng.” 94 BM+SW S B (3) với B là kích thước dữ liệu mật. q được tính theo công thức: B q   (4) Do tín hiệu audio thường biến đổi chậm, nên các đoạn tín hiệu audio liền kề thường khác nhau không đáng kể. Vì vậy khi nhúng bằng phương pháp BM+SW, thường có các đoạn tín hiệu nhúng liền kề không chứa dữ liệu mật (do nhúng không thành công liên tiếp), khi đó 0q sẽ tăng làm cho EE tăng và SNR giảm. Trong bài báo này, chúng tôi đề xuất cải tiến phương pháp nhúng BM+SW bằng kỹ thuật SG; Gộp  đoạn tín hiệu nhúng liền kề không chứa dữ liệu mật thành một nhóm; Sử dụng 2 bit để đánh dấu không nhúng cho nhóm (thay cho phải sử dụng  bit như trước). Kết quả tính toán và thực nghiệm cho thấy, phẩm chất EE, SNR của tín hiệu nhúng được cải thiện đáng kể so với phương pháp nhúng BM+SW. Bài báo có những đóng góp sau:  Đề xuất kỹ thuật SG, để giảm được   2 bit  ghi đè vào tín hiệu audio cho một lần nhóm so với phương pháp nhúng BM+SW, với 2  ;  Phân tích, tính toán các tham số liên quan, thực nghiệm và so sánh kết quả với phương pháp nhúng BM+SW. Phần còn lại của bài báo có cấu trúc như sau: Mô hình nhúng, giải nhúng theo phương pháp nhúng BM+SW+SG được trình bày trong mục 2; Mục 3 phân tích và tính toán các tham số EE, SNR; Mục 4 là kết quả thực nghiệm và đánh giá so sánh với phương pháp nhúng BM+SW; Các kết luận và định hướng nghiên cứu tiếp theo được trình bày trong mục 5. 2. MÔ HÌNH HỆ THỐNG 2.1. Cấu trúc mô hình Hình 1. Cấu trúc mô hình nhúng, giải nhúng BM+SW kết hợp kỹ thuật đề xuất (SG). Hình 1 là mô hình nhúng, giải nhúng bằng phương pháp BM+SW+SG. Mô hình được mô tả như sau: Nhúng BM + SW So sánh và tách đoạn Khôi phục nhúng Nhóm đoạn Mã hóa nhóm Ghép ~ ~ C B ' C ' 2C  ' 1C  C 3C ' 3C '' C Phía thu Giải Nhúng BM+SW Tách B ' 1C  ' 3C '' C Người dùng thông thường '' C Phía phát Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 95 Tín hiệu audio gốc  C được cho bởi (5,6,7,8). Trong đó jC là mẫu audio thứ j , n là tổng số mẫu audio của C , C là đoạn audio thứ  , p là tổng số đoạn C của C và  là số mẫu jC trong C .  ; 1, 2, ... jC C j n  (5) C p   (6)  ; 1, 2, ... C C p   (7)  ; 1, 2, ... jC C j    (8) Dữ liệu mật  B được cho bởi (9,10), với B là đoạn dữ liệu thứ  , q là tổng số đoạn B của B và  là số bit của B .  ; 1, 2, ... B B q   (9)  bitB   (10) 'C là kết quả nhúng B vào C theo [6,7]. C được mô tả bởi (11,12), với 'C là đoạn tín hiệu nhúng thứ  và 'jC là mẫu audio có nhúng thứ j .  ' ' ; 1, 2, ... C C p   (11)  ' ' ; 1, 2, ... jC C j    (12) ' 2C là đoạn tín hiệu nhúng không chứa B (hình 2), tuy nhiên do ' 2C có 1 bit bị ghi đè nên lỗi nhúng  2EE trong đoạn '2C sẽ được tính theo công thức:  ' 22EE 1 bitC C     (13) Khi khôi phục '2C trở về đoạn tín hiệu audio gốc ( 2 'C C  ), thì lỗi nhúng trong đoạn này được tính theo công thức:  ' 22EE 0 bitkp C C C C         (14)  [bit] B  [bit] B  đoạn ' 2C liền kề ' 1C '1C  bit dư thừa   0 q Hình 2. Mô tả đoạn tín hiệu audio ' 1C , ' 2C và các bít dư thừa 0q . Kỹ thuật điều khiển & Điện tử V.V. Tâm, P.T. Hanh, “Nâng cao hiệu quả phương pháp nhúng dữ liệu nhúng.” 96 '1C là đoạn tín hiệu nhúng có B (hình 2) [6] thì lỗi nhúng  1EE là:  ' 11EE bitC C      , (15) với  là số đoạn ' 2C ở giữa hai đoạn '1C . 3C là nhóm tín hiệu nhúng, gồm  đoạn ' 2C liền kề,  23 ' ; 1, 2, ... C C    . (16) 3 'C là nhóm tín hiệu nhúng  3C , đã được khôi phục nhúng ( '2C C  ) và ghi đè 2 bit đánh dấu ( 1g hoặc g ) để báo phía thu nhóm 3'C không có B (hình 3, 4):   23 ''' ; 1, 2, ... C C    . (17) " C là tín hiệu nhúng được đưa vào hệ thống truyền dẫn hoặc lưu trữ ( ''C được ghép nối tiếp từ 3 'C và '1C theo trình tự của 'C ) ' ''' 1 3 (serial) C C C  . (18) 2.2. Hoạt động của mô hình + Quá trình nhúng: Dữ liệu mật  B được nhúng vào tín hiệu audio  C theo phương pháp nhúng BM+SW [6,7] thành tín hiệu nhúng ( 'C ). Theo [6], EE được tính là: BM+SW BM+SWEE S (19) BM+SW 0EE q + q  (20) Trong đó q là tổng số bit đánh dấu cho q đoạn ' 1C có chứa B , 0q là tổng số bit đánh dấu cho 0q đoạn ' 2C không chứa B . Để loại bỏ 0q chúng tôi thực hiện so sánh 'C với C để tách ' 1C và ' 2C . ' 1C có chứa B được giữ nguyên, còn ' 2C được so sánh với C của C để khôi phục nhúng. ' 2C C  (21) 0 0q  (22) ' 1C '1C '1C '1C ' 3C '3C 1 = 01g 0 0 g  Hình 3. Đánh dấu nhóm khi <   . Hình 4. Đánh dấu nhóm khi   . Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 97 Tuy nhiên, để báo phía thu biết không có B trong các đoạn ' 2C chúng tôi gộp  đoạn ' 2C liền kề thành một nhóm  3C theo (16) (với 2  và được chọn tối ưu bằng cách nhóm thử sao cho EE là nhỏ nhất) và ghi đè 2 bit vào nhóm 3C thành 3 'C (hình 3) tương ứng hai trường hợp sau: (i). Khi <   thì chuỗi 1 01g  được ghi đè vào 3C (hình 3); (ii). Khi   thì chuỗi 00g  được ghi đè vào 3C (hình 4).    1 bit bit 2g g  (23) ' ' C được tạo thành theo (18), người dùng thông thường sử dụng ''C như C , mà không cảm nhận được sự khác biệt. + Quá trình giải nhúng: Tại phía thu sẽ thực hiện quá trình xử lý tín hiệu ngược lại với phía phát, đó là: Tách q đoạn '1C từ ''C (bỏ qua 3 'C vì không chứa B ), chỉ cần giải nhúng q đoạn '1C để nhận được q đoạn B , ghép lại theo (9) để được B . 3. PHÂN TÍCH VÀ TÍNH TOÁN CÁC THAM SỐ 3.1. Lỗi nhúng  BM+SW+SGEE Từ công thức (19,20,23), BM+SW+SGEE được tính theo công thức: 0 1 2BM+SW+SG 1 1 1 1 1 EE qq fe z x z x EE EE g g             (24) trong đó e là số lần sảy ra trường hợp (i), f là số lần sảy ra trường hợp (ii). Các đoạn ' 2C được khôi phục nhúng, nên 2 = 0xEE với x và kết hợp với (23) chúng ta có:  1BM+SW+SG 1 EE 0 2 q z z EE e f      (25)  BM+SW+SGEE 2 q e f   (26) 3.2. Tỉ số tín hiệu trên tạp âm  BM+SW+SGSNR Theo [6,7] thì BM+SWSNR được tính theo công thức sau: 2 1 10BM+SW 0 C 10 logSNR n j j q q     (27) Với kỹ thuật đề xuất, khi kết hợp (20,26,27) thì BM+SW+SGSNR được tính như sau:     2 1 BM+SW+SG 10 C SNR dB 10log 2 n j j q e f      . (28) Kết hợp (20,26,27) và (28) chúng ta có: - Nếu   02 e f q  thì BM+SW+SG BM+SWEE < EE và BM+SW+SG BM+SWSNR SNR ; - Nếu   02 = e f q thì BM+SW+SG BM+SWEE = EE và BM+SW+SG BM+SWSNR = SNR ; Kỹ thuật điều khiển & Điện tử V.V. Tâm, P.T. Hanh, “Nâng cao hiệu quả phương pháp nhúng dữ liệu nhúng.” 98 - Nếu   02 > e f q thì BM+SW+SG BM+SWEE > EE và BM+SW+SG BM+SWSNR < SNR . 4. KẾT QUẢ THỰC NGHIỆM 4.1. Mô hình thực nghiệm Để minh chứng cho tính ưu việt của kỹ thuật đề xuất, chúng tôi đã tiến hành thực nghiệm với các tham số như sau: C là 50 file audio định dạng kiểu *.Wave:  testC ; test = 1, 2, .., 50 , có tiết tấu nhanh, chậm khác nhau; Tham số cơ bản của các file wave đưa vào thực nghiệm được mô tả tại hình 5. B là 10 file text có dung lượng khác nhau:  textB ; tex = 1, 2, .., 10t . Công cụ thực nghiệm: Sử dụng ngôn ngữ lập trình Visual Basic để cài đặt các thuật toán nhúng và giải nhúng theo phương pháp nhúng BM+SW và phương pháp nhúng BM+SW+SG; Sử dụng ngôn ngữ Matlab để tính toán và vẽ biểu đồ so sánh. Quy trình thử nghiệm: Mỗi file audio được nhúng với 10 file text, kết quả sẽ có 500 file tín hiệu nhúng   test'C ; test = 1, 2, .., 500 . Lấy trung bình trung các tham số EE, SNR để lập biểu đồ so sánh. Hình 5. Chương trình thực nghiệm nhúng, giải nhúng với kỹ thuật đề xuất. 2.2. Phân tích kết quả 1). Hình 6 là đồ thị biểu diễn phẩm chất EE khi thực hiện nhúng B vào C tương ứng hai trường hợp: (i) Nhúng BM+SW (không sử dụng kỹ thuật đề xuất); (ii) Nhúng BM+SW+SG (có sử dụng kỹ thuật đề xuất). Kết quả cho thấy kỹ thuật đề xuất đã làm EE giảm đáng kể, đó là do: Kỹ thuật đề xuất đã loại bỏ hoàn toàn các bit dư thừa  0q ; Đồng thời chỉ sử dụng 2 bit để đánh dấu cho 1 nhóm tín hiệu nhúng, thay cho phải sử dụng  bitw như trước (hình 2, hình 3). 2). Kỹ thuật đề xuất sẽ phát huy hiệu quả cao khi B có dung lượng nhỏ hoặc quá lớn, bởi vì: Khi B quá nhỏ thì B chủ yếu được nhúng ở phần đầu của file audio, khi B quá lớn Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 40, 12 - 2015 99 thì B sẽ được nhúng cả phần đầu và cuối của file audio; Do phần đầu và cuối của các file audio thường là các khoảng trắng   0jC  hoặc có tiết tấu rất chậm, nếu không sử dụng kỹ thuật đề xuất thì 0q sẽ tăng nhanh và làm cho EE tăng theo. Cũng giải thích tương tự như trên khi C có dung lượng nhỏ hoặc có tiết tấu chậm (bài hát, bản nhạc nhẹ) thì kỹ thuật đề xuất cũng sẽ cho hiệu quả cao. 3). Hình 7 là đồ thị biểu diễn phẩm chất SNR [dB], kết quả cho thấy phẩm chất SNR của tín hiệu nhúng tăng lên khi sử dụng thêm kỹ thuật đề xuất. Đó là do kỹ thuật đề xuất đã làm EE giảm, mà vẫn giữ nguyên định dạng và cấu trúc của tín hiệu audio. Phẩm chất EE, SNR [dB] của tín hiệu nhúng được cải thiện đã chứng tỏ tính ưu việt của kỹ thuật đề xuất,   02 e f q  và các tính toán ở nêu trên là đúng đắn. 4). Tuy nhiên, kỹ thuật đề xuất còn có hạn chế sau: Làm tăng độ phức tạp khi xử lý tín hiệu tại phía phát, do vậy khi nhúng thời gian thực thì phải cần có phần cứng tốt; Khi C có tiết tấu nhanh (nhạc Rock, Rap...) thì kỹ thuật đề xuất sẽ kèm hiệu quả; Việc nhóm thử để tìm  tối ưu sẽ làm tăng thời gian xử lý tại phía phát. Các hạn chế nêu trên sẽ là động lực để chúng tôi tiếp tục nghiên cứu về lĩnh vực này. 5. KẾT LUẬN Trong bài báo này, chúng tôi đã đề xuất cải tiến phương pháp nhúng BM+SW bằng kỹ thuật nhóm đoạn tín hiệu nhúng không chứa dữ liệu mật. Kết quả thực nghiệm cho thấy, kỹ thuật đề xuất đã cải thiện đáng kể phẩm chất EE, SNR của tín hiệu nhúng. Kỹ thuật đề xuất đặc biệt hiệu quả khi: Dữ liệu mật có dung lượng nhỏ hoặc quá lớn hoặc khi tín hiệu audio có tiết tấu chậm. Tuy còn một vài hạn chế, nhưng kỹ thuật đề xuất đã góp phần giải quyết triệt để hơn bài toán nhúng dữ liệu mật vào tín hiệu audio. TÀI LIỆU THAM KHẢO [1] L. Babu, J. S. John, D. B. Parameshachari, C. Muruganantham C, H. S. DivakaraMurthy, "Steganography method for data hiding in audio signal with LSB &DCT," International Journal of Computer Science and Mobile Computing, Vol. 2, No. 8 (2013), pp. 54-62. [2] P. Dutta, D. Bhattacharyya, T. H. Kim, "Data hiding in audio signal-A review," International Journal of Database Theory and Application, Vol. 2, No. 2 (2009), pp. 1-8. EE: Embeddeding Error Hình 6. Phẩm chất EE. Hình 7. Phẩm chất SNR. C a p a c i t y B [ b i t ] C a p a c i t y B [ b i t ] SNR: Signal-to-Noise Ratio Kỹ thuật điều khiển & Điện tử V.V. Tâm, P.T. Hanh, “Nâng cao hiệu quả phương pháp nhúng dữ liệu nhúng.” 100 [3] H. B. Kekre, A. Athawale, S. Rao, U. Athawale, "Information hiding in audio signal," International Journal of Computer Applications (0975-8887), Vol. 7, No. 9 (2010), pp. 14-19. [4] S. Malviya, K. K. Nayak, M. Saxena, A. Khare, "Audio steganography in a nutshell," International Journal of Electronics Communication and Computer Technology (IJECCT), Vol. 2, No. 5 (2012), pp. 219-222. [5] V. V. Tam, P. T. Hanh, "Một phương pháp mới nhúng dữ liệu vào tín hiệu audio," Tạp chí Nghiên cứu KH&CN quân sự, Vol. 33 (2014), pp. 58-64. [6] V. V. Tam, T. D. Tan, N. D. Tien, N. T. Thuy, P. T. Hanh, "Data Embedding in Audio Signal by a Novel Bit Marking Method," International Journal of Advancements in Computing Technology (IJACT), Vol. 7, No. 1 (2015), pp.67-77. [7] V. V. Tam, T. D. Tan, N. T. Thuy and P. T. Hanh, "Embedding Data into Audio Signal by Combining Sliding Window Technique with a Novel Marking Bit Method,", International Conference on Multimedia and Ubiquitous Engineering (MUE-15), pp. 191-197. ABSTRACT IMPROVING THE EFFICIENCY OF THE BIT MARKING METHOD BY THE SEGMENT GROUP TECHNIQUE OF THE SIGNAL SEGMENTS WITHOUT EMBEDDED DATA The audio signal often changes slowly, so embedding confidential data in the audio signal by the marking bit (BM) gives embedding error (EE) and signal-to- noise ratio (SNR) of the unevenly embedded audio signal in transmission or storage. In this paper, we propose the segment group technique (SG) for BM embedding method combining with sliding window technique (SW) in which the number of bits overwriting in the audio signal is reduced by: Discarding the excessive bits, grouping the consecutive segments of the audio signal which contain confidential data, using only 2 bits to mark no embedded for the grouped data segments. The results of analysis, calculations and tests show that the proposed technique has improved the quality of the embedded audio signal. Keywords: Embeded signals, Group segment, Bit marking, Sliding window. Nhận bài ngày 16 tháng 9 năm 2015 Hoàn thiện ngày 22 tháng 10 năm 2015 Chấp nhận đăng ngày 25 tháng 12 năm 2015 Địa chỉ: 1 Đại học Kỹ thuật - Hậu cần Công an nhân dân; 2 Học viện Kỹ thuật Quân sự. *Email: tamt36bca@gmail.com

Các file đính kèm theo tài liệu này:

  • pdf13_tam_0984_2149247.pdf