Tự động nhận dạng tín hiệu âm thanh morse trong điều kiện ít tạp âm

Tài liệu Tự động nhận dạng tín hiệu âm thanh morse trong điều kiện ít tạp âm: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Kỷ niệm 55 năm Viện KHCNQS, 10 - 2015 205 TỰ ĐỘNG NHẬN DẠNG TÍN HIỆU ÂM THANH MORSE TRONG ĐIỀU KIỆN ÍT TẠP ÂM Nguyễn Văn Hùng1*, Nguyễn Thái Hòa2 Tóm tắt: Tín hiệu Morse được phát minh năm 1835, và cho đến nay vẫn được sử dụng để truyền tin, đặc biệt trong các hoạt động liên quan đến truyền tin quân sự, tình báo. Bài báo trình bày một phương pháp giải quyết bài toán nhận dạng tự động âm thanh tín hiệu mã Morse trong điều kiện ít tạp âm trên cơ sở xây dựng hệ số đặc trưng nhận dạng. Từ khóa: Nhận dạng âm thanh, Mã Morse. 1. ĐẶT VẤN ĐỀ Việc truyền - nhận tin bằng tín hiệu Morse là phương thức liên lạc cổ điển, tuy nhiên cho đến nay nó vẫn là một mô hình không thể thiếu trong tác chiến quân sự. Đă nhiều năm nay, Phòng Kỹ thuật hệ thống - Viện Công nghệ thông tin (Phòng KTHT-Viện CNTT) kết hợp với Phòng Thông tin, Ban dự án VQ98 – Quân chủng Phòng không - Không quân đã nghiên cứu, thiết kế ch...

pdf6 trang | Chia sẻ: quangot475 | Lượt xem: 460 | Lượt tải: 0download
Bạn đang xem nội dung tài liệu Tự động nhận dạng tín hiệu âm thanh morse trong điều kiện ít tạp âm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Kỷ niệm 55 năm Viện KHCNQS, 10 - 2015 205 TỰ ĐỘNG NHẬN DẠNG TÍN HIỆU ÂM THANH MORSE TRONG ĐIỀU KIỆN ÍT TẠP ÂM Nguyễn Văn Hùng1*, Nguyễn Thái Hòa2 Tóm tắt: Tín hiệu Morse được phát minh năm 1835, và cho đến nay vẫn được sử dụng để truyền tin, đặc biệt trong các hoạt động liên quan đến truyền tin quân sự, tình báo. Bài báo trình bày một phương pháp giải quyết bài toán nhận dạng tự động âm thanh tín hiệu mã Morse trong điều kiện ít tạp âm trên cơ sở xây dựng hệ số đặc trưng nhận dạng. Từ khóa: Nhận dạng âm thanh, Mã Morse. 1. ĐẶT VẤN ĐỀ Việc truyền - nhận tin bằng tín hiệu Morse là phương thức liên lạc cổ điển, tuy nhiên cho đến nay nó vẫn là một mô hình không thể thiếu trong tác chiến quân sự. Đă nhiều năm nay, Phòng Kỹ thuật hệ thống - Viện Công nghệ thông tin (Phòng KTHT-Viện CNTT) kết hợp với Phòng Thông tin, Ban dự án VQ98 – Quân chủng Phòng không - Không quân đã nghiên cứu, thiết kế chế tạo thiết bị phát tín hiệu Morse nhằm từng bước đáp ứng nhu cầu thực tiễn, phục vụ cho huấn luyện, diễn tập, thao diễn và thực hiện nhiệm vụ tác chiến. Tuy nhiên hiện nay việc tự động nhận dạng tín hiệu âm thanh mã Morse là vấn đề vẫn còn đang để ngỏ. 2. TỰ ĐỘNG NHẬN DẠNG ÂM THANH TÍN HIỆU MÃ MORSE Đây là bài toán nhận dạng âm thanh đơn tần. Bài toán có khối lượng tính toán lớn do số lượng dữ liệu đầu vào nhiều, liên tục theo thời gian. Độ bất định của dữ liệu lớn, có thể chịu ảnh hưởng của nhiều loại nhiễu phức tạp, khó đoán trước. Trên thực tế, khi thu tín hiệu Morse qua sóng ngắn có rất nhiều nhiễu tạp âm, có khi tỉ lệ Tín/Tạp nhỏ đến cỡ 1/7. Để giải quyết vấn đề đó, cần đầu tư nhiều hơn về thời gian và công sức nghiên cứu. Trong nội dung này, chúng ta chỉ giải quyết bài toán trong trường hợp điều kiện thường, nhiễu tạp âm không lớn. Trên cơ sở đó có thể xây dựng một công cụ có chức năng “nghe” được âm thanh tín hiệu mă Morse, nhận dạng tín hiệu và tính toán đúng tốc độ phát (ký tự/phút), phục vụ công tác huấn luyện. Trong quá trình giải quyết bài toán, ngoài việc thu, lọc, chuẩn hóa dữ liệu đầu vào, ta cần tìm ra các quy luật, các tham số chính của dữ liệu và thực hiện việc phân đoạn dữ liệu, rút trích đặc trưng, làm cơ sở nhận dạng. 2.1. Khảo sát tín hiệu âm thanh mă Morse: Dữ liệu tín hiệu âm thanh mã Morse (tịch, tà) có dạng các chu kỳ tín hiệu chuẩn hình sin (hình 1). Hình 1. Tín hiệu âm thanh mã Morse theo thời gian (tà-tịch-tịch). Kỹ thuật điều khiển & Điện tử N. V. Hùng, N. T. Hoà, “Tự động nhận dạng tín hiệu âm thanh... điều kiện ít tạp âm.” 206 Tín hiệu âm thanh do máy phát Morse có 2 dạng âm sắc khác nhau. Dạng thứ nhất, thời gian của một chu kỳ hình sin có giá trị: Tần số dao động của tín hiệu âm thanh tương ứng là: (1) Dạng thứ hai, thời gian một chu kỳ hình sin có chu kỳ: Tần số âm thanh tương ứng là: (2) Trong trường hợp tín hiệu âm thanh mã Morse do người phát bằng cần manip thì thời gian một chu kỳ hình sin có giá trị: Tần số dao động tương ứng là: (3) Theo Định lý lấy mẫu Nyquist-Shannon, một hàm số tín hiệu x(t) không chứa bất kỳ thành phần tần số nào lớn hơn hoặc bằng một giá trị Fm có thể biểu diễn chính xác bằng tập các giá trị của nó với chu kỳ lấy mẫu T = 1/2 Fm, do đó, chúng ta có thể lấy mẫu dữ liệu âm thanh tín hiệu Morse với tần số lấy mẫu không nhỏ hơn 23.800 = 7.600 (Hz) để xử lý. Nhằm đảm bảo độ chính xác của việc tính toán và phù hợp với khả năng của phần cứng cũng như các tham số của hệ điều hành máy tính, ta sẽ thực hiện việc thu âm lấy mẫu tín hiệu âm thanh mă Morse với tần số lấy mẫu 11.025 Hz (tức là nhận được 11.025 giá trị mẫu trên một giây). 2.2. Chuẩn hóa dữ liệu đầu vào Để giảm thiểu các tác động không mong muốn, ta xây dựng các bộ lọc số để loại bỏ đi một số thành phần tín hiệu âm thanh có tần số nằm ngoài phạm vi cần thiết [1]. Trong bài toán này, do tần số phát Morse có thể có giá trị từ 612 (Hz) đến 3.800 (Hz) nên ta chọn giải pháp: - Xây dựng bộ lọc FIR thông thấp có tần số cắt = 3.800 (Hz) để loại bỏ các thành phần tín hiệu có tần số lớn hơn 4.000 Hz. - Xây dựng bộ lọc FIR thông cao có tần số cắt = 612 (Hz) để loại bỏ các thành phần tín hiệu có tần số nhỏ hơn 612 Hz. Có nhiều phương pháp để tổng hợp bộ lọc số, trong đó phương pháp cửa sổ là phương pháp đơn giản, hiệu quả, được ứng dụng nhiều [2], [3]. Trong bài toán này, chúng ta sử dụng phương pháp cửa sổ Hamming để đảm bảo các tham số cần thiết cho tín hiệu đầu ra: mức độ suy hao ≥ 50 dB; độ rộng dải chuyển tiếp 11.025 Hz, ta xác định được bậc bộ lọc là 330, tức là sẽ tính ra 330 hệ số của bộ lọc. Bộ lọc FIR thông thấp, tần số cắt = 3.800 Hz có đồ thị đáp ứng xung như hình 2: Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Kỷ niệm 55 năm Viện KHCNQS, 10 - 2015 207 Hình 2. Đồ thị đáp ứng xung h1(n). Bộ lọc FIR thông cao có tần số cắt = 612 Hz có đồ thị đáp ứng xung như hình 3: Hình 3. Đồ thị đáp ứng xung h2(n). Sau khi xây dựng các bộ lọc số thông thấp h1(n) và thông cao h2(n), chúng ta cho dữ liệu âm thanh đầu vào x(n) chạy qua đó và thu được dữ liệu đầu ra y(n). Giả sử dăy x(n) có M mẫu (M liên tục tăng theo giá trị thời gian: M = 11025  T, trong đó T là thời gian tính bằng giây), khi đó dăy đầu ra có M+330 mẫu. 2.3. Tìm đặc trưng Để thực hiện việc trích rút đặc trưng âm thanh tín hiệu Morse làm cơ sở cho nhận dạng, ta phân đoạn dữ liệu thành các khoảng cơ bản có độ dài không nhỏ hơn chu kỳ cơ bản của tín hiệu mã Morse cần thu. Tuy nhiên, nếu độ dài khoảng cơ bản càng nhỏ thì khối lượng dữ liệu cần lưu trữ và so sánh cũng càng lớn, ảnh hưởng tới tốc độ nhận dạng. Trong phương án thực hiện, ta chia dữ liệu đầu vào thành các khoảng đều nhau có độ dài 108 mẫu, tương đương với 9.796 ms, bằng khoảng hơn 5 lần chu kỳ cơ bản của tín hiệu. Ta tính giá trị hữu dụng trung bình RMS (Root Mean Square) của tín hiệu âm thanh trong khoảng đó: (4) Trong đó, m là chiều dài cửa sổ, là các giá trị tín hiệu đầu vào. Thính giác của con người có đặc tính cảm thụ cường độ âm thanh tỷ lệ theo hàm số logarit [4], nên ta chuyển dữ liệu sang độ đo Decibel theo công thức sau: (5) Trong đó, là giá trị lớn nhất có thể nhận của giá trị tín hiệu âm thanh đầu vào. Giá trị này tùy thuộc số bit ta thiết lập để ghi giá trị tín hiệu trong phần thu âm thanh đầu vào (8 hay 16 bit - theo chuẩn của Windows). Ở đây, ta thiết lập 8 bit để ghi giá trị tín hiệu đầu vào. Trước khi sử dụng hệ số H làm đặc trưng nhận dạng, ta cần chuẩn hóa chuỗi hệ số nhận được về cùng một hệ quy chiếu: Kỹ thuật điều khiển & Điện tử N. V. Hùng, N. T. Hoà, “Tự động nhận dạng tín hiệu âm thanh... điều kiện ít tạp âm.” 208 - Cộng thêm 100 vào giá trị của H; - Xác định ngưỡng Ho tương ứng với việc có tín hiệu âm thanh mă Morse; - Xác định vùng xử lý dữ liệu , ở đây ta xác định tương ứng với khoảng thời gian 2s; - Nếu trong vùng = {Hj} có tín hiệu âm thanh mă Morse, ta nhân các Hj với cùng hệ số: Hj = Hj  (100/HjMax), tương đương việc khuếch đại âm thanh; - So sánh với ngưỡng: Nếu hệ số âm thanh H lớn hơn ngưỡng ta coi là có tín hiệu Morse và đánh dấu “+”, ngược lại thì thêm dấu “-” vào chuỗi nhận dạng. Kết quả sau khi rút trích đặc trưng, từ dòng dữ liệu tín hiệu âm thanh liên tục đầu vào ta nhận được chuỗi nhận dạng gồm các ký tự “+” và “-”, có dạng: -------++++++------++++++++++++++++++------++++++++++++++++++-------------- (Tương ứng với một vùng xử lý dữ liệu i, ta có một chuỗi nhận dạng gồm 204 = 11025  2 /108 ký tự). 2.4. Nhận dạng – đối sánh: Sau khi tính giá trị đặc trưng, ta dựa vào các quy luật của tín hiệu mă Morse để thực hiện việc nhận dạng. Giả sử độ dài của tín hiệu dấu “Tịch” là x, độ dài tín hiệu khác tương ứng như sau: - Độ dài dấu “Tà” = 3x. - Khoảng cách giữa các dấu trong 1 ký tự = 1x. - Khoảng cách giữa 2 ký tự = 3x. - Khoảng cách giữa 2 từ = 7x. Phương án so sánh-nhận dạng thực hiện gồm các bước: Xác định độ dài dấu “Tà”: Để thực hiện, ta cần xác định vùng nhận dạng O. Trong phương án thực hiện, ta xác định vùng O tương ứng với vùng xử lý dữ liệu , là một chuỗi gồm 204 ký tự “+” và “-”, ứng với thời gian 2s. Giả định trong vùng O này tồn tại ít nhất một dấu “Tà”, từ đó ta có thể xác định được thời gian phát tín hiệu “Tà”, là độ dài lớn nhất trong các chuỗi toàn dấu cộng trong vùng O. Phân đoạn cụm ký tự: xác định khoảng lặng giữa 2 ký tự hoặc 2 từ trong vùng nhận dạng O theo chiều từ phải sang trái. Ta thu được Phân đoạn cụm ký tự Pc. Phần thừa sẽ nối với vùng nhận dạng tiếp theo. Phân đoạn ký tự: trong Pc, duyệt các khoảng lặng giữa 2 ký tự hoặc 2 từ theo thứ tự từ trái sang phải, ta sẽ nhận được các Phân đoạn ký tự Ki. Nhận dạng: chuyển phân đoạn Ki từ dạng chuỗi gồm các dấu “+” và “-” về dạng “-” và “.”, so sánh nhận dạng theo từ điển mă Morse. 2.5. Tính toán các tham số cần thiết Trên cơ sở nhận dạng được các thành phần tín hiệu Morse, ta tính tốc độ phát trung bình của thời điểm hiện tại dựa trên thời gian phát tín hiệu “Tà”, “Tịch”, khoảng lặng giữa 2 dấu trong 1 ký tự, khoảng lặng giữa 2 chữ cái và giữa 2 từ; tính tốc độ phát thực tế dựa trên số ký tự thu nhận được trong một khoảng thời gian. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số Kỷ niệm 55 năm Viện KHCNQS, 10 - 2015 209 3. KẾT QUẢ THỰC HIỆN VÀ HƯỚNG PHÁT TRIỂN Trên cơ sở lý thuyết và các thuật toán đã trình bày ở trên, chúng tôi đã xây dựng thành công phầm mềm nhận dạng tự động âm thanh tín hiệu mã Morse trong điều kiện thông thường. Giao diện chương trình như sau: Hình 4. Giao diện chương trình. Chương trình được kiểm thử nhiều lần với máy phát mã Morse, tốc độ phát có thể đo được hiện nay nằm trong khoảng từ 20 đến 220 ký tự trên một phút, cho độ chính xác cao. Một trong những nhóm dữ liệu phục vụ kiểm tra gồm: - Văn bản VB1, có nội dung: “Cộng hòa xã hội chủ nghĩa Việt Nam Độc lập Tự do Hạnh phúc” - tổng cộng 45 ký tự; - Văn bản VB2, có nội dung: “Quê hương là chùm khế ngọt cho con trèo hái mỗi ngày” - tổng cộng 41 ký tự. Các dữ liệu VB1 và VB2 được phát bởi máy phát Morse RMORSE-2013 với các tốc độ phát lần lượt cho từng lần thử nghiệm là 50, 100, 150 và 200 chữ/phút. Chương trình thử nghiệm chạy trên máy ảo VMWare- HĐH Windows XP, thu dữ liệu âm thanh từ đầu phát âm tần thông qua micro. Kết quả thu, nhận dạng và đo đạc như sau: Bảng 1. Kết quả thử nghiệm chương trình. Các kết quả thử nghiệm cho thấy độ chính xác tuyệt đối khi nhận dạng trong môi trường bình thường (đạt 100%), chứng tỏ việc lựa chọn đặc trưng là đúng đắn. Các sai số Kỹ thuật điều khiển & Điện tử N. V. Hùng, N. T. Hoà, “Tự động nhận dạng tín hiệu âm thanh... điều kiện ít tạp âm.” 210 khi đánh giá tốc độ phát chỉ chiếm tỉ lệ nhỏ, vì đôi khi còn phụ thuộc cách tính do chúng ta quy định. Kết quả đầu tiên này có thể hoàn thiện để ứng dụng trong việc kiểm tra, đánh giá các nội dung huấn luyện, diễn tập chiến sĩ báo vụ. Trong thực tế truyền nhận tín hiệu qua sóng ngắn, tỉ lệ tạp âm đường truyền là rất lớn, phụ thuộc nhiều vào môi trường truyền tin. Trên cơ sở giải pháp thực hiện này, ta có thể phát triển áp dụng các thuật toán lọc và nhận dạng để tăng độ tin cậy khi áp dụng cho bài toán trong trường hợp thu dữ liệu sóng ngắn trên thực tế. Đó cũng là những tiền đề hữu ích cho việc nghiên cứu, tiếp cận các phương pháp xử lý, nhận dạng âm thanh và các phương pháp xử lý tín hiệu số trong truyền tin tại Viện Công nghệ thông tin – Viện Khoa học và Công nghệ Quân sự. TÀI LIỆU THAM KHẢO [1]. Giáo trình “Xử lý số tín hiệu” - ĐH Giao thông vận tải, Chương 8: Thiết kế bộ lọc số. [2]. Giáo trình “Xử lý tín hiệu số” - Học viện Bưu chính Viễn thông (2006). [3]. Nguyễn Quốc Trung - “Xử lý tín hiệu số - Tập 1” - NXB Khoa học và kỹ thuật (2006). [4]. Trang web: https://en.wikipedia.org/wiki/Decibel. ABSTRACT AUTOMATIC IDENTIFICATION MORSE-CODE’S AUDIO SIGNALS IN LOW-NOISE ENVIRONMENTS Morse signal was invented in 1835, and has so far been used for communication, especially in activities related to military communications, intelligence agency. The paper presents a method of solving the automatic recognition of the audio signal in Morse code problem in the less noise conditions based on building recognition feature. Keywords: Automatic recognition, Morse code Nhận bài ngày 15 tháng 7 năm 2015 Hoàn thiện ngày 15 tháng 8 năm 2015 Chấp nhận đăng ngày 10 tháng 9 năm 2015 Địa chỉ: 1 Phòng ĐT-CGCN, Viện Công nghệ thông tin - Viện KH-CN Quân sự; 2 Phòng Kỹ thuật hệ thống, Viện Công nghệ thông tin - Viện KH-CN Quân sự ; *Email: nvhnt73@gmail.com.

Các file đính kèm theo tài liệu này:

  • pdf30_nguyenvanhung_8817_2150123.pdf
Tài liệu liên quan