Tài liệu Tự động nhận dạng tín hiệu âm thanh morse trong điều kiện ít tạp âm: Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Kỷ niệm 55 năm Viện KHCNQS, 10 - 2015 205
TỰ ĐỘNG NHẬN DẠNG TÍN HIỆU ÂM THANH MORSE
TRONG ĐIỀU KIỆN ÍT TẠP ÂM
Nguyễn Văn Hùng1*, Nguyễn Thái Hòa2
Tóm tắt: Tín hiệu Morse được phát minh năm 1835, và cho đến nay vẫn được sử
dụng để truyền tin, đặc biệt trong các hoạt động liên quan đến truyền tin quân sự,
tình báo. Bài báo trình bày một phương pháp giải quyết bài toán nhận dạng tự động
âm thanh tín hiệu mã Morse trong điều kiện ít tạp âm trên cơ sở xây dựng hệ số đặc
trưng nhận dạng.
Từ khóa: Nhận dạng âm thanh, Mã Morse.
1. ĐẶT VẤN ĐỀ
Việc truyền - nhận tin bằng tín hiệu Morse là phương thức liên lạc cổ điển, tuy nhiên
cho đến nay nó vẫn là một mô hình không thể thiếu trong tác chiến quân sự. Đă nhiều năm
nay, Phòng Kỹ thuật hệ thống - Viện Công nghệ thông tin (Phòng KTHT-Viện CNTT) kết
hợp với Phòng Thông tin, Ban dự án VQ98 – Quân chủng Phòng không - Không quân đã
nghiên cứu, thiết kế ch...
6 trang |
Chia sẻ: quangot475 | Lượt xem: 460 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Tự động nhận dạng tín hiệu âm thanh morse trong điều kiện ít tạp âm, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Kỷ niệm 55 năm Viện KHCNQS, 10 - 2015 205
TỰ ĐỘNG NHẬN DẠNG TÍN HIỆU ÂM THANH MORSE
TRONG ĐIỀU KIỆN ÍT TẠP ÂM
Nguyễn Văn Hùng1*, Nguyễn Thái Hòa2
Tóm tắt: Tín hiệu Morse được phát minh năm 1835, và cho đến nay vẫn được sử
dụng để truyền tin, đặc biệt trong các hoạt động liên quan đến truyền tin quân sự,
tình báo. Bài báo trình bày một phương pháp giải quyết bài toán nhận dạng tự động
âm thanh tín hiệu mã Morse trong điều kiện ít tạp âm trên cơ sở xây dựng hệ số đặc
trưng nhận dạng.
Từ khóa: Nhận dạng âm thanh, Mã Morse.
1. ĐẶT VẤN ĐỀ
Việc truyền - nhận tin bằng tín hiệu Morse là phương thức liên lạc cổ điển, tuy nhiên
cho đến nay nó vẫn là một mô hình không thể thiếu trong tác chiến quân sự. Đă nhiều năm
nay, Phòng Kỹ thuật hệ thống - Viện Công nghệ thông tin (Phòng KTHT-Viện CNTT) kết
hợp với Phòng Thông tin, Ban dự án VQ98 – Quân chủng Phòng không - Không quân đã
nghiên cứu, thiết kế chế tạo thiết bị phát tín hiệu Morse nhằm từng bước đáp ứng nhu cầu
thực tiễn, phục vụ cho huấn luyện, diễn tập, thao diễn và thực hiện nhiệm vụ tác chiến.
Tuy nhiên hiện nay việc tự động nhận dạng tín hiệu âm thanh mã Morse là vấn đề vẫn còn
đang để ngỏ.
2. TỰ ĐỘNG NHẬN DẠNG ÂM THANH TÍN HIỆU MÃ MORSE
Đây là bài toán nhận dạng âm thanh đơn tần. Bài toán có khối lượng tính toán lớn do số
lượng dữ liệu đầu vào nhiều, liên tục theo thời gian. Độ bất định của dữ liệu lớn, có thể
chịu ảnh hưởng của nhiều loại nhiễu phức tạp, khó đoán trước. Trên thực tế, khi thu tín
hiệu Morse qua sóng ngắn có rất nhiều nhiễu tạp âm, có khi tỉ lệ Tín/Tạp nhỏ đến cỡ 1/7.
Để giải quyết vấn đề đó, cần đầu tư nhiều hơn về thời gian và công sức nghiên cứu.
Trong nội dung này, chúng ta chỉ giải quyết bài toán trong trường hợp điều kiện
thường, nhiễu tạp âm không lớn. Trên cơ sở đó có thể xây dựng một công cụ có chức năng
“nghe” được âm thanh tín hiệu mă Morse, nhận dạng tín hiệu và tính toán đúng tốc độ phát
(ký tự/phút), phục vụ công tác huấn luyện.
Trong quá trình giải quyết bài toán, ngoài việc thu, lọc, chuẩn hóa dữ liệu đầu vào, ta
cần tìm ra các quy luật, các tham số chính của dữ liệu và thực hiện việc phân đoạn dữ liệu,
rút trích đặc trưng, làm cơ sở nhận dạng.
2.1. Khảo sát tín hiệu âm thanh mă Morse:
Dữ liệu tín hiệu âm thanh mã Morse (tịch, tà) có dạng các chu kỳ tín hiệu chuẩn hình
sin (hình 1).
Hình 1. Tín hiệu âm thanh mã Morse theo thời gian (tà-tịch-tịch).
Kỹ thuật điều khiển & Điện tử
N. V. Hùng, N. T. Hoà, “Tự động nhận dạng tín hiệu âm thanh... điều kiện ít tạp âm.” 206
Tín hiệu âm thanh do máy phát Morse có 2 dạng âm sắc khác nhau. Dạng thứ nhất, thời
gian của một chu kỳ hình sin có giá trị:
Tần số dao động của tín hiệu âm thanh tương ứng là:
(1)
Dạng thứ hai, thời gian một chu kỳ hình sin có chu kỳ:
Tần số âm thanh tương ứng là:
(2)
Trong trường hợp tín hiệu âm thanh mã Morse do người phát bằng cần manip thì thời
gian một chu kỳ hình sin có giá trị:
Tần số dao động tương ứng là:
(3)
Theo Định lý lấy mẫu Nyquist-Shannon, một hàm số tín hiệu x(t) không chứa bất kỳ
thành phần tần số nào lớn hơn hoặc bằng một giá trị Fm có thể biểu diễn chính xác bằng
tập các giá trị của nó với chu kỳ lấy mẫu T = 1/2 Fm, do đó, chúng ta có thể lấy mẫu dữ
liệu âm thanh tín hiệu Morse với tần số lấy mẫu không nhỏ hơn 23.800 = 7.600 (Hz) để
xử lý. Nhằm đảm bảo độ chính xác của việc tính toán và phù hợp với khả năng của phần
cứng cũng như các tham số của hệ điều hành máy tính, ta sẽ thực hiện việc thu âm lấy mẫu
tín hiệu âm thanh mă Morse với tần số lấy mẫu 11.025 Hz (tức là nhận được 11.025 giá trị
mẫu trên một giây).
2.2. Chuẩn hóa dữ liệu đầu vào
Để giảm thiểu các tác động không mong muốn, ta xây dựng các bộ lọc số để loại bỏ đi
một số thành phần tín hiệu âm thanh có tần số nằm ngoài phạm vi cần thiết [1]. Trong bài
toán này, do tần số phát Morse có thể có giá trị từ 612 (Hz) đến 3.800 (Hz) nên ta chọn
giải pháp:
- Xây dựng bộ lọc FIR thông thấp có tần số cắt = 3.800 (Hz) để loại bỏ các
thành phần tín hiệu có tần số lớn hơn 4.000 Hz.
- Xây dựng bộ lọc FIR thông cao có tần số cắt = 612 (Hz) để loại bỏ các thành
phần tín hiệu có tần số nhỏ hơn 612 Hz.
Có nhiều phương pháp để tổng hợp bộ lọc số, trong đó phương pháp cửa sổ là phương
pháp đơn giản, hiệu quả, được ứng dụng nhiều [2], [3]. Trong bài toán này, chúng ta sử
dụng phương pháp cửa sổ Hamming để đảm bảo các tham số cần thiết cho tín hiệu đầu ra:
mức độ suy hao ≥ 50 dB; độ rộng dải chuyển tiếp 11.025 Hz, ta xác định được bậc bộ lọc
là 330, tức là sẽ tính ra 330 hệ số của bộ lọc.
Bộ lọc FIR thông thấp, tần số cắt = 3.800 Hz có đồ thị đáp ứng xung như hình 2:
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Kỷ niệm 55 năm Viện KHCNQS, 10 - 2015 207
Hình 2. Đồ thị đáp ứng xung h1(n).
Bộ lọc FIR thông cao có tần số cắt = 612 Hz có đồ thị đáp ứng xung như hình 3:
Hình 3. Đồ thị đáp ứng xung h2(n).
Sau khi xây dựng các bộ lọc số thông thấp h1(n) và thông cao h2(n), chúng ta cho dữ
liệu âm thanh đầu vào x(n) chạy qua đó và thu được dữ liệu đầu ra y(n). Giả sử dăy x(n) có
M mẫu (M liên tục tăng theo giá trị thời gian: M = 11025 T, trong đó T là thời gian tính
bằng giây), khi đó dăy đầu ra có M+330 mẫu.
2.3. Tìm đặc trưng
Để thực hiện việc trích rút đặc trưng âm thanh tín hiệu Morse làm cơ sở cho nhận dạng,
ta phân đoạn dữ liệu thành các khoảng cơ bản có độ dài không nhỏ hơn chu kỳ cơ bản của
tín hiệu mã Morse cần thu. Tuy nhiên, nếu độ dài khoảng cơ bản càng nhỏ thì khối lượng
dữ liệu cần lưu trữ và so sánh cũng càng lớn, ảnh hưởng tới tốc độ nhận dạng. Trong
phương án thực hiện, ta chia dữ liệu đầu vào thành các khoảng đều nhau có độ dài 108
mẫu, tương đương với 9.796 ms, bằng khoảng hơn 5 lần chu kỳ cơ bản của tín hiệu.
Ta tính giá trị hữu dụng trung bình RMS (Root Mean Square) của tín hiệu âm thanh
trong khoảng đó:
(4)
Trong đó, m là chiều dài cửa sổ, là các giá trị tín hiệu đầu vào.
Thính giác của con người có đặc tính cảm thụ cường độ âm thanh tỷ lệ theo hàm số
logarit [4], nên ta chuyển dữ liệu sang độ đo Decibel theo công thức sau:
(5)
Trong đó, là giá trị lớn nhất có thể nhận của giá trị tín hiệu âm thanh đầu vào. Giá trị
này tùy thuộc số bit ta thiết lập để ghi giá trị tín hiệu trong phần thu âm thanh đầu vào (8 hay
16 bit - theo chuẩn của Windows). Ở đây, ta thiết lập 8 bit để ghi giá trị tín hiệu đầu vào.
Trước khi sử dụng hệ số H làm đặc trưng nhận dạng, ta cần chuẩn hóa chuỗi hệ số nhận
được về cùng một hệ quy chiếu:
Kỹ thuật điều khiển & Điện tử
N. V. Hùng, N. T. Hoà, “Tự động nhận dạng tín hiệu âm thanh... điều kiện ít tạp âm.” 208
- Cộng thêm 100 vào giá trị của H;
- Xác định ngưỡng Ho tương ứng với việc có tín hiệu âm thanh mă Morse;
- Xác định vùng xử lý dữ liệu , ở đây ta xác định tương ứng với khoảng thời
gian 2s;
- Nếu trong vùng = {Hj} có tín hiệu âm thanh mă Morse, ta nhân các Hj với cùng
hệ số: Hj = Hj (100/HjMax), tương đương việc khuếch đại âm thanh;
- So sánh với ngưỡng: Nếu hệ số âm thanh H lớn hơn ngưỡng ta coi là có tín hiệu
Morse và đánh dấu “+”, ngược lại thì thêm dấu “-” vào chuỗi nhận dạng.
Kết quả sau khi rút trích đặc trưng, từ dòng dữ liệu tín hiệu âm thanh liên tục đầu vào ta
nhận được chuỗi nhận dạng gồm các ký tự “+” và “-”, có dạng:
-------++++++------++++++++++++++++++------++++++++++++++++++--------------
(Tương ứng với một vùng xử lý dữ liệu i, ta có một chuỗi nhận dạng gồm 204 =
11025 2 /108 ký tự).
2.4. Nhận dạng – đối sánh:
Sau khi tính giá trị đặc trưng, ta dựa vào các quy luật của tín hiệu mă Morse để thực
hiện việc nhận dạng. Giả sử độ dài của tín hiệu dấu “Tịch” là x, độ dài tín hiệu khác tương
ứng như sau:
- Độ dài dấu “Tà” = 3x.
- Khoảng cách giữa các dấu trong 1 ký tự = 1x.
- Khoảng cách giữa 2 ký tự = 3x.
- Khoảng cách giữa 2 từ = 7x.
Phương án so sánh-nhận dạng thực hiện gồm các bước:
Xác định độ dài dấu “Tà”: Để thực hiện, ta cần xác định vùng nhận dạng O. Trong
phương án thực hiện, ta xác định vùng O tương ứng với vùng xử lý dữ liệu , là một
chuỗi gồm 204 ký tự “+” và “-”, ứng với thời gian 2s. Giả định trong vùng O này tồn tại ít
nhất một dấu “Tà”, từ đó ta có thể xác định được thời gian phát tín hiệu “Tà”, là độ dài lớn
nhất trong các chuỗi toàn dấu cộng trong vùng O.
Phân đoạn cụm ký tự: xác định khoảng lặng giữa 2 ký tự hoặc 2 từ trong vùng nhận
dạng O theo chiều từ phải sang trái. Ta thu được Phân đoạn cụm ký tự Pc. Phần thừa sẽ
nối với vùng nhận dạng tiếp theo.
Phân đoạn ký tự: trong Pc, duyệt các khoảng lặng giữa 2 ký tự hoặc 2 từ theo thứ tự từ
trái sang phải, ta sẽ nhận được các Phân đoạn ký tự Ki.
Nhận dạng: chuyển phân đoạn Ki từ dạng chuỗi gồm các dấu “+” và “-” về dạng “-” và
“.”, so sánh nhận dạng theo từ điển mă Morse.
2.5. Tính toán các tham số cần thiết
Trên cơ sở nhận dạng được các thành phần tín hiệu Morse, ta tính tốc độ phát trung
bình của thời điểm hiện tại dựa trên thời gian phát tín hiệu “Tà”, “Tịch”, khoảng lặng giữa
2 dấu trong 1 ký tự, khoảng lặng giữa 2 chữ cái và giữa 2 từ; tính tốc độ phát thực tế dựa
trên số ký tự thu nhận được trong một khoảng thời gian.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số Kỷ niệm 55 năm Viện KHCNQS, 10 - 2015 209
3. KẾT QUẢ THỰC HIỆN VÀ HƯỚNG PHÁT TRIỂN
Trên cơ sở lý thuyết và các thuật toán đã trình bày ở trên, chúng tôi đã xây dựng thành
công phầm mềm nhận dạng tự động âm thanh tín hiệu mã Morse trong điều kiện thông
thường. Giao diện chương trình như sau:
Hình 4. Giao diện chương trình.
Chương trình được kiểm thử nhiều lần với máy phát mã Morse, tốc độ phát có thể đo
được hiện nay nằm trong khoảng từ 20 đến 220 ký tự trên một phút, cho độ chính xác cao.
Một trong những nhóm dữ liệu phục vụ kiểm tra gồm:
- Văn bản VB1, có nội dung: “Cộng hòa xã hội chủ nghĩa Việt Nam Độc lập Tự do
Hạnh phúc” - tổng cộng 45 ký tự;
- Văn bản VB2, có nội dung: “Quê hương là chùm khế ngọt cho con trèo hái mỗi ngày”
- tổng cộng 41 ký tự.
Các dữ liệu VB1 và VB2 được phát bởi máy phát Morse RMORSE-2013 với các tốc độ
phát lần lượt cho từng lần thử nghiệm là 50, 100, 150 và 200 chữ/phút. Chương trình thử
nghiệm chạy trên máy ảo VMWare- HĐH Windows XP, thu dữ liệu âm thanh từ đầu phát
âm tần thông qua micro. Kết quả thu, nhận dạng và đo đạc như sau:
Bảng 1. Kết quả thử nghiệm chương trình.
Các kết quả thử nghiệm cho thấy độ chính xác tuyệt đối khi nhận dạng trong môi
trường bình thường (đạt 100%), chứng tỏ việc lựa chọn đặc trưng là đúng đắn. Các sai số
Kỹ thuật điều khiển & Điện tử
N. V. Hùng, N. T. Hoà, “Tự động nhận dạng tín hiệu âm thanh... điều kiện ít tạp âm.” 210
khi đánh giá tốc độ phát chỉ chiếm tỉ lệ nhỏ, vì đôi khi còn phụ thuộc cách tính do chúng ta
quy định. Kết quả đầu tiên này có thể hoàn thiện để ứng dụng trong việc kiểm tra, đánh giá
các nội dung huấn luyện, diễn tập chiến sĩ báo vụ.
Trong thực tế truyền nhận tín hiệu qua sóng ngắn, tỉ lệ tạp âm đường truyền là rất lớn,
phụ thuộc nhiều vào môi trường truyền tin. Trên cơ sở giải pháp thực hiện này, ta có thể
phát triển áp dụng các thuật toán lọc và nhận dạng để tăng độ tin cậy khi áp dụng cho bài
toán trong trường hợp thu dữ liệu sóng ngắn trên thực tế. Đó cũng là những tiền đề hữu ích
cho việc nghiên cứu, tiếp cận các phương pháp xử lý, nhận dạng âm thanh và các phương
pháp xử lý tín hiệu số trong truyền tin tại Viện Công nghệ thông tin – Viện Khoa học và
Công nghệ Quân sự.
TÀI LIỆU THAM KHẢO
[1]. Giáo trình “Xử lý số tín hiệu” - ĐH Giao thông vận tải, Chương 8: Thiết kế bộ lọc số.
[2]. Giáo trình “Xử lý tín hiệu số” - Học viện Bưu chính Viễn thông (2006).
[3]. Nguyễn Quốc Trung - “Xử lý tín hiệu số - Tập 1” - NXB Khoa học và kỹ thuật
(2006).
[4]. Trang web: https://en.wikipedia.org/wiki/Decibel.
ABSTRACT
AUTOMATIC IDENTIFICATION MORSE-CODE’S AUDIO SIGNALS
IN LOW-NOISE ENVIRONMENTS
Morse signal was invented in 1835, and has so far been used for
communication, especially in activities related to military communications,
intelligence agency. The paper presents a method of solving the automatic
recognition of the audio signal in Morse code problem in the less noise conditions
based on building recognition feature.
Keywords: Automatic recognition, Morse code
Nhận bài ngày 15 tháng 7 năm 2015
Hoàn thiện ngày 15 tháng 8 năm 2015
Chấp nhận đăng ngày 10 tháng 9 năm 2015
Địa chỉ: 1 Phòng ĐT-CGCN, Viện Công nghệ thông tin - Viện KH-CN Quân sự;
2 Phòng Kỹ thuật hệ thống, Viện Công nghệ thông tin - Viện KH-CN Quân sự ;
*Email: nvhnt73@gmail.com.
Các file đính kèm theo tài liệu này:
- 30_nguyenvanhung_8817_2150123.pdf