Tài liệu Xác định hướng nguồn âm trong cảnh báo đột nhập: Kỹ thuật điều khiển & Điện tử
L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 90
XÁC ĐỊNH HƯỚNG NGUỒN ÂM TRONG CẢNH BÁO ĐỘT NHẬP
Lương Công Duẩn1*, Trần Vũ Kiên2, Nguyễn Ngọc Minh1
Tóm tắt: Bài báo trình bày về mô hình thiết bị xác định hướng của nguồn âm
bước chân ứng dụng trong phát hiện và cảnh báo đột nhập. Mô hình sử dụng 3 điểm
thu âm từ đó tính toán, xác định ra hướng, vị trí của nguồn âm trong không gian
thông qua hàm tương quan chéo và các tính toán trong hình học không gian.
Chương trình phần mềm cho mô hình được phát triển dựa trên 5 bước chính sau:
Khôi phục mẫu nén sau khi nhận, Biến đổi FFT xác định cường độ âm thanh trong
vùng tần số 200-500Hz[1], Lọc IIR để lọc bỏ các thành phần tần số ngoài vùng âm
thanh bước chân, xác định độ lệch pha âm thanh thông qua hàm tương quan chéo,
xác định vị trí nguồn âm trong không gian.
Từ khóa: DSP; Xử lý âm thanh; Xác định vị trí nguồn âm; TDOA; ITD.
1. ĐẶT VẤN ĐỀ
Bài ...
7 trang |
Chia sẻ: quangot475 | Lượt xem: 613 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Xác định hướng nguồn âm trong cảnh báo đột nhập, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỹ thuật điều khiển & Điện tử
L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 90
XÁC ĐỊNH HƯỚNG NGUỒN ÂM TRONG CẢNH BÁO ĐỘT NHẬP
Lương Công Duẩn1*, Trần Vũ Kiên2, Nguyễn Ngọc Minh1
Tóm tắt: Bài báo trình bày về mô hình thiết bị xác định hướng của nguồn âm
bước chân ứng dụng trong phát hiện và cảnh báo đột nhập. Mô hình sử dụng 3 điểm
thu âm từ đó tính toán, xác định ra hướng, vị trí của nguồn âm trong không gian
thông qua hàm tương quan chéo và các tính toán trong hình học không gian.
Chương trình phần mềm cho mô hình được phát triển dựa trên 5 bước chính sau:
Khôi phục mẫu nén sau khi nhận, Biến đổi FFT xác định cường độ âm thanh trong
vùng tần số 200-500Hz[1], Lọc IIR để lọc bỏ các thành phần tần số ngoài vùng âm
thanh bước chân, xác định độ lệch pha âm thanh thông qua hàm tương quan chéo,
xác định vị trí nguồn âm trong không gian.
Từ khóa: DSP; Xử lý âm thanh; Xác định vị trí nguồn âm; TDOA; ITD.
1. ĐẶT VẤN ĐỀ
Bài toán xác định hướng của nguồn âm là bài toán đang nhận được nhiều sự quan tâm
trong đó có thể kể đến các ứng dụng như: Hỗ trợ Robot tương tác với người thông qua
giọng nói; điều khiển camera tự động trong họp trực tuyến... Đã có nhiều nghiên cứu [2]-
[5] về bài toán này tuy nhiên hầu hết các thiết kế này đều sử dụng đến mảng microphone
gồm rất nhiều các microphone tích hợp. Với số lượng các microphone lớn có thể giúp xác
định được vị trí của nguồn âm với độ chính xác cao đặc biệt trong mô hình không gian 3D.
Với thiết kế có độ phức tạp cao nên cũng yêu cầu thiết bị cần có các bộ xử lý và cấu hình
tốt, do vậy chi phí để sản xuất các thiết bị này cũng rất cao. Chính vì thế hiện nay các thiết
bị này chưa thực sự phổ biến.
Ở bài báo này, nhóm tác giả tập trung nghiên cứu thiết kế thiết bị ứng dụng trong bài
toán xác định nguồn âm và đưa ra cảnh báo đột nhập. Hiện nay, các hệ thống camera an
ninh hoạt chủ yếu hoạt động theo phương pháp quét dò để có thể thu được góc quét rộng,
vì vậy vẫn có những khoảng “thời gian chết”. Hơn nữa, trong thời gian về đêm việc nhận
diện các đối tượng cũng trở nên khó khăn. Chính vì những vấn đề trên tác giả định hướng
xây dựng thêm một thiết bị phụ trợ hỗ trợ các hệ thống camera an ninh cũng như các hệ
thống cảnh báo đột nhập khác dựa trên phân tích, xác định vị trí của âm thanh bước chân.
Hơn nữa, trong hướng ứng dụng này nguồn âm xuất hiện ở 1 bề mặt tương đối phẳng và
không thay đổi nên có thể quy về tính toán và xử lý tương đương trong không gian 2D.
Điều này giúp tiết kiệm rất nhiều về chi phí thiết bị và nâng cao được tốc độ tính toán của
thiết bị. Với mục tiêu chính là xác định hướng của nguồn âm với độ chính xác về khoảng
cách yêu cầu không quá khắt khe giúp cho mô hình có thiết kế đơn giản và có thể tiến
hành xử lý trên các nền tảng vi xử lý, DSP cấu hình thấp, dễ dàng áp dụng trên các thiết bị
dân dụng.
Bài báo được phân tích theo các phần chính như sau:
Phân tích lý thuyết và xây dựng mô hình hệ thống.
Xây dựng chương trình mô phỏng.
Thử nghiệm, đánh giá và đề xuất.
2. PHÂN TÍCH LÝ THUYẾT VÀ XÂY DỰNG MÔ HÌNH HỆ THỐNG
2.1. Phân tích lý thuyết
Thiết kế của mô hình được dựa trên sự sai khác về thời gian giữa các điểm nhận tín
hiệu âm TDOA (Time Differences Of Arrival) [6], [7] hoặc ITD (Interaural Time
Difference)[8]. Với các khoảng cách khác nhau âm thanh nhận được đến các microphone
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 59, 02 - 2019 91
sẽ có độ trễ khác nhau. Khoảng thời gian chênh lệch được tính toán thông qua hàm tương
quan chéo [7].
Hình 1. Nguyên lý tính toán dựa trên TDOA.
Với tối thiểu 3 nguồn thu âm có thể tính toán được vị trí của nguồn âm trong không
gian bằng các tính toán hình học cơ bản. Vị trí của các microphone có thể đặt tùy ý tuy
nhiên ở đây để dễ dàng cho thiết kế và tính toán tác giả sử dụng 3 microphone ở các vị trí
tạo thành 1 đường thẳng và có khoảng cách giữa MIC1 và MIC3 đến MIC2 là đều nhau và
chọn MIC2 là vị trí để tham chiếu. MIC2 được coi là vị trí tham chiếu nên quy định MIC2
có tọa độ là (0,0) từ đó suy ra MIC1 có tọa độ là (-d,0) và MIC3 có tọa độ là (d,0). Ngoài
ra, do xác định được khoảng thời gian chênh lệch của tín hiệu âm thanh giữa MIC1 và
MIC2, MIC3 và MIC2 nên có giá trị a và b.
Hình 2. Vị trí lắp đặt các nguồn thu âm.
Từ đó, có thể tính toán được tọa độ của nguồn âm thông qua hệ phương trình:
2 2
( )
2 2
2 2
( )
x d y D a
x y D
x d y D b
(1)
Khoảng cách chênh lệch từ nguồn âm đạt giá trị lớn nhất khi nguồn âm (Sound Source)
kết hợp với các MIC tạo thành một đường thẳng và nằm về phía ngoài so với vị trí của các
MIC. Trong đó, nguồn âm thanh do tiếng bước chân tạo nên có dải tần tập trung vào
khoảng từ 200Hz - 500Hz[1]. Do vậy, khoảng cách giữa các MIC (d) cần thỏa mãn điều
kiện (2) để đảm bảo trong quá trình tính toán hàm tương quan chéo không xảy ra hiện
tượng chồng pha trong trường hợp tín hiệu đến là tín hiệu tuần hoàn:
axm
v
d
f
(2)
Kỹ thuật điều khiển & Điện tử
L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 92
Với vận tốc âm thanh đạt khoảng 330m/s và tần số âm lớn nhất khảo sát
ax 500mf Hz nên điều kiện về khoảng cách giữa các vị trí đặt microphone là:
66( )d cm . Đồng thời khoảng cách này cũng không được quá nhỏ và phụ thuộc vào tần
số lấy mẫu âm thanh của bộ xử lý. Tần số lấy mẫu càng cao thì khoảng cách d có thể càng
nhỏ và tương đương với độ chính xác tính toán cao.
Khi sử dụng nhiều microphone, số lượng mẫu tại các microphone cần phải truyền về là
rất lớn. Để có thể giảm lượng dữ liệu cần truyền và năng lượng truyền khi sử dụng đường
truyền không dây, các mẫu tín hiệu sẽ được nén trước khi truyền về. Sau khi thu nhận, các
mẫu tín hiệu sẽ được giải nén và xử lý [9].
2.2. Xây dựng mô hình hệ thống
Theo các phân tích như ở trên mô hình chương trình được xây dựng như sau:
Hình 3. Mô hình phần mềm.
Trong đó, các khối có vai trò và thiết kế chi tiết như sau:
Khối khôi phục mẫu:
Khối khôi phục mẫu thực hiện tiếp nhận các tín hiệu thu nhận được từ các bộ thu tín
hiệu và giải nén để khôi phục các mẫu tín hiệu gốc.
Khối FFT, xác định biên độ:
Thực hiện biến đổi Fourier một trong 3 tín hiệu âm thanh đã thu được từ một trong 3
microphone sau đó xác định ngưỡng giá trị cường độ trong khoảng 200-500Hz. Nếu cường
độ âm trong khoảng này lớn hơn một ngưỡng quy định thì thực hiện các tính toán tiếp
theo. Nếu không xác định không có tín hiệu bước chân và bỏ qua.
Khối IIR thông dải:
Thực hiện lọc tín hiệu âm thanh đầu vào sử dụng bộ lọc thông dải tần số từ 200-500Hz
nhằm loại bỏ nhiễu cũng như các tín hiệu tạp âm khác và trích lấy các âm ở khoảng của tín
hiệu bước chân. Bộ lọc IIR có thiết kế đơn giản nên có thể hỗ trợ tính toán nhanh phù hợp
với các kiến trúc xử lý chậm. Bộ lọc này được áp dụng với cả 3 tín hiệu đầu vào.
Khối tương quan chéo:
Sau khi 3 tín hiệu đã được lọc thông qua bộ lọc IIR, 2 cặp tín hiệu từ MIC1-MIC2 và
MIC3-MIC2 được đưa vào 2 khối tương quan chéo để xác định được khoảng lệch thời
gian của 2 cặp tín hiệu này. Đầu ra của khối này là khoảng thời gian chênh lệch và có thể
quy đổi ra hiệu khoảng cách của tín hiệu đến các microphone.
Khối tính toán, xác định vị trí:
Sử dụng công thức (1), khối này có vai trò tính toán ra vị trí của nguồn âm thông qua
độ lệch khoảng cách từ nguồn âm tới các vị trí đo tín hiệu.
3. MÔ PHỎNG VÀ ĐÁNH GIÁ
3.1. Tín hiệu thử nghiệm
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 59, 02 - 2019 93
Tín hiệu đầu vào là một số tín hiệu âm bước chân được thu âm sẵn. Dưới đây là một tín
hiệu âm bước chân được sử dụng:
Hình 4. Nguồn âm thử nghiệm.
Bản thân tín hiệu được thu âm đã có can nhiễu âm thanh môi trường. Ngoài ra, các tín
hiệu nguồn âm thực tế thường có can nhiễu từ sự ổn định của các tín hiệu thu. Do vậy, tín
hiệu trước khi được đưa vào bộ mô phỏng được xử lý bằng cách bổ sung nhiễu trắng và
suy hao về cường độ theo khoảng cách[10]. Cường độ của nhiễu trắng được thêm vào phụ
thuộc khoảng cách từ nguồn âm đến các microphone. Dưới đây là một đoạn tín hiệu âm đã
được xử lý bổ sung nhiễu và suy hao với giả sử điều kiện suy hao lớn nhất trong điều kiện
môi trường 50°C độ ẩm 90%[11].
Hình 5. Nguồn âm sau khi thêm nhiễu và suy hao.
3.2. Mô phỏng
Chương trình được xây dựng trên nền tảng phần mềm Matlab. Với các nền tảng vi điều
khiển, DSP hiện tại thường có tần số lấy mẫu khoảng dưới 1MSps. Vì vậy, ở đây tác giả
tiến hành mô phỏng với tần số lẫy mẫu mỗi kênh là 100kSps để có thể đạt được sai số
±3.4cm về khoảng cách lấy mẫu giúp giảm sai số khi tính toán hướng và vị trí của nguồn
âm. Tổng trên 3 kênh là 300kSps phù hợp với các nền tảng vi điều khiển, DSP hiện có.
Các mẫu này sẽ được nén lại và truyền về. Số lượng mẫu cho mỗi lần đo và tính toán là
2048 điểm. Khoảng cách d giữa các microphone được thử nghiệm ở mức 40cm (2).
Quá trình mô phỏng gồm các bước sau:
Mô phỏng xác định độ chính xác của mô hình trong khoảng từ 0-180 độ
Xác định sai số của mô hình hệ thống theo khoảng cách.
Xác định sai số của mô hình hệ thống theo góc quét.
3.3. Kết quả mô phỏng và bình luận
3.3.1. Xác định vùng hoạt động tối ưu
Với mục tiêu được xác định là hỗ trợ cảnh báo đột nhập cho các thiết bị như camera an
ninh, hệ thống đèn quét... nên hệ thống cần đạt được độ chính xác cao về hướng của nguồn
âm để khi kết hợp với góc quét của các thiết bị sẵn có vẫn đảm bảo các đối tượng xâm
Kỹ thuật điều khiển & Điện tử
L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 94
nhập nằm trong khu vực quản lý của thiết bị. Do vậy cần xác định được vùng hoạt động có
sai số về góc đảm bảo vật thể xâm nhập vẫn nằm trong vùng quét của thiết bị cảnh báo và
giám sát.
Chương trình mô phỏng thực hiện với một khoảng cách bất kỳ và góc của tín hiệu so
với đường thẳng tạo thành của 2 microphone chạy từ 0-180°. Quá trình mô phỏng cho kết
quả như sau:
Hình 6. Kết quả mô phỏng thử nghiệm vùng hoạt động.
Kết quả mô phỏng cho sai số tăng dần từ 90° về 2 phía của đồ thị. Trong đó sai số của
vùng xung quanh góc 90° tiệm cận đến 0. Sai số trong khoảng từ 15-165° nằm trong
khoảng nhỏ hơn 5° và tăng nhanh trong khoảng 0-15° và 165-180°. Hai vùng này có giá trị
sai số khoảng 5-15°.
Hình 7. Phân bố sai số về góc ở các khoảng cách nguồn âm khác nhau.
Với kết quả này cho thấy mô hình có khả năng hoạt động tốt trong vùng từ 15-165°.
Với sai số khoảng 3° kết hợp với góc quét của camera an ninh hoặc các hệ thống đèn chiếu
sáng thì đối tượng vẫn nằm trong khu vực quan sát và đảm bảo ở gần với chính giữa
khoảng quan sát.
3.3.2. Xác định sai số về góc theo khoảng cách.
Tiến hành mô phỏng với khoảng cách trong khoảng từ 50-1500cm góc tín hiệu nằm
trong khoảng từ 15-165° để xác định sai số theo khoảng cách. Kết quả mô phỏng như sau:
Kết quả cho thấy sai số trong khoảng từ 50-1250cm có sai số về góc trung bình nằm
trong khoảng từ 0-2°. Ở ngoài vùng trên sai số có dấu hiệu tăng nhanh và không ổn định.
Do vậy, có thể xác định khoảng làm việc hiệu quả của mô hình nằm trong vùng khoảng
cách nhỏ hơn 1250cm.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 59, 02 - 2019 95
Hình 8. Kết quả mô phỏng sai số về góc theo khoảng cách.
3.3.3. Xác định sai số về khoảng cách.
Tiến hành mô phỏng với góc quét xác định và liên tục thay đổi khoảng cách trong
khoảng từ 50cm đến 1000cm để xác định sai số trung bình về khoảng cách. Kết quả mô
phỏng như sau:
Hình 9. Kết quả mô phỏng sai số khoảng cách.
Kết quả cho thấy trong khoảng từ 50-1000cm sai số về khoảng cách nằm trong khoảng
nhỏ hơn 10% và có sự tăng nhanh khi vượt qua khoảng cách này.
Như vậy, từ các kết quả mô phỏng trên cho thấy mô hình này có khả năng đáp ứng tốt
về góc và khoảng cách trong một vùng xác định. Tuy sai số về khoảng cách chưa thực sự
nhỏ nhưng chấp nhận được với cách ứng dụng về hỗ trợ cảnh báo đột nhập mà độ chính
xác yêu cầu cao về hướng của nguồn âm.
4. KẾT LUẬN
Dựa trên mô hình nhóm tác giả thiết kế cho thấy mô hình đã đáp ứng tốt và có khả năng
ứng dụng trong các thiết bị về giám sát, cảnh báo đột nhập đặc biệt trong điều kiện tối. Mô
hình này có thể được triển khai trên các nền tảng vi xử lý, DSP có cấu hình thấp do vậy
giúp chi phí thiết bị được giảm xuống. Kết hợp với nền tảng camera an ninh sẵn có và các
hệ thống chiếu sáng chủ động sẽ giúp cho các thiết bị an ninh được hoàn thiện hơn.
Tuy nhiên, kết quả cho thấy sai số về khoảng cách của mô hình còn tương đối lớn. Điều
này có thể khắc phục bằng cách sử dụng tần số lấy mẫu cao hơn, số lượng mẫu nhiều hơn.
Ngoài ứng dụng trong các mô hình cảnh báo đột nhập hệ thống này còn có thể được kết
hợp sử dụng trong các robot điều khiển. Hiện nay, việc tương tác giữa người và robot
thông qua giọng nói đang ngày càng phố biến. Mô hình này có thể giúp robot tìm ra hướng
nguồn âm của lệnh tương tác để thực hiện các lệnh tương tác phù hợp theo yêu cầu di
chuyển đối với đối tượng tương tác.
TÀI LIỆU THAM KHẢO
[1]. Alexander Ekimov and James M. Sabatier, “Vibration and sound signatures of
human footsteps in buildings,” The Journal of the Acoustical Society of America
120, 762 (2006).
Kỹ thuật điều khiển & Điện tử
L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 96
[2]. Despoina Pavlidi, Anthony Griffin, Matthieu Puigt, and Athanasios Mouchtaris,
“Real-Time Multiple Sound Source Localization and Counting Using a Circular
Microphone Array”, IEEE TRANSACTIONS ON AUDIO, SPEECH, AND
LANGUAGE PROCESSING, VOL. 21, NO. 10, OCTOBER 2013, pp. 2193-2205.
[3]. Toni Heittola, Annamaria Mesaros, Tuomas Virtanen, Antti Eronen, "Sound Event
Detection in Multisource Environments Using Source Separation," Machine
Listening in Multisource Environments, September 1, 2011
[4]. Y. Cho, D. Yook, S. Chang and H. Kim, "Sound source localization for robot
auditory systems," in IEEE Transactions on Consumer Electronics, vol. 55, no. 3, pp.
1663-1668, August 2009.
[5]. Xiaofei Li, Miao Shen, Wenmin Wang, and Hong Liu, "Real-Time Sound Source
Localization for a Mobile Robot Based on the Guided Spectral-Temporal Position
Method," International Journal of Advanced Robotic Systems, Jan. 2012
[6]. Horiuchi, T.; Mizumachi, M.; Nakamura, S., “Iterative compensation of microphone
array and sound source movements based on minimization of arrival time
differences,” IEEE Processing Workshop 2004 Sensor Array and Multichannel
Signal, pp. 566-570, Aug. 2004.
[7]. Chang, Yao Tang; Wu, Chi Lin; Cheng, Hsu Chih, “International Symposium on
Computer, Consumer and Control - Integrated Cross-Correlation and Genetic
Algorithm to Improve TDOA-Based Locating System in Preventing Radio
Interference,” IEEE 2014 International Symposium on Computer, Consumer and
Control, pp. 1078--1081, Sep. 2014.
[8]. Byoung-gi Lee, Jongsuk Choi and Munsang Kim, "Interaural Time Difference
estimation using Cross-power spectrum phase with zerocrossings," 2009 4th
International Conference on Autonomous Robots and Agents, Wellington, 2000, pp.
222-226.
[9]. Candès, E.J., & Wakin, M.B., “An Introduction To Compressive Sampling”, IEEE
Signal Processing Magazine, V.21, March 2008
[10]. Frank J. Fahy, "Engineering Acoustics/Outdoor Sound Propagation".
[11].
ABSTRACT
SOUND SOURCE LOCALIZATION FOR INTRUSION WARNING SYSTEMS
This paper introduces a model to determine the location of walking source
sound. Our model uses 3 microphones and calculates the direction and location of
sound in 2D space. The model uses 5 main steps: restoring sample, FFT calculator,
using IIR to filter the signal, determine the phase-different by cross-correlation,
determine location of walking source sound.
Keywords: DSP; Audio Processing; Sound Source Localization; TDOA; ÍTD.
Nhận bài ngày 30 tháng 11 năm 2018
Hoàn thiện ngày 20 tháng 12 năm 2018
Chấp nhận đăng ngày 19 tháng 02 năm 2019
Địa chỉ: 1 Học viện Công nghệ Bưu chính viễn thông;
2 Đại học Điện lực.
* Email: duanlc@ptit.edu.vn.
Các file đính kèm theo tài liệu này:
- 9_duan_1241_2150361.pdf