Xác định hướng nguồn âm trong cảnh báo đột nhập

Tài liệu Xác định hướng nguồn âm trong cảnh báo đột nhập: Kỹ thuật điều khiển & Điện tử L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 90 XÁC ĐỊNH HƯỚNG NGUỒN ÂM TRONG CẢNH BÁO ĐỘT NHẬP Lương Công Duẩn1*, Trần Vũ Kiên2, Nguyễn Ngọc Minh1 Tóm tắt: Bài báo trình bày về mô hình thiết bị xác định hướng của nguồn âm bước chân ứng dụng trong phát hiện và cảnh báo đột nhập. Mô hình sử dụng 3 điểm thu âm từ đó tính toán, xác định ra hướng, vị trí của nguồn âm trong không gian thông qua hàm tương quan chéo và các tính toán trong hình học không gian. Chương trình phần mềm cho mô hình được phát triển dựa trên 5 bước chính sau: Khôi phục mẫu nén sau khi nhận, Biến đổi FFT xác định cường độ âm thanh trong vùng tần số 200-500Hz[1], Lọc IIR để lọc bỏ các thành phần tần số ngoài vùng âm thanh bước chân, xác định độ lệch pha âm thanh thông qua hàm tương quan chéo, xác định vị trí nguồn âm trong không gian. Từ khóa: DSP; Xử lý âm thanh; Xác định vị trí nguồn âm; TDOA; ITD. 1. ĐẶT VẤN ĐỀ Bài ...

7 trang | Chia sẻ: quangot475 | Lượt xem: 944 | Lượt tải: 0

Bạn đang xem nội dung tài liệu Xác định hướng nguồn âm trong cảnh báo đột nhập, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên

Kỹ thuật điều khiển & Điện tử L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 90 XÁC ĐỊNH HƯỚNG NGUỒN ÂM TRONG CẢNH BÁO ĐỘT NHẬP Lương Công Duẩn1*, Trần Vũ Kiên2, Nguyễn Ngọc Minh1 Tóm tắt: Bài báo trình bày về mô hình thiết bị xác định hướng của nguồn âm bước chân ứng dụng trong phát hiện và cảnh báo đột nhập. Mô hình sử dụng 3 điểm thu âm từ đó tính toán, xác định ra hướng, vị trí của nguồn âm trong không gian thông qua hàm tương quan chéo và các tính toán trong hình học không gian. Chương trình phần mềm cho mô hình được phát triển dựa trên 5 bước chính sau: Khôi phục mẫu nén sau khi nhận, Biến đổi FFT xác định cường độ âm thanh trong vùng tần số 200-500Hz[1], Lọc IIR để lọc bỏ các thành phần tần số ngoài vùng âm thanh bước chân, xác định độ lệch pha âm thanh thông qua hàm tương quan chéo, xác định vị trí nguồn âm trong không gian. Từ khóa: DSP; Xử lý âm thanh; Xác định vị trí nguồn âm; TDOA; ITD. 1. ĐẶT VẤN ĐỀ Bài toán xác định hướng của nguồn âm là bài toán đang nhận được nhiều sự quan tâm trong đó có thể kể đến các ứng dụng như: Hỗ trợ Robot tương tác với người thông qua giọng nói; điều khiển camera tự động trong họp trực tuyến... Đã có nhiều nghiên cứu [2]- [5] về bài toán này tuy nhiên hầu hết các thiết kế này đều sử dụng đến mảng microphone gồm rất nhiều các microphone tích hợp. Với số lượng các microphone lớn có thể giúp xác định được vị trí của nguồn âm với độ chính xác cao đặc biệt trong mô hình không gian 3D. Với thiết kế có độ phức tạp cao nên cũng yêu cầu thiết bị cần có các bộ xử lý và cấu hình tốt, do vậy chi phí để sản xuất các thiết bị này cũng rất cao. Chính vì thế hiện nay các thiết bị này chưa thực sự phổ biến. Ở bài báo này, nhóm tác giả tập trung nghiên cứu thiết kế thiết bị ứng dụng trong bài toán xác định nguồn âm và đưa ra cảnh báo đột nhập. Hiện nay, các hệ thống camera an ninh hoạt chủ yếu hoạt động theo phương pháp quét dò để có thể thu được góc quét rộng, vì vậy vẫn có những khoảng “thời gian chết”. Hơn nữa, trong thời gian về đêm việc nhận diện các đối tượng cũng trở nên khó khăn. Chính vì những vấn đề trên tác giả định hướng xây dựng thêm một thiết bị phụ trợ hỗ trợ các hệ thống camera an ninh cũng như các hệ thống cảnh báo đột nhập khác dựa trên phân tích, xác định vị trí của âm thanh bước chân. Hơn nữa, trong hướng ứng dụng này nguồn âm xuất hiện ở 1 bề mặt tương đối phẳng và không thay đổi nên có thể quy về tính toán và xử lý tương đương trong không gian 2D. Điều này giúp tiết kiệm rất nhiều về chi phí thiết bị và nâng cao được tốc độ tính toán của thiết bị. Với mục tiêu chính là xác định hướng của nguồn âm với độ chính xác về khoảng cách yêu cầu không quá khắt khe giúp cho mô hình có thiết kế đơn giản và có thể tiến hành xử lý trên các nền tảng vi xử lý, DSP cấu hình thấp, dễ dàng áp dụng trên các thiết bị dân dụng. Bài báo được phân tích theo các phần chính như sau:  Phân tích lý thuyết và xây dựng mô hình hệ thống.  Xây dựng chương trình mô phỏng.  Thử nghiệm, đánh giá và đề xuất. 2. PHÂN TÍCH LÝ THUYẾT VÀ XÂY DỰNG MÔ HÌNH HỆ THỐNG 2.1. Phân tích lý thuyết Thiết kế của mô hình được dựa trên sự sai khác về thời gian giữa các điểm nhận tín hiệu âm TDOA (Time Differences Of Arrival) [6], [7] hoặc ITD (Interaural Time Difference)[8]. Với các khoảng cách khác nhau âm thanh nhận được đến các microphone Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 59, 02 - 2019 91 sẽ có độ trễ khác nhau. Khoảng thời gian chênh lệch được tính toán thông qua hàm tương quan chéo [7]. Hình 1. Nguyên lý tính toán dựa trên TDOA. Với tối thiểu 3 nguồn thu âm có thể tính toán được vị trí của nguồn âm trong không gian bằng các tính toán hình học cơ bản. Vị trí của các microphone có thể đặt tùy ý tuy nhiên ở đây để dễ dàng cho thiết kế và tính toán tác giả sử dụng 3 microphone ở các vị trí tạo thành 1 đường thẳng và có khoảng cách giữa MIC1 và MIC3 đến MIC2 là đều nhau và chọn MIC2 là vị trí để tham chiếu. MIC2 được coi là vị trí tham chiếu nên quy định MIC2 có tọa độ là (0,0) từ đó suy ra MIC1 có tọa độ là (-d,0) và MIC3 có tọa độ là (d,0). Ngoài ra, do xác định được khoảng thời gian chênh lệch của tín hiệu âm thanh giữa MIC1 và MIC2, MIC3 và MIC2 nên có giá trị a và b. Hình 2. Vị trí lắp đặt các nguồn thu âm. Từ đó, có thể tính toán được tọa độ của nguồn âm thông qua hệ phương trình: 2 2 ( ) 2 2 2 2 ( ) x d y D a x y D x d y D b                        (1) Khoảng cách chênh lệch từ nguồn âm đạt giá trị lớn nhất khi nguồn âm (Sound Source) kết hợp với các MIC tạo thành một đường thẳng và nằm về phía ngoài so với vị trí của các MIC. Trong đó, nguồn âm thanh do tiếng bước chân tạo nên có dải tần tập trung vào khoảng từ 200Hz - 500Hz[1]. Do vậy, khoảng cách giữa các MIC (d) cần thỏa mãn điều kiện (2) để đảm bảo trong quá trình tính toán hàm tương quan chéo không xảy ra hiện tượng chồng pha trong trường hợp tín hiệu đến là tín hiệu tuần hoàn: axm v d f  (2) Kỹ thuật điều khiển & Điện tử L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 92 Với vận tốc âm thanh đạt khoảng 330m/s và tần số âm lớn nhất khảo sát ax 500mf Hz nên điều kiện về khoảng cách giữa các vị trí đặt microphone là: 66( )d cm . Đồng thời khoảng cách này cũng không được quá nhỏ và phụ thuộc vào tần số lấy mẫu âm thanh của bộ xử lý. Tần số lấy mẫu càng cao thì khoảng cách d có thể càng nhỏ và tương đương với độ chính xác tính toán cao. Khi sử dụng nhiều microphone, số lượng mẫu tại các microphone cần phải truyền về là rất lớn. Để có thể giảm lượng dữ liệu cần truyền và năng lượng truyền khi sử dụng đường truyền không dây, các mẫu tín hiệu sẽ được nén trước khi truyền về. Sau khi thu nhận, các mẫu tín hiệu sẽ được giải nén và xử lý [9]. 2.2. Xây dựng mô hình hệ thống Theo các phân tích như ở trên mô hình chương trình được xây dựng như sau: Hình 3. Mô hình phần mềm. Trong đó, các khối có vai trò và thiết kế chi tiết như sau: Khối khôi phục mẫu: Khối khôi phục mẫu thực hiện tiếp nhận các tín hiệu thu nhận được từ các bộ thu tín hiệu và giải nén để khôi phục các mẫu tín hiệu gốc. Khối FFT, xác định biên độ: Thực hiện biến đổi Fourier một trong 3 tín hiệu âm thanh đã thu được từ một trong 3 microphone sau đó xác định ngưỡng giá trị cường độ trong khoảng 200-500Hz. Nếu cường độ âm trong khoảng này lớn hơn một ngưỡng quy định thì thực hiện các tính toán tiếp theo. Nếu không xác định không có tín hiệu bước chân và bỏ qua. Khối IIR thông dải: Thực hiện lọc tín hiệu âm thanh đầu vào sử dụng bộ lọc thông dải tần số từ 200-500Hz nhằm loại bỏ nhiễu cũng như các tín hiệu tạp âm khác và trích lấy các âm ở khoảng của tín hiệu bước chân. Bộ lọc IIR có thiết kế đơn giản nên có thể hỗ trợ tính toán nhanh phù hợp với các kiến trúc xử lý chậm. Bộ lọc này được áp dụng với cả 3 tín hiệu đầu vào. Khối tương quan chéo: Sau khi 3 tín hiệu đã được lọc thông qua bộ lọc IIR, 2 cặp tín hiệu từ MIC1-MIC2 và MIC3-MIC2 được đưa vào 2 khối tương quan chéo để xác định được khoảng lệch thời gian của 2 cặp tín hiệu này. Đầu ra của khối này là khoảng thời gian chênh lệch và có thể quy đổi ra hiệu khoảng cách của tín hiệu đến các microphone. Khối tính toán, xác định vị trí: Sử dụng công thức (1), khối này có vai trò tính toán ra vị trí của nguồn âm thông qua độ lệch khoảng cách từ nguồn âm tới các vị trí đo tín hiệu. 3. MÔ PHỎNG VÀ ĐÁNH GIÁ 3.1. Tín hiệu thử nghiệm Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 59, 02 - 2019 93 Tín hiệu đầu vào là một số tín hiệu âm bước chân được thu âm sẵn. Dưới đây là một tín hiệu âm bước chân được sử dụng: Hình 4. Nguồn âm thử nghiệm. Bản thân tín hiệu được thu âm đã có can nhiễu âm thanh môi trường. Ngoài ra, các tín hiệu nguồn âm thực tế thường có can nhiễu từ sự ổn định của các tín hiệu thu. Do vậy, tín hiệu trước khi được đưa vào bộ mô phỏng được xử lý bằng cách bổ sung nhiễu trắng và suy hao về cường độ theo khoảng cách[10]. Cường độ của nhiễu trắng được thêm vào phụ thuộc khoảng cách từ nguồn âm đến các microphone. Dưới đây là một đoạn tín hiệu âm đã được xử lý bổ sung nhiễu và suy hao với giả sử điều kiện suy hao lớn nhất trong điều kiện môi trường 50°C độ ẩm 90%[11]. Hình 5. Nguồn âm sau khi thêm nhiễu và suy hao. 3.2. Mô phỏng Chương trình được xây dựng trên nền tảng phần mềm Matlab. Với các nền tảng vi điều khiển, DSP hiện tại thường có tần số lấy mẫu khoảng dưới 1MSps. Vì vậy, ở đây tác giả tiến hành mô phỏng với tần số lẫy mẫu mỗi kênh là 100kSps để có thể đạt được sai số ±3.4cm về khoảng cách lấy mẫu giúp giảm sai số khi tính toán hướng và vị trí của nguồn âm. Tổng trên 3 kênh là 300kSps phù hợp với các nền tảng vi điều khiển, DSP hiện có. Các mẫu này sẽ được nén lại và truyền về. Số lượng mẫu cho mỗi lần đo và tính toán là 2048 điểm. Khoảng cách d giữa các microphone được thử nghiệm ở mức 40cm (2). Quá trình mô phỏng gồm các bước sau:  Mô phỏng xác định độ chính xác của mô hình trong khoảng từ 0-180 độ  Xác định sai số của mô hình hệ thống theo khoảng cách.  Xác định sai số của mô hình hệ thống theo góc quét. 3.3. Kết quả mô phỏng và bình luận 3.3.1. Xác định vùng hoạt động tối ưu Với mục tiêu được xác định là hỗ trợ cảnh báo đột nhập cho các thiết bị như camera an ninh, hệ thống đèn quét... nên hệ thống cần đạt được độ chính xác cao về hướng của nguồn âm để khi kết hợp với góc quét của các thiết bị sẵn có vẫn đảm bảo các đối tượng xâm Kỹ thuật điều khiển & Điện tử L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 94 nhập nằm trong khu vực quản lý của thiết bị. Do vậy cần xác định được vùng hoạt động có sai số về góc đảm bảo vật thể xâm nhập vẫn nằm trong vùng quét của thiết bị cảnh báo và giám sát. Chương trình mô phỏng thực hiện với một khoảng cách bất kỳ và góc của tín hiệu so với đường thẳng tạo thành của 2 microphone chạy từ 0-180°. Quá trình mô phỏng cho kết quả như sau: Hình 6. Kết quả mô phỏng thử nghiệm vùng hoạt động. Kết quả mô phỏng cho sai số tăng dần từ 90° về 2 phía của đồ thị. Trong đó sai số của vùng xung quanh góc 90° tiệm cận đến 0. Sai số trong khoảng từ 15-165° nằm trong khoảng nhỏ hơn 5° và tăng nhanh trong khoảng 0-15° và 165-180°. Hai vùng này có giá trị sai số khoảng 5-15°. Hình 7. Phân bố sai số về góc ở các khoảng cách nguồn âm khác nhau. Với kết quả này cho thấy mô hình có khả năng hoạt động tốt trong vùng từ 15-165°. Với sai số khoảng 3° kết hợp với góc quét của camera an ninh hoặc các hệ thống đèn chiếu sáng thì đối tượng vẫn nằm trong khu vực quan sát và đảm bảo ở gần với chính giữa khoảng quan sát. 3.3.2. Xác định sai số về góc theo khoảng cách. Tiến hành mô phỏng với khoảng cách trong khoảng từ 50-1500cm góc tín hiệu nằm trong khoảng từ 15-165° để xác định sai số theo khoảng cách. Kết quả mô phỏng như sau: Kết quả cho thấy sai số trong khoảng từ 50-1250cm có sai số về góc trung bình nằm trong khoảng từ 0-2°. Ở ngoài vùng trên sai số có dấu hiệu tăng nhanh và không ổn định. Do vậy, có thể xác định khoảng làm việc hiệu quả của mô hình nằm trong vùng khoảng cách nhỏ hơn 1250cm. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 59, 02 - 2019 95 Hình 8. Kết quả mô phỏng sai số về góc theo khoảng cách. 3.3.3. Xác định sai số về khoảng cách. Tiến hành mô phỏng với góc quét xác định và liên tục thay đổi khoảng cách trong khoảng từ 50cm đến 1000cm để xác định sai số trung bình về khoảng cách. Kết quả mô phỏng như sau: Hình 9. Kết quả mô phỏng sai số khoảng cách. Kết quả cho thấy trong khoảng từ 50-1000cm sai số về khoảng cách nằm trong khoảng nhỏ hơn 10% và có sự tăng nhanh khi vượt qua khoảng cách này. Như vậy, từ các kết quả mô phỏng trên cho thấy mô hình này có khả năng đáp ứng tốt về góc và khoảng cách trong một vùng xác định. Tuy sai số về khoảng cách chưa thực sự nhỏ nhưng chấp nhận được với cách ứng dụng về hỗ trợ cảnh báo đột nhập mà độ chính xác yêu cầu cao về hướng của nguồn âm. 4. KẾT LUẬN Dựa trên mô hình nhóm tác giả thiết kế cho thấy mô hình đã đáp ứng tốt và có khả năng ứng dụng trong các thiết bị về giám sát, cảnh báo đột nhập đặc biệt trong điều kiện tối. Mô hình này có thể được triển khai trên các nền tảng vi xử lý, DSP có cấu hình thấp do vậy giúp chi phí thiết bị được giảm xuống. Kết hợp với nền tảng camera an ninh sẵn có và các hệ thống chiếu sáng chủ động sẽ giúp cho các thiết bị an ninh được hoàn thiện hơn. Tuy nhiên, kết quả cho thấy sai số về khoảng cách của mô hình còn tương đối lớn. Điều này có thể khắc phục bằng cách sử dụng tần số lấy mẫu cao hơn, số lượng mẫu nhiều hơn. Ngoài ứng dụng trong các mô hình cảnh báo đột nhập hệ thống này còn có thể được kết hợp sử dụng trong các robot điều khiển. Hiện nay, việc tương tác giữa người và robot thông qua giọng nói đang ngày càng phố biến. Mô hình này có thể giúp robot tìm ra hướng nguồn âm của lệnh tương tác để thực hiện các lệnh tương tác phù hợp theo yêu cầu di chuyển đối với đối tượng tương tác. TÀI LIỆU THAM KHẢO [1]. Alexander Ekimov and James M. Sabatier, “Vibration and sound signatures of human footsteps in buildings,” The Journal of the Acoustical Society of America 120, 762 (2006). Kỹ thuật điều khiển & Điện tử L. C. Duẩn, T. V. Kiên, N. N. Minh, “Xác định hướng nguồn âm trong cảnh báo đột nhập.” 96 [2]. Despoina Pavlidi, Anthony Griffin, Matthieu Puigt, and Athanasios Mouchtaris, “Real-Time Multiple Sound Source Localization and Counting Using a Circular Microphone Array”, IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL. 21, NO. 10, OCTOBER 2013, pp. 2193-2205. [3]. Toni Heittola, Annamaria Mesaros, Tuomas Virtanen, Antti Eronen, "Sound Event Detection in Multisource Environments Using Source Separation," Machine Listening in Multisource Environments, September 1, 2011 [4]. Y. Cho, D. Yook, S. Chang and H. Kim, "Sound source localization for robot auditory systems," in IEEE Transactions on Consumer Electronics, vol. 55, no. 3, pp. 1663-1668, August 2009. [5]. Xiaofei Li, Miao Shen, Wenmin Wang, and Hong Liu, "Real-Time Sound Source Localization for a Mobile Robot Based on the Guided Spectral-Temporal Position Method," International Journal of Advanced Robotic Systems, Jan. 2012 [6]. Horiuchi, T.; Mizumachi, M.; Nakamura, S., “Iterative compensation of microphone array and sound source movements based on minimization of arrival time differences,” IEEE Processing Workshop 2004 Sensor Array and Multichannel Signal, pp. 566-570, Aug. 2004. [7]. Chang, Yao Tang; Wu, Chi Lin; Cheng, Hsu Chih, “International Symposium on Computer, Consumer and Control - Integrated Cross-Correlation and Genetic Algorithm to Improve TDOA-Based Locating System in Preventing Radio Interference,” IEEE 2014 International Symposium on Computer, Consumer and Control, pp. 1078--1081, Sep. 2014. [8]. Byoung-gi Lee, Jongsuk Choi and Munsang Kim, "Interaural Time Difference estimation using Cross-power spectrum phase with zerocrossings," 2009 4th International Conference on Autonomous Robots and Agents, Wellington, 2000, pp. 222-226. [9]. Candès, E.J., & Wakin, M.B., “An Introduction To Compressive Sampling”, IEEE Signal Processing Magazine, V.21, March 2008 [10]. Frank J. Fahy, "Engineering Acoustics/Outdoor Sound Propagation". [11]. ABSTRACT SOUND SOURCE LOCALIZATION FOR INTRUSION WARNING SYSTEMS This paper introduces a model to determine the location of walking source sound. Our model uses 3 microphones and calculates the direction and location of sound in 2D space. The model uses 5 main steps: restoring sample, FFT calculator, using IIR to filter the signal, determine the phase-different by cross-correlation, determine location of walking source sound. Keywords: DSP; Audio Processing; Sound Source Localization; TDOA; ÍTD. Nhận bài ngày 30 tháng 11 năm 2018 Hoàn thiện ngày 20 tháng 12 năm 2018 Chấp nhận đăng ngày 19 tháng 02 năm 2019 Địa chỉ: 1 Học viện Công nghệ Bưu chính viễn thông; 2 Đại học Điện lực. * Email: [email protected].

Các file đính kèm theo tài liệu này:

9_duan_1241_2150361.pdf