Tài liệu Kỹ thuật phân tích thành phần độc lập sử dụng ước lượng nguyên lý cực đại trong tách các tổ hợp tín hiệu âm thanh - Nguyễn Thị Huyền: Kỹ thuật điện tử & Khoa học mỏy tớnh
Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phõn tớch tớn hiệu õm thanh” 106
Kỹ thuật phân tích thành phần độc lập
sử dụng ước lượng nguyên lý cực đại trong
tách các tổ hợp tín hiệu âm thanh
NGUYỄN THỊ HUYỀN, PHAN TRỌNG HANH
Túm tắt: Phõn tớch thành phần độc lập (Independent Component Analysis -
ICA) là một kỹ thuật tớnh toỏn phõn tỏch nguồn mự hiệu quả trong nhiều ứng
dụng thực tế của cỏc lĩnh vực khoa học và cụng nghệ khỏc nhau. Bài bỏo nghiờn
cứu cỏch ỏp dụng phương phỏp ước lượng hợp lý cực đại trong ICA, đề xuất
cỏch đỏnh giỏ độ hội tụ của thuật toỏn thụng qua số lần lặp để cải thiện tốc độ
của thuật toỏn.
Từ khúa: ICA, Ước lượng ML.
1. MỞ ĐẦU
Kỹ thuật ICA là một phỏt minh tương đối mới ở cuối thế kỷ 20 được giới thiệu
lần đầu tiờn vào những năm đầu thập niờn 1980 trong khung cảnh mụ hỡnh mạng
nơ ron. ICA cú thể được xem như phần mở rộng của kỹ thuật phõn tớch thành phần
chủ yếu (Principal Component Analysis - ...
10 trang |
Chia sẻ: quangot475 | Lượt xem: 653 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Kỹ thuật phân tích thành phần độc lập sử dụng ước lượng nguyên lý cực đại trong tách các tổ hợp tín hiệu âm thanh - Nguyễn Thị Huyền, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
Kỹ thuật điện tử & Khoa học máy tính
Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 106
Kü thuËt ph©n tÝch thµnh phÇn ®éc lËp
sö dông íc lîng nguyªn lý cùc ®¹i trong
t¸ch c¸c tæ hîp tÝn hiÖu ©m thanh
NGUYỄN THỊ HUYỀN, PHAN TRỌNG HANH
Tóm tắt: Phân tích thành phần độc lập (Independent Component Analysis -
ICA) là một kỹ thuật tính toán phân tách nguồn mù hiệu quả trong nhiều ứng
dụng thực tế của các lĩnh vực khoa học và công nghệ khác nhau. Bài báo nghiên
cứu cách áp dụng phương pháp ước lượng hợp lý cực đại trong ICA, đề xuất
cách đánh giá độ hội tụ của thuật toán thông qua số lần lặp để cải thiện tốc độ
của thuật toán.
Từ khóa: ICA, Ước lượng ML.
1. MỞ ĐẦU
Kỹ thuật ICA là một phát minh tương đối mới ở cuối thế kỷ 20 được giới thiệu
lần đầu tiên vào những năm đầu thập niên 1980 trong khung cảnh mô hình mạng
nơ ron. ICA có thể được xem như phần mở rộng của kỹ thuật phân tích thành phần
chủ yếu (Principal Component Analysis - PCA) [1].
ICA định nghĩa một mô hình sinh cho dữ liệu đa biến quan sát được, thường
được cho như một cơ sở dữ liệu lớn của các mẫu. Trong mô hình, các biến dữ liệu
được giả thiết là tổ hợp tuyến tính hoặc phi tuyến của một số biến ẩn chưa biết và
hệ thống các tham số tổ hợp cũng chưa được biết trước. Các biến ẩn được giả thiết
là không chuẩn, độc lập tương hỗ và được gọi là các thành phần độc lập của dữ
liệu quan sát được. Các thành phần độc lập này cũng được gọi là các nguồn hoặc
các hệ số, có thể được xác định bởi kỹ thuật ICA. Để thực hiện nhiệm vụ này, ICA
giả thiết rằng tín hiệu thu được bao gồm một số thành phần độc lập thống kê với
nhau và thực hiện xử lí sao cho tính độc lập của các thành phần này là cực đại.
Trước đây, kỹ thuật ICA được xử lý nhờ các thuật toán cực đại hóa tính phi
Gaussian hay nguyên lý thông tin cực đại, tuy nhiên, các thuật toán này có độ hội
tụ khá chậm [2]. Có một cách tiếp cận cải thiện đáng kể thời gian xử lý của kỹ
thuật ICA, đó là sử dụng phương pháp ước lượng hợp lý cực đại [3] trong ước
lượng các tham số mô hình ICA.
2. ICA SỬ DỤNG PHƯƠNG PHÁP ƯỚC LƯỢNG HỢP LÝ CỰC ĐẠI
2.1 Mô hình ICA
Mô hình ICA được đề cập trong [4]. Trong đó, giả sử ta quan sát n xáo trộn
tuyến tính của n thành phần độc x1, x2, , xn, chẳng hạn như các tín hiệu thu được
từ micro trong một hội nghị hoặc tổ hợp tín hiệu từ Sonar, hình ảnh,... Bỏ tham số
thời gian ta có:
1 1 2 2 ...i i i in nx a s a s a s với mọi giá trị của i =1, , n (1)
Với xi, s1, s2 đều là hàm của tham số thời gian t và aij, i,j = 1, , n là các hệ
số thực.
Định nghĩa x là véc tơ ngẫu nhiên chứa các phần tử là các tổ hợp 1 2, ,..., nx x x và
s là véc tơ ngẫu nhiên với các phần tử 1 2, ,..., ns s s được gọi là các thành phần độc
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 107
lập. A gồm các phần tử aij được gọi là ma trận trộn. Tất cả các véc tơ đều được viết
dưới dạng véc tơ cột. Ta có mô hình trộn: x=As
Gọi ai là các véc tơ cột của ma trận A, mô hình cũng có thể được viết lại như sau:
1
n
i i
i
sx a
(2)
Mô hình trên được gọi là phân tích thành phần độc lập hoặc mô hình ICA. Mô
hình ICA là một mô hình sinh (generative model) với ý nghĩa là nó mô tả quá trình
dữ liệu được quan sát được tạo ra bởi một quá trình tổ hợp các phần tử si như thế
nào. Khởi đầu cho ICA là một giả thiết rất đơn giản rằng các phần tử si là độc lập
thống kê và có phân bố phi Gaussian (nongaussian). Giả thiết thứ hai là các ma
trận xáo trộn chưa biết là các ma trận vuông. Cái chúng ta quan sát được chỉ là véc
tơ ngẫu nhiên x và ta cần phải ước lượng cả A và s sử dụng nó.
Trong mô hình ICA, xem mỗi một tổ hợp xi cũng như mỗi một thành phần độc
lập sk là một biến ngẫu nhiên thay thế cho một tín hiệu riêng. Không mất tính tổng
quát, giả thiết rằng cả tín hiệu được tổ hợp và cả thành phần độc lập đều có trung
bình 0. Nếu không, các biến xi quan sát được có thể luôn luôn được định tâm lại
bằng cách trừ đi một lượng trung bình mẫu để đảm bảo mô hình có trung bình 0.
Tức là các tổ hợp đầu vào của thuật toán 'x là kết quả tiền xử lý bởi:
' 'E x x x (3)
được xử lý trước khi kỹ thuật ICA thực hiện. Do các thành phần độc lập có trung
bình 0, nên:
1E Es A x (4)
Như vậy, sau khi ước lượng ma trận tổ hợp và các thành phần độc lập với các
dữ liệu trung bình 0 có thể đơn giản được xây dựng lại bằng việc thêm 1 'EA x
vào các thành phần độc lập trung bình 0. Với mô hình có trung bình 0 này sẽ thuận
tiện cho việc sử dụng ma trận véc tơ để thay thế cho các tổng trong biểu thức trên.
2.2. Ước lượng hợp lý cực đại
Ước lượng hợp lý cực đại (Maximum Likelihood- ML) [5] thực hiện ước lượng
đại lượng ˆML của véc tơ tham số θ được chọn sao cho
ˆ
ML làm cực đại hóa hàm
phân bố xác suất chung:
1 21 , 1 ,..., | ( ) ( ) ... ( )n np p x x x n p x p x p x x (5)
của các tham số x(1), x(2), , x(n) là n quan sát độc lập thống kê và có phân bố
xác định. Ước lượng hợp lý cực đại tương ứng với giá trị ˆML làm cho các tham số
xác định được là hợp lý nhất.
Các phân bố điển hình thường có hàm mật độ xác suất có dạng mũ nên để thuận
tiện hơn khi giải quyết vấn đề ước lượng hợp lý cực đại, ta thường xét hàm log hợp
lý: lnp(xn| θ). Hiển nhiên là ước lượng hợp lý cực đại ˆML cũng làm cực đại hóa
hàm log hợp lý. Như vậy, ước lượng hợp lý cực đại chính là nghiệm của biểu thức:
ˆ
ln 0
ML
np
x (6)
Kỹ thuật điện tử & Khoa học máy tính
Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 108
Biểu thức (6) xác định các giá trị của θ làm cực đại hóa (cực tiểu hóa) hàm hợp
lý. Trong trường hợp hàm hợp lý phức tạp, phải có thêm một số cực trị địa phương,
ta phải lựa chọn giá trị của ˆML tương ứng với trị tuyệt đối cực đại. Biểu thức hợp
lý (6) bao gồm m biểu thức:
ˆ
ˆln 0, 1,...,
ML
n ML
i
p i m
x (7)
cho m tham số ước lượng ,
ˆ , 1,...,i ML i m .
Dựa trên các công thức toán học của phương pháp ước lượng hợp lý cực đại, xét
việc áp dụng nguyên lý này vào mô hình ICA để ước lượng các véc tơ của ma trận
trộn các thành phần độc lập.
2.3. Mô hình ICA theo ước lượng hợp lý cực đại
Để xây dựng hàm hợp lý xét mô hình ICA không có tạp âm:
x = As (8)
Đặt W = (w1,, wn)
T = A-1, biểu thức loga của hợp lý được cho bởi:
1 1
log log det
T n
T
i i
t i
L f t Tw x W (9)
Trong đó, fi là các hàm mật độ của si (ở đây ta giả thiết là đã biết trước) và x(t),
t = 1, , T là phần thực của x. Với một véc tơ ngẫu nhiên x bất kỳ có hàm mật độ
xác suất px và với một ma trận W bất kỳ thì hàm mật độ của véc tơ y=Wx được
xác định là px(Wx)|detW|.
Nếu việc ước lượng ma trận A (hoặc W) chính xác thì y=Wx = WAs = A-1As =
s tức là ta đã xác định được các thành phần độc lập.
Thay thế tổng theo chỉ số t trong (9) bởi hàm kỳ vọng và chia cho T ta được:
1
log log det
n
T
i i
i
L
E f
T
w x W (10)
Hàm kỳ vọng này cho phép ta xác định được giá trị trung bình của các mẫu
quan sát được.
Xét các thuật toán thực hiện kỹ thuật ICA sử dụng ước lượng hợp lý cực đại:
Thuật toán Bell-Sejnowski: [4] Là lớp các thuật toán đơn giản nhất để cực đại
hóa hàm hợp lý trong nhóm các phương pháp gradient. Gradient thống kê của log-
hàm hợp lý:
1 11 T T T TL E E
T
W g Wx x W g y x
W
(11)
g(y) = (gi(yi), , gn(yn) là một hàm véc tơ hàng bao gồm các hàm tỷ lệ gi âm
của các phân bố si, được định nghĩa:
'
'
log ii i
i
f
g f
f
(12)
Xét thuật toán sử dụng ước lượng ML theo biểu thức:
1T TE
W W g y x
(13)
Bỏ qua hàm kỳ vọng trong mỗi bước của thuật toán, tính toán cho một điểm dữ
liệu được sử dụng ta có:
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 109
1T T W W g y x (14)
Thuật toán trong biểu thức (13) hội tụ rất chậm vì phải xác định nghịch đảo của
ma trận W trong các bước xử lý của thuật toán. Vì thế dù thuật toán Bell-
Sejnowski khá đơn giản nhưng ít được sử dụng trong thực tế.
Thuật toán gradient tự nhiên: [4] Thực hiện đơn giản hóa việc xác định cực
đại của hàm hợp lý. Nguyên lý của gradient tự nhiên dựa trên cấu trúc hình học của
không gian tham số.
Nhân vế phải của biểu thức (13) với WTW, ta có:
TE W I g y y W (15)
Thuật toán hội tụ khi TE g y y I tức là yi và gj (yj) là không tương quan với
mọi i ≠ j. Các lớp hàm g thường được chọn thuộc về tập các lớp hàm không toàn
phương và trong thuật toán này ta chọn g là một hàm tanh (tanhx = sinhx/coshx),
xét với các phân bố trên chuẩn (supergaussian), chọn:
2 tanhg y y (16)
Với các thành phần độc lập dưới chuẩn(subgaussian) ta lựa chọn hàm g:
tanhg y y y (17)
Việc lựa chọn sử dụng hai thành phần phi tuyến trong (16) và (17) dựa trên kết
quả tính toán của mô men phi đa thức:
2tanh 1 tanhi i iE s s s (18)
Việc sử dụng mô men phi đa thức yêu cầu đầu tiên là các ước lượng của các
thành phần độc lập phải có cùng tỷ lệ chính xác, ràng buộc chúng có phương sai
bằng 1. Nếu dấu của mô men tính được là âm thì lựa chọn g theo (16), ngược lại
thì chọn theo (17)
Thuật toán được tóm tắt lại trong bảng 1. Trong bảng này, quá trình trắng hóa
và chuẩn hóa dữ liệu thô được thực hiện ở bước tiền xử lý của ICA.
Bảng 1. Thuật toán gradient tự nhiên thống kê trực tuyến cho ước lượng ML.
STT
các bước
Nội dung thực hiện
Bước 1 Định tâm dữ liệu.
Bước 2 Khởi tạo giá trị ban đầu cho ma trận W. Chọn các giá trị ban đầu của si ,
i=1, , n có thể tạo một cách ngẫu nhiên hoặc sử dụng các thông tin biết
trước. Chọn tốc độ học µ và µγ
Bước 3 Tính toán biểu thức y = Wx
Bước 4 Nếu các hàm phi tuyến là không cố định trước thì:
Cập nhật 21 tanh 1 tanhi i i i is s s E y y y (19)
- Nếu si > 0 thì định nghĩa lại gi theo biểu thức (2.16), nếu không thì sử
dụng biểu thức (2.17).
Bước 5 Cập nhật ma trận phân tách bởi: T W W I g y y W (20)
Bước 6 Nếu không hội tụ ( TE g y y I ) quay lại bước 3.
Kỹ thuật điện tử & Khoa học máy tính
Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 110
Thuật toán cố định điểm nhanh - FastICA
Hàm hợp lý có thể được cực đại hóa theo thuật toán cố định điểm nhanh. Thuật
toán cố định điểm thuộc lớp thuật toán FastICA [3, 4] là một phương pháp có tốc
độ hội tụ rất nhanh và tin cậy để cực đại hóa tính không chuẩn sử dụng trong ước
lượng ICA. Thực tế, thuật toán FastICA có thể được áp dụng trực tiếp để cực đại
hóa hàm hợp lý.
Bước lặp thuật toán FastICA cho dữ liệu đã thực hiện trắng hóa (norm w =1)
được thực hiện như sau:
T TE g 'E g w w z w z w w z (21)
Trong đó, β được xác định: i iE y g y , w
+ là giá trị cập nhật mới của w và
z là véc tơ sau thủ tục trắng hóa của x. Viết dưới dạng ma trận ta có:
diag diag Ti i E g W W y y W (22)
Với αi = '1 T iE g w z và y = Wz.
Sau mỗi bước lặp, ma trận W cần được tham chiếu đến tập các ma trận trắng
hóa để đảm bảo tính trực giao của nó:
1 2T W WCW W (23)
Với C = E{xxT} là ma trận tương quan của dữ liệu.
Các bước xử lý của thuật toán FastICA được tóm tắt trong bảng 2. Trong
FastICA, tốc độ hội tụ được tối ưu bởi việc lựa chọn các ma trận đường chéo diag
(αi) và diag (βi). Hai ma trận này quyết định kích thước bước lặp tối ưu được sử
dụng trong thuật toán.
Bảng 2. Thuật toán FastICA cho ước lượng hợp lý cực đại.
STT
các bước
Nội dung thực hiện
Bước 1 Định tâm dữ liệu. Tính ma trận tương quan C=E{xxT}.
Bước 2 Chọn một giá trị khởi tạo cho ma trận phân tách W (có thể chọn ngẫu
nhiên).
Bước 3 Thực hiện tính toán: y Wx (24)
; 1,...,i i iE y g y i n (25)
1 ' ; 1,...,i i iE g y i n (26)
Bước 4 Cập nhật ma trận phân tách theo:
Ti idiag diag E g W W y y W (27)
Bước 5 Giải tương quan và chuẩn hóa bởi:
1 2
;T T
W WCW W W = W W W (28)
Bước 6 Nếu không hội tụ ( TE g y y I ) quay lại bước 3.
Trong FastICA, đầu ra yi là được giải tương quan và được chuẩn hóa với
phương sai bằng 1 sau mỗi bước lặp. Không có các thao tác phức tạp như trong
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 111
thuật toán gradient chính vì thế tốc độ xử lý của FastICA nhanh hơn hẳn so với các
phương pháp truyền thống. Như vậy trong các thuật toán xử lý kỹ thuật ICA theo
nguyên lý ước lượng hợp lẽ cực đại thì thuật toán FastICA bằng thủ tục trắng hóa
và giải tương quan ma trận trộn đã giảm số lượng các phần tử cần phải ước lượng
của ma trận trộn từ n2 xuống còn n(n-1)/2 vì ma trận W là trực giao. Một ưu điểm
khác nữa của FastICA là nó có thể ước lượng cả các thành phần độc lập có phân bố
trên và dưới chuẩn.
2.4. Một số ứng dụng điển hình của ICA
ICA trong lĩnh vực y tế [6]: Xét các bản ghi điện tử của các hoạt động não bộ
của con người được ghi lại bởi điện não đồ MEG (Magneto Encephalo Graphy).
Dữ liệu MEG bao gồm các bản ghi của các điện áp tại các vùng khác nhau của vỏ
não. Các điện áp này được tạo ra bằng cách trộn một số thành phần điện áp nằm
dưới hoạt động não bộ. Bài toán đặt ra là cần tìm ra các thành phần ban đầu của
hoạt động não bộ nhưng lại chỉ có thể quan sát các tổ hợp của các thành phần. Để
giải quyết bài toán này, sử dụng thuật toán ICA, FastICA để tách các hình ảnh độc
lập trong tín hiệu MEG nhằm phát hiện ra các thành phần chuyển động của các cơ
quan và đặc biệt hơn là tìm ra được các thành phần lạ là các xung bệnh lý. Như
hình 1 minh họa, với thuật toán FastICA có thể tách ra được cả thành phần chuyển
động của mắt và nháy mắt (IC3, IC5) cũng như các thành phần của tim, cơ và các
thành phần khác từ các tín hiệu MEG, trong đó phát hiện ra IC4 thể hiện thành
phần lạ của tim chính là xung bệnh lý cần khắc phục. Thuật toán FastICA là một
công cụ đặc biệt phù hợp với việc phân tích tín hiệu hình ảnh MEG này bởi vì việc
phát hiện chuyển động của thành phần lạ là một kỹ thuật tương hỗ và việc tìm ra
chúng có thể thoải mái lựa chọn bao nhiêu thành phần độc lập (IC- Independent
Component) muốn có.
a) b)
Hình 1. a) Các mẫu của tín hiệu MEG.
b) Các thành phần độc lập được tách từ dữ liệu MEG.
ICA trong khử giao thoa cho tín hiệu Sonar thụ động [7]: thực hiện phân tách
thành phần độc lập đối với tín hiệu đầu ra của các hydrophone gồm ba thành phần
độc lập: hai tín hiệu từ hai mục tiêu ở hướng 1900, 2050 và tín hiệu tự nhiễu nhằm
giảm nhiễu giao thoa trong các hướng lân cận nhau. Xét ví dụ phân tích DEMON
Kỹ thuật điện tử & Khoa học máy tính
Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 112
(Demodulation of Envolope Modulation On Noise - giải điều chế đường bao trên
nền nhiễu) tín hiệu thu được từ hướng 2050 bị nhiễu giao thoa bởi mục tiêu theo
hướng 1900 khi không sử dụng ICA và sử dụng ICA như trong hình 2.
a) b)
Hình 2. Phân tích DEMON ở 2050: a) không sử dụng ICA, b) sử dụng ICA.
Với việc sử dụng ICA, biên độ các thành phần tần số giao thoa FA và FC đã được
giảm từ -5.9dB và -3.2dB tương ứng xuống mức -9.1dB và -4.2dB. Trên thực tế,
phương pháp sử dụng ICA để giảm nhiễu giao thoa đã được ứng dụng trong Hải
quân Braxin.
Trong lĩnh vực viễn thông, xét ứng dụng thực tế của kỹ thuật FastICA trong tách
các tổ hợp âm thanh sử dụng trong quốc phòng, an ninh.
3. THỰC HIỆN THUẬT TOÁN FASTICA
3.1. Xử lý các tổ hợp tín hiệu âm thanh
Bài toán mô phỏng thực tế: Trong một phòng họp, ta có 4 micro đặt tại 4 vị trí
khác nhau và thu được tổ hợp 4 tín hiệu từ 4 người nói đồng thời. Yêu cầu đặt ra là
chỉ chọn lấy một tín hiệu âm thanh trong số 4 tín hiệu âm thanh ban đầu đó mới là
thông tin có ích. Bốn âm thanh này chính là 4 thành phần độc lập trong bài toán
ICA đang xét.
Xét tổ hợp 4 tín hiệu âm thanh ban đầu có dạng sóng như trong hình 3:
0 1 2 3 4 5 6 7 8 9
x 10
4
-0.5
0
0.5
Tin hieu am thanh 1
A
m
p
lit
u
d
e
time (ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-0.5
0
0.5
Tin hieu am thanh 2
A
m
p
lit
u
d
e
time(ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-1
0
1
Tin hieu am thanh 3
A
m
p
lit
u
d
e
time(ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-0.5
0
0.5
Tin hieu am thanh 4
A
m
p
lit
u
d
e
time(ms)
Hình 3. Các tín hiệu âm thanh gốc.
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 113
Giả sử ma trận tổ hợp của 4 tín hiệu là:
A = [1 0.75 0.8 0.6; 0.75 1 0.8 0.75; 0.6 0.7 1 0.6; 0.5 0.7 0.8 1]
Việc lựa chọn ma trận tổ hợp là hoàn toàn ngẫu nhiên, để phù hợp hơn với thực
tế, ta giả thiết rằng mỗi một micro được đặt gần nhất với một tín hiệu tương ứng
khi đó tỷ lệ trộn của tín hiệu này là 1. Như vậy, ta có 4 tổ tín hiệu sau trộn tương
ứng với 4 tổ hợp ta thu được sau micro như thể hiện trong hình 4.
Sử dụng thuật toán FastICA theo phương pháp ước lượng hợp lẽ cực đại ta thu
được 4 tín hiệu có dạng như nhể hiện trong hình 5. So sánh giữa tín hiệu sau khi
tách và tín hiệu ban đầu ta thấy thuật toán đã thực hiện tách được 4 âm thanh từ tổ
hợp trộn ngẫu nhiên của 4 âm thanh gốc. Mặc dù biên độ của tín hiệu là không xác
định được tuy nhiên dạng sóng của tín hiệu sau khi tách là hoán toàn trùng khớp
với dạng sóng của tín hiệu ban đầu.
0 1 2 3 4 5 6 7 8 9
x 10
4
-1
0
1
Tin hieu tron 1
A
m
p
lit
u
d
e
time (ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-0.5
0
0.5
Tin hieu tron 2
A
m
p
lit
u
d
e
time(ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-1
0
1
Tin hieu tron 3
A
m
p
lit
u
d
e
time(ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-0.5
0
0.5
Tin hieu tron 4
A
m
p
lit
u
d
e
time(ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-2
0
2
Tin hieu sau tach 1
A
m
p
lit
u
d
e
time (ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-2
0
2
Tin hieu sau tach 2
A
m
p
lit
u
d
e
time(ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-2
0
2
Tin sau tach 3
A
m
p
lit
u
d
e
time(ms)
0 1 2 3 4 5 6 7 8 9
x 10
4
-2
0
2
Tin sau tach 4
A
m
p
lit
u
d
e
time(ms)
Hình 4. Các tín hiệu âm thanh sau khi trộn Hình 5. Các tín hiệu âm
(tín hiệu thu được trong thực tế). thanh sau khi tách.
3.2. Đánh giá chất lượng thuật toán
Việc đánh giá chất lượng thuật toán thông qua số bước lặp để thuật toán hội tụ
là việc hết sức cần thiết bởi nó quyết định đến tốc độ xử lý và khả năng thực hiện
của thuật toán theo thời gian thực. Để đo tính hiệu quả của thuật toán, bài báo đề
xuất phương pháp đánh giá thuật toán dựa trên ma trận ước lượng theo chỉ số thực
hiện (PI- Performance Index) được định nghĩa theo biểu thức:
1 1 1
1
1 1
1 max max
n n n
ik ki
i k kj ij j ji
g g
PI
n n g g
(29)
Ở đây gij là thành phần (i,j) của ma trận G = W
-1.A. và maxj|gij| biểu diễn cho
giá trị lớn nhất trong số các phần tử của vector hàng thứ i của G, maxj|gji| biểu diễn
cho giá trị lớn nhất trong số các phần tử của vector cột thứ i của G. Khi việc tách
tín hiệu hoàn chỉnh đạt được, chỉ số hiệu quả bằng không (đồng nghĩa với việc ma
trận ước lượng W là hoàn toàn khớp với ma trận tổ hợp A). Thực tế, giá trị chỉ số
hiệu quả khoảng 10-2 đã là thực hiện khá tốt.
Kỹ thuật điện tử & Khoa học máy tính
Nguyễn Thị Huyền, Phan Trọng Hanh “Kỹ thuật phân tích tín hiệu âm thanh” 114
So sánh PI theo số lần lặp theo hình 6.
0 20 40 60 80 100 120 140 160 180 200
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
So lan lap
C
hi
s
o
th
uc
h
ie
n
P
I
Hình 6. Chất lượng thuật toán cải thiện qua số lần lặp.
Nhận xét:
Số lần lặp của thuật toán càng lớn thì chỉ số thực hiện PI càng thấp, chứng tỏ
chất lượng của thuật toán được cải thiện đáng kể sau khi tăng số lần lặp. Tuy nhiên
khi lần lặp lớn hơn 150 lần thì thuật toán hội tụ có nghĩa là dù có tăng số lần lặp
lên nữa thì chất lượng tín hiệu đầu ra vẫn không cải thiện thêm. Vì thế, tùy số
lượng tổ hợp tín hiệu đầu vào mà ta có thể lựa chọn số lần lặp cho phù hợp để đảm
bảo tốc độ và thời gian xử lý của thuật toán.
4. KẾT LUẬN
Bài báo đã nghiên cứu kỹ thuật ICA theo theo phương pháp ước lượng hợp lý
cực đại, mô phỏng thuật toán bằng chương trình Matlab với tổ hợp 4 âm thanh. Đề
xuất cách đánh giá chất lượng thuật toán qua số lần lặp thông qua hệ số thực hiện
được xây dựng trên ma trận tổng thể G là tích của ma trận tổ hợp (A) và nghịch
đảo ma trận ước lượng của nó (W-1). Rút ra kết luận: kỹ thuật ICA sử dụng ước
lượng hợp lý cực đại là một phương pháp phân tách các nguồn tín hiệu mù cho độ
tin cậy cao và thời gian xử lý nhanh nhất trong nhóm các phương pháp phân tách
nguồn mù áp dụng cho xử lý các tổ hợp âm thanh, hình ảnh, sử dụng trong lĩnh
vực viễn thông, xử lý ảnh
TÀI LIỆU THAM KHẢO
[1]. Bell, AJ, & Sejnowski. “An information-maximization approach to blind
separation and blind deconvolution”. “Neural computation” (1995).
[2]. Lee, London, Kluwer Academic Press. “Independent component analysis”
(2001).
[3]. A.Hyvarinen, Oja.“A fast fixed-point algorithm for independent component
analysis”. “Neural computation” (1997).
Nghiên cứu khoa học công nghệ
Tạp chí Nghiên cứu KH&CN quân sự, Số 33, 10 - 2014 115
[4]. A.Hyvarinen, Juha-Karhunen, Erkki - Oja. “Independent Component
Analysis” (2001), pages 182-188.
[5]. Cardoso, J-F. “Infomax and maximum likelihood for blind source separation”.
Ieee signal processing letters (1997).
[6]. J. L. Contreras-Vidal and S. E. Kerick, “Independent component analysis
of dynamic brain responses during visuomotor adaptation” (2004).
[7]. Natanael Nunes de Moura, Eduardo Simas Filho and Joso Manoel de Seixas
“Independent Component Analysis for Passive Sonar Signal Processing”
(2009).
ABSTRACT
INDEPENDENT COMPONENT ANALYSIS TECHNIQUE USING MAXIMUM
LIKELIHOOD ESTIMATION IN ANALIZING MIXED AUDIO SIGNALS
Independent Component Analysis (ICA) is a computationally efficient
blind source separation technique for many practical applications in various
fields of science and engineering. This paper studies the method of applying
maximum likelihood estimation on ICA and propose evaluating the
convergence of the algorithm via iteration number to improve the algorithm’s
speed.
Keywords: ICA, ML estimation.
Nhận bài ngày 20 tháng 07 năm 2014
Hoàn thiện ngày 18 tháng 08 năm 2014
Chấp nhận đăng ngày 15 tháng 09 năm 2014
Địa chỉ: * Học viện Kỹ thuật Quân sự.
Email: nguyenhuyenhvktqs@gmail.com. Phone: 0912959582
Email : tronghanhmai@yahoo.com
Các file đính kèm theo tài liệu này:
- 14_nguyen_thi_huyen_106_115_9342_2149256.pdf