Tài liệu Luận văn Ma trận xác định dương: bài toán bảo toàn tuyến tính và tính đơn điệu của trung bình nhân: ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC SƯ PHẠM
? ? ?F ? ??
HUỲNH ĐÌNH TUÂN
MA TRẬN XÁC ĐỊNH DƯƠNG:
BÀI TOÁN BẢO TOÀN TUYẾN TÍNH
VÀ TÍNH ĐƠN ĐIỆU CỦA TRUNG BÌNH NHÂN
KHOÁ LUẬN TỐT NGHIỆP
Chuyên ngành : Đại số
Cán bộ hướng dẫn
PGS. TS. ĐOÀN THẾ HIẾU
Huế, tháng 5 năm 2011
i
LỜI CẢM ƠN
Khóa luận này được hoàn thành dưới sự hướng dẫn nhiệt tình, chu
đáo của PGS. TS. Đoàn Thế Hiếu. Tôi xin phép được gửi đến Thầy sự
kính trọng và lòng biết ơn sâu sắc về sự tận tâm của Thầy đối với bản
thân tôi không những trong thời gian làm khóa luận mà còn trong suốt
quá trình học tập. Đồng thời, tôi xin được bày tỏ nguyện vọng tiếp tục
tìm hiểu toán học dưới sự hướng dẫn của Thầy.
Tôi cũng xin phép được gửi lời cám ơn chân thành đến quý Thầy
cô đã giảng dạy lớp Toán B trường ĐHSP Huế cũng như toàn thể quý
thầy cô Khoa Toán trường ĐHSP Huế, những người đã cho tôi kiến
thức, quan tâm động viên, nhiệt tình giúp đỡ tôi trong suốt quá trình
học tập cũng như trong thời gian thực hiện đề tài.
Cuối cù...
60 trang |
Chia sẻ: hunglv | Lượt xem: 3386 | Lượt tải: 1
Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Ma trận xác định dương: bài toán bảo toàn tuyến tính và tính đơn điệu của trung bình nhân, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC SƯ PHẠM
? ? ?F ? ??
HUỲNH ĐÌNH TUÂN
MA TRẬN XÁC ĐỊNH DƯƠNG:
BÀI TOÁN BẢO TOÀN TUYẾN TÍNH
VÀ TÍNH ĐƠN ĐIỆU CỦA TRUNG BÌNH NHÂN
KHOÁ LUẬN TỐT NGHIỆP
Chuyên ngành : Đại số
Cán bộ hướng dẫn
PGS. TS. ĐOÀN THẾ HIẾU
Huế, tháng 5 năm 2011
i
LỜI CẢM ƠN
Khóa luận này được hoàn thành dưới sự hướng dẫn nhiệt tình, chu
đáo của PGS. TS. Đoàn Thế Hiếu. Tôi xin phép được gửi đến Thầy sự
kính trọng và lòng biết ơn sâu sắc về sự tận tâm của Thầy đối với bản
thân tôi không những trong thời gian làm khóa luận mà còn trong suốt
quá trình học tập. Đồng thời, tôi xin được bày tỏ nguyện vọng tiếp tục
tìm hiểu toán học dưới sự hướng dẫn của Thầy.
Tôi cũng xin phép được gửi lời cám ơn chân thành đến quý Thầy
cô đã giảng dạy lớp Toán B trường ĐHSP Huế cũng như toàn thể quý
thầy cô Khoa Toán trường ĐHSP Huế, những người đã cho tôi kiến
thức, quan tâm động viên, nhiệt tình giúp đỡ tôi trong suốt quá trình
học tập cũng như trong thời gian thực hiện đề tài.
Cuối cùng, tôi xin phép được gửi lời cảm ơn đến những người thân,
bạn bè đã quan tâm động viên giúp đỡ tôi trong suốt quãng đường học
tập vừa qua.
Huế, tháng 5 năm 2011
Huỳnh Đình Tuân
ii
MỤC LỤC
Trang phụ bìa i
Lời cảm ơn ii
MỤC LỤC 1
MỞ ĐẦU 3
CÁC KÝ HIỆU SỬ DỤNG TRONG KHÓA LUẬN 5
1 MA TRẬN XÁC ĐỊNH DƯƠNG 6
1.1 Ma trận đối xứng - ma trận Hermite - ma trận trực giao - ma trận
Unita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Ma trận nửa xác định dương - ma trận xác định dương . . . . . . . 8
1.3 Một số phép toán trên không gian các ma trận . . . . . . . . . . . . 12
1.4 Căn bậc hai của ma trận . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5 Một số bất đẳng thức ma trận và các tính chất liên quan đến ma
trận khối . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.6 Hàm lồi, lõm, đơn điệu trên tập các ma trận xác định dương . . . . 18
1.7 Phương trình ma trận . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 BÀI TOÁN BẢO TOÀN TUYẾN TÍNH 21
2.1 Bài toán bảo toàn tuyến tính . . . . . . . . . . . . . . . . . . . . . 21
2.2 Bảo toàn tuyến tính hạng của ma trận . . . . . . . . . . . . . . . . 22
2.3 Bài toán bảo toàn định thức . . . . . . . . . . . . . . . . . . . . . . 23
2.4 Bảo toàn tuyến tính chuẩn và tập các ma trận Unita . . . . . . . . 24
2.5 Bảo toàn tuyến tính miền số học và bán kính số học . . . . . . . . . 25
2.6 Bài toán bảo toàn tuyến tính chỉ số quán tính . . . . . . . . . . . . 26
2.7 Toán tử tuyến tính xác định dương . . . . . . . . . . . . . . . . . . 28
2.8 Bài toán bảo toàn tuyến tính chỉ số (n, 0, 0) . . . . . . . . . . . . . 29
2.9 Một số kết quả mới . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1
3 TRUNG BÌNH NHÂN CỦA CÁC MA TRẬN 37
3.1 Trung bình của hai ma trận xác định dương và một số tính chất . . 37
3.2 Một số biểu diễn của trung bình nhân hai ma trận . . . . . . . . . . 40
3.3 Mở rộng khái niệm trung bình nhân bằng phương pháp quy nạp . . 43
3.4 Mở rộng khái niệm trung bình nhân dựa vào hình học Riemann . . 49
KẾT LUẬN 56
TÀI LIỆU THAM KHẢO 57
2
MỞ ĐẦU
Lý thuyết về ma trận xác định dương chiếm một vị trí quan trọng trong đại
số tuyến tính. Có nhiều định lý liên quan đến ma trận xác định dương đơn giản
song có ứng dụng lớn. Hiện nay, còn rất nhiều bài toán mở liên quan mật thiết đến
ma trận xác định dương.
Các bài toán bảo toàn tuyến tính là một hướng nghiên cứu sôi động trong
lý thuyết ma trận và lý thuyết toán tử. Các bài toán này đề cập đến các toán tử
bảo toàn một hàm, một tập con, một quan hệ nào đó trên không gian các ma trận.
Hiện nay, lĩnh vực này thu hút sự quan tâm của nhiều nhà toán học. Dù đã có
hàng trăm công trình trong lĩnh vực này nhưng vẫn còn rất nhiều vấn đề mở cần
được nghiên cứu, đặc biệt là bài toán bảo toàn tuyến tính chỉ số quán tính. Cho
đến nay, việc xác định tất cả các toán tử tuyến tính bảo toàn chỉ số (n, 0, 0), tức
bảo toàn tập các ma trận xác định dương vẫn nằm ngoài mọi hướng tiếp cận.
Trung bình ma trận là sự mở rộng khái niệm trung bình trên tập hợp các số
dương sang tập hợp các ma trận xác định dương. Đối với trung bình cộng và trung
bình điều hòa, việc mở rộng là đơn giản. Việc xây dựng khái niệm trung bình nhân
cho hai ma trận xác định dương đã được thực hiện. Khi người ta tìm cách mở rộng
khái niệm trung bình nhân cho trường hợp n ma trận xác định dương thì có nhiều
khó khăn nảy sinh. Hiện nay, có hai hướng tiếp cận chủ yếu đối với vấn đề này.
Nếu dựa vào phương pháp quy nạp, khái niệm trung bình nhân đưa ra quá phức
tạp. Một hướng khác đơn giản hơn là dựa vào hình học Riemann. Tuy vậy, đối với
phương pháp này, việc chứng minh tính đơn điệu của trung bình nhân vẫn còn là
một vấn đề mở.
Khóa luận nhằm mục tiêu tìm hiểu, hệ thống hóa các tính chất của ma trận
xác định dương, tổng quan các kết quả đã được nghiên cứu về bài toán bảo toàn
tuyến tính, các hướng xây dựng khái niệm trung bình nhân ma trận, phát triển
một số kết quả đã có về bài toán bảo toàn tập các ma trận xác định dương.
Nội dung của khóa luận chia làm ba chương.
Chương một hệ thống hóa các kiến thức về ma trận xác định dương, trình
bày một số kiến thức cần thiết cho các chương tiếp theo.
Chương hai tổng quan một số kết quả đạt được trong lĩnh vực bảo toàn tuyến
3
tính, các kết quả đạt được trong các đề tài khoa học đã thực hiện. Chương này
cũng trình bày một số kết quả mới về bài toán bảo toàn tính xác định dương.
Chương ba giới thiệu khái niệm trung bình ma trận, một số loại trung bình và
hai phương pháp xây dựng khái niệm trung bình nhân ma trận tổng quát: phương
pháp quy nạp và phương pháp dựa vào hình học Riemann.
4
CÁC KÝ HIỆU SỬ DỤNG TRONG
KHÓA LUẬN
At Chuyển vị của ma trận A
A∗ Chuyển vị liên hợp của ma trận A
Matm×n(K) Không gian các ma trận cỡ m× n trên trường K
Matn(K) Không gian các ma trận vuông cấp n trên trường K
Sn(R) Không gian các ma trận đối xứng thực cấp n
Hn Không gian các ma trận Hermite cấp n
Sn Không gian Sn(R) hoặc không gian Hn
Un Không gian các ma trận tam giác trên cấp n
GLn(K) Nhóm các ma trận khả nghịch cấp n trên trường K
với phép nhân ma trận
On Nhóm các ma trận trực giao cấp n
Un Nhóm các ma trận Unita cấp n
diag(a1, · · · , an) Ma trận đường chéo với các phần từ a1, · · · , an trên
đường chéo chính
‖.‖2 Chuẩn phổ
‖.‖∗ Chuẩn vết
‖.‖F Chuẩn Frobenius
S(A,B) Tích đối xứng của hai ma trận A,B
A⊗B Tích Tensor (tích Kronecker) của hai ma trận A,B
A ◦B Tích Hadamard (tích Schur) của hai ma trận A,B
A]B Trung bình nhân của hai ma trận A,B
logA Logarit tự nhiên của ma trận A
expA Lũy thừa cơ số e của ma trận A
A ∼= B A và B tương đương Unita
A ∼ B A và B tương đẳng
5
Chương 1
MA TRẬN XÁC ĐỊNH DƯƠNG
Trong chương này, chúng tôi nêu định nghĩa ma trận đối xứng, ma trận Hermite, ma
trận nửa xác định dương, ma trận xác định dương và một số tính chất cơ bản. Chúng tôi tập
trung mô tả một số tính chất đặc trưng của ma trận xác định dương và một số kiến thức liên
quan đến ma trận xác định dương như: căn bậc hai của ma trận, phương trình ma trận, bất
đẳng thức ma trận, hàm lồi, lõm, đơn điệu trên tập các ma trận xác định dương. Chúng tôi
cũng giới thiệu tích đối xứng, tích Schur, tích Kronecker và các tính chất liên quan đến ma trận
xác định dương của chúng.
1.1 Ma trận đối xứng - ma trận Hermite - ma trận
trực giao - ma trận Unita
Ma trận vuông A trên trường số thực R được gọi là đối xứng nếu At = A. Ta
đã biết tập hợp Sn(R) các ma trận đối xứng thực cấp n là không gian con của
không gian các ma trận vuông cấp n trên trường số thực Matn(R). Tương ứng
với khái niệm ma trận đối xứng trên trường số thực là khái niệm ma trận Hermite
trên trường số phức. Ma trận vuông A trên trường số phức C được gọi là Hermite
nếu A∗ = A, ở đây ký hiệu A∗ để chỉ chuyển vị liên hợp của ma trận A. Tương tự
tập hợp Sn(R), tập hợp Hn các ma trận Hermite cấp n tạo thành một không gian
con của không gian các ma trận vuông cấp n trên trường số phức Matn(C). Các
ma trận đối xứng và ma trận Hermite có một tính chất chung rất quan trọng, mọi
giá trị riêng của chúng đều là các số thực. Từ nay trở đi, ta sử dụng ký hiệu Sn để
chỉ một trong hai không gian Sn(R) hoặc Hn.
Để khảo sát các tính chất của ma trận đối xứng và ma trận Hermite cũng như
một số tính chất khác, ta cần tìm hiểu thêm về ma trận trực giao và ma trận
Unita. Ma trận Q thuộc Matn(R) được gọi là trực giao nếu QtQ = In. Tập hợp On
6
các ma trận trực giao cấp n trên trường số thực là nhóm con của nhóm GLn(R)
các ma trận thực khả nghịch cấp n với phép nhân ma trận. Tương ứng với khái
niệm ma trận trực giao trên trường số thực là khái niệm ma trận Unita trên trường
số phức. Ma trận U thuộc Matn(C) được gọi là Unita nếu U∗U = In. Cũng vậy,
tập hợp Un các ma trận Unita cấp n trên trường số phức là nhóm con của nhóm
GLn(C) các ma trận phức khả nghịch cấp n với phép nhân ma trận. Liên quan
đến khái niệm ma trận trực giao và ma trận Unita, hai định lý về chéo hóa ma
trận dưới đây đóng vai trò quan trọng.
Định lý 1.1.1. [10] (Định lý phân tích SVD đối với không gian phức) Cho ma trận
A ∈ Matm×n(C). Khi đó tồn tại các ma trận Unita U ∈ Matm(C), V ∈ Matn(C)
và ma trận S ∈ Matm×n(C), S = diag(σ1, · · · , σp), σ1 ≥ σ2 ≥ · · · ≥ σp, p =
min{m,n} sao cho A = USV .
Định lý 1.1.2. [10] (Định lý phân tích SVD đối với không gian thực) Cho ma
trận A ∈ Matm×n(R). Khi đó tồn tại các ma trận trực giao P ∈ Matm(R),
Q ∈ Matn(R) và ma trận S ∈ Matm×n(R) S = diag(σ1, · · · , σp), σ1 ≥ σ2 ≥ · · · ≥
σp, p = min{m,n} sao cho A = PSQ.
Các phần tử trên đường chéo của ma trận S trong hai định lý trên được gọi là
các giá trị kỳ dị của A. Đây có thể xem là một sự mở rộng khái niệm giá trị riêng
của các ma trận vuông. Trên các không gian Sn(R) và Hn, các định lý về chéo hóa
ma trận dưới đây sẽ được sử dụng nhiều trong khuôn khổ khóa luận này.
Định lý 1.1.3. [10] Cho A ∈ Sn(R). Khi đó tồn tại ma trận trực giao Q ∈
Matn(R) sao cho QtAQ là ma trận chéo.
Định lý 1.1.4. [10] Cho A ∈ Hn. Khi đó tồn tại ma trận Unita U ∈ Matn(C)
sao cho U∗AU là ma trận chéo.
Dưới đây là một vài tính chất của các ma trận thuộc Sn thu được từ các định
lý trên và chúng sẽ được nhắc đến trong các phần tiếp theo.
Định lý 1.1.5. [10] Cho A ∈ Sn(R). Khi đó rank(A) = r khi và chỉ khi A =∑r
i=1 kixix
t
i, trong đó ki ∈ {−1, 1} ∀ i = 1, 2, · · · , r và x1, · · · , xr là các vector độc
lập tuyến tính.
Chứng minh. Theo Định lý 1.1.3 tồn tại ma trận trực giao Q sao cho QtAQ = D =
diag(λ1, · · · , λn), trong đó λ1, · · · , λn là các giá trị riêng của A. Do rank(A) = r
7
nên tồn tại đúng r giá trị riêng của A khác không. Không mất tính tổng quát, giả
sử λ1, · · · , λr là các giá trị riêng khác 0 của A, lúc đó
A = QDQt =
r∑
i=1
Q(λieie
T
i )Q
t =
r∑
i=1
sign(λi)(
√
|λi|Qei)((
√
|λi|Qei)t.
Đặt xi =
√|λi|Qei, ki = sign(λi), ta có ngay A = ∑ri=1 kixixti. Do Q khả nghịch
và e1, · · · , er độc lập tuyến tính nên x1, · · · , xr độc lập tuyến tính.
Đảo lại, giả sử A =
∑r
i=1 kixix
t
i, trong đó ki ∈ {−1, 1} ∀i = 1, 2, · · · , r và
x1, · · · , xr là các vector độc lập tuyến tính. Bổ sung vào hệ {x1, · · · , xr} các vector
xr+1, · · · , xn để được cơ sở của Rn. Đặt P = [x1 x2 · · ·xn], ở đây các vector xi
được viết theo cột, ta có P khả nghịch và A = Pdiag(k1, · · · , kr, 0, · · · , 0)P t. Vậy
rank(A) = r.
Định lý 1.1.6. Giả sử A ∈ Sn(R), đặt W (A) = {xtAx, ||x|| = 1}, khi đó ta có
W (A) = [λmin(A), λmax(A)].
Chứng minh. Giả sử λmin(A) = λ1 ≤ · · · ≤ λn = λmax(A) là dãy không giảm
các giá trị riêng của A. Khi đó theo Định lý 1.1.3 tồn tại ma trận trực giao
Q sao cho QtAQ = D = diag(λ1, · · · , λn). Đặt y = Qtx = (y1 · · · yn)t, khi đó
y21 + · · · + y2n = yty = (Qtx)t(Qtx) = xt(QQt)x = xtx = 1. Mặc khác ta có
xtAx = xtQDQtx = ytDy = λ1y21 + · · · + λny2n. Từ đây ta suy ra ngay điều cần
chứng minh.
Nhận xét 1.1.7. Nếu ta thay các cụm từ "ma trận trực giao", "chuyển vị" trong
các phát biểu trên không gian thực bởi các cụm từ "ma trận Unita", "chuyển vị
liên hợp" đối với không gian phức thì các tính chất trên vẫn còn đúng trên không
gian Hn. Trong phần lớn các trường hợp thì các kết quả trên hai không gian này
là tương tự nhau. Do vậy trong các phát biểu và chứng minh, thông thường ta chỉ
xét trên không gian Sn(R) hoặc Hn mà thôi. Đối với các trường hợp có sự khác
biệt giữa hai không gian này, ta sẽ nói rõ cụ thể.
1.2 Ma trận nửa xác định dương - ma trận xác định
dương
Định nghĩa 1.2.1. Giả sử A là ma trận trên không gian Sn.
1. A được gọi là nửa xác định dương trên Sn(R) nếu xtAx ≥ 0 ∀ x ∈ Rn.
8
2. A được gọi là xác định dương trên Sn(R) nếu A là nửa xác định dương và
xtAx = 0 ⇐⇒ x = 0.
3. A được gọi là nửa xác định dương trên Hn nếu x∗Ax ≥ 0 ∀ x ∈ Cn.
4. A được gọi là xác định dương trên Hn nếu A là nửa xác định dương và
x∗Ax = 0 ⇐⇒ x = 0.
5. Ta dùng ký hiệu A ≥ 0 (A > 0) để chỉ ma trận A là nửa xác định dương (xác
định dương).
6. A được gọi là nửa xác định âm (xác định âm) nếu −A là nửa xác định dương
(xác định dương), kí hiệu A ≤ 0 (A < 0).
7. Nếu A−B > 0 (A−B ≥ 0) thì ta viết A > B (A ≥ B) hay B < A (B ≤ A).
8. Tập hợp các ma trận nửa xác định dương cấp n được ký hiệu là Pn, tập hợp
các ma trận xác định dương cấp n được ký hiệu là Pn.
Nhận xét 1.2.1. Từ định nghĩa ta thấy ngay một số tính chất sau
1. Quan hệ A ≥ B ⇐⇒ A−B ≥ 0 là quan hệ thứ tự trên Sn.
2. Pn là một nón lồi trong không gian Sn.
3. Pn là một nón lồi và là một tập mở trong không gian Sn.
Tiếp theo ta tìm hiểu một số dấu hiệu nhận biết ma trận nửa xác định dương -
ma trận xác định dương. Để thuận tiện ta sẽ làm việc trên trên không gian Sn(R).
Ta đã biết một số dấu hiệu quen thuộc sau để nhận biết các ma trận nửa xác định
dương - xác định dương:
1. A > 0 khi và chỉ khi A ≥ 0 và det(A) 6= 0.
2. A ≥ 0 (> 0) khi và chỉ khi các giá trị riêng của A không âm (dương).
3. A ≥ 0 (> 0) khi và chỉ khi các định thức con chính của A không âm (dương).
Dưới đây là một số dấu hiệu nhận biết các ma trận nửa xác định dương khi đã
biết hạng của chúng.
Định lý 1.2.2. [4] Cho A ≥ 0. Khi đó rank(A) = r khi và chỉ khi A = ∑ri=1 xixti,
trong đó x1, · · · , xr là các vector độc lập tuyến tính.
9
Chứng minh. Suy ra ngay từ Định lý 1.1.5
Định lý 1.2.3. [4] Cho A ≥ 0 và rank(A) = r. Khi đó tồn tại ma trận khả nghịch
W với A = W (
∑r
i=1 Eii)W
t, trong đó Eii = eieti với mọi i = 1, 2 · · · , n.
Chứng minh. Theo Định lý 1.1.3, tồn tại ma trận trực giao Q sao cho QtAQ =
D = diag(λ1, · · · , λr, 0, · · · , 0) trong đó λi 6= 0 với mọi i = 1, 2, · · · , r. Do A
là ma trận nửa xác định dương nên λi > 0 với mọi i = 1, 2, · · · , r. Ta có A =
QDQt = Q(
∑r
i=1 λiEii)Q
t. Đặt K = diag(
√
λ1, · · · ,
√
λr, 1, · · · , 1), thế thì K khả
nghịch và A = QK(
∑r
i=1 Eii)KQ
t = W (
∑r
i=1 Eii)W
t với W = QK là ma trận
khả nghịch.
Hệ quả 1.2.4. [4] Nếu A ≥ 0 thì tồn tại ma trận W sao cho A = WW t. Nếu A
xác định dương thì W khả nghịch.
Hơn thế nữa, người ta còn chứng minh được nếu A ≥ 0 thì có thể biểu diễn
A = UU t, trong đó U là ma trận nửa tam giác trên và diag(U) ≥ 0. Biểu diễn này
được gọi là phân tích Cholesky của ma trận A.
Định lý 1.2.5. [4] A = (aij)n×n nửa xác định dương khi và chỉ khi tồn tại các
vector x1, · · · , xn sao cho aij = 〈xi, xj〉 ∀ i, j = 1, 2, · · · , n. A > 0 khi và chỉ khi
{x1, · · · , xn} độc lập tuyến tính.
Chứng minh. Giả sử có các vector x1, · · · , xn sao cho aij = 〈xi, xj〉 ∀ i, j =
1, 2, · · · , n. Đặt P = [x1, · · · , xn] ta có A = P tP , do đó A ≥ 0. Đảo lại, nếu A ≥ 0,
ta viết A = QtDQ, trong đó Q là ma trận trực giao và D = diag(λ1, · · · , λn), ở đây
λi > 0, i = 1, · · · , n. Đặt A12 = Qtdiag(
√
λ1, · · · ,
√
λn)Q, xj = A
1
2ej, j = 1, · · · , n
ta có
aij = 〈ei, Aej〉 = 〈A12ei, A12ej〉 = 〈xi, xj〉.
Trong phần tiếp theo, ta tìm hiểu một số tính chất về chéo hóa của các ma trận
xác định dương.
Định lý 1.2.6. Giả sử A,B ∈ Sn(R), A > 0. Khi đó tồn tại ma trận W khả nghịch
để W tAW = In,W tBW = diag(λ1, · · · , λn). Hơn nữa {λ1, · · · , λn} chính là tập
các giá trị riêng của ma trận A−1B.
Chứng minh. Theo Định lý 1.1.3, tồn tại ma trận trực giao Q sao cho QtAQ =
D = diag(α1, · · · , αn). Do A là ma trận xác định dương nên αi > 0 với mọi
10
i = 1, 2, · · · , n. Đặt K = diag( 1√
α1
, · · · , 1√
αn
), khi đó ta có KtQtAQK = In.
Đặt B′ = KtQtBQK, theo Định lý 1.1.3 tồn tại ma trận trực giao P sao cho
P TB′P = diag(λ1, · · · , λn). Ma trận W = QKP thỏa mãn các yêu cầu đặt ra ban
đầu.
DoW tAW = In,W tBW = diag(λ1, · · · , λn) nênW−1(A−1B)W = diag(λ1, · · · , λn).
Vậy {λ1, · · · , λn} chính là tập các giá trị riêng của ma trận A−1B.
Định lý 1.2.7. [10] Giả sử A,B ∈ Sn(R), A > 0. Khi đó ma trận AB chéo hóa
được và có số giá trị riêng dương, âm, bằng không như ma trận B.
Chứng minh. Tương tự chứng minh Định lý 1.2.5, ta đặt A = (A
1
2 )2. Khi đó ma
trận AB đồng dạng với ma trận (A
1
2 )−1(AB)A
1
2 = A
1
2BA
1
2 . Với mọi vector x ∈ Rn
thì tồn tại vector y để x = A
1
2y và khi đó xtBx = yt(A
1
2BA
1
2 )y. Vậy ma trận AB
chéo hóa được và có số giá trị riêng dương, âm, bằng không như ma trận B.
Dưới đây là một số tính chất liên quan đến ma trận nửa xác định dương - xác
định dương được sử dụng trong các phần tiếp theo của khóa luận này.
Mệnh đề 1.2.8. Giả sử A ∈ Sn(R) là ma trận nửa xác định dương và diag(A) > 0.
Khi đó tồn tại vector x ∈ Rn sao cho mọi thành phần của x đều khác 0 và ma trận
nửa xác định dương B ∈ Sn(R) để A = xxt +B.
Chứng minh. Giả sử xi = (xi1, · · · , xin). Đặt u1 = α1x1 + β1x2 = (u11, · · · , u1n),
v1 = β1x1 − α1x2, ở đây α1, β1 được chọn sao cho α1, β1 > 0, α21 + β21 = 1 và nếu
x1k 6= 0 hoặc x2k 6= 0 thì u1k 6= 0. Hiển nhiên ta có u1ut1 + v1vt1 = x1xt1 + x2xt2.
Tương tự đặt u2 = α2u1+β2x3 và tiếp tục quá trình trên ta được A = ur−1utr−1+∑r−1
i=1 viv
t
i . Đặt x = ur−1 và B =
∑r−1
i=1 viv
t
i ta có đpcm.
Mệnh đề 1.2.9. Giả sử B ∈ Sn(R).
1. Nếu B ∈ Pn, B 6= 0 thì với mọi ma trận xác định dương A ∈ Sn(R) ta có
tr(AB) > 0.
2. Nếu B /∈ Pn thì tồn tại ma trận A ∈ Sn(R), A > 0 sao cho tr(AB) < 0.
Chứng minh. 1. Theo Hệ quả 1.2.4 tồn tại ma trận khả nghịch W sao cho A =
WW t. Ta có AB ∼ W−1ABW = W tBW . Do B là ma trận nửa xác định dương
khác 0 nên W tBW cũng là ma trận nửa xác định dương khác 0. Do vậy tr(AB) =
tr(W tBW ) > 0.
2. Theo Định lý 1.1.3, tồn tại ma trận trực giao Q sao cho D = Q−1BQ là ma trận
chéo. Do B không phải là ma trận nửa xác định dương nên tồn tại phần tử λi < 0
11
trên đường chéo chính của D. Chọn ma trận chéo C > 0 sao cho tr(CD) < 0. Đặt
A = QCQ−1 ta có A > 0 và tr(AB) = tr(Q−1AQQ−1BQ) = tr(CD) < 0.
Mệnh đề 1.2.10. Nếu A,B ∈ Sn(R) là các ma trận xác định dương thì tồn tại số
thực dương α sao cho A > αB.
Chứng minh. Theo Định lý 1.2.6, tồn tại ma trận W khả nghịch để WAW t =
In,WBW
t = diag(λ1, · · · , λn). Chọn α là số thực dương nhỏ hơn 1
λmin
, ở đây
λmin = min{λi, i = 1, · · · , n} ta có A > αB.
1.3 Một số phép toán trên không gian các ma trận
Định nghĩa 1.3.1. Giả sử A,B là các ma trận thuộc Matn(R). Tích đối xứng
của A,B, ký hiệu S(A,B) được xác định bởi
S(A,B) = AB +BA.
Nhận xét 1.3.1. Nếu A,B là các ma trận đối xứng thì S(A,B) cũng là ma trận đối
xứng. Tuy vậy, nếu A > 0, B > 0 thì chưa chắc S(A,B) ≥ 0. Thực vậy, với
A =
(
1 0
0 ²
)
, B =
(
1 α
α 1
)
trong đó ² là số dương đủ nhỏ và α gần bằng 1 ta có A > 0, B > 0 nhưng
S(A,B) =
(
2 α(1 + ²)
α(1 + ²) 2²
)
không phải là ma trận nửa xác định dương.
Định lý 1.3.2. [4] Giả sử A,B ∈ Sn(R), A > 0. Nếu S(A,B) > 0 (≥ 0) thì
B > 0 (B ≥ 0).
Chứng minh. Giả sử B = Qtdiag(β1, · · · , βn)Q, trong đó Q là ma trận trực giao.
Đặt S′ = QtS(A,B)Q,A′ = QtAQ và gọi s′ii, a
′
ii là phần tử thứ i trên đường chéo
chính của S′ và A′. Ta có S′ = A′diag(β1, · · · , βn) + diag(β1, · · · , βn)A′, do vậy
s′ii = 2βia
′
ii, i = 1, · · · , n. Do S′ ≥ 0, A′ > 0 nên s′ii ≥ 0, a′ii > 0, i = 1, · · · , n.
Vậy βi ≥ 0, i = 1, · · · , n, suy ra B ≥ 0.
Định nghĩa 1.3.2. Cho A = (aij)m×n, B = (bij)m×n là hai ma trận thuộc
Matm×n(K). Tích Hadamard (tích Schur) giữa A và B, ký hiệu A ◦ B được định
nghĩa bởi
A ◦B = (aijbij)m×n.
12
Định lý 1.3.3. [10] (Định lý Schur) Nếu A ≥ 0, B ≥ 0 thì A ◦B ≥ 0.
Chứng minh. Giả sử rank(A) = r, rank(B) = s, khi đó tồn tại r vector độc lập
tuyến tính x1, · · · , xr, tồn tại s vector độc lập tuyến tính y1, · · · , ys sao cho A =∑r
i=1 xix
t
i, B =
∑s
i=1 yiy
t
i . Ta có
A ◦B =
r∑
i=1
xix
t
i ◦
s∑
i=1
yiy
t
i =
∑
i,j
(xix
t
i) ◦ (yjytj) =
∑
i,j
(xi ◦ yj)(xi ◦ yj)t ≥ 0
(do mỗi thành phần của tổng
∑
i,j(xi ◦ yj)(xi ◦ yj)t đều là các ma trận nửa xác
định dương).
Hơn thế nữa chúng ta có
Mệnh đề 1.3.4. Nếu A > 0, B ≥ 0,diag(B) > 0 thì A ◦B > 0.
Chứng minh. Theo Mệnh đề 1.2.8 tồn tại vector x ∈ R sao cho mọi thành phần
của x đều khác 0 và ma trận nửa xác định dương C ∈ Sn(R) để B = xxt +C. Do
A là ma trận xác định dương nên tồn tại n vector độc lập tuyến tính x1, · · · , xn
sao cho A =
∑n
i=1 xix
t
i. Ta có A ◦ (xxt) =
∑n
i=1 xix
t
i ◦ (xxT ) =
∑n
i=1(xi ◦x)t. Ta sẽ
chỉ ra các vector x1 ◦ x, · · · , xn ◦ x là độc lập tuyến tính. Thực vậy, xét biểu thức∑n
i=1 αi(xi ◦ x) = 0, αi ∈ R, i = 1, · · · , n ta có
n∑
i=1
αi(xi ◦ x) = 0 ⇐⇒ (
n∑
i=1
αixi) ◦ x = 0
⇐⇒
n∑
i=1
αixi = 0
⇐⇒ α1 = · · · = αn = 0.
Điều này chứng tỏ x1 ◦ x, · · · , xn ◦ x độc lập tuyến tính, suy ra ma trận A ◦ xxt
xác định dương. Do C ≥ 0 nên A ◦ C ≥ 0. Từ đó A ◦ B = A ◦ (xxt + C) =
A ◦ xxt + A ◦ C > 0. Vậy A ◦B là ma trận xác định dương.
Mệnh đề 1.3.5. Nếu B không phải là ma trận nửa xác định dương trên Sn(R)
thì tồn tại ma trận A xác định dương trên Sn(R) sao cho A ◦B không phải là ma
trận xác định dương.
Chứng minh. Do B không phải là ma trận xác định dương nên tồn tại x ∈ Rn sao
cho xtBx < 0. Với mỗi ² ∈ R đặt A² = (1)n + ²In,trong đó (1)n là ma trận vuông
cấp n với mọi phần tử đều là 1. Khi đó A² là ma trận xác định dương với mọi
² > 0. Ta có A² ◦B = (1)n ◦B + ²In ◦B = B + ²diag(B), trong đó diag(B) là ma
13
trận đường chéo với các phần tử trên đường chéo chính tương ứng là các phần tử
trên đường chéo chính của B. Chọn ² > 0 đủ bé sao cho xtBx+ ²xtdiag(B)x < 0,
khi đó A² xác định dương và A² ◦ B không xác định dương do tồn tại x ∈ R sao
cho xt(A² ◦B)x < 0.
Định nghĩa 1.3.3. Cho A = (aij)m×n ∈ Matm×n(R), B = (bij)p×q ∈ Matp×q(R).
Tích Tensor (tích Kronecker) của A và B, ký hiệu A⊗B được xác định bởi
A⊗B =
a11B · · · a1nB
a21B · · · a2nB
· · ·
am1B · · · amnB
.
Nhận xét 1.3.6. Giả sử A ∈ Matn(R) có các giá trị riêng λi, i = 1, · · · , n, B ∈
Matm(R) có các giá trị riêng µj, j = 1, · · · ,m. Khi đó tập các giá trị riêng của
A⊗B là {λiµj, i = 1, · · · , n, j = 1, · · · ,m}. Từ đây ta thấy ngay nếu A,B là các
ma trận nửa xác định dương thì A⊗B cũng là ma trận nửa xác định dương.
1.4 Căn bậc hai của ma trận
Trong mục này, ta chỉ tìm hiểu sơ lược về căn bậc hai của của ma trận trong
một số trường hợp đặc biệt. Để hiểu sâu hơn lý thuyết về căn bậc n của ma trận
tổng quát, có thể tham khảo trong [11].
Định lý 1.4.1. [4] Cho A ∈ Sn(R). A ≥ 0 khi và chỉ khi tồn tại duy nhất ma trận
B ∈ Sn(R), B ≥ 0 sao cho A = B2.
Chứng minh. Theo Định lý 1.1.3 ta cóA = QtDQ, trong đóQ là ma trận trực giao,
D = diag(λ1, · · · , λn), λi ≥ 0, i = 1, · · · , n. Đặt B = Qtdiag(
√
λ1, · · · ,
√
λn)Q, ta
có ngay B ∈ Sn(R), B ≥ 0 và B2 = A. Giả sử có ma trận C ≥ 0, C ∈ Sn(R)
để C2 = A, đặt C ′ = QCQt ta có ngay C ′2 = D. Do vậy, tồn tại ma trận trực
giao W sao cho C ′ = W tdiag(
√
λ1, · · · ,
√
λn)W . Từ C ′2 = D ta có W tDW = D,
suy ra C ′ = W tdiag(
√
λ1, · · · ,
√
λn)W = diag(
√
λ1, · · · ,
√
λn). Vậy B = C. Ta có
đpcm.
Định nghĩa 1.4.1. Ma trận B trong Định lý 1.4.1 được gọi là căn bậc hai của
ma trận A, ký hiệu A
1
2 .
Nhận xét 1.4.2. Hoàn toàn tương tự ta có thể đưa ra khái niệm căn bậc n của ma
trận nửa xác định dương. Hơn thế nữa, có thể chứng minh rằng nếu A ∈ Matn(R)
14
là ma trận chéo hóa được có các giá trị riêng không âm thì tồn tại duy nhất ma
trận B ∈ Matn(R) có các giá trị riêng không âm để A = B2. Ma trận B trong
trường hợp này cũng được gọi là căn bậc hai của ma trận A, ký hiệu A
1
2 .
1.5 Một số bất đẳng thức ma trận và các tính chất
liên quan đến ma trận khối
Cũng như bất đẳng thức số, các bất đẳng thức ma trận là một lĩnh vực rất
phong phú. Tuy vậy, giữa chúng cũng có nhiều sự khác biệt nhất định. Một số bất
đẳng thức không còn đúng trong trường hợp ma trận. Trong mục này, chúng tôi
chỉ trình bày một số bất đẳng thức đơn giản. Một vài bất đẳng thức thú vị khác
sẽ được giới thiệu trong chương 3.
Mệnh đề 1.5.1. [4] Nếu A,B là các ma trận xác định dương và A > B thì
A
1
2 > B
1
2 .
Chứng minh. Đặt X = A
1
2 , Y = B
1
2 ta có
A−B = X2 − Y 2 = 1
2
S(X + Y,X − Y ).
Do X + Y > 0, X2 − Y 2 > 0 nên theo Định lý 1.3.2 ta có X − Y > 0.
Nhận xét 1.5.2. Nếu A ≥ B ≥ 0 thì chưa chắc A2 ≥ B2. Thực vậy, với
A =
(
2 1
1 1
)
, B =
(
1 1
1 1
)
ta có ngay A ≥ B ≥ 0 nhưng
A2 −B2 =
(
3 1
1 0
)
0.
Mệnh đề 1.5.3. [4] Nếu A,B là các ma trận nửa xác định dương thì A ≥ B khi
và chỉ khi A−1 ≤ B−1.
Chứng minh. Theo Định lý 1.2.6, tồn tại ma trận W khả nghịch sao cho W tAW =
In,W
tBW = D, ở đây D là ma trận chéo. Ta có A ≥ B ⇔ In ≥ D ⇔ In ≤ D−1 ⇔
A−1 ≤ B−1.
Định nghĩa 1.5.1. Toán tử A ∈ Matn(K) được gọi là co nếu ‖A‖ ≤ 1.
Mệnh đề 1.5.4. [4] Toán tử A ∈ Matn(C) co khi và chỉ khi
(
I A
A∗ I
)
≥ 0.
15
Chứng minh. Giả sử phân tích SVD của ma trậnA làA = USV , S = diag(s1, · · · , sn).
khi đó ta có(
I A
A∗ I
)
=
(
I USV
V ∗SU∗ I
)
=
(
U O
O V ∗
)(
I S
S I
)(
U∗ O
O V
)
∼=
(
I S
S I
)
.
Hiển nhiên ma trận
(
I S
S I
)
tương đương Unita với ma trận
(
1 s1
s1 1
)
⊕
(
1 s2
s2 1
)
⊕ · · · ⊕
(
1 sn
sn 1
)
.
Vậy
(
I A
A∗ I
)
≥ 0 khi và chỉ khi si ≤ 1, i = 1, · · · , n. Nói cách khác,
(
I A
A∗ I
)
≥ 0
khi và chỉ khi A là toán tử co.
Mệnh đề 1.5.5. [4] Giả sử A,B là các ma trận nửa xác định dương. Khi đó(
A X
X∗ B
)
≥ 0 khi và chỉ khi tồn tại toán tử co K để X = A12KB 12 .
Chứng minh. Trước hết, ta chứng minh bài toán với A,B là các ma trận xác định
dương. Với giả thiết này ta có(
A X
X∗ B
)
∼
(
A−
1
2 O
O B−
1
2
)(
A X
X∗ B
)(
A−
1
2 O
O B−
1
2
)
=
(
I A−
1
2XB−
1
2
B−
1
2X∗A−
1
2 I
)
.
Đặt K = A−
1
2XB−
1
2 , theo Mệnh đề 1.5.4 ta có ngay đpcm.
Trong trường hợp A,B là các ma trận nửa xác định dương, áp dụng kết quả trên
đối với các ma trận xác định dương A + ²In, B + ²In, ² > 0 và cho ² dần về 0 ta
thu được kết quả bài toán.
Mệnh đề 1.5.6. [4] Giả sử A,B là các ma trận xác định dương. Khi đó
(
A X
X∗ B
)
≥
0 khi và chỉ khi A ≥ XB−1X∗.
Chứng minh. Ta có(
A X
X∗ B
)
∼
(
I −XB−1
O I
)(
A X
X∗ B
)(
I O
−B−1X∗ I
)
=
(
A−XB−1X∗ O
O B
)
.
Do B > 0 nên
(
A X
X∗ B
)
≥ 0 khi và chỉ khi A ≥ XB−1X∗.
16
Dưới đây là một vài kết quả được suy ra trực tiếp từ mệnh đề trên.
Hệ quả 1.5.7. [4] Nếu A > 0 thì
(
A I
I A−1
)
≥ 0
Hệ quả 1.5.8. [4] Giả sử B là ma trận xác định dương và X là ma trận bất kỳ,
khi đó ta có
XB−1X∗ = min
{
A :
(
A X
X∗ B
)
≥ 0
}
.
Hệ quả 1.5.9. [4] Giả sử A,B là các ma trận nửa xác định dương và X là ma
trận bất kỳ, khi đó ta có
A−XB−1X∗ = max
{
Y :
(
A X
X∗ B
)
≥
(
Y O
O O
)}
.
Mệnh đề 1.5.10. [4] Giả sử A,B là các ma trận xác định dương, khi đó ta có(A+B
2
)−1
≤ A
−1 +B−1
2
.
Chứng minh. Theo Hệ quả 1.5.7 ta có
(
A I
I A−1
)
≥ 0,
(
B I
I B−1
)
≥ 0. Do vậy(
A+B 2I
2I A−1 +B−1
)
cũng là ma trận nửa xác định dương. Theo Mệnh đề 1.5.6
ta có A−1 +B−1 ≥ 4(A+B)−1, hay(A+B
2
)−1
≤ A
−1 +B−1
2
.
Mệnh đề 1.5.11. [10] (Bất đẳng thức Fiedler) Nếu A là ma trận xác định dương
cấp n thì A ◦ A−1 ≥ In.
Chứng minh. Với các ma trận xác định dương A,B bất kỳ, theo Hệ quả 1.5.7 thì(
A I
I A−1
)
≥ 0,
(
B I
I B−1
)
≥ 0. Theo Định lý 1.3.3 ta có
(
A ◦B I
I A ◦B
)
≥ 0.
Theo Mệnh đề 1.5.6 ta có A ◦ B ≥ (A−1 ◦ B−1)−1. Thay B = A−1 vào bất đẳng
thức trên ta được
A ◦ A−1 ≥ (A−1 ◦ A)−1 = (A ◦ A−1)−1.
Vậy A ◦ A−1 ≥ In.
17
1.6 Hàm lồi, lõm, đơn điệu trên tập các ma trận
xác định dương
Hàm ma trận và các tính chất lồi, lõm, đơn điệu của nó có thể xem là sự tổng
quát hóa hàm số và các tính chất. Lý thuyết tương đối hoàn chỉnh về hàm ma trận
có thể được tìm thấy trong [11].
Định nghĩa 1.6.1. Ánh xạ f : Sn −→ Sn được gọi là lồi nếu
f((1− α)A+ αB) ≤ (1− α)f(A) + αf(B) ∀ A,B ∈ Sn, ∀ α ∈ [0, 1]. (1.6.1)
Định nghĩa 1.6.2. Ánh xạ f : Sn −→ Sn được gọi là lõm nếu
f((1− α)A+ αB) ≥ (1− α)f(A) + αf(B) ∀ A,B ∈ Sn, ∀ α ∈ [0, 1]. (1.6.2)
Tương tự trong trường hợp hàm số, nếu hàm ma trận f là liên tục thì f lồi
(lõm) khi và chỉ khi f
(A+B
2
)
≤ (≥)f(A) + f(B)
2
∀ A,B ∈ Sn.
Nhận xét 1.6.1. Nếu K là tập con của Sn thì ta gọi f là lồi (lõm) trên K nếu bất
đẳng thức (1.6.1) ((1.6.2)) đúng với mọi A,B ∈ K.
Ví dụ 1.6.2. Theo Mệnh đề 1.5.10 với mọi ma trận xác định dương A,B ta có(A+B
2
)−1
≤ A
−1 +B−1
2
.
Do vậy ánh xạ f : A −→ A−1 lồi trên tập Pn.
Ví dụ 1.6.3. Ánh xạ f : A −→ A2 lồi trên tập Pn.
Mệnh đề 1.6.4. [4] Ánh xạ f : Pn ×Matn(C) −→ Pn, (B,X) −→ XB−1X∗ lồi
theo cả hai biến B và X.
Chứng minh. Theo Mệnh đề 1.5.6 với các ma trận B1, B2 ∈ Pn, X1, X2 ∈ Matn(C)
ta có (
X1B
−1
1 X
∗
1 X1
X∗1 B1
)
≥ 0,
(
X2B
−1
2 X
∗
2 X2
X∗2 B2
)
≥ 0.
Do vậy X1B
−1
1 X
∗
1 +X2B
−1
2 X
∗
2
2
X1 +X2
2(X1 +X2
2
)∗ B1 +B2
2
≥ 0.
Lại theo Mệnh đề 1.5.6 ta có
1
2
(X1B
−1
1 X
∗
1 +X2B
−1
2 X
∗
2) ≥
(X1 +X2
2
)(B1 +B2
2
)−1(X1 +X2
2
)∗
.
Bất đẳng thức trên chứng tỏ f lồi theo cả hai biến.
18
Định nghĩa 1.6.3. Ánh xạ f : Sn −→ Sn được gọi là đơn điệu tăng (giảm) nếu
với mọi A,B ∈ Sn, A ≥ B =⇒ f(A) ≥ (≤)f(B). Ánh xạ đơn điệu tăng, giảm gọi
chung là ánh xạ đơn điệu.
Ví dụ 1.6.5. Ánh xạ A −→ A12 đơn điệu tăng trên Pn, trong khi ánh xạ A −→ A2
không phải là hàm đơn điệu trên Pn.
Mệnh đề 1.6.6. [4] Ánh xạ f : Pn×Pn×Sn −→ Sn, (A,B,X) −→ A−XB−1X∗
lõm theo cả ba biến A,B,X và đơn điệu tăng theo các biến A,B.
Mệnh đề 1.6.7. [4] Ánh xạ f(A) = Ar trên Pn đơn điệu nếu 0 ≤ r ≤ 1 và lồi
nếu 1 ≤ r ≤ 2.
1.7 Phương trình ma trận
Phương trình ma trận ẩn X có dạng f(X) = A, trong đó f : Matn(K) −→
Matn(K), X −→ f(X) là một ánh xạ trên không gian các ma trận cấp n.
Ví dụ 1.7.1. Phương trình Lyapunov là phương trình ma trận có dạng
A∗X +XA = W. (1.7.1)
Người ta chứng minh được rằng nếu các giá trị phổ của A nằm trong nửa mặt
phẳng bên phải thì phương trình Lyapunov (1.7.1) có duy nhất nghiệm. Hơn thế
nữa, nếu W là ma trận nửa xác định dương thì nghiệm của phương trình trên cũng
là nửa xác định dương.
Trong trường hợp A = diag(α1, · · · , αn) thì nghiệm của phương trình Lyapunov
được cho bởi công thức
X =
[ 1
αi + αj
]
n×n
◦ W. (1.7.2)
Ví dụ 1.7.2. Phương trình Stein là phương trình ma trận có dạng
X − F ∗XF = W. (1.7.3)
Nếu các giá trị phổ của F chứa trong hình cầu mở đơn vị thì phương trình Stein
(1.7.3) có nghiệm duy nhất cho bởi công thức
X =
∞∑
m=0
F ∗mWFm. (1.7.4)
Trong trường hợp F = diag(β1, · · · , βn) thì nghiệm của phương trình Stein được
cho bởi công thức
X =
[ 1
1− βiβj
]
n×n
◦ W. (1.7.5)
19
Phương trình ma trận Riccati dưới đây đóng vai trò quan trọng trong các khảo
sát ở chương 3.
Định nghĩa 1.7.1. Phương trình Riccati là phương trình ma trận có dạng
XAX = B. (1.7.6)
Mệnh đề 1.7.3. [4] Nếu A > 0, B ≥ 0 thì nghiệm nửa xác định dương của phương
trình Riccati (1.7.6) tồn tại duy nhất và được cho bởi công thức
X = A−
1
2 (A
1
2BA
1
2 )
1
2A−
1
2 . (1.7.7)
Chứng minh. Từ phương trình (1.7.6) ta có
A
1
2XAXA
1
2 = A
1
2BA
1
2 .
Lấy căn bậc hai hai vế ta thu được
A
1
2XA
1
2 = (A
1
2BA
1
2 )
1
2 .
Vậy nghiệm nửa xác định dương của phương trình (1.7.6) tồn tại duy nhất và
được cho bởi công thức (1.7.7).
20
Chương 2
BÀI TOÁN BẢO TOÀN TUYẾN TÍNH
Trong chương này, chúng tôi giới thiệu lớp bài toán bảo toàn tuyến tính, đặc biệt là lớp
bài toán bảo toàn tuyến tính chỉ số quán tính. Chúng tôi tổng quan một số kết quả trong
lĩnh vực này và giới thiệu một số kết quả đạt được trong các đề tài thực hiện trong các năm
2009, 2010. Trong quá trình thực hiện khóa luận, chúng tôi cũng đã thu được một số kết quả
mới. Cụ thể, chúng tôi đưa ra một điều kiện đủ để toán tử tuyến tính hạng 3 bảo toàn chỉ số
(n, 0, 0). Ngoài ra, chúng tôi đưa ra một lớp toán tử hạng r bảo toàn chỉ số này.
2.1 Bài toán bảo toàn tuyến tính
Các bài toán bảo toàn tuyến tính là một hướng nghiên cứu sôi động trong lĩnh
vực toán tử và lĩnh vực ma trận. Các bài toán này đề cập đến các toán tử bảo
toàn trong không gian các ma trận hay toán tử. Các bài toán bảo toàn có thể là
bảo toàn một hàm, một tập con, một quan hệ. Bài báo đầu tiên đề cập đến vấn
đề này xuất hiện năm 1897. Kể từ đó đến nay, rất nhiều những công trình ra đời
nhằm trả lời cho loại câu hỏi này. Hiện nay lĩnh vực này đang thu hút nhiều nhà
toán học quan tâm, nổi bật là Chi-Kwong Li và Stephen Pierce. Vẫn đang còn rất
nhiều vấn đề mở cần nghiên cứu về bài toán bảo toàn tuyến tính, đặc biệt là bài
toán bảo toàn tuyến tính chỉ số quán tính. Trong lớp bài toán này, bài toán bảo
toàn chỉ số (n, 0, 0), tức bài toàn bảo toàn tính xác định dương hiện nay vẫn nằm
ngoài mọi cách tiếp cận.
Trong phần này, ta giả sử T : Matm×n(K) −→ Matm×n(K) là một toán tử
tuyến tính. Trước hết, chúng ta sẽ đề cập đến ba vấn đề bảo toàn tuyến tính quan
trọng.
21
Bảo toàn tuyến tính hàm
Toán tử tuyến tính T gọi là bảo toàn hàm f : Matm×n(K) −→ K nếu f(A) =
f(T (A)) với mọi A ∈ Matm×n(K). Chẳng hạn khi f = det và Matm×n(K) ≡
Matn(K), ta có bài toán bảo toàn định thức.
Bảo toàn tuyến tính tập con
Giả sử ξ là một tập con của Matm×n(K). Toán tử tuyến tính T được gọi là bảo
toàn tập ξ nếu T (ξ) ⊆ ξ. Chẳng hạn khi Matm×n(K) ≡ Matn(C) và ξ là nhóm
các ma trận unita Un, ta có bài toán bảo toàn nhóm Un.
Bảo toàn tuyến tính một quan hệ hoặc quan hệ tương đương
Giả sử Φ là một quan hệ hay là một quan hệ tương đương trên Matm×n(K).
Toán tử tuyến tính T gọi là bảo toàn quan hệ Φ nếu T (A)ΦT (B) khi AΦB hoặc
T (A)ΦT (B) khi và chỉ khi AΦB. Chẳng hạn ở đây quan hệ Φ được định nghĩa bởi
AΦB khi AB = BA.
Trong phần tiếp theo, ta tìm hiểu sơ lược một số dạng bài toán bảo toàn tuyến
tính và các kết quả đã biết.
2.2 Bảo toàn tuyến tính hạng của ma trận
Toán tử tuyến tính T được gọi là bảo toàn hạng k nếu với mọi ma trận A thuộc
Matm×n(K) sao cho rank(A) = k ta có rank(T (A)) = k. Đối với bài toàn bảo toàn
hạng 1, người ta đã giải quyết trên không gian Matm×n(K), với K là trường đại số
đóng với đặc số bằng 0. Năm 1959, Marus và Moyls chứng minh được định lý sau
Định lý 2.2.1. [13] Giả sử T là một toán tử tuyến tính bảo toàn hạng 1 trên
Matn(C), khi đó tồn tại hai ma trận khả nghịch P và Q sao cho
T (A) = PAQ, ∀ A ∈ Matn(C), (2.2.1)
hoặc
T (A) = PAtQ, ∀ A ∈ Matn(C). (2.2.2)
Trong trường hợp T là toán tử tuyến tính trên Matm×n(C),m 6= n, người ta
chứng minh được rằng T có dạng (2.2.1) với P ∈ Matm(C), Q ∈ Matn(C) là các
ma trận khả nghịch.
Người ta còn xét bài toán bảo toàn hạng 1 trên các không gian khác và thu được
22
nhiều kết quả thú vị. Chẳng hạn xét trên không gian các ma trận Hermite cấp n
ta có kết quả sau
Định lý 2.2.2. [7] Xét T là toán tử tuyến tính trên Hn bảo toàn hạng 1. Giả sử
tồn tại một ma trận Hermite có ảnh là khả nghịch. Khi đó tồn tại một ma trận
khả nghịch S trên Matn(C) và ε ∈ {−1, 1} sao cho
T (A) = εSAS∗, ∀ A ∈ Hn,
hoặc
T (A) = εSAtS∗, ∀ A ∈ Hn.
Bài toán bảo toàn hạng k đã được giải quyết trong trường hợp Matn(C). Một
toán tử tuyến tính bảo toàn hạng k trên Matn(C) sẽ có dạng (2.2.1) hoặc (2.2.2).
2.3 Bài toán bảo toàn định thức
Toán tử tuyến tính T trênMatn(C) được gọi là bảo toàn định thức nếu det(A) =
det(T (A)) với mọi ma trận A ∈ Matn(C).
Bài toán bảo toàn định thức là bài toán được đề cập đầu tiên trong lĩnh vực
bảo toàn tuyến tính và đã được giải quyết triệt để vào năm 1897 bởi Ferdinand
Georg Frobenius (1849 - 1917).
Định lý 2.3.1. [13] Giả sử T là một toán tử tuyến tính bảo toàn định thức trên
Matn(C), khi đó tồn tại hai ma trận nghịch đảo P và Q với det(PQ) = 1 sao cho
T (A) = PAQ, ∀ A ∈ Matn(C),
hoặc
T (A) = PAtQ, ∀ A ∈ Matn(C).
Chúng ta thấy rằng dạng của toán tử tuyến tính bảo toàn định thức và bảo toàn
hạng 1 trên Matn(C) là hoàn toàn giống nhau. Thực ra hoàn toàn có thể quy bài
toán bảo toàn định thức về bài toán bảo toàn hạng 1. Đối với bài toán bảo toàn
định thức, người ta còn quan tâm đến những toán tử T thỏa mãn
det(A+ λB) = det(T (A) + λT (B)), ∀ A,B ∈ Matn(C), ∀ λ ∈ C. (2.3.1)
Năm 2002, Dolinar và Semrl chỉ ra rằng nếu toán tử T toàn ánh và đồng thời
thỏa mãn (2.3.1) thì T là tuyến tính. Theo công trình mới của Wang Fei, có thể
bỏ đi giả thiết T toàn ánh.
23
Định lý 2.3.2. [7] Giả sử T : Matn(C) −→ Matn(C) là một toán tử xác định
trên không gian Matn(C) sao cho det(A + λB) = det(T (A)) + λT (B)) với mọi
A,B ∈ Matn(C) và λ ∈ C. Khi đó T là tuyến tính.
Bằng cách hạn chế không gian đang xét, người ta thu được một số kết quả khá
thú vị. Đây cũng là một hướng nghiên cứu đáng được quan tâm. Chẳng hạn, xét
Un là không gian các ma trận tam giác trên cấp n, ta có
Định lý 2.3.3. [7] Giả sử T là một toán tử tuyến tính đi từ Un vào chính nó và
det(A+ λB) = det(T (A) + λT (B)), ∀A,B ∈ Un, ∀ λ ∈ C.
Khi đó tồn tại một hoán vị σ của {1, 2, · · · , n} và các số không âm c1, c2, · · · , cn
với
∏n
i=1 ci = 1 sao cho với mỗi A ∈ Un ta có
[T (A)]ii = ci(A)σ(i)σ(i), i = 1, 2, · · · , n.
Đồng thời, người ta còn quan tâm đến việc mô tả những toán tử tuyến tính bảo
toàn định thức và một tính chất khác nữa. Chẳng hạn, người ta đã chỉ ra rằng nếu
toán tử tuyến tính T trên Matn(C) bảo toàn định thức và vết thì T (A) = PAP−1
với mọi A ∈ Matn(C) hoặc T (A) = PAtP−1 với mọi A ∈ Matn(C), ở đây P là
một ma trận khả nghịch.
2.4 Bảo toàn tuyến tính chuẩn và tập các ma trận
Unita
Trong mục này ta dùng ký hiệu T ∗ để chỉ toán tử đối ngẫu của toán tử tuyến
tính T .
Định nghĩa 2.4.1. Giả sử A ∈ Matm×n(C)
1. Chuẩn phổ (spectral norm) của A, ký hiệu ‖A‖2 được xác định bởi
‖A‖2 =
√
λmax(A∗A) = σmax(A),
ở đây ký hiệu λmax(X), σmax(X) để chỉ giá trị riêng lớn nhất, giá trị kỳ dị lớn nhất
của ma trận X.
2. Chuẩn vết (trace norm, Ky Fan norm) của A, ký hiệu ‖A‖∗ được xác định bởi
‖A‖∗ =
min{m,n}∑
i=1
σi.
24
Định lý 2.4.1. [14] Giả sử T là toán tử tuyến tính trên Matn(C), khi đó các
khẳng định sau đây là tương đương.
1. T bảo toàn chuẩn phổ.
2. T (Un) = Un.
3. T bảo toàn chuẩn vết.
4. T ∗ biến tập các ma trận với giá trị kỳ dị 1, 0, · · · , 0 thành chính nó.
5. T có dạng
T (A) = UAV, ∀A ∈ Matn(C)
hoặc
T (A) = UAtV, ∀A ∈ Matn(C),
ở đây U, V là các ma trận Unita.
6. T ∗ có dạng
T (A) = UAV, ∀A ∈ Matn(C)
hoặc
T (A) = UAtV, ∀A ∈ Matn(C),
ở đây U, V là các ma trận Unita.
2.5 Bảo toàn tuyến tính miền số học và bán kính
số học
Định nghĩa 2.5.1. Với mỗi ma trận A ∈ Matn(C) ta định nghĩa
1. Miền số học của A là tập
W (A) = {x∗Ax : x ∈ Cn, x∗x = 1},
ở đây x là vector cột và x∗ là chuyển vị liên hợp của x.
2. Bán kính số học của A được xác định bởi đẳng thức
r(A) = max{|z| : z ∈ W (A)}.
Bài toán bảo toàn tuyến tính miền số học và bán kính số học đã được Chi -
Kwong Li giải quyết triệt để.
Định lý 2.5.1. [12] Toán tử tuyến tính T : Matn(C) −→ Matn(C) thỏa mãn điều
kiện
r(T (A)) = r(A) ∀A ∈ Matn(C)
25
nếu và chỉ nếu tồn tại ma trận unita U ∈ Matn(C) và ξ ∈ C với |ξ| = 1 sao cho
T (A) = ξUAU∗, ∀A ∈ Matn(C)
hoặc
T (A) = ξUAtU∗, ∀A ∈ Matn(C).
Định lý 2.5.2. [12] Toán tử tuyến tính T : Hn −→ Hn thỏa mãn điều kiện
r(T (A)) = r(A) ∀A ∈ Hn
nếu và chỉ nếu tồn tại ma trận unita U ∈ Matn(C) và ξ ∈ {−1, 1} sao cho
T (A) = ξUAU∗, ∀A ∈ Hn
hoặc
T (A) = ξUAtU∗, ∀A ∈ Hn.
Định lý 2.5.3. [12] Giả sử T : Matn(C) −→ Matn(C) là toán tử tuyến tính. Khi
đó các khẳng định sau đây là tương đương
1. W (T (A)) = W (A), ∀A ∈ Matn(C).
2. W (T (A)) = W (A), ∀ A ∈ Hn.
3. Tồn tại ma trận unita U ∈ Matn(C) sao cho
T (A) = UAU∗, ∀A ∈ Matn(C)
hoặc
T (A) = UAtU∗, ∀A ∈ Matn(C).
2.6 Bài toán bảo toàn tuyến tính chỉ số quán tính
Bài toán bảo toàn tuyến tính chỉ số quán tính là một bài toán quan trọng trong
lĩnh vực bảo toàn tuyến tính. Đây là một trong những mảng còn có nhiều vấn đề
chưa được giải quyết. Trong mục này, ta quan tâm đến không gian các ma trận
đối xứng trên trường số thực Sn(R) và không gian các ma trận Hermite Hn.
Các ma trận đối xứng trên trường số thực và các ma trận Hermite luôn có các
giá trị riêng thực, do đó ta có thể đưa ra định nghĩa sau
Định nghĩa 2.6.1. Ma trận A được gọi là có chỉ số quán tính (r, p, q) nếu A có r
giá trị riêng dương, p giá trị riêng âm và q giá trị riêng bằng 0.
26
Ký hiệu G(r, p, q) là tập các ma trận với chỉ số quán tính (r, p, q). Ta thấy ngay
G(n, 0, 0) = Pn. Toán tử tuyến tính T được gọi là bảo toàn chỉ số (r, p, q) nếu
T (G(r, p, q)) ⊂ G(r, p, q). (2.6.1)
Vấn đề bảo toàn tuyến tính chỉ số quán tính là một vấn đề khó và còn nhiều bài
toán mở. Đặc biết hiện nay, người ta còn đang gặp nhiều khó khăn trong việc giải
quyết được bài toán trong trường hợp (n, 0, 0).
Kết quả quan trọng đầu tiên trong quá trình giải quyết bài toán bảo toàn tập
các ma trận xác định dương được đưa ra vào năm 1965 bởi Schneider. Tác giả đã
hoàn toàn xác định được lớp các phép biến đổi tuyến tính biến tập tất cả các ma
trận nửa xác định dương thành chính nó.
Định lý 2.6.1. [20] Cho T là phép biến đổi tuyến tính trên Hn. Nếu T (Pn) = Pn
thì T có dạng
T (A) = X∗AX, ∀A ∈ Hn, (2.6.2)
hoặc
T (A) = X∗AtX, ∀A ∈ Hn (2.6.3)
trong đó X là một ma trận phức khả nghịch cấp n× n.
Mở rộng kết quả của Schneider, trong [8], Johnson và Pierce đã xác định được
các toán tử tuyến tính biến tập G = G(k, n− k, 0) vào chính nó. Nếu k 6= n− k và
T là một toán tử tuyến tính trên Matn(C) biến G thành chính nó thì T sẽ có dạng
nêu trong Định lý 2.6.1, trong đó ma trận A được lấy trên không gian Matn(C).
Trong trường hợp k = n−k thì T biến G thành chính nó nếu và chỉ nếu T có dạng
T (A) = εX∗AX, ∀A ∈ Matn(C) (2.6.4)
hoặc
T (A) = εX∗AtX, ∀A ∈ Matn(C) (2.6.5)
với ε ∈ {−1, 1}, X là một ma trận phức khả nghịch cấp n× n.
Tuy vậy ở đây, giả thiết T (G) = G là mạnh hơn rất nhiều so với (2.6.1). Tiếp
tục mở rộng kết quả này, trong [9] Johnson và Pierce tiếp tục xác định được
tất cả các toán tử tuyến tính không suy biến bảo toàn các lớp chỉ số quán tính
ngoại trừ bốn trường hợp (n, 0, 0), (0, n, 0), (0, 0, n), (n2 ,
n
2 , 0). Cụ thể, giả sử ta
có r, s, t là những số nguyên không âm thỏa mãn r + s + t = n và (r, s, t) /∈
{(n, 0, 0), (0, n, 0), (0, 0, n), (n2 , n2 , 0)} và T là một toán tử tuyến tính không suy
biến trên Hn bảo toàn chỉ số (r, s, t). Nếu r 6= s thì T có dạng nêu trong Định lý
27
2.6.1. Nếu r = n − r thì T có dạng (2.6.4) hoặc (2.6.5), trong đó ma trận A
được lấy trên không gian Hn.
Không những thế, trong [9], vấn đề bảo toàn tuyến tính các lớp chỉ số (n−1, 1, 0)
và (k+1, k, 0) đã được giải quyết triệt để. Nếu (r, s, t) ∈ {(n−1, 1, 0), (k+1, k, 0)}
và T là toán tử tuyến tính trên Hn bảo toàn chỉ số (r, s, t) thì T cũng sẽ có dạng
nêu trong Định lý 2.6.1.
Phải đến năm 1988, Stephen Pierce và Leiba Rodman mới xác định được các
toán tử tuyến tính không suy biến bảo toàn lớp chỉ số (n2 ,
n
2 , 0).
Định lý 2.6.2. [19] Giả sử n = 2k, k ∈ N, k ≥ 2 và T là toán tử tuyến tính không
suy biến trên Hn bảo toàn chỉ số (k, k, 0). Khi đó T có dạng
T (A) = εX∗AX, ∀A ∈ Hn
hoặc
T (A) = εX∗AtX, ∀A ∈ Hn
với ε ∈ {−1, 1}, X là một ma trận phức khả nghịch cấp n× n.
Định lý 2.6.3. [19] Giả sử Dr,s : H2 −→ H2 được xác định bởi
Dr,s :
(
a u+ iv
u− iv b
)
−→
(
a ru+ siv
ru− siv b
)
.
Nếu T là toán tử tuyến tính không suy biến trên H2 bảo toàn chỉ số (1, 1, 0) thì T
là tích của các toán tử có dạng được đưa ra trong Định lý 2.6.2 và toán tử có dạng
Dr,s với |r|, |s| ≥ 1.
2.7 Toán tử tuyến tính xác định dương
Bài toán bảo toàn tuyến tính chỉ số (n, 0, 0), tức bài toán bảo toàn tính xác
định dương có mối quan hệ chặt chẽ với lý thuyết về các toán tử tuyến tính xác
định dương. Toán tử tuyến tính T : Matn(K) −→ Matm(K) được gọi là nửa xác
định dương (xác định dương) nếu T (A) ≥ 0 (> 0) khi A ≥ 0 (> 0). Dễ thấy toán
tử tuyến tính nửa xác định dương T là xác định dương khi T (In) > 0.
Ví dụ 2.7.1. 1. T (A) = trA là phiếm hàm tuyến tính nửa xác định dương.
2. T (A) = X∗AX với X ∈ Matn×m(K) là toán tử tuyến tính nửa xác định
dương đi từ Matn(K) đến Matm(K).
28
3. Nếu B là ma trận nửa xác định dương thì T (A) = A⊗B là toán tử nửa xác
định dương.
4. Nếu B là ma trận nửa xác định dương thì T (A) = A ◦ B là toán tử nửa
xác định dương. Nếu B là ma trận nửa xác định dương và diag(B) > 0 thì
T (A) = A ◦B là toán tử xác định dương.
Còn nhiều vấn đề mở được đặt ra khi khảo sát các toán tử tuyến tính xác định
dương. Chẳng hạn, người ta chứng tỏ được rằng nếu T : Matn(K) −→ Matm(K)
là toán tử tuyến tính nửa xác định dương thì ‖T‖ = ‖T (In)‖. Ngược lại, người ta
dự đoán rằng toán tử tuyến tính T thỏa ‖T‖ = ‖T (In)‖ và T (In) ≥ 0 thì T là toán
tử nửa xác định dương. Cho đến nay giả thuyết này vẫn chưa được giải quyết.
Một lớp toán tử tuyến tính nửa xác định dương được đặc biệt quan tâm là
lớp các toán tử hoàn toàn nửa xác định dương. Xét Matm(Matn(C)) là không
gian các m × m ma trận khối [[Aij]] với vị trí thứ i, j là phần tử của Matn(C).
Với mỗi toán tử tuyến tính T : Matn(C) −→ Matk(C), ta có toán tử tuyến tính
Tm : Matm(Matn(C)) −→ Matm(Matk(C)) xác định bởi
Tm([[Aij]]) = [[T (Aij)]]. (2.7.1)
Toán tử T được gọi là m − nửa xác định dương nếu Tm là nửa xác định dương.
Dễ thấy các toán tử tuyến tính nửa xác định dương là 1 − nửa xác định dương .
Nếu Tm nửa xác định dương với mọi m ∈ N∗ thì toán tử T được gọi là hoàn toàn
nửa xác định dương. Lớp các toán tử tuyến tính hoàn toàn nửa xác định dương đã
được mô tả một cách đầy đủ.
Định lý 2.7.2. [4] (Choi, Kraus) Giả sử T : Matn(C) −→ Matk(C) là toán
tử tuyến tính hoàn toàn nửa xác định dương. Khi đó tồn tại các ma trận Vi ∈
Matn×k(C), i = 1, · · · , nk sao cho
T (A) =
nk∑
i=1
V ∗i AVi, ∀ A ∈ Matn(C).
2.8 Bài toán bảo toàn tuyến tính chỉ số (n, 0, 0)
Trong phần này, chúng tôi tóm lược một số kết quả thu được trong các đề tài
thực hiện vào các năm 2009, 2010.
Như đã biết, bài toán bảo toàn tuyến tính chỉ số quán tính, đặc biệt là bảo toàn
lớp chỉ số (n, 0, 0) vẫn còn là một bài toán mở mặc dù ta có thể dễ dàng chỉ ra
29
nhiều dạng toán tử bảo toàn lớp chỉ số này, chẳng hạn T : Sn(R) −→ Sn(R), A −→∑r
i=1 WiAW
t
i , ở đây Wi, i = 1, · · · , n là các ma trận khả nghịch. Về những khó
khăn trong trường hợp này, có thể thấy trong [13]. Hướng tìm hiểu của chúng tôi
là khảo sát bài toán này với một số giả thiết bổ sung. Cụ thể chúng tôi đưa ra
dạng của toán tử tuyến tính bảo toàn hạng của các ma trận Eii và bảo toàn lớp
chỉ số (n, 0, 0).
Định lý 2.8.1. [1] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính bảo toàn
hạng của các ma trận Eii, i = 1, 2, · · · , n và bảo toàn các ma trận xác định dương
trên Sn(R). Khi đó, tồn tại ma trận nửa xác định dương H ∈ Sn(R) với các phần
tử trên đường chéo chính khác 0, tồn tại ma trận khả nghịch W sao cho
T (A) = W (H ◦ A)W t,∀ A ∈ Sn(R).
Từ định lý trên ta suy ra ngay kết quả sau
Mệnh đề 2.8.2. [2] Cho toán tử tuyến tính T : Sn(R) −→ Sn(R) xác định bởi
T (A) =
r∑
i=1
Wi(Hi ◦ A)W ti , ∀ A ∈ Sn(R),
ở đây Wi, i = 1, · · · , r khả nghịch, Hi ∈ Sn(R), i = 1, · · · , r là các ma trận nửa
xác định dương có các phần tử trên đường chéo chính khác 0. Khi đó T bảo toàn
lớp chỉ số (n, 0, 0).
Trong [15], Chi-Kwong-Ly và Hugo J. Woerdeman khảo sát vấn đề tương tự
trên không gian Matn(K) và thu được các kết quả sau
Định lý 2.8.3. [15] Giả sử T : Matn(R) −→ Matn(R) là toán tử tuyến tính bảo
toàn tập các ma trận nửa xác định dương. Khi đó các mệnh đề sau đây là tương
đương
1. (T (A))ii = Aii ∀ A ∈ Matn(R), ∀ 1 ≤ i ≤ n.
2. T (Eii) = Eii ∀ 1 ≤ i ≤ n.
3. Tồn tại ma trận nửa xác định dương H với các phần tử trên đường chéo chính
bằng 1 và toán tử tuyến tính T˜ :
{X ∈ Matn(R) : X = −Xt} −→ {X ∈ Matn(R) : Xii = 0, i = 1, · · · , n}
sao cho T (A) = A ◦H + T˜ (A− At), ∀ A ∈ Matn(R).
30
Định lý 2.8.4. [15] Giả sử T : Matn(C) −→ Matn(C) là toán tử tuyến tính bảo
toàn tập các ma trận nửa xác định dương. Khi đó các mệnh đề sau đây là tương
đương
1. (T (A))ii = Aii ∀ A ∈ Matn(C), ∀ 1 ≤ i ≤ n.
2. T (Eii) = Eii ∀ 1 ≤ i ≤ n.
3. T (A) = A ◦ In + A ◦H + At ◦K, ∀ A ∈ Matn(C), trong đó H,K ∈ Hn là
các ma trận với đường chéo chính bằng 0 thỏa mãn I +D∗KD+DHD∗ ≥ 0
với mọi ma trận đường chéo Unita D.
Tuy vậy, việc mô tả một cách tường minh điều kiện "H,K ∈ Hn là các ma trận
với đường chéo chính bằng 0 thỏa mãn I +D∗KD +DHD∗ ≥ 0 với mọi ma trận
đường chéo Unita D" là rất khó khăn khi n ≥ 3. Hiện nay vấn đề này vẫn chưa
được giải quyết triệt để.
Từ Định lý 2.8.1, chúng tôi đưa ra một số lớp toán tử tuyến tính khả nghịch
bảo toàn tập các ma trận xác định dương trên Sn(R).
Định lý 2.8.5. [2] Cho toán tử tuyến tính T : Sn(R) −→ Sn(R) là toán tử tuyến
tính. Các mệnh đề sau đây là tương đương
1. T bảo toàn chỉ số (n, 0, 0) và bảo toàn tập các ma trận suy biến.
2. T bảo toàn chỉ số (n, 0, 0) và bảo toàn tập các ma trận nửa xác định dương
suy biến.
3. T (G(n, 0, 0)) = G(n, 0, 0).
4. T (Pn) = Pn.
5. Tồn tại ma trận khả nghịch W ∈ Matn(R) sao cho
T (A) = WAW t, ∀A ∈ Sn(R).
Một hướng tiếp cận khác của chúng tôi là xác định các toán tử tuyến tính bảo
toàn chỉ số (n, 0, 0) với hạng cụ thể. Trong phần này, gọi λmin(A), λmax(A) lần lượt
là các giá trị riêng nhỏ nhất và lớn nhất của ma trận A. Giả sử T : Sn(R) −→ Sn(R)
là toán tử tuyến tính hạng r và {U1, · · · , Ur} là một cơ sở của Im(T ). Dễ thấy
rằng nếu T bảo toàn chỉ số (n, 0, 0) thì U1, · · · , Ur có thể chọn trong tập Pn.
Giả sử T (Eii) =
∑r
k=1 b
k
iiUk và T (Eij + Eji) =
∑r
k=1(b
k
ij + b
k
ji)Uk, b
k
ij = b
k
ji, k =
31
1, 2, · · · , r; i, j = 1, 2, · · · , n. Đặt Bk = (bkij)n×n, khi đó dễ thấy rằng với mọi ma
trận A ∈ Sn(R) ta có
T (A) =
r∑
k=1
tr(ABk)Uk. (2.8.1)
Từ Mệnh đề 1.2.9 ta suy ra kết quả sau
Mệnh đề 2.8.6. [15] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính xác định
bởi
T (A) =
r∑
k=1
tr(ABk)Uk,
trong đó {U1, · · · , Ur} ⊂ Pn là hệ độc lập tuyến tính. Nếu Bk > 0 ∀ k = 1, · · · , r
thì T bảo toàn chỉ số (n, 0, 0).
Tuy vậy điều kiện Bk > 0 ∀ k = 1, · · · , r là rất mạnh nên lớp các toán tử thu
được trong trường hợp này trở nên hẹp. Chúng tôi đặt vấn đề giảm nhẹ điều kiện
trên và thu được một số kết quả trong trường hợp toán tử T có hạng 1, 2. Chúng
tôi cũng giải quyết bài toán trong trường hợp hạng T bằng r với một giả thiết bổ
sung.
Định lý 2.8.7. [1] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính hạng 1 bảo
toàn chỉ số (n, 0, 0) trên Sn(R). Khi đó, tồn tại ma trận nửa xác định dương khác
không B1 ∈ Sn(R) và ma trận xác định dương U1 ∈ Sn(R) sao cho
T (A) = tr(AB1)U1, ∀ A ∈ Sn(R).
Định lý 2.8.8. [2] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính có dạng
T (A) = tr(AB1)U1 + tr(AB2)U2, ∀A ∈ Sn(R) (2.8.2)
với U1, U2 ∈ Sn(R) là các ma trận xác định dương độc lập tuyến tính. T bảo toàn
chỉ số (n, 0, 0) khi và chỉ khi B1+λmin(U
−1
1 U2)B2, B1+λmax(U
−1
1 U2)B2 là các ma
trận nửa xác định dương khác 0.
Mệnh đề 2.8.9. [2] Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính có dạng
(2.8.1) trong đó {U1, · · · , Ur} là hệ các ma trận xác định dương độc lập tuyến
tính sao cho tồn tại ma trận khả nghịch W để W tUkW = diag(λ1k, · · · , λnk), k =
1, · · · , r. T bảo toàn chỉ số (n, 0, 0) khi và chỉ khi ∑rk=1 λikUk, i = 1, · · · , n là các
ma trận nửa xác định dương khác 0.
32
2.9 Một số kết quả mới
Tiếp tục hướng xác định các lớp toán tử tuyến tính bảo toàn tập các ma trận
xác định dương với hạng cụ thể, chúng tôi đưa ra một điều kiện đủ để toán tử
dạng (2.8.1) bảo toàn chỉ số (n, 0, 0) trong trường hợp hạng T bằng 3. Trước hết,
ta cần có một số bổ đề sau.
Bổ đề 2.9.1. Giả sử A,B,C ∈ Sn(R) là các ma trận xác định dương. Khi đó, nếu
đặt E = {(α, β, γ) ∈ R3 : αA+ βB + γC > 0} thì ta có
E = {(α, β, γ) ∈ R3 : γ + λmin[C−1(αA+ βB)] > 0}. (2.9.1)
Chứng minh.
Với (α, β, γ) ∈ R3, theo Định lý 1.2.6 tồn tại ma trận khả nghịch W để
WCW t = In,W (αA + βB)W t = diag(µ1, · · · , µn) ∼ C−1(αA + βB). Do αA +
βB + γC > 0 khi và chỉ khi W (αA+ βB + γC)W t > 0 nên
E = {(α, β, γ) ∈ R3 : γ + λmin[C−1(αA+ βB)] > 0}.
Bổ đề 2.9.2. Cho A ∈ Sn(R) là ma trận xác định dương, B ∈ Sn(R), khi đó
λmin(A
−1B) ≥ min{λmin(B)
λmax(A)
,
λmin(B)
λmin(A)
}.
Chứng minh. Ký hiệu các ma trận W,P,K,Q tương tự chứng minh Định lý 1.2.6.
Ta có λmin(A−1B) = λmin(WBW t) = min‖x‖=1
xtWBW tx. Đặt y = W tx ta có yty =
xtPK2P tx = ztK2z, trong đó z = P tx. Hiển nhiên ‖z‖ = 1. Do vậy ‖y‖2 ∈
[λmax(K2), λmin(K2)] = [
1
λmax(A)
, 1λmin(A) ]. Ta có
λmin(A
−1B) ≥ min
‖y‖2∈[ 1λmax(A) ,
1
λmin(A)
]
ytBy
= min
‖y‖2∈{ 1λmax(A) ,
1
λmin(A)
}
ytBy
= min{λmin(B)
λmax(A)
,
λmin(B)
λmin(A)
}.
Mệnh đề 2.9.3. Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính có dạng
T (A) = tr(AM)In + tr(AN)D + tr(AP )K ∀A ∈ Sn(R) (2.9.2)
33
trong đó D = diag(µ1, · · · , µn) > 0, K > 0 và {In, D,K} là hệ độc lập tuyến
tính. Ký hiệu µmin = min{µi, i = 1, · · · , n}, µmax = max{µi, i = 1, · · · , n}. Nếu
λmax(K)P + M + µminN , λmax(K)P + M + µmaxN , λmin(K)P + M + µmaxN ,
λmin(K)P +M + µminN là các ma trận nửa xác định dương khác 0 thì T bảo toàn
chỉ số (n, 0, 0).
Chứng minh. Từ giả thiết và theo Mệnh đề 1.2.9, với mọi ma trận xác định dương
A ∈ Sn(R) thì
tr(A(λmax(K)P +M + µminN)) > 0
tr(A(λmax(K)P +M + µmaxN)) > 0
tr(A(λmin(K)P +M + µminN)) > 0
tr(A(λmin(K)P +M + µmaxN)) > 0.
Do vậy, nếu ký hiệu α = tr(AM), β = tr(AN), γ = tr(AP ) thì ta có
γλmax(K) + α+ βµmin > 0
γλmax(K) + α+ βµmax > 0
γλmin(K) + α+ βµmin > 0
γλmin(K) + α+ βµmax > 0.
Do vậy γλmax(K) + λmin(αIn + βD) > 0, γλmin(K) + λmin(αIn + βD) > 0. Theo
Bổ đề 2.9.2 ta có
γ + λmin[K
−1(αIn + βD)] ≥ γ +min{λmin(αIn + βD)
λmax(K)
,
λmin(αIn + βD)
λmin(K)
}
= min{γ + λmin(αIn + βD)
λmax(K)
, γ +
λmin(αIn + βD)
λmin(K)
} > 0.
Theo Bổ đề 2.9.1 ta có αIn + βD + γD > 0, hay T (A) > 0 (đpcm).
Mệnh đề 2.9.4. Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính có dạng
T (A) = tr(AM)B1 + tr(AN)B2 + tr(AP )B3 ∀A ∈ Sn(R) (2.9.3)
trong đó {B1, B2, B3} là hệ các ma trận xác định dương độc lập tuyến tính. Nếu
M + λmin(B
−1
1 B2)N + λmax(B
−1
1 B3), M + λmax(B
−1
1 B2)N + λmax(B
−1
1 B3), M +
λmin(B
−1
1 B2)N+λmin(B
−1
1 B3), M+λmax(B
−1
1 B2)N+λmin(B
−1
1 B3) là các ma trận
nửa xác định dương khác 0 thì T bảo toàn tập các ma trận xác định dương.
Chứng minh. Theo Định lý 1.2.6 tồn tại ma trận khả nghịch W sao cho WB1W
t =
In,WB2W
t = D = diag(µ1, · · · , µn),WB3W t = K > 0. Đặt T1 : Sn(R) −→
34
Sn(R), T1(A) = WT (A)W t. Khi đó T bảo toàn chỉ số (n, 0, 0) khi và chỉ khi T1
bảo toàn chỉ số (n, 0, 0) đồng thời
T1(A) = tr(AM)In + tr(AN)D + tr(AP )K ∀A ∈ Sn(R).
Áp dụng Mệnh đề 2.9.4 và Định lý 1.2.6 ta có đpcm.
Tiếp tục theo hướng này, chúng tôi đưa ra một điều kiện đủ để toán tử tuyến
tính dạng (2.8.1) bảo toàn chỉ số (n, 0, 0).
Bổ đề 2.9.5. Với các ma trận X1, · · · , Xr ∈ Sn(R) ta có
λmin(
r∑
i=1
Xi) ≥
r∑
i=1
λmin(Xi).
Chứng minh. Ta có
λmin(
r∑
i=1
Xi) = min‖x‖=1
xt(
r∑
i=1
Xi)x
= min
‖x‖=1
r∑
i=1
xt(Xi)x
≥
r∑
i=1
min
‖x‖=1
xt(Xi)x
=
r∑
i=1
λmin(Xi).
Bổ đề 2.9.6. Với mọi ma trận X1, · · · , Xr ∈ Sn(R), với mọi α1, · · · , αr ∈ R, đặt
B = {∑ri=1 αiλ(Xi), λ ∈ {λmin, λmax}}. Khi đó ta có
λmin(
r∑
i=1
αiXi) ≥ minB.
Chứng minh. Áp dụng Bổ đề 2.9.5 với chú ý rằng với X ∈ Sn(R), α ∈ R thì
λmin(αX) ∈ {αλmin(X), αλmax(X)}.
Mệnh đề 2.9.7. Giả sử T : Sn(R) −→ Sn(R) là toán tử tuyến tính hạng r có
dạng
T (A) =
r∑
k=1
tr(ABk)Uk, ∀ A ∈ Sn(R),
ở đây Uk, k = 1, · · · , r là các ma trận xác định dương độc lập tuyến tính. Nếu∑r
k=1 λ(Uk)Bk, λ ∈ {λmin, λmax} là các ma trận nửa xác định dương khác 0 thì T
bảo toàn chỉ số (n, 0, 0).
35
Chứng minh. Từ giả thiết và Mệnh đề 1.2.9 ta có
∑r
k=1 λ(Uk)tr(ABk) > 0, λ ∈
{λmin, λmax}, suy ra min{
∑r
k=1 λ(Uk)tr(ABk), λ ∈ {λmin, λmax}} > 0. Theo Bổ đề
2.9.6 ta có λmin(
∑r
k=1 tr(ABk)Uk) ≥ minB > 0. Vậy T (A) > 0 (đpcm).
Nhận xét 2.9.8. Điều kiện trên chỉ là một điều kiện đủ để T bảo toàn chỉ số (n, 0, 0).
Thực vậy, xét n = r = 2, U1 =
(
1 0
0 2
)
, U2 =
(
6 2
2 3
)
. Khi đó các giá trị riêng
của ma trận U−11 U2 là λ1 =
15 +
√
113
4
, λ2 =
15−√113
4
. Rõ ràng với
B1 =
(
−1.05 0
0 −1.05
)
, B2 =
(
1 0
0 1
)
thì B1 + λ1B2, B1 + λ2B2 là các ma trận nửa xác định dương khác 0. Theo Định
lý 2.8.8 thì toán tử tuyến tính T xác định bởi
T (A) = tr(AB1)U1 + tr(AB2)U2, ∀A ∈ S2(R)
bảo toàn chỉ số (2, 0, 0). Bằng tính toán cụ thể ta có ngay λmax(U1)B1+λmin(U2)B2 =
2[B1 +B2] =
(
−0.1 0
0 −0.1
)
không phải là ma trận nửa xác định dương.
36
Chương 3
TRUNG BÌNH NHÂN CỦA CÁC MA
TRẬN
Trong chương này, chúng tôi giới thiệu khái niệm trung bình của các ma trận xác định
dương như là một sự mở rộng khái niệm trung bình nhân của các số nguyên dương. Trên cơ sở
đó, chúng tôi trình bày một số loại trung bình ma trận, đặc biệt là trung bình nhân của hai
ma trận xác định dương, các tính chất và một số biểu diễn của nó. Chúng tôi cũng trình bày
hướng mở rộng khái niệm trung bình nhân của nhiều ma trận xác định dương dựa vào quy
nạp được T. Ando, Chi-Kwong Li, Roy Mathias đưa ra trong [3]. Cuối cùng, chúng tôi tóm
lược cách tiếp cận mới nhất trong lĩnh vực này được M. Moakher và Rajendra Bhatia, John
Holbrook đưa ra trong [17], [5].
3.1 Trung bình của hai ma trận xác định dương và
một số tính chất
Giả sử a, b là hai số nguyên dương. Ta đã biết trung bình số học, trung bình
nhân, trung bình điều hòa của a, b lần lượt là các đại lượng
A(a, b) =
a+ b
2
;
G(a, b) =
√
ab;
H(a, b) =
(
a−1 + b−1
2
)−1
.
Một cách tổng quát, hàm số M : R∗+×R∗+ → R∗+ có thể xem là hàm trung bình
nếu các tính chất sau đây được thỏa mãn với mọi số dương a, b :
1. M(a, b) > 0.
37
2. Nếu a ≤ b thì a ≤ M(a, b) ≤ b.
3. M(a, b) = M(b, a).
4. M(a, b) đơn điệu tăng theo a, b.
5. M(αa, αb) = αM(a, b), ∀α > 0.
6. M(a, b) liên tục.
Giữa trung bình cộng, trung bình nhân và trung bình điều hòa ta có bất đẳng
thức quen thuộc sau
H(a, b) ≤ G(a, b) ≤ A(a, b). (3.1.1)
Bây giờ ta sẽ mở rộng khái niệm trung bình của các số nguyên dương cho trường
hợp các ma trận xác định dương. Rõ ràng một hàm ma trận được coi là trung bình
nếu nó thỏa mãn một số tính chất nhất định tương tự như hàm trung bình của
các số nguyên dương. Tính chất 5 được viết dưới dạng tương đương là
M(xax, xbx) = xM(a, b)x ∀x ∈ C, x 6= 0.
Một cách tự nhiên, hàm ma trận M : Pn × Pn → Pn được xem là hàm trung
bình nếu các tính chất sau đây được thỏa mãn với mọi ma trận xác định dương
A,B :
1. M(A,B) > 0.
2. Nếu A ≤ B thì A ≤ M(A,B) ≤ B.
3. M(A,B) = M(B,A).
4. M(A,B) đơn điệu tăng theo A,B.
5. M(X∗AX,X∗BX) = X∗M(A,B)X với mọi ma trận X khả nghịch.
6. M(A,B) liên tục.
Ví dụ 3.1.1. Có thể mở rộng khái niệm trung bình số học và trung bình điều hòa
của hai số nguyên dương sang cho trường hợp ma trận xác định dương một cách
hợp lý
A(A,B) =
A+B
2
;
H(A,B) =
(
A−1 +B−1
2
)−1
.
38
Tuy vậy, đối với trong trường hợp trung bình nhân thì không đơn giản. Định nghĩa
G(A,B) = A
1
2B
1
2 sẽ không hợp lý vì ma trận này không phải luôn là ma trận đối
xứng. Định nghĩa G(A,B) =
A
1
2B
1
2 +B
1
2A
1
2
2
cũng không hợp lý vì tính chất 1
không phải lúc nào cũng xảy ra (xem Nhận xét 1.3.1). Đối với hai ma trận đường
chéo A > 0, B > 0 thì có thể định nghĩa G(A,B) = A
1
2B
1
2 . Với mỗi X ∈ GLn(C),
đặt TX(A) = X∗AX, ∀A ∈ Matn(C). Toán tử TX xác định như trên được gọi là
phép tương đẳng. Dễ thấy {TX |X ∈ GLn(C)} là một nhóm với phép hợp thành
bảo toàn tập các ma trận xác định dương. Ta cũng dùng ký hiệu TX(A,B) để chỉ
(TX(A), TX(B)).
Giả sử A > 0, B > 0, khi đó
T
A−
1
2
(A,B) = (I, A−
1
2BA−
1
2 ).
Lấy ma trận Unita U sao cho U∗A−
1
2BA−
1
2U = D, với D là ma trận đường chéo,
ta có
T
A−
1
2U
(A,B) = (I,D).
Theo nhận xét ban đầu của ta, đối với các ma trận đường chéo I,D thì
G(I,D) = D
1
2 = U∗(A−
1
2BA−
1
2 )
1
2U. (3.1.2)
Mặc khác, hàm trung bình nhân phải thỏa mãn tính chất 5, do vậy từ đẳng thức
(3.1.2) ta hoàn toàn xác định được trung bình nhân của hai ma trận A,B.
Định nghĩa 3.1.1. Trung bình nhân của hai ma trận A,B, ký hiệu A]B (hoặc
G(A,B)) được xác định bởi
A]B = A
1
2 (A−
1
2BA−
1
2 )
1
2A
1
2 . (3.1.3)
Nhận xét 3.1.2. A]B là nghiệm xác định dương duy nhất của phương trình Riccati
XA−1X = B. (3.1.4)
Từ định nghĩa, ta suy ra ngay một số tính chất của trung bình nhân hai ma
trận.
Mệnh đề 3.1.3. [4] Nếu A,B là các ma trận xác định dương thì
(A]B)−1 = A−1]B−1
Mệnh đề 3.1.4. [4] Nếu A,B là các ma trận xác định dương thì
A]B = B]A
39
Chứng minh. Nếu X0 là nghiệm xác định dương của phương trình 3.1.4 thì X0
cũng là nghiệm xác định dương của phương trình ma trận XB−1X = A.
Mệnh đề 3.1.5. [4] Nếu A,B là các ma trận xác định dương thì(
A A]B
A]B B
)
≥ 0. (3.1.5)
Chứng minh. Ta có A = (A]B)B−1(A]B). Theo Mệnh đề 1.5.6 ta có ngay bất
đẳng thức cần chứng minh.
Mệnh đề 3.1.6. [4] Nếu A,B là các ma trận xác định dương thì
H(A,B) ≤ A]B ≤ A(A,B). (3.1.6)
Chứng minh. Ta có
(A−
1
2BA−
1
2 − I)2 ≥ 0 ⇒ 4A−12BA−12 ≤ (A−12BA−12 + I)2
⇒ (A−12BA−12 )12 ≤ I + A
−12BA−
1
2
2
⇒ (A−12BA−12 )12 ≤ A−12
(
A+B
2
)
A−
1
2
⇒ A]B ≤ A(A,B).
Áp dụng bất đẳng thức vừa chứng minh cho hai ma trận A−1, B−1 và Mệnh đề
3.1.3 ta có H(A,B) ≤ A]B.
Như vậy, khái niệm trung bình nhân hai ma trận ma ta vừa xây dựng thỏa mãn
6 yêu cầu đặt ra ban đầu đối với một hàm trung bình. Hơn thế nữa, bất đẳng thức
giữa trung bình cộng, trung bình nhân và trung bình điều hòa cũng được thỏa
mãn.
3.2 Một số biểu diễn của trung bình nhân hai ma
trận
Mệnh đề 3.2.1. [4] Nếu A,B là các ma trận xác định dương thì
A]B = max
{
X ∈ Hn :
(
A X
X B
)
≥ 0
}
. (3.2.1)
40
Chứng minh. Ta có(
A X
X B
)
≥ 0 ⇒ A ≥ XB−1X
⇒ B−12AB−12 ≥ B−12XB−1XB−12
⇒ B−12AB−12 ≥ (B−12XB−12 )2
⇒ (B−12AB−12 )12 ≥ B−12XB−12 .
Tác động T
B
1
2
vào hai vế ở đẳng thức cuối ta có đpcm.
Nếu đặt U = (A−
1
2BA−
1
2 )
1
2A
1
2B−
1
2 thì ta có U là ma trận Unita và A]B =
A
1
2UB
1
2 . Hơn nữa ta có kết quả sau
Mệnh đề 3.2.2. [4] Nếu A,B > 0 và U là ma trận unita sao cho A
1
2UB
1
2 > 0 thì
A]B = A
1
2UB
1
2 .
Chứng minh. Đặt G = A
1
2UB
1
2 , ta có(
A G
G B
)
=
(
A
1
2 O
O B
1
2
)(
I U
U∗ I
)(
A
1
2 O
O B
1
2
)
∼
(
I U
U∗ I
)
∼
(
O O
O I
)
.
Mặc khác ta có (
A G
G B
)
∼
(
A−GB−1G O
O B
)
.
Vậy A − GB−1G = 0, hay G là nghiệm của phương trình Riccati A = XB−1X.
Do đó G = A]B.
Mệnh đề 3.2.3. [4] A]B = A(A−1B)
1
2 = (AB−1)
1
2B.
Chứng minh. Ta có A−
1
2BA−
1
2 = A
1
2A−1BA−
1
2 = [A
1
2 (A−1B)
1
2A−
1
2 ]2. Lấy căn
bậc hai hai vế ta được (A−
1
2BA−
1
2 )
1
2 = A
1
2 (A−1B)
1
2A−
1
2 . Vậy A]B = A(A−1B)
1
2 .
Chứng minh hoàn toàn tương tự ta được A]B = (AB−1)
1
2B.
Mệnh đề 3.2.4. [4] A]B = (A+B)[(A+B)−1A(A+B)−1B]
1
2 .
41
Chứng minh. Áp dụng đồng nhất thức X = (X−1 + I)−1(I +X) đối với ma trận
A−1B ta được
A−1B = (B−1A+ I)−1(I + A−1B) = (A+B)−1(AB−1)−1(A+B).
Lấy căn bậc hai hai vế ta được
(A−1B)
1
2 = (A+B)−1(AB−1)−
1
2 (A+B).
Biến đổi ta được
A(A−1B)
1
2 (A+B)−1(AB−1)
1
2B = A(A+B)−1B.
Theo Mệnh đề 3.2.3, đẳng thức vừa thu được có thể viết lại dưới dạng
A]B(A+B)−1A]B = A(A+B)−1B.
Nhân hai vế đẳng thức trên với (A+B)−1 và lấy căn bậc hai hai vế ta có đpcm.
Trong trường hợp n = 2, ta có công thức biểu diễn trung bình nhân khá đẹp
mắt.
Mệnh đề 3.2.5. [4] Giả sử A,B ∈ P2,det(A) = det(B) = 1, khi đó ta có
A]B =
A+B√
det(A+B)
. (3.2.2)
Chứng minh. Đặt X = (A−1B)
1
2 ta có ngay det(X) = 1. Gọi λ,
1
λ
là các giá trị
riêng của X (λ > 0). Ta có
det(A+B) = det(A(I +X2) = det(I +X2) = (λ+
1
λ
)2.
Do vậy tr(X) = λ +
1
λ
=
√
det(A+B). Theo định lý Caley - Hamilton, X là
nghiệm của phương trình
X2 −
√
det(A+B)X + I.
Do vậy ta có
A−1B −
√
det(A+B)(A−1B)
1
2 + I.
Nhân hai vế đẳng thức trên cho A và rút gọn ta có đpcm.
Hệ quả 3.2.6. [4] Giả sử A,B ∈ P2,det(A) = α2,det(B) = β2, α, β > 0, khi đó
ta có
A]B =
√
αβ√
det(α−1A+ β−1B)
(α−1A+ β−1B). (3.2.3)
42
3.3 Mở rộng khái niệm trung bình nhân bằng phương
pháp quy nạp
Ở mục trước, chúng ta đã định nghĩa trung bình hình học của hai ma trận xác
định dương A,B là ma trận
A]B = A
1
2 (A−
1
2BA−
1
2 )
1
2A
1
2 .
Trong mục này, chúng ta trình bày phương pháp xây dựng khái niệm trung bình
hình học tổng quát của T. Ando, Chi-Kwong Li và Roy Mathias.
Ý tưởng chủ yếu của phương pháp này xuất phát từ một kết quả đơn giản trong
giải tích. Xét ba dãy số xn, yn, zn được xác định bằng truy hồi x0 = a, y0 = b, z0 = c,
xn+1 =
xn + yn
2
, yn+1 =
xn + zn
2
, zn+1 =
yn + zn
2
, n ∈ N. Khi đó ta có
lim
n→∞ xn = limn→∞ yn = limn→∞ zn =
a+ b+ c
3
.
Chúng ta lưu ý rằng
a+ b+ c
3
chính là trung bình cộng của a, b, c.
Về mặt hình học, nếu ta xem ba vector a, b, c biểu diễn ba đỉnh của tam giác
A0B0C0 thì các vector x1, y1, z1 sẽ biểu diễn ba trung điểm A1, B1, C1 của tam giác
A0B0C0. Ta dễ dàng nhận thấy tam giác AiBiCi dần về trọng tâm của tam giác
A0B0C0 khi n dần ra vô cùng.
Một cách tổng quát, giả sử M là hàm trung bình hai biến và a, b, c là ba số thực
dương bất kỳ cho trước, ta xây dựng bằng truy hồi các dãy số xn, yn, zn như sau:
x0 = a, y0 = b, z0 = c, xn+1 = M(xn, yn), yn+1 = M(xn, zn), zn+1 = M(yn, zn), n ∈
N. Khi đó ta có
lim
n→∞ xn = limn→∞ yn = limn→∞ zn.
Một cách tự nhiên, ta coi giới hạn này chính là M(a, b, c). Dựa trên ý tưởng này
ta đưa ra khái niệm trung bình nhân của các ma trận xác định dương trong trường
hợp tổng quát bằng quy nạp.
Trước hết, ta cần có một số kiến thức chuẩn bị. Ký hiệu ρ(X) là bán kính phổ
của X. Với hai ma trận xác định dương A,B ta có
ρ(A−1B) = ρ(A
−1
2 BA
−1
2 ) = ρ(B
1
2A−1B
1
2 ) = min{α ∈ R : B ≤ αA}. (3.3.1)
Đặt
R(A,B) = max{ρ(A−1B), ρ(B−1A)} (3.3.2)
ta có
43
Định lý 3.3.1. Hàm R : Pn × Pn → R+ thỏa mãn các tính chất sau đây:
R(A,B) ≥ 1, R(A,B) = 1 ⇔ A = B; (3.3.3)
R(A,C) ≤ R(A,B)R(B,C) ∀ A,B,C > 0; (3.3.4)
R(A,B)−1A ≤ B ≤ R(A,B)A; (3.3.5)
‖A−B‖ ≤ (R(A,B)− 1) ‖A‖ ; (3.3.6)
R(G(A1, A2), G(B1, B2)) ≤ [R(A1, B1)R(A2, B2)]12 . (3.3.7)
Chứng minh. Các tính chất từ (3.3.3) - (3.3.6) có thể dễ dàng suy ra từ lý thuyết
về ma trận xác định dương trình bày trong chương 1. Để chứng minh (3.3.7), ta
chú ý rằng
Bi ≤ ρ(A−1i Bi)Ai, i = 1, 2.
Sử dụng tính đơn điệu của trung bình nhân ta có
G(B1, B2) ≤
√
ρ(A−11 B1)ρ(A
−1
2 B2)G(A1, A2).
Từ (3.3.1) ta có
ρ(G(A1, A2)
−1G(B1, B2)) ≤ [R(A1, B1)R(A2, B2)]12 .
Hoàn toàn tương tự ta có
ρ(G(B1, B2)
−1G(A1, A2)) ≤ [R(A1, B1)R(A2, B2)]12 .
Vậy (3.3.7) đúng.
Bây giờ, ta bắt đầu xây dựng khái niệm trung bình nhân tổng quát cho n ma
trận. Trước hết, xét trường hợp n = 3. Trong [3], hàm G : P3n → Pn được coi là
trung bình nhân nếu nó thỏa mãn các tính chất sau
1. G(A,B,C) = (ABC)
1
3 khi A,B,C giao hoán.
2. G(αA, βB, γC) = (αβγ)
1
3G(A,B,C) với mọi α, β, γ > 0.
3. Với mọi hoán vị pi của (A,B,C) ta có G(A,B,C) = G(pi(A,B,C)).
4. G đơn điệu tăng.
5. G liên tục.
6. Với mọi ma trận khả nghịch S ta cóG(S∗AS, S∗BS, S∗CS) = S∗G(A,B,C)S.
44
7. Với mọi λ ∈ (0, 1) ta cóG(λA1+(1−λ)A2, λB1+(1−λ)B2, λC1+(1−λ)C2) ≥
λG(A1, B1, C1) + (1− λ)G(A2, B2, C2).
8. G(A,B,C) = G(A−1, B−1, C−1)−1.
9. detG(A,B,C) = (detA.detB.detC)
1
3 .
Rõ ràng trong trường hợp n = 2, định nghĩa G(A,B) = A]B thỏa 9 tính chất trên.
Giả sử ta đã định nghĩa được trung bình nhân G(X1, · · · , Xk) của k ma trận xác
định dương X1, · · · , Xk bất kỳ. Với k + 1 ma trận xác định dương A1, · · · , Ak+1,
xét A = (A1, · · · , Ak+1) và đặt
Tk+1(A) = (G((Ai)i6=1), G((Ai)i6=2), · · · , G((Ai)i 6=k+1)).
Định nghĩa 3.3.1. 1. Khi k = 2 ta định nghĩa G(A1, A2) = A1]A2.
2. Giả sử ta đã định nghĩa trung bình nhân G(X1, · · · , Xk) của k ma trận
xác định dương X1, · · · , Xk bất kỳ. Khi đó, dãy {T rk+1(A)}∞r=1 hội tụ về
(A˜, · · · , A˜). Ta định nghĩa G(A1, · · · , Ak+1) = A˜.
Dưới đây ta sẽ chỉ ra định nghĩa ở trên là hoàn toàn hợp lý.
Định lý 3.3.2. [3] Giả sử A1, · · · , Ak+1 là các ma trận xác định dương. Đặt
A(r+1) = Tk+1(A(r)), khi đó dãy {A(r)1 , · · · , A(r)k+1}∞r=1 hội tụ về (A˜, · · · , A˜) và khái
niệm trung bình hình học định nghĩa ở trên thỏa mãn 9 tính chất đã nêu ban đầu,
hơn nữa ta có
R(G(A1, · · · , Ak), G(B1, · · · , Bk)) ≤ [
k∏
i=1
R(Ai, Bi)]
1
k , k = 2, 3, . . . (3.3.8)
Chứng minh. Ta chứng minh bằng quy nạp. Với k = 2 định lý đúng do các tính
chất của A]B. Giả sử ta đã xây dựng được khái niệm trung bình nhân cho k ma
trận và định lý đúng đến k. Ta chứng minh định lý đúng với k + 1.
Đặt S = {(1, 2), (2, 3), · · · , (k, k + 1), (k + 1, 1)}, lúc đó với mọi (p, q) ∈ S, theo
giả thiết quy nạp, với mọi r ≥ 1 ta có
R(A(r+1)p , A
(r+1)
q ) ≤ R(A(r)p , A(r)q )
1
k .
Đặt Rr =
∏
(p,q)∈S R(A
(r)
p , A
(r)
q ) từ bất đẳng thức trên ta có
1 ≤ Rr+1 ≤ (Rr) 1k . (3.3.9)
45
Lấy i 6= j (không mất tính tổng quát ta giả sử j < i), áp dụng bất đẳng thức tam
giác nhiều lần ta có
R(A(r)j , A
(r)
i ) ≤
i−1∏
k=j
R(A(r)k , A
(r)
k+1) ≤ Rr (3.3.10)
Sử dụng các bất đẳng thức (3.3.9) và (3.3.10) ta được
R(A(r+1)i , A
(r)
i ) = R(G((A
(r)
j )j 6=i), A
(r)
i )
= R(G((A(r)j )j 6=i), G(A
(r)
i , · · · , A(r)i ))
≤
∏
j 6=i
R(A(r)j , A
(r)
i )
1
k
≤
∏
j 6=i
R
1
k
r
= Rr ≤ R
1
k
r−1 ≤ · · · ≤ R
1
kr−1
1 .
Đặt R1 = 1 + α,M = max{‖Ai‖ : i = 1, · · · , k + 1} ta có∥∥∥A(r+1)i − A(r)i ∥∥∥ ≤ (R 1kr−11 − 1)M ≤ 1kr−1αM.
Do chuỗi
∑∞
r=1
1
kr−1
hội tụ nên dãy (A(r)i )r là dãy Cauchy. Không gian Matn(C)
đủ nên dãy trên hội tụ về A˜i. Từ bất đẳng thức (3.3.9) cho r dần ra vô cùng ta
được ∏
(p,q)∈S
R(A˜p, A˜q) = 1.
Từ đây ta có ngay A˜1 = A˜2 = · · · , A˜k+1. Tiếp theo, ta chứng minh (3.3.8). Giả
sử A1, · · · , Ak+1, B1, · · · , Bk+1 là các ma trận xác định dương. Với mọi r ≥ 1 và
j ∈ {1, · · · , k + 1}, theo giả thiết quy nạp ta có
R(A(r+1)j , B
(r+1)
j ) = R(G((A
(r)
i )i6=j), G((B
(r)
i )i6=j)) ≤ [
∏
i 6=j
R(A(r)i , B
(r)
i )]
1
k .
Do vậy
k+1∏
j=1
R(A(r+1)j , B
(r+1)
j ) ≤
k+1∏
j=1
[
∏
i6=j
R(A(r)i , B
(r)
i )]
1
k =
k+1∏
j=1
R(A(r)j , B
(r)
j ).
Sử dụng bất đẳng thức trên k lần, cuối cùng ta thu được:
k+1∏
j=1
R(A(r+1)j , B
(r+1)
j ) ≤
k+1∏
j=1
R(Aj, Bj).
46
Cho r dần ra vô cùng ta có
R(A˜, B˜)k+1 ≤
k+1∏
j=1
R(Aj, Bj).
Lấy căn bậc k + 1 cả hai vế ta có đpcm.
Cuối cùng, các tính chất 1 - 9 được suy từ các tính chất của giới hạn. Ta chứng
minh tính chất 3. Các tính chất còn lại là hiển nhiên. Ta vẫn giả sử kết quả đã đúng
đến k. Giả sử (i1, · · · , ik+1) là một hoán vị của (1, · · · , k + 1). Đặt Bj = Aij , j =
1, · · · , k + 1. Trước hết bằng quy nạp theo r ta chỉ ra với mọi j = 1, · · · , k + 1,
với mọi r ≥ 1 ta có B(r)j = A(r)ij . Với r = 1, kết quả hiển nhiên đúng theo cách đặt
Bj. Giả sử kết quả đúng đến r. Ta chứng minh nó đúng với r + 1. Ta có
B
(r+1)
j = G((B
(r)
l )l 6=j) = G((A
(r)
il )l 6=j) = G((A
(r)
m )m 6=ij) = A
(r+1)
ij
.
Từ đây ta có ngay
(B˜, B˜, · · · , B˜) = lim
r→∞(B
(r)
1 , · · · , B(r)k+1) = limr→∞(A
(r)
i1
, · · · , A(r)ik+1) = (A˜, A˜, · · · , A˜).
Do vậy
G(Ai1, · · · , Aik+1) = B˜ = A˜ = G(A1, · · · , Ak+1).
Tóm lại, ta đã mở rộng khái niệm trung bình nhân cho trường hợp tổng quát.
Tuy vậy, cách xây dựng bằng quy nạp khá phức tạp và không thuận lợi cho tính
toán. Ví dụ dưới đây cho ta thấy ngay điều đó.
Ví dụ 3.3.3. [3] Tính trung bình nhân của các ma trận A =
(
2 1
1 1
)
, B =(
1 1
1 2
)
, C = I2.
Đặt (A0, B0, C0) = (A,B,C) và
Ar+1 = Br]Cr, Br+1 = Cr]Ar, Cr+1 = Ar]Br, ∀r ≥ 0.
Bằng quy nạp ta sẽ chứng tỏ với mọi số tự nhiên r, tồn tại αr, βr ≥ 0 sao cho
Ar = αrA+ βrB + βrC,
Br = βrA+ αrB + βrC,
Cr = βrA+ βrB + αrC.
47
Với r = 0, kết quả trên hiển nhiên đúng, giả sử kết quả trên đúng với r ≥ 1, ta
chứng minh nó cũng đúng với r + 1. Gọi Θ là phép toán trên Mat2(C) xác định
bởi
Θ(X) =
(
x22 −x12
−x21 x11
)
, với X =
(
x11 x12
x21 x22
)
.
Rõ ràng Θ là ánh xạ tuyến tính, đồng thời nếu hai ma trận X, Y có định thức bằng
1 thì ta có det(X + Y ) = 2 + tr(Θ(X).Y ). Do det(Ar) = det(Br) = det(Cr) = 1
nên theo Mệnh đề 3.2.5 ta có
Ar+1 =
1√
2 + tr(Θ(Br).Cr)
(Br + Cr),
Br+1 =
1√
2 + tr(Θ(Cr).Ar)
(Cr + Ar),
Cr+1 =
1√
2 + tr(Θ(Ar).Br)
(Ar +Br).
Từ các đẳng thức
tr(Θ(A).A) = tr(Θ(B).B) = tr(Θ(C).C) = 2,
tr(Θ(A).B) = tr(Θ(A).C) = 3,
tr(Θ(B).C) = tr(Θ(B).A) = 3,
tr(Θ(C).A) = tr(Θ(C).B) = 3
và giả thiết quy nạp ta tính được
tr(Θ(Ar).Br) = tr(Θ(Br).Cr) = tr(Θ(Cr).Ar) = 3α
2
r + 10αrβr + 11β
2
r = γr.
Theo giả thiết quy nạp ta có
Ar+1 = Br]Cr =
Br + Cr√
2 + tr(Θ(Br).Cr)
=
(2βr)A+ (αr + βr)B + (αr + βr)C√
2 + γr
,
Br+1 = Ar]Cr =
Ar + Cr√
2 + tr(Θ(Ar).Cr)
=
(αr + βr)A+ (2βr)B + (αr + βr)C√
2 + γr
,
Ar+1 = Br]Cr =
Ar +Br√
2 + tr(Θ(Ar).Br)
=
(αr + βr)A+ (αr + βr)B + (2βr)C√
2 + γr
.
Vậy kết quả đúng với r + 1. Do các ma trận A,B,C độc lập tuyến tính và
G(A,B,C) = lim
r→∞Ar = limr→∞Br = limr→∞Cr
48
ta có ngay
lim
r→∞αr = limr→∞ βr = α.
Vậy
G(A,B,C) = α(A+B + C).
Do det(G(A,B,C)) = 1 nên ta tính được ngay α =
1√
12
. Tóm lại
G(A,B,C) =
1√
3
(
2 1
1 2
)
.
Cũng bằng phương pháp tương tự trên, trong [18] De’nes Petz đưa ra cách xây
dựng trung bình nhân ma trận khá sơ cấp cho trường hợp n = 3. Trong trường
hợp 0 < A ≤ B ≤ C và M2 là hàm trung bình hai biến tổng quát, Petz chỉ ra rằng
các dãy (An)n, (Bn)n, (Cn)n xác định bởi A1 = A,B1 = B,C1 = C và
An+1 = M2(An, Bn), Bn+1 = M2(An, Cn), Cn+1 = M2(Bn, Cn)
sẽ có giới hạn chung
M3(A,B,C) = lim
n
An = lim
n
Bn = lim
n
Cn.
Trong trường hợp A,B,C là các ma trận xác định dương, bằng cách sử dụng
kết quả trên cho các ma trận A ≤ αB ≤ γC, có thể dễ dàng chỉ ra các dãy
truy hồi (An)n, (Bn)n, (Cn)n xác định bởi A1 = A,B1 = B,C1 = C, An+1 =
An]Bn, Bn+1 = An]Cn, Cn+1 = Bn]Cn tồn tại giới hạn chung.
3.4 Mở rộng khái niệm trung bình nhân dựa vào
hình học Riemann
Có một cách tiếp cận khác đối với các hàm trung bình. Ký hiệu x0 = argminf
để chỉ x0 là điểm duy nhất mà tại đó hàm f đạt giá trị nhỏ nhất, khi đó ta có
A(x1, · · · , xn) = argmin
x>0
n∑
i=1
de(x, xk)
2,
ở đây de(x, y) = |x− y| là khoảng cách Euclid trên R. Tương tự ta có
G(x1, · · · , xn) = argmin
x>0
n∑
i=1
dh(x, xk)
2,
49
ở đây dh(x, y) = | log x− log y| là khoảng cách Hyperbolic trên R. Một cách tổng
quát, trung bình M(x1, · · · , xn) của các số dương x1, · · · , xn được xác định bởi
M(x1, · · · , xn) = argmin
x>0
n∑
i=1
d(x, xk)
2,
trong đó d là một metric trên R.
Bây giờ ta sẽ tìm cách mở rộng hướng tiếp cận trên cho trường hợp các ma trận
xác định dương. Muốn vậy, ta cần xác định metric trên Pn tương ứng với trung
bình nhân. Như sẽ thấy dưới đây, tập Pn khi được trang bị một metric sẽ là một
đa tạp Riemann.
Ta đã biết Matn(C) là không gian Hilbert với tích vô hướng Euclid (còn gọi là
tích vô hướng Frobenius) 〈A,B〉 = trA∗B và chuẩn tương ứng ‖A‖F = (tr(A∗.A))
1
2 .
Ta cũng biết Hn là không gian con của Matn(C) và Pn là tập mở của Hn, do đó Pn
là một đa tạp khả vi. Cũng vì Pn là tập mở của Hn nên với mỗi A ∈ Pn, ta đồng
nhất không gian tiếp xúc TA của Pn tại A với Hn. Tích vô hướng trên Hn cảm sinh
một metric Riemann trên đa tạp Pn. Trên không gian tiếp xúc tại A ∈ Pn, tích vô
hướng và chuẩn tương ứng được xác định bởi
〈H,K〉A = tr(A−1HA−1K); ‖H‖A = 〈H,H〉
1
2
A =
∥∥∥A−12HA−12∥∥∥
F
. (3.4.1)
Nếu γ : [a, b] −→ Pn là đường khả vi thì độ dài của γ được xác định bởi
L(γ) =
∫ b
a
∥∥γ′(t)∥∥
γ(t)
dt =
∫ b
a
∥∥∥γ−12 (t)γ′(t)γ−12 (t)∥∥∥
F
dt. (3.4.2)
Dễ dàng chứng minh được L(TX ◦ γ) = L(γ) với mọi X ∈ GLn(C) và với mọi
đường khả vi γ. Với hai điểm A,B ∈ Pn, đặt
δ2(A,B) = inf {L(γ) : γ là đường khả vi nối A và B}. (3.4.3)
Khi đó δ2 cũng là một metric trên Pn và dưới đây ta sẽ chỉ ra rằng có duy nhất
một đường khả vi γ0 nối A và B để δ2(A,B) = L(γ0). Đường γ0 như thế được gọi
là đường trắc địa nối A và B. Ta dùng ký hiệu [A,B] để chỉ đường trắc địa nối hai
điểm A,B ∈ Pn. Đồng thời, với hai điểm H,K ∈ Hn, ký hiệu [H,K] được dùng
để chỉ đoạn thẳng
H(t) = (1− t)H + tK, 0 ≤ t ≤ 1
nối hai điểm H,K trên Hn.
Để chứng tỏ sự tồn tại của các đường trắc địa nêu trên, cần một số kiến thức
về các hàm ma trận eX , logX mà ta không có điều kiện trình bày ở đây. Người
50
ta chứng minh được rằng với công thức tính đạo hàm của hàm lũy thừa tại điểm
H ∈ Hn cho bởi
DeH(K) = lim
t→0
eH+tK − eH
t
thì ∥∥∥e−H2 DeH(K)e−H2 ∥∥∥
F
≥ ‖K‖F , ∀ H,K ∈ Hn. (3.4.4)
Từ bất đẳng thức trên và công thức (3.4.2) ta có ngay nếu H(t), a ≤ t ≤ b là một
đường khả vi bất kỳ trên Hn và γ(t) = eH(t) thì
L(γ) ≥
∫ b
a
∥∥H ′(t)∥∥
F
dt. (3.4.5)
Giả sử γ(t) là một đường khả vi bất kỳ nối A,B ∈ Pn, khi đó H(t) = log γ(t) là
đường khả vi nối logA và logB trên Hn. Độ dài đường khả vi này không nhỏ hơn
độ dài đoạn thẳng nối logA và logB. Do vậy, từ bất đẳng thức (3.4.5) ta có
Định lý 3.4.1. [5] Với hai điểm A,B ∈ Pn ta có
δ2(A,B) ≥ ‖logA− logB‖F . (3.4.6)
Bây giờ ta sẽ chứng minh sự tồn tại của các đường trắc địa, trước hết cho trường
hợp hai ma trận giao hoán.
Mệnh đề 3.4.2. [5] Giả sử A,B ∈ Pn là các ma trận giao hoán. Khi đó ánh xạ
lũy thừa biến đoạn thẳng [logA, logB] trong Hn thành đường trắc địa [A,B] trong
Pn. Trong trường hợp này ta có
δ2(A,B) = ‖logA− logB‖F .
Chứng minh. Ta sẽ chứng tỏ rằng đường
γ(t) = exp((1− t) logA+ t logB), 0 ≤ t ≤ 1,
là đường duy nhất có độ dài ngắn nhất nối A,B trong không gian (Pn, δ2). Do
A,B giao hoán nên γ(t) = A1−tBt và γ′(t) = (logA− logB)γ(t). Theo công thức
(3.4.2) ta có
L(γ) =
∫ b
a
‖logA− logB‖F dt = ‖logA− logB‖F .
Từ Định lý 3.4.1 ta thấy γ chính là đường ngắn nhất nối A và B. Giả sử γ˜ là
một đường nối A và B sao cho L(γ˜) = L(γ). Khi đó H˜(t) = log γ˜(t) là đường nối
logA và logB trong Hn. Từ bất đẳng thức (3.4.5) ta có độ dài của H˜(t) bằng
51
‖logA− logB‖F . Thế nhưng ta đã biết trong không gian Euclid thì đoạn thẳng
chính là đường duy nhất có độ dài nhỏ nhất nối hai điểm cho trước. Do đó H˜ là
tham số của đoạn thẳng [logA, logB]. Vậy γ˜ là một tham số khác của γ.
Mệnh đề 3.4.3. [5] Giả sử A,B là các ma trận bất kỳ thuộc Pn. Tồn tại duy nhất
đường trắc địa [A,B] nối A và B có tham số
γ(t) = A
1
2 (A−
1
2BA−
1
2 )tA
1
2 , 0 ≤ t ≤ 1, (3.4.7)
đồng thời
δ2(A, γ(t)) = tδ2(A,B). (3.4.8)
Hơn thế nữa, chúng ta có
δ2(A,B) =
∥∥∥logA−12BA−12∥∥∥
F
. (3.4.9)
Chứng minh. Các ma trận I và A−
1
2BA−
1
2 giao hoán. Áp dụng Mệnh đề 3.4.2,
đường tham số
γ0(t) = (A
−12BA−
1
2 )t
chính là đường trắc địa nối I và A−
1
2BA−
1
2 . Đồng thời ta có
δ2(I, γ0(t)) = tδ2(I, A
−12BA−
1
2 ).
Do vậy
γ(t) = T
A
1
2
(γ0(t)) = A
1
2 (A−
1
2BA−
1
2 )tA
1
2
là đường trắc địa nối T
A
1
2
(I) = A với T
A
1
2
(A−
1
2BA−
1
2 ) = B, đồng thời
δ2(A, γ(t)) = tδ2(A,B).
Cũng theo Mệnh đề 3.4.2 ta có
δ2(A,B) = δ2(I, A
−12BA−
1
2 )
=
∥∥∥log I − log(A−12BA− 12 )∥∥∥
F
=
∥∥∥logA−12BA−12∥∥∥
F
.
Tóm lại, ta đã chỉ ra được sự tồn tại của các đường trắc địa, đồng thời, công
thức (3.4.9) cho ta một biểu diễn tường minh metric δ2 được định nghĩa ở (3.4.3).
Từ định nghĩa chuẩn ‖.‖F và tính chất của hàm log người ta chỉ ra được
δ2(A,B) = (
n∑
i=1
log2 λi(A
−1B))
1
2 , (3.4.10)
ở đây λi, i = 1, · · · , n là các giá trị riêng của ma trận A−1B.
52
Nhận xét 3.4.4. Giả sử A,B ∈ Pn và ma trận đơn vị I nằm trên đường trắc
địa [A,B]. Khi đó, theo Mệnh đề 3.4.3 ta có I = A
1
2 (A−
1
2BA−
1
2 )ξA
1
2 , ở đây
ξ = δ2(A, I)/δ2(A,B). Từ đó ta có B = A
− (1−ξ)ξ . Do vậy A,B là các ma trận giao
hoán và
logB = −1− ξ
ξ
logA,
trong đó ξ = δ2(A, I)/δ2(A,B).
Nhận xét 3.4.5. Từ các công thức (3.4.8) và (3.4.9) ta thấy trung bình nhân A]B
của hai ma trận A,B chính là trung điểm của đường trắc địa γ nối A và B trong
không gian (Pn, δ2).
Tiếp theo ta sẽ khảo sát một số tính chất của không gian (Pn, δ2) cần thiết cho
việc xây dựng khái niệm trung bình nhân.
Mệnh đề 3.4.6. [5] Không gian metric (Pn, δ2) là không gian đủ.
Chứng minh. Xét (Am)m là một dãy Cauchy bất kỳ trong (Pn, δ2) và đặt Hm =
logAm,m ∈ N. Từ Định lý 3.4.1 ta có (Hm)m là dãy Cauchy trong (Hn, ‖.‖F ), do
vậy (Hm)m hội tụ về H ∈ Hn. Khi đó, với metric tương ứng với chuẩn ‖.‖F ta có
dãy e−HmeH hội tụ về I. Do vậy các giá trị riêng λi(e−HmeH), i = 1, · · · , n hội tụ
về 1. Từ đẳng thức (3.4.10) ta có δ2(eHm, eH) dần về 0 khi m dần ra vô cùng. Nói
cách khác dãy (Am)m hội tụ về A = eH trong không gian (Pn, δ2). Vậy (Pn, δ2) là
không gian đủ.
Trong không gian (Pn, δ2), quy tắc hình bình hành có dạng sau
Định lý 3.4.7. [5] Giả sử A,B ∈ Pn và M = A]B là trung điểm của đường trắc
địa [A,B]. Khi đó với mọi C ∈ Pn ta có
δ22(M,C) ≤
δ22(A,C) + δ
2
2(B,C)
2
− δ
2
2(A,B)
4
. (3.4.11)
Chứng minh. Bằng cách tác động T
M−
1
2
vào hai vế của bất phương trình đã nêu,
không mất tính tổng quát ta có thể giả sử M = I. Theo Nhận xét 3.4.4 ta có các
ma trận A,B giao hoán, do đó
δ2(A,B) = ‖logA− logB‖F .
Các ma trận I, C giao hoán nên
δ2(I, C) = ‖log I − logC‖F .
53
Quy tắc hình bình hành trên không gian Hilbert (Hn, ‖.‖F ) cho ta
‖log I − logC‖2F =
‖logA− logC‖2F + ‖logB − logC‖2F
2
− ‖logA− logB‖
2
F
4
.
Từ các đẳng thức trên và Định lý 3.4.1 ta có đpcm.
Nhận xét 3.4.8. Xét A là một ma trận bất kỳ thuộc Pn và đặt f(X) = δ22(A,X).
Khi đó với mọi ma trận X1, X2 ∈ Pn, X1 6= X2, từ quy tắc hình bình hành ta có
f(X1]X2) <
1
2
[f(X1) + f(X2)].
Do f liên tục nên f là hàm lồi ngặt trên Pn.
Từ quy tắc hình bình hành, ta chứng tỏ được kết quả quan trọng sau
Định lý 3.4.9. [5] Giả sử A,B ∈ Pn, xét hàm f xác định bởi
f(X) = δ22(A,X) + δ
2
2(B,X), ∀X ∈ Pn. (3.4.12)
Khi đó X0 = A]B là điểm duy nhất mà tại đó hàm f đạt giá trị nhỏ nhất.
Chứng minh. Từ quy tắc hình bình hành, với mọi ma trận X ∈ Pn ta có
δ22(A]B,X) ≤
1
2
f(X)− 1
4
δ22(A,B) =
1
2
f(X)− 1
2
f(A]B).
Hay
f(A]B) ≤ f(X)− 2δ22(A]B,X).
Từ bất đẳng thức này ta có ngay đpcm.
Như vậy, trong trường hợp n = 2, metric δ2 của ta tương ứng với trung bình
nhân ma trận. Một cách tự nhiên, ta nghĩ đến việc định nghĩa trung bình nhân
của các ma trận A1, · · · , Am bởi
G(A1, · · · , Am) = argmin
m∑
i=1
δ22(Ai, X). (3.4.13)
Dưới đây ta sẽ chỉ ra định nghĩa như trên là hoàn toàn hợp lý.
Định lý 3.4.10. [5] Giả sử A1, A2, · · · , Am là các ma trận thuộc Pn và f là hàm
được xác định bởi
f(X) =
m∑
i=1
δ22(Ai, X), ∀X ∈ Pn. (3.4.14)
Khi đó tồn tại duy nhất điểm X0 ∈ Pn để hàm f đạt giá trị nhỏ nhất.
54
Chứng minh. Đặt a = inf f(X), khi đó tồn tại dãy (Xr)r ⊂ Pn sao cho f(Xr) →
a, r →∞. Với mọi i = 1, · · · ,m, với mọi r, s ∈ N, áp dụng quy tắc hình bình hành
ta có
δ22(Xr]Xs, Ai) ≤
δ22(Xr, Ai) + δ
2
2(Xs, Ai)
2
− δ
2
2(Xr, Xs)
4
.
Cộng vế theo vế m bất đẳng thức trên ta được
f(Xr]Xs) ≤ 1
2
(f(Xr) + f(Xs))− m
4
δ22(Xr, Xs).
Do vậy
m
4
δ22(Xr, Xs) ≤
1
2
(f(Xr) + f(Xs))− f(Xr]Xs)
≤ 1
2
(f(Xr) + f(Xs))− a.
Điều này chứng tỏ (Xr)r là dãy Cauchy trong không gian (Pn, δ2). Do đây là không
gian đủ nên tồn tại X0 ∈ Pn để Xr hội tụ về X0 khi r dần ra vô cùng. Vậy hàm f
đạt giá trị nhỏ nhất tại X0. Theo Nhận xét 3.4.8 ta có f là hàm lồi ngặt. Do vậy
f đạt giá trị nhỏ nhất duy nhất tại X0.
Tóm lại, ta đã xây dựng được trung bình nhân của các ma trận xác định dương
trong trường hợp tổng quát. Người ta còn chứng minh được rằng trung bình nhân
xác định như trên chính là nghiệm của phương trình ma trận
m∑
i=1
X−1 log(XA−1i ) = 0. (3.4.15)
Phương pháp xây dựng trung bình nhân nêu trên được đưa ra độc lập bởi M.
Moakher và Rajendra Bhatia, John Holbrook. Bài báo [17] của M. Moakher công
bố sớm hơn, song Rajendra Bhatia và John Holbrook là những người đầu tiên
chứng minh sự tồn tại duy nhất giá trị nhỏ nhất của hàm f trong Định lý 3.4.10.
Các kết quả trong [5] cũng phong phú hơn nhiều. Phương pháp xây dựng trung
bình nhân mới này tương đối đơn giản hơn so với phương pháp xây dựng bằng quy
nạp. Tuy vậy, với cách xây dựng này, người ta chưa chứng minh được tính đơn điệu
của trung bình nhân. Ngoài ra, việc xác định điều kiện để hai định nghĩa trung
bình nhân trên trùng nhau vẫn còn là một vấn đề mở.
55
KẾT LUẬN
Luận văn bao gồm 3 phần: mở đầu, nội dung và kết luận. Phần nội dung được
trình bày trong 3 chương: Chương 1, chương 2 và chương 3. Kết quả chính của
khóa luận nằm ở chương 2 và chương 3.
Trong chương 1, chúng tôi hệ thống hóa các kiến thức đã biết về ma trận xác
định dương. Các kiến thức này là cần thiết cho việc theo dõi các chương tiếp theo.
Trong chương 2, chúng tôi tổng quan một số kết quả đã có trong lĩnh vực bảo
toàn tuyến tính. Đi sâu tìm hiểu bài toán bảo toàn tính xác định dương, chúng
tôi đưa ra được một số điều kiện đủ để toán tử tuyến tính T bảo toàn tập các ma
trận xác định dương trong trường hợp rank(T ) = 3, rank(T ) = r.
Trong chương 3, chúng tôi tổng quan phương pháp xây dựng khái niệm trung
bình nhân ma trận tổng quát. Hai hướng tiếp cận chính đó là hướng quy nạp của
T. Ando, Chi-Kwong Li, Roy Mathias và hướng dựa vào hình học Riemann của
M. Moakher và Rajendra Bhatia, John Holbrook đã được chúng tôi trình bày khá
đầy đủ.
Chúng tôi đã cố gắng dẫn dắt, phân tích để người đọc có được cái nhìn tổng
thể, biết được các vấn đề nào đã được giải quyết, vấn đề nào vẫn còn đang là vấn
đề mở. Từ đó, giúp những ai quan tâm đến các vấn đề này có thể tiếp tục đi sâu
tìm hiểu.
Tác giả đã cố gắng để hoàn thành luận văn một cách tốt nhất có thể. Tuy
nhiên, do hạn chế của bản thân và thời gian có hạn, chắc chắn không thể tránh
khỏi nhiều thiếu sót. Tác giả rất mong nhận được sự nhận xét và góp ý chân thành
của quý thầy cô và bạn đọc để tác giả hoàn thiện hơn. Tác giả xin chân thành cám
ơn và tiếp thu.
56
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1] Huỳnh Đình Tuân, Trần Thị Nhã Trang (2009), Báo cáo tổng kết đề tài nghiên
cứu khoa học cấp trường: Bài toán bảo toàn tuyến tính chỉ số quán tính, T.09-
TN-37.
[2] Huỳnh Đình Tuân, Trần Thị Nhã Trang (2010), Báo cáo tổng kết đề tài nghiên
cứu khoa học cấp trường: Bài toán bảo toàn tuyến tính chỉ số quán tính, T.10-
TN-70.
Tiếng Anh
[3] T. Ando, Chi-Kwong Li, Roy Mathias (2004), Geometric Means, Linear Alge-
bra and its Applications Volume 385, Pages 305-334.
[4] Rajendra Bhatia (2007), Positive Definite Matrices, Princeton University
Press.
[5] Rajendra Bhatia, John Holbrook (2006), Riemannian geometry and matrix
geometric means, Linear Algebra Appl., 413(2-3), Pages 594-618.
[6] Manfredo P. do Carmo (1992), Riemannian Geometry, Birkha¨user Boston.
[7] Wang Fei (2003), Some problems on linear preservers, Derpartment of Math-
ematics National University of Singapore.
[8] C. R. Johnson, S. Pierce (1985), Linear maps on Hermitian matrices: The
stabilizer of an inertia class, Can. Math. Bull.28, 401-404.
[9] C. R. Johnson, S. Pierce (1986), Linear maps on Hermitian matrices: The
stabilizer of an inertia class II, Can. Math. Bull. 19, 21-31.
[10] Leslie Hogben (2007), Handbook of Linear Algebra, Taylor & Francis Group.
57
[11] R. A. Horn, C. R. Johnson (1991), Topics in Matrix Analysis, Cambridge
University Press.
[12] Chi-Kwong Li (1987), Linear operators preserving the numercial radius of ma-
trices, Proceedings of the American Mathematical Society, Volume 99, Number
4.
[13] Chi-Kwong Li, S. Pierce (2001), Linear preserver problems, Amer. Math.
Monthly, 108: 519-605.
[14] Chi-Kwong Li, Nam Kiu Tsing (1992), Linear Preserver Problems : A brief
Introduction and Some Special Techniques, Linear algebra and its applications
162-164: 217-235.
[15] Chi-Kwong Li, Hugo J.Woerdeman (1997), Special Classes of Positive and
Completely Positive Maps, Linear Algebra and its Applications Volume 255,
Issues 1-3, Pages 247-258.
[16] R. Loewy (1990), Linear maps which preserve a blanced nonsingular inertia
class, Linear Algebra Appl. 134: 165-179.
[17] M. Moakher (2005), A differential geometric approach to the geometric mean
of symmetric positive-definite matrices, SIAM J. Matrix Anal, Pages 735-747.
[18] Denes Petz (2005), Means of positive matrices: Geometry and a conjecture,
Annales Mathematicae et Informaticae 32, Pages 129-139.
[19] Stephen Pierce, Leiba Rodman (1988), Linear Preservers of the class of Her-
mitian matrices with balanced inertia, SIAM J. MATRIX ANAL. APPL. Vol.
9, No. 4.
[20] H. Schneider (1965), Positive Operators and an inertia theorem, Numer. Math.
7, 11-17.
58
Các file đính kèm theo tài liệu này:
- HuynhDinhTuan.pdf