Luận văn Dưới vi phân của hàm lồi và một số ứng dụng trong tối ưu

Tài liệu Luận văn Dưới vi phân của hàm lồi và một số ứng dụng trong tối ưu: 1Đại học thái nguyên Trường đại học sư phạm - - - - - - - - - - - - - - - - - Nông Thị Mai Dưới vi phân của hàm lồi và một số ứng dụng trong tối ưu Chuyên ngành: Giải tích Mã số:60.46.01 Luận văn thạc sĩ toán học Người hướng dẫn khoa học: GS -TSKH Lê Dũng Mưu Thái nguyên - Năm 2008 2Mục lục Trang Trang phụ bìa 1 Mục lục 2 Danh mục các ký hiệu, các chữ viết tắt 3 Lời nói đầu 4 Chương1. Các kiến thức cơ bản về tập lồi và hàm lồi 5 1.1. Tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2. Hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2.1. Hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2.2. Tính liên tục của hàm lồi . . . . . . . . . . . . . . . . . 15 1.2.3. Các phép toán bảo toàn tính lồi . . . . . . . . . . . . . 15 1.2.4. Bất đẳng thức lồi . . . . . . . . . . . . . . . . . . . . . 16 1.2.5. Hàm liên hợp . . . . . . . . . . . . . . . . . . . . . . . 16 Chương2. Dưới vi phân của hàm lồi 18 2.1. ...

64 trang | Chia sẻ: hunglv | Lượt xem: 1082 | Lượt tải: 0

Bạn đang xem trước 20 trang mẫu tài liệu Luận văn Dưới vi phân của hàm lồi và một số ứng dụng trong tối ưu, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

1Đại học thái nguyên Trường đại học sư phạm - - - - - - - - - - - - - - - - - Nông Thị Mai Dưới vi phân của hàm lồi và một số ứng dụng trong tối ưu Chuyên ngành: Giải tích Mã số:60.46.01 Luận văn thạc sĩ toán học Người hướng dẫn khoa học: GS -TSKH Lê Dũng Mưu Thái nguyên - Năm 2008 2Mục lục Trang Trang phụ bìa 1 Mục lục 2 Danh mục các ký hiệu, các chữ viết tắt 3 Lời nói đầu 4 Chương1. Các kiến thức cơ bản về tập lồi và hàm lồi 5 1.1. Tập lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.2. Hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2.1. Hàm lồi . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2.2. Tính liên tục của hàm lồi . . . . . . . . . . . . . . . . . 15 1.2.3. Các phép toán bảo toàn tính lồi . . . . . . . . . . . . . 15 1.2.4. Bất đẳng thức lồi . . . . . . . . . . . . . . . . . . . . . 16 1.2.5. Hàm liên hợp . . . . . . . . . . . . . . . . . . . . . . . 16 Chương2. Dưới vi phân của hàm lồi 18 2.1. Đạo hàm theo phương . . . . . . . . . . . . . . . . . . . . . . 18 2.2. Dưới vi phân và các tính chất . . . . . . . . . . . . . . . . . . 22 2.2.1. Dưới vi phân . . . . . . . . . . . . . . . . . . . . . . . 22 2.2.2. Tính khả vi của hàm lồi . . . . . . . . . . . . . . . . . 30 2.2.3. Tính đơn điệu của dưới vi phân . . . . . . . . . . . . . 35 2.2.4. Tính liên tục của dưới vi phân . . . . . . . . . . . . . . 39 2.2.5. Phép tính với dưới đạo hàm . . . . . . . . . . . . . . . 43 2.3. Dưới vi phân xấp xỉ . . . . . . . . . . . . . . . . . . . . . . . 45 Chương3. Một số ứng dụng của dưới vi phân trong tối ưu hoá 52 3.1. Các khái niệm . . . . . . . . . . . . . . . . . . . . . . . . . . 52 3.2. Bài toán lồi không có rằng buộc . . . . . . . . . . . . . . . . . 53 3.3. Bài toán lồi với rằng buộc đẳng thức . . . . . . . . . . . . . . 53 3.4. Bài toán lồi với rằng buộc bất đẳng thức . . . . . . . . . . . . 54 Kết luận 63 Tài liệu tham khảo 64 3Danh mục các ký hiệu, các chữ viết tắt Với n là số nguyên dương, ký hiệu: Rn: không gian Euclide n-chiều trên trường số thực; Rn+: góc không âm của R n (tập các véc-tơ có mọi toạ độ đều không âm ); R: trục số thực (R = R1); R: trục số thực mở rộng (R = R ∪ {−∞,+∞}); N : tập hợp số nguyên dương; 2R n : tập hợp tất cả các tập con của Rn; Với mọi véc-tơ x, y ∈ Rn, ký hiệu: xi: toạ độ thứ i của x; xT : véc-tơ hàng (chuyển vị của x); 〈x, y〉 = xTy = xy := ∑nj=1 xjyj: tích vô hướng của hai véc-tơ x và y; ||x|| = √∑n j=1 x 2 j : chuẩn Euclide của x; [x, y]: đoạn thẳng đóng nối x và y; (x, y): đoạn thẳng mở nối x và y; Với tập A, ký hiệu: A: bao đóng của A; coA: bao lồi của A; aff A: bao a-phin của A; intA: tập hợp các điểm trong của A; riA: tập hợp các điểm trong tương đối của A; Với hàm f của n biến, ký hiệu: f : hàm bao đóng của f ; dom f : tập hữu dụng của f ; f ∗: hàm liên hợp của f ; epi f : trên đồ thị của f ; ∂f(x): dưới vi phân của f tại x; ∂f(x): - dưới vi phân của f tại x; Of(x) hoặc f ′(x): đạo hàm của f tại x; f ′(x, d): đạo hàm theo phương d của f tại x; 4Lời nói đầu Giải tích lồi là một bộ môn quan trọng trong giải tích phi tuyến hiện đại. Giải tích lồi nghiên cứu những khía cạnh giải tích của tập lồi và hàm lồi. Dưới vi phân là một khái niệm cơ bản của giải tích lồi. Đây là mở rộng cho đạo hàm khi hàm không khả vi. Điều này cho thấy vai trò của dưới vi phân trong giải tích hiện đại cũng có tầm quan trọng như vai trò của đạo hàm trong giải tích cổ điển. Dưới vi phân của hàm lồi có rất nhiều ứng dụng trong giải tích phi tuyến và đặc biệt trong các bộ môn toán ứng dụng, như tối ưu hoá, bất đẳng thức biến phân, cân bằng v...v. Mục đích của luận văn là trình bày một cách có hệ thống, các kiến thức cơ bản và quan trọng nhất về dưới vi phân của hàm lồi và xét một số ứng dụng điển hình của dưới vi phân trong tối ưu hoá. Luận văn gồm 3 chương. Trong chương 1 sẽ trình bày những kiến thức cơ bản về tập lồi và hàm lồi. Đây là các kiến thức bổ trợ cho chương 2 và do đó sẽ không được chứng minh trong luận văn này. Trong chương 2 sẽ đề cập về đạo hàm theo phương, dưới vi phân, dưới vi phân xấp xỉ và một số tính chất cơ bản của chúng. Dựa trên các kết quả đã nghiên cứu trong các chương trước, trong chương 3 sẽ trình bày các điều kiện cực trị cho các bài toán quy hoạch lồi với các rằng buộc khác nhau (không rằng buộc, rằng buộc đẳng thức, rằng buộc bất đẳng thức). Bản luận văn này được hoàn thành dưới sự hướng dẫn khoa học của GS -TSKH Lê Dũng Mưu. Nhân đây em xin chân thành cảm ơn thầy đã hướng dẫn, động viên, khuyến khích em học tập, nghiên cứu để hoàn thành luận văn này. Chương 1 Các kiến thức cơ bản về tập lồi và hàm lồi Trong luận văn này, chúng ta sẽ làm việc với không gian euclid-n chiều trên trường số thực R. Không gian này được kí hiệu là Rn. Chương này nhằm giới thiệu những khái niệm cơ bản nhất của tập lồi và hàm lồi cùng với những tính chất đặc trưng của nó. Các kiến thức ở trong chương này đuợc lấy ở tài liệu : + Giáo trình "Nhập môn giải tích lồi ứng dụng" của tác giả Lê Dũng Mưu và Nguyễn Văn Hiền. + Cuốn "Convex Analysis" của tác giả T.Rockafellar. Do chương này chỉ mang tính chất bổ trợ, nên ta không chứng minh các kết quả nêu ở đây. 1.1 Tập lồi Định nghĩa 1.1. Đoạn thẳng nối hai điểm a và b trong Rn là tập hợp các véc-tơ x có dạng {x ∈ Rn | x = αa+ βb , α > 0 , β > 0 , α + β = 1}. Định nghĩa 1.2. Một tập C ⊆ Rn được gọi là một tập lồi nếu C chứa mọi đoạn thẳng đi qua hai điểm bất kỳ của nó. Tức là C lồi khi và chỉ khi ∀x, y ∈ C, λ ∈ [0, 1] =⇒ λx+ (1− λ)y ∈ C. 5 6Ví dụ 1.1. (Về tập lồi). a) Tập C = R2+ là tập lồi. b) Tập C = [−2; 3) là tập lồi. c) Tập C ≡ oxy trong R3 là tập lồi. d) Các tam giác, hình tròn trong mặt phẳng là các tập lồi. Ví dụ 1.2. (Về tập không lồi). a) Tập C = (−2; 0) ∪ (0; 3) không là tập lồi. b) Tập C = {(x, y) ∈ R2 | xy = 0} không là tập lồi. Định nghĩa 1.3. Ta nói x là tổ hợp lồi của các điểm (véc-tơ) x1, ..., xk nếu x = k∑ j=1 λjx j , λj > 0 , ∀j = 1, ..., k , k∑ j=1 λj = 1. Định nghĩa 1.4. Siêu phẳng trong không gian Rn là một tập hợp các điểm có dạng {x ∈ Rn | aTx = α}, trong đó a ∈ Rn là một véc-tơ khác 0 và α ∈ R. Véc-tơ a thường được gọi là véc-tơ pháp tuyến của siêu phẳng. Một siêu phẳng sẽ chia không gian ra hai nửa không gian. Nửa không gian được định nghĩa như sau: Định nghĩa 1.5. Nửa không gian là một tập hợp có dạng {x | aTx > α}, trong đó a 6= 0 và α ∈ R. Đây là nửa không gian đóng. Định nghĩa 1.6. Cho C ⊆ Rn là một tập lồi và x ∈ C. Tập NC(x) := {ω | 〈ω, y − x〉 6 0 , ∀y ∈ C}, được gọi là nón pháp tuyến ngoài của C tại x. Nhận xét. NC(x) là một nón lồi đóng. 7Ví dụ 1.3. Trong R2, xét tập C = R2+. NC(0) = {ω | 〈ω, y − 0〉 6 0 , ∀y ∈ C} = {ω | 2∑ i=1 ωiyi 6 0} = {ω | ωi 6 0}. Định nghĩa 1.7. Một điểm a ∈ C được gọi là điểm trong tương đối của C nếu nó là điểm trong của C theo tô-pô cảm sinh bởi aff C. Ta sẽ ký hiệu tập hợp các điểm trong tương đối của C là riC. Theo định nghĩa trên ta có: riC := {a ∈ C | ∃B : (a+B) ∩ aff C ⊂ C}, trong đó B là một lân cận mở của gốc. Hiển nhiên riC := {a ∈ aff C | ∃B : (a+B) ∩ aff C ⊂ C}. Như thường lệ, ta ký hiệu C, là bao đóng của C. Tập hợp C \ riC được gọi là biên tương đối của C. Mệnh đề 1.1. Cho C ⊆ Rn là một tập lồi. Giả sử x ∈ riC. Khi đó với mọi y ∈ C tất cả các điểm trên đoạn thẳng nối x và y, có thể trừ y, đều thuộc riC. Nói cách khác, với mọi 0 6 λ < 1, thì (1− λ) riC + λC ⊂ riC. Định nghĩa 1.8. Một đường thẳng nối hai điểm (hai véc-tơ) a,b trong Rn là tập hợp tất cả các véc-tơ x ∈ Rn có dạng {x ∈ Rn | x = αa+ βb , α , β ∈ R , α + β = 1}. Định nghĩa 1.9. Một tập C được gọi là tập a-phin nếu nó chứa mọi đường thẳng đi qua hai điểm bất kỳ của nó, tức là ∀x, y ∈ C , ∀λ ∈ R =⇒ λx+ (1− λ)y ∈ C. Ví dụ 1.4. (Về tập a-phin). Tập C = R2 là tập a-phin, không gian con là một tập affine 8Nhận xét. Tập a-phin là một trường hợp riêng của tập lồi. Định nghĩa 1.10. Bao lồi của một tập E là giao của tất cả các tập lồi chứa E. Bao lồi của một tập E sẽ được ký hiệu là coE. Bao lồi đóng của một tập E là tập lồi đóng nhỏ nhất chứa E. Ta sẽ ký hiệu bao lồi đóng của một tập E là coE. Bao a-phin của E là giao của tất cả các tập a-phin chứa E. Bao a-phin của một tập E sẽ được ký hiệu là aff E. Định nghĩa 1.11. Cho E ⊆ Rn. Điểm a được gọi là điểm trong của E nếu tồn tại một lân cận mở U(a) của a sao cho U(a) ⊂ E. Ký hiệu tập hợp các điểm trong của tập E là intE và B là quả cầu đơn vị tâm ở gốc. Khi đó theo định nghĩa ta có intE = {x | ∃r > 0 : x+ rB ⊂ E}. Điểm a được gọi là điểm biên của E nếu mọi lân cận của a đều có điểm thuộc E và điểm không thuộc E. Tập E được gọi là tập mở nếu mọi điểm của E đều là điểm trong của E. Tập E được gọi là tập đóng nếu E chứa mọi điểm biên của nó. Tập E được gọi là bị chặn, nếu tồn tại một hình cầu chứa E. Trong Rn tập E được gọi là tập compắc nếu E là một tập đóng và bị chặn. Định nghĩa 1.12. Cho C là một tập lồi. Một tập F ⊂ C được gọi là một diện của một tập lồi C nếu F là tập lồi và ∀x, y ∈ C , tx+ (1− t)y ∈ F , 0 < t < 1 =⇒ [x, y] ⊂ F. Ví dụ 1.5. Cho C := {(x, y, z) ∈ R3 | x, y, z ∈ [0, 1]}. Tập F1 := {(x, y, z) ∈ R3 | x, y ∈ [0, 1], z = 0} là một diện của tập C. Tập F2 := {(x, y, z) ∈ R3 | y ∈ [0, 1], x = 1, z = 0} là một diện của tập C. Điểm cực biên là diện có thứ nguyên (chiều) bằng 0. 9Định nghĩa 1.13. Cho x0 ∈ C. Ta nói aTx = α là siêu phẳng tựa của C tại x0, nếu aTx0 = α , aTx > α ∀x ∈ C. Như vậy siêu phẳng tựa của C tại x0 ∈ C là siêu phẳng đi qua x0 và để tập C về một phía. Nửa không gian aTx > α trong định nghĩa trên, được gọi là nửa không gian tựa của C tại x0. Định lý 1.1. (Krein-Milman). Mọi tập lồi đóng khác rỗng, không chứa đường thẳng đều có điểm cực biên. Định lý 1.2. (Xấp xỉ tuyến tính tập lồi). Mọi tập lồi đóng khác rỗng và không trùng với toàn bộ không gian đều là giao của tất cả các nửa không gian tựa của nó. Định nghĩa 1.14. Cho hai tập C và D khác rỗng. Ta nói siêu phẳng aTx = α tách C và D nếu aTx 6 α 6 aTy , ∀x ∈ C , ∀y ∈ D. Ta nói siêu phẳng aTx = α tách chặt C và D nếu aTx < α < aTy , ∀x ∈ C , ∀y ∈ D. Ta nói siêu phẳng aTx = α tách mạnh C và D nếu Supx∈C a Tx < α < infy∈D aTy. Ví dụ 1.6. (Tách nhưng không tách chặt). Cho tập C = {(x, y) ∈ R2 | x2 + y2 6 1}, và D = {(x, y) ∈ R2 | − 1 6 x 6 1, 1 6 y 6 3}. Ta có: 10 + C và D khác rỗng. + C,D tách được vì tồn tại siêu phẳng (0, 1)(x, y) = 1 thoả mãn (0, 1)(x, y) 6 1 6 (0, 1)(x′, y′) ∀(x, y) ∈ C, ∀(x′, y′) ∈ D. Hay y 6 1 6 y′ ∀(x, y) ∈ C, ∀(x′, y′) ∈ D. + C,D không tách chặt được vì không tồn tại siêu phẳng (a1, a2)(x, y) = α nào thoả mãn (a1, a2)(x, y) < α < (a1, a2)(x ′, y′) ∀(x, y) ∈ C, ∀(x′, y′) ∈ D. Ví dụ 1.7. (Tách nhưng không tách mạnh). Cho tập C = {(x, y) ∈ R2 | x > 0, y = 0}, và D = {(x, y) ∈ R2 | y > 1 x , y > 0, x > 0}. Ta có: + C và D khác rỗng. + C,D tách được vì tồn tại siêu phẳng (0, 1)(x, y) = 0 thoả mãn (0, 1)(x, y) = 0 6 (0, 1)(x′, y′) ∀(x, y) ∈ C, ∀(x′, y′) ∈ D. Hay y = 0 6 y′ ∀(x, y) ∈ C, ∀(x′, y′) ∈ D. + C,D không tách mạnh được vì Sup(x,y)∈C(0, 1)(x, y) = 0, inf(x′,y′)∈D(0, 1)(x′, y′) = 0. Định lý 1.3. (Định lý tách 1). Cho C và D là hai tập lồi khác rỗng trong Rn sao cho C ∩D = ∅. Khi đó có một siêu phẳng tách C và D. 11 Hệ quả 1.1. (Bổ đề liên thuộc). Cho C ⊂ Rn là một tập lồi khác rỗng. Giả sử x0 6∈ C. Khi đó tồn tại t ∈ Rn , t 6= 0 thoả mãn 〈t, x〉 > 〈t, x0〉 ∀x ∈ C. Định lý 1.4. (Định lý tách 2). Cho C và D là hai tập lồi đóng khác rỗng sao cho C ∩ D = ∅. Giả sử có ít nhất một tập là compắc. Khi đó hai tập này có thể tách mạnh được bởi một siêu phẳng. Hệ quả 1.2. Cho C ⊂ Rn là một tập lồi đóng khác rỗng sao cho 0 6∈ C. Khi đó tồn tại một véc-tơ t ∈ Rn , t 6= 0 và α > 0 sao cho 〈t, x〉 > α > 0 , ∀x ∈ C. 1.2 Hàm lồi 1.2.1 Hàm lồi Cho C ⊆ Rn và f : C −→ R ∪ {−∞,+∞}. Ta sẽ kí hiệu: dom f := {x ∈ C | f(x) < +∞} . Tập dom f được gọi là miền hữu dụng của f epi f := {(x, à) ∈ C ì R | f(x) 6 à}. Tập epi f được gọi là trên đồ thị của hàm f . Bằng cách cho f(x) = +∞ nếu x 6∈ C, ta có thể coi f được xác định trên toàn không gian và hiển nhiên là dom f := {x ∈ Rn | f(x) < +∞}. epi f := {(x, à) ∈ Rn ìR | f(x) 6 à}. Định nghĩa 1.15. Cho ∅ 6= C ⊆ Rn lồi và f : C −→ R ∪ {−∞,+∞}. Ta nói f là hàm lồi trên C nếu epi f là một tập lồi trong Rn+1. Sau đây ta sẽ chủ yếu làm việc với hàm f : Rn −→ R ∪ {+∞}.Trong trường hợp này, định nghĩa trên tương đương với: 12 Hàm f : Rn −→ R ∪ {+∞} là hàm lồi trên C nếu f [λx+ (1− λ)y] 6 λf(x) + (1− λ)f(y) , ∀x, y ∈ C , ∀λ ∈ (0, 1) Hàm f : Rn −→ R ∪ {+∞} là hàm lồi chặt trên C nếu f [λx+ (1− λ)y] < λf(x) + (1− λ)f(y) , ∀x, y ∈ C , ∀λ ∈ (0, 1) Hàm f : Rn −→ R ∪ {+∞} là hàm lồi mạnh trên C với hệ số lồi η > 0 nếu f [λx+ (1− λ)y] 6 λf(x) + (1− λ)f(y)− 1 2 ηλ(1− λ)||x− y||2 , ∀x, y ∈ C , ∀λ ∈ (0, 1). Hàm f được gọi là một hàm lõm trên C, nếu −f là hàm lồi trên C. Ví dụ 1.8. Hàm a-phin. f(x) = aTx+ α, a ∈ Rn, α ∈ R ∀x, y ∈ Rn,∀λ ∈ (0, 1), ta có f [λx+ (1− λ)y] = aT [λx+ (1− λ)y] + α = λaTx+ (1− λ)aTy + α = λaTx+ λα + (1− λ)aTy + (1− λ)α = λ(aTx+ α) + (1− λ)(aTy + α) = λf(x) + (1− λ)f(y). Vậy f là một hàm lồi trên Rn. ∀x, y ∈ Rn,∀λ ∈ (0, 1), lại có −f [λx+ (1− λ)y] = −aT [λx+ (1− λ)y]− α = −λaTx− (1− λ)aTy − α = −λaTx− λα− (1− λ)aTy − (1− λ)α = −λ(aTx+ α)− (1− λ)(aTy + α) = −λf(x)− (1− λ)f(y). Vậy −f là một hàm lồi trên Rn. Suy ra f là một hàm lõm trên Rn. 13 Ví dụ 1.9. Hàm chỉ. Cho C 6= ∅ là một tập lồi . Đặt δC(x) := { 0 nếu x ∈ C, +∞ nếu x 6∈ C. Ta nói δC là hàm chỉ của C. + ∀x, y ∈ C, ∀λ ∈ (0, 1), ta có: δC(x) = 0 , δC(y) = 0. Do C lồi nên λx+ (1− λ)y ∈ C. Suy ra δC [λx+ (1− λ)y] = 0 = λδC(x) + (1− λ)δC(y). + ∀x ∈ C, ∀y 6∈ C, ∀λ ∈ (0, 1), ta có : δC(x) = 0 , δC(y) = +∞ , δC [λx+ (1− λ)y] 6 +∞. Suy ra δC [λx+ (1− λ)y] 6 λδC(x) + (1− λ)δC(y). + ∀x, y 6∈ C, ∀λ ∈ (0, 1), ta có : δC(x) = +∞ , δC(y) = +∞ , δC [λx+ (1− λ)y] 6 +∞. Suy ra δC [λx+ (1− λ)y] 6 λδC(x) + (1− λ)δC(y). Vậy δC là hàm lồi trên R n . Ví dụ 1.10. Hàm tựa. Đặt SC(y) := Supx∈C〈y, x〉.Ta nói SC là hàm tựa của C. ∀x, y ∈ C, ∀λ ∈ (0, 1), ta có SC [λx+ (1− λ)y] = Supz∈C〈λx+ (1− λ)y, z〉 = Supz∈C{〈λx, z〉+ 〈(1− λ)y, z〉} 6 Supz∈C〈λx, z〉+ Supz∈C〈(1− λ)y, z〉 = λ Supz∈C〈x, z〉+ (1− λ) Supz∈C〈y, z〉 = λSC(x) + (1− λ)SC(y). Vậy SC là hàm lồi trên C. Định nghĩa 1.16. Cho f : Rn −→ R ∪ {+∞} (không nhất thiết lồi), C ⊆ Rn là một tập lồi khác rỗng và η là một số thực . Ta nói η là hệ số lồi của f trên C, nếu với mọi λ ∈ (0, 1), với mọi x, y ∈ C, ta có: f [(1− λ)x+ λy] 6 (1− λ)f(x) + λf(y)− 1 2 ηλ(1− λ)||x− y||2. 14 Nếu η = 0 thì f lồi trên C. Nếu f có hệ số lồi trên C là η > 0, thì f lồi mạnh trên C với hệ số η. Định nghĩa 1.17. Một hàm f : Rn −→ R∪{+∞} được gọi là chính thường nếu dom f 6= ∅ và f(x) > −∞ với mọi x. Định nghĩa 1.18. Hàm f : Rn −→ R ∪ {+∞} được gọi là đóng, nếu epi f là một tập đóng trong Rn+1 Chú ý 1.1. 1. Nếu f là một hàm lồi trên một tập lồi C, thì có thể thác triển f lên toàn không gian bằng cách đặt fe(x) = { f(x) nếu x ∈ C, +∞ nếu x 6∈ C. Hiển nhiên fe(x) = f(x) với mọi x ∈ C và fe lồi trên Rn. Hơn nữa fe là chính thường khi và chỉ khi f chính thường. Tương tự fe đóng khi và chỉ khi f đóng. 2. Nếu f là một hàm lồi trên Rn thì dom f là một tập lồi vì dom f chính là hình chiếu trên Rn của epi f , tức là: dom f = {x|∃à ∈ R : (x, à) ∈ epi f}. Định nghĩa 1.19. Cho f : Rn −→ R ∪ {+∞}. Hàm f được gọi là thuần nhất dương (bậc 1) trên Rn nếu f(λx) = λf(x) ∀x ∈ Rn,∀λ > 0. Hàm f được gọi là dưới cộng tính nếu f(x+ y) 6 f(x) + f(y) ∀x, y. Hàm f được gọi là dưới tuyến tính nếu f là thuần nhất dương và dưới cộng tính. Ví dụ 1.11. Hàm chuẩn f(x) = ‖x‖ là hàm dưới tuyến tính. Thật vậy, ∀x ∈ Rn,∀λ > 0, ta có: f(λx) = ‖λx‖ = |λ|.‖x‖ = λ‖x‖ = λf(x). ∀x, y ∈ Rn, ta có: f(x+ y) = ‖x+ y‖ 6 ‖x‖+ ‖y‖ = f(x) + f(y). Mệnh đề 1.2. Cho f : Rn −→ R ∪ {+∞} là một hàm thuần nhất dương trên Rn. Khi đó: f lồi khi và chỉ khi f là dưới cộng tính. 15 1.2.2 Tính liên tục của hàm lồi Định nghĩa 1.20. Cho hàm f : E −→ R ∪ {−∞,+∞}. Hàm f được gọi là nửa liên tục dưới tại một điểm x ∈ E nếu với mọi dãy {xk} ⊂ E, xk → x ta có lim inf f(xk) > f(x). Hàm f được gọi là nửa liên tục trên tại x ∈ E nếu −f nửa liên tục dưới tại x ∈ E. Như vậy f nửa liên tục trên tại x ∈ E nếu với mọi dãy {xk} ⊂ E, xk → x ta có lim sup f(xk) 6 f(x). Hàm f được gọi là liên tục tại x ∈ E nếu như nó vừa nửa liên tục trên và nửa liên tục dưới tại x ∈ E. Hàm f được gọi là nửa liên tục dưới trên E nếu nó nửa liên tục dưới tại mọi điểm thuộc E. Hàm f được gọi là nửa liên tục trên trên E nếu nó nửa liên tục trên tại mọi điểm thuộc E. Hàm f được gọi là liên tục trên E nếu nó nửa liên tục trên và nửa liên tục dưới trên E. Định nghĩa 1.21. Cho hai hàm f và g xác định trên Rn. Ta nói g là bao đóng của f , nếu epi g = epi f . Bao đóng của f sẽ được kí hiệu là f . Vậy epi f = epi f . Hàm f được gọi là đóng nếu epi f = epi f . 1.2.3 Các phép toán bảo toàn tính lồi Định nghĩa 1.22. Giả sử {fα}α∈I là một họ tuỳ ý các hàm số trên Rn và E ⊆ Rn. Hàm cận trên của họ hàm này trên coE, ký hiệu là Vα∈Ifα là hàm số được định nghĩa như sau: (Vα∈Ifα)(x) := Supα∈I fα(x) với mỗi x ∈ coE. 16 Mệnh đề 1.3. Giả sử {fα}α∈I là một họ hàm lồi trên Rn và E ⊆ Rn. Khi đó hàm cận trên của họ hàm này là một hàm lồi trên coE. 1.2.4 Bất đẳng thức lồi Định nghĩa 1.23. Cho D ⊆ Rn là một tập lồi và f1, ..., fm là các hàm lồi trên Rn. Hệ bất đẳng thức x ∈ D, fi(x) <= 0, i ∈ I được gọi là hệ bất đẳng thức lồi, trong đó I là tập chỉ số và ký hiệu <= có thể hiểu là < hoặc 6. Mệnh đề 1.4. Cho f1, ..., fm là các hàm lồi hữu hạn trên một tập lồi D 6= ∅ và A là một ma trận thực cấp k ì n. Giả sử b ∈ riA(D). Khi đó hệ x ∈ D, Ax = b, fi(x) < 0 i = 1, ..,m không có nghiệm, khi và chỉ khi tồn tại t ∈ Rk và λi > 0, i = 1, ..,m sao cho ∑m i=1 λi = 1 và 〈t, Ax− b〉+ m∑ i=1 λifi(x) > 0 ∀x ∈ D. 1.2.5 Hàm liên hợp Định nghĩa 1.24. Cho f : Rn −→ [−∞,+∞] là một hàm bất kỳ. Hàm f ∗(x∗) := Sup{〈x∗, x〉 − f(x) | x ∈ Rn} được gọi là hàm liên hợp của f . Chú ý 1.2. Như thường lệ, trong định nghĩa trên ta qui ước cận trên đúng trên một tập rỗng là −∞. Như vậy nếu f ≡ +∞, thì f ∗ ≡ −∞, ngoài ra nếu f có nhận giá trị −∞ thì f ∗ ≡ +∞. Để khỏi phải làm việc với hàm liên hợp đồng nhất bằng +∞ hoặc đồng nhất bằng −∞, ta sẽ hạn chế việc xét hàm liên hợp trong lớp hàm có tính chất sau: f 6≡ +∞ và tồn tại một hàm non a-phin của f. 17 Ví dụ 1.12. Xét hàm chỉ δC(x) = { 0 nếu x ∈ C, +∞ nếu x 6∈ C. Ta có: δ∗C(x ∗) := Supx∈Rn{〈x∗, x〉 − δC(x)} = Supx∈C{〈x∗, x〉 − δC(x)} = Supx∈C{〈x∗, x〉 − 0} = Supx∈C〈x∗, x〉 = SC(x ∗). Mệnh đề 1.5. Với mọi hàm số f , hàm liên hợp f ∗ là một hàm lồi đóng thoả mãn bất đẳng thức Fenchel sau: f ∗(x∗) > 〈x∗, x〉 − f(x) ∀x,∀x∗. Chú ý 1.3. Trong nhiều trường hợp, ta quan tâm đến hàm liên hợp thứ hai. Theo định nghĩa hàm liên hợp thì f ∗∗(x) := (f ∗)∗(x) = Sup{〈x, s〉 − f ∗(s) | s ∈ Rn}. Hàm liên hợp thứ hai tất nhiên luôn là một hàm lồi đóng. Mệnh đề 1.6. Giả sử f 6≡ +∞ và tồn tại một hàm non a-phin của f . Khi đó epi f ∗∗ = co(epi f). Hệ quả 1.3. f ≡ f ∗∗ khi và chỉ khi f là hàm lồi, đóng. Định nghĩa 1.25. Hàm l là hàm non a-phin của một hàm f trên Rn nếu l là hàm a-phin trên Rn và l(x) 6 f(x) ∀x ∈ Rn. Chương 2 Dưới vi phân của hàm lồi Phép tính vi phân là một trong những đề tài cơ bản nhất của giải tích cổ điển. Trong giải tích lồi, lý thuyết này lại càng trở nên phong phú nhờ những tính chất đặc biệt của tập lồi và hàm lồi. Mục đầu tiên của chương này sẽ xét đến đạo hàm theo phương của một hàm lồi. Tiếp đến ở mục 2, sẽ đưa ra định nghĩa về dưới vi phân và các tính chất của nó như: Xét tính khả vi của hàm lồi, khảo sát tính đơn điệu của dưới vi phân, khảo sát tính liên tục của ánh xạ dưới vi phân và một số phép tính với dưới vi phân. Mục cuối của chương sẽ giới thiệu về dưới vi phân xấp xỉ và một số tính chất của nó. 2.1 Đạo hàm theo phương Cho một hàm n-biến f : Rn −→ R∪{+∞}. Khi cố định một phương và xét hàm nhiều biến trên phương đó , thì ta có một hàm một biến. Giả sử y 6= 0 là một phương cho trước xuất phát từ điểm x0. Khi đó mọi điểm x thuộc đường thẳng đi qua x0 và có phương y đều có dạng x = x0 + λy với λ ∈ R. Nếu đặt ξ(λ) = f(x0 + λy) thì ξ lồi trên R khi và chỉ khi f lồi trên Rn. Định nghĩa 2.1. Cho f : Rn −→ R ∪ {+∞} và x0 ∈ Rn sao cho f(x0) < +∞. Nếu với một véc-tơ y ∈ Rn mà giới hạn lim λ→0 f(x0+λy)−f(x0) λ tồn tại (hữu hạn hay vô hạn) thì ta nói f có đạo hàm theo phương y tại điểm x0. Ta sẽ ký hiệu giới hạn này là f ′(x0, y). 18 19 Ví dụ 2.1. Giả sử f được cho như sau: f(x) =  0 nếu x < 0, 1 nếu x = 0, +∞ nếu x > 0. Ta có dom f = (−∞; 0]⇒ dom f 6= ∅ , f(x) > −∞,∀x . Vậy f là hàm chính thường . Ta có: f ′(0,−1) = lim λ→0 f(0+λ(−1))−f(0) λ = limλ→0 0−1 λ = −∞, f ′(0, 0) = lim λ→0 f(0+λ0)−f(0) λ = limλ→0 1−1 λ = 0, f ′(0, 1) = lim λ→0 f(0+λ1)−f(0) λ = limλ→0 ∞−1 λ = +∞. Suy ra f ′(0, .) không là hàm chính thường. Mệnh đề 2.1. Cho f : Rn −→ R ∪ {+∞} lồi. Khi đó với mọi x ∈ dom f và mọi y ∈ Rn ta có: i) ϕ là hàm đơn điệu không giảm trên (0; +∞) , trong đó ϕ(λ) := f(x+ λy)− f(x) λ , và do đó f ′(x, y) tồn tại với mọi y ∈ Rn và f ′(x, y) := infλ>0 f(x+ λy)− f(x) λ . ii) Hàm f ′(x, .) thuần nhất dương bậc 1. Ngoài ra nếu f ′(x, .) > −∞ thì hàm f ′(x, .) là dưới tuyến tính trên Rn (do đó nó là hàm lồi chính thường trên Rn). iii) −f ′(x,−y) 6 f ′(x, y) ∀y ∈ Rn. iv) Hàm f ′(x, .) nhận giá trị hữu hạn trên F khi và chỉ khi x ∈ ri(dom f), trong đó F là không gian con của dom f . Chứng minh. i) Ta chứng minh hàm ϕ đơn điệu không giảm trên miền (0; +∞). 20 Định nghĩa hàm h : R −→ R ∪ {+∞} xác định bởi h(λ) = f(x+ λ.y)− f(x). Khi đó h(0) = 0. Giả sử 0 < λ′ 6 λ, do f là hàm lồi nên h là hàm lồi , không nhận giá trị −∞. Ta có h(λ′) = h[ λ′ λ λ+ (1− λ ′ λ )0] 6 λ ′ λ h(λ) + (1− λ ′ λ )h(0) = λ′ λ h(λ). Do ϕ(λ) = f(x+λy)−f(x)λ = h(λ) λ nên ϕ(λ ′) 6 ϕ(λ). Vậy ϕ là hàm không giảm trên miền (0; +∞). Suy ra f ′(x, y) = lim λ→0 ϕ(λ) tồn tại và lim λ→0 ϕ(λ) = infλ>0 ϕ(λ) = infλ>0 f(x+ λ.y)− f(x) λ . ii) Theo định nghĩa, ta có f ′(x, 0) = lim λ→0 f(x+ λ0)− f(x) λ = 0. Chứng minh tính thuần nhất dương . Với t > 0, ta viết f ′(x, ty) = lim λ→0 f(x+ λty)− f(x) λ . Đặt λ′ = λt, ta có tiếp f ′(x, ty) = t lim λ→0 f(x+ λ′y)− f(x) λ′ = tf ′(x, y). Vậy f ′(x, .) thuần nhất dương. Chứng minh tính dưới tuyến tính. 21 Giả sử f ′(x, .) > −∞, với mọi u và v ta có: f ′(x, u+ v) = infλ>0 f [x+ λ2(u+ v)]− f(x) λ 2 (theo i) = infλ>0 f [(x2 + λ 2u) + ( x 2 + λ 2v)]− 12f(x)− 12f(x) λ 2 . Do f là hàm lồi không nhận giá trị −∞ ,nên f [( x 2 + λ 2 u) + ( x 2 + λ 2 v)]− 1 2 f(x)− 1 2 f(x) 6 1 2 [f(x+ λu)− f(x)] + 1 2 [f(x+ λv)− f(x)]. Do đó f ′(x, u+ v) 6 infλ>0 f(x+ λu) λ + infλ>0 f(x+ λv) λ = f ′(x, u) + f ′(x, v). (f ′(x, u) + f ′(x, v) có nghĩa vì f ′(x, .) > −∞). Vậy f ′(x, .) là hàm dưới cộng tính. Suy ra f ′(x, .) là hàm dưới tuyến tính trên Rn. Vì f ′(x, .) > −∞, f ′(x, 0) = 0 và f ′(x, .) là dưới tuyến tính trên Rn, nên nó là hàm lồi, chính thường trên toàn không gian. iii) Do f ′(x, 0) = 0 và theo tính chất dưới cộng tính, ta có: 0 = f ′(x, 0) = f ′(x, y − y) 6 f ′(x, y) + f ′(x,−y) ∀y ∈ Rn. Suy ra −f ′(x,−y) 6 f ′(x, y) với mọi y ∈ Rn. iv) Giả sử x ∈ ri(dom f) . Ta cần chứng tỏ f ′(x, .) hữu hạn trên F . Từ iii) suy ra f ′(x, .) > −∞. Vậy cần chỉ ra f ′(x, y) < +∞ với mọi y ∈ F . Do x ∈ ri(dom f), nên ∀y ∈ F , x+ λ.y ∈ dom f ∀λ > 0 đủ nhỏ. Do đó f ′(x, y) = infλ>0 f(x+λ.y)−f(x) λ < +∞. Ngược lại, giả sử f ′(x, y) hữu hạn với mọi y ∈ F . Ta cần chứng tỏ x ∈ ri(dom f). 22 Thật vậy, nếu trái lại sẽ tồn tại y ∈ F và một dãy {λk} các số dương hội tụ đến 0 và x+ λk.y 6∈ dom f với mọi k đủ lớn. Trong trường hợp này f(x+ λk.y)− f(x) = +∞ với mọi k đủ lớn. Do đó f ′(x, y) = +∞. Mâu thuẫn với giả thiết. Vậy x ∈ ri(dom f). 2.2 Dưới vi phân và các tính chất 2.2.1 Dưới vi phân Định nghĩa 2.2. Cho f : Rn −→ R ∪ {+∞}. Ta nói x∗ ∈ Rn là dưới đạo hàm của f tại x nếu 〈x∗, z − x〉+ f(x) 6 f(z) ∀z. Kí hiệu tập hợp tất cả các dưới đạo hàm của f tại x là ∂f(x). Vậy ∂f(x) là một tập (có thể bằng ∅) trong Rn. Khi ∂f(x) 6= ∅, thì ta nói hàm f khả dưới vi phân tại x. Theo định nghĩa, một điểm x∗ ∈ ∂f(x) khi và chỉ khi nó thoả mãn một hệ vô hạn các bất đẳng thức tuyến tính . Như vậy ∂f(x) là giao của các nửa không gian đóng. Vậy ∂f(x) luôn là một tập lồi đóng (có thể rỗng). Kí hiệu dom(∂f) := {x|∂f(x) 6= ∅}. Ví dụ 2.2. 1) Hàm chuẩn f(x) = ‖x‖, x ∈ Rn. Tại điểm x = 0, ta có ∂f(0) = {x∗|〈x∗, x〉 6 ‖x‖,∀x}. Vậy hàm f(x) khả dưới vi phân. Lại có lim x→0 f(x)− f(0)− 〈x∗, x− 0〉 ‖x− 0‖ = limx→0 ‖x‖ − 〈x∗, x〉 ‖x‖ = 1 6= 0. Vậy hàm f(x) không khả vi tại x = 0. 23 2) Hàm chỉ f(x) = δC(x) := { 0 nếu x ∈ C, +∞ nếu x 6∈ C. Trong đó C là một tập lồi khác ∅. Khi đó với x0 ∈ C, ta có ∂f(x0) = ∂δC(x 0) = {x∗|〈x∗, x− x0〉 6 δC(x),∀x}. Với x 6∈ C thì δC(x) = +∞, nên bất đẳng thức này luôn đúng. Vậy ∂f(x0) = ∂δC(x 0) = {x∗|〈x∗, x− x0〉 6 0,∀x ∈ C} = NC(x0). Vậy dưới vi phân của hàm chỉ của một tập lồi C khác ∅ tại một điểm x0 ∈ C chính là nón pháp tuyến ngoài của C tại x0. Mệnh đề 2.2. i) x∗ ∈ ∂f(x) khi và chỉ khi f ′(x, y) > 〈x∗, y〉 ,∀y. ii) Nếu f là hàm lồi chính thường trên Rn, thì với mọi x ∈ dom(∂f), ta có f(x) = f(x) và ∂f(x) = ∂f(x). Chứng minh. i) Theo định nghĩa x∗ ∈ ∂f(x)⇔ 〈x∗, z − x〉+ f(x) 6 f(z) ∀z. Với bất kì y, lấy z = x+ λ.y, λ > 0, ta có 〈x∗, λ.y〉+ f(x) 6 f(x+ λ.y). Từ đây suy ra 〈x∗, y〉 6 f(x+ λ.y)− f(x) λ ∀λ > 0. (2.1) Theo định nghĩa của f ′(x, y), suy ra ngay 〈x∗, y〉 6 f ′(x, y) ∀y. Ngược lại, giả sử (2.1) thoả mãn. Lấy z bất kì và áp dụng (2.1) với y = z − x và λ = 1, ta có 〈x∗, z − x〉 6 f(z)− f(x) ∀z. Vậy x∗ ∈ ∂f(x). ii) Cho x ∈ dom(∂f), thì ∂f(x) 6= ∅, tức là tồn tại x∗ ∈ ∂f(x). 24 Theo định nghĩa của f , ta có epi f = epi f . Mặt khác, ta lại có epi f ⊂ epi f , suy ra epi f ⊂ epi f . Vậy f(x) > f(x). (2.2) Theo giả thiết f là hàm lồi chính thường trên Rn, nên f là hàm lồi đóng trên Rn, theo hệ quả 1.1, ta có f(x) = f ∗∗(x). (2.3) Theo tính chất của hàm liên hợp thứ 2, ta có f ∗∗(x) >< 〈x∗, x〉 − f ∗(x∗) = f(x). (2.4) Từ (2.2),(2.3) và (2.4) ta có f(x) = f(x). Ta lấy y∗ ∈ ∂f(x) thì ∀z tacó 〈y∗, z − x〉+ f(x) 6 f(z). Mặt khác f(z) > f(z) > 〈y∗, z − x〉+ f(x) = 〈y∗, z − x〉+ f(x). Suy ra y∗ ∈ ∂f(x). Vậy ∂f(x) ⊂ ∂f(x). (2.5) Ngược lại, lấy z0 ∈ ri(dom f). Với mọi z ta có f(z) = f(z) = lim t→0 f [(1− t).z + t.z0]. Vậy theo định nghĩa của dưới vi phân ta có : x∗ ∈ ∂f(x)⇔ 〈x∗, (1− t).z + t.z0 − x〉+ f(x) 6 f [(1− t).z + t.z0]. Cho t→ 0 ta được : 〈x∗, z − x〉+ f(x) 6 f(z). 25 Hay 〈x∗, z − x〉+ f(x) 6 f(z) Chứng tỏ x∗ ∈ ∂f(x). Vậy ∂f(x) ⊂ ∂f(x). (2.6) Từ (2.5) và (2.6) ta có ∂f(x) = ∂f(x). Mệnh đề 2.3. Cho f : Rn −→ R ∪ {+∞} lồi, khi đó : i) Nếu x 6∈ dom f , thì ∂f(x) = ∅. ii) x ∈ ri(dom f) khi và chỉ khi ∂f(x) 6= ∅ và compắc. Chứng minh. i) Cho z ∈ dom f , thì f(z) < +∞. Vậy nếu x 6∈ dom f thì f(x) = +∞ và do đó không thể tồn tại x∗ tho mãn 〈x∗, z − x〉+ f(x) 6 f(z) < +∞. Vậy ∂f(x) = ∅. ii) Giả sử x ∈ ri(dom f). Ta có điểm (x, f(x)) nằm trên biên của epi f . Do f lồi, chính thường, nên tồn tại siêu phẳng tựa của epi f đi qua (x, f(x)). Tức là tồn tại p ∈ Rn, t ∈ R không đồng thời bằng 0 sao cho 〈p, x〉+ t.f(x) 6 〈p, y〉+ t.à , ∀(y, à) ∈ epi f. (2.7) Ta có t 6= 0, vì nếu t = 0 thì 〈p, x〉 6 〈p, y〉 ,∀y ∈ dom f . Hay 〈p, x− y〉 6 0 ,∀y ∈ dom f . Nhưng do x ∈ ri(dom f), nên điều này kéo theo p = 0. Mâu thuẫn với p, t không đồng thời bằng 0. Vậy t 6= 0. Hơn nữa t > 0, vì nếu t < 0 thì trong bất đẳng thức (2.7), khi cho à→∞ ta suy ra mâu thuẫn vì vế trái cố định. Chia hai vế của (2.7) cho t > 0, ta được: 〈p t , x〉+ f(x) 6 〈p t , y〉+ à ∀y ∈ dom f. 26 Thay à = f(y), ta được 〈p t , x〉+ f(x) 6 〈p t , y〉+ f(y) ∀y ∈ dom f. Đặt x∗ = −pt , ta được −〈x∗, x〉+ f(x) 6 −〈x∗, y〉+ f(y) ∀y ∈ dom f. Hay 〈x∗, y − x〉+ f(x) 6 f(y) ∀y ∈ dom f. Nếu y 6∈ dom f thì f(y) =∞, do đó 〈x∗, y − x〉+ f(x) 6 f(y) ∀y. Chứng tỏ x∗ ∈ ∂f(x). Vậy ∂f(x) 6= ∅ . Bây giờ ta chỉ ra tập ∂f(x) compắc. Do x ∈ ri(dom f), theo mệnh đề (2.2) x∗ ∈ ∂f(x)⇐⇒ f ′(x, d) > 〈x∗, d〉 ∀d. (2.8) Gọi F là không gian tuyến tính của dom f . Lấy ei là véc-tơ đơn vị thứ i (i=1,...,n) của Rn (toạ độ thứ i của ei bằng 1 và mọi toạ độ khác là 0). Không giảm tổng quát, ta giả sử rằng các véc-tơ đơn vị e1, ...ek ∈ F , áp dụng (2.8) lần lượt với d = ei với i=1,...k, ta có x∗i 6 f ′(x, ei). Tương tự , áp dụng với d = −ei với i=1,...k, ta có −x∗i 6 f ′(x,−ei). Hay x∗i > −f ′(x,−ei). Tóm lại −f ′(x,−ei) 6 x∗i 6 f ′(x, ei) ,với mọi i=1,...k. Theo (iv) mệnh đề (2.1), do x ∈ ri(dom f) và F là không gian con của dom f , nên f ′(x, y) hữu hạn với mọi y ∈ F . Nói riêng f ′(x,−ei) và f ′(x, ei) hữu hạn với mọi i=1,...k. Vậy ∂f(x) bị chặn , và do tính đóng nên nó là compắc. Ngược lại, giả sử rằng ∂f(x) 6= ∅ và ∂f(x) compắc. Ta chỉ ra rằng x ∈ ri(dom f). Do ∂f(x) 6= ∅ nên x ∈ dom f . Nếu trái lại x 6∈ ri(dom f), thì x ở trên biên tương đối của dom f . 27 Do dom f lồi, theo mệnh đề về siêu phẳng tựa, tồn tại một siêu phẳng tựa của dom f tại x, tức là tồn tại vectơ p ∈ Rn, p 6= 0 sao cho 〈p, x〉 > 〈p, z〉 ∀z ∈ dom f. Lấy x∗ ∈ ∂f(x). Từ đây và theo định nghĩa dưới vi phân ta có: f(z)− f(x) > 〈x∗, z − x〉 > 〈x∗, z − x〉+ λ.〈p, z − x〉 = 〈x∗ + λ.p, z − x〉 ∀λ > 0,∀z. Chứng tỏ x∗ + λ.p ∈ ∂f(x) ∀λ > 0. Điều này mâu thuẫn với tính bị chặn của ∂f(x). Vậy x ∈ ri(dom f). Ví dụ 2.3. Cho hàm một biến f(x) = { −2x 12 nếu x > 0, +∞ nếu x < 0. Ta có dom f = [0; +∞) , 0 6∈ int(dom f). x∗ ∈ ∂f(0)⇔ 〈x∗, x〉+ f(0) 6 f(x) ,∀x ⇔ x∗.x 6 −2x 12 ,∀x > 0. (2.9) Nếu x∗ < 0 , ta chọn x = 0.01 thì (2.9) không thoả mãn. Nếu x∗ 6 0 thì (2.9) không thoả mãn. Vậy ∂f(0) = ∅. Ví dụ trên cho thấy nếu x 6∈ int(dom f) thì tập ∂f(x) có thể bằng rỗng. Mệnh đề 2.4. Cho f : Rn −→ R ∪ {+∞} và x ∈ dom f . Khi đó i) Nếu x ∈ ri(dom f), thì f ′(x, y) = maxx∗∈∂f(x) 〈x∗, y〉 ,∀y. ii) Với mọi tập bị chặn C ⊂ int(dom f), tập ∪x∈C∂f(x) bị chặn . iii) Nếu có thêm f đóng, thì f ∗(x∗) + f(x) = 〈x∗, x〉 ⇐⇒ x∗ ∈ ∂f(x), x ∈ ∂f(x∗). 28 Chứng minh. i) Do f ′(x, .) là hàm lồi, thuần nhất dương, nên mọi hàm non a-phin của f ′(x, .) đều tuyến tính, tức là có dạng 〈p, .〉. Vậy nếu 〈p, .〉 là hàm non a-phin của f ′(x, .) trên Rn, thì 〈p, y〉 6 f ′(x, y) ,∀y. Theo mệnh đề 2.2 ta có p ∈ ∂f(x). Hơn nữa, do f ′(x, .) là một hàm lồi đóng, nên theo định lý xấp xỉ tập lồi nó là bao trên của các hàm non a-phin của nó. Vậy f ′(x, y) = Supp∈∂f(x) 〈p, y〉. ii) Giả sử C ⊆ int(dom f). Đặt ξ = Supx∗∈∂f(C) ‖x∗‖ = Supx∈C Supx∗∈∂f(C) ‖x∗‖ (2.10) Xét ánh xạ tuyến tính 〈x∗, z〉. Chuẩn của ánh xạ tuyến tính này là ‖x∗‖ = Sup‖z‖=1 〈x∗, z〉. Thay vào (2.10) ta có : ξ = Supx∈C Supx∗∈∂f(C) Sup‖z‖=1 〈x∗, z〉. Do f ′(x, z) = Supx∗∈∂f(x) 〈x∗, z〉 nên ta có tiếp ξ = Sup‖z‖=1 Supx∈C f ′(x, z). Đặt g(z) = Supx∈C f ′(x, z). Do x ∈ C ⊆ int(dom f), nên hàm f ′(x, .) lồi trên Rn ( do đó liên tục ). Suy ra hàm g liên tục vì là bao trên của một họ hàm lồi liên tục trên Rn. Vậy ξ = Sup‖z‖=1 g(z) = max‖z‖=1 g(z) < +∞. Chứng tỏ ∂f(C) bị chặn. 29 iii) Theo định nghĩa hàm liên hợp, ta có f ∗(x∗) = Supx {〈x∗, x〉 − f(x)}. Điều này tương đương với f ∗(x∗) > 〈x∗, y〉 − f(y) ,∀y. Do đó f ∗(x∗) + f(x) = 〈x∗, x〉 ⇔ 〈x∗, y〉 − f(y) + f(x) 6 〈x∗, x〉 ,∀y. Hay 〈x∗, y − x〉+ f(x) 6 f(y) ,∀y. Vậy x∗ ∈ ∂f(x). Do f đóng, nên theo hệ quả 1.1, ta có f = f ∗∗. Theo định nghĩa của hàm liên hợp, ta có: f ∗∗ = Supx∗ {〈x, x∗〉 − f ∗(x∗)}. Điều này tương đương với f ∗∗(x) > 〈x, y〉 − f ∗(y) ,∀y. Hay f(x) > 〈x, y〉 − f ∗(y) ,∀y. Do đó f ∗(x∗) + f(x) = 〈x∗, x〉 ⇔ 〈x, y〉 − f ∗(y) + f ∗(x∗) 6 〈x∗, x〉 ,∀y. Hay 〈x, y − x∗〉+ f ∗(x∗) 6 f ∗(y) ,∀y. Vậy x ∈ ∂f ∗(x∗). 30 2.2.2 Tính khả vi của hàm lồi Định nghĩa 2.3. Cho một hàm f xác định trên một lân cận của x ∈ Rn. Hàm f được gọi là khả vi tại x, nếu tồn tại x∗ sao cho lim z→x f(z)− f(x)− 〈x∗, z − x〉 ‖z − x‖ = 0. Một điểm x∗ như thế nếu tồn tại sẽ duy nhất và được gọi là đạo hàm của f tại x. Thông thường đạo hàm này được kí hiệu là Of(x) hoặc f ′(x). Giả sử f : Rn −→ R ∪ {+∞} lồi, chính thường và x ∈ dom f . Nếu f khả vi tại x, thì với mọi y 6= 0, ta có: lim λ→0 f(x+ λ.y)− f(x)− 〈Of(x), λ.y〉 λ.‖y‖ = 0. Hay là f ′(x, y)− 〈Of(x), y〉 ‖y‖ = 0. Suy ra f ′(x, y) = 〈Of(x), y〉 ,∀y. Lấy y = ei (i=1,...,n) là véc-tơ đơn vị thứ i của Rn, ta có : 〈Of(x), ei〉 = ( ∂f ∂xi )(x)(i = 1, .., n). Vậy f ′(x, y) = n∑ i=1 yi( ∂f ∂xi )(x). Từ đây ta có mệnh đề sau: Mệnh đề 2.5. Giả sử f : Rn −→ R ∪ {+∞} lồi, chính thường và x ∈ dom f . Khi đó f khả vi tại x khi và chỉ khi tồn tại x∗ ∈ Rn sao cho f ′(x, y) = 〈x∗, y〉 ,∀y. Ngoài ra x ∈ int(dom f) và Of(x) = x∗. Chứng minh. Nếu f khả vi tại x thì như ở trên, ta đã chỉ ra rằng f ′(x, y) = 〈Of(x), y〉 ,∀y. 31 Vậy f ′(x, y) hữu hạn trên toàn Rn, nên x ∈ int(dom f). Ngược lại f ′(x, y) = 〈Of(x), y〉 ,∀y. Trước hết ta có x ∈ int(dom f) vì f ′(x, .) hữu hạn trên toàn Rn. Để chứng minh tính khả vi của f tại x, ta lấy g(y) := f(x+ y)− f(x)− 〈x∗, y〉. Do f lồi, chính thường và f hữu hạn, nên g cũng là một hàm lồi, chính thường trên Rn. Ta cần chứng tỏ lim y→0 g(y) ‖y‖ = 0. Trước hết từ f ′(x, y) = 〈x∗, y〉, theo định nghĩa của f ′(x, y), ta có g(y) > 0 ,∀y và g(0) = 0. Nếu y 6= 0 thì véc-tơ y‖y‖ thuộc siêu hộp H := [−1, 1]n. Vậy theo định lý Krein-Milman điểm y ‖y‖ biểu diễn được bởi một tổ hợp lồi của các đỉnh của H, tức là tồn tại các số thực βi (phụ thuộc y) sao cho βi > 0, ∑ i∈I βi = 1 và y ‖y‖ = ∑ i∈I βiv i, trong đó vi(i ∈ I) là các đỉnh của H. Ta có g(y) := g(‖y‖ y‖y‖) = g(‖y‖ ∑ i∈I βiv i) = g( ∑ i∈I βi‖y‖vi). Theo tính lồi của g thì g( ∑ i∈I βi‖y‖vi) 6 ∑ i∈I βig(‖y‖vi). Tóm lại 0 6 g(y)‖y‖ 6 ∑ i∈I βi g(‖y‖vi) ‖y‖ . Theo định nghĩa của g ta lại có g(‖y‖vi) ‖y‖ → 0 khi y → 0. Vậy g(y) ‖y‖ → 0. Chứng tỏ f khả vi tại x và do đó Of(x) = x∗. 32 Mệnh đề 2.6. Cho f : Rn −→ R ∪ {+∞} khả vi và C ⊂ Rn. Ba điều kiện sau tương đương. a) η là hệ số lồi của f trên C. b) f(y) > f(x) + 〈f ′(x), y − x〉+ η2‖x− y‖2 ∀x, y ∈ C c)〈f ′(y)− f ′(x), y − x〉 > η‖x− y‖2 ∀x, y ∈ C Chứng minh. (a)→ (b): Do η là hệ số lồi của trên C, nên với t ∈ (0; 1) và mọi x,y thuộc C ta có: f [t.y + (1− t)x] 6 tf(y) + (1− t)f(x)− η 2 t(1− t)‖x− y‖2. Suy ra f(y)− f(x) > f [ty + (1− t)x]− f(x) + η 2t(1− t)‖x− y‖2 t = f [x+ t(y − x)]− f(x) t + η 2 (1− t)‖x− y‖2. Cho t→ 0, do f khả vi, ta được: f(y)− f(x) > f ′(x, y − x) + η 2 ‖x− y‖2. (b)→(a): Cho t ∈ (0; 1) và ω = (1− t)x+ ty. Khi đó y = ω + (1− t)(y − x), x = ω + (−t)(y − x). Ap dụng (b), ta được: f(y) > f(ω) + 〈f ′(ω), y − ω〉+ η 2 ‖ω − y‖2, f(x) > f(ω) + 〈f ′(ω), x− ω〉+ η 2 ‖ω − x‖2. Hay f(y) > f(ω) + 〈f ′(ω), (1− t)(y − x)〉+ η 2 (1− t)2‖y − x‖2, f(x) > f(ω) + 〈f ′(ω), (−t)(y − x)〉+ η 2 t2‖y − x‖2. 33 Nhân bất đẳng thức trên với t > 0 và bất đẳng thức dưới với 1− t > 0 ta được : tf(y) > tf(ω) + 〈f ′(ω), t(1− t)(y − x)〉 + η 2 t(1− t)2‖y − x‖2, (1− t)f(x) > (1− t)f(ω) + 〈f ′(ω),−t(1− t)(y − x)〉 + η 2 t2(1− t)‖y − x‖2. Cộng hai bất đẳng thức trên và chuyển vế, ta có: tf(y) + (1− t)f(x) > f(ω) + η 2 t(1− t)‖y − x‖2. Hay f [(1− t)x+ ty] 6 (1− t)f(x) + tf(y)− η 2 t(1− t)‖y − x‖2. Chứng tỏ η là hệ số lồi của f trên C. (b)→(c): Do (b), nên ∀x, y ∈ C, ta có: f(y)− f(x) > 〈f ′(x), y − x〉+ η 2 ‖x− y‖2, f(x)− f(y) > 〈f ′(y), x− y〉+ η 2 ‖x− y‖2. Cộng hai bất đẳng thức lại ta được: 0 > 〈f ′(x)− f ′(y), y − x〉+ η‖x− y‖2. Hay 〈f ′(y)− f ′(x), y − x〉 > η‖x− y‖2. (c)→(b): Đặt γ(t) = f [(1− t)x+ ty] = f [x+ t(y − x)]. Khi đó γ′(t) = 〈f ′[x+ t(y − x)], y − x〉, 34 và f(y)− f(x) = γ(1)− γ(0) = ∫ 1 0 γ′(t)dt. Bây giờ giả sử có (c). Với x, y ∈ C, đặt h := y − x. Khi đó f(y)− f(x) = ∫ 1 0 γ′(t)dt = ∫ 1 0 〈f ′[x+ t(y − x)], y − x〉dt = ∫ 1 0 f ′(x+ th).hdt = ∫ 1 0 [f ′(x) + f ′(x+ th)− f ′(x)]hdt = ∫ 1 0 (f ′(x)h+ [f ′(x+ th)− f ′(x)]h)dt = f ′(x)ht|10 + ∫ 1 0 [f ′(x+ th)− f ′(x)]hdt = f ′(x)h+ ∫ 1 0 [f ′(x+ th)− f ′(x)]hdt. Theo (c) ta có : 〈f ′(x+ th)− f ′(x), th〉 > η‖th‖2, hay [f ′(x+ th)− f ′(x)]h > ηt‖h‖2. Suy ra ∫ 1 0 [f ′(x+ th)− f ′(x)]hdt > ∫ 1 0 ηt‖h‖2dt = η t2 2 ‖h‖2|10 = η 2 ‖h‖2. Vậy f(y)− f(x) > f ′(x)h+ η 2 ‖h‖2, 35 hay f(y)− f(x) > 〈f ′(x), y − x〉+ η 2 ‖y − x‖2. 2.2.3 Tính đơn điệu của dưới vi phân Cho T là một toán tử đa trị trên Rn, tức là với mỗi x ∈ Rn, thì T (x) là một tập (có thể bằng rỗng). Như thường lệ ta ký hiệu tập hợp tất cả các tập con của Rn là 2R n . Kí hiệu miền xác định của T là domT := {x ∈ Rn | T (x) 6= ∅}, và đồ thị của T là G(T ) := {(x, y) ∈ Rn ìRn | y ∈ T (x)}. Định nghĩa 2.4. Cho T : Rn −→ 2Rn và C ⊆ domT . Ta nói T là đơn điệu tuần hoàn trên C, nếu với mọi số nguyên dương m và mọi cặp (xi, yi) ∈ G(T ), xi ∈ C (i=0,...,m) ta có: 〈x1 − x0, y0〉+ 〈x2 − x1, y1〉+ ...+ 〈x0 − xm, ym〉 6 0. (2.11) Nếu (2.11) chỉ đúng với m = 1, thì ta nói T đơn điệu trên C, tức là 〈y − y′, x− x′〉 > 0 ,∀x, x′ ∈ C , ∀y ∈ T (x) ,∀y′ ∈ T (x′). Nếu T đơn điệu (hoặc đơn điệu tuần hoàn) trên toàn domT , thì ta nói ngắn gọn là T đơn điệu (đơn điệu tuần hoàn). Nếu T ≡ ∂f thì T đơn điệu tuần hoàn trên dom(∂f). Thật vậy: ∀m ∈ N ,∀(xi, yi) ∈ G(∂f) , xi ∈ dom(∂f) (i = 0, ...n) ta có: G(∂f) = {(xi, yi) | yi ∈ ∂f(xi)}. 36 Suy ra 〈y0, x1 − x0〉+ f(x0) 6 f(x1) 〈y1, x2 − x1〉+ f(x1) 6 f(x2) ... ... ... 〈ym, x0 − xm〉+ f(xm) 6 f(x0). Cộng vế với vế của các bất đẳng thức trên, ta được: 〈y0, x1 − x0〉+ 〈y1, x2 − x1〉+ ...+ 〈ym, x0 − xm〉 6 0. Theo định nghĩa, T ≡ ∂f đơn điệu tuần hoàn trên dom(∂f). Một câu hỏi được đặt ra là điều ngược lại có đúng không? Trả lời câu hỏi này ta có mệnh đề sau: Mệnh đề 2.7. Giả sử S là một toán tử đa trị từ Rn −→ Rn. Điều kiện cần và đủ để tồn tại một hàm lồi, đóng, chính thường f trên Rn sao cho S(x) ⊆ ∂f(x) ,∀x là toán tử S đơn điệu tuần hoàn. Chứng minh. Điều kiện cần: Nếu tồn tại một hàm f lồi, đóng, chính thường trên Rn sao cho S(x) ⊆ ∂f(x) ,∀x thì S là toán tử đơn điệu tuần hoàn. ∀m ∈ N ,∀(xi, yi) ∈ G(S), xi ∈ domS(i = 0, ...m). Từ (xi, yi) ∈ G(S) ⇒ yi ∈ S(xi) ⊆ ∂f(xi), (∀i = 0, ..m), do ∂f là đơn điệu tuần hoàn trên dom(∂f) nên 〈y0, x1 − x0〉+ 〈y1, x2 − x1〉+ ...+ 〈ym, x0 − xm〉 6 0. Suy ra S là đơn điệu tuần hoàn trên domS. Điều kiện đủ: Nếu S là toán tử đơn điệu tuần hoàn thì tồn tại một hàm f lồi, đóng, chính thường trên Rn sao cho S(x) ⊆ ∂f(x) ,∀x Giả sử (x0, y0) ∈ G(S), định nghĩa hàm f bằng cách lấy f(x) := Sup{〈x− xm, ym〉+ ...+ 〈x1 − x0, y0〉}, 37 trong đó cận trên đúng được lấy trên tất cả các cặp (xi, yi) ∈ G(S) và các số nguyên dương m. Ta chứng minh: f lồi, đóng, chính thường và S(x) ⊆ ∂f(x) ,∀x. Do f là bao trên của một họ các hàm a-phin, nên f là một hàm lồi đóng. Do tính đơn điệu tuần hoàn của S, nên f(x0) := Sup{〈xo−xm, ym〉+〈xm−xm−1, ym−1〉+ ...+〈x1−x0, y0〉} := 0, suy ra dom f 6= ∅. Vậy f là chính thường. Với bất kì cặp (x, x∗) ∈ G(S), ta có x∗ ∈ S(x), ta sẽ chứng minh x∗ ∈ ∂f(x). Muốn thế ta sẽ chứng minh rằng ∀α < f(x) và y ∈ Rn , ta có α + 〈x∗, y − x〉 < f(y). Thật vậy, do α < f(x), nên theo tính chất của cận trên đúng, sẽ tồn tại các cặp (xi, yi) ∈ G(S) và số nguyên dương m (i=1,...m) thỏa mãn α < 〈x− xm, ym〉+ 〈xm − xm−1, ym−1〉+ ...+ 〈x1 − x0, y0〉. Theo định nghĩa của f(y), ta được: f(y) > 〈y − xm, ym〉+ ...+ 〈x1 − x0, y0〉 = 〈y − xm+1, ym〉+ 〈xm+1 − xm, ym〉+ ...+ 〈x1 − x0, y0〉. Thay xm+1 = x , ym = x∗, ta có f(y) > 〈y − x, x∗〉+ 〈x− xm, ym〉+ 〈xm − xm−1, ym−1〉 + ...+ 〈x1 − x0, y0〉 > 〈y − x, x∗〉+ α. Điều này đúng với mọi (x, x∗) ∈ G(S) nên S(x) ⊂ ∂f(x) ,∀x. Định nghĩa 2.5. Ta nói một toán tử T : Rn −→ 2Rn là đơn điệu cực đại nếu nó là đơn điệu và đồ thị của nó không phải là tập con thực sự của đồ thị của một toán tử đơn điệu nào khác. Toán tử T được gọi là đơn điệu tuần hoàn cực đại, nếu nó là đơn điệu tuần hoàn và đồ thị của nó không phải là tập con thực sự của đồ thị của một toán tử đơn điệu tuần hoàn nào khác. 38 Ví dụ 2.4. (Toán tử đơn điệu) Xét NC(x) := {ω | 〈ω, y − x〉 6 0 , ∀y ∈ C}. Ta chứng tỏ rằng nón pháp tuyến có tính chất đơn điệu theo nghĩa 〈ω − ω′, x− x′〉 > 0 ∀x, x′ ∈ C , ∀ω ∈ NC(x) , ∀ω′ ∈ NC(x′). Thật vậy: ∀x, x′ ∈ C ta có: + ω ∈ NC(x)⇔ 〈ω, y − x〉 6 0 ∀y ∈ C. Với y = x′, ta có 〈ω, x′ − x〉 6 0. + ω′ ∈ NC(x′)⇔ 〈ω′, y − x′〉 6 0 ∀y ∈ C. Với y = x, ta có 〈ω′, x− x′〉 6 0. ⇒ 〈ω, x′ − x〉+ 〈ω′, x− x′〉 6 0. ⇒ 〈ω − ω′, x− x′〉 > 0. Ví dụ 2.5. (Toán tử đơn điệu) Xét ánh xạ f : R2 −→ R2 x 7−→ f(x) = Qx = (x2,−x1). Với x = (x1, x2), Q = ( 0 1 −1 0 ) . Với mọi x = (x1, x2), y = (y1, y2) ∈ R2 ta có: + x− y = (x1 − y1, x2 − y2). + f(x)− f(y) = (x2 − y2,−x1 + y1). Suy ra 〈f(x)− f(y), x− y〉 = (x2 − y2)(x1 − y1) + (−x1 + y1)(x2 − y2) = 0 ∀x, y ∈ R2. Vậy f là ánh xạ đơn điệu trên R2. Hệ quả 2.1. Mọi toán tử đơn điệu tuần hoàn cực đại trong Rn đều là dưới vi phân của một hàm lồi, đóng, chính thường trên Rn. 39 Chứng minh. Giả sử S là toán tử đơn điệu tuần hoàn cực đại trong Rn. Theo định nghĩa ta có : + S là toán tử đơn điệu tuần hoàn . + G(S) không là tập con thực sự của đồ thị của một toán tử đơn điệu tuần hoàn nào khác. Do S là toán tử đơn điệu tuần hoàn nên theo mệnh đề 2.7, tồn tại một hàm lồi, đóng, chính thường f trên Rn sao cho S(x) ⊆ ∂f(x) , ∀x. Ta có :∀(x, y) ∈ G(S)⇒ y ∈ S(x) do S(x) ⊆ ∂f(x),∀x nên y ∈ ∂f(x) ⇒ (x, y) ∈ G(∂f). Vậy G(S) ⊂ G(∂f). Do G(S) không là tập con thực sự của đồ thị của một toán tử đơn điệu tuần hoàn nào khác và ∂f là toán tử đơn điệu tuần hoàn nên G(S) = G(∂f). Suy ra S ≡ ∂f . 2.2.4 Tính liên tục của dưới vi phân Định nghĩa 2.6. Một ánh xạ T : Rn −→ 2Rn được gọi là đóng tại x, nếu với mọi dãy xk → x, mọi yk ∈ T (xk) và yk → y thì y ∈ T (x) Định nghĩa 2.7. Một ánh xạ T : Rn −→ 2Rn được gọi là nửa liên tục trên tại x, nếu với mọi tập mở G chứa T(x), tồn tại một lân cận mở U của x sao cho T (z) ⊂ G,∀z ∈ U. Ta nói ánh xạ T là đóng (nửa liên tục trên) trên tập C, nếu nó đóng (nửa liên tục trên) tại mọi điểm thuộc C. Một ánh xạ T được gọi là đóng nếu đồ thị của T là một tập đóng. Nói một cách khái quát, bổ đề dưới đây chỉ ra rằng: Một dãy hàm lồi nếu bị chặn trên bởi một hàm lồi theo từng điểm ở trên một tập lồi, mở, thì sẽ bị chặn trên đều bởi chính hàm lồi đó trên mọi tập compắc thuộc tập mở này. Bổ đề 2.1. Cho một tập lồi, mở G ⊆ Rn và f là một hàm lồi nhận giá trị hữu hạn trên G. Giả sử {fi}i ∈ I là một dãy các hàm lồi hữu hạn trên G và hội tụ theo từng điểm trên G đến f . Giả sử lim sup fi(x) 6 f(x) ,∀x ∈ G. 40 Khi đó với mọi tập compắc K ⊆ G, với mọi > 0, tồn tại chỉ số i sao cho fi(x) 6 f(x) + , ∀i > i ,∀x ∈ K. Chứng minh. Với mọi x ∈ G, mọi i ∈ N , định nghĩa gi(x) := max{fi(x), f(x)}. Hàm gi lồi, hữu hạn trên G vì nó là hàm bao trên của hai hàm lồi, hữu hạn trên G. Do G mở, nên gi liên tục trên G. Do K ⊆ G compắc, nên dãy {gi(x)}i ∈ I bị chặn. Không giảm tổng quát, bằng cách qua dãy con, ta có thể coi gi(x)→ l(x) khi i→ +∞. Theo định nghĩa của gi(x) và do lim sup fi(x) 6 f(x) ∀x ∈ K, ta suy ra l(x) = f(x). Vậy dãy gi(x) hội tụ theo từng điểm đến f trên tập compắc K, nên nó hội tụ đều đến f trên K. Nhưng do gi := max{fi(x), f(x)}, nên với mọi tập compắc K ⊆ G, với mọi > 0,∃i : ∀i > i ta có fi(x) 6 f(x) + , ∀x ∈ K. Từ mệnh đề sau, suy ra tính nửa liên tục trên của ánh xạ ∂f . Cụ thể là: Mệnh đề 2.8. Cho một tập lồi, mở U ⊆ Rn và f là một hàm lồi nhận giá trị hữu hạn trên U . Giả sử {fi}i ∈ I là một dãy các hàm lồi hữu hạn trên U và hội tụ theo từng điểm trên U đến f . Khi đó, nếu dãy {xi} ⊂ U hội tụ đến x ∈ U , thì với mọi > 0, tồn tại chỉ số i sao cho ∂fi(x i) ⊂ ∂f(x) + .B(0, 1) ,∀i > i, trong đó B(0, 1) là hình cầu đơn vị đóng tâm ở O 41 Chứng minh. Cho α > 0 , y ∈ Rn. Với mỗi x ∈ U đặt à := f ′(x, y) + α. Do f lồi, hữu hạn trên tập U mở và x ∈ U , nên x ∈ int(dom f), do đó à hữu hạn. Do x ∈ int(dom f), nên với mọi y, tồn tại δ > 0 sao cho x+ λ.y ∈ int(dom f) với mọi 0 < λ < δ. Do α > 0 và định nghĩa của f ′(x, y), ta có : f(x+ λ.y)− f(x) λ < à ,∀λ ∈ (0, δ). (2.12) Do fi(x+ λ.y)→ f(x+ λ.y) và fi(xi)→ f(x), nên từ (2.12), tồn tại i1 sao cho fi(x i + λ.y)− fi(xi) λ i1 ,∀λ ∈ (0, δ). Do f ′i(x i, y) 6 fi(x i + λ.y)− fi(xi) λ nên f ′i(x i, y) 6 à với mọi i > i1. Vậy lim sup f ′i(x i, y) 6 à = f ′(x, y) + α. Do điều này đúng với mọi α > 0, ta suy ra lim sup f ′i(x i, y) < f ′(x, y). Vì f ′i(x i, .) và f ′(x, .) lồi, hữu hạn trên U ( do x ∈ U ⊂ int(dom f)) nên áp dụng bổ đề 2.1 cho các hàm lồi f ′i(x i, .) và f ′(x, .) với G = Rn, K = B(0, 1) ta có : Với mọi tập compắc B(0, 1) ⊆ Rn ,∀ > 0 ,∃i sao cho ∀i > i ta có f ′i(x i, y) 6 f ′(x, y) + , ∀y ∈ B(0, 1). Từ đây, với mọi y 6= 0, theo tính chất thuần nhất dương của f ′(x, .), ta có: 1 ‖y‖f ′ i(x i, y) = f ′i(x i, y ‖y‖) 6 f ′(x, y ‖y‖) + . 42 Hay f ′i(x i, y) 6 f ′(x, y) + .‖y‖ ,∀i > i ,∀y. Do f ′i(x i, y) là hàm tựa của ∂fi(x i) và f ′(x, y) là hàm tựa của ∂f(x) nên từ đây suy ra ∂fi(x i) ⊆ ∂f(x) + .B(0, 1). Mệnh đề 2.9. Cho f là một hàm lồi chính thường trên Rn. Khi đó ánh xạ dưới vi phân x −→ ∂f(x) nửa liên tục trên tại mọi điểm x ∈ int(dom f) Chứng minh. Ta có f lồi nên nó hữu hạn trên tập int(dom f). Vậy áp dụng mệnh đề 2.8 với U = int(dom f) và fi = f, ∀i, ta có: Nếu x ∈ int(dom f) và {xi} ⊂ int(dom f) hội tụ đến x thì với mọi > 0, tồn tại i sao cho ∀i > i ta có ∂f(xi) ⊂ ∂f(x) + .B(0, 1). Suy ra ∂f nửa liên tục trên tại mọi điểm x ∈ int(dom f). Mệnh đề 2.10. Cho f là một hàm lồi chính thường trên Rn. Nếu f khả vi trên tập int(dom f) thì nó khả vi liên tục trên tập này. Chứng minh. Cho x ∈ int(dom f) và dãy{xi} ⊂ int(dom f). Ta áp dụng mệnh đề 2.8 với U = int(dom f) và Ofi = Of , ∀i, ta có: ∀ > 0 tồn tại i sao cho ∀i > i, ‖Of(xi)− Of(x)‖ 6 . Chứng tỏ Of(.) liên tục tại x. 2.2.5 Phép tính với dưới đạo hàm Tương tự giải tích cổ điển, nếu f là một hàm lồi chính thường trong Rn thì ∂(λf)(x) = λ.∂f(x) ,∀λ > 0 ,∀x. 43 Thật vậy x∗ ∈ ∂(λf)(x)⇔ 〈x∗, z − x〉+ (λf)(x) 6 (λf)(z) ,∀z ⇔ 〈x∗, z − x〉+ λf(x) 6 λf(z) ,∀z ⇔ 〈x ∗ λ , z − x〉+ f(x) 6 f(z) ,∀z ⇔ x ∗ λ ∈ ∂f(x) ⇔ x∗ ∈ λ∂f(x). Đối với dưới vi phân của tổng các hàm lồi, ta có định lý sau: Mệnh đề 2.11. (Định lý Moreau-Rockafellar). Cho fi, i=1,...,m là các hàm lồi chính thường trên Rn. Khi đó m∑ i=1 ∂fi(x) ⊆ ∂( m∑ i=1 fi(x)) ,∀x. Nếu ∩ ri(dom fi) 6= ∅ thì m∑ i=1 ∂fi(x) = ∂( m∑ i=1 fi(x)) ,∀x Chứng minh. Ta chứng minh m∑ i=1 ∂fi(x) ⊆ ∂( m∑ i=1 fi(x)),∀x. Nếu x∗ ∈∑mi=1 ∂fi(x) thì x∗ = ∑mi=1 x∗i , x∗i ∈ ∂fi(x), i = 1, ..,m. Ta có x∗i ∈ ∂fi(x), i = 1, ...,m⇔ 〈x∗i , z − x〉+ fi(x) 6 fi(z) ,∀z , i = 1, ...,m ⇒ 〈 m∑ i=1 x∗i , z − x〉+ m∑ i=1 fi(x) 6 m∑ i=1 fi(z),∀z ⇔ 〈x∗, z − x〉+ m∑ i=1 fi(x) 6 m∑ i=1 fi(z),∀z ⇔ x∗ ∈ ∂( m∑ i=1 fi(x)) ,∀x. Vậy ∑m i=1 ∂fi(x) ⊆ ∂( ∑m i=1 fi(x)),∀x. 44 Ta chứng minh m∑ i=1 ∂fi(x) ⊇ ∂( m∑ i=1 fi(x)) ,∀x. Chỉ cần chứng minh với m = 2, với m > 2 dùng quy nạp. Lấy x0 ∈ Rn và x∗ ∈ ∂( 2∑ i=1 fi(x 0)) = ∂(f1(x 0) + f2(x 0)) = ∂(f1 + f2)(x 0). Theo định nghĩa của dưới vi phân ta có: 〈x∗, x− x0〉+ f1(x0) + f2(x0) 6 f1(x) + f2(x) ∀x ⇔f1(x) + f2(x)− f1(x0)− f2(x0)− 〈x∗, x− x0〉 > 0 ∀x ⇔ { f1(x) + f2(y)− f1(x0)− f2(x0)− 〈x∗, x− x0〉 < 0 x = y không có nghiệm. Lấy D = dom f1ì dom f2 và A(x, y) = x− y. Theo giả thiết f1 liên tục tại một điểm a ∈ dom f1 ∩ dom f2, nên tồn tại một lân cận U của gốc sao cho U = (a+ U)− a ⊂ dom f1 − dom f2 = A(D). Vậy 0 ∈ intA(D), áp dụng mệnh đề 1.4 với f(x, y) = f1(x) + f2(y)− f1(x0)− f2(x0)− 〈x∗, x− x0〉 A(x, y) = x− y. Ta có 〈t, x− y〉+ [f1(x) + f2(y)− f1(x0)− f2(x0)− 〈x∗, x− x0〉] > 0, ∀x ∈ dom f1 , y ∈ dom f2. Đối với x 6∈ dom f1 và y 6∈ dom f2, thì bất đẳng thức trên là hiển nhiên. Vậy 〈t, x− y〉+ [f1(x) + f2(y)− f1(x0)− f2(x0)− 〈x∗, x− x0〉] > 0 ,∀x, y. 45 Lấy x = x0 ta có 〈t, y − x0〉+ f2(x0) 6 f2(y) ,∀y. Chứng tỏ t ∈ ∂f2(x0). Lấy y = x0 ta có 〈x∗ − t, x− x0〉+ f1(x0) 6 f1(x) ,∀x. Chứng tỏ x∗ − t ∈ ∂f1(x0). Do đó x∗ = (x∗ − t) + t ∈ ∂f1(x0) + ∂f2(x0). 2.3 Dưới vi phân xấp xỉ Dưới vi phân xấp xỉ, hay còn được gọi là -dưới vi phân, thường được sử dụng trong thực tế bởi hai lý do chính sau đây. Một là hàm lồi có thể không khả dưới vi phân tại những điểm thuộc biên của miền hữu dụng của nó, trong khi đó, như sẽ thấy dưới đây, trong miền này, dưới vi phân xấp xỉ luôn tồn tại. Lý do thứ hai quan trọng hơn là trong ứng dụng, thường người ta chỉ cần, và nhiều khi chỉ tính được dưới vi phân một cách xấp xỉ. Định nghĩa 2.8. Cho > 0. Một véctơ x∗ được gọi là -dưới đạo hàm của f tại x, nếu 〈x∗, y − x〉+ f(x) 6 f(y) + , ∀y. Kí hiệu tập hợp tất cả -dưới đạo hàm của f tại x là ∂f(x). Tập hợp này được gọi là -dưới vi phân. Hiển nhiên ∂0f(x) = ∂f(x). Vậy dưới đạo hàm xấp xỉ là một khái niệm tổng quát hoá của dưới đạo hàm chính xác. Nhận xét: Theo định nghĩa x∗ ∈ ∂f(x)⇔ 〈x∗, z − x〉+ f(x) 6 f(z) + , ∀z. 46 Thay z = y + x , ta được 〈x∗, y〉+ f(x) 6 f(x+ y) + , ∀y. Từ đây, nếu đặt h(y) = f(x+ y)− f(x) , ta có 〈x∗, y〉 − h(y) 6 , ∀y. Theo định nghĩa hàm liên hợp, ta có ∂f(x) = {x∗|h∗(x∗) 6 }. Do h∗ là một hàm lồi, đóng nên từ đây thấy rằng ∂f(x) luôn là một tập lồi, đóng . Hiển nhiên ∂f(x) ⊆ ∂′f(x) nếu 6 ′. Hơn nữa ∩>0∂f(x) nếu khác rỗng thì sẽ bằng ∂f(x). Ví dụ 2.6. Cho hàm một biến f(x) = { −2x 12 nếu x > 0, +∞ nếu x < 0. Ta có ∂f(0) 6= ∅ với > 0. Thật vậy, lấy x∗ ∈ ∂f(0), ta có: x∗ ∈ ∂f(0)⇔ 〈x∗, y − 0〉+ f(0) 6 f(y) + , ∀y ⇔ x∗y 6 −2√y + , ∀y > 0. Nếu y = 0 thì 0 6 . Vậy bất đẳng thức trên được thoả mãn với mọi x∗. Nếu y > 0 thì x∗ 6 −2 √ y y . Vậy ∂f(0) 6= ∅ với > 0. Mặt khác ∂f(0) = ∅ ( đã chứng minh phần trước ). Ví dụ trên cho thấy rằng ∂f(x) 6= ∅ với mọi > 0, tuy nhiên ∂f(x) = ∅. Mệnh đề sau đây nói rằng mọi hàm lồi đóng đều khả -dưới vi phân với mọi > 0 tại mọi điểm thuộc miền hữu dụng của nó . Mệnh đề 2.12. Cho f là một hàm lồi đóng chính thường trên Rn. Khi đó với mọi > 0 và mọi x0 ∈ dom f , tập ∂f(x0) 6= ∅. Hơn nữa với mọi tập bị chặn C ⊂ int(dom f) tập ∂f(C) bị chặn. 47 Chứng minh. Do f lồi, đóng, chính thường nên epi f lồi, đóng, khác rỗng. Do epi f đóng nên điểm (x0, f(x0) − ) 6∈ epi f với mọi > 0. Ta áp dụng định lý tách chặt cho hai tập C := epi f và D := {(x0, f(x0)− )}, sẽ tồn tại (p, t) 6= 0, p ∈ Rn, t ∈ R và số thực η ( phụ thuộc ) sao cho: 〈p, t〉 − tν < η < 〈p, x0〉 − t[f(x0)− ] ,∀(x, ν) ∈ epi f. (2.13) Từ đây ta có t 6= 0, vì nếu t=0 thì 〈p, x〉 < η < 〈p, x0〉 ,∀x ∈ dom f và do đó ta có mâu thuẫn nếu lấy x = x0. Hơn nữa t > 0, vì nếu t < 0 ta sẽ có mâu thuẫn từ (2.13) khi cho ν đủ lớn . Thay ν = f(x) và chia hai vế của (2.13) cho t > 0, ta có 〈p t , x〉 − f(x) < η t < 〈p t , x0〉 − f(x0) + . Suy ra 〈p t , x− x0〉+ f(x0) < f(x) + . Vậy p t ∈ ∂f(x0) hay ∂f(x0) 6= ∅. Giả sử C ⊂ int(dom f), C bị chặn. Đặt ξ = Supx∗∈∂f(C) ‖x∗‖ = Supx∈C Supx∗∈∂f(C) ‖x∗‖. (2.14) Xét ánh xạ tuyến tính 〈x∗, z〉. Chuẩn của ánh xạ tuyến tính này là ‖x∗‖ = Sup‖z‖=1〈x∗, z〉. Thay vào (2.14) ta có ξ = Supx∈C Supx∗∈∂f(x) Sup‖z‖=1〈x∗, z〉. Mặt khác x∗ ∈ ∂f(x)⇔ f ′(x, y) + β > 〈x∗, y〉 ,∀β > 0 ,∀y. 48 Do đó f ′(x, y) + β = Supx∗∈∂f(x)〈x∗, y〉 ,∀β > 0 ,∀y. Hay f ′(x, z) + β = Supx∗∈∂f(x)〈x∗, z〉 ,∀β > 0 ,∀z. Ta có tiếp ξ = Sup‖z‖=1 Supx∈C(f ′(x, z) + β) = Sup‖z‖=1 Supx∈C f ′(x, z) + β. Đặt g(z) := Supx∈C f ′(x, z). Do x ∈ C ⊆ int(dom f), nên hàm f ′(x, z) lồi trên Rn (do đó liên tục). Suy ra hàm g liên tục vì là bao trên của một họ hàm lồi liên tục trên Rn. Vậy ξ = Sup‖z‖=1 g(z) + β = max‖z‖=1 g(z) + β < +∞. Chứng tỏ ∂f(C) bị chặn. Mệnh đề 2.13. Cho f : Rn −→ R là hàm lồi đóng. Khi đó một véc-tơ x∗ là - dưới vi phân của f tại x ∈ dom f khi và chỉ khi f ∗(x∗) + f(x)− 〈x∗, x〉 6 . Chứng minh. Dùng định nghĩa -dưới đạo hàm ta có: x∗ ∈ ∂f(x)⇔ 〈x∗, y − x〉+ f(x) 6 f(y) + , ∀y ∈ dom f ⇔ [〈x∗, y〉 − f(y)] + f(x)− 〈x∗, x〉 6 , ∀y ∈ dom f. Theo định nghĩa của f ∗(x∗) ta có: f ∗(x∗) = Supy{〈x∗, y〉 − f(y)}. Vậy f ∗(x∗) + f(x)− 〈x∗, x〉 6 . 49 Định nghĩa 2.9. Cho C ⊆ Rn là một tập lồi, đóng và x ∈ C. Tập -nón pháp tuyến ngoài của C tại x là -dưới vi phân của hàm chỉ của C tại x. Tức là: NC,(x) := ∂δC(x) = {x∗ ∈ Rn | 〈x∗, y − x〉 6 , ∀y ∈ C} Định lý 2.1. Cho f là hàm lồi, đóng, chính thường trên Rn. 0 ∈ ∂f(x)⇔ f(x) 6 f(y) + , ∀y ∈ Rn. Chứng minh. Theo định nghĩa dưới vi phân xấp xỉ ta có: 0 ∈ ∂f(x)⇔ 〈0, y − x〉+ f(x) 6 f(y) + , ∀y ∈ Rn ⇔ f(x) 6 f(y) + , ∀y ∈ Rn. Mệnh đề 2.14. Cho fi, i=1,...,m là các hàm lồi chính thường trên R n . Giả sử ∩ri(dom fi) 6= ∅. Khi đó ∂ ( m∑ i=1 fi(x) ) ⊆ m∑ i=1 ∂fi(x) ∀x. Đặc biệt ∂ ( m∑ i=1 fi(x) ) = m∑ i=1 ∂fi(x), ∀x⇔ = 0. Chứng minh. Ta chứng minh cho m = 2. Với m > 2 dùng quy nạp. Ta lấy x0 ∈ Rn và x∗ ∈ ∂( 2∑ i=1 fi(x 0)) = ∂(f1(x 0) + f2(x 0)) = ∂(f1 + f2)(x 0). 50 Theo định nghĩa của dưới vi phân xấp xỉ, ta có: x∗ ∈ ∂(f1 + f2)(x0) ⇔〈x∗, x− x0〉+ (f1 + f2)(x0) 6 (f1 + f2)(x) + ∀x ⇔〈x∗, x− x0〉+ f1(x0) + f2(x0) 6 f1(x) + f2(x) + ∀x ⇔f1(x) + f2(x)− f1(x0)− f2(x0)− 〈x∗, x− x0〉+ > 0 ∀x ⇒hệ { f1(x) + f2(y)− f1(x0)− f2(x0)− 〈x∗, x− x0〉+ < 0 x = y không có nghiệm. (2.15) Lấy D = dom f1 ì dom f2, A(x, y) = x− y, f(x, y) = f1(x) + f2(y)− f1(x0)− f2(x0)− 〈x∗, x− x0〉+ . Theo giả thiết f1 liên tục tại một điểm a ∈ dom f1 ∩ dom f2, nên tồn tại một lân cận U của gốc sao cho U = (a+ U)− a ⊂ dom f1 − dom f2 = A(D). Vậy 0 ∈ intA(D). Lúc này (2.15) có dạng: hệ  f(x, y) < 0 A(x, y) = 0 (x, y) ∈ D không có mghiệm Ap dụng mệnh đề 1.4 ta có: 〈t, A(x, y)− 0〉+ f(x, y) > 0 ∀(x, y) ∈ D. ⇔ 〈t, x− y〉+ f1(x) + f2(y)− f1(x0)− f2(x0) + 〈x∗, x− x0〉+ > 0, ∀x ∈ dom f1 ,∀y ∈ dom f2. 51 Đối với x 6∈ dom f1 và y 6∈ dom f2 thì bất đẳng thức trên là hiển nhiên. Vậy 〈t, x− y〉+ f1(x) + f2(y)− f1(x0)− f2(x0) + 〈x∗, x−x0〉+ > 0 ∀x, y. Lấy x = x0 ta có : 〈t, x0 − y〉+ f2(y)− f2(x0) + > 0 ∀y ⇔ 〈t, y − x0〉+ f2(x0) 6 f2(y) + ∀y ⇔ t ∈ ∂f2(x0). Lấy y = x0 ta có: 〈t, x− x0〉+ f1(x)− f1(x0)− 〈x∗, x− x0〉+ > 0 ∀x ⇔ 〈x∗ − t, x− x0〉+ f1(x0) 6 f1(x) + ∀x ⇔ x∗ − t ∈ ∂f1(x0). Do đó x∗ = (x∗ − t) + t ⊆ ∂f1(x0) + ∂f2(x0). Vậy ∂(f1(x 0) + f2(x 0)) ⊆ ∂f1(x0) + ∂f2(x0). Chương 3 Một số ứng dụng của dưới vi phân trong tối ưu hoá Chương này trước hết giới thiệu một số khái niệm chung về cực tiểu, - cực tiểu của một hàm lồi. Tiếp theo trình bày điều kiện cần và đủ của nghiệm tối ưu của bài toán lồi với các ràng buộc khác nhau (Không ràng buộc, ràng buộc đẳng thức, ràng buộc bất đẳng thức). Cuối chương trình bày điều kiện cần và đủ của nghiệm tối ưu xấp xỉ của bài toán lồi với các ràng buộc khác nhau. 3.1 Các khái niệm Định nghĩa 3.1. Cho C ⊆ Rn khác rỗng và f : Rn −→ R ∪ {+∞}. a) Điểm x∗ ∈ C được gọi là cực tiểu địa phương của f trên C nếu tồn tại một lân cận U của x∗ sao cho f(x∗) 6 f(x),∀x ∈ U ∩ C. b) Điểm x∗ ∈ C được gọi là cực tiểu toàn cục (hay cực tiểu tuyệt đối ) của f trên C nếu f(x∗) 6 f(x),∀x ∈ C. c) Điểm x ∈ C được gọi là điểm chấp nhận được của bài toán. Định nghĩa 3.2. Cho > 0. Một điểm x ∈ C được gọi là điểm -cực tiểu toàn cục của f trên C nếu f(x) 6 f(x) + ,∀x ∈ C. 52 53 3.2 Bài toán lồi không có ràng buộc Xét bài toán (P1) {minh(x) | x ∈ Rn}. Trong đó h là một hàm lồi chính thường trên Rn. Mệnh đề 3.1. x∗ là nghiệm của bài toán (P1)⇔ 0 ∈ ∂h(x∗). Chứng minh. Ta có: x∗là nghiệm của bài toán (P1)⇔ x∗là điểm cực tiểu của h trên Rn ⇔ h(x∗) 6 h(x) ,∀x ∈ Rn ⇔ 〈0, x− x∗〉+ h(x∗) 6 h(x) ,∀x ∈ Rn ⇔ 0 ∈ ∂h(x∗). 3.3 Bài toán lồi với ràng buộc đẳng thức Xét bài toán (P2) {min f(x) | x ∈ C}. Trong đó C ⊆ Rn là một tập lồi khác rỗng và f là một hàm lồi trên C. Mệnh đề 3.2. Giả sử ri(dom f) ∩ riC 6= ∅. x∗ ∈ C là nghiệm của bài toán (P2)⇔ 0 ∈ ∂f(x∗) +NC(x∗), trong đó NC(x ∗) := {ω | 〈ω, x− x∗〉 6 0 ,∀x ∈ C} là nón pháp tuyến ngoài của C tại x∗. Chứng minh. Gọi δC(.) là hàm chỉ của tập C , tức là δC(x) := { 0 nếu x ∈ C, +∞ nếu x 6∈ C. 54 Khi đó x∗ là nghiệm của bài toán (P2) ⇔x∗ là điểm cực tiểu của f trên C ⇔x∗ là điểm cực tiểu của h(x) := f(x) + δC(x) trênRn ⇔0 ∈ ∂h(x∗) (theo mệnh đề 3.1). Do ri(dom f) ∩ riC 6= ∅, theo định lý Moreau-Rockafellar ta có: ∂h(x∗) = ∂[f(x∗) + δC(x∗)] = ∂f(x∗) + ∂δC(x∗). Vì x∗ ∈ C nên ∂δC(x∗) = NC(x∗). Vậy ∂h(x∗) = ∂f(x∗) +NC(x∗). Suy ra 0 ∈ ∂f(x∗) +NC(x∗). 3.4 Bài toán lồi với ràng buộc bất đẳng thức Xét bài toán tìm cực tiểu của một hàm lồi trên một tập lồi có dạng sau: (OP ) {min f(x) | gi(x) 6 0 (i = 1, ....m), x ∈ X}. Trong đó X ⊆ Rn là một tập lồi đóng khác rỗng và f, gi (i=1,..m) là các hàm lồi hữu hạn trên X . Ta sẽ luôn giả sủ rằng X có điểm trong. Bài toán (OP) này được gọi là một quy hoạch lồi. Hàm f được gọi là hàm mục tiêu. Các điều kiện x ∈ X, gi(x) 6 0 (i = 1, ...m) được gọi là các ràng buộc. Tập D := {x ∈ X | gi(x) 6 0 i = 1, ...m} được gọi là miền chấp nhận được. Một điểm x ∈ D được gọi là điểm chấp nhận được của bài toán (OP). Do X là tập lồi, các hàm gi (i=1,..,m) lồi trên X nên D là một tập lồi. Điểm cực tiểu của f trên D cũng được gọi là nghiệm tối ưu của bài toán (OP). 55 Ta xây dựng hàm sau, được gọi là hàm Lagrange, cho bài toán (OP): L(x, λ) := λ0f(x) + m∑ i=1 λigi(x), với λ = (λ0, ..., λm) Dựa vào hàm Lagrange ta có kết qủa sau: Định lý 3.1. (Karush- Kuhn- Tucker) Giả sử ri(dom f) ∩ ri(dom gi) ∩ riX 6= ∅ a) Nếu x∗ là nghiệm của bài toán (OP) thì tồn tại λ∗i > 0 (i=0,...,m) không đồng thời bằng 0 sao cho: 1) L(x∗, λ∗) = minx∈X L(x, λ∗) (điều kiện đạo hàm triệt tiêu ) (⇔ 0 ∈ λ∗0∂f(x∗) + m∑ i=1 λ∗i∂gi(x ∗) +NX(x∗) ). Trong đó NX(x ∗) là nón pháp tuyến ngoài của X tại x∗ . 2) λ∗i gi(x ∗) = 0 (i = 1, ...,m) (điều kiện độ lệch bù). Hơn nữa nếu điều kiện Slater sau thoả mãn: ∃x0 ∈ X : gi(x0) 0. b) Nếu hai điều kiện đạo hàm triệt tiêu và độ lệch bù ở trên được thoả mãn với λ∗0 > 0 thì điểm chấp nhận được x ∗ là nghiệm tối ưu của bài toán (OP) Chứng minh. a) Giả sử x∗ là nghiệm của bài toán (OP). Đặt C :={(λ0, λ1, ..., λm) ∈ Rm+1|∃x ∈ X : f(x)− f(x∗) < λ0, gi(x) 6 λi, i = 1, ...,m}. Do X 6= ∅ lồi, f, gi lồi trên X , nên C là một tập lồi . 56 Ta có C 6= ∅. Thật vậy: + Lấy (λ0, ..., λm) ∈ intRm+1+ . Khi đó λi > 0 (i = 1, ...,m). + Với x = x∗, ta có f(x∗)− f(x∗) = 0 < λ0 gi(x ∗) 6 0 < λi (i = 1, ...,m). ⇒ (λ0, ..., λm) ∈ C. ⇒ intRm+1+ ⊂ C. ⇒ C 6= ∅ trong Rm+1. Hơn nữa 0 6∈ C. Thật vậy, nếu 0 ∈ C thì ∃x ∈ X : f(x)− f(x∗) < 0 gi(x) 6 0 (i = 1, ...,m). Do đó x∗ không là nghiệm của bài toán (OP)⇒ mâu thuẫn. Vậy 0 6∈ C. Theo định lý tách thứ 1, có thể tách các tập C và {0}, tức là ∃λ∗i (i=0,...m) không đồng thời bằng 0 sao cho m∑ i=0 λ∗iλi > 0 ∀(λ0, ..., λm) ∈ C. (3.1) Do intRm+1+ ⊂ C, ta suy ra λ∗i > 0. Với > 0 và x ∈ X , lấy λ0 = f(x)− f(x∗) + λi = gi(x) (i = 1, ...,m). Thay vào (3.1) ta có λ∗0[f(x)− f(x∗) + ] + m∑ i=1 λ∗i gi(x) > 0 ∀x ∈ X. Cho → 0 ta được λ∗0f(x) + m∑ i=1 λ∗i gi(x) > λ∗0f(x∗) ∀x ∈ X. (3.2) 57 Do x∗ là điểm chấp nhận được nên ta có gi(x∗) 6 0 (i = 1, ...,m). Vậy λ∗0f(x ∗) > λ∗0f(x∗) + m∑ i=1 λ∗i gi(x ∗). (3.3) Từ (3.2) và (3.3) ta có λ∗0f(x) + m∑ i=1 λ∗i gi(x) > λ∗0f(x∗) + m∑ i=1 λ∗i gi(x ∗) ∀x ∈ X ⇔L(x, λ∗) > L(x∗, λ∗) ∀x ∈ X ⇔L(x∗, λ∗) = minx∈X L(x, λ∗) (điều kiện đạo hàm triệt tiêu). Ta chú ý rằng x∗ là nghiệm của bài toán {minL(x, λ∗), x ∈ X} khi và chỉ khi x∗ là điểm cực tiểu của hàm L(x, λ∗) trên X ⇔x∗ là điểm cực tiểu của hàm L1(x, λ∗) := L(x, λ∗) + δX(x) trênRn. ⇔0 ∈ ∂L1(x∗, λ∗) (theo mệnh đề 3.1). Do ri(dom f) ∩ ri(dom gi) ∩ riX 6= ∅ và f, gi (i:=1,...,m) là các hàm lồi, hữu hạn trên X nên theo định lý Moreau-Rockafellar ta có ∂L1(x ∗, λ∗) = ∂[L(x∗, λ∗) + δX(x∗)] = ∂[λ∗0f(x ∗) + m∑ i=1 λ∗i gi(x ∗)] + ∂δX(x∗) = λ∗0∂f(x ∗) + m∑ i=1 λ∗i∂gi(x ∗) +NX(x∗) (vì ∂δX(x ∗) = NX(x∗) ). Vậy 0 ∈ λ∗0∂f(x∗) + m∑ i=1 λ∗i∂gi(x ∗) +NX(x∗). Do x∗ là điểm chấp nhận được nên gi(x∗) 6 0 (i = 1, ...,m). Nếu ∃i ∈ {1, ...,m} : gi(x∗) = ξ < 0 thì ∀ > 0 , f(x∗)− f(x∗) = 0 < gj(x ∗) 6 0 < (j = 1, ..., i− 1, i+ 1, ...,m). 58 ⇒ (, ..., , ξ, , ..., ) ∈ C (ξ ở vị trí thứ i). ⇒ λ∗i ξ > 0 ( thay vào (3.1) và cho → 0) ⇒ λ∗i 6 0. Theo chứng minh trên ta có λ∗i > 0. Vậy λ∗i = 0. Như vậy là, nếu gi(x ∗) < 0 thì λ∗i = 0. Do đó λ∗i gi(x ∗) = 0 (i = 1, ..,m) (điều kiện độ lệch bù ). Giả sử điều kiện Slater được thoả mãn: ∃x0 ∈ X : gi(x0) < 0. Khi đó nếu λ∗0 = 0 thì do điều kiện đạo hàm triệt tiêu và độ lệch bù ta có 0 = λ∗0f(x ∗) + m∑ i=1 λ∗i gi(x ∗) 6 λ∗0f(x) + m∑ i=1 λ∗i gi(x) ,∀x ∈ X. Do λ∗0 = 0 nên phải có ít nhất một λ ∗ i > 0. Thay x0 vào bất đẳng thức trên, sẽ được 0 = λ∗0f(x ∗) + m∑ i=1 λ∗i gi(x ∗) 6 λ∗0f(x0) + m∑ i=1 λ∗i gi(x 0) < 0. Suy ra mâu thuẫn. Vậy λ∗0 6= 0 tức là λ∗0 > 0. b) Giả sử x∗ là điểm chấp nhận được thoả mãn hai điều kiện đạo hàm triệt tiêu và độ lệch bù ở trên với λ∗0 > 0, λ ∗ i > 0 (i = 1, ...,m). Do λ∗0 > 0, nên bằng cách chia cho λ ∗ 0, ta có thể coi hàm Lagrange là L(x, λ) = f(x) + m∑ i=1 λigi(x). Từ điều kiện đạo hàm triệt tiêu và độ lệch bù, ta có: f(x∗) + m∑ i=1 λ∗i gi(x ∗) 6 f(x) + m∑ i=1 λ∗i gi(x) ∀x ∈ X λ∗i gi(x ∗) = 0 (i = 1, ...,m). Suy ra f(x∗) 6 f(x) + m∑ i=1 λ∗i gi(x) ,∀x ∈ X. (3.4) 59 Với mọi x là điểm chấp nhận được, tức là: x ∈ X : gi(x) < 0 , i = 1, ...,m, ta có f(x) + m∑ i=1 λ∗i gi(x) 6 f(x). (3.5) Từ (3.4) và (3.5) suy ra f(x∗) 6 f(x) ,∀x ∈ X .Chứng tỏ x∗ là nghiệm tối ưu của bài toán (OP). Ví dụ 3.1. Ap dụng định lý cho bài toán sau: {min f(x) | gi(x) 6 0 (i = 1, 2) , x ∈ X}, (OP ) trong đó f(x) = x2, g1(x) = x 2 − x, g2(x) = −x,X = [−12 , 12 ]. Giải: Ta có miền chấp nhận được D = {x ∈ X | gi(x) 6 0 (i = 1, 2)} = [0, 1 2 ]. Giả sử tồn tại λ∗i > 0 (i = 0, ..., 2) không đồng thời bằng 0 sao cho: 1) L(x∗, λ∗) = minx∈X L(x, λ∗) (⇔ 0 ∈ λ∗0∂f(x∗) + ∑2 i=1 λ ∗ i∂gi(x ∗) +NX(x∗) ). 2) λ∗i gi(x ∗) = 0, i = 1, 2. 3) λ∗0 > 0. Từ định lí 3.1, suy ra x∗ là nghiệm tối ưu của bài toán (OP) ⇔f(x∗) 6 f(x), ∀x ∈ D ⇔x∗2 6 x2, ∀x ∈ D ⇔x∗2 6 0 ⇔x∗ = 0. Ngược lại, nếu x∗ = 0 là nghiệm của bài toán (OP) thì từ định lí 3.1, suy ra tồn tại λ∗i > 0 (i = 0, ..., 2) không đồng thời bằng 0 sao cho : 60 1) L(x∗, λ∗) = minx∈X L(x, λ∗) (⇔ 0 ∈ λ∗0∂f(x∗) + ∑2 i=1 λ ∗ i∂gi(x ∗) +NX(x∗) ). 2) λ∗i gi(x ∗) = 0, i = 1, 2. Ta có L(x∗, λ∗) = minx∈X L(x, λ∗) ⇔L(x, λ∗) > L(x∗, λ∗), ∀x ∈ X ⇔λ∗0f(x) + 2∑ i=1 λ∗i gi(x) > λ∗0f(x∗) + 2∑ i=1 λ∗i gi(x ∗), ∀x ∈ X ⇔λ∗0x2 + λ∗1(x2 − x)− λ∗2x > 0, ∀x ∈ X. Ta có λ∗i gi(x ∗) = 0, i = 1, 2⇔ λ∗i .0 = 0, i = 1, 2⇔ λ∗i > 0, i = 1, 2. Do λ∗i > 0 (i = 0, ..., 2) không đồng thời bằng 0 nên: + Chọn λ∗1 = λ ∗ 2 = 0. Ta có λ∗0x 2 + λ∗1(x 2 − x)− λ∗2x > 0, ∀x ∈ X ⇔λ∗0x2 > 0, ∀x ∈ X ⇔λ∗0 > 0 ⇒Chọnλ∗0 = 1. + Chọn λ∗1 = λ ∗ 2 = 1. Ta có λ∗0x 2 + λ∗1(x 2 − x)− λ∗2x > 0, ∀x ∈ X ⇔(λ∗0 + 1)x2 − 2x > 0, ∀x ∈ X ⇒Không tồn tại λ∗0. + Chọn λ∗1 = 0, λ ∗ 2 = 1. Ta có λ∗0x 2 + λ∗1(x 2 − x)− λ∗2x > 0, ∀x ∈ X ⇔λ∗0x2 − x > 0, ∀x ∈ X ⇒Không tồn tại λ∗0. 61 + Chọn λ∗1 = 1, λ ∗ 2 = 0. Ta có λ∗0x 2 + λ∗1(x 2 − x)− λ∗2x > 0, ∀x ∈ X ⇔(λ∗0 + 1)x2 − x > 0, ∀x ∈ X ⇒Không tồn tại λ∗0. Vậy x∗ = 0 là nghiệm tối ưu của bài toán (OP) và λ∗0 = 1, λ ∗ 1 = λ ∗ 2 = 0 là các nhân tử Lagrang tương ứng. Chú ý 3.1. Trong nhiều trường hợp bài toán (P1), (P2) và (OP) có thể không có lời giải tối ưu chính xác. Hơn nữa trong thực tế thường người ta không tính được lời giải tối ưu (chính xác), mà chỉ tính được lời giải xấp xỉ. Khi đó ta dùng khái niệm lời giải tối ưu xấp xỉ hay còn gọi là - tối ưu. Mệnh đề 3.3. x là -nghiệm của bài toán (P1)⇔ 0 ∈ ∂h(x) Chứng minh. Ta có: x là − nghiệm của bài toán (P1) ⇔x là điểm − cực tiểu của h trên Rn ⇔h(x) 6 h(x) + , ∀x ∈ Rn (theo định nghĩa3.2) ⇔0 ∈ ∂h(x) (theo định lý2.1). Mệnh đề 3.4. Giả sử ri(dom f) ∩ riC 6= ∅. Khi đó x ∈ C là -nghiệm của bài toán (P2) =⇒ 0 ∈ ∂f(x) +NC,(x), trong đó NC,(x) := {ω | 〈ω, x − x〉 6 , ∀x ∈ C} là -nón pháp tuyến ngoài của C tại x. Chứng minh. Gọi δC(.) là hàm chỉ của tập C , tức là δC(x) := { 0 nếu x ∈ C, +∞ nếu x 6∈ C. 62 Khi đó x là − nghiệm của bài toán (P2) ⇔x là điểm − cực tiểu của f trên C ⇔x là điểm − cực tiểu của h(x) := f(x) + δC(x) trên Rn ⇔0 ∈ ∂h(x) (theo mệnh đề 3.3). Do ri(dom f) ∩ riC 6= ∅, ta có: ∂h(x) = ∂[f(x) + δC(x)] ⊆ ∂f(x) + ∂δC(x) (theo mệnh đề 2.14) = ∂f(x) +NC,(x) (Vì x ∈ C nên theo định nghĩa 2.9 ∂δC(x) = NC,(x) ). Vậy 0 ∈ ∂f(x) +NC,(x). 63 Kết luận Như vậy, luận văn này đã trình bày một cách hệ thống các khái niệm, tính chất cơ bản của tập lồi và hàm lồi. Sau đó lại đề cập về đạo hàm theo phương, dưới vi phân, dưới vi phân xấp xỉ và chứng minh một cách cụ thể một số tính chất của chúng. Cuối cùng luận văn trình bày các điều kiện cực trị cho các bài toán quy hoạch lồi với các rằng buộc khác nhau. Tài liệu tham khảo [1] Lê Dũng Mưu và Nguyễn Văn Hiền (2003), Nhập môn giải tích lồi ứng dụng, Giáo trình. [2] . Tạ Quang Sơn (2008), Some Qualitative Problems In Optimization, Luận án tiến sĩ. [3] T. Rockafellar (1970), Convex Analysis, Princeton University Press, Princeton, New Jersey. [4] J. Hiriart-Urruty and C. Lemarechal, Convex Analysis and Minimization Algorithms. 64

Các file đính kèm theo tài liệu này:

doc219.pdf