Tài liệu Đề tài Thuật toán nhánh cận trên môi trường song song: TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
-------***-------
B ÁO C ÁO KHOA H ỌC
Chuyên đề: Xử lí song song
Đề tài: Thuật toán nhánh cận trên môi trường song song
MỤC LỤC
TỔNG QUAN VỀ THUẬT TOÁN NHÁNH CẬN
Thuật toán nhánh cận là phương pháp chủ yếu để giải các bài toán tối ưu tổ hợp. Ta sẽ thực hiện việc đánh giá theo từng bước, nếu không có khả năng tìm thấy kết quả tốt hơn thì sẽ cắt nhánh đó, không thực hiện tìm tiếp mà chuyển ngay sang nhánh khác. Khi đó, chỉ ghi nhận các kết quả tốt hơn lúc ban đầu. Nghiệm của bài toán sẽ tốt dần lên do khi tìm ra kết quả tốt hơn ta sẽ cập nhật lại giá trị hiện thời của bài toán.
Thuật toán nhánh cận
Một trong những bài toán đặt ra trong thực tế là tìm một nghiệm của bài toán thỏa mãn một số điều kiện nào đó và nghiệm đó là tốt nhất theo một tiêu chí cụ thể, nghiên cứu lời giải các bài toán tối ưu thuộc về lĩnh vực quy hoạch toán học. mô hình được sử dụng để tìm kiếm là mô hình cây phân cấp . việc tìm nghiệm của các bài...
33 trang |
Chia sẻ: hunglv | Lượt xem: 1175 | Lượt tải: 0
Bạn đang xem trước 20 trang mẫu tài liệu Đề tài Thuật toán nhánh cận trên môi trường song song, để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
-------***-------
B ÁO C ÁO KHOA H ỌC
Chuyên đề: Xử lí song song
Đề tài: Thuật toán nhánh cận trên môi trường song song
MỤC LỤC
TỔNG QUAN VỀ THUẬT TOÁN NHÁNH CẬN
Thuật toán nhánh cận là phương pháp chủ yếu để giải các bài toán tối ưu tổ hợp. Ta sẽ thực hiện việc đánh giá theo từng bước, nếu không có khả năng tìm thấy kết quả tốt hơn thì sẽ cắt nhánh đó, không thực hiện tìm tiếp mà chuyển ngay sang nhánh khác. Khi đó, chỉ ghi nhận các kết quả tốt hơn lúc ban đầu. Nghiệm của bài toán sẽ tốt dần lên do khi tìm ra kết quả tốt hơn ta sẽ cập nhật lại giá trị hiện thời của bài toán.
Thuật toán nhánh cận
Một trong những bài toán đặt ra trong thực tế là tìm một nghiệm của bài toán thỏa mãn một số điều kiện nào đó và nghiệm đó là tốt nhất theo một tiêu chí cụ thể, nghiên cứu lời giải các bài toán tối ưu thuộc về lĩnh vực quy hoạch toán học. mô hình được sử dụng để tìm kiếm là mô hình cây phân cấp . việc tìm nghiệm của các bài toán thường phải dựa vào việc liệt kê toàn bộ các cấu hình có thể và đánh giá tìm ra cấu hình tốt nhất.
Ví dụ: Bài toán người du lịch: không gian trạng thái là N!
Bài toán K- median : không gian trạng thái là
Khi đó, không gian tìm kiếm của bài toán là rất lớn trong khi nhiều trường hợp có thể loại bỏ được ngay. Điều này gây nên tình trạng lãng phí bộ nhớ và mất rất nhiều thời gian. Vấn đề đặt ra là trong quá trình liệt kê lời giải cần tận dụng những thông tin đã có để loại bỏ sớm những phương án chắc chắn không tối ưu. Thuật toán nhánh cận được sử dụng để khắc phục những vấn đề trên
Tư tưởng cơ bản của thuật toán là trong quá trình tìm kiếm lời giải, ta sẽ phân hoạch tập các phương án của bài toán thành hai hay nhiều tập con biểu diễn như một nút của cây tìm kiếm và cố gắng bằng phép đánh giá cận các nút, tìm cách loại bỏ các nhánh cây (những tập con các phương án của bài toán) mà ta biết chắc chắn không phải là phương án tối ưu. Mặc dù trong trường hợp tồi nhất thuật toán sẽ trở thành duyệt toàn bộ, nhưng những trường hợp cụ thể nó rút ngắn đáng kể thời gian tìm kiếm.
Để áp dụng phương pháp nhánh cận đối với 1 tập các bài toán tối ưu chúng ta cần làm theo các bước sau:
Bước1 ( khởi tạo): L:={П0}, Q: ={П0},bs:= -∞ và T:=(tập hợp rỗng).
Bước 2( tìm kiếm): đi tới Bước 9 nếu L =
đi đến Bước 3 sau khi lựa chọn Пi:= s(Ls) để kiểm tra.
Bước 3 (cập nhật ): Nếu lower_bound(Пi)> bs, thì bs:= lower_bound(Пi) và T:={σ } với σ là lời giải khả thi của Пi sao cho f(x,σ )= lower_bound(П i). Đi tới bước 4.
Bước 4 : đi tới Bước 8 nếu Пi G (tập hợp các bài toán bộ phận Пi được giải trong tiến trình tính toán cận trên của Пi). ngược lại thì đi đến Bước 5.
Bước 5: ( kiểm tra cận trên): đi đến bước 8 nếu cận trên nhỏ hơn bs: upper_bound(Пi) ≤ bs. Ngược lại đi tới bước 6.
Bước 6: đi tới bước 8 nếu tồn tại một Пk (≠ Пi) Q mà f(Пk) ≥ f(Пi). Ngược lại đi tới bước 7.
Bước7: (phân nhánh): Phân và cập nhật . Quay trở lại bước 2.
Bước 8 ( kết thúc bài toán con): gán L:= L - Пi sau đó quay trở lại bước 2.
Bước 9 ( kết thúc toàn bộ ) : Dừng. bs = f(П0) và T lưu trữ một lời giải tối ưu của П0, nếu bs = - ∞ , П0 không có lời giải
Một số ví dụ cụ thể áp dụng thuật toán nhánh cận
Bài 1: Bài toán người du lịch( TSP)
Phát biểu bài toán : Một người du lịch muốn đi thăm quan n thành phố T1 , T2 , ….., Tn .Xuất phát từ một thành phố nào đó người du lịch muốn đi qua tất cả các thành phố còn lại, mối thành phố đúng một lần, rồi quay trở lại thành phố xuất phát. Biết ci,j là chi phí từ thành phố Ti đến thành phố Tj . Hãy tìm hành trình với tổng chi phí nhỏ nhất
Xây dựng công thức :
Phương án : p = (p1, p2, … pn) là hoán vị của 1, 2, …, n
Hành trình : T p1 ® T p2 ® …… ® T pn
Chi phí : f(p) = c p1, p2 + c p2, p3 + …. + c pn, p1
P : tập tất cả các hoán vị
=> min {f(p) : p Î P }
Tư tưởng của thuật toán nhánh cận:
Cố định thành phố 1
Tìm cực tiểu của hàm :
f(x2, x3, . . , xn) = c[1,x2] + c[x2,x3] + ... + c[xn,1] => min
x2, x3, . . , xn là hoán vị của các số 2, 3, …, n
Ký hiệu : cmin = min{c[i,j]; i, j = 1,2,…,n, i≠j}
Giả sử có phương án bộ phận (u1,u2, …, uk)
Chi phí phải trả là : s = c[1,u2] + c[u2,u3] + ... + c[uk-1, uk]
Cận dưới là : g (u1,u2, …, uk) = s + (n-k+1)*cmin
Phương pháp phân nhánh:
+ Nếu bài toán con có g() > f -(Kỉ lục tạm thời) thì cắt luôn nhánh của bài toán này
+ Nếu không thì phân nhánh tiếp bài toán con cho đến khi tính được kỉ lục của bài toán con này. Nếu kỉ lục của bài toán con nhỏ hơn f() thì cập nhật lại kỉ lục tạm thời f()
Phương pháp tính cận:
tính cận trên của bài toán con dựa vào công thức
= c[1,u2] + c[u2,u3] + ... + c[uk-1, uk]
g (u1,u2, …, uk) = s + (n-k+1)*cmin
Bài 2: Bài toán cái túi
Phát biểu bài toán : Một nhà thám hiểm cần đem theo một cái túi có trọng lượng không quá b. Có n đồ vật có thể đem theo. Đồ vật thứ j có trọng lượng a và giá trị sử dụng là c . Hỏi rằng nhà thám hiểm cần đem theo các đồ vật nào để cho tổng giá trị sử dụng của các đồ vật đem theo là lớn nhất.
Xây dựng công thức :
Phương án x = {x1,x2, …, xn}
Giá trị đồ vật đem theo
Tổng trọng lượng đồ vật
min{f(x) : g(x) ≤ b}
XÂY DỰNG KHUNG THUẬT TOÁN NHÁNH CẬN
Thuật toán nhánh cận được xây dựng với mong muốn giải quyết được tập các bài toán tối ưu tổ hợp. Có nghĩa là tất cả các bài toán đó sẽ được giải quyết dựa trên một khung chung của thuật toán để khi vào một bài toán cụ thể người viết chương trình chỉ cần thêm vào khung đó những dữ liệu phù hợp với bài toán của mình. Nó giảm bớt thời gian xây dựng thuật toán đồng thời nó hữu ích cho những người không biết kỹ thuật nhánh cận trên môi trường song song vẫn có thể cài đặt song song. Chương này sẽ trình bày việc xây dựng khung của kĩ thuật nhánh cận và kỹ thuật nhánh cận trên môi trường tuần tự hoặc song song.
Hệ thống gồm hai nhóm : một nhóm các lớp cung cấp (Provided) bao hàm các thủ tục chung cho thuật toán nhánh cận (ví dụ như khung của thuật toán nhánh cận tuần tự, khung của thuật toán nhánh cận song song ...) và nhóm các lớp yêu cầu (Required) bao hàm các thủ tục riêng để giải quyết một bài toán cụ thể sử dụng kỹ thuật nhánh cận (ví dụ như các thủ tục tính cận, thủ tục phân nhánh, ...). Để giải quyết một bài toán bằng kỹ thuật nhánh cận, người sử dụng chỉ cần viết các khai báo và xây dựng các hàm trong nhóm yêu cầu mà không cần xây dựng lại nhóm cung cấp. Hình 4.1 diễn tả mô hình UML tổng quan của hệ thống.
Hình 1 : Mô hình UML
* Nhóm các lớp yêu cầu
Mô hình chung của nhóm các lớp yêu cầu
Hình 2 diễn tả các lớp và thủ tục chính trong nhóm yêu cầu.
Hình 2 : Các lớp yêu cầu
Các lớp yêu cầu được sử dụng để lưu trữ dữ liệu cơ bản của thuật toán : bài toán, trạng thái không gian tìm kiếm. Nó bao gồm các lớp chính sau :
Bài toán (Problem): Diễn tả các tham số của bài toán cần giải quyết.
Bài toán con (Subproblem) : Diễn tả vùng không gian chưa được khai thác và cung cấp các chức năng sau :
InitSubProblem(pbm) : Sinh ra bài toán con đầu tiên từ bài toán ban đầu
LowerBound(pbm, sol) : Tính toán cận dưới của hàm mục tiêu cho lời giải bộ phận sol của bài toán pbm.
UpperBound(pbm, sol) : Tính giá trị hàm mục tiêu của lời giải toàn cục sol của bài toán pbm.
Branch(pbm, sps) : Sinh ra một tập các bài toán con của bài toán đang xét và lưu vào sps.
Lớp bài toán con diễn tả một bài toán bộ phận. Một bài toán con được xác định bởi các dữ liệu sau : vector sol chứa các chỉ số đỉnh làm median của bài toán con (hay là lời giải bộ phận của bài toán cần giải quyết) và được sắp xếp theo thứ tự tăng dần, chỉ số đỉnh cuối eV của lời giải bộ phận, và cận dưới cost ứng với lời giải bộ phận sol.
Lớp bài toán con phải cung cấp các hàm chính sau :
InitSubProblem(pbm): sinh ra bài toán con ban đầu với
Các hàm tính cận dưới (LowerBound), tính cận trên (UpperBound), phân nhánh (Branch).
* Nhóm các lớp cung cấp
Trước khi mô tả lớp cung cấp chúng ta cần xem xét cấu trúc dữ liệu để lưu các bài toán con chưa được giải quyết trong quá trình tính toán. Vì số lượng các bài toán con là rất lớn và không biết trước nên ta sử dụng một danh sách liên kết kép để quản lý chúng.
Lớp Solver : Làm nhiệm vụ đưa ra và duy trì các thông tin có liên quan tới trạng thái tìm kiếm trong suốt quá trình thực hiện
class Solver {
protected:
const Problem& pbm;// bài toán cần giải quyết
Direction dir;
SubProblem sp; // bài toán con hiện thời cần giải quyết
Solution sol; // giải pháp tốt nhất hiện thời
container HP;// danh sách các bài toán con cần giải quyết
Bound high;// cận trên của nhánh bài toán con
Bound low;// cận dưới của nhánh bài toán con
Bound bestSol;// kỉ lục hiện thời của bài toán
public:
Solver(const Problem &problem);
..........................
Có hai lớp kế thừa từ lớp Solver
Lớp Solver_Seq : Chứa thủ tục run() để giải quyết bài toán một cách tuần tự
Lớp Solver_Lan : Chứa thủ tục run(int argc, char** argv) để giải quyết bài toán một cách song song trên môi trường mạng LAN. Với tham số truyền vào của hàm chính là các tên máy tham gia vào quá trình tính toán.
Người sử dụng muốn thực hiện theo phương thức nào (song song hay tuần tự) thì tạo ra một đối tượng tương ứng sau đó gọi tới thủ tục run . Ví dụ chúng ta muốn tiến hành thuật toán nhánh cận tuần tự để giải quyết bài toán TSP có đoạn mã của thủ tục main như sau
Int Main(int argc, char** argv) {
Problem pbm; // Bài toán cần giải quyết
SolVec sol; // Lời giải tối ưu của bài toán
Bound bs; // Giá trị tối ưu của bài toán
Solver_Seq sv(pbm);
Sv.run();
Bs = sv.bestSolution();
Sol = sv.solution();
}
Xây dựng khung nhánh cận
Cấu trúc dữ liệu
Cấu trúc dữ liệu sử dụng là hàng đợi động để điều khiển bài toán con được sinh ra bằng phương thức phân nhánh. Các bài toán con được thêm và0 hàng đợi phụ thuộc vào phương thức tìm kiếm cụ thể trong lớp cài đặt: lifo(last in first out), fifo (first in first out) hoặc prio-rity. Mỗi một bài toán con được kết nối bởi 2 con trỏ tới thành phần trứơc và sau của danh sách riêng biệt.
Hình 3: Hàng đợi các bài toán con của kĩ thuật nhánh cận
Thuật toán
Các bài toán sử dụng nhánh cận để giải quyết đều phải sử dụng khung của thuật toán. Điều này nhấn mạnh rằng người dùng nếu giải bài toán của mình trên môi trường tuần tự hoặc song song thì chỉ cần thêm một số phương thức, dữ liệu phù hợp mà không cần suy nghĩ đến việc phải thiết kế các bước như thế nào.
Dưới đây là khung chung của thuật toán:
Khởi tạo
Tập hoạt động (tập các bài toán con chưa được duyệt) chứa bài toán ban đầu.
Giá trị kỷ lục(best solution=bs) bằng ¥.
Lựa chọn
Dựa trên một phương pháp nào đó (theo chiều sâu, chiều rộng, hoặc cận tốt nhất ,...) để lựa chọn một bài toán con khả thi cùng cận của nó từ tập hoạt động.
Xóa bài toán con khỏi tập hoạt động.
Phân nhánh
Áp dụng luật phân nhánh để sinh ra các bài toán con mới từ bài toán đang xét. Tính cận của các bài toán con mới này.
Tiến hành kiểm tra các bài toán con vừa được sinh ra.
Có hai trường hợp :
bài toán con đã được giải quyết – đi tới bước 5
bài toán con chưa được giải quyết – đi tới bước 4.
Kiểm tra tính khả thi : Đưa các bài toán con có cận nhỏ hơn kỷ lục tạm thời vào tập hoạt động.
Dò xét kết thúc
Bài toán con được duyệt là một lời giải khả thi khi có cận nhỏ hơn kỷ lục và khi đó nó sẽ thay thế kỷ lục. Ngược lại sẽ bị xóa.
Khi cập nhật kỷ lục mới (5a) thì tất cả các bài toán con trong tập hoạt động có cận dưới lớn hơn hoặc bằng kỷ lục sẽ bị xóa.
Kết thúc thuật toán
Lặp lại các bước từ 2-5 nếu tập hoạt động không rỗng. Ngược lại, thì kết thúc thuật toán và lời giải tối ưu là giá trị kỷ lục.
Ta gọi
L : là tập hoạt động
Q: là tập các bài toán con hiện tại được sinh ra.
bs: giá trị kỉ lục
σ : lời giải
T: lưu trữ lời giải tốt nhất
Пi: các bài toán con được sinh ra
Dưới đây là đoạn mã giả của thuật toán phân nhánh:
Ta có thể sử dụng cấu trúc heap và queue để lưu trữ các bài toán con chưa được giải quyết. Ở đây chúng tôi sử dụng queue bởi lí do khi số lượng các thành phố là lớn thì không gian bài toán con tăng lên rất nhiều mà heap không thể lưu trữ được.
Queue gồm 3 lớp sau :
Class bbnode : Định nghĩa các nút trên cây
Class BandbQueue : Lớp trừu tượng này miêu tả một queue
Class BranchQueue : Lớp này sử dụng trong suốt giai đoạn phân nhánh
Xây dựng khung nhánh cận tuần tự
Ta có thể tóm lược hoạt động của thuật toán nhánh cận tuần tự như sau : Tại thời điểm khởi tạo, tập hoạt động L chứa bài toán ban đầu, và giá trị kỷ lục tạm thời bs là µ. Lặp đi lặp lại các bước sau cho đến khi tập hoạt động bằng Æ : Lựa chọn một bài toán con từ tập hoạt động, bài toán con có lời giải bộ phận là v1, v2, ...., vi-1. Nếu cận dưới của bài toán con nhỏ hơn kỷ lục tạm thời ta tiến hành phân nhánh thành các bài toán con nhỏ hơn với lời giải bộ phận tương ứng là (v1, v2, ...., vi-1+1), ......, (v1, v2, ...., N – K + 1), tiến hành tính cận cho các bài toán con này. Nếu các bài toán con đã được giải quyết ta tiến hành duyệt và cập nhật kỷ lục tạm thời bs, ngược lại thì đưa các bài toán con này vào tập hoạt động L. Sau đây là đoạn mã giả mô phỏng thuật toán nhánh cận tuần tự.
Hình 4: Thuật toán nhánh cận tuần tự
Xây dựng khung nhánh cận song song
Để song song hóa khung sử dụng kỹ thuật nhánh cận chúng ta sử dụng chiến lược chủ - thợ. Chiến lược này có thể được định nghĩa như sau: một bộ xử lý chủ giữ tất cả thông tin về không gian trạng thái, nơi mà chứa đựng số lượng các bài toán con chưa được phân nhánh trên cây liệt kê và nó cũng lưu giữ lời giải hiện thời. Máy chủ gửi bài toán con tới máy thợ rỗi và nhận các bài toán con mới được phát sinh từ các máy thợ đó. Một vài máy thợ định giá những bài toán con và phát sinh thêm những cái mới nếu cần thiết. Một máy thợ rỗi nhận một bài toán con chỉ khi có những bài tóan con mà có khả năng dẫn tới một giải pháp tối ưu. Chiến lược này đề xuất những sự kiện có ý nghĩa như là khả năng điều khiển dễ dàng và thuật toán nhánh cận song song theo phương pháp dễ hiểu và tự nhiên hơn.
- Bộ xử lí chủ: chỉ có một bộ xử lí chủ trong khung. Nó chứa tất cả thông tin về không gian trạng thái và tình trạng của mỗi máy thợ ( bận hoặc rỗi.)
- Bộ xử lí thợ: Số lượng bộ xử lí thợ được xác định bởi tham số đầu vào. Nó thực hiện tất cả những thao tác tính toán để giải quyết hoặc ước lượng một bài toán con.
Sự song song hiển thị cấu trúc trong Hình 4. Máy chủ có một hàng đợi những bài toán chưa được giải quyết. Nó loại bỏ mọi bài toán con từ hàng đợi của nó và giao việc của nó tới máy thợ rỗi trong giai đoạn a. Trong giai đoạn b, một tập bài toán con của máy thợ đưa đến máy chủ.Trong giai đoạn c, máy chủ nhận những bài toán con và chèn chúng vào trong hàng đợi của nó. Cuối cùng, máy chủ loại bỏ những bài toán con có thể thực hiện đc và gửi chúng đến máy thợ rỗi trong giai đoạn d. Tiến trình kết thúc khi hàng đợi máy chủ là rỗng và lời giải tốt nhất tìm thấy đc.
Hình 5: Các giai đoạn của mô hình Chủ - thợ
Ta nhận thấy rằng mô hình hoạt động ở trên tương đối đơn giản và dễ dàng cài đặt. Tuy nhiên nó có một nhược điểm lớn là số lượng bài toán con chỉ tập trung tại máy chủ, điều đó dễ dẫn tới tràn bộ nhớ do số lượng bài toán con này là rất lớn. Thêm vào nữa máy chủ luôn phải điều động từng bài toán con tới các máy thợ dẫn tới tăng số lượng công việc tại máy chủ cũng như lưu lượng truyền thông trên mạng là lớn. Để giải quyết vấn đề này chúng tôi đề xuất một mô hình dữ liệu phân tán, nghĩa là trên mỗi máy thợ đều có một vùng nhớ để lưu các bài toán con. Và bây giờ các bài toán con được chuyển một cách trực tiếp từ máy thợ bận (có nhiều bài toán con) tới máy thợ rỗi ( không còn bài toán con để tìm kiếm) dưới sự điều phối của máy chủ. Sau đây là thiết kế chi tiết đối với cả hai hệ thống này.
Lược đồ song song dữ liệu tập trung
Cấu trúc dữ liệu :
Danh sách các bài toán con chưa được giải quyết lưu tại máy chủ, các bài toán con được rời và gửi tới các máy thợ. Mỗi máy thợ khi nhận bài toán con tiến hành phân nhánh và lưu các bài toán con vừa mới được sinh ra cùng với cận của nó trong một danh sách cục bộ. Sau đó nó gửi tới máy chủ, máy chủ lúc này tiến hành nối các bài toán con nhận được từ danh sách đó nếu cận của nó nhỏ hơn kỷ lục tạm thời. Cấu trúc dữ liệu để lưu các bài toán con là một danh sách liên kết kép.
Thuật toán
Thực hiện trên máy chủ
Hình 6 mô tả các công việc được thực hiện trên máy chủ. Máy chủ thực hiện phân phối các bài toán con giữa các máy thợ. Máy chủ có một danh sách cục bộ L để lưu trữ bài toán con và cấu trúc dữ liệu I để ghi nhận trạng thái hiện thời của các máy thợ (dòng 1);
Ban đầu tất cả các máy thợ đều rỗi. Khi có các máy thợ rỗi, máy chủ liên tục trích lọc từng bài toán con khả thi (có cận nhỏ hơn kỷ lục tạm thời), sau đó lựa chọn một máy thợ rỗi và gửi bài toán con tới nó để tiến hành phân nhánh và ước lượng( dòng 6-7). Nếu danh sách L rỗng hoặc không có máy thợ nào rỗi, máy chủ tiến hành kiểm tra có dữ liệu (là các bài toán con mới sinh ra) được gửi về từ máy thợ hay không. Nếu có nó sẽ nhận dữ liệu từ máy thợ là một tập các bài toán con cùng cận dưới của nó. Kiểm tra lần lượt từng bài toán con. Nếu bài toán được giải quyết (có số lượng median bằng k), thì cập nhật kỷ lục và lời giải tạm thời (nếu có cận nhỏ hơn kỷ lục tạm thời) ngược lại nối các bài toán con khả thi vào danh sách L (Dòng 12-17). Quá trình tìm kiếm kết thúc khi tất cả các máy thợ đều rỗi và danh sách L rỗng, và khi đó máy chủ gửi một thông báo kết thúc quá trình tính toán tới các máy thợ (Dòng 20). Sau đây là đoạn mã giả của thủ tục.
Hình 6: Hoạt động trên máy chủ (Dữ liệu tập trung)
Thực hiện trên máy thợ
Máy thợ nhận lệnh từ máy chủ. Có thể là kết thúc quá trình tính toán hoặc nhận một bài toán con cần phân tích. Nếu lệnh yêu cầu nhận một bài toán con, máy thợ thực hiện nhận dữ liệu (Dòng 6) , sau đó tiến hành phân nhánh và tính cận cho các bài toán con vừa được sinh ra (Dòng 7-8). Dữ liệu này được gửi tới máy chủ. Sau đây là đoạn mã giả của thủ tục.
Hình 7: Hoạt động trên máy thợ (Dữ liệu tập trung)
Lược đồ song song dữ liệu phân tán
Cấu trúc dữ liệu
Mỗi máy thợ lưu một danh sách các bài toán con cục bộ. Máy chủ chỉ gửi bài toán con đầu tiên tới một máy thợ rỗi ban đầu và sau đó không lưu trữ bất kỳ bài toán con nào mà chỉ thực hiện điều phối các bài toán con giữa các máy thợ.
Thuật toán
a. Thực hiện trên máy chủ
Hình 4.6 chỉ ra các công việc trên máy chủ. Máy chủ có một cấu trúc dữ liệu I để ghi nhận trạng thái hiện thời của các máy thợ (Dòng 1); ban đầu tất cả các máy thợ đều rỗi. Bài toán con đầu tiên, kỷ lục và lời giải tạm thời được gửi tới một máy thợ rỗi (dòng 3-4). Máy chủ nhận thông tin gửi về từ máy thợ và quyết định hoạt động tiếp theo phụ thuộc vào bài toán con được giải quyết (dòng 8) hay là một yêu cầu các máy thợ rỗi từ máy thợ nào đó (dòng 10) hay là thông báo một máy thợ đang rỗi (dòng 16). Nếu bài toán con đã được giải quyết, máy chủ nhận và lưu trữ lời giải (nếu cận của nó nhỏ hơn kỷ lục tạm thời). Khi máy chủ nhận một yêu cầu r máy thợ rỗi từ một máy thợ nào đó, nó sẽ tiến hành xác định các máy thợ đang rỗi và gửi thông tin về số lượng và tên các máy thợ đang rỗi tới máy thợ yêu cầu (dòng 13-14), sau đó chờ đợi và nhận lại từ máy thợ đó các máy thợ không được sử dụng. Quá trình kết thúc khi tất cả các máy thợ đều rỗi và máy chủ gửi một thông báo kết thúc tới toàn bộ hệ thống( dòng 19). Dưới đây là đoạn mã giả của thủ tục.
Hình 8: Hoạt động trên máy chủ (Dữ liệu phân tán)
b. Thuật toán trên máy thợ
Máy thợ nhận bài toán con và kỷ lục tạm thời từ một máy thợ nào đó, sau đó tiến hành phân nhánh và tính cận các bài toán con vừa được sinh ra. Nếu các bài toán con đã được giải quyết (có số median là k), nó đi tìm bài toán con có cận tốt nhất và gửi tới máy chủ (Dòng 12 -18). Ngược lại nó gửi một thông báo xin máy chủ cấp cho các máy thợ đang rỗi để hỗ trợ quá trình tính toán. Nếu số lượng máy thợ nhận được lớn hơn 0 nó tiến hành gửi các bài toán con tới các máy thợ này ngược lại thì thực hiện các hoạt động của thuật toán một cách cục bộ ( Dòng 20-24). Nếu trong tập hoạt động không còn bài toán con nào, máy thợ gửi một thông báo đang rỗi tới máy chủ (Dòng 25).
Công cụ phát triển hệ thống
Hệ thống sử dụng ngôn ngữ C++ để phát triển và thư viện Nestream để quản lý quá trình trao đổi dữ liệu giữa các máy trong hệ thống. Netstream hỗ trợ gửi services(basic và advandced) qua một giao thức mạng và Netstream được phát triển như một lớp trên chuẩn MPI.
Lựa chọn mô hình phát triển hệ thống
Phân lớp thuật toán nhánh cận song song
Có ba cách tiếp cận chính trong việc thiết kế thuật toán nhánh cận song song.
Song song loại 1 : Tiến hành song song hóa các hoạt động trên bài toán con, ví dụ như tính cận song song trên bài toán con. Cách tiếp cận này không ảnh hưởng tới cấu trúc chung của thuật toán nhánh cận.
Song song loại 2 : Xây dựng cây nhánh cận một cách song song bằng việc thực hiện các hoạt động trên các bài toán con một cách đồng thời. Vì thế nó có thể ảnh hưởng tới việc thiết kế thuật toán.
Song song loại 3 : Một vài cây nhánh cận được xây dựng một cách song song. Các cây được đặc thù bởi các hoạt động khác nhau (phân nhánh, tính cận, kiểm tra ước lượng hay lựa chọn), và thông tin sinh ra khi xây dựng một cây có thể được sử dụng cho việc xây dựng cây khác.
Dưới đây ta trình bày cách tiếp cận song song loại 2 để thiết kế thuật toán nhánh cận song song.
Lựa chọn mô hình phát triển thuật toán
Có hai hệ thống tính toán song song chủ yếu là bộ nhớ dùng chung và bộ nhớ phân tán. Chúng tôi lựa chọn hệ thống bộ nhớ phân tán để tiến hành thiết kế thuật toán vì một số lý do sau :
Lý do đầu tiên xuất phát từ thực tế đó là có thể tiến hành các thuật toán song song trên mạng nối kết ethernet đơn giản bằng kỹ thuật chuyển thông báo. Đây là một cách kinh tế để có một hệ thống song song.
Thứ hai đó là số lượng bộ xử lý trong các hệ thống bộ nhớ dùng chung là giới hạn.
Các mô hình phân biệt với nhau bởi cách quản lý và điều phối tập các bài toán con nằm trong cơ sở dữ liệu chính của thuật toán. Mô hình đầu tiên có cơ sở dữ liệu tập trung. Nghĩa là máy chủ sẽ lưu trữ tập các bài toán con và điều phối chúng tới các máy thợ rỗi. Mô hình có ưu điểm dễ xây dựng, dễ quản lý nhưng khối lượng công việc cũng như không gian bộ nhớ trên máy chủ là tương đối lớn đồng thời lưu lượng truyền thông trên mạng cũng lớn. Mô hình thứ hai có cơ sở dữ liệu phân tán, nghĩa là các bài toán con lúc này sẽ được lưu một cách cục bộ tại các máy thợ và sẽ được chuyển giao một cách trực tiếp giữa các máy thợ dưới sự điều phối của máy chủ. Với mô hình này ngoài chiến lược lựa chọn nút để khai thác không gian lời giải một cách có hiệu quả, hệ thống còn phải thực hiện các chiến lược để cân bằng công việc giữa các máy thợ sao cho không xảy ra tình trạng có máy thợ phải thực hiện quá nhiều công việc trong khi các máy khác rỗi.
SỬ DỤNG THUẬT TOÁN NHÁNH CẬN ĐỂ GIẢI QUYẾT BÀI TOÁN TSP
Trong chương này chúng tôi đưa ra các kết quả thực nghiệm nhằm đánh giá hiệu suất của mô hình thuật toán nhánh cận song song đề xuất ở trên. Thuật toán tuần tự được lựa chọn để so sánh có cùng cách tính cận, phân nhánh và lựa chọn bài toán con như trong mô hình thuật toán song song.
* Bài toán TSP (Bài toán người du lịch)
Giới thiệu bài toán
Bài toán người du lịch(TSP) là bài toán tiêu biểu trong việc sử dụng thuật toán nhánh cận song song. Bài toán được phát biểu như sau:
Một người du lịch có trong tay bản đồ gồm n thành phố và chi phí đi lại giữa chúng, các con đường này đều là đường 1 chiều(nghĩa là chi phi từ A đến B sẽ khác khoảng cách từ B đến A). người du lịch muốn làm một hành trình đi qua tất cả các thành phố với điều kiện mỗi thành phố chỉ đi qua một lần, rồi quay trở về thành phố xuất phát. Bài toán đặt ra là tìm đường đi cho người du lịch sao cho tổng chi phí là nhỏ nhất.
Định nghĩa bài toán
Cho n thành phố và một ma trận chi phí của các đường đi. Hãy tìm đường đi sao cho tổng chi phí là nhỏ nhất đảm bảo điều kiện của bài toán
Xây dựng công thức :
Phương án : p = (p1, p2, … pn) là hoán vị của 1, 2, …, n
Hành trình : T p1 ® T p2 ® …… ® T pn
Chi phí : f(p) = c p1, p2 + c p2, p3 + …. + c pn, p1
P : tập tất cả các hoán vị
=> min {f(p) : p Î P }
Dữ liệu vào cho trong file TSP.DAT, trong đó:
- Dòng đầu: Chứa N là số lượng các thành phố
- Tiếp theo : Ma trận c(n*n) trong đó c(i,j)= chi phí đi lại từ thành phố i đến thành phố j
Mỗi giá trị chi phí khác nhau được ghi cách nhau một dấu cách trắng
Kết qủa: Ghi trực tiếp lên file TSP.DAT, trong đó:
- Dòng đầu ghi tổng chi phí mà người đó đi hết bằng cách tốt nhất
- Dòng tiếp theo đưa ra phươg án tối ưu nhất qua các thành phố
Sử dụng thuật toán nhánh cận để giải bài toán TSP
Để đi tìm lời giải chính xác cho bài toán TSP không còn cách nào khác ngoài việc chúng ta phải duyệt tất cả các lời giải có thể, tuy nhiên số lượng này là quá lớn (= n!), trong đó rất lãng phí các lời giải không cần thiết. Cách tiếp cận hiệu quả nhất từ trước tới nay trong chiến lược này đó chính là thuật toán nhánh cận(có thể cắt các nhánh ở các lời giải không cần thiết)
* Tính cận và phân nhánh
- Tính cận: Cố định thành phố 1
Tìm cực tiểu của hàm :
f(x2, x3, . . , xn) = c[1,x2] + c[x2,x3] + ... + c[xn,1] => min
x2, x3, . . , xn là hoán vị của các số 2, 3, …, n
Ký hiệu : cmin = min{c[i,j]; i, j = 1,2,…,n, i≠j}
Giả sử có phương án bộ phận (u1,u2, …, uk)
Chi phí phải trả là : s = c[1,u2] + c[u2,u3] + ... + c[uk-1, uk]
Cận dưới là : g (u1,u2, …, uk) = s + (n-k+1)*cmin
- Thuật toán phân nhánh dựa vào thuật toán liệt kê các hoán vị của n phần tử{1, 2, ...., n}. Nghĩa là nếu bài toán con của ta có lời giải bộ phận là c1, c2, ...., ci. Thì các bài toán con sinh ra có lời giải bộ phận (c1, c2, ...., ci-1+1), .........., (c1, c2, ...., n – k + i).
* Các lớp xây dựng cho bài toán TSP
Như chúng ta đã biết, bài toán yêu cầu tìm giải pháp tốt nhất cho người du lịch sao cho chi đi qua mỗi thành phố một lần và tổng chi phí quãng đường là nhỏ nhất. Dưới đây là khai báo lớp Problem cho bài toán TSP:
Lớp Problem lưu giữ số lượng thành phố và ma trận giá trị giữa các thành phố
class Problem {
private:
Number N; // Số lượng thành phố trong bài toán
Matrix c; // Ma trận giá trị giữa các đỉnh
public:
Problem ();
.................
};
Lớp bài toán con diễn tả một bài toán bộ phận. Một bài toán con được xác định bởi các dữ liệu sau : đỉnh đầu iV, đỉnh cuối eV của lời giải bộ phận, và cận dưới cost ứng với lời giải bộ phận sol .
class SubProblem {
private:
unsigned iV, /// đỉnh đầu tiên
eV, /// đỉnh kết thúc trong hành trình
cost; /// gía trị thật
Tset visitedSet; /// các thành phố đến thăm
Solution sol; /// giá trị tốt nhất hiện thơi
public:
SubProblem ();
......................
};
Lớp bài toán con phải cung cấp các hàm chính sau :
InitSubProblem(pbm) : sinh ra bài toán con ban đầu với
iV = 0;
eV = 0;
cost = 0;
- Các hàm tính cận dưới (LowerBound), tính cận trên (UpperBound), phân nhánh(Branch).
Lớp Solution lưu giữ lời giải hiện tại
Class Solution()
{
…….
}
* Trên môi trường tuần tự
Khi thực thi trên môi trường tuần tự người dùng chỉ cần gọi phương thức run() của lớp Solver_Seq:
void Solver_Seq::run()
{
if (dir == Minimize) {
minimizing();
}
else {
maximizing();
}
}
* Trên môi trường song song
Tương tự, khi đó phương thức run() của lớp Solver_Lan sẽ được gọi:
void Solver_Lan::run()
{
minimizing();
}
Chương trình thực thi
Đầu vào của chương trình là tệp tsp.dat lưu số đỉnh, trọng số khoảng cách giữa các đỉnh.
TÀI LIỆU THAM KHẢO
[1]. Nguyễn Đức Nghĩa, Nguyễn Tô Thành. Toán rời rạc. Nhà xuất bản Giáo dục, 1999.
[2]. Nguyễn Đức Nghĩa. Tối ưu hóa (Quy hoạch tuyến tính và rời rạc). Nhà xuất bản Giáo dục, 1999.
[3]. Nguyễn Đức Nghĩa. Tính toán song song. Bài giảng 2003.
[4]. Nguyễn Thanh Thủy, Lê Đăng Hưng, Tạ Tuấn Anh, Nguyễn Hữu Đức. Lập trình hướng đối tượng với C++. Nhà xuất bản khoa học kỹ thuật, 1999.
[5]. Nguyễn Lê Anh, Phạm Thế Long. Xử lý song song. Bài giảng 2005.
[6]. Alberto CESELLI. Two exact algorithms for the capacitated p-median problem. Quarterly Journal of the Belgian, French and Italian Operations Research Societies. 2003
[7]. Alberto Ceselli. Branch-and-price algorithms for partitioning problems. Ph.D. Thesis, 2005
[8]. Alberto CESELLI, Giovanni RIGHINI. Algoritmi Branch & Bound e Branch & Price per il problema delle p-mediane con capacità. 2001
[9]. Alan Edelman. Applied Parallel Computing. MIT 2004.
[10]. Alan Edelman. Parallel Scientific Computing. MIT 2002.
Các file đính kèm theo tài liệu này:
- thuat toan nhanh can tren moi truong song song.doc