Bài tập tìm cây khung nhỏ nhất có lời giải năm 2024

Bài toán cây khung nhỏ nhất của đồ thị là một trong số những bài toán tối ưu trên đồ thị tìm được ứng dụng trong nhiều lĩnh vực khác nhau của đời sống. Trong mục này chúng ta trình bày những thuật toán cơ bản để giải bài toán nào. Trước hết chúng ta phát biểu nội dung bài toán.

Phát biểu bài toán

Cho G =(V,E) là đồ thị vô hướng liên thông với tập đỉnh V ={1, 2, . . . ,n} và tập cạnh E gồm m cạnh. Mỗi cạnh E của đồ thị G được gán với một số không âm c(e), gọi là độ dài của nó. Giả sử H=(V,T) là cây khung của đồ thị G. Ta gọi độ dài c(H) của cây khung H là tổng độ dài các cạnh của nó:

C ( H ) = ∑ e ∈ T c ( e ) size 12{C \( H \) `=` Sum cSub { size 8{e` in `T} } {c \( e \) } } {}

Bài toán đặt ra là trong tất cả cây khung của đồ thị G hãy tìm cây khung với độ dài nhỏ nhất. Cây khung như vậy như vậy được gọi là cây khung nhỏ nhất của đồ thị và bài toán đặt ra được gọi là bài toán cây khung nhỏ nhất.

Để minh hoạ cho những ứng dụng bài toán cây khung nhỏ nhất, dưới đây, ta phát biểu hai mô hình thực tế tiêu biểu của nó.

Bài toán xây dựng hệ thống đường sắt. Giả sử ta muốn xây dựng một hệ thống đường sắt nối n thành phố sao cho hành khách có thể đi từ bất kỳ một thành phố nào đến bất kỳ một trong các thành phố còn lại. Mặt khác trên quan điểm kinh tế đòi hỏi là chi phí xây dựng hệ thống đường phải nhỏ nhất. Rõ ràng đồ thị mà đỉnh là các thành phố còn các cạnh là các tuyến đường sắt nối các thành phố tương ứng với phương án xây dựng tối ưu phải là cây. Vì vây, bài toán đặt ra dẫn về bài toán tìm cây khung nhỏ nhất trên đồ thị đầy đủ n đỉnh, mỗi đỉnh tương ứng với một thành phố, với độ dài trên các các cạnh chính là chi phí xây dựng đường ray nối hai thành phố tương ứng (chú ý là trong bài toán này ta giả thiết là không xây dựng tuyến đường sắt có các nhà ga phân tuyến nằm ngoài các

thành phố).Bài toán nối mạng máy tính. Cần nối mạng một hệ thống gồm n máy tính đánh

số từ 1 đến n. Biết chi phí nối máy i với máy j là c[i,j], i,j = 1, 2, . . . ,n ( thông thường chi phí này phụ thuộc vào độ dài cáp nối cần sử dụng). Hãy tìm cách nối mạng sao cho tổng chi phí nối mạng là nhỏ nhất.

Để giải bài toán cây khung nhỏ nhất, tất nhiên có thể liệt kê tất cả các cây khung của đồ thị và chọn trong số cây khung ấy cây khung nhỏ nhất. Phương pháp như vậy, trong trường hợp đồ thị đầy đủ, sẽ đòi hỏi thời gian cỡ nn-2 , và rõ ràng không thể thực hiện được ngay cả với những đồ thị với số đỉnh cỡ hàng chục. Rất may là đối với bài toán cây khung nhỏ nhất chúng ta đã có những thuật toán rất hiệu quả để giải chúng. Chúng ta xét hai trong số những thuật toán như vậy: Thuật toán Kruskal và Thuật toán Prim.

Thuật toán Kruskal

Thuật toán sẽ xây dựng tập cạnh T của cây khung nhỏ nhất H=(V,T) theo từng bước. Trước hết sắp xếp các cạnh của đồ thị G theo thứ tự không giảm của độ dài. Bắt đầu từ tập T=∅ , ở mỗi bước ta sẽ lần lượt duyệt trong danh sách cạnh đã sắp xếp, từ cạnh có độ dài nhỏ đến cạnh có độ dài lớn hơn, để tìm ra cạnh mà việc bổ sung nó vào tập T gồm n-1 cạnh. Cụ thể, thuật toán có thể mô tả như sau:

Procedure Kruskal;

Begin

T:= ∅ ;

While |T| < (n-1) and (E<> ∅ ) do

Begin

E:=E \ {e};

if (T  {e} không chứa chu trình) then T:= T  {e} ;

End;

if (|T| < n-1) then Đồ thị không liên thông;

End;

Ví dụ 1 Tìm cây khung nhỏ nhất của đồ thị cho trong hình 1 dưới.

Bước khởi tạo. Đặt T:=∅ . Sắp xếp các cạnh của đồ thị theo thứ tự không giảm của độ dài ta có dãy:

(3,5) , (4,6) , (4,5) , (5,6) , (3,4) , (1,3) , (2,3) , (2,4) , (1,2)

dãy độ dài tương ứng của chúng

4, 8, 9, 14, 16, 17, 18, 20, 23.

Hình 1 Đồ thị và cây khung nhỏ nhất.

Ở ba lần gặp đầu tiên ta lần lượt bổ sung vào tập T các cạnh (3,5) , (4,6) , (4,5). Rõ ràng nếu thêm cạnh (5,6) vào T thì sẽ tạo thành 2 cạnh (4,5), (4,6) đã có trong T chu trình. Tình huống tương tự cũng xảy ra đối với cạnh (3,4) là cạnh tiếp theo của dãy. Tiếp theo ta bổ sung cạnh (1,3), (2,3) vào T và thu được tập T gồm 5 cạnh:

T = { (3,5) , (4,6) , (4,5) , (1,3) , (2,3) }

Chính là tập cạnh của cây khung nhỏ nhất cần tìm.

Chứng minh tính đúng đắn của thuật toán.

Rõ ràng đồ thị thu được theo thuật toán có n-1 cạnh và không có chu trình, vì vậy theo định lý 4.1 nó là cây khung của đồ thị G. Như vậy, chỉ còn phải chỉ ra rằng T có độ dài nhỏ nhất. Giả sử tồn tại cây S của đồ thị G mà c(S) < c(T). Ký hiệu ek là cạnh đầu tiên trong dãy các cạnh của T xây dựng theo thuật toán vừa mô tả không thuộc S. khi đó đồ thị con của G sinh bởi cây S được bổ sung cạnh ek sẽ chứa một chu trình C duy nhất đi qua ek. Do chu trình C phải chứa cạnh e thuộc S nhưng không thuộc T nên đồ thị con thu được từ S bằng cách thay cạnh e của nó bởi cạnh ek (ký hiệu đồ thị là S’) sẽ là cây khung. Theo cách xây dựng c(ek) ≤ c(e) do đó c(S’) ≤ c(S), đồng thời số cạnh chung của S’ và T đã tăng thêm 1 so với số cạnh chung của S và T. Lặp lại quá trình trên từng bước một ta có thể biến đổi S thành T và trong mỗi bước tổng độ dài không tăng, tức là c(T) ≤ c(S). Mâu thuẫn thu được chúng tỏ T là cây khung nhỏ nhất.

Về việc lập trình thực hiện thuật toán.

Khối lượng tính toán nhiều nhất của thuật toán chính là ở bước sắp xếp các cạnh của đồ thị theo thứ tự không giảm của độ dài để lựa chọn cạnh bổ sung. Đối với đồ thị m cạnh cần phải thực hiện mlogm phép toán để sắp xếp các cạnh của đồ thị thành dãy không giảm theo độ dài. Tuy nhiên, để xây dựng cây khung nhỏ nhất với n-1 cạnh, nói chung ta không cần phải sắp thứ tự toàn bộ các cạnh mà chỉ cần xét phần trên của dãy đó chứa r < m cạnh. Để làm việc đó ta có thể sử dụng các thủ tục sắp xếp dạng Vun đống (Heap Sort). Trong thủ tục này, để tạo đống đầu tiên ta mất cỡ O(m) phép toán, mỗi phần tử tiếp theo trong đống có thể tìm sau thời gian O(log m). Vì vậy, với cải tiến này thuật toán sẽ mất thời gian cỡ O(m+p) log m) cho việc sắp xếp các cạnh. Trong thực tế tính toán số p nhỏ hơn rất nhiều so với m.

Vấn đề thứ hai trong việc thể hiện thuật toán Kruskal là việc lựa chọn cạnh để bổ sung đòi hỏi phải có một thủ tục hiệu quả kiểm tra tập cạnh T  {e} có chứa chu trình hay không. Để ý rằng, các cạnh trong T ở các bước lặp trung gian sẽ tạo thành một rừng. Cạnh e cần khảo sát sẽ tạo thành chu trình với các cạnh trong T khi và chỉ khi cả hai đỉnh đầu của nó thuộc vào cùng một cây con của rừng nói trên. Do đó, nếu cạnh e không tạo thành chu trình với các cạnh trong T, thì nó phải nối hai cây khác nhau trong T. vì thế, để kiểm tra xem có thể bổ sung cạnh e vào T ta chỉ cần kiểm tra xem nó có nối hai cây khác nhau trong T hay không. Một trong các phương pháp hiệu quả để thực hiện việc kiểm tra này là ta sẽ phân hoạch tập các đỉnh của đồ thị ra thành các tập con không giao nhau, mỗi tập xác định bởi một cây con trong T(được hình thành ở các bước do việc bổ sung cạnh vào T). chẳng hạn, đối với đồ thị trong ví dụ 3, đầu tiên ta có sáu tập con 1 phần tử: {1}, {2}, {3}, {4}, {5}, {6} . Sau khi bổ sung cạnh (3, 5), ta có các tập con {1}, {2}, {3,5}, {4}, {6} . Ở bước thứ 3, ta chọn cạnh (4, 5), khi đó hai tập con được nối lại và danh sách các tập con là {1}, {2} , {3, 5, 4, 6} . Cạnh có độ dài tiếp theo là (4,6), do hai đầu của nó thuộc vào cùng một tập con {3,4,5,6} , nên nó sẽ tạo thành chu trình trong tập này. Vì vậy cạnh này không được chọn. Và thuật toán sẽ tiếp tục chọn cạnh tiếp theo để khảo sát …

Như vậy, để giải quyết vấn đề thứ hai này ta phải xây dựng hai thủ tục: Kiểm tra xem hai đầu u, v của cạnh e=(u,v) có thuộc vào hai tập con khác nhau hay không, và trong trường hợp câu trả lời là khẳng định, nối hai tập con tương ứng thành một tập. Chú ý rằng mỗi tập con trong phân hoạch có thể lưu trữ như là một cây có gốc, và khi đó mỗi gốc sẽ được sử dụng làm nhãn nhận biết tập con tương ứng.

Chương trình trên Pascal thực hiện thuật toán Kruskal với những nhận xét vừa nêu có thể viết như sau:

(* TÌM CÂY KHUNG NHỎ NHẤT THEO THUẬT TOÁN KRUSKAL CỦA ĐỒ THỊ CHO BỞI DANH SÁCH CẠNH *)

uses crt;

type

arrn=array[1. .50] of integer;

arrm= array[1...50] of integer;

var

n,m, minL:integer;

Dau, cuoi, W:arrm;

DauT, CuoiT, Father:arrn;

Connect:boolean;

Procedure Nhapdl;

Var

i:integer;

Fanme:string;

F:text;

Begin

Write(‘Cho ten file du lieu:’) readln(fname);

Assign(f,fname); reset(f);

Readln(f,n,m);

For i:=1 to m do readln(f, Dau[i], Cuoi[i], W[i]);

Close(f);

End;

Procedure Indulieu;

Var i:integer;

Begin

Writeln(‘So dinh ‘,n,’. So canh ’,m);

Writeln(‘Dinh dau Dinh cuoi Do dai’);

For i:=1 to m do

Writeln(Dau[i]:4, Cuoi[i}:10, W[i]:12);

End;

Procedure Heap(First, Last:integer);

Var j,k,t1,t2,t3 : integer;

Begin

J:=first;

While (j<=trunc(last/2)) do

Begin

If (2*j<last) and W[2*j+1]<W[2*j]) then K:= 2*j+1

Else k"=2*j;

If W[k]<W[j} then

Begin

T1:=Dau[j]; t1:=Cuoi[j]; t3:=W[j];

Dau[j]:=Dau[k];Cuoi[j]:=Cuoi[k]; W[j]:=W[k];

Dau[k]:=t1; Cuoi[k]:=t2; W[k]:=t3;

J:=k;

End

Else j:=Last;

End;

End;

Function Find(i:integer):integer;

Var Tro:integer;

Begin

Tro:=i;

While Father[Tro]>0 do Tro:=Father[Tro];

Find:=Tro;

End;

Procedure Union(i,j:integer);

Var x:integer;

Begin

x:=father[i]+father[j];

if father[i]>father[j] then

begin

father[i]:=f;

father[j]:=x;

end

else

begin

father[j]:=i;

father[i]:=x;

end;

End;

Procedure Kruskal;

Var

I, Last, u,v,r1,r2, Ncanh, Ndinh:integer;

Begin

(* Khoi tao mang Father danh dau cay con va khoi tao Heap *)

for i:= 1 to n do father[i]:=-1;

for i:=trunc(m/2) downto 1 do Heap(i,m);

last:=m; Ncanh:=0; Ndinh:=0;

MinL:=0;

Connect:=true;

While (Ndinh<n-1) and (Ncanh<m) do

Begin

Ncanh:=Ncanh+1;

u:=dau[1];

v:=Cuoi[1];

(* Kiem tra u va v co thuoc cung mot cay con *)

r1:=find(u);

r2:=find(v);

if r1<>r2 then

begin

(* Ket nap canh (u,v) vao cay khung *)

Ndinh:=Ndinh+1; Union(r1, r2);

DauT[Ndinh]:=u;

CuoiT[Ndinh]:=v;

MinL:=MinL+W[1];

end;

(* To chuc lai Heap *)

Dau[1]:=Dau[Last];

Cuoi[1]:=Cuoi[Last];

W[1]:=W[Last];

Last:=Last-1;

End;

If Ndinh<>n-1 then Connect:=false;

End;

Procedure Inketqua;

Var i:integer;

Begin

Writeln(‘******************************’);

Writeln(‘***** Ket qua tinh toan ********’);

Writeln(‘*******************************’);

Writeln(‘Do dai cua cay khung nho nhat: ‘,MinL);

Writeln(‘Cac canh cua cay khung nho nhat’);

For i:=1 to n-1 do

Writeln(‘(‘,DauT[i]:2,’,’,CuoiT[i]:2,’)’);

Writeln(‘*******************************’);

End;

Begin

Clrscr;

Nhapdl;’

Indulieu;

Kruskal;

If connect then Inketqua

Else

Writeln(‘ Do thi khong lien thong’);

Readln;

End.

File dữ liệu của bài toán trong ví dụ 3 có dạng sau:

7 9

3 5 4

4 6 8

4 5 9

5 6 14

3 4 16

1 3 17

2 3 18

2 4 20

1 2 23

Thuật toán Prim

Thuật toán Kruskal làm việc kém hiệu quả với những đồ thị dày (đồ thị với số cạnh m ≈ n(n-1)/2). Trong trường hợp đó thuật toán Prim tỏ ra hiệu quả hơn. Thuật toán Prim còn được gọi là phương pháp lân cận gần nhất. Trong phương pháp này bắt đầu từ một đỉnh tuỳ ý của đồ thị, đầu tiên ta nối s với đỉnh lân cận gần nó nhất, chẳng hạn là đỉnh y. Nghĩa là trong số các cạnh kề của đỉnh s, cạnh (s,y) có độ dài nhỏ nhất. Tiếp theo trong số các cạnh kề với hai đỉnh s hoặc y ta tìm cạnh có độ dài nhỏ nhất, cạnh này dẫn đến đỉnh thứ ba z, và ta thu được cây bộ phận gồm 3 đỉnh và 2 cạnh. Quá trình này sẽ tiếp tục cho đến khi ta thu được cây gồm n đỉnh và n-1 cạnh sẽ chính là cây khung nhỏ nhất cần tìm.

Giả sử đồ thị cho bởi ma trận trọng số C = {c[i,j], i, j= 1, 2, . . . , n} . trong quá trình thực hiện thuật toán, ở mỗi bước để có thể nhanh chóng chọn đỉnh và cạnh cần bổ sung vào cây khung, các đỉnh của đồ thị sẽ được gán cho các nhãn. Nhãn của một đỉnh v sẽ gồm hai phần và có dạng [d[v], near[v]], trong đó d[v] dùng để ghi nhận độ dài của cạnh có độ dài nhỏ nhất trong số các cạnh nối với đỉnh v với các đỉnh của cây khung đang xây dựng (ta sẽ gọi là khoảng cách từ đỉnh v đến tập đỉnh của cây khung), nói một cách chính xác

d[v]:= min {c[v,w] : w ∈ VH } ( = c[v,z]),

còn near[v] ghi nhận đỉnh của cây khung gần v nhất (near[v]:=z).

Thuật toán Prim được mô tả đầy đủ trong thủ tục sau:

Procedure Prim;

Begin

(* buoc khoi tao *)

chon s la mot dinh nao do cua do thi;

V H :={s} ; T:= ∅ ; d[s]:=0; near[s]:=s.

For v ∈ V\VH do

Begin

D[v]:=c[s,v];

near[v]:=s;

End;

(* buoc lap *)

stop:=false;

while not stop do

begin

tim u ∈ V\VH thoa man:

d[u] =min {d[v]: u ∈ V\V H } ;

V H := V H  { u} ; T := T  {(u, near[u])} ;

If |VH | = n then

Begin

H=( VH,T) la cay khung nho nhat cua do thi;

Stop:=true;

End

Else

For v∈ V\ VH do

If d[v]>c[u,v] then

Begin

d[v]:=c[u,v];

near[v]:=u;

End;

end;

End;

Ví dụ 2 Tìm cây khung nhỏ nhất cho đồ thị xét trong ví dụ 5.1 theo thuật toán Prim. Ma trận trọng số của đồ thị có dạng

Bảng dưới đây ghi nhãn của các đỉnh trong các bước lặp của thuật toán, đỉnh đánh dấu * là đỉnh được chọn để bổ sung vào cây khung (khi đó nhãn của nó không còn bị biến đổi trong các bước lặp tiếp theo, vì vậy ta đánh dấu – để ghi nhận điều đó):

Bước lặp Đỉnh 1 Đỉnh 2 Đỉnh 3 Đỉnh 4 Đỉnh 5 Đỉnh 6 VH T Khởi tạo [0,1] [33,1] [17,1]* [∞ ,1] [∞ ,1] [∞ ,1] 1 ∅ 1 - [18,3] - [16,3] [4,3]* [∞ ,1] 1,3 (3,1) 2 - [18,3] - [9,5] - [14,5] 1,3,5 (3,1), (5,3) 3 - [18,3] - - - [8,4] 1,3,5,4 (3,1), (5,3), (4,5) 4 - [18,3]* - - - - 1,3,5,4,6 (3,1), (5,3), (4,5), (6,4) 5 - - - - - - 1,3,5,4,6,2 (3,1), 5,3), (4,5), 6,4), (2,3)

Bài tập

Bài tập 1 : Mạng an toàn

Cho một mạng N (N <= 20) máy tính được đánh số từ 1 đến N. Sơ đồ mạng được cho bởi hệ gồm M kênh (đoạn) nối trực tiếp giữa một số cặp máy trong mạng, m kênh tương ứng với m cặp. Cho biết chi phí truyền 1 đơn vị thông tin theo mỗi kênh của mạng.

Người ta cần chuyển một bức thông điệp từ máy s đến máy t. Để đảm bảo an toàn, người ta chuyển bức thông điện này theo hai đường truyền tin khác nhau (tức không có kênh nào) của mạng được sử dụng trong cả hai đường truyền tin; cho phép hai đường truyền tin cùng đi qua một số máy tính). Chi phí của một đường truyền được hiểu là tổng chi phí trên các kênh của nó. Đơn giá đường truyền từ máy s sang máy t được tính như sau:

Với hai máy s và t, cùng bức thông điệp có độ dài là 1 đơn vị thông tin, đơn giá truyền cho cặp (s, t) được tính bằng tổng chi phí chuyển thông điệp an toàn (bằng tổng chi phí của hai đường truyền tin) là nhỏ nhất.

Mạng truyền tin nói trên thỏa mãn tính chất an toàn theo nghĩa là từ một máy bất kỳ luôn truyền được (một cách an toàn) thông điệp tới một máy bất kỳ khác. Khi một mạng an toàn, người ta tính được đơn giá của mạng là tổng đơn giá mọi đường truyền từ một máy bất kỳ tới một máy bất kỳ khác.

Ma trận đơn giá của mạng là mảng hai chiều A có N dòng và N cột, mà giá trị phần tử A[i, j] chính là đơn giá từ máy i sang máy j.

Câu 1: Cho trước một mạng, hãy kiểm ra tính an toàn của mạng đó.

Câu 2: Khi mạng không an toàn được phép bổ sung một số kênh truyền để nó trở thành an toàn. Đơn giá mỗi kênh truyền bổ sung theo được coi bằng hai lần giá trị cực đại đơn giá các kênh đã có. Mọi kênh bổ sung được coi có đơn giá như nhau. Hãy tìm cách bổ sung các kênh mới mà đơn giá mạng là nhỏ nhất.

Câu 3: Khi mạng an toàn hoặc sau khi bổ sung kênh để mạng an toàn, hãy in ra đơn giá mạng và ma trận đơn giá.

Dữ liệu vào: cho trong file INP.B2 với cấu trúc như sau:

Dòng đầu tiên ghi 2 số n, m cách nhau bởi dấu cách.

Mỗi dòng thứ i trong số m dòng tiếp theo ghi thông tin về kênh nối thứ i của mạng gồm 3 số d[i], c[i], g[i] trong đó d[i], c[i] là chỉ số của hai máy tương ứng với kênh này và g[i] (nguyên dương) là chi phí để truyền một đơn vị thông tin từ máy d[i] đến máy c[i] theo kênh này. Các giá trị g[i] cho trước không vượt quá 40 (và như vậy đơn giá các kênh bổ sung không vượt quá 80).

Kết quả: ghi ra file OUT.B2 theo qui cách sau:

Dòng đầu tiên ghi 1 số nguyên p thể hiện mạng có an toàn hay không và p có ý nghĩa là số lượng kênh cần bổ sung. p=0 có nghĩa mạng an toàn; p>0 có nghĩa mạng không an toàn và cần bổ sung p kênh nữa để mạng an toàn với chi phí bổ sung ít nhất.

p dòng tiếp theo ghi p kênh bổ sung. Cách ghi như trong file dữ liệu vào.

Dòng tiếp theo ghi đơn giá của mạng an toàn.

N dòng tiếp theo ghi ma trận đơn giá của mạng an toàn: mỗi hàng của ma trận ghi trên một dòng.

Bài tập 2: Xây dựng đường ống nước

Có 1 trạm cấp nước và N điểm dân cư. Hãy xây dựng chương trình thiết kế tuyến đường ống nước cung cấp đến mọi nhà sao cho tổng chiều dài đường ống phải dùng là ít nhất. Giả sử rằng các đường ống chỉ được nối giữa 2 điểm dân cư hoặc giữa trạm cấp nước với điểm dân cư.

Chủ đề