[알고리즘] 크루스칼 알고리즘(Kruskal Algorithm)
이것이 취업을 위한 코딩 테스트다. with 파이썬
책을 참고하여 정리한 내용입니다.
✅ 신장 트리
신장 트리(Spanning Tree)란 하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프를 의미한다. 이때 모든 노드가 포함되어 서로 연결되면서 사이클이 존재하지 않는다는 조건은 트리의 성립조건이기도하다.
✅ 크루스칼 알고리즘(Kruskal Algorithm)
신장 트리 중에서 최소 비용으로 만들 수 있는 신장트리를 찾는 알고리즘을 ‘최소 신장 트리 알고리즘’이라고 한다. 대표적인 최소 신장 트리 알고리즘이 크루스칼 알고리즘(Kruskal Algorithm)이다. 크루스칼 알고리즘은 그리디 알고리즘으로 분류된다. 구체적인 알고리즘은 다음과 같다.
- 간선 데이터를 비용에 따라 오름차순으로 정렬한다.
- 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인한다. Ⅰ. 사이클이 발생하지 않는 경우 최소 신장 트리에 포함시킨다.
Ⅱ. 사이클이 발생하는 경우 최소 신장 트리에 포함시키지 않는다. - 모든 간선에 대하여
2
번 과정을 반복한다.
최종적으로 신장 트리에 포함되는 간선의 개수가 ‘노드의 수 - 1’과 같다는 특징이 있다.
✅ 크루스칼 알고리즘 시간 복잡도
간선의 개수가 $E$개일 때, $O(ElogE)$의 시간 복잡도를 가진다. 크루스칼 알고리즘에서 가장 시간이 오래 걸리는 부분이 간선을 정렬하는 작업이며, 크루스칼 내부에서 사용되는 서로소 집합 알고리즘의 시간 복잡도는 정렬 알고리즘의 시간 복잡도보다 작으므로 무시한다.
🗒️ 크루스칼 알고리즘 소스코드
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
# 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
if parent[x] != x:
parent[x] = find_parent(parent, parent[x])
return parent[x]
# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
a = find_parent(parent, a)
b = find_parent(parent, b)
if a < b:
parent[b] = a
else:
parent[a] = b
# 노드의 개수와 간선(union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = list(range(v + 1)) # 부모 테이블 초기화
# 모든 간선을 담을 리스트와 최종 비용을 담을 변수
edges = []
result = 0
# 모든 간선에 대한 정보를 입력받기
for _ in range(e):
a, b, cost = map(int, input().split())
# 비용순으로 정렬하기 위해서 튜플의 첫 번째 원소를 비용으로 설정
edges.append((cost, a, b))
# 간선을 비용순으로 정렬
edges.sort()
# 간선을 하나씩 확인하며
for edge in edges:
cost, a, b = edge
# 사이클이 발생하지 않는 경우에만 집합에 포함
if find_parent(parent, a) != find_parent(parent, b):
union_parent(parent, a, b)
result += cost
print(result)
예제 입력
1
2
3
4
5
6
7
8
9
10
7 9
1 2 29
1 5 75
2 3 35
2 6 34
3 4 7
4 6 23
4 7 13
5 6 53
6 7 25
예제 출력
1
159
This post is licensed under CC BY 4.0 by the author.