Computer Science/Algorithm

[Algorithm] 크루스칼 (Kruskal) 알고리즘

great_park 2023. 5. 22. 17:29
반응형

Idea

Kruskal Algorithm

크루스칼 알고리즘은 최소 신장 트리, MST 를 찾는 알고리즘입니다. 그래프의 간선을 하나씩 늘리면서 가중치가 최소인 간선부터 추가하는 Greedy 방식을 사용합니다. 

즉, 간선을 추가하는 각 단계에서 사이클을 이루지 않는 최소 비용 간선을 선택하며 MST를 만들어가는 알고리즘입니다.

 

동작 과정

  1. 그래프의 간선들을 가중치의 오름차순으로 정렬한다.
  2. 정렬된 간선 리스트에서 순서대로 사이클을 형성하지 않는 간선을 선택한다.
    - 즉, 가장 낮은 가중치를 먼저 선택한다.
    - 사이클을 형성하는 간선을 제외한다.
  3. 해당 간선을 현재의 MST(최소 비용 신장 트리)의 집합에 추가한다.

 

각 단계에서 간선 선택을 Greedy하게 실시 하고, 이전 단계에서 만들어진 신장 트리와는 상관없이 무조건 최소 간선만을 선택합니다. 

이때, 각 단계에서는 사이클의 형성 여부를 확인하기 위해서 union-find 알고리즘을 사용합니다.

즉, 내가 추가하고자 하는 간선의 양끝 정점이 같은 집합에 속해 있는지를 먼저 검사합니다.

 

Code

# 특정 원소가 속한 집합을 찾기
def find_parent(parent, x):
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b

# 노드의 개수와 간선(union 연산)의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v + 1)

# 부모 테이블상에서, 부모를 자기 자신으로 초기화
for i in range(1, v + 1):
    parent[i] = i

edges = []
result = 0

# 간선을 입력받아 coat를 기준으로 오름차순 정렬
for _ in range(e):
    a, b, cost = map(int, input().split())
    edges.append((cost, a, b))

edges.sort()

# 정렬된 간선을 하나씩 확인
for edge in edges:
    cost, a, b = edge
    # 두 노드의 루트 노드가 서로 다르다면 사이클이 발생하지 않은것이므로  
    if find_parent(parent, a) != find_parent(parent, b):
        # 신장 트리에 간선 추가
        union_parent(parent, a, b)
        result += cost

 

Time Complexity

크루스칼 알고리즘은 간선의 개수가 E개일 때, O(ElogE)의 시간 복잡도를 가집니다. 

크루스칼 알고리즘의 동작 과정은 크게 (1) 유니온-파인드, (2) 간선 정렬 이렇게 2가지로 나뉘는데, 유니온 파인드의 경우 정확히 정의할 수 없지만 O(logN)에서 O(N)로 나오며, 가장 빠른 퀵 정렬을 사용하면 O(NlogN)이 나오므로, 크루스칼 알고리즘의 시간 복잡도는 간선 E개에 대해서 O(ElogE)라고 정리할 수 있습니다.

반응형