성능 좋은 Java/Python의 기본 sorting 알고리즘, Tim Sort 이해하기

TimSort 란?

Tim Sort는 Java, Python을 비롯한 여러 언어와 프레임워크에서 기본 알고리즘으로 사용되는 sorting 알고리즘이다.

python (since v2.3)
java (since SE 7)
android
V8
Swift

특징

hybrid sorting algorithm (merge + insertion)
highly optimized mergesort
stable and faster mergesort

장점

작은 수의 sort에서 quick이나 merge sort보다 빠른 속도를 보인다.
큰 수에 있어서도 빠른 속도를 보인다.
real data에서 강하다.
- 테스트를 하는 데이터(실험실에서나 보이는)들에서는 whole random data 이기 때문에 기존의 sorting들과 유사한 속도.
- real data들은 부분 sorting 되어 있거나 연속적인 값인 경우가 많아 더 효율적.
worst case에서도 성능을 유지한다.
- quick sort와 대비하여 사용되는 이유가 되기도 함.

주요 개념

Tim sort의 기본은 merge sort 이다.
여러가지 기술들로 여러 부분의 단점들을 개선해낸 sorting 알고리즘이다.

binary insersion sort

insertion sort의 \(O(n^2)\)를 \(C1 * n^2 + a1\) 라고 표현한다면 merge sort의 \(O(nlogn)\)을 \(C2 * nlogn + a2\)라고 표현할 수 있는데, 작은 n에서는 C1과 C2의 크기가 성능에 큰 영향을 미치며 insertion sort가 더 효율적이다.
따라서 성능 개선을 목적으로 tim sort는 작은 단위에서 insertion sort를 사용한다.
효율을 위해 binary search로 넣을 위치를 찾는다.

run

run은 각각이 insertion sort로 sorted 된 기본 단위이다. Tim sort는 run이라는 덩어리를 만들어놓고 run들을 merge하는 방식으로 진행된다. minRun을 통해 run의 최소 크기를 정함.

ary의 크기를 N이라하면 minRun = min(N, MIN_MERGE)
MIN_MERGE의 경우 \(2^5\) ~ \(2^6\) 의 값을 사용.
- 이는 통계적으로 insertion sort가 더 빠른 크기.
- 전체 크기에서 mergesort가 가장 효율적일 수 있는 minRunLength를 계산하여 사용.
- merge sort는 2의 제곱수일 때 가장 효율이 좋음.

merge stack

각각의 run은 stack에 쌓이고 Tim sort의 merge는 stack에서 run들을 가져와 병합하는 방식으로 이루어진다. 기존의 merge sort에서 중요한 부분들이 run을 도입하여 Tim sort에서 추가적으로 고려해야 되는 부분들이 있다. Tim sort가 여기서 고려한 부분은 다음과 같다.

stack의 갯수를 조절한다.
- merge sort는 stack을 사용하지 않음.
- run을 무자비하게 쌓으면 stack의 메모리 문제.
길이가 유사한 크기의 run 끼리 병합한다.
- merge sort에서는 유사/동일한 크기의 덩어리를 병합하는 것이 기본.
인접한 run을 병합한다.
- merge sort에서는 인접한 덩어리를 병합하는 것이 기본.
- 안정성과 효율적인 처리를 위해.

이러한 구현을 위해 stack에 run을 쌓을 때 다음과 같은 조건으로 stack을 쌓는다.

C > A + B
B > A

run merge

merge를 실제 진행할 때, merge sort의 단점은 추가 메모리를 n 사용한다는 점이었다. Tim sort에서는 두 run의 merge 과정에서 작은 run만 복사하여 merge 값을 채우는 방식으로 진행하여 추가 메모리를 n/2 이하로 줄인다.

galloping

두 run을 merge할 때 한 쪽에서 계속해서 큰 숫자가 보이는 경우 galloping mode를 발동시킨다.
galloping mode는 \(2^k\) 번씩 점프하며 merge sort의 속도를 증가시킬 수 있도록 한다.

다시보는 장점

작은 수의 sort에서 quick이나 merge sort보다 빠른 속도를 보인다.
- insertion sort의 활용
큰 수에 있어서도 빠른 속도를 보입니다.
- 작은 단위에서의 insertion sort의 역할
- 기본적으로 merge sort의 성능
real data에서 강하다.
- 테스트를 하는 데이터(실험실에서나 보이는)들에서는 whole random data 이기 때문에 기존의 sorting들과 유사한 속도.
- real data들은 부분 sorting 되어 있거나 연속적인 값인 경우가 많아 더 효율적.
- insertion sort가 정렬된 데이터에 대해서 보다 효율적으로 동작
- galloping mode로 일부 정렬된 데이터에서 더 빠르게 sort
worst case에서도 성능을 유지한다.
- quick sort와 대비하여 사용되는 이유가 되기도 함.
- 기본적으로 merge sort의 성능

코드

jetbrains에서 관리하는 repo인 jdk8를 참고하면 좋다.
이 외에도 여러 곳에서 timsort 소스코드를 확인할 수 있다.

merge sort vs tim sort

merge sort와 tim sort를 비교하는 속도 영상 참고