归并排序原理

发表于 2021-09-11 更新于 2024-10-01 分类于算法阅读次数： Disqus：本文字数： 788 阅读时长 ≈ 3 分钟

归并排序属于分治法思想，归并排序完全遵循分治模式。直观上其操作如下：

分解：分解待排序的n个元素成各具n/2个元素的两个子序列。
解决：使用归并排序递归地排序两个子序列。
合并：合并两个已排序的子序列以产生已排序的数组。

核心函数有两个，merge(A,p,q,r)：将已经有序的序列 A[p…q]和A[q+1,r] 合并为一个有序序列。

#include <iostream>
#include <vector>
#include <climits>
using namespace std;

void merge(vector<int> &A, int p, int q, int r)
{
    int n1 = q - p + 1;
    int n2 = r - q;
    vector<int> L(n1 + 1);
    vector<int> R(n2 + 1);
    L[n1] = INT_MAX;
    R[n2] = INT_MAX;
    for (int i = 0; i < n1; ++i)
    {
        L[i] = A[p + i];
    }
    for (int i = 0; i < n2; ++i)
    {
        R[i] = A[q + i + 1];
    }
   
    int i = 0, j = 0;
    for (int k = p; k <= r; ++k)
    {
        if (L[i] <= R[j])
        {
            A[k] = L[i];
            ++i;
        }
        else
        {
            A[k] = R[j];
            ++j;
        }
    }
}

void merge_sort(vector<int> &A, int p,int r){
    if(p<r){
        int q = (p+r)>>1;   // (p+r)/2
        merge_sort(A,p,q);
        merge_sort(A,q+1,r);
        merge(A,p,q,r);
    }
}

int main()
{
    vector<int> A{1,5,2,7,3,7,1,6,3};
    merge_sort(A,0,A.size()-1);
    for(auto x:A){
        cout<<x<<" ";
    }
    return 0;
}

分治法时间复杂度分析

假设 T(n) 是规模为 n 的一个问题的运行时间。把原问题分解为 a 个子问题，每个子问题的规模为原问题的 1/b（对于归并排序，a和b都是2）。为了求解一个规模为 n/b 的子问题，需要 T(n/b)，所以需要aT(n/b)的时间来求解a个子问题。如果分解问题成子问题需要时间 D(n)，合并子问题为原问题的解需要时间 C(n)，那么得到以下递归式：T(n) = aT(n/b) + D(n) + C(n)

归并排序算法

时间复杂度

分解：只需计算数组中间的下标位置，需要常量时间，D(n) = O(1)

解决：我们递归地求解两个规模为 n/2 的子为题，将产生 2T(n/2) 的时间

合并：排序两个有序数组，需要线性时间，C(n) =Θ(n)，为什么这里用Θ，而不用 O，因为 O(n)还包括常数时间，Θ(n)不包括常数时间。

T(n) = Θ(1) 当n==1

T(n) = 2T(n/2) + Θ(n) 当 n >1

以下为 T(n)的递归树：

IMG_082FCEFC406D-1

顶层具有总代价 cn，下一层具有总代价 c(n/2)+c(n/2) == cn，下一层的下一层具有总代价 c(n/4)+c(n/4)+c(n/4)+c(n/4) == cn。总的来说，递归树每一层的代价都为 cn

递归树的总的层数为 lgn+1，其中 n是叶数，对应输入规模。总的代价为 cn( lgn+1) = cn$\lg n$+cn。忽略低阶项和常量 c，最终归并排序的时间复杂度为 O(n lgn)。

空间复杂度

递归树的深度为 lgn+1，每次递归使用常量空间 O(1)

使用两个零时数组，空间复杂度为 O(n)

所以总的空间复杂度为 O(n + 1*(lgn+1) )，忽略低阶项和常数项 1，最终空间复杂度为 O(n)