归并排序原理
归并排序属于分治法思想,归并排序完全遵循分治模式。直观上其操作如下:
- 分解:分解待排序的n个元素成各具n/2个元素的两个子序列。
- 解决:使用归并排序递归地排序两个子序列。
- 合并:合并两个已排序的子序列以产生已排序的数组。
核心函数有两个,merge(A,p,q,r):将已经有序的序列 A[p…q]和A[q+1,r] 合并为一个有序序列。
1 |
|
分治法时间复杂度分析
假设 T(n) 是规模为 n 的一个问题的运行时间。把原问题分解为 a 个子问题,每个子问题的规模为原问题的 1/b(对于归并排序,a和b都是2)。为了求解一个规模为 n/b 的子问题,需要 T(n/b),所以需要aT(n/b)的时间来求解a个子问题。如果分解问题成子问题需要时间 D(n),合并子问题为原问题的解需要时间 C(n),那么得到以下递归式:T(n) = aT(n/b) + D(n) + C(n)
归并排序算法
时间复杂度
分解:只需计算数组中间的下标位置,需要常量时间,D(n) = O(1)
解决:我们递归地求解两个规模为 n/2 的子为题,将产生 2T(n/2) 的时间
合并:排序两个有序数组,需要线性时间,C(n) =Θ(n),为什么这里用Θ,而不用 O,因为 O(n)还包括常数时间,Θ(n)不包括常数时间。
T(n) = Θ(1) 当n==1
T(n) = 2T(n/2) + Θ(n) 当 n >1
以下为 T(n)的递归树:
顶层具有总代价 cn,下一层具有总代价 c(n/2)+c(n/2) == cn,下一层的下一层具有总代价 c(n/4)+c(n/4)+c(n/4)+c(n/4) == cn。总的来说,递归树每一层的代价都为 cn
递归树的总的层数为 lgn+1,其中 n是叶数,对应输入规模。总的代价为 cn( lgn+1) = cn$\lg n$+cn。忽略低阶项和常量 c,最终归并排序的时间复杂度为 O(n lgn)。
空间复杂度
递归树的深度为 lgn+1,每次递归使用常量空间 O(1)
使用两个零时数组,空间复杂度为 O(n)
所以总的空间复杂度为 O(n + 1*(lgn+1) ),忽略低阶项和常数项 1,最终空间复杂度为 O(n)