昨天通宵,早上四点的时候就开始写博客.结果五点的时候电脑罢工,自动重启.我写的东西也就都没有了,都怪自己平时没有保存的习惯。
下次一定要注意,要养成保存的习惯,要不然再发生这样的情况,那就只能笑话自己还是个马马虎虎的小孩子了.
刚才自己列了一下文章中需要讲到的部分,很庆幸,今天的状态还不错,自己还是很满意的.
说到排序算法,首先来搞清楚一个问题,内排序和外排序指的是什么?要想解释这个问题,需要将内排序和外排序比较区分.
内排序: 需要比较的数据数量相比较外排序少,排序的数据可以一次装入内存中,在内存中进行排序.
外排序: 需要比较的数据数量相比较内排序多,数据无法一次装入内存进行排序操作.数据一般存储在较慢的外存储器.而且一般借助临时
文件完成排序操作.
快速排序算法也是基于分治模式.分治模式怎么解释?
所谓分治模式,来自算法的一种思想-- 分治思想.分治算法的基本思想就是将一个规模为N的问题分解为K个规模较小的子问题,且子问题
与原问题相互独立而且性质相同,所以求出子问题的解,就可一得到原问题的解.
分治算法的解题步骤:
1. 分解: 将需要解决的问题划分为相互独立且性质相同的若干子问题.
2. 求解: 求解每一个子问题的解.
3. 合并: 合并子问题的解得到原问题的解.
从分治算法的解题步骤可以看出,分治的思想突出的就是分开治理,从局部到整体.用个不恰当的例子来理解一下分治,就像是生活中我们
遇到复杂棘手的问题,仔细分析,然后按照步骤一个个解决,从简单到复杂.
为什么要浪费这么多的语言来说明一下分治算法思想,因为<<算法导论>>中对于快速排序的描述是用分治模式来描述的.
快速排序算法的描述:(<<算法导论>>)
分解: 数组A[p..r]被划分成为两个(可能为空)子数组A[p..q-1]和A[q+1..r],使得A[p..q-1]中的每个元素都小于等于A(q),而且小于等于A[q+1..r]
中的元素,下标q也在划分的过程中进行计算.
解决: 通过递归调用快速排序,对子数组A[p..q-1],A[q+1..r]排序.
合并: 因为两个子数组是就地排序的,将他们的合并不需要操作:整个数组A[p..r]已排序.
就地排序是什么? 怎么理解呢? -,-,先别急,先来看看对于快速排序过程的伪代码描述,让我们清晰的理解一下快速排序的过程.
QUICKSORT(A,p,r)
1 if p < r
2 then q <-- PARTITION(A,p,r)
3 QUICKSORT(A,p,q-1)
4 QUICKSORT(A,q+1,r)
QUICKSORT函数中三个参数的意义: A 待排序数组 p 排序开始标志位 r 待排序数组A的长度.如果想要给一个完整的数组A排序,那么就需要执行QUICKSORT(A,1,length[A]).
从上面的排序过程可以看出3,4都是递归调用解决子问题,而就地排序的过程在PARTITION中进行。所以重点理解PARTITION。
PARTITION(A,p,r)
1 x <-- A[r]
2 i <-- p-1
3 for j <-- p to r-1
4 do if A[j] <= x
5 then i <-- i+1
6 exchange A[i] <--> A[j]
7 exchange A[i+1] <--> A[r]
8 return i+1
上述就地排序的过程是:选取数组最后一个元素作为主元,然后循环遍历A(p) to A(r-1) 将数组分为左右两个部分,
左边部分的元素都是小于等于A(r),右边的元素都大于A(r).注意交换的元素索引,是i而不是j,所以在最后执行一步操作
exchage A[i+1] <--> A[j],将此次排序的基准主元移动到分界点,然后返回索引,用于下面对于划分后的左右两个部分的
递归排序,也就是上面
3 QUICKSORT(A,p,q-1)
4 QUICKSORT(A,q+1,r)
操作.
对于快速排序的概念解释的差不多了,下面来说说快速排序的性能.
快速排序的最坏性能:
最坏的情况发生子划分的过程中,产生的两个区域分别包含N-1个元素和1个0元素.那么运行时间就可以递归的表示
为T(n) = T(n-1)+ T(0)+O(n)= T(n-1) + O(n) = O(n^2)
快速排序的最佳性能:
快速排序就地排序的过程中划分出的两个子问题都不可能大于n/2(因为主元已经被划分出,不需要放在任意一个子问题中
重复求解).如果每次的划分总是两边对称的,那么就会得到最佳运行情况:
T(n) <= 2T(n/2)+ O(n) T(n) = O(nlgn)
快速排序的平衡性能:
快速排序的性能接近最佳性能而不是接近最坏性能。当划分情况是按照常数比例划分的时候,得到的性能指标是O(nlgn)
上面只是说了一些快速排序的性能指标,按照我的层次也不能去证明这些. 另外也没有必要,只要知道在什么情况下是最好情况,
什么情况下是最坏情况. 证明的事情就留给有想法的人去做吧.
至于快速排序的源码实现:
看了网上很多网友在博客中给出的快速排序源码,不发表评论.但是我还是比较相信标准,所以将看一下glibc和libstd++中GNU对
C和C++两个不同版本的快速排序的源码实现.将会在下篇文章中给出.