用划分树来解决选定区间内的第K大值,其实也就两步!一步是建树,另一步则是查询。
先说我对建树的理解吧!
建树的过程很简单:两步就OK了!
第一步:找到序列的中位数,把大于中位数的扔到中位数的左边,小于中位数的扔到数的右边。这样整个序列就被分成了两个区间。
第二步:对每个子区间,也分别执行第一步操作,直到序列中只有一个元素为止。
可以看出,建树是一个递归的过程,与线段树的建树有相似之处。
划分树的建树需要注意以下几点:
第一:建树是分层的,所以代码中用的是二维数组tree[20][M]。一般10W级别的数据,20层已经够了。
第二:建树划分的标准是中位数,所以需要排序。而且只排一次序就OK了,为什么只排一次就OK了,我很久都没明白这一点。其实是这样的:对于任意序列: 划分后,左边的数据永远不会大于右边的数据。那么对左边数据单独排序与整体排序的结果是一样的,所以排一次序就OK了!
第三:划分树划分好的数据永远在存放在下一层。比如数据:
tree[0][M]=1 5 2 6 3 7 4
排序后为:1 2 3 4 5 6 7
中位数为:4
划分后的结果为:tree [M]=1 2 3 4 5 6 7(这组数据有点特殊,划分后来就已经是排好序的了)红黑色字体都仍按原未排顺序排列
(红色表示划分到中位数的左边,黑色表示划分到中位数的右边)
接着划分:tree [M]=1 2 3 4 5 6 7
再接着分:tree [M]=1 2 3 4 5 6 0
到这里已经分完了,为什么最后是0呢?在第2层(tree [M]),7已经分完了,所以不用再分
第四:划分到最后,实际上已经对序列进行排序了。
划分的时候还有一点需要处理:如果有多个数据相同怎么办呢?通过一种特殊的处理:尽量使左右两边平均分配相同的数。这个特殊处理是这样的:
在没分之前,先假设中位数左边的数据suppose都已经分到左边了,所以suppose=mid-left+1;然后如果真的分在左边,即if(tree[level][i]<sorted[mid])
suppose--;suppose就减一!到最后,如果suppos=1,则说明中位数左边的数都小于中位数,如果有等于中位数的,则suppose大于1。
最后分配的时候,把suppose个数,分到左边就可以了,剩下的分到右边!因为suppose的初值是mid-left+1,这样就能保证中位数左边和右边的数平衡了!
第五:划分的过程,需要把每层的数据记录:toLeft[20][M]。toLeft[i][j]定义为:第i层[1,j]之间有多
模板:
[cpp]
#include<stdio.h>
#include<algorithm>
using namespace std;
#define M 100005
int tree[20][M],sorted[M];
int toLeft[20][M];
void build(int level,int left,int right){
if(left==right)return ;
int mid=(left+right)>>1;
int i;
int suppose;//假设在中位数sorted[mid]左边的数都全部小于sorted[mid]
suppose=mid-left+1;
for(i=left;i<=right;i++){
if(tree[level][i]<sorted[mid]){
suppose--;
}
}