Description
GameZ为他们最新推出的游戏开通了一个网站。世界各地的玩家都可以将自己的游戏得分上传到网站上。这样就可以看到自己在世界上的排名。得分越高,排名就越靠前。当两个玩家的名次相同时,先上传记录者优先。由于新游戏的火爆,网站服务器已经难堪重负。为此GameZ雇用了你来帮他们重新开发一套新的核心。排名系统通常要应付三种请求:上传一条新的得分记录、查询某个玩家的当前排名以及返回某个区段内的排名记录。当某个玩家上传自己最新的得分记录时,他原有的得分记录会被删除。为了减轻服务器负担,在返回某个区段内的排名记录时,最多返回10条记录。
Input
第一行是一个整数n(n>=10)表示请求总数目。接下来n行每行包含了一个请求。请求的具体格式如下: +Name Score 上传最新得分记录。Name表示玩家名字,由大写英文字母组成,不超过10个字符。Score为最多8位的正整数。 ?Name 查询玩家排名。该玩家的得分记录必定已经在前面上传。 ?Index 返回自第Index名开始的最多10名玩家名字。Index必定合法,即不小于1,也不大于当前有记录的玩家总数。输入文件总大小不超过2M。 NOTE:用C++的fstream读大规模数据的效率较低
Output
对于每条查询请求,输出相应结果。对于?Name格式的请求,应输出一个整数表示该玩家当前的排名。对于?Index格式的请求,应在一行中依次输出从第Index名开始的最多10名玩家姓名,用一个空格分隔。
Sample Input 20
+ADAM 1000000 加入ADAM的得分记录
+BOB 1000000 加入BOB的得分记录
+TOM 2000000 加入TOM的得分记录
+CATHY 10000000 加入CATHY的得分记录
?TOM 输出TOM目前排名
?1 目前有记录的玩家总数为4,因此应输出第1名到第4名。
+DAM 100000 加入DAM的得分记录
+BOB 1200000 更新BOB的得分记录
+ADAM 900000 更新ADAM的得分记录(即使比原来的差)
+FRANK 12340000 加入FRANK的得分记录
+LEO 9000000 加入LEO的得分记录
+KAINE 9000000 加入KAINE的得分记录
+GRACE 8000000 加入GRACE的得分记录
+WALT 9000000 加入WALT的得分记录
+SANDY 8000000 加入SANDY的得分记录
+MICK 9000000 加入MICK的得分记录
+JACK 7320000 加入JACK的得分记录
?2 目前有记录的玩家总数为12,因此应输出第2名到第11名。
?5 输出第5名到第13名。
?KAINE 输出KAINE的排名
Sample Output
2
CATHY TOM ADAM BOB
CATHY LEO KAINE WALT MICK GRACE SANDY JACK TOM BOB
WALT MICK GRACE SANDY JACK TOM BOB ADAM DAM
算法分析
主要涉及到三种操作,我们可以用Treap或者Splay实现。由于Splay实现相对复杂,我们用Treap实现。存储我们这里采用二叉链。
- 查询名字,我们可以通过hash生成名字与id的映射,同时由于我们建树是把分数作为关键字,并且先插入的数字比较大,因此我们可以把分数乘以一个很大的树,然后减去当前插入的数作为id。这里我们图省事儿直接用了STL的map。
- 查询排名,这个我们可以理解为:BST中只要一直沿着右子树下降那么最右边的肯定是第一名,因为他最大,同时我们把每个节点绑定一个size,这个size代表节点包含子节点的总数目(包括自己),那么我们很明显知道节点的右子节点的size+1就是排名;如果沿着左子树去查找了,那么我们需要把要找的节点的size加右子树的size+1,这样我们就递归的找到了。
- 查询邻近的10个排名
- 先解决查询第k名的问题,这个就是问题2的逆过程:
- BST中只要一直沿着右子树下降那么最右边的肯定是第一名,因为他最大,同时我们把每个节点绑定一个size,这个size代表节点包含子节点的总数目(包括自己),那么我们很明显知道节点的右子节点的size+1就是排名;如果沿着左子树去查找了,那么我们需要把要找的排名k减掉前几名再去找,这个前几名也就是右子树的size+1,这样我们就递归的找到了。
- 再解决k到k+9区间问题。这个用Splay的话很好实现,我们先找到第k名和第k+9(当然不能越界),然后把第k+9旋转到k的右边,遍历子树就可以了。对于Treap树的话相对复杂一点,就是需要逐个去找k到k+9排名的同学,稍微复杂一点。
C++源码
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include <map>
#include <string>
#include <iostream>
typedef long long int LL;
using namespace std;
//二叉链表示Treap树的节点
struct Node
{
int size; //4字节
LL score; //id就是score,8字节
string name; //假设不超过10,需要10字节
int priority; //4字节
Node *left; //4字节
Node *right; //4字节
};
Node *root; //根节点
map<string,LL>mp; //名字与id的map
//修改节点包含的节点总数目
void push_up(Node *rt){
int lsize = rt->left ? rt->left->size : 0 ;
int rsize = rt->right ? rt->right->size : 0;
rt->size = lsize + rsize + 1;
}
void zig(Node * &node){ //右旋
Node *x = node->left;
node->left = x->right;
x->right = node;
x->size = node->size; //父节点总数不变
push_up(node); //子节点总数需要从新计算,因为左子树变了
node = x;
}
void zag(Node* &node){ //左旋
Node *x = node->right;
node->right = x->left;
x->left = node;
x->size = node->size;
push_up(node); //右子树变了重新计算
node = x;
}
//插入节点,并记录size大小
void t_insert(Node* &root, string name, LL score){
if(root == NULL){
Node *node = new Node;
node->name = name;
node->score = score;
node->priority = rand();
node->left = node->right = NULL;
node->size = 1;
root = node;
return;
}
root->size++;
if(score < root->score){
t_insert(root->left, name, score);
if(root->left->priority < root->priority)
zig(root); //右旋
}
else{ //我们在插入的时候避免了score相同,不会出现重复
t_insert(root->right, name, score);
if(root->right->priority < root->priority)
zag(root); //左旋
}
}
void _insert(string name, LL score){
t_insert(root,name,score);
}
//求id为score的节点
Node* queryNode(Node*root,LL score){
if(root->left && root->left->score > score) return queryNode(root->left,score);
else if(root->right && root->right->score < score) return queryNode(root->right,score);
else return root;
}
//获取右节点的排名(注意不是每个节点是这样获取排名,这里使用的多所以单独写出来了)
int getNodeRank(Node *node){
return node->right ? node->right->size + 1:1;
}
//获取id为score的节点的排名
int queryRank(Node*root,LL score){
if(!root) //这里说明没找到,我们这里没处理,只是返回0
return 0;
if(score == root->score) return getNodeRank(root);
if(score > root->score) return queryRank(root->right,score);
return queryRank(root->left,score) + getNodeRank(root);
}
//根据名字映射的scoreid求排名
int _queryRank(LL score){
return queryRank(root,score);
}
//求排名第k的节点
Node* findRank(Node * root,int k){
if(k > root->size || k < 1) { //排名越界,最少是第1,最多是第根节点的大小
return NULL;
}
int s = root->right ? root->right->size : 0;
if(s+1 == k) return root;
else if(k<s+1) return findRank(root->right,k);
return findRank(root->left, k-s-1);
}
//查找从第k名开始的10名同学
void _find10Rank(int k){
for(int i=k;i<k+10;i++){
Node *t = findRank(root,i);
if(t)
cout<<t->name<<" ";
}
cout<<endl;
}
void t_delete(Node *&root, LL score){
if(root !=NULL){
if(score < root->score){
root->size--;
t_delete(root->left, score);
}
else if(root->score < score){
root->size--;
t_delete(root->right, score);
}
else{ //找到节点
if(root->left == NULL)
root = root->right; //只有右孩子,直接把右孩子替换就可删除
else if(root->right == NULL)
root = root->left;
else{
if(root->left->priority < root->right->priority)
zig(root);
else
zag(root);
if(root != NULL)
t_delete(root,score);
else{
delete root->left;
root->left = NULL;
}
}
}
}
}
void _delete(LL score){
t_delete(root,score);
}
//遍历节点,此处无用
void in_order_traverse(Node *root){
if(root != NULL){
in_order_traverse(root->left);
cout<<root->name<<root->score<<endl;
in_order_traverse(root->right);
}
}
int main()
{
mp.clear();
int n;
cin>>n;
string s,ss;
int sc;
for (int i=1;i<=n;i++){
cin>>s;
ss="";
for(int i=1;i<s.size();i++) ss+=s[i];
if(s[0]=='+'){
cin>>sc;
if(mp[ss]!=0) _delete(mp[ss]);
mp[ss]=(LL)sc*1000000-i; //保证先插入的一定排名考前
_insert(ss,mp[ss]);
}
else {
if('0'<=ss[0]&&ss[0]<='9'){
sc=0;
for(int j=0;j<ss.size();j++) sc=(sc<<3)+(sc<<1)+ss[j]-'0';
_find10Rank(sc);
}
else{
cout<<_queryRank(mp[ss])<<endl;
}
}
}
}
算法分析
Treap的平均时间复杂度是O(logN),对于这三个操作基本都是O(logN)的时间复杂度。N为插入的总记录数。
在32位操作系统上,空间的话由于引入了map,一般而言map的空间代价略大于2N*18字节(假设名字小于10字节),节点采用二叉链存储总共需要N *30字节,一共大约需要44 *N字节。