本文已参与「新人创作礼」活动,一起开启掘金创作之路
给定两个整数集合,它们的相似度定义为:Nc/Nt×100%。其中Nc是两个集合都有的不相等整数的个数,Nt是两个集合一共有的不相等整数的个数。你的任务就是计算任意一对给定集合的相似度。
输入格式:
输入第一行给出一个正整数N(≤50),是集合的个数。随后N行,每行对应一个集合。每个集合首先给出一个正整数M(≤104),是集合中元素的个数;然后跟M个[0,109]区间内的整数。
之后一行给出一个正整数K(≤2000),随后K行,每行对应一对需要计算相似度的集合的编号(集合从1到N编号)。数字间以空格分隔。
输出格式:
对每一对需要计算的集合,在一行中输出它们的相似度,为保留小数点后2位的百分比数字。
输入样例:
3
3 99 87 101
4 87 101 5 87
7 99 101 18 5 135 18 99
2
1 2
1 3
输出样例:
50.00%
33.33%
解题思路
要点1:合理数据存储结构,使查询的时间复杂度降低
首先,由题意,各个集合用vector存储最合适。
这类题目的心得是:只要后面做检索,前面输入数据肯定要保证一个良好的结构。对于输入数据,怎么进行预处理都不嫌浪费时间,关键是保证后面数次检索的时间复杂度达到最低。 针对这道题,我们提出每个集合的两个结构:有序和无重。
- 有序:因为涉及两个集合之间的比较,如果每次都盲目比较是一个的复杂度,所以通过预先排序降低复杂度
- 无重:因为题目求解的指标只统计不相等整数的个数,对于无重复的集合更好计算,所以很明显需要对每个集合做去重,这样在写判断逻辑的时候稍微简单,而且实际花费的时间也少。
在这里的程序设计里面直接调用了排序函数和去重函数,其实正宗方法是使用归并排序直接完成排序和去重。
要点2:合理设计查询,尽量降低时间复杂度
注意到+=两个集合的元素总数,所以只要统计其中之一即可。正宗方法是使用一轮归并排序统计无重复元素个数,代码实现里面的similarity基本上是这么做的,可参阅。
代码
注意输入输出格式。
#include <iostream>
#include <string>
#include <cstring>
#include <algorithm>
#include <stack>
#include <queue>
#include <vector>
#include <cmath>
#include <cstdio>
#include <bitset>
using namespace std;
static vector<int>* set;
double similarity(int i, int j){
int pi = 0, pj = 0, result = 0;
bool flag;
while(pi < set[i].size() && pj < set[j].size()){
if(set[i][pi] < set[j][pj]) flag = 1;
else if(set[i][pi] > set[j][pj]) flag = 0;
else{
result++;
flag = 1;
}
if(flag && pi < set[i].size()) pi++;
else pj++;
}
return (double)result / (double)(set[i].size()+set[j].size()-result);
}
int main(){
int n, size, elem;
cin >> n;
set = new vector<int>[n];
// input
for(int i=0; i<n; i++){
cin >> size;
for(int j=0; j<size; j++){
scanf("%d", &elem);
set[i].push_back(elem);
}
sort(set[i].begin(), set[i].end());
set[i].erase(unique(set[i].begin(),set[i].end()), set[i].end()); // remove_duplicate
}
// test
/*
for(int i=0; i<n; i++){
cout << set[i].size() << endl;
for(int j=0; j<set[i].size(); j++){
printf("%d ", set[i][j]);
}
cout << endl;
}
*/
// sim
int k, c1, c2;
cin >> k;
for(int i=0; i<k; i++){
cin >> c1 >> c2;
printf("%0.2f%%\n", similarity(c1-1, c2-1) * 100);
}
return 0;
}