难点:如何测试。我的解决方式是:a,三种解法,看结果是否一致。b,小数据(100个点),人工排查。第一种方法,暴力法适合小数据。第二种方法:我的改进型。第三种方法:经典方法(分治法)。实验证明1000万数据时,我的算法有优势。 暴力算法,O(n2)。我的改进型要点:先对所有数据按Y排序。只比较y距离小于等于已知最小距离的点对。经典方法:按Y排序,分成两部分,递归调用。合并时只比较距离分界线不超过已知最小距离的点对。 实际证明500万数据以下,我的改进算法明显优于经典算法;1000万数据时,略强于经典算法。
核心源码节选:
double Dis(const CPT& pt1,const CPT& pt2) { return sqrt((double) (pt1.x-pt2.x)(pt1.x-pt2.x)+(pt1.y-pt2.y)(pt1.y-pt2.y)+(pt1.z-pt2.z)*(pt1.z-pt2.z) ); }
void InitData(CPT* pts,int iNum) { srand(time(NULL));
for( int i = 0 ; i < iNum ; i++)
{
pts[i].x = rand()%10000;
pts[i].y = rand()%10000;
pts[i].z = rand()%10000;
}
}
double Fun1(CPT* pts,const int iNum) { double dMinDis = 10000*10000 ; for(int i = 0 ; i < iNum ; i++ ) for( int j = i+1 ; j < iNum ; j++ ) { const double d = Dis(pts[i] , pts[j]); if( d < dMinDis) { dMinDis = d ; } } return dMinDis; }
class CCmpY { public: bool operator()(const CPT& pt1,const CPT& pt2) { return pt1.y < pt2.y ; } };
double Fun2(CPT* pts,const int iNum) { std::sort(pts,pts+iNum,CCmpY() );
double dMinDis = 10000*10000 ;
for(int i = 0 ; i < iNum ; i++ )
for( int j = i+1 ; j < iNum ; j++ )
{
const double d = Dis(pts[i] , pts[j]);
if( d < dMinDis)
{
dMinDis = d ;
}
if( abs(pts[i].y - pts[j].y )> dMinDis )
{
break;
}
}
return dMinDis;
}
double Fun3(CPT* pts,const int iNum) { std::sort(pts,pts+iNum,CCmpY() );
if( iNum < 100 )
{
return Fun1(pts,iNum);
}
const int iMid = iNum/2 ;
const double dMin1 = Fun3(pts,iMid);
const double dMin2 = Fun3(pts+iMid,iNum-iMid);
double dMinDis = min(dMin1,dMin2) ;
for(int i = iMid-1 ; i >= 0 ; i-- )//左集合
{
if( abs(pts[i].y - pts[iMid].y ) > dMinDis )
{
break;
}
for( int j = iMid ; j < iNum ; j++ )//右集合
{
const double d = Dis(pts[i] , pts[j]);
if( d < dMinDis)
{
dMinDis = d ;
}
if( abs(pts[i].y - pts[j].y )> dMinDis )
{
break;
}
}
}
return dMinDis;
}