软件架构师何志丹
说明
旧文新发,改了错别字,死链等。尽量保持“原汁原味”。
难点
如何测试。我的解决方式是:a,三种解法,看结果是否一致。b,小数据(100个点),人工排查。第一种方法,暴力法适合小数据。第二种方法:我的改进型。第三种方法:经典方法(分治法)。实验证明1000万数据时,我的算法有优势。
改进
暴力算法,O(n2)。我的改进型要点:先对所有数据按Y排序。只比较y距离小于等于已知最小距离的点对。经典方法:按Y排序,分成两部分,递归调用。合并时只比较距离分界线不超过已知最小距离的点对。
实际证明500万数据以下,我的改进算法明显优于经典算法;1000万数据时,略强于经典算法。
核心源码节选:
double Dis(const CPT& pt1,const CPT& pt2)
{
return sqrt((double) (pt1.x-pt2.x)*(pt1.x-pt2.x)+(pt1.y-pt2.y)*(pt1.y-pt2.y)+(pt1.z-pt2.z)*(pt1.z-pt2.z) );
}
void InitData(CPT* pts,int iNum)
{
srand(time(NULL));
for( int i = 0 ; i < iNum ; i++)
{
pts[i].x = rand()%10000;
pts[i].y = rand()%10000;
pts[i].z = rand()%10000;
}
}
double Fun1(CPT* pts,const int iNum)
{
double dMinDis = 10000*10000 ;
for(int i = 0 ; i < iNum ; i++ )
for( int j = i+1 ; j < iNum ; j++ )
{
const double d = Dis(pts[i] , pts[j]);
if( d < dMinDis)
{
dMinDis = d ;
}
}
return dMinDis;
}
class CCmpY
{
public:
bool operator()(const CPT& pt1,const CPT& pt2)
{
return pt1.y < pt2.y ;
}
};
double Fun2(CPT* pts,const int iNum)
{
std::sort(pts,pts+iNum,CCmpY() );
double dMinDis = 10000*10000 ;
for(int i = 0 ; i < iNum ; i++ )
for( int j = i+1 ; j < iNum ; j++ )
{
const double d = Dis(pts[i] , pts[j]);
if( d < dMinDis)
{
dMinDis = d ;
}
if( abs(pts[i].y - pts[j].y )> dMinDis )
{
break;
}
}
return dMinDis;
}
double Fun3(CPT* pts,const int iNum)
{
std::sort(pts,pts+iNum,CCmpY() );
if( iNum < 100 )
{
return Fun1(pts,iNum);
}
const int iMid = iNum/2 ;
const double dMin1 = Fun3(pts,iMid);
const double dMin2 = Fun3(pts+iMid,iNum-iMid);
double dMinDis = min(dMin1,dMin2) ;
for(int i = iMid-1 ; i >= 0 ; i-- )//左集合
{
if( abs(pts[i].y - pts[iMid].y ) > dMinDis )
{
break;
}
for( int j = iMid ; j < iNum ; j++ )//右集合
{
const double d = Dis(pts[i] , pts[j]);
if( d < dMinDis)
{
dMinDis = d ;
}
if( abs(pts[i].y - pts[j].y )> dMinDis )
{
break;
}
}
}
return dMinDis;
}
测试环境
似乎是WinXP VS2005(VC8)
下载
可通过以下链接下载测试数据,exe,源码(VS2005,VC8)
https://download.csdn.net/download/he_zhidan/10887801