VisDrone坐标信息
VisDrone数据集格式:
txt标签内容为:bbox_left,bbox_top,bbox_width,bbox_height,score,object_category,truncation,occlusion
类别: ignored regions(0), pedestrian(1), people(2), bicycle(3), car(4),van(5), truck(6), tricycle(7),awning-tricycle(8), bus(9), motor(10),others(11)
从VisDrone中生成集群BBox
步骤如下:
-
读取txt标签数据,并从中筛选score为1的数据,得到M个BBox数据
-
计算M个BBox对应的M个中心点坐标
-
对中心化进行归一化后,选择聚类算法进行聚类,聚类可以得到N个集群 M个中心坐标与N个集群的对应关系
-
统计每个集群所涵盖的坐标点数目
-
将集群按囊括的坐标点数目进行降序排列,取前10个大集群
-
筛选每个集群下的原BBox点(未归一化)
-
计算这群BBox的最左上角(x1,y1)和最右下角的点(x2,y2), 再用左上角坐标-右下角坐标,得到集群BBox的宽w和高h
-
然后将集群BBox加到原始的txt文件中,其中bject_category设置为11
最终效果: