mmtracking单目标跟踪数据集说明以及自定义数据集
官方数据集说明文档可参考:数据集准备 — MMTracking 0.14.0 文档
我对其单目标跟踪的数据集格式简单说明一下。
单目标跟踪用到的数据集包括:LaSOT、UAV123、TrackingNet、OTB100、GOT10k、VOT2018。单目标跟踪任务的训练和测试配置文件中,用到了 MSCOCO, ILSVRC, LaSOT, UAV123, TrackingNet, OTB100 和 GOT10k 数据集。
官方虽然提供了OTB100、VOT2018的数据集下载脚本,但下载速度非常慢,有的则官网都没了,所以想要下载OTB100、VOT2018、UAV123,最快的办法就是使用openxlab
以OTB100为例,查看网址数据集-OpenDataLab
下载方法:
pip install openxlab #安装pip install -U openxlab #版本升级openxlab login #进行登录,输入对应的AK/SKopenxlab dataset info --dataset-repo OpenDataLab/OTB100 #数据集信息及文件列表查看openxlab dataset get --dataset-repo OpenDataLab/OTB100 #数据集下载openxlab dataset download --dataset-repo OpenDataLab/OTB100 --source-path /raw --target-path data/ #数据集文件下载
数据集的结构,要按照官方文档1.5 数据集文件夹结构的说明放好,然后根据文档2. 转换标注格式 执行相应的脚本,生成统一的CocoVID格式,实际上就是在每个数据集下生成了一个annotations文件夹,里面放着一个txt,打开文档看一下:
格式为:图片序列路径、图片序列标注文件路径、开始帧、结束帧,开始帧默认就是1,结束帧可以理解为最后一张图片的序列,或者文件夹下图片的总数。
以data_seq/UAV123/bike1,anno/UAV123/bike1.txt,1,3085为例,data_seq/UAV123/bike1目录下放的是一个视频的图片序列
anno/UAV123/bike1.txt存放的是每张图片,同一个物体的矩形标注框位置703和361是矩形框左上角点的坐标,57是矩形宽度,114是矩形长度。
1为起始ID
3085为data_seq/UAV123/bike1下图片总数量。
了解了CocoVID的格式,那么自定义数据集就不是问题了。思路如下:
1、视频抽帧
视频文件抽帧,图片文件名从000001.jpg开始。
2、标注图片
建议一个视频只跟着一个运动的物体标注,如果数据集实在匮乏,也可以一个视频的图片序列标注多个运动物体,但只要每个运动的物体都生成独立的标注文件就可以了。
3、生成annotations
以“data_seq/UAV123/bike1,anno/UAV123/bike1.txt,1,3085”为例,一行一条数据生成annotations.txt即可。