Skip to content

Latest commit

 

History

History
372 lines (283 loc) · 15 KB

README.md

File metadata and controls

372 lines (283 loc) · 15 KB

tracking 单目标跟踪框架

介绍

tracking 是基于百度深度学习框架Paddle研发的视频单目标跟踪(Visual Object Tracking, VOT)库, 整体框架参考 pytracking,其优秀的设计使得我们能够方便地将其他跟踪器如SiamFC,SiamRPN,SiamMask等融合到一个框架中,方便后续统一的实验和比较。

当前tracking涵盖当前目标跟踪的主流模型,包括SiamFC, SiamRPN, SiamMask, ATOM。tracking旨在给开发者提供一系列基于PaddlePaddle的便捷、高效的目标跟踪深度学习算法,后续会不断的扩展模型的丰富度。

ATOM 跟踪效果展示:

ball

图中,绿色框为标注的bbox,红色框为ATOM跟踪的bbox。

代码目录结构

imgs 包含跟踪结果的图像

ltr 包含模型训练代码
  └─ actors             输入数据,输出优化目标  
  └─ admin              管理数据路径等
  └─ data               多线程数据读取和预处理
  └─ dataset            训练数据集读取
  └─ models             模型定义
  └─ train_settings     训练配置
  └─ trainers           模型训练器
  └─ run_training.py    模型训练入口程序

pytracking  包含跟踪代码
  └─ admin              管理数据路径,模型位置等
  └─ features           特征提取
  └─ libs               跟踪常用操作
  └─ parameter          跟踪器参数设置
  └─ tracker            跟踪器
  └─ utils              画图等
  └─ pysot-toolkit      评估数据集载入和指标计算
  └─ eval_benchmark.py  评估跟踪器入口程序
  └─ visualize_results_on_benchmark.ipynb  可视化跟踪结果

开始使用

数据准备

目标跟踪的训练集和测试集是不同的,目前最好的模型往往是使用多个训练集进行训练。

主流的训练数据集有:

下载并解压后的数据集的组织方式为:

/Datasets/
    └─ ILSVRC2015/
    └─ ILSVRC2015_DET/
    └─ COCO/
    └─ YoutubeVOS/
    └─ GOT-10K/
    └─ LaSOTBenchmark/

Datasets是数据集保存的路径。

注:数据集较大,请预留足够的磁盘空间。训练Siamfc时,只需要下载VID数据集,训练ATOM需要全部下载上述三个数据集。

快速开始

tracking的工作环境:

  • Linux
  • python3
  • PaddlePaddle1.8

注意:如果遇到cmath无法import的问题,建议切换Python版本,建议使用python3.6.8, python3.7.0 。另外, tracking暂不支持在window上运行,如果开发者有需求在window上运行tracking,请在issue中提出需求。

安装依赖

  1. 安装paddle,需要安装1.8版本的Paddle,如低于这个版本,请升级到Paddle 1.8.
pip install paddlepaddle-gpu==1.8.0
  1. 安装第三方库,建议使用anaconda
# (可选) 0. 强烈建议新建一个 conda 环境,在安装 anaconda 后执行
#      conda create -n paddle1.7-py3.6 python=3.6
#      conda activate paddle1.7-py3.6

cd tracking
pip install -r requirements.txt

# (可选) 1. 推荐安装:快速读取 jpeg 文件
apt-get install libturbojpeg

# (可选) 2. 推荐安装:进程控制
apt-get install build-essential libcap-dev
pip install python-prctl

预训练 backbone 下载

在开始训练前,先准备SiamRPN、SiamMask、ATOM模型的Backbone预训练模型。

我们提供 ATOM ResNet18 和 ResNet50 的 backbone模型。可从这里下载所有预训练模型的压缩包。 压缩包解压后的文件夹为 pretrained_models. 文件的目录结构如下:

/pretrained_models/
    └─ atom
        └─ atom_resnet18.pdparams
        └─ atom_resnet50.pdparams
    └─ backbone
        └─ AlexNet.pdparams
        └─ ResNet18.pdparams
        └─ ResNet50.pdparams
        └─ ResNet50_dilated.pdparams

其中/pretrained_models/backbone/文件夹包含,AlexNet、ResNet18、ResNet50在Imagenet上的预训练模型。

设置训练参数

在启动训练前,需要设置tracking使用的数据集路径,以及训练模型保存的路径,这些参数在ltr/admin/local.py中设置。

首先,需要先生成local.py文件。

# 到代码库根目录
cd tracking

其次,设置训练模型文件保存路径:workspace_dir,backbone模型路径:backbone_dir,数据集路径等等,对于没有用到的数据集,可以不用设置其路径。

# 用你常用的编辑器编辑 ltr/admin/local.py
# 比方说,vim ltr/admin/local.py
# 其中,
#       workspace_dir = './checkpoints' # 要保存训练模型的位置
#       backbone_dir = Your BACKBONE_PATH # 训练SiamFC时不需要设置
#       并依次设定需要使用的训练数据集如 VID, LaSOT, COCO 等,比如:
#       imagenet_dir = '/Datasets/ILSVRC2015/'  # 设置训练集VID的路径

# 如果 ltr/admin/local.py 不存在,请使用代码生成
python -c "from ltr.admin.environment import create_default_local_file; create_default_local_file()"

训练SiamFC时需要只需要配置 workspace_dir和 imagenet_dir即可,如下:

    self.workspace_dir = './checkpoints'
    self.imagenet_dir = '/Datasets/ILSVRC2015/'

训练ATOM时,除了 workspace_dir和 imagenet_dir外,还需要指定coco, lasot, got10k的数据集路径,参考如下:

    self.workspace_dir = './checkpoints'
    self.lasot_dir = '/Datasets/LaSOTBenchmark/'
    self.coco_dir = '/Datasets/COCO/'
    self.got10k_dir = '/Datasets/GOT-10k/train'
    self.imagenet_dir = '/Datasets/ILSVRC2015/'

另外,训练ATOM时,需要准备got10k和lasot的数据集划分文件,方式如下:

cd ltr/data_specs/
wget https://paddlemodels.cdn.bcebos.com/paddle_track/vot/got10k_lasot_split.tar
tar xvf got10k_lasot_split.tar

训练SiamRPN、SiamMask时,需要配置 workspace_dir,以及imagenet、coco、imagenetdet、youtubevos、lasot、got10k的数据集路径,如下:

    self.workspace_dir = './checkpoints'
    self.imagenet_dir = '/Datasets/ILSVRC2015/'
    self.coco_dir = '/Datasets/COCO/'
    self.imagenetdet_dir = '/Datasets/ILSVRC2015_DET/'
    self.youtubevos_dir = '/Datasets/YoutubeVOS/'
    self.lasot_dir = '/Datasets/LaSOTBenchmark/'
    self.got10k_dir = '/Datasets/GOT-10k/train'

启动训练

# 到训练代码目录
cd ltr

# 训练 ATOM ResNet18
python run_training.py bbreg atom_res18_vid_lasot_coco

# 训练 ATOM ResNet50
python run_training.py bbreg atom_res50_vid_lasot_coco

# 训练 SiamFC
python run_training.py siamfc siamfc_alexnet_vid

# 训练 SiamRPN AlexNet
python run_training.py siamrpn siamrpn_alexnet

# 训练 SiamMask-Base ResNet50
python run_training.py siammask siammask_res50_base

# 训练 SiamMask-Refine ResNet50,需要配置settings.base_model为最优的SiamMask-Base模型
python run_training.py siammask siammask_res50_sharp

模型评估

评估训练后的模型使用pysot-toolkit工具包,其提供了多个单目标跟踪数据集的评估API。测试数据集建议从pysot-toolkit 提供的链接中下载。

准备好测试数据后,使用如下命令,克隆跟踪评估pysot-toolkit的代码模块,运行如下命令:

cd pytracking
git clone https://github.com/StrangerZhang/pysot-toolkit.git
mv pysot-toolkit pysot_toolkit
cd pysot_toolkit
pip install -r requirements.txt
cd pysot/utils/
python setup.py build_ext --inplace

测试数据集准备

按照pysot-toolkit的方式准备数据集VOT2018,放到/Datasets 文件夹下。

设置模型评估环境

接下来开始设置评估环境:

# 在pytracking/admin/local.py文件中设置测试数据集、待测试模型、以及测试结果的保存路径
# 用你常用的编辑器编辑 pytracking/admin/local.py
# 比方说,vim pytracking/admin/local.py
# 其中 settings.dataset_path 和 settings.network_path 分别设置为测试集的路径和模型训练参数的路径

# 如果不存在 pytracking/admin/local.py,可以使用代码生成
python -c "from pytracking.admin.environment import create_default_local_file; create_default_local_file()"

准备测试数据和模型

按照pysot-toolkit的方式准备数据集VOT2018,放到settings.dataset_path指定文件夹中,或者自行设置settings.dataset_path指向测试数据集。

将自己训练的模型拷贝到 NETWORK_PATH,或者建立软链接,如

ln -s tracking/ltr/Logs/checkpoints/ltr/bbreg/ $NETWORK_PATH/bbreg

开始测试:

测试ATOM模型:

# 在VOT2018上评测ATOM模型
# -d VOT2018  表示使用VOT2018数据集进行评测
# -tr bbreg.atom_res18_vid_lasot_coco 表示要评测的模型,和训练保持一致
# -te atom.default_vot 表示加载定义超参数的文件pytracking/parameter/atom/default_vot.py
# -e 40 表示使用第40个epoch的模型进行评测,也可以设置为'range(1, 50, 1)' 表示测试从第1个epoch到第50个epoch模型
# -n 15 表示测试15次取平均结果,默认值是1
python eval_benchmark.py -d VOT2018 -tr bbreg.atom_res18_vid_lasot_coco -te atom.default_vot -e 40 -n 15

测试SiamFC

# 在VOT2018上测试SiamFC
python eval_benchmark.py -d VOT2018 -tr siamfc.siamfc_alexnet_vid -te siamfc.default -e 'range(1, 50, 1)'

测试SiamRPN

python eval_benchmark.py -d OTB100 -tr siamrpn.siamrpn_alexnet -te siamrpn.default_otb -e 'range(1, 40, 1)'

测试SiamMask

# 在VOT2018上测试SiamMask-Base
python eval_benchmark.py -d VOT2018 -tr siammask.siammask_res50_base -te siammask.base_default -e 'range(1, 20, 1)'
# 在VOT2018上测试SiamMask-Sharp
python eval_benchmark.py -d VOT2018 -tr siammask.siammask_res50_sharp -te siammask.sharp_default_vot -e 'range(1, 20, 1)'

跟踪结果可视化

在数据集上评测完后,可以通过可视化跟踪器的结果来定位问题。我们提供下面的方法来可视化跟踪结果:

cd pytracking

# 开启 jupyter notebook,请留意终端是否输出 token
jupyter notebook --ip 0.0.0.0 --port 8888

在你的浏览器中输入服务器的 IP 地址加上端口号,若是在本地执行则打开 http://localhost:8888。若需要输入 token 请查看执行 jupyter notebook --ip 0.0.0.0 --port 8888 命令时的终端输出。

打开网页之后,打开 visualize_results_on_benchmark.ipynb 来可视化结果。

指标结果

数据集 模型 Backbone 论文结果 训练结果 模型
VOT2018 ATOM Res18 EAO: 0.401 0.399 model
VOT2018 SiamMask Res50 EAO: 0.380 0.379 model
VOT2018 SiamFC AlexNet EAO: 0.188 0.211 model
OTB100 SiamRPN AlexNet Succ: 0.637, Prcn: 0.851 Succ: 0.644, Prcn: 0.848 model

引用与参考

SiamFC [Paper] [Code]

@inproceedings{bertinetto2016fully,
  title={Fully-convolutional siamese networks for object tracking},
  author={Bertinetto, Luca and Valmadre, Jack and Henriques, Joao F and Vedaldi, Andrea and Torr, Philip HS},
  booktitle={European conference on computer vision},
  pages={850--865},
  year={2016},
  organization={Springer}
}

SiamRPN [Paper] [Code]

@inproceedings{li2018high,
  title={High performance visual tracking with siamese region proposal network},
  author={Li, Bo and Yan, Junjie and Wu, Wei and Zhu, Zheng and Hu, Xiaolin},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  pages={8971--8980},
  year={2018}
}

SiamMask [Paper] [Code]

@inproceedings{wang2019fast,
  title={Fast online object tracking and segmentation: A unifying approach},
  author={Wang, Qiang and Zhang, Li and Bertinetto, Luca and Hu, Weiming and Torr, Philip HS},
  booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
  pages={1328--1338},
  year={2019}
}

ATOM [Paper] [Raw results] [Models] [Training Code] [Tracker Code]

@inproceedings{danelljan2019atom,
  title={Atom: Accurate tracking by overlap maximization},
  author={Danelljan, Martin and Bhat, Goutam and Khan, Fahad Shahbaz and Felsberg, Michael},
  booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
  pages={4660--4669},
  year={2019}
}

DiMP [Paper] [Raw results] [Models] [Training Code] [Tracker Code]

@inproceedings{bhat2019learning,
  title={Learning discriminative model prediction for tracking},
  author={Bhat, Goutam and Danelljan, Martin and Gool, Luc Van and Timofte, Radu},
  booktitle={Proceedings of the IEEE International Conference on Computer Vision},
  pages={6182--6191},
  year={2019}
}

ECO [Paper] [Models] [Tracker Code]

@inproceedings{danelljan2017eco,
  title={Eco: Efficient convolution operators for tracking},
  author={Danelljan, Martin and Bhat, Goutam and Shahbaz Khan, Fahad and Felsberg, Michael},
  booktitle={Proceedings of the IEEE conference on computer vision and pattern recognition},
  pages={6638--6646},
  year={2017}
}