博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
论文阅读 | Recurrent Filter Learning for Visual Tracking
阅读量:5099 次
发布时间:2019-06-13

本文共 1410 字,大约阅读时间需要 4 分钟。

Contribution

  1. 提出一个新颖的recurrent filter learning 框架从而去捕捉空间与时间信息,并且不要求在线fine-tune(on tracking)
  2. 设计一个高效有效的初始化和更新target appearance 方法,具体而言就是conv LSTM作为记忆单元更新目标表观

    网络结构

    在这里插入图片描述

    从groundtruth来crop object exemplar \(E_{t}\)(127 * 127 * 3)经过E-CNN(exemplar feature extractor),得到exemplar feature\(e_{t}\)(6 * 6 * 256),作为conv-LSTM的输入,conv-LSTM接收\(e_{t}\),还接受上一个状态的hidden state \(h_{t-1}\)和cell state \(c_{t-1}\),产生当前状态的hidden state \(h_{t}\)(6 * 6 * 1024)和cell state \(c_{t}\)(6 * 6 * 1024), 产生的hidden state \(h_{t}\) 经过output layer(1 * 1 * 256的卷积核) 产生 object filter \(f_{t}\) (6 * 6 * 256),在下一帧的Search image \(S_{t+1}\)(255 * 255 * 3)经过 S-CNN 特征提取之后得到Search image feature(22 * 22 * 256)进行correlation 操作(实际是卷积)得到响应映射\(R_{t}\)(17 * 17)

S-CNN 与E-CNN

S-CNN 与E-CNN参数是不同的(实验证明这样的效果是最好的),卷积网络结构是相同的网络如图

在这里插入图片描述
conv 之后都有用BatchNormalization加速网络收敛,除了Conv-5 ,都用激活函数ReLu

convolutional LSTM 的结构

在这里插入图片描述

结构与原始的LSTM结构相似,只不过sigmod前面加了卷积层(3 * 3 filter),保存图像的空间结构
在这里插入图片描述
初始化cell state \(c_{0}\),hidden state \(h_{0}\)第一帧的exemplar 用E-CNN提取\(e_{0}\)再用(3* 3 *1024)conv filter 进行的卷积在经过tanh 初始化完成。

loss fuction

在这里插入图片描述

在这里插入图片描述

Training Details

mini-batchSize是长度为10的10个视频剪辑, 数据增广,随机干扰色,图片镜像变换,拉伸等,

Online tracking

我们没有用BBox regression,而是用bicubic 插值做,选择最大值位置作为目标位置,并构建尺度金子塔

\(R^{m}(f_{t},s_{t+1}) = f_{t}*s_{t+1}^m\)
\(v^m\)是 response map \(R^m\)在尺度m上的最大值.
找到\(v^m\)最大的那个尺度
在尺度m 上求出前k个score的平均位置,
\(p^{*}=\frac{1}{K}\sum\limits_{k}^{K}{p_{k}}\)

转载于:https://www.cnblogs.com/Zak-NoS/p/10941822.html

你可能感兴趣的文章
WPF中实现多选ComboBox控件
查看>>
读构建之法第四章第十七章有感
查看>>
Windows Phone开发(4):框架和页 转:http://blog.csdn.net/tcjiaan/article/details/7263146
查看>>
python asyncio 异步实现mongodb数据转xls文件
查看>>
TestNG入门
查看>>
【ul开发攻略】HTML5/CSS3菜单代码 阴影+发光+圆角
查看>>
IOS-图片操作集合
查看>>
IO—》Properties类&序列化流与反序列化流
查看>>
jquery实现限制textarea输入字数
查看>>
Codeforces 719B Anatoly and Cockroaches
查看>>
ActiveMQ与spring整合
查看>>
EOS生产区块:解析插件producer_plugin
查看>>
格式化输出数字和时间
查看>>
关于TFS2010使用常见问题
查看>>
URL编码与解码
查看>>
Eclipse 安装SVN插件
查看>>
阿里云服务器CentOS6.9安装Mysql
查看>>
剑指offer系列6:数值的整数次方
查看>>
js 过滤敏感词
查看>>
poj2752 Seek the Name, Seek the Fame
查看>>