慕湮

白日放歌须纵酒


  • 首页

  • 关于

  • 标签

  • 归档

目标检测 超越YOLOv3 CornerNet-Lite: Efficient Keypoint Based Object Detection

发表于 2019-04-25 | 更新于 2019-06-04 | 阅读次数:
本文字数: 2.4k | 阅读时长 ≈ 4 分钟

CornerNet-Lite: Efficient Keypoint Based Object Detection
Hei Law, Yun Teng, Olga Russakovsky, Jia Deng
Princeton University, 2019

CornerNet的作者带来的CornerNet升级版。CornerNet的准确率很不错,但其速度的缓慢使其难以应用。因此作者基于两个方向对其进行了优化:降低像素处理量和降低每个像素的处理量,得到了CornerNet的两个升级版:CornerNet-Saccade和CornerNet-Squeeze。前者通过注意力机制降低处理的像素量,超越了基于关键点的SOTA准确率,后者通过SqueezeNet结构降低每个像素的处理量,在准确率、速度上均超越了YOLOv3。代码与模型已开源。

阅读全文 »

ECCV2018 目标检测 CornerNet: Detecting Objects as Paired Keypoints

发表于 2019-04-21 | 更新于 2019-04-25 | 阅读次数:
本文字数: 3k | 阅读时长 ≈ 5 分钟

ECCV2018 目标检测 CornerNet: Detecting Objects as Paired Keypoints
Hei Law, Jia Deng
Princeton University, 2018

CornerNet这篇论文引领了目标检测领域Anchor-Free的风潮,在博主学习行人检测TLL时就有了解,但未深入阅读。近期多篇SOTA的目标检测如CornerNet-Lite和CenterNet都基于此论文。因此先来阅读这篇CornerNet。

阅读全文 »

强力基础网络 SENet: Squeeze-and-Excitation Networks

发表于 2019-04-19 | 阅读次数:
本文字数: 1.3k | 阅读时长 ≈ 2 分钟

SENet: Squeeze-and-Excitation Networks
Jie Hu, Li Shen, Samuel Albanie, Gang Sun, Enhua Wu
Momenta, 2017

SENet赢得了ImageNet最后一届(ImageNet 2017)的图像识别冠军。论文提出的Squeeze和Excitation可以集成到很多网络结构中,用少量的计算量提升换取更强劲的网络。

阅读全文 »

CVPR 2019 领域自适应行人Re-ID ECN. Invariance Matters: Exemplar Memory for Domain Adaptive Person Re-identification

发表于 2019-04-16 | 阅读次数:
本文字数: 2.7k | 阅读时长 ≈ 5 分钟

Invariance Matters: Exemplar Memory for Domain Adaptive Person Re-identification
Zhun Zhong, Liang Zheng, Zhiming Luo, Shaozi Li1, Yi Yang
Cognitive Science Department, Xiamen University
Centre for Artificial Intelligence, University of Technology Sydney
Research School of Computer Science, Australian National University
Baidu Research 5 Postdoc Center of Information and Communication Engineering
Xiamen University, 2019

又一篇领域自适应的行人re-id,有开源代码。主要的点在于提出了exemplar memory机制,并利用memory基于3个假设,完成对目标域的自适应。比博主总结的另一篇CVPR2019无监督的re-id MAR报告的性能要好。

阅读全文 »

CVPR2019 行人检测 抛弃限位框 CSP: High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection

发表于 2019-04-11 | 更新于 2019-04-21 | 阅读次数:
本文字数: 2.8k | 阅读时长 ≈ 5 分钟

CSP: High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection
Wei Liu, Shengcai Liao, Weiqiang Ren, Weidong Hu, Yinan Yu
ATR, College of Electronic Science, National University of Defense Technology, Changsha, China
CBSR & NLPR, Institute of Automation, Chinese Academy of Sciences, Beijing ,China
Inception Institute of Artificial Intelligence (IIAI), Abu Dhabi, UAE
Horizon Robotics Inc., Beijing ,China 2019

目前物体检测需要滑动窗口或anchor,而作者认为直接检测高级语义特征即可,如边缘、角、斑点等。这论文里即是在行人检测领域,以行人中心作为高级语义特征进行检测,同时预测其大小。获得了SOTA的结果。代码也即将开源

论文里相关工作里提到的,已经博主之前阅读过的一篇行人检测论文【TTL: 远距离行人检测,从标注出发】也是不依赖限位框的,预测上下两个端点及之间的连线,对较小的行人非常有效。不过该方法需要额外的中轴线标注,而且进行对3种预测结果进行关联时需要使用Markov Random Field进行后处理。本文所需的后处理仅有NMS。从两点一线,到中点和尺度,非常自然的改变,所以很多时候只需多想一想,发散一下,可能就会有好的效果。

论文里省略了infer时限位框的生成方法,需要代码开源后看代码理解。

阅读全文 »

CVPR2019 行人检测 利用分割和注意力机制提升性能 SSA-CNN: Semantic Self-Attention CNN for Pedestrian Detection

发表于 2019-04-11 | 更新于 2019-04-16 | 阅读次数:
本文字数: 1.7k | 阅读时长 ≈ 3 分钟

SSA-CNN: Semantic Self-Attention CNN for Pedestrian Detection
Chengju Zhou, Meiqing Wu, Siew-Kei Lam
Nanyang Technological University, Singapore 2019

SSA-CNN在训练中的4个尺度引入了分割,并将用于分割的特征图融合回backbone,作为self-attention。仅仅需要限位框标注而无需像素级的分割标注。据称在Caltech上达到了top的成绩,CityPerson上前列的成绩,同时运行效率高。

阅读全文 »

行人re-id 利用姿态估计和分割提升性能 EANet: Enhancing Alignment for Cross-Domain Person Re-identification

发表于 2019-04-10 | 更新于 2019-04-16 | 阅读次数:
本文字数: 1.7k | 阅读时长 ≈ 3 分钟

EANet: Enhancing Alignment for Cross-Domain Person Re-identification
Houjing Huang, Wenjie Yang, Xiaotang Chen, Xin Zhao, Kaiqi Huang, Jinbin Lin, Guan Huang, Dalong Du
中科院,地平线 2018

一篇开源的行人re-id论文,效果不错。目标是解决跨领域re-id问题。提出了PAP(Part Aligned Pooling),显著提升了跨领域测试效果。对ReID特征提出了PS(Part Segmentation)约束,增强了对齐能力,提升了模型泛化性。还尝试了把PS约束应用到目标域图片,进行有效的领域迁移

阅读全文 »

CVPR 2019人群检测计数 PSDDN Point in, Box out: Beyond Counting Persons in Crowds

发表于 2019-04-09 | 更新于 2019-04-16 | 阅读次数:
本文字数: 2.4k | 阅读时长 ≈ 4 分钟

PSDDN Point in, Box out: Beyond Counting Persons in Crowds
Yuting Liu, Miaojing Shi, Qijun Zhao, Xiaofang Wang
四川大学计算机科学学院,Univ Rennes, Inria,2019

在论文作者里看到了自己认识的人。真的是大牛啊,高山仰止,景行行止~

目前人群计数工作基本都预测密度图,虽然计数精度已经很高了,但无法知道每个人的具体位置。而已有基于检测的方法都需要限位框的标注,这在人群计数的应用场景里非常昂贵。这篇论文则是只需要人头点标注,即可预测人头限位框。

阅读全文 »

CVPR 2019 无监督行人Re-ID: Unsupervised Person re-identification by Soft Multi-label Learning

发表于 2019-04-08 | 更新于 2019-04-16 | 阅读次数:
本文字数: 3.9k | 阅读时长 ≈ 7 分钟

Unsupervised Person re-identification by Soft Multi-label Learning
Hong-Xing Yu, Wei-Shi Zheng, Ancong Wu, Xiaowei Guo, Shaogang Gong, Jian-Huang Lai
中山大学,腾讯优图,Queen Mary University of London 2019

利用额外数据集,无监督地训练目标集的re-id方法。将Market-1501的无监督的SOTA结果,rank-1从62.2提升到了67.7,mAP从31.4提升到了40.0。里面的提特征使用的ResNet50,能不能替换为训练好的Aligned Re-ID或更强力的模型,是否会有更好的结果?
Related work介绍了一些Unsupervised RE-ID和Unsupervised domain adaptation的相关工作,有需要的时候可以作为阅读指导。

阅读全文 »

CVPR 2018 车辆Re-ID: Vehicle Re-Identification with the Space-Time Prior

发表于 2019-04-01 | 更新于 2019-04-16 | 阅读次数:
本文字数: 1.4k | 阅读时长 ≈ 2 分钟

Vehicle Re-Identification with the Space-Time Prior
Chih-Wei Wu, Chih-Ting Liu, Cheng-En Chiang, Wei-Chih Tu, Shao-Yi Chien
NTU IoX Center, National Taiwan University, 2018

文中的AFL应该可以有效用于re-ID任务的再训练,帮助模型适应到要应用的场景。

阅读全文 »
1234…8
慕湮

慕湮

76 日志
138 标签
GitHub E-Mail 微博 图虫
友情链接
  • dotrabbit
© 2015 – 2021 慕湮 | 534k | 16:10
由 Hexo 强力驱动
|
主题 – NexT.Muse