拖更的二周年
2020年不太普通,有疫情,有我喜欢的科比的意外逝世。就个人来说,也经历了第一次在比赛里拿到一点成绩,也第一次硬着头皮研究模型在实际应用中怎么变好。胖过,又瘦了。比较浑浑噩噩的过,所以也没怎么管博客,不知不觉,就拖到了现在。
CVPR2020 人脸表情识别 SCN自愈网络
Suppressing Uncertainties for Large-Scale Facial Expression Recognition
Kai Wang, Xiaojiang Peng, Jianfei Yang, Shijian Lu, Yu Qiao
Shenzhen Institutes of Advanced Technology, Nanyang Technological University, Singapore, 2019
数据集的标注总是存在谬误或难以界定的问题,而在表情识别里这个问题尤为突出,如图1。这篇论文提出了为样本加权以及自学习re-labeling解决这一问题。据作者声称,他们的实验发现这一结构在其它领域里都有用。代码即将开源。
GhostNet: More Features from Cheap Operations
Kai Han, Yunhe Wang, Qi Tian, Jianyuan Guo, Chunjing Xu, Chang Xu
Huawei Noah’s Ark Lab, Peking University, University of Sydney, Australia, 2019
CNN在嵌入式设备上的部署受制于内存与计算资源,通常都很困难。CNN特征图有一定冗余,这是它的重要特性,但这一点很少在架构设计中被关注到。这篇论文提出了Ghost
模块,可以用很小的运算量来生成更多的特征图。在ImageNet上,用相同的计算量获得了比MobileNetv3更高的精度。代码以及ImageNet预训练权重已开源。
这是上一篇博客记录的商汤IBN-Net作者团队的进一步工作。IBN-Net是结合了BN和IN,这篇则是结合了归一化和白化。IBN-Net中的BN和IN的占比是通过大量实验手工设定的,而这篇论文则是训练中学习到的,因此称为Switchable Whitening。在分类、语义分割、领域迁移,图像风格迁移上都能获得性能提升。代码以及ImageNet预训练权重已开源。
结合Normalization和Whitening SW: Switchable Whitening for Deep Representation Learning
Xingang Pan, Xiaohang Zhan, Jianping Shi, Xiaoou Tang, Ping Luo
CUHK-SenseTime Joint Lab, The Chinese University of Hong Kong, SenseTime Group Limited, The University of Hong Kong, 2019
IN在图像风格迁移中用得很多,它能保留样本独特的外观特征。BN在这种任务中效果就不好。而在很多BN有效的任务中,IN也表现不好。这就是这篇文章的出发点了。IBN-Net结合了两种Normal layer,在各种任务上都有提升。
Two at Once: Enhancing Learning and Generalization Capacities via IBN-Net
Xingang Pan, Ping Luo, Jianping Shi, Xiaoou Tang
CUHK-SenseTime Joint Lab, SenseTime Group Limited, 2019
文章提出了Weighted Triplet Loss (WTL),并结合了6个水平的局部特征进行CE分类学习。
行人重识别 HTCNN: Person re-identification using Hybrid Task Convolutional Neural Network in camera sensor networks
Shuang Liu, Wenmin Huang, Zhong Zhang
Tianjin Key Laboratory of Wireless Mobile Communications and Power Transmission, Tianjin Normal University, Tianjin 300387, China, 2019
行人重识别 ABD-Net: Attentive but Diverse Person Re-Identification
Tianlong Chen, Shaojin Ding, Jingyi Xie, Ye Yuan , Wuyang Chen, Yang Yang, Zhou Ren, Zhangyang Wang
Texas A&M University, University of Science and Technology of China, Walmart Technology, Wormpex AI Research, 2019
注意力机制已被证明在re-id中是比较有效的。但学到的注意力特征通常不够不互相关和多样性。这篇论文就是从这个角度出发。
行人重识别 二阶注意力 SONA: Second-order Non-local Attention Networks for Person Re-identification
Bryan (Ning) Xia, Yuan Gong, Yizhe Zhang, Christian Poellabauer
University of Notre Dame, 2019
将Non-local和二阶注意力结合到了re-id任务中。
行人重识别 联合GAN训练 DGNet: Joint Discriminative and Generative Learning for Person Re-identification
Zhedong Zheng, Xiaodong Yang, Zhiding Yu, Liang Zheng, Yi Yang, Jan Kautz
NVIDIA, CAI University of Technology Sydney, Australian National University, 2019
行人重识别领域里,有过一些GAN的研究工作。但它们都是利用GAN生成的数据来训练re-id模型,两个模型是独立的。这篇论文提出的DGNet是第一个将GAN任务加入到训练re-id模型的框架中的,端到端的工作。
目标检测 Matrix Nets: A New Deep Architecture for Object Detection
Abdullah Rashwan, Agastya Kalra, Pascal Poupart
University of Waterloo, 2019
又一个CornerNet升级版,相对的优势在于参数量少、训练所需显存少、收敛快。