Guanshuo Wang, Yufeng Yuan, Xiong Chen, Jiwei Li, Xi Zhou
Cooperative Medianet Innovation Center, Shanghai Jiao Tong University
CloudWalk Technology, 2018
很简单的一篇行人Re-ID论文,效果却很好。可能是因为在每个局部、全局、分支的全局特征都有独立的训练目标。
Introduction
论文的Multiple Granularities的意义见图1,即是不同粒度的特征。同样也是一篇全局特征+局部特征的论文。与Aligned ReID训练时需要二分图匹配将局部特征对齐不同,与EANet测试时需要姿态估计来准确分割局部特征也不同,本文的MGN仅仅是做了2/3等分的局部特征,简单而粗暴。
MGN
网络结构见图2,是一个多分支的结构。backbone为ResNet-50 conv4-2前的所有层。第一个分支为全局分支,在conv5使用了步长为2进行下采样。GMP提取2048维特征向量,全连接后用softmax进行训练。再使用1*1卷积降维后,使用triplet loss进行训练。
第2、3个分支在conv5均保持了分辨率。分别使用水平2、3等分的GMP获得局部和全局特征,同分支1一样,全局特征会在1*1卷积降维前进行softmax训练,降维后进行triplet loss训练。而局部特征的信息不足,仅降维后进行softmax训练。
Loss如下:
其中P指一个batch的id数量,K指每个id的图片数。这里就是一个hard triplet loss。
Experiments
效果很优秀。