论文笔记《From Large-Scale Object Classifiers to Large-Scale Object Detectors:An Adaptation Approach》

笔者吐槽，原来一个月没更新没看论文了。

来源

NIPS2014的一篇：http://www.eecs.berkeley.edu/~jhoffman/papers/adaptdet-submission_7-15-14.pdf

动机

如上图，动机简单来说是，物体的用来做cls的label易得，而用来做det的bbox不易得。
于是，我们能否找到一种方法，将一些有bbox信息的类的det功能transfer到另外一些没有给出bbox的类呢？
作者说可以：如果我们有一些类别，是同时知道它们的label和bbox的，那么能够找到一个方法，让另外一些没有给出bbox但给出了label的类，也能训练出一个不错的detector。

方法简述

如上图。上面所说的有label也有bbox的集合称为B（图中绿色的部分），只有label而没有bbox的类为A类（图中的蓝色部分）
过程大致分成a) b) c)三步，依次解释：

a) 首先用AlexNet和Imagenet的120w图片训练一个用于做cls的1k路softmax分类器。然后摘掉softmax，换成multinomial logistic regression，重新finetuning。（由于这一步做的是cls，这里对A，B都做）
b) 然后只考虑B，用RCNN框架再次tuning出适合det的一个网络，注意到这里也是添加了一个背景类（红色部分）
c) 之后将A接回来就好了（。。。就是那么粗暴），中间黄色的部分代表某种变换，下面会说，但其实起到的作用不大。