可以理解成是Faster R-CNN的改进版,使用了多层特征融合来加强判别性来提高效果。
PennU的机器人课。时隔多年又开始刷课,不知道这次能坚持多久:)
记录Caffe源码阅读过程的笔记,这篇是关于Softmax的
一篇关于object proposal的综述,将proposal的方法进行了回顾,分类和比较。
从某个层面上,可以理解成SPP-Net的另外一个加强版,通过增加特征的多样性和最后对bbox regression做了改进来提升效果,自此,VOC07的mAP被提升到75%.
Fast R-CNN约等于一个可以end-to-end joint training的SPP-Net。
做的问题是face labeling,可以看成semantic segmentation的一个特例。将CRF和CNN融合求解,并引入一个prior来进一步纠正错误。并且也考虑到了全图测试的FCN和upsampling等工程问题,个人觉得是个很赞的工作。
通过对patch做一个小形变,产生新的更加匹配与LR的新的HR patch,相当于拓展了词典,最后提高了SR的效果
简单记录SSIM的计算方法
两步走,先用AOG来parsing一张肖像图的各个component,之后对于每个component单独设置渲染的映射,最后求取一个全局的优化解。