在路上

长期帮大疆(DJI)招人，岗位描述戳这里，熟悉CV跟DL算法无限量招，待遇优渥，对无人机感兴趣的小伙伴请将简历发我~liliang.zhang (at) dji.com

论文笔记《Learning Structural SVMs with Latent Variables》

发表于 2014-11-22 |

论文出处：http://www.cs.cornell.edu/~cnyu/papers/icml09_latentssvm.pdf
ICML09的“老物”，作者项目见：http://www.cs.cornell.edu/~cnyu/latentssvm/

概述

先介绍structural SVM，然后介绍latent structual SVM的求解方法。

Structual SVM

优化目标如下：

大致理解成，y是某种结构化的label，φ是data和label的联合特征，由于y是离散的，所以只能通过搜索来进行求解。
由于预测label和真实label之间差值的Δ也是非凸离散的，所以需要找到一个凸上界来优化：

直观理解为，max那一项是通过搜索找出最接近真实label的y尖的得分；最后一项是真实label的真实得分。
最后加上正则项，就变成了SVM-like的loss function：

Latent structual SVM

优化目标如下：

可以看出多出的一项是h，代表隐项，这项其实也是通过搜索得到，理解成搜索空间又变大了好多。。囧
衡量真实label和预测label差值的Δ也升级了，变成：

大概给出的直观解释是：

h*是说，知道真实label的情况下（比如训练样本），搜索出最佳的隐变量h，作为h*
h尖是说，不知道真实label情况下（比如测试样本），搜索出最佳的预测label和隐变量。

之后经过一番求bound，得到最后的loss function形式为：

也算是SVM-like吧。

优化方法

由于上式减号两边都是凸的，所以用CCCP来求解：

撇开那么高大上的说法，对于latent structual SVM来说，其实是两步：

对应的直观含义是：

对于真实label，求解最优的隐变量h*
fix住h*，常规求解structual SVM

对上述两步进行迭代，能够求解local optimal。

很久没有更新网站，发现多了不少评论和问题，无法一一回复，如果现在仍有问题请再次留言 :) 2016.03.29

Zhang Liliang

Zhang Liliang

On My Way to Be a Good R&D Engineer

0 分类

GitHub Weibo ZhiHu

Creative Commons

1. 概述
2. Structual SVM
3. Latent structual SVM
4. 优化方法