Trading Convexity for Scalability
2016-01-16 22:55
330 查看
这篇文章发表于ICML06,很有意思的点在于,它抓住了随着样本规模的大幅度提升,SVs的数量也随之而提升的问题,这样,由于稀疏性的不好导致计算的耗时也很多。作者以Hinge Loss作例举,当y⋅f(x)<1y\cdot f(x)<1时,约束得到的点则均被认为support vectors,作者认为,这里面的很多outliner不应该被认为sv,所以,作者构造一个新的损失函数,Rs(z)=H1(z)−Hs(z)R_s(z)=H_1(z)-H_s(z),这样问题就变成了一个非凸问题,接着,作者用cccp来解决。
在文章第四部分,作者又将自己提出的方法应用到了semi-supervised learning的问题上,同样,也构造了一个非凸问题,然后用cccp去解。
personal:
这篇文章是在查cccp应用的paper时找到的,对于大规模样本问题,作者从SVs的数量切入,很巧妙的构造了一个新的loss function,并得到了很不错的结果,只是文章比较短,没有给出过多的推导证明,上面这种新的损失函数的合理性就不太明白了,回头找找看看作者是不是在其他问题中有提到吧。
在文章第四部分,作者又将自己提出的方法应用到了semi-supervised learning的问题上,同样,也构造了一个非凸问题,然后用cccp去解。
personal:
这篇文章是在查cccp应用的paper时找到的,对于大规模样本问题,作者从SVs的数量切入,很巧妙的构造了一个新的loss function,并得到了很不错的结果,只是文章比较短,没有给出过多的推导证明,上面这种新的损失函数的合理性就不太明白了,回头找找看看作者是不是在其他问题中有提到吧。
相关文章推荐
- 网页色彩搭配的几种常用颜色
- 2015苏州大学ACM-ICPC集训队选拔赛(2)1002
- JAVA网络编程
- 5种睡姿透露宝宝健康状况,爸妈必看
- mysql 数据查询时 中文乱码问题 以 php 为例
- HDU 3397 线段树
- 从Storm和Spark 学习流式实时分布式计算的设计
- c++ 经验总结
- 宝贝「长牙」的秘密都在这儿!(附出牙时间表)
- 搜索:跳跃表
- 经典SQL语句大全
- 调试的艺术
- POJ 3414 - Pots
- HashMap解析
- 010-http-2.4 new features
- oracle笔记整理13——性能调优之SQL优化
- Python 第三篇(上):python文件基础操作、json模块、lambda、map、filter、reduce和函数位置参数
- python的tab自动补全
- MFC使用ado连接SQLserver
- zookeeper学习笔记———《zookeeper-3.4.6单机伪集群配置》