多标签分类的学习感悟
2017-11-07 21:17
232 查看
多标签学习
问题来源
定义
背景
分类算法
应用前景
最新进展
博主也是刚开始接触多标签分类相关的学习,如果有不正确的地方希望大家指正
1.问题来源
多标签学习概念的提出源于文档分类中遇到的多义性问题。
2.定义
有多标签分类,肯定就有单标签分类,那么和单标签分类有什么区别,下面我从定义开始出发:
1. 单标签分类:在传统的单标签分类中,训练集中的每一个样本只有一个相关的标签 l ,这个标签来自于一个不重合的标签集合L,|L| > 1.当|L|=2 时,这就是一个二分类问题,或文本和网页数据的过滤(filtering)问题。当|L| > 2 时是多类分类问题,标签与标签之间互斥。如对人的性别进行分类,一个人不是男,就是女。当然很明显这属于一个二分类问题。
2.多标签分类:简单的说就是同一个实例,可以有多个标签, 或者被分为多个类。和多分类的区别是, 多分类中每个实例只有一个标签,标签与标签之间存在某种关系。如下面一副图片,可以同时标注“蓝天”、“河”、“山”,甚至“树木”等标签。
3.背景
单标签分类分类已经不能满足人们的需求了,所以多标签分类也就自然而然的出现了。
4.分类算法
依据:解决问题的角度
1.基于问题转化的方法
转化问题数据,使之适用于现有算法,代表算法有LP、BR、CLR等
2.算法适应的方法
针对某一特定的算法进行扩展,从而能够直接处理多标签数据;
多标签学习算法的策略大致分为以下三类:
“一阶”策略:逐一考察单个标记而忽略标记之间的相关性,如将多标记学习问题分解为独立二分类问代 表性算法ML-KNN(该方法将“惰性学习(lazy learning )”算法k近邻进行改造以适应多标记数据)
“二阶”策略:考察两两标记之间的相关性,如相关标记与无关标记之间的排序问题,两两标记之间的交互关系等,代表性算法Rank-SVM(该方法将“核学习(kernel learning )”算法SVM进行改造以适应多标记数据)、
“高阶”策略:考察高阶标记的相关性,如处理任一标记对其它所有标记的影响,代表算法LEAD(该算法将“贝叶斯学习(Bayes learning)算法”Bayes网络进行改造以适应多标记数据)
5.应用前景
可以应用在蛋白质分类、音乐分类、语义场景分类和疾病诊断,图像视频自动标注,情感分类;对多标记学习的研究主要围绕降低特征空间和标记空间的复杂性,提高多标记分类算法的精度而展开。
问题来源
定义
背景
分类算法
应用前景
最新进展
博主也是刚开始接触多标签分类相关的学习,如果有不正确的地方希望大家指正
1.问题来源
多标签学习概念的提出源于文档分类中遇到的多义性问题。
2.定义
有多标签分类,肯定就有单标签分类,那么和单标签分类有什么区别,下面我从定义开始出发:
1. 单标签分类:在传统的单标签分类中,训练集中的每一个样本只有一个相关的标签 l ,这个标签来自于一个不重合的标签集合L,|L| > 1.当|L|=2 时,这就是一个二分类问题,或文本和网页数据的过滤(filtering)问题。当|L| > 2 时是多类分类问题,标签与标签之间互斥。如对人的性别进行分类,一个人不是男,就是女。当然很明显这属于一个二分类问题。
2.多标签分类:简单的说就是同一个实例,可以有多个标签, 或者被分为多个类。和多分类的区别是, 多分类中每个实例只有一个标签,标签与标签之间存在某种关系。如下面一副图片,可以同时标注“蓝天”、“河”、“山”,甚至“树木”等标签。
3.背景
单标签分类分类已经不能满足人们的需求了,所以多标签分类也就自然而然的出现了。
4.分类算法
依据:解决问题的角度
1.基于问题转化的方法
转化问题数据,使之适用于现有算法,代表算法有LP、BR、CLR等
2.算法适应的方法
针对某一特定的算法进行扩展,从而能够直接处理多标签数据;
多标签学习算法的策略大致分为以下三类:
“一阶”策略:逐一考察单个标记而忽略标记之间的相关性,如将多标记学习问题分解为独立二分类问代 表性算法ML-KNN(该方法将“惰性学习(lazy learning )”算法k近邻进行改造以适应多标记数据)
“二阶”策略:考察两两标记之间的相关性,如相关标记与无关标记之间的排序问题,两两标记之间的交互关系等,代表性算法Rank-SVM(该方法将“核学习(kernel learning )”算法SVM进行改造以适应多标记数据)、
“高阶”策略:考察高阶标记的相关性,如处理任一标记对其它所有标记的影响,代表算法LEAD(该算法将“贝叶斯学习(Bayes learning)算法”Bayes网络进行改造以适应多标记数据)
5.应用前景
可以应用在蛋白质分类、音乐分类、语义场景分类和疾病诊断,图像视频自动标注,情感分类;对多标记学习的研究主要围绕降低特征空间和标记空间的复杂性,提高多标记分类算法的精度而展开。
相关文章推荐
- Learning中的多类分类,多标签分类,多示例学习,多任务学习
- caffe多任务学习之多标签分类
- [置顶] caffe多任务学习之多标签分类
- 深度学习caffe平台--制作自己.lmdb格式数据集及分类标签文件
- 深度学习caffe平台--制作自己.lmdb格式数据集及分类标签文件
- Learning中的多类分类,多标签分类,多示例学习,多任务学习,
- h5学习之5(html中常见标签的分类和标签之间的转换)
- 深度学习与文本分类总结第二篇--大规模多标签文本分类
- 几种分类问题的区别:多类分类,多标签分类,多示例学习,多任务学习
- 几种分类问题的区别:多类分类,多标签分类,多示例学习,多任务学习
- Tensorflow学习教程------lenet多标签分类
- <学习html>第二天笔记-标签分类、关系;开发工具;文档类型;标签语义化;HTML标签;问题“图像标签代码语法无误,但是图像显示不出来”
- Django学习笔记三:页面侧边栏最新文章,文章归档,分类,标签云的实现
- HTML5学习_day02(4)--html常用标签分类
- 余弦计算相似度度量【转】 此博文包含图片 (2014-11-17 10:18:40)转载▼ 标签: 数学 基础 自然语言处理 分类: 学习 http://blog.csdn.net/u0121606
- caffe多任务学习之多标签分类
- 实战caffe多标签分类——汽车品牌与车辆外观(C++接口)[详细实现+数据集]
- 黑马程序员——交通灯系统设计学习感悟
- [算法学习]整数序列的奇偶分类
- ACM学习感悟——HDU-命运