KPCA降维
2015-09-07 16:43
295 查看
KPCA方法是一种非线性主元分析方法,主要思想:通过某种事先选择的非线性映射函数Ф将输入矢量X映射到一个高维线性特征空间F之中,然后在空间F中使用PCA方法计算主元成分,核主成分分析最主要是非线性映射函数Ф的选取。
核函数如下:
径向基核函数:
多项式核函:
Sigmoid核函数:
算法步骤:
Step 1. 数据标准化处理。
Step 2. 求核矩阵K,使用核函数来实现将原始数据由数据空间映射到特征空间。采用的核函数为径向基核函数,公式为:
Step 3. 中心化核矩阵Kc,用于修正核矩阵。公式为:
其中 为N×N的矩阵,每一个元素都为1/N
Step 4. 计算矩阵KC的特征值 ,对应的特征向量为
。特征值决定方差的大小
,也就是说特征值越大所蕴含的有用信息越多,因此按特征值降序排序得
,特征向量相应调整 。
Step 5. 通过施密特正交化方法,正交化并单位化特征向量,得到
。
Step 6. 计算特征值的累计贡献率
,根据给定的贡献率要求p,如果rt>p,则选取前t个主分量
,作为降维后的数据。
核函数如下:
径向基核函数:
多项式核函:
Sigmoid核函数:
算法步骤:
Step 1. 数据标准化处理。
Step 2. 求核矩阵K,使用核函数来实现将原始数据由数据空间映射到特征空间。采用的核函数为径向基核函数,公式为:
Step 3. 中心化核矩阵Kc,用于修正核矩阵。公式为:
其中 为N×N的矩阵,每一个元素都为1/N
Step 4. 计算矩阵KC的特征值 ,对应的特征向量为
。特征值决定方差的大小
,也就是说特征值越大所蕴含的有用信息越多,因此按特征值降序排序得
,特征向量相应调整 。
Step 5. 通过施密特正交化方法,正交化并单位化特征向量,得到
。
Step 6. 计算特征值的累计贡献率
,根据给定的贡献率要求p,如果rt>p,则选取前t个主分量
,作为降维后的数据。
相关文章推荐
- Eclipse网络求情返回数据多显示不全的处理
- java-----时间
- OneNote 的一种模拟方法(上)
- HDU - 3313 Key Vertex(在最短路上的DFS)
- 求数组中最长递增子序列
- LeetCode -- 3Sum
- 第二周项目0 宣告“主权”
- url传字符串的时候,如果字符串中有“/”,则可能会影响到域名解析
- ARC~美国太阳能抗反射专利
- 黑马程序员--@synthesize的使用
- Linux access()函数 使用 http://blog.163.com/lqy_super/blog/static/199751021201302351831330/
- 1.1 MFC对话框背景设置
- myeclipse安装svn插件的多种方式
- 查看端口被占用
- 汇编中各寄存器的作用
- IP地址的分类——a,b,c 类是如何划分的
- linux下的Tomcat搭建与基本应用
- 启用mysqli扩展模块
- 97 AFNetworking文件上传
- 操作系统