降维方法学习
2017-04-12 15:40
309 查看
关于机器学习入门的记录
---------------2017.4.17-----------------
一、学习python
(一)NumPy SciPy Matplotlib
NumPy :提供对高维数据的支持
SciPy :提供快速的数值分析方法库
python: 绘制高品质图形
Matplotlib: 程序库
1. NumPy
(1)>>>import numpy as np
(2)需要副本时
(3)
2. SciPy
genfromtxt()读取数据,要求是以tab作为分隔符
>>>import scipy as sp
>>>data = sp.genfromtxt("web_traffic.tsv",delimiter="\t").tsv文件包含以tab字符分割的数字
3. Matplotlib
包含pyplot包,模仿Matlab接口,可以画图
4. 预处理和清洗数据
5.
计算误差
二、降维方法
1. PCA
无监督方法
目标:矩阵特征值预示方差的大小,使得方差最大
选出最大的N个特征
Scikit-learn在decomposition包里特供了PCA类
使用fit()和transform()方法分析数据,并映射到变换后的特征空间中
数据方差
不确定维度时不指定n_components参数,而是让其进行完全转换。对数据进行拟合后,explained_variance_ratio_包含了一个以降序排列的比例数组。
第一个值:描述最大方差方向的基向量比例
第二个值:次最大方差方向的比例,
........
画出数组后可以看到需要多少个成分(成分个数出现拐角的地方可能是)-->成分个数和方差之间的关系图:Scree图
2. LDA
有监督方法
目标:不同类别样本之间距离最大,相同样本之间距离最小。
---------------2017.4.17-----------------
一、学习python
(一)NumPy SciPy Matplotlib
NumPy :提供对高维数据的支持
SciPy :提供快速的数值分析方法库
python: 绘制高品质图形
Matplotlib: 程序库
1. NumPy
(1)>>>import numpy as np
(2)需要副本时
>>> c = a.reshape((3,2)).copy()a,c是两个独立的副本
(3)
2. SciPy
genfromtxt()读取数据,要求是以tab作为分隔符
>>>import scipy as sp
>>>data = sp.genfromtxt("web_traffic.tsv",delimiter="\t").tsv文件包含以tab字符分割的数字
>>>print(data.shape)打印行列数
3. Matplotlib
包含pyplot包,模仿Matlab接口,可以画图
4. 预处理和清洗数据
5.
计算误差
二、降维方法
1. PCA
无监督方法
目标:矩阵特征值预示方差的大小,使得方差最大
选出最大的N个特征
Scikit-learn在decomposition包里特供了PCA类
>>>from sklearn import linear_model,decomposition,datasets >>>pca = decomposition.PCA(n_components=1)//设置维度
使用fit()和transform()方法分析数据,并映射到变换后的特征空间中
>>>Xtrans = pca.fit_transform(X)
数据方差
>>>print(pca.explained_variance_ratio_)
不确定维度时不指定n_components参数,而是让其进行完全转换。对数据进行拟合后,explained_variance_ratio_包含了一个以降序排列的比例数组。
第一个值:描述最大方差方向的基向量比例
第二个值:次最大方差方向的比例,
........
画出数组后可以看到需要多少个成分(成分个数出现拐角的地方可能是)-->成分个数和方差之间的关系图:Scree图
2. LDA
有监督方法
目标:不同类别样本之间距离最大,相同样本之间距离最小。
>>>from sklearn import lda >>>lda_inst = lda.LDA(n_components=1) >>>Xtrans = lda_inst.fit_transform(X,good)缺点:类别增多,每个类别中的样本变少,效果将不好
相关文章推荐
- 机器学习降维方法总结
- Python机器学习应用 | 降维——NMF方法及实例
- 降维与流形学习几种方法
- 【Python学习系列二十三】Scikit_Learn库降维方法(矩阵分解)-PCA&FA
- 【深度学习】数据降维方法总结
- Python机器学习应用 | 降维——PCA方法及其应用
- 机器学习流程,常规算法,降维方法
- 机器学习降维方法概括
- 可视化降维方法学习笔记
- 机器学习降维方法概括
- 关于学习VB.NET方法
- Javascript学习笔记: Function::apply 方法
- [学习日记]对SOAP请求的头添加内容的方法
- [团队管理]+[软件人生]从项目计划到保密管理到个人学习与提高的方法
- Linux学习随手记(1) find命令的最简单的使用方法
- C# 静态成员和方法的学习小结
- 方法是学习和进步的捷径
- ASP学习:史上最强的数据分页方法
- Mcad学习笔记之委托再理解(delegate的构造器,MulticastDelegate,BeginInvoke,EndInvoke,Invoke4个方法的探讨)
- [DNN学习所得]CBO——简化从数据库读取数据并实例化对象的有效方法