您的位置:首页 > 其它

第九周(异常发现+推荐系统)-【机器学习-Coursera Machine Learning-吴恩达】

2018-03-08 16:26 253 查看
目录
    异常检测
    多元高斯分布的异常检测
    推荐系统

1 异常检测

1)正态分布或高斯分布:



2)异常检测算法:



3)异常检测与监督学习的比较
使用异常检测算法的情况
- 不正常的样本较少,不利于学习;
- 导致不正常的原因有很多,不方便进行学习时
4)选择特征
当特征不符合正态分布时,可以利用log或者根号等运算改变所有样本该特征值,然后作图观察是否符合正态分布

2 多元高斯分布的异常检测

1)多元高斯分布
概率分布:



参数:



多元高斯分布与期望值μ和协方差有关,多元高斯分布中期望值μ便为一个向量的。
例如二维数据的概率分布:



2)多元高斯分布的异常检测算法
首先,根据样本计算多元高斯分布参数(期望 和 协方差)
然后,针对新样本计算P(x),如果小于设定值,则异常。
3)普通高斯模型 vs 多元高斯模型
 - 多元高斯模型能够捕捉不同特征之间的相关性
   必须 m>n,样本数量要多于特征变量数量
 - 普通高斯模型运算量小。
    如果要捕捉不同特征之间的关系,可以手动增加额外特征向量
错题:



2 推荐系统

1)协同:
 - 协同就是在训练过程中,每一个用户都在一起帮助系统更好的训练参数。
 - 每个用户对多个电影进行评分,每个电影被多个用户进行评分
 - 在知道用户对电影的评分之后:(x即电影特征、theta即用户参数)
给定每部电影的成分(爱情、动作..)分布 x,可以预测用户的喜好(爱情、动作..)分布 theta;
给定每个用户的喜好(爱情、动作..)分布 theta,可以预测每部电影的成分(爱情、动作..)分布 x ;



合并优化函数:



2)协同过滤算法:(预测用户给电影的打分)
 - 原理



 - 寻找相关电影进行推荐
当得到所有电影的特征分布之后,可以选择参数x距离最短的相关电影进行推荐
- 均值归一化,将所有用户针对某一电影的评分均一化有助于预测一个从来没有打过分的用户的评分,如果不均一化预测将总为0,如果均一化因为最后预测值中需要+平均值,所以预测就变为了平均值。
错题:



题目参考: http://blog.csdn.net/sundy0808/article/details/78997898
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐