关于数据挖掘的几个概念
2013-05-23 15:52
232 查看
整理的数据挖掘基本概念一书中的第一章的知识点
数据挖掘:从数据中提取有用模型的过程。其中,提出的模型可以是数据的汇总结果,不过一般情况下是数据中极端的特征所组成的集合。
邦弗朗尼原理:数据挖掘中考察数据的一个误区,指某个显著的特征如果是很有可能在随机数据中出现的话,那么根据这个显著的特征所获得的数据就具有不可依赖性。
TF.IDF:计算词频和词语重要度的一个计量指标
幂定律:类似于马太效应,可以表示为y=cxa,a为x的指数,此处a就是幂。这个定律在很多地方使用
比如pageRank,商品销量,包括TF.IDF词频统计中。
哈希,索引,这些也很重要,就不介绍了~~
ps:现阶段的数据挖掘中,机器学习和人工分析对于实际效果而言,并无明显优势
数据挖掘:从数据中提取有用模型的过程。其中,提出的模型可以是数据的汇总结果,不过一般情况下是数据中极端的特征所组成的集合。
邦弗朗尼原理:数据挖掘中考察数据的一个误区,指某个显著的特征如果是很有可能在随机数据中出现的话,那么根据这个显著的特征所获得的数据就具有不可依赖性。
TF.IDF:计算词频和词语重要度的一个计量指标
幂定律:类似于马太效应,可以表示为y=cxa,a为x的指数,此处a就是幂。这个定律在很多地方使用
比如pageRank,商品销量,包括TF.IDF词频统计中。
哈希,索引,这些也很重要,就不介绍了~~
ps:现阶段的数据挖掘中,机器学习和人工分析对于实际效果而言,并无明显优势
相关文章推荐
- 数据挖掘特征关于数据挖掘的几个概念
- 关于数据挖掘其中的一些基本概念的理解
- 机器学习&数据挖掘笔记_15(关于凸优化的一些简单概念)
- 机器学习&数据挖掘笔记_15(关于凸优化的一些简单概念)
- 关于数据挖掘的若干概念
- 机器学习&数据挖掘笔记_15(关于凸优化的一些简单概念)
- 机器学习&数据挖掘笔记_15(关于凸优化的一些简单概念)
- 数据挖掘学习笔记-关于数据的基本概念
- 机器学习&数据挖掘笔记_15(关于凸优化的一些简单概念)
- 几个概念——关于人工智能、大数据、深度学习
- 关于“重定位”及其相关的几个概念
- 关于数据挖掘的步骤
- 关于几个js获取当前时间和处理返回数据改变时间格式的函数
- 【摄影笔记四】关于图像的几个概念
- 数据挖掘概念与技术(韩家伟)阅读笔记5--数据规范化和属性构造
- 1.数据挖掘概念笔记——引论
- 关于数据仓库 — ODS概念
- 关于 Python 数据抓取、分析、挖掘、机器学习和Python 分布式计算内容分享
- 推荐几个机器学习和数据挖掘领域相关的中国大牛
- 数据挖掘概念与技术(原书第三版)范明 孟小峰译-----第六章课后习题答案