什么是大数据?
2015-07-23 19:04
162 查看
大数据是一种现象,而不是一种数据的概念。
什么现象呢:
1. 数据模式的复杂性!数据不仅仅是关系型模型,我感觉我们不能因为数据不能抽象成关系型的schema就认为这不是我们数据库人做的事。只要是数据管理就是我们做的事。
2. 计算的复杂性!计算的复杂性体现在那几点呢,量大,hot data,hot time(例双11,春节的12306)等。
3. 分布式!正因为计算的复杂性,所以需要由单机到分布式,由scale up到scale out的转化,这里主要有currency control和consistent等。
4. 领域合作!其实就是互联网+的概念。就是要把我们数据库的技术应用到各个领域中(为什么在这个时候提出来呢,因为现在有足够的数据了)。
5. 数据管理的多粒度问题!(schema或者隔离级别上等)
6. in time!为什么在这时候说intime呢?因为上述那些现象让in time变得很难…
综上所述,大数据是当前环境下数据(数据处理)所呈现的一种新的现象!
什么现象呢:
1. 数据模式的复杂性!数据不仅仅是关系型模型,我感觉我们不能因为数据不能抽象成关系型的schema就认为这不是我们数据库人做的事。只要是数据管理就是我们做的事。
2. 计算的复杂性!计算的复杂性体现在那几点呢,量大,hot data,hot time(例双11,春节的12306)等。
3. 分布式!正因为计算的复杂性,所以需要由单机到分布式,由scale up到scale out的转化,这里主要有currency control和consistent等。
4. 领域合作!其实就是互联网+的概念。就是要把我们数据库的技术应用到各个领域中(为什么在这个时候提出来呢,因为现在有足够的数据了)。
5. 数据管理的多粒度问题!(schema或者隔离级别上等)
6. in time!为什么在这时候说intime呢?因为上述那些现象让in time变得很难…
综上所述,大数据是当前环境下数据(数据处理)所呈现的一种新的现象!
相关文章推荐
- 2015 Multi-University Training Contest 2 1006 Friends
- 理解OpenContrail(by quqi99)
- Lua中闭包详解 来自RingOfTheC[ring.of.the.c@gmail.com]
- activity_main.xml
- 一切成功源于积累——20150723 大数据分析 201501-201507 所有的亏损源于五分钟定律
- 算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification)
- error Link2005:"pulbic:_thiscall class:run()已经在main.class。obj中定义
- Rails 上传图片
- AIDL(不完整)
- CLOSE_WAIT TIME_WAIT
- Failure [INSTALL_FAILED_OLDER_SDK]解决办法
- Failure [INSTALL_FAILED_OLDER_SDK]解决办法
- lightoj 1138 - Trailing Zeroes (III)【二分】
- OC笔记-学习self时候2个target然后修改名字出现linker command failed with exit code 1 (use -v to see invocation)
- Configuring HDFS High Availability
- “FormCRUD.csProj.FormMain.Name”隐藏了继承的成员“System.Windows.Forms.Control.Name”。如果是有意隐藏,请使用关键字 new。
- AIDL的in out inout
- 安装inotify-tools,用inotifywait命令监听文件或目录的访问信息
- WEKA “Detailed Accuracy By Class”和“Confusion Matrix”含义
- POJ 1230 Pass-Muraille