spark学习--基本概念描述
2017-09-20 16:05
204 查看
spark系统概述
什么是spark?
是apache旗下的一款开源项目,通俗的理解就是一个分布式的大数据处理框架,有一个很大优点,一栈式解决方案
spark与hadoop相比有哪些优点?
为什么spark比hadoop快?因为spark基于内存进行计算而hadoop基于磁盘进行计算,hadoop把每次计算的结果存回磁盘并在下次需要使用时重新从磁盘读取这就导致会有大量的IO操作,时间会很慢。
hadoop进行计算是按部就班的进行,但是spark会事先将数据读取进来之后把整个运算过程绘制成一幅有向无环图,具有方向性,可以对路径进行优化。
他可以和已存在的hadoop数据集成
BDAS
spark core ?
spark core是一个分布式大数据处理框架,包含spark的基本功能,他不仅比mapreduce快很多,并且提供量比mapreduce更多的操作函数,它具有核心组件RDD。弹性分布式数据集。
相关文章推荐
- spark学习起步(一):基本概念
- spark学习一 基本概念理解
- Spark学习笔记 --- SparkStreaming 中基本概念
- 【Spark深入学习-11】Spark基本概念和运行模式
- Linux学习之CentOS(二十五)--Linux磁盘管理:LVM逻辑卷基本概念及LVM的工作原理
- hadoop学习笔记4:hadoop、spark概念
- 关于多线程学习总结(一) 基本概念了解
- Java学习(1) java基本概念
- UML软件建模学习与开发基本概念汇总
- RFC3261 SIP协议学习笔记----sip协议基本功能描述
- Direct3D 9学习笔记(2)基本概念
- [DB2 学习记录]4. DB2 基本安全概念-授权
- SPARK中的基本概念
- Spark基本概念
- 【深度学习 论文综述】深度神经网络全面概述:从基本概念到实际模型和硬件基础
- Windows GDI学习笔记——基本概念
- Spark学习之RDD基本操作
- java学习之旅52--数组_数组基本概念_内存分析
- Spark的几个基本概念:Driver和Job,Stage
- Deep Learning 学习系列001 —— 神经网络基本概念