您的位置:首页 > 其它

Spark官方文档 - 中文翻译

2016-07-06 18:16 477 查看
注:Spark版本:1.6.0

转载自:http://www.cnblogs.com/BYRans/

1 概述(Overview)

2 引入Spark(Linking with Spark)

3 初始化Spark(Initializing Spark)

3.1 使用Spark Shell(Using the Shell)

4 弹性分布式数据集(RDDs)

4.1 并行集合(Parallelized Collections)

4.2 外部数据库(External Datasets)

4.3 RDD操作(RDD Operations)

4.3.1 基础(Basics)

4.3.2 把函数传递到Spark(Passing Functions to Spark)

4.3.3 理解闭包(Understanding closures)

4.3.3.1 示例(Example)

4.3.3.2 本地模式 VS 集群模式(Local vs. cluster modes)

4.3.3.3 打印RDD的元素(Printing elements of an RDD)

4.3.4 操作键值对(Working with Key­Value Pairs)

4.3.5 Transformations

4.3.6 Actions

4.3.7 Shuffle操作(Shuffle operations)

4.3.7.1 背景(Background)

4.3.7.2 性能影响(Performance Impact)

4.4 RDD持久化(RDD Persistence)

4.4.1 如何选择存储级别(Which Storage Level to Choose?)

4.4.2 移除数据(Removing Data)

5 共享变量(Shared Variables)

5.1 广播变量(broadcast variables)

5.2 累加器(Accumulators)

6 将应用提交到集群(Deploying to a Cluster)

7 Java/Scala中启动Spark作业(Launching Spark jobs from Java / Scala)

8 单元测试(Unit Testing)

9 从Spark1.0之前的版本迁移(Migrating from pre­1.0 Versions of Spark)

10 下一步(Where to Go from Here)

详情见:http://www.cnblogs.com/BYRans/p/5292763.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: