Spark SQL的DataFrame会不会存储相同的数据
2017-02-24 11:04
253 查看
spark版本 2.1.0
代码路径:$SPARK_HOME/examples/src/main/java/org/apache/spark/examples/sql/JavaSparkSQLExample.java
该代码示例中的部分代码粘贴如下
实验数据一:原始people.json内容如下:
输出结果为:
实验数据二:people.json内容如下:
输出结果为:
由以上实验可以看出,DataFrame会存储相同的数据。
实验结果是会存储相同的结果
实验
实验代码使用spark中代码示例JavaSparkSQLExample.java代码路径:$SPARK_HOME/examples/src/main/java/org/apache/spark/examples/sql/JavaSparkSQLExample.java
该代码示例中的部分代码粘贴如下
// $example on:create_df$ Dataset<Row> df = spark.read().json("examples/src/main/resources/people.json"); //省略部分代码 // $example on:run_sql$ // Register the DataFrame as a SQL temporary view df.createOrReplaceTempView("people"); Dataset<Row> sqlDF = spark.sql("SELECT * FROM people"); sqlDF.show();
实验数据一:原始people.json内容如下:
{"name":"Michael"} {"name":"Andy", "age":30} {"name":"Justin", "age":19}
输出结果为:
17/02/24 10:56:00 INFO scheduler.DAGScheduler: Job 10 finished: show at JavaSparkSQLExample.java:171, took 0.028799 s +----+-------+ | age| name| +----+-------+ |null|Michael| | 30| Andy| | 19| Justin| +----+-------+
实验数据二:people.json内容如下:
{"name":"Michael"} {"name":"Andy", "age":30} {"name":"Justin", "age":19}
{"name":"Justin", "age":19}
{"name":"Justin", "age":19}
{"name":"Michael"}
{"name":"Michael"}
输出结果为:
17/02/24 11:00:58 INFO scheduler.DAGScheduler: Job 10 finished: show at JavaSparkSQLExample.java:171, took 0.023679 s +----+-------+ | age| name| +----+-------+ |null|Michael| |null|Michael| | 30| Andy| | 19| Justin| | 19| Justin| | 19| Justin| |null|Michael| |null|Michael| +----+-------+
由以上实验可以看出,DataFrame会存储相同的数据。
相关文章推荐
- 程序开发中数据存储在多个Access数据库中会不会改善性能?
- 迁移本地数据文件、控制文件、日志文件到新的存储(挂载点目录与本地目录相同)
- 使用数据2分处理的通用分页存储过程 前半部分与后半部分数据访问时间相同
- SharedPreferences自动登录及存储多组相同类型数据
- 随机产生【10-50】的整形数据,使用集合的方式对数据存储并统计相同数据出现次数
- 行专列,拆分json,实现数据的展示。Map<String, Object>存储多个相同的key,List<Map<String, Object>>
- 使用数据2分处理的通用分页存储过程 前半部分与后半部分数据访问时间相同,同等访问速度提高一倍
- ArrayList数据add时出现覆盖,及arraylist最后获取到(存储到集合中的)数据相同。
- 数据仓库的数据存储
- 在.net中如何把调用存储过程代码写入数据连接层中
- 将数据库表中的数据生成Insert脚本的存储过程!!!
- 将 SQL Server 存储过程用于数据访问
- 应用存储过程按月建数据表
- 实现千万级数据分页的存储过程!
- ACCESS存储数据极限
- Php+mysql处理大容量数据存储,
- 数据仓库的数据存储 [转]
- 将 SQL Server 存储过程用于数据访问
- Windows 日志存储数据结构
- 关于block中数据的存储和重组的探究