2016 - 2024

感恩一路有你

spark编程基础 Spark RDD,DataFrame和DataSet的区别?

浏览量:2596 时间:2021-03-11 01:53:58 作者:admin

Spark RDD,DataFrame和DataSet的区别?

官网解释:RDD:A Resilient Distributed Dataset (RDD), the basic abstraction in Spark.rdd是一个分布式的数据集,数据分散在分布式集群的各台机器上A DataFrame is equivalent to a relational table in Spark SQL, and can be created using various functions in SQLContextdataframe更像是一张关系型数据表,是一种spark独有的数据格式吧,这种格式的数据可以使用sqlcontext里面的函数

spark编程基础 spark使用 dataset用法

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。