spark编程基础 Spark RDD,DataFrame和DataSet的区别?
浏览量:2596
时间:2021-03-11 01:53:58
作者:admin
Spark RDD,DataFrame和DataSet的区别?
官网解释:RDD:A Resilient Distributed Dataset (RDD), the basic abstraction in Spark.rdd是一个分布式的数据集,数据分散在分布式集群的各台机器上A DataFrame is equivalent to a relational table in Spark SQL, and can be created using various functions in SQLContextdataframe更像是一张关系型数据表,是一种spark独有的数据格式吧,这种格式的数据可以使用sqlcontext里面的函数
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。