pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例

 更新时间:2018年08月02日 11:10:51   作者:birdlove1987  
今天小编就为大家分享一篇pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

代码如下,步骤流程在代码注释中可见:

# -*- coding: utf-8 -*-
import pandas as pd
from pyspark.sql import SparkSession
from pyspark.sql import SQLContext
from pyspark import SparkContext
 
#初始化数据
 
#初始化pandas DataFrame
df = pd.DataFrame([[1, 2, 3], [4, 5, 6]], index=['row1', 'row2'], columns=['c1', 'c2', 'c3'])
 
#打印数据
print df
 
#初始化spark DataFrame
sc = SparkContext()
if __name__ == "__main__":
 spark = SparkSession\
  .builder\
  .appName("testDataFrame")\
  .getOrCreate()
 
sentenceData = spark.createDataFrame([
 (0.0, "I like Spark"),
 (1.0, "Pandas is useful"),
 (2.0, "They are coded by Python ")
], ["label", "sentence"])
 
#显示数据
sentenceData.select("label").show()
 
#spark.DataFrame 转换成 pandas.DataFrame
sqlContest = SQLContext(sc)
spark_df = sqlContest.createDataFrame(df)
 
#显示数据
spark_df.select("c1").show()
 
 
# pandas.DataFrame 转换成 spark.DataFrame
pandas_df = sentenceData.toPandas()
 
#打印数据
print pandas_df

程序结果:

以上这篇pyspark.sql.DataFrame与pandas.DataFrame之间的相互转换实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python+Selenium实现无头浏览器网页截图

    Python+Selenium实现无头浏览器网页截图

    这篇文章主要为大家详细介绍了Python+Selenium实现无头浏览器网页截图的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-03-03
  • Python中asyncio模块的深入讲解

    Python中asyncio模块的深入讲解

    这篇文章主要给大家介绍了关于Python中asyncio模块的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-06-06
  • Python日志打印里logging.getLogger源码分析详解

    Python日志打印里logging.getLogger源码分析详解

    在本篇文章里小编给大家整理的是一篇关于Python logging.getLogger源码分析的相关内容,有兴趣的朋友们可以学习参考下。
    2021-01-01
  • Pandas:DataFrame对象的基础操作方法

    Pandas:DataFrame对象的基础操作方法

    今天小编就为大家分享一篇Pandas:DataFrame对象的基础操作方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • 一文带你吃透Python中的日期时间模块

    一文带你吃透Python中的日期时间模块

    Python 提供了 日期和时间模块用来处理日期和时间,还可以用于格式化日期和时间等常见功能。这篇文章就来带大家了解一下它的使用,需要的可以参考一下
    2023-02-02
  • 速记Python布尔值

    速记Python布尔值

    这篇文章主要介绍了速记Python布尔值,具有一定参考价值,需要的朋友可以了解下。
    2017-11-11
  • Python defaultdict方法使用分析

    Python defaultdict方法使用分析

    在使用Python字典的过程中,如果没有key就会自动报错,这时就需要python中defaultdict函数发挥作用。defaultdict是Python内建dict类的一个子类,功能与dict相同,但可以产生一个带有默认值的dict,如果key不存在,就会返回默认值
    2022-10-10
  • 使用Python和scikit-learn创建混淆矩阵的示例详解

    使用Python和scikit-learn创建混淆矩阵的示例详解

    这篇文章主要介绍了使用Python和scikit-learn创建混淆矩阵的示例详解,该示例包括生成数据集、为数据集选择合适的机器学习模型、构建、配置和训练它,最后解释结果,即混淆矩阵,需要的朋友可以参考下
    2022-06-06
  • python算法演练_One Rule 算法(详解)

    python算法演练_One Rule 算法(详解)

    下面小编就为大家带来一篇python算法演练_One Rule 算法(详解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-05-05
  • Python用selenium实现自动登录和下单的项目实战

    Python用selenium实现自动登录和下单的项目实战

    本文主要介绍了Python用selenium实现自动登录和下单的项目实战,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02

最新评论