pycharm连接spark教程

 更新时间:2025年01月13日 15:07:47   作者:多学多看多练  
这篇文章详细介绍了如何在PyCharm中配置Hadoop和Spark环境,并提供了一个Python代码示例来测试连接

1.解压Hadoop

解压到任意盘,路径不要带中文路径

进入保存后的bin目录,查看,是否解压成功

2.解压spark

到任意位置,路径不要带有中文

3. 打开pycharm

把Hadoop,spark环境变量配置到pycharm中。

3.1新建项目

3.2在项目中创建一个python文件

3.3把Hadoop_home

python_home,pythonpath添加到Pycharm中.

  • 1.HADOOP_HOME
  • 2.SPARK_HOME
  • 3.PYTHONPATH

注意!!!

PYTHONPATH路径要添加到D:\spark\spark-2.4.6-bin-hadoop2.7\python\lib\py4j-0.10.7-src.zip下

3.4 检查是否有以下软件包

3.4.1 如果没有请按照以下教程下载,后期需要

3.4.2安装py4j

3.4.3安装pyspark推荐2.4.6版本

3.4.4安装pip

3.5安装findspark

4.把winutils.exe插件

放到Hadoop解压后的/bin目录下面

5.把以下代码

复制到4.2步骤中,新建的python文件中

#添加此代码
import findspark
findspark.init()
#在spark前,添加此代码
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName("WordCount").getOrCreate()
spark.sparkContext.textFile("file:///D:/Hadoop/hadoop-2.7.7/README.txt")\
        .flatMap(lambda x: x.split(' '))\
        .map(lambda x: (x, 1))\
        .reduceByKey(lambda x, y: x + y)\
        .foreach(print)

必须要有这句话在spark前面!!!

6.测试

出现以上内容,表示pycharm连接spark成功。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Windows下实现将Pascal VOC转化为TFRecords

    Windows下实现将Pascal VOC转化为TFRecords

    今天小编就为大家分享一篇Windows下实现将Pascal VOC转化为TFRecords,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • Python实现的简单算术游戏实例

    Python实现的简单算术游戏实例

    这篇文章主要介绍了Python实现的简单算术游戏,可实现随机给出算数表达式,并对用户输入答案进行判断的功能,需要的朋友可以参考下
    2015-05-05
  • python 正则式 概述及常用字符

    python 正则式 概述及常用字符

    python 正则,刚开始需要注意的他的正则的独特的地方。不同语言的正则稍有不同。
    2009-05-05
  • Python将字符串转换为小写字母的几种常用方法

    Python将字符串转换为小写字母的几种常用方法

    这篇文章主要介绍了Python中将字符串大写字母转小写的四种方法:lower()方法简洁高效,手动ASCII转换灵活可控,str.translate()性能优化适合大数据处理,列表推导式实现代码简洁,总结方法优缺点及适用场景,需要的朋友可以参考下
    2025-05-05
  • Django中ModelForm组件的简单配置与使用教程

    Django中ModelForm组件的简单配置与使用教程

    modelform是django中基于已有的model,快速生成的具有form功能的一个模块,下面这篇文章主要给大家介绍了关于Django中ModelForm组件的简单配置与使用教程,需要的朋友可以参考下
    2022-10-10
  • Python generator生成器和yield表达式详解

    Python generator生成器和yield表达式详解

    这篇文章主要介绍了Python generator生成器和yield表达式详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • python+pyqt5实现KFC点餐收银系统

    python+pyqt5实现KFC点餐收银系统

    这篇文章主要为大家详细介绍了python+pyqt5实现KFC点餐收银系统,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-01-01
  • Python中zip()函数的使用方法详解

    Python中zip()函数的使用方法详解

    在Python中,zip()函数是一个非常实用且强大的内置函数,它主要用于将多个迭代器(如列表、元组、字符串等)中的元素“打包”成一个个元组,并返回一个迭代器,下面,我将详细探讨zip()函数的使用方法,需要的朋友可以参考下
    2024-09-09
  • Python模板的使用详细讲解

    Python模板的使用详细讲解

    Django 模板是使用 Django 模板语言标记的一个文本文档或Python字符串。模板引擎可以识别和解释一些构造。主要是变量和标签。模板是通过上下文来渲染的。渲染用变量的值替换变量,变量的值在上下文中查找,并执行标签。其他的一切都按原样输出
    2022-10-10
  • 利用Python将多张图片合成视频的实现

    利用Python将多张图片合成视频的实现

    这篇文章主要介绍了利用Python将多张图片合成视频的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11

最新评论