Pycharm连接远端Python环境操作Spark过程

 更新时间:2025年07月28日 09:19:02   作者:时下握今  
远程连接方案通过SSH配置PyCharm连接CentOS服务器,统一环境避免差异,自动同步代码至远程工作目录,并映射pyspark等工具包,提升开发效率与一致性

远程连接方案,允许程序员连接远端测试环境,确保环境的统一,避免各种环境问题的发生,而且由于是连接的远程环境,所有在Pycharm编写的代码 可自动上传到远端服务器,本地在执行代码的时候,相当于直接在远端环境上运行。

1. 创建工程,指定远端python解析器

前提条件:远端Centos系统,安装了Spark环境,安装了Python环境,本文基于anaconda安装的python环境

打开pycharm开发工具,选择File->New Project->Pure Python创建一个Python工程

需要:指定工程本地工作目录,选择先前配置的python解析器,若未配置远端python解析器,则打开对话框根据提示配置

2. 添加远端python解析器

添加远端python解析器,需要SSH方式(指定服务器地址、登录用户名、登录口令)登录远端服务器

指定服务器的登录口令

单机 Next,连接到服务器后,选择python的安装目录

配置完成,就可以选择已经配置了的服务器python解析器。

同时指定工程在服务器上的工作目录

3. 配置完成

配置完成,File->Settings -> 选择对应工程,可以发现:服务器上python环境安装的工具包,及本地工作目录和服务器工作目录的映射。这里主要关注pyspark包的安装

4. 本地文件自动同步远端

本地工程文件实时同步到服务器工作目录,若担心影响开发效率,可以关闭自动同步,开启手工同步

5. 删除远端python解析器(非必须操作,重新配置时参考该项)

配置过程中,若发现服务器python解析器配置错误,或配置重复,可从此处进入,删除有误的配置

6. 文件模板配置

每个文件都用到的一些代码,例如导包,本地锁定服务器python解析器,可以做成一个模板。工程中每次创建一个新文件,会自动导入模板。

#!/usr/bin/env python
# @desc : 
__coding__ = "utf-8"
__author__ = "xxx team"

from pyspark import SparkContext, SparkConf
import os

# 锁定远端操作环境, 避免存在多个版本环境的问题
os.environ['SPARK_HOME'] = '/export/server/spark'
os.environ["PYSPARK_PYTHON"] = "/root/anaconda3/bin/python"
os.environ["PYSPARK_DRIVER_PYTHON"] = "/root/anaconda3/bin/python"

# 快捷键:  main 回车
if __name__ == '__main__':
    print("XXX案例")

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python全角与半角之间相互转换的方法总结

    Python全角与半角之间相互转换的方法总结

    全角与半角转换在处理汉语语料中会经常出现,这里分别说明汉字、数字、字母的unicode编码范围,下面这篇文章主要给大家介绍了关于Python全角与半角之间相互转换的相关资料,需要的朋友可以参考下
    2022-03-03
  • Python异常处理之try...except语句

    Python异常处理之try...except语句

    Python异常处理是Python中重要的一部分,为了保证程序的稳定性和可靠性,我们需要使用异常处理来及时捕获,并以优雅的方式来处理这些异常,本教程将介绍如何处理 Python中的异常,需要的朋友可以参考下
    2023-06-06
  • PyQt5每天必学之组合框

    PyQt5每天必学之组合框

    这篇文章主要为大家详细介绍了PyQt5每天必学之组合框,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-04-04
  • 用Python实现2024年春晚刘谦魔术

    用Python实现2024年春晚刘谦魔术

    昨晚春晚上刘谦的两个魔术表演都非常精彩,忍不住用编程去模拟一下这个过程,所以本文给大家用Python实现2024年春晚刘谦魔术,文中通过代码示例给大家介绍的非常详细,需要的朋友可以参考下
    2024-02-02
  • Python 对象拷贝及深浅拷贝区别的详细教程示例

    Python 对象拷贝及深浅拷贝区别的详细教程示例

    这篇文章主要介绍了Python 对象拷贝及深浅拷贝区别的详细教程示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-03-03
  • 介绍Python的Urllib库的一些高级用法

    介绍Python的Urllib库的一些高级用法

    这篇文章主要介绍了Python的Urllib库的一些高级用法,是用Python编写爬虫的一些基础知识,需要的朋友可以参考下
    2015-04-04
  • python之如何合并excel的多个sheet

    python之如何合并excel的多个sheet

    文章介绍使用openpyxl和pandas处理Excel报表,前者需手动合并逻辑,后者通过concat/append简化操作,强调data_only参数避免公式干扰,并可实现数据过滤、转换等功能
    2025-09-09
  • PyQT5实现选项卡窗口、堆栈窗口、停靠窗口、子窗口

    PyQT5实现选项卡窗口、堆栈窗口、停靠窗口、子窗口

    这篇文章主要介绍了PyQT5实现选项卡窗口、堆栈窗口、停靠窗口、子窗口,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • python的time模块和datetime模块实例解析

    python的time模块和datetime模块实例解析

    这篇文章主要介绍了python的time模块和datetime模块实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • Python爬虫入门教程02之笔趣阁小说爬取

    Python爬虫入门教程02之笔趣阁小说爬取

    这篇文章主要介绍了Python爬虫入门教程02之笔趣阁小说爬取,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-01-01

最新评论