pyspark连接mysql数据库报错的解决

 更新时间:2023年11月07日 08:59:34   作者:猿界零零七  
本文主要介绍了pyspark连接mysql数据库报错的解决,因为spark中缺少连接MySQL的驱动程序,下面就来介绍一下解决方法,感兴趣的可以了解一下

使用pyspark连接mysql数据库代码如下

spark_conf = SparkConf().setAppName("MyApp").setMaster("local")
 
spark = SparkSession.builder.config(conf=spark_conf).getOrCreate()
 
url = "jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=UTF-8&useSSL=false"
table_name = "tab_tf"
properties = {
    "user": "root",
    "password": "root"
}
 
# 读取 MySQL 数据库中的数据
df = spark.read.jdbc(url=url, table=table_name, properties=properties)
# 展示数据
df.show()

执行时报错了,错误信息如下:

py4j.protocol.Py4JJavaError: An error occurred while calling o32.jdbc.
: java.sql.SQLException: No suitable driver
    at java.sql.DriverManager.getDriver(DriverManager.java:315)
    at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions$$anonfun$6.apply(JDBCOptions.scala:105)
    at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions$$anonfun$6.apply(JDBCOptions.scala:105)
    at scala.Option.getOrElse(Option.scala:121)
    at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions.<init>(JDBCOptions.scala:104)
    at org.apache.spark.sql.execution.datasources.jdbc.JDBCOptions.<init>(JDBCOptions.scala:35)
    at org.apache.spark.sql.execution.datasources.jdbc.JdbcRelationProvider.createRelation(JdbcRelationProvider.scala:32)
    at org.apache.spark.sql.execution.datasources.DataSource.resolveRelation(DataSource.scala:332)
    at org.apache.spark.sql.DataFrameReader.loadV1Source(DataFrameReader.scala:242)
    at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:230)
    at org.apache.spark.sql.DataFrameReader.load(DataFrameReader.scala:186)
    at org.apache.spark.sql.DataFrameReader.jdbc(DataFrameReader.scala:257)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at py4j.reflection.MethodInvoker.invoke(MethodInvoker.java:244)
    at py4j.reflection.ReflectionEngine.invoke(ReflectionEngine.java:357)
    at py4j.Gateway.invoke(Gateway.java:282)
    at py4j.commands.AbstractCommand.invokeMethod(AbstractCommand.java:132)
    at py4j.commands.CallCommand.execute(CallCommand.java:79)
    at py4j.GatewayConnection.run(GatewayConnection.java:238)
    at java.lang.Thread.run(Thread.java:748)

经查询,是因为spark中缺少连接MySQL的驱动程序,于是乎下载了与自己mysql数据库版本一致的jar包,下载地址:https://downloads.mysql.com/archives/c-j/ 

查询mysql版本命令:mysql -V

下载完成后,解压,将mysql-connector-java-8.0.30.jar拷贝到spark安装目录的libs中

重新执行程序,问题解决,执行结果如下:

参考:py4j.protocol.Py4JJavaError: An error occurred while calling o32.jdbc.

到此这篇关于pyspark连接mysql数据库报错的解决的文章就介绍到这了,更多相关pyspark连接mysql内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:

相关文章

  • python使用whisper读取蓝牙耳机语音并转为文字

    python使用whisper读取蓝牙耳机语音并转为文字

    这篇文章主要为大家详细介绍了python如何使用whisper读取蓝牙耳机语音并识别转为文字,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下
    2025-05-05
  • python笔记_将循环内容在一行输出的方法

    python笔记_将循环内容在一行输出的方法

    今天小编就为大家分享一篇python笔记_将循环内容在一行输出的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • 利用python绘制中国地图(含省界、河流等)

    利用python绘制中国地图(含省界、河流等)

    这篇文章主要介绍了利用python绘制中国地图,帮助大家更好的理解和使用python绘制图形,感兴趣的朋友可以了解下
    2020-09-09
  • Python操作CSV格式文件的方法大全

    Python操作CSV格式文件的方法大全

    CSV 文件(Comma Separated Values file,即逗号分隔值文件)是一种纯文本文件,它使用特定的结构来排列表格数据,这篇文章主要给大家介绍了关于Python操作CSV格式文件的相关资料,需要的朋友可以参考下
    2021-07-07
  • python重试装饰器的简单实现方法

    python重试装饰器的简单实现方法

    今天小编就为大家分享一篇python重试装饰器的简单实现方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • Python使用Spire.XLS for Python轻松实现将Excel转换为PDF

    Python使用Spire.XLS for Python轻松实现将Excel转换为PDF

    在许多商务工作流程中,Excel 文件常用于存储和分析数据,然而,在共享报告或发票时,将其转换为 PDF 能确保内容在不同设备上保持固定和可读,下面我们就来看看如何使用Python实现Excel到PDF的转换吧
    2025-11-11
  • Python 字符串裁切与提取全面且实用的解决方案

    Python 字符串裁切与提取全面且实用的解决方案

    本文梳理了Python字符串处理方法,涵盖基础切片、split/partition分割、正则匹配及结构化数据解析(如BeautifulSoup、json库),并提供场景选择建议与注意事项,感兴趣的朋友跟随小编一起看看吧
    2025-08-08
  • Python 批量操作设备的实现步骤

    Python 批量操作设备的实现步骤

    本文将结合实例代码,介绍Python 批量操作设备的实现步骤,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧
    2021-07-07
  • Python解析cyber record文件的示例详解

    Python解析cyber record文件的示例详解

    cyber record 是 Cyber RT 中用于录制和回放数据的工具,本文将为大家展示一下如何使用Python进行解析cyber record文件,需要的可以参考下
    2025-02-02
  • Python读取mp3中ID3信息的方法

    Python读取mp3中ID3信息的方法

    这篇文章主要介绍了Python读取mp3中ID3信息的方法,实例分析了Python中mutagen包的使用技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-03-03

最新评论