完美解决python针对hdfs上传和下载的问题
当我们使用python的hdfs包进行上传和下载文件的时候,总会出现如下问题
requests.packages.urllib3.exceptions.NewConnectionError:<requests.packages.urllib3.connection.HTTPConnection object at 0x7fe87cc37c50>: Failed to establish a new connection: [Errno -2] Name or service not known
其实这主要是由于没有将各个集群节点的ip映射到/etc/hosts文件中
修改/etc/hosts文件,将各个集群节点ip映射加上即可,如博主所示
vim /etc/hosts
192.168.20.174 hadoop04
192.168.20.173 hadoop03
192.168.20.172 hadoop02
192.168.20.171 hadoop01
补充知识:python上传文件到hadoop异常问题
使用库:pyhdfs
调用方法:
pyhdfs.HdfsClient(ip,port,user).copy_from_local()
pyhdfs.HdfsClient(ip,port,user).copy_to_local()
异常现象1如下图:
异常现象2如下图:
异常现象3如下图:
原因分析:可以看出,以上都是连接成功了,但是上传或者下载失败了,造成这种现象的原因是
我这里连接的是name节点,端口50070,当调用copy_from_local()时,name节点会主动去连接data节点进行数据读写操作,而data节点端口50075没有开启,造成data节点连接超时,抛出异常
解决办法:开启data节点端口
以上这篇完美解决python针对hdfs上传和下载的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
- Python select及selectors模块概念用法详解
- Python连接HDFS实现文件上传下载及Pandas转换文本文件到CSV操作
- Python selenium文件上传下载功能代码实例
- 基于python实现FTP文件上传与下载操作(ftp&sftp协议)
- Python Socketserver实现FTP文件上传下载代码实例
- python3 requests库文件上传与下载实现详解
- 使用Python操作FTP实现上传和下载的方法
- python ftp 按目录结构上传下载的实现代码
- python实现上传下载文件功能
- python实现的简单FTP上传下载文件实例
- python 基于selectors库实现文件上传与下载
相关文章
Python中出现"No module named 'requests'"
这篇文章主要给大家介绍了关于Python中出现"No module named 'requests'"的解决办法,"No module named requests"是Python报错提示,意味着你在使用某个Python程序或脚本时,没有找到名为requests的模块,需要的朋友可以参考下2023-11-11Python matplotlib绘图时使用鼠标滚轮放大/缩小图像
Matplotlib是Python程序员可用的事实上的绘图库,虽然它比交互式绘图库在图形上更简单,但它仍然可以一个强大的工具,下面这篇文章主要给大家介绍了关于Python matplotlib绘图时使用鼠标滚轮放大/缩小图像的相关资料,需要的朋友可以参考下2022-05-05python Bamboolib库加速Pandas数据分析过程详解
这篇文章主要介绍了python Bamboolib库加速Pandas数据分析过程详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2024-01-01windows下python安装paramiko模块和pycrypto模块(简单三步)
这篇文章主要给大家介绍了通过简单的三个步骤在windows下python中安装paramiko模块和pycrypto模块的相关资料,文中安装的步骤,简单而且又易于大家理解,需要的朋友们下面跟着小编一起来学习学习吧。2017-07-07python:pandas合并csv文件的方法(图书数据集成)
下面小编就为大家分享一篇python:pandas合并csv文件的方法(图书数据集成),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧2018-04-04
最新评论