为python爬虫docker镜像添加nodejs环境实现方法

 更新时间:2023年09月12日 08:38:09   作者:ponponon  
这篇文章主要为大家介绍了为python爬虫docker镜像添加nodejs环境实现方法,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

旧方法

过去会使用类似 curl -sL https://deb.nodesource.com/setup_16.x | bash - 这样的方式添加 source 源,然后在使用 apt 安装 nodejs

但是这个方法最近不行了,运行会有警告

root@f51e70203b5b:/# curl -sL https://deb.nodesource.com/setup_16.x | bash -
================================================================================
▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓
================================================================================
                           SCRIPT DEPRECATION WARNING                    
  This script, located at https://deb.nodesource.com/setup_X, used to
  install Node.js is deprecated now and will eventually be made inactive.
  Please visit the NodeSource distributions Github and follow the
  instructions to migrate your repo.
  https://github.com/nodesource/distributions
  The NodeSource Node.js Linux distributions GitHub repository contains
  information about which versions of Node.js and which Linux distributions
  are supported and how to install it.
  https://github.com/nodesource/distributions
                          SCRIPT DEPRECATION WARNING
================================================================================
▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓▓
================================================================================
TO AVOID THIS WAIT MIGRATE THE SCRIPT
Continuing in 60 seconds (press Ctrl-C to abort) ...
^C

大概意思就是,这种方式已经 out了,nodejs 叫你别这么用了

nodejs最新推荐的方式是

https://github.com/nodesource/distributions#debian-versions

需要更多命令了,而且大家知道,因为「邪恶长城」的存在,这非常不适合大陆宝宝

缺点

  • 网络问题,不适合大陆宝宝
  • 变来变去,早晚要吃亏

那么有没有更加适合大陆宝宝并且更加永恒不变的打包安装 nodejs 方式呢?

当然有

因为 python 的 docker 镜像是基于 debian 打包的

debian 的仓库里面就有 nodejs

但是别选 buster (debian10),因为这款远古时期的 debian 10 buster 仓库里面的 nodejs 是 12 版本的,狗见了都摇头

建议选择 bookworm ,也就是 debian12 的,热乎,今年刚发布。仓库里面带的 nodejs 版本是 18,很新鲜

Dockerfile 示例

FROM python:3.10.13-bookworm
# 改变pip缓存目录
# RUN pip config set global.cache-dir /pip/cache
# 使用 aliyun 内网镜像源
# RUN (echo "deb http://mirrors.cloud.aliyuncs.com/debian/ buster main non-free contrib" > /etc/apt/sources.list) 
RUN (apt-get update) && (apt-get upgrade -y)
# 安装依赖工具,default-libmysqlclient-dev 是 mysqlclient 的依赖
RUN (apt-get install -y vim wget httpie netcat-openbsd htop curl gcc make g++ default-libmysqlclient-dev) 
# 安装 node 环境
RUN (apt install -y nodejs npm) && (npm install -g crypto-js @babel/core @babel/cli @babel/preset-env)

当然,上面的 还没有把 apt 镜像源换成大陆的

说更加完整的是下面这样

FROM python:3.11.5-bookworm
# 为什么要删除这些东西? 参考:[为什么我把 debian12 的 apt 源替换为上海交大之后,还会连接 debian 官方源?](https://segmentfault.com/q/1010000044193707)
RUN rm -rf /etc/apt/sources.list.d/*
RUN echo "deb http://mirror.sjtu.edu.cn/debian bookworm main non-free contrib" > /etc/apt/sources.list
RUN (apt-get update) && (apt-get upgrade -y)
# 安装依赖工具,default-libmysqlclient-dev 是 mysqlclient 的依赖
RUN (apt-get install -y vim wget httpie netcat-openbsd htop curl gcc make g++ default-libmysqlclient-dev) 
# 安装 node 环境
RUN (apt install -y nodejs npm) && (npm install -g crypto-js @babel/core @babel/cli @babel/preset-env)

小结

  • 要用 debian12,也就是 bookworm。不建议用 debian10 和debian11,因为他两自带的都是 nodejs12,太古老了,毫无意义。
  • 而 debian12 的 nodejs18 足够 hold 大多数场景
  • 记得替换 apt 换为大陆的,不然在大陆的你,受不了

以上就是为python爬虫docker镜像添加nodejs环境实现方法的详细内容,更多关于python docker镜像nodejs环境的资料请关注脚本之家其它相关文章!

相关文章

  • python遍历目录的方法小结

    python遍历目录的方法小结

    这篇文章主要介绍了python遍历目录的方法,总结分析了Python常用的两种目录遍历技巧,需要的朋友可以参考下
    2016-04-04
  • Python 探针的实现原理

    Python 探针的实现原理

    本文将简单讲述一下 Python 探针的实现原理。 同时为了验证这个原理,我们也会一起来实现一个简单的统计指定函数执行时间的探针程序。
    2016-04-04
  • python编程嵌套函数实例代码

    python编程嵌套函数实例代码

    这篇文章主要介绍了python编程嵌套函数实例代码,分享了相关代码示例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-02-02
  • Python实现基于KNN算法的笔迹识别功能详解

    Python实现基于KNN算法的笔迹识别功能详解

    这篇文章主要介绍了Python实现基于KNN算法的笔迹识别功能,结合实例形式详细分析了使用KNN算法进行笔迹识别的相关库引入、操作步骤与相关注意事项,需要的朋友可以参考下
    2018-07-07
  • Python3 执行Linux Bash命令的方法

    Python3 执行Linux Bash命令的方法

    今天小编就为大家分享一篇Python3 执行Linux Bash命令的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • python导入不同目录下的自定义模块过程解析

    python导入不同目录下的自定义模块过程解析

    这篇文章主要介绍了python导入不同目录下的自定义模块过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-11-11
  • python中的异步爬虫详解

    python中的异步爬虫详解

    这篇文章主要介绍了python中的异步爬虫详解,所谓的异步异步 IO,就是发起一个 IO 阻塞的操作,但是不用等到它结束,可以在它执行 IO 的过程中继续做别的事情,当 IO 执行完毕之后会收到它的通知,需要的朋友可以参考下
    2023-08-08
  • 如何实现一个python函数装饰器(Decorator)

    如何实现一个python函数装饰器(Decorator)

    这篇文章主要介绍了如何实现一个python函数装饰器(Decorator),帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-10-10
  • Python爬虫获取op.gg英雄联盟英雄对位胜率的源码

    Python爬虫获取op.gg英雄联盟英雄对位胜率的源码

    这篇文章主要介绍了Python爬虫获取op.gg英雄联盟英雄对位胜率,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-01-01
  • 解决keras.datasets 在loaddata时,无法下载的问题

    解决keras.datasets 在loaddata时,无法下载的问题

    这篇文章主要介绍了解决keras.datasets 在loaddata时,无法下载的问题,具有很好的参考价值,希望对大家有所帮助。
    2021-05-05

最新评论