Python使用execjs执行包含中文参数的JavaScript

 更新时间:2022年03月28日 16:15:54   作者:小小明-代码实体  
爬虫的开发过程中,往往需要对JS进行模拟,简单或者通用的还可以在Python中模拟或者找到对应的第三方库,但是复杂的就可能不好实现了,下面这篇文章主要给大家介绍了关于Python使用execjs执行包含中文参数的JavaScript的相关资料,需要的朋友可以参考下

抓取到了一段包含数据的JavaScript代码:

import re
import requests

headers = {
    "user-agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36",
    "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
}
res = requests.get(
    "https://www.kuaikanmanhua.com/web/comic/100868/",
    headers=headers
)
script = re.findall(
    "<script>window.__NUXT__=([^<]+);</script>", res.text)[0].replace('\\u002F', "/")
script

结果:

image-20220223204934945

这段代码直接在游览器执行可以得到对应的JSON数据,那么我们如何使用python执行这段代码获取JS数据呢?答案是使用execjs

安装:

pip install PyExecJS 

但是如果此时在安装过Nodejs的windows上直接执行代码:

import execjs

execjs.eval(script)

会报出如下错误:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa4 in position 447: illegal multibyte sequence

此时我们需要重新指定execjs的环境为JScript:

import os

os.environ["EXECJS_RUNTIME"] = "JScript"

再次执行可以顺利得到结果。

如果我们确实需要使用本地nodejs的环境执行JavaScript则需要修改修改execjs的源码:

import os

os.environ["EXECJS_RUNTIME"] = "Node"
print(execjs.get().name)

Node.js (V8)

找到execjs安装目录下的_external_runtime.py文件:

image-20220223204010168

重启程序再次执行即可得到结果:

image-20220223204725760

execjs的调用函数或读取变量示例:

import execjs

ctx = execjs.compile("""
       function add(x, y) {
               return x + y;
       }
       v = add(3, 4);
""")
print(ctx.call("add", 1, 2), ctx.eval("v"))

3 7

Lib\site-packages\execjs\runtime_names.py文件可以看到execjs所支持的JavaScript环境:

PyV8           = "PyV8"
Node           = "Node"
JavaScriptCore = "JavaScriptCore"
SpiderMonkey   = "SpiderMonkey"
JScript        = "JScript"
PhantomJS      = "PhantomJS"
SlimerJS       = "SlimerJS"
Nashorn        = "Nashorn"

总结

到此这篇关于Python使用execjs执行包含中文参数JavaScript的文章就介绍到这了,更多相关execjs执行包含中文参数js内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 详解使用Python处理文件目录的相关方法

    详解使用Python处理文件目录的相关方法

    这篇文章主要介绍了使用Python处理文件目录的相关方法,使用到了os模块,需要的朋友可以参考下
    2015-10-10
  • 使用Python和NLTK进行文本预处理示例详解

    使用Python和NLTK进行文本预处理示例详解

    文将介绍如何使用Python编程语言和NLTK(Natural Language Toolkit)库进行文本预处理,为后续的文本分析和机器学习任务做准备,文中有详细的代码示例供大家参考,需要的朋友可以参考下
    2024-03-03
  • Python OpenCV 直方图的计算与显示的方法示例

    Python OpenCV 直方图的计算与显示的方法示例

    这篇文章主要介绍了Python OpenCV 直方图的计算与显示的方法示例,主要介绍用NumPy和Matplotlib计算和绘制直方图,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-02-02
  • Python实现大文件排序的方法

    Python实现大文件排序的方法

    这篇文章主要介绍了Python大文件排序的方法,涉及Python针对文件、缓存及日期等操作的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-07-07
  • Django使用Mysql数据库已经存在的数据表方法

    Django使用Mysql数据库已经存在的数据表方法

    今天小编就为大家分享一篇Django使用Mysql数据库已经存在的数据表方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • python中将字典改造为对象的方法

    python中将字典改造为对象的方法

    这篇文章主要介绍了python中将字典改造为对象的方法,在实际项目中,当使用json模块加载一个深度很深的字典类型的json文件时,使用字典的访问方式,将会出现很多中括号,即不直观也不美观,可以将这个字典转化为对象,使得可以用.的方式访问,需要的朋友可以参考下
    2023-11-11
  • python 多线程实现检测服务器在线情况

    python 多线程实现检测服务器在线情况

    本文给大家分享的是Python使用多线程通过ping命令检测服务器的在线状况,给大家了内网和外网的2个例子,有需要的小伙伴可以参考下。
    2015-11-11
  • python 根据列表批量下载网易云音乐的免费音乐

    python 根据列表批量下载网易云音乐的免费音乐

    这篇文章主要介绍了python 根据列表下载网易云音乐的免费音乐,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-12-12
  • 详解python中的json的基本使用方法

    详解python中的json的基本使用方法

    本篇文章主要介绍了python中的json的基本使用方法,在Python中使用json的时候,主要也就是使用json模块,json是以一种良好的格式来进行数据的交互,有兴趣的可以了解一下。
    2016-12-12
  • python中字典的常见操作总结2

    python中字典的常见操作总结2

    这篇文章主要介绍了python中字典的常见操作总结,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-07-07

最新评论