python爬虫之快速对js内容进行破解

 更新时间:2019年07月09日 09:17:51   作者:dragon-brother  
这篇文章主要介绍了python爬虫之快速对js内容进行破解,到一般js破解有两种方法,一种是用Python重写js逻辑,一种是利用第三方库来调用js内容获取结果,这次我们就用第三方库来进行js破解,需要的朋友可以参考下

前言

一般js破解有两种方法,一种是用Python重写js逻辑,一种是利用第三方库来调用js内容获取结果。这两种方法各有利弊,第一种方法性能好,但对js和Python要求掌握比较高;第二种方法快捷便利,对一些复杂js加密很有效。这次我们就用第三方库来进行js破解。

目标网站

本次网站是[企名片],网站对展示的数据进行了加密,所以直接找根本找不到。

目标url:https://www.qimingpian.com/finosda/project/pinvestment

js分析调试工具

对js进行分析调试的浏览器一定要用谷歌浏览器,用这个来调试测试真的很方便。首先我们按F12打开开发者工具,选到network选项并勾选preserve log 选项,然后输入网址url来抓包。此时你会发现网页源码里没有展示内容,在搜索也找不到我们看到的内容,那说明网页内容是被加密处理了。

此时你可以一个个看每个包找找有什么可疑的内容,当然我们一般会先看xhr里的内容,一眼我们就发现里面都有encrypt_data这个数据,看着很像。

我们ctrl加shift加f键搜索encrypt_data,找到第一个js里的encrypt_data内容,然后翻到下面return e.encrypt_data这一行来,打上断点看看这会是什么内容。(一般我们搜索到return我们搜索的内容都要打上断点来看看,八九不离十的)

打好断点后我们刷新页面来观察,选中e.encrypt_data右键有个什么什么in console的,点这个会在下面出现我们选中的内容是什么。然后把后面的Object(d.a)(e.encrypt_data)用同样的方法来试下,发现没有网页的内容啊。

这里一定要注意我们打的断点,在按一次,重复上面的步骤会发现,Object(d.a)(e.encrypt_data)这不就是我们要的内容吗!e.encrypt_data这个就是我们xhr里面的那个encrypt_data,Object(d.a)是一个函数,就是这个函数对内容进行了加密,我们只要破解这个函数就OK了。

选中Object(d.a)上面会出现它在哪里,点击下跳转过去。可以发现函数返回了一个json对象。这个返回结果包括1个s函数,参数里只有a.a.decode(t)这一个变量,其余都是常量。

所有我们用同样的方法找到s函数的具体内容和a.a.decode()这个函数的具体内容。方法就是我们在return JSON.parse这里重新打断点,点击断点的那个下一步,然后找上述函数的内容。

s函数

a.a.decode()

利用webstorm编辑器来运行上述函数进行调试

1 首先我们安装Nodejs,去官网下载安装,这是js环境。这个自己搜索个安装教程吧,这里不过多介绍了。

2 WebStorm 安装后激活,教程网上很多,大家自行搜索。它使用方式与 PyCharm 很类似。

我们把上述所需要的函数全部扣下来放到webstorm中,然后运行。注意有的函数里面会有没有定义的参数,遇到这些我们几句在谷歌浏览器里一个个找就可以了,一般会有很多常量,直接替换掉。

然后我们调用上述方法可以看到能够正常获取数据了,这里js里的部分方法我重新命名了,注意下,下面是部分代码片段。

最后用 Python 去调用解密函数就行了,这里出于对网站保护就不直接贴完整代码了。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • Python 如何读取字典的所有键-值对

    Python 如何读取字典的所有键-值对

    这篇文章主要介绍了Python 读取字典的所有键-值对操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • 列举Python中吸引人的一些特性

    列举Python中吸引人的一些特性

    这篇文章主要介绍了Python中吸引人的一些特性,有助于初学者或者开发者在选择编程语言时用作参考或入门指引,需要的朋友可以参考下
    2015-04-04
  • Python Traceback(most recent call last)报错信息:示例解读

    Python Traceback(most recent call last)报错信息:示例解读

    这篇文章主要介绍了Python Traceback(most recent call last)报错信息:示例解读,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-12-12
  • python itertools包内置无限迭代器

    python itertools包内置无限迭代器

    这篇文章主要介绍了python itertools包内置无限迭代器, Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数,itertools提供的几个“无限”迭代器。下文更多相关内容,需要的朋友可以参考一下
    2022-03-03
  • Python 使用matplotlib模块模拟掷骰子

    Python 使用matplotlib模块模拟掷骰子

    这篇文章主要介绍了Python 使用matplotlib模块模拟掷骰子,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-08-08
  • python自动生成证件号的方法示例

    python自动生成证件号的方法示例

    这篇文章主要给大家介绍了关于python自动生成证件号的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 基于Python编写一个刷题练习系统

    基于Python编写一个刷题练习系统

    这篇文章主要为大家详细介绍了如何基于Python语言编写一个简单的刷题练习系统,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2023-02-02
  • Django生成PDF文档显示在网页上以及解决PDF中文显示乱码的问题

    Django生成PDF文档显示在网页上以及解决PDF中文显示乱码的问题

    这篇文章主要介绍了Django生成PDF文档显示在网页上以及解决PDF中文显示乱码的问题,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-07-07
  • python Socket网络编程实现C/S模式和P2P

    python Socket网络编程实现C/S模式和P2P

    这篇文章主要介绍了python Socket网络编程实现C/S模式和P2P,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-06-06
  • Python第三方库h5py_读取mat文件并显示值的方法

    Python第三方库h5py_读取mat文件并显示值的方法

    今天小编就为大家分享一篇Python第三方库h5py_读取mat文件并显示值的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02

最新评论