如何使用Python逆向抓取APP数据

 更新时间:2021年05月24日 08:22:58   作者:不加班的程序员丶  
今天给大伙分享一下 Python 爬虫的教程,这次主要涉及到的是关于某 APP 的逆向分析并抓取数据,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

今天给大伙分享一下 Python 爬虫的教程,这次主要涉及到的是关于某 APP 的逆向分析并抓取数据,关于 APP 的反爬会麻烦一些,比如 Android 端的代码写完一般会进行打包并混淆加密加固,所以除了抓包之外,还需要对 APP 进行查壳脱壳反编译等操作。

所需设备和环境:

设备:安卓手机

抓包:

fiddler+xposed+JustTrustme

查壳:ApkScan-PKID

脱壳:frida-DEXDump

反编译:jadx-gui

hook:frida

抓包

手机安装app,设置好代理,打开 fiddler 先来抓个包,发现这个 app 做了证书验证,fiddler 开启之后  app提示连接不到服务器:

图片

那就是 app 做了 SSL pinning 证书验证,解决这种问题一般都是安装 xposed 框架,里面有一个 JustTrustme 模块,它的原理就是hook,直接绕过证书验证类,安装方法大家百度吧。

之后再打开app,可以看到成功抓到了包:

图片

先简单分析一下,可以看到请求体中 formdata 是密文,响应内容也是密文,这个请求和响应中有用信息非常少,甚至都不知道在 jadx-gui 里怎么搜索,请求体中 formdata 是以两个等号结尾的,应该是个 base64 编码,其他一概不知。。。

脱壳反编译

那先来反编译,在这之前,通常是先用查壳工具检查一下 app 是否加固,打开 ApkScan-PKID ,把 app

可以看到这个 app 使用了 360 加固,真是层层设限啊!!这里使用frida-DEXDump来脱壳,可以到 github 上下载 frida-DEXDump 的源代码,完成之后打开项目所在文件夹,在当前位置打开命令行运行以下命令:

python main.py

等待脱壳完成,可以看到当前项目中生成了一个对应文件夹,里面有很多dex文

图片

下面用 jadx-gui 打开 dex 文件,一般先从最大的文件开始依次搜索关键字,我们知道 java 中使用 base64 是有 BASE64Encoder 关键字的,因为抓包得到的信息非常少,在这里就只能搜索这个关键字了,搜到第四个dex中,得到了疑似加密处:

图片

可以看到是使用了一个 aes 加密,密钥是固定的字符串。

Frida Hoo

Java不太熟,分析不来,直接使用 frida 来写一段 hook 代码看一看 encrypt 函数入参和出参的内容:

图片

同时来抓包对比:

图片

图片

就得到了这里的请求 data 入参数据:

pageIndex:当前页码

pageSize:当前页对应的数据条数

typeId 和 source 是固定的, 接下来再来 hook decrypt 函数,对比抓包和 hook 结果:

图片

图片

结果是一样的,至此,我们逆向分析就完成了。

总结一下请求和响应过程,就是请求体中的 data 经过 encrypt 函数加密传参,改变 pageIndex 就可以得到每页数据,响应是经过 decrypt 函数加密显示,那我们只需要在 python 中实现这个 aes 加密解密过程就行了,从反编译的 java 代码中可以看出密钥是固定的:wxtdefgabcdawn12,没有 iv 偏移。

请求

直接上代码:

图片

运行代码,成功拿到数据:

图片

到此这篇关于如何使用Python逆向抓取APP数据的文章就介绍到这了,更多相关Python逆向抓取APP数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用Python编写一个沙箱隔离功能

    使用Python编写一个沙箱隔离功能

    这篇文章主要为大家详细介绍了如何通过 Docker 实现一个简单的沙箱隔离应用,然后提供一个通过 Python 模拟沙箱的例子,感兴趣的可以了解下
    2024-12-12
  • Python简易版图书管理系统

    Python简易版图书管理系统

    这篇文章主要为大家详细介绍了Python如何实现简易版图书管理系统,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-08-08
  • django2.0扩展用户字段示例

    django2.0扩展用户字段示例

    今天小编就为大家分享一篇关于django2.0扩展用户字段示例,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-02-02
  • Mac中升级Python2.7到Python3.5步骤详解

    Mac中升级Python2.7到Python3.5步骤详解

    本篇文章主要介绍了Mac中升级Python2.7到Python3.5步骤详解,具有一定的参考价值,感兴趣的小伙伴们可以参考一下。
    2017-04-04
  • pycharm配置SSH远程连接服务器详细步骤(0基础详细版)

    pycharm配置SSH远程连接服务器详细步骤(0基础详细版)

    PyCharm是一款流行的Python集成开发环境(IDE),提供了远程连接云服务器的功能,使得开发者可以更加便捷地进行远程开发和调试,这篇文章主要给大家介绍了关于pycharm配置SSH远程连接服务器的详细步骤,需要的朋友可以参考下
    2024-07-07
  • 控制Python浮点数输出位数的操作方法

    控制Python浮点数输出位数的操作方法

    在python的输出结果中,尤其是浮点数的输出,当我们需要写入文本文件时,最好是采用统一的输出格式,这样也能够增强结果的可读性,这篇文章主要介绍了控制Python浮点数输出位数的方法,需要的朋友可以参考下
    2022-04-04
  • python 判断linux进程,并杀死进程的实现方法

    python 判断linux进程,并杀死进程的实现方法

    今天小编就为大家分享一篇python 判断linux进程,并杀死进程的实现方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • python常用的正则表达式大全

    python常用的正则表达式大全

    正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配,下面这篇文章主要给大家介绍了关于python常用正则表达式的相关资料,文中通过图文以及实例代码介绍的非常详细,需要的朋友可以参考下
    2022-02-02
  • pycharm设置当前工作目录的操作(working directory)

    pycharm设置当前工作目录的操作(working directory)

    今天小编就为大家分享一篇pycharm设置当前工作目录的操作(working directory),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • nlp自然语言处理学习CBOW模型类实现示例解析

    nlp自然语言处理学习CBOW模型类实现示例解析

    这篇文章主要为大家介绍了nlp自然语言处理学习CBOW模型类实现示例解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步早日升职加薪
    2022-04-04

最新评论