如何使用Python破解ZIP或RAR压缩文件密码

 更新时间:2020年01月09日 15:06:37   作者:python大师  
这篇文章主要介绍了如何使用Python破解ZIP或RAR压缩文件密码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

这篇文章主要介绍了如何使用Python破解ZIP或RAR压缩文件密码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

我们经常会从网络上下载一些带密码的压缩包,想要获取里面的内容,往往就要给提供商支付一些费用。想要白嫖其中的内容,常见的做法是百度搜索一些压缩包密码破解软件,但后果相信体验过的人都知道。本文将会利用 Python 破解压缩包的密码,这里以 ZIP/RAR 为例。

破解原理

其实原理很简单,一句话概括就是「大力出奇迹」,Python 有两个压缩文件库:zipfile和 rarfile,这两个库提供的解压缩方法 extractall() 可以指定密码,这样的话首先生成一个密码字典(手动或用程序),然后依次尝试其中的密码,如果能够正常解压缩则表示密码正确。

  • zipfile:Python 标准库,使用时直接导入即可
  • rarfile:Python 第三方库,使用时需要安装,API 文档(https://rarfile.readthedocs.io/en/latest/api.html)

利用 Pipenv 安装 rarfile 

pipenv install rarfile

最后,再将一个带有密码的压缩包放入实验环境中即可。

编码

知道原理后,编码就会非常简单了

准备密码本

「密码本」其实就是一个包含了所有可能密码的文件,用户可以手动录入,也可以用程序录入。文末还会有一个介绍。

读取压缩文件

尝试解压

先尝试不用密码解压缩,如果成功则表示压缩文件没有密码

 

暴力破解

程序入口

使用

如果想要使用上述代码,我们只需在命令行执行 python main.py<filename>即可。例如 python main.py test.zip

运行结果:

扩展密码本如何获取?

看到这里,细心的小伙伴一定会发现,最核心的其实不是代码,而是「密码本」。理论上只要密码本中的密码足够多,就一定能获取到压缩包的密码,这也就是俗称的「撞库」。

如何加速破解过程?

解决了密码本的问题,深入思考的小伙伴的一定又会有新的疑问,密码本既然如此庞大,那如何加速破解的过程呢?这里给出两个思路

多线程(进程)破解

密码本如果很多且密码数量庞大时,我们可以采用多线程(进程)的方式读取密码,一个进程读一个密码本,一个线程分段读密码。当然,如果是在 python 中,建议不要采用多线程,因为 python 中的线程就是鸡肋,有兴趣的可以阅读相关资料。

利用 GPU 加速

我们以上的代码都是运行在 CPU 上的,即使开启多线程(进程)也只是利用到 CPU 的资源,但如果想要加速破解过程,我们其实还可以利用闲置的 GPU 资源。

在介绍为什么可以利用 GPU 加速前,我们需要明确一个观点,两者都为了完成计算任务而设计。

那为什么会想到使用 GPU 加速呢?这是就要说到两者的不同了:CPU 虽然有多核,但总数没有超过两位数,并且每个核的运算能力极其强大。而 GPU 的核数远超 CPU,但每个核的运算能力与 CPU 的核相比就相差甚远了。

我们可以简单的举个例子,解一道题,CPU 就是博士生,GPU 就是小学生,CPU 负责理解题目并且整理出解题的步骤以及解法,而 GPU 负责其中很简单但是数量又很大的简单运算就行了。

因此理论上在破解密码的过程中,我们完全可以使用 GPU 来加速这一过程。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python Scrapy爬虫框架的使用

    python Scrapy爬虫框架的使用

    这篇文章主要介绍了python Scrapy爬虫框架的使用,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2021-01-01
  • python中fastapi设置查询参数可选或必选

    python中fastapi设置查询参数可选或必选

    这篇文章主要介绍了python中fastapi设置查询参数可选或必选,文围绕主题展开详细的内容介绍,具有一定的参考价值需要的小伙伴可以参考一下
    2022-06-06
  • python3 sorted 如何实现自定义排序标准

    python3 sorted 如何实现自定义排序标准

    这篇文章主要介绍了python3 sorted 如何实现自定义排序标准,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Python 使用元类type创建类对象常见应用详解

    Python 使用元类type创建类对象常见应用详解

    这篇文章主要介绍了Python 使用元类type创建类对象,结合实例形式详细分析了Python元类的概念、功能及元类type创建类对象的常见应用技巧,需要的朋友可以参考下
    2019-10-10
  • pandas抽取行列数据的几种方法

    pandas抽取行列数据的几种方法

    这篇文章主要介绍了pandas抽取行列数据的几种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • Python中的序列化详细解析

    Python中的序列化详细解析

    这篇文章主要介绍了Python中的序列化详细解析,序列化是指把程序中的一个类转化成一个标准化的格式,标准化的意义是这个格式可以跨程序,跨平台的被使用,而且保持其原有的内容,规范,需要的朋友可以参考下
    2023-11-11
  • Python+Selenium随机生成手机验证码并检查页面上是否弹出重复手机号码提示框

    Python+Selenium随机生成手机验证码并检查页面上是否弹出重复手机号码提示框

    这篇文章主要介绍了Python+Selenium随机生成手机验证码并检查页面上是否弹出重复手机号码提示框,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-09-09
  • 用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os)

    用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os)

    这篇文章主要介绍了用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • Python import模块的缓存问题解决方案

    Python import模块的缓存问题解决方案

    这篇文章主要介绍了Python import模块的缓存问题解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-06-06
  • Python正规则表达式学习指南

    Python正规则表达式学习指南

    本文介绍了Python对于正则表达式的支持,包括正则表达式基础以及Python正则表达式标准库的完整介绍及使用示例,非常不错,具有参考借鉴价值,需要的朋友一起学习吧
    2016-08-08

最新评论