Python如何提取chm数据

 更新时间:2023年01月06日 08:35:55   作者:彳亍261  
这篇文章主要介绍了Python如何提取chm数据,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

Python提取chm数据

需求场景

chm格式文档中的内容,提取保存为html

  • 方法一 使用在线转换工具或者软件
  • 方法二 脚本编译

step 1:.bat脚本反编译

使用该脚本, 可以将chm文件反编译,类似解压,获取文件。有些文档可以直接转换为txt,有些会转化为html. 这个跟生成chm文件有关系。

1 新建txt文档, 参照示例写入命令。保存后文件另存为.bat格式

hh -decompile 转换结果输出路径 待转换文件(相对/绝对路径)
# 示例
hh -decompile   D:\Desktop\  123.chm

2 右键 管理员身份运行该文件即可,结果输出到命令指定的目录

step 2: html转txt

【html】Python提取html中文本到txt

查用python自带的.chm官方文档

1.去python的官方网站去下载对应版本的python,在这里下载的python会自带一份官方文档(根据操作系统选择的不同,会有不同的格式),下载windows版本的会有一个(*.chm)格式的说明文档

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

下载好后进入下载目录,找到Doc目录,进入

我的是windows系统,可以看到有个5-6兆的(*.chm)说明文档

windows下可以直接双击打开。

如何查用python自带的.chm官方文档

打开后的样子,可以看到很多目录,充满了知识,等待着去发掘。

如何查用python自带的.chm官方文档

如果我对python自带的某个库的使用十分不解,比如copy,

我应该这样查

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

想找python基本的数据类型以及使用来学习

可以这样来找

如何查用python自带的.chm官方文档

python自带的(内建的)函数有很多,了解一下

如何查用python自带的.chm官方文档

python自带了的各种异常,快来捕获吧

如何查用python自带的.chm官方文档

python语言是一种解释型语言,很大程度上解决了跨平台开发的难度,关于python的各种接口(interface)调用,以及对操作系统的支持,都可以查到。

如何查用python自带的.chm官方文档

关于英语的问题,大可不必担心,有道云翻译提供截屏翻译,鼠标取词翻译,是十分方便的,快去学习吧!

如何查用python自带的.chm官方文档

如何查用python自带的.chm官方文档

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Django model.py表单设置默认值允许为空的操作

    Django model.py表单设置默认值允许为空的操作

    这篇文章主要介绍了Django model.py表单设置默认值允许为空的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • Pycharm配置Anaconda环境的详细图文教程

    Pycharm配置Anaconda环境的详细图文教程

    PyCharm是一款很好用很流行的python编辑器,Anaconda通过管理工具包、开发环境、Python版本,大大简化了你的工作流程,下面这篇文章主要给大家介绍了关于Windows系统下Pycharm配置Anaconda环境的相关资料,需要的朋友可以参考下
    2023-02-02
  • python读写数据读写csv文件(pandas用法)

    python读写数据读写csv文件(pandas用法)

    这篇文章主要介绍了python读写数据读写csv文件(pandas用法),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • Python解决两个整数相除只得到整数部分的实例

    Python解决两个整数相除只得到整数部分的实例

    今天小编就为大家分享一篇Python解决两个整数相除只得到整数部分的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • 对python捕获ctrl+c手工中断程序的两种方法详解

    对python捕获ctrl+c手工中断程序的两种方法详解

    今天小编就为大家分享一篇对python捕获ctrl+c手工中断程序的两种方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • python3使用diagrams绘制架构图的步骤

    python3使用diagrams绘制架构图的步骤

    这篇文章主要介绍了python3使用diagrams生成架构图的步骤,帮助大家更好的理解和学习使用python,感兴趣的朋友可以了解下
    2021-04-04
  • Python(TensorFlow框架)实现手写数字识别系统的方法

    Python(TensorFlow框架)实现手写数字识别系统的方法

    这篇文章主要介绍了Python(TensorFlow框架)实现手写数字识别系统的方法。小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-05-05
  • Python面向对象中的封装详情

    Python面向对象中的封装详情

    这篇文章主要介绍了Python面向对象中的封装详情,在python中也有对对象的封装操作,使其对外只提供固定的访问模式,不能访问其内部的私有属性和私有方法。下文详细内容,需要的小伙伴可以参考一下
    2022-03-03
  • python利用多种方式来统计词频(单词个数)

    python利用多种方式来统计词频(单词个数)

    这篇文章主要介绍了python利用多种方式来统计词频(单词个数),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-05-05
  • Python scikit-learn数据预处理常见方法和步骤

    Python scikit-learn数据预处理常见方法和步骤

    数据预处理是数据准备阶段的一个重要环节,主要目的是将原始数据转换成适合机器学习模型使用的格式,数据预处理可以显著提高机器学习模型的性能和准确度,本文给大家介绍了Python数据预处理常见方法和步骤,需要的朋友可以参考下
    2024-05-05

最新评论