Python字体反爬实战案例分享

 更新时间:2022年06月01日 10:32:17   作者:梦想橡皮擦  
这篇文章主要介绍了Python字体反爬实战案例分享,文章基于python的相关资料利用实习 x站点实战案例,具有一定的的参考价值,需要的小伙伴可以参考一下

实战场景 

本篇博客学习字体反爬,涉及的站点是实习 x,目标站点地址直接百度搜索即可。

可以看到右侧源码中出现了很多“乱码”,这其中就包含了关键信息。

接下来按照常规的套路,在开发者工具中检索字体相关信息,但是筛选之后,并没有得到反爬的字体,只有一个 file? 有些许的可能性。

这里就是一种新鲜的场景了,如果判断不准,那只能用字体样式和字体标签名进行判断了。
在网页源码中检索 @font-face 和 myFont,得到下图内容,这里发现 file 字体又出现了,看来解决问题的关键已经出现了。

下载文件名之后发现无后缀名,我们可以补上一个 .ttf 的后缀,接下来拖拽到 FontCreator 中,然后进行查阅。

二次刷新页面之后,再次获取一个 file 文件,查看二者是否有编码变化问题。

结论:每次请求字体文件,得到的响应无变化。

既然没有变化,后续的字体反爬实战编码就变的简单了。

实战编码 

解析字体文件,获取编码与字符。

from fontTools.ttLib import TTFont
font1 = TTFont('./fonts/file.ttf')
keys,values = [],[]
for k, v in font1.getBestCmap().items():
    print(k,v)

得到的结果如下所示:

2 extra bytes in post.stringData array
120 x
57345 uni4E00
57360 uni77
57403 uni56
……

然后我们查看一下实习僧站点返回的数据。

&#xf626&#xf395&#xf395-&#xf043&#xf395&#xf395

这其中又涉及到了编码的转换。

我们拿到一段带编码的文字,如下所示:

&#xedb3&#xe4d0&#xe4d0&#xedb3&#xe12a&#xeb3d销售实习&#xe595

接下来查看一下页面呈现的文字

SaaS软件销售实习生

其中 &#xedb3 对应的是 S 字符,再看一下该字符在字体文件中的编码,如下所示。

但是从刚才的结果中,并未得到 edb3 相关值,但是把十进制的编码进行转换之后,得到下述结果。

到此这篇关于Python字体反爬实战案例分享的文章就介绍到这了,更多相关Python字体反爬 内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python3 实现将bytes图片转jpg格式

    Python3 实现将bytes图片转jpg格式

    这篇文章主要介绍了Python3 实现将bytes图片转jpg格式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Python中bisect的用法及示例详解

    Python中bisect的用法及示例详解

    这篇文章主要介绍了Python中bisect的用法及示例详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • python如何停止递归

    python如何停止递归

    在本篇内容里小编给大家整理的是一篇关于python停止递归的方法和相关知识点,有兴趣的朋友们可以学习下。
    2020-09-09
  • 跟老齐学Python之啰嗦的除法

    跟老齐学Python之啰嗦的除法

    python 除法运算 比较奇怪,和别的程序语言不大一样。从Python2.2开始,除法运算符除了/之外,又引入了一个除法运算符://,后一种运算符只用于进行整除法。对于除法运算符/,默认时的行为跟Python2.2之前的一样,它视操作数而定,既可以进行整除,也可以进行真除法。
    2014-09-09
  • 一文读懂Python的’=='和’is’用法

    一文读懂Python的’=='和’is’用法

    探索Python世界的'=='与'is',一个看似简单却隐藏玄机的话题,本指南将带你轻松读懂它们背后的故事,解锁编程中的这道难题,开始我们的快速之旅,释放代码的潜能吧!
    2024-01-01
  • 如何创建一个Flask项目并进行简单配置

    如何创建一个Flask项目并进行简单配置

    这篇文章主要介绍了如何创建一个Flask项目并进行简单配置,帮助大家更好的理解和学习flask框架,感兴趣的朋友可以了解下
    2020-11-11
  • 11个Python3字典内置方法大全与示例汇总

    11个Python3字典内置方法大全与示例汇总

    这篇文章主要给大家介绍了11个Python3字典内置方法大全与示例的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-05-05
  • python实现二叉排序树

    python实现二叉排序树

    这篇文章主要介绍了python实现二叉排序树,
    2022-01-01
  • 详解使用python绘制混淆矩阵(confusion_matrix)

    详解使用python绘制混淆矩阵(confusion_matrix)

    这篇文章主要介绍了详解使用python绘制混淆矩阵(confusion_matrix),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • 比较两个numpy数组并实现删除共有的元素

    比较两个numpy数组并实现删除共有的元素

    这篇文章主要介绍了比较两个numpy数组并实现删除共有的元素,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-02-02

最新评论