Python实现Web指纹识别实例

 更新时间:2023年10月31日 11:39:23   作者:微软技术栈  
这篇文章主要来带大家探索Web指纹识别:了解主流识别方式,从标题到指纹读取网站信息的简单方法,揭秘Web指纹识别 关键字、哈希和URL的魔力

web主流的识别方式

在当今的Web安全行业中,识别目标网站的指纹是渗透测试的常见第一步。指纹识别的目的是了解目标网站所使用的技术栈和框架,从而进一步根据目标框架进行针对性的安全测试,指纹识别的原理其实很简单,目前主流的识别方式有下面这几种。

  • 识别特定网页中的关键字,比对关键字识别框架:这种方式通过在目标网页的HTML、CSS、JavaScript代码中搜索特定的关键字或标识,比对这些关键字与已知框架的特征进行识别。例如,如果在网页中发现了特定的JavaScript函数、CSS类名或HTML标签,可以推断目标网站所使用的框架或库,如jQuery、AngularJS等。
  • 通过计算特定的相对独立页面的哈希值,比对实现鉴别:这种方式将目标网页的内容进行哈希计算,生成一个唯一的哈希值,并与已知框架的页面哈希值进行比对。如果目标网页的哈希值与某个框架的哈希值匹配,则可以推断目标网站所使用的框架。这种方法适用于那些在不同页面间保持相对稳定的框架,例如单页应用(SPA)。
  • 通过指定URL的TAG模式,鉴别目标容器类型:这种方式通过分析目标网站的URL结构或特定的URL参数,来推断目标网站所使用的容器类型或框架。例如,如果URL中包含特定的路径或参数,可以推断目标网站可能是基于某个特定容器,如WordPress、Drupal等。这种方式常用于识别内容管理系统(CMS)或其他特定的应用程序。

这些指纹识别方式都是通过分析目标网站的特定特征或行为,从中推断所使用的框架或技术。它们可以帮助渗透测试人员了解目标网站的技术栈和框架,从而进行针对性的安全测试和漏洞扫描。本节内容中我们将采用第二种方式通过哈希鉴定来确定目标指纹信息,此种方法需要有完善的特征库,这些库我们可以自行寻找制作,也可以使用已有的库经过转换后获取。

读取到该目标网站的标题信息

在实现指纹识别之前,我们先要尝试读取到该目标网站的标题信息,该功能实现非常简单,只需要读入页面,并依次取出所需要的"Date","Server","X-Powered-By","title"字段即可,由于代码较为简单此处就直接放出代码部分。

import re,socket,threading,requests
import argparse
header = {'user-agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) LySharkTools'}
def GetIPAddress(domain):
    try:
        url = str(domain.split("//")[1])
        sock = socket.getaddrinfo(url,None)
        result = re.findall("(?:[0-9]{1,3}\.){3}[0-9]{1,3}", str(sock[0][4]))
        return str(result[0])
    except Exception:
        pass
def GetServerTitle(url):
    try:
        address = GetIPAddress(url)
        Respon = requests.get(url=url,headers=header,timeout=5)
        print("--" * 80)
        print(url + "   ",end="")
        print(address + "   ", end="")
        if Respon.status_code == 200:
            RequestBody = [item for item in Respon.headers]
            for item in ["Date","Server","X-Powered-By"]:
                if item in RequestBody:
                    print(Respon.headers[item] + "   ",end="")
            title = re.findall("<title>.*</title>", Respon.content.decode("utf-8"))
            print(title)
    except Exception:
        pass
if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("-f","--file",dest="file",help="")
    args = parser.parse_args()
    # 使用方法: main.py -f url.log
    if args.file:
        fp = open(args.file,"r")
        for item in fp.readlines():
            url = item.replace("\n","")
            thread = threading.Thread(target=GetServerTitle,args=(url,))
            thread.start()
    else:
        parser.print_help()

这段代码在运行时读者需要准备好需要获取的网站列表,并每行一列放入url.log文件中,通过运行如下图所示的命令即可依次读取到这些网站的服务器信息;

调用MD5算法计算出该页面的HASH值并比对

我们继续实现指纹识别功能,首先利用Requests库将目标页面读入到字符串中,然后调用MD5算法计算出该页面的HASH值并比对,由于特定框架中总是有些页面不会变动,我们则去校验这些页面的HASH值,即可实现对框架的识别,代码很简单这里就直接放出源代码。

import requests
import os,sys,hashlib
import argparse
headers = {'user-agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) LySharkTools'}
def CheckFinger(url,flag,keyworld):
    if flag == 0:
        ret = requests.get(url=url,headers=headers,timeout=1)
        text = ret.text
        md5=hashlib.md5()
        md5.update(text.encode('utf-8'))
        print("目标网页Hash值:  {}".format(md5.hexdigest()))
    else:
        fp = open(keyworld,"r")
        for i in fp.readlines():
            path = url + eval(i.replace("\n", ""))["Path"]
            hash = eval(i.replace("\n", ""))["Hash"]
            web = eval(i.replace("\n", ""))["WebServer"]
            ret = requests.get(url=path, headers=headers, timeout=1)
            if ret.status_code == 200:
                text = ret.text
                md5 = hashlib.md5()
                md5.update(text.encode('utf-8'))
                if md5.hexdigest() == hash:
                    print("目标Hash:{}  CMS页面类型:{} ".format(hash,web))
                else:
                    continue
if __name__ == "__main__":
    parser = argparse.ArgumentParser()
    parser.add_argument("--mode",dest="mode",help="设置检查类型 [check/get]")
    parser.add_argument("-u","--url",dest="url",help="指定需要检测的网站地址")
    parser.add_argument("-f","--file",dest="file",help="指定字典数据库 data.json")
    args = parser.parse_args()
    if args.mode == "get" and args.url:
        CheckFinger(args.url,0,args.file)
    # 检测目标容器类型: main.py --mode=check -u https://www.xxx.com -f data.json
    elif args.mode == "check" and args.url and args.file:
        CheckFinger(args.url,1,args.file)
    else:
        parser.print_help()

这段代码通过使用get方法可获取到特定页面的hash值,例如获取www.lyshark.com网站特定路径的hash值,则可以执行如下命令;

当获取到这些特征后,我们就可以新建database.db文件,并将这些数据保存为特定的格式,如下所示;

{"Path":"/about/index.html","Hash": "9e69dd111c6cc873a1f915ca1a331b06","WebServer":"hexo"}
{"Path":"/index.php","Hash": "2457dd111c6cc32461f915ca17789b06","WebServer":"typecho"}
{"Path":"/index.html","Hash": "7530893af83150dc07461f4bc4cc0de6","WebServer":"oss"}

当特征库完整时,即可使用-f指定特征文件,循环获取是否匹配特征,从而判断web容器使用了那种容器。

以上就是 Python 实现Web指纹识别的详细内容,更多关于 Python Web指纹识别的资料请关注脚本之家其它相关文章!

相关文章

  • Python retrying 重试机制的使用方法

    Python retrying 重试机制的使用方法

    我们在程序开发中,经常会需要请求一些外部的接口资源,而且我们不能保证每次请求一定会成功,所以这些涉及到网络请求的代码片段就需要加上重试机制。本文就来详细的介绍一下,感兴趣的可以了解一下
    2021-09-09
  • Python使用matplotlib 画矩形的三种方式分析

    Python使用matplotlib 画矩形的三种方式分析

    这篇文章主要介绍了Python使用matplotlib 画矩形的三种方式,结合实例形式分析了Python基于matplotlib绘制矩形的具体实现方法与相关操作注意事项,需要的朋友可以参考下
    2019-10-10
  • pytorch  RNN参数详解(最新)

    pytorch  RNN参数详解(最新)

    这篇文章主要介绍了pytorch  RNN参数详解,这个示例代码展示了如何使用 PyTorch 定义和训练一个 LSTM 模型,并详细解释了每个类和方法的参数及其作用,需要的朋友可以参考下
    2024-06-06
  • 好的Python培训机构应该具备哪些条件

    好的Python培训机构应该具备哪些条件

    python是现在开发的热潮,大家应该如何学习呢?许多人选择自学,还有人会选择去培训结构学习,那么好的培训机构的标准是什么样的呢?下面跟随脚本之家小编一起通过本文学习吧
    2018-05-05
  • python绘制散点图详细步骤(从0到1必会)

    python绘制散点图详细步骤(从0到1必会)

    这篇文章主要介绍了如何使用Python绘制散点图,包括导入包、准备数据、绘制图像、修饰图像(添加标题、坐标轴标签、颜色图例)以及整合所有代码,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-12-12
  • Python解释器及PyCharm工具安装过程

    Python解释器及PyCharm工具安装过程

    这篇文章主要介绍了Python解释器和python 开发工具PyCharm安装过程,本文通过图文并茂的形式给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • python简单分割文件的方法

    python简单分割文件的方法

    这篇文章主要介绍了python简单分割文件的方法,涉及Python针对文件的读取与写入技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-07-07
  • python如何在终端里面显示一张图片

    python如何在终端里面显示一张图片

    这篇文章主要为大家详细介绍了python如何在终端里面显示一张图片的方法,感兴趣的小伙伴们可以参考一下
    2016-08-08
  • python3实现zabbix告警推送钉钉的示例

    python3实现zabbix告警推送钉钉的示例

    今天小编就为大家分享一篇python3实现zabbix告警推送钉钉的示例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • np.zeros()函数的使用方法

    np.zeros()函数的使用方法

    本文主要介绍了np.zeros()函数的使用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02

最新评论