使用Python计算两个不同列表的相似度

 更新时间:2023年07月28日 08:51:33   作者:袁袁袁袁满  
这篇文章主要介绍了使用Python计算两个不同列表的相似度,Python数据开发工作中的需求两个不同列表给出相似度,本文实现判断数字类型相似度和字符串类型相似度,非常实用,需要的朋友可以参考下

数字类型相似度

可以使用余弦相似度来计算两个列表的相似度。

具体步骤如下:

  1. 将两个列表转化为向量形式,即将列表中的元素作为向量的分量。
  2. 计算向量的点积。
  3. 计算向量的模长。
  4. 计算余弦值。
  5. 将余弦值作为相似度。

Python代码实现:

import math
def cosine_similarity(list1, list2):
    dot_product = sum([list1[i]*list2[i] for i in range(len(list1))])
    norm1 = math.sqrt(sum([x**2 for x in list1]))
    norm2 = math.sqrt(sum([x**2 for x in list2]))
    similarity = dot_product / (norm1 * norm2)
    return similarity
# 示例
list1 = [1, 2, 3, 4, 5]
list2 = [3, 4, 5, 6, 7]
similarity = cosine_similarity(list1, list2)
print(similarity)

输出结果为:

0.9970544855015815

表示两个列表的相似度很高。

字符串类型相似度

可以使用Jaccard相似度来计算两个字符串列表的相似度。

Jaccard相似度是通过计算两个集合的交集与并集之比来衡量它们的相似程度。具体步骤如下:

  1. 将两个列表转化为集合形式,即将列表中的元素作为集合的元素。
  2. 计算两个集合的交集。
  3. 计算两个集合的并集。
  4. 计算交集与并集之比。
  5. 将比值作为相似度。

Python代码实现:

def jaccard_similarity(list1, list2):
    set1 = set(list1)
    set2 = set(list2)
    intersection = len(set1.intersection(set2))
    union = len(set1.union(set2))
    similarity = intersection / union
    return similarity
# 示例
list1 = ['apple', 'banana', 'orange']
list2 = ['apple', 'pear', 'peach']
similarity = jaccard_similarity(list1, list2)
print(similarity)

输出结果为:

0.25

表示两个字符串列表的相似度较低。

到此这篇关于使用Python计算两个不同列表的相似度的文章就介绍到这了,更多相关Python计算列表相似度内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • jupyter的安装与使用以及运行卡顿问题及解决

    jupyter的安装与使用以及运行卡顿问题及解决

    这篇文章主要介绍了jupyter的安装与使用以及运行卡顿问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-06-06
  • pytest自定义命令行参数的实现

    pytest自定义命令行参数的实现

    本文主要介绍了在使用pytest运行测试用例时,通过传递自定义命令行参数来启动mitmdump进程进行抓包,具有一定的参考价值,感兴趣的可以了解一下
    2024-12-12
  • 获取CSDN文章内容并转换为markdown文本的python

    获取CSDN文章内容并转换为markdown文本的python

    这篇文章主要介绍了自己写的小工具,可以直接获取csdn文章并转换为markdown格式,需要的朋友可以参考下
    2020-09-09
  • python 实现的车牌识别项目

    python 实现的车牌识别项目

    这篇文章主要介绍了python 实现的车牌识别项目,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2021-01-01
  • Python GUI实现PDF转Word功能

    Python GUI实现PDF转Word功能

    这篇文章主要介绍了如何使用 wxPython 创建一个简单的图形用户界面(GUI)应用程序,结合 pdf2docx 库,实现将 PDF 转换为 Word 文档的功能,需要的可以参考下
    2024-12-12
  • 使用wxPython和ECharts实现生成和保存HTML图表

    使用wxPython和ECharts实现生成和保存HTML图表

    wxPython是一个基于wxWidgets的Python GUI库,ECharts是一个用于数据可视化的JavaScript库,本文主要为大家介绍了如何使用wxPython和ECharts库来生成和保存HTML图表,感兴趣的可以学习一下
    2023-08-08
  • python列表的特点分析

    python列表的特点分析

    在本篇文章里小编个大家整理的是一篇关于python列表的特点分析内容总结,有需要的朋友们可以学习下。
    2021-08-08
  • Python tornado上传文件的功能

    Python tornado上传文件的功能

    这篇文章主要介绍了Python tornado上传文件的功能,代码分为普通上传和ajax上传,通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • 基于Python实现身份证信息识别功能

    基于Python实现身份证信息识别功能

    身份证是用于证明个人身份和身份信息的官方证件,在现代社会中,身份证被广泛应用于各种场景,如就业、教育、医疗、金融等,它包含了个人的基本信息,本文给大家介绍了如何基于Python实现身份证信息识别功能,感兴趣的朋友可以参考下
    2024-01-01
  • 关于numpy中np.nonzero()函数用法的详解

    关于numpy中np.nonzero()函数用法的详解

    下面小编就为大家带来一篇关于numpy中np.nonzero()函数用法的详解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-02-02

最新评论