基于Python实现抢注大词的提词工具

 更新时间:2023年02月28日 14:22:56   作者:虚坏叔叔  
这篇文章主要为大家详细介绍了如何利用Python语言实现抢注大词的提词工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下

假设通过爬虫获得了一个自媒体.txt

想要从这些关键词中提取流量最大的关键词

可以通过如下算法实现:

from smoothnlp.algorithm.phrase import extract_phrase
import re

class_name = '自媒体'
class_name_low = class_name.lower()
top_k = 100

with open('%s.txt' % class_name,'r',encoding='utf-8') as file:
	data_str = file.read()
	keyword_list = data_str.split('\n')

with open('dont.txt','r',encoding='utf-8') as file:
	dont_set = set(file.read().split('\n'))

word_count_dict = dict()
new_word_list = extract_phrase(keyword_list,top_k=top_k)
for new_word in new_word_list:
	if new_word in dont_set:
		continue
		
	new_word_low = new_word.lower()

	if class_name_low in new_word_low or class_name_low == new_word_low:
		word_count_dict[new_word] = len(re.findall(new_word_low,data_str))
		continue

	add_l = re.findall('%s%s' % (class_name_low,new_word_low),data_str)
	add_r = re.findall('%s%s' % (new_word_low,class_name_low),data_str)
	if len(add_l) >= len(add_r):
		word_count_dict['%s%s' % (class_name,new_word)] = len(add_l)
	else:
		word_count_dict['%s%s' % (new_word,class_name)] = len(add_r)

for word,count in word_count_dict.items():
	print('%s\t%s' % (word,count))

其中:

自媒体.txt 就是需要的关键词库

dont.txt 就是过滤掉一些没有用的词汇

获得的结果如下,下面的这些词就是流量很大的词汇 可以用于注册账号去获取流量

自媒体领域    702
自媒体软件    502
自媒体身份证    68
自媒体推荐    450
自媒体研究    199
自媒体素材    378
自媒体原创    1147
自媒体审核    417
浏览器自媒体    110
自媒体阅读量    378
自媒体app    346
自媒体工具    222
自媒体图片    416
自媒体电脑    112
自媒体管理    824
自媒体内容    1083
自媒体电视剧    48
自媒体申请    742
自媒体注册    1597
百度自媒体    545
自媒体同步    89
自媒体电影片段    14
自媒体检测    36
自媒体抄袭    130
自媒体选择    215
自媒体产品    105
自媒体信息    355
自媒体粉丝    474
自媒体下载    173
企业自媒体    789
自媒体收益    1296
自媒体数据    317
淘宝自媒体    263
自媒体手机    568
自媒体剪辑    367
自媒体电影    380
自媒体服务    167
自媒体采集    234
自媒体变现    246
自媒体修改    65
自媒体风险    43
中国自媒体    533
自媒体兼职    182
自媒体定位    143
自媒体英语    53
自媒体传播    776
抖音自媒体    686
自媒体渠道    212
自媒体影响力    130
0万粉丝自媒体    18
自媒体绑定    47
自媒体免费    205
自媒体认证    1662
自媒体流量    595
自媒体播放量    164
万粉丝自媒体    42
自媒体评论    116
自媒体邀请码    137
健康自媒体    96
自媒体问题    35
自媒体收入    826
自媒体垂直    129
自媒体招聘    665
自媒体奖励    26
自媒体教程    312
自媒体盈利模式    140
自媒体热点    104
自媒体标题    561
自媒体经营范围    20
自媒体意识形态    13
自媒体ppt    70
自媒体品牌    219
自媒体竞争    45
自媒体社会    235
自媒体现状    123
开通自媒体    219
2018自媒体    443
国外自媒体    350
自媒体公司    2862
自媒体介绍    311
自媒体生活    180
自媒体模式    56
自媒体故事    55
自媒体分析    168
自媒体策划    244
自媒体版权    123
自媒体推广    1893
自媒体考核    38
自媒体情况    32
自媒体搬运    958
音乐自媒体    337

最后的所有项目代码如下:

到此这篇关于基于Python实现抢注大词的提词工具的文章就介绍到这了,更多相关Python提词工具内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 利用Python批量循环读取Excel的技巧分享

    利用Python批量循环读取Excel的技巧分享

    这篇文章主要为大家详细介绍了何用Python批量循环读取Excel,文中的示例代码讲解详细,对我们的学习或工作有一定的帮助,感兴趣的可以了解一下
    2023-07-07
  • Python利用PySimpleGUI实现自制桌面翻译神器

    Python利用PySimpleGUI实现自制桌面翻译神器

    工作上经常需要与外国友人邮件沟通,奈何工作电脑没有安装有道词典一类的翻译软件,结合自己的需要,自己用PySimpleGUI撸一个桌面翻译神器,感兴趣的可以了解一下
    2022-09-09
  • 详解PyQt5 事件处理机制

    详解PyQt5 事件处理机制

    PyQt为事件处理提供了两种机制高级的信号与槽机制,以及低级的事件处理机制,这篇文章主要介绍了PyQt5 事件处理机制,需要的朋友可以参考下
    2022-11-11
  • python内置模块之上下文管理contextlib

    python内置模块之上下文管理contextlib

    这篇文章介绍了python内置模块之上下文管理contextlib,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-06-06
  • 安装python3的时候就是输入python3死活没有反应的解决方法

    安装python3的时候就是输入python3死活没有反应的解决方法

    下面小编就为大家分享一篇安装python3的时候就是输入python3死活没有反应的解决方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-01-01
  • 用python打开摄像头并把图像传回qq邮箱(Pyinstaller打包)

    用python打开摄像头并把图像传回qq邮箱(Pyinstaller打包)

    这篇文章主要介绍了用python打开摄像头并把图像传回qq邮箱,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-05-05
  • Python变量的定义和运算符的使用

    Python变量的定义和运算符的使用

    这篇文章主要介绍了Python变量的定义和运算符的使用,Python和C/Java不同,在定义变量的时候不需要显示的指定变量的类型,在赋值的时候自动就会确定类型,需要的朋友可以参考下
    2023-05-05
  • 树莓派安装OpenCV3完整过程的实现

    树莓派安装OpenCV3完整过程的实现

    这篇文章主要介绍了树莓派安装OpenCV3完整过程的实现,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-10-10
  • Python强大邮件处理库Imbox安装及用法示例

    Python强大邮件处理库Imbox安装及用法示例

    这篇文章主要给大家介绍了关于Python强大邮件处理库Imbox安装及用法的相关资料,Imbox是一个Python 库,用于从IMAP邮箱中读取邮件,它提供了简单易用的接口,帮助开发者处理邮件,需要的朋友可以参考下
    2024-03-03
  • Python内置的字符串处理函数详细整理(覆盖日常所用)

    Python内置的字符串处理函数详细整理(覆盖日常所用)

    Python内置的字符串处理函数整理,有字母处理、格式化相关、字符串搜索相关、字符串替换相关等等
    2014-08-08

最新评论