批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)

 更新时间:2021年09月15日 11:21:56   作者:CrLf  
这篇文章主要介绍了批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数),需要的朋友可以参考下

请问批处理可以统计词频吗?
4字一行,只统计4字词组出现的频率。
如:

一丘之貉
一丝不挂
一丝不苟
一事无成
一亲对老
一分身又
一叶知秋
一叶知秋
一叶障目
一叶障目
一往无前
一往无前
一往无前

实现如下:

一丘之貉 1
一丝不挂 1
一丝不苟 1
一事无成 1
一亲对老 1
一分身又 1
一叶知秋 2
一叶障目 2
一往无前 3

解决代码

@echo off & setlocal enabledelayedexpansion
for /f "delims=" %%a in ('type "测试.txt"') do set /a "#%%a#+=1"
for /f "tokens=1* delims=#=" %%a in ('set #') do echo %%a %%b
pause

win7以上系统

powershell -c "gc '测试.txt'|group $_|%%{$_.name+' '+$_.count}"
pause

到此这篇关于批处理统计词频实现代码(统计重复行的数量/每行重复出现的次数)的文章就介绍到这了,更多相关bat统计词频内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

最新评论