Python smallseg分词用法实例分析
更新时间:2015年05月28日 12:14:53 作者:imzoer
这篇文章主要介绍了Python smallseg分词用法,以实例形式分析了Python实现分析的相关技巧,需要的朋友可以参考下
本文实例讲述了Python smallseg分词用法。分享给大家供大家参考。具体分析如下:
#encoding=utf-8 #import psyco #psyco.full() words = [x.rstrip() for x in open("main.dic",mode='r',encoding='utf-8') ] from smallseg import SEG seg = SEG() print('Load dict...') seg.set(words) print("Dict is OK.") def cuttest(text): wlist = seg.cut(text) wlist.reverse() tmp = " ".join(wlist) print(tmp) print("================================") if __name__=="__main__": cuttest("这是一个伸手不见五指的黑夜。我爱Python和C++。") cuttest("我不喜欢黑夜。") cuttest("回归人间。") cuttest("技术性器件的安装工作") cuttest("我需要租房") cuttest("服装饰品有限公司") cuttest("我爱美食") cuttest("abc") cuttest("马尔可夫") cuttest("这是个好网站") cuttest("“Microsoft”一词由“MICROcomputer(微型计算机)”和“SOFTware(软件)”两部分组成") cuttest("今年的流行词汇是什么") cuttest("总店") cuttest("中国科学院计算技术研究所") cuttest("罗密欧与朱丽叶") cuttest("我购买了道具和服装")
smallseg分词,在python3.3上运行稍微有些问题。py代码xrange在3.*中已经改名字为range了。另外,3.*中也没有decode函数了。
修改了上面的两个地方,代码就可移植性了。效果还可以。
希望本文所述对大家的Python程序设计有所帮助。
相关文章
python实现单目标、多目标、多尺度、自定义特征的KCF跟踪算法(实例代码)
这篇文章主要介绍了python实现单目标、多目标、多尺度、自定义特征的KCF跟踪算法,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下2020-01-01
最新评论