python去除所有html标签的方法

 更新时间:2015年05月05日 12:33:07   作者:令狐不聪  
这篇文章主要介绍了python去除所有html标签的方法,涉及Python正则替换的相关技巧,非常简单实用,需要的朋友可以参考下

本文实例讲述了python去除所有html标签的方法。分享给大家供大家参考。具体分析如下:

这段代码可以用于去除文本里的字符串标签,不包括标签里面的内容

import re
html='<a href="https://www.jb51.net">脚本之家</a>,Python学习!'
dr = re.compile(r'<[^>]+>',re.S)
dd = dr.sub('',html)
print(dd)

运行结果如下:

脚本之家,Python学习!

希望本文所述对大家的Python程序设计有所帮助。

相关文章

最新评论