python中django框架通过正则搜索页面上email地址的方法

 更新时间:2015年03月21日 12:39:55   作者:niuniu  
这篇文章主要介绍了python中django框架通过正则搜索页面上email地址的方法,涉及django框架及正则表达式的使用技巧,需要的朋友可以参考下

本文实例讲述了python中django框架通过正则搜索页面上email地址的方法。分享给大家供大家参考。具体实现方法如下:

import re
from django.shortcuts import render
from pattern.web import URL, DOM, abs, find_urls
def index(request):
 """
 find email addresses in requested url or contact page
 """
 error = ''
 emails = set()
 url_string = request.GET.get('url', '')
 EMAIL_REGEX = re.compile(r'[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,6}', re.IGNORECASE)
 # use absolute url or domain name
 url = URL(url_string) if url_string.startswith('http') else URL(domain=url_string,protocol='http')
 if url_string:
 try:
  dom = DOM(url.download(cached=True))
 except Exception, e:
  error = e
 else:
  contact_urls = { url.string }
  # search links of contact page
  for link in dom('a'):
  if re.search(r'contact|about', link.source, re.IGNORECASE):
   contact_urls.add(
   abs(link.attributes.get('href',''), base=url.redirect or url.string))
  for contact_url in contact_urls:
  # download contact page
  dom = DOM(URL(contact_url).download(cached=True))
  # search emails in the body of the page
  for line in dom('body')[0].content.split('\n'):
   found = EMAIL_REGEX.search(line)
   if found:
   emails.add(found.group())
 data = {
 'url': url_string,
 'emails': emails,
 'error': error,
 }
 return render(request, 'index.html', data)

PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:

JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript

正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg

希望本文所述对大家的Python程序设计有所帮助。

相关文章

  • Windows 下更改 jupyterlab 默认启动位置的教程详解

    Windows 下更改 jupyterlab 默认启动位置的教程详解

    这篇文章主要介绍了Windows 下更改 jupyterlab 默认启动位置,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-05-05
  • python写程序统计词频的方法

    python写程序统计词频的方法

    这篇文章主要介绍了python写程序统计词频的方法,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-07-07
  • Python快速排序算法实例分析

    Python快速排序算法实例分析

    这篇文章主要介绍了Python快速排序算法,简单说明了快速排序算法的原理、实现步骤,并结合具体实例分析了Python实现快速排序的相关操作技巧,需要的朋友可以参考下
    2017-11-11
  • Python面向对象编程(一)

    Python面向对象编程(一)

    本文详细讲解了Python的面向对象编程,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-05-05
  • 浅析Django接口版本控制

    浅析Django接口版本控制

    一个项目在升级迭代的时候,不会立马抛弃旧的版本,甚至会出现多个版本共存同时维护的情况,因此需要版本控制
    2021-06-06
  • 解决pycharm不能自动补全第三方库的函数和属性问题

    解决pycharm不能自动补全第三方库的函数和属性问题

    这篇文章主要介绍了解决pycharm不能自动补全第三方库的函数和属性问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • python des,aes,rsa加解密的实现

    python des,aes,rsa加解密的实现

    这篇文章主要介绍了python des,aes,rsa加解密的实现,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2021-01-01
  • Python编程求解二叉树中和为某一值的路径代码示例

    Python编程求解二叉树中和为某一值的路径代码示例

    这篇文章主要介绍了Python编程求解二叉树中和为某一值的路径代码示例,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • 基于Python制作一个恶搞代码

    基于Python制作一个恶搞代码

    这篇文章主要为大家详细介绍了如何基于Python和Tkinter制作一个恶搞代码--无限弹窗,每天写一些有趣的小程序,带你成为一个浪漫的程序员
    2023-08-08
  • Python小程序 控制鼠标循环点击代码实例

    Python小程序 控制鼠标循环点击代码实例

    这篇文章主要介绍了Python小程序 控制鼠标循环点击代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-10-10

最新评论