php结合正则批量抓取网页中邮箱地址

 更新时间:2015年05月19日 11:35:30   投稿:hebedich  
目前在做一个项目,需要提取一个小型网站的所有邮箱地址,度娘了一下,方法还挺多,这里给大家总结几个比较实用的,分享给大家。

php如何抓取网页中邮箱地址,下面我就给大家分享一个用php抓取网页中电子邮箱的实例。

<?php
  $url='https://www.jb51.net'; //要采集的网址 
  $content=file_get_contents($url);
  //echo $content;
  function getEmail($str) {
  //$pattern = "/([a-z0-9]*[-_\.]?[a-z0-9]+)*@([a-z0-9]*[-_]?[a-z0-9]+)+[\.][a-z]{2,3}([\.][a-z]{2})?/i";
  $pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/";
  preg_match_all($pattern,$str,$emailArr);
 
  return $emailArr[0];
  }
  print_r( getEmail($content));
  ?>

方法2:

<?php 
$url='https://www.jb51.net'; //当页已留邮箱
$content=file_get_contents($url);             //获取页面内容
function getEmail($str) {                 //匹配邮箱内容
$pattern = "/([a-z0-9\-_\.]+@[a-z0-9]+\.[a-z0-9\-_\.]+)/"; 
preg_match_all($pattern,$str,$emailArr); 
return $emailArr[0]; 
} 
print_r( getEmail($content)); 
?>

以上所述就是本文的全部内容了,希望大家能够喜欢。

相关文章

最新评论