php file_get_contents函数轻松采集html数据

 更新时间:2010年04月22日 23:42:07   作者:  
PHP手册里是这么解释的:file_get_contents — 将整个文件读入一个字符串,于是可以很容易的获取其他站的信息,再用正则加以变换,再做一些判断和设定,就OK了,不多说了,放代码,我基本都做了解释的。
复制代码 代码如下:

<?php
//全国,判断条件是$REQUEST_URI是否含有html
if (!strpos($_SERVER["REQUEST_URI"],".html"))
{
$page="http://qq.ip138.com/weather/";
$html = file_get_contents($page,'r');
$pattern="/<B>全国主要城市、县当天和未来五天天气趋势预报在线查询<\/B>(.*?)<center style=\"padding\:3px\">/si";
//正则匹配之间的html
preg_match($pattern,$html,$pg);
echo "";
//正则替换远程地址为本地地址
$p=preg_replace('/\/weather\/(\w+)\/index.htm/', 'tq.php/$1.html', $pg[1]);
echo $p;
}
//省,判断条件是$REQUEST_URI是否含有?
else if(!strpos($_SERVER["REQUEST_URI"],"?")){
//yoyo推荐的使用分割获得数据,这里是获得省份名称
$province=explode("/",$_SERVER["REQUEST_URI"]);
$province=explode(".",$province[count($province)-1]);
$province=$province[0];
//被注释掉的是我自己写出来的正则,感觉写的不好,但效果等同上面
//preg_match('/[^\/]+[\.(html)]$/',$_SERVER["REQUEST_URI"],$pro);
//$province=preg_replace('/\.html/','',$pro[0]);
$page="http://qq.ip138.com/weather/".$province."/index.htm";
//获取html数据之前先尝试打开页面,防止恶意输入地址导致出错
if (!@fopen($page, "r")) {
die("对不起,该地址不存在!<a href=javascript:history.back(1)>点击这里返回</a>");
exit(0);
}
$html = file_get_contents($page,'r');
$pattern="/五天天气趋势预报<\/B>(.*?)请输入输入市/si";
preg_match($pattern,$html,$pg);
echo "";
//正则替换,获取省份,城市
$p=preg_replace('/\/weather\/(\w+)\/(\w+).htm/', '$2.html?pro=$1', $pg[1]);
echo $p;
}
else {
//市,通过get传递省份
$pro=$_REQUEST['pro'];
$city=explode("/",$_SERVER["REQUEST_URI"]);
$city=explode(".",$city[count($city)-1]);
$city=$city[0];
//preg_match('/[^\/]+[\.(html)]+[\?]/',$_SERVER["REQUEST_URI"],$cit);
//$city=preg_replace('/\.html\?/','',$cit[0]);
$page="http://qq.ip138.com/weather/".$pro."/".$city.".htm";
if (!@fopen($page, "r")) {
die("对不起,该地址不存在!<a href=javascript:history.back(1)>点击这里返回</a>");
exit(0);
}
$html = file_get_contents($page,'r');
$pattern="/五天天气趋势预报<\/B>(.*?)请输入输入市/si";
preg_match($pattern,$html,$pg);
echo "";
//获取真实的图片地址
$p=preg_replace('/\/image\//', 'http://qq.ip138.com/image/', $pg[1]);
echo $p;
}
?>

相关文章

  • thinkphp模板用法和内容输出实例

    thinkphp模板用法和内容输出实例

    这篇文章主要介绍了thinkphp模板用法和内容输出,以实例形式分析了模板的常见用法与使用过程中经常遇到的问题以及内容输出的各种技巧,对于ThinkPHP开发具有一定的参考借鉴价值,需要的朋友可以参考下
    2014-11-11
  • Ubuntu下如何升级到PHP7.4的方法步骤

    Ubuntu下如何升级到PHP7.4的方法步骤

    这篇文章主要介绍了Ubuntu下如何升级到PHP7.4的方法步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-12-12
  • 完美解决Thinkphp3.2中插入相同数据的问题

    完美解决Thinkphp3.2中插入相同数据的问题

    下面小编就为大家带来一篇完美解决Thinkphp3.2中插入相同数据的问题。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-08-08
  • 浅谈discuz密码加密的方式

    浅谈discuz密码加密的方式

    这篇文章主要介绍了discuz密码加密的方式,需要的朋友可以参考下
    2014-05-05
  • Laravel获取当前请求的控制器和方法以及中间件的例子

    Laravel获取当前请求的控制器和方法以及中间件的例子

    今天小编就为大家分享一篇Laravel获取当前请求的控制器和方法以及中间件的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-10-10
  • PHP实现微信小程序人脸识别刷脸登录功能

    PHP实现微信小程序人脸识别刷脸登录功能

    本文通过实例代码给大家讲解了基于PHP实现微信小程序人脸识别刷脸登录功能,感兴趣的朋友跟随脚本之家小编一起学习吧
    2018-05-05
  • 浅谈thinkphp5 instance 的简单实现

    浅谈thinkphp5 instance 的简单实现

    本篇文章主要介绍了浅谈thinkphp5 instance 的简单实现,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-07-07
  • 使用PHP抓取微博数据实现demo及原理解析

    使用PHP抓取微博数据实现demo及原理解析

    这篇文章主要为大家介绍了使用PHP抓取微博数据实现demo及原理解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-05-05
  • 利用Laravel生成Gravatar头像地址的优雅方法

    利用Laravel生成Gravatar头像地址的优雅方法

    Gravatar是一图像跟随著您到访过的网站,当您在博客中留言或发表文章,它将会出现在您的名称旁。下面这篇文章主要给大家介绍了关于利用Laravel如何生成 Gravatar 头像地址的优雅方法,需要的朋友可以参考下。
    2017-12-12
  • 一篇文章弄懂PHP和HTML的嵌套写法

    一篇文章弄懂PHP和HTML的嵌套写法

    虽然HTML标签有很多,并且我们在制作页面的时候可以无限的嵌套,但是嵌套也有规则,不能随意的嵌套,这篇文章主要给大家介绍了如何通过一篇文章弄懂PHP和HTML的嵌套写法,需要的朋友可以参考下
    2021-07-07

最新评论