phpQuery采集网页实现代码实例

 更新时间:2020年04月02日 11:02:23   作者:白眉少侠  
这篇文章主要介绍了phpQuery采集网页实现代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

前言

  平时开发中可能遇到一个问题。采集网页,小偷程序等等。各种花式秀正则的话,虽然能体现出geek,但是我觉得做事却不够优雅。采集到的网页说白了也是DOM,jQuery各种优雅地获取节点。幸好,有这个类库,帮我们解决了这个,那就是phpQuery.

为什么使用phpQuery

phpQuery是基于php5新添加的DOMDocument。而DOMDocument则是专门用来处理html/xml。它提供了强大的xpath选择器及其他很多html/xml操作函数,使得处理html/xml起来非常方便。

尤其对于新手,看到一堆”不知所云”的字符评凑在一起,有种脑袋都要炸了的感觉。如果要分离的对象没有太明显的特征,正则写起来更是麻烦。

学习成本低,jQuery是PHP程序员的标配,那么懂jQuery的话,是可以无缝衔接的,学习成本几乎为0。选择器,节点,节点信息,over

下载地址

https://code.google.com/archive/p/phpquery/downloads(需要翻墙,或者自行百度phpQuery)

实验

  既然开始了,那么就做个实验,比如我们要获取SF的所有标签名称https://segmentfault.com/tags,审查元素,得到部分标签属性。<a class="tag" data-original-title="负载均衡">负载均衡</a>

Demo

<?php
  
  require("phpQuery.php");//导入phpQuery库
  $html   = phpQuery::newDocumentFile("https://segmentfault.com/tags");
  $hrefList = pq(".tag"); //获取标签为a的所有对象$(".tag")

  foreach ($hrefList as $href) {
    echo $href->getAttribute("data-original-title"),"<br>";
  }

结果

总结

0.网页采集真特么无脑暴力,成功绕过恶心的正则

1.写法参照jQuery

2.体会Dom的思想

3.此类库并非万金油,更适合网页采集

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • PHP parse_ini_file函数的应用与扩展操作示例

    PHP parse_ini_file函数的应用与扩展操作示例

    这篇文章主要介绍了PHP parse_ini_file函数的应用与扩展操作,结合实例形式分析了php扩展parse_ini_file函数解析配置文件相关操作技巧,需要的朋友可以参考下
    2019-01-01
  • PHP的cookie与session原理及用法详解

    PHP的cookie与session原理及用法详解

    这篇文章主要介绍了PHP的cookie与session原理及用法,结合实例形式详细分析了cookie与session的原理及php操作cookie与session的相关注意事项,需要的朋友可以参考下
    2019-09-09
  • 如何让PHP编码更加好看利于阅读

    如何让PHP编码更加好看利于阅读

    在本篇文章里小编给大家分享了关于如何让PHP编码更加好看利于阅读的方法和习惯,需要的朋友们可以学习下。
    2019-05-05
  • php的curl实现get和post的代码

    php的curl实现get和post的代码

    类似于dreamhost这类主机服务商,是显示fopen的使用的。使用php的curl可以实现支持FTP、FTPS、HTTP HTPPS SCP SFTP TFTP TELNET DICT FILE和LDAP。
    2008-08-08
  • php 文本文件的读取效率

    php 文本文件的读取效率

    一直鼓捣着想把博客的首页存在文件里,结果存在文件里,博客更新时再重新将内容再次写入到这个文件。所以刚才测试了三种读取文本的常规方法
    2012-02-02
  • PHP设计模式之装饰者模式

    PHP设计模式之装饰者模式

    装饰者模式动态地将责任附加到对象上。若要扩展功能,装饰者提供了比继承更有弹性的替代方案
    2012-02-02
  • PHP中定义数组常量(array常量)的方法

    PHP中定义数组常量(array常量)的方法

    这篇文章主要介绍了PHP中定义数组常量(array常量)的方法,本文在类中使用了const关键字和eval()函数来实现,需要的朋友可以参考下
    2014-11-11
  • PHP小技巧之函数重载

    PHP小技巧之函数重载

    php 作为一种弱类型语言,本身不能像强类型如java ,c++那样,直接的实现重载。不过可以通过一些方法,间接的实现重载。
    2014-06-06
  • php实现多站点共用session实现单点登录的方法详解

    php实现多站点共用session实现单点登录的方法详解

    这篇文章主要介绍了php实现多站点共用session实现单点登录的方法,结合实例形式详细分析了php多站点共用seeion实现单点登录相关原理及操作注意事项,需要的朋友可以参考下
    2019-09-09
  • 神盾加密解密教程(一)PHP变量可用字符

    神盾加密解密教程(一)PHP变量可用字符

    这篇教程首先讲PHP变量可用字符,是因为要解密神盾加密的程序,了解PHP变量可用字符是解密的首要条件,好了,废话不多说,直接进入正题
    2014-05-05

最新评论