dede3.1分页文字采集过滤规则详说(图文教程)续二

 更新时间:2007年04月03日 00:00:00   作者:  
稍微了解dede采集规则的朋友上篇内容完全可以略过,下面看看如何以静制动、以不变就万变地解决分页采集问题。
二、采集新目标

目标地址:
1、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/index.html
2、http://www.tiansou.net/Html/Y_CYFW/R_Gzzj/F_Gzjh/2007-2/9/20070209110903558.html
之所以选取两个目标页面,是因为以上的两个页面一个有分页,而另一个没有,并且在分页和全文取样部分有较大的差别。以下的说明是在为采集目标地址(首页)全部链接的基础上改动的,个别地方会显得蛇足,只为说明的方便。

目标文字部分头部代码1:


目标文字部分头部代码2:



通过比较不难发现,两个文字部分的开始采集部分能确定下来为描黑部分,开头部分好说,代码如下:
复制代码 代码如下:

              <TR>
                <TD height="8"></TD>
              </TR>
              <TR>
                <TD valign="top" class=Connet><p>

目标文尾及分页区域代码1:



目标文尾及分页区域代码2:



比较一下两个结尾,尽管想把第一个的结尾再往前提一点,但没法子,要考虑到全部链接的共同部分,就只好取描黑的部分了,这也给今后确定过滤规则添了点麻烦,这是后话。先把结尾部分确定了吧:
复制代码 代码如下:

</p>
                  </TD>
              </TR>

相关文章

  • php session的锁和并发

    php session的锁和并发

    这篇文章主要介绍了php session的锁和并发,与之相关的现象有请求阻塞、session数据丢失、session数据读不到的问题,感兴趣的小伙伴们可以参考一下
    2016-01-01
  • 一个非常实用的php文件上传类

    一个非常实用的php文件上传类

    这篇文章主要为大家详细介绍了一个非常实用的php文件上传类,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-07-07
  • PHP输出图像imagegif、imagejpeg与imagepng函数用法分析

    PHP输出图像imagegif、imagejpeg与imagepng函数用法分析

    这篇文章主要介绍了PHP输出图像imagegif、imagejpeg与imagepng函数用法,结合实例形式较为详细的分析了imagegif()、imagejpeg()、imagepng()和imagewbmp()函数的功能、参数含义及使用技巧,需要的朋友可以参考下
    2016-11-11
  • php中用memcached实现页面防刷新功能

    php中用memcached实现页面防刷新功能

    这篇文章主要介绍了php中用memcached实现页面防刷新功能,这是一个比较安全、稳定的防刷新方案,需要的朋友可以参考下
    2014-08-08
  • 解决phpmyadmin 乱码,支持gb2312和utf-8

    解决phpmyadmin 乱码,支持gb2312和utf-8

    解决phpmyadmin 乱码,支持gb2312和utf-8...
    2006-11-11
  • PHP排序算法之直接插入排序(Straight Insertion Sort)实例分析

    PHP排序算法之直接插入排序(Straight Insertion Sort)实例分析

    这篇文章主要介绍了PHP排序算法之直接插入排序(Straight Insertion Sort),结合实例形式较为详细的分析了直接插入排序算法的原理与实现技巧,需要的朋友可以参考下
    2018-04-04
  • 启用OPCache提高PHP程序性能的方法

    启用OPCache提高PHP程序性能的方法

    今天小编就为大家分享一篇关于启用OPCache提高PHP程序性能的方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • php输出图像的方法实例分析

    php输出图像的方法实例分析

    这篇文章主要介绍了php输出图像的方法,简单分析了php图像输出所涉及的常用函数并结合实例形式分析了php图像输出的具体实现方法,需要的朋友可以参考下
    2017-02-02
  • 如何理解PHP程序执行的过程原理

    如何理解PHP程序执行的过程原理

    本文主要介绍了PHP程序指定的过程原理。为了以后能开发PHP扩展,就一定要了解PHP的执行顺序。这篇文章就是为C开发PHP扩展做铺垫。
    2021-05-05
  • php简单计算年龄的方法(周岁与虚岁)

    php简单计算年龄的方法(周岁与虚岁)

    这篇文章主要介绍了php简单计算年龄的方法,通过自定义函数实现针对周岁与虚岁的简单计算功能,涉及php日期与时间相关操作技巧,需要的朋友可以参考下
    2016-12-12

最新评论