网站的反采集技术前一段时间同几个朋友聊起内容采集的事情,因为我从未涉足这个领域,就自以为可以找到一个方法来反采集,经过一段时间的研究,似乎是有办法做到的,不是说完全阻止采集,而是让采集的成本变高,或者让采集后的内容无法使用,或者说采集后的内容要花很多人工来分析,过滤。下面的方法,转自别人的文章,作者:翟振恺(小琦),我摘录了反采集的部分内容。一、分页文件名规则防采集对策大部分采集器都是靠分析分页文件名规则,进行批量、多页采集的。如果别人找不出你的分页文件的文件名规则,那么别人就无法对你的网站进行批量多页采集。实现方法:我认为用MD5加密分页文件名是一个比较好的方法,说到这里,有人会说,你用MD...
http://www.jb51.net//article/675.htm
共有:1/10,当前1/1页
[首页] [上一页]
1
[下一页] [尾页]
转到:
