从前面的我讲的采集原理大家可以看出,绝大多数采集程序都是靠分析规则来进行采集的,如分析分页文件名规则、分析页面代码规则。 一、分页文件名规则防采集对策 大部分采集器都是靠分析分页文件名规则,进行批量、多页采集的。如果别人找不出你的分页文件的文件名规则,那么别人就无法对你的网站进行批量多页采集。 实现方法: 我认为用MD5加密分页文件名是一个比较好的方法,说到这里,有人会说,你用MD5加密分页文件名,别人根据此规则...
http://www.jb51.net//article/492.htm
目前防采集的方法有很多种,先介绍一下常见防采集策略方法和它的弊端及采集对策:一、判断一个IP在一定时间内对本站页面的访问次数,如果明显超过了正常人浏览速度,就拒绝此IP访问 弊端: 1、此方法只适用于动态页面,如:asp\jsp\php等...静态页面无法判断某个IP一定时间访问本站页面的次数。 2、此方法会严重影响搜索引擎蜘蛛对其收录,因为搜索引擎蜘蛛收录时,浏览速度都会比较快而且是多线程。此方法也会拒绝搜索引擎蜘蛛收录站内文件 采集对策:只能放慢采集速度,...
http://www.jb51.net//article/491.htm
采集原理: 采集程序的主要步骤如下: 一、获取被采集的页面的内容 二、从获取代码中提取所有用的数据 一、获取被采集的页面的内容 我目前所掌握的ASP常用获取被采集的页面的内容方法: 1、用serverXMLHTTP组件获取数据FunctionGetBody(weburl) ’-----------------翟振恺(小琦) ’创建对象 &n...
http://www.jb51.net//article/490.htm
[html]<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head><meta http-equiv="Content-Type" content="text/html; charset=gb2312"><title>filter(css滤镜)</title><style type="text/css">body&nbs...
http://www.jb51.net//article/484.htm
[html]<SCRIPTlanguage=JavaScript><!--<!--varspeed=100varpause=1000vartimerID=nullvarbannerRunning=falsevarar=newArray()ar[0]="严谨求实开拓创新"ar[1]="敬业爱生博采求精"varcurrentMessage=0varoffset=0functionstopBanner(){if(bannerRunning)clearTimeout(timerID)bannerRunning=false}functionstartBanner(){stopBa...
http://www.jb51.net//article/471.htm
最近在做项目的时候,客户要求表格里的数据可以拖选,于是用JS写了个下面的方法。支持IE、FIREFOX等浏览器。实现对整行、整列数据的选取,全选、反选、清除,在数据表格内拖拉出的矩形范围的单元格数据全选。PS:1.如果数据单元格没有数据,请将ID设为空或去掉ID,样式为"inactive".则选择时会跳过此单元格。2.如果不想某个单元格被选,请将class设为“bg_green”,则选择时会跳过此单元格。[html]<!DOCTYPEHTMLPUBLIC"-//W3C//DTDHTML4.01Transitional//EN""http://www.w3.org/TR/html4/loo...
http://www.jb51.net//article/457.htm
[html]<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"><HTML><HEAD><TITLE> New Document </TITLE><META NAME="Generator" CONTENT="EditPlus"><META NAME="Author" CONTENT=""><META&nb...
http://www.jb51.net//article/381.htm
很无聊的把n个滤镜堆在一起就成了下面这个效果,呵呵IE5.5+ Only[html]<style>#pp00 { width:950px; height:256px; position:absolute; left:10px; top:0px; background-color:#00006...
http://www.jb51.net//article/377.htm
[code]<?php class html { var $dir; //dir for the htmls(without/) var $rootdir; //root of html files(without/):html...
http://www.jb51.net//article/355.htm
思路 1.利用如Dw-Mx这样的工具生成html格式的模板,在需要添加格式的地方加入特殊标记(如$htmlformat$),动态生成文件时利用代码读取此模板,然后获得前台输入的内容,添加到此模板的标记位置中,生成新文件名后写入磁盘,写入后再向数据库中写入相关数据。 2.使用后台代码硬编码Html文件,可以使用HtmlTextWriter类来写html文件。 优点 1.可以建立非常复杂的页面,利用包含js文件的方法,在js文件内加入document.write()方法可以在所有页面内加入如页面头,广告等内容。 2.静态html文件利用MSWindows2000的Inde...
http://www.jb51.net//article/314.htm
ASP生成静态网页的方法 随着网站访问量的加大,每次从数据库读取都是以效率作为代价的,很多用ACCESS作数据库的更会深有体会,静态页加在搜索时,也会被优先考虑。互联网上流行的做法是将数据源代码写入数据库再从数据库读取生成静态面,这样无形间就加大了数据库。将现有的ASP页直接生成静态页,将会节省很多。 下面的例子是将、index.asp?id=1/index.asp?id=2/index.asp?id=3/这三个动态页面,分别生成ndex1.htm,index2.htm,index3.htm存在根目录下面:<%dim strUrl,Item_Classid,id,FileN...
http://www.jb51.net//article/290.htm
