让站长最头痛的事,除了程序和服务器安全外,可能就要算内容被采集了。当然,现在网络本身就是资源共享,我这里不谈采集的对错,只是就防采集说说个人看法。 一、如何分辨搜索爬虫 以前,在网上看到过关于用asp代码来捕捉搜索爬虫的代码,通过代码把爬虫的访问记录记录到文件。就此代码(原作者未知)我作了修改,加入程序中防采集。现做成函数,直接在页面中调用。[code] Func...
http://www.jb51.net//article/14311.htm
在一般的链接地址形式如: [code]1、<a class="链接样式" href="链接地址" title="链接说明" target="_blank">文章标题</a> 2、<a class='链接样式' href='链接地址' title='链接说明' target='_blank'>文章标题</a> [/code]  ...
http://www.jb51.net//article/14310.htm
Copyright © 2004 本文遵从GPL协议,欢迎转载、修改、散布。第一次发布时间:2004年8月6日--------------------------------------------------------------------------------Table of Contents1. awk简介2. awk命令格式和选项2.1. awk的语法有两种形式2.2. 命令选项3. 模式和操作3.1. 模式3.2. 操作4. awk的环境变...
http://www.jb51.net//article/14260.htm
屏蔽IE浏览器(也就是IE下不显示)*:lang(zh) select {font:12px !important;} /*FF的专用*/select:empty {font:12px !important;} /*safari可见*/这里select是选择符,根据情况更换。第二句是MAC上safari浏览器独有的。仅IE7识别*+html {…}当面临需要只针对IE7做样式的时候就可以采用这个HACK。IE6及IE6以下识别* html {…}这个地方要特别注意很多地主都写了是IE...
http://www.jb51.net//article/14228.htm
状态一:天热,给宝宝多喂了点西瓜汁,没想到,晚上宝宝的尿特多,使得宝宝的小屁股上出现了红疹。 ·护理关照: 最重要的是,时刻保持宝宝小屁屁的干燥,尿布要勤换勤洗。如果宝宝爱出汗,干脆白天就甩掉尿布,让宝宝的小屁屁透透气。 宝宝大小便后,要用温水为宝宝洗净屁股,但切忌使用肥皂,不然,很容易破坏宝宝皮肤的保护膜。 清洗完宝宝的小屁屁后,可轻轻涂一层紫草软膏,以预防尿布疹的发生。 吃母乳的宝宝,妈妈不要吃海鲜等容易过敏的食物。添加辅食应由少及多,每添加一样新东西,都要格外注意宝宝是否会对它产生过敏。 ·民间土法: 用食用的香油在火上烧热后冷却,然后涂在宝宝的屁股上,尿布疹就可减轻。 ...
http://www.jb51.net//article/14223.htm
注意:下面的所有函数都没有用正则。以上为取出第一个匹配的三个函数,实现相同的目的function str_cut($str ,$start, $end) {//取出第一个匹配,效率最高,先分割再替换$content = strstr( $str, $start );$content = substr( $content, strlen( $start ), strpos( $content, $end&n...
http://www.jb51.net//article/14199.htm
ar功能说明:建立或修改备存文件,或是从备存文件中抽取文件。语 法:ar[-dmpqrtx][cfosSuvV][a<成员文件>][b<成员文件>][i<成员文件>][备存文件][成员文件]补充说明:ar可让您集合许多文件,成为单一的备存文件。在备存文件中,所有成员文件皆保有原来的属性与权限。参 数: 指令参数 -d 删除备存文件中的成员文件。 -m 变更成员文件在备存文件中的次序。 -p 显示备存文件中的成员文件内容。 -q 将问家附加在备存文件末端。&nb...
http://www.jb51.net//article/14137.htm
添加采集规则规则说明系统默认变量:<{articleid}>-文章序号,<{chapterid}>-章节序号,<{subarticleid}>-文章子序号,<{subchapterid}>-章节子序号。系统标签*可以替代任意字符串。系统标签!可以替代除了<和>以外的任意字符串。系统标签~可以替代除了<>'"以外的任意字符串。系统标签^可以替代除了数字和<>之外字符串。系统标签$可以替代数字字符串。采集规则中,需要获取的内容部分用四个以上系统标签代替,如!!!!基本设置 网站标识config...
http://www.jb51.net//article/14102.htm
匹配中文字符的正则表达式: [\u4e00-\u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^\x00-\xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)  ...
http://www.jb51.net//article/14049.htm
/*获得客户端ip地址*/ function getIP() { if(getenv("HTTP_CLIENT_IP") && strcasecmp(getenv("HTTP_CLIENT_IP"),"unknown")) { ...
http://www.jb51.net//article/13981.htm
将数据插入到php?name=%CA%FD%BE%DD%BF%E2" onclick="tagshow(event)" class="t_tag">数据库的时候显示乱码及从php?name=%CA%FD%BE%DD%BF%E2" onclick="tagshow(event)" class="t_tag">数据库读取出来的数据在网页上显示为乱码的问题,其实就是做到php?name=%CA%FD%BE%DD%BF%E2" onclick="tagshow(event)" class="t_tag">数据库编码,网页编码...
http://www.jb51.net//article/13969.htm
