PHP实现通过中文字符比率来判断垃圾评论的方法

 更新时间:2014年10月20日 15:10:48   投稿:shichen2014  
这篇文章主要介绍了PHP实现通过中文字符比率来判断垃圾评论的方法,是一个比较实用的技巧,对于进行PHP应用程序开发来说有一定的参考借鉴价值,需要的朋友可以参考下

本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:

一、需求:

最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。

二、解决方案:

要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。

三、实现代码:

复制代码 代码如下:
$len_all = strlen($comment['text']);                     
 $len_st = mb_strlen($comment['text'], 'UTF-8');
 if(($len_all-$len_st)/(2*$len_st) < 0.5){
        $error = "中文字符少于百分之五十"; 
 }

如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。

希望本文所述对大家的PHP程序设计有所帮助。

相关文章

  • php记录日志的实现代码

    php记录日志的实现代码

    php记录日志的实现代码,主要分为几种模式,需要的朋友可以参考下。
    2011-08-08
  • PHP连接数据库实现简单的登录页面功能

    PHP连接数据库实现简单的登录页面功能

    这篇文章主要介绍了PHP连接数据库实现简单的登录页面功能,文中的示例代码讲解详细,对大家的学习或工作有一定的帮助,感兴趣的可以了解一下
    2023-09-09
  • 深入解析Session是否必须依赖Cookie

    深入解析Session是否必须依赖Cookie

    php中的session是否只能使用session cookie呢?下面小编就来详细的为大家介绍一下吧,需要的朋友可以过来参考下
    2013-08-08
  • 一个PHP二维数组排序的函数分享

    一个PHP二维数组排序的函数分享

    二维数组在PHP开发中经常遇到,但是他的排序就不如一维数组那样用内置函数来的方便了,下面为大家详细介绍下
    2014-01-01
  • php实现的美国50个州选择列表实例

    php实现的美国50个州选择列表实例

    这篇文章主要介绍了php实现的美国50个州选择列表实例,可实现让当前州为选中状态的功能,非常具有实用价值,需要的朋友可以参考下
    2015-04-04
  • php设计模式介绍之编程惯用法

    php设计模式介绍之编程惯用法

    《PHP设计模式介绍》第一章 编程惯用法 学习一门新的语言意味着要采用新的惯用法。这章将介绍或者可能重新强调一些惯用法。你会发现这些惯用法在你要在代码中实现设计模式时候是非常有用的。
    2008-04-04
  • PHP设计模式之建造者模式定义与用法简单示例

    PHP设计模式之建造者模式定义与用法简单示例

    这篇文章主要介绍了PHP设计模式之建造者模式定义与用法,简单描述了建造者模式的概念、原理并结合实例形式分析了建造者模式的具体定义与使用方法,需要的朋友可以参考下
    2018-08-08
  • php number_format() 函数通过千位分组来格式化数字的实现代码

    php number_format() 函数通过千位分组来格式化数字的实现代码

    以下是对php中的number format()函数通过千位分组来格式化数字的实现代码进行了详细的分析介绍,需要的朋友可以过来参考下
    2013-08-08
  • php访问数组最后一个元素的函数end()用法

    php访问数组最后一个元素的函数end()用法

    这篇文章主要介绍了php访问数组最后一个元素的函数end()用法,实例分析了php中end函数访问数组元素的技巧,非常具有实用价值,需要的朋友可以参考下
    2015-03-03
  • PHP使用数组实现队列

    PHP使用数组实现队列

    PHP的数组处理函数还可以将数组实现队列,堆栈是“先进后出”。在堆栈中,最后压入的数据(进栈),将会被最先弹出(出栈)。而队列是先进先出,就如同银行的排号机
    2012-02-02

最新评论