php权重计算方法代码分享

 更新时间:2014年01月09日 15:10:07   作者:  
权重计算,稍加修改亦可用于分词,词频统计,全文和spam检测等

复制代码 代码如下:

<?php
/* vim: set expandtab tabstop=4 shiftwidth=4: */
// +------------------------------------------------------------------------
//  Name       :   权重计算                                        
//  Description:   稍加修改,亦可用于分词,词频统计,全文检索和垃圾检测
//  Date       :   2013/12/16 08:51

class weight {
    protected $aDict = array(array());
    protected $aItems = array();
    protected $sLastRule;
    protected $aMatchs = array();
    protected $aShow = array();

 private function init() {
  //清空记录的匹配表和输出结果
  unset($this->aShow);
 }

    public function newItems($mItems) {
  //导入新的项目
  $this->aItems = (is_array($mItems))? $mItems: array($mItems);
  $this->init();
 }

 public function newTable(array $aTable) {
        //导入新的对照表,并生成字典
        foreach($aTable as $iTableKey=>$sTableLine) {
            $aTableLine = explode(',', str_replace('|', ',', $sTableLine));
            $setter = function($v, $k, $paraMeter) {
                $k1 = $paraMeter[0]; $oWeight = $paraMeter[1];
                $oWeight->genDict($v, $k1);
            };
            array_walk($aTableLine, $setter, array($iTableKey, $this));
        }
        $this->init();
 }

    public function getShow($sRule = 'max') {
  //获取最终的显示结果
        if(empty($this->aItems) || empty($this->aDict))
            return array();
  if (empty($this->aShow) || $sRule != $this->sLastRule)
            return $this->genShow($sRule);
        return $this->aShow;
 }

    public function genShow($sRule) {
        $aShow = array();
        $aMatchs = array();
  $getter = function($v, $k, $oWeight) use(&$aShow, &$aMatchs, $sRule) {
   $t = array_count_values($oWeight->matchWord($v));
            $aMatchs[] = $t;
            switch ($sRule) {
                case 'max':
                    $aShow[$k] = array_keys($t, max($t)); 
                    break;
            }
  };
  array_walk($this->aItems, $getter, $this);
  $this->aShow = $aShow;
  $this->aMatchs = $aMatchs;
  return $aShow;
    }

    private function genDict($mWord, $iKey = '') {
        $iInsertPonit = count($this->aDict);
        $iCur = 0; //当前节点号
        foreach (str_split($mWord) as $iChar) {
            if (isset($this->aDict[$iCur][$iChar])) {
                $iCur = $this->aDict[$iCur][$iChar];
                continue;
            }
            $this->aDict[$iInsertPonit] = array();
            $this->aDict[$iCur][$iChar] = $iInsertPonit;
            $iCur = $iInsertPonit;
            $iInsertPonit++;
        }
        $this->aDict[$iCur]['acc'][] = $iKey;

    }

        function matchWord($sLine) {
            $iCur = $iOffset = $iPosition = 0;
            $sLine .= "\0";
            $iLen = strlen($sLine);
            $aReturn = array();
            while($iOffset < $iLen) {
                $sChar = $sLine{$iOffset};
                if(isset($this->aDict[$iCur][$sChar])) {
                    $iCur = $this->aDict[$iCur][$sChar];
                    if(isset($this->aDict[$iCur]['acc'])) {
                        $aReturn = array_merge($aReturn, $this->aDict[$iCur]['acc']);

                        $iPosition = $iOffset + 1;
                        $iCur = 0;
                    }
                } else {
                    $iCur = 0;
                    $iOffset = $iPosition;
                    $iPosition = $iOffset + 1;
                }
                ++$iOffset;
            }
            return $aReturn;
        }
}

?>

外部调用示例

复制代码 代码如下:

$aItems = array(
    'chinaisbig',
    'whichisnot',
    'totalyrightforme',
);
$aTable = array(
    'china,is|small',
    'china,big|me',
    'china,is|big,which|not,me',
    'totaly|right,for,me',
);

$oWeight = new ttrie;
$oWeight->newItems($aItems);
$aResult = $oWeight->newTable($aTable);

相关文章

  • 详解PHP对象的串行化与反串行化

    详解PHP对象的串行化与反串行化

    我们大家有知道PHP串行化可以把变量包括对象,转化成连续bytes数据,你可以将串行化后的变量存在一个文件里或在网络上传输,然后再反串行化还原为原来的数据。文章给大家介绍PHP对象的串行化与反串行化,感兴趣的朋友一起学习吧
    2016-01-01
  • 网页的分页下标生成代码(PHP后端方法)

    网页的分页下标生成代码(PHP后端方法)

    网页的分页选择效果直接影响用户的使用体验。类似功能的方法有很多,我在这里写的方法主要是的优势在于前后端分离,可以自己定义长度和分页的行数
    2016-02-02
  • Yii中Model(模型)的创建及使用方法

    Yii中Model(模型)的创建及使用方法

    这篇文章主要介绍了Yii中Model(模型)的创建及使用方法,结合实例形式较为详细的分析了Yii中模型的基本创建技巧,使用方法及相关注意事项,需要的朋友可以参考下
    2015-12-12
  • php数字运算验证码的实现代码

    php数字运算验证码的实现代码

    这篇文章主要介绍了php实现数字运算验证码的方法,具有一定借鉴价值,需要的朋友可以参考下
    2015-07-07
  • 基于PHP选项与信息函数的使用详解

    基于PHP选项与信息函数的使用详解

    本篇文章是对PHP选项与信息函数的使用进行了详细的分析介绍。需要的朋友参考下
    2013-05-05
  • 解决laravel上传图片之后,目录有图片,但是访问不到(404)的问题

    解决laravel上传图片之后,目录有图片,但是访问不到(404)的问题

    今天小编就为大家分享一篇解决laravel上传图片之后,目录有图片,但是访问不到(404)的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-10-10
  • Yii入门教程之目录结构、入口文件及路由设置

    Yii入门教程之目录结构、入口文件及路由设置

    本文从YII的目录结构开始分析,到入口文件分析,到路由设置详解,视图详解,十分全面的向我们展示了YII框架的方方面面,是篇非常不错的文章,这里推荐给大家。
    2014-11-11
  • Laravel服务容器绑定的几种方法总结

    Laravel服务容器绑定的几种方法总结

    这篇文章主要给大家介绍了关于Laravel服务容器绑定的几种方式,文中通过示例代码介绍的非常详细,对大家学习或者使用Laravel具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2020-06-06
  • PHP之预定义接口详解

    PHP之预定义接口详解

    这篇文章主要整理了PHP之预定义接口,在平时项目过程中比较常用的四个接口:IteratorAggregate(聚合式aggregate迭代器Iterator)、Countable、ArrayAccess、Iterator,需要的朋友可以参考下
    2015-07-07
  • PHP中把数据库查询结果输出为json格式简单实例

    PHP中把数据库查询结果输出为json格式简单实例

    这篇文章主要介绍了PHP中把数据库查询结果输出为json格式简单实例,本文直接给出示例代码,都是非常基础的写法,大家应该一看就明白,需要的朋友可以参考下
    2015-04-04

最新评论