PHP中文分词 自动获取关键词介绍

 更新时间:2012年11月13日 17:07:58   作者:  
用了大家熟知的scws 还有phpanalysis ,需要的朋友可以参考下
复制代码 代码如下:

<?php
header("Content-Type:text/html; charset=utf-8");
define('APP_ROOT', str_replace('\\', '/', dirname(__FILE__)));
$test = '这里是一段中文测试代码!';
function get_tags_arr($title)
{
require(APP_ROOT.'/pscws4.class.php');
$pscws = new PSCWS4();
$pscws->set_dict(APP_ROOT.'/scws/dict.utf8.xdb');
$pscws->set_rule(APP_ROOT.'/scws/rules.utf8.ini');
$pscws->set_ignore(true);
$pscws->send_text($title);
$words = $pscws->get_tops(5);
$tags = array();
foreach ($words as $val) {
$tags[] = $val['word'];
}
$pscws->close();
return $tags;
}
print_r(get_tags_arr($test));
//============================================================
function get_keywords_str($content){
require(APP_ROOT.'/phpanalysis.class.php');
PhpAnalysis::$loadInit = false;
$pa = new PhpAnalysis('utf-8', 'utf-8', false);
$pa->LoadDict();
$pa->SetSource($content);
$pa->StartAnalysis( false );
$tags = $pa->GetFinallyResult();
return $tags;
}
print(get_keywords_str($test));

相关下载地址

SCWS – 简易中文分词系统

SCWS 在概念上并无创新成分,采用的是自行采集的词频词典,并辅以一定程度上的专有名称、人名、地名、数字年代等规则集,经小范围测试大概准确率在 90% ~ 95% 之间,已能基本满足一些中小型搜索引擎、关键字提取等场合运用。 SCWS 采用纯 C 代码开发,以 Unix-Like OS 为主要平台环境,提供共享函数库,方便植入各种现有软件系统。此外它支持 GBK,UTF-8,BIG5 等汉字编码,切词效率高。

系统平台:Windows/Unix
开发语言:C
使用方式:PHP扩展

演示网址:http://www.ftphp.com/scws/demo.php
开源官网:http://www.ftphp.com/scws/

晴枫附注:作为PHP扩展,容易与现有的基于PHP架构的Web系统继续集成,是其一大优势。

PhpanAlysis - PHP无组件分词系统

PhpanAlysis分词系统是基于字符串匹配的分词方法 ,这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。按照扫描方向的不同,串匹配分词方法可以分为正向匹配 和逆向匹配;按照不同长度优先匹配的情况,可以分为最大(最长)匹配和最小(最短)匹配;按照是否与词性标注过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。 

系统平台:PHP环境

开发语言:PHP

使用方式:HTTP服务

演示网址:http://www.itgrass.com/phpanalysis/
开源官网:http://www.itgrass.com/phpanalysis/

晴枫附注:实现简单,容易使用,能做一些简单应用,但大数据量的计算效率不如前几种。

试用了几个系统,基本分词功能都没什么问题,只是在个别一些词的划分上存在一些差异;对于词性的确定,系统间有所不同。

https://www.jb51.net/codes/40139.html

相关文章

  • PHP实现搜索地理位置及计算两点地理位置间距离的实例

    PHP实现搜索地理位置及计算两点地理位置间距离的实例

    这篇文章主要介绍了PHP实现搜索地理位置及计算两点地理位置间距离的实例,地理位置搜寻的例子中使用到了MongoDB数据库,需要的朋友可以参考下
    2016-01-01
  • 实例介绍PHP的Reflection反射机制

    实例介绍PHP的Reflection反射机制

    这篇文章主要介绍了实例介绍PHP的Reflection反射机制,本文从使用Reflection获取一个类的信息角度来介绍PHP的Reflection反射机制,需要的朋友可以参考下
    2014-08-08
  • TP5(thinkPHP5)框架mongodb扩展安装及特殊操作示例

    TP5(thinkPHP5)框架mongodb扩展安装及特殊操作示例

    这篇文章主要介绍了TP5(thinkPHP5)框架mongodb扩展安装及特殊操作,结合实例形式分析了MongoDB扩展的基本安装、配置、模型操作以及使用Push操作实现的数据添加、更新等方法,需要的朋友可以参考下
    2018-09-09
  • PHP安全过滤库输入过滤最佳实例探究

    PHP安全过滤库输入过滤最佳实例探究

    PHP安全过滤库是一种很好的安全实践,直接引用、可以为我们的项目提供全面的安全保护,并且不用浪费太多的精力和时间去完善安全问题,专业的事交给专业的人去做,事半功倍,可以帮助我们防止常见的安全漏洞,满足合规要求,并为用户提供安全可靠的web应用程序
    2024-01-01
  • php fseek函数读取大文件两种方法

    php fseek函数读取大文件两种方法

    php中读取文件非常简单,但如果读取的文件非常大,改如何解决呢?我们可以直接使用fseek来进行大文件操作,本文章向大家介绍php使用fseek函数读取大文件,需要的朋友可以参考一下
    2016-10-10
  • php权重计算方法代码分享

    php权重计算方法代码分享

    权重计算,稍加修改亦可用于分词,词频统计,全文和spam检测等
    2014-01-01
  • Zend Framework教程之Zend_Layout布局助手详解

    Zend Framework教程之Zend_Layout布局助手详解

    这篇文章主要介绍了Zend Framework教程之Zend_Layout布局助手用法,结合实例形式详细分析了Layout布局的相关实现技巧,需要的朋友可以参考下
    2016-03-03
  • YII Framework教程之异常处理详解

    YII Framework教程之异常处理详解

    这篇文章主要介绍了YII Framework教程之异常处理,结合实例形式详细分析了Yii框架异常处理机制的原理,使用方法与相关注意事项,需要的朋友可以参考下
    2016-03-03
  • php获取指定日期之间的各个周和月的起止时间

    php获取指定日期之间的各个周和月的起止时间

    本文推荐给大家一个php类文件,可以根据指定日期获取所在周的起始时间和结束时间,并附上使用实例,有需要的小伙伴参考下吧
    2014-11-11
  • PHP实现图片合并的示例详解

    PHP实现图片合并的示例详解

    这篇文章主要为大家详细介绍了如何利用PHP实现图片合并的效果,文中的示例代码讲解详细,具有一定的学习价值,感兴趣的小伙伴可以了解一下
    2023-03-03

最新评论