基于mysql全文索引的深入理解

 更新时间:2013年06月02日 21:30:32   投稿:jingxian  
本篇文章是对mysql全文索引进行了详细的分析介绍,需要的朋友参考下

前言:本文简单讲述全文索引的应用实例,MYSQL演示版本5.5.24。
Q:全文索引适用于什么场合?
A:全文索引是目前实现大数据搜索的关键技术。
至于更详细的介绍请自行百度,本文不再阐述。
--------------------------------------------------------------------------------
一、如何设置?



如图点击结尾处的{全文搜索}即可设置全文索引,不同MYSQL版本名字可能不同。

二、设置条件
1.表的存储引擎是MyISAM,默认存储引擎InnoDB不支持全文索引(新版本MYSQL5.6的InnoDB支持全文索引)
2.字段类型:char、varchar和text
 
三、配置
my.ini配置文件中添加
# MySQL全文索引查询关键词最小长度限制
[mysqld]
ft_min_word_len = 1
保存后重启MYSQL,执行SQL语句

复制代码 代码如下:

SHOW VARIABLES

查看ft_min_word_len是否设置成功,如果没设置成功请确保
1.确认my.ini正确配置,注意不要搞错my.ini的位置
2.确认mysql已经重启,实在不行重启电脑
其他相关配置请自行百度。
注:重新设置配置后,已经设置的索引需要重新设置生成索引
 
四、SQL语法
首先生成temp表

CREATE TABLE IF NOT EXISTS `temp` (
 `id` int(11) NOT NULL AUTO_INCREMENT,
 `char` char(50) NOT NULL,
 `varchar` varchar(50) NOT NULL,
 `text` text NOT NULL,
 PRIMARY KEY (`id`),
 FULLTEXT KEY `char` (`char`),
 FULLTEXT KEY `varchar` (`varchar`),
 FULLTEXT KEY `text` (`text`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=2 ;
INSERT INTO `temp` (`id`, `char`, `varchar`, `text`) VALUES
(1, 'a bc 我 知道 1 23', 'a bc 我 知道 1 23', 'a bc 我 知道 1 23');

搜索`char`字段 'a' 值

SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a')

但是你会发现查询无结果?!
这时你也许会想:哎呀怎么回事,我明明按照步骤来做的啊,是不是那里漏了或者错了?
你不要着急,做程序是这样的,出错总是有的,静下心来,着急是不能解决问题的。
 
如果一个关键词在50%的数据出现,那么这个词会被当做无效词。
如果你想去除50%的现在请使用IN BOOLEAN MODE搜索

SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a' IN BOOLEAN MODE)

这样就可以查询出结果了,但是我们不推荐使用。
全文索引的搜索模式的介绍自行百度。
 
我们先加入几条无用数据已解除50%限制

INSERT INTO `temp` (
`id` ,
`char` ,
`varchar` ,
`text`
)
VALUES (
NULL , '7', '7', '7'
), (
NULL , '7', '7', '7'
), (
NULL , 'a,bc,我,知道,1,23', 'a,bc,我,知道,1,23', 'a,bc,我,知道,1,23'
), (
NULL , 'x', 'x', 'x'
);

这时你执行以下SQL语句都可以查询到数据

SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('bc');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('我');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('知道');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('1');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('23');

以下SQL搜索不到数据

SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('b');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('c');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('知');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('道');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('2');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('3');

如果搜索多个词,请用空格或者逗号隔开

SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a x');
SELECT * FROM `temp` WHERE MATCH(`char`) AGAINST ('a,x');

上面的SQL都可以查询到三条数据
 
五、分词
看到这里你应该发现我们字段里的值也是分词,不能直接插入原始数据。
全文索引应用流程:
1.接收数据-数据分词-入库
2.接收数据-数据分词-查询
现在有个重要的问题:怎么对数据分词?
数据分词一般我们会使用一些成熟免费的分词系统,当然如果你有能力也可以自己做分词系统,这里我们推荐使用SCWS分词插件。
首先下载
1.php_scws.dll  注意对应版本
2.XDB词典文件
3.规则集文件
下载地址
 
安装scws
1.先建一个文件夹,位置不限,但是最好不要中文路径。
2.解压{规则集文件},把xdb、三个INI文件全部扔到 D:\scws
3.把php_scws.dll复制到你的PHP目录下的EXT文件夹里面
4.在 php.ini 的末尾加入以下几行:
[scws]
;
; 注意请检查 php.ini 中的 extension_dir 的设定值是否正确, 否则请将 extension_dir 设为空,
; 再把 php_scws.dll 指定为绝对路径。
;
extension = php_scws.dll
scws.default.charset = utf8
scws.default.fpath = "D:\scws"
5.重启你的服务器
测试

$str="测试中文分词";
$so = scws_new();
$so->send_text($str);
$temp=$so->get_result();
$so->close();
var_dump($temp);

如果安装未成功,请参照官方说明文档
--------------------------------------------------------------------------------
这样我们就可以使用全文索引技术了。

相关文章

  • MySQL AUTO_INCREMENT 主键自增长的实现

    MySQL AUTO_INCREMENT 主键自增长的实现

    本文主要介绍了MySQL AUTO_INCREMENT 主键自增长的实现,每增加一条记录,主键会自动以相同的步长进行增长,具有一定的参考价值,感兴趣的可以了解一下
    2023-11-11
  • 解决mysql报错ERROR 1049 (42000): Unknown database ‘数据库‘的问题

    解决mysql报错ERROR 1049 (42000): Unknown dat

    对于错误代码1049(42000):Unknown database ‘数据库‘,这个错误通常表示您正在尝试访问一个不存在的数据库,本文给出了解决方法,您可以按照文中步骤进行操作,需要的朋友可以参考下
    2024-01-01
  • MySQL聚簇索引和非聚簇索引的区别详情

    MySQL聚簇索引和非聚簇索引的区别详情

    这篇文章主要介绍了MySQL聚簇索引和非聚簇索引的区别详情,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的朋友可以参考一下
    2022-06-06
  • MySQL中表的几种连接方式

    MySQL中表的几种连接方式

    这篇文章主要给大家介绍了关于MySQL中表的几种连接方式,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-11-11
  • 使用MySQL实现高效的用户昵称模糊搜索

    使用MySQL实现高效的用户昵称模糊搜索

    在大型系统中,用户表中的昵称字段需要支持高效的模糊搜索,并且必须处理包含特殊字符的查询,本文将介绍一种在MySQL中实现高效模糊搜索的解决方案,能够支持特殊字符,并且利用MySQL自身的全文索引机制来优化搜索性能,需要的朋友可以参考下
    2024-05-05
  • Mysql 9.0.0创新MSI安装的实现

    Mysql 9.0.0创新MSI安装的实现

    本文提供了MySQL 9.0.0版本的MSI安装方法,包括安装前的下载链接,安装过程中的选项介绍,以及安装完成后的配置指南,具有一定的参考价值,感兴趣的可以了解一下
    2024-10-10
  • SQL查询至少连续七天下单的用户

    SQL查询至少连续七天下单的用户

    这篇文章介绍了SQL查询至少连续七天下单用户的方法,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-01-01
  • MySQL快速复制数据库数据表的方法

    MySQL快速复制数据库数据表的方法

    有些时候,我们为了快速搭建一个测试环境,或者说是克隆一个网站,需要复制已经存在的mysql数据库。下面小编给大家介绍mysql快速复制数据库数据表的方法,小伙伴们跟着小编一起学习吧
    2015-10-10
  • MySQL中的聚合查询和联合查询操作代码

    MySQL中的聚合查询和联合查询操作代码

    这篇文章主要介绍了MySQL中的聚合查询和联合查询操作代码,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-03-03
  • 解析SQL 表结构信息查询 含主外键、自增长

    解析SQL 表结构信息查询 含主外键、自增长

    本篇文章是对SQL 表结构信息查询 含主外键、自增长进行了详细的分析介绍,需要的朋友参考下
    2013-06-06

最新评论