mysql中使用sphinx搜索子域名需注意的问题

 更新时间:2013年02月07日 17:32:34   作者:  
比如搜索jb51.net会把www.jb51.net、jb51.net、sc.jb51.net等都搜索出来

搜索子域名

比如搜索jb51.net会把www.jb51.net、jb51.net、host.jb51.net等都搜索出来。

如果使用mysql用like的话效率是非常低的,几百万甚至上千万的数据那是没有办法使用的,于是采取sphinx来做。

在使用的过程中发现了诸多问题,这里将其总结起来,也让不知道的朋友注意下这些字符。

分析:
sphinx是全文索引,它搜索的是包含的记录。

首先如果我们不做任何设置的话,搜索jb51.net会出现把aajb51.net、jb51.a.cn、jb51.net.com(当然这个域名后缀不存在,但是会有符合相应规则的域名,这里只举例)等等。

为什么会出现这种情况呢?

我们使用./search -c 配置文件 -i 索引名 'jb51.net' 搜索的时候会发现下面words部分被分成了两部分'jb51'和'cn',默认以.作为分隔符,如果我们不想让它做为分隔符,就需要把.添加到charset_table里面,这里需要说的是我们搜索域名只需要有字母、数字、"-"等字符,其他的不需要。设置如下:
charset_table = 0..9,A..Z->a..z, a..z,U+002e,U+002d,U+0040,U+0060  #其中U+002e代表".",U+002d代表"-",U+0040代表"@",U+0060代表"`",这里为ascii码值。
这样会解决掉搜出jb51.a.cn这类域名。

那么jb51.net.com这类呢?我们可以在索引的字段中增加惟一后缀比如“XXXXX”,concat(search,'XXXXX')这样,就不会出来了。

现在就剩下aajb51.net这类域名,我们使用关键字“ '".jb51.net"' ”(注意是单引号里面套双引号)这样来搜索,主域名单独加上,但是使用的过程中发现这样搜出了与这个域名无关的域名,比如aa.bb.cn这样,经后来研究是"."的问题,后来把"."替换成"@",来搜索又出现12306等好多域名无法读取到的问题,后来经研究估计这些特殊字符在sphinx中都有特殊的意义,于是找到了"`"这个字符,换成这个以后一切才算正常了。

注意:将"."替换成"`"等相应字符后需在charset_table里增加这个字符,不然是被忽略的。

所以在搜索的过程中我们需要注意下这些特殊字符。

相关文章

  • mysql是否需要容器化深入分析

    mysql是否需要容器化深入分析

    这篇文章主要为大家介绍了mysql是否需要容器化深入解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-09-09
  • mysql zip archive 版本(5.7.19)安装教程详细介绍

    mysql zip archive 版本(5.7.19)安装教程详细介绍

    这篇文章主要介绍了mysql zip archive 版本(5.7.19)安装教程详细介绍,需要的朋友可以参考下
    2017-10-10
  • MySQL笔记之修改表的实现方法

    MySQL笔记之修改表的实现方法

    我们在创建表的过程中难免会考虑不周,因此后期会修改表。本篇文章就介绍了在mysql中修改表的实现方法。需要的朋友参考下
    2013-05-05
  • mysql从执行.sql文件时处理\n换行的问题

    mysql从执行.sql文件时处理\n换行的问题

    后来注意到,在上面我们恢复数据的时候是在没有连接数据的状态下执行的。
    2009-05-05
  • MySQL中的SUM函数使用教程

    MySQL中的SUM函数使用教程

    这篇文章主要介绍了MySQL中的SUM函数使用教程,是MySQL入门学习中的基础知识,需要的朋友可以参考下
    2015-05-05
  • 解决windows下mysql8修改my.ini设置datadir后无法启动问题

    解决windows下mysql8修改my.ini设置datadir后无法启动问题

    在修改MySQL的my.ini文件以更改数据目录后,可能会遇到无法启动的问题,这通常是因为字符编码被改变或新路径权限不足,正确的做法是备份my.ini文件,确保使用ANSI字符编码修改datadir,并确保新路径有足够的权限,特别是SYSTEM或NETWORKSERVICE权限
    2025-01-01
  • MySQL多表查询的案例详解

    MySQL多表查询的案例详解

    这篇文章主要介绍了MySQL多表查询的案例说明,包括多表查询的分类及umion的使用,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-03-03
  • MySQL中FOR UPDATE的具体用法

    MySQL中FOR UPDATE的具体用法

    本文主要介绍了MySQL中FOR UPDATE的具体用法,它在事务中起到了锁定数据行的关键作用,确保了数据的一致性和可靠性,下面就来具体的介绍一下应用场景等,感兴趣的可以了解一下
    2024-02-02
  • 为什么MySQL数据库索引选择使用B+树?

    为什么MySQL数据库索引选择使用B+树?

    今天小编就为大家分享一篇关于为什么MySQL数据库索引选择使用B+树?,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • MySQL查询条件中in会用到索引吗

    MySQL查询条件中in会用到索引吗

    这篇文章主要给大家介绍了MySQL查询条件中in会不会用到索引的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用MySQL具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-07-07

最新评论