MongoDB实现基于关键词的文章检索功能(C#版)

 更新时间:2016年04月18日 11:08:06   投稿:mrr  
这篇文章主要介绍了MongoDB实现基于关键词的文章检索功能(C#版)的相关资料,需要的朋友可以参考下

我的实现目标是:

可以通过一个或多个关键词搜索到文章。

可以通过文章的关键词列表查询到其相关文章。

查询到的结果依据相关程度降序排列。

查询速度要够快。(理论上关键词检索比全文检索要快很多的)

在网上找了一大圈,就没有一个靠谱的方法,基本都是只能传入单词来检索,而且基本都没有提供C#驱动版本的代码,于是乎自己研究出了这个实现方案:

首先要求使用标签、分词、关键词提取组件对文章对应的关键词进行提取,然后作为数组格式,存入文章的Keywords字段中。

核心检索代码:

/// <summary>
/// 根据关键词获取文章编号与标题映射。
/// 注意:此方法会返回最为匹配的若干个项目,并根据匹配程度降序排列,即使是没有任何关键词匹配项,也会返回若干个结果的。
/// 另需注意:如果是根据文章关键词来查询,一般来说其中一定包含原文章,所以应该把期望获得的数量加1,并在结果中移除原文。
/// </summary>
/// <param name="limitNum">数量上限</param>
/// <param name="keywords">关键词集合</param>
/// <returns>文章编号与标题映射字典</returns>
public async Task<Dictionary<Guid, string>> GetArticleDicByKeywordsAsync(int limitNum, IEnumerable<string> keywords)
{
var list =
await
Database.GetCollection<Domain.Entity.Article>("Article").Aggregate()
.Match(q => !q.IsDeleted && q.Keywords != null)
.Project(q => new { q.Id, q.Title, Count = q.Keywords.Count(t => keywords.Contains(t)) })
.SortByDescending(q => q.Count)
.Limit(limitNum)
.ToListAsync();
return list.ToDictionary(f => f.Id, f => f.Title);
}

注意:这里一定要用Aggregate()方法做聚合,而不是常用的Find()方法做查询,Find()方法后面跟Project()方法也不会改变方法链中操作的对象类型,这样后面的SortByDescending()方法的目标对象还是Article类,而不是Project()方法中定义的匿名类,而SortByDescending()方法中传入的表达式又仅允许用来选择对象属性,不允许进行任何计算,所以就根本无法实现我们的需求,我在发现Aggregate()方法之前就在这里一直卡着很久~

用作关键词搜索时一般就是把关键词传入就可以了,不过传回的结果也有可能压根没有匹配到任何关键词,所以最好在发给用户前再检查一遍项目的匹配程度,把没有任何匹配的结果滤掉。

用作相关文章搜索时,直接把原文章的Keywords属性值传入,获取数量要比你预计的数量多1,因为非常可能你的原文章就在获取到的列表中,而且是前列,获取后滤掉原文章的ID,再执行Take方法返回你需要数量的项目即可(执行Take方法是为了以防你的原文没出现在列表中,这概率极小但也是有的)。

为了增进查询效率,还可以预设好索引,代码如下:

var c=Database.GetCollection<Domain.Entity.Article>("Article");
c.Indexes.DropAll();
await c.Indexes.CreateOneAsync(
Builders<Domain.Entity.Article>.IndexKeys.Ascending(q => q.Keywords));
//参考自:http://mongodb.github.io/mongo-csharp-driver/2.2/reference/driver/admin/#creating-an-index

所使用的C#官方驱动版本是:MongoDB.Driver.2.2.3

相关文章

  • mongodb使用c#驱动数据插入demo

    mongodb使用c#驱动数据插入demo

    今天小编就为大家分享一篇关于mongodb使用c#驱动数据插入demo,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-01-01
  • MongoDB入门教程之细说MongoDB数据库的增删查改操作

    MongoDB入门教程之细说MongoDB数据库的增删查改操作

    这篇文章主要介绍了MongoDB入门教程之细说MongoDB数据库的增删查改操作,本文环境是windows,所以以图片形式讲解,需要的朋友可以参考下
    2014-08-08
  • 高效mongodb的php分页类(不使用skip)

    高效mongodb的php分页类(不使用skip)

    这篇文章主要介绍了高效mongodb的php分页类,并且没有使用mongodb的skip来实现分页,需要的朋友可以参考下
    2014-05-05
  • MongoDB社区版和企业版的差别对照表

    MongoDB社区版和企业版的差别对照表

    这篇文章主要介绍了MongoDB社区版和企业版的差别对照表,本文同时提供了中文和英文版的对照表,需要的朋友可以参考下
    2014-10-10
  • Windows系统下安装Mongodb 3.2.x的步骤详解

    Windows系统下安装Mongodb 3.2.x的步骤详解

    mongodb3.x版本有好多新功能,关于这方面参考官网即可,下面这篇文章主要给大家介绍了在Windows系统下安装Mongodb 3.2.x的详细步骤,文中介绍的非常详细,需要的朋友们可以参考学习,下面来一起看看吧。
    2017-03-03
  • MongoDB安装使用并实现Python操作数据库

    MongoDB安装使用并实现Python操作数据库

    Mongo最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。本文就详细的介绍一下如何使用,感兴趣的可以了解一下
    2021-06-06
  • MongoDB中自动增长ID详解(实现、应用及优化)

    MongoDB中自动增长ID详解(实现、应用及优化)

    在MongoDB中,自动增长的功能主要通过使用数据库的ObjectId或自定义的序列来实现,ObjectId是MongoDB默认的主键类型,它是唯一的并且具有一定的排序特性,本文给大家介绍了MongoDB中自动增长ID,需要的朋友可以参考下
    2024-06-06
  • Windows系统启动MongoDB报错无法连接服务器的问题及解决方案

    Windows系统启动MongoDB报错无法连接服务器的问题及解决方案

    在Windows系统中启动MongoDB时遇到连接拒绝的错误,通常是因为服务未运行或配置问题,本文给大家分享Windows系统启动MongoDB报错无法连接服务器的问题及解决方案,一起看看吧
    2024-10-10
  • springboot + mongodb 通过经纬度坐标匹配平面区域的方法

    springboot + mongodb 通过经纬度坐标匹配平面区域的方法

    这篇文章主要介绍了springboot + mongodb 通过经纬度坐标匹配平面区域的方法,文中通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-10-10
  • MongoDB 语法使用小结

    MongoDB 语法使用小结

    MongoDB是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的
    2011-10-10

最新评论