python使用elasticsearch的过程详解

 更新时间:2024年03月05日 11:53:11   作者:酷爱码  
Elasticsearch 是一个开源的搜索引擎,建立在一个全文搜索引擎库 Apache Lucene基础之上,这篇文章主要介绍了python使用elasticsearch的详细过程,需要的朋友可以参考下

一. 什么是 Elasticsearch

想查数据就免不了搜索,搜索就离不开搜索引擎,百度、谷歌都是一个非常庞大复杂的搜索引擎,他们几乎索引了互联网上开放的所有网页和数据。然而对于我们自己的业务数据来说,肯定就没必要用这么复杂的技术了,如果我们想实现自己的搜索引擎,方便存储和检索,Elasticsearch 就是不二选择,它是一个全文搜索引擎,可以快速地储存、搜索和分析海量数据。

Elasticsearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。Elasticsearch是用Java语言开发的,并作为Apache许可条款下的开放源码发布,是一种流行的企业级搜索引擎。Elasticsearch用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。官方客户端在Java、.NET(C#)、PHP、Python、Apache Groovy、Ruby和许多其他语言中都是可用的。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr,也是基于Lucene。

二. 为什么要用 Elasticsearch

Elasticsearch 是一个开源的搜索引擎,建立在一个全文搜索引擎库 Apache Lucene™ 基础之上。

那 Lucene 又是什么?Lucene 可能是目前存在的,不论开源还是私有的,拥有最先进,高性能和全功能搜索引擎功能的库,但也仅仅只是一个库。要用上 Lucene,我们需要编写 Java 并引用 Lucene 包才可以,而且我们需要对信息检索有一定程度的理解才能明白 Lucene 是怎么工作的,反正用起来没那么简单。

那么为了解决这个问题,Elasticsearch 就诞生了。Elasticsearch 也是使用 Java 编写的,它的内部使用 Lucene 做索引与搜索,但是它的目标是使全文检索变得简单,相当于 Lucene 的一层封装,它提供了一套简单一致的 RESTful API 来帮助我们实现存储和检索。

所以 Elasticsearch 仅仅就是一个简易版的 Lucene 封装吗?那就大错特错了,Elasticsearch 不仅仅是 Lucene,并且也不仅仅只是一个全文搜索引擎。 它可以被下面这样准确的形容:

一个分布式的实时文档存储,每个字段可以被索引与搜索
一个分布式实时分析搜索引擎
能胜任上百个服务节点的扩展,并支持 PB 级别的结构化或者非结构化数据
总之,是一个相当牛逼的搜索引擎,维基百科、Stack Overflow、GitHub 都纷纷采用它来做搜索。

使用Python连接Elasticsearch的详细过程如下:

安装elasticsearch-py库:
在命令行中使用pip安装elasticsearch-py库:

$ pip install elasticsearch

导入elasticsearch库:
在Python脚本中导入elasticsearch库:

from elasticsearch import Elasticsearch

连接到Elasticsearch:
使用Elasticsearch类创建一个连接到Elasticsearch集群的对象:

es = Elasticsearch(hosts=[{'host': 'localhost', 'port': 9200}])

创建索引:
使用create_index方法创建一个新的索引:

es.indices.create(index='my_index', ignore=400)

索引文档:
使用index方法将文档插入到索引中:

es.index(index='my_index', doc_type='my_type', id=1, body={'name': 'John', 'age': 30})

搜索文档:
使用search方法搜索文档:

result = es.search(index='my_index', body={'query': {'match': {'name': 'John'}}})

删除索引:
使用delete_index方法删除索引:

es.indices.delete(index='my_index', ignore=[400, 404])

以上是连接和使用Elasticsearch的基本步骤。你可以根据需要进行更高级的操作,例如更新文档、删除文档等。具体的操作可以参考elasticsearch-py库的文档。

到此这篇关于python使用elasticsearch的详细过程的文章就介绍到这了,更多相关python使用elasticsearch内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用pytorch读取数据集

    使用pytorch读取数据集

    这篇文章主要介绍了使用pytorch读取数据集,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-05-05
  • 基于PyQT5制作一个二维码生成器

    基于PyQT5制作一个二维码生成器

    这篇文章主要介绍了利用PyQT5制作一个简单的二维码生成器,并打包成exe可执行程序。文中的示例代码讲解详细,感兴趣的同学可以了解一下
    2021-12-12
  • 详解pycharm2020.1.1专业版安装指南(推荐)

    详解pycharm2020.1.1专业版安装指南(推荐)

    这篇文章主要介绍了pycharm2020.1.1专业版安装指南,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-08-08
  • Python实例练习水仙花数问题讲解

    Python实例练习水仙花数问题讲解

    这篇文章介绍了Python找水仙花数从分析到实现的过程,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-05-05
  • Python多图片合并PDF的方法

    Python多图片合并PDF的方法

    今天小编就为大家分享一篇关于Python多图片合并PDF的方法,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-01-01
  • 深入了解Python中描述器的使用

    深入了解Python中描述器的使用

    Python描述器是Python编程语言中的一个重要特性,它提供了一种灵活且强大的机制来控制属性访问行为。在本文中,我们将详细介绍Python描述器的概念、实现方式以及如何使用Python描述器来增强我们的Python程序
    2023-03-03
  • Python制作Windows系统服务

    Python制作Windows系统服务

    这篇文章主要为大家详细介绍了Python制作Windows系统服务的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-03-03
  • Python中的高级数据结构详解

    Python中的高级数据结构详解

    这篇文章主要介绍了Python中的高级数据结构详解,本文讲解了Collection、Array、Heapq、Bisect、Weakref、Copy以及Pprint这些数据结构的用法,需要的朋友可以参考下
    2015-03-03
  • 使用tensorflow实现线性svm

    使用tensorflow实现线性svm

    这篇文章主要为大家详细介绍了使用tensorflow实现线性svm的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09
  • Python中生成一个指定长度的随机字符串实现示例

    Python中生成一个指定长度的随机字符串实现示例

    这篇文章主要介绍了Python中生成一个指定长度的随机字符串,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11

最新评论