【RAG】【vector_stores033】Elasticsearch自动检索

张开发

• 2026/6/14 6:04:50 • 15 分钟阅读

分享文章

【RAG】【vector_stores033】Elasticsearch自动检索

案例目标本案例展示了如何使用Elasticsearch向量存储与LlamaIndex实现自动检索功能。自动检索是一种高级检索技术它可以根据自然语言查询自动推断出适当的元数据过滤条件和查询字符串。通过本案例您将学习到如何使用Elasticsearch作为向量存储后端如何定义向量存储的元数据信息如何使用VectorIndexAutoRetriever实现自动检索如何让LLM自动推断元数据过滤条件如何结合语义搜索和元数据过滤实现更精确的检索自动检索根据自然语言查询自动推断元数据过滤条件向量存储使用Elasticsearch作为向量存储后端元数据过滤支持多种元数据类型的过滤条件语义搜索结合语义搜索和元数据过滤提高检索精度技术栈与核心依赖本案例使用以下技术栈和依赖LlamaIndexElasticsearchOpenAIPython核心依赖包llama-index-vector-stores-elasticsearch llama-index openai关键组件ElasticsearchStore: 连接Elasticsearch向量存储VectorIndexAutoRetriever: 实现自动检索功能VectorStoreInfo: 定义向量存储和元数据信息MetadataInfo: 描述元数据字段信息环境配置1. 安装必要的依赖包pip install llama-index-vector-stores-elasticsearch pip install llama-index2. 配置OpenAI API密钥import os import getpass os.environ[OPENAI_API_KEY] getpass.getpass(OpenAI API Key:) import openai openai.api_key os.environ[OPENAI_API_KEY]3. 导入必要的依赖import logging import sys logging.basicConfig(streamsys.stdout, levellogging.INFO) logging.getLogger().addHandler(logging.StreamHandler(streamsys.stdout)) from llama_index.core import VectorStoreIndex, StorageContext from llama_index.vector_stores.elasticsearch import ElasticsearchStore from llama_index.core.schema import TextNode from llama_index.core.retrievers import VectorIndexAutoRetriever from llama_index.core.vector_stores import MetadataInfo, VectorStoreInfo4. 启动Elasticsearch服务确保Elasticsearch服务在本地运行默认地址为 http://localhost:9200案例实现1. 定义示例数据# 定义带有元数据的文本节点 nodes [ TextNode( text( A bunch of scientists bring back dinosaurs and mayhem breaks loose ), metadata{year: 1993, rating: 7.7, genre: science fiction}, ), TextNode( text( Leo DiCaprio gets lost in a dream within a dream within a dream within a ... ), metadata{ year: 2010, director: Christopher Nolan, rating: 8.2, }, ), TextNode( text( A psychologist / detective gets lost in a series of dreams within dreams within dreams and Inception reused the idea ), metadata{year: 2006, director: Satoshi Kon, rating: 8.6}, ), TextNode( text( A bunch of normal-sized women are supremely wholesome and some men pine after them ), metadata{year: 2019, director: Greta Gerwig, rating: 8.3}, ), TextNode( textToys come alive and have a blast doing so, metadata{year: 1995, genre: animated}, ), ]2. 构建Elasticsearch向量索引# 创建Elasticsearch向量存储 vector_store ElasticsearchStore( index_nameauto_retriever_movies, es_urlhttp://localhost:9200 ) storage_context StorageContext.from_defaults(vector_storevector_store) # 创建向量索引 index VectorStoreIndex(nodes, storage_contextstorage_context)3. 定义VectorIndexAutoRetriever# 定义向量存储信息 vector_store_info VectorStoreInfo( content_infoBrief summary of a movie, metadata_info[ MetadataInfo( namegenre, descriptionThe genre of the movie, typestring or list[string], ), MetadataInfo( nameyear, descriptionThe year the movie was released, typeinteger, ), MetadataInfo( namedirector, descriptionThe name of the movie director, typestring, ), MetadataInfo( namerating, descriptionA 1-10 rating for the movie, typefloat, ), ], ) # 创建自动检索器 retriever VectorIndexAutoRetriever( index, vector_store_infovector_store_info )4. 执行自动检索查询# 查询1查找Christopher Nolan在2020年前导演的电影 results retriever.retrieve( What are 2 movies by Christopher Nolan were made before 2020? ) print(results)# 查询2查找Andrei Tarkovsky导演的科幻电影 results retriever.retrieve(Has Andrei Tarkovsky directed any science fiction movies) print(results)案例效果本案例展示了Elasticsearch自动检索的强大功能实现了以下效果自动元数据过滤系统能够根据自然语言查询自动推断出适当的元数据过滤条件语义搜索增强结合语义搜索和元数据过滤提高检索的精确度灵活查询处理可以处理各种复杂的查询场景包括多条件组合查询智能查询理解系统能够理解查询意图并自动选择最合适的检索策略关键观察对于What are 2 movies by Christopher Nolan were made before 2020?查询系统自动推断出directorChristopher Nolan和year2020的过滤条件对于Has Andrei Tarkovsky directed any science fiction movies?查询系统自动推断出directorAndrei Tarkovsky和genrescience fiction的过滤条件系统不仅应用了元数据过滤还使用了语义搜索确保检索结果的语义相关性输出示例 INFO:llama_index.indices.vector_store.retrievers.auto_retriever.auto_retriever:Using query str: science fiction Using query str: science fiction INFO:llama_index.indices.vector_store.retrievers.auto_retriever.auto_retriever:Using filters: {director: Andrei Tarkovsky} Using filters: {director: Andrei Tarkovsky} INFO:llama_index.indices.vector_store.retrievers.auto_retriever.auto_retriever:Using top_k: 2 Using top_k: 2案例实现思路本案例的实现思路如下环境准备安装必要的依赖包配置OpenAI API密钥启动Elasticsearch服务数据准备创建带有文本和元数据的TextNode对象向量存储创建使用ElasticsearchStore创建向量存储并将数据加载到Elasticsearch向量存储信息定义使用VectorStoreInfo和MetadataInfo定义向量存储和元数据信息自动检索器创建使用VectorIndexAutoRetriever创建自动检索器查询执行使用自然语言查询系统自动推断元数据过滤条件和查询字符串技术要点VectorIndexAutoRetriever是LlamaIndex提供的自动检索器它使用LLM自动推断查询参数VectorStoreInfo描述了向量存储的内容和元数据字段信息MetadataInfo定义了每个元数据字段的名称、描述和类型系统根据自然语言查询自动生成查询字符串和元数据过滤条件检索结果结合了语义搜索和元数据过滤提高了检索的精确度扩展建议基于本案例可以考虑以下扩展方向更多元数据类型扩展支持更多的元数据类型如日期、地理位置等复杂过滤条件实现更复杂的过滤条件如范围查询、模糊匹配等多语言支持扩展支持多语言查询和文档自定义提示模板自定义自动检索的提示模板提高特定领域的检索效果性能优化优化大规模数据下的检索性能可视化界面开发可视化界面方便用户使用自动检索功能结果排序优化实现更智能的结果排序算法多向量存储支持支持同时查询多个向量存储总结本案例详细介绍了如何使用Elasticsearch向量存储和LlamaIndex的VectorIndexAutoRetriever实现自动检索功能。通过定义向量存储信息和元数据信息系统能够根据自然语言查询自动推断出适当的元数据过滤条件和查询字符串。自动检索技术结合了语义搜索和元数据过滤的优点能够实现更精确、更智能的检索。它特别适合于需要处理复杂查询场景的应用如电影推荐、文档检索、知识问答等。通过本案例的学习您应该掌握了如何使用VectorIndexAutoRetriever实现自动检索以及如何定义向量存储和元数据信息。这些知识将帮助您构建更智能、更高效的检索应用。

更多文章

前端开发 2026/6/14 7:28:48

Charticulator：重新定义图表设计的布局感知可视化工具

Charticulator：重新定义图表设计的布局感知可视化工具【免费下载链接】charticulator Interactive Layout-Aware Construction of Bespoke Charts 项目地址: https://gitcode.com/gh_mirrors/ch/charticulator 在数据可视化领域，Charticulator以…

如何在Windows 11上完美复活经典游戏联机：IPXWrapper终极配置指南【免费下载链接】ipxwrapper 项目地址: https://gitcode.com/gh_mirrors/ip/ipxwrapper 还在为《星际争霸》《魔兽争霸》这些经典游戏无法在Windows 11上联机而烦恼吗？&#x1f…

张开发

前端开发 2026/5/25 7:34:02

终极免费虚拟光驱指南：WinCDEmu让ISO挂载变得如此简单

终极免费虚拟光驱指南：WinCDEmu让ISO挂载变得如此简单【免费下载链接】WinCDEmu 项目地址: https://gitcode.com/gh_mirrors/wi/WinCDEmu 你是否曾经遇到过需要打开ISO文件却不想刻录光盘的烦恼？或者需要在没有物理光驱的电脑上安装软件&#x…

张开发

【RAG】【vector_stores033】Elasticsearch自动检索

最新文章

Mac Mouse Fix终极指南：让你的普通鼠标秒变苹果触控板！[特殊字符]

mysql事务什么时候需要回滚_mysql异常处理解析

虚拟线程在Spring WebFlux中偷偷泄露数据库连接？深度剖析ThreadLocal跨虚拟线程失效的5类隐蔽漏洞，立即修复！

别再傻傻分不清了！一张图看懂NI USRP和Ettus USRP的区别与选型

从“鱼与熊掌”到帕累托最优：NSGA-II算法如何帮你做更聪明的决策？

2026年高并发AI应用架构指南：5款主流大模型API中转服务性能横评与接入实战

推荐文章

相关文章

分享文章

更多文章

Charticulator：重新定义图表设计的布局感知可视化工具

终极指南：如何使用ECAPA-TDNN构建99%准确率的说话人验证系统

蛋白质语言模型ESM：如何让AI读懂生命的密码？

M2FP实战应用：电商模特图批量处理，自动生成精准蒙版

Ventoy终极指南：如何制作一个U盘启动所有系统

设计开发管理化技术架构决策记录ADR

新手必看：通义千问1.8B-Chat模型WebUI部署常见问题解决

【PCB设计实战】Allegro DFA约束规则在高速PCB布局中的关键应用

YOLOv11s-OBB目标检测与ROS MoveIt机械臂抓取实战：从数据集标注到源码部署全解析

Venera漫画阅读器终极指南：3步解锁全网漫画自由阅读体验

如何在Windows 11上完美复活经典游戏联机：IPXWrapper终极配置指南

终极免费虚拟光驱指南：WinCDEmu让ISO挂载变得如此简单