Elasticsearch 向量搜索

news2024/9/20 1:30:58

目标记录

["你好,我的爱人","你好,我的爱妻","你好,我的病人","世界真美丽"]

搜索词

爱人

预期返回

["你好,我的爱人","你好,我的爱妻"]

示例代码:

代码连接 es8以及bge-large-zh模型,

bge-large-zh用来将文本转换为向量数据

es用来存储向量数据,并根据向量来搜索相似度最高的文本(相似度可以用阈值调整)

from flask import Flask, request  # 导入Flask类
from FlagEmbedding import FlagModel
from elasticsearch import Elasticsearch
from elasticsearch.helpers import bulk

app = Flask(__name__)  # 实例化并命名为app实例
model = FlagModel('./models/bge/bge-large-zh', query_instruction_for_retrieval="为这个句子生成表示以用于检索相关文章:")
# 创建Elasticsearch客户端对象
es = Elasticsearch(hosts="http://localhost:9200")
es.ping()


@app.route('/ins', methods=['POST'])
def index():    
    data = request.get_json()
    print(data)
    strs = data["strs"]
    documents = []
    for str in strs:            
        print(str)
        tmp = model.encode(str)
        documents.append({
            "general_text": str,
            "general_text_vector": tmp,
            # "domain":"001"
        })

    documents
    bulk(es, documents, index="demo")

    return success(1)

@app.route('/search', methods=['POST'])
def search():
    data = request.get_json()
    doc_vector = model.encode(data["name"])
    results = es.search(
        index="demo",
        source=[
            "general_text",            
        ],
        min_score= 1.83,
        query={
            "script_score": {
                "query": { "match_all": {} },
                "script": {
                    "source": "cosineSimilarity(params.queryVector, 'general_text_vector') + 1.0",
                    "params": {
                        "queryVector": doc_vector.tolist()
                    }
                }
            }
        },
        size=1000
    )
    # return results
    return results['hits']['hits']


def success(data):
    return {
        "status": "success",
        "result": data
    }


def fail(data):
    return {
        "status": "fail",
        "result": data
    }

if __name__ == "__main__":
    # Run
    port = 5000
    app.run(host='127.0.0.1', port=port, debug=False, use_reloader=False)



es存储数据

搜索结果

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1553517.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企业微信知识库:从了解到搭建的全流程

你是否也有这样的疑惑:为什么现在的企业都爱创建企业微信知识库?企业微信知识库到底有什么用?如果想要使用企业微信知识库企业应该如何创建?这就是我今天要探讨的问题,感兴趣的话一起往下看吧! | 为什么企业…

踏入网页抓取的旅程:使用 grequests 构建 Go 视频下载器

引言 在当今数字化的世界中,网页抓取技术变得越来越重要。无论是获取数据、分析信息,还是构建自定义应用程序,我们都需要从互联网上抓取数据。本文将介绍如何使用 Go 编程语言和 grequests 库来构建一个简单的 Bilibili 视频下载器&#xff…

小米汽车正式发布:开启智能电动新篇章

随着科技的不断进步,汽车产业正经历着前所未有的变革。智能电动汽车作为这一变革的重要方向,正吸引着越来越多的目光。在这个充满机遇和挑战的时代,小米汽车凭借其卓越的技术实力和深厚的市场底蕴,终于迈出了坚实的一步。今天&…

FSV13罗德与施瓦茨FSV13频谱分析仪

181/2461/8938产品概述: 罗德与施瓦茨 FSV13 是一款速度极快且多功能的信号和频谱分析仪,适用于从事射频系统开发、生产、安装和维修工作的注重性能、注重成本的用户。 在开发应用中,罗德与施瓦茨 FSV13 凭借其出色的射频特性、同类产品中无…

论文笔记:分层问题-图像共注意力问答

整理了2017 Hierarchical Question-Image Co-Attention for Visual Question Answering)论文的阅读笔记 背景模型问题定义模型结构平行共注意力交替共注意力 实验可视化 背景 视觉问答(VQA)的注意力模型在此之前已经有了很多工作,这种模型生成了突出显示…

EDA 全加器设计及例化语句应用

文章目录 前言一、全加器是什么?二、使用步骤1.半加器2.全加器1.新建一个全加器工程2.添加半加器的.v文件到全加器工程中3.新建全加器.v文件,写程序,调用半加器.v文件 完成例化 三、仿真效果总结 前言 提示:这里可以添加本文要记…

【Linux】体验一款开源的Linux服务器运维管理工具

今天为大家介绍一款开源的 Linux 服务器运维管理工具 - 1panel。 一、安装 根据官方那个提供的在线文档,这款工具的安装需要执行在线安装, # Redhat / CentOScurl -sSL https://resource.fit2cloud.com/1panel/package/quick_start.sh -o quick_start…

腾讯云邮件推送功能有哪些?如何有效使用?

腾讯云邮件推送如何设置?怎么用邮件推送做高效营销? 腾讯云作为业界领先的云服务提供商,其邮件推送功能在便捷性、稳定性和安全性上都有着出色的表现。那么,腾讯云邮件推送功能究竟有哪些呢?让AokSend来探个究竟。 腾…

基于Python的电商特产数据可视化分析与推荐系统

温馨提示:文末有 CSDN 平台官方提供的学长 QQ 名片 :) 1. 项目简介 利用网络爬虫技术从某东采集某城市的特产价格、销量、评论等数据,经过数据清洗后存入数据库,并实现特产销售、市场占有率、价格区间等多维度的可视化统计分析,并…

愚人节海外网红营销:如何避免“愚人”变“愚己”?

2024年愚人节即将到来,这个一年一度的日子既是欢乐的时刻,也是一个对品牌来说充满挑战的时刻。在这一天,人们习惯性地开展各种恶作剧和愚人行为,而对于企业和品牌来说,通过海外网红营销参与其中,既是一种与…

C#OpenCvSharp YOLO v3 Demo

目录 效果 项目 代码 下载 效果 项目 代码 using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Windows.Forms; using OpenCvSharp; using S…

010_documentation_in_Matlab中的帮助与文档

Matlab中的帮助与文档 1. 前言 一眨眼已经写了十篇文章。 000在Matlab中使用Python包CoolProp001Matlab运行时间测试与时间复杂度分析002避免使用for循环003Matlab中的向量约定004Matlab中的矩阵约定005Matlab中的数组索引006Matlab中的逻辑数组索引007Matlab学习的启动与加…

OceanBase OBCA 数据库认证专员考证视频

培训概述 OceanBase 认证是 OceanBase 官方推出的唯一人才能力认证体系,代表了阿里巴巴及蚂蚁集团官方对考生关于 OceanBase 技术能力的认可,旨在帮助考生更好地学习 OceanBase 数据库产品,早日融入 OceanBase 技术生态体系,通过由…

SpringBoot Redis 之Lettuce 驱动

一、前言 一直以为SpringBoot中 spring-boot-starter-data-redis使用的是Jredis连接池,直到昨天在部署报价系统生产环境时,因为端口配置错误造成无法连接,发现报错信息如下: 一了解才知道在SpringBoot2.X以后默认是使用Lettuce作…

换芯片流程

1寻找芯片包 2.在这里改芯片 3.改芯片容量 4.改芯片启动文件 启动文件有且只能有1个 这里是把MD删掉改HD 5.改仿真

CDLF20-80不锈钢立式多级泵

在工业应用中,泵的作用至关重要。它不仅需要稳定地提升流体,还要确保在各种工况下都能保持高效和耐用。在众多类型的泵中,不锈钢立式多级泵由于其出色的性能和广泛的适用性,成为了工程师和技术人员的首选之一。特别是像CDLF20-80这…

33.HarmonyOS App(JAVA)鸿蒙系统app数据库增删改查

33.HarmonyOS App(JAVA)鸿蒙系统app数据库增删改查 关系数据库 关系对象数据库(ORM) 应用偏好数据库 分布式数据库 关系型数据库(Relational Database,RDB)是一种基于关系模型来管理数据的数据库。HarmonyOS关系型…

小米还涉足了哪些领域

小米作为一家全球性的移动互联网企业,其业务领域相当广泛,除了核心的智能手机业务外,还涉足了许多其他领域。以下是对小米涉足领域的简要介绍: 智能硬件与IoT平台:小米是全球领先的智能硬件和IoT平台公司,致…

Webpack生成企业站静态页面 - ajax请求

一些项目因需求不同,如需SEO或小项目,使用angular、react或vue就大材小用了。可以通过webpack、gulp这些构建工具,也能快速完成html页面开发,并且也能使用less/sass/styus等样式预编译功能,以及将js、html分模块、分组…

WhatsApp防封指南:封号原因与解封方法

相信各位小伙伴已经发现,WhatsApp新一轮风控已经启动,不少小伙伴已经受到封号潮的冲击。无论是老号还是新号都难以幸免。为了防止WhatsApp客户数据和聊天信息的丢失,针对封号的防封攻略请收藏! 一、WhatsApp被封的8个原因 1、被过…