Meilisearch 和 Ollama 实现文本向量搜索

news2024/11/23 19:28:48

Meilisearch 是一个开源、快速、简洁的全文搜索引擎,专为构建高性能、实时的搜索功能而设计。其主要特点如下:

  1. 极速搜索:Meilisearch 使用反向索引来加速搜索查询,因此能够在海量数据中提供毫秒级的响应时间,尤其适合实时搜索需求。

  2. 智能搜索:Meilisearch 支持模糊搜索、拼写纠错、同义词匹配、结果排序等功能,使得用户在搜索时无需提供完全准确的关键词。

  3. 即时更新:它支持对数据的实时更新,任何数据变动都会立即反映在搜索结果中,适合频繁变动的数据集。

  4. 轻量级:Meilisearch 采用 Rust 编写,内存占用较低,部署和使用都非常简单。通过一个简单的 RESTful API 即可操作,无需复杂的配置和维护。

  5. 多语言支持:Meilisearch 支持多种语言的文本处理和分析,包括词形还原、停用词处理等。对于不同语言,它可以自适应提供准确的搜索结果。

  6. 搜索体验优化:它不仅支持传统的精确匹配,还能根据用户的搜索意图返回最相关的结果,提升用户体验。

  7. 开源和可扩展性:由于是开源项目,开发者可以根据需要对其进行自定义扩展,并且有一个活跃的社区持续维护和改进。

Meilisearch 非常适合用于电商、博客、文档管理等需要提供快速搜索体验的应用场景。

1. Meilisearch 设置

1.1 部署 Meilisearch

首先,我们使用 Docker Compose 来启动 Meilisearch。创建一个 docker-compose.yml 文件,内容如下:

version: '3'  
services:  
  meilisearch:  
    container_name: meilisearch  
    image: getmeili/meilisearch:v1.8  
    environment:  
      - http_proxy  
      - https_proxy  
      - MEILI_MASTER_KEY=${MEILI_MASTER_KEY:-masterKey}  
      - MEILI_NO_ANALYTICS=${MEILI_NO_ANALYTICS:-true}  
      - MEILI_ENV=${MEILI_ENV:-development}  
      - MEILI_LOG_LEVEL  
      - MEILI_DB_PATH=${MEILI_DB_PATH:-/meili_data/data.ms}  
    ports:  
      - ${MEILI_PORT:-7700}:7700  
    networks:  
      - meilisearch  
    volumes:  
      - ./meili_data:/meili_data  
    restart: unless-stopped  
networks:  
  meilisearch:  
    driver: bridge  

1.2 配置环境变量

创建一个 .env 文件,用来存储 Meilisearch 的一些配置:

MEILI_MASTER_KEY=vhcdWXs31gt3cB76  
MEILI_NO_ANALYTICS=true  
MEILI_ENV=development  
MEILI_LOG_LEVEL=info  
MEILI_DB_PATH=./data.ms  
MEILI_PORT=7700  

参数说明
MEILI_MASTER_KEY
Meilisearch 的主密钥,用于身份验证。
MEILI_NO_ANALYTICS
禁用分析功能。
MEILI_ENV
Meilisearch 环境设置,development 表示开发环境。
MEILI_LOG_LEVEL
设置日志级别为 info,用于输出一般信息。
MEILI_DB_PATH
数据库路径,指定 Meilisearch 存储数据的位置。
MEILI_PORT
Meilisearch 运行时的端口号。

1.3 启动 Meilisearch

有了 docker-compose.yml.env 文件后,只需要运行以下命令即可启动 Meilisearch:

docker-compose up -d  

2. Ollama 设置

Ollama 是一个支持本地部署的大语言模型平台,可以帮助开发者通过 API 访问 AI 模型,并进行高效的自然语言处理任务。它通常用于构建自定义的 AI 应用和高级搜索功能,比如与 Meilisearch 集成进行向量搜索。Ollama 支持多种语言模型,并提供灵活的配置选项,允许开发者在本地或私有云环境中运行这些模型,避免了将数据发送到外部服务器的风险。

与 Meilisearch 集成时,Ollama 可以通过处理用户的查询,将其转换为向量,并与 Meilisearch 中的文档向量进行对比,从而实现高效的语义搜索。你可以通过 Ollama 的 API 定制各种自然语言任务,比如文本生成、摘要、分类等。

2.1 安装 Ollama

按照 Ollama 官方文档 的指示安装 Ollama。安装完成后,我们需要配置服务。

2.2 配置 Ollama 服务

创建一个新的 systemd 服务文件,路径为 /etc/systemd/system/ollama.service

[Unit]  
Description=Ollama Service  
After=network.target  
  
[Service]  
ExecStart=/usr/local/bin/ollama serve  
Restart=always  
User=root  
  
[Install]  
WantedBy=multi-user.target  

2.3 允许外部访问

如果你需要从外部网络访问 Ollama,需要修改服务配置,允许绑定到所有网络接口。创建 /etc/systemd/system/ollama.service.d/override.conf 文件,内容如下:

[Service]  
Environment="OLLAMA_HOST=0.0.0.0"  

接着,运行以下命令来重新加载服务并启动 Ollama:

systemctl daemon-reload  
systemctl restart ollama  

3. 配置 Meilisearch 向量搜索

3.1 激活向量搜索功能

首先,确保你激活了 Meilisearch 的向量搜索功能。你可以通过以下命令来打开这个功能:

curl -X PATCH 'https://meili.x.net/experimental-features/' \  
  -H 'Content-Type: application/json' \  
  -H 'Authorization: Bearer vhcdWXsxi11Np1gt3cB76' \  
  --data-binary '{  
    "vectorStore": true  
  }'  

3.2 配置 Meilisearch 使用 Ollama

接下来,我们将 Meilisearch 和 Ollama 结合使用。通过以下命令将 Ollama 作为 Meilisearch 的嵌入模型:

curl -X PATCH 'https://meili.x.net/indexes/posts/settings' \  
     -H 'Content-Type: application/json' \  
     -H 'Authorization: Bearer vhcdWXs3idet3cB76' \  
     --data-binary '{  
       "embedders": {  
         "default": {  
           "source": "ollama",  
           "url": "http://149.x:11434/api/embeddings",  
           "model": "nomic-embed-text",  
           "documentTemplate": "The document titled {{doc.title}} contains: {{doc.summary|truncatewords: 20}}"  
         }  
       }  
     }'  

Nomic-embed-text是一个新发布的开源文本嵌入模型,具有8192的上下文长度,能够有效处理短文本和长文本任务。该模型在性能上超越了OpenAI的text-embedding-ada-002和text-embedding-3-small,且参数量为137M,属于较小的模型。它的训练数据集包含2.35亿个文本对,支持研究人员复现和审计模型。

4. 执行向量搜索

现在你已经完成了配置,可以开始执行向量搜索查询了。下面是一个简单的查询例子:

curl -X POST -H 'content-type: application/json' \  
  -H 'Authorization: Bearer vhcdWXs3eycNmxi11Np1gt3cB76' \  
  'https://meili.x.net/indexes/posts/search' \  
  --data-binary '{  
    "q": "Cloudflare tunnel Mac 本地设置隧道指南",  
    "hybrid": {  
      "semanticRatio": 0.1,  
      "embedder": "default"  
    }  
  }'  

参数说明
source
指定嵌入器的来源,使用 Ollama 平台。
url
Ollama 提供的 API URL,用于生成嵌入向量。
model
使用的嵌入模型,nomic-embed-text 用于将文本转换为向量。
documentTemplate
文档模板,定义嵌入器如何从文档提取信息进行处理。{{doc.title}} 代表文档的标题,`{{doc.summarytruncatewords: 20}}` 代表文档摘要并截取前 20 个词。

5. 监控和维护

为了确保系统运行平稳,你可以查看 Ollama 的运行日志:

journalctl -u ollama.service -f  

还可以通过以下命令检查 Meilisearch 的设置是否正确:

curl -X GET 'https://meili.x.net/indexes/posts/settings' \  
   -H 'Authorization: Bearer vhcdWXs31Np1gt3cB76' \  
   -H 'Content-Type: application/json'  

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2203907.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SPSS 分类模型实训步骤 (以 Logistic 回归为例)

✅作者简介:2022年博客新星 第八。热爱国学的Java后端开发者,修心和技术同步精进。 🍎个人主页:Java Fans的博客 🍊个人信条:不迁怒,不贰过。小知识,大智慧。 💞当前专栏…

VBA即用型代码手册:将工作表复制到已关闭的工作簿

我给VBA下的定义:VBA是个人小型自动化处理的有效工具。可以大大提高自己的劳动效率,而且可以提高数据的准确性。我这里专注VBA,将我多年的经验汇集在VBA系列九套教程中。 作为我的学员要利用我的积木编程思想,积木编程最重要的是积木如何搭建…

接口inference

定义: 接口是用来被类实现的,实现接口的类称为实现类。实现类可以理解成所谓的子类 一个类实现接口,必须重写完全部接口的全部抽象方法,否则这个类需要定义成抽象类。 接口多继承的作用:规范合并,整合多个接…

YOLO11改进|注意力机制篇|引入局部注意力HaloAttention

目录 一、【HaloAttention】注意力机制1.1【HaloAttention】注意力介绍1.2【HaloAttention】核心代码 二、添加【HaloAttention】注意力机制2.1STEP12.2STEP22.3STEP32.4STEP4 三、yaml文件与运行3.1yaml文件3.2运行成功截图 一、【HaloAttention】注意力机制 1.1【HaloAttent…

基于组合模型的公交交通客流预测研究

摘 要 本研究致力于解决公交客流预测问题,旨在通过融合多种机器学习模型的强大能力,提升预测准确性,为城市公交系统的优化运营和交通管理提供科学依据。研究首先回顾了公交客流预测领域的相关文献,分析了传统统计方法在处理大规…

企业大文件传输之:镭速如何提升上传文件浏览器压缩效率?

互联网技术的迅猛发展带来了文件传输需求的激增,尤其是在需要在浏览器中上传大文件的场景下。为了提升传输效率并减少服务器的带宽和资源消耗,文件压缩变得尤为重要。许多开发者选择使用JSZip等开源工具来实现浏览器端的文件压缩。 不过,这些…

运动耳机选哪个品牌比较好?盘点五大高品质运动耳机推荐!

在骨传导耳机日益普及的同时,一个不容忽视的问题也逐渐暴露在大众视野之中。根据可靠消息,有超过九成的运动爱好者反馈在使用骨传导耳机时感到佩戴不适!作为一名有着5年经验的运动达人,我秉持着对消费者负责的态度,同时…

LLM 何时需要检索增强? 减轻 LLM 的过度自信有助于检索增强

洞见 检索增强(RA)技术作为减轻大语言模型(LLMs)幻觉问题的一种手段,已经受到了广泛的关注。然而,由于其带来的额外计算成本以及检索结果质量的不确定性,持续不断地应用RA并非总是最优的解决方…

【Python】Conda离线执行命令

以下链接证明了想要离线使用conda命令的方法 启用离线模式 — Anaconda documentation 基本上大部分的命令都会提供网络选项 例如creat命令 conda create — conda 24.7.1 文档 - Conda 文档

PCL 将点云投影到拟合平面

PCL点云算法汇总及实战案例汇总的目录地址链接: PCL点云算法与项目实战案例汇总(长期更新) 一、概述 点云投影到拟合平面是指将三维点云数据中的点投影到与其最接近的二维平面上。通过投影到平面,可以消除数据的高度变化或Z轴信息…

小程序会取代APP吗?——零工市场小程序和APP的区别

小程序在某些场景下有着取代了APP的潜力,特别是零工市场这样的领域中,单其中能不能完全取代还有待分析。 1.小程序无需下载,想用的时候随时打开,在零工市场领域,小程序可以快速连接求职者和雇主,满足临时工…

秋天来临,猫咪又到换毛季,掉毛严重怎么办?宠物空气净化器有用吗?

秋天到了,新一轮的宠物换毛季又来了。谁能想到这只胖猫和之前刚接回来时的皮包骨小猫是同一只!除了养了一年长了些肉外,更多的都是换毛季掉毛”膨胀“的。每天下班回家都要搞卫生,家里衣服上、地板上,目光所及之处都有…

GNU链接器(LD):PROVIDE、PROVIDE_HIDDEN关键字介绍

0 参考资料 GNU-LD-v2.30-中文手册.pdf GNU linker.pdf1 前言 一个完整的编译工具链应该包含以下4个部分: (1)编译器 (2)汇编器 (3)链接器 (4)lib库 在GNU工具链中&…

用布尔表达式巧解数字电路图

1.前置知识 明确AND,OR,XOR,NOR,NOT运算的规则 参见:E25.【C语言】练习:修改二进制序列的指定位 这里再补充一个布尔运算符:NOR,即先进行OR运算,再进行NOT运算 如下图为其数字电路的符号 注意到在OR符号的基础上,在尾部加了一个(其实由简化而来) 附:NOR的真值表 2.R-S触发…

第二十章 番外 混淆矩阵

混淆矩阵(Confusion Matrix)是一种用于描述监督学习中分类模型性能的特定表格布局。它提供了直观的方式来理解分类器的性能,特别是对于多类别分类任务。混淆矩阵通过比较实际类别标签与分类器预测的类别标签来展示分类结果。 混淆矩阵的基本…

2-118 基于matlab的六面体建模和掉落仿真

基于matlab的六面体建模和掉落仿真,将对象建模为刚体来模拟将立方体扔到地面上。同时考虑地面摩擦力、刚度和阻尼所施加的力,在三个维度上跟踪平移运动和旋转运动。程序已调通,可直接运行。 下载源程序请点链接:2-118 基于matla…

Microsoft Edge 离线安装包制作或获取方法和下载地址分享

方法一:自制压缩包 进入目录 "C:\Program Files (x86)\Microsoft\Edge\Application" 或 "C:\Program Files (x86)\Microsoft\EdgeCore\Edge版本号",将所有文件打包,再放到没有安装到 Edge 的电脑里解压,运行…

打破常规,BD仓储物流的效能提升!

当前,随着国家战略的推进,JS与民用领域的融合不断加深,物流业也步入了军民融合的新时代。在智能仓储物流方面,JS物流的智能化进展受到了BD系统的高度关注和重视。 一、建设JS仓储物流RFID基础设施 JS物流领域引入RFID技术的基础工…

入门端到端第一步!最新综述回顾基于深度学习的规划方法发展历程

这篇新的综述,系统的回顾了基于深度学习的预测和规划方法, 端到端方法的发展历程, 非常适合初学者了解领域背景. The Integration of Prediction and Planning in Deep Learning Automated Driving Systems: A Review 0. 摘要 自动化驾驶系统有潜力彻底改变个人、公共和货物…

Cesium 获取当前视角信息

通过 浏览器控制台,直接获取到当前地球视角的信息,然后通过 flyTo 跳转视角。 方法: 控制台内输入下列代码,控制台就会输出视角信息: const camera viewer.camera; const position camera.positionCartographic; c…