OpenSearch LLM智能问答版全新升级

news2025/1/23 10:28:55

阿里云OpenSearch LLM智能问答版是OpenSearch推出的一站式开箱即用的检索增强生成(RAG)云产品,帮助开发者快速构建多模态对话式搜索服务。

自2023年6月上线以来,OpenSearch LLM智能问答版已累计支持了数百家云上客户搭建RAG系统,适用于商品导购、智能客服、企业知识库等众多典型应用场景。随着AI技术日新月异的发展,OpenSearch也在进行能力升级,持续打造更优质的RAG云产品。

本文将重点介绍OpenSearch近期带来的全新升级。

内置最新开源大模型

OpenSearch LLM智能问答版新增支持最新版开源大模型。相比于去年同期发布的模型,新一代大模型的训练数据量扩展了7倍,包含的代码数量扩展了4倍,其在标准测试集上的效果也超过了众多知名模型,被称为“目前市场上最好的开源大模型”。

在RAG场景下,最新版大模型的表现同样优异。在相似的模型参数规模下,最新版大模型生成结果的冗余性大幅降低,总结能力明显提升,同时在英文场景下的表现更加出色。

第二代大模型生成结果

1.png

第三代大模型生成结果

2.png

目前,OpenSearch LLM智能问答版已全量开放最新版大模型测试,欢迎感兴趣的客户对比测试。

中文语义理解能力登顶C-MTEB榜单

语义理解是搜索的基础,也是影响RAG系统准确性的重要环节。

OpenSearch基于自主研发的稠密+稀疏混合向量模型,构建更精准的语义理解能力,目前已登顶中文向量模型C-MTEB榜单,超过众多知名国内外厂商和开源模型。

3.png

特别是在召回率指标上,OpenSearch的优势更加明显。更高的召回率保证了对话大模型能获取更充足的语料输入,从而生成更优质的答案。

多模态模型助力新一代图片理解

在电商导购、智能客服、企业知识库等场景中,大量关键信息以图片的形式呈现,图文结合的多模态展现可以大幅提升用户体验和结果准确率。

OpenSearch结合Qwen-VL-Max多模态大模型,实现了全新一代图片内容理解,打造多模态RAG系统。

其中,图片结合能力包含:

  • 图片内容理解:使用Qwen-VL-Max模型,理解文档中的图片信息,并作为文档知识参与知识库对话问答。

示例:

4.png

问题:伞是什么颜色的

回答:伞是红色的。在已知信息中提到:“这种图片展示了一个场景,其中一个人站在一个红色的雨伞下。”因此,可以确定伞的颜色是红色。

  • 文字信息OCR:识别图片中的文字信息,并作为格式化文本存储到知识库中。

示例:

5.png

问题:哲学书的名字是什么

回答:哲学书的名字是“苏格拉底的申辩”。

  • 上下文信息扩展联想:结合图片上下文的文本信息,作为图片内容的辅助描述,增强图片的理解能力。
  • 多参考图片返回:升级后的OpenSearch LLM智能问答版支持多种图片作为问答结果的参考图片,适用于操作流程图、商品信息展示等多个场景。

切片策略升级,搜索能力大幅提升

在常见的RAG框架中,知识库中的长文本文档会首先进行切片,然后进行后续的向量化以及索引构建等处理。

最新版OpenSearch LLM智能问答版支持语义切片、单句切片等多种切片策略。结合使用两种切片策略后,OpenSearch在典型场景上的准确率、召回率得到大幅提升。

切片方式

回答准确率

搜索召回率

语义切片

85%

88%

语义切片+单句切片

90%

95%

结合OpenSearch底层高性能引擎Havenask,即使单句切片产生了大量的扩展文本和向量索引,系统也可毫秒级返回最相关的文档段落,从而保障RAG系统整体的性能和效果。

未来规划

未来,OpenSearch将结合大语言模型、自然语言处理技术,持续探索智能搜索技术,并将于近期推出搜索开发工作台,支持在智能搜索、RAG场景下更灵活使用,敬请期待。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1681470.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

人工智能|深度学习——YOLOV8结构图

YoloV8相对于YoloV5的改进点: Replace the C3 module with the C2f module.Replace the first 6x6 Conv with 3x3 Conv in the Backbone.Delete two Convs (No.10 and No.14 in the YOLOv5 config).Replace the first 1x1 Conv with 3x3 Conv in the Bottleneck.Use…

免费SSL证书签发安装指南

一、签发 1.选择证书颁发机构(CA):首先,你需要找到一个提供免费SSL证书的CA。有些CA会提供永久免费的SSL证书,而有些则可能只提供有限时间的试用证书,如JoySSL就提供永久免费证书。 2.生成CSR&#xff08…

【面试干货】 两个有序数组的合并排序

【面试干货】 两个有序数组的合并排序 1、实现思想2、代码实现 💖The Begin💖点点关注,收藏不迷路💖 1、实现思想 使用两个指针分别指向两个数组的起始位置,然后逐个比较两个指针所指向的元素,将较小的元素…

云原生 初识Kubernetes的理论基础

一、k8s 的由来及其技术运用 1.1 k8s的简介 Kubernetes,词根源于希腊语的 舵手、飞行员。在国内又称k8s(因为k和s之间有8个字母,所以得名。“国内程序员的幽默”)。 作用: 用于自动部署、扩展和管理“容器化&#x…

OpenAI发布会最新消息!ChatGPT新功能发布!

关于即将发布的内容,OpenAI 官方帖子提供的唯一细节是,此次发布将更新 ChatGPT 及其最新模型 GPT-4。 OpenAI 员工程博文(Bowen Cheng)跟了个帖,「比 gpt-5 更酷」,不过又迅速删帖。 OpenAI 的葫芦里到底卖…

C 深入指针(4)

目录 一、字符指针变量 1 初始化 2 与字符串数组的区别 二、数组指针变量 1 初始化 2 二维数组传参本质 三、函数指针变量 1 初始化 2 用法 四、typedef关键字 五、函数指针数组 一、字符指针变量 1 初始化 //VS2022 x64 #include <stdio.h> int main() {…

前端 JS 经典:数组去重万能方法

前言&#xff1a;只需要掌握这一个方法&#xff0c;就可以对有任何重复的数据数组&#xff0c;进行去重了。 可以自己思考下&#xff0c;怎么对以下对象数组去重&#xff1a; const arr [{ a: 1, b: 2 },{ b: 2, a: 1 },{ a: 1, b: 2, c: { a: 1, b: 2 } },{ b: 2, a: 1, c:…

vue2 中使用audio播放音频

<audio controls ref"audioPlayer" style"width:800px;"><source :src"obj.audioUrl" /></audio> data() {return {obj: {audioUrl: require(../../../../public/audio/video.wav)}}}, 有个地方一定要注意一下. 如果不写req…

推荐丨免费的HTTPS证书在哪里可以申请?怎么申请?

当然&#xff0c;申请HTTPS证书的简化流程大致可以分为以下四个步骤&#xff1a; 1. 确定证书类型&#xff1a; - 首先&#xff0c;根据你的网站需求选择合适的HTTPS证书。常见类型包括&#xff1a;域名验证型&#xff08;DV&#xff09;、组织验证型&#xff08;OV&#xff09…

智慧校园是什么?如何定义?

智慧校园从边界上来说&#xff0c;是指以物联网为中心的智慧化的学校学习、日常生活一体化的环境&#xff0c;经过信息化手法将教育、教务办理和学校日子进行充沛交融&#xff0c;完结智慧化服务和办理的学校形式。 现在智慧校园已成未来趋势&#xff0c;我国的学校环境阅历了巨…

在springboot项目中自定义404页面

今天点击菜单的时候不小心点开了一个不存在的页面&#xff0c;然后看到浏览器给的一个默认的404页面 后端的程序员都觉得这页面太丑了&#xff0c;那么怎么能自定义404页面呢&#xff1f; 很简单&#xff0c;在我们的springboot的静态资源目录下创建一个error包&#xff0c;然…

氮气柜开门停止充氮、开门亮灯和超湿报警功能介绍

氮气柜是一种专门设计用于存储对湿度敏感的电子元器件、半导体材料、精密仪器、化学试剂等物品的设备&#xff0c;它通过注入高纯度氮气来降低内部湿度&#xff0c;以防止物品受潮或氧化。除基本功能外&#xff0c;沐渥科技新增了开门停止充氮、开门亮灯以及超湿报警这三个功能…

特征衍生-多变量交叉组合特征衍生

https://www.bilibili.com/video/BV1Kg411n7jv?p21&vd_source08e23da22e328e8950aeb24d2001d586

【AI绘画】Stable diffusion初级教程08——提示词(prompt)该如何写

今天是一篇干货&#xff0c;干的喝水的那种…… 写之前呢&#xff0c;先给大家打个比方&#xff1a;现在刚入门学习SD的相当于刚上学的小学生&#xff0c;提示词就相当于作文&#xff0c;还是英语作文&#xff0c;如果你总是抄抄抄&#xff0c;不知道作文的要点&#xff0c;语法…

笔记-Windows NFS → 中文乱码导致文件找不到

前提准备 项目中有这么一块业务 1、 脚本同步 这一环&#xff0c;是运维同事通过脚本实现的&#xff0c;所以我没去关注 2、 读取文件并上传 这一环&#xff0c;是我实现的&#xff0c;稳定运行了很长一段时间了&#xff0c;一直没出问题 中文乱码** 直到有一天&#xff0…

Typora + AliyunOSS + PicGo + OneDrive 搭建同步笔记本

文章目录 Typora AliyunOSS PicGo OneDrive 搭建同步笔记本1. 购置阿里云OSS资源2. 配置PicGo3. Typora oneDrive4. 注意 Typora AliyunOSS PicGo OneDrive 搭建同步笔记本 前记: 尝试使用Gitee和Github&#xff0c;效果都十分不理想 Gitee&#xff1a; repository仓库…

什么开放式耳机好用?2024五大爆款机型安利!

​2024年耳机的大热门毫无疑问的是开放式耳机&#xff0c;开放式耳机有着更健康的听音表现和极佳的佩戴舒适度&#xff0c;开放式设计在享受音乐的同时还可以清楚地听到外界的声音&#xff0c;这有助于在户外活动时保持对周围环境的警觉&#xff0c;增加使用时的安全性。作为一…

气膜体育馆的基础设施有哪些—轻空间

随着体育事业的迅速发展和全民健身意识的提升&#xff0c;现代体育场馆设施也在不断更新换代。新型气膜体育馆的出现&#xff0c;解决了传统体育场馆构建审核难、时间长、门槛高的问题&#xff0c;有利于构建多样化的体育场馆&#xff0c;提升人均体育场馆面积。 气膜建筑因其建…

医院内外网文件交互,关键在于安全、效率和便捷

目前&#xff0c;国内医院内外网隔离的网络建设已较为普遍&#xff0c;医院涉及大量患者信息、疾病研究、学术报告等资料&#xff0c;数据具有重要的价值&#xff0c;因此医院的内外网建设成为基本共识。 医院的内外网是相互对应而言的&#xff0c;一般来说&#xff0c;外网指医…

【Python】语句与众所周知【自我维护版】

各位大佬好 &#xff0c;这里是阿川的博客 &#xff0c; 祝您变得更强 个人主页&#xff1a;在线OJ的阿川 大佬的支持和鼓励&#xff0c;将是我成长路上最大的动力 阿川水平有限&#xff0c;如有错误&#xff0c;欢迎大佬指正 本篇博客是在之前的基础上进行的维护 目录 条…