Jina AI 的 8K 向量模型上线 AWS Marketplace,支持本地部署!

news2025/2/28 7:08:46

a618e97cb0f02b364f87992b06b5e5b1.png

在当前多模态 AI 和大模型技术风头正劲的背景下,Jina AI 始终领跑于创新前沿,技术领先。2023 年 10 月 30 日,Jina AI 隆重推出 jina-embeddings-v2,这是全球首款支持 8192 输入长度的开源向量大模型,其性能媲美 OpenAI 的闭源 text-embedding-ada002。如今,jina-embeddings-v2 正式登陆 AWS Marketplace,为中大型企业提供了私有化部署向量模型的理想解决方案。

作为亚马逊云科技创业加速器的一员,Jina AI 与 AWS 的密切合作体现了双方在推动 AI 技术发展上的共同承诺。这次合作不仅在技术层面上实现了联合,更是对未来大模型应用落地的深入探索。

Jina AI 的创始人兼 CEO 肖涵博士,对此表示:“jina-embeddings-v2 上线 AWS Marketplace,是对私有化 AI 解决方案行业标准的一次重大推进。”

e177642d79fa9570bc19629a1769e237.png 现在,企业用户可以在 AWS Marketplace 上搜索 jina-embeddings-v2-base/small,并将它们直接部署到自己的 AWS 账户中。

AWS SageMaker 的无缝集成

在 Jina AI,我们不仅追求技术创新,更重视其在 实际应用中的高效实施。因此我们将 jina-embeddings-v2 与 AWS SageMaker 进行了无缝集成,为企业用户提供了一种高效便捷的解决方案。企业用户现在可以轻松地将 jina-embeddings-v2 模型直接部署为 SageMaker 终端节点,迅速应用到实际业务中,无需担忧技术复杂性和部署挑战。

在商业应用方面,我们特别注重 经济性和隐私保护。我们的英语 Base 模型和 Small 模型无需额外许可费,客户仅需承担 AWS 实例相关费用。这不仅确保了在 Virtual Private Cloud(VPC)内的数据隐私和安全,同时也提供了成本效益极高的解决方案。

此外,我们为不同业务场景提供多元化的选择。0.27 GB 的 Base 模型和 0.07 GB 的 Small 模型,能够服务从深度数据分析到轻量级应用的多样化需求。其中,Base 模型以其全面的语义表示能力,非常适合企业级搜索和内容推荐。而专门针对移动和边缘设备优化的 Small 模型,则突出了在速度和效率上的优势。

jina-embeddings-v2 的独特优势

  1. RAG 应用的理想选择:我们深知长文本处理的复杂性,特别是在需要广泛信息搜集和深度理解的场景中。jina-embeddings-v2 支持不同语义粒度的完整文本表示,使其成为优化 RAG 应用中处理长篇文本的理想选择。它不仅增强了文本的语义理解能力,还提供了更大的灵活性和准确性。

  2. 全球首个支持 8k 输入长度的开源模型:jina-embeddings-v2 作为全球首个支持高达 8k 输入长度的开源模型,它在多方面比肩 OpenAI 的闭源模型 text-embedding-ada-002。我们的开源模型不仅具有强大的性能,更重要的是,它为用户提供了根据自己的业务需求进行个性化调整的自由度。

  3. 更小的维度实现高效的表征:在保持与 OpenAI 的 text-embedding-ada-002 模型相当的性能表现的同时,jina-embeddings-v2 的向量维度仅为其一半,大幅降低了存储需求并提高了检索速度。

开始使用 AWS 上的 jina-embeddings-v2

要开始使用 jina-embeddings-v2,请访问 AWS Marketplace 列表并选择最适合您需求的模型。

🔗:https://aws.amazon.com/marketplace/seller-profile?id=seller-stch2ludm6vgy

以下示例可帮助您开始使用 jina-embeddings-v2 模型:

  1. Sagemaker 的实时推理:https://github.com/jina-ai/jina-sagemaker/blob/main/notebooks/Real-time%20inference.ipynb

  2. 使用 SageMaker 批量向量化:https://github.com/jina-ai/jina-sagemaker/blob/main/notebooks/Batch%20transform.ipynb

即将推出多语言向量模型

Jina AI 正在积极开发多语言向量模型,包括中英双语、德英双语的向量模型。供企业客户在各种云服务提供商(CSP)上进行私有化部署,为全球客户提供更加全面和灵活的 AI 解决方案。随着这些模型的推出,不仅将跨越语言障碍,更将为企业解锁全球机遇。

4ab6220a4510690d71a191a094255959.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1240589.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【计算机基础】通过插件plantuml,实现在VScode里面绘制状态机

📢:如果你也对机器人、人工智能感兴趣,看来我们志同道合✨ 📢:不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】 📢:文章若有幸对你有帮助,可点赞 👍…

frp内网穿透配置以及相关端口、过程解释

介绍 假设现有外网笔记本、云服务器、内网工作站三台设备,希望使用外网笔记本通过云服务器转发,访问内网工作站;这里使用frp进行内网穿透。 云服务器端配置 登录腾讯轻量型云服务器控制台,开放转发端口、bind_port以及deshboad…

【开源】基于JAVA的开放实验室管理系统

项目编号: S 013 ,文末获取源码。 \color{red}{项目编号:S013,文末获取源码。} 项目编号:S013,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、研究内容2.1 实验室类型模块2.2 实验室模块2.3 实…

黑马React18: ReactRouter

黑马React: ReactRouter Date: November 21, 2023 Sum: React路由基础、路由导航、导航传参、嵌套路由配置 路由快速上手 1. 什么是前端路由 一个路径 path 对应一个组件 component 当我们在浏览器中访问一个 path 的时候,path 对应的组件会在页面中进行渲染 2. …

【开源】基于JAVA的音乐偏好度推荐系统

项目编号: S 012 ,文末获取源码。 \color{red}{项目编号:S012,文末获取源码。} 项目编号:S012,文末获取源码。 目录 一、摘要1.1 项目介绍1.2 项目录屏 二、系统设计2.1 功能模块设计2.1.1 音乐档案模块2.1…

基于爬行动物算法优化概率神经网络PNN的分类预测 - 附代码

基于爬行动物算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于爬行动物算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于爬行动物优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神…

SSM之Mybatis框架

1 概述 1.1 什么是Mybayis 它是一款半自动的ORM持久层框架,具有较高的SQL灵活性,支持高级映射(一对一,一对多),动态SQL,延迟加载和缓存等特性,但它的数据库无关性较低。 1.2 什么是ORM ORM(…

黑马点评笔记 redis实现缓存

文章目录 什么是缓存?为什么要使用缓存 如何使用缓存功能实现缓存模型和思路代码实现 缓存更新策略数据库缓存不一致解决方案代码实现 什么是缓存? 缓存(Cache),就是数据交换的缓冲区,俗称的缓存就是缓冲区内的数据,一般从数据库中获取,存储于本地代码(例如: 例1:Static fi…

SpringBoot:kaptcha生成验证码

GitHub项目地址:GitHub - penggle/kaptcha: kaptcha - A kaptcha generation engine. kaptcha介绍 kaptcha官网(Google Code Archive - Long-term storage for Google Code Project Hosting.)对其介绍如下, kaptcha十分易于安装…

刚刚!OpenAI官宣!Sam Altman回归OpenAI 担任CEO

大家好我是二狗,就在刚刚! OpenAI宣布,Sam Altman将重新回到 OpenAI 担任CEO。 并组建由Bret Taylor(主席)、Larry Summers 和 Adam DAngelo 组成的新的初始董事会。 Sam Altman第一时间做了石锤回应: Sa…

office word 使用笔记

office word 使用笔记 1. 功能1.1 格式快捷键1.2 复选框 2 遇到过的问题2.1 表格标题和表格距离过大 1. 功能 1.1 格式快捷键 复制格式:ctrl shift c 粘贴格式:ctrl shift v 1.2 复选框 方框位置和类型:“插入——高级符号——字体”选…

pikachu靶场Table pikachu.member doesn’t exist:解决

背景: 第一次搭建pikachu靶场,搭建好后访问index.php后,尝试练习,发现界面显示Table pikachu.member doesn t exist,后来找了很多教程,没有解决,后来发现是自己没有进行初始化,给大家…

【JDK源码阅读】什么是 avoid getfield opcode ?

说明:JDK源码版本为 Oracle JDK 8 1. 背景 阅读 java.lang.String 的源码,会发现有些地方注释为/* avoid getfield opcode */,此处的代码是将当前类定义的成员变量引用为本地变量,从字面意思理解,是为了避免使用 get…

千云物流 - 使用k8s负载均衡openelb

openelb的介绍 具体根据官方文档进行安装官方文档,这里作为测试环境的安装使用. OpenELB 是一个开源的云原生负载均衡器实现,可以在基于裸金属服务器、边缘以及虚拟化的 Kubernetes 环境中使用 LoadBalancer 类型的 Service 对外暴露服务。OpenELB 项目最初由 KubeSphere 社区…

Echarts实现散点图

效果图如下&#xff1a; <html><head><meta charsetutf-8><link rel"stylesheet" href"js/leaflet1.7.1/dist/leaflet.css"/><script src"js/leaflet1.7.1/dist/leaflet.js"></script><script src"…

【C++入门到精通】 Lambda表达式 C++11 [ C++入门 ]

阅读导航 引言一、C98中的一个例子二、Lambda表达式1. Lambda表达式语法&#xff08;1&#xff09;Lambda表达式各部分说明&#xff08;2&#xff09;捕获列表说明 三、Lambda表达式的底层原理温馨提示 引言 当今软件开发行业的快速发展和日益复杂的需求&#xff0c;要求程序员…

新能源车将突破2000万辆,汉威科技为电池安全保驾护航

近年来&#xff0c;我国新能源汽车销量持续突破新高。据中汽协数据&#xff0c;1~10月&#xff0c;国内新能源汽车销量达728万辆&#xff0c;同比增长37.8%&#xff0c;市场占有率达到30.4%。随着第四季度车市传统旺季的到来&#xff0c;新能源消费需求将进一步释放&#xff0c…

机器学习/sklearn 笔记:K-means,kmeans++

1 K-means介绍 1.0 方法介绍 KMeans算法通过尝试将样本分成n个方差相等的组来聚类&#xff0c;该算法要求指定群集的数量。它适用于大量样本&#xff0c;并已在许多不同领域的广泛应用领域中使用。KMeans算法将一组样本分成不相交的簇&#xff0c;每个簇由簇中样本的平均值描…

图神经网络与图注意力网络

随着计算机行业和互联网时代的不断发展与进步&#xff0c;图神经网络已经成为人工智能和大数据的重要研究领域。图神经网络是对相邻节点间信息的传播和聚合的重要技术&#xff0c;可以有效地将深度学习的理念应用于非欧几里德空间的数据上。本期推送围绕图神经网络与图注意力网…

老生常谈之 JavaScript 中 0.1 + 0.2 != 0.3 的原因

先来一个模棱两可的说法&#xff1a;因为精度丢失、存储溢出的问题 先复习一下二进制的转换方法&#xff1a; 整数&#xff1a;除以基数&#xff0c;取余&#xff0c;自底向上小数&#xff1a;乘以基数&#xff0c;取整&#xff0c;自顶向下 接着&#xff0c;复习一下双精度…