零门槛,不等待!立刻领取 Embedding API 密钥及 1 万免费 tokens!

news2024/11/25 10:37:29

e6d24a53b324b66a2b59e9c4387b1d00.png2023 年 10 月 30 号,Jina AI 正式发布了 jina-embeddings-v2,是全球首个唯一支持 8K(8192)输入长度的开源向量大模型,今天,我们趁热打铁,为企业和开发者提供 Embedding API,即插即用!

借助该 API,开发者可以用于改进检索增强生成 (RAG) 系统的效果,用以解决大型语言模型的上下文长度限制、幻觉问题和知识注入问题。

现在我们提供了其 英文版本 的免费 API 试用方案:

新用户无需注册,打开网页 https://jina.ai/embeddings/,即刻免费获取 API 密钥,该密钥包含 10,000 tokens 的使用额度。

现有模型的限制

  1. 现有开源模型的长度限制:当前主流的开源向量模型,如 BERT 和 GPT 系列,受限于最多 512 个 token 的输入长度限制。这意味着长文本必须被截断或分割,从而破坏了文本的完整性和内在的引用关系网络。这种文本切割会直接影响下游任务的效果,如文本分类、问答系统和文本摘要。特别是在信息检索中,我们就只能利用原文档里排名靠前 top-k 的文本片段,送回 LLM 里进行处理,这对于需要全面理解和生成回应的任务来说,远远不够。

  2. 商用 8k 长度模型选择受限:目前市面上唯一的商用的长文本向量模型是 OpenAI 的专有模型 text-embedding-ada-002,由于该模型是闭源的,我们无法进行根据具体业务数据做个性化微调。

  3. RAG 系统需要高性能向量模型:通常用于解决大模型的上下文长度限制、幻觉问题和知识注入问题的 RAG 系统,其性能极大依赖于其核心组件——Embedding 模型的效能。如果 Embedding 模型在文本向量的提取过程中表现不佳,则即便 RAG 系统在其他方面设计得当,最终输出也难以达到预期水平。

为什么选择 jina-embeddings-v2

  1. 突破长文本向量瓶颈:Jina-embeddings-v2 是目前市场上首个并且唯一支持 8k 输入长度的开源向量模型,有效突破了长文本向量化的技术瓶颈。

  2. 更小的维度实现高效的表征:在保持精确表征的同时,jina-embeddings-v2 的向量维度仅为 text-embedding-ada-002 的一半(768 vs 1536),这种高效的向量表征不仅减少了存储需求,同时提高了检索速度。

  3. RAG 应用的最佳选择:jina-embeddings-v2 允许开发者对文本信息进行不同语义颗粒度的完整表示,为长文本提供了完整的语义理解,使其成为优化 RAG 场景下处理长篇文本信息的理想选择。

具体技术细节可以在我们的技术报告里了解:https://arxiv.org/abs/2310.19923

低成本高性能长输入:OpenAI API 的 1:1 替换方案

对于已经在使用 OpenAI Embedding API 的开发者和企业来说,切换到 jina-embeddings-v2 将是非常丝滑的。我们确保了 API 输入输出格式与 OpenAI API 保持完全一致,可以无缝替换 —— 无需修改现有代码,只需将代码中的 openai.com 替换成 jina.ai,就能立刻享受到更低的成本和更长的输入支持。

b9e509a2e2c23984372e347bb882d864.png

f39b50c5987eb87848a1afc0d5b96f36.jpeg

完全兼容的 API,支持众多编程语言,丰富的代码样例 —— jina-embeddings-v2 为你的项目提供了强大的后盾,并且一切简洁明了,开箱即用。所以,不要犹豫,立刻开始免费试用吧!

根据 MTEB 排行榜,与 OpenAI 的 text-embedding-ada-002 相比,jina-embeddings-v2 展现出不俗的实力。值得注意的是,jina-embeddings-v2 在文本分类任务、检索任务、检索重排任务、和文本摘要任务上的得分都超过了 text-embedding-ada-002。

277a4c7fcb38bb6ebd60985981d7f82b.png

jina-embeddings-v2 vs text-embedding-ada-002 性能比较

在成本敏感的当下,每分每秒的计算资源都意味着成本。而现在 jina-embeddings-v2,提供比 text-embedding-ada-002 同等甚至更优的服务,但 性价比更高,并且用得越多,省得越多!当数据量攀升,其中的成本差异就转化为了企业和开发者的巨大优势,让他们能够在不牺牲任何性能的前提下,大幅度减少支出。

开局送神装,API 免费试用

为了让你直观体验到 jina-embeddings-v2 的卓越性能,我们提供了 API 免费试用方案:每位用户,无需注册,打开网页即可免费获取 API 密钥,该密钥包含 10,000 tokens 的使用额度。这足够你将我们的模型运用到实际场景中测试,全面检验其性能,确保它能为你的项目带来价值。

访问我们的 https://jina.ai/embeddings/ 以查看更多模型选择、请求参数和返回格式的详细信息。

27be73c24a1c6b899a6a67a9a19b202d.png

如果您的 API 密钥需要更多 tokens,可以在网页选择“充值”选项,并按需添加 tokens,也可以添加文末小助手,我们的支持团队随时准备帮助您解决任何问题。

554968d912a6ff278cb45a36b0204b73.png

6ef3a63690b98834681e35b721773835.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1179558.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Rabbit的高可用机制

RabbitMQ是一个消息中间件,提供了多种高可用机制来确保系统在出现故障时仍能保持可用性。以下是RabbitMQ的一些高可用机制: 镜像队列(Mirrored Queues): 作用: 镜像队列可以在集群中复制队列的消息到多个节…

SpringBoot整合定时任务遇到的多实例问题

唠嗑部分 是这样,前几日完善了定时任务的日志记录,今日切换了服务器,多部署了一个节点,使用nginx负载均衡,但是查看日志却发现了如下情况 那糟糕了,传说中的多实例问题出现了,今天我们就来聊聊…

HTML5的语义元素

HTML5语义元素&#xff1a; HTML5提供新的语义元素来明确一个web页面的不同部分&#xff1a;<head>、<nav>、<section>、<article>、<aside>、<figcation>、<figure>、<footer>。 1&#xff09;、<section>元素&#x…

11、Python文件操作:文件读写、文件对象方法、with语句

文章目录 文件读写模式文件对象方法with语句在Python中,文件操作是一项基本技能,它允许你读写文件,并与文件系统进行交互。这篇文章将详细介绍如何使用Python进行文件读写,涉及不同的文件模式,文件对象的方法,以及如何使用with语句来管理文件资源。 文件读写模式 在Pyt…

10、Python列表深入:列表推导式、列表常用方法、多维列表

文章目录 列表推导式列表常用方法多维列表列表是Python中非常灵活的内置数据类型,它们可以包含任意类型的对象,从数字到字符串甚至是其他列表。在这篇文章中,我们将深入探讨列表推导式、列表的常用方法以及多维列表的使用。 列表推导式 列表推导式提供了一种简洁的方法来创…

Django初窥门径-自定义用户模型

前言 自定义用户模型在Django应用中是一个重要的话题&#xff0c;它涉及到如何根据您的项目需求以及特定的用户身份验证和授权需求来调整用户模型。在以下前言中&#xff0c;我将讲述为什么自定义用户模型是如此重要以及其潜在的优势&#xff1a; 随着Web应用的不断发展&…

只改一行语句,锁这么多?

&#x1f449;导读 这篇文章我想来聊聊 MySQL 的锁是怎么加上的&#xff0c;为啥想聊这个呢&#xff1f;主要是因为业务中我们或多或少都会使用到锁&#xff0c;毕竟锁是保障我们数据安全性的关键法宝。但是由于不了解原理&#xff0c;往往可能导致我们在”刻意“或者”无意“的…

JavaScript从入门到精通系列第三十篇:详解JavaScript中的正则表达式语法

文章目录 前言 1&#xff1a;概念回顾 2&#xff1a;正则表达式 一&#xff1a;正则表达式 1&#xff1a;正则表达式字面量 2&#xff1a;检查是否有a或者b 3&#xff1a;检查是否有字母 4&#xff1a;检查是否有abc/aec/afc 5&#xff1a;检查除了ab 大神链接&#x…

Python教程:打印自己的名字

要打印的名字是&#xff1a;PYTHON …######… …#…#… …######… …#… …#… …#…#… …#…#… …##… …##… …##… …######… …##… …##… …##… …##… …#…#… …#…#… …######… …#…#… …#…#… …######… …#…#… …#…#… …#…#… …######… ……

【Spring实战——构建Spring Web应用程序】1.10 处理表单

引言 Web应用功能 ○ 提供内容 ○ 用户填写表单 ○ 提交数据 Spring MVC的控制器提供了 ○ 处理表单展示 ○ 用户提交数据的支持 在Spittr应用中&#xff0c;需要一个注册表单供新用户使用。SpitterController是一个新的控制器&#xff0c;目前只有一个请求处理方法用于展示…

LInux-0.11

文章目录 前言学习资料正文 前言 B站视频链接 linux 0.11 内核代码 学习资料 正文 一个山区512字节

稀土/铜催化剂电催化CO2制C2+或CH4

在电化学CO2还原反应&#xff08;CO2RR&#xff09;中&#xff0c;合理调控反应途径以生成所需产物是最重要的挑战之一。基于此&#xff0c;中国科学院化学研究所韩布兴院士和朱庆宫研究员等人报道了一系列稀土-铜混合相催化剂&#xff0c;通过调整催化剂的组成和结构&#xff…

Nodejs的安装以及配置(node-v12.16.1-x64.msi)

Nodejs的安装以及配置 1、安装 node-v12.16.1-x64.msi点击安装&#xff0c;注意以下步骤 本文设置nodejs的安装的路径&#xff1a;D:\soft\nodejs 继续点击next&#xff0c;选中Add to PATH &#xff0c;旁边的英文告诉我们会把 环境变量 给我们配置好 当然也可以只选择 Nod…

工业自动化工厂PLC远程控制网关物联网应用

远程控制网关在工厂自动化领域中起到了至关重要的作用&#xff0c;特别是在工厂PLC数据通讯方面。它充当着数据传输的桥梁&#xff0c;连接了工厂中的各类设备和系统&#xff0c;实现了远程监控和控制的功能。本文将详细介绍远程控制网关在工厂PLC数据通讯中的应用。 远程控制网…

Hadoop知识点全面总结

文章目录 什么是HadoopHadoop发行版介绍Hadoop版本演变历史Hadoop3.x的细节优化Hadoop三大核心组件介绍HDFS体系结构NameNode介绍总结 SecondaryNameNode介绍DataNode介绍DataNode总结 MapReduce介绍分布式计算介绍MapReduce原理剖析MapReduce之Map阶段MapReduce之Reduce阶段 实…

Langchain-Chatchat-win10本地安装部署成功笔记(CPU)

Langchain-Chatchat&#xff08;原Langchain-ChatGLM&#xff09;基于 Langchain 与 ChatGLM 等语言模型的本地知识库问答 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM) QA app with langchain。 开源网址&#xff1a;https:…

leetcode周赛 第 370 场周赛

2923. 找到冠军 I 一场比赛中共有 n 支队伍&#xff0c;按从 0 到 n - 1 编号。 给你一个下标从 0 开始、大小为 n * n 的二维布尔矩阵 grid 。对于满足 0 < i, j < n - 1 且 i ! j 的所有 i, j &#xff1a;如果 grid[i][j] 1&#xff0c;那么 i 队比 j 队 强 &…

第五章:java构造方法与对象创建

系列文章目录 文章目录 系列文章目录前言一、构造方法&#xff08;构造器&#xff09;二、对象创建流程总结 前言 构造方法由程序自动调用&#xff0c;完成对象初始化。 一、构造方法&#xff08;构造器&#xff09; 构造方法又叫构造器(constructor)&#xff0c; 是类的一种…

将字符串转换为日期型对象date.fromisoformat(str)

【小白从小学Python、C、Java】 【计算机等考500强证书考研】 【Python-数据分析】 将字符串转换为日期型对象 date.fromisoformat(str) 选择题 下列代码执行后&#xff0c;变量d的数据类型是? s 2023-11-01 d date.fromisoformat(s) print(f"【显示】s {s}") p…

大数据毕业设计选题推荐-家具公司运营数据分析平台-Hadoop-Spark-Hive

✨作者主页&#xff1a;IT研究室✨ 个人简介&#xff1a;曾从事计算机专业培训教学&#xff0c;擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…