小而强大!零一万物 Yi-Coder 模型震撼发布!

news2024/12/21 23:12:30

前沿科技速递🚀

在 AI 迅速发展的今天,代码生成和编辑工具已经成为开发者们追求高效开发的重要利器。近日,零一万物正式开源了 Yi-Coder 系列模型,一个专为编程任务设计的强大工具,为开发者们带来了全新的生产力提升方案。无论你是代码新手还是资深开发者,Yi-Coder 都能成为你可靠的编程伙伴。

来源:传神社区

01 Yi-Coder 系列模型简介

Yi-Coder 系列模型是零一万物 Yi 系列模型家族中的“编程小能手”,提供了 1.5B 和 9B 两种参数版本。这一模型通过 2.4 万亿高质量代码语料库训练,支持 52 种编程语言,适用于代码生成、代码补全、代码翻译等多个领域。尽管 Yi-Coder 的参数量相对较小,但其性能却超越了 CodeQwen1.5 7B、CodeGeex4 9B 等同类模型,甚至能够媲美更大规模的 DeepSeek-Coder 33B。

小参数,大能量

尽管 Yi-Coder-9B 模型的参数量小于 10B,但它在各种任务中都表现出了极高的效率。从代码生成到代码补全、调试等任务,Yi-Coder 在多个评测中成绩优异,足以满足开发者们的日常需求。模型的小体积使得它易于在本地部署,尤其适合端侧应用,开发者们可以轻松将其集成到自己日常使用的编程工具中。

128K 长序列建模

复杂的项目往往伴随着大量代码文件之间的依赖关系,Yi-Coder 的长序列建模能力允许它处理长达 128K tokens 的上下文内容。在这样的情况下,Yi-Coder 依旧能够高效捕捉代码中的长期依赖关系,使其在跨文件代码补全和复杂项目级代码理解中表现突出。

强大的代码生成和补全能力

Yi-Coder 支持 52 种主要编程语言,涵盖了从 Python 到 Java 的主流开发语言。通过结合更长的上下文建模,Yi-Coder 不仅能够完成高质量的代码生成,还能精准地完成跨文件的代码补全任务,为开发者节省了大量手动查找和填写代码的时间。

02 模型表现如何?数据告诉你!

LiveCodeBench:Yi-Coder-9B-Chat 在 LiveCodeBench 评测平台上的通过率高达 23.4%,成为唯一一个在 10B 参数以下的模型中通过率超过 20% 的产品。它甚至超越了 CodeGeex4 和 DeepSeek-Coder 等高参数模型。

图片

基准测试:在 HumanEval 和 MBPP 等流行的代码生成和推理任务中,Yi-Coder-9B-Chat 也表现突出,分别达到了 85.4% 和 73.8% 的通过率,并且是首个在 CRUXEval-O 基准测试中通过率超过 50% 的开源模型。

图片

代码编辑和跨文件代码补全:CodeEditorBench 涵盖了四个关键领域:代码调试、代码翻译、代码优化和代码需求转换。结果表明,在开源代码大语言模型中,Yi-Coder-9B-Chat 取得了优异的成绩,在 Primary 和 Plus 两个子集中始终优于 DeepSeek-Coder-33B-Instruct 和 CodeQwen1.5-7B-Chat。

图片

 CrossCodeEval 基准测试中,Yi-Coder 在有检索和无检索上下文的情况下都表现优异,展现了强大的代码补全能力,尤其适合处理跨文件依赖的代码库。

图片

图片

长序列建模表现优秀:零一万物效仿文本领域流行的长序列评测,合成了一个 128K 长序列的“Needle in the code” 评估任务,长度双倍于 CodeQwen1.5 所构建的 64K 长序列评测。它通过在长代码库中随机插入一个简单的自定义函数,测试模型能否在代码库最后重复这个函数。该测试旨在检测模型 LLM 是否能从长文本中提取出这些关键信息,从而反映 LLM 其对长文本的理解基础能力。

下图全绿结果表示,Yi-Coder-9B 在 128K 长度范围内完美完成了这一任务。

图片

数学推理能力:Yi-Coder 还可以通过编程解决复杂的数学推理问题。在代码辅助解题的测试中,Yi-Coder-9B 的准确率达到 70.3%,远超同类模型。

图片

03 使用实例

当我让模型编写一个快排算法时,输出如下:

图片

04 模型下载

传神社区:

https://opencsg.com/models/01AI/Yi-Coder-1.5B

https://opencsg.com/models/01AI/Yi-Coder-1.5B-Chat

https://opencsg.com/models/01AI/Yi-Coder-9B

https://opencsg.com/models/01AI/Yi-Coder-9B-Chat

blog:

https://01-ai.github.io/

欢迎加入传神社区

•贡献代码,与我们一同共建更好的OpenCSG

•Github主页

欢迎🌟:https://github.com/OpenCSGs

•Huggingface主页

欢迎下载:https://huggingface.co/opencsg

•加入我们的用户交流群,分享经验

图片

扫描上方二维码添加传神小助手


“      关于OpenCSG

开放传神(OpenCSG)成立于2023年,是一家致力于大模型生态社区建设,汇集人工智能行业上下游企业链共同为大模型在垂直行业的应用提供解决方案和工具平台的公司。

关注OpenCSG

图片

加入传神社区

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2119702.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

记录|C#的软件图标更换

目录 前言一、软件界面的图标二、软件外的图标更新时间 前言 参考文章: 自己开发出的软件,肯定要更换图标,无论是软件打开前还是软件上的。如下图: 一、软件界面的图标 直接在Form的属性中进行icon的更换【如下图:】…

2024年8款好用的图纸加密软件推荐|有效的图纸加密方法分享

在如今信息化迅速发展的时代,图纸作为企业的核心资产之一,特别是工程、制造、建筑等领域的CAD图纸,一旦泄露可能给企业带来巨大的经济损失和竞争风险。因此,如何有效地保护图纸安全,防止泄密,成为了每个企业…

记录:uniapp直播的弹幕的样式修改与发送弹幕会自动滚动到底部两个技巧

1、在直播页面的弹幕评论中,我们希望的样式是: 观众名字:评论 而且颜色有所区分,并在同一行显示 2、我们希望在发弹幕的时候可以回自动滚动到自己发的内容那里 一:弹幕样式修改 因为是小白,前端对于样式这…

Machine Learning Specialization 学习笔记(1)

文章目录 前言一、监督学习二、无监督学习三、一些基本概念线性回归模型简单线性回归多元线性回归模型训练模型评估应用 损失函数 (cost function)梯度下降 (gradient descent)多类特征(multiple features)…

微积分复习笔记 Calculus Volume 1 - 1.5 Exponential and Logarithmic Functions

1.5 Exponential and Logarithmic Functions - Calculus Volume 1 | OpenStax

JavaScript(进阶篇)

🌏个人博客主页:心.c 前言:今天讲解的是JavaScript进阶,希望大家可以有所收获,话不多说,开干! 🔥🔥🔥文章专题:JavaScript 😽感谢大家…

Numba坐标索引(CPU + 多线程)

文章目录 一、测试样本 —— 创建样本mask,具有 N 个唯一像素值,每个值有 M 个坐标。二、加速方法(1)多线程加速 —— 每次提取一个像素值,然后遍历图像,匹配并判断其与初始化坐标的关系。(2&am…

传输层 I(传输层提供的服务、UDP协议)【★★★★】

(★★)代表非常重要的知识点,(★)代表重要的知识点。 运输层是整个网络体系结构中的关键层次之一。一定要弄清以下一些重要概念: (1) 运输层为相互通信的应用进程提供逻辑通信。 (2) 端口和套接字的意义。 …

OpenCV 之 模版匹配多个对象、图片旋转 综合应用

引言 在图像处理和计算机视觉中,模板匹配是一种常用的技术,用于在一幅较大的图像中查找与给定模板图像相似的部分。然而,在实际应用中,目标物体可能会出现在不同的角度,这就需要我们在匹配之前对模板进行旋转处理。本…

[AHK]动态创建带ListBox的窗口,答选择题的界面

根据传入的窗口标题、提示信息(题干)、列表(选项)生成一个带ListBox的窗口(向导界面)。 AHK v1代码 if(A_ScriptFullPath=A_LineFile)MsgBox % ListBox("窗口标题", "这是一个生成listbox的Demo", "a|b|c|d|",3) return ;-------------…

清华智普ChatGlm批量API多线程写文章软件【glm-4-flash的key免费无限写 】

清华智普GLM-4-Flash经全面测评,在语义理解、数学逻辑、逻辑推理、代码执行以及广泛知识覆盖等方面,其表现显著超越了Llama-3-8B模型。 清华智普GLM-4-Flash模型还具备多种核心功能,包括但不限于流畅的多轮对话能力、内置的网页浏览功能、直…

线上购物商城小程序,uniapp,PHP语言开发在线购物商城小程序

前言: 商城小程序能够帮助商家降低成本、提高效率,为用户提供更加便捷和个性化的购物体验,是移动互联网时代的一种高效商业工具。 一、商城小程序功能有哪些? 基础功能需求 用户注册与登录 - 用户可以通过手机号、微信等方式进…

【第25章】Spring Cloud之Sentinel控制台详解

文章目录 前言一、实时监控二、簇点链路三、流控规则四、熔断规则五、热点规则六、系统规则七、授权规则八、集群流控九、机器列表总结 前言 前面我们详细介绍了Sentinel控制台的安装过程,这里我们来了解各个菜单的功能作用。 一、实时监控 同一个服务下的所有机器…

【网络安全】分析JS文件实现账户接管

未经许可,不得转载。 文章目录 正文正文 网站使用的是简单的OTP(一次性密码)验证机制,通过用户注册时提供的电子邮件发送邮箱验证码。在功能有限的情况下,我选择去分析网站加载的JavaScript文件。 我发现了一个名为 saveJobseekerPasswordInCache 的函数: 这个函数虽然…

等待实质审查的商标可以用吗!

申请注册商标受理书下来后,会有一个等待实质审查,这个审查出来就会出现要么通过初审,要么驳回,要么部分驳回,普推知产商标老杨发现时间大约是三个月左右,所以基本从申请3个月左右就知道结果了。 申请注册商…

智算时空 重塑视界│智汇云舟2024视频孪生产品发布会圆满举行,多个“全球首款”重磅亮相

​秋风送爽,丹桂飘香。9月6日,由北京智汇云舟科技有限公司主办(简称:智汇云舟),北京北科软科技有限公司(简称:北科软)、北京恒升联合科技有限公司(简称&#…

【北京迅为】《STM32MP157开发板使用手册》- 第十一章 编译U-Boot

iTOP-STM32MP157开发板采用ST推出的双核cortex-A7单核cortex-M4异构处理器,既可用Linux、又可以用于STM32单片机开发。开发板采用核心板底板结构,主频650M、1G内存、8G存储,核心板采用工业级板对板连接器,高可靠,牢固耐…

TPM管理培训为何难以落地?原因解析与解决之道

近年来,TPM管理被视为提升设备效率、减少故障率、降低生产成本的关键。然而,尽管TPM的理念被广泛接受,其在实践中的落地却常常面临各种挑战。本文,深圳天行健企业管理咨询公司将深入解析TPM管理培训难以落地的根本原因&#xff0c…

微信小程序登录与获取手机号 (Python)

文章目录 相关术语登录逻辑登录设计登录代码 相关术语 调用接口[wx.login()]获取登录凭证(code)。通过凭证进而换取用户登录态信息,包括用户在当前小程序的唯一标识(openid)、微信开放平台账号下的唯一标识&#xff0…

华为防火墙 nat64

如果设备接收到的IPv6报文的前缀是设备为NAT64定义的前缀,说明报文的目的地址是IPv4网络,报文将经过NAT64处理后被转发至IPv4网络。 如果设备接收到的IPv6报文的前缀不是设备为NAT64定义的前缀,说明报文的目的地址是IPv6网络,报文…