智谱AI开源代码生成大模型 CodeGeeX4-ALL-9B

news2024/11/16 19:24:19

智谱AI 旗下的代码生成大模型 CodeGeeX 正式发布第四代开源版本:CodeGeeX4-ALL-9B,其是集代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等能力于一体的代码大模型,是目前百亿(10B)参数以下性能最强、最全能的代码大模型。

在这里插入图片描述

模型的核心功能 Demo 和使用教程已经在 GitHub 上开源,模型权重可在 HuggingFace、ModelScope、WiseModel 等大模型平台下载。

GitHub:
https://github.com/THUDM/CodeGeeX4
HuggingFace:
https://huggingface.co/THUDM/codegeex4-all-9b
ModelScope:
https://modelscope.cn/models/ZhipuAI/codegeex4-all-9b
WiseModel:
https://wisemodel.cn/models/ZhipuAI/codegeex4-all-9b

百亿参数以下性能最强的全能代码模型

CodeGeeX4-ALL-9B,集多种编程开发功能于一体,覆盖了编程的多个场景,并在多个代码评测集上表现优异,展现了强大的代码生成能力。模型支持128K上下文,处理长代码文件,并在代码检索任务中实现 100% 准确度。

此外,CodeGeeX4-ALL-9B 是唯一实现Function Call的代码大模型,在函数调用测试中成功率超过90%。

1. 性能表现评测

CodeGeeX4-ALL-9B 在多个权威代码能力评测集,如 NaturalCodeBench、BigCodeBench 上都取得了极具竞争力的表现,是百亿参数量级以下性能最强的模型,甚至超过数倍规模的通用模型,在推理性能和模型效果上得到最佳平衡。

BigCodeBench 测试结果显示,CodeGeeX4-ALL-9B 在同等尺寸下效果最好:

在这里插入图片描述

在其他代码生成、补全、推理测试集上,CodeGeeX4-ALL-9B 取得了与更大规模模型接近的水平:

在这里插入图片描述

2. 支持128K上下文

CodeGeeX4-ALL-9B 升级支持 128K 上下文,使其能够处理和利用更长代码文件、甚至是项目代码中的信息,有助于模型更深入理解复杂和细节丰富的代码。

在“大海捞针”(Needle In A Haystack, NIAH)评估中,CodeGeeX4-ALL-9B 模型展示了其在处理长达 128K 的上下文中进行代码的嵌入和检索能力,实现了 100% 的检索准确度。

在这里插入图片描述

3. 支持 Function Call

CodeGeeX4-ALL-9B 是目前唯一一个实现 Function Call 的代码大模型。

Berkeley Function Calling Leaderboard 是第一个可全面评估大模型函数调用能力的测试集。其中 AST 数据集是评估模型对 Java、JavaScript、Python 程序的调用能力;Excecutable 数据集是评估模型对真实场景 API 的函数调用能力。

CodeGeeX4-ALL-9B 在 Berkeley Function Calling Leaderboard 上进行了全面的测试,包括各种形式的函数调用、不同的函数调用场景以及函数调用可执行性的测试,得到了以下结果:在 AST 和 Exec 测试集中调用成功率超过 90%。

在这里插入图片描述

4. 插件功能全面进入项目级辅助编程

CodeGeeX 插件 v2.12.0 版本已全面接入第四代模型,带来更快的代码生成速度和多项功能创新,如自动生成项目README文件、长文本上下文记忆、跨文件分析和问答、本地模式支持,以及NL2SQL能力提升。这些功能增强了代码查找、理解和维护的效率,提升了开发体验。

在这里插入图片描述查看更多,请阅读:

CodeGeeX零基础上手实用手册:

https://zhipu-ai.feishu.cn/wiki/CuvxwUDDqiErQUkFO2Tc4walnZY

欢迎各位关注我的个人微信公众号:HsuDan,我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1909314.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

299k stars利用Public APIs提升开发效率:探索APILayer提供的开源资源

299k stars利用Public APIs提升开发效率:探索APILayer提供的开源资源 在现代软件开发中,API(应用程序接口)是实现应用间通信和功能扩展的关键工具。公共API(Public APIs)则为开发者提供了宝贵的资源&#…

2024QS世界大学学科排名(各学科详细)

2024QS全球高校学科排名附榜单: 人文与艺术相关学科全球Top10 社会科学与管理相关学科全球Top10 自然科学相关学科全球Top10 工程与技术相关学科全球Top10 生命科学与医学相关学科全球Top10

Matlab基础语法篇(上)

Matlab基础语法(上) 一、基知(一)界面介绍(二)常用快捷键(三)常用指令(四)Matlab帮助系统 二、运算基础(一)变量(二&#…

几级系统需要做等保?

正常来说只要是在运营的系统都需要做等保,无论是内网还是外网,等保常见的系统一般分成五个级别,一级最低,五级最高,不同级别的系统国家的监管程度也不一样,具体如下: 第一级:系统运…

暑期备考2024小学生古诗文大会:吃透真题和知识点(持续)

2024年上海市小学生古诗文大会的自由报名初赛将于10月19日(星期六)正式开始,还有3个多月的时间。 为帮助孩子们备考,我持续分享往年上海小学生古诗文大会真题,这些题目来自我去重、合并后的1700在线题库,每…

跨境传输需要遵守哪些准则,如何做到有效管控?

在全球化的商业环境中,跨国企业面临着数据跨境传输的挑战。随着业务的扩展,企业需要在不同国家和地区之间高效、安全地传输大量数据。选择合适的跨境传输方案对于保障数据安全、提高业务效率、遵守法律法规至关重要。 跨境传输数据需要遵守的准则和规定主…

【机器学习】特征选择:精炼数据,提升模型效能

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 ​💫个人格言: "如无必要,勿增实体" 文章目录 特征选择:精炼数据,提升模型效能引言为何进行特征选择&a…

消费盲返模式,让消费者真实消费的钱返利回来?

盲返模式是一种基于消费者参与的商业模式,其核心在于通过购买指定产品或服务,消费者能够获得一定比例的利润分配,但具体返利金额是不确定的,因此被称为“盲返”。这种模式以其独特的优势和创新的玩法,在电商领域尤其是…

企业微信hook接口协议,移除群成员通知

移除群成员通知 返回示例 {"flag": 0, "receiver": 0, "sender_name": "", "is_room": 1, "server_id": 15318083, "send_time": 1687688952, "sender": 1688855749266556, "referid&…

编程范式之函数式编程

目录 前言1. 函数式编程的定义2. 函数式编程的特点2.1 纯函数2.2 不可变性2.3 高阶函数2.4 惰性求值 3. 函数式编程的应用场景3.1 并行计算3.2 数据分析3.3 Web开发 4. 函数式编程的优缺点4.1 优点4.2 缺点 5. 代表性的编程语言5.1 Haskell5.2 Scala5.3 Clojure 6. 示例代码结语…

Android手机恢复出厂设置后可以恢复数据吗?

“我有一台小米 8 Lite,上周我收到了 OTA 更新作为通知。在执行此操作时,手机崩溃并进入启动循环。没有办法检索数据,所以我最终擦除了它。现在,我想问一下是否真的有任何有用的应用程序/程序可以在恢复出厂设置后从Android手机恢…

大厂面试:算法考前必看汇总(全)

hello hello~ ,这里是绝命Coding——老白~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹 💥个人主页:绝命Coding-CSDN博客 &a…

温度传感器的常见故障及处理方法

温度传感器作为现代工业、科研及日常生活中不可或缺的重要元件,其稳定性和准确性直接影响到设备的运行效率和安全。然而,由于各种因素的影响,温度传感器在使用过程中常会遇到一些故障。本文将针对这些常见故障进行分析,并提出相应…

Codeforces Round #956 (Div. 2) and ByteRace 2024(A~D题解)

这次比赛也是比较吃亏的,做题顺序出错了,先做的第三个,错在第三个数据点之后,才做的第二个(因为当时有个地方没检查出来)所以这次比赛还是一如既往地打拉了 那么就来发一下题解吧 A. Array Divisibility …

数据结构与算法:顺序表和链表

目录 一、线性表 二、顺序表 三、链表 一、线性表 线性表( linear list )是n个具有相同特性的数据元素的有限序列。线性表是一种在实际中广泛使用的数据结构,常见的线性表:顺序表、链表、栈、队列、字符串... 线性表在逻辑上是线…

IC认证介绍

IC认证是什么? IC是加拿大工业部Industry Canada的简称,作为政府机构,负责电子电器产品进入加拿大市场的认证事务。与美国的FCC相似,IC目前只在电磁干扰上做限制。一般规定:仅限制EMI,认证方式也与FCC相同…

idea http client插件上传文件,并忽略https证书验证

上传文件 ### 传临时素材 图片 POST https://qyapi.weixin.qq.com/cgi-bin/media/upload?access_token{{access_token}}&typeimage Content-Type: multipart/form-data; boundary----WebKitFormBoundarywKUX3Xj6aL5Wssnb------WebKitFormBoundarywKUX3Xj6aL5Wssnb Conten…

星间链路与星地链路

目录 一、星间链路 1.1 层内星间链路(Intra-layer ISLs) 1.2 层间星间链路(Inter-layer ISLs) 1.3 实现方式 1.3.1 微波链路 1.3.2 激光链路 二、星地链路 2.1 星地链路的关键特性 2.1.2 Ka信关站 2.1.2 Q/V信关站 2.1…

Windows 控制中心在哪里打开,七种方法教会你

在 Windows 操作系统中,控制中心的概念可能稍有些混淆,因为 Windows 通常使用“控制面板”这一术语来指代用于配置系统设置和更改硬件及软件设置的中心区域。 不过,随着 Windows 的更新,微软也在逐步将一些设置迁移到“设置”应用…

前端面试题30(闭包和作用域链的关系)

闭包和作用域链在JavaScript中是紧密相关的两个概念,理解它们之间的关系对于深入掌握JavaScript的执行机制至关重要。 作用域链 作用域链是一个链接列表,它包含了当前执行上下文的所有父级执行上下文的变量对象。每当函数被调用时,JavaScri…