点击蓝字 关注我们
关注并星标
从此不迷路
计算机视觉研究院
公众号ID|计算机视觉研究院
学习群|扫码在主页获取加入方式
计算机视觉研究院专栏
Column of Computer Vision Institute
6月6日,在文心大模型技术交流会(成都)上,百度智能云推出“Comate”代码助手,并正式开放邀测。借助文心大模型的理解、推理能力,“Comate”可实现代码的快速补齐、自然语言推荐代码、自动查找代码错误,全面提升开发者研发效率。未来,开发者可以通过插件等形式,在主流开发软件中使用“Comate”代码助手。目前市面上已经有很多代码助手工具,百度回脱颖而出吗?
01
背 景
早在2021年6月,为了满足未来的大模型训练任务,百度智能云开始规划全新的高性能GPU集群的建设,联合NVIDIA共同完成了可以容纳万卡以上规模的IB网络架构设计,集群中节点间的每张GPU卡都通过IB网络连接, 并在2022年4月将集群建设完成,提供单集群EFLOPS级别的算力。
2023年3月,文心一言在这个高性能集群上诞生,并不断迭代出新的能力。目前,这个集群的规模还在不断扩大。NVIDIA中国区解决方案与工程总经理赖俊杰博士:高速IB网络互联的GPU集群是大模型时代的关键基础设施。NVIDIA和百度智能云共同建成的这个国内云计算市场最大规模的高性能GPU/IB集群,将加速百度在大模型领域获得更大突破。
覆盖大模型全生命周期——更全面更全面
提供数据标注,模型训练与评估,推理服务与应用集成的全面功能服务
训练与推理性能大幅提升——更高效更高效
MLPerf榜单训练性能世界领先,千亿模型分布式并行训练加速能力和算力利用率大幅提升
快速应用编排与插件集成——更开放更开放
预置百度文心大模型与第三方大模型,支持插件与应用灵活编排,助力大模型多场景落地应用
自带敏感词过滤——更安全更安全
完善的鉴权与流控安全机制,自带敏感词过滤,机审与人审双重保障
内置文心大模型基座
技术领先
知识增强大模型,统一范式支持多类下游任务
先进并行策略支撑大模型训练、压缩与部署
可控可信的语言理解和生成能力
全场景覆盖
支持对话互动,自由问答,文案创作等能力
覆盖能源、金融、航天、工业、媒体等领域
低门槛使用便捷
一行代码调用服务
一键自动模型微调
少量数据完成多场景AI应用落地
真实可落地
提供企业级一站式客户服务
打通芯片+平台+模型+应用的四层架构
联合多家合作伙伴实现端到端应用落地
02
大模型代码助手
随着数字化转型需求增长,AI在企业中的应用也越来越多,AI开发门槛高、应用场景复杂多样、对场景标注数据依赖等问题成为AI规模化落地的挑战,而预训练大模型的出现则为人工智能带来了新的机遇与希望。
大模型作为政府和企业推进人工智能产业发展的重要抓手,在识别、理解、决策、生成等AI任务的泛化性、通用性、迁移性方面都表现出显著优势和巨大潜力。如果程序员拥有一个代码助手,可以轻松准确协助完成一些重复、简单、琐碎等的工作,已经不再是天方夜谭。
现在,越来越多的开发者都需要用到这个必备工具。当下主流的几个AI智能编程代码助手包括Github CopilotX、Codeium、Tabnine、Replit Ghostwriter和Amazon CodeWhisperer。
Github CopilotX
Copilot X是对2021年发布的Copilot进行了升级,接入GPT-4,并新增了聊天和语音等功能,在Copilot X中,你只需“动动嘴”,它就能把你的代码写了,顺便帮你把测试用例也写了,还能给你解释你看不太懂的代码片段,更能直接让它帮你DeBug,简直是程序员的贴心小助手。
随着OpenAI的GPT-4模型的发布,GitHub紧接着就发布了新版本的GitHub Copilot X,Copilot X的AI模型采用的是最新OpenAI GPT-4。GitHub Copilot X致力于改进开发者体验,将提供聊天和语音界面,支持拉取请求,回答文档问题,并通过GPT-4实现更个性化的开发者体验。使用GitHub Copilot X,它可以解释代码的用途,还可以在遇到bugs时让Copilot X尝试去修复它,甚至还可以顺带生成单元测试。
Replit Ghostwriter
Replit Ghostwriter是一款基于人工智能的代码辅助工具,它可以帮助开发者快速编写、生成、转换和解释代码,同时提供了一个在编辑器内搜索和导入开源代码的功能。Replit是一个在线的集成开发环境(IDE),它支持多种编程语言,如Python、JavaScript、Ruby等,让开发者可以在浏览器中创建、运行和分享代码。Replit还提供了多人协作、版本控制、云部署等功能,使得开发者可以轻松地构建和发布应用程序。Replit AI Ghostwriter是Replit的一个新功能,它利用了OpenAI的GPT-4模型,为开发者提供了一个基于人工智能的代码辅助工具。
但是,现在百度智能云基于文心大模型打造的新一代编码辅助工具——代码助手Comate!
在工程师开发过程中,Comate可以通过开发中的上下文、评论组合代码,通过读取声明的函数名称来预测代码。同时允许查看建议并手动编辑建议的代码,自动填充重复代码。
工作原理是通读全球GitHub存储库上的头部开源代码,收集数据并尝试找到与之相关的最佳代码,通过返回的数据不断训练提升推荐准确度。核心能力体现在单行推荐、多行推荐和自然语言转代码等方面。
单行推荐
多行推荐
自然语言转代码
经过大量内部测试,在Comate建议的代码中,30%-50%的建议代码被开发者采纳,占正式新入库代码的10%以上,并且越来越多应用到各类产品开发中。Comate支持主流IDE框架,目前已覆盖30+语言,尤其在C/C++、Python、Java、Go、PHP、JavaScript等多个主流语言表现出色。
© THE END
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
ABOUT
计算机视觉研究院
计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、目标跟踪、图像分割等研究方向。研究院始终分享最新论文算法框架,平台着重”研究“和“实践”。后期会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!
点击“阅读原文”,立即合作咨询