IEEE权威杂志特别报道一款国内大语言模型，不是百度、不是阿里、不是华为……

IEEE权威杂志特别报道一款国内大语言模型，不是百度、不是阿里、不是华为……

news2025/7/3 2:56:52

现如今，大模型早已成为街谈巷议的 AI 话题，ChatGPT 更火出了圈。NLP、CV 和多模态领域的大模型层出不穷，并朝着通用方向不断演进，让人们看到了 AGI 的希望。

在大模型时代，除了继续升级预训练、微调等技术和算法之外，构建开源开放的大模型评测体系和生态同等重要。

说来容易，但做起来很难。仅就开源而言，谷歌、OpenAI 等头部 AI 企业对自己的大模型大多并没有开源或仅开放 API 使用，正在逐渐形成壁垒。

在国内，BAT等大型互联网大厂在AI领域正持续发力，关于它们的新闻也是层出不穷。

然而，IEEE Spectrum官网发表的一则消息，却吸引了我的注意。

IEEE Spectrum 是由电气和电子工程师协会（IEEE）发行的一份学术期刊。

该杂志会刊登有关影响商业和社会的技术和科学趋势的同行评审文章。2012 年，IEEE Spectrum 被评为国家杂志奖“杰出思想领袖杂志”类别的获奖者。

大语言模型为什么一定要大？小不可以吗？北京智源人工智能研究院推出的“悟道 3.0”就在小而精上下起了功夫。

作为研究成果，悟道3.0·天鹰是首个具备中英双语知识，支持商用许可协议、国内数据合规需求的开源语言大模型。

这一模型在中英文高质量语料基础上从“0”开始训练，通过数据质量的控制、多种训练的优化方法，实现在更小的数据集、更短的训练时间获得更优的性能。

为什么要缩小模型的规模？

训练成本高昂、芯片被卡脖子、监管变态的严苛，让悟道 2.0这样的大语言模型很难实施下去。最终，他们选择生产参数较小的模型，供国内其它公司使用。

另外，开源相对较小的模型也可能是该公司的战略选择，因为它是一个非营利性研究机构，再训练一个大语言模型的投资回报很低，这样的话，很不划算。

对于较小的开源模型，运行模型输出结果的成本会比较低，可以更容易地商业化。它们特别适用于像医疗聊天机器人之类较为小众的市场。

另外，模型小，训练需要的芯片数也少，在当前芯片短缺的情况下，模型的训练不会受较大影响。

悟道3.0·天鹰模型在国内并没有引起太多关注，可能是因为其参数规模与其他可用的开源模型相似，比如Meta的LLaMA和Llama 2。

为大模型构建基础，通过开源合作促进创新，北京智源正在努力创建一个类似于Linux的开源生态系统。

希望他们再接再历，在人工智能领域上开辟一条道路。

文章来源：

https://spectrum.ieee.org/china-chatgpt-wu-dao

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/880596.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Python 基础教程，Python 是什么？

Python 基础教程，Python 是什么？

Python 的诞生是极具戏曲性的，据 Guido 自述记载，Python 语言是在圣诞节期间为了打发无聊的时间而开发的，之所以会选择 Python 作为该编程语言的名字，是因为 Guido 是 Monty Python 戏剧团的忠实粉丝。 Python 语言是在 ABC 语言的…

阅读更多...

uniapp封装组件，选中后右上角显示对号√样式（通过css实现）

uniapp封装组件，选中后右上角显示对号√样式（通过css实现）

效果： 一、组件封装 1、在项目根目录下创建components文件夹，自定义组件名称，我定义的是xc-button 2、封装组件代码 <template><view class"handle-btn"><view :class"handleIdCode 1 ? select : unSelec…

阅读更多...

RL 实践（7）—— CartPole【TPRO PPO】

RL 实践（7）—— CartPole【TPRO PPO】

本文介绍 PPO 这个 online RL 的经典算法，并在 CartPole-V0 上进行测试。由于 PPO 是源自 TPRO 的，因此也会在原理部分介绍 TPRO参考：张伟楠《动手学强化学习》、王树森《深度强化学习》完整代码下载：8_[Gym] CartPole-V0 (PPO) 文…

阅读更多...

超过2个G的视频怎么发给朋友？快来学视频压缩

超过2个G的视频怎么发给朋友？快来学视频压缩

影响视频体积大小的主要因素无非就是比特率、码率、格式以及视频时长等，当我们的视频文件过大无法通过平台或者软件发送给朋友的时候，就可以借助压缩的方法解决问题，下面就给大家分享几个压缩技巧，一起来看看吧。方法一&#xff…

阅读更多...

LeetCode 热题 100（四）：48. 旋转图像、240. 搜索二维矩阵 II、234. 回文链表

LeetCode 热题 100（四）：48. 旋转图像、240. 搜索二维矩阵 II、234. 回文链表

一.48. 旋转图像题目要求：就是一个顺时针的旋转过程。思路：观察矩阵，得出翻转前第i行的第J个元素等于翻转后倒数第i列的第J个元素，举例说明，第1行第2个元素为“2”，翻转后到了倒数第1列的第2个元素…

阅读更多...

AIGC｜AGI究竟是什么？为什么大家都在争先入场？

AIGC｜AGI究竟是什么？为什么大家都在争先入场？

一、AI大语言模型进入爆发阶段 2022年12月ChatGPT突然爆火，原因是其表现出来的智能化已经远远突破了我们的常规认知。虽然其呈现在使用者面前仅仅只是一个简单的对话问答形式，但是它的内容化水平非常强大，甚至在某些方面已经超过人类了&#…

阅读更多...

多主题自适应知识变现博客论坛，支持docker一键部署

多主题自适应知识变现博客论坛，支持docker一键部署

iblog 给大家推荐一个多主题自适应，支持付费收款的博客论坛系统，支持docker一键部署，支持企业微信通知。前端多主题自适应个人页后端 H2 console 运行命令 docker run -d --name iblog --restartalways -p 8080:8080 -e consoletrue …

阅读更多...

易服客工作室：Pixwell主题 – 现代杂志/WordPress新闻主题

易服客工作室：Pixwell主题 – 现代杂志/WordPress新闻主题

PixWell主题概述 Pixwell主题是一个强大、多用途和现代的WordPress杂志主题，具有像素完美的设计、出色的功能、完全响应和移动友好。它非常灵活，非常适合食谱、时尚、旅行、技术、个人或任何其他很棒的杂志和博客网站。该主题与 Elementor、Cooked&am…

阅读更多...

SAP MM学习笔记22- 购买发注的项目种类（明细Category）

SAP MM学习笔记22- 购买发注的项目种类（明细Category）

SAP中控制购买流程的是购买发注页面中购买发注明细行的项目种类（明细Category）栏目。・项目种类（明细Category）有： 1， 标准 2，K 受托品 3，L 外注 4，S 仕入先直送…

阅读更多...

Linux系统中基于NGINX的代理缓存配置指南

Linux系统中基于NGINX的代理缓存配置指南

作为一名专业的爬虫程序员，你一定知道代理缓存在加速网站响应速度方面的重要性。而使用NGINX作为代理缓存服务器，能够极大地提高性能和效率。本文将为你分享Linux系统中基于NGINX的代理缓存配置指南，提供实用的解决方案，助你解决在…

阅读更多...

Blender增强现实3D模型制作指南【AR】

Blender增强现实3D模型制作指南【AR】

推荐：用 NSDT编辑器快速搭建可编程3D场景将静态和动画 3D 内容集成到移动增强现实 (AR) 体验中是增强用户沉浸感和参与度的高效方法。然而，为 AR 创建 3D 对象可能相当艰巨，尤其是对于那些缺乏 3D 建模经验的人来说。与添加视频或照片 AR…

阅读更多...

智慧工地源码，PC+APP源码，项目管理端+企业监管端+数据大屏端

智慧工地源码，PC+APP源码，项目管理端+企业监管端+数据大屏端

智慧工地概念智慧工地是一种崭新的工程全生命周期管理理念，是指运用信息化手段，通过对工程项目进行精确设计和施工模拟，围绕施工过程管理，建立互联协同、智能生产、科学管理的施工项目信息化生态圈，并将此数据在虚拟…

阅读更多...

python3 0基础学习笔记

python3 0基础学习笔记

0基础学习笔记，临时有事暂停后边会继续学习基础内容1. 条件语句 if - elif - else2. 错误铺捉try - except(一种保险策略）3. 四种开发模式4. 函数：def用来定义函数的5. 最大值最小值函数，max ，min6. is 严格的相等&am…

阅读更多...

神经网络基础-神经网络补充概念-02-逻辑回归

神经网络基础-神经网络补充概念-02-逻辑回归

概念逻辑回归是一种用于二分分类问题的统计学习方法，尽管名字中带有"回归"一词，但实际上它用于分类任务。逻辑回归的目标是根据输入特征来预测数据点属于某个类别的概率，然后将概率映射到一个离散的类别标签。逻辑回归模型的核…

阅读更多...

echarts绘制仪表盘

echarts绘制仪表盘

代码展示： /**绘制仪表盘图表 */function drawInstrument(id) {setTimeout(()> {var chart echarts.init(document.getElementById(id)); var option {series: [{name: 风险指数,type: gauge,center: [50%, 60%],radius: 90%,min: chartData.min,max: chartDat…

阅读更多...

捷码低代码+智慧水务：降本增效，灵活应变

捷码低代码+智慧水务：降本增效，灵活应变

数字经济正在强势崛起，已成为未来经济发展的主要动力。如何通过数字化转型获得最大收益，成为当下各行业最关心的问题。水务行业，作为我国的传统行业，也迎来数字化转型的快速发展期。如何利用新技术，实现以创新为核心的…

阅读更多...

Android splash.img的制作

Android splash.img的制作

在device\qcom\common\display\logo下找到logo_gen.py如果没有安装Python，先执行以下命令 sudo apt-get install python-imaging将需要制作logo的图片拷贝到logo_gen.py的同级目录需要注意的是图片分辨率应该与设备屏分辨率一致运行如下命令生成splash.img,执行 py…

阅读更多...

相约天津！全国智能汽车竞赛百度创意组总决赛通知

相约天津！全国智能汽车竞赛百度创意组总决赛通知

“全国大学生智能汽车竞赛”是教育部倡导的大学生科技A类竞赛，中国高等教育学会将其列为含金量最高的大学生竞赛之一，为《全国普通高校大学生竞赛排行榜》榜单内赛事。飞桨共承办了百度完全模型组和百度智慧交通组两大赛道。下文为百度智慧交通组具体安…

阅读更多...

NeMo 声纹识别VPR-实战

NeMo 声纹识别VPR-实战

声纹识别(VPR) ，生物识别技术的一种，也称为说话人识别，是从说话人发出的语音信号中提取声纹信息，从应用上看，可分为：说话人辨认(Speaker Identification)：用以判断某段语音是若干人中的哪一个所说的，是“多选一”问题；说话人确认(Speaker Verification)：用以确认某…

阅读更多...

【Git】本地搭建Gitee、Github环境

【Git】本地搭建Gitee、Github环境

本地 （Local） 1、使用命令生成公钥（pub文件） 1. $ ssh-keygen -t rsa -C "xxxxxxxemail.com" -f "github_id_rsa" 2. $ ssh-keygen -t rsa -C "xxxxxxxemail.com" -f "gitee_id_rsa" …

阅读更多...

推荐文章

最新文章