今天分享的是AI大模型系列深度研究报告:《AI大模型专题:工业大模型技术应用与发展报告1.0》。
(报告出品方:中国信通院)
报告共计:25页
人工智能的几个相关概念
大模型:即基础模型,在海量数据和计算资源的基础上通过 预先训练出来的,具有大参数规模的深度学习模型。狭义多指大语言模型,广义还包括CV、多模态等各种模型类型。
GPT:生成式预训练模型,大模型的一种类型,可生成内容。ChatGPT是GPT的一个典型产品。
生成式AI:能够生成文本、图片、视频等内容的智能技术, 大模型为其提供了新的技术手段。早期GAN用于内容生成效果有限,如NLP逐词生成。大模型拓展了生成能力,如实现多领域多风格图像/文本生成。
通用人工智能:AI终极发展目标,具备认知、理解、推理、 学习、创造和社会协作等能力。大模型具备学习、生成等能力,但还缺少完备的推理、认知能力。
应用总体视图:4类核心模型、15+应用场景,目前处于初步探索阶段
工业各环节围绕语言、专用、多模态和视觉四类大模型开展探索。当前以大语言模型为主,4类模型应用占比:75%、 15%、8%和2%。通用模型的场景化适配调优是主要部署方式,问答交互为主要应用模式。
算力:端/边缘侧推理的大模型专用计算有望成为未来趋势
1.大模型训练推理算力需求相对可控:大模型每10亿参数(1G模型文件)所需最低显存需求
2.工业边端侧推理需满足工业应用及峰值QPS 等需求:百亿参数大模型,使用1张英伟达A100GPU进行 推理,每秒生成的token数大约为60。已有大模型一体机及端侧优化芯片,实现推理加速。
3.工业算力智能分配可能成为关键:云端大算力和终端小算力的平衡使算力分配和性能达到最优。
大模型+装备:增强具身智能水平,有望提升工业设备灵活性和协同性
1. 综合分析能力 综合视觉、语言、空间、理解、决策能力,从被动感知向主动认知跨越。
2. 任务执行能力 无需控制代码预设,实现模型对机器人直接控制。
3. 强泛化能力 对于陌生场景,无需针对性训练或模型微调,通过多步推理和知识迁移控制机器完成任务。
(1)大语言模型:主要应用于工业问答交互、内容生成,以提升任务处理效率为主,暂未触及工业核心环节
有望形成具有认知智能的数字员工及超级自动化链路,实现从需求理解到规划、自动化执行及结果交付的全链条能力。
(2)专业任务大模型: 围绕研发形成辅助设计、药物研发两个重点方向,进一步增强研发模式的创新能力
面向工业设计、蛋白质结构预测及药物研发创新等场景,扩展创新边界、降低创新成本与时间。
(3)多模态大模型与视觉大模型:在装备智能化和视觉识别领域应用获得初步尝试
结合视频、语义、执行等多类型数据综合分析,有望构建认知能力的装备、系统方案及智能工厂。
报告共计:25页