AI算力专题:AI时代领先者,大装置+大模型推动AGI落地

news2024/11/15 17:36:52

今天分享的是AI算力系列深度研究报告:《AI算力专题:AI时代领先者,大装置+大模型推动AGI落地》。

(报告出品方:中银证券)

报告共计:28

四核驱动引领智慧科技新潮流

商汤是一家行业领先的人工智能软件公司,以“坚持原创,让 AI 引领人类进步”为使命。长期投入于原创技术研究,不断增强行业领先的全栈式人工智能能力,其优势领域涵盖感知智能、决策智能、智能内容生成和智能内容增强等关键技术领域,除此以外还具备 AI 芯片、AI 传感器及 AI 算力基础设施等相关能力。其主要业务分为四个部分:智慧商业、智慧城市、智慧生活、智能汽车,紧紧围绕公司自研的 SenseCore AI 大装置作为大模型生产的核心平台,带动公司不断向前发展,成为 AI行业头部企业。

围绕大装置+大模型,打造 AI 商业新模式

持续升级的 SenseCore大装置与大模型

商汤的 SenseCore 以 Alaas 的模式面向行业伙伴提供服务,其目前可有效支持最多 20 个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。2023年以来,共有超1.000 个参数两数十亿至上千亿的大模型在大装置上完成训练,实现了领跑行业的技术迭代速度。并且公司投入了约 10,000张 GPU在大语言模型的研发上,使其能力实现高速发展:投入了约 2.000张 GPU在文生图模型的研发上,实现了文生图能力的快速选代。

商汤的 Alaas 生态具体包括底层计算基础设施服务(Iaas)与深度学习平台服务(Paas)、模型部署及推理服务(MaaS)三大部分的能力。

在 laaS 层面,SenseCore 提供高性能计算资源,以支持大型模型训练所需的强大算力。位于上海临港的商汤 AIDC 上线 GPU数量约3万块,算力规模高达 6000P FLOPS。

在 PaaS 层面,SenseCore 提供易用的开发工具和深度学习平台,协助内外部高效构建和优化模型。公司与多家科研机构合作推进 AI开源平台建设,自 2018年开源计算机视觉框架 OpenMMLab(8.7万 GitHub 星标)开始,已扩展到决策智能、大语言模型、数据平台、高性能训练和推理框架、AI智能体框架等更多 AI工具的开源。IntemLM-7B(70亿参数)的部分训练数据、训练代码及基模型权重已经向学术界及工业界开放、支持商用。近期公司还将开源能力更加强大的 InternLM-20B 模型 (200亿参数)。

在 MaaS 层面,SenseCore 支持用户将训练好的 AI 模型一键跨平台部署到云端、边缘设备或混合环境中。公司针对 30款芯片、100多种平台进行了常规模型的适配和优化,以支持大规模的实时推理此外,SenseCore 拥有一支经验丰富的模型训练支持团队,协助用户优化模型架构、选择合适的算法和参数,确保模型性能达到最优。

SenseCore Al大装置持续升级

目前我国智能算力处于高增长阶段,截至 2023年 11月,国内投入运营、在建和筹备中的人工智能计算中心已超过 30 家。其中位于上海临港的商汤人工智能计算机中心(AIDC)的上线 GPU 数量约 3万块,算力规模高达 6,000PFLOPS。商汤作为亚洲目前最大的智能计算平台之一,就国内市场而言,其智算中心在算力质量方面仍位居第一梯队。

在持续升级公司智能计算基础设施 SensecCore AI 大装置外,商汤联合多家国内顶尖科研机构于 2023 年 6 月发布了国内首个超越 GPT-3.5-turbo 性能的预训练大模型 InternLM,该基模型参数量 达 1040 亿,使用 1.6 万亿 token 的多语言语料训练,在其基础商汤上发布了商量 2.0,并于 2023 年 9 月升级至 3.0。2023 年 10 月,中文通用大模型综合性评测基准 SuperCLUE 发布 9 月总排行榜和 各个分类任务榜单,商汤商量 SenseChat 3.0 位列中文大模型总榜排名第一。 目前,商汤大语言模型的原始语料数据积累以及对语料进行清洗和试验的能力行业领先,其中 InternLM-7B 在多个模型测试榜单高踞榜首,成为性能最好的轻量级基模型。在文生图模型方面, 秒画 3.0 核心算法在 COCO benchmark 上超过了谷歌的 Imagen 与 OpenAI 的 DALL·E 2,出图效果 跻身全球前列,为国内领先。

人工智能应用场景持续拓展

商汤日日新 SenseNova 大模型体系以低成本解锁通用人工智能的任务和能力,推动高效率、低成本规模化的 AI 创新和落地,打通商业价值循环,解决长尾应用问题,推动人工智能进入工业化发展阶段。我们预计,SenseNova大模型体系未来应用主要是两个方向,2B和2B2C:2B模式发展较快已有大量客户项目落地。

商汤日日新大模型体系的 2B 客户覆盖多个领域,如金融、地产、能源、教育等,商汤根据每个公司的具体要求进行行业大模型的定制化和私有化部署。例如,在金融领,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效:在医疗健康领域,商汤打造了中文医疗健康语言大模型“大医”。“大医”内嵌医学“场景集市”,包含 13 个预设场景,并支持提示工程自定义长程记忆存取和医学知识库查询总结等个性化功能,帮助医疗健康产业链上下游机构根据实际需求打造专属医疗健康大模型。

此外,商汤日日新 SenseNova 大模型体系还能为客户提供 API 接口和服务,包括图片生成,自然 语言生成,视觉感知通用任务与标注服务,客户可根据实际应用需求,调用“日日新 SenseNova” 大模型的各项 AI 技术能力,低门坎、低成本、高效率地实现各类 AI 应用。同时商汤将持续搭建升 级自有 2C 大模型应用平台,并打造多样性的 AI 用户社区。

智慧医疗

在医疗领域,公司以成为“AI 驱动的'未来医院”设计赋能者”为战略目标,向医院客户提供多种智能化产品及服务,包括智能辅助临床诊疗、智慧就医助手、智慧医院管理服务、智慧科研服务智慧医联体服务等。公司的 SenseCare 智慧诊疗平台已获得国内 NMPA 三类、二类医疗器械注册证欧盟 CE、新加坡、沙特、阿联酋等国内外医疗器械认证共计 22 项,并落地了上海交通大学医学院附属瑞金医院、四川大学华西医院、郑州大学第一附属医院等大型头部医院在内的上百家医院与医疗机构。

智慧能源

凭借先进的人工智能技术以及在能源行业的多年深耕,商汤已经成功构建了覆盖能源生产、传输、存储等多个产业链条的数字能源产品矩阵,并与光伏、电网及锂电池企业达成战略合作,助力企业降本增效、创新运维管理范式。

2023 年,公司与南方电网数字电网集团签署战略合作。双方将以多模态大模型、语言大模型、视觉大模型为基础,共同探索大模型技术与新型电力系统的创新结合点,在复杂场景调度运行决策、精细化源荷预测、电力数据智能处理等多场景开展应用。双方于 2020年便在电网换流站开展首个工业级视觉定位 AR 技术试点研究,以 AI+AR 技术助力实现智能电网巡检,提高电力运维效率。借助 AR 巡检,可帮助实现换流站设备运维作业智能辅助与闭环管控,以及实现换流站运维远程指挥、安全监管和智能协助。

报告共计:28

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1422937.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++ 数论相关题目 博弈论 Nim游戏

给定 n 堆石子,两位玩家轮流操作,每次操作可以从任意一堆石子中拿走任意数量的石子(可以拿完,但不能不拿),最后无法进行操作的人视为失败。 问如果两人都采用最优策略,先手是否必胜。 输入格式…

惬意上手python —— python中的术语及案例解析

面向对象编程 面向对象编程(Object-Oriented Programming,OOP)是一种编程范式,它将数据和操作数据的方法封装在一起,以对象的形式表示。在Python中,一切皆为对象,因此Python是一种面向对象的语…

【开源】SpringBoot框架开发天然气工程运维系统

目录 一、摘要1.1 项目介绍1.2 项目录屏 二、功能模块2.1 系统角色分类2.2 核心功能2.2.1 流程 12.2.2 流程 22.3 各角色功能2.3.1 系统管理员功能2.3.2 用户服务部功能2.3.3 分公司(施工单位)功能2.3.3.1 技术员角色功能2.3.3.2 材料员角色功能 2.3.4 安…

带自执行安装脚本的ROS包的生成

带自执行安装脚本的ROS包的生成 在打包和安装ROS包时, 会有一些固定的配置需要去人为实现, 比如网络配置, 设备树的管理等, 比较麻烦, 不如一次性解决掉, 所以查了相关文档 过程: # 使用bloom-generate rosdebian生成debian文件夹 bloom-generate rosdebian # 进入debian文件…

Unix/Linux上的五种IO模型

a.阻塞 blocking 调用者调用了某个函数,等待这个函数返回,期间什么也不做,不停的去检查这个函数有没有返回,必须等这个函数返回才能进行下一步动作。 注意:阻塞并不是函数的行为,而是跟文件描述符有关。通…

法律视角下的数据出境《2023年数据出境合规年鉴》

关注国际云安全联盟CSA公众号,回复关键词“数据安全”获取报告 在全球数字产业以及大数据和云计算技术快速发展的背景下,数据流动对世界经济的影响日益显著。由此带来的数据红利和数据安全之间的冲突,将对未来数字经济的发展方向产生深刻影响…

如何使用wireshark解析二进制文件

目录 目录 1.将已有的packet raw data按照下面格式写入文本文件中 a. Raw IP packet b. Ethernet packet 2.用wiershark导入hex文件 3.设置对应的packet类型 a. Raw IP packet b. Ethernet packet 1.将已有的packet raw data按照下面格式写入文本文件中 a. Raw IP pac…

C++——特殊类

特殊类 文章目录 特殊类一、请设计一个类,不能被拷贝二、请设计一个类,只能在堆上创建对象方案一:析构函数私有化方案二:构造函数私有化 三、请设计一个类,只能在栈上创建对象四、请设计一个类,不能被继承五…

交叉注意力融合2024创新方案汇总,附配套模块和代码

多模态学习和注意力机制是当前深度学习研究的热点领域之一,而交叉注意力融合作为这两个领域的结合点,具有很大的发展空间和创新机会。 作为多模态融合的一个重要组成部分,交叉注意力融合通过注意力机制在不同模块之间建立联系,促…

【网络】:网络套接字(TCP)

网络套接字(TCP) 一.编写TCP服务器二.编写Tcp客户端三.多进程四.多线程版本五.线程池版完整源代码六.使用示例 一.编写TCP服务器 1.先搭一个架子 2.创建sockfd domain参数依然是AF_INET(因为是IPV4) type方式选择SOCK_STREAM(提供可靠的连接…

记一次某竞赛中的渗透测试(Windows Server 2003靶机漏洞)

靶机简介 Windows Server 2003是微软公司于2003年3月28日发布的服务器操作系统,它基于Windows XP/Windows NT 5.1进行开发,并在同年4月底上市。以下是关于Windows Server 2003的详细介绍: 系统名称与发布历程: 该产品最初被命名为…

Gaussian_Splatting 项目脚本指令

准备好一个稀疏重建的目录(如Colmap的sparse文件),高斯泼溅需要稀疏重建的点云结果来作为输入,进行进一步训练和渲染。 可以参考:gaussian-splatting原理 有一点需要注意:Gaussian_Splatting 需要稀疏重建…

力扣之2621.睡眠函数

/*** param {number} millis* return {Promise}*/ async function sleep(millis) {return new Promise(resolve > setTimeout(resolve, millis)); }/** * let t Date.now()* sleep(100).then(() > console.log(Date.now() - t)) // 100*/ 这样的异步休眠功能在实际应用…

vue中使用html2canvas配合jspdf导出pdf(以及在导出时遇到的导出样式问题)

指定页面中导出为pdf格式并打包,使用html2canvas先转为图片格式,在利用jspdf转为pdf,最后下载打包为本地压缩包 yarn add html2canvas yarn add jspdf1. 注册一个插件并挂载 import html2Canvas from html2canvas import JsPDF from jspdf …

【零基础学习CAPL】——CAN报文的发送(配合Panel面板单次发送)

🙋‍♂️【零基础学习CAPL】系列💁‍♂️点击跳转 文章目录 1.概述2.面板创建2.1.新建一个Panel2.2. 在Panel中调出控件窗口2.3.控件添加与配置 3.系统变量创建4.系统变量与Panel绑定5.CAPL脚本实现6.效果 1.概述 使用场景,按下面板按钮同时…

人工智能与机器学习——开启智能时代的里程碑

写在前面 前言人工智能与机器学习的概述监督学习、无监督学习和强化学习的基本原理监督学习:无监督学习:强化学习: 机器学习的算法和方法常见的机器学习算法和方法线性回归:决策树:支持向量机:神经网络&…

个人多域名SSL证书推荐

SSL数字证书和通配符SSL证书、多域名通配符SSL证书一样,可以同时保护多个域名站点,但是它们之间还是存在一些区别。其中,最明显的区别就是它们的保护域名网站的类型和适用场景。今天就随SSL盾小编来了解多域名SSL证书。 1.多域名SSL证书可以…

【C/C++】深入理解--函数重载(什么是函数重载?为什么要有函数重载?)

目录 一、前言 二、 函数重载 🍎什么是函数重载 🍐函数重载的条件 🍇函数重载的注意点 🍉为什么要有函数重载 🍓为何C语言不支持函数重载,反倒C可以? 💦 Linux环境下演示函数重…

云纱网签约百望云,联手打造数字化产业闭环

近日,百望云签约广东云纱数字科技有限公司,共建数字化发票管理系统,赋能产业链上下游供应商的协同交易与运营,助力企业实现数字化四流合一交易,打造数字化产业闭环。 云纱网是广东云纱数字科技有限公司依托于深厚的产业…

Halcon 几何测量

文章目录 算子Halcon 计算两点之间的距离案例Halcon 计算点到直线的距离Halcon 计算点到区域的距离Halcon 线到区域的距离Halcon 线到线的距离 算子 distance_pp 两点之间的距离算子 distance_pp( : : Row1, Column1, Row2, Column2 : Distance) Row1 点1的行坐标 Column1 点1的…