今天分享的是AI算力系列深度研究报告:《AI算力专题:AI时代领先者,大装置+大模型推动AGI落地》。
(报告出品方:中银证券)
报告共计:28页
四核驱动引领智慧科技新潮流
商汤是一家行业领先的人工智能软件公司,以“坚持原创,让 AI 引领人类进步”为使命。长期投入于原创技术研究,不断增强行业领先的全栈式人工智能能力,其优势领域涵盖感知智能、决策智能、智能内容生成和智能内容增强等关键技术领域,除此以外还具备 AI 芯片、AI 传感器及 AI 算力基础设施等相关能力。其主要业务分为四个部分:智慧商业、智慧城市、智慧生活、智能汽车,紧紧围绕公司自研的 SenseCore AI 大装置作为大模型生产的核心平台,带动公司不断向前发展,成为 AI行业头部企业。
围绕大装置+大模型,打造 AI 商业新模式
持续升级的 SenseCore大装置与大模型
商汤的 SenseCore 以 Alaas 的模式面向行业伙伴提供服务,其目前可有效支持最多 20 个千亿参数量大模型(以千卡并行)同时训练,最高可支持万亿参数超大模型的训练。2023年以来,共有超1.000 个参数两数十亿至上千亿的大模型在大装置上完成训练,实现了领跑行业的技术迭代速度。并且公司投入了约 10,000张 GPU在大语言模型的研发上,使其能力实现高速发展:投入了约 2.000张 GPU在文生图模型的研发上,实现了文生图能力的快速选代。
商汤的 Alaas 生态具体包括底层计算基础设施服务(Iaas)与深度学习平台服务(Paas)、模型部署及推理服务(MaaS)三大部分的能力。
在 laaS 层面,SenseCore 提供高性能计算资源,以支持大型模型训练所需的强大算力。位于上海临港的商汤 AIDC 上线 GPU数量约3万块,算力规模高达 6000P FLOPS。
在 PaaS 层面,SenseCore 提供易用的开发工具和深度学习平台,协助内外部高效构建和优化模型。公司与多家科研机构合作推进 AI开源平台建设,自 2018年开源计算机视觉框架 OpenMMLab(8.7万 GitHub 星标)开始,已扩展到决策智能、大语言模型、数据平台、高性能训练和推理框架、AI智能体框架等更多 AI工具的开源。IntemLM-7B(70亿参数)的部分训练数据、训练代码及基模型权重已经向学术界及工业界开放、支持商用。近期公司还将开源能力更加强大的 InternLM-20B 模型 (200亿参数)。
在 MaaS 层面,SenseCore 支持用户将训练好的 AI 模型一键跨平台部署到云端、边缘设备或混合环境中。公司针对 30款芯片、100多种平台进行了常规模型的适配和优化,以支持大规模的实时推理此外,SenseCore 拥有一支经验丰富的模型训练支持团队,协助用户优化模型架构、选择合适的算法和参数,确保模型性能达到最优。
SenseCore Al大装置持续升级
目前我国智能算力处于高增长阶段,截至 2023年 11月,国内投入运营、在建和筹备中的人工智能计算中心已超过 30 家。其中位于上海临港的商汤人工智能计算机中心(AIDC)的上线 GPU 数量约 3万块,算力规模高达 6,000PFLOPS。商汤作为亚洲目前最大的智能计算平台之一,就国内市场而言,其智算中心在算力质量方面仍位居第一梯队。
在持续升级公司智能计算基础设施 SensecCore AI 大装置外,商汤联合多家国内顶尖科研机构于 2023 年 6 月发布了国内首个超越 GPT-3.5-turbo 性能的预训练大模型 InternLM,该基模型参数量 达 1040 亿,使用 1.6 万亿 token 的多语言语料训练,在其基础商汤上发布了商量 2.0,并于 2023 年 9 月升级至 3.0。2023 年 10 月,中文通用大模型综合性评测基准 SuperCLUE 发布 9 月总排行榜和 各个分类任务榜单,商汤商量 SenseChat 3.0 位列中文大模型总榜排名第一。 目前,商汤大语言模型的原始语料数据积累以及对语料进行清洗和试验的能力行业领先,其中 InternLM-7B 在多个模型测试榜单高踞榜首,成为性能最好的轻量级基模型。在文生图模型方面, 秒画 3.0 核心算法在 COCO benchmark 上超过了谷歌的 Imagen 与 OpenAI 的 DALL·E 2,出图效果 跻身全球前列,为国内领先。
人工智能应用场景持续拓展
商汤日日新 SenseNova 大模型体系以低成本解锁通用人工智能的任务和能力,推动高效率、低成本规模化的 AI 创新和落地,打通商业价值循环,解决长尾应用问题,推动人工智能进入工业化发展阶段。我们预计,SenseNova大模型体系未来应用主要是两个方向,2B和2B2C:2B模式发展较快已有大量客户项目落地。
商汤日日新大模型体系的 2B 客户覆盖多个领域,如金融、地产、能源、教育等,商汤根据每个公司的具体要求进行行业大模型的定制化和私有化部署。例如,在金融领,商汤与银行、保险、券商等客户展开合作,利用数字人进行智能客服、智慧营销等工作,并通过接入大语言模型能力,提供投研分析、研报撰写等新功能,实现降本增效:在医疗健康领域,商汤打造了中文医疗健康语言大模型“大医”。“大医”内嵌医学“场景集市”,包含 13 个预设场景,并支持提示工程自定义长程记忆存取和医学知识库查询总结等个性化功能,帮助医疗健康产业链上下游机构根据实际需求打造专属医疗健康大模型。
此外,商汤日日新 SenseNova 大模型体系还能为客户提供 API 接口和服务,包括图片生成,自然 语言生成,视觉感知通用任务与标注服务,客户可根据实际应用需求,调用“日日新 SenseNova” 大模型的各项 AI 技术能力,低门坎、低成本、高效率地实现各类 AI 应用。同时商汤将持续搭建升 级自有 2C 大模型应用平台,并打造多样性的 AI 用户社区。
智慧医疗
在医疗领域,公司以成为“AI 驱动的'未来医院”设计赋能者”为战略目标,向医院客户提供多种智能化产品及服务,包括智能辅助临床诊疗、智慧就医助手、智慧医院管理服务、智慧科研服务智慧医联体服务等。公司的 SenseCare 智慧诊疗平台已获得国内 NMPA 三类、二类医疗器械注册证欧盟 CE、新加坡、沙特、阿联酋等国内外医疗器械认证共计 22 项,并落地了上海交通大学医学院附属瑞金医院、四川大学华西医院、郑州大学第一附属医院等大型头部医院在内的上百家医院与医疗机构。
智慧能源
凭借先进的人工智能技术以及在能源行业的多年深耕,商汤已经成功构建了覆盖能源生产、传输、存储等多个产业链条的数字能源产品矩阵,并与光伏、电网及锂电池企业达成战略合作,助力企业降本增效、创新运维管理范式。
2023 年,公司与南方电网数字电网集团签署战略合作。双方将以多模态大模型、语言大模型、视觉大模型为基础,共同探索大模型技术与新型电力系统的创新结合点,在复杂场景调度运行决策、精细化源荷预测、电力数据智能处理等多场景开展应用。双方于 2020年便在电网换流站开展首个工业级视觉定位 AR 技术试点研究,以 AI+AR 技术助力实现智能电网巡检,提高电力运维效率。借助 AR 巡检,可帮助实现换流站设备运维作业智能辅助与闭环管控,以及实现换流站运维远程指挥、安全监管和智能协助。
报告共计:28页