近日,以“创未来 享非凡”为主题的2023鲲鹏昇腾开发者峰会在东莞松山湖举办。鲲鹏昇腾开发者峰会是面向ICT领域开发者的技术盛会,旨在打造生态伙伴、开发者学习、交流的平台,帮助开发者深入了解鲲鹏、昇腾全栈技术,加速行业技术、产品和解决方案创新。
冲量在线作为鲲鹏、昇腾认证级合作伙伴受邀参与2023鲲鹏昇腾开发者峰会,并由冲量合伙人、产品总经理周岳骞于鲲鹏BoostKit机密计算解决方案专场做题为《AI原生隐私计算平台赋能AIGC的共享,开放和繁荣》的分享,并在现场完成冲量联合鲲鹏打造的可信AIGC一体机的产品方案产品签约仪式,旨在共同推动计算产业发展,构筑开放共赢生态。
据艾媒数据中心发布的《2023年中国AIGC行业发展研究报告》指出,未来五年,中国AIGC的市场容量将大规模持续增长,预计到2028年达到2700亿的市场规模,该报告还指出了2023年中国AIGC所赋能的行业排名,除了像虚拟人、直播电商、游戏等热门领域,对于传统行业,比如金融、政务行业也有极大的促进发展空间,在当前各行业中,应用较为广泛的AIGC模型,包括文本生成、图像生成、视频生成、虚拟人构建等,以上模型主要通过简单的文本输入,即可按用户指定属性去创作画作或文案。
支撑AIGC运转的核心的三大要素就是算法、数据和算力。算法提供计算逻辑,数据是模型训练和推理过程中的燃料,算力则是模型的启动引擎。一个AIGC模型的使用通常需要大规模的数据来支撑训练和调优,并需要与之性能需求相匹配的算力资源来辅助,所以精准的模型算法、高质量的数据源和安全可信的算力市场是AIGC模型运作的基础条件。
综合上面提到的AIGC核心三要素,在构建AIGC应用产品时也存在相关痛点,
01
数据层面
大型企业在使用AIGC模型时,需要使用自身的内部数据来对模型进行微调,同时也需要利用外部数据来扩充训练集的规模和多样性,从而提高模型的准确性。而在内外部数据流通和使用过程中,数据存在难以确权的问题,数据的获取过程也存在合规风险。
02
模型层面
企业在构建自身AIGC模型门槛较高,需要具备定制化模型算法开发能力,模型的训练和推理能力等。
03
算力层面
当前算力市场中的算力资源无法准确锁定不当的计算行为,缺乏安全技术来保证算力的安全性,用户模型及数据在计算过程中存在个人隐私泄露的风险其次,算力资源缺乏激励手段,算力节点与计算任务也缺乏有效的协同机制,所以会导致算力资源利用率低。目前国内的算力市场也不够完善。
结合在数据、算力、算法层面的难题,冲量在线作为软硬件结合的隐私计算基础设施服务领导者,联合鲲鹏打造可信AIGC一体机的产品方案。
核心技术壁垒
“
1
兼容鲲鹏 TEE OS:冲量可信AIGC平台兼容鲲鹏硬件+鲲鹏TEE OS,向上提供标准隐私计算OS,并基于鲲鹏BoostKit实现隐私计算算法性能调优,整合鲲鹏远程认证和可信度量,集成丰富的隐私计算算子。
“
2
异构硬件 + TEE:拆分学习框架利用GPU对TEE中深度学习进行加速,TEE的CUDA代理向上提供无缝的算法迁移体验,TEE+GPU的联合隐私计算正在加速推进中
“
3
链下TEE+链上零知识证明:实现可信与安全互补,并基于隐私保护的数据、算法、算力权益证明,提供AI训练和推理过程的可信验证和审计。
“
4
可认证数据指纹技术:可认证数据指纹保护AIGC训练数据与产出物权属,无痕水印技术确保数据质量不会产生损坏。
基于隐私计算的分布式数据网络与算力网络,能够为训练数据提供者的隐私和权益保驾护航,给优质行业和个人数据提供安全的输出手段,并基于鲲鹏TrustZone对数据进行隐私保护,满足合规要求,通过水印技术保证数据权属并上链存证;能够为算力需求方提供优质、可信、高性价比的海量AI算力,提供基于鲲鹏BoostKit的性能调优、智能化任务调度,提高空闲算力的资源利用率,同时支持多样化GPU加速能力,满足不同场景算力要求。
目前该平台已上线数十种主流图生图、文生图AIGC模型;多个阶梯的可信AI算力满足不同场景,支持一键发起AIGC模型训练或推理任务;全面覆盖的训练数据众筹网络。
未来,冲量在线将持续深度融合鲲鹏系列产品,基于鲲鹏生态打造更大规模AIGC分布式算力网络,赋能各行业数字化转型,促进AIGC产业繁荣发展。