7月9日,浪潮信息在济南“元脑中国行”巡展上隆重发布了AIStation V5升级版人工智能开发平台,该平台凭借全面的大模型流程支持能力,旨在为企业用户简化大模型构建与微调流程,提供标准化、安全可靠的推理服务,并通过优化集群管理功能,加速大模型业务在行业中的创新应用与高效落地。
随着大模型技术与产业化发展的快速迭代,企业用户在大模型开发和应用的过程中面临诸多新的挑战。一方面,用户在大模型微调过程通常会遇到环境算法配置复杂、模型结构多样适配繁琐、算力资源管理难等问题,模型精度难以提升;另一方面,在部署本地化、私有化大模型时,会面临部署经验不足、性能优化瓶颈、算力资源利用不合理等挑战,难以在保障数据与业务隐私的条件下构建和使用本地化大模型应用。
AIStation V5版本功能全面升级,支持端到端的大模型开发流程,新增适配50+大模型结构,内置10+微调数据集和20+可配置参数项,提供低代码大模型微调能力,让用户一键提交任务、统一管理任务,低门槛构建大模型微调任务、优化模型性能。同时,针对大模型算力资源占用高、训练稳定性难保障的问题,AIStation V5升级了针对大模型训练与微调的分布式任务一键配置能力,帮助用户高效、稳定地进行大模型微调。
AIStation V5集成了高性能推理服务框架,同等算力大模型批量推理服务承载量较原生部署方式提升1-3倍。通过对算力、服务、业务访问的全方位治理,以及多样化的推理服务部署机制,AIStation V5可以满足不同场景下用户自研模型的部署需求,让用户能够在大规模集群内更加细粒度的分配调度算力,部署和使用不同来源、不同结构、不同规模的大模型推理服务,就像在本地部署单个大模型、传统AI应用与服务一样简单。
此外,AIStation V5针对大模型业务特点持续优化集群管理核心功能,支持平台管控的数据模型下载任务管理和导入流程,实现了分钟级大模型训练异常自动恢复,能够有效降低大模型相关业务的人力投入和管理成本;优化升级算力池化与分配策略,实现多团队开发人员共用流程、共享环境,开发者与算力高效协同,助力企业客户提升各类AI创新业务的整体效率。
浪潮信息AIStation作为一款专注于企业级AI全生命周期管理的平台,通过整合计算资源、数据资源及深度学习技术栈,全方位赋能企业用户。其一体化、高效能的解决方案,不仅加速了AI应用的创新步伐,更助力企业在数字化转型中抢占先机,实现智能升级与业务增长。