【专题速递】大模型、带宽优化、智能外呼和AIGC的数据实践

news2026/2/9 2:29:45

ChatGPT的爆发为音视频带来了怎样的革新？AIGC又将如何辅助音视频技术为用户带来更好的体验？7月29日LiveVideoStackCon上海站AI与多媒体专场，为您解答。

AI与多媒体

随着生活方式及习惯的变化，人们对于媒体内容与体验有着更高的需求与期待，如何提供更高的视频质量和沉浸式的音视频体验成为了新一代多媒体发展的挑战，人工智能、计算机视觉和云计算等技术的发展和突破为这些挑战提供了更多的机会与可能。

议题介绍

TOPIC1《家庭场景大模型技术与应用实践》

付涛中国移动智慧家庭运营中心人工智能专家

智慧家庭作为一种新的生活方式，受到越来越多的关注。

对话陪伴，家庭安防，家庭教育，家庭健康和家庭娱乐等模块是智慧家庭的重要组成部分，其中涉及到自然语言处理，计算机视觉，语音处理等多模态复杂AI理解和生成技术，为解决人们对智能要求的不断提升，需要利用大规模预训练大模型所涌现出的通用智能，并针对性的做场景化微调适配；具体的，我们利用千亿参数的大模型，并结合家庭场景进行指令微调和对应算法优化，赋能了亿级的智慧家庭用户，其中智能对话，智能安防，家庭教育等覆盖率达到了千万级以上；

本次分享分为4个部分，第一部分主要是介绍家庭场景的核心业务，同步引入算法应用的关键问题，第二部分主要是回顾行业大模型的发展现状和主要算法架构，第三部分是我们在家庭场景下大模型的关键技术研发，第四部分主要是大模型的应用实践。

TOPIC2《基于人眼感知质量的端云结合画质及带宽优化实践》

剑寒小红书音视频架构视频图像处理算法负责人

随着小红书视频业务和短视频播放的规模化增长，如何有效地提升用户体验质量同时降低视频带宽成本成为一个重要的技术优化目标。端侧超分是一种有效的画质提升及带宽节省技术，然而端侧计算资源及性能约束限制了高级超分算法的落地。此外，如何规模化地评价超分后视频质量从而最大程度保障和量化用户体验质量也成为一个待解决的问题。

为应对上述挑战，小红书音视频架构算法团队开发了基于人眼感知质量的端云结合超分框架，通过云端视频处理有效补偿并提升端侧超分效果，利用基于AI的无参考视频质量评估指标实现与人眼视觉一致的质量评价，为云端画质分析和处理以及大规模量化用户体验质量提供了关键支撑。整体方案实现端侧超分效果可量化、集成高覆盖、带宽高节省。

TOPIC3《数据即科技——AIGC底层数据探索》

张晴晴 Magic Data 创始人兼CEO

ChatGPT爆发之后，全球范围内掀起了大模型热潮。包括微软、谷歌、百度、阿里在内的一众科技巨头加速大炼“大模型”。数据是大模型构建三要素之一，是决定模型智能的关键因素。目前国内模型训炼数据依然存在很多挑战，如语料库稀缺、数据质量低和数据合规等。

本次分享将主要分为四个部分，首先介绍目前大模型的发展现状以及目前训练数据的痛点，之后介绍国内中文数据与ChatGPT所用的数据进行对比，第三部分将会通过实验介绍对话式数据在大模型训练中的表现能力，最后介绍如何打造数据为中心的MLOps，助力大模型构建以及落地。

TOPIC4《智能外呼，引领信贷服务的未来》

陈亮洞听智能算法工程师

随着人工智能技术的发展，企业客服的模式也在发生变革。传统的客服模式往往是人工坐席接听电话或在线客服回复消息，但这种模式效率低下，容易出现人为失误，不符合现代企业对高效、精准的客服服务的需求。

本次分享将分为三个部分，第一部分介绍传统客服模式存在的痛点，以及小Go智能外呼机器人是怎么解决这些问题的，第二部分介绍相较于传统客服场景，小Go的优势与亮点，第三部分介绍技术特色。通过以上三个部分的分享，将为大家全面介绍小Go智能外呼机器人在传统客服场景中的创新应用和技术优势。