据第三方咨询公司iiMedia Research预测,2017-2020年,视频直播行业一直处于高速发展阶段。2020年,视频直播行业市场收入超1万亿元,累计覆盖用户5.26亿。
视频直播的应用范围已从视频娱乐、电子商务等泛互联网行业扩展到在线教育、视频安防、广电传媒、医疗服务等传统行业。“直播+”已成为新趋势。视频直播行业市场潜力巨大,是一个竞争激烈的行业,涉及众多参与者。为了吸引更多的用户,直播商必须能够细化直播内容,丰富直播场景,创新营销模式。为了实现这些,直播平台需要结合实时互动和短视频,从而达到更好的整体效果。
自建直播平台的直播提供商面临巨大挑战:
- 自建系统需要大量的资源和硬件投入,以及高昂的带宽成本。结果也不完美。对于大多数企业来说,建议将资金存到核心业务上,选择专业灵活的直播服务商。
- 实现涉及分布式存储、分布式计算、视频编解码、视频加密、CDN分发等多种技术。这在开发和运维方面产生了极高的人力和时间成本。
- 运营成本很高。由于视频直播行业的突飞猛进,自建系统无法满足弹性带宽需求,导致运营成本居高不下。此外,对直播内容的人工审查带来了高昂的运营成本。
阿里云视频直播服务架构
阿里云视频直播是基于领先技术的音视频直播平台,包括内容接入分发网络、大规模分布式实时视频处理等。具有接入方便、时延低、并发高等特点,提供高清流畅的音视频直播服务。
如上图所示,主播从采集设备采集直播内容,然后使用推流 SDK 进行直播。视频直播服务通过边缘推流的方式将直播推流到阿里云直播中心。然后,通过CDN边缘节点对视频流进行加速,保证上行传输的稳定性。视频流投递到直播中心后,主播可以根据您的需求对直播流进行处理。例如,播法者可以对流进行转码、执行时移、录制流或捕获流的一些快照。
处理后的流通过CDN节点下发到客户端设备进行播放。移动播放器可以通过集成阿里云提供的播放器SDK来开发。除了对直播进行转码和截取快照外,用户还可以通过直播到点播功能,将录制的直播流投递到视频点播。在视频点播中,用户可以将录制的直播流在线编辑为短视频,并将录制的直播流作为点播视频提供。这个过程将直播与短视频的制作和传播联系起来。
视频直播的核心优势
全球加速:全球边缘云节点网络
阿里云在全球拥有超过 2,800 个边缘云节点和 9 个直播中心。支持海外业务的无缝布局。依托阿里云音视频全球实时传输网络(GRTN),从最近点即可访问全球直播流,并通过高速通道快速传输到指定直播中心进行内容分发。
极致视听效果:独家音视频技术,确保最佳体验
阿里云的窄带高清技术可以智能分析视频中的场景、动作、内容、纹理等细节。例如,针对足球比赛中的足球、球员、草地等不同内容,实现基于不同策略的编码优化。因此,在图像输出继续的同时,比特率降低,从而节省了 20% 到 40% 的带宽成本。
左图为正常转码,右图为窄带高清转码。当观众看到这张照片时,焦点会放在人脸上。通过智能分析,系统为人脸分配更多的码率,使细节更清晰,从而更好地识别整个人脸的纹理。现在,让我们看一下比特率分析。如果左侧的视频图像较复杂,则码率在1.5MB到2MB之间。
当视频图像中的细节较少时,例如,在足球比赛的中场休息期间,我们可以使用智能识别来减少码率的消耗。使用该技术,整体带宽平均减少 30% 至 40%。换句话说,在确保图像更清晰的同时节省了带宽。这就是阿里云的窄带高清2.0技术。
阿里云还开发了名为Ali S265的实时高性能视频编码器,支持H265 1080p高质量实时转码、视频增强算法和图像增强。视频直播场景的编码有一个关键的前提条件。也就是说,编码必须是实时的,这意味着一小时的视频必须在一小时内进行转码。更准确地说,比如每一秒的视频内容都需要在一秒内逐一转码,以保证实时转码。
阿里S265可以实现1080p高质量的视频实时转码,并采用图像增强算法来提升图像质量。在上面的例子中,你可以看到动物身后树上的雪花细节经过阿里S265处理后得到了增强。在保证实时转码和图像质量的基础上,通过增强算法对图像进行处理,使其更清晰、更有层次感。
技术领先:直播技术的进一步创新
RTS基于实时直播,优化了全流程时延监控、CDN协议转换、UDP等底层技术。通过与播放器SDK集成,在千万级并发请求的场景下,实现节点间毫秒级的时延。这减少了传统直播中 3 到 6 秒的延迟,保证了低延迟、少卡顿,最终实现快速接入和流畅的直播观看体验。RTS具有多重技术优势,可广泛应用于各种工业场景。凭借为数百名客户提供的实践经验,RTS为企业带来了巨大的价值。
阿里云的Production Studio服务基于视频直播和MTS,旨在改变传统的云上视频制作工具。通过集成视频AI识别、双语翻译和各种交互功能,创新了定向视频的效果。您可以按需使用 Production Studio 服务,而无需购买额外的硬件。生产工作室服务提供生产控制台、API 和 Web SDK。您可以根据需要访问它们,以方便二次开发或直接使用。控制台易于交互,可以降低学习成本。
除了直播和点播视频源外,还支持多种类型的内容源,如图片、文档和网页。最多可以同时混合和编码六个视频。提供多视图、实时图文打包组件、多语言字幕、视频AI等能力。他们随时帮助打包制作直播,一键在线同步,打造精彩、身临其境的直播体验。
多地点功能在活动不同地点的多个位置的多个流之间进行组合和切换。不同位置的视频通过视频帧级同步播放传输,使用户能够同时拥有多个视角,帮助他们欣赏所有精彩的场景。虚拟演播室采用基于深度算法的实时自动抠图技术实现,支持多设备、多地点、远程播出。通过云抠和合成能力,实现双屏、分屏、画中画等直播场景,打造沉浸式直播体验。
该功能用于汇聚多个视频节目,创建类似轮播演播室的直播间,实现直播场景和节目形式多样化。用户可以在剧集列表中添加、删除、修改和搜索节目,并修改节目内容。用户可以使用此功能以灵活、轻松、协作的方式实现业务场景。
Production Studio实时字幕,集成Production Studio、Damo Academy ASR、翻译服务,提供实时多语言语音转字幕直播服务。它支持在现场录制过程中长期存储翻译的字幕以及字体、背景、效果和显示时间等各种参数的设置。此外,还可以灵活使用中文、英文、法文、西班牙文、俄文等多种语言的模板。而且,在直播语音转文字的过程中,实现了字幕的实时叠加,翻译以字幕的形式融入到直播中进行展示。
Production Studio 还支持集成直播视频剪辑、点播视频剪辑、图片、文本、动态 H5 组件素材和 AI 能力。通过此,重构视频内容的制作流程,多维度展示数据信息,增强内容丰富度,扩大流量曝光,通过广告获得收益。
视频智能:视频AI的应用
视频审核服务是基于海量标注数据和深度学习算法实现的。该服务可以从语音、文本、视觉展示等多个维度准确识别媒体文件中的违禁内容,包括色情、暴力、恐怖、广告、不健康场景等。该服务还支持对视频、图片和文件进行内容审核,以确保内容安全。
阿里云推流SDK是基于阿里云CDN(CDN)和音视频实时通信技术推出的一款功能强大的音视频广播服务。提供简单易用的开放API、流畅的网络自适应播放体验、基于多节点的低延时优化、实时修饰等。智能修饰是一种基于智能视觉算法的海量人脸检测识别技术。它提供了修饰、塑形和化妆美化以及拍摄滤镜和贴纸等功能。
面部关键位置独家定位技术,覆盖106个基本位置和280个高精度位置,使效果逼真。智能视觉算法和实时渲染技术定期优化,提供更好的用户体验。脸部修饰和塑形效果、滤镜、贴纸和材质不断升级和丰富,使图像更加有趣。全面的开发人员支持确保快速响应客户需求以及优质可靠的服务。
安全稳定:多重安全策略,保障视频直播安全
视频直播支持访问控制,如引用用户黑白名单、IP黑白名单等。它还支持播放中心身份验证和业务远程身份验证。播放中心身份验证包括用于流引入和播放的 URL 身份验证。安全 URL 身份验证支持自定义身份验证密钥和身份验证过期时间,以动态生成身份验证 URL。业务远程认证是指将业务请求信息传输到客户定制的认证中心进行有效性检查。
通过主备流切换,实现可靠稳定的直播。切换过程简单易操作。视频直播支持使用EdgeScript进行自定义认证。用户可以根据业务特点自定义认证脚本,从而实现快速部署和发布。用户可以在CDN边缘节点上编译EdgeScript进行直播,无需关注机器的硬件配置、区域部署、调度、自动扩缩容等。上传后,云视频直播的边缘云节点可以部署在全球。基于代码逻辑,可以在全球边缘节点上处理来自世界各地的请求。
视频直播加密是一种云设备集成的视频加密解决方案,采用专有的加密算法,确保视频流传输的安全性。支持通用DRM加密,支持多终端、多平台、全方位的版权保护。这种加密方案使用独立的加密密钥,避免了单个密钥泄露导致的广泛安全问题。它支持加密、转码和解密播放。通过动态密钥管理,为视频资源提供更好的保护,有效防止视频泄露和热链接。通过数字水印技术在视频直播中的应用,可以获取证据,追根溯源,追究重大体育赛事直播侵犯著作权的责任人。
视频直播提供实时监控直播推流质量、观看次数、错误状态、观看次数、播放流量带宽、播放质量等秒级监控。用户可以及时发现直播过程中的异常,超低时延。实时日志投递是指将直播中域名的日志投递到日志服务。用户还可以通过对日志进行分析,发现和识别推流相关的问题,或者根据对直播受众的分析制定运营策略。
视频直播应用场景
从应用来看,典型的视频直播场景包括大型体育赛事直播、泛娱乐(节目、游戏、社交媒体)、电子商务、晚会活动、在线教育、企业等。
重大活动直播
- 适用场景:奥运会、世界杯、体育赛事、电竞赛事等大型赛事直播。
- 场景需求:高可靠、高质量、低时延的直播服务。支持千万用户稳定流畅并发观看,全流程容灾应急预案,影院般的沉浸式观影体验。
- 绝对稳定:主备推流、远程双中心容灾、多码率对齐、httpDNS+302调度。多种方案,保障直播稳定。
- 内容升级:智能制作自动生成比赛集锦;高光点的二级时移;在体育赛事转播的开头和结尾插入;品牌LOGO曝光;视频和广告的整合。制作工作室有助于在巨大的流量下促进品牌营销和变现。
- 极其流畅的观看体验:窄带高清™ 2.0 提供影院般的画质。50 帧清晰度为用户提供更流畅的沉浸式观看体验。多个流在云端进行合并和优化,以动态生成具有最佳帧率的流进行输出。
- 直播安全:直播DRM确保内容安全。通过全面的容灾和应急预案,保障千万用户在弹幕上同时播放视频、与观众互动的流畅用户体验。
泛娱乐直播
- 应用场景:直播(现场唱歌、脱口秀)、UGC视频(生活、娱乐、交友)、比赛解说直播。
- 场景需求:直播节目、游戏、社交活动;低成本的直播转码分发能力,为全球文化娱乐广播行业提供,帮助客户快速直播全球活动。
- 直播端能力:主播在手机或PC上推流,观众在终端上观看直播。阿里云视频直播提供推流SDK和播放SDK,内置美脸功能。
- 直播服务器能力:GRTN传输网络和实时转码能力,为百万观众提供稳定、流畅、高质量的直播内容。
- 解说员和观众之间的互动:流媒体工作室中的点赞、评论和互动。
- 自动审核计划:根据用户标准,灵活调整视频中色情恐怖内容审核策略。多种音频场景的识别方案。对特定广告事件进行定期控制,以识别广告变体。有效识别静态和无意义的视频内容,提高运营和控制效率。
电商直播
- 适用场景:商城直播(产品介绍、榜单分享、销售转化最大化)和微商互动(“直播+互动”模式,通过社交媒体促进产品销售)。
- 场景需求:直播商务最重要的两个方面是直播能力和互动通信能力。通过直播功能,观众可以观看直播;通过交互式通信功能,观众可以在演播室中参与实时互动。
- 直播端能力:主播可以通过手机、电脑或专业设备推流。参观者可以通过手机、PC、网络和小程序观看视频。
- 直播服务器能力:直播服务器可以访问最近的直播流,并在加速后进行分发。这确保了为来自世界各地的买家提供稳定、流畅和高清的直播内容。
- 直播录制和回放:根据直播过程中的精彩产品介绍生成短视频。直播结束后,这些短视频可以积累成精彩的内容,促进产品销售。时移功能允许按需播放直播过程中的任何精彩片段,买家可以拖放时间线观看错过的精彩片段。
- 解说员与买家互动:买家在直播过程中可能会询问某些商品的一些信息、发表评论或与解说员互动。直播还可能涉及闪购、抽奖、红包互动营销等。直播的端到端延迟为 1 秒或更短。
派对活动直播
- 适用场景:新闻报道、体育节目、综艺节目相关活动直播。
- 场景需求:为各类晚会和活动提供高质量、高可靠的直播。超高清、杜比全景声、全球大范围内容分发的视频直播视听盛宴。
- 更高清晰度+杜比全景声(Dolby Atmos):用于信号传输的4K高清转播车和杜比全景声(Dolby Atmos)使屏幕前的观众听到的声音“比现场观众听到的声音更真实”。当用户疯狂购物时,他们同时享受听觉和视觉感知。
- 高可靠性:双通道SRT回流技术确保无缝切换。如果主信号通道出现任何异常,屏幕在切换到待机通道后不会中断。这确保了在复杂网络中从节目源高质量传输重要内容。它能够以更低的成本将更稳定、更快、更完整的内容交付到用户屏幕。
在线教育直播
- 适用场景:大班成人教育。
- 场景需求:为不同地区不同互联网连接的学生稳定观看优质直播课。RTS 确保更好的师生互动(低延迟直播和同步消息交互)。直播安全保护核心教学内容。
- 直播并发观看次数:视频直播支持千万级并发观看次数,覆盖全球2800多个CDN节点。视频直播预留150Tbit/s带宽,提供专线,保障各国直播质量。
- 直播回放录制:直播课程录制在云端,可生成可随时查看的回放文件。直播时移支持任意精彩点播。
- 现场互动与问答:师生互动促进了在线教育的教学效果。集成的SDK支持交互式视频连接、评论展示和群组管理。
- 直播安全防盗:视频直播支持链接和内容加密功能,如URL认证、远程认证、阿里巴巴加密、DRM加密等。他们确保视频内容免受盗版和非法内容的侵害。
企业直播
- 适用场景:企业营销直播、财经直播。
- 场景需求:没有完善的线下演播室和专业的直播机构。云端需要多个摄像机位置、导演和虚拟演播室来完善直播内容。同时,直播需要低延迟、高互动性。
- 短延时互动直播,实现良好的营销效果:面向企业营销、金融场景的直播,需要功能齐全、性价比高、超低时延。直播应支持百万级并发观看,端到端延迟为 1 秒。互动更及时,秒杀红包活动更顺畅,GMV和用户转化提升。
- 基于云的视频处理让直播更专业:营销直播让直播内容和策略更有针对性,让内容更有针对性、更专业。制作工作室支持视频点播和直播源之间的融合切换,并在直播过程中无缝插入优质 VOD 预告片等内容。虚拟演播室支持多种设备、多个摄像机位置和远程广播。通过云抠合成能力,实现双屏、分屏、画中画等直播场景,打造沉浸式直播体验。