「视频空间化」这个趋势不是从现在开始,而是潜在发展了很多年了,而且我个人觉得「视频空间化」的背后其实对应的是「空间视频化」的趋势,所以未来我们还是要注重自己的技术栈中对视频相关处理技术的吸收以及整合,下面是我的几个理解:
1.底图的视频化
过去几年,我觉得在空间表达方面对「传统地图表达形式」挑战最大的产品形式就是视频厂商的这种「AR全景视频」和「阵列拼接视频」,而且这类视频产品现在也在朝着多源数据融合这个方向发展,比如在交通场景上,视频产品开始基于视频进行地图、雷达、浮动车、电警、卡口、地磁、微波等多种数据源间的融合。
之前超图就发布过直接在视频上进行矢量数据叠加以及空间量算的功能实现,其核心就是对视频构建空间参考,使其和真实的物理空间进行对齐,其实进一步去考虑,这种模式是不是已经在考虑将视频作为「底图」了。
当然,除了这种模式,前几年比较流行的一些做法就是将三维通过视频投影的方式与三维场景进行融合。不过在一些项目中,这种模式都是「后集成」的模式,也就是说先有了摄像头,后面地图再通过坐标校准的方式将视频投影上去,但是这种建设方式比较被动,覆盖的效果也不是很理想,很难形成无缝覆盖的效果。后来跟一些专门做这一方面的厂家交流的时候,做这类项目比较好的模式就是新建摄像头的时候就把视频投影覆盖这一点也考虑进去,所以他们也会介入到前期视频点位铺设的方案设计中,这样才能够保证最终出来的效果比较好。
现在对于视频来说,一个趋势就是如何能够实现更广的覆盖范围,可以是更高的高度,可以是多个视频的拼接融合,而和空间数据融合也是一个发展方向,而对于空间底图来说,更多的融入动态的视频也是一个必然的方向。
2.应用场景的视频化
这类的场景莫过于各种监测类的场景了,而监测是各种管理逻辑的第一环,比如自然资源的监测、水利的监测,视频都是一种自动化监测的重要组成。而且这些年随着无人机机场的普及,基于无人机的自动化监测也成为了一个新的流行趋势,各种行业论坛也都会提到这种应用模式。
同时现在行业里热度最高的方向莫过于低空经济了,而低空经济带来的一个最直接的影响就是飞行视频数据的极大丰富,当然除了低空,现在行业里面比较喜欢提的概念就是「空天地一体化」,只是现在卫星的视频凝视时长还比较短。在低空领域除了空域的管理和运营,其实和我们行业相关的更大的应用场景其实就是低空AI监测方面的,基于上游的设备、数据,下游结合不同行业的应用需求,配合现在的一些视频AI的算法来进行行业化应用的定制。
3.视频AI的低门槛化
最近正好在一个项目上遇到的一个需求,配合的伙伴说这类的需求他们都是用YOLO 来做视频AI相关的工作,包括Detect、Segment、Classify、Pose,基于这些工作下游就可以做非常多的延伸,比如一些行为的检测、人群计数、人群热力都可以,这个技术相对已经比较成熟了,所以最近一段时间我也在尝试学习这个工具的使用。尤其是ultralytics这个框架其实还是很不错的,这个傻瓜式的框架可以极大的降低非专业用户的使用门槛,避免你还没入门前就开始放弃了。
1、开源非免费,虽然这是一个开源的框架,但是使用的是AGPL协议,要求使用他这个框架的产品也得开源,同时如果想绕开这个协议限制就需要每年订阅他的企业授权,所以这是一个对于个人学习比较友好,但是对于闭源商用不是很友好的产品,不过这个框架确实可以帮你快速的了解和认识目前这些最新的视频AI的能力,更新自己的技术栈,后续再根据需要选择更加合适的产品,不过国内针对这类问题似乎应该都已经有经验了,看是个问题,但是又不是个问题。
2、傻瓜式使用,两分钟搭建开发环境,几行代码就可以让程序跑起来,使用比较小的数据集在普通的机器上也可以运行起来,而且ultralytics将其他的模型也做了一致性的封装,代码写好之后,只需要更换一下引入的模型对象,更换权重文件,其他的部分几乎不需要修改程序就可以继续运行了,真的是做到了大道至简。
ultralytics这种模式的一个很重要的贡献就是实现了视频AI的低门槛化,过去我们做项目的时候一遇到和视频AI相关的需求,基本上都还是交给专门的视频厂商来做,提一些定制的需求基本上是不太可能的,但是随着一些低门槛或者普适化的AI产品推出,更多的厂商也都会逐渐在自己的产品和技术中开始引入AI的能力,结合需求进行深度的定制,这个作用就非常类似CesiumJS对行业的作用,大家都知道3D GIS是趋势,但是真正破局的点是CesiumJS的产生。