Linux 音视频SDK开发实践

news2024/7/6 18:17:46

一、兼容性适配处理

为什么需要兼容处理?
![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/a5b31c22f20c4f23b9b382d12b16039b

1、c++兼容处理

主要有ABI兼容性问题,不同ubuntu系统依赖的ABI版本如下:

ubuntu 18.04ubuntu 16.04ubuntu 14.04
g++7.55.44.8
stdc++版本libstdc++.so.6.0.25libstdc++.so.6.0.21libstdc++.so.6.0.19
GLIBCXXGLIBCXX_3.4.25GLIBCXX_3.4.21GLIBCXX_3.4.19

若用ubuntu 18.04开发的SDK,在utuntu 16.04去集成SDK开发APP,链接大概率无法通过(如果使用到GLIBCXX_3.4.21以上或CXXABI_1.3.9以上的符号),错误举例如下:

undefined reference to `std::__exception_ptr::exception_ptr::exception_ptr(void*)@CXXABI_1.3.11
undefined reference to `std::thread::_M_start_thread(std::unique_ptr<std::thread::_State, std::default_delete<std::thread::_State> >, void (*)())@GLIBCXX_3.4.22
undefined reference to `__cxa_init_primary_exception@CXXABI_1.3.11'
undefined reference to `std::thread::_State::~_State()@GLIBCXX_3.4.22'
undefined reference to `typeinfo for std::thread::_State@GLIBCXX_3.4.22

鉴于此,我们采用静态链接C++标准库的方式解决高版本开发环境到低版本生成环境无法运行的问题。

思考:怎么操作?
cmake方式下可以在CMakeLists.txt增加一条链接命令target_link_libraries(${PROJECT_NAME} -static-libgcc -static-libstdc++

总结:为了充分利用C++语言的新特性和高级功能,我们开发使用了较高版本的gcc/g++和stdc++,但输出的SDK不再依赖c++,也就实现了开发环境和生产环境的解耦,这里的生产环境可以指代使用SDK的客户开发环境和生产环境。
在这里插入图片描述

2、c兼容处理

和c++兼容性一样,c也有同样问题。
如果采用静态链接c库的方式,会造成产物二进制体积暴增,如果对包体积大小不敏感,可以采用此方式,另外可以选择一个低版本的c库去编译链接,这样编译出来的产物就只依赖低版本的c库,这样在高版本的系统里运行是没有兼容性问题的。

target_link_libraries(${RTCSDK_LIBRARY_NAME} ${LIB_DIR}/libc-2.19.so) # ubuntu 14.04, gcc4.8
target_link_libraries(${RTCSDK_LIBRARY_NAME} ${LIB_DIR}/libm-2.19.so)

3、iot兼容处理

Linux音视频SDK除了运行于桌面端环境(比如x86_64-ubuntu, aarch64-uos等),也可以应用于IoT领域(arm-linux平台),比如arm云对讲,教育录播场景。

实践中发现OpenSSL在arm上存在一些兼容性问题,比如使用libcurl based on OpenSSL实现https通信场景下会出现ssl connect error等一系列疑难问题,后来使用libcurl based on mbedTLS顺利解决这个问题,mbedTLS是为嵌入式设备而开发的一个TLS协议的轻量级实现,用作OpenSSL的一个轻量级替代。(参考https://github.com/Mbed-TLS/mbedtls)

二、音频开发

音频开发技术栈包括:

  • 基于ALSA驱动开发
  • 基于PulseAudio服务开发
  • 基于PipeWire服务开发

基于ALSA驱动开发存在独占,混音等诸多难题,开发难度大;PulseAudio声音服务作为声音系统的代理,对上层应用开发较友好,开发者完全不用考虑底层复杂的处理细节;PipeWire作为新一代Linux audio/video bus,旨在取代PulseAudio并统一音视频框架,但目前尚未全面普及,稳定性暂时不如PulseAudio(进展:ubuntu 22.04桌面系统内部预安装了PulseAudio和PipeWire服务,ubuntu 22.10预计会用PipeWire直接替换PulseAudio,基于此并考虑到到当前大多数Linux桌面系统发行版(包括低版本)都将PulseAudio作为默认声音服务器提供音频能力,我们倾向于选用PulseAudio进行音频功能开发,包括:

  • 音频设备枚举
    • 包括输入设备(micphone)和输出设备(speaker)
  • 音频采集(输入)
  • 音频播放(渲染)
  • 音频设备事件通知
    • 包括默认设备变更,音频输入和输出设备插入、拔出等

三、视频开发

包括以下功能:

  • 基于V4L2视频采集
  • 基于OpenGL视频渲染
  • 视频设备事件通知
    • 插入、拔出操作等

V4L2(Video For Linux Two的缩写)是Linux下关于视频采集相关设备的驱动框架,为驱动和应用程序提供了一套统一的接口规范。应用程序通过一系列IO系统接口即可完成摄像头数据采集功能,摄像头在Linux系统下会被映射为/dev/video0,/dev/video1等设备文件,特别应注意,V4L2支持的设备十分广泛,但是其中只有很少一部分在本质上是真正的视频设备,实际使用过程中应该特别关注V4L2_CAP_VIDEO_CAPTURE特征,如下:

struct v4l2_capability {
    __u8 driver[16];
    __u8 card[32];
    __u8 bus_info[32];
    __u32 version;
    __u32 capabilities;
    __u32 device_caps;
    __u32 reserved[3];
};

 struct v4l2_capability cap;
if (ioctl(fd, VIDIOC_QUERYCAP, &cap) == 0) 
{
    if (cap.device_caps & V4L2_CAP_VIDEO_CAPTURE)
    { 
       // it is real video
    }
}

Linux 桌面视频渲染较多采用OpenGL渲染,Qt跨平台框架QOpenGLWidget也是基于OpenGL实现的。

四、屏幕共享开发

在Linux的世界里,桌面、窗口或图形化界面并不是必须的,因为Linux是基于命令行的操作系统,图形界面只是Linux下的一个应用程序,不带桌面的发行版也可以自己动手安装上桌面,屏幕共享的实现依赖于桌面环境,更准确的说法应该窗口系统或显示服务器。

窗口系统:
在Linux系统下,有两个比较常见的窗口系统,X Window System(X11)和Wayland,但当前使用最多的还是X11,窗口系统均采用C/S架构。
在这里插入图片描述

1、 基于X11屏幕共享开发

适用于X11窗口系统

基于X11进行开发,包括桌面共享和窗口共享,依赖X11,Xdamage,Xfixes,Xext,Xcomposite,xcb,Xdmcp和Xau库等。
客户端应用使用xlib(参考https://www.x.org/releases/current/doc/libX11/libX11/libX11.html)与X Server进行通信,完成屏幕共享等图形功能。

2、基于pipewire 屏幕共享开发

适用于Wayland 窗口系统

WebRTC M95升级pipewire0.2到pipewire0.3,实现了基于pipewire进行屏幕共享和窗口共享功能,内部使用D-bus做为通信方式,依赖pipewire-0.3,glib-2.0,gio-2.0和gobject-2.0四个库。
在这里插入图片描述

以上流程分为两大模块,屏幕源选择(由xdg-desktop-portal实现),pipewire流处理和数据回调,针对屏幕源选择,不像X11需要自己去实现源选择对话框,这里开箱即用。

3、番外(ubuntu 桌面窗口系统演进)

在这里插入图片描述
ubuntu在17.04版本引入了wayland,但由于无法实现屏幕共享,远程桌面等问题,在18.04版本去除了wayland feature,重新拥抱Xorg,到22.04版本正式支持了wayland,默认启动wayland窗口系统,同时保留切换为X11的选项(登录界面可进行切换)。除了ubuntu 发行版,其它Linux发行版也在跟进wayland的支持,可见wayland已成为Linux 图形技术栈的最新方向。

4、补充(Linux 图形栈技术)

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1326785.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【SpringBoot快速入门】(4)SpringBoot项目案例代码示例

目录 1 创建工程3 配置文件4 静态资源 之前我们已经学习的Spring、SpringMVC、Mabatis、Maven&#xff0c;详细讲解了Spring、SpringMVC、Mabatis整合SSM的方案和案例&#xff0c;上一节我们学习了SpringBoot的开发步骤、工程构建方法以及工程的快速启动&#xff0c;从这一节开…

JavaCV音视频开发宝典:UDP局域网组播推流,多播推流,局域网多网段推流,使用UDP方式推送TS组播流,实现UDP一对多组播

《JavaCV音视频开发宝典》专栏目录导航 《JavaCV音视频开发宝典》专栏介绍和目录 ​ 前言 在之前文章中我们已经实现rtp点到点传输JavaCV音视频开发宝典:rtp点到点音视频传输(一对一音视频直播)和rtp广播JavaCV音视频开发宝典:rtp广播方式发送TS流音视频传输(一对多音视…

私域用户标签体系|超全指南

将用户进行精准画像&#xff0c;搭建用户标签体系&#xff0c;将自己的客户分层&#xff0c;逐个突破。

IEEE TASLP | 联合语音识别与口音识别的解耦交互多任务学习网络

尽管联合语音识别&#xff08;ASR&#xff09;和口音识别&#xff08;AR&#xff09;训练已被证明对处理多口音场景有效&#xff0c;但当前的多任务ASR-AR方法忽视了任务之间的粒度差异。细粒度单元&#xff08;如音素、声韵母&#xff09;可用于捕获与发音相关的口音特征&…

利用阿里通义千问和Semantic Kernel,10分钟搭建大模型知识助手!

前言 **通义千问&#xff1a;**是阿里推出的一个超大规模的语言模型&#xff0c;其中参数模型Qwen-72B已经宣布开源&#xff0c;同时还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio&#xff0c;至此已经开源了18亿、70亿、140亿、720亿参数的4款大语言模型&#xff0c;…

【QT】QGraphicsView和QGraphicsItem坐标转换

坐标转换 QGraphicsItem和QGraphicsView之间的坐标转换需要通过QGraphicsScene进行转换 QGraphicsView::mapToScene() - 视图 -> 场景QGraphicsView::mapFromScene() - 场景 -> 视图QGraphicsItem::mapToScene() - 图元 -> 场景QGraphicsItem::mapFromScene() - 场景 …

【leetcode234】回文链表Java代码讲解

12.21 234. 回文链表 给你一个单链表的头节点 head &#xff0c;请你判断该链表是否为回文链表。如果是&#xff0c;返回 true &#xff1b;否则&#xff0c;返回 false 。 示例 1&#xff1a; 输入&#xff1a;head [1,2,2,1] 输出&#xff1a;true示例 2&#xff1a; 输入&a…

【Java代码审计】URL跳转漏洞篇

【Java代码审计】URL跳转漏洞篇 1.URL跳转漏洞概述2.Java中的URL重定向3.URL跳转漏洞修复 1.URL跳转漏洞概述 通俗地说&#xff0c;目前很多的Web应用因为业务需要&#xff0c;需与内部的其他服务或者第三方的服务进行交互&#xff0c;这样就需要重定向的功能&#xff0c;由当…

上市十年 这家互联网服务平台窥见汽车市场“沧海桑田”

十年&#xff0c;对于一家上市公司而言意味着什么&#xff1f;以中概股为例&#xff0c;十年里的高低起伏&#xff0c;折射出不同公司和行业的各异命运。 新浪在2021年私有化退市&#xff0c;曾经名声在外的聚美优品在2020年遭遇同样命运。再往前数&#xff0c;还有离开美股回…

浅谈ASO优化如何应对市场竞争的挑战

随着应用市场的竞争越来越激烈&#xff0c;ASO优化也要为了应对各种来临的风险与机遇做出改变&#xff0c;提高自己的适应能力&#xff0c;下面小柚整理了一些思路供大家参考。 1. 深入了解目标用户需求&#xff1a;首先&#xff0c;需要深入了解目标用户的需求和痛点&#xf…

【LeetCode刷题笔记(11-1)】【Python】【和为 K 的子数组】【前缀和】【中等】

文章目录 引言和为 K 的子数组题目描述提示 解决方案1&#xff1a;【暴力枚举】解决方案2&#xff1a;【前缀和】结束语 和为 K 的子数组 引言 编写通过所有测试案例的代码并不简单&#xff0c;通常需要深思熟虑和理性分析。虽然这些代码能够通过所有的测试案例&#xff0c;但…

985等高校急速开设“鸿蒙班”,引领IT就业新时代

​根据澎湃新闻记者了解到&#xff0c;华为以及鸿蒙系软件厂商都在积极培养鸿蒙开发人才。其中产学联动、产教融合来培养鸿蒙生态人才是重要的一条路径&#xff0c;目前已有 23 家 985 高校、46 家 211 高校已开设或即将开设HarmonyOS 相关课程。 其中南京大学已经将 HarmonyOS…

一套rk3588 rtsp服务器推流的 github 方案及记录 -03(完结)

opencv 解码记录 解码库使用的时候发现瑞芯微以前做过解码库对ffmpeg和gstreamer的支持 然后最近实在不想再调试Rtsp浪费时间了&#xff0c;就从这中间找了一个比较快的方案 ffmpeg 带硬解码库编译 编译流程参考文献 https://blog.csdn.net/T__zxt/article/details/12342435…

【网络安全】—Shell编程入门(2)

文章目录 循环控制语句函数知识精讲数组知识精讲开发环境规范调试优化实践自动化实战项目 在前面的章节中&#xff0c;我们已经介绍了Shell编程的基础知识&#xff0c;包括变量、特殊变量、数值计算、条件测试、条件判断和基本的循环语句。接下来&#xff0c;我们将深入讲解更高…

还在用QQ拼音输入法吗?赶快卸载吧~!

最近总觉得我的C盘在莫名其妙的减少。之前的电脑C盘只有240G&#xff0c;所以我很在意C盘空间。但是&#xff0c;我发现买了新电脑&#xff0c;C盘空间也在莫名其妙减少。 随挨个文件夹检查。最后发现&#xff0c;QQ拼音的 dict 文件夹很大&#xff0c;居然有 30G多G。 30多~…

华为安防监控摄像头

华为政企42 华为政企 目录 上一篇华为政企城市一张网研究报告下一篇华为全屋wifi6蜂鸟套装标准

Linux学习(3)——基本命令-文件

1、cat&#xff1a;查看文件内容--上下合并文件 注意&#xff1a;cat只能查看普通的文本文件 如果文件内容过多会显示不全 选项效果-n显示行号包括空行-b跳过空白行编号&#xff1b;注意&#xff0c;在一行打了空格不算空白行&#xff0c;enter键直接跳过这一行才算-s将所有连续…

智能优化算法应用:基于饥饿游戏算法3D无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用&#xff1a;基于饥饿游戏算法3D无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用&#xff1a;基于饥饿游戏算法3D无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.饥饿游戏算法4.实验参数设定5.算法结果6.…

本地配置Java支付宝沙箱环境模拟支付并内网穿透远程调试

文章目录 前言1. 下载当面付demo2. 修改配置文件3. 打包成web服务4. 局域网测试5. 内网穿透6. 测试公网访问7. 配置二级子域名8. 测试使用固定二级子域名访问 前言 在沙箱环境调试支付SDK的时候&#xff0c;往往沙箱环境部署在本地&#xff0c;局限性大&#xff0c;在沙箱环境…

常见的Web攻击手段分析总结,实战案例:通过 X-Forwarded-Host 的密码重置令牌泄漏

常见的Web攻击手段分析总结,实战案例:通过 X-Forwarded-Host 的密码重置令牌泄漏。 常见的 Web 攻击手段主要有 XSS 攻击、CSRF 攻击、SQL 注入攻击、DDos 攻击、文件漏洞攻击等。这几种攻击方式的防护手段并不复杂,却还是有很多企业遭受了该攻击,朔源到头,还是因为人为的…