WebRTC 采集音视频数据

news2025/1/8 5:07:18

WebRTC 采集音视频数据

  • WebRTC 采集音视频数据
    • getUserMedia API 简介
      • 浏览器兼容性
      • getUserMedia 接口格式
      • MediaStreamConstraints
      • MediaTrackConstraints
    • 采集音频数据
    • MediaStream 和 MediaStreamTrack
    • 本地视频预览
    • 切换摄像头显示
    • 参考

WebRTC 采集音视频数据

getUserMedia API 简介

HTML5 的 getUserMedia API为用户提供访问硬件设备媒体(摄像头、视频、音频、地理位置等)的接口,基于该接口,开发者可以在不依赖任何浏览器插件的条件下访问硬件媒体设备。

getUserMedia API 最初是 navigator.getUserMedia,目前已被最新Web标准废除,变更为 navigator.mediaDevices.getUserMedia,但浏览器支持情况不如旧版 API 普及。

MediaDevices.getUserMedia 方法提示用户允许使用一个视频和/或一个音频输入设备,例如相机或屏幕共享和/或麦克风。如果用户给予许可,就返回一个 Promise 对象,MediaStream 对象作为此 Promise 对象的 Resolved[成功]状态的回调函数参数,相应的,如果用户拒绝了许可,或者没有媒体可用的情况下PermissionDeniedError 或者 NotFoundError 作为此 Promise 的 Rejected[失败]状态的回调函数参数。注意,由于用户不会被要求必须作出允许或者拒绝的选择,所以返回的 Promise 对象可能既不会触发 resolve 也不会触发 reject。

浏览器兼容性

在这里插入图片描述

getUserMedia 接口格式

navigator.mediaDevices.getUserMedia(constraints)
.then(function(mediaStream) { ... })
.catch(function(error) { ... })

该接口有一个 MediaStreamConstraints 类型的输入参数,指定请求的媒体类型,主要包含 video 和 audio,必须至少一个类型或者两个同时可以被指定。如果浏览器无法找到指定的媒体类型或者无法满足相对应的参数要求,那么返回的 Promise 对象就会处于 rejected[失败]状态,NotFoundError 作为 rejected[失败]回调的参数。

成功回调函数seccessCallback的参数mediaStream:mediaStream是MediaStream的对象,表示媒体内容的数据流,可以通过URL.createObjectURL转换后设置为Video或Audio元素的src属性来使用,部分较新的浏览器也可以直接设置为srcObject属性来使用。

失败回调函数errorCallback的参数error,可能的异常有:

  • AbortError:硬件问题
  • NotAllowedError:用户拒绝了当前的浏览器实例的访问请求;或者用户拒绝了当前会话的访问;或者用户在全局范围内拒绝了所有媒体访问请求。
  • NotFoundError:找不到满足请求参数的媒体类型。
  • NotReadableError:操作系统上某个硬件、浏览器或者网页层面发生的错误导致设备无法被访问。
  • OverConstrainedError:指定的要求无法被设备满足。
  • SecurityError:安全错误,在getUserMedia() 被调用的 Document
    上面,使用设备媒体被禁止。这个机制是否开启或者关闭取决于单个用户的偏好设置。
  • TypeError:类型错误,constraints对象未设置[空],或者都被设置为false。

MediaStreamConstraints

MediaStreamConstraints 结构体:

dictionary MediaStreamConstraints {
    (boolean) or (MediaTrackConstraints) video = true;
    (boolean) or (MediaTrackConstraints) audio = true;
}

video 和 audio 属性可以是 boolean 类型,也可以是 MediaTrackConstraints 类型,只有像 JavaScript 这种弱类型语言才可以做到这一点。因此,我们既可以直接给 video 和 audio 赋值 true/false,简单地指明是否采集视频/音频数据,此时浏览器会采用默认设备和默认参数采集音视频数据;也可以赋值一个 MediaTrackConstraints 类型值,对音视频设备做更精准的设置。

MediaTrackConstraints

MediaTrackConstraints 结构体:

dictionary MediaTrackConstraints {
	// Instance properties of video tracks
	ConstrainULong width;
	ConstrainULong height;
	ConstrainDouble aspectRatio; // 宽高比
	ConstrainDouble frameRate;
	ConstrainDOMString facingMode; // 前置/后置摄像头
	ConstrainDOMString resizeMode; // 缩放或裁剪
	// Instance properties of audio tracks
	ConstrainULong sampleRate;
	ConstrainULong sampleSize
	ConstrainULong channelCount;
	ConstrainDouble latency; // 目标延迟
	ConstrainDouble volume; // 已废弃
	ConstrainBoolean autoGainControl; // 自动增益
	ConstrainBoolean echoCancellation; // 回声消除
	ConstrainBoolean noiseSuppression; // 降噪
    // Instance properties of all media tracks
    ConstrainDOMString deviceId;
    ConstrainDOMString groupId;
}

MediaTrackConstraints官方文档:https://developer.mozilla.org/en-US/docs/Web/API/MediaTrackConstraints

采集音频数据

通用模板:

// 从设备选项栏里选择某个设备
var deviceId = ...;
// 设置采集限制
var constraints = {
	// 音频约束
	audio: {
	deviceId: deviceId?{exact:deviceId}:undefined,
	sampleRate: 16000, // 采样率
    sampleSize: 16, // 每个采样点大小的位数
    channelCount: 1, // 通道数
    volume: 1, // 从 0(静音)到 1(最大音量)取值,被用作每个样本值的乘数
    echoCancellation: true, // 开启回音消除
    noiseSuppression: true, // 开启降噪功能
    },
    // 视频约束
    video: false
}
// 开始采集数据
navigator.mediaDevices.getUserMedia(constraints)
.then(gotMediaStream)
.catch(handleError);
// 采集到某路流
function gotMediaStream(stream) {
	...
}
// 处理错误
function handleError {
	...
}

更详细的例子:HTML + JavaScript 实现网页录制音频与下载

MediaStream 和 MediaStreamTrack

  • MediaStreamTrack 称为“轨”,表示单一类型的媒体源。
  • MediaStream 称为“流”,它包含 0 个或多个 MediaStreamTrack。

MediaStream 有两个作用:

  1. 作为录制或者渲染的源。可以录制成文件,也可以通过浏览器的<video>标签播放出来。
  2. 同一 MediaStream 中的 MediaStreamTrack 会进行同步。

本地视频预览

当使用 getUserMedia() 接口获得本地音视频流 MediaStream 后,赋值给 H5 的 <video> 标签的 srcObject 属性,就可以显示出来。

index.html:

<!DOCTYPE html>
<html lang="en">

    <head>
        <meta charset="UTF-8">
        <meta name="viewport" content="width=device-width, initial-scale=1.0">
        <title>Camera Video Display</title>
    </head>

    <body>
        <video id="video" width="640" height="480" autoplay="autoplay"></video>

        <script src="index.js"></script>
    </body>

</html>

video 标签设置 autoplay,可以自动显示采集的数据。

index.js:

// 从 HTML 页面获得 video 标签
var videoElement = document.getElementById('video');
// getUserMedia 的采集限制
var constraints = {
    video: true,
    audio: false
};

// 检查浏览器是否支持 getUserMedia API
if (!navigator.mediaDevices || !navigator.mediaDevices.getUserMedia) {
    console.error("您的浏览器不支持 getUserMedia API");
} else {
    navigator.mediaDevices.getUserMedia(constraints)
        .then(gotLocalStream)
        .catch(handleError);
}

function gotLocalStream(mediaStream) {
    // 将采集到的视频信息显示在 video 标签中
    videoElement.srcObject = mediaStream;
}

function handleError() {
    // 处理错误
    console.error("获取摄像头错误:", err);
}

切换摄像头显示

结合前一篇文章 WebRTC 遍历音视频设备,我们可以用一个 select 选择不同的摄像头,切换摄像头后,select.value 就是当前的 deviceId,重新设置 constraints 中 video 的 deviceId,使用 getUserMedia() 接口获得本地音视频流 MediaStream 后,赋值给 H5 的 <video> 标签的 srcObject 属性,就可以实现切换摄像头的效果。

index.html:

<!DOCTYPE html>
<html lang="en">

    <head>
        <meta charset="UTF-8">
        <meta name="viewport" content="width=device-width, initial-scale=1.0">
        <title>Camera Video Display</title>
        <link rel="stylesheet" href="styles.css">
    </head>

    <body>
        <div class="center-select">
            <label>请选择你的采集设备:</label>
            <select id="cameraSelect"></select>
        </div>

        <div class="center-video">
            <video id="video" width="640" height="480" autoplay="autoplay"></video>
        </div>

        <script src="index.js"></script>
    </body>

</html>

styles.css:

.center-select {
    display: flex;
    justify-content: center;
    align-items: center;
}

.center-video {
    display: flex;
    justify-content: center;
    align-items: center;
    /* 使用视口高度来使容器填满整个屏幕 */
    height: 100vh;
}

index.js:

// 使用严格语法 
'use strict'
var cameraSelect = document.getElementById('cameraSelect');
// 从 HTML 页面获得 video 标签
var videoElement = document.getElementById('video');

// 获取摄像头列表并填充到 select 元素中
async function getCameraDevices() {
    try {
        const devices = await navigator.mediaDevices.enumerateDevices();
        const cameras = devices.filter(device => device.kind === 'videoinput');
        cameras.forEach(camera => {
            const option = document.createElement('option');
            option.value = camera.deviceId;
            option.text = camera.label || `Camera ${cameraSelect.length + 1}`;
            cameraSelect.appendChild(option);
        });
    } catch (error) {
        console.error('Error enumerating devices:', error);
    }
}

// 切换摄像头
async function switchCamera() {
    const deviceId = cameraSelect.value;
    const constraints = {
        video: {
            deviceId: deviceId ? { exact: deviceId } : undefined
        },
        audio: false
    };

    try {
        const mediaStream = await navigator.mediaDevices.getUserMedia(constraints);
        videoElement.srcObject = mediaStream;
    } catch (error) {
        console.error('Error switching camera:', error);
    }
}

// 初始化页面
async function init() {
    await getCameraDevices();
    if (cameraSelect.length > 0) {
        // 默认选择第一个摄像头
        await switchCamera();
    }
}

cameraSelect.addEventListener('change', switchCamera);

// 初始化
init();

运行效果:

在这里插入图片描述

切换采集设备后,下面的显示内容也会跟着切换。

参考

  1. https://www.cnblogs.com/cangqinglang/p/10210826.html
  2. https://webrtc.org.cn/20200318-api/
  3. https://blog.csdn.net/xiehuanbin/article/details/131512316

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1655038.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

线性表的拓展之广义表

概述 示例 性质 区别 运算

Spring 常用的注入方式有什么?

Spring 是一个非常流行的 Java 开发框架&#xff0c;它提供了多种依赖注入&#xff08;Dependency Injection&#xff09;的方式&#xff0c;使得开发者可以轻松地管理应用程序中的组件依赖关系。在 Spring 中&#xff0c;常用的注入方式主要包括构造器注入、Setter 方法注入、…

Jmeter性能测试(四)

一、遇到问题解决思路 1、检查请求头是否正确 2、检查请求参数是否正确 3、检查鉴权信息是否正确 4、检查变量作用域 5、检查数据提取是否正确(正则/json提取器) 二、请求头检查 1、在Http信息头管理器查看 2、注意这里的变量作用域是全局的 三、请求参数检查 1、在查看结…

英语学习笔记6——What make is it?

What make is it? 它是什么牌子的&#xff1f; make n.&#xff08;产品的&#xff09;品牌名称    v. 制作 区别&#xff1a;model n.&#xff08;产品的&#xff09;型号       n. 模型       n. 模特 make 指的是大的品牌名称&#xff0c; model 是旗下产品…

Git知识点总结

目录 1、版本控制 1.1什么是版本控制 1.2常见的版本控制工具 1.3版本控制分类 2、集中版本控制 SVN 3、分布式版本控制 Git 2、Git与SVN的主要区别 3、软件下载 安装&#xff1a;无脑下一步即可&#xff01;安装完毕就可以使用了&#xff01; 4、启动Git 4.1常用的Li…

Bert 实现情感分析任务

BERT Bert &#xff08;Bidirectional Encoder Representations from Transformers&#xff09;预训练模型是 Google 2018开源的自然语言模型&#xff0c;主要有以下特点。 像它名字一样&#xff0c;BERT最显著的特点是其能够为文本中的每个标记考虑双向上下文。与传统的基于…

vue+ant-design+formBuiler表单构建器——技能提升——form design——亲测有效

最近看到后端同事在弄一个后台管理系统&#xff0c;额&#xff0c;前端真的是夹缝中生存啊&#xff0c;AI抢饭碗&#xff0c;后端也想干前端的活儿。。。 他用到了表单构建器&#xff0c;具体效果如下: 网上有很多适用于ElementUi和ant-design的form design插件&#xff0c;下…

FX110书籍推荐:如何快速成为一名专业股票投资人?

股票投资领域有一本神作《股票交易入门》&#xff0c;它是股票从业人员的入门必备书籍。 关于股票入门的书籍很多&#xff0c;但这本书涉及的知识面最全、实用性最强。从这本书里&#xff0c;我们可以领略到股票交易世界的跌宕起伏而又波澜壮阔的魅力。本书作者 本书的作者是美…

大模型的不足与解决方案

文章目录 ⭐ 不具备记忆能力 上下文窗口受限⭐ 实时信息更新慢 新旧知识难区分⭐ 内部操作很灵活 外部系统难操作⭐ 无法为专业问题 提供靠谱的答案⭐ 解决方案的结果 各有不同的侧重 在前面三个章节呢&#xff0c;为大家从技术的角度介绍了大模型的历程与发展&#xff0c;也为…

【AutoGPT】踩坑帖(follow李鱼皮)

本文写于2024年5月7日 参考视频&#xff1a;AutoGPT傻瓜式使用教程真实体验&#xff01; 对应文章&#xff1a;炸裂的AutoGPT&#xff0c;帮我做了个网站&#xff01; 平台&#xff1a;GitPod 云托管服务 原仓库已经改动很大&#xff0c;应使用的Repo为&#xff1a;Auto-GPT-ZH…

uniapp——点赞、取消点赞

案例 更新点赞状态&#xff0c;而不是每次都刷新整个列表。避免页面闪烁&#xff0c;提升用户体验 代码 <view class"funcBtn zan" click"onZan(index,item.id)"><image src"/static/images/circle/zan.png" mode"aspectFill&…

element-ui table sortable排序 掉后端接口方式

实例: 官方解释:如果需要后端排序&#xff0c;需将sortable设置为custom&#xff0c;同时在 Table 上监听sort-change事件&#xff0c;在事件回调中可以获取当前排序的字段名和排序顺序&#xff0c;从而向接口请求排序后的表格数据。 1.table上要加 sort-change"sortCha…

51单片机keil编程中遇到的问题(持续更新)

字符无法打印报错 查看特殊功能寄存器名字的时候也会报错&#xff0c;因为无法编译通过&#xff0c;导致头文件的定义内容无法查找 keil编译中 error C127: ‘xx’: invalid storage class 这种一般是在编写头文件或源文件时&#xff0c;在声明函数的结尾没有添加分号&…

C语言 | Leetcode C语言题解之第75题颜色分类

题目&#xff1a; 题解&#xff1a; void swap(int *a, int *b) {int t *a;*a *b, *b t; }void sortColors(int *nums, int numsSize) {int p0 0, p2 numsSize - 1;for (int i 0; i < p2; i) {while (i < p2 && nums[i] 2) {swap(&nums[i], &num…

大模型微调之 在亚马逊AWS上实战LlaMA案例(六)

大模型微调之 在亚马逊AWS上实战LlaMA案例&#xff08;六&#xff09; 通过 SageMaker Python SDK 进行微调Llama2 可以使用 SageMaker Python SDK 微调 Llama 2 模型。以下是在数据集上微调 Llama 2 7B 的示例代码&#xff1a; import os import boto3 from sagemaker.sessi…

Python代码生成类型注解库之monkeytype使用详解

概要 MonkeyType 是由 Instagram 开发的一个 Python 库,用于自动为 Python 代码生成类型注解。通过监控运行时的类型信息,MonkeyType 能够帮助开发者为现有的 Python 代码库增加类型提示,从而提高代码的可读性和健壮性。 安装 安装 MonkeyType 非常简单,可以通过 pip 进行…

证照之星是什么软件 证照之星哪个版本好用?证照之星支持哪些相机 证照之星XE免费版

许多人都需要使用证件照&#xff0c;为了满足这一需求&#xff0c;人们会使用照相机、手机、电脑等工具进行拍摄。除此之外&#xff0c;市面上还存在专门的证件照拍摄软件&#xff0c;比如证照之星。那么&#xff0c;各位小伙伴是否了解证照之星哪个版本好用&#xff0c;证照之…

93、动态规划-最长回文子串

思路 首先从暴力递归开始&#xff0c;回文首尾指针相向运动肯定想等。就是回文&#xff0c;代码如下&#xff1a; public String longestPalindrome(String s) {if (s null || s.length() 0) {return "";}return longestPalindromeHelper(s, 0, s.length() - 1);…

Day 42 0-1背包理论基础 416. 分割等和子集

01背包理论基础 先了解背包问题的区别和分类&#xff1a; ​ 由于所有的问题的原理都可以转化为01背包&#xff1b;通过纯01背包问题&#xff0c;把01背包原理讲清楚&#xff1b; 01背包 ​ 有n件物品和一个最多能背重量为w 的背包。第i件物品的重量是weight[i]&#xff0c;…

华为OD机试【全量和已占用字符集】(java)(100分)

1、题目描述 给定两个字符集合&#xff0c;一个是全量字符集&#xff0c;一个是已占用字符集&#xff0c;已占用字符集中的字符不能再使用。 2、输入描述 输入一个字符串 一定包含&#xff0c;前为全量字符集 后的为已占用字符集&#xff1b;已占用字符集中的字符一定是全量…