vscode录音及语音实时转写插件开发并在工作区生成本地mp3文件 踩坑日记!

news2024/9/21 8:04:26

前言

最近接到一个需求,实现录音功能并生成mp3文件到本地工作区,一开始考虑到的是在vscode主体代码里面开发,但这可不是一个小的工作量。时间紧,任务重!市面上实现录音功能的案例其实很多,一些功能代码是可以复用过来的,最后决定写一个插件去实现这个需求!但是插件页面是浏览器环境,想要生成mp3文件是不可能的!需要把语音数据传到node环境。

以目前的vscode版本来说,作者并没有开放访问本地媒体权限,所以插件市场里面的所有语音相关插件也并没有直接获取vscode的媒体权限。毕竟vscode是开源项目,有广大的插件市场,如果开放了所有权限,遇到了图谋不轨的人 ,想通过插件获取你的个人信息很容易,比如打开你的麦克风 打开你的摄像头 获取地理定位,在你不经意间可能就获取了你的个人信息,所以作者对权限做了限制。 这样如果想单纯通过写插件调用本地媒体设备的同学,可以放弃你的想法了。

对于一些二次开发的同学则很容易,在主体代码里面放开对应权限。
这里我们主要讲下 插件实现:

对应目录结构,主要文件

在这里插入图片描述

对应demo页面

在这里插入图片描述
wavesurfer.js ->实现 声纹图、声谱图、播放录音
lame.min.js -> mp3编码器
record.js的 -> 实现录音

这几个文件github有很多例子,大同小异,核心api都是一样的
初始化

我们再了解几个js关于语音的api
navigator.getUserMedia: 该对象可提供对相机和麦克风等媒体输入设备的连接访问,也包括屏幕共享。
AudioContext: 接口表示由链接在一起的音频模块构建的音频处理图,每个模块由一个AudioNode表示。音频上下文控制它包含的节点的创建和音频处理或解码的执行。在做任何其他操作之前,您需要创建一个AudioContext对象,因为所有事情都是在上下文中发生的。建议创建一个AudioContext对象并复用它,而不是每次初始化一个新的AudioContext对象,并且可以对多个不同的音频源和管道同时使用一个AudioContext对象。
createMediaStreamSource: 方法用于创建一个新的 MediaStreamAudioSourceNode 对象,需要传入一个媒体流对象 (MediaStream 对象)(可以从 navigator.getUserMedia 获得 MediaStream 对象实例), 然后来自 MediaStream 的音频就可以被播放和操作。
createScriptProcessor: 处理音频。
onaudioprocess: 监听音频录制过程,实时获取语音流

页面

mounted() {
	this.wavesurfer = WaveSurfer.create({
		container: '#waveform',
		waveColor: 'black',
		interact: false,
		cursorWidth: 1,
		barWidth: 1,
		plugins: [
			WaveSurfer.microphone.create()
		]
	});

	this.wavesurfer.microphone.on('deviceReady', function (stream) {
		console.log('Device ready!', stream);
	});
	this.wavesurfer.microphone.on('deviceError', function (code) {
		console.warn('Device error: ' + code);
	});

	this.recorder = new Recorder({
		sampleRate: 44100, //采样频率,默认为44100Hz(标准MP3采样率)
		bitRate: 128, //比特率,默认为128kbps(标准MP3质量)
		success: function() { //成功回调函数
			console.log('success-->')
			// start.disabled = false;
		},
		error: function(msg) { //失败回调函数
			alert('msg-->', msg);
		},
		fix: function(msg) { //不支持H5录音回调函数
			alert('msg--->', msg);
		}
	});
}

点击开始和结束录音

start() {
	// start the microphone
	this.wavesurfer.microphone.start();
	// 开始录音
	this.recorder.start();
},
end() {
	// same as stopDevice() but also clears the wavesurfer canvas
	this.wavesurfer.microphone.stop();
	// 结束录音
	this.recorder.stop();
	let that = this;
	this.recorder.getBlob(function(blob) {
		that.audioPath = URL.createObjectURL(blob);
		that.$refs.myAudio.load();
	});
}

recorder.js

//初始化
init: function () {
	navigator.getUserMedia = navigator.getUserMedia ||
		navigator.webkitGetUserMedia ||
		navigator.mozGetUserMedia ||
		navigator.msGetUserMedia;

	window.AudioContext = window.AudioContext ||
		window.webkitAudioContext;
},
// 访问媒体设备
navigator.getUserMedia({
		audio: true //配置对象
	},
function (stream) { //成功回调
	var context = new AudioContext(),
		microphone = context.createMediaStreamSource(stream), //媒体流音频源
		processor = context.createScriptProcessor(0, 1, 1), //js音频处理器
	}
})		
// 开始录音
_this.start = function () {
	if (processor && microphone) {
		microphone.connect(processor);
		processor.connect(context.destination);
		Util.log('开始录音');
	}
};
//结束录音
_this.stop = function () {
	if (processor && microphone) {
		microphone.disconnect();
		processor.disconnect();
		Util.log('录音结束');
	}
};
// new worker 开启后台线程,为数据编码,这里我部署到线上 是为了避免访问限制
fetch(
		"https://lawdawn-download.oss-cn-beijing.aliyuncs.com/js/recorderWorker.js"
	)
		.then((response) => response.blob())
		.then((blob) => {
			const url = URL.createObjectURL(blob);
			realTimeWorker = new Worker(url);
			realTimeWorker.onmessage = async function (e) {
			...
		}
	})	

recorderWorker.js

// 后台线程接受到语音流数据之后做编码
(function(){
    'use strict';

    importScripts('https://lawdawn-download.oss-cn-beijing.aliyuncs.com/js/lame.min.js');

    var mp3Encoder, maxSamples = 1152, samplesMono, lame, config, dataBuffer;

    var clearBuffer = function(){
        dataBuffer = [];
    };

    var appendToBuffer = function(mp3Buf){
        dataBuffer.push(new Int8Array(mp3Buf));
    };

    var init = function(prefConfig){
        config = prefConfig || {};
        lame = new lamejs();
        mp3Encoder = new lame.Mp3Encoder(1, config.sampleRate || 44100, config.bitRate || 128);
        clearBuffer();
        self.postMessage({
            cmd: 'init'
        });
    };

    var floatTo16BitPCM = function(input, output){
        for(var i = 0; i < input.length; i++){
            var s = Math.max(-1, Math.min(1, input[i]));
            output[i] = (s < 0 ? s * 0x8000 : s * 0x7FFF);
        }
    };

    var convertBuffer = function(arrayBuffer){
        var data = new Float32Array(arrayBuffer);
        var out = new Int16Array(arrayBuffer.length);
        floatTo16BitPCM(data, out);
        return out;
    };

    var encode = function(arrayBuffer){
        samplesMono = convertBuffer(arrayBuffer);
        var remaining = samplesMono.length;
        for(var i = 0; remaining >= 0; i += maxSamples){
            var left = samplesMono.subarray(i, i + maxSamples);
            var mp3buf = mp3Encoder.encodeBuffer(left);
            appendToBuffer(mp3buf);
            remaining -= maxSamples;
        }
    };

    var finish = function(){
        appendToBuffer(mp3Encoder.flush());
        self.postMessage({
            cmd: 'end',
            buf: dataBuffer
        });
        clearBuffer();
    };

    self.onmessage = function(e){
        switch(e.data.cmd){
            case 'init':
                init(e.data.config);
                break;
            case 'encode':
                encode(e.data.buf);
                break;
            case 'finish':
                finish();
                break;
        }
    };
})();

整个recorder.js


(function (exports) {
	//公共方法
	var Util = {
		//初始化
		init: function () {
			navigator.getUserMedia = navigator.getUserMedia ||
				navigator.webkitGetUserMedia ||
				navigator.mozGetUserMedia ||
				navigator.msGetUserMedia;

			window.AudioContext = window.AudioContext ||
				window.webkitAudioContext;
		},
		//日志
		log: function () {
			console.log.apply(console, arguments);
		}
	};
	let realTimeWorker;

	var Recorder = function (config) {

		var _this = this;
		config = config || {}; //初始化配置对象
		config.sampleRate = config.sampleRate || 44100; //采样频率,默认为44100Hz(标准MP3采样率)
		config.bitRate = config.bitRate || 128; //比特率,默认为128kbps(标准MP3质量)

		Util.init();

		if (navigator.getUserMedia) {
			navigator.getUserMedia({
				audio: true //配置对象
			},
				function (stream) { //成功回调
					var context = new AudioContext(),
						microphone = context.createMediaStreamSource(stream), //媒体流音频源
						processor = context.createScriptProcessor(0, 1, 1), //js音频处理器
						successCallback, errorCallback;

					config.sampleRate = context.sampleRate;

					processor.onaudioprocess = function (event) {
						//监听音频录制过程
						var array = event.inputBuffer.getChannelData(0);

						realTimeWorker.postMessage({ cmd: 'encode', buf: array });
					};
					fetch(
						"https://lawdawn-download.oss-cn-beijing.aliyuncs.com/js/recorderWorker.js"
					)
						.then((response) => response.blob())
						.then((blob) => {
							const url = URL.createObjectURL(blob);
							realTimeWorker = new Worker(url);
							realTimeWorker.onmessage = async function (e) { //主线程监听后台线程,实时通信
								switch (e.data.cmd) {
									case 'init':
										Util.log('初始化成功');
										if (config.success) {
											config.success();
										}
										break;
									case 'end':
										if (successCallback) {
											var blob = new Blob(e.data.buf, { type: 'audio/mp3' });
											let formData = new FormData();
											formData.append('file', blob, 'main.mp3');
											fetch("http://127.0.0.1:8840/microm", {
												method: 'POST',
												body: formData
											})
											successCallback(blob);
											Util.log('MP3大小:' + blob.size + '%cB', 'color:#0000EE');
										}
										break;
									case 'error':
										Util.log('错误信息:' + e.data.error);
										if (errorCallback) {
											errorCallback(e.data.error);
										}
										break;
									default:
										Util.log('未知信息:' + e.data);
								}
							};
							_this.start = function () {
								if (processor && microphone) {
									microphone.connect(processor);
									processor.connect(context.destination);
									Util.log('开始录音');
								}
							};
							//结束录音
							_this.stop = function () {
								if (processor && microphone) {
									microphone.disconnect();
									processor.disconnect();
									Util.log('录音结束');
								}
							};
							//获取blob格式录音文件
							_this.getBlob = function (onSuccess, onError) {
								successCallback = onSuccess;
								errorCallback = onError;
								realTimeWorker.postMessage({ cmd: 'finish' });
							};

							realTimeWorker.postMessage({
								cmd: 'init',
								config: {
									sampleRate: config.sampleRate,
									bitRate: config.bitRate
								}
							});
						});
					// var realTimeWorker = new Worker('js/recorderWorker.js'); //开启后台线程
					//接口列表
					//开始录音

				},
				function (error) { //失败回调
					var msg;
					switch (error.code || error.name) {
						case 'PermissionDeniedError':
						case 'PERMISSION_DENIED':
						case 'NotAllowedError':
							msg = '用户拒绝访问麦克风';
							break;
						case 'NOT_SUPPORTED_ERROR':
						case 'NotSupportedError':
							msg = '浏览器不支持麦克风';
							break;
						case 'MANDATORY_UNSATISFIED_ERROR':
						case 'MandatoryUnsatisfiedError':
							msg = '找不到麦克风设备';
							break;
						default:
							msg = '无法打开麦克风,异常信息:' + (error.code || error.name);
							break;
					}
					Util.log(msg);
					if (config.error) {
						config.error(msg);
					}
				});
		} else {
			Util.log('当前浏览器不支持录音功能');
			if (config.fix) {
				config.fix('当前浏览器不支持录音功能');
			}
		}

	};
	//模块接口
	exports.Recorder = Recorder;
})(window);

踩坑!

前面录音都进行的很顺利,录音在渲染进程里都可以正常播放,接下来就是生成本地mp3文件的处理了。

第一次尝试:浏览器端获取的Blob数据,通过vscode.postMessage传送过去之后获取的竟是{}空对象。
在这里插入图片描述
肯能原因 数据传输过程做了序列化,导致丢失,或者Blob只是浏览器API,node无法获取

第二次尝试:将实时获取的语音数据流传递过去
在这里插入图片描述
在这里插入图片描述
数据 是Float32Array格式数据,但是通过序列化传递过去之后,发现数据无法恢复原来的样子,还是失败!

经过苦想后接下来,用了一个方法
第三次尝试
extension.ts里面开启了一个本地服务

export async function activate(context: vscode.ExtensionContext) {
	(global as any).audioWebview = null;

	context.subscriptions.push(VsAudioEditorProvider.register(context));
	const server = http.createServer((req, res) => {
		res.setHeader('Access-Control-Allow-Origin', '*');
		res.setHeader('Access-Control-Allow-Methods', 'GET, POST, OPTIONS, PUT, PATCH, DELETE');
		res.setHeader('Access-Control-Allow-Headers', 'X-Requested-With,content-type');
		res.setHeader('Access-Control-Allow-Credentials', 'true');
		if (req.method === 'POST' && req.url === '/microm') {
			const stream = fs.createWriteStream(path.join(path.dirname((global as any).documentUri!.fsPath), 'main.mp3'));
			req.on("data", (chunck) => {
				stream.write(chunck);
			});
			req.on("end", () => {
				vscode.window.showInformationMessage('语音文件生成成功!');
				res.writeHead(200);
				res.end('success!');
			});
		}
	}).listen(8840);

}

在浏览器端录音结束后,调用了接口把数据传送了过来
在这里插入图片描述
经过在本地和生产环境测试都没有问题~ 大工告成!
在这里插入图片描述

兄弟萌给个关注~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/547842.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【敬伟ps教程】修复工具

文章目录 模糊工具锐化工具涂抹工具减淡、加深工具海绵工具仿制图章工具图案图章工具修复画笔工具污点修复画笔工具修补工具内容感知移动工具红眼工具 模糊工具 模糊工具的主要功能就是把图像变的模糊。虽然是把图像变模糊&#xff0c;但是模糊工具应用也是很广泛的。使用模糊工…

小黑子—Java从入门到入土过程:第十一章 - 网络编程、反射及动态代理

Java零基础入门11.0 网络编程1. 初识网络编程2. 网络编程三要素3.IP三要素3.1 IPV4的细节3.1.1特殊的IP地址3.1.2 常用的CMD命令 3.2 InetAddress 的使用3.3 端口号3.4 协议3.4.1 UDP协议3.4.1 - I UDP 发送数据3.4.1 - II UDP 接收数据3.4.1 - III UDP 练习&#xff08;聊天室…

C++实现日期类(超详细)

个人主页&#xff1a;平行线也会相交&#x1f4aa; 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 平行线也会相交 原创 收录于专栏【C之路】&#x1f48c; 本专栏旨在记录C的学习路线&#xff0c;望对大家有所帮助&#x1f647;‍ 希望我们一起努力、成长&…

六级备考28天|CET-6|听力第二讲|长对话满分技巧|听写技巧|2022年6月考题|14:30~16:00

目录 1. 听力策略 2. 第一二讲笔记 3. 听力原文复现 (5)第五小题 (6)第六小题 (7)第七小题 (8)第八小题 扩展业务 expand business 4. 重点词汇 1. 听力策略 2. 第一二讲笔记 3. 听力原文复现 (5)第五小题 our guest is Molly Sundas, a university stud…

【ZYNQ】ZYNQ7000 定时器及私有定时器驱动示例

简介 每个 Cortex-A9 处理器都有自己独立的 32 位私有定时器和 32 位看门狗定时器。这两个处理器共享一个 64 位的全局定时器。这些计时器的频率为 CPU 频率&#xff08;CPU_3x2x&#xff09;的 1/2。 在系统级别上&#xff0c;有一个 24 位看门狗定时器和两个 16 位三重定时…

据不可靠消息,ST的新一代机皇正式命名为STM32V8系列,搭载Cortex-M85内核

根据以往的传统单片机命名方式&#xff1a; C0, L0, G0, F0 > Cortex-M0内核 F1, L1 > Corterx-M3内核 F2, F3 > Corterx-M3/M4 F4&#xff0c;G4&#xff0c;L4, L4 > Cortex-M4内核 L5&#xff0c;U5, H5 > Cor…

数据结构—排序算法(插入排序及选择排序)

目录 1、排序的概念 2、常见的排序算法 3、直接插入排序&#xff08;插入排序&#xff09; 3.1 直接插入排序基本思想 3.2 直接插入排序实现 4、 希尔排序( 缩小增量排序 )&#xff08;插入排序&#xff09; 4.1 基本思想 4.2 希尔排序实现 4.3 希尔排序的特性总结 5、…

【Draw.io】让Draw.io导出的SVG格式图片包含自定义属性信息

前景提要 Draw.io重度用户一枚 这个Draw.io是一个极其好用的跨平台流程图绘制软件。 它保存的文件格式可以输出成SVG格式. 这个是基本功能了&#xff0c;没啥好说的 导出之后得到画的图片的SVG代码 SVG代码&#xff0c;也没啥好说的&#xff0c;一种矢量图片格式。 但是&…

改造Springboot+vue项目

准备 搜索一个项目&#xff0c;并成功运行 毕设时&#xff0c;我们可以从网上搜索一个项目&#xff08;包括前端的页面、后台的处理、数据库等有一下简单的模板样式&#xff09;并能成功的将项目在自己的电脑上跑起来。毕设项目可以用搜索的模板&#xff08;不用从头开始写&a…

【数据结构】_2.包装类与泛型

目录 1. 包装类 1.1 基本数据类型和对应的包装类 1.2 &#xff08;自动&#xff09;装箱和&#xff08;自动&#xff09;拆箱 1.2.1 装箱与拆箱 1.2.2 自动装箱与自动拆箱 1.3 valueOf()方法 2. 泛型类 2.1 泛型类与Object类 2.2 泛型类语法 2.3 泛型类示例 2.4 裸类…

怎么把照片缩小到200k?图片指定大小压缩怎么弄?

平时在给账号设置头像时&#xff0c;都会遇到图片过大无法上传的情况&#xff0c;这时候我们可以通过图片压缩指定大小工具来将图片压缩到200kb以下&#xff0c;这样就可以顺利设置头像了&#xff0c;下面一起来看一下图片指定大小压缩&#xff08;https://www.yasuotu.com/ima…

机器学习笔记 - windows基于TensorRT的UNet推理部署

一、TensorRT简介 NVIDIA TensorRT是一个用于高性能深度学习推理的平台。TensorRT适用于使用CUDA平台的所有NVIDIA GPU。所以如果需要基于TensorRT部署,至少需要一个NVIDIA显卡,算力5.0以上,比Maxwell更新的架构,可以参考下表。 CUDA GPUs - Compute Capability | NVIDIA …

电动车头盔检测数据集

现在正慢慢整理自己有关电动车头盔检测的项目内容&#xff0c;会逐渐将这些资源进行发布&#xff0c;供大家参考和使用【部分资源有偿提供&#xff0c;毕竟花费了很多心血】。 这篇文章主要是发布相关数据集的。网上关于工厂环境下的头盔数据集有很多&#xff0c;而且多种多样…

PFCdocumentation_Coupling PFC and FLAC3D

目录 Coupling PFC and FLAC3D 1D Structural Element Coupling Scheme Wall-Zone Coupling Scheme 2D 3D Ball-Zone Coupling Scheme Commands FISH Functions Coupling PFC and FLAC3D 在 FLAC3D 图形用户界面中&#xff0c;可以通过“工具 ‣ 加载 PFC”菜单项加载 …

计算机组成与结构易错题

计算机组成与结构 海明校验码是在n个数据位之外增设k个校验位&#xff0c;从而形成一个kn位的新的码字&#xff0c;使新的码字的码距比较均匀地拉大。n与k的关系是&#xff08;A&#xff09;。 A、2k-1≥nk B、2n-1≤nk C、nk D、n-1≤k 知识&#xff1a; 确定要传输的信息&…

普通专科生,拿什么拯救自己的未来我想成为一名网络安全专业人员,需要做什么?

前 言 写这篇文章的初衷是很多朋友都想了解如何入门/转行网络安全&#xff0c;实现自己的“黑客梦”。文章的宗旨是&#xff1a; 1.指出一些自学的误区 2.提供客观可行的学习表 3.推荐我认为适合小白学习的资源.大佬绕道哈&#xff01; 我的经历&#xff1a; 我19年毕业&…

【C语言】入门必看之循环练习(含二分查找动图)

&#x1f6a9;纸上得来终觉浅&#xff0c; 绝知此事要躬行。 &#x1f31f;主页&#xff1a;June-Frost &#x1f680;专栏&#xff1a;C语言 ⚡注&#xff1a;此篇文章的 代码风格部分 将根据《高质量 C/C 编程指南》 —— 林锐 进行说明。该部分将用紫色表示 该篇将对循环语…

AI落地:10分钟变身Excel高手

本文首发公众号突围一只鹰。 使用Excel的时候经常有几个难点&#xff1a; 有些功能不知道如何操作不知道该用哪个公式不知道公式的参数如何设置复杂数据处理不知道如何写公式多表链接的时候不知道如何写公式其他数据源导入Excel只会手动录入 有了ChatGPT之后&#xff0c;很多…

求爷爷告奶奶,阿里大佬才甩出这份Spark+Hadoop+中台实战pdf

Spark大数据分析实战 1、Spark简介 初识Spark Sp ark生态系统BDAS Sp ark架构与运行逻辑 弹性分布式数据集 2、Spark开发与环境配置 Spark应用开发环境2置 使用Intelli i开发Spark 远程调试Spark程序 Spark编译 配置Spark源码阅读环境 3、BDAS简介 SQL on Spark S…

Windows使用flask部署HTML网页的方法

使用Flask python运行设计的好的html网页&#xff0c;已经配套的css和js文件&#xff1a; 前提条件 html、css 和 js 在同一个目录之下 html 内使用 css 和 js &#xff0c;需要使用相对路径flask python 程序可以和 html 不在同一个目录 即&#xff1a;python程序可以在D盘…