soundfile torchaudio 读取音频文件

news2026/2/8 19:22:35

soundfile 和 torchaudio 读取音频文件后的数据格式不同，前者是numpy，后者是tensor。前者读取后可以直接用于一些python的基础函数输入，后者用于pytorch的一些函数的应用。两者互换用途时候需要进行格式转换。

import soundfile as sf
import torchaudio
sound_file_3, sr = sf.read('./audio/bed_room_record_3.wav')
torch_audio_3, sr = torchaudio.load('./audio/bed_room_record_3.wav')

soundfile 读取音频文件后，数据格式为numpy.array ，数据是1维的，大小定义为 [ samples]

torchaudio 读取音频文件后，数据格式为 tensor ，数据是2维的，大小定义为 [ch , samples]

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/761192.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

soundfile torchaudio 读取音频文件

相关文章

智能指针使用及详细解析

Gradle 构建工具 #5 又冲突了！如何理解依赖冲突与版本决议？

STM32（HAL库）驱动SHT30温湿度传感器通过串口进行打印

Spring Batch之读数据库——JdbcCursorItemReader之自定义RowMapper（三十七）

代码随想录第27天 | 455.分发饼干 ● 376. 摆动序列 ● 53. 最大子序和

STM32（HAL库）软件IIC驱动OLED

java linux服务器环境搭建

Kubespray v2.22.1 在线部署 kubernetes v1.26.5 集群

Ubuntu18.04 安装vscode 配置C#编译器

Python 自学 day04 函数为参数传递，匿名函数，文件操作

详解DDPG算法：解决对大量的超参数、随机重启、任务环境敏感问题，完成月球着陆器，双足机器人demo、以及超参数调优教学

1、linux中安装tomcat

为什么选择孟德尔随机化来写文章

【日常BUG】批量插入数据时报错： There is no setter for proerty named uptByd‘ in ‘class ...

QT QTableView添加CheckBox

FasterViT实战：使用FasterViT实现图像分类任务（一）

Flask_使用flask_marshmallow序列化数据

JavaFx 用户界面控件2——ListView

【深度学习笔记】正则化与 Dropout

如何手动初始化项目目录结构，并在命令行用gradle编译运行项目