为什么我们能判断声音的远近

news2024/9/24 9:20:56

想象一下,当我们走在路上时,听到了头顶的鸟儿在树梢间的叫声,即使无法透过浓密的树叶看见它,也可以大致知道鸟儿的距离。此时身后传来由远到近自行车铃铛声,我们并不需要回过头去看,便为它让开了道路。这些现象都说明了在不依靠视觉的情况下,我们的耳朵和大脑仅从声音中也可以感知到声源的距离。为了实现这一功能,声音中必然包含着某些信息或者线索来协助我们判断距离。

通常来说,人类对于距离的感知是非常不准确的。大约以一米处为分界点,当小于这个距离时,人对声源的感知距离往往高于实际距离,而当声源与人的距离大于一米时,声音的距离是被低估的。

平均估计距离(实验人数n=5)作为物理声源距离的函数,试验结果可以被一个指数为0.45、乘法常数为1.17的压缩幂函数很好地近似【1】.

从图上可以看到,只有在距离人较近的位置,听觉系统的距离感知才是可靠的。当声源远离人时,距离感知仿佛被“压缩”了。比如,当一个声源距离我们十米时,我们很难仅通过声音来判断出一个相对准确的距离。此时的声音给我们的听觉刺激,与声源位于八米或者十二米时的很相近。

影响距离感知的听觉线索

一个音频中,有多种声学线索可以用于感知听者和声源之间的距离。在这个章节中,总结了一些公认的可以影响距离感知的线索。

声压级 (SPL)

声压级是声音的压力级,以分贝(dB) 为单位。长久以来声压级一直被当做距离感知中主要的声学线索,这是因为大多数情况下它都被认为是一种可以使用的提示。在理想环境下(在自由场中放置的固定声功率的声源),声源和接收者之间的声压级和距离之间的关系以平方反比定律为特征,声源距离每增加一倍,声压级就会下降约6 dB。利用这个特征,我们的大脑会根据听到的声音大小来估计距离。

有趣的是,根据研究,声源的类型(如噪声和语音)以及角度位置(如声源正对着听众或者成90度)对我们使用声压级作为距离线索的权重也有很大影响【2】。也就是说,在不同的情境下,我们可能更依赖或者更不依赖声压级来感知距离。

直达声与混响声能量之比 (DRR)

在室内环境中,声音源发出的声波可以直接传播到我们的耳朵(直达声),也可以在墙壁、天花板和地板等表面反射后到达我们的耳朵(混响声)。DRR是指到达我们耳朵的直达声能量与混响声能量之比。这里存在着一个问题,就是对直达声的能量应该如何来定义。一般来说,直达声能量是指从直达声的峰值开始,到之后一段时间内的声能之和。而对于直达声的时长,不同的学者会使用不同的的数值,其长度可以从1.5 ms【3】 到8 ms【4】。混响声能量则是从直达声结束后到脉冲响应结束之间所有的声能量。

一个房间中的脉冲响应,红色箭头处代表直达声峰值,蓝色的框代表着直达声能量的计算范围。

混响声的存在会不利于人们对于声源的方向的定位【5】,但是却对距离的感知有帮助【6】,这是因为DRR在其中提供了一些信息。由于混响声在空间内的分布特性,其能量会在整个空间内相对均匀。这意味着,当我们在一个空间内改变声源与接收点的距离时,对混响声的影响相对较小。然而,直达声的能量随着距离的增加呈指数式衰减,因此,对于处于较远离声源的接收点,其混响声相对于直达声的比例更大,这使得DRR在空间内随着听众与声源之间的距离的增加而减小,通过这一变化我们可以大概判断声源的距离。

频谱(spectrum)

在音频和信号处理领域,频谱表示一个信号或声音在频率域上的分布情况。通过对信号进行频谱分析,可以了解信号中各个频率成分的相对强度。当声音在空气中传播时,较高频率的声音成分比频率较低的衰减更大,从而改变了频谱形状。需要注意的是,频谱可以用于当听众距离声源超过15米的情况下【7】,而在15米之内时,频谱线索不提供距离信息,因为声音传播的距离不足以在较高频率下损失掉令人类可察觉的能量,并且头部周围衍射提供的低频线索太小而无法检测到【8】。

图a为相同角度测量得到的2米和8米处的房间脉冲响应的频谱,图b为2米与8米频谱相减得到的差值以及线性拟合曲线,可以看到随着频率的增加,频谱差略微增大。

双耳提示(binaural cues)

双耳差异是我们在定位声源时使用的一种关键线索,包括双耳声级差(interaural level difference, 简称ILD),双耳声音到达时间差(interaural time difference, 简称ILD)以及头部相关传递函数(HRTF)。它们的存在有助于我们确定声源的方向和距离。

当声源在距离听众不远的地方时,两耳之间的声级差异较大。当声源距离头部一米以内时,如果这个声源位于头部的两侧,声源的距离变化会导致ILD变化高达20分贝,但是,如果声源位于听众的正前方,此时由于声源到左耳和右耳的路径对称,ILD的数值很小,因此无法提供距离信息【9】。如果声源和听众的距离超过一米,ILD变得大致独立于源距离【10】。而对于ITD来说,它在接近听众时随着声源距离而变化的程度不如ILD剧烈,因此对距离判断的贡献较小。

HRTF视差(parallax)是指由于听者的耳朵和声源之间的距离差异而导致的HRTF变化,它也可用于确定到离听众相对较近的声源的距离。当声音相对靠近头部时,就会发生声学视差,导致声源相对于左耳的角度与声源相对于右耳的角度之间存在差异。对于位于听众前方的声源来说,它在较近的位置处会产生更大的视差角,因此HRTF视差可以解释听众在没有ILD和ITD线索的情况下,也能够在声源较近时分辨出它与自己的距离【11】。

总结

在本文中,我们探讨了双耳听觉在距离感知方面的重要性。并详细介绍了四个关键参数——声压级、直达声与混响声能量之比、频谱和双耳差异对距离感知的影响。其中声压级和DRR在任何距离都适用,而频谱仅在声源与听众距离较远时能够帮助判断距离,双耳差异则是需要在声源十分接近听众时才能对距离判断有贡献,因此频谱和双耳差异的适用范围不如声压级和DRR。

当然除了上面四个参数,还有其他线索也可以帮助我们判断距离,比如动态线索,声源的熟悉度等等。了解这些参数对听觉中距离感知的影响,有助于我们深入理解人类的听觉系统是如何在复杂的声学环境中解析空间信息的。在未来,这些知识将为改善助听设备、设计更自然的虚拟现实音频系统以及优化音响设计等方面提供有力支持。

作者简介:郭智涵,DTU声学专业在读硕士,主要兴趣方向为心理声学、听觉化等。

Linkedin:https://www.linkedin.com/in/zhihan-guo-91272a19b/

参考链接

【1】Zahorik, P., & Wightman, F. L. (2001). Loudness constancy with varying sound source distance. Nature neuroscience, 4(1), 78-83.

【2】Zahorik, P. (2002). Assessing auditory distance perception using virtual acoustics. The Journal of the Acoustical Society of America, 111(4), 1832-1846.

【3】Werner, S., & Liebetrau, J. (2014, September). Adjustment of direct-to-reverberant-energy-ratio and the just-noticable-difference. In 2014 Sixth International Workshop on Quality of Multimedia Experience (QoMEX) (pp. 1-3). IEEE.

【4】Xiong, F., Goetze, S., Kollmeier, B., & Meyer, B. T. (2018). Joint estimation of reverberation time and early-to-late reverberation ratio from single-channel speech signals. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 27(2), 255-267.

【5】Hartmann, W. M. (1983). Localization of sound in rooms. The Journal of the Acoustical Society of America, 74(5), 1380-1391.

【6】Bronkhorst, A. W., & Houtgast, T. (1999). Auditory distance perception in rooms. Nature, 397(6719), 517-520.

【7】Blauert, J. (1997). Spatial hearing: the psychophysics of human sound localization. MIT press.

【8】Kolarik, A. J., Moore, B. C., Zahorik, P., Cirstea, S., & Pardhan, S. (2016). Auditory distance perception in humans: a review of cues, development, neuronal bases, and effects of sensory loss. Attention, Perception, & Psychophysics, 78, 373-395.

【9】Hartley, R. V. L., & Fry, T. C. (1921). The Binaural Location of Pure Tones. Physical Review, 18(6), 431.

【10】Brungart, D. S., Durlach, N. I., & Rabinowitz, W. M. (1999). Auditory localization of nearby sources. II. Localization of a broadband source. The Journal of the Acoustical Society of America, 106(4), 1956-1968.

【11】Ashmead, D. H., Leroy, D., & Odom, R. D. (1990). Perception of the relative distances of nearby sound sources. Perception & psychophysics, 47, 326-331.

封面来源:https://theheadphonelist.com/ces-2015-detour-3d-audio-headphones-fraunhofer-3d-sound-labs/fig_binaural_sound/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/452459.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

查找文件路径——whereis、which、locate、find命令

目录标题 whereis命令——通过环境变量查找所有文件(包括可执行文件)which命令——查找系统命令文件与whereis命令区别 locate命令——全局搜索find命令(全盘搜索)find命令中的参数及作用按照文件名搜索按照文件大小搜索按照修改时…

离散数学-考纲版-02-谓词

文章目录 2. 谓词参考2.1 命题2.1 个体谓词和量词2.1.1 个体2.1.2 谓词2.1.3 量词引入个体域符号化量词真值确定谓词符号化举例示例一示例二示例三示例四 2.3谓词合式公式2.3.1 四类符号2.3.2 项2.3.3 合式公式 2.4 自由变元与约束变元2.4.1 定义2.4.2 判定2.4.3 两个规则2.4.4…

【京东】商品详情页+商品列表数据采集

作为国内最大的电商平台之一,京东数据采集具有多个维度。 有人需要采集商品信息,包括品类、品牌、产品名、价格、销量等字段,以了解商品销售状况、热门商品属性,进行市场扩大和重要决策; 有人需要采集产品评论&…

Android OpenGL 渲染相机预览画面显示体系

OpenGL能进行高效得渲染图形图像,并支持各种复杂的特效和动画。 而在 Android 当中,运用的是OpenGL ES,它是OpenGL的一个轻量级版本,专门用于在移动设备、游戏控制台、嵌入式系统等嵌入式环境中使用。 它可以做相机滤镜或者图片…

基于html+css的图片展示31

准备项目 项目开发工具 Visual Studio Code 1.44.2 版本: 1.44.2 提交: ff915844119ce9485abfe8aa9076ec76b5300ddd 日期: 2020-04-16T16:36:23.138Z Electron: 7.1.11 Chrome: 78.0.3904.130 Node.js: 12.8.1 V8: 7.8.279.23-electron.0 OS: Windows_NT x64 10.0.19044 项目…

yield用法理解,配有代码块和解析

包含 yield 关键字的函数,是一个生成器 yield和return的区别 1、return是返回return关键字的值,被调用一次就返回一次,return只能放在一个函数代码块的最后面,运行到return的时候,就结束循环,结束这个函数…

IO、存储、硬盘、文件系统相关常识

目录 IO 文件系统 存储 存储这些数据的硬盘 IO io分为io设备和io接口, 我们日常生活中的打印机, 固态硬盘等都是io设备. IO(Input-Output)是指计算机中输入输出的相关操作,包括数据的读取、存储、传输和显示等。存储是指将数据保存在计算…

美国肝素钠专用树脂,医药肝素钠提取工艺专用树脂

具有控制孔径的大孔强碱性Ⅰ型阴离子交换树脂 Tulsimer A-72 MP 是一款具有便于颜色和有机物去除的控制孔径的,专门开发的大孔强碱性Ⅰ型阴离子交换树脂。 Tulsimer A-72 MP专门应用于去除COD以及其他有机物等。 Tulsimer A-72 MP 由于其本身的大孔特性而显示出…

电巢携手中国自动化学会:计算机能有感情史了

4月22日,为了促进模式识别、数据挖掘和计算机视觉等相关领域从业者进一步了解领域内最新发展动态与前沿技术进展,由中国自动化学会主办,中国自动化学会模式识别与机器智能(CAA-PRMI)专委会、中国计算机学会&#xff08…

Python OpenCV 蓝图:6~7

原文:OpenCV with Python Blueprints 协议:CC BY-NC-SA 4.0 译者:飞龙 本文来自【ApacheCN 计算机视觉 译文集】,采用译后编辑(MTPE)流程来尽可能提升效率。 当别人说你没有底线的时候,你最好真…

【Cartopy基础入门】如何更好的确定边界显示

原文作者:我辈理想 版权声明:文章原创,转载时请务必加上原文超链接、作者信息和本声明。 Cartopy基础入门 【Cartopy基础入门】Cartopy的安装 【Cartopy基础入门】Geojson数据的加载 【Cartopy基础入门】如何更好的确定边界显示 文章目录 Ca…

苯酚吸附树脂

苯酚作为一种重要的化工原料,主要用于生产酚醛树脂,双酚A,己内酰胺,壬基酚,水杨酸等,此外还可以做溶剂,试剂盒消毒剂等,在合成纤维,合成橡胶,塑料&#xff0c…

我国采矿采石设备制造行业发展现状与部分产品市场分析

一、行业基本概述 采矿采石设备制造,指地下或露天,用于对金属、煤炭、石油、化工等各种矿石或建筑用石的开采设备制造,以及矿石筛选、分类、分离、洗选、轧碎或类似加工工艺使用的专用机械的制造。 根据观研报告网发布的《 中国采矿采石设备…

5年测试总结,自动化测试DevOps-CICD持续集成流程设计...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 测试进阶&#xf…

JS对Json数组进行抽取 获取key: “value“

这篇文章不是拿key或value 是抽取需要的 key: “value” 【必须是单一数组 若是多组数据需要for循环】 // row 是json串 !!! 一、我有一个单一的json【row】 只要 id 和 appStatus 且分开成新数组 let list [];for (var key in row) {var temp {}if (key "id") {…

MyBatis-Plus多数据源dynamic-datasource解决多线程情境下数据源切换失效问题

前言:项目中使用MyBatis-Plus多数据源dynamic-datasource,完成多数据源的切换;但是在并发场景下,我们会发现线程会一直访问默认数据源(配置的Master数据),并没有访问我们在上一步切换后的数据源…

如何把电脑文件备份?本指南很详细

概述:当文件发生丢失的时候,如果我们有备份,直接进行还原就可以了。可见备份的重要性。如何把电脑文件备份?本文将为大家详细介绍。 一、为什么要备份文件 我们在电脑上面会保存很多文件,有的文件是很重要的&#xf…

基于vfw的局域网语音聊天室系统源码论文

语音视频聊天 UDP套接字的运用 在实现语音视频聊天时,采用的是基于UDP套接字的点对点模式,而UDP面向的是无连接的数据服务,其套接字的使用如图10所示。 图10 UDP套接字的使用 视频的捕获 利用VFW接口,视频捕获可以分为以下几个步骤: 建立视频采集窗口…

如何把数据库中的数据显示到页面

主要内容:使用JDBC访问数据库中数据(Java Web数据可视化案例) 文章目录 前期准备:案例:第一步:创建数据库及数据第二步:编写实体类第三步:编写Dao类第四步:编写Servlet代…

SpringBoot中使用redis事务

本文基于SpringBoot 2.X 事务在关系型数据库的开发中经常用到,其实非关系型数据库,比如redis也有对事务的支持,本文主要探讨在SpringBoot中如何使用redis事务。 事务的相关介绍可以参考: 0、起因 在一次线上事故中,我们…