【音视频|PCM】PCM格式详解

news2024/12/22 22:49:30

😁博客主页😁:🚀https://blog.csdn.net/wkd_007🚀
🤑博客内容🤑:🍭嵌入式开发、Linux、C语言、C++、数据结构、音视频🍭
🤣本文内容🤣:🍭介绍数字音频的PCM格式🍭
😎金句分享😎:🍭子曰:君子不器。 ——《论语·为政篇》。意思是,君子不应像器具那样,只有一种用途。🍭

目录

  • 🎄一、PCM是什么?
    • ✨1.1 PCM 的定义
    • ✨1.2 PCM 和 声音(音频) 的关系
  • 🎄二、PCM 生成过程
    • ✨2.1 采样(Sampling)
    • ✨2.2 量化(Quantization)
    • ✨2.3 编码(Encoding)
  • 🎄三、PCM音频的特征或参数
  • 🎄四
  • 🎄五
  • 🎄六、


在这里插入图片描述

🎄一、PCM是什么?

✨1.1 PCM 的定义

PCM(Pulse Code Modulation)又称脉冲编码调制,是一种用于数字通信和音频记录的技术。PCM通过对模拟信号进行采样、量化、编码,将连续的模拟信号转换为离散的数字信号,从而实现信号的高保真传输和存储。

✨1.2 PCM 和 声音(音频) 的关系

从PCM的定义来看,它主要是将模拟信号转成数字信号。那它和音频有什么关系呢?为什么是要转成数字信号呢?

1、自然界中的声音通过麦克风等采集设备处理后,首先会将声音信号转换成电信号,但此时的电信号是连续的模拟信号,将这些音频模拟信号在坐标系表示就类似于下图:
在这里插入图片描述

2、计算机只认识0和1,这样连续的模拟信号要被计算机传输或存储等处理的话,就需要先转换成数字信号;

3、通过模数转换器(A/D),将音频模拟信号转换成数字信号后就可以被计算机处理,经过模数转换器处理后的音频数字信号就是PCM,是声音的原始数据。在音视频编程中,常被称为音频裸数据,它还可以继续被编码成其他格式的音频数据如:wav、mp3、aac、ogg;

4、计算机处理后的数字音频信号,再通过数模转换器(D/A),转换成音频模拟信号,最后通过扬声器等设备转成声音信号,进行播放。

通过前面的介绍,PCM可以总结为:通过模数转换器处理后,将声音模拟信号转换而成的数字信号,是声音要给计算机处理的最原始的音频数据。

在这里插入图片描述

🎄二、PCM 生成过程

读者可以先思考一下,怎样才能将连续的模拟信号转成数字信号呢?

既然模拟信号看起来像连续的一段曲线,是不是可以用很密集的一些点去表示,只要有足够多的点,就可以让这些点看起来像模拟信号的曲线了;

如果选择用很多点去表示连续的曲线,那么这些点的取值范围应该是多少呢?取值范围越大,越能精确地表示模拟信号曲线;

确定范围后,表示曲线的每个点就成了各个数值,最后将这些数值按照格式排列起来,就成了数字信号了。

其实,PCM也是大概按照上面的流程去生成的,PCM生成需要经过 采样(Sampling)量化(Quantization)编码(Encoding)

✨2.1 采样(Sampling)

采样就是将模拟信号的音频转换成数字信号音频的过程,通过模/数转换器(A/D)对声波进行采样,每一次采样都记录下了原始模拟声波在某一时刻的状态,称之为样本,将一串的样本连接起来,就可以描述一段声波。把每一秒钟所采样的次数称为采样频率,单位为HZ(赫兹)。其实,采样就是在时间轴上对信号进行数字化。
在这里插入图片描述
采用过程如上图,用若干个黑点来表示红色的曲线。红色的曲线是音频模拟信号,各个黑点就是样本。

采样率:每一秒钟所采样的样本个数;如果每秒所采集的样本越多,越能精确的表示曲线。常见的采样率有:通话时的采样率为8KHz(每秒8000个样本),常用的媒体采样率有44.1KHz(每秒44100个样本),更高要求的有48KHz(每秒48000个样本)等等。

✨2.2 量化(Quantization)

量化就是为采集的样本确定一个取值范围。

比如用16比特的二进制信号来表示声音的一个样本, 而16比特(一个short) 所表示的范围是[-32768,32767], 共有65536个可能取值, 因此最终音频的数字信号在幅度上也分为了65536层。

如果用8比特的二进制信号来表示声音的一个样本,8比特(一个unsigned char)所表示的范围是[0,255],共有256个层级。
在这里插入图片描述
注意:
在8位的PCM音频数据中,样本的取值范围是从0到255。对于有符号的8位PCM编码,取值范围为-128到127。每个样本使用一个8位字节来表示其幅度值,其中最低位(LSB)表示0,最高位(MSB)表示255。这种编码方式使得正负幅度能够均匀地分布在取值范围内,方便存储和处理。如果没有明确指定是有符号还是无符号的情况下,通常默认为无符号的0到255取值范围。

在16位PCM音频数据中,样本的取值范围是-32768到32767。16位PCM音频数据使用两个字节(16个比特)来表示每个样本的取值,其中一个比特用于表示正负号(16位中最高位为符号位)。因此,样本的取值范围可以表示为从 − 2 15 -2^{15} 215(-32768)到 2 15 2^{15} 215-1(32767)。这个范围与8位PCM音频数据的取值范围不同,因为它们使用了不同数量的比特来表示每个样本的取值。

✨2.3 编码(Encoding)

编码, 就是按照一定的格式记录采样和量化后的样本数据,将量化后的数字信号转换为二进制码的过程。比如顺序存储或压缩存储, 等等。

采样、量化后的数据经过编码后产生的二进制数据,就是PCM数据。
在这里插入图片描述

在这里插入图片描述

🎄三、PCM音频的特征或参数

  • 采样率(Sampling Rate):表示每秒钟采样的样本数量,单位为赫兹(Hz)。它决定了PCM音频的时间分辨率和频率范围。
  • 位深度(Bit Depth):表示每个样本的取值精度,通常以位数表示。它决定了PCM音频的动态范围和信噪比。一般为16bit。
  • 字节序(Byte Order):表示多字节数据在存储或传输中的排列顺序。常见的字节序有大端序(Big Endian)和小端序(Little Endian)两种。常见的为小端字节序。
  • 采样数据是否有符号(Signed or Unsigned Samples):表示每个样本的取值是否包含符号位。有符号PCM样本的取值范围涵盖正负值,而无符号PCM样本的取值范围仅包含非负值。
  • 声道数(Number of Channels):表示PCM音频中的独立声道数量。常见的声道数有单声道(Mono)和立体声(Stereo),还可以有更多声道如5.1声道、7.1声道等。

这些参数共同定义了PCM音频的基本特征,对于处理、存储和传输PCM音频非常重要。不同的应用场景和需求可能需要不同的参数设置来满足特定的要求。
在这里插入图片描述

🎄四

在这里插入图片描述

🎄五

在这里插入图片描述

🎄六、

在这里插入图片描述
如果文章有帮助的话,点赞👍、收藏⭐,支持一波,谢谢 😁😁😁

参考资料:
https://blog.csdn.net/qq_25333681/article/details/90682989

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1148022.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【队列的顺序表示,链式表示】

文章目录 队列的表示和实现相关术语队列的表示链队的表示链队的定义链队的初始化销毁链队列 链队列的入队出栈 队列的表示和实现 相关术语 队列(Queue)是仅在表尾进行插入操作,在表头进行删除操作的线性表。表尾即an端,称为队尾…

分布式锁其实很简单,6行代码教你实现redis分布式锁

一、前言 分布式锁是一种用于协调分布式系统中多个节点之间对共享资源进行访问控制的机制。它可以确保在分布式环境下,同一时间只有一个节点能够获取到锁,并且其他节点需要等待释放锁后才能获取。 以下是使用分布式锁的几个常见场景和原因:…

ChatGPT 驱动软件开发:AI 在软件研发全流程中的革新与实践

目录 内容简介作者简介专家推荐读者对象目录直播预告 计算机技术的发展和互联网的普及,使信息处理和传输变得更加高效,极大地改变了金融、商业、教育、娱乐等领域的运作方式。数据分析、人工智能和云计算等新兴技术,也在不断地影响和改变着各…

misc学习(4)Traffic(流量分析)-

感悟:回想起自己学的计算机网络和网络协议分析,有所感悟:计算机网络好比将一群人区分开来(局域网),为了能够使得不同部分的人能够沟通(wireshark中的数据包),就设置了网络…

高级深入--day43

通过Fiddler进行手机抓包 通过Fiddler抓包工具,可以抓取手机的网络通信,但前提是手机和电脑处于同一局域网内(WI-FI或热点),然后进行以下设置: 用Fiddler对Android应用进行抓包 打开Fiddler设置 在Conne…

DIANA算法c++实现

第一步对具有最大直径的簇中每个点计算平均相异度找出最大的点放入splinter group&#xff0c;其余放在放入splinter group 第二步 在old party里找出到splinter group中点的最近距离 < 到old party中点的最近距离的点&#xff0c;并将该点加入splinter group 重复第二步的…

共用体开发案例

有若干个人员的数据,其中有学生和教师。学生的数据中包括:姓名、号码性别、职业、班级。教师的数据包括:姓名、号码、性别、职业、职务。要求用同一个表格来处理。 #include <stdio.h>struct Person {char name[32];int age;char zhiYe;char addr[32];union {int class;…

Ubuntu系统编译调试QGIS源码保姆级教程

在之前的文章中&#xff0c;我详细介绍了怎么在Windows下编译QGIS源码&#xff0c;也得到了不错的反馈。但是不足的是Windows下只能编译QGIS的Release模式和RelWithDebInfo模式&#xff0c;想要分析源码&#xff0c;“断点调试”肯定是少不了的&#xff0c;但是这两种模式虽然也…

论文写作框架示例:论软件系统建模方法及其应用

标题 前言题目要求写作框架(1)摘要(300~330字)(2)正文(2000~2500字,2200字左右为宜)(3)收尾(200字左右)前言 本章内容参考了51cto的薛老师的《软考论文高分特训与范文10篇》的内容,是帮助初学者打开写作思路的工具,而不是必须要遵循的模式。建议软考人多读多看…

集丰照明|灯光布局没做好,几百万装修也拯救不了

俗话说拍照要看灯光的位置&#xff0c;我们在装修的时候也要注重灯光的摆放&#xff0c;不然可能你花了很多钱的装修&#xff0c;结果就会因为灯光的布局不合理&#xff0c;导致效果大打折扣。 装修也是一样&#xff0c;忽略掉灯光&#xff0c;可能就会发生花了几十万&#xff…

08. 按键输入

08. 按键输入 按键原理图代码编写GPIO驱动代码按键驱动代码主函数 加上清除BSS段&#xff0c;代码不运行 按键原理图 按键KEY0连接到了UART1_CTS上。默认情况下&#xff0c;KEY0为高&#xff0c;当按下KEY0后&#xff0c;UART1_CTS为低电平 代码编写 在bsp下创建一个key和一个…

减少磁盘读/写中延迟时间的方法(交替编号,错位命名)

目录 1.延迟时间的优化空间2.交替编号3.磁盘地址结构的设计1.若物理地址结构是&#xff08;盘面号&#xff0c;柱面号&#xff0c;扇区号&#xff09;2.若物理地址结构是&#xff08;柱面号&#xff0c;盘面号&#xff0c;扇区号) 4.错位命名 关于磁盘延迟时间的概念请看博主的…

AQS 关于锁与队列的关系

前面的文章中又介绍的在争用激烈的场景下&#xff0c;使用基于CAS自旋实现的轻量级锁有两个大的问题: (1)CAS恶性空自旋会浪费大量的CPU资源。 (2)在SMP架构的CPU上会导致“总线风暴”。 解决CAS恶性空白旋的有效方式之一是以空间换时间&#xff0c;较为常见的方案有两…

leetCode 229. 多数元素 II + k值摩尔投票法 + 进阶 + 优化空间

229. 多数元素 II - 力扣&#xff08;LeetCode&#xff09; 给定一个大小为 n 的整数数组&#xff0c;找出其中所有出现超过 ⌊ n/3 ⌋ 次的元素。 进阶&#xff1a;尝试设计时间复杂度为 O(n)、空间复杂度为 O(1)的算法解决此问题。 &#xff08;1&#xff09;哈希表 class …

“RG-SMP 安全管理平台” 优化

全局添加ICO图标 管理强制重定向https <!-- \SMP\jboss\server\default\deploy\smp.war\common common_js.jsp --> <link rel"shortcut icon" href"data:image/x-icon;base64,AAABAAEAICAAAAEAIACoEAAAFgAAACgAAAAgAAAAQAAAAAEAIAAAAAAAABAAAAAAAAAAA…

通俗易懂的GPT原理简介

GPT是自然语言处理领域中最受欢迎的模型之一。GPT全称为Generative Pre-trained Transformer&#xff0c;是一种基于Transformer模型的预训练语言模型。在接下来的文章中&#xff0c;我们将详细介绍GPT的原理。 一、前置知识 在了解GPT原理之前&#xff0c;需要了解以下一些基…

【2023年冬季】华为OD统一考试(B卷)题库清单(已收录345题),又快又全的 B 卷题库大整理

目录 专栏导读华为OD机试算法题太多了&#xff0c;知识点繁杂&#xff0c;如何刷题更有效率呢&#xff1f; 一、逻辑分析二、数据结构1、线性表① 数组② 双指针 2、map与list3、队列4、滑动窗口5、二叉树6、并查集7、栈 三、算法1、基础算法① 贪心算法② 二分查找③ 分治递归…

【Linux】-进程控制(深度理解写时拷贝、exit函数、return的含义以及makefile编译多个程序)-进程创建、进程终止、进程等待、进程程序替换

&#x1f496;作者&#xff1a;小树苗渴望变成参天大树&#x1f388; &#x1f389;作者宣言&#xff1a;认真写好每一篇博客&#x1f4a4; &#x1f38a;作者gitee:gitee✨ &#x1f49e;作者专栏&#xff1a;C语言,数据结构初阶,Linux,C 动态规划算法&#x1f384; 如 果 你 …

基于SSM的品牌手机销售信息系统

末尾获取源码 开发语言&#xff1a;Java Java开发工具&#xff1a;JDK1.8 后端框架&#xff1a;SSM 前端&#xff1a;采用JSP技术开发 数据库&#xff1a;MySQL5.7和Navicat管理工具结合 服务器&#xff1a;Tomcat8.5 开发软件&#xff1a;IDEA / Eclipse 是否Maven项目&#x…

dash--项目的前端展示简单基础

1.前置工作 创建虚拟环境&#xff1a; sudo apt-get install python3-venv # 安装 python3 -m venv venv # 在本目录下创建venv虚拟环境&#xff08;也是一个文件夹。如果用不到这个虚拟环境以后就rm -rf venv&#xff09; source venv/bin/activate # 激活虚拟环境临时使用清华…