思路:信号→和声
通过计算特征值(特征向量)区分音频的关键信息
Chroma特征向量
(32 条消息) 什么是 Chroma Features? - 知乎 (zhihu.com)
基本思想:音高听感的周期性
- 音高每高一个八度,就回到相似的听感
- 音高所处的八度,对和声功能影响较小
而Chroma所做的就是把音频特征压缩在一个八度中(12个维度)
向量提纯:打击乐和音频音色分离
基于概率模型的思路
定义随机变量:
X:一首音乐音频的Chroma特征序列
S:和弦标签特征
求:argmax[P(S/X)]
序列生成模型:隐马尔科夫模型(HMM)
- 使用随机值初始化HMM的参数θ,α
- 给定数据集,通过最大似然估计求HMM的参数
- 通过动态规划算出argmax[P(S/X)]
拓展:动态贝叶斯模型