摘要: 分享对论文的理解, 原文见 Zhongping Zhang and Youzuo Lin, Data-driven seismic waveform inversion: A study on the robustness and generalization.
1. 论文贡献
- 提供实时预测的 VelocityGAN
- 与其他基于编码器-解码器的数据驱动地震波形反演方法不同, VelocityGAN 从数据中学习正则化, 并进一步将正则化应用于生成器, 从而提高反演精度.
- 进一步使用迁移学习, 缓解泛化性问题.
2. 相关工作
图 1 展示了全波形反演的基本框架, 本质上就是端到端: 地震数据到速度模型.
2.1 声波反演: 物理驱动方法
正演模型为
P
=
f
(
m
)
(1)
P = f(\mathbf{m}) \tag{1}
P=f(m)(1)
其中
m
\mathbf{m}
m 为速度模型参数 (一个向量),
f
f
f 为正演模型算子 (一个函数),
P
P
P 是声学情况下的压力波场.
正则化的物理驱动地震反演为
E
(
m
)
=
min
m
{
∥
d
−
f
(
m
)
∥
2
2
+
λ
R
(
m
)
}
(2)
E(\mathbf{m}) = \min_{\mathbf{m}} \{\|\mathbf{d} - f(\mathbf{m})\|_2^2 + \lambda R(\mathbf{m})\} \tag{2}
E(m)=mmin{∥d−f(m)∥22+λR(m)}(2)
其中
d
\mathbf{d}
d 是实测的数据,
∥
⋅
∥
2
\| \cdot \|_2
∥⋅∥2 是 2 范数, 相应部分表示数据匹配误差,
λ
\lambda
λ 为一个系数,
R
(
m
)
R(\mathbf{m})
R(m) 是由参数导致的正则项, 用于避免模型太复杂 (过拟合).
这种方法的特点:
- 不需要其它数据的支持. 本质上, 输入只有 d \mathbf{d} d;
- 需要进行不断迭代求解. 预先猜一个模型 m \mathbf{m} m 根据式 (3) 计算损失, 再根据该损失进行 m \mathbf{m} m 的调整;
- 效率比较低 (与上一条有关);
- 依赖于初始猜测的模型, 即 m \mathbf{m} m 的最初版本. 如果数据没有噪声, 可以获得非常好的效果. 否则会陷入局部最优解, 无法进行良好的拟合.
2.2 数据驱动: 学习反演算子
m
=
g
(
d
)
=
f
−
1
(
d
)
(4)
\mathbf{m} = g(\mathbf{d}) = f^{-1}(\mathbf{d}) \tag{4}
m=g(d)=f−1(d)(4)
其中
g
g
g 就是需要学习的反演算子.
g
=
arg min
g
{
∑
i
=
1
N
∥
m
i
−
g
(
d
i
)
∥
2
2
}
(5)
g = \argmin_g \left\{\sum_{i=1}^N \|\mathbf{m}_i - g(\mathbf{d}_i)\|_2^2\right\}\tag{5}
g=gargmin{i=1∑N∥mi−g(di)∥22}(5)
其中
{
d
i
,
m
i
}
i
=
1
N
\{\mathbf{d}_i, \mathbf{m}_i\}_{i=1}^N
{di,mi}i=1N 为训练数据.
2.3 方法比较
物理方法 | 数据驱动方法 | |
---|---|---|
数据 | 不需要其它数据的支持. 本质上, 输入只有 d \mathbf{d} d | 需要训练数据 { d i , m i } i = 1 N \{\mathbf{d}_i, \mathbf{m}_i\}_{i=1}^N {di,mi}i=1N |
训练 | 针对当前数据的求解, 没有训练 | 大量训练时间, 效果与训练样本强相关 |
求解 | 需要进行不断迭代求解. 预先猜一个模型 m \mathbf{m} m 根据式 (3) 计算损失, 再根据该损失进行 m \mathbf{m} m 的调整 | 使用 g g g 直接求解 |
效率 | 针对当前数据求解慢 | 训练慢, 但测试效率高 |
依赖 | 依赖于初始猜测的模型, 即 m \mathbf{m} m 的最初版本. 如果数据没有噪声, 可以获得非常好的效果. 否则会陷入局部最优解, 无法进行良好的拟合 | 训练数据质量 |