UQ 过滤:提升分子预测反事实解释可靠性
目录
- I-INF 指标结合 F1 评分,为评估大分子复合物(包括 RNA-蛋白质)的界面相互作用网络提供了可靠且全面的新方法。
- 通过使用生成的人工 CAR 序列微调蛋白质语言模型(PLM),显著提高了 CAR-T 细胞活性的预测准确性,有效克服了合成蛋白数据稀缺的挑战。
- 通过量化不确定性并过滤高不确定性反事实样本,研究者显著提升了分子性质预测中反事实解释的真实性与可靠性。
- LncMamba 模型,通过引入 Mamba 架构,显著提升了 lncRNA 亚细胞定位预测的准确性、效率和可解释性。
- 评估蛋白质设计优化算法时必须考虑风险与成本。
1. I-INF:评估大分子复合物界面新利器
研究者引入了一种名为分子间相互作用网络保真度(Intermolecular Interaction Network Fidelity, I-INF)的新指标,旨在精确评估大分子复合物内部,特别是链间的相互作用网络的准确性。该指标源自一个针对 RNA 的特定测量方法,并生成一个范围在 0 到 1 之间的标准化相似度得分。其中,得分 1 表示与参考结构完美匹配,而 0 则表示完全不匹配。
为了验证其有效性,研究者在 72 个 RNA-蛋白质对接诱饵结构上测试了 I-INF 评分。结果显示,I-INF 与 TM-score 高度相关,这证明了它在评估分子界面准确性方面的有效性,这对大分子复合物的预测至关重要。
此外,该研究还整合了蛋白质结构预测中广泛使用的 F1 评分。通过结合使用 I-INF 和 F1,作者构建了一个强大的框架,能够更全面地评估预测模型中界面的准确性,特别关注氢键和链间相互作用。这个框架适用于评估 RNA-RNA、DNA-DNA 以及蛋白质 - 蛋白质等多种复合物的界面。
研究表明,I-INF 为 RNA-蛋白质对接预测提供了可靠且一致的评分,并且是对现有评估方法(如 DockQv2&#x