MMDFND:多模态多域假新闻检测
1 介绍
现有的假新闻检测方法通常集中在单一领域的新闻上,如健康或政治。然而,社交媒体上的新闻往往来自多个领域,这给单一领域的假新闻检测方法带来了两个主要挑战:
数据稀缺性:处理较小、单一领域的新闻数据集时,由于训练数据的稀缺,模型的有效性显著下降。
跨领域检测的准确性下降:单一领域的假新闻检测方法在跨领域新闻数据集上的准确性大幅降低。
1.2 现有方法的不足
现有的多领域假新闻检测方法存在以下三个问题:
- 领域间模态语义偏差:不同领域的文本和图像描述在语义上存在差异,可能导致对同一新闻的不同解释。
- 领域间模态依赖偏差:不同领域对模态信息的依赖程度不同,某些领域可能更依赖文本,而其他领域可能更依赖图像。
- 领域间知识依赖偏差:不同领域对跨领域知识和领域特定知识的依赖程度不同,现有方法未能有效利用这些知识。