当前位置: 首页 > news >正文

谣言检测论文精读——11.SAFE: Similarity-Aware Multi-Modal Fake News Detection

Abstract

作者指出现在的谣言检测文章很少考虑视觉和文本之间的关系(相似性),但是这种相关性是很重要的,比如说一个假新闻文章为了吸引读者的注意力,用了一张和文本毫不相干图片。所以作者提出了一个相似性感知假新闻检测模型——SAFE。这个模型从新闻文章中调查了大量的多模态信息,首先,用神经网络分别提取文本和视觉特征用于新闻表示,然后研究提取的多模态间的关系。然后新闻的文本和视觉特征表示和他们之间的关系联合学习并用来预测假新闻。
作者提出的方法有助于根据新闻文章的文本、图像或“不匹配”来识别其虚假性

1.Introduction

作者在该部分介绍了两种谣言检测方法:基于社交上下文和基于内容的
基于社交上下文的检测方法不利于在早期传播时检测假新闻,因为早期上下文信息较少。
基于内容的检测方法通常是视觉和文本信息,作者提出,当创作者使用非操纵图像来支持非事实场景或陈述时,虚假新闻的文本信息和视觉信息之间存在“鸿沟”。因此,作者认为加入文本和图像间的相关性来检测谣言是有必要的。
作者提出的方法由三个模块组成(如图一),执行(1)多模式(文本和视觉)特征提取;(2) 模态内(或者说模态无关)虚假新闻预测;(3) 跨模态相似性提取。
大致流程是:首先采用神经网络自动获取文本和视觉信息的潜在表示,并在此基础上定义它们之间的相似性度量。然后,这些新闻文本和视觉信息的表示及其相似性被联合学习并用于预测假新闻。该方法旨在识别新闻文章的文本或图像的虚假性,或文本和图像之间的“不匹配”
在这里插入图片描述

本文工作的主要贡献总结如下:
1.据我们所知,我们提出了第一种方法,调查新闻文本和视觉信息之间的关系(相似性)在预测虚假新闻中的作用;2.提出了一种新的方法,联合利用多模态(文本和视觉)和关系信息来学习新闻文章的表示和预测虚假新闻;3.对大规模真实数据进行了大量实验,以证明所提方法的有效性。

2.Related Work

这部分主要是基于内容和基于社交上下文的谣言检测的相关工作。

3.Methodology

这部分主要介绍模型使用的方法,三个模块及最后的联合预测。
问题定义和主要的符号:给定一个新闻文章表示为A = {T, V },T为文本信息,V为视觉信息。t ∈ Rd和v ∈ Rd作为相应的表示,其中 t = Mt(T, θt) andv = Mv(V, θv),让s = Ms(t, v) 来表示t和v之间的相似度,并且s ∈ [0, 1],我们的目标是通过文章的文本信息,视觉信息和他们的关系来预测A是假新闻(y^=1)还是真实新闻(y^=0)。

3.1Multi-modal Feature Extraction

Text:作者引入了一个额外的全连接层的扩展Text-CNN来自动提取每个新闻文章的文本特征。Text-CNN架构如图2所示.
在这里插入图片描述
给一个有n个单词的内容,每一次单词被嵌入表示为向量xlt ∈ R^k, l = 1, 2, · · · , n. 卷积层是将本地输入序列{x i:(i+h−1)t }^n−h+1i=1经过一个过滤器wt后产生特征映射,表示为Ct。如图所示,每一个本地输入是一组连续的h个单词。计算公式如下:
在这里插入图片描述
其中⊕是一个连接操作,σ是ReLU函数,wt和bt是Text_CNN中要被学习的参数
在这里插入图片描述
然后,最大池化是用来得到维度缩小的特征映射。最后,新闻的文本被表示为 t = Wtˆct + bt.
Image:为了表示图像,还是使用有一个额外的全连接层的Text-CNN,但是在这之前先使用一个预训练的image2sentence模型。最后计算方法一样,图像表示也是v = Wvˆcv + bv

3.2Modal-independent Fake News Prediction

将提取的新闻内容的文本视觉特征正确地映射到其虚假的可能性,进而映射到其实际标签。数学上,这种可能性可以通过
在这里插入图片描述
计算得到,1 = [1, 0]^T, ⊕是拼接运算,w和b是参数,为了让预测新闻时假新闻的可能性更加接近真实标签,定义一个交叉熵损失:
在这里插入图片描述

3.3Cross-modal Similarity Extraction

将新闻文章的视觉和文本信息之间的相关性定义为微调的余弦相似性:
在这里插入图片描述
Ms(t, v) 一定是正数并且 ∈ [0, 1],0表示t和v之前几乎不相似,1表示t和v几乎是相同的。
然后定义用交叉熵来定义损失:
在这里插入图片描述

3.4Model Integration and Joint Learning

检测虚假新闻目标是正确识别虚假新闻,其虚假性在于(1)文本和/或视觉信息,或(2)它们的关系。为了涉及这两种情况,将最终损失函数指定为:
在这里插入图片描述

4.Experiment

Dataset在这里插入图片描述## Results在这里插入图片描述

实验结果表明,多模态特征和跨模态关系(相似度)在虚假新闻检测中具有相当重要的价值。进行的案例研究进一步验证了该方法在评估此类相似性和预测虚假新闻方面的有效性。
作者提出的模型主要在文本和视觉相似性上做出了创新,因为作者发现很多虚假新闻的文本和图片并没有什么关系,很多图片只是为了吸引读者注意,还有一些图片本身就是错误的。并且比单模态和多模态简单融合有更好的效果。

相关文章:

  • 【华为机试真题 Python实现】找单词
  • Android应用安全指南-反逆向
  • Oracle数据库的表空间(一)
  • C | 实用调试技巧
  • 使用nvm安装node
  • 【算法】剑指offer-调整数组顺序数组出现超过一半的数字
  • 蓝桥杯C++AB算法辅导
  • matplotlib设置x轴和y轴 设置
  • MiniFly V1.1开源四轴驱动代码分析八:旋转矩阵、控制分配矩阵等分析介绍
  • 【云原生 | 从零开始学Kubernetes】二十五、kubectl深入理解
  • 策略模式的java实现-实际应用场景进阶版
  • [计算机通信网络]以太网的帧格式详解
  • [图像识别]10.OpenCV的特征点检测 SIFT和SURF算法
  • 牛客网专项练习30天Pytnon篇第02天
  • Controller部分
  • 时间复杂度分析经典问题——最大子序列和
  • 《剑指offer》分解让复杂问题更简单
  • 【Leetcode】104. 二叉树的最大深度
  • canvas绘制圆角头像
  • Java到底能干嘛?
  • JS学习笔记——闭包
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • 从重复到重用
  • 多线程 start 和 run 方法到底有什么区别?
  • 工作中总结前端开发流程--vue项目
  • 技术攻略】php设计模式(一):简介及创建型模式
  • 聚类分析——Kmeans
  • 每天一个设计模式之命令模式
  • 微信支付JSAPI,实测!终极方案
  • 小程序 setData 学问多
  • 学习JavaScript数据结构与算法 — 树
  • 一个普通的 5 年iOS开发者的自我总结,以及5年开发经历和感想!
  • 移动端唤起键盘时取消position:fixed定位
  • 译米田引理
  • 【运维趟坑回忆录 开篇】初入初创, 一脸懵
  • 阿里云IoT边缘计算助力企业零改造实现远程运维 ...
  • ​比特币大跌的 2 个原因
  • (10)Linux冯诺依曼结构操作系统的再次理解
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (Matalb回归预测)PSO-BP粒子群算法优化BP神经网络的多维回归预测
  • (第27天)Oracle 数据泵转换分区表
  • (附源码)spring boot公选课在线选课系统 毕业设计 142011
  • (九十四)函数和二维数组
  • (六)什么是Vite——热更新时vite、webpack做了什么
  • (免费领源码)python#django#mysql校园校园宿舍管理系统84831-计算机毕业设计项目选题推荐
  • (十三)Flask之特殊装饰器详解
  • (完整代码)R语言中利用SVM-RFE机器学习算法筛选关键因子
  • (转)ORM
  • (转)Scala的“=”符号简介
  • (转)总结使用Unity 3D优化游戏运行性能的经验
  • .NET CF命令行调试器MDbg入门(四) Attaching to Processes
  • .NET core 自定义过滤器 Filter 实现webapi RestFul 统一接口数据返回格式
  • .NET Core跨平台微服务学习资源
  • .net mvc 获取url中controller和action
  • .NET/C# 的字符串暂存池