当前位置: 首页 > news >正文

当图网络遇上计算机视觉!计算机视觉中基于图神经网络和图Transformer的方法和最新进展...

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—> CV 微信技术交流群


可能是目前最全面的《当图网络遇上计算机视觉》综述!近四百篇文献,覆盖五大主题 全面阐述计算机视觉中基于图神经网络和图Transformer的方法和最新进展!

3ee48eea0641bd9de77ce269ebd0b44a.png

A Survey on Graph Neural Networks and Graph Transformers in Computer Vision: A Task-Oriented Perspective

论文:https://arxiv.org/abs/2209.13232

近年来,由于在图表示学习(representation learning on graphs)和非网格数据(non-grid data)上的性能优势,基于图神经网络(Graph Neural Network)的方法被广泛应用于不同问题并且显著推动了相关领域的进步,包括但不限于数据挖掘(例如,社交网络分析、推荐系统开发)、计算机视觉(例如,物体检测、点云处理)和自然语言处理(例如,关系提取、序列学习)。

考虑到图神经网络已经取得了丰硕的成果,一篇全面且详细的综述可以帮助相关研究人员掌握近年来计算机视觉中基于图神经网络的方法的进展,以及从现有论文中总结经验和产生新的想法。可惜的是,我们发现由于图神经网络在计算机视觉中应用非常广泛,现有的综述文章往往在全面性或者时效性上存在不足,因此无法很好的帮助科研人员入门和熟悉相关领域的经典方法和最新进展。同时,如何合理的组织和呈现相关的方法和应用是一个不小的挑战。

830cf162d9739a28411eebfbae014bdd.png

图神经网络发展史

在本文中,我们首先介绍了图神经网络的发展史和最新进展,包括最常用、最经典的图神经网络和图Transformer。然后,我们以任务为导向对计算机视觉中基于图神经网络(包括图Transformer)的方法和最新进展进行了全面且详细的调研。具体来说,我们根据输入数据的模态将图神经网络在计算机视觉中的应用大致划分为五类:自然图像(二维)、视频、视觉+语言、三维数据(例如,点云)以及医学影像。在每个类别中,我们再根据视觉任务的不同对方法和应用进一步分类。

  • 建立在自然图像(二维)上的视觉任务包括 Image Classification (multi-label、few-shot、zero-shot、transfer learning),Object Detection,Semantic Segmentation,和 Scene Graph Generation。

  • 建立在视频上的视觉任务包括 Video Action Recognition,Temporal Action Localization,Multi-Object Tracking,Human Motion Prediction,和 Trajectory Prediction。

  • 视觉+语言方向的任务包括 Visual Question Answering,Visual Grounding,Image Captioning,Image-Text Matching,和 Vision-Language Navigation。

  • 建立在三维数据上的视觉任务包括 3D Representation Learning (Point Clouds、Meshes),3D Understanding (Point Cloud Segmentation、3D Object Detection、3D Visual Grounding),和 3D Generation (Point Cloud Completion、3D Data Denoising、3D Reconstruction)。

  • 建立在医学影像上的任务包括 Brain Activity Investigation,Disease Diagnosis (Brain Diseases、Chest Diseases),Anatomy Segmentation (Brain Surfaces、Vessels、etc)。

这种以任务为导向的分类法使我们能够研究不同的基于图神经网络的方法是如何处理每个任务的,以及较为公平地比较这些方法在不同数据集上的性能。在内容上我们还涵盖了基于Transformer的图神经网络方法,和在ECCV2022上发表的相关文章。

b15de08342b81cbecd0d5bf83e057c1f.png

已覆盖的计算机视觉中的相关领域

在文章中我们指出了图神经网络在视觉任务中面临的挑战,同时也揭示了一些鲜有人研究但是很有意义的方向,例如,如何从规则网格数据中获得抽象的图结构。这篇综述不仅帮助研究人员回顾了最新的技术进展,而且还可以作为计算机视觉从业者的参考手册,方便他们对实际问题进行分类并寻找潜在的解决方案。

上面综述PDF下载


 

后台回复:GNN综述,即可下载上面论文

图神经网络和Transformer 交流群成立
扫描下方二维码,或者添加微信:CVer222,即可添加CVer小助手微信,便可申请加入CVer-图神经网络或Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。
一定要备注:研究方向+地点+学校/公司+昵称(如GNN / Transformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

▲扫码或加微信号: CVer222,进交流群
CVer学术交流群(知识星球)来了!想要了解最新最快最好的CV/DL/ML论文速递、优质开源项目、学习教程和实战训练等资料,欢迎扫描下方二维码,加入CVer学术交流群,已汇集数千人!

▲扫码进群
▲点击上方卡片,关注CVer公众号

 
整理不易,请点赞和在看

相关文章:

  • 如何通过执行SQL为低代码项目提速?
  • linux_文件跟踪查看/实时查看添加到⽂件中的内容/linux日志查看(outline)
  • CDH Kerberos启动后hue报错Couldn‘t renew kerberos ticket
  • 学Spring5源码之入门
  • Maven - 3、详解maven解决依赖问题
  • 1行代码提取6种TCGA表达矩阵和临床信息
  • 直升飞机领衔、三百辆婚车开道,三十台巨型吊车,小伟婚礼超豪华
  • 【2023秋招面经】OPPO 前端 一面(40min)
  • Nifi05 Nifi单节点、集群部署以及迁移
  • SQL server发布订阅事务复制新增表的解决方案(不重新初始化)
  • Tableau2——折线图,饼图
  • 对话腾讯天琴赵伟峰:当音乐与科技结合,会碰撞出怎样的火花?
  • codePen前端编码神器
  • Android 10.0 系统settings系统属性控制一级菜单显示隐藏
  • Linux多路I/O复用入门必读 -- epoll实现原理以及使用方法
  • hexo+github搭建个人博客
  • 2017 年终总结 —— 在路上
  • Js实现点击查看全文(类似今日头条、知乎日报效果)
  • Netty源码解析1-Buffer
  • niucms就是以城市为分割单位,在上面 小区/乡村/同城论坛+58+团购
  • opencv python Meanshift 和 Camshift
  • 分类模型——Logistics Regression
  • 目录与文件属性:编写ls
  • 小程序 setData 学问多
  • 一天一个设计模式之JS实现——适配器模式
  • 正则表达式小结
  • 06-01 点餐小程序前台界面搭建
  • Hibernate主键生成策略及选择
  • #1014 : Trie树
  • #经典论文 异质山坡的物理模型 2 有效导水率
  • #我与Java虚拟机的故事#连载05:Java虚拟机的修炼之道
  • (007)XHTML文档之标题——h1~h6
  • (26)4.7 字符函数和字符串函数
  • (HAL)STM32F103C6T8——软件模拟I2C驱动0.96寸OLED屏幕
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)spring boot火车票售卖系统 毕业设计 211004
  • (附源码)计算机毕业设计SSM基于健身房管理系统
  • (六)什么是Vite——热更新时vite、webpack做了什么
  • (篇九)MySQL常用内置函数
  • (完整代码)R语言中利用SVM-RFE机器学习算法筛选关键因子
  • (轉貼) UML中文FAQ (OO) (UML)
  • .mkp勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET Core SkiaSharp 替代 System.Drawing.Common 的一些用法
  • .NET Core使用NPOI导出复杂,美观的Excel详解
  • .NET/C# 中设置当发生某个特定异常时进入断点(不借助 Visual Studio 的纯代码实现)
  • .NET设计模式(2):单件模式(Singleton Pattern)
  • .NET项目中存在多个web.config文件时的加载顺序
  • @angular/cli项目构建--Dynamic.Form
  • @javax.ws.rs Webservice注解
  • [ 网络基础篇 ] MAP 迈普交换机常用命令详解
  • [.net 面向对象程序设计进阶] (19) 异步(Asynchronous) 使用异步创建快速响应和可伸缩性的应用程序...
  • []常用AT命令解释()
  • [Bada开发]初步入口函数介绍
  • [BZOJ3757] 苹果树
  • [C++]unordered系列关联式容器