当前位置: 首页 > news >正文

EPT-Net:用于3D医学图像分割的边缘感知转换器

EPT-Net: Edge Perception Transformer for 3D Medical Image Segmentation

  • EPT-Net:用于3D医学图像分割的边缘感知转换器
    • 背景
    • 贡献
    • 实验
    • 方法
      • Dual Positional Transformer(双位置Transformer)
        • Learnable Patch Embedding
        • Voxel Spacial Positional Embedding
      • Edge Weight Guidance Module(边界权重引导模块)
        • Shallow Guidance Module(浅层引导模块)
        • Weighted Attention Module(加权注意力模块)
    • 损失函数
    • Thinking

EPT-Net:用于3D医学图像分割的边缘感知转换器

IEEE TRANSACTIONS ON MEDICAL IMAGING, VOL. 42, NO. 11, NOVEMBER 2023

背景

卷积运算的内在局部性在建模长程依赖性方面存在局限性。尽管为序列到序列全局预测而设计的Transformer就是为了解决这个问题而诞生的,但由于底层细节特征不足,它可能会导致定位能力有限。此外,低级特征具有丰富的细粒度信息,这极大地影响了不同器官的边缘分割决策。然而,一个简单的CNN模块很难捕捉细粒度特征中的边缘信息,并且在处理高分辨率3D特征时消耗的计算能力和内存是昂贵的。

本文提出了一种双位置变换器,以有效地提高三维空间定位能力。此外,由于低级别特征包含详细信息,我们在不添加网络参数的情况下,通过最小化边缘信息函数来执行边缘权重引导模块来提取边缘信息

贡献

  1. 提出了一种新的医学图像分割网络,称为EPT-Net,它混合了改进的Transformer和无参数注意机制,用于对器官特征的长期依赖性进行建模。
  2. 提出了一种双位置嵌入Transformer,包括可学习位置嵌入体素空间位置嵌入。该方法用于优化位置编码,可以有效地捕捉医学图像性不同器官位置之间的内在相关。
  3. 开发了一个边缘权重引导模块来学习浅层特征中的边缘信息,该模块可以捕捉相邻器官之间的微小粘连。这种设计是为了在不增加网络参数的情况下最小化边缘信息功能。
  4. 在三个数据集上验证了EPTNet的有效性和稳健性,包括SegTHOR 2019、颅骨拱顶外的多图谱标记和重新标记的KiTS19。实验表明,在这些数据集上,我们的方法优于最先进的方法。

实验

选择了三个数据集进行实验验证,其中包括两个公共数据集SegTHOR 2019[17],颅骨(BCV)之外的多图谱标记[18]和重新标记的KiTS19数据集[19],称为KiTS19-M。首先,介绍了SegTHOR 2019数据集,并专门用于在放疗期间分割肿瘤周围胸腔中的危险器官,包括心脏(hea)、气管(tra)、主动脉(aor)和食道(eso)。该数据集包括60个CT扫描,分为40个训练集和20个测试集。经验丰富的放射治疗师已经手动绘制了心脏、气管、主动脉和食道。接下来,MultiAtlas Labeling Beyond the Cranial Vault包含13个腹部器官的标签,包括脾脏(spl)、左右肾(L-K和R-K)、胆囊(gal)、食道(eso)、肝脏(liv)和胃(sto)、主动脉(aor)、下腔静脉(I-V-C)、门静脉和脾静脉(P-V/S-V)、胰腺(pan)、左右肾上腺(R-A-G和L-A-G),由两名经验丰富的大学生和放射科医生手工标记。使用MIPAV软件进行容量验证。该数据集包含30个标记的CT图像和20个测试图像。KiTS19-M数据集来自KiTS19数据集肾脏肿瘤分割竞赛。它包含300个样本,包括210个训练样本和90个测试样本。为了促进我们对多器官分割的研究,我们对数据集中的多个器官进行了重新标记。经过经验丰富的专家重新标记,我们对四个腹部器官进行了精细标记,包括肝、脾、右肾和左肾。
在这里插入图片描述
在这里插入图片描述

方法

U型网络结构在医学图像分割中取得了显著的成就。由于卷积运算的内在局部性和编码器-解码器的U型网络结构中缺乏全局上下文边缘信息处理,我们提出了EPT-Net。该网络主要基于U型网络,由双位置Transformer(DPT)和边缘权重引导(EWG)模块组成。DPT是在编码器末端提取深度信息,通过Transformer解决了U型网络的远程依赖性限制。将浅层细粒度特征输入EWG以提取图像边缘信息。
在这里插入图片描述

Dual Positional Transformer(双位置Transformer)

在这里插入图片描述

Learnable Patch Embedding

利用异步卷积,确保相邻的补丁块在补丁序列化过程中具有特定的交互部分【An image is worth 16×16 words: Transformers for image recognition at scale】

Voxel Spacial Positional Embedding

对于医学三维体积数据,不仅需要考虑切片中像素之间的连接,还需要考虑不同切片之间的信息交互。提出了一种条件位置码生成器,并将其命名为体素空间位置嵌入(VSPE)。VSPE和可学习的位置嵌入为Transformer提供了更有用的位置信息。【Conditional positional encodings for vision transformers】

Edge Weight Guidance Module(边界权重引导模块)

ET-Net: A generic edge-attention guidance network for medical image segmentation
在这里插入图片描述
在这里插入图片描述

SimAM: A simple, parameterfree attention module for convolutional neural networks
https://github.com/ZjjConan/SimAM
在这里插入图片描述

Shallow Guidance Module(浅层引导模块)

SG为早期监督提供预测的边缘检测结果。

Weighted Attention Module(加权注意力模块)

WA和SG被组合以生成EA。WA可以对整个特征图进行优先排序,并且可以很容易地与三维卷积相结合。在每次卷积操作之后将WA模块插入SG模块可以产生更具代表性的边缘特征。在这里,完成了从浅层特征中提取边缘信息

损失函数

深度监督

Thinking

SG,WA没表达清楚???

相关文章:

  • gitlab图形化界面使用
  • Verilog基础:时序调度中的竞争(一)
  • ElasticSearch之cat aliases API
  • Redis中文结果查看方式
  • 【Python 千题 —— 基础篇】删除列表值
  • Nginx模块开发之http过滤器filter
  • MySQL面试,MySQL事务,MySQL锁,MySQL集群,主从,MySQL分区,分表,InnoDB
  • 蓝桥杯每日一题2023.11.23
  • 【算法专题】滑动窗口—无重复字符的最长子串
  • Django项目window环境部署
  • Python之Pygame游戏编程详解
  • 音视频项目—基于FFmpeg和SDL的音视频播放器解析(二十一)
  • Missing file libarclite_iphoneos.a 问题解决方案
  • Halcon Solution Guide I basics(4): Blob Analysis(连通性解析)
  • 【Java】认识异常
  • 自己简单写的 事件订阅机制
  • Android 初级面试者拾遗(前台界面篇)之 Activity 和 Fragment
  • ES6之路之模块详解
  • JavaScript-Array类型
  • js正则,这点儿就够用了
  • Lsb图片隐写
  • Lucene解析 - 基本概念
  • Vue UI框架库开发介绍
  • vue脚手架vue-cli
  • 创建一个Struts2项目maven 方式
  • 订阅Forge Viewer所有的事件
  • 翻译:Hystrix - How To Use
  • 看图轻松理解数据结构与算法系列(基于数组的栈)
  • 批量截取pdf文件
  • 前端学习笔记之观察者模式
  • 详解移动APP与web APP的区别
  • 小程序滚动组件,左边导航栏与右边内容联动效果实现
  • ​2020 年大前端技术趋势解读
  • ‌[AI问答] Auto-sklearn‌ 与 scikit-learn 区别
  • # centos7下FFmpeg环境部署记录
  • # 再次尝试 连接失败_无线WiFi无法连接到网络怎么办【解决方法】
  • $.ajax中的eval及dataType
  • (1)svelte 教程:hello world
  • (19)夹钳(用于送货)
  • (android 地图实战开发)3 在地图上显示当前位置和自定义银行位置
  • (pytorch进阶之路)扩散概率模型
  • (不用互三)AI绘画工具应该如何选择
  • (附源码)spring boot基于小程序酒店疫情系统 毕业设计 091931
  • (简单) HDU 2612 Find a way,BFS。
  • (十八)Flink CEP 详解
  • (十一)图像的罗伯特梯度锐化
  • (转)GCC在C语言中内嵌汇编 asm __volatile__
  • (转)Linux下编译安装log4cxx
  • (转)Unity3DUnity3D在android下调试
  • (转)自己动手搭建Nginx+memcache+xdebug+php运行环境绿色版 For windows版
  • (轉貼) VS2005 快捷键 (初級) (.NET) (Visual Studio)
  • .【机器学习】隐马尔可夫模型(Hidden Markov Model,HMM)
  • .equals()到底是什么意思?
  • .NET Compact Framework 3.5 支持 WCF 的子集
  • .Net Core 微服务之Consul(二)-集群搭建