当前位置: 首页 > news >正文

论文阅读:Most Probable Densest Subgraphs

摘要

本文提出了一种在不确定图中发现最有可能稠密子图(MPDS)的新方法。不确定图中的每条边都有存在概率,使得计算稠密子图变得複杂。作者定义了稠密子图概率,并证明了计算该概率是#P难的。为了解决这个问题,设计了基于抽样的高效近似算法,并提供了准确性保证。实验结果表明,该方法在生物、社交和金融网络中的应用中具有高效性和实用性。

研究背景

在数据管理和网络分析领域,稠密子图的发现一直是重要的研究问题。稠密子图在各种应用中具有重要意义,如社交网络中的社区检测、生物网络中的功能模块识别,以及金融网络中的欺诈检测等。然而,现实世界中的数据往往具有不确定性,例如由于测量误差或数据隐私原因,图中的边可能不确定。这种不确定性使得传统的稠密子图发现方法在应用中面临挑战。因此,研究如何在不确定图中有效地发现稠密子图成为了一个重要课题。

研究问题

本文研究的核心问题是在不确定图中找到最有可能生成稠密子图的节点集。具体而言,给定一个不确定图,每条边都有一定的存在概率,目标是找出一个节点集,使得这些节点在所有可能的确定性图中生成稠密子图的概率最大。这个问题被定义为“最有可能的稠密子图问题”(MPDS)。

在这里插入图片描述

主要贡献

  1. 新问题定义:引入了稠密子图概率的概念,并证明了计算该概率是#P难的。这一创新为稠密子图问题提供了新的视角和解决方案。
  2. 高效近似算法:设计了基于抽样的近似算法,用于计算MPDS,并提供了端到端的准确性保证。这些算法能够在合理的时间内处理大规模不确定图,并给出准确的近似结果。
  3. 实验验证:通过在多个真实世界数据集上的实验,展示了所提出方法的有效性和实用性。实验结果表明,该方法在生物、社交和金融网络中的应用中具有显着优势。

方法

问题建模

在不确定图中,每条边都有一个存在概率。本文首先将这一模型形式化,并定义了稠密子图概率,表示某个节点集在所有可能的确定性图中生成稠密子图的总概率。

在这里插入图片描述

抽样技术

为了计算稠密子图概率,作者使用了蒙特卡罗抽样方法生成多个可能的确定性图(可能世界)。每个确定性图都是根据不确定图中的边存在概率独立生成的。

稠密子图检测

在每个抽样的确定性图中,使用现有的稠密子图检测算法,如基于最大流的Goldberg算法,找到所有的稠密子图。这些结果被累积起来,用于估计每个节点集生成稠密子图的概率。

为了更好地理解这一过程,我们以3-clique稠密子图检测为例,展示如何在确定性图中进行该检测。

在这里插入图片描述

解释如下:

输入图 (a):一个包含6个节点和若干边的输入不确定图。

确定性实例 (b):从不确定图中抽样得到的一个确定性图实例。

流网络 ©:为了找出3-clique稠密子图,构建了一个对应的流网络。

所有 (h-1) clique (d):在确定性图中找到所有的2-clique,作为后续流网络构建的基础。

残差图 (e):在最大流计算后得到的残差图,通过残差图可以识别出所有的3-clique稠密子图。

这一示例展示了从不确定图到确定性图,再到流网络和残差图的转变过程,并说明了如何利用这些工具来识别稠密子图。

结果排序

根据计算出的稠密子图概率,将节点集进行排序,找出top-k最有可能生成稠密子图的节点集。这些节点集即为所谓的“最有可能的稠密子图”。

实验与结果

实验设计

为了验证所提出方法的有效性,作者在多个真实世界数据集上进行了实验,包括脑网络、社交网络和金融网络。这些数据集具有不同的规模和特性,能够全面测试算法的性能。

结果分析

实验结果表明,所提出的方法在计算效率和结果准确性方面均优于现有方法。具体来说,所提出的基于抽样的算法能够在合理的时间内处理大规模不确定图,并提供高准确性的近似结果。此外,这些结果在不同应用场景中均显示出良好的适应性。

案例研究

脑网络

在脑网络的实验中,研究人员应用了所提出的方法来分析不同脑区之间的连接模式。实验结果成功区分了健康脑与自闭症脑,展示了该方法在生物医学领域的潜力。具体来说,该方法能够识别出自闭症患者脑中的异常连接模式,这些异常连接可能与自闭症的病理机制相关,为临床诊断和治疗提供了新的线索。

在这里插入图片描述

图8展示了在脑网络中3-clique MPDS的节点集,对比了典型发育的脑与受自闭症影响的脑。彩色边界表示小脑、枕叶和颞叶的位置。左图显示了在典型发育的脑中3-clique MPDS的节点集,右图显示了在受自闭症影响的脑中3-clique MPDS的节点集。这张图对比了不同脑区中的稠密子图结构,有助于理解自闭症对脑网络结构的影响。

在这里插入图片描述

图9展示了在脑网络中3-clique MPDS的节点集,并对比了典型发育的脑与受自闭症影响的脑。图中每条边的粗细与其概率成正比。这进一步直观地展示了脑网络中节点之间的连接强度及其分布情况,为理解自闭症对脑网络结构的影响提供了视觉化的辅助工具。

结论

本文提出了一种新方法来解决不确定图中的稠密子图问题。通过基于抽样的高效近似算法,该方法能够在处理大规模不确定图时提供准确的近似结果,并在多个应用领域中展示了其有效性和实用性。这一研究为不确定图的分析提供了新的工具和方法,对未来的研究和应用具有重要意义。之後的研究可以进一步优化算法,降低计算成本,并探索更多不同类型的不确定图模型和应用场景。此外,可以将所提出的方法扩展到动态图和加权图等更複杂的图模型中,以应对更加多样化的实际应用需求。

论文地址:https://arxiv.org/abs/2212.08820

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 二手车交易系统开发设计源码及功能解析
  • M21170G-12
  • Unity射击游戏开发教程:(31)制造一定追踪行为的敌人
  • 使用QNetworkAccessManager实现FTP上传下载功能
  • 反序列化靶机实战serial(保姆级教程)
  • jupyter for c++
  • java进阶 CompletableFuture
  • Python 设计模式之工厂函数模式
  • stem32江科大自学笔记
  • nodeJS的一点个人总结
  • C语言time库
  • linux shell 脚本 之 getopt
  • 【Mysql】第一章 (环境配置)
  • SpringBoot简单项目(二维码扫描)
  • JVM—虚拟机类加载时机与过程
  • - C#编程大幅提高OUTLOOK的邮件搜索能力!
  • css布局,左右固定中间自适应实现
  • Java 内存分配及垃圾回收机制初探
  • Java,console输出实时的转向GUI textbox
  • Laravel 实践之路: 数据库迁移与数据填充
  • RxJS: 简单入门
  • Solarized Scheme
  • SwizzleMethod 黑魔法
  • 创建一个Struts2项目maven 方式
  • 给初学者:JavaScript 中数组操作注意点
  • 后端_MYSQL
  • 日剧·日综资源集合(建议收藏)
  • 一起参Ember.js讨论、问答社区。
  • 容器镜像
  • ​secrets --- 生成管理密码的安全随机数​
  • #NOIP 2014# day.2 T2 寻找道路
  • #微信小程序:微信小程序常见的配置传值
  • #我与Java虚拟机的故事#连载01:人在JVM,身不由己
  • #我与Java虚拟机的故事#连载06:收获颇多的经典之作
  • (6)STL算法之转换
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第5节(封闭类和Final方法)
  • (Python) SOAP Web Service (HTTP POST)
  • (react踩过的坑)antd 如何同时获取一个select 的value和 label值
  • (webRTC、RecordRTC):navigator.mediaDevices undefined
  • (草履虫都可以看懂的)PyQt子窗口向主窗口传递参数,主窗口接收子窗口信号、参数。
  • (超简单)构建高可用网络应用:使用Nginx进行负载均衡与健康检查
  • (动手学习深度学习)第13章 计算机视觉---图像增广与微调
  • (附源码)springboot美食分享系统 毕业设计 612231
  • (六)DockerCompose安装与配置
  • (原)Matlab的svmtrain和svmclassify
  • (转)eclipse内存溢出设置 -Xms212m -Xmx804m -XX:PermSize=250M -XX:MaxPermSize=356m
  • (转)Linux下编译安装log4cxx
  • .NET Core 2.1路线图
  • .net和jar包windows服务部署
  • .NET企业级应用架构设计系列之开场白
  • .net知识和学习方法系列(二十一)CLR-枚举
  • @Mapper作用
  • [ linux ] linux 命令英文全称及解释
  • [ 转载 ] SharePoint 资料
  • [12] 使用 CUDA 进行图像处理