当前位置: 首页 > news >正文

【斯坦福大学公开课CS224W——图机器学习】一、图机器学习中的传统方法(1)

【斯坦福大学公开课CS224W——图机器学习】一、图机器学习中的传统方法(1)

文章目录

  • 【斯坦福大学公开课CS224W——图机器学习】一、图机器学习中的传统方法(1)
    • 1. 节点水平任务和特征
      • 1.1 节点的度
      • 1.2 节点中心性(node centrality)
        • 1.2.1 特征向量中心性(Eigenvector centrality)
        • 1.2.2 中间性中心性(Betweenness centrality)
        • 1.2.3 紧密性中心性(Closeness centrality)
      • 1.3 聚类参数(Clustering coefficient)
      • 1.4 图元(Graphlets)
    • 2. 总结

1. 节点水平任务和特征

节点的任务主要是利用机器学习的方式实现对图数据的未知节点进行分类。

节点的特征——目标:表征网络中节点的结构和位置:节点的度、节点中心性、聚类参数、图元

1.1 节点的度

节点v的度kv是该节点有多少条边与之相连。

1.2 节点中心性(node centrality)

节点的度计算了相邻节点的个数,但没有捕获到他们的重要性。节点的中心性cv考虑了图中节点的重要性。

不同的方法来构建他们的重要性:特征向量中心性(Eigenvector centrality)、中间性中心性(Betweenness centrality)、紧密性中心性(Closeness centrality)和其他方法

1.2.1 特征向量中心性(Eigenvector centrality)

将递归方程改写为矩阵形式。该方法可以简单理解为:自己的特征取决于邻近节点特征向量的标准化。

在这里插入图片描述

1.2.2 中间性中心性(Betweenness centrality)

该方法认为:如果一个节点位于其他节点之间的许多最短路径上,则该节点很重要。

在这里插入图片描述

1.2.3 紧密性中心性(Closeness centrality)

如果节点到所有其他节点的最短路径长度很小,则节点很重要。

在这里插入图片描述

1.3 聚类参数(Clustering coefficient)

在这里插入图片描述

1.4 图元(Graphlets)

通过观察发现,聚类系数计算自我中心网络(eco-network)中的三角形。我们可以通过计算预先指定的子图,即图元来推广以上内容。

目标:描述节点u周围的网络结构。

图元(Graphlets)是一个能够描述节点u的网络社区结构的小型子图。

类比来看,度计算了节点相接的边的个数;聚类参数计算节点周围边围成的三角形;图元度向量(Graphlet Degree Vector,GDV):基于图元的节点特征。GDV计算节点触接的图元个数。

图元度向量提供了节点局部网络拓扑的度量。比较两个节点的向量提供了比节点度或聚类系数更详细的局部拓扑相似性度量。

诱导子图:诱导子图是另一个图,由顶点子集和连接该子集中顶点的所有边形成。

图同构:两个图包含相同数量的节点,以相同的方式连接,称为同构。

图元:有根连通诱导非同构子图。

在这里插入图片描述

在这里插入图片描述

  • 我们有三种不同的轨道(orbit),轨道上有a、b、c、d四种节点位置(orbit position,图6中节点旁边标的数字)。对于节点v来说,其在轨道位置a上有2个图元,在轨道位置b上有1个图元,在轨道位置c上没有图元,在轨道位置d上有2个图元。这里需要注意的是图元是导出子图

例如把V节点放在c的位置,而在原图中 这个图不是导出子图,故图元为0.

对于GDV的理解是:它提供了对于一个节点的本地网络拓扑的度量,这样可以比较两个节点的GDV来度量它们的相似度。由于Graphlet的数量随着节点的增加可以很快变得非常大,所以一般会选择2-5个节点的Graphlet来标识一个节点的GDV。

2. 总结

我们介绍了获得节点特征的不同的方法,他们可以按照以下标准进行分类:

基于重要性的特征:捕获图中节点的重要性;用于预测图中有影响的节点,例如预测社交网络中的名人用户

  • 节点的度
  • 不同的节点中心性方法

基于结构的特征:捕捉节点周围局部邻域的拓扑性质;用于预测节点在图中扮演的特定角色,例如蛋白质相互作用网络中蛋白质功能的预测

  • 节点的度
  • 聚类参数
  • 图元计数向量(Graphlet count vector)

相关文章:

  • 【Java基础】TreeSet集合、自然排序、比较器排序、成绩排序及不重复随机数案例
  • Code For Better 谷歌开发者之声——Flutter - Google 开源的移动 UI 框架
  • 数据结构与算法01-算法的评估(大O表示法) 算法的优化方向
  • 某银行开发一个信用卡管理系统CCMS
  • JAVA基础知识
  • 计算机组成原理_数据寻址
  • Springboot集成Mybatisplus,轻松CRUD
  • IDEA生成时序图和类图(案例超详解)
  • 笔试选择题-树
  • 用神经网络模拟3个距离为0的粒子
  • 【重识云原生】第六章容器6.1.10节——DockerFile解析
  • 20220910编译ITX-3588J的Buildroot的系统1(编译uboot)
  • 100 ECMAScript6数组方法
  • 循环神经网络
  • web安全常见漏洞 之CSRF
  • [rust! #004] [译] Rust 的内置 Traits, 使用场景, 方式, 和原因
  • 【407天】跃迁之路——程序员高效学习方法论探索系列(实验阶段164-2018.03.19)...
  • 【译】React性能工程(下) -- 深入研究React性能调试
  • ES10 特性的完整指南
  • ESLint简单操作
  • Linux中的硬链接与软链接
  • SegmentFault 技术周刊 Vol.27 - Git 学习宝典:程序员走江湖必备
  • Spring声明式事务管理之一:五大属性分析
  • yii2权限控制rbac之rule详细讲解
  • 动态魔术使用DBMS_SQL
  • 前端相关框架总和
  • 思维导图—你不知道的JavaScript中卷
  • 王永庆:技术创新改变教育未来
  • 微信小程序--------语音识别(前端自己也能玩)
  • 原生JS动态加载JS、CSS文件及代码脚本
  • 分布式关系型数据库服务 DRDS 支持显示的 Prepare 及逻辑库锁功能等多项能力 ...
  • ​RecSys 2022 | 面向人岗匹配的双向选择偏好建模
  • (6)STL算法之转换
  • (Arcgis)Python编程批量将HDF5文件转换为TIFF格式并应用地理转换和投影信息
  • (Redis使用系列) Springboot 使用Redis+Session实现Session共享 ,简单的单点登录 五
  • (二)Linux——Linux常用指令
  • (机器学习-深度学习快速入门)第三章机器学习-第二节:机器学习模型之线性回归
  • (排序详解之 堆排序)
  • (七)微服务分布式云架构spring cloud - common-service 项目构建过程
  • (五)Python 垃圾回收机制
  • (转)eclipse内存溢出设置 -Xms212m -Xmx804m -XX:PermSize=250M -XX:MaxPermSize=356m
  • (转)项目管理杂谈-我所期望的新人
  • (自用)learnOpenGL学习总结-高级OpenGL-抗锯齿
  • ***通过什么方式***网吧
  • .NET 5种线程安全集合
  • .net refrector
  • .net 获取url的方法
  • .NET 依赖注入和配置系统
  • .Net8 Blazor 尝鲜
  • .NET开发不可不知、不可不用的辅助类(一)
  • .NET值类型变量“活”在哪?
  • /dev/sda2 is mounted; will not make a filesystem here!
  • [BUUCTF]-PWN:wustctf2020_number_game解析(补码,整数漏洞)
  • [C#基础知识]专题十三:全面解析对象集合初始化器、匿名类型和隐式类型
  • [C++]类和对象(中)