当前位置: 首页 > news >正文

线性阈值(Linear Threshold)模型的原理及代码实现

目录

  • 1. 原理
  • 2. 代码实现
    • 2.1 数据集
    • 2.2 线性阈值

1. 原理

线性阈值模型和独立级联模型一样,在影响力最大化任务中属于比较经典的影响力传播模型。

有关独立级联模型的相关原理和代码可以参考我的上一篇文章:独立级联(Independent Cascade)模型的原理及代码实现

具体来讲,针对某一具体传播的实体(谣言、绯闻、产品等),将图中的每个点描述为两种可能状态:不活跃(inactive)和活跃(active)。不活跃状态表示该个体还没有接受对应实体,而活跃状态表示该个体已经接受对应的实体。节点从不活跃状态变为活跃状态表示该节点接受了对应实体,也称之为被激活。

在线性阈值模型中,每条边e=(u,v)上都存在一个权重 w u , v w_{u,v} wu,v w u , v w_{u,v} wu,v量化了节点u在节点v的所有入邻居中的影响力占比,权重越大说明节点u对节点v影响就更大。需要注意的是,节点v的所有入边上的权重之和要小于等于1。除此之外,节点v还有一个影响力阈值 θ v \theta_v θv,这个阈值在01之间均匀随机选取,一旦确定就不再改变。节点v的阈值越高,表明节点v越不容易被影响,反之阈值越低越容易被影响。

激活过程具体来讲:初始时同样只有种子节点被激活,随后每个时间步所有未被激活的节点都根据其已被激活的入邻居到它的线性加权和是否达到阈值来决定是否激活该节点。与独立级联不同的是,每个被激活都节点都有多次机会去激活自己尚未被激活的邻居节点

那么算法步骤可以被分解为:

  1. 初始化种子节点,然后激活种子节点作为初始激活集合。
  2. 寻找尚未被激活且有激活节点作为邻居节点的节点,放入备选节点集合。
  3. 依次对备选节点集合中的节点计算激活概率,然后尝试激活,被激活的节点将被放进激活集合。
  4. 重复23步骤,直至没有可激活的节点。

2. 代码实现

在本次代码实现中, w u , v w_{u,v} wu,v的计算方法为:
w u , v = 1 d v i n w_{u,v}=\frac{1}{d_v^{in}} wu,v=dvin1
其中 d v i n d_v^{in} dvin表示节点 v v v的入度。从计算方法来看,如果一个节点v的入邻居很多,那么每条入边上的权重会相应降低,这保证了它们的和不会超过1。

2.1 数据集

数据集采用PyG中已经处理好的GemsecDeezer数据集,具体来讲为:

data = GemsecDeezer('data', name='RO')
graph = data[0]
G = to_networkx(graph)

GemsecDeezer表示从一个音乐网站Deezer上收集到的用户及其关注者社交网络,一共包含三个欧洲国家的用户:
在这里插入图片描述其中name=RO表示罗马尼亚用户数据集。

2.2 线性阈值

首先为每条边(u,v)计算 w u , v w_{u,v} wu,v

in_degree = G.in_degree()
# init influence
for e in G.edges():
    G[e[0]][e[1]]['influence'] = 1 / in_degree[e[1]]

为了简单起见,每个节点的阈值都被设置为0.5,当然也可以进行均匀随机采样:

# init threshold
threshold = uniform(size=G.number_of_nodes())
for n in G.nodes():
    # G.nodes[n]['threshold'] = threshold[0][n]
    G.nodes[n]['threshold'] = 0.5

初始的种子节点设置:

init_seed = [1, 15, 149, 785, 1542, 1958, 2008, 2784, 3025, 7845, 9584, 10025]

然后是LT模型的定义:

def linear_threshold():
    final_activated = copy.deepcopy(init_seed)
    activated = []
    while True:
        flag = False
        for v in G.nodes():
            if v in final_activated:
                continue
            activated_u = list(set(G.predecessors(v)).intersection(set(final_activated)))
            total_threshold = 0.0
            for u in activated_u:
                total_threshold += G[u][v]['influence']
            if total_threshold >= G.nodes[v]['threshold']:
                activated.append(v)
                final_activated.append(v)
                flag = True

        if flag:
            continue
        else:
            break

    return activated, final_activated

代码比较简单,不再解释。

相关文章:

  • 你不知道的自然语言处理应用场景和挑战
  • Springboot学生选课系统的设计与实现毕业设计源码
  • 直播回顾|应用上容器的最佳实践技术沙龙
  • 【论文阅读】ART-SLAM: Accurate Real-Time 6DoF LiDAR SLAM
  • redis使用zset实现数据库多字段排序的一种方式
  • Elasticsearch ES数据迁移方法及注意事项
  • OPENSQL 2022.9.1
  • Redis集群研究和实践(基于redis 3.2.5)(一)
  • 初等数论总结
  • React(9)-组件引用传递(高级应用)
  • Flink在Window上的开发环境搭建
  • elasticsearch ES新增字段并赋初始值
  • DOM--预加载和懒加载
  • HCIA网络课程第七周作业
  • Nacos2.1.1 github下载zip太慢解决方法及资源分享
  • 实现windows 窗体的自己画,网上摘抄的,学习了
  • [分享]iOS开发 - 实现UITableView Plain SectionView和table不停留一起滑动
  • 【159天】尚学堂高琪Java300集视频精华笔记(128)
  • 08.Android之View事件问题
  • 345-反转字符串中的元音字母
  • bearychat的java client
  • emacs初体验
  • ES6 ...操作符
  • Linux快速复制或删除大量小文件
  • mysql常用命令汇总
  • nfs客户端进程变D,延伸linux的lock
  • Node项目之评分系统(二)- 数据库设计
  • supervisor 永不挂掉的进程 安装以及使用
  • 给初学者:JavaScript 中数组操作注意点
  • 关于List、List?、ListObject的区别
  • 记录:CentOS7.2配置LNMP环境记录
  • 区块链将重新定义世界
  • 如何设计一个微型分布式架构?
  • 如何邀请好友注册您的网站(模拟百度网盘)
  • 提醒我喝水chrome插件开发指南
  • 携程小程序初体验
  • ​VRRP 虚拟路由冗余协议(华为)
  • ​第20课 在Android Native开发中加入新的C++类
  • ​一些不规范的GTID使用场景
  • # 达梦数据库知识点
  • (7)STL算法之交换赋值
  • (Java数据结构)ArrayList
  • (windows2012共享文件夹和防火墙设置
  • (zt)最盛行的警世狂言(爆笑)
  • (附源码)计算机毕业设计SSM教师教学质量评价系统
  • (机器学习的矩阵)(向量、矩阵与多元线性回归)
  • (五) 一起学 Unix 环境高级编程 (APUE) 之 进程环境
  • ..回顾17,展望18
  • .htaccess配置重写url引擎
  • .NET Core、DNX、DNU、DNVM、MVC6学习资料
  • .NET框架
  • .net实现头像缩放截取功能 -----转载自accp教程网
  • /bin/rm: 参数列表过长"的解决办法
  • @entity 不限字节长度的类型_一文读懂Redis常见对象类型的底层数据结构
  • [ CTF ] WriteUp-2022年春秋杯网络安全联赛-冬季赛