当前位置: 首页 > news >正文

聚类的外部指标(Purity, ARI, NMI, ACC) 和内部指标(NCC,Entropy,Compactness,Silhouette Index)

在聚类分析中,外部指标和内部指标用于评估聚类结果的质量。外部指标需要知道真实的类别标签,而内部指标则仅基于聚类结果本身进行评估。

外部指标
Purity (纯度): 计算聚类结果中每个簇中最多数目的样本所属的类别,并计算所有簇的该类别样本数之和占所有样本数的比例。
Python (使用 sklearn):

python
复制代码
from sklearn import metrics  
from sklearn.datasets import make_blobs  
from sklearn.cluster import KMeans  
  
# 假设 X 是数据, y 是真实标签  
# 聚类...  
kmeans = KMeans(n_clusters=3)  
labels_pred = kmeans.fit_predict(X)  
  
# 计算纯度 (需要自定义函数)  
def purity_score(y_true, y_pred):  
    contingency_matrix = metrics.cluster.contingency_matrix(y_true, y_pred)  
    return np.sum(np.amax(contingency_matrix, axis=0)) / y_true.shape[0]  
  
purity = purity_score(y, labels_pred)  
print(f"Purity: {purity}")
Matlab:

在 Matlab 中,没有直接的 purity 函数,但可以通过混淆矩阵计算。

Adjusted Rand Index (ARI): 衡量两个聚类结果之间的相似度。
Python (使用 sklearn):

相关文章:

  • 变压器绕线完成之后要做的事
  • Jenkins流水线pipeline--基于上一章的工作流程
  • 人工智能安全风险分析及应对策略
  • 燃烧截稿倒计时,NDSS‘25大会即将召开,你的论文准备好了吗?
  • elementui Menu 二级菜单 min-width修改无效
  • NFS服务器
  • 水电表自动抄表系统
  • 【UE5教程】使用蓝图显示鼠标
  • ARCGIS 几种SHP融合、拼接等方法
  • 03-3.2.3 队列的链式存储的实现
  • 【人工智能】流行且重要的智能算法整理
  • TP8 定时任务yzh52521/http-crontab 教程
  • 前端 CSS 经典:水波进度样式
  • Windows取证分析 | 如何最大程度提升分析效率
  • 【MySQL】表的约束
  • angular2 简述
  • Go 语言编译器的 //go: 详解
  • mysql中InnoDB引擎中页的概念
  • PaddlePaddle-GitHub的正确打开姿势
  • rc-form之最单纯情况
  • ReactNative开发常用的三方模块
  • vue-router 实现分析
  • webpack项目中使用grunt监听文件变动自动打包编译
  • 得到一个数组中任意X个元素的所有组合 即C(n,m)
  • 关于使用markdown的方法(引自CSDN教程)
  • 简单实现一个textarea自适应高度
  • 面试总结JavaScript篇
  • 前端面试总结(at, md)
  • 前端性能优化——回流与重绘
  • 思考 CSS 架构
  •  一套莫尔斯电报听写、翻译系统
  • 好程序员web前端教程分享CSS不同元素margin的计算 ...
  • ​​​​​​​GitLab 之 GitLab-Runner 安装,配置与问题汇总
  • ​Kaggle X光肺炎检测比赛第二名方案解析 | CVPR 2020 Workshop
  • ### Error querying database. Cause: com.mysql.jdbc.exceptions.jdbc4.CommunicationsException
  • #我与Java虚拟机的故事#连载17:我的Java技术水平有了一个本质的提升
  • (3) cmake编译多个cpp文件
  • (C#)Windows Shell 外壳编程系列4 - 上下文菜单(iContextMenu)(二)嵌入菜单和执行命令...
  • (C语言)fread与fwrite详解
  • (vue)页面文件上传获取:action地址
  • (附源码)计算机毕业设计SSM疫情社区管理系统
  • (蓝桥杯每日一题)平方末尾及补充(常用的字符串函数功能)
  • (三) prometheus + grafana + alertmanager 配置Redis监控
  • (译) 理解 Elixir 中的宏 Macro, 第四部分:深入化
  • (原創) 如何讓IE7按第二次Ctrl + Tab時,回到原來的索引標籤? (Web) (IE) (OS) (Windows)...
  • (转载)Linux 多线程条件变量同步
  • (转载)OpenStack Hacker养成指南
  • *p++,*(p++),*++p,(*p)++区别?
  • .NET Windows:删除文件夹后立即判断,有可能依然存在
  • @Data注解的作用
  • @Mapper作用
  • [2024-06]-[大模型]-[Ollama] 0-相关命令
  • [383] 赎金信 js
  • [8-23]知识梳理:文件系统、Bash基础特性、目录管理、文件管理、文本查看编辑处理...
  • [AHOI2009]中国象棋 DP,递推,组合数