当前位置：首页 > news >正文

分类评价指标

news 来源：原创 2024/9/19 9:31:26

分类算法的评价指标用于衡量模型在分类任务中的表现，帮助判断模型的好坏和适用性。以下是常用的分类评价指标：

1. 准确率 (Accuracy)

定义: 正确分类的样本数占总样本数的比例。
公式: \[ \text{Accuracy} = \frac{TP + TN}{TP + TN + FP + FN} \]
适用场景: 当类别分布均衡时有效，不适用于类别极不平衡的数据集。

2. 精确率 (Precision)

定义: 正确预测为正类的样本数占所有预测为正类的样本数的比例。
公式: \[ \text{Precision} = \frac{TP}{TP + FP} \]
适用场景: 适用于关注误报成本的场景，如垃圾邮件检测。

3. 召回率 (Recall)

定义: 正确预测为正类的样本数占所有真实正类样本数的比例。
公式: \[ \text{Recall} = \frac{TP}{TP + FN} \]
适用场景: 适用于关注漏报成本的场景，如疾病检测。

4. F1分数 (F1 Score)

定义: 精确率和召回率的调和平均数。
公式: \[ \text{F1 Score} = 2 \times \frac{\text{Precision} \times \text{Recall}}{\text{Precision} + \text{Recall}} \]
适用场景: 适用于精确率和召回率都很重要的场景，特别是类别不平衡时。

5. 特异度 (Specificity)

定义: 正确预测为负类的样本数占所有真实负类样本数的比例。
公式: \[ \text{Specificity} = \frac{TN}{TN + FP} \]
适用场景: 与召回率一起使用，特别是当负类更为重要时。

6. ROC曲线 (Receiver Operating Characteristic Curve) 和 AUC (Area Under Curve)

定义: ROC曲线展示了模型的TPR（真阳性率）与FPR（假阳性率）的关系，AUC则表示曲线下的面积，衡量模型区分正负类的能力。
适用场景: 用于评估分类模型在不同阈值下的表现，适用于不平衡数据。

7. PR曲线 (Precision-Recall Curve)

定义: 展示了不同阈值下的精确率和召回率的关系。
适用场景: 适用于类别严重不平衡时，用来替代ROC曲线。

8. Kappa系数 (Cohen's Kappa)

定义: 衡量分类器的准确性与随机猜测准确性的差异。
公式: \[ \text{Kappa} = \frac{p_o - p_e}{1 - p_e} \] 其中 \( p_o \) 是观察到的准确率，\( p_e \) 是随机猜测的准确率。
适用场景: 用于评价分类器相对于随机猜测的改进。

9. 平均精确率 (Average Precision)

定义: 综合多个阈值下的精确率和召回率的表现。
适用场景: 类似于AUC，但特别适合类别不平衡的情况。

10. Log Loss (对数损失)

定义: 测量模型输出的概率与真实标签之间的差距。
公式: \[ \text{Log Loss} = -\frac{1}{N} \sum_{i=1}^{N} \left[y_i \log(p_i) + (1 - y_i) \log(1 - p_i)\right] \]
适用场景: 用于评估分类器输出概率的准确性。

常用术语：

TP (True Positive): 真阳性，正确预测的正类样本数。
TN (True Negative): 真阴性，正确预测的负类样本数。
FP (False Positive): 假阳性，错误预测为正类的负类样本数。
FN (False Negative): 假阴性，错误预测为负类的正类样本数。

这些指标帮助我们从不同的角度评估分类模型的性能，并根据具体应用场景选择合适的评价指标。

相关文章：

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

计算机网络 --- 计算机网络的分类

C语言---函数概念深入学习基础（3）

spring 事物使用场景说明

SpringBoot项目部署+属性配置方式+多环境开发

59 - I. 滑动窗口的最大值

Windows自动化程序开发指南

获取STM32 MCU的唯一ID

Unity动画系统详解

C、C++、JAVA 的区别与联系

如何在本地部署大语言模型

Python爱心射线（完整代码）

一文弄懂FLink状态及checkpoint源码

Liunx常用指令

TypeScript系列：初篇 - 类型系统

基于vue框架的城市体育运动交流平台15s43（程序+源码+数据库+调试部署+开发环境）系统界面在最后面。

Asm.js的简单介绍

chrome扩展demo1-小时钟

IIS 10 PHP CGI 设置 PHP_INI_SCAN_DIR

Javascript 原型链

Linux编程学习笔记 | Linux多线程学习[2] - 线程的同步

markdown编辑器简评

Nginx 通过 Lua + Redis 实现动态封禁 IP

编写高质量JavaScript代码之并发

规范化安全开发 KOA 手脚架

诡异！React stopPropagation失灵

机器人定位导航技术激光SLAM与视觉SLAM谁更胜一筹？

聊聊flink的BlobWriter

让你成为前端，后端或全栈开发程序员的进阶指南，一门学到老的技术

收藏好这篇，别再只说“数据劫持”了

算法-图和图算法

探索 JS 中的模块化

由插件封装引出的一丢丢思考

鱼骨图 - 如何绘制？

- 语言经验 - 《c++的高性能内存管理库tcmalloc和jemalloc》

主流的CSS水平和垂直居中技术大全

自动记录MySQL慢查询快照脚本

MyCAT水平分库

RDS-Mysql 物理备份恢复到本地数据库上

关于Android全面屏虚拟导航栏的适配总结

iOS实时查看App运行日志

创新驱动，边缘计算领袖：亚马逊云科技海外服务器服务再进化

#QT项目实战（天气预报）

#前后端分离# 头条发布系统

(04)Hive的相关概念——order by 、sort by、distribute by 、cluster by

(iPhone/iPad开发)在UIWebView中自定义菜单栏

（javaweb）Http协议

(js)循环条件满足时终止循环

（六）Flink 窗口计算

（十）初识 Docker file

(算法)硬币问题

(轉貼) 蒼井そら挑戰筋肉擂台 (Misc)

*上位机的定义

*算法训练（leetcode）第四十天 | 647. 回文子串、516. 最长回文子序列

.net core Swagger 过滤部分Api

.NET Framework 3.5中序列化成JSON数据及JSON数据的反序列化，以及jQuery的调用JSON