当前位置: 首页 > news >正文

分类模型——Logistics Regression

Logistics regression

from sklearn.linear_model import LogisticRegression
clf = LogisticRegression()
clf.fit(x_train, y_train)  

准确率与召回率

准确率:scikit-learn提供了accuracy_score来计算:LogisticRegression.score()
准确率是分类器预测正确性的比例,但是并不能分辨出假阳性错误和假阴性错误
精确率是指分类器预测出的垃圾短信中真的是垃圾短信的比例,P=TP/(TP+FP)
召回率在医学上也叫做灵敏度,在本例中知所有真的垃圾短信被分类器正确找出来的比例,R=TP/(TP+FN)

from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score  
predictions = clf.predict(x_test)  
print('准确率:', accuracy_score(y_test, predictions))  
print('精确率:', precision_score(y_test, predictions))  
print('召回率:', recall_score(y_test, predictions))  
print('F1-Score:', f1_score(y_test, predictions))  

from sklearn.metrics import classification_report, accuracy_score, confusion_matrix  
predictions = clf.predict(x_test)  
print('准确率:', accuracy_score(y_test, predictions))  
print('混淆矩阵:', confusion_matrix(y_test, predictions))  
print('分类报告:', classification_report(y_test, predictions))  

ROC AUC

ROC曲线(Receiver Operating Characteristic,ROC curve)可以用来可视化分类器的效果。和准确率不同,ROC曲线对分类比例不平衡的数据集不敏感,ROC曲线显示的是对超过限定阈值的所有预测结果的分类器效果。ROC曲线画的是分类器的召回率与误警率(fall-out)的曲线。误警率也称假阳性率,是所有阴性样本中分类器识别为阳性的样本所占比例:
F=FP/(TN+FP) AUC是ROC曲线下方的面积,它把ROC曲线变成一个值,表示分类器随机预测的效果.

from sklearn.metrics import roc_curve, auc  
predictions = clf.predict_proba(x_test)  
false_positive_rate, recall, thresholds = roc_curve(y_test, predictions[:, 1])  
roc_auc = auc(false_positive_rate, recall)  
plt.title('Receiver Operating Characteristic')  
plt.plot(false_positive_rate, recall, 'b', label='AUC = %0.2f' % roc_auc)  
plt.legend(loc='lower right')  
plt.plot([0, 1], [0, 1], 'r--')  
plt.xlim([0.0, 1.0])  
plt.ylim([0.0, 1.0])  
plt.ylabel('Recall')  
plt.xlabel('Fall-out')  
plt.show() 

模型原理

http://blog.csdn.net/sergeyca...
http://blog.csdn.net/zjuPeco/...

相关文章:

  • AR图书,看着很美其实有点坑
  • 有关libpthread.so库的问题
  • 运用免费OA让你有意想不到的效果
  • MongoDB内存机制
  • LDAP注入与防御剖析
  • PCA算法学习_1(OpenCV中PCA实现人脸降维)
  • 利用VM虚拟机联通网络
  • 设置无线网卡
  • 区块链原理是什么?如何开发区块链程序
  • Eclipse 如何创建Web项目
  • 软件开发中的完整测试所包括的环节UT、IT、ST、UAT
  • 我奋斗了18年,不是为了和你一起喝咖啡
  • 你信仰的一切就是你的价值观
  • VirtualBox中CentOS安装GuestAdditions
  • ghost 恢复和安装系统
  • [笔记] php常见简单功能及函数
  • 2017 前端面试准备 - 收藏集 - 掘金
  • Angular 响应式表单之下拉框
  • ComponentOne 2017 V2版本正式发布
  • django开发-定时任务的使用
  • github指令
  • Git同步原始仓库到Fork仓库中
  • HTML5新特性总结
  • JS专题之继承
  • JWT究竟是什么呢?
  • MySQL常见的两种存储引擎:MyISAM与InnoDB的爱恨情仇
  • React-flux杂记
  • Redis提升并发能力 | 从0开始构建SpringCloud微服务(2)
  • 闭包--闭包之tab栏切换(四)
  • 初识 beanstalkd
  • 正则表达式
  • 看到一个关于网页设计的文章分享过来!大家看看!
  • Java总结 - String - 这篇请使劲喷我
  • scrapy中间件源码分析及常用中间件大全
  • 你学不懂C语言,是因为不懂编写C程序的7个步骤 ...
  • ​io --- 处理流的核心工具​
  • # Maven错误Error executing Maven
  • #13 yum、编译安装与sed命令的使用
  • (待修改)PyG安装步骤
  • (附源码)基于SpringBoot和Vue的厨到家服务平台的设计与实现 毕业设计 063133
  • (附源码)小程序儿童艺术培训机构教育管理小程序 毕业设计 201740
  • (十一)手动添加用户和文件的特殊权限
  • (算法二)滑动窗口
  • (转)memcache、redis缓存
  • **PHP分步表单提交思路(分页表单提交)
  • *ST京蓝入股力合节能 着力绿色智慧城市服务
  • .NET 4.0网络开发入门之旅-- 我在“网” 中央(下)
  • .Net Core和.Net Standard直观理解
  • .NET/C# 避免调试器不小心提前计算本应延迟计算的值
  • .Net+SQL Server企业应用性能优化笔记4——精确查找瓶颈
  • .NET下的多线程编程—1-线程机制概述
  • .NET中GET与SET的用法
  • ??如何把JavaScript脚本中的参数传到java代码段中
  • @javax.ws.rs Webservice注解
  • [51nod1610]路径计数