当前位置: 首页 > news >正文

Python实现支持向量机SVM分类模型线性SVM决策过程的可视化项目实战

说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。

 

1.项目背景

支持向量机是由间隔最大化和高维映射两大部件组成。间隔最大化是目标,支持向量机的损失函数依靠间隔计算,能让间隔达到最大的就是支持向量机要“学习”的过程。

高维映射用于解决线性不可分问题,可以理解为对数据的“预处理”。对于那些你中有我、间不容发的非线性分布数据,首先通过核函数映射至高维,映射后的数据集呈线性分布,为使用线性方法分类创造了条件。

最后归纳一下,使用支持向量机进行分类经过三个步骤:

1)选取一个合适的数学函数作为核函数。

2)使用核函数进行高维映射,数据点在映射后由原本的线性不可分变为线性可分。

3)间隔最大化,用间隔作为度量分类效果的损失函数,最终找到能够让间隔最大的超平面,分类也就最终完成了。

2.数据获取

本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:

数据包括两个Excel数据集:

数据详情如下(部分展示):

 

3.数据预处理

3.1 用Pandas工具查看数据

使用Pandas工具的head()方法查看前五行数据:

 

关键代码:

 

3.2 缺失值统计

使用Pandas工具的info()方法查看数据是否有缺失值:

从图中可以看到,数据集1没有缺失值。

3.2 描述性统计分析

使用Pandas工具的describe ()方法进行描述性统计分析:

 

从上图可以看到,每个数据项的数量、平均值、标准差、最小值、最大值、分位数。

4.特征工程

4.1 构建特征和标签

关键代码如下:

5.探索性数据分析

5.1 可视化特征数据集:绘制散点图

 

从图中可以看到,数据集1中两个特征变量的散点图分布情况。

5.2 画决策边界:散点图中制作网格

 

通过上图可以看到,散点图中中布满了网格小点。

6.构建支持向量机分类模型

主要使用SVC算法,用于构建决策边界。

6.1 建模,计算决策边界并找出网格上每个点到决策边界的距离

 

 

从上图可以看到,从上图可以看到三条等高线,这三条等高线是分别基于Z的值为-1、0、1绘制的。

关键代码:

6.2 模型探索

进行模型预测、计算模型的准确率和模型中支持向量的个数:

从上图可以看到,可以看到模型的预测值、支持向量和支持向量的个数为2。

关键参数代码:

6.3 推广到非线性情况

数据集2特征的散点图:

 

从上图可以看到,是大圆里面套了一个小圆。

绘制带有决策边界的散点图:

从上图可以看出,明显,现在线性SVM已经不适合于数据集2。

6.4为非线性数据增加维度并绘制3D图像

 

从上图可以看到,数据集2明显是线性可分的了:我们可以使用一个平面来将数据完全分开,并使平面的上方的所有数据点为一类,平面下方的所有数据点为另一类,这就是决策树模型的高维映射。

7.结论与展望

综上所述,本项目采用了SVM分类模型来绘制线性数据和非线性数据决策边界的可视化图,最终证明了支持向量机分类模型具备非线性数据的分类能力,即具有高维映射的能力。

本次机器学习项目实战所需的资料,项目资源如下:

项目说明:
链接:https://pan.baidu.com/s/1dW3S1a6KGdUHK90W-lmA4w 
提取码:bcbp

网盘如果失效,可以添加博主微信:zy10178083

相关文章:

  • 想学习软件测试,求推荐看什么书或者教程?
  • Spring-事务管理
  • 监控平台SkyWalking9入门实践
  • 【Linux】常见指令(二)
  • 网络套接字实现UDP机制通信
  • C语言字符串函数的详解
  • 在 Next.js 中使用无服务器函数构建 API
  • Go语言json包怎么使用?
  • ios屏蔽更新的插件
  • Linux之内核Platform LED
  • 详解CAN总线:CAN总线报文格式—遥控帧
  • 1,【electron+vue】 构建桌面应用——创建electron项目(包括创建,运行,打包碰到的问题)
  • vue3使用pinia
  • 快用Python(Pygame)代码燃放起你专属的烟花吧,咝......咻——嘭~
  • 关于CSDN编程竞赛的一些感受
  • IE9 : DOM Exception: INVALID_CHARACTER_ERR (5)
  • 2018以太坊智能合约编程语言solidity的最佳IDEs
  • CentOS学习笔记 - 12. Nginx搭建Centos7.5远程repo
  • classpath对获取配置文件的影响
  • happypack两次报错的问题
  • Python 使用 Tornado 框架实现 WebHook 自动部署 Git 项目
  • Redis的resp协议
  • Spring Cloud中负载均衡器概览
  • thinkphp5.1 easywechat4 微信第三方开放平台
  • Vim 折腾记
  • vuex 学习笔记 01
  • 如何用Ubuntu和Xen来设置Kubernetes?
  • 深入浅出webpack学习(1)--核心概念
  • 实战:基于Spring Boot快速开发RESTful风格API接口
  • 我从编程教室毕业
  • 限制Java线程池运行线程以及等待线程数量的策略
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • 硬币翻转问题,区间操作
  • 走向全栈之MongoDB的使用
  • 3月27日云栖精选夜读 | 从 “城市大脑”实践,瞭望未来城市源起 ...
  • RDS-Mysql 物理备份恢复到本地数据库上
  • ​业务双活的数据切换思路设计(下)
  • ​用户画像从0到100的构建思路
  • # 安徽锐锋科技IDMS系统简介
  • #if和#ifdef区别
  • #LLM入门|Prompt#1.8_聊天机器人_Chatbot
  • #宝哥教你#查看jquery绑定的事件函数
  • #大学#套接字
  • (java)关于Thread的挂起和恢复
  • (LeetCode) T14. Longest Common Prefix
  • (MonoGame从入门到放弃-1) MonoGame环境搭建
  • (二)学习JVM —— 垃圾回收机制
  • (附源码)计算机毕业设计大学生兼职系统
  • (简单) HDU 2612 Find a way,BFS。
  • (力扣记录)235. 二叉搜索树的最近公共祖先
  • (一)SpringBoot3---尚硅谷总结
  • *p=a是把a的值赋给p,p=a是把a的地址赋给p。
  • .apk 成为历史!
  • .naturalWidth 和naturalHeight属性,
  • .NET Core 通过 Ef Core 操作 Mysql