当前位置: 首页 > news >正文

机器学习_SVM支持向量机

引入:在面对线性可分时,即用一条直线就可以区分数据的时候,需要将直线放在距离数据点距离最大化的位置,这个过程需要寻找最大间隔,即为最优化问题。当数据点不能用一根直线区分——线性不可分,就需要用核函数将数据点映射到高维空间运算得到超平面进行区分。

一、基本原理

1、概念

解决二分类问题,通过寻找最优决策面来对数据进行分类。

如下图,当分类(a)中的数据点时,(b)和(c)两种都能够正确分类,

但当数据点增加,(b)的分类结果明显好于(c)。显然,同一波数据有不同划分的决策面,但是需要让他的间隔最大从而找出最优决策面,即SVM的最优解。

2、重点名词解释

①超平面:将数据点划分为不同类别 —— 维度比当前空间维度低一维,eg二维数据下就是一条直线,三维空间内就是一个平面,n维数据就是n-1维。

②支持向量:位于间隔边界的数据点,即离分隔超平面最近的那些点。是最有可能被错误分类的数据点,直接影响超平面的位置和方向。

③最大间隔:距离是指支持向量到超平面的距离。SVM的目标不只是找到能够正确分类的超平面,还希望这个超平面能有最大间隔,从而让模型更具鲁棒性,不容易受噪声和异常点影响。

 3、核函数【针对线性不可分问题】

在解决如下图数据点线性不可分的情况下,映射到高维找到决策面。但是这里需要注意,他并不是在高维空间的数据点进行高维空间运算,核函数相当于一个小trick,通过实现在高维空间的效果下在原低维空间内进行运算,从而解决了高维空间内的计算成本。

二、SVM的数学建模

1)首先定义超平面为 w⋅x+b=0,则数据带你到超平面的距离为 \text{Distance}=\frac{|w\cdot x_i+b|}{||w||},而我们希望找到这样的超平面使得 y_i(w\cdot x_i+b)\geq1 —— 该表达式保证数据点位于超平面的正确一侧。

2)目标函数的优化问题:求解间隔最大化

\begin{aligned}\arg\max_{\boldsymbol{w},b}&\frac{2}{\|\boldsymbol{w}\|}\\\mathrm{s.t.}&y_i(\boldsymbol{w}^\top\boldsymbol{x}_i+b)\geq1, i=1,2,\ldots,m.\end{aligned} 

转化一下以下就是求解以下公式,该公式就是SVM的基本模型

  \begin{aligned}&\min_{w,b}\frac12||w||^2\\&\quad\mathrm{subject~to~}y_i(w\cdot x_i+b)\geq1,\forall i\end{aligned}

然后就是通过拉格朗日和对偶进行数学推导找到最优的w和b了,公式推导指路SVM公式推导

\max_{\alpha}\sum_{i=1}^{n}\alpha_{i}-\frac{1}{2}\sum_{i,j=1}^{n}\alpha_{i}\alpha_{j}y_{i}y_{j}\boldsymbol{x}_{i}^{\mathrm{T}}\boldsymbol{x}_{j}  &s.t.    \sum_{i=1}^n\alpha_iy_i=0 ,和  \alpha_{i}\geq0

因为所有的数据并不一定都是“干净”的(即可能存在噪声),因此在这里引入松弛变量 C,用于控制“最大化间隔”和“保证大部分点的函数间隔<1”的权重,允许有些数据点可以分错

约束条件变成 0<\alpha_i<C  和 \sum_{i=1}^n\alpha_iy_i=0

所以,SVM的主要工作就是求解这些 \alpha

三、SVM简单构造

1、准备数据

数据结构如下图

导入数据并进行可视化

import matplotlib.pyplot as plt
import numpy as npdef loadDataSet(fileName):dataMat = []; labelMat = []fr = open(fileName)for line in fr.readlines():                                     #逐行读取,滤除空格等lineArr = line.strip().split('\t')dataMat.append([float(lineArr[0]), float(lineArr[1])])      #添加数据labelMat.append(float(lineArr[2]))                          #添加标签return dataMat,labelMatdef showDataSet(dataMat, labelMat):data_plus = []                                  #正样本data_minus = []                                 #负样本for i in range(len(dataMat)):if labelMat[i] > 0:data_plus.append(dataMat[i])else:data_minus.append(dataMat[i])data_plus_np = np.array(data_plus)              #转换为numpy矩阵data_minus_np = np.array(data_minus)            #转换为numpy矩阵plt.scatter(np.transpose(data_plus_np)[0], np.transpose(data_plus_np)[1])   #正样本散点图plt.scatter(np.transpose(data_minus_np)[0], np.transpose(data_minus_np)[1]) #负样本散点图plt.show()if __name__ == '__main__':dataMat, labelMat = loadDataSet('testSet.txt')showDataSet(dataMat, labelMat)

2、SVM 函数定义

class mySVM:def __init__(self, learning_rate=0.01, lambda_param=0.1, n_iters=1000):self.learning_rate = learning_rateself.lambda_param = lambda_paramself.n_iters = n_itersself.w = Noneself.b = Nonedef fit(self, X, y):n_samples, n_features = X.shapeself.w = np.zeros(n_features)self.b = 0.0for _ in range(self.n_iters):linear_output = np.dot(X, self.w) - self.berrors = y - linear_outputself.w -= self.learning_rate * (2 * self.lambda_param * self.w - np.dot(X.T, errors))self.b -= self.learning_rate * np.mean(errors)def predict(self, X):linear_output = np.dot(X, self.w) - self.breturn np.sign(linear_output)def loss(self, X, y):linear_output = np.dot(X, self.w) - self.bhinge_loss = np.maximum(0, 1 - y * linear_output)reg_loss = self.lambda_param * np.linalg.norm(self.w)return np.mean(hinge_loss) + 0.5 * reg_loss

 3、绘制数据点和决策边界

# 可视化数据点和决策边界
def plot_show(X, y, svm):plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.coolwarm, s=20, edgecolor='k')# 创建一个网格x_min, x_max = X[:, 0].min() - 1, X[:, 0].max() + 1y_min, y_max = X[:, 1].min() - 1, X[:, 1].max() + 1xx, yy = np.meshgrid(np.linspace(x_min, x_max, 100), np.linspace(y_min, y_max, 100))# 计算决策边界,Z 是一个二维网格,表示每个点属于哪个类别Z = svm.predict(np.c_[xx.ravel(), yy.ravel()])Z = Z.reshape(xx.shape)# 绘制决策边界plt.contourf(xx, yy, Z, alpha=0.4, cmap=plt.cm.coolwarm)plt.contour(xx, yy, Z, colors='k', linestyles='-', levels=[0])plt.xlabel('Feature 1')plt.ylabel('Feature 2')plt.title('SVM Decision Boundary')plt.show()

4、结果展示

# 主程序
if __name__ == "__main__":fileName = 'testSet.txt'  dataMat, labelMat = loadDataSet(fileName)# 实例化并训练SVM模型svm = mySVM(learning_rate=0.01, lambda_param=0.1, n_iters=1000)svm.fit(dataMat, labelMat)# 绘制决策边界plot_show(dataMat, labelMat, svm)

四、总结

上面用到的是线性SVM,但在实际应用中,需要处理更复杂的数据分布,例如使用核函数处理非线性可分的数据。此外,超参数的选择(如学习率、正则化参数和迭代次数)对模型性能有重要影响,还有松弛变量C对最后模型的训练效果也有很大影响(可能存在过拟合/欠拟合)

SVM的优缺点
  • 优点:高准确率,对高维数据有效等
  • 缺点:对核函数和参数选择敏感,计算复杂度高等

相关文章:

  • 【Android面试八股文】你能说一说线程池管理线程的原理吗?
  • 【因果推断python】44_评估因果模型2
  • word添加页码后,每一页的页码都一样怎么办??
  • 二次规划(Lagrange 方法,起作用集方法)
  • ROS 激光雷达
  • LeetCode 平衡二叉搜索树
  • linux配置Vnc Server给Windows连接
  • 关于docker无法正常下载镜像的问题
  • Python学习笔记14:进阶篇(三)。类的终结篇,类的导入和模块的导入。
  • Python学习打卡:day10
  • 【python】PyCharm如何设置字体大小和背景
  • 类注释规范
  • Python 基础:文件
  • Adobe Premiere 视频编辑软件下载安装,pr 全系列资源分享!
  • 全网爆品!!【当当狸智能天文望远镜TW2】首发,超清智能大屏
  • 【Under-the-hood-ReactJS-Part0】React源码解读
  • Angular js 常用指令ng-if、ng-class、ng-option、ng-value、ng-click是如何使用的?
  • avalon2.2的VM生成过程
  • Docker: 容器互访的三种方式
  • ES6系列(二)变量的解构赋值
  • Hibernate最全面试题
  • httpie使用详解
  • HTTP传输编码增加了传输量,只为解决这一个问题 | 实用 HTTP
  • Java,console输出实时的转向GUI textbox
  • PermissionScope Swift4 兼容问题
  • Sass 快速入门教程
  • vue.js框架原理浅析
  • 初探 Vue 生命周期和钩子函数
  • 理解 C# 泛型接口中的协变与逆变(抗变)
  • 聊聊sentinel的DegradeSlot
  • 名企6年Java程序员的工作总结,写给在迷茫中的你!
  • 三分钟教你同步 Visual Studio Code 设置
  • 数据可视化之 Sankey 桑基图的实现
  • 微服务框架lagom
  • 原生JS动态加载JS、CSS文件及代码脚本
  • media数据库操作,可以进行增删改查,实现回收站,隐私照片功能 SharedPreferences存储地址:
  • 如何在招聘中考核.NET架构师
  • ​ 轻量应用服务器:亚马逊云科技打造全球领先的云计算解决方案
  • ​html.parser --- 简单的 HTML 和 XHTML 解析器​
  • ​VRRP 虚拟路由冗余协议(华为)
  • ​如何使用ArcGIS Pro制作渐变河流效果
  • ‌移动管家手机智能控制汽车系统
  • # include “ “ 和 # include < >两者的区别
  • # MySQL server 层和存储引擎层是怎么交互数据的?
  • ### RabbitMQ五种工作模式:
  • (31)对象的克隆
  • (floyd+补集) poj 3275
  • (Spark3.2.0)Spark SQL 初探: 使用大数据分析2000万KF数据
  • (STM32笔记)九、RCC时钟树与时钟 第二部分
  • (第8天)保姆级 PL/SQL Developer 安装与配置
  • (二)windows配置JDK环境
  • (二开)Flink 修改源码拓展 SQL 语法
  • (附源码)springboot家庭财务分析系统 毕业设计641323
  • (附源码)ssm基于微信小程序的疫苗管理系统 毕业设计 092354
  • (规划)24届春招和25届暑假实习路线准备规划