当前位置: 首页 > news >正文

5.27周报

这两周邻近毕业故没有很多时间来学习课余内容,另外最近身体有些不舒服【偏头痛】,所以学的内容不多,包括SVM向量机和ResNet【不包括代码复现】

1.SVM支持向量机的大概内容

1、目的:

  1. 主要内容是如何找到分类的那条线【超平面】——>此线应该是唯一的,那么如何保证两条平行线的最大距离d。
    2.而我们的SVM的目的就是找到这个最大化d以及分类的超平面。

2、相关工作:

1.点到平面的距离【因为要寻找到我们对样本进行分类的超平面】——>进而衍生到了向量X0到超平面的距离。
2. 将距离公式进行演变 ,目的是最大化d即为最小化||w||^2。
**3.给模型规定限制条件:**目的是区分支持向量和非支持向量。

在这里插入图片描述

3.引入松弛变量求W: 但是最小化方程1/2||W||^2最小化求极值点W是无解的,所以我们需要添加一个正则项(Regulation Term)去求解【也就是我们的松弛变量,在反向传播算法中常用来减少梯度消失问题】,还有一种可能优化问题求解的解并不是我们想要的,我们也需要加一个正则项。【本质凸优化问题求唯一极值点】

4.问题:但是如果样本为线性不可分,则无法进行分类:

1、引入思想: 高维映射,将低维矢量映射到高维,然后用一个向量代数式表示。【这里用了异或问题进行解释,参考链接】
异或问题如何分类
在这里也有一个思想出现了:无限维度被线性可分的概率接近1。

2、后面得到了约束条件的方程【本质类似与低维,只是我们的W变成向量,而那个fai函数也是一个高维映射,两内积相乘为常量】,可以发现分类结果已经出来了。
超平面方程例子
超平面方程

5.所以按过程来说我们应该要求这个高维映射函数,这里涉及核函数的引入【具体推导过程参考链接】
在这里插入图片描述
目的:无需显式的计算高维映射函数,内积得到常量,减少复杂性【推导过程极其优美】

6.引入对偶问题和原问题,将优化问题转换到对偶空间【引入拉格朗日乘数,主要好处是优化问题变成了仅依赖于数据点之间内积的形式,在后续公式推导中可以直接将核函数进行带入计算出高维空间的内积(核技巧)】
笔记一:

关于对偶问题的学习以及原问题如何转换为对偶问题的学习
笔记二:

SVM解决线性可分问题

2.ResNet残差网络的学习

本文基于何明凯前辈论文的学习,首先是学习了残差网络的背景,就于梯度消失和cnn参数过大FLOPs过多,以及VGG/plain网络的劣势进行对比,进而提出方案【所涉及的技术,如何改进等】
笔记三:
https://blog.csdn.net/weixin_57128596/article/details/139223695

3.写了一个关于阿里艺术字的接口:
基于WordArt锦书模型,输入字体和提示词即可生成关于提示词的艺术字。

在这里插入图片描述
效果图:
在这里插入图片描述
后期展望:
1.CNN学习和+复习大模型
2.准备复现一下代码(结合几个大模型CNN,VGG,残差网络ResNet对于图片的分类)或者微调一下大模型(拿到了关于医学的数据)
想学习一下微调大模型。
数据如下:
在这里插入图片描述
在这里插入图片描述

相关文章:

  • 【MySQL精通之路】数据类型
  • [转载]同一台电脑同时使用GitHub和GitLab
  • C++:vector基础讲解
  • 【ARMv8/v9 异常模型入门及渐进 10 -- WFI 与 WFE 使用详细介绍 1】
  • linux网卡MAC地址
  • 浅谈,Java当中普通类与抽象类的区别
  • Day47 打家劫舍123
  • 【MySQL精通之路】全文搜索(3)-带查询扩展的全文搜索
  • .DFS.
  • Docker安装MySQL的详细教程
  • 机器学习笔记——K近邻算法、手写数字识别
  • 【网络协议】【OSI】一次HTTP请求OSI工作过程详细解析
  • vue详解(4)
  • Android Gradle文件 一次通关
  • 全能集成开发平台Team·IDE
  • __proto__ 和 prototype的关系
  • Angular 响应式表单之下拉框
  • exif信息对照
  • express.js的介绍及使用
  • FineReport中如何实现自动滚屏效果
  • javascript数组去重/查找/插入/删除
  • Java小白进阶笔记(3)-初级面向对象
  • orm2 中文文档 3.1 模型属性
  • Python实现BT种子转化为磁力链接【实战】
  • 分享自己折腾多时的一套 vue 组件 --we-vue
  • 高性能JavaScript阅读简记(三)
  • 基于web的全景—— Pannellum小试
  • 深入 Nginx 之配置篇
  • 探索 JS 中的模块化
  • 微信小程序设置上一页数据
  • 一个普通的 5 年iOS开发者的自我总结,以及5年开发经历和感想!
  • 一起来学SpringBoot | 第十篇:使用Spring Cache集成Redis
  • 《码出高效》学习笔记与书中错误记录
  • MPAndroidChart 教程:Y轴 YAxis
  • ​ 无限可能性的探索:Amazon Lightsail轻量应用服务器引领数字化时代创新发展
  • ​【C语言】长篇详解,字符系列篇3-----strstr,strtok,strerror字符串函数的使用【图文详解​】
  • ​数据链路层——流量控制可靠传输机制 ​
  • (1/2)敏捷实践指南 Agile Practice Guide ([美] Project Management institute 著)
  • (4)STL算法之比较
  • (42)STM32——LCD显示屏实验笔记
  • (done) ROC曲线 和 AUC值 分别是什么?
  • (Oracle)SQL优化基础(三):看懂执行计划顺序
  • (ZT)一个美国文科博士的YardLife
  • (附源码)ssm教材管理系统 毕业设计 011229
  • (回溯) LeetCode 77. 组合
  • (十三)Maven插件解析运行机制
  • (转)负载均衡,回话保持,cookie
  • * CIL library *(* CIL module *) : error LNK2005: _DllMain@12 already defined in mfcs120u.lib(dllmodu
  • .Net 访问电子邮箱-LumiSoft.Net,好用
  • .Net 中Partitioner static与dynamic的性能对比
  • .net流程开发平台的一些难点(1)
  • :class的用法及应用
  • ?php echo ?,?php echo Hello world!;?
  • @for /l %i in (1,1,10) do md %i 批处理自动建立目录
  • @RequestBody与@ModelAttribute