当前位置: 首页 > news >正文

2024 6.10~6.16 周报

一、上周工作

完成毕设

二、本周计划

吴恩达的机器学习、实验-回顾之前密集连接部分,调整损失函数

三、完成情况

3.1 机器学习的两种主要类型:

  • 监督学习(supervised learning)(实际中使用最多的):提供具有正确答案的数据来训练模型。是指学习x到y或输入到输出映射的算法。
    • 监督学习主要有两种类型:

    • 回归任务(regression algorithms):学会从无限多可能的数字中预测数字。模型可以输出无限多可能的数字
    • 分类算法(classification algorithm:对一个类别做出预测,有一小部分可能的产出
  • 无监督学习(unsupervised learning):数据仅带有输入x而没有输出标签y。
    • 无监督学习主要有三种类型:
    • 聚类算法(clustering):他将相似的数据点组合在一起。这是一种无监督学习算法,获取没有标签的数据并尝试自动将他们分组到集群中
    • 异常检测(Anomaly detection):用于检测异常事件。
    • 降维(Dimensionality reduction):这使你可以将一个大数据集神奇地压缩成一个小得多的数据集,同时丢失尽可能少的信息。

3.2 代价函数与损失函数之间的差异:

  • 代价函数(Cost Function):用于衡量模型在所有样本上的平均表现。范围:在整个训练集上的,是所有样本误差的平均,即损失函数的平均。
  • 损失函数(Loss Function):用于衡量模型在每个单独样本上的表现。范围:在单个样本上的,计算的是一个样本的误差。

3.3 通过视频中的例子,对梯度下降有了更深刻的理解。

梯度下降是一种可用于尝试最小化任何函数的算法。

  • 首先要做的只是从对w和b进行一些初始猜测。在线性回归中,初始值是多少并不重要。所以一个常见的选择是将它们都设置为0。
  • 使用梯度下降算法,你要做的是,每次都稍微改变参数w和b,以尝试降低w和b的成本J,直到J稳定在或接近最小值。

梯度下降的两个关键:

  • 导数
  • 学习率
    • 学习率太小——梯度下降会起作用,虽然降低了成本函数J,但下降速度非常慢。

    • 学习率太大——可能会离最小值越来越远。

3.4 数学表达式

符号表、集合、向量、矩阵

3.5 实验——未完待续

浅层有些就没有反演好

——分阶段

第一个网络-专门反演浅层,把浅层权值变大如系数2,深层权值变小如系数0.1

第二个网络-中间

第三个网络-深层,把深层权值变大

代码中如何实现?——后续

四、存在问题及解决

1.在之前的实验和学习中,仅了解损失函数

成本函数和损失函数?——上一节已阐述

2.成本函数非凸,会产生多个局部最优解,因此引入损失函数,并对其求平均值,可以使成本函数变凸?还不太理解为什么

五、下一步计划

继续吴恩达机器学习

如何实现分阶段反演,调整损失函数

相关文章:

  • NLP实战入门——文本分类任务(TextRNN,TextCNN,TextRNN_Att,TextRCNN,FastText,DPCNN,BERT,ERNIE)
  • 如何使用任意浏览器远程访问本地搭建的Jellyfin影音平台
  • java-内部类 2
  • 安徽保安员精选模拟试题(含答案)
  • 程序员画图工具?那必然是你了!!【送源码】
  • 在mybatis 中如何防止 IN里面的参数过多?
  • Vite使用unplugin-auto-import实现vue3中的自动导入
  • jingxiang制作
  • springcloud第4季 分布式事务seata作用服务搭建
  • vite配置之获取.env.[mode]下的数据
  • linux 安装sftp及使用sftp上传和下载
  • NVIDIA发布Nemotron-4 340B 用于生成高质量的合成数据
  • GitHub项目里的api
  • Excel小技巧| 批量多列多行转为一列
  • 系统架构设计师【论文-2017年 试题2】: 论软件架构风格(包括写作要点和经典范文)
  • 2018天猫双11|这就是阿里云!不止有新技术,更有温暖的社会力量
  • angular组件开发
  • happypack两次报错的问题
  • iOS | NSProxy
  • JAVA SE 6 GC调优笔记
  • spring boot 整合mybatis 无法输出sql的问题
  • Swift 中的尾递归和蹦床
  • Webpack 4 学习01(基础配置)
  • 从零开始在ubuntu上搭建node开发环境
  • 技术:超级实用的电脑小技巧
  • 用mpvue开发微信小程序
  • 用简单代码看卷积组块发展
  • Java数据解析之JSON
  • 阿里云ACE认证学习知识点梳理
  • 大数据全解:定义、价值及挑战
  • 关于Android全面屏虚拟导航栏的适配总结
  • 曜石科技宣布获得千万级天使轮投资,全方面布局电竞产业链 ...
  • 整理一些计算机基础知识!
  • ​软考-高级-系统架构设计师教程(清华第2版)【第1章-绪论-思维导图】​
  • ​一帧图像的Android之旅 :应用的首个绘制请求
  • ######## golang各章节终篇索引 ########
  • #07【面试问题整理】嵌入式软件工程师
  • #Ubuntu(修改root信息)
  • #多叉树深度遍历_结合深度学习的视频编码方法--帧内预测
  • (LeetCode 49)Anagrams
  • (PHP)设置修改 Apache 文件根目录 (Document Root)(转帖)
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (备忘)Java Map 遍历
  • (二)hibernate配置管理
  • (解决办法)ASP.NET导出Excel,打开时提示“您尝试打开文件'XXX.xls'的格式与文件扩展名指定文件不一致
  • (三分钟)速览传统边缘检测算子
  • (学习日记)2024.03.25:UCOSIII第二十二节:系统启动流程详解
  • (转)Android学习笔记 --- android任务栈和启动模式
  • (转)自己动手搭建Nginx+memcache+xdebug+php运行环境绿色版 For windows版
  • (最优化理论与方法)第二章最优化所需基础知识-第三节:重要凸集举例
  • .gitignore文件_Git:.gitignore
  • .NET CORE 2.0发布后没有 VIEWS视图页面文件
  • .考试倒计时43天!来提分啦!
  • [ vulhub漏洞复现篇 ] GhostScript 沙箱绕过(任意命令执行)漏洞CVE-2019-6116
  • [CC2642R1][VSCODE+Embedded IDE+IAR Build+Cortex-Debug] TI CC2642R1基于VsCode的开发环境