当前位置: 首页 > news >正文

一起对话式学习-机器学习03——模型评估与模型选择

【一】前言

        这一部分其实已在第二节中介绍到,这节起到回顾归纳的作用。

【二】训练误差与测试误差

        首先,在分类问题中,有误差率和准确率两个概念,二者和为1。

        误差率:分类错误的样本数占总数的比例。

        其次,在回归问题中,则有训练误差和测试误差两个概念,顾名思义不再多说,可详见02。而在未知新样本上也就是进行预测时产生的误差称为泛化误差,这是我们要追求使之最小化的,即预测最准确的。

【三】过拟合和模型选择

        已在02详细介绍过概念,指出几点:欠拟合较好克服,增加训练轮数,增加模型复杂性就好,而过拟合往往是机器学习面临的关键障碍且无法避免只能尽量缓解。

        与02所述一致,以测试误差可以作为泛化误差进行求解,但如果数据较少可以进行数据重利用:留出法、交叉验证法与自助法,之后会详细介绍。

        接下来举个拟合多项式函数的例子方便理解:

         如图M代表目标函数的项数,下面有公式辅助理解,四张图不变的那条曲线可以看作标准答案模型,当然我们在实际建模时几乎不可能做到完美,那看看第几个最好?不难看出是第三个,第四个明显过拟合,第一二个欠拟合。

        针对这个问题,实际求解的过程是怎样的?首先确定模型项数(基本形式)后,列出损失函数使用测试数据利用最小二乘法(因为设定未知参数幂次为1,所以是线性问题用最小二乘法)得出一组未知参数解,最后计算一下其训练误差。就这样对于每个项数/复杂度的模型皆如此得出下图:

         肯定要选二者都较低的复杂度,如何选择呢?其实02已经给出标准答案,可以用正则化与交叉验证。 


 Over!!! 


相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 中电信翼康基于Apache Dolphinscheduler重构“星海·济世医疗数据中台”实践经验分享
  • 【网络通信基础与实践第四讲】用户数据报协议UDP和传输控制协议TCP
  • JavaWeb纯小白笔记02:Tomcat的使用:发布项目的三种方式、配置虚拟主机、配置用户名和密码
  • 什么是上层建筑?
  • 局域网共享文件夹:您没有权限访问,请与网络管理员联系
  • Vue vs React vs Angular 的对比和选择
  • LD3320语音识别模块的简单应用
  • 机器翻译之创建Seq2Seq的编码器、解码器
  • C++11——function与bind
  • Vue3 : Pinia的性质与作用
  • react jsx
  • Java基础(中)
  • 进阶版水仙花数水是指一个n位数,各个位数字的n次方之和等于该数字本身
  • 《华为三台交换机堆叠的详细命令行配置示例》
  • flink自定义process,使用状态求历史总和(scala)
  • 【知识碎片】第三方登录弹窗效果
  • C++类的相互关联
  • create-react-app做的留言板
  • crontab执行失败的多种原因
  • Git初体验
  • js如何打印object对象
  • js作用域和this的理解
  • Less 日常用法
  • RxJS: 简单入门
  • Sequelize 中文文档 v4 - Getting started - 入门
  • vue学习系列(二)vue-cli
  • Work@Alibaba 阿里巴巴的企业应用构建之路
  • 阿里研究院入选中国企业智库系统影响力榜
  • 案例分享〡三拾众筹持续交付开发流程支撑创新业务
  • 从tcpdump抓包看TCP/IP协议
  • 从零搭建Koa2 Server
  • 工作中总结前端开发流程--vue项目
  • 坑!为什么View.startAnimation不起作用?
  • 名企6年Java程序员的工作总结,写给在迷茫中的你!
  • 因为阿里,他们成了“杭漂”
  • 阿里云ACE认证学习知识点梳理
  • ​RecSys 2022 | 面向人岗匹配的双向选择偏好建模
  • ​ubuntu下安装kvm虚拟机
  • # wps必须要登录激活才能使用吗?
  • ## 临床数据 两两比较 加显著性boxplot加显著性
  • #1014 : Trie树
  • #php的pecl工具#
  • #vue3 实现前端下载excel文件模板功能
  • #大学#套接字
  • $forceUpdate()函数
  • (13)[Xamarin.Android] 不同分辨率下的图片使用概论
  • (51单片机)第五章-A/D和D/A工作原理-A/D
  • (6)添加vue-cookie
  • (Matalb时序预测)WOA-BP鲸鱼算法优化BP神经网络的多维时序回归预测
  • (Matlab)使用竞争神经网络实现数据聚类
  • (NO.00004)iOS实现打砖块游戏(十二):伸缩自如,我是如意金箍棒(上)!
  • (分享)自己整理的一些简单awk实用语句
  • (附表设计)不是我吹!超级全面的权限系统设计方案面世了
  • (九)信息融合方式简介
  • (三分钟)速览传统边缘检测算子