当前位置: 首页 > news >正文

MAML算法详解

引言:MAML是元学习的经典论文,也是基于optimization based meta-learning方法的开山之作,后序很多工作都是follow这篇工作。目前已经有13140的引用,其算法思想很巧妙,值得反复品读。
论文链接:http://proceedings.mlr.press/v70/finn17a/finn17a.pdf

Motivation:这里参考李宏毅老师的讲解,MAML的目的是找到最适合优化的初始化参数,这样在泛化到新的任务的时候,模型就能只进行少量的优化,就能达到一个比较好的性能。
MAML与传统的pretrain算法的对比:


而传统的预训练是为了找到一组在预训练的所有任务上表现得都比较好的参数。

也就是说MAML是为了使得模型具有适应新任务的潜力,而预训练更加关注模型在当前任务上的表现如何。

算法:伪代码如下:

 这里参考知乎用户的回答:https://zhuanlan.zhihu.com/p/57864886


总体思想:先尝试在各个任务上只进行一步或几步梯度更新计算梯度并更新权重,然后边更新边在挡前任务的test(测试集上)测试模型的loss,循环仿佛不断的采集任务,更新,保留每个任务计算的loss。然后在见过了所有任务的loss了之后,再用第10步的公式对原本的模型参数进行更新,注意第十步是对原始的模型参数进行更新,只是使用了每个任务计算得到的loss(总体的loss是每个任务的loss之和在进行参数的更新),这样就能同时考虑所有任务的loss,使得每一个任务都能通过少量的优化之后得到较低的loss。并将这一组参数作为模型经过meta-train之后找到最适合优化的初始化参数。之后再进行meta-test。

对整个过程进行可视化,参考:https://zhuanlan.zhihu.com/p/349578874

 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Oracle RAC 集群启动顺序
  • C语言——位运算
  • linux系统使用 docker 来部署web环境 nginx+php7.4 并配置称 docker-compose-mysql.yml 文件
  • 【第一章概述—计算机中的数制】非十进制数到十进制数的转换,八进制转十进制,16进制转十进制。十进制转8进制,十进制转16进制
  • SSRF漏洞实现
  • Flask返回Json格式字符,中文导致unicode乱码问题
  • Unity URP Shader 修改深度让人物不再被地面遮挡
  • 数论之组合数
  • git cherry-pick 合并多个提交
  • Go 调用Rust函数
  • 浅谈线性表——链表
  • AI编程简介
  • 【第69课】Java安全JWT攻防Swagger自动化算法签名密匙Druid未授权
  • java-Mybatis框架
  • MFC程序设计(一) MFC框架
  • JS 中的深拷贝与浅拷贝
  • Android系统模拟器绘制实现概述
  • bootstrap创建登录注册页面
  • co.js - 让异步代码同步化
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • Druid 在有赞的实践
  • ES学习笔记(12)--Symbol
  • JavaScript-Array类型
  • js中forEach回调同异步问题
  • Mac 鼠须管 Rime 输入法 安装五笔输入法 教程
  • Magento 1.x 中文订单打印乱码
  • SpingCloudBus整合RabbitMQ
  • vue和cordova项目整合打包,并实现vue调用android的相机的demo
  • 成为一名优秀的Developer的书单
  • 聊聊sentinel的DegradeSlot
  • 浅谈Golang中select的用法
  • 原生 js 实现移动端 Touch 滑动反弹
  • 深度学习之轻量级神经网络在TWS蓝牙音频处理器上的部署
  • ​ ​Redis(五)主从复制:主从模式介绍、配置、拓扑(一主一从结构、一主多从结构、树形主从结构)、原理(复制过程、​​​​​​​数据同步psync)、总结
  • ​queue --- 一个同步的队列类​
  • ​软考-高级-系统架构设计师教程(清华第2版)【第12章 信息系统架构设计理论与实践(P420~465)-思维导图】​
  • ‌分布式计算技术与复杂算法优化:‌现代数据处理的基石
  • #快捷键# 大学四年我常用的软件快捷键大全,教你成为电脑高手!!
  • #我与Java虚拟机的故事#连载16:打开Java世界大门的钥匙
  • $forceUpdate()函数
  • $var=htmlencode(“‘);alert(‘2“); 的个人理解
  • ()、[]、{}、(())、[[]]命令替换
  • (70min)字节暑假实习二面(已挂)
  • (ros//EnvironmentVariables)ros环境变量
  • (不用互三)AI绘画工具应该如何选择
  • (仿QQ聊天消息列表加载)wp7 listbox 列表项逐一加载的一种实现方式,以及加入渐显动画...
  • (十三)Maven插件解析运行机制
  • (学习日记)2024.02.29:UCOSIII第二节
  • (学习日记)2024.04.10:UCOSIII第三十八节:事件实验
  • *_zh_CN.properties 国际化资源文件 struts 防乱码等
  • .NET 3.0 Framework已经被添加到WindowUpdate
  • .NET Core IdentityServer4实战-开篇介绍与规划
  • .NET Core中Emit的使用
  • .Net FrameWork总结
  • .NET Micro Framework初体验(二)