当前位置: 首页 > news >正文

大模型参数高效微调学习笔记

大模型参数高效微调学习笔记

github地址
billbill链接

1.分类

在这里插入图片描述
图中有五个大类:

  1. selective(选择性微调):BitFit,Attention Tuning
  2. soft prompts(提示微调):Prompt-tuning,P-tuning,Prefix-Tuning
  3. reparametrization-based(重参数化微调):Lora
  4. additive(增量微调):IA3
  5. adapters(适配器微调):Adapters

2.代表性的方法介绍

1.BitFit
将模型的所有偏置bias设为可训练的参数,其他部分设置为不可训练的。

2.Attention Tuning
将模型的所有注意力层Attention设为可训练的参数,其他部分设置为不可训练的。

3.Prompt-tuning
在模型的输入的prompt前面加入一个可训练Prompt embedding向量,模型的整个部分全部冻结,如下图。
在这里插入图片描述
如果Prompt embedding向量参数是随机初始化的,则是soft prompt,如果使用一段文本初始化(例如,“下面是一个情感任务”),则是hard prompt。

4.P-tuning
在Prompt-tuning的基础上,使用一个LSTM/MLP(或其他一个小的神经网络)获得Prompt embedding向量。除了LSTM/MLP部分,其他部分均冻结,即原模型的整个部分全部冻结。
在这里插入图片描述
5.Prefix-Tuning
在Transformers模型的每一层网络的前面都加一个可训练的past_key_values向量,原模型的整个部分全部冻结。
在这里插入图片描述
5.Lora
原模型的整个部分全部冻结,新增一部分参数W_lora,W_lora之后可以与原模型的参数进行合并。
在这里插入图片描述
在这里插入图片描述
6.IA3

通过训练一个向量,修改网络的激活值实现。
在这里插入图片描述

相关文章:

  • 从0开发一个Chrome插件:用户反馈与更新 Chrome 插件
  • C++面向对象三大特性--多态
  • Java程序之简单“记事本”
  • 【感悟】世界著名五大学习法
  • C# OpenCvSharp 图像处理函数-颜色通道-cvtColor
  • ViT:5 Knowledge Distillation
  • ADB获取当前正在显示的Activity和Fragment
  • 使用 select 进行 UART 通信的注意事项
  • godot所有2D节点介绍
  • 【C语言】--- 常见调试信息预处理器宏
  • 全面解析:C# 委托的实质性应用与优势
  • windows11子系统Ubuntu 22.04.4子安装图形化界面
  • 在Linux中如何解决程序崩溃的问题
  • linux高级编程(1)
  • 华为Atlas NPU ffmpeg 编译安装
  • 30天自制操作系统-2
  • bootstrap创建登录注册页面
  • canvas 高仿 Apple Watch 表盘
  • canvas 绘制双线技巧
  • CentOS 7 修改主机名
  • Fundebug计费标准解释:事件数是如何定义的?
  • javascript 总结(常用工具类的封装)
  • Java超时控制的实现
  • JS进阶 - JS 、JS-Web-API与DOM、BOM
  • Js实现点击查看全文(类似今日头条、知乎日报效果)
  • Laravel5.4 Queues队列学习
  • Linux CTF 逆向入门
  • Meteor的表单提交:Form
  • open-falcon 开发笔记(一):从零开始搭建虚拟服务器和监测环境
  • PV统计优化设计
  • SSH 免密登录
  • 第2章 网络文档
  • 理清楚Vue的结构
  • 爬虫进阶 -- 神级程序员:让你的爬虫就像人类的用户行为!
  • 浅谈web中前端模板引擎的使用
  • 如何合理的规划jvm性能调优
  • 试着探索高并发下的系统架构面貌
  • 一个SAP顾问在美国的这些年
  • 怎么把视频里的音乐提取出来
  • 职业生涯 一个六年开发经验的女程序员的心声。
  • 《码出高效》学习笔记与书中错误记录
  • ​queue --- 一个同步的队列类​
  • ​TypeScript都不会用,也敢说会前端?
  • #DBA杂记1
  • #HarmonyOS:基础语法
  • (6)添加vue-cookie
  • (C#)一个最简单的链表类
  • (PySpark)RDD实验实战——求商品销量排行
  • (ZT)一个美国文科博士的YardLife
  • (附源码)springboot人体健康检测微信小程序 毕业设计 012142
  • (附源码)SSM环卫人员管理平台 计算机毕设36412
  • (附源码)ssm跨平台教学系统 毕业设计 280843
  • (三)模仿学习-Action数据的模仿
  • (生成器)yield与(迭代器)generator
  • .htaccess配置常用技巧