当前位置: 首页 > news >正文

[LLM][FT]大模型Fine-Tuning相关技术0

全参数微调FT

优势:

  • 能适应新数据分布

劣势:

  • 灾难性遗忘/泛化性差
  • 成本高

高效微调PEFT

1.添加额外参数-adapters:在FeedForword后面添加

  • 优点: 仅4%微调,就可以和fine-tuning相当
  • 缺点:参数增加

Q:why放在FeedForword后面添加?

  • 在决策层放比较make sense
  • 比较简单
  • 实验效果好

2.soft-prompts/隐式提升

对每一层加前缀微调,比如:prefix-tuning

3.重参数化-LoRA(低秩适配器)

paper: LoRA: Low-Rank Adaptation of Large Language Models[2106.09685]

dd–>dr × r*d
(r为秩)
思路源于SVD原理
把秩当成一个超参,让模型自己去学习,r一般取1,2,4,8,64等
r较小时,我们提取的是δ中信息最丰富的维度,信息精炼
r较大时,低秩近似逼近δ,噪声比较大

LoRA的 一个简单的视频教程:
视频:https://www.bilibili.com/video/BV1wX4y1s7an

How? 构建数据集

经验:50~100条就可以微调
比如,指令微调数据格式:
[{
“instruction”:“”
“input”:“”,
“output”:“”
}]

注意要点:

  • 1)指令完整性
  • 2)数据一致性
  • 3)注意过多拒绝
  • 4)多样性(平衡性)
  • 5)注意token限制
  • 6)注意数据格式

调参经验:

  • 学习率e-4/e-5就行

训练方案:

多卡训练:deepspeed
offload

  • 计算量低的放在cpu上,参数更新可以放在cpu上
  • 充分利用cpu&GPU

推理加速方案:

vLLm:多并发处理,多进程
FastLLM:显存下降30%,速度提升20%,1000tokens/s
llama.cpp

相关文章:

  • Android fragment 转场动画
  • android实现真随机数生成器(物理随机)
  • 设计模式学习笔记 - 面向对象 - 5.接口和抽象类的区别
  • 倒计时41天
  • chatgpt:还有哪些人工智能和科技值得关注?
  • AI浅谈:计算机视觉(CV)技术的优势和挑战
  • 策略模式:封装行为策略,灵活切换实现多态业务逻辑
  • uniapp的扩展组件uni-popup 弹出层自动打开
  • python学习笔记-内置异常
  • CMS垃圾回收器
  • Kotlin:协程基础
  • Leetcoder Day25| 回溯part05:子集+排列
  • 大概了解一下G1收集器
  • Redis 学习笔记 3:黑马点评
  • 服务器部署java 的docker项目,以及常用的一些命令
  • E-HPC支持多队列管理和自动伸缩
  • Eureka 2.0 开源流产,真的对你影响很大吗?
  • Median of Two Sorted Arrays
  • nodejs调试方法
  • RedisSerializer之JdkSerializationRedisSerializer分析
  • 当SetTimeout遇到了字符串
  • 短视频宝贝=慢?阿里巴巴工程师这样秒开短视频
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • 项目实战-Api的解决方案
  • 源码之下无秘密 ── 做最好的 Netty 源码分析教程
  • 在Unity中实现一个简单的消息管理器
  • 正则表达式
  • #HarmonyOS:软件安装window和mac预览Hello World
  • #我与Java虚拟机的故事#连载14:挑战高薪面试必看
  • %@ page import=%的用法
  • (11)工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】
  • (175)FPGA门控时钟技术
  • (保姆级教程)Mysql中索引、触发器、存储过程、存储函数的概念、作用,以及如何使用索引、存储过程,代码操作演示
  • (定时器/计数器)中断系统(详解与使用)
  • (九十四)函数和二维数组
  • (一)基于IDEA的JAVA基础1
  • (转)拼包函数及网络封包的异常处理(含代码)
  • (轉貼) 資訊相關科系畢業的學生,未來會是什麼樣子?(Misc)
  • .equals()到底是什么意思?
  • .Family_物联网
  • .NET 8.0 发布到 IIS
  • .NET 的静态构造函数是否线程安全?答案是肯定的!
  • .NET 应用启用与禁用自动生成绑定重定向 (bindingRedirect),解决不同版本 dll 的依赖问题
  • .Net调用Java编写的WebServices返回值为Null的解决方法(SoapUI工具测试有返回值)
  • .NET设计模式(11):组合模式(Composite Pattern)
  • @html.ActionLink的几种参数格式
  • [ IO.File ] FileSystemWatcher
  • [ vulhub漏洞复现篇 ] ThinkPHP 5.0.23-Rce
  • [8481302]博弈论 斯坦福game theory stanford week 1
  • [AIGC] 如何建立和优化你的工作流?
  • [BT]BUUCTF刷题第4天(3.22)
  • [c++] C++多态(虚函数和虚继承)
  • [C++基础]-入门知识
  • [IE编程] IE8 新增的C++开发接口
  • [LeetCode周赛复盘] 第 310 场周赛20220911