当前位置: 首页 > news >正文

【LoRA】浅谈大模型微调之LoRA技术

在当今的信息时代中,大型语言模型扮演着至关重要的角色,它们在自然语言处理任务中展现出强大的能力。LoRA,英文全称Low-Rank Adaptation of Large Language Models,是一种用于微调大型语言模型的低秩适应技术,由微软的研究人员于 2021 年提出,这种技术能够利用少量显卡和时间对大模型进行微调,降低成本。

LoRA论文:LoRA: Low-Rank Adaptation of Large Language Models

LoRA 的核心思想是使用低秩近似来降低权重矩阵的维度,从而减少模型中可训练参数的数量。它通过添加成对的秩分解权重矩阵,也称为更新矩阵,到现有的权重中,并且只训练这些新添加的权重,从而实现对大模型的有效微调。 

LoRA对Stable Diffusion模型中最关键的部分进行小的修改:交叉注意力层。研究人员发现,微调这部分模型就足以实现良好的训练。在这些层中引入一对低秩矩阵(通常为稀疏的),分别对应于权重矩阵的增加项(additive update)和乘法项(multiplicative update),这些低秩矩阵通常具有较小的秩(rank),比如远小于原始权重矩阵的维度,这意味着它们包含的参数数量远少于直接微调整个模型所需。

通过低秩分解(先降维再升维)来模拟参数的更新量,公式如下: 

模型是过参数化的,它们有更小的内在维度,模型主要依赖于这个低的内在维度(low intrinsic dimension)去做任务适配。假设模型在适配任务时参数的改变量是低秩的,通过低秩分解来模拟参数的改变量,从而以极小的参数量来实现大模型的间接训练。

总之,LoRA 模型是一种低秩适应的训练方法,用于加速大型语言模型的训练,并降低内存消耗。它在保持原始模型性能的同时,允许用户根据需要进行定制化调整。 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 快速了解高并发解决方案
  • 如何在Oracle中实现数据的加密
  • 基于飞桨paddle2.6.1+cuda11.7+paddleRS开发版的目标提取-道路数据集训练和预测代码
  • 安卓开发中LiveData的使用
  • 算法41:位1的个数
  • 【人工智能学习笔记】4_1 深度学习基础之深度学习概述
  • 数据同步-Mysql同步到ElasticSearch
  • perl的学习记录——仿真regression
  • 【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn
  • Jeremy Howard对创业,AI产品,技术趋势,社区的看法
  • 万龙觉醒免费辅助:VMOS云手机辅助巴克尔阵容搭配攻略!
  • jQuery基础2-css的操作-事件-属性-Ajax-DOM操作
  • Redis访问工具
  • 【系统架构设计师】建造者模式(Builder Pattern)
  • 苹果手机铃声怎么设置自己的歌?3个方法自定义手机铃声
  • [case10]使用RSQL实现端到端的动态查询
  • 4. 路由到控制器 - Laravel从零开始教程
  • - C#编程大幅提高OUTLOOK的邮件搜索能力!
  • Docker 1.12实践:Docker Service、Stack与分布式应用捆绑包
  • Essential Studio for ASP.NET Web Forms 2017 v2,新增自定义树形网格工具栏
  • Node + FFmpeg 实现Canvas动画导出视频
  • Redux 中间件分析
  • spring security oauth2 password授权模式
  • Tornado学习笔记(1)
  • 分享一份非常强势的Android面试题
  • 目录与文件属性:编写ls
  • 深入浏览器事件循环的本质
  • 手写一个CommonJS打包工具(一)
  • 突破自己的技术思维
  • 译自由幺半群
  • ​第20课 在Android Native开发中加入新的C++类
  • ‌前端列表展示1000条大量数据时,后端通常需要进行一定的处理。‌
  • (+4)2.2UML建模图
  • (void) (_x == _y)的作用
  • (二)延时任务篇——通过redis的key监听,实现延迟任务实战
  • (二刷)代码随想录第15天|层序遍历 226.翻转二叉树 101.对称二叉树2
  • (生成器)yield与(迭代器)generator
  • (十一)图像的罗伯特梯度锐化
  • (译)计算距离、方位和更多经纬度之间的点
  • (转)winform之ListView
  • ..回顾17,展望18
  • .apk文件,IIS不支持下载解决
  • .NET Compact Framework 多线程环境下的UI异步刷新
  • .NET Core WebAPI中封装Swagger配置
  • .NET Core、DNX、DNU、DNVM、MVC6学习资料
  • .NET Framework 3.5中序列化成JSON数据及JSON数据的反序列化,以及jQuery的调用JSON
  • .NET MAUI Sqlite程序应用-数据库配置(一)
  • .net redis定时_一场由fork引发的超时,让我们重新探讨了Redis的抖动问题
  • .NET 使用 ILRepack 合并多个程序集(替代 ILMerge),避免引入额外的依赖
  • .NET下ASPX编程的几个小问题
  • .sh 的运行
  • @Query中countQuery的介绍
  • @requestBody写与不写的情况
  • @四年级家长,这条香港优才计划+华侨生联考捷径,一定要看!
  • [ CTF ]【天格】战队WriteUp- 2022年第三届“网鼎杯”网络安全大赛(青龙组)