当前位置: 首页 > news >正文

第十八节 LLaVA如何按需构建LORA训练(视觉、语言、映射多个组合训练)

文章目录

  • 前言
  • 一、基于llava源码构建新的参数
    • 1、添加lora_vit参数
    • 2、训练命令脚本设置
  • 二、修改源码,构建lora训练
    • 1、修改源码-lora训练
    • 2、LLM模型lora加载
    • 3、VIT模型加载
    • 4、权重冻结操作
    • 5、结果显示
  • 三、实验结果

前言

如果看了我前面文章,想必你基本对整个代码有了更深认识。实际上,大多大模型都是使用huggingface搭建,而大多LORA训练也是调用PEFT库。然而,LLaVA代码却没有相关VIT模型训练内容,也没有不同组合训练。而我也是想探索单独使用vit的lora训练、单独使用llm的lora训练或全都使用会有什么效果呢?因此,本篇文章将探索LLaVA如何按需构建LORA训练,我会给出如何构建参数与修改源码,也会给出我实验结果。实验结果表明,视觉、语言、映射三着结合训练基本没有效果,视觉与语言训练也不会有效果,而其它基本会有转好效果。

一、基于llava源码构建新的参数

1、添加lora_vit参数

我想使用一个参数来决定是否对视觉vit模型进行lora训练,而llm与映射训练已有相关参数可控制。为此,我们在TrainingArguments的参数中添加lora_vit变量,用此来控制是否视觉使用vit训练。其如图所示:

在这里插入图片描述

2、训练命令脚本设置

于是,我们可以使用训练命令脚本,我们只需设置lora_vit的bool,即可实现视觉部分训练。当然,我也修改了源码,使用lora_enable控制LLM模型是否训练,tune_mm_mlp_adapter控制映射层是否训练。最终,我们可以自由组合决定训练哪些模块。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 上海外贸建站公司wordpress模板推荐
  • 【Linux进阶】文件系统7——文件系统简单操作
  • FUSE(用户空间文件系统)命令参数
  • 学懂C#编程:C# 索引器(Indexer)的概念及用法
  • 通用个人客户关系管理系统设计
  • OpenSNN推文:盛夏智慧之光:七月高校新闻聚焦
  • Git命令常规操作
  • C++ //练习 14.45 编写类型转换运算符将一个Sales_data对象分别转换成string和double,你认为这些运算符的返回值应该是什么?
  • 电脑多开卡顿的所有原因汇总
  • IEC62056标准体系简介-2.IEC62056标准体系及对象标识系统(OBIS)
  • 嵌入式底层开发 入门学习路线
  • Python深度理解系列之【排序算法——冒泡排序】
  • 使用OpenCV的absdiff函数报错
  • 深圳唯创知音革新健康监测!语音播报,蓝牙传输,电量检测—全能型智能血压计三大方案,让关爱更“声”动人心
  • 智能眼镜火热发展 AI+AR或将成为主流趋势?
  • Android框架之Volley
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • ES6简单总结(搭配简单的讲解和小案例)
  • es6要点
  • MySQL的数据类型
  • Nacos系列:Nacos的Java SDK使用
  • Netty 4.1 源代码学习:线程模型
  • Python - 闭包Closure
  • Spring思维导图,让Spring不再难懂(mvc篇)
  • use Google search engine
  • v-if和v-for连用出现的问题
  • vue和cordova项目整合打包,并实现vue调用android的相机的demo
  • 成为一名优秀的Developer的书单
  • 基于阿里云移动推送的移动应用推送模式最佳实践
  • 简析gRPC client 连接管理
  • 前端相关框架总和
  • 如何邀请好友注册您的网站(模拟百度网盘)
  • 如何用Ubuntu和Xen来设置Kubernetes?
  • 深度解析利用ES6进行Promise封装总结
  • 使用putty远程连接linux
  • 使用SAX解析XML
  • 腾讯优测优分享 | 你是否体验过Android手机插入耳机后仍外放的尴尬?
  • 职业生涯 一个六年开发经验的女程序员的心声。
  • 曜石科技宣布获得千万级天使轮投资,全方面布局电竞产业链 ...
  • ​secrets --- 生成管理密码的安全随机数​
  • ​水经微图Web1.5.0版即将上线
  • # 数论-逆元
  • #pragma once与条件编译
  • (2024,RWKV-5/6,RNN,矩阵值注意力状态,数据依赖线性插值,LoRA,多语言分词器)Eagle 和 Finch
  • (el-Date-Picker)操作(不使用 ts):Element-plus 中 DatePicker 组件的使用及输出想要日期格式需求的解决过程
  • (Forward) Music Player: From UI Proposal to Code
  • (k8s中)docker netty OOM问题记录
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (六)Hibernate的二级缓存
  • .net 7 上传文件踩坑
  • .NET Framework Client Profile - a Subset of the .NET Framework Redistribution
  • .NET 使用 ILMerge 合并多个程序集,避免引入额外的依赖
  • .NET 中选择合适的文件打开模式(CreateNew, Create, Open, OpenOrCreate, Truncate, Append)
  • .Net的C#语言取月份数值对应的MonthName值
  • .NET使用存储过程实现对数据库的增删改查