当前位置: 首页 > news >正文

InternVL 微调实践

任务

follow 教学文档和视频使用QLoRA进行微调模型,复现微调效果,并能成功讲出梗图.

复现过程

参考教程部署:https://github.com/InternLM/Tutorial/blob/camp3/docs/L2/InternVL/joke_readme.md
训练
在这里插入图片描述

合并权重&&模型转换

python3 xtuner/configs/internvl/v1_5/convert_to_official.py xtuner/configs/internvl/v2/internvl_v2_internlm2_2b_qlora_finetune.py /root/InternLM/work_dir/internvl_ft_run_8_filter/iter_1000.pth /root/InternLM/InternVL2-2B/

模型在这
在这里插入图片描述

最后效果

在这里插入图片描述

相关文章:

  • 计算机网络自顶向下(1)---网络基础
  • 第十四周周报:Transformer for CV
  • SparseArray为啥在android 源码中经常被使用,原因何在
  • 画个心,写个花!Python Turtle库带你玩转创意绘图!
  • Linux系统安装和配置 VNC 服务器
  • 【第四章 IP 子网划分】
  • 使用Python创建EXE运行器和截图工具
  • 【OS】计算机系统概述|操作系统基本概念|并发|并行|虚拟异步
  • Stable Diffusion 的 ControlNet 主要用途
  • 【APM】在Kubernetes中,使用Helm安装loki-distributed 3.1.1
  • 【高效管理集合】并查集的实现与应用
  • 【工具分享】BlackBasta勒索病毒解密工具
  • C语言扫盲
  • 2、Stable Diffusion
  • Latex 自定义运算符加限定条件的实现
  • Codepen 每日精选(2018-3-25)
  • css布局,左右固定中间自适应实现
  • CSS实用技巧干货
  • ERLANG 网工修炼笔记 ---- UDP
  • JavaScript 基本功--面试宝典
  • java架构面试锦集:开源框架+并发+数据结构+大企必备面试题
  • Joomla 2.x, 3.x useful code cheatsheet
  • JS笔记四:作用域、变量(函数)提升
  • mysql外键的使用
  • 基于Vue2全家桶的移动端AppDEMO实现
  • 可能是历史上最全的CC0版权可以免费商用的图片网站
  • 前言-如何学习区块链
  • 我的zsh配置, 2019最新方案
  • 用Visual Studio开发以太坊智能合约
  • #mysql 8.0 踩坑日记
  • (23)Linux的软硬连接
  • (Git) gitignore基础使用
  • (附源码)python旅游推荐系统 毕业设计 250623
  • (六)vue-router+UI组件库
  • (六)什么是Vite——热更新时vite、webpack做了什么
  • (原创)可支持最大高度的NestedScrollView
  • (转)ObjectiveC 深浅拷贝学习
  • (转)项目管理杂谈-我所期望的新人
  • (转载)深入super,看Python如何解决钻石继承难题
  • (转载)微软数据挖掘算法:Microsoft 时序算法(5)
  • (转载)虚函数剖析
  • .NET 2.0中新增的一些TryGet,TryParse等方法
  • .net core 6 redis操作类
  • .net core控制台应用程序初识
  • .NET Core中的去虚
  • .NET Standard 的管理策略
  • .NET/C# 的字符串暂存池
  • .NET是什么
  • .NET序列化 serializable,反序列化
  • .Net组件程序设计之线程、并发管理(一)
  • [2010-8-30]
  • [20171101]rman to destination.txt
  • [BUUCTF]-PWN:[极客大挑战 2019]Not Bad解析
  • [Bzoj4722]由乃(线段树好题)(倍增处理模数小快速幂)
  • [C#]C# OpenVINO部署yolov8图像分类模型