当前位置: 首页 > news >正文

大模型微调4:Alpaca模型微调、Adalora、Qlora

Alpaca模型微调:

整个pipeline

8654b6232ed64c77b0b981fc184e5cbc.png

1. 主流底座:Candidate

        中文:YI-34B

        英文:LLama,mistral 

2. 验证:

        我们自己的Instructoin data

        通用的Instruction data(适合我们场景的) 

3. 收集大量的Finetune Data:一万到十万,高质量7K>一般质量30K

  • 人工
  • 半人工
  • 全自动

4. Fine Tune: Lora等

5. Inference-->server-->API-->APP/PC

 

Instruction Tuning可以尝试的使用方法

1. training on Instruction data

2. 通用Instruction data和私有 Instruction data混合,可以解决某些能力的遗忘

3. 混合比例,根据关注度确定,混合后做sample,构成minibatch

4. pre-train的时候加入Instruction data,接着在SFT上再使用Instruction Data

 

llama模型

开源模型

Transformer Decoder架构

结构上与Transformer经典结构差距很小

7B、13B、33B、65B四种基座模型(一般从小的开始训)

 

使用的通用数据:

0f222e71f1614a238db5c8b6bdfa6811.png

  • 位置编码-->循环位置编码
  • Relu激活函数-->SwiGlu激活函数
  • Efficient Implementation (reduce time and memory)

 

Alpaca是llama的fundation model,不具备chat能力,

 

instruction data 示例:

a46ed12cfe07445bbc15598ea5e52584.png

 

b16e59870a2b4eed930c6676454673c5.png

356c5cdcf9b4441b94809add484f97b0.png 

7a0e6936f767444e865b3788cc3f8c17.png 

 

相关文章:

  • mysql学习教程,从入门到精通,SQL LIKE 运算符(28)
  • C++教程(三):c++常用的配置文件类型
  • 基于nodejs+vue的宠物医院管理系统
  • jupyter报错IProgress not found. Please update jupyter and ipywidgets
  • 基于Spring框架的分层解耦详解
  • 状态模式原理剖析
  • HTML基础用法介绍二
  • 计算机前沿技术-人工智能算法-大语言模型-最新论文阅读-2024-09-23
  • 单体到微服务架构服务演化过程
  • 《深度学习》【项目】OpenCV 发票识别 透视变换、轮廓检测解析及案例解析
  • Cocos 3.8.3 实现外描边效果(逃课玩法)
  • Apache Iceberg 概述
  • MobaXterm基本使用 -- 服务器状态、批量操作、显示/切换中文字体、修复zsh按键失灵
  • 精通推荐算法32:行为序列建模总结
  • 亚马逊爆款三明治封口器发明专利维权,恐涉及大量卖家,速查
  • 2018以太坊智能合约编程语言solidity的最佳IDEs
  • 30天自制操作系统-2
  • github指令
  • JAVA并发编程--1.基础概念
  • Java精华积累:初学者都应该搞懂的问题
  • leetcode-27. Remove Element
  • miaov-React 最佳入门
  • Python3爬取英雄联盟英雄皮肤大图
  • rabbitmq延迟消息示例
  • SegmentFault 2015 Top Rank
  • Spring框架之我见(三)——IOC、AOP
  • Spring思维导图,让Spring不再难懂(mvc篇)
  • 笨办法学C 练习34:动态数组
  • 测试开发系类之接口自动化测试
  • 从@property说起(二)当我们写下@property (nonatomic, weak) id obj时,我们究竟写了什么...
  • 第2章 网络文档
  • 时间复杂度与空间复杂度分析
  • 腾讯优测优分享 | Android碎片化问题小结——关于闪光灯的那些事儿
  • 新书推荐|Windows黑客编程技术详解
  • 一个项目push到多个远程Git仓库
  • 职业生涯 一个六年开发经验的女程序员的心声。
  • Nginx实现动静分离
  • (13):Silverlight 2 数据与通信之WebRequest
  • (4) PIVOT 和 UPIVOT 的使用
  • (8)STL算法之替换
  • (JSP)EL——优化登录界面,获取对象,获取数据
  • (九)信息融合方式简介
  • (十一)c52学习之旅-动态数码管
  • (贪心 + 双指针) LeetCode 455. 分发饼干
  • (原創) 如何使用ISO C++讀寫BMP圖檔? (C/C++) (Image Processing)
  • (转)德国人的记事本
  • (转载)Linux 多线程条件变量同步
  • **CI中自动类加载的用法总结
  • ..thread“main“ com.fasterxml.jackson.databind.JsonMappingException: Jackson version is too old 2.3.1
  • .apk文件,IIS不支持下载解决
  • .bat批处理(十一):替换字符串中包含百分号%的子串
  • .mat 文件的加载与创建 矩阵变图像? ∈ Matlab 使用笔记
  • .mp4格式的视频为何不能通过video标签在chrome浏览器中播放?
  • .Net Core 微服务之Consul(二)-集群搭建
  • .NET Framework 4.6.2改进了WPF和安全性