当前位置: 首页 > news >正文

主流开源大语言模型的微调方法

文章目录

  • 模型
    • ChatGLM2
      • 网址
      • 原生支持微调方式
    • ChatGLM3
      • 网址
      • 原生支持微调方式
    • Baichuan 2
      • 网址
      • 原生支持微调方式
    • Qwen
      • 网址
      • 原生支持微调方式
  • 框架
    • Firefly
    • Efficient-Tuning-LLMs
    • SuperAdapters

模型

ChatGLM2

网址

https://github.com/thudm/chatglm2-6b

原生支持微调方式

https://github.com/THUDM/ChatGLM2-6B/tree/main/ptuning

全量微调和 P-Tuning v2

ChatGLM3

网址

https://github.com/THUDM/ChatGLM3

原生支持微调方式

https://github.com/THUDM/ChatGLM3/blob/main/finetune_demo/README.md

全量微调和 P-Tuning v2

Baichuan 2

网址

https://github.com/baichuan-inc/Baichuan2

原生支持微调方式

全量微调和Lora

Qwen

网址

https://github.com/QwenLM/Qwen/blob/main/README_CN.md

原生支持微调方式

全参微调、LoRA以及Q-LoRA

框架

Firefly

https://github.com/yangjianxin1/Firefly
支持市面绝大多数模型的QLoRA和全量参数微调

Efficient-Tuning-LLMs

https://github.com/jianzhnie/Efficient-Tuning-LLMs/blob/main/README_zh.md
支持市面少数模型的QLoRA和全量参数微调

SuperAdapters

https://github.com/cckuailong/SuperAdapters
支持市面绝大多数模型的各种微调

相关文章:

  • centeros7系统安装指定版本的mongodb数据库
  • 『Linux升级路』基础开发工具——gcc/g++篇
  • 【Python大数据笔记_day11_Hadoop进阶之MR和YARNZooKeeper】
  • 【docker】安装redis和mysql生产实战
  • 聚观早报 |一加12正式开启预订;OPPO Reno11系列卖点
  • 【中间件】服务化中间件理论intro
  • opencv-图像金字塔
  • HTML5+ API 爬坑记录
  • Linux基础命令5
  • 时序预测 | MATLAB实现基于LSTM-AdaBoost长短期记忆网络结合AdaBoost时间序列预测
  • 关于前端处理后端轮询的操作 (总结)
  • 项目整个管理论文之5
  • 如何解决requests库自动确定认证arded 类型
  • 搭配:基于OpenCV的边缘检测实战
  • 3D火山图绘制教程
  • Angular 2 DI - IoC DI - 1
  • Apache Pulsar 2.1 重磅发布
  • export和import的用法总结
  • git 常用命令
  • Kibana配置logstash,报表一体化
  • Netty 4.1 源代码学习:线程模型
  • select2 取值 遍历 设置默认值
  • spring学习第二天
  • tab.js分享及浏览器兼容性问题汇总
  • 前嗅ForeSpider中数据浏览界面介绍
  • 融云开发漫谈:你是否了解Go语言并发编程的第一要义?
  • 如何借助 NoSQL 提高 JPA 应用性能
  • 什么软件可以剪辑音乐?
  • 使用权重正则化较少模型过拟合
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • 找一份好的前端工作,起点很重要
  • elasticsearch-head插件安装
  • NLPIR智能语义技术让大数据挖掘更简单
  • 宾利慕尚创始人典藏版国内首秀,2025年前实现全系车型电动化 | 2019上海车展 ...
  • (C语言)fread与fwrite详解
  • (汇总)os模块以及shutil模块对文件的操作
  • (三)Hyperledger Fabric 1.1安装部署-chaincode测试
  • (转) Face-Resources
  • .bat批处理(一):@echo off
  • .net 4.0 A potentially dangerous Request.Form value was detected from the client 的解决方案
  • .NET 中创建支持集合初始化器的类型
  • .net经典笔试题
  • /*在DataTable中更新、删除数据*/
  • :=
  • ??javascript里的变量问题
  • @DependsOn:解析 Spring 中的依赖关系之艺术
  • @font-face 用字体画图标
  • [2669]2-2 Time类的定义
  • [ActionScript][AS3]小小笔记
  • [acwing周赛复盘] 第 69 场周赛20220917
  • [Android Pro] listView和GridView的item设置的高度和宽度不起作用
  • [Android Studio] 开发Java 程序
  • [BZOJ3757] 苹果树
  • [C# 基础知识系列]专题十六:Linq介绍
  • [HCIE] IPSec-VPN (手工模式)