当前位置: 首页 > news >正文

llama-factory微调大模型

一、背景

微调或者全量调大语言模型,还包括deepseek,想找个快速的微调教程,网上暂时没有

二、原理和步骤

原理:搭建环境太累了,还是docker环境镜像简单快捷

1、先下载模型

如果用本身的会自动从huggingface下载,这下不了(也没有提示)

from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen-7B')
print(model_dir )下载的路径

2、拉去LLAMA-factory repo

docker build -f ./Dockerfile -t llama-factory:latest .

3、要根据自己的目录调整启动镜像

docker run --gpus=all \-v 你下载的模型地址:/models/Qwen-7B \-v ./data:/app/data \-v ./output:/app/output \-e CUDA_VISIBLE_DEVICES=0 \-p 7860:7860 \--shm-size 16G \--name llama_factory \-d llama-factory:latest

三、访问web

地址:ip:7860

可以点击chat-load模型,并可以正常聊天了

其次就算微调模型,各种参数设置了

相关文章:

  • 深入分析 Android Activity (六)
  • [C#]使用C#部署yolov8-seg的实例分割的tensorrt模型
  • vscode写html不会自动补全
  • 东方博宜1703 - 小明买水果
  • 数据结构:希尔排序
  • 身份认证与口令攻击
  • excel怎么对非数字求和汇总?
  • AI边缘计算盒子在智慧交通的应用
  • USB主机模式——Android
  • python项目中的日志定义
  • Qt for android : libusb在android中使用
  • gitea的git库备份与恢复
  • nacos连接异常did not find the Leader node;
  • JAVA应用服务器如何快速定位CPU问题
  • 【vue】@、@/、../和./的区别
  • ES学习笔记(10)--ES6中的函数和数组补漏
  • java概述
  • Lucene解析 - 基本概念
  • Median of Two Sorted Arrays
  • Spring Cloud(3) - 服务治理: Spring Cloud Eureka
  • Vue小说阅读器(仿追书神器)
  • Work@Alibaba 阿里巴巴的企业应用构建之路
  • 初识 beanstalkd
  • 从0到1:PostCSS 插件开发最佳实践
  • 大型网站性能监测、分析与优化常见问题QA
  • 关键词挖掘技术哪家强(一)基于node.js技术开发一个关键字查询工具
  • 前端面试之CSS3新特性
  • 一天一个设计模式之JS实现——适配器模式
  • 怎么把视频里的音乐提取出来
  • 最近的计划
  • mysql 慢查询分析工具:pt-query-digest 在mac 上的安装使用 ...
  • ​浅谈 Linux 中的 core dump 分析方法
  • ​如何使用QGIS制作三维建筑
  • #[Composer学习笔记]Part1:安装composer并通过composer创建一个项目
  • #vue3 实现前端下载excel文件模板功能
  • (2024)docker-compose实战 (9)部署多项目环境(LAMP+react+vue+redis+mysql+nginx)
  • (8)STL算法之替换
  • (Arcgis)Python编程批量将HDF5文件转换为TIFF格式并应用地理转换和投影信息
  • (C语言)共用体union的用法举例
  • (Note)C++中的继承方式
  • (Redis使用系列) Springboot 使用Redis+Session实现Session共享 ,简单的单点登录 五
  • (笔试题)分解质因式
  • (纯JS)图片裁剪
  • (附源码)springboot车辆管理系统 毕业设计 031034
  • (论文阅读40-45)图像描述1
  • (十) 初识 Docker file
  • (十二)Flink Table API
  • (四)软件性能测试
  • (已解决)vue+element-ui实现个人中心,仿照原神
  • .net core 6 集成 elasticsearch 并 使用分词器
  • .NET Core6.0 MVC+layui+SqlSugar 简单增删改查
  • .NET/C# 编译期能确定的字符串会在字符串暂存池中不会被 GC 垃圾回收掉
  • .NET/C# 如何获取当前进程的 CPU 和内存占用?如何获取全局 CPU 和内存占用?
  • .NET编程——利用C#调用海康机器人工业相机SDK实现回调取图与软触发取图【含免费源码】
  • .NET国产化改造探索(一)、VMware安装银河麒麟