当前位置: 首页 > news >正文

10、ollama启动LLama_Factory微调大模型(llama.cpp)

在前面章节中介绍了如何使用LLama_Factory微调大模型,并将微调后的模型文件合并导出,本节我们我们看下如何使用ollama进行调用。

1、llama.cpp

LLama_Factory训练好的模型,ollama不能直接使用,需要转换一下格式,我们按照ollama官网的提示使用llama.cpp来进行实现。
在这里插入图片描述

1.1 安装llama.cpp

下载 llama.cpp

git clone https://github.com/ggerganov/llama.cpp.gitcd llama.cpp# 安裝 Python 相依套件
pip install -r requirements.txt

在这里插入图片描述

1.2 格式转换

python convert_hf_to_gguf.py  /root/LLaMA-Factory-main/Qwen2-0.5B-Chat_all \
> --outfile /root/LLaMA-Factory-main/Qwen2-0.5B-Chat_all/Qwen2-0.5B-Chat_829.gguf
  • /root/LLaMA-Factory-main/Qwen2-0.5B-Chat_all :微调后合并的模型文件路径
  • /root/LLaMA-Factory-main/Qwen2-0.5B-Chat_all/Qwen2-0.5B-Chat_829.gguf :转换后的文件路径和名称

在这里插入图片描述
速度很快
在这里插入图片描述
在这里插入图片描述

2、ollama启动模型

2.1 Linux安装ollama

在这里插入图片描述

curl -fsSL https://ollama.com/install.sh | sh

如果服务器网络不好无法下载,可以先下载到本地再上传
下载地址:https://ollama.com/download/ollama-linux-amd64.tgz
解压安装:sudo tar -xzf ollama-linux-amd64.tgz -C /usr/local/
在这里插入图片描述

2.2 加载模型

要导入 GGUF 模型到 Ollama 中,您需要创建一个名为 ModelFile 的文件,并在其中包含指定的内容。以下是如何创建这个文件的步骤:

  1. 选择创建文件的目录
    需要确定把ollama相关的配置文件放在那个目录,比如在主目录中创建一个专用目录来存放模型文件:

    mkdir -p ~/ollama_models/my_model
    cd ~/ollama_models/my_model
    
  2. 创建 ModelFile 文件
    在进入目标目录后,使用以下命令创建一个名为 ModelFile 的文件:

    touch ModelFile
    
  3. 编辑 ModelFile 文件

    接下来,使用您熟悉的文本编辑器(如 nanovivim)打开并编辑 ModelFile 文件。例如,使用 nano 编辑:

    nano ModelFile
    

    在文件中输入以下内容,将 /path/to/file.gguf 替换为 GGUF 文件的实际路径:

    FROM /path/to/file.gguf
    

    例如,我的 GGUF 文件位于 FROM /root/LLaMA-Factory-main/Qwen2-0.5B-Chat_all/Qwen2-0.5B-Chat_829.gguf,则内容应为:

    FROM /root/LLaMA-Factory-main/Qwen2-0.5B-Chat_all/Qwen2-0.5B-Chat_829.gguf
    
  4. 保存并关闭文件

    在编辑完成后,保存文件并退出编辑器:

    • nano 中,按 Ctrl + O 保存,按 Enter 确认保存路径,然后按 Ctrl + X 退出编辑器。
    • vivim 中,按 Esc 键,然后输入 :wq 保存并退出。
  5. 使用 Ollama 导入模型

    完成 ModelFile 文件的创建后,使用 Ollama 的命令来导入该模型:

    ollama create my-model -f /root/ollama_models/my_model/ModelFile
    

    在上述命令中,my-model 为模型选择的名称。
    在这里插入图片描述

  6. 查看创建的模型
    在这里插入图片描述

  7. 运行模型
    在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 网闸与防火墙的区别
  • Python中排序算法之冒泡排序
  • k8s单master多node环境搭建-k8s版本低于1.24,容器运行时为docker
  • deque容器---C++
  • 第4章-06-让无头浏览器加载扩展插件
  • 小程序中使用page-container来做弹窗
  • C++ 洛谷 哈希表(对应题库:哈希,hash)习题集及代码
  • 【FPGA】入门学习路线
  • 【Python系列】SQLAlchemy 基本介绍
  • 等保2.0--安全计算环境--TiDB数据库
  • ThinkPHP A表和B表一对多关联,根据B表中符合条件记录的某个字段的值对A表数据进行排序。
  • 更改网络ip地址时出现错误怎么办
  • 深度学习项目实践——qq聊天机器人(transformer)(二)配置环境与部署
  • 做影像组学+深度学习技术研究如何发表高分论文,案例解析
  • 常用Numpy操作(笔记整理)
  • $translatePartialLoader加载失败及解决方式
  • [deviceone开发]-do_Webview的基本示例
  • 【跃迁之路】【519天】程序员高效学习方法论探索系列(实验阶段276-2018.07.09)...
  • 0x05 Python数据分析,Anaconda八斩刀
  • 2018一半小结一波
  • Apache的基本使用
  • Babel配置的不完全指南
  • Essential Studio for ASP.NET Web Forms 2017 v2,新增自定义树形网格工具栏
  • IE报vuex requires a Promise polyfill in this browser问题解决
  • java中具有继承关系的类及其对象初始化顺序
  • JS+CSS实现数字滚动
  • Phpstorm怎样批量删除空行?
  • Quartz初级教程
  • react-core-image-upload 一款轻量级图片上传裁剪插件
  • SpriteKit 技巧之添加背景图片
  • weex踩坑之旅第一弹 ~ 搭建具有入口文件的weex脚手架
  • windows-nginx-https-本地配置
  • 闭包--闭包之tab栏切换(四)
  • 订阅Forge Viewer所有的事件
  • 前端路由实现-history
  • 走向全栈之MongoDB的使用
  • [地铁译]使用SSD缓存应用数据——Moneta项目: 低成本优化的下一代EVCache ...
  • Android开发者必备:推荐一款助力开发的开源APP
  • Spark2.4.0源码分析之WorldCount 默认shuffling并行度为200(九) ...
  • 进程与线程(三)——进程/线程间通信
  • ​无人机石油管道巡检方案新亮点:灵活准确又高效
  • ​中南建设2022年半年报“韧”字当头,经营性现金流持续为正​
  • # 再次尝试 连接失败_无线WiFi无法连接到网络怎么办【解决方法】
  • #70结构体案例1(导师,学生,成绩)
  • #多叉树深度遍历_结合深度学习的视频编码方法--帧内预测
  • $GOPATH/go.mod exists but should not goland
  • (1/2)敏捷实践指南 Agile Practice Guide ([美] Project Management institute 著)
  • (pytorch进阶之路)扩散概率模型
  • (STM32笔记)九、RCC时钟树与时钟 第一部分
  • (八)Flask之app.route装饰器函数的参数
  • (汇总)os模块以及shutil模块对文件的操作
  • (六)Hibernate的二级缓存
  • (六)vue-router+UI组件库
  • (四)Tiki-taka算法(TTA)求解无人机三维路径规划研究(MATLAB)
  • (原創) 物件導向與老子思想 (OO)