当前位置: 首页 > news >正文

Meta-Llama-3-8B 部署

        Meta-Llama-3-8B                                模型文件地址

        LLaMA-Factory                                   仓库地址

        Download Ollama

环境准备

  • 操作系统:Ubuntu 22.04.5 LTS
  • Anaconda3:Miniconda3-latest-Linux-x86_64
  • GPU: NVIDIA GeForce RTX 4090 24G

1. 准备conda环境

创建一个新的conda环境:

conda create -n llama8b python==3.10 -y

conda activate llama8b

2. 下载LLaMA-Factory的项目文件

下载LLama_Factory源码:

git clone https://github.com/hiyouga/LLaMA-Factory.git

  • 3. 升级pip版本

建议在执行项目的依赖安装之前升级 pip 的版本:

python -m pip install --upgrade pip

4. 使用pip安装LLaMA-Factory项目代码运行的项目依赖

在LLaMA-Factory中提供的 requirements.txt文件包含了项目运行所必需的所有 Python 包及其精确版本号。使用pip一次性安装所有必需的依赖,执行命令如下:

pip install -r requirements.txt -i https://pypi.mirrors.ustc.edu.cn/simple 

 5. Llama3模型下载

        从下面地址中下载模型文件,这里我们从ModelScope来下载

huggingface Llama3模型主页:https://huggingface.co/meta-llama/
Github主页:GitHub - meta-llama/llama3: The official Meta Llama 3 GitHub site
ModelScope Llama3-8b模型主页:Meta-Llama-3-8B-Instruct

git clone https://www.modelscope.cn/LLM-Research/Meta-Llama-3-8B-Instruct.git

6. 运行原始模型

切换到LLama_Factory目录下

cd ~/LLaMA-Factory

1、

CUDA_VISIBLE_DEVICES=0 python src/web_demo.py \
--model_name_or_path /root/LLaMA-Factory-main/Meta-Llama-3-8B \
--template llama3 \
--infer_backend vllm \
--vllm_enforce_eager

2、

CUDA_VISIBLE_DEVICES=0 python src/web_demo.py \
--model_name_or_path /root/LLaMA-Factory/Meta-Llama-3-8B-Instruct \
--template llama3 \
--infer_backend vllm \
--vllm_enforce_eager

3、

CUDA_VISIBLE_DEVICES=0 python src/web_demo.py \
--model_name_or_path /home/oneview/ai-test/model/Meta-Llama-3-8B-Instruct \
--template llama3 \
--infer_backend vllm \
--vllm_enforce_eager

报错

INFO 06-16 09:19:47 llm_engine.py:87] Initializing an LLM engine with config: model='/root/LLaMA-Factory-main/Meta-Llama-3-8B', tokenizer='/root/LLaMA-Factory-
06/16/2024 09:19:53 - INFO - llmtuner.data.template - Add pad token: <|eot_id|>
Running on local URL:  http://0.0.0.0:7080

Could not create share link. Please check your internet connection or our status page: https://status.gradio.app.
 

解决方法:

链接:Could not create share link. Please check your internet connection or our status page: https://statu-CSDN博客

pip install modelscope -i https://pypi.mirrors.ustc.edu.cn/simple 

pip install vllm==0.3.3 -i https://pypi.mirrors.ustc.edu.cn/simple 

CUDA_VISIBLE_DEVICES=0 python src/web_demo.py \
--model_name_or_path /root/LLaMA-Factory-main/Meta-Llama-3-8B
--template LLaMA-Factory \
--infer_backend vllm \
--vllm_enforce_eager

LLaMA-Factory

CUDA_VISIBLE_DEVICES=0 python src/web_demo.py \
--model_name_or_path /root/LLaMA-Factory-main/Meta-Llama-3-8B \
--template llama3 \
--infer_backend vllm \
--vllm_enforce_eager
 

参考:Llama3本地部署与高效微调入门_llama3-8b开源如何部署微调-CSDN博客

相关文章:

  • 英语(1)-读音规则-连读-失去爆破
  • AJAX 数据库
  • 发那科机器人IO 分配
  • C# WPF入门学习主线篇(二十三)—— 控件模板(ControlTemplate)和数据模板(DataTemplate)
  • [pycrypto][python]pycrypto所有whl文件下载地址汇总
  • 基于自编码器的心电图信号异常检测(Python)
  • 近期学习文章
  • 基于单电阻采样的电流重构
  • <Rust><iced><resvg>基于rust使用iced构建GUI实例:使用resvg库实现svg转png
  • 数据仓库的实际应用示例-广告投放平台为例
  • 解决Qt中 -lGL无法找到的问题
  • Java数据类型与运算符
  • 小游戏app看广告app开发案例
  • NodeJs实现对本地 mysql 数据库的增删改查
  • Flink 窗口函数
  • 8年软件测试工程师感悟——写给还在迷茫中的朋友
  • github从入门到放弃(1)
  • Linux链接文件
  • nginx 配置多 域名 + 多 https
  • vue--为什么data属性必须是一个函数
  • 前端代码风格自动化系列(二)之Commitlint
  • 前端临床手札——文件上传
  • 前端每日实战:70# 视频演示如何用纯 CSS 创作一只徘徊的果冻怪兽
  • 视频flv转mp4最快的几种方法(就是不用格式工厂)
  • 想晋级高级工程师只知道表面是不够的!Git内部原理介绍
  • 用Node EJS写一个爬虫脚本每天定时给心爱的她发一封暖心邮件
  • 优秀架构师必须掌握的架构思维
  • 责任链模式的两种实现
  • “十年磨一剑”--有赞的HBase平台实践和应用之路 ...
  • 2017年360最后一道编程题
  • ​LeetCode解法汇总1410. HTML 实体解析器
  • ​ubuntu下安装kvm虚拟机
  • (C#)一个最简单的链表类
  • (论文阅读26/100)Weakly-supervised learning with convolutional neural networks
  • (一)python发送HTTP 请求的两种方式(get和post )
  • (一)基于IDEA的JAVA基础1
  • .NET C# 使用 SetWindowsHookEx 监听鼠标或键盘消息以及此方法的坑
  • .net MVC中使用angularJs刷新页面数据列表
  • /etc/fstab 只读无法修改的解决办法
  • :如何用SQL脚本保存存储过程返回的结果集
  • @SuppressLint(NewApi)和@TargetApi()的区别
  • [ vulhub漏洞复现篇 ] JBOSS AS 5.x/6.x反序列化远程代码执行漏洞CVE-2017-12149
  • [16/N]论得趣
  • [2015][note]基于薄向列液晶层的可调谐THz fishnet超材料快速开关——
  • [2024-06]-[大模型]-[Ollama]- WebUI
  • [51nod1610]路径计数
  • [AR]Vumark(下一代条形码)
  • [AutoSar]BSW_Memory_Stack_004 创建一个简单NV block并调试
  • [hdu 1711] Number Sequence [kmp]
  • [java] 23种设计模式之责任链模式
  • [Latex] \bibitem{} | .bbl 格式参考文献转换与获得
  • [leetcode]114. Flatten Binary Tree to Linked List由二叉树构建链表
  • [LeetCode]-225. 用队列实现栈-232. 用栈实现队列
  • [LOJ#6259]「CodePlus 2017 12 月赛」白金元首与独舞
  • [Mac软件]Goldie App v2.2 Mac黄金比例设计工具