当前位置: 首页 > news >正文

一、大模型推理

https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md
https://github.com/hiyouga/LLaMA-Factory/blob/main/examples/README_zh.md

  • 安装 v7.1

https://github.com/hiyouga/LLaMA-Factory/releases/tag/v0.7.1

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e .[torch,metrics]
  • 推理
    • 以 Llama-3-8B-Instruct 为例,这里全部用 vllm 作为后端,不写就是 transformers 后端
  • 使用命令行接口
    • llama3_vllm.yaml
model_name_or_path: eta-Llama-3-8B-Instruct
template: llama3
infer_backend: vllm
vllm_enforce_eager: true
CUDA_VISIBLE_DEVICES=0 llamafactory-cli chat examples/inference/llama3_vllm.yaml

image.png

  • 使用浏览器界面
CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat examples/inference/llama3_vllm.yaml

image.png

  • 启动 OpenAI 风格 API
CUDA_VISIBLE_DEVICES=0 llamafactory-cli api examples/inference/llama3_vllm.yaml

image.png

  • 模拟发起请求
curl http://0.0.0.0:8000/v1/chat/completions \-H "Content-Type: application/json" \-H "Authorization: Bearer " \-d '{"model": "Meta-Llama-3-8B-Instruct","messages": [{"role": "system","content": "You are a helpful assistant."},{"role": "user","content": "Who won the world series in 2020?"},{"role": "assistant","content": "The Los Angeles Dodgers won the World Series in 2020."},{"role": "user","content": "Where was it played?"}]}'

相关文章:

  • 深入Maven:从入门到精通的全面指南
  • vue3 项目目录使用文件夹和index.vue,与直接用直接用名字.vue的区别
  • 线性数据结构-链表
  • kafka-消费者组(SpringBoot整合Kafka)
  • typesense-开源的轻量级搜索引擎
  • pytorch中的维度变换操作性质大总结:view, reshape, transpose, permute
  • 【LeetCode 101】对称二叉树
  • text2sql、nl2sql框架总结
  • Aurora 8b/10b协议(高速收发器十五)
  • 小程序简单版录音机
  • MyBatisPlus——入门到进阶
  • 网络安全领域六大顶级会议介绍:含会议介绍、会议地址及会议时间和截稿日期
  • 动态IP与静态IP的优缺点
  • 如何手撸一个java ioc框架
  • 数字智能数字人直播带货软件系统 实现真人形象的1:1克隆 前后端分离 带完整的安装代码包以及搭建教程
  • 自己简单写的 事件订阅机制
  • 《Javascript高级程序设计 (第三版)》第五章 引用类型
  • 3.7、@ResponseBody 和 @RestController
  • docker-consul
  • Essential Studio for ASP.NET Web Forms 2017 v2,新增自定义树形网格工具栏
  • Invalidate和postInvalidate的区别
  • js
  • js如何打印object对象
  • js作用域和this的理解
  • node-sass 安装卡在 node scripts/install.js 解决办法
  • SpingCloudBus整合RabbitMQ
  • Spring-boot 启动时碰到的错误
  • vue2.0一起在懵逼的海洋里越陷越深(四)
  • Webpack入门之遇到的那些坑,系列示例Demo
  • 对JS继承的一点思考
  • 观察者模式实现非直接耦合
  • 前端攻城师
  • 容器化应用: 在阿里云搭建多节点 Openshift 集群
  • 小程序 setData 学问多
  • 正则与JS中的正则
  • linux 淘宝开源监控工具tsar
  • 扩展资源服务器解决oauth2 性能瓶颈
  • ​卜东波研究员:高观点下的少儿计算思维
  • # 消息中间件 RocketMQ 高级功能和源码分析(七)
  • ## 1.3.Git命令
  • #宝哥教你#查看jquery绑定的事件函数
  • $HTTP_POST_VARS['']和$_POST['']的区别
  • (1)Jupyter Notebook 下载及安装
  • (C语言)字符分类函数
  • (二)WCF的Binding模型
  • (论文阅读30/100)Convolutional Pose Machines
  • (转)C#调用WebService 基础
  • (转)es进行聚合操作时提示Fielddata is disabled on text fields by default
  • (转)如何上传第三方jar包至Maven私服让maven项目可以使用第三方jar包
  • (转)淘淘商城系列——使用Spring来管理Redis单机版和集群版
  • (转载)跟我一起学习VIM - The Life Changing Editor
  • **CentOS7安装Maven**
  • *_zh_CN.properties 国际化资源文件 struts 防乱码等
  • .CSS-hover 的解释
  • .net core 源码_ASP.NET Core之Identity源码学习