当前位置: 首页 > news >正文

基于vllm部署大模型

VLLM(非常大的语言模型)在中文中通常指的是经过大量文本数据训练的神经网络模型,能够理解和生成类似人类语言的文本。这类模型是许多先进AI系统的核心,比如ChatGPT、GPT-4等。

VLLM 可以执行各种任务,如自然语言处理、文本生成、翻译、问答系统等。它们在处理大量数据的情况下表现出色,能够为各种语言应用提供支持。

VLLM官方网址
VLLM官方 github 地址

部署大模型

  1. 基于agiclass创建算力服务器
    在这里插入图片描述
    在这里插入图片描述

  2. 启动实例
    在这里插入图片描述

  3. 打开本地终端,远程连接

ssh -p 40227 root@connect.cqa1.seetacloud.com

移动文件夹

mv Yi-6B-Chat/ /root/autodl-tmp/

启动服务

python -m vllm.entrypoints.openai.api_server --model /root/autodl-tmp/Yi-6B-Chat --trust-remote-code --port 6006
  1. 启动服务器实例自定义服务
ssh -CNg -L 6006:127.0.0.1:6006 root@connect.cqa1.seetacloud.com -p 40227

本地测试 http://127.0.0.1:6006/ 地址
在这里插入图片描述

  1. 终端访问地址
curl http://127.0.0.1:6006/v1/chat/completions \-H "Content-Type: application/json" \-d '{"model": "/root/autodl-tmp/Yi-6B-Chat","max_tokens":60,"messages": [{"role": "user","content": "你是谁?"}]}'
  1. 本地pycharm调用
from openai import OpenAI# Modify OpenAI's API key and API base to use vLLM's API server.
openai_api_key = "EMPTY"
openai_api_base = "http://localhost:6006/v1"
client = OpenAI(api_key=openai_api_key,base_url=openai_api_base,
)
completion = client.chat.completions.create(messages = [{"role": "user","content": "你是谁"}],
model="/root/autodl-tmp/Yi-6B-Chat"
)
print(completion.choices[0].message.content)

输出如下

你好!我是零一万物开发的智能助手,我叫 Yi,我是由零一万物的研究团队通过大量的文本数据进行训练的。我旨在为用户提供各种信息查询、文本理解和自然语言处理方面的帮助。如果您有任何问题或需要帮助,请随时告诉我!

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • <数据集>铝型材缺陷识别数据集<目标检测>
  • Comsol 宽频带超薄卷状超表面吸声器
  • 使用 Apache POI 的 DataFormatter 处理 Excel 数据
  • 《智能计算系统:从深度学习到大模型(第2版)》重磅上市!
  • 动态规划-打家劫舍、股票问题
  • Python——变量和字符串以及转义字符常见问题总结
  • 机器学习第十二章-计算学习理论
  • 计算机网络速成(二)
  • Elasticsearch高阶查询
  • 【C++】String类:标准库介绍
  • HarmonyOS Next原生应用开发-从TS到ArkTS的适配规则(十六)
  • 使用Nexus3为containerd和docker配置镜像代理
  • 前端怎么用 EventSource并配置请求头及加参数(流式数据)
  • Hyperf 安装,使用,
  • 单一责任原则
  • php的引用
  • 时间复杂度分析经典问题——最大子序列和
  • [译]如何构建服务器端web组件,为何要构建?
  • 【笔记】你不知道的JS读书笔记——Promise
  • 【跃迁之路】【444天】程序员高效学习方法论探索系列(实验阶段201-2018.04.25)...
  • 4个实用的微服务测试策略
  • Android 初级面试者拾遗(前台界面篇)之 Activity 和 Fragment
  • canvas实际项目操作,包含:线条,圆形,扇形,图片绘制,图片圆角遮罩,矩形,弧形文字...
  • cookie和session
  • golang 发送GET和POST示例
  • Intervention/image 图片处理扩展包的安装和使用
  • magento 货币换算
  • React Native移动开发实战-3-实现页面间的数据传递
  • 编写高质量JavaScript代码之并发
  • 纯 javascript 半自动式下滑一定高度,导航栏固定
  • 对超线程几个不同角度的解释
  • 检测对象或数组
  • 猫头鹰的深夜翻译:Java 2D Graphics, 简单的仿射变换
  • 每天一个设计模式之命令模式
  • 如何设计一个比特币钱包服务
  • 深度学习在携程攻略社区的应用
  • 通过来模仿稀土掘金个人页面的布局来学习使用CoordinatorLayout
  • 鱼骨图 - 如何绘制?
  • const的用法,特别是用在函数前面与后面的区别
  • 大数据全解:定义、价值及挑战
  • ​configparser --- 配置文件解析器​
  • ​软考-高级-系统架构设计师教程(清华第2版)【第9章 软件可靠性基础知识(P320~344)-思维导图】​
  • (16)UiBot:智能化软件机器人(以头歌抓取课程数据为例)
  • (2022 CVPR) Unbiased Teacher v2
  • (Demo分享)利用原生JavaScript-随机数-实现做一个烟花案例
  • (function(){})()的分步解析
  • (MonoGame从入门到放弃-1) MonoGame环境搭建
  • (定时器/计数器)中断系统(详解与使用)
  • (附源码)springboot“微印象”在线打印预约系统 毕业设计 061642
  • (更新)A股上市公司华证ESG评级得分稳健性校验ESG得分年均值中位数(2009-2023年.12)
  • (黑马C++)L06 重载与继承
  • (论文阅读笔记)Network planning with deep reinforcement learning
  • (入门自用)--C++--抽象类--多态原理--虚表--1020
  • (一)springboot2.7.6集成activit5.23.0之集成引擎
  • (转)Linux NTP配置详解 (Network Time Protocol)