当前位置: 首页 > news >正文

本地部署Xinference实现智能体推理工作流(一)

提示:没有安装Docker的需要先提前安装好Docker

第一篇章 使用AutoDL平台快速部署xinference

备注:若使用AutoDL平台,以下过程使用无卡模型开机即可(省钱)

1. 下载Dify源码

Github下载Dify:https://github.com/langgenius/dify

2. 快速启动

启动 Dify 服务器的最简单方法是运行我们的 [docker-compose.yml] 文件。在运行安装命令之前,请确保您的机器上安装了 [Docker](https://docs.docker.com/get-docker/) 和 [Docker Compose](https://docs.docker.com/compose/install/):

```bash

cd docker

cp .env.example .env

docker compose up -d

```

启动后依次点击 头像->设置->模型供应商->ChatGLM,这样要求输入API地址,所以我们需要本地部署一个GLM,并暴露API地址给用户。

3. 本地部署ChatGLM

因为我本地电脑性能不够,所有这里我在AutoDL平台部署ChatGLM

① 首先创建一个实例,然后安装Xinference(安装原因:用Xinference安装会自己生成API接口,但使用其他人创建好的模型或官方模型不好使,不知道原因,有知道的可以打在评论区)

② 运行命令(需要下载很久,嫌慢的可以使用我下载安装好的镜像):

$ pip install "xinference[all]"

③ 创建xinference运行的python虚拟环境

运行命令:conda create -n xinference python=3.10

④ 运行虚拟环境

执行命令:conda activate xinference

⑤ 在虚拟环境中运行xinference

执行命令:

xinference-local --host 0.0.0.0 --port 9997

⑥ 可以看到服务已经起来了,然后我们用linux的隧道传输功能将AutoDL中的端口映射到自己的本地电脑。

⑦ 本来想用MAC代理的,但不知道什么原因,MAC无法建立连接,所以只能用另一台Windows系统了。

代理成功后后如图所示:

(坑:要代理的端口号必须和服务器上运行的服务的端口号保持一样,不然无法代理成功):

其他问题:conda activate xinference命令好像只有第一次运行的时候需要输入这个命令,后面再启动服务的话直接输入:xinference-local --host 0.0.0.0 --port 9997命令就可以了。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • GitLab私有代码仓库搭建与使用
  • 【Java设计模式】Balking模式:智能控制Java执行
  • 【Java 设计模式】Bytecode 模式:使用自定义虚拟机解释指令
  • GAMES202——作业1 实时阴影(ShadowMap,PCF,PCSS)
  • windows C++-Lambda表达式(三)
  • 数学基础 -- 微积分之三角恒等式的积分
  • day57-graph theory-part07-8.28
  • 深度强化学习算法(四)(附带MATLAB程序)
  • 基于imx6ull平台opencv的图像采集和显示屏LCD显示功能(不带Qt界面)
  • CMake Error at CMakeLists.txt (find_package)幕后真凶
  • Linux之ip命令详解
  • Dockerfile+私有仓库
  • 创新互动体验RAG:利用角色化AI技术增强影视评论的沉浸感
  • [mysql]mysql的演示使用
  • linux下使用xargs批量操作
  • 《Javascript数据结构和算法》笔记-「字典和散列表」
  • Android Studio:GIT提交项目到远程仓库
  • CentOS6 编译安装 redis-3.2.3
  • Git同步原始仓库到Fork仓库中
  • Node.js 新计划:使用 V8 snapshot 将启动速度提升 8 倍
  • react-native 安卓真机环境搭建
  • SpringBoot几种定时任务的实现方式
  • tweak 支持第三方库
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 互联网大裁员:Java程序员失工作,焉知不能进ali?
  • 机器学习学习笔记一
  • 将回调地狱按在地上摩擦的Promise
  • 理解 C# 泛型接口中的协变与逆变(抗变)
  • 适配mpvue平台的的微信小程序日历组件mpvue-calendar
  • 手写一个CommonJS打包工具(一)
  • 走向全栈之MongoDB的使用
  • gunicorn工作原理
  • 教程:使用iPhone相机和openCV来完成3D重建(第一部分) ...
  • ​​​​​​​开发面试“八股文”:助力还是阻力?
  • ###51单片机学习(2)-----如何通过C语言运用延时函数设计LED流水灯
  • #考研#计算机文化知识1(局域网及网络互联)
  • #免费 苹果M系芯片Macbook电脑MacOS使用Bash脚本写入(读写)NTFS硬盘教程
  • (2024,LoRA,全量微调,低秩,强正则化,缓解遗忘,多样性)LoRA 学习更少,遗忘更少
  • (51单片机)第五章-A/D和D/A工作原理-A/D
  • (八)c52学习之旅-中断实验
  • (二十三)Flask之高频面试点
  • (分享)一个图片添加水印的小demo的页面,可自定义样式
  • (附源码)基于SSM多源异构数据关联技术构建智能校园-计算机毕设 64366
  • (蓝桥杯每日一题)love
  • (六) ES6 新特性 —— 迭代器(iterator)
  • (六)vue-router+UI组件库
  • (论文阅读26/100)Weakly-supervised learning with convolutional neural networks
  • (四)React组件、useState、组件样式
  • (四)图像的%2线性拉伸
  • (转)关于pipe()的详细解析
  • ***linux下安装xampp,XAMPP目录结构(阿里云安装xampp)
  • *算法训练(leetcode)第四十天 | 647. 回文子串、516. 最长回文子序列
  • .bat批处理(四):路径相关%cd%和%~dp0的区别
  • .Net CoreRabbitMQ消息存储可靠机制
  • .Net Web窗口页属性