当前位置: 首页 > news >正文

如何在算家云搭建text-generation-webui(文本生成)

一、text-generation-webui 简介

text-generation-webui 是一个流行的用于文本生成的 Gradio Web UI。支持 transformers、GPTQ、AWQ、EXL2、llama.cpp (GGUF)、Llama 模型。

它的特点如下,

  • 3 种界面模式:default (two columns), notebook, chat
  • 支持多个模型后端:Transformers、llama.cpp(通过 llama-cpp-python)、ExLlama、ExLlamaV2、AutoGPTQ、AutoAWQ、GPTQ-for-LLaMa、CTransformers、QuIP#。
  • 下拉菜单可在不同模型之间快速切换。
  • 大量扩展(内置和用户贡献),包括用于真实语音输出的 Coqui TTS、用于语音输入的 Whisper STT、翻译、多模式管道、向量数据库、Stable Diffusion 集成等等。
  • 与自定义角色聊天。
  • 适用于指令跟踪模型的精确聊天模板,包括 Llama-2-chat、Alpaca、Vicuna、Mistral。
  • LoRA:使用您自己的数据训练新的 LoRA,动态加载/卸载 LoRA 以进行生成。
  • Transformers 库集成:通过 bitsandbytes 以 4 位或 8 位精度加载模型,将 llama.cpp 与 Transformers 采样器( llamacpp_HF 加载器)结合使用,使用 PyTorch 以 32 位精度进行 CPU 推理。
  • 具有 OpenAI 兼容的 Chat 和 Completions API 服务器 。

二、模型搭建流程

1. 容器镜像一键使用

镜像环境: RXT3090 nvidia/cuda/12.4.1-cudnn-runtime-ubuntu20.04

(1)进入算家云“租用实例”页面,点击“应用社区”,选择text-generation-webui

image.png

image.png

(2)选择 3090 卡或 其他性能优于 3090 的显卡,点击“立即创建”即可创建实例

image.png

2.进入创建的实例

在“项目实例”页面点击对应实例的“Web SSH”进入终端操作

b5ad37cf876cdd60c5925a98f471107.jpg

image.png

以下命令均在该页面进行:

conda activate textcd /text-generation-webui/modelsgit lfs installgit clone https://www.modelscope.cn/Xorbits/vicuna-7b-v1.3.git

启动运行模型

cd /
cd text-generation-webui python server.py --model vicuna-7b-v1.3 --listen --listen-port 8080

3.开启外部访问获取访问链接

返回“项目实例”列表,选择并点击对应实例的“开放端口”操作。

image.png

有两种访问方式可以选择:本地私密访问和对外开放端口

(1)本地私密访问:选择 ssh 工具访问,登录之后填写各选项,点击“开启代理”

image.png

(2)对外开放端口:请按照下图操作

image.png

三、网页演示

运行成功后获取访问链接,即可进入 webUI 界面使用

image.png

以上就是在算家云搭建text-generation-webui的流程,具体使用方式可进入算家云应用社区查看该模型的使用说明。

点击应用社区,进入算家云,选择模型,一键开启 AI 之旅!

首页.png

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • uniapp中<map>地图怎么实现点位聚合?
  • 【Qwen2-VL】通义多模态新作速读
  • 创建游戏暂停菜单
  • 力扣(leetcode)每日一题 LCR 187 破冰游戏(还是考的约瑟夫环)
  • UWA支持鸿蒙HarmonyOS NEXT
  • 【Spring】条件装配 @ConditionalOnClass @ConditionalOnBean
  • 【Midjourney中文版】智能绘画,高效便捷
  • python日志搜集分析系统
  • 系统架构笔记-3-信息系统基础知识
  • 关于 NLP 应用方向与深度训练的核心流程
  • 鸿蒙环境服务端签名直传文件到OSS
  • Redis安全
  • Elasticsearch7.7.1集群不能相互发现的问题解决以及Elasticsearch7.7.1安装analysis-ik中文分词插件的应用
  • 力扣19 删除链表的倒数第N个节点 Java版本
  • 【C++】模拟实现list
  • Android开源项目规范总结
  • ComponentOne 2017 V2版本正式发布
  • Create React App 使用
  • iOS筛选菜单、分段选择器、导航栏、悬浮窗、转场动画、启动视频等源码
  • Javascript编码规范
  • Rancher如何对接Ceph-RBD块存储
  • 给github项目添加CI badge
  • 老板让我十分钟上手nx-admin
  • 如何解决微信端直接跳WAP端
  • 小程序开发之路(一)
  • 一个6年java程序员的工作感悟,写给还在迷茫的你
  • CMake 入门1/5:基于阿里云 ECS搭建体验环境
  • 小白应该如何快速入门阿里云服务器,新手使用ECS的方法 ...
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • ​软考-高级-信息系统项目管理师教程 第四版【第23章-组织通用管理-思维导图】​
  • (10)STL算法之搜索(二) 二分查找
  • (11)工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】
  • (Java)【深基9.例1】选举学生会
  • (Redis使用系列) Springboot 使用redis实现接口幂等性拦截 十一
  • (附源码)计算机毕业设计ssm高校《大学语文》课程作业在线管理系统
  • (十五)、把自己的镜像推送到 DockerHub
  • (转)jdk与jre的区别
  • (转)Linux NTP配置详解 (Network Time Protocol)
  • (转载)Linux 多线程条件变量同步
  • .NET Core MongoDB数据仓储和工作单元模式封装
  • .net core开源商城系统源码,支持可视化布局小程序
  • .NET Framework 服务实现监控可观测性最佳实践
  • .NET/C# 阻止屏幕关闭,阻止系统进入睡眠状态
  • .NET大文件上传知识整理
  • .NET未来路在何方?
  • .NET中的Event与Delegates,从Publisher到Subscriber的衔接!
  • @ 代码随想录算法训练营第8周(C语言)|Day53(动态规划)
  • @hook扩展分析
  • @html.ActionLink的几种参数格式
  • @Transactional事务注解内含乾坤?
  • [ Socket学习 ] 第一章:网络基础知识
  • [ vulhub漏洞复现篇 ] Hadoop-yarn-RPC 未授权访问漏洞复现
  • [ 物联网 ]拟合模型解决传感器数据获取中数据与实际值的误差的补偿方法
  • [AIGC] MySQL存储引擎详解
  • [Algorithm][动态规划][01背包问题][目标和][最后一块石头的重量Ⅱ]详细讲解