当前位置：首页 > news >正文

ChatGLM3-6B部署

news 来源：原创 2024/7/2 23:20:14

ZhipuAI/chatglm3-6b 模型文件地址 chatglm3-6B-32k-int4 量化的模型地址

ChatGLM3 代码仓库

ChatGLM3 技术文档

cpolar http xxx

端口

/anaconda3/envs/chatglm2/lib/python3.8/site-packages/gradio$

networking.py

硬件环境

最低要求：

为了能够流畅运行 Int4 版本的 ChatGLM3-6B，最低的配置要求：

内存：>= 8GB

显存: >= 5GB（1060 6GB,2060 6GB）

为了能够流畅运行 FP16 版本的，ChatGLM3-6B，最低的配置要求：

内存：>= 16GB

显存: >= 13GB（4080 16GB）

Mac开发者无需关注GPU的限制。对于搭载了 Apple Silicon 或者 AMD GPU 的 Mac，可以使用 MPS 后端来在 GPU 上运行 ChatGLM3-6B。需要参考 Apple 的官方说明安装 PyTorch-Nightly（正确的版本号应该是2.x.x.dev2023xxxx，而不是 2.x.x）。

如果使用CPU加载，可以忽略显存的要求，但是速度非常慢

软件环境

Python环境

请开发者按照仓库中的requirements.txt来安装对应的依赖，并需要注意:

python 版本推荐3.10 - 3.11

transformers 库版本推荐为 4.36.2

torch 推荐使用 2.0 及以上的版本，以获得最佳的推理性能

2、配置环境
建议最好自己新建一个conda环境

conda create -n chatglm3 python==3.10

conda activate chatglm3

conda activate chatglm31

pip install -r requirements.txt -i https://pypi.mirrors.ustc.edu.cn/simple

pip install gradio==3.40.0 -i https://pypi.mirrors.ustc.edu.cn/simple

+++++++++++++++++++

修改requirements.txt

# basic requirementstransformers>=4.41.0
cpm_kernels>=1.0.11
torch>=2.3.0
#vllm>=0.4.2
gradio==3.40.0
sentencepiece>=0.2.0
sentence_transformers>=2.7.0
accelerate>=0.29.2
streamlit>=1.33.0
fastapi>=0.110.0
loguru~=0.7.2
mdtex2html>=1.3.0
latex2mathml>=3.77.0
jupyter_client>=8.6.1# for openai demo
openai>=1.30.1
pydantic
sse-starlette>=2.1.0
uvicorn>=0.29.0
timm>=0.9.16
tiktoken>=0.6.0# for langchain demolangchain>=0.2.0
langchain_community>=0.2.0
langchainhub>=0.1.15
arxiv>=2.1.0

pip install vllm==0.2.0 -i https://pypi.mirrors.ustc.edu.cn/simple

pip install peft

二、本地加载chatglm3-6B-32k-int4模型

打开pycharm运行

web_demo.py

或

python basic_demo/web_demo_gradio.py

python web_demo.py

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

源码安装

克隆代码和模型

模型基础运行代码已经上传到 github 和 SwanHub 两个平台，两个平台的信息同步。开发者通过以下方式下载模型代码。

从 github 下载源码

git clone https://github.com/THUDM/ChatGLM3.git

从 SwanHub 下载源码

git clone https://swanhub.co/ZhipuAI/ChatGLM3.git

通过以下方式下载模型文件

下载模型文件前请先确保`git lfs`命令已安装，安装教程请参考这里。
模型文件已上传至 Huggingface, Modelsope , SwanHub 三个平台，用户可以快速安装模型。
若使用 Huggingface 下载模型

git lfs install
git clone https://huggingface.co/THUDM/chatglm3-6b.git

若使用 Modelscope 下载模型

git lfs install
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

若使用 SwanHub 下载模型

git lfs install
git clone https://swanhub.co/ZhipuAI/chatglm3-6b.git

安装依赖

使用 pip 安装依赖：

cd ChatGLM3 
pip install -r requirements.txt

运行demo

使用本地模型加载并使用命令行来问答

python basic_demo/cli_demo.py

使用本地模型加载并使用web_demo来问答

python basic_demo/web_demo_gradio.py

通过以下命令启动基于 Gradio 的网页版 demo

python basic_demo/web_demo_streamlit.py

Python代码关系图生成，帮助快速熟悉一个项目

Vue.js的核心概念：如何理解Vue.js的声明式渲染、组件系统、Vue实例、Vue生命周期等核心概念。

机器学习实战项目一（卡通化图像）

Linux命令篇（一）：文件管理部分

阿里云短信服务使用(Java)

C# 语言类型(二)—预定义类型之字符串及字符类型简述

深入理解Java中的List集合：解析实例、优化技巧与最佳实践

HackTheBox-Machines--Lazy

数据结构——图

Lua的几个特殊用法

PHP面向对象编程总结

Flutter 中的 SliverCrossAxisGroup 小部件：全面指南

C++ 变量的声明和初始化方式

＜Rust＞＜iced＞基于rust使用iced库构建GUI实例：动态改变主题色

使用Spring的@Scheduled注解实现定时任务

[PHP内核探索]PHP中的哈希表

Google 是如何开发 Web 框架的

78. Subsets

android高仿小视频、应用锁、3种存储库、QQ小红点动画、仿支付宝图表等源码...

dva中组件的懒加载

javascript面向对象之创建对象

Java精华积累：初学者都应该搞懂的问题

mysql innodb 索引使用指南

webpack入门学习手记（二）

第十八天-企业应用架构模式-基本模式

番外篇1：在Windows环境下安装JDK

给新手的新浪微博 SDK 集成教程【一】

基于 Babel 的 npm 包最小化设置

------- 计算机网络基础

蓝海存储开关机注意事项总结

理清楚Vue的结构

两列自适应布局方案整理

聊聊hikari连接池的leakDetectionThreshold

前端攻城师

前端临床手札——文件上传

前端相关框架总和

深入浅出webpack学习(1)--核心概念

数据科学第 3 章 11 字符串处理

数据库写操作弃用“SELECT ... FOR UPDATE”解决方案

用 Swift 编写面向协议的视图

1.Ext JS 建立web开发工程

3月27日云栖精选夜读 | 从 “城市大脑”实践，瞭望未来城市源起 ...

无限可能性的探索：Amazon Lightsail轻量应用服务器引领数字化时代创新发展

！！java web学习笔记(一到五)

# 再次尝试连接失败_无线WiFi无法连接到网络怎么办【解决方法】

#laravel 通过手动安装依赖PHPExcel#

#QT（TCP网络编程-服务端）

#微信小程序：微信小程序常见的配置传旨

$L^p$ 调和函数恒为零

（2024，LoRA，全量微调，低秩，强正则化，缓解遗忘，多样性）LoRA 学习更少，遗忘更少

（动态规划）5. 最长回文子串 java解决

（附源码）springboot美食分享系统毕业设计 612231

（十五）Flask覆写wsgi_app函数实现自定义中间件

（四） Graphivz 颜色选择

(太强大了) - Linux 性能监控、测试、优化工具