当前位置: 首页 > news >正文

本地GPT-window平台 搭建ChatGLM3-6B

一 ChatGLM-6B 介绍

         ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,新一代开源模型 ChatGLM3-6B 已发布,拥有10B以下最强的基础模型,支持工具调用(Function Call)、代码执行(Code Interpreter)、Agent 任务等功能,结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。

二 在 window平台 搭建ChatGLM3-6B

1 在github下拉该项目代码:

 1  下拉项目源代码:

 https://github.com/THUDM/ChatGLM-6B

git clone https://github.com/THUDM/ChatGLM-6B
cd ChatGLM-6B

  2 下载项目数据模型

 国内可下载地址:魔搭社区

下载的模型数据保存位置:

如果保存在别的地方需要指定配置模型路径的系统变量,也可以直接修改以下代码,如下图:

2 环境安装

使用 pip 安装依赖:pip install -r requirements.txt

pip install -r requirements.txt

注意:项目没有有明确说支持什么平台,当安装依赖时会报错,因为有一个vllm是不支持windows平台的,所以安装依赖时要注释掉一个依赖 vllm,其作用是加速推理项目可以不用,该框架的官方网站明确只支持linux,如下图:

检查pytorch环境

import torchif __name__ == '__main__':# 检测cuda环境print(torch.__version__)print(torch.cuda.is_available())print(torch.version.cuda)

pytorch正常,cuda可用如下图: 

如果这一步有问题,请查看之前的文章:https://blog.csdn.net/qyhua/article/details/136248165

3 启动项目 

 启动演示项目:

cd basic_demo
python web_demo_gradio.py

启动过程中,大概要有4G左右的空闲内存,如果内存不够启动失败,且没有任何提示,如下图: 

测试成功如下图: 

 由于我的电脑配置低,3060的显卡只有12G显存,所以这里改了一下代码。

这里测试了一下,当量化参数设置成8 时GPU内存大概使用了8G多,当设置成4时,只用了4G多,如下图:

model = AutoModel.from_pretrained(model_dir, trust_remote_code=True).quantize(8).cuda()

 量化参数设置成8时的效果图,回复比4快。 

 量化参数设置成4时 ,系统本身用了1.5G,模型大概使用了4G多。如下图:

 

相关文章:

  • Oracle最终会扼杀MySQL?(译)
  • 最新下载:CorelDraw 2023【软件附加安装教程】
  • Ecovadis审核的内容
  • CG-85C 振弦式土压力计厂家 结构物内部土压力变化量如何测量?
  • 高考志愿填报秘籍:个人篇
  • getDay 与 getUTCDay 本质区别
  • 基于 Delphi 的前后端分离:之三,使用 HTMX
  • H323 截包分析辅流问题
  • 力扣42 接雨水
  • mysql社区版有可以双机吗
  • 大城市与小城市的一些感受
  • C++中的适配器模式
  • 欢乐打地鼠小游戏html源码
  • 面试题:callable与runable的区别?
  • python中字典的创建
  • [nginx文档翻译系列] 控制nginx
  • [NodeJS] 关于Buffer
  • 【Linux系统编程】快速查找errno错误码信息
  • Bytom交易说明(账户管理模式)
  • ES6简单总结(搭配简单的讲解和小案例)
  • Js基础——数据类型之Null和Undefined
  • Laravel 中的一个后期静态绑定
  • Puppeteer:浏览器控制器
  • Webpack 4x 之路 ( 四 )
  • 飞驰在Mesos的涡轮引擎上
  • 面试遇到的一些题
  • 扫描识别控件Dynamic Web TWAIN v12.2发布,改进SSL证书
  • 使用前端开发工具包WijmoJS - 创建自定义DropDownTree控件(包含源代码)
  • 吴恩达Deep Learning课程练习题参考答案——R语言版
  • MiKTeX could not find the script engine ‘perl.exe‘ which is required to execute ‘latexmk‘.
  • Java数据解析之JSON
  • 阿里云API、SDK和CLI应用实践方案
  • # SpringBoot 如何让指定的Bean先加载
  • #设计模式#4.6 Flyweight(享元) 对象结构型模式
  • $.ajax中的eval及dataType
  • (带教程)商业版SEO关键词按天计费系统:关键词排名优化、代理服务、手机自适应及搭建教程
  • (第61天)多租户架构(CDB/PDB)
  • (第三期)书生大模型实战营——InternVL(冷笑话大师)部署微调实践
  • (附源码)spring boot车辆管理系统 毕业设计 031034
  • (附源码)spring boot建达集团公司平台 毕业设计 141538
  • (七)理解angular中的module和injector,即依赖注入
  • (一)ClickHouse 中的 `MaterializedMySQL` 数据库引擎的使用方法、设置、特性和限制。
  • (一)十分简易快速 自己训练样本 opencv级联haar分类器 车牌识别
  • .aanva
  • .NET Core 成都线下面基会拉开序幕
  • .NET Core、DNX、DNU、DNVM、MVC6学习资料
  • .net php 通信,flash与asp/php/asp.net通信的方法
  • .Net 高效开发之不可错过的实用工具
  • .NET 中让 Task 支持带超时的异步等待
  • .NET/C# 检测电脑上安装的 .NET Framework 的版本
  • .NET/C# 使用 SpanT 为字符串处理提升性能
  • .NET/MSBuild 中的发布路径在哪里呢?如何在扩展编译的时候修改发布路径中的文件呢?
  • .Net的DataSet直接与SQL2005交互
  • .NET微信公众号开发-2.0创建自定义菜单
  • .net下简单快捷的数值高低位切换