当前位置: 首页 > news >正文

【Python大语言模型系列】Windows环境下部署Chatglm2-6B-int4大语言模型(完整教程)

这是我的第319篇原创文章。

一、引言

电脑配置 :

  • python版本要求:3.8
  • torch版本:2.0.1
  • cuda:11.7
  • windows系统:Windows 10 
  • 显卡:6G以上GPU

二、实现过程

2.1 下载chatglm2-6b的项目源码

上chatglm2-6B的官方github下载源码(https://github.com/THUDM/ChatGLM2-6B)直接右键下载打包的源码即可,解压到本地目录。

图片

这里我把项目zip直接下载到E:\盘,解压后项目根目录为E:\ChatGLM2-6B-main:

图片

2.2 创建虚拟环境,安装项目依赖

用Pycharm打开这个文件夹,进入终端:

图片

(1)创建conda的虚拟环境,指定Python的版本:

conda create -n chatglm2-6b python=3.8

(2)激活环境:

conda activate chatglm2-6b

(3)下载torch的gpu版本以及依赖包:

pip install -r requirements.txt

2.3 下载chatglm2-6b-int4的模型文件

从(https://huggingface.co/THUDM/chatglm2-6b-int4/tree/main)下载里面的模型文件下来,放到上面项目的model-int4目录(新建)里。

图片

结果:

图片

2.4 修改项目脚本文件进行配置,使用模型

修改web_demo.py:

图片

运行结果:

图片

作者简介:

读研期间发表6篇SCI数据挖掘相关论文,现在某研究院从事数据算法相关科研工作,结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能系列基础知识与应用案例。致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。需要数据集和源码的小伙伴可以关注底部公众号添加作者微信。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 通用机器人里程碑!MIT提出策略组合框架PoCo,解决数据源异构难题,实现机器人多任务灵活执行
  • C# + halcon 联合编程示例
  • 图书馆数据仓库
  • 浅谈重要组件JSR223介绍
  • 打造高效的高性能计算大模型训练平台
  • vue2实现复制,粘贴功能,使用vue-clipboard2插件
  • 算术运算符用途解析及应用案例
  • AggregatingMergeTree 物化视图下使用
  • Linux服务器CPU占用率达到100%排查思路
  • 蓝牙人员定位精准吗?是否会对人体有伤害?
  • Drools开源业务规则引擎(六)- Drools Flow中RuleFlow文件即*.rf文件介绍
  • 手机回收站视频过期怎么恢复?跟随这2个方法解锁新技能
  • 60秒带你了解冒泡排序
  • LinK3D: Linear Keypoints Representation for 3D LiDAR Point Cloud【翻译与解读】
  • 探索Kotlin:从K1到K2
  • 【5+】跨webview多页面 触发事件(二)
  • CentOS从零开始部署Nodejs项目
  • Java 23种设计模式 之单例模式 7种实现方式
  • Java,console输出实时的转向GUI textbox
  • Java读取Properties文件的六种方法
  • Leetcode 27 Remove Element
  • mysql外键的使用
  • Odoo domain写法及运用
  • quasar-framework cnodejs社区
  • vue-router的history模式发布配置
  • Web设计流程优化:网页效果图设计新思路
  • 闭包,sync使用细节
  • 多线程事务回滚
  • 飞驰在Mesos的涡轮引擎上
  • 基于Android乐音识别(2)
  • 简单数学运算程序(不定期更新)
  • 如何编写一个可升级的智能合约
  • 如何胜任知名企业的商业数据分析师?
  • 使用阿里云发布分布式网站,开发时候应该注意什么?
  • 微信开放平台全网发布【失败】的几点排查方法
  • 一个JAVA程序员成长之路分享
  • 与 ConTeXt MkIV 官方文档的接驳
  • 追踪解析 FutureTask 源码
  • 深度学习之轻量级神经网络在TWS蓝牙音频处理器上的部署
  • No resource identifier found for attribute,RxJava之zip操作符
  • 仓管云——企业云erp功能有哪些?
  • ​linux启动进程的方式
  • ​低代码平台的核心价值与优势
  • # MySQL server 层和存储引擎层是怎么交互数据的?
  • #、%和$符号在OGNL表达式中经常出现
  • #1014 : Trie树
  • (C++二叉树05) 合并二叉树 二叉搜索树中的搜索 验证二叉搜索树
  • (C语言)输入自定义个数的整数,打印出最大值和最小值
  • (附源码)python房屋租赁管理系统 毕业设计 745613
  • (附源码)ssm高校志愿者服务系统 毕业设计 011648
  • (理论篇)httpmoudle和httphandler一览
  • (四)js前端开发中设计模式之工厂方法模式
  • (未解决)macOS matplotlib 中文是方框
  • .Net - 类的介绍
  • .NET Core 项目指定SDK版本