当前位置: 首页 > news >正文

langchain==win11搭建使用GPU

annaconda安装Python 3.11.7

下载代码:

GitHub - chatchat-space/Langchain-Chatchat: Langchain-Chatchat(原Langchain-ChatGLM)基于 Langchain 与 ChatGLM 等语言模型的本地知识库问答 | Langchain-Chatchat (formerly langchain-ChatGLM), local knowledge based LLM (like ChatGLM) QA app with langchain

然后查看项目的requirements.txt和requirements_api.txt,发现里面用的是

torch==2.1.2
torchvision==0.16.2
torchaudio==2.1.2

因为是基于GPU,所以修改为

torch==2.1.2+cu121
torchvision==0.16.2+cu121
torchaudio==2.1.2+cu121

下载模型库:

真的慢,所有文件全部下载下来

 Embedding 模型:

 LLM 模型:

我这下载后的存放位置为:

D:\\model\\bge-large-zh

D:\\model\\chatglm2-6b

安装cuda:

官网下载,然后安装即可

CUDA Toolkit Archive | NVIDIA Developer

我这安装的是12.1

安装torch:

pip3 install torch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 --index-url https://download.pytorch.org/whl/cu121

最后的cu121代码这cuda是12.1

修改代码:

修改代码中的configs目录下的所有文件,去掉后缀的example

然后修改model_config.py

EMBEDDING_DEVICE = "cuda"

LLM_DEVICE = "cuda"

TEMPERATURE = 0.1

EMBEDDING_MODEL = "bge-large-zh"
LLM_MODELS = ["chatglm2-6b"]

 "bge-large-zh": "D:\\model\\bge-large-zh",

 "chatglm2-6b": "D:\\model\\chatglm2-6b",

启动:

修改依赖文件中关于torch,torchvision,torchaudio的版本号
为安装torch的时候的版本号# 安装全部依赖pip install -r requirements.txt pip install -r requirements_api.txtpip install -r requirements_webui.txt  
python startup.py -a

可以从日志中看到分别使用了什么模型

UI界面

可以发现问问题的时候GPU直接拉满了

 BUG:

知识库用不起,创建失败,上传文件也失败,才不到一年的项目BUG多也正常

相关文章:

  • JVM-垃圾回收(标记算法,收集器)
  • 机试复习-4
  • Electron实战之进程间通信
  • SSM框架,Spring-ioc的学习(下)
  • 力扣热题100_双指针_15_三数之和
  • React18原理: React核心对象之ReactElement对象和Fiber对象
  • Paper - CombFold: predicting structures of large protein assemblies 论文简读
  • 函数 栈帧
  • Python 修改window桌面背景图片
  • 算法训练营day28(补), 贪心算法2
  • node.js后端+小程序前端+mongoDB(增删改查)
  • 【机器学习基础】决策树(Decision Tree)
  • Qt网络编程-TCP与UDP
  • 寒假学习记录15:Node(网络)
  • 代码随想录day27 Java版
  • ----------
  • 【407天】跃迁之路——程序员高效学习方法论探索系列(实验阶段164-2018.03.19)...
  • CSS 三角实现
  • C语言笔记(第一章:C语言编程)
  • JavaScript对象详解
  • PHP的Ev教程三(Periodic watcher)
  • ucore操作系统实验笔记 - 重新理解中断
  • Vue--数据传输
  • Vue小说阅读器(仿追书神器)
  • Vue源码解析(二)Vue的双向绑定讲解及实现
  • 百度小程序遇到的问题
  • 对象管理器(defineProperty)学习笔记
  • 基于Javascript, Springboot的管理系统报表查询页面代码设计
  • 一份游戏开发学习路线
  • 在Docker Swarm上部署Apache Storm:第1部分
  • mysql 慢查询分析工具:pt-query-digest 在mac 上的安装使用 ...
  • Prometheus VS InfluxDB
  • 机器人开始自主学习,是人类福祉,还是定时炸弹? ...
  • 说说我为什么看好Spring Cloud Alibaba
  • # 安徽锐锋科技IDMS系统简介
  • (2)STL算法之元素计数
  • (Java)【深基9.例1】选举学生会
  • (Matalb时序预测)WOA-BP鲸鱼算法优化BP神经网络的多维时序回归预测
  • (poj1.3.2)1791(构造法模拟)
  • (安全基本功)磁盘MBR,分区表,活动分区,引导扇区。。。详解与区别
  • *setTimeout实现text输入在用户停顿时才调用事件!*
  • .mkp勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET Core中Emit的使用
  • .NET连接MongoDB数据库实例教程
  • .net中调用windows performance记录性能信息
  • @Autowired标签与 @Resource标签 的区别
  • @Mapper作用
  • @Transaction注解失效的几种场景(附有示例代码)
  • [ CTF ]【天格】战队WriteUp- 2022年第三届“网鼎杯”网络安全大赛(青龙组)
  • [3D游戏开发实践] Cocos Cyberpunk 源码解读-高中低端机性能适配策略
  • [④ADRV902x]: Digital Filter Configuration(发射端)
  • [CISCN2019 华东北赛区]Web2
  • [GN] Vue3.2 快速上手 ---- 核心语法2
  • [HNOI2010]BUS 公交线路
  • [ISCTF 2023]——Web、Misc较全详细Writeup、Re、Crypto部分Writeup