当前位置：首页 > news >正文

[大模型]配置文件-Langchain-Chatchat-V0.3 (1)

news 来源：原创 2024/9/20 21:26:33

文章目录

- 简述
- 本地配置
- 配置文件
- model_settings.yaml
- - 使用Ollama配置
  - - 模型配置
  - 使用Xinference配置
  - - 模型配置
    - 修改默认使用的模型
- 对话
- - 基础对话
  - 知识库对话

简述

针对Langchain-Chatchat-V0.3版本，对配置文件与模型使用说明，本文建议使用Ollama配合Chatchat使用。

Ollama安装方式查看以往教程。
[大模型]ollama本地部署自然语言大模型_ollama模型下载后存放位置-CSDN博客

本地配置

nvidia-smi

配置文件

model_settings.yaml

默认使用的模型

# 默认选用的 LLM 名称
DEFAULT_LLM_MODEL: llama3.1# 默认选用的 Embedding 名称
DEFAULT_EMBEDDING_MODEL: mxbai-enbed-large

在支持Agent模型中添加你想要的新模型

# 支持的Agent模型
SUPPORT_AGENT_MODELS:- llama3.1- chatglm3

使用ollama的LLM模型于Embedding模型

使用Ollama配置

模型配置

修改llm_models与embed_models配置，为自己想要使用的模型。

  - platform_name: ollamaplatform_type: ollamaapi_base_url: http://127.0.0.1:11434/v1api_key: EMPTYapi_proxy: ''api_concurrencies: 5auto_detect_model: falsellm_models:- llama3embed_models:- mxbai-embed-large

找到Ollama双击启动

任务栏如下提示表示启动成功。使用模型时，Ollama会自动运行该模型，无需单独启动模型。

使用Xinference配置

启动模型

为chatchat安装客户端模块

pip install xinference-client

模型配置

修改llm_models与embed_models配置，为自己想要的

  - platform_name: xinferenceplatform_type: xinferenceapi_base_url: http://127.0.0.1:9997/v1api_key: EMPTYapi_proxy: ''api_concurrencies: 5auto_detect_model: truellm_models:- chatglm3embed_models:- bge-large-zh-v1.5text2image_models: []image2text_models: []rerank_models: []speech2text_models: []text2speech_models: []

修改默认使用的模型

# 默认选用的 LLM 名称
DEFAULT_LLM_MODEL: chatglm3# 默认选用的 Embedding 名称
DEFAULT_EMBEDDING_MODEL: bge-large-zh-v1.5

对话

基础对话

配置好LLM模型，即可使用基础的对话。

知识库对话

创建知识库

选择文件，并点击添加文件到知识库

之后就可看到，知识库中已经拥有了这一段记忆。

最后，我们询问可以访问知识库的模型，可以得到如下结果

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

单个像素的威胁：微小的变化如何欺骗深度学习系统

哈工深、NUS等联合提出全新信息抽取基准任务：细粒度定位的统一多模态信息抽取...

leetcode349:两个数组的交集

原生js用Export2Excel导出excel单级表头和多级表头数据方式实现

Python：什么是WSGI

软件定义网络（SDN）：网络架构的未来

HTML+CSS+JavaScript制作动态七夕表白网页(含音乐+自定义文字)

如何应对突发技术故障和危机：开发团队的应急策略

【C语言小项目】五子棋游戏

Linux离线安装fontconfig

基于Python的机器学习系列（11）：K-Nearest Neighbors

Spark2.x 入门：DStream 输出操作

鹏哥C语言自定义笔记重点(29-)

Oracle问题笔记

跟李沐学AI：语义分割

【Leetcode】101. 对称二叉树

python3.6+scrapy+mysql 爬虫实战

《网管员必读——网络组建》（第2版）电子课件下载

【React系列】如何构建React应用程序

【跃迁之路】【519天】程序员高效学习方法论探索系列（实验阶段276-2018.07.09）...

CSS 提示工具(Tooltip)

CSS实用技巧

docker容器内的网络抓包

github指令

javascript 哈希表

javascript 总结（常用工具类的封装）

Javascript设计模式学习之Observer(观察者)模式

JavaScript设计模式之工厂模式

JDK 6和JDK 7中的substring（）方法

js如何打印object对象

Laravel Mix运行时关于es2015报错解决方案

Linux学习笔记6-使用fdisk进行磁盘管理

mysql 5.6 原生Online DDL解析

Netty源码解析1-Buffer

Spring Boot快速入门（一）：Hello Spring Boot

spring学习第二天

开源SQL-on-Hadoop系统一览

区块链技术特点之去中心化特性

如何优雅的使用vue+Dcloud（Hbuild）开发混合app

什么软件可以提取视频中的音频制作成手机铃声

通过几道题目学习二叉搜索树

项目实战-Api的解决方案

在electron中实现跨域请求，无需更改服务器端设置

Benvista PhotoZoom Pro 9.0.4新功能介绍

埃文科技受邀出席2024 “数据要素×”生态大会

# windows 运行框输入mrt提示错误：Windows 找不到文件‘mrt‘。请确定文件名是否正确后，再试一次

#pragma multi_compile #pragma shader_feature

（20）目标检测算法之YOLOv5计算预选框、详解anchor计算

（4）(4.6) Triducer

(el-Date-Picker)操作(不使用 ts)：Element-plus 中 DatePicker 组件的使用及输出想要日期格式需求的解决过程

（Redis使用系列） Springboot 使用Redis+Session实现Session共享，简单的单点登录五

（定时器/计数器）中断系统（详解与使用）

（附源码）ssm考生评分系统毕业设计 071114

（四）鸿鹄云架构一服务注册中心

（已解决）vue+element-ui实现个人中心，仿照原神

文章目录

简述

本地配置

配置文件

model_settings.yaml

使用Ollama配置

模型配置

使用Xinference配置

模型配置

修改默认使用的模型

对话

基础对话

知识库对话

相关文章：