当前位置: 首页 > news >正文

[大模型]配置文件-Langchain-Chatchat-V0.3 (1)

文章目录

    • 简述
    • 本地配置
    • 配置文件
    • model_settings.yaml
      • 使用Ollama配置
        • 模型配置
      • 使用Xinference配置
        • 模型配置
        • 修改默认使用的模型
    • 对话
      • 基础对话
      • 知识库对话

简述

针对Langchain-Chatchat-V0.3版本,对配置文件与模型使用说明,本文建议使用Ollama配合Chatchat使用。

Ollama安装方式查看以往教程。
[大模型]ollama本地部署自然语言大模型_ollama模型下载后存放位置-CSDN博客

本地配置

nvidia-smi

image.png

配置文件

model_settings.yaml

默认使用的模型

# 默认选用的 LLM 名称
DEFAULT_LLM_MODEL: llama3.1# 默认选用的 Embedding 名称
DEFAULT_EMBEDDING_MODEL: mxbai-enbed-large

在支持Agent模型中添加你想要的新模型

# 支持的Agent模型
SUPPORT_AGENT_MODELS:- llama3.1- chatglm3

image.png
使用ollama的LLM模型于Embedding模型

使用Ollama配置

模型配置

修改llm_modelsembed_models配置,为自己想要使用的模型。

  - platform_name: ollamaplatform_type: ollamaapi_base_url: http://127.0.0.1:11434/v1api_key: EMPTYapi_proxy: ''api_concurrencies: 5auto_detect_model: falsellm_models:- llama3embed_models:- mxbai-embed-large

找到Ollama双击启动
image.png
任务栏如下提示表示启动成功。使用模型时,Ollama会自动运行该模型,无需单独启动模型。
image.png

使用Xinference配置

image.png
启动模型
image.png
image.png
为chatchat安装客户端模块

pip install xinference-client

image.png

模型配置

修改llm_modelsembed_models配置,为自己想要的

  - platform_name: xinferenceplatform_type: xinferenceapi_base_url: http://127.0.0.1:9997/v1api_key: EMPTYapi_proxy: ''api_concurrencies: 5auto_detect_model: truellm_models:- chatglm3embed_models:- bge-large-zh-v1.5text2image_models: []image2text_models: []rerank_models: []speech2text_models: []text2speech_models: []
修改默认使用的模型
# 默认选用的 LLM 名称
DEFAULT_LLM_MODEL: chatglm3# 默认选用的 Embedding 名称
DEFAULT_EMBEDDING_MODEL: bge-large-zh-v1.5

image.png

对话

基础对话

配置好LLM模型,即可使用基础的对话。
image.png

知识库对话

创建知识库
image.png
选择文件,并点击添加文件到知识库
image.png
之后就可看到,知识库中已经拥有了这一段记忆。
image.png
最后,我们询问可以访问知识库的模型,可以得到如下结果
image.png

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 单个像素的威胁:微小的变化如何欺骗深度学习系统
  • 哈工深、NUS等联合提出全新信息抽取基准任务:细粒度定位的统一多模态信息抽取...
  • leetcode349:两个数组的交集
  • 原生js用Export2Excel导出excel单级表头和多级表头数据方式实现
  • Python:什么是WSGI
  • 软件定义网络(SDN):网络架构的未来
  • HTML+CSS+JavaScript制作动态七夕表白网页(含音乐+自定义文字)
  • 如何应对突发技术故障和危机:开发团队的应急策略
  • 【C语言小项目】五子棋游戏
  • Linux离线安装fontconfig
  • 基于Python的机器学习系列(11):K-Nearest Neighbors
  • Spark2.x 入门:DStream 输出操作
  • 鹏哥C语言自定义笔记重点(29-)
  • Oracle问题笔记
  • 跟李沐学AI:语义分割
  • 【Leetcode】101. 对称二叉树
  • python3.6+scrapy+mysql 爬虫实战
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • 【React系列】如何构建React应用程序
  • 【跃迁之路】【519天】程序员高效学习方法论探索系列(实验阶段276-2018.07.09)...
  • CSS 提示工具(Tooltip)
  • CSS实用技巧
  • docker容器内的网络抓包
  • github指令
  • javascript 哈希表
  • javascript 总结(常用工具类的封装)
  • Javascript设计模式学习之Observer(观察者)模式
  • JavaScript设计模式之工厂模式
  • JDK 6和JDK 7中的substring()方法
  • js如何打印object对象
  • Laravel Mix运行时关于es2015报错解决方案
  • Linux学习笔记6-使用fdisk进行磁盘管理
  • mysql 5.6 原生Online DDL解析
  • Netty源码解析1-Buffer
  • Spring Boot快速入门(一):Hello Spring Boot
  • spring学习第二天
  • 开源SQL-on-Hadoop系统一览
  • 区块链技术特点之去中心化特性
  • 如何优雅的使用vue+Dcloud(Hbuild)开发混合app
  • 什么软件可以提取视频中的音频制作成手机铃声
  • 通过几道题目学习二叉搜索树
  • 项目实战-Api的解决方案
  • 在electron中实现跨域请求,无需更改服务器端设置
  • ​Benvista PhotoZoom Pro 9.0.4新功能介绍
  • ​埃文科技受邀出席2024 “数据要素×”生态大会​
  • # windows 运行框输入mrt提示错误:Windows 找不到文件‘mrt‘。请确定文件名是否正确后,再试一次
  • #pragma multi_compile #pragma shader_feature
  • (20)目标检测算法之YOLOv5计算预选框、详解anchor计算
  • (4)(4.6) Triducer
  • (el-Date-Picker)操作(不使用 ts):Element-plus 中 DatePicker 组件的使用及输出想要日期格式需求的解决过程
  • (Redis使用系列) Springboot 使用Redis+Session实现Session共享 ,简单的单点登录 五
  • (定时器/计数器)中断系统(详解与使用)
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (四)鸿鹄云架构一服务注册中心
  • (已解决)vue+element-ui实现个人中心,仿照原神