当前位置: 首页 > news >正文

大模型本地化部署2-Docker部署MaxKB

大模型本地化部署2-Docker部署MaxKB

    • 0、MaxKB简介
    • 1、安装docker
    • 2、在docker中拉取MaxKB镜像
    • 3、运行镜像
    • 4、访问MaxKB
    • 5、创建应用
    • 6、使用应用进行对话

0、MaxKB简介

MaxKB是一款基于LLM大预言模型的知识库问答系统。具有以下特点:

  • 多模型支持:支持对接主流的大模型,包括本地私有大模型(如Llama 2)、Azure OpenAI、百度千帆、阿里通义千问大模型等;
  • 开箱即用:支持直接上传文档、自动爬取在线文档,支持文本自动拆分、向量化、智能问答交互体验好;
  • 无缝嵌入:支持零编码快速嵌入到第三方业务系统。

1、安装docker

docker的安装不在此讲解,假设您已经安装好了docker环境。我本地电脑是Windows11,采用的WLS的方式,就是在应用商店中安装了Ubuntu20.4,在Ubuntu20.4中安装的docker环境,使用时先启动docker服务,如下图:
在这里插入图片描述

2、在docker中拉取MaxKB镜像

首先通过以下命令搜索都有那些maxkb镜像:

docker search maxkb

执行如下下图:
在这里插入图片描述
然后通过以下命令拉取maxkb镜像

docker pull 1panel/maxkb

如果提示网络未响应,可以改为以下命令尝试最新镜像

docker pull cr2.fit2cloud.com/1panel/maxkb

执行如下图:
在这里插入图片描述

3、运行镜像

拉取镜像完毕后,运行一个容器实例,如下:

docker run -d --name=maxkb -p 8080:8080 -v ~/.maxkb:/var/lib/postgresql/data 1panel/maxkb

执行结果如下图:
在这里插入图片描述

4、访问MaxKB

启动maxkb容器实例后,就可以在本机打开浏览器,在地址栏输入以下地址进行访问:
http://localhost:8080
运行效果如下图:
在这里插入图片描述

默认登录信息
用户名:admin
默认密码:MaxKB@123…

进入系统后会提示修改默认密码,如下图所示:
在这里插入图片描述
然后输入自己的新密码保存。

5、创建应用

点击下图中的创建应用
在这里插入图片描述
根据提示填写相关信息
在这里插入图片描述
其中AI模型选择,添加模型,在弹出选择供应商界面中选择Ollama,如下图:
在这里插入图片描述
在添加Ollama模型时填写相应信息,如下图所示:
在这里插入图片描述

其中“基础模型”,如果下拉列表中没有你要用的模型,可以直接输入,只要名字对就行,如果ollama还没有安装这个模型,就会自动下载。
其中“API域名”,要填写ollama服务器的IP地址:11434
注意需要关闭windows下的专用网络防火墙,就是能在wsl2中能ping通ollama服务器的ip地址,或者能telnet登录上ollama服务器IP地址 11434。否则会提示API域名无效。

填写应用信息完毕后如下图:
在这里插入图片描述
然后点击“创建”按钮,就可以在应用列表中看到这个应用,如下图:
在这里插入图片描述

6、使用应用进行对话

点击应用下面的演示按钮,就可以打开对话界面了,如下图:
在这里插入图片描述
点击演示后,出现新页面,如下图:
在这里插入图片描述
这样就可以进行知识问答了,如下图:
在这里插入图片描述
在问答的过程中,可以看到GPU的使用情况。
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Unity(2022.3.41LTS) - 网格,纹理,材质
  • Clickhouse集群化(三)集群化部署
  • 云计算day32
  • Windows系统安装MySQL
  • 2024 Ollama 一站式解决在Windows系统安装、使用、定制服务与实战案例
  • 线性代数:如何由AB=E 推出 BA=AB?
  • 【有来开源组织】开发规范手册
  • 【开端】 进行页面升级或维护时不影响用户体验NGINX配置
  • 影像设备国产替代究竟有多重要?这家企业提前布局8K时代
  • object.defineProperty用法
  • 开放式耳机的优缺点有什么?本文为你讲解推荐一下!
  • encodeURI 确保特殊字符能够正确传输
  • 告别手动记录,音频转文字软件助力会议记录新高度
  • 【Android 设备上的所有相关 WiFi 命令和使用方法】
  • 【架构设计】安全架构设计
  • 【跃迁之路】【585天】程序员高效学习方法论探索系列(实验阶段342-2018.09.13)...
  • miaov-React 最佳入门
  • QQ浏览器x5内核的兼容性问题
  • Spring核心 Bean的高级装配
  • Vue.js源码(2):初探List Rendering
  • webgl (原生)基础入门指南【一】
  • 表单中readonly的input等标签,禁止光标进入(focus)的几种方式
  • 从地狱到天堂,Node 回调向 async/await 转变
  • 分布式事物理论与实践
  • 解决iview多表头动态更改列元素发生的错误
  • 聊聊redis的数据结构的应用
  • 强力优化Rancher k8s中国区的使用体验
  • 使用API自动生成工具优化前端工作流
  • 线上 python http server profile 实践
  • 新书推荐|Windows黑客编程技术详解
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • 一、python与pycharm的安装
  • 字符串匹配基础上
  • Linux权限管理(week1_day5)--技术流ken
  • mysql 慢查询分析工具:pt-query-digest 在mac 上的安装使用 ...
  • ​​​【收录 Hello 算法】9.4 小结
  • ​软考-高级-系统架构设计师教程(清华第2版)【第1章-绪论-思维导图】​
  • #laravel 通过手动安装依赖PHPExcel#
  • #nginx配置案例
  • (13)[Xamarin.Android] 不同分辨率下的图片使用概论
  • (3)Dubbo启动时qos-server can not bind localhost22222错误解决
  • (Repost) Getting Genode with TrustZone on the i.MX
  • (待修改)PyG安装步骤
  • (二)测试工具
  • (附源码)springboot电竞专题网站 毕业设计 641314
  • (每日一问)基础知识:堆与栈的区别
  • (轉貼) 蒼井そら挑戰筋肉擂台 (Misc)
  • .halo勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .net core 使用js,.net core 使用javascript,在.net core项目中怎么使用javascript
  • .NET 编写一个可以异步等待循环中任何一个部分的 Awaiter
  • .NET 反射 Reflect
  • .Net 转战 Android 4.4 日常笔记(4)--按钮事件和国际化
  • .NET开发人员必知的八个网站
  • .net连接MySQL的方法
  • .NET设计模式(8):适配器模式(Adapter Pattern)