当前位置：首页 > news >正文

【大模型系列篇】本地问答系统-部署Ollama、Open WebUI

news 来源：原创 2024/9/23 5:22:28

部署本地大模型，结合Ollama、Open WebUI以及本地RAG（Retrieval-Augmented Generation）可以为用户提供一个强大的本地知识库和交互式对话系统。以下是详细的部署步骤和功能介绍：

一、部署Ollama

访问Ollama官网：首先，你需要访问Ollama的官方网站（https://ollama.com），在这里你可以找到适合你操作系统的安装包。
下载并安装：下载对应的安装包后，直接进行安装。Ollama的安装过程非常简单，没有复杂的配置选项。
拉取大模型：在Ollama官网的Models页面，你可以找到多种可下载的模型。例如，Meta的Llama27b版本只需要大约8GB的内存即可运行。如果你的硬件条件允许，可以选择更大的模型，如13b或70b版本，分别需要16GB和64GB的内存。
运行模型：通过在终端中运行ollama run qwen2:7b等命令，你可以自动下载并运行相应的模型。

为了屏蔽系统处理器架构，可以选择docker进行安装部署

docker pull ollama/ollama
docker run -d --restart=always -v /home/docker/ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

这将在后台运行一个名为 “ollama” 的容器，并将 /home/docker/ollama 目录挂载到容器内的 /root/.ollama 目录，同时将容器内的端口 11434 映射到宿主机的端口 11434。

二、部署Open WebUI

安装Docker Desktop：由于Open WebUI是基于Windows部署的，你需要先安装Docker Desktop。可以从Docker官网下载并安装Docker Desktop。
运行Open WebUI：安装Docker Desktop后，通过运行如下命令来安装WebUI：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

访问WebUI：安装完成后，通过在浏览器地址栏输入http://localhost:3000来访问Open WebUI。首次登录需要注册账号，并选择模型（如llama2、qwen2）以开始对话。

三、集成本地RAG

启用RAG功能：Open WebUI自带RAG功能，你可以在对话框中输入“#”，然后跟上网址，即可访问网页的实时信息，并进行内容生成。
上传文档：Open WebUI还支持上传文档，基于文本进行更深层次的知识交互。通过本地知识库功能，可以通过#号选择对应的文档进行总结分析。

四、功能和优势

丰富的模型支持：Ollama支持多种大模型，包括但不限于llama2、qwen1.5、mixtral、Gemma等。
易用性：通过Open WebUI，用户可以在一个类似ChatGPT的界面中与大模型进行交互，提供了更友好的用户体验。
本地化：部署在本地的系统可以确保数据的隐私和安全性，同时减少对互联网连接的依赖。
扩展性：Ollama和Open WebUI都支持自定义和扩展，用户可以根据自己的需求进行相应的调整和优化。

通过上述步骤，你可以成功部署一个本地的大模型系统，享受强大的计算能力和便捷的交互体验。

参考文献

[1] https://ollama.com/library

[2] https://sspai.com/post/85193

[3] https://zhuanlan.zhihu.com/p/690501095

[4] https://zhuanlan.zhihu.com/p/684800288

[5] https://blog.csdn.net/spiderwower/article/details/138463635

[6] https://blog.csdn.net/2401_83946509/article/details/138476796

相关文章：

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

【MATLAB源码】机器视觉与图像识别技术(7)续---BP神经网络

vite打包文件配置到IIS出现页面、图片加载不出来的问题

JavaScript Reference Type解读

git安装和使用（托管服务分支克隆）超细教程

AR 眼镜之-充电动画定制-实现方案

安全编程的代码示例

libevent入门篇

MySQL中，除了使用LIKE进行模糊搜索外，还有其他几种方法可以执行搜索操作

【CTFHub】文件上传漏洞详解！

java项目中添加SDK项目作为依赖使用（无需上传Maven）

C++基础知识：构造函数的分类和调用,有参构造和无参构造,有参构造和无参构造,三种调用方式：括号法，显示法，隐式转换法，以及相关代码演示和注意事项

文件上传题目练习

书生大模型实战营--L1关卡-Llamaindex RAG实践

正则采集器之三——前端搭建

C#插件调用存储过程（输出参数类型）

@jsonView过滤属性

[数据结构]链表的实现在PHP中

2017-08-04 前端日报

JavaScript-Array类型

Markdown 语法简单说明

Object.assign方法不能实现深复制

PHP 程序员也能做的 Java 开发 30分钟使用 netty 轻松打造一个高性能 websocket 服务...

php中curl和soap方式请求服务超时问题

vue-router 实现分析

Webpack 4 学习01（基础配置）

道格拉斯-普克抽稀算法附javascript实现

构造函数（constructor）与原型链（prototype）关系

精彩代码 vue.js

蓝海存储开关机注意事项总结

聊聊redis的数据结构的应用

每个JavaScript开发人员应阅读的书【1】 - JavaScript: The Good Parts

前端代码风格自动化系列（二）之Commitlint

如何胜任知名企业的商业数据分析师？

【云吞铺子】性能抖动剖析（二）

国内开源镜像站点

#includecmath

（11）工业界推荐系统-小红书推荐场景及内部实践【粗排三塔模型】

(C#)Windows Shell 外壳编程系列9 - QueryInfo 扩展提示

（备份） esp32 GPIO

（附源码）ssm高校志愿者服务系统毕业设计 011648

（附源码）ssm基于jsp的在线点餐系统毕业设计 111016

(黑客游戏)HackTheGame1.21 过关攻略

（力扣题库）跳跃游戏II(c++)

（一）C语言之入门：使用Visual Studio Community 2022运行hello world

(一)kafka实战——kafka源码编译启动

(原创)攻击方式学习之(4) - 拒绝服务(DOS/DDOS/DRDOS)

(转) Face-Resources

（转）ObjectiveC 深浅拷贝学习

(转)setTimeout 和 setInterval 的区别

(转贴)用VML开发工作流设计器 UCML.NET工作流管理系统

* 论文笔记【Wide Deep Learning for Recommender Systems】

.NET 8 跨平台高性能边缘采集网关

.NET C# 使用 SetWindowsHookEx 监听鼠标或键盘消息以及此方法的坑

.net CHARTING图表控件下载地址

.NET MVC 验证码