当前位置：首页 > news >正文

【LLM】Ollama：本地大模型使用

news 来源：原创 2024/9/23 20:40:57

本指南将详细介绍如何在Linux系统上使用Ollama进行本地大模型的快速部署与管理。通过Docker容器化技术，您可以轻松部署Ollama及其WebUI，实现通过浏览器访问和管理大型语言模型。

快速部署，Web访问

安装Docker

根据操作系统下载并安装 Docker Desktop（Windows/macOS）或使用包管理工具（如 apt）安装 Docker（Linux）。

使用Ollama和Open WebUI独立部署

部署Ollama容器

首先，启动Ollama服务容器，可以使用 GPU 运行 Ollama，修改你的 Docker 命令，添加 --gpus all 参数来使用 GPU：

docker run -d --name ollama \-p 11434:11434 \-v ollama_data:/ollama/data \--restart always \ollama/ollama:latest

命令解析：

-d：后台运行容器。
--name ollama：指定容器名称为ollama。
-p 11434:11434：将主机的11434端口映射到容器的11434端口，用于API访问。
-v ollama_data:/ollama/data：挂载卷，确保数据持久化。
--restart always：设置容器自动重启策略。
ollama/ollama:latest：指定使用最新版本的Ollama镜像。

部署Open WebUI容器

接下来，启动Open WebUI服务容器，并连接到本地运行的Ollama服务。

docker run -d -p 3000:8080 \--add-host=host.docker.internal:host-gateway \-v open-webui:/app/backend/data \--name open-webui \--restart always \ghcr.io/open-webui/open-webui:main

命令解析：

-d：后台运行容器。
-p 3000:8080：将主机的3000端口映射到容器的8080端口，用于WebUI访问。
--add-host=host.docker.internal:host-gateway：在容器内添加主机的内部地址，使WebUI能够访问本地Ollama服务。
-v open-webui:/app/backend/data：挂载卷，确保WebUI数据持久化。
--name open-webui：指定容器名称为open-webui。
--restart always：设置容器自动重启策略。
ghcr.io/open-webui/open-webui:main：指定使用Open WebUI的主分支镜像。

访问Open WebUI

部署完成后，通过浏览器访问http://localhost:3000即可打开Open WebUI界面。在此界面中，您可以：

输入提示（prompt）与大模型进行交互。
管理和切换不同的模型。
调整生成参数，如温度（temperature）和最大生成长度（max_tokens）。

使用Bundled Ollama进行一体化部署

Bundled Ollama提供了一个包含Open WebUI和Ollama的单一Docker镜像，简化了部署过程，适合希望快速上手且不需要单独管理服务的用户。

使用CPU进行部署

如果您的系统不具备NVIDIA GPU，或者不需要GPU加速，可以使用以下命令启动Bundled Ollama：

docker run -d -p 3000:8080 \-v ollama:/root/.ollama \-v open-webui:/app/backend/data \--name open-webui \--restart always \ghcr.io/open-webui/open-webui:ollama

命令解析：

-d：后台运行容器。
-p 3000:8080：将主机的3000端口映射到容器的8080端口，用于WebUI访问。
-v ollama:/root/.ollama：挂载卷，确保Ollama数据持久化。
-v open-webui:/app/backend/data：挂载卷，确保WebUI数据持久化。
--name open-webui：指定容器名称为open-webui。
--restart always：设置容器自动重启策略。
ghcr.io/open-webui/open-webui:ollama：指定使用Bundled Ollama的镜像。

使用Nvidia GPU支持进行部署

如果您的系统配备NVIDIA GPU，并希望利用GPU加速模型推理，请确保已安装NVIDIA Container Toolkit以支持GPU资源分配。然后，使用以下命令启动Bundled Ollama：

docker run -d -p 3000:8080 \--gpus all \-v ollama:/root/.ollama \-v open-webui:/app/backend/data \--name open-webui \--restart always \ghcr.io/open-webui/open-webui:ollama

命令解析：

--gpus all：将所有可用的GPU资源分配给容器，以加速模型推理。
其他参数与CPU部署方法相同。

访问Open WebUI

同样，通过浏览器访问http://localhost:3000即可打开Open WebUI界面。由于Bundled Ollama已经包含了Ollama服务，您无需进行额外的配置即可开始使用。

停止和管理容器

无论您选择哪种部署方法，都可以使用以下Docker命令来管理Open WebUI和Ollama容器。

查看正在运行的容器

docker ps

停止容器

docker stop open-webui
docker stop ollama

启动已停止的容器

docker start open-webui
docker start ollama

重启容器

docker restart open-webui
docker restart ollama

查看容器日志

docker logs open-webui
docker logs ollama

删除容器

docker rm open-webui
docker rm ollama

注意： 删除容器不会删除挂载的卷中的数据。如果需要删除数据，请手动移除相应的Docker卷：

docker volume rm open-webui
docker volume rm ollama_data

管理数据卷

在 Docker 中，数据卷用于持久化容器中的数据。您在部署命令中使用了以下数据卷：

-v ollama_data:/ollama/data
-v open-webui:/app/backend/data

列出和查看数据卷

要查看系统中的所有 Docker 数据卷，使用以下命令：

docker volume ls

要获取特定数据卷的信息，如 ollama_data，使用：

docker volume inspect ollama_data

备份数据卷

可以使用 tar 命令将数据卷备份：

docker run --rm -v ollama_data:/volume -v $(pwd):/backup alpine tar czf /backup/ollama_data_backup.tar.gz -C /volume .

恢复数据卷

从备份恢复数据卷：

docker run --rm -v ollama_data:/volume -v $(pwd):/backup alpine sh -c "tar xzf /backup/ollama_data_backup.tar.gz -C /volume"

删除数据卷

删除数据卷（例如 ollama_data）：

docker volume rm ollama_data

主机目录作为数据卷

可以将主机目录挂载为数据卷以直接访问和管理数据：

docker run -d --name ollama -v /home/user/ollama_data:/ollama/data --restart always ollama/ollama:latest

管理Ollama

除了部署和运行，您还需要了解如何管理Ollama，包括进入容器、执行常用指令等。

进出容器

有时您需要进入运行中的Docker容器，执行一些管理任务或查看配置。

进入容器

docker exec -it ollama /bin/bash

命令解析：

exec：在运行的容器中执行命令。
-it：交互式终端。
open-webui：容器名称。
/bin/bash：启动bash shell。

退出容器

在容器内执行exit命令即可退出交互式会话。

exit

Ollama常用指令

在管理Ollama时，以下是一些常用的命令和指令：

查看可用模型列表

ollama list

下载模型

ollama pull <model-name>

运行模型

ollama run <model-name>

删除模型

ollama rm <model-name>

查看已下载的模型

ollama models

获取Ollama版本信息

ollama version

查看Ollama帮助信息

ollama help

导入模型

ollama import <path-to-modelfile>

导出模型

ollama export <model-name> <output-path>

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

力扣3290.最高乘法得分

sklearn特征选取之RFE

【Linux篇】TCP/IP协议（笔记）

软考中级系统集成项目管理证书好考吗

Java多线程(1)—线程基础

【Unity3d Shader】毛玻璃效果

el-select组件：选择某个选项触发查询

华--清--速--递

Python知识点：如何使用Python进行算法交易

用Python实现运筹学——Day 0: 学习计划

Python 从入门到实战25（模块）

JSP(Java Server Pages)基础使用

D盘格式化了，数据怎么恢复？

【JavaWeb】二、HTML 入门

跨境专线的网速收到什么影响

[PHP内核探索]PHP中的哈希表

《Javascript高级程序设计 (第三版)》第五章引用类型

【5+】跨webview多页面触发事件（二）

angular2开源库收集

GitUp, 你不可错过的秀外慧中的git工具

HTTP传输编码增加了传输量，只为解决这一个问题 | 实用 HTTP

interface和setter，getter

JavaScript 奇技淫巧

JavaScript工作原理（五）：深入了解WebSockets，HTTP/2和SSE，以及如何选择

jdbc就是这么简单

JDK 6和JDK 7中的substring（）方法

jQuery(一)

Lsb图片隐写

mysql常用命令汇总

NSTimer学习笔记

swift基础之_对象实例方法对象方法。

vuex 学习笔记 01

windows下如何用phpstorm同步测试服务器

初识 webpack

高度不固定时垂直居中

解析 Webpack中import、require、按需加载的执行过程

开放才能进步！Angular和Wijmo一起走过的日子

判断客户端类型，Android，iOS，PC

前端知识点整理（待续）

微服务核心架构梳理

[Shell 脚本] 备份网站文件至OSS服务（纯shell脚本无sdk） ...

《TCP IP 详解卷1：协议》阅读笔记 - 第六章

k8s使用glusterfs实现动态持久化存储

整理一些计算机基础知识！

# windows 安装 mysql 显示 no packages found 解决方法

#define用法

%@ page import=%的用法

（14）目标检测_SSD训练代码基于pytorch搭建代码

（2024，LoRA，全量微调，低秩，强正则化，缓解遗忘，多样性）LoRA 学习更少，遗忘更少

（3）选择元素——（17）练习（Exercises）

（9）YOLO-Pose:使用对象关键点相似性损失增强多人姿态估计的增强版YOLO

（C语言）输入一个序列，判断是否为奇偶交叉数

（ISPRS，2021）具有遥感知识图谱的鲁棒深度对齐网络用于零样本和广义零样本遥感图像场景分类

(TipsTricks)用客户端模板精简JavaScript代码

（附源码）springboot炼糖厂地磅全自动控制系统毕业设计 341357

快速部署，Web访问

安装Docker

使用Ollama和Open WebUI独立部署

部署Ollama容器

部署Open WebUI容器

访问Open WebUI

使用Bundled Ollama进行一体化部署

使用CPU进行部署

使用Nvidia GPU支持进行部署

访问Open WebUI

停止和管理容器

查看正在运行的容器

停止容器

启动已停止的容器

重启容器

查看容器日志

删除容器

管理数据卷

列出和查看数据卷

备份数据卷

恢复数据卷

删除数据卷

主机目录作为数据卷

管理Ollama

进出容器

进入容器

退出容器

Ollama常用指令

查看可用模型列表

下载模型

运行模型

删除模型

查看已下载的模型

获取Ollama版本信息

查看Ollama帮助信息

导入模型

导出模型

相关文章：