当前位置: 首页 > news >正文

用Ollama 和 Open WebUI本地部署Llama 3.1 8B

说明: 本人运行环境windows11 N卡6G显存。部署Llama3.1 8B

简介

  Ollama是一个开源的大型语言模型服务工具,它允许用户在自己的硬件环境中轻松部署和使用大规模预训练模型。Ollama 的主要功能是在Docker容器内部署和管理大型语言模型(LLM),使得用户能够快速地在本地运行这些模型。它简化了部署过程,通过简单的安装指令,用户可以执行一条命令就在本地运行开源大型语言模型,例如Llama 3.1。本地部署,离线运行,数据无需上传云端,担心隐私泄露。

1、下载Ollama安装

  官网地址:https://ollama.com/, 依据自己操作系统类型下载相应版本。

2、 下载Docker安装

  Open WebUI 在Docker环境中运行,下载Docker进行安装

  官网地址:https://www.docker.com/
在这里插入图片描述

3、在Docker中安装open-webui

  确认Docker已经运行。

  在Open WebUI 官网https://docs.openwebui.com/
在这里插入图片描述

  复制以下命令运行

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

在这里插入图片描述

  执行完以上的命令,会在docker中出现open-webui项目。通过http://localhost:3000/打开Open WebUI界面。

在这里插入图片描述

4、浏览器中打开Open WebUI

  第一次登录,要求你注册,注册信息保存在本地。第一个注册的用户默认为系统管理员。注册完成后来到一个类似ChatGPT的界面。
在这里插入图片描述

5、设置拉取模型。

  在第③步中,可以访问https://ollama.com/library,在这里有很多常用的模型。

在这里插入图片描述
我这里选取的是llama3.1
在这里插入图片描述
复制命令在cmd下执行,拉取model,大约4.7G。稍等一会会。
在这里插入图片描述
在这里插入图片描述

或者复制大语言模型名称在Open WebUI中直接下载
在这里插入图片描述

  同样的方法,可以安装其它模型了。

6、选择模型,让我们开始吧!

  选择模型后,就可以对话了。

工作空间的简单应用

在这里插入图片描述
https://openwebui.com/可以选择相应预设模型,在页面中可以知道它采那个模型,还有相应的 System Prompt。
在这里插入图片描述
  综上所述,Ollama作为一个强大的开源大模型管理工具,它不仅能够助你高效地管理本地开源大模型,更能显著提升工作效率。通过其丰富的功能和灵活的配置选项,你可以轻松地组织、训练和调优各种模型,满足不同的应用需求。而Open WebUI的引入,提供了一个直观、便捷的Web界面,使你无需深入技术细节也能轻松访问和管理Ollama的接口。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 前端性能优化-Gzip工作原理
  • java之多线程篇
  • Nodjs编程-typeorm实体管理器
  • OpenCV||超详细的灰度变换和直方图修正
  • 从容应对技术面试:策略、技巧与成功案例
  • 众人帮蚂蚁帮任务平台修复版源码,含搭建教程。
  • C语言程序设计之基础易错题锦集2
  • Mybatis学习(3)
  • 数据结构 二叉树和堆总结
  • JavaEE: 进程和线程
  • 《云数据中心网络架构与技术》第四章:金融数据中心网络的总体架构与方案演进
  • 面壁发布端侧视觉理解模型 MiniCPM-V 2.6;ChatGPT 人形机器人二代正式发布丨 RTE 开发者日报
  • RabbitMQ高级特性 - 消息分发(限流、负载均衡)
  • Leetcode 第 135 场双周赛题解
  • 深入JVM:类加载器和双亲委派模型
  • 【css3】浏览器内核及其兼容性
  • CSS 提示工具(Tooltip)
  • HTTP 简介
  • JavaScript-Array类型
  • JS笔记四:作用域、变量(函数)提升
  • Lsb图片隐写
  • STAR法则
  • 基于OpenResty的Lua Web框架lor0.0.2预览版发布
  • 免费小说阅读小程序
  • 如何胜任知名企业的商业数据分析师?
  • 使用iElevator.js模拟segmentfault的文章标题导航
  • 【云吞铺子】性能抖动剖析(二)
  • Spring第一个helloWorld
  • 阿里云ACE认证之理解CDN技术
  • 交换综合实验一
  • 说说我为什么看好Spring Cloud Alibaba
  • #android不同版本废弃api,新api。
  • #数据结构 笔记一
  • #我与Java虚拟机的故事#连载09:面试大厂逃不过的JVM
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (32位汇编 五)mov/add/sub/and/or/xor/not
  • (DenseNet)Densely Connected Convolutional Networks--Gao Huang
  • (精确度,召回率,真阳性,假阳性)ACC、敏感性、特异性等 ROC指标
  • (图)IntelliTrace Tools 跟踪云端程序
  • (转贴)用VML开发工作流设计器 UCML.NET工作流管理系统
  • .java 9 找不到符号_java找不到符号
  • .NET/C# 编译期间能确定的相同字符串,在运行期间是相同的实例
  • .NET开源的一个小而快并且功能强大的 Windows 动态桌面软件 - DreamScene2
  • .net通用权限框架B/S (三)--MODEL层(2)
  • /etc/sudoer文件配置简析
  • /run/containerd/containerd.sock connect: connection refused
  • @zabbix数据库历史与趋势数据占用优化(mysql存储查询)
  • [Android]Tool-Systrace
  • [Angular] 笔记 20:NgContent
  • [C# 开发技巧]如何使不符合要求的元素等于离它最近的一个元素
  • [CSS]浮动
  • [C进阶] 数据在内存中的存储——浮点型篇
  • [DAU-FI Net开源 | Dual Attention UNet+特征融合+Sobel和Canny等算子解决语义分割痛点]
  • [English]英语积累本
  • [ES-5.6.12] x-pack ssl