当前位置: 首页 > news >正文

本地安装Ollama+WebUI

本地安装Ollama+WebUI

B站教程地址:https://www.bilibili.com/video/BV1Kz421h7Jk/?spm_id_from=333.337.search-card.all.click&vd_source=42b07826977d09765ec11b9fa06715e5

一、下载Ollama

https://ollama.com/download 支持mac、linux、windows

选择在ubuntu下安装

odoo@odoo-pc:~$ curl -fsSL https://ollama.com/install.sh | sh
>>> Installing ollama to /usr/local
[sudo] odoo 的密码: 
>>> Downloading Linux amd64 bundle
######################################################################## 100.0%######################################################################### 100.0%
>>> Creating ollama user...
>>> Adding ollama user to render group...
>>> Adding ollama user to video group...
>>> Adding current user to ollama group...
>>> Creating ollama systemd service...
>>> Enabling and starting ollama service...
Created symlink /etc/systemd/system/default.target.wants/ollama.service → /etc/systemd/system/ollama.service.
>>> The Ollama API is now available at 127.0.0.1:11434.
>>> Install complete. Run "ollama" from the command line.
WARNING: No NVIDIA/AMD GPU detected. Ollama will run in CPU-only mode.从上面的安装过程发现两点:
1、api的端口号是11434
2、没有检测到显卡,Ollama运行在cpu模式下

安装第一个大模型: 其实这一步可用不用做,后面通过webui来安装。

odoo@odoo-pc:~$ ollama run llama3
pulling manifest 
pulling 6a0746a1ec1a... 100% ▕████████████████▏ 4.7 GB                         
pulling 4fa551d4f938... 100% ▕████████████████▏  12 KB                         
pulling 8ab4849b038c... 100% ▕████████████████▏  254 B                         
pulling 577073ffcc6c... 100% ▕████████████████▏  110 B                         
pulling 3f8eb4da87fa... 100% ▕████████████████▏  485 B                         
verifying sha256 digest 
writing manifest 
success 
>>> Send a message (/? for help)

到这里就可以向大模型提问了,进行交互了,不过只能在本地终端进行,下面,我们需要安装WebUI,可用通过web界面进行交互。

二、安装WebUI

https://docs.openwebui.com

因为我的机器没有GPU,所以找了一个不需要GPU命令进行安装:

For CPU Only: If you're not using a GPU, use this command instead:
docker run -d -p 3000:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama
odoo@odoo-pc:~$ sudo docker run -d -p 3000:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama
[sudo] odoo 的密码: 
Unable to find image 'ghcr.io/open-webui/open-webui:ollama' locally
ollama: Pulling from open-webui/open-webui
a2318d6c47ec: Pull complete 
334af29dc78e: Pull complete 
d534b3df1e9e: Pull complete 
95b5b248c442: Pull complete 
98d167576f7c: Pull complete 
ac786ed3fe21: Pull complete 
4f4fb700ef54: Pull complete 
0b3cbd1796a0: Pull complete 
08dcfffb691a: Pull complete 
290e855a01d4: Pull complete 
da884a0397a7: Pull complete 
46fe1a8da679: Pull complete 
6497c5d13491: Pull complete 
2e2171744e6b: Pull complete 
8558874c3ff3: Pull complete 
15f64213e6de: Pull complete 
Digest: sha256:b70396e243682d7e93fc426b5aa6ade41c2240e5559aa00301dbdcf8e520235b
Status: Downloaded newer image for ghcr.io/open-webui/open-webui:ollama
ba2b5958578f44030936768b324f451ecce00865047fc53e158ce84c616e91e1

安装完成后打开地址

http://127.0.0.1:3000/

注册一个账号,账号会保存在本地而不是云端,第一个注册的账号会成为管理员。

进入界面后,选择左下角的头像进入设置菜单,通用里面可用选择语言,默认会跟操作系统的语言保持一致。

选择管理员设置:

会出现模型的设置。

注意: Ollama是一个管理平台,它可用管理很多模型,像开源的llama3, chatgpt等

从ollama.com选取一个模型,然后输入模型的名称,就可以进行下载。下载速度还是比较快的。

可用多安装几个模型,获取更多元化的回答。

注册了一个账号:

fatux 156277468@qq.com 密码是最复杂的

三、使用技巧

1、模型

可用安装别人训练好的agent

2、提示词

3、指定检索文件

在让大模型回答问题之前可用指定文件,不过这样有个缺点,大模型需要经过检索和回答两个步骤,可能需要的时间会变长。

四、微调模型

让AI将特定领域的知识,内化整合成模型的一部分,而这种让语言模型在原有知识的基础上进行额外训练的过程被称为模型微调。fine-tuning

要微调模型,我们要准备一些问答的范例协助AI进行学习,其中一种常见的格式叫Json

格式类似于QA,有问有答

可用通过chatgpt转换成JSON格式的文本。

https://unsloth.ai/ 训练和微调语言模型的工具

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 基于Linux文件编程实现处理Excel表格的数据
  • 《深入理解 Java 中的继承与方法重写》
  • JavaScript 中 new Function() 和 new function() 的区别
  • 51. 数组中的逆序对
  • HTML中的文字与分区标记
  • Docker高级管理之compose容器编排与私有仓库的部署
  • UE5 对象池
  • 【研赛论文】数学建模2024华为杯论文word/latex模板
  • 希捷,AI时代的存储“破壁者”
  • R语言数据整理和分析(1)
  • 对接开源大模型应用开发平台最佳实践
  • B3635 硬币问题
  • vue3 指定元素全屏 screenfull(可直接粘贴使用)
  • 【Python机器学习】循环神经网络(RNN)——对RNN进行预测
  • Ansible自动化部署kubernetes集群
  • [PHP内核探索]PHP中的哈希表
  • 《Javascript高级程序设计 (第三版)》第五章 引用类型
  • Android系统模拟器绘制实现概述
  • DOM的那些事
  • GDB 调试 Mysql 实战(三)优先队列排序算法中的行记录长度统计是怎么来的(上)...
  • HTTP中的ETag在移动客户端的应用
  • Java 11 发布计划来了,已确定 3个 新特性!!
  • JWT究竟是什么呢?
  • Linux各目录及每个目录的详细介绍
  • mockjs让前端开发独立于后端
  • MYSQL如何对数据进行自动化升级--以如果某数据表存在并且某字段不存在时则执行更新操作为例...
  • XML已死 ?
  • 得到一个数组中任意X个元素的所有组合 即C(n,m)
  • 解决jsp引用其他项目时出现的 cannot be resolved to a type错误
  • 你真的知道 == 和 equals 的区别吗?
  • 如何在 Tornado 中实现 Middleware
  • 为物联网而生:高性能时间序列数据库HiTSDB商业化首发!
  • 小程序滚动组件,左边导航栏与右边内容联动效果实现
  • 学习笔记DL002:AI、机器学习、表示学习、深度学习,第一次大衰退
  • 一道面试题引发的“血案”
  • 译有关态射的一切
  • 原生JS动态加载JS、CSS文件及代码脚本
  • 支付宝花15年解决的这个问题,顶得上做出十个支付宝 ...
  • ​LeetCode解法汇总518. 零钱兑换 II
  • ​香农与信息论三大定律
  • # Panda3d 碰撞检测系统介绍
  • #我与Java虚拟机的故事#连载11: JVM学习之路
  • (Redis使用系列) Springboot 使用redis的List数据结构实现简单的排队功能场景 九
  • (每日一问)设计模式:设计模式的原则与分类——如何提升代码质量?
  • (四)Controller接口控制器详解(三)
  • (四)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (学习日记)2024.03.12:UCOSIII第十四节:时基列表
  • (转)MVC3 类型“System.Web.Mvc.ModelClientValidationRule”同时存在
  • (转)一些感悟
  • .htaccess 强制https 单独排除某个目录
  • .Net 6.0 处理跨域的方式
  • .NET Core WebAPI中使用swagger版本控制,添加注释
  • .NET Core跨平台微服务学习资源
  • .net dataexcel winform控件 更新 日志
  • .NET Standard / dotnet-core / net472 —— .NET 究竟应该如何大小写?