当前位置: 首页 > news >正文

2024最新私有化部署AI大模型,让每个人都有属于自己的AI助理

让每个人都拥有一个属于自己的本地大模型

下载Ollama

下载地址

https://ollama.com/download

​ Ollama支持MacOS、Linux、Windows

image-20240507105722380

解压

下载完成后,会得到一个Ollama-darwin.zip文件,解压后,以Mac为例是一个可运行文件:Ollama.app

image-20240507110010601

使用步骤

  1. 双击解压后的可运行文件:Ollama.app

  2. 在Ollama官网上点击Models,可看见各种大模型的列表,我这里选择了llama3

    image-20240507110356947

  3. 打开终端,执行如下命令:ollama run llama3

  4. 等待下载模型文件,llama3:8b大概4.7GB

    image-20240507110739615

  5. 完成后,会出现如下窗口说明安装成功

    image-20240507111012638

  6. 发送任意消息进行测试

    image-20240507111147248

使用聊天页面调用大模型

无论是使用命令还是调用大模型接口,用起来肯定是不方便,大模型肯定是要配合完美的页面来使用的。我推荐使用的是open-webui

gitHub地址

https://github.com/open-webui/open-webui

安装方式

推荐使用docker安装(可直接参考github中的文档)

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

使用

安装成功后,浏览器直接访问localhost:3000,注册一个账号,即可正常使用。

在UI页面中,可设置系统语言,支持中文

image-20240507111929884

image-20240507112004852

开发工具插件使用本地大模型

有很多插件都支持Ollama,拿VsCode开发工具来说,有一个插件叫Ollama Autocoder

image-20240507112321692

在设置中,将模型手动改为:llama3

image-20240507112651772

在VSCode中,按下空格即可有插件的提示:

image-20240507112808701

按下Tab键,即可使用大模型的推理生成上下文代码。这里不重点介绍了,有很多优秀的插件做的都很好,这里着重演示使用本地大模型。

相关文章:

  • 【面试八股总结】索引(二):B+树数据结构、索引使用场景、索引优化、索引失效
  • 【加密与解密(第四版)】第十五章笔记
  • TiDB学习4:Placement Driver
  • springboot项目部署到linux服务器
  • SEO之核心关键词(二)
  • 股票交易vip快速通道有什么门槛?vip交易通道的开通流程!
  • 【如何检查 ONNX 模型是否正确?】onnx.checker.check_model 用法详解
  • Elasticsearch 认证模拟题 - 1
  • 钉钉企业内部H5微应用或小程序之钉消息推送
  • 赛事|基于SprinBoot+vue的CSGO赛事管理系统(源码+数据库+文档)
  • Python库之Scrapy的高级用法深度解析
  • MySQL 状态【中文对照表】
  • Java应用中文件上传安全性分析与安全实践
  • ModuleNotFoundError: No module named ‘import_export‘
  • 《TCP/IP网络编程》(第十二章)I/O复用(1)
  • -------------------- 第二讲-------- 第一节------在此给出链表的基本操作
  • 【comparator, comparable】小总结
  • 5、React组件事件详解
  • CAP理论的例子讲解
  • JS基础之数据类型、对象、原型、原型链、继承
  • LeetCode刷题——29. Divide Two Integers(Part 1靠自己)
  • Linux编程学习笔记 | Linux多线程学习[2] - 线程的同步
  • python学习笔记 - ThreadLocal
  • SpingCloudBus整合RabbitMQ
  • 关于使用markdown的方法(引自CSDN教程)
  • 计算机常识 - 收藏集 - 掘金
  • 精彩代码 vue.js
  • 快速构建spring-cloud+sleuth+rabbit+ zipkin+es+kibana+grafana日志跟踪平台
  • 力扣(LeetCode)965
  • 入手阿里云新服务器的部署NODE
  • 我是如何设计 Upload 上传组件的
  • 原生 js 实现移动端 Touch 滑动反弹
  • 正则与JS中的正则
  • C# - 为值类型重定义相等性
  • 阿里云移动端播放器高级功能介绍
  • $.proxy和$.extend
  • (1/2)敏捷实践指南 Agile Practice Guide ([美] Project Management institute 著)
  • (2)空速传感器
  • (Mac上)使用Python进行matplotlib 画图时,中文显示不出来
  • (pytorch进阶之路)CLIP模型 实现图像多模态检索任务
  • (附源码)python旅游推荐系统 毕业设计 250623
  • (附源码)计算机毕业设计SSM疫情居家隔离服务系统
  • (简单有案例)前端实现主题切换、动态换肤的两种简单方式
  • (四) 虚拟摄像头vivi体验
  • (一)ClickHouse 中的 `MaterializedMySQL` 数据库引擎的使用方法、设置、特性和限制。
  • .NET C# 使用 iText 生成PDF
  • .net framework 4.0中如何 输出 form 的name属性。
  • .NET 的程序集加载上下文
  • .NET 中小心嵌套等待的 Task,它可能会耗尽你线程池的现有资源,出现类似死锁的情况
  • .net6使用Sejil可视化日志
  • .pyc文件是什么?
  • ?
  • @JsonFormat 和 @DateTimeFormat 的区别
  • @在php中起什么作用?
  • [ 常用工具篇 ] POC-bomber 漏洞检测工具安装及使用详解