当前位置: 首页 > news >正文

本地部署大模型

模型排行榜:https://www.superclueai.com/


Open WebUI

https://docs.openwebui.com/
Open WebUI 是一种可扩展、功能丰富且用户友好的自托管 WebUI,旨在完全离线运行。它支持各种 LLM 运行器,包括 Ollama 和 OpenAI 兼容的 API。
docker安装

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

LobeChat

https://lobehub.com/zh/docs/usage/start
LobeChat 是一个开源、高性能的聊天机器人框架,支持语音合成、多模态和可扩展的功能调用插件系统
docker安装

$ docker run -d -p 3210:3210 -e OPENAI_API_KEY=sk-xxxx -e ACCESS_CODE=lobe66 --name lobe-chat lobehub/lobe-chat

Ollama

Ollama是一个专为在本地环境中运行和定制大型语言模型而设计的工具。
官网:https://ollama.com/
文档:https://ollama.fan/getting-started/#import-from-gguf
系统环境变量OLLAMA_MODELS,设置存放位置
命令窗口中使用ollama

# 拉取&运行模型(根据服务器配置选择模型)
ollama run qwen2:0.5b
# 查看模型列表
ollama list
# 删除模型
ollama rm qwen2:0.5b

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 49、PHP 实现堆排序
  • vue3 + element plus使用iconfont 自定义font组件颜色大小可修改
  • 2024 CISCN总决赛 ShareCard
  • CPU、GPU等处理器介绍
  • 深入探索非线性数据结构:树与图的世界
  • 基于opencv的人脸识别(实战)
  • 贪心加暴力枚举
  • Postman中的A/B测试实践:优化API性能的科学方法
  • Mysql备份恢复
  • redis的使用场景-热点数据缓存
  • 【技术升级】Docker环境下Nacos平滑升级攻略,安全配置一步到位
  • 论文阅读:(DETR)End-to-End Object Detection with Transformers
  • B端系统UI个性化设计:感受定制之美
  • 微信小游戏之 三消(一)
  • C#华为OD笔试题*3
  • Android路由框架AnnoRouter:使用Java接口来定义路由跳转
  • extjs4学习之配置
  • Javascript弹出层-初探
  • Mac转Windows的拯救指南
  • PHP 7 修改了什么呢 -- 2
  • SSH 免密登录
  • tab.js分享及浏览器兼容性问题汇总
  • webpack4 一点通
  • 持续集成与持续部署宝典Part 2:创建持续集成流水线
  • 电商搜索引擎的架构设计和性能优化
  • 实战|智能家居行业移动应用性能分析
  • 算法-图和图算法
  • HanLP分词命名实体提取详解
  • 如何正确理解,内页权重高于首页?
  • ​2021半年盘点,不想你错过的重磅新书
  • ​如何在iOS手机上查看应用日志
  • # Maven错误Error executing Maven
  • # Spring Cloud Alibaba Nacos_配置中心与服务发现(四)
  • (2024)docker-compose实战 (9)部署多项目环境(LAMP+react+vue+redis+mysql+nginx)
  • (23)Linux的软硬连接
  • (floyd+补集) poj 3275
  • (不用互三)AI绘画工具应该如何选择
  • (附源码)springboot美食分享系统 毕业设计 612231
  • (蓝桥杯每日一题)平方末尾及补充(常用的字符串函数功能)
  • (六) ES6 新特性 —— 迭代器(iterator)
  • (三)docker:Dockerfile构建容器运行jar包
  • (十二)python网络爬虫(理论+实战)——实战:使用BeautfulSoup解析baidu热搜新闻数据
  • (四)js前端开发中设计模式之工厂方法模式
  • (四)Linux Shell编程——输入输出重定向
  • (四十一)大数据实战——spark的yarn模式生产环境部署
  • (转)IOS中获取各种文件的目录路径的方法
  • (转载)hibernate缓存
  • (转载)利用webkit抓取动态网页和链接
  • *++p:p先自+,然后*p,最终为3 ++*p:先*p,即arr[0]=1,然后再++,最终为2 *p++:值为arr[0],即1,该语句执行完毕后,p指向arr[1]
  • .net Application的目录
  • .net core 客户端缓存、服务器端响应缓存、服务器内存缓存
  • .NET Core 控制台程序读 appsettings.json 、注依赖、配日志、设 IOptions
  • .NET CORE使用Redis分布式锁续命(续期)问题
  • .Net组件程序设计之线程、并发管理(一)
  • /3GB和/USERVA开关