当前位置: 首页 > news >正文

LLama3本地部署安装

这篇教程将指导你如何在本机上安装 LLama3 客户端和可视化对话界面,我们会分为三部分:安装 LLama3 客户端、部署大模型和设置模型文件路径。

一、LLama3客户端安装

  1. 去 Ollama 官网下载 Ollama 客户端

         Download Ollama on macOS

      选择合适的操作系统平台后点击Download按钮等待下载完成即可。

     2.下载完成后,双击文件进行安装,mac选择方式如图所示:

      安装完成后会提示你默认启动命令,不需要管这个关闭即可。

 3.打开cmd控制台,键入ollama,如果如下图显示命令提示就说明安装已经成功

4.进入官网找到想要下载的模型名称 https://ollama.com/library/llama3/tags。 如果你使用的是普通电脑,建议选择8b(80亿参数)

5.控制台中键入ollama run llama3:8b,会自动进行8B模型下载,该模型有80亿参数,普通电脑可以执行。如果想要70B可以修改为入ollama run llama3:70b。按回车键就开始下载并自动安装,

当提示success时,说明已经成功安装了大模型。

二、LLama3可视化对话界面安装

  1. 确保系统中已经安装了nodejs和git,如果没有可以自己去官网下载安装https://nodejs.org/en
  2. 打开cmd控制台,键入node -v,如果显示vxx.xx.x.就说明安装成功了。
  3. 在cmd控制台键入mkdir llama在当前路径下创建一个叫llama的文件夹,然后键入cd llama进入该文件夹下。
  4. 在cmd控制台键入     git clone https://github.com/ollama-webui/ollama-webui-lite.git 将web ui界面下载回来

  5. 在cmd控制台键入cd ollama-webui-lite 进入web ui项目文件夹
  6. 在cmd控制台键入 npm install,安装环境与依赖
  7. 在cmd控制台键入 npm run dev,启动web ui系统。出现下面的画面,说明启动成功了。

页面部署完成了,打开体验一下:

三、设置模型文件位置

  1. 默认模型文件会下载到C:\Users\用户名.ollama\models
  2. 中国人的习惯就是c盘容量小e盘容量大。所以需要重新设置磁盘位置。
  3. 在e盘下创建目标文件夹
  4. 将C:\Users\用户名.ollama下的models文件夹整个移动到新创建的文件夹下
  5. 打开系统属性页面,点击环境变量按钮,弹出设置窗口
  6. 点击“心间按钮”,在“变量名”键入 OLLAMA_MOKDELS, 在"变量值"中填入刚刚移动到新位置的models路径,点击确定即可

四、第三方微调模型、中文资源下载

如果需要解除限制,或是其他微调功能,可以在https://huggingface.co下载其他人搞好的模型。
都是免费自由下载,很方便。

本文参考原文:LLama3大模型本地部署 仅需6步完成对话模型本地安装部署。附送可视化ui安装、自定义模型目录,修改模型保存地址,第三方微调模型、中文模型下载地址_llama本地部署-CSDN博客

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • DevEco Studio 预览器报错踩坑
  • 二进制协议集合
  • 基于springmvc实现文件上传
  • 常见虚拟现实硬件设备及特点
  • C++不同数据类型连接成一个字符串
  • 老程序员回到小地方搞团队接私活
  • Vue | 简单说说 Vuex 实现响应式的原理
  • leetcode203:移除链表元素
  • 【Linux目录结构简析】
  • Datawhale X 李宏毅苹果书 AI夏令营task1-3笔记
  • linux:进程间的通信
  • python怎么使用模块中的类
  • vue3 生命周期钩子
  • 2024.8.23 刷题总结
  • 【clickhouse】访问clickhouse数据库,并且插入数据
  • 【知识碎片】第三方登录弹窗效果
  • gitlab-ci配置详解(一)
  • Java 11 发布计划来了,已确定 3个 新特性!!
  • js如何打印object对象
  • vue脚手架vue-cli
  • vue自定义指令实现v-tap插件
  • 第十八天-企业应用架构模式-基本模式
  • 给github项目添加CI badge
  • 力扣(LeetCode)21
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • 微信小程序上拉加载:onReachBottom详解+设置触发距离
  • 详解移动APP与web APP的区别
  • 原生 js 实现移动端 Touch 滑动反弹
  • Linux权限管理(week1_day5)--技术流ken
  • ​zookeeper集群配置与启动
  • # 安徽锐锋科技IDMS系统简介
  • $.each()与$(selector).each()
  • $.type 怎么精确判断对象类型的 --(源码学习2)
  • (cljs/run-at (JSVM. :browser) 搭建刚好可用的开发环境!)
  • (附源码)ssm本科教学合格评估管理系统 毕业设计 180916
  • (附源码)ssm高校升本考试管理系统 毕业设计 201631
  • (论文阅读32/100)Flowing convnets for human pose estimation in videos
  • (每日一问)设计模式:设计模式的原则与分类——如何提升代码质量?
  • (四)js前端开发中设计模式之工厂方法模式
  • (一) 初入MySQL 【认识和部署】
  • (一)appium-desktop定位元素原理
  • .equal()和==的区别 怎样判断字符串为空问题: Illegal invoke-super to void nio.file.AccessDeniedException
  • .Family_物联网
  • .net core使用ef 6
  • .NET 分布式技术比较
  • .NET 回调、接口回调、 委托
  • .NET与 java通用的3DES加密解密方法
  • /proc/vmstat 详解
  • @Autowired和@Resource的区别
  • @RunWith注解作用
  • @test注解_Spring 自定义注解你了解过吗?
  • [ vulhub漏洞复现篇 ] struts2远程代码执行漏洞 S2-005 (CVE-2010-1870)
  • [001-03-007].第07节:Redis中的事务
  • [1] 平面(Plane)图形的生成算法
  • [2008][note]腔内级联拉曼发射的,二极管泵浦多频调Q laser——