当前位置: 首页 > news >正文

llama3.1本地部署方式

llama3.1 资源消耗情况

Llama 3.1 - 405B、70B 和 8B 的多语言与长上下文能力解析



70B版本,FP16+16K token需要的资源约为75G;FP16+128K token需要的资源约为110G



1、ollama

ollama工具部署及使用:

https://github.com/ollama/ollama/blob/main/README.md#quickstart

ollama工具支持模型:

https://ollama.com/library

开放IP (配置修改教程):

阿里云Linux服务器安装Ollama后,IP无法访问_ollama ip-CSDN博客

第二十六篇-Ollama-监听本地IP与端口_ollama 修改端口-CSDN博客



开源模型地址:

https://github.com/meta-llama/llama-models/blob/main/README.md



2、modelscope

模型文件:

魔搭社区

使用方式:

魔搭社区



相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Java 中的泛型 集合(List,Set) Map
  • opencascade AIS_Line源码学习直线节点
  • 前端响应式布局解决方案分享
  • One-hot编码
  • 2024视频编辑网站微服务
  • android13去掉安全模式 删除安全模式
  • kafka 将log4j的项目升级到log4j2
  • 把外部资源利用到极致 如何利用大公司的dll插件 大公司的应用有大量的dll 还有windows系统dll
  • java自定义日志注解
  • 计算机毕业设计Django+Vue.js考研推荐系统 考研分数线预测 中公考研爬虫 混合神经网络推荐算法 考研可视化 机器学习 深度学习 大数据毕业设计
  • 热力学计算网站使用推荐,Thermo-Calc!
  • Qt QTableWidget 去除序号列
  • 将tsx引入vue
  • JavaScript 逆向技巧总结
  • 进程信号的产生与处理
  • 【前端学习】-粗谈选择器
  • JS进阶 - JS 、JS-Web-API与DOM、BOM
  • Median of Two Sorted Arrays
  • REST架构的思考
  • spring cloud gateway 源码解析(4)跨域问题处理
  • Work@Alibaba 阿里巴巴的企业应用构建之路
  • 得到一个数组中任意X个元素的所有组合 即C(n,m)
  • 个人博客开发系列:评论功能之GitHub账号OAuth授权
  • 基于OpenResty的Lua Web框架lor0.0.2预览版发布
  • 开源中国专访:Chameleon原理首发,其它跨多端统一框架都是假的?
  • 聊聊directory traversal attack
  • 猫头鹰的深夜翻译:Java 2D Graphics, 简单的仿射变换
  • 如何借助 NoSQL 提高 JPA 应用性能
  • 通过git安装npm私有模块
  • Redis4.x新特性 -- 萌萌的MEMORY DOCTOR
  • UI设计初学者应该如何入门?
  • ​第20课 在Android Native开发中加入新的C++类
  • ​七周四次课(5月9日)iptables filter表案例、iptables nat表应用
  • #Spring-boot高级
  • (ctrl.obj) : error LNK2038: 检测到“RuntimeLibrary”的不匹配项: 值“MDd_DynamicDebug”不匹配值“
  • (博弈 sg入门)kiki's game -- hdu -- 2147
  • (补充):java各种进制、原码、反码、补码和文本、图像、音频在计算机中的存储方式
  • (翻译)Quartz官方教程——第一课:Quartz入门
  • (七)Java对象在Hibernate持久化层的状态
  • (原)本想说脏话,奈何已放下
  • (自用)网络编程
  • **《Linux/Unix系统编程手册》读书笔记24章**
  • .net core webapi 部署iis_一键部署VS插件:让.NET开发者更幸福
  • .NET/C# 中你可以在代码中写多个 Main 函数,然后按需要随时切换
  • .NET技术成长路线架构图
  • .vue文件怎么使用_vue调试工具vue-devtools的安装
  • /run/containerd/containerd.sock connect: connection refused
  • ??myeclipse+tomcat
  • @WebServiceClient注解,wsdlLocation 可配置
  • [2021]Zookeeper getAcl命令未授权访问漏洞概述与解决
  • [Android]创建TabBar
  • [Angularjs]asp.net mvc+angularjs+web api单页应用之CRUD操作
  • [BZOJ 3282] Tree 【LCT】
  • [C++] 默认构造函数、参数化构造函数、拷贝构造函数、移动构造函数及其使用案例
  • [C语言][PTA基础C基础题目集] strtok 函数的理解与应用