当前位置: 首页 > news >正文

llama.cpp

https://github.com/echonoshy/cgft-llm

cgft-llm/llama-cpp/README.md at master · echonoshy/cgft-llm (github.com)

【大模型量化】- Llama.cpp轻量化模型部署及量化_哔哩哔哩_bilibili

Release模式是直接运行,Debug模式是调试模型。

github.com/ggerganov/llama.cpp

export HF_ENDPOINT=https://hf-mirror.comhuggingface-cli download shenzhi-wang/Llama3-8B-Chinese-Chat-GGUF-8bit --local-dir /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

cmake -B build_cpu
cmake --build build_cpu --config Release
cmake -B build_cuda -DLLAMA_CUDA=ON
cmake --build build_cuda --config Release -j 12

cd ~/code/llama.cpp/build_cuda/bin
./quantize --allow-requantize /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF/Llama3-8B-Chinese-Chat-q8_0-v2_1.gguf /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF/Llama3-8B-Chinese-Chat-q4_1-v1.gguf Q4_1

python convert-hf-to-gguf.py /root/autodl-tmp/models/Llama3-8B-Chinese-Chat --outfile /root/autodl-tmp/models/Llama3-8B-Chinese-Chat-GGUF/Llama3-8B-Chinese-Chat-q8_0-v1.gguf --outtype q8_0

相关文章:

  • CPP入门:日期类的构建
  • [AIGC] HashMap的扩容与缩容:动态调整容量以提高性能
  • 【JavaEE精炼宝库】多线程进阶(2)synchronized原理、JUC类——深度理解多线程编程
  • 【Qt+opencv】图片与视频的操作
  • 13018.CUDA工程配置GDB调试
  • 探索未来远程调试新纪元——《串口网口远程调试软件》:无缝连接,高效调试
  • 森林防火气象站:守护森林安全的科技利器
  • 【FFmpeg】avcodec_find_encoder和avcodec_find_decoder
  • 《mysql篇》--查询(进阶)
  • TCP: 传输控制协议
  • 双非本 985 硕,我马上要入职上海AI实验室大模型算法岗
  • 嵌入式实验---实验五 串口数据接收实验
  • Webpack: Loader开发 (1)
  • 基于正点原子FreeRTOS学习笔记——时间片调度实验
  • pdfmake不能设置表格边框颜色?
  • 深入了解以太坊
  • 分享一款快速APP功能测试工具
  • 《网管员必读——网络组建》(第2版)电子课件下载
  • 08.Android之View事件问题
  • 345-反转字符串中的元音字母
  • bearychat的java client
  • C++类的相互关联
  • Java面向对象及其三大特征
  • nodejs:开发并发布一个nodejs包
  • Spring核心 Bean的高级装配
  • TypeScript实现数据结构(一)栈,队列,链表
  • 基于web的全景—— Pannellum小试
  • 通过几道题目学习二叉搜索树
  • 怎么将电脑中的声音录制成WAV格式
  • “十年磨一剑”--有赞的HBase平台实践和应用之路 ...
  • ​3ds Max插件CG MAGIC图形板块为您提升线条效率!
  • ​Linux·i2c驱动架构​
  • ​软考-高级-信息系统项目管理师教程 第四版【第23章-组织通用管理-思维导图】​
  • # 详解 JS 中的事件循环、宏/微任务、Primise对象、定时器函数,以及其在工作中的应用和注意事项
  • ###STL(标准模板库)
  • #ubuntu# #git# repository git config --global --add safe.directory
  • (2)(2.10) LTM telemetry
  • (3)(3.2) MAVLink2数据包签名(安全)
  • (4)事件处理——(6)给.ready()回调函数传递一个参数(Passing an argument to the .ready() callback)...
  • (CVPRW,2024)可学习的提示:遥感领域小样本语义分割
  • (LeetCode C++)盛最多水的容器
  • (附源码)springboot社区居家养老互助服务管理平台 毕业设计 062027
  • (论文阅读11/100)Fast R-CNN
  • (原创) cocos2dx使用Curl连接网络(客户端)
  • (转)平衡树
  • .NET delegate 委托 、 Event 事件
  • .NET LINQ 通常分 Syntax Query 和Syntax Method
  • .net(C#)中String.Format如何使用
  • .NET/C# 解压 Zip 文件时出现异常:System.IO.InvalidDataException: 找不到中央目录结尾记录。
  • .NET/C# 使用反射注册事件
  • .NET/C# 推荐一个我设计的缓存类型(适合缓存反射等耗性能的操作,附用法)
  • .net程序集学习心得
  • .NET国产化改造探索(三)、银河麒麟安装.NET 8环境
  • .net专家(高海东的专栏)
  • .pop ----remove 删除