当前位置: 首页 > news >正文

window11 部署llama.cpp并运行Qwen2-0.5B-Instruct-GGUF

吾名爱妃,性好静亦好动。好编程,常沉浸于代码之世界,思维纵横,力求逻辑之严密,算法之精妙。亦爱篮球,驰骋球场,尽享挥洒汗水之乐。且喜跑步,尤钟马拉松,长途奔袭,考验耐力与毅力,每有所进,心甚喜之。

 

吾以为,编程似布阵,算法如谋略,需精心筹谋,方可成就佳作。篮球乃团队之艺,协作共进,方显力量。跑步与马拉松,乃磨炼身心之途,愈挫愈勇,方能达至远方。愿交志同道合之友,共探此诸般妙趣。

诸君,此文尚佳,望点赞收藏,谢之!

1. 下载llama.cpp框架编译环境(llama.cpp/docs/build.md at master · ggerganov/llama.cpp · GitHub):

2. 下载w64devkit:Releases · skeeto/w64devkit · GitHub

3. 解压后直接运行w64devkit.exe:

4. 下载llama.cp源码:

git clone https://github.com/ggerganov/llama.cpp

进入llama.cpp目录,执行make命令:

5. 运行后,在llama.cpp目录找到llama-cli.exe表示安装成功

6. 下载Qwen2-0.5B-Instruct-GGUF格式模型:魔搭社区

7.在llama-cli.exe文件所在目录新建chat-with-qwen.txt文件,内容为:You are a helpful assistant.

在llama-cli.exe文件所在目录打开命中行,执行:

llama-cli.exe -m ..\Qwen2-0.5B-Instruct-GGUF\qwen2-0_5b-instruct-q5_k_m.gguf -n 512 -co -i -if -f chat-with-qwen.txt --in-prefix "<|im_start|>user\n" --in-suffix "<|im_end|>\n<|im_start|>assistant\n" -ngl 24

结果:

可以进行交互了~

8. 以服务的形式运行模型:

llama-server.exe -m ..\Qwen2-0.5B-Instruct-GGUF\qwen2-0_5b-instruct-q5_k_m.gguf -ngl 24 -fa

结果:

启动成功,使用postman测试:

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • python实现插入排序、快速排序
  • 陪玩系统小程序模式APP小程序H5系统搭建开发
  • 微信小程序-组件通信
  • DETR算法解读——Transformer在目标检测任务的首次应用
  • <数据集>铁轨缺陷检测数据集<目标检测>
  • IP转接服务的重要性及其应用
  • linux服务器数据库备份脚本
  • 【JavaScript 算法】拓扑排序:有向无环图的应用
  • 「实战应用」如何用DHTMLX将上下文菜单集成到JavaScript甘特图中(三)
  • 处理在 electron 中使用开启了懒加载的 el-image 后,窗口最大化或窗口尺寸变化后图片无法显示的问题
  • [米联客-安路飞龙DR1-FPSOC] FPGA基础篇连载-21 VTC视频时序控制器设计
  • RESTful API设计指南:构建高效、可扩展和易用的API
  • 达梦数据库DM8-索引篇
  • 【GraphRAG】微软 graphrag 效果实测
  • Keysight 是德 DSA90804A 高性能示波器
  • 「前端」从UglifyJSPlugin强制开启css压缩探究webpack插件运行机制
  • crontab执行失败的多种原因
  • Docker: 容器互访的三种方式
  • JavaScript新鲜事·第5期
  • Java面向对象及其三大特征
  • JS正则表达式精简教程(JavaScript RegExp 对象)
  • Linux学习笔记6-使用fdisk进行磁盘管理
  • MySQL几个简单SQL的优化
  • nginx 配置多 域名 + 多 https
  • node学习系列之简单文件上传
  • PHP变量
  • Protobuf3语言指南
  • 电商搜索引擎的架构设计和性能优化
  • 搞机器学习要哪些技能
  • 关键词挖掘技术哪家强(一)基于node.js技术开发一个关键字查询工具
  • 老板让我十分钟上手nx-admin
  • 前端面试之闭包
  • 使用 @font-face
  • 腾讯优测优分享 | 你是否体验过Android手机插入耳机后仍外放的尴尬?
  • 小程序测试方案初探
  • 异常机制详解
  • 应用生命周期终极 DevOps 工具包
  • ​软考-高级-信息系统项目管理师教程 第四版【第14章-项目沟通管理-思维导图】​
  • ​中南建设2022年半年报“韧”字当头,经营性现金流持续为正​
  • #565. 查找之大编号
  • #NOIP 2014#Day.2 T3 解方程
  • #QT(串口助手-界面)
  • #调用传感器数据_Flink使用函数之监控传感器温度上升提醒
  • #我与Java虚拟机的故事#连载08:书读百遍其义自见
  • (04)Hive的相关概念——order by 、sort by、distribute by 、cluster by
  • (1)Map集合 (2)异常机制 (3)File类 (4)I/O流
  • (20)docke容器
  • (ZT)出版业改革:该死的死,该生的生
  • (附源码)spring boot球鞋文化交流论坛 毕业设计 141436
  • (附源码)springboot 基于HTML5的个人网页的网站设计与实现 毕业设计 031623
  • (附源码)springboot猪场管理系统 毕业设计 160901
  • (附源码)ssm高校社团管理系统 毕业设计 234162
  • (译) 理解 Elixir 中的宏 Macro, 第四部分:深入化
  • (原創) 如何使用ISO C++讀寫BMP圖檔? (C/C++) (Image Processing)
  • (杂交版)植物大战僵尸