当前位置: 首页 > news >正文

【AI学习】在魔塔社区玩Ollama:部署GLM4和CodeGeeX4

看到文章《Ollama可以玩GLM4和CodeGeeX4了,快来魔搭玩起来》,参考的运行了一遍,折腾了一个晚上加一个上午,终于搞定了。本来很简单的事情,对这个代码小白,还是有点坑。。
GPU要明显快很多,CPU的速度,也还凑合吧。

个人尝试,整个过程如下:

1)启动魔塔社区的Notebook环境:
在这里插入图片描述
2)启动一个Terminal
在这里插入图片描述
3)在启动的Terminal输入以下命令:
先需要下载模型

modelscope download --model=LLM-Research/glm-4-9b-chat-GGUF --local_dir . glm-4-9b-chat.Q5_K.gguf

使用魔搭镜像环境安装,这一步是必须的:

modelscope download --model=modelscope/ollama-linux --local_dir ./ollama-linux
cd ollama-linux
sudo chmod 777 ./ollama-modelscope-install.sh
./ollama-modelscope-install.sh

启动Ollama服务

ollama serve

显示如下:
在这里插入图片描述
3)然后再启动一个Terminal
注意,需要另外启动一个Terminal
创建ModelFile
复制模型路径,创建名为“ModelFile”的meta文件,内容如下:

FROM /mnt/workspace/glm-4-9b-chat.Q5_K.gguf
#FROM /mnt/workspace/codegeex4-all-9b-Q5_K_M.gguf# set parameters
PARAMETER stop "<|system|>"
PARAMETER stop "<|user|>"
PARAMETER stop "<|assistant|>"TEMPLATE """[gMASK]<sop>{{ if .System }}<|system|>
{{ .System }}{{ end }}{{ if .Prompt }}<|user|>
{{ .Prompt }}{{ end }}<|assistant|>
{{ .Response }}"""

创建自定义模型
使用ollama create命令创建自定义模型

ollama create myglm4 --file ModelFile

运行模型:

ollama run myglm4

然后就成功了,显示如下:
在这里插入图片描述
4)也尝试了一下CodeGeeX4-ALL-9B 的Ollama部署

基本过程也一样
就是需要先下载模型:

modelscope download --model=LLM-Research/codegeex4-all-9b-GGUF --local_dir . codegeex4-all-9b-Q5_K_M.gguf

修改ModelFile,把“#FROM /mnt/workspace/codegeex4-all-9b-Q5_K_M.gguf”的注释取消,把“FROM /mnt/workspace/glm-4-9b-chat.Q5_K.gguf”注释掉

最后结果如下:
在这里插入图片描述

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 切换JDK版本
  • CSS3页面布局-三栏-固定宽度布局
  • TCP协议(1)
  • Ubuntu上搭建Nginx环境
  • Golang | Leetcode Golang题解之第368题最大整除子集
  • 面试被面试官问:3D目标检测预处理优化策略有哪些?
  • 计算机网络模型
  • kafak集群搭建-基于zookeeper方式
  • 七牛云文件存储
  • 大模型在应用开发安全左移实践
  • 【C/C++】Sleep()函数详解
  • GPIO(通用输入/输出)、中断(hal库)
  • Chrome 中的 RCE 会在 JIT 编译器中产生不正确的副作用
  • 【Linux】匿名管道
  • TypeSript8 泛型学习
  • 【跃迁之路】【733天】程序员高效学习方法论探索系列(实验阶段490-2019.2.23)...
  • C++入门教程(10):for 语句
  • Linux CTF 逆向入门
  • Spring核心 Bean的高级装配
  • 阿里云ubuntu14.04 Nginx反向代理Nodejs
  • 从0实现一个tiny react(三)生命周期
  • 从零搭建Koa2 Server
  • 关于Java中分层中遇到的一些问题
  • 回顾 Swift 多平台移植进度 #2
  • 将 Measurements 和 Units 应用到物理学
  • 利用DataURL技术在网页上显示图片
  • 那些被忽略的 JavaScript 数组方法细节
  • 前端技术周刊 2019-01-14:客户端存储
  • 全栈开发——Linux
  • 容器化应用: 在阿里云搭建多节点 Openshift 集群
  • 如何设计一个比特币钱包服务
  • 吴恩达Deep Learning课程练习题参考答案——R语言版
  • ionic入门之数据绑定显示-1
  • 带你开发类似Pokemon Go的AR游戏
  • ​Kaggle X光肺炎检测比赛第二名方案解析 | CVPR 2020 Workshop
  • #14vue3生成表单并跳转到外部地址的方式
  • $ git push -u origin master 推送到远程库出错
  • ${ }的特别功能
  • %check_box% in rails :coditions={:has_many , :through}
  • (06)金属布线——为半导体注入生命的连接
  • (145)光线追踪距离场柔和阴影
  • (160)时序收敛--->(10)时序收敛十
  • (2021|NIPS,扩散,无条件分数估计,条件分数估计)无分类器引导扩散
  • (39)STM32——FLASH闪存
  • (android 地图实战开发)3 在地图上显示当前位置和自定义银行位置
  • (C语言)求出1,2,5三个数不同个数组合为100的组合个数
  • (MATLAB)第五章-矩阵运算
  • (第三期)书生大模型实战营——InternVL(冷笑话大师)部署微调实践
  • (二)七种元启发算法(DBO、LO、SWO、COA、LSO、KOA、GRO)求解无人机路径规划MATLAB
  • (附源码)springboot 智能停车场系统 毕业设计065415
  • (附源码)ssm失物招领系统 毕业设计 182317
  • .net core MVC 通过 Filters 过滤器拦截请求及响应内容
  • .NET Core 将实体类转换为 SQL(ORM 映射)
  • .Net6使用WebSocket与前端进行通信
  • .NET8.0 AOT 经验分享 FreeSql/FreeRedis/FreeScheduler 均已通过测试