当前位置: 首页 > news >正文

[论文笔记] ShortGPT Qwen2-0.5B-instruct Qwen2-1.5B-instruct 大模型剪枝

工作:

        把shortgpt的llama代码改成了Qwen的剪枝。
具体方法:

        用wikitext数据,计算每层的影响力分数即BI分数(1-层前后隐层状态余弦相似度),剪掉影响力低的P%的层数。


剪枝脚本:bash short_qwen_xin.sh
推理脚本:bash short_qwen_xin_test.sh

bash short_qwen_xin.sh

short_qwen_xin.sh

# 模型路径
model_names="/cpfs/074bqrkckm2dg5dq9nc/shared/AI-QIHUAN/OpenModels/Qwen2/Qwen2-0.5B-Instruct /cpfs/074bqrkckm2dg5dq9nc/shared/AI-QIHUAN/OpenModels/Qwen2/Qwen2-1.5B-Instruct"# 遍历模型
# 遍历剪枝层数从1到20
for model_name in ${model_names};do
echo "[^.^] 模型名称为:${model_name}"
for prune_layers in {1..20};doecho 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【SQL】百题计划:SQL内置函数“LENGTH“的使用
  • 电脑丢失msvcp120.dll问题原因及详细介绍msvcp120.dll丢失的解决方法
  • DevOps实现CI/CD实战(七)- Jenkins集成k8s实现自动化CI
  • 前端Warning解决:多行文本省略号样式失效丢失,css
  • ERDAS实现根据矢量数据的一个属性字段,裁剪栅格并生成多个栅格文件
  • npm镜像源证书过期的问题解决
  • Linux学习-Ansible(二)
  • 严重干扰的验证码识别系统源码分享
  • Pandas与Matplotlib:Python中的动态数据可视化
  • 非凸科技钻石赞助第四届Rust China Conf 2024
  • 【渗透测试】——DVWA靶场搭建
  • 【运维监控】系列文章汇总索引
  • 网络学习-eNSP配置VRRP
  • 第15-02章:理解Class类并获取Class实例
  • 食品加工废水处理设备工作原理
  • 230. Kth Smallest Element in a BST
  • ES6语法详解(一)
  • HTML中设置input等文本框为不可操作
  • Java 实战开发之spring、logback配置及chrome开发神器(六)
  • js作用域和this的理解
  • LeetCode算法系列_0891_子序列宽度之和
  • PAT A1017 优先队列
  • rabbitmq延迟消息示例
  • 百度地图API标注+时间轴组件
  • 构建工具 - 收藏集 - 掘金
  • 后端_MYSQL
  • 将 Measurements 和 Units 应用到物理学
  • 快速构建spring-cloud+sleuth+rabbit+ zipkin+es+kibana+grafana日志跟踪平台
  • 力扣(LeetCode)21
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • ​数据结构之初始二叉树(3)
  • #### golang中【堆】的使用及底层 ####
  • #HarmonyOS:基础语法
  • (+4)2.2UML建模图
  • (42)STM32——LCD显示屏实验笔记
  • (pojstep1.3.1)1017(构造法模拟)
  • (二)延时任务篇——通过redis的key监听,实现延迟任务实战
  • (附源码)spring boot儿童教育管理系统 毕业设计 281442
  • (附源码)计算机毕业设计ssm本地美食推荐平台
  • (论文阅读40-45)图像描述1
  • (七)微服务分布式云架构spring cloud - common-service 项目构建过程
  • (数据大屏)(Hadoop)基于SSM框架的学院校友管理系统的设计与实现+文档
  • (一)Kafka 安全之使用 SASL 进行身份验证 —— JAAS 配置、SASL 配置
  • (转) SpringBoot:使用spring-boot-devtools进行热部署以及不生效的问题解决
  • .Net Remoting(分离服务程序实现) - Part.3
  • .net对接阿里云CSB服务
  • /run/containerd/containerd.sock connect: connection refused
  • @PreAuthorize与@Secured注解的区别是什么?
  • @Resource和@Autowired的区别
  • [ JavaScript ] JSON方法
  • [240621] Anthropic 发布了 Claude 3.5 Sonnet AI 助手 | Socket.IO 拒绝服务漏洞
  • [AAuto]给百宝箱增加娱乐功能
  • [ABC275A] Find Takahashi 题解
  • [C#]OpenCvSharp结合yolov8-face实现L2CS-Net眼睛注视方向估计或者人脸朝向估计
  • [CDOJ 838]母仪天下 【线段树手速练习 15分钟内敲完算合格】