当前位置: 首页 > news >正文

逻辑推理之lora微调

逻辑推理微调

  • 比赛介绍
  • 准备内容
  • lora微调
    • lora微调介绍
    • lora优势
    • 代码内容
  • start_vllm
    • 相关介绍
    • 调用
  • 运行主函数
  • 提交结果
  • 总结
  • 相应连接

比赛介绍

本比赛旨在测试参与者的逻辑推理和问题解决能力。参与者将面对一系列复杂的逻辑谜题,涵盖多个领域的推理挑战。
比赛的连接:第二届世界科学智能大赛逻辑推理赛道:复杂推理能力评估
在这里插入图片描述

准备内容

选择相应的GPU环境以及对应的镜像,这里使用到的是魔搭社区的内容
在这里插入图片描述

lora微调

lora微调介绍

LoRA(Low-Rank Adaptation)微调是一种高效的模型微调技术,特别适用于大型预训练语言模型的适应性调整。LoRA的核心思想是通过引入低秩矩阵来调整模型的权重,从而在不显著增加模型参数数量的情况下,实现对模型的微调。

lora优势

  • 可以针对不同的下游任务构建小型 LoRA 模块,从而在共享预训练模型参数基础上有效地切换下游任务。
  • LoRA 使用自适应优化器(Adaptive Optimizer),不需要计算梯度或维护大多数参数的优化器状态,训练更有效、硬件门槛更低。
  • LoRA 使用简单的线性设计,在部署时将可训练矩阵与冻结权重合并,不存在推理延迟。
  • LoRA 与其他方法正交,可以组合。

代码内容

在这里插入图片描述
复制内容:

git clone https://www.modelscope.cn/datasets/Datawhale/DW2024_Complex_reasoning_ability_assessment_qwen2-7b-lora.git

之后就会看到有一个文件夹,点击进去,选择 lora.ipynb
运行前两个代码
在这里插入图片描述
然后逐个运行下面的代码

start_vllm

相关介绍

vLLM(Virtual Large Language Model)是一个由伯克利大学LMSYS组织开源的大规模语言模型高速推理框架。它的设计目标是在实时应用场景中大幅提升语言模型服务的吞吐量和内存使用效率。vLLM的特点包括易于使用、与Hugging Face等流行工具无缝集成以及高效的性能。

调用

调用这个vllm的服务
选择start_vllm.ipynb
在这里插入图片描述

运行主函数

运行主函数 baseline2_main.ipynb
然后要注意的是要上传相应的test的文件
在这里插入图片描述

提交结果

将生成的文件upload.jsonl提交到官网,得到相应的分数
在这里插入图片描述

总结

主要就是根据datawhale所给到的相应学习资料进行一个运行操作,了解了这个模型调整的内容,对自己来说有很多还有学习的地方

相应连接

文章当中的内容都是由datawhale所给出

https://tianchi.aliyun.com/notebook/757650

Datawhale AI夏令营第三期逻辑推理赛道baseline02跑通指南

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 2024/8/3 英语每日一段
  • 数据结构与算法 - 堆
  • Halcon 模型变化
  • 题解题解题解题解
  • 《古代希腊赛会研究:能揭开古希腊赛会的神秘面纱吗?》
  • 学习编程的第二十天,加油!
  • 【Android】通知的使用
  • 【java基础】徒手写Hello, World!程序
  • 剪画小程序:致敬奥运举重冠军:照片变成动漫风格!
  • Python 爬虫项目实战(二):爬取微博热搜榜
  • Flink笔记整理(六)
  • WordPress资源下载类主题 CeoMax-Pro_v7.6绕授权开心版
  • 函数递归(第十九天)
  • Spring中ImportBeanDefinitionRegistrar源码和使用
  • idea使用free流程,2024idea、2023idea都可以安装免费使用
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • css的样式优先级
  • Docker下部署自己的LNMP工作环境
  • electron原来这么简单----打包你的react、VUE桌面应用程序
  • HTTP传输编码增加了传输量,只为解决这一个问题 | 实用 HTTP
  • Laravel 中的一个后期静态绑定
  • Mysql数据库的条件查询语句
  • socket.io+express实现聊天室的思考(三)
  • webpack+react项目初体验——记录我的webpack环境配置
  • 对JS继承的一点思考
  • 反思总结然后整装待发
  • ------- 计算机网络基础
  • 聊聊flink的BlobWriter
  • 普通函数和构造函数的区别
  • 前端相关框架总和
  • 浅谈Golang中select的用法
  • 浅谈web中前端模板引擎的使用
  • 实现简单的正则表达式引擎
  • 小程序 setData 学问多
  • 2017年360最后一道编程题
  • 测评:对于写作的人来说,Markdown是你最好的朋友 ...
  • #控制台大学课堂点名问题_课堂随机点名
  • #我与Java虚拟机的故事#连载01:人在JVM,身不由己
  • $.ajax()参数及用法
  • (3)选择元素——(17)练习(Exercises)
  • (poj1.2.1)1970(筛选法模拟)
  • (pojstep1.1.1)poj 1298(直叙式模拟)
  • (二)windows配置JDK环境
  • (附源码)ssm高校社团管理系统 毕业设计 234162
  • (函数)颠倒字符串顺序(C语言)
  • (六) ES6 新特性 —— 迭代器(iterator)
  • (七)Flink Watermark
  • (算法)求1到1亿间的质数或素数
  • (推荐)叮当——中文语音对话机器人
  • .net framework 4.8 开发windows系统服务
  • .NET Framework 服务实现监控可观测性最佳实践
  • .NET Remoting Basic(10)-创建不同宿主的客户端与服务器端
  • .net6 core Worker Service项目,使用Exchange Web Services (EWS) 分页获取电子邮件收件箱列表,邮件信息字段
  • .NET建议使用的大小写命名原则
  • .NET微信公众号开发-2.0创建自定义菜单