当前位置: 首页 > news >正文

[Datawhale AI夏令营 2024 第四期] 从零入门大模型微调之旅的总结

0. 引言:

在人工智能飞速发展的今天,掌握大模型微调技能对于从事 AI 研究和开发的专业人士来说至关重要。因此,Datawhale AI夏令营 2024 第四期] 从零入门大模型微调之旅;顺便参加了星火大模型驱动阅读理解题库构建挑战赛。

1. DataWhale 夏令营:

DataWhale AI 夏令营是一个为期数周的密集培训项目,它给像我这样的初学者带来了多方面的好处。
首先,夏令营提供了由行业专家精心设计的课程体系,内容覆盖了从基础理论到高级实践的各个层面。其次,夏令营的实战导向教学让我得以将理论知识应用于实际问题中,通过项目作业和团队合作,我的编程能力和问题解决能力都得到了显著提高。此外,夏令营还为我提供了与来自不同背景的同行交流的机会,这些交流极大地拓宽了我的视野并激发了我对未来可能研究方向的思考。

2. 星火大模型驱动阅读理解题库构建挑战赛:

为了有效地进行大模型微调,需要参加星火大模型驱动阅读理解构建挑战赛。得益于 DataWhale AI 的 Baseline, 可以自动化的处理初赛的文本,减少数据集的处理时间;
在这里插入图片描述
目前的几次提交,主要是比较精细化的清洗训练数据集,满足大赛的要求;比如说:数据集中的错误字符,错误答案,数据集中的问题过少等;只是清洗训练数据集,就可以提高分数;说明金标准的数据集的重要性;

目前,觉得训练的数据集,还可以挖掘得更好一下,

  • 出题不足 4 道题目,需要通过数据扩增的方式,填补;
  • Promot 工程更科学一些;
  • 添加训练集中没有的新的数据集,进行扩增数据

针对数据线下需要补充的知识点,也记录下来:

  • one shot learining 策略 以及 Paper: https://arxiv.org/pdf/2312.10302
  • 本地实现结果评分

3.结论:

通过参加DataWhale AI夏令营,我不仅掌握了大模型微调的关键技能,更重要的是学会了如何持续学习和自我提升。在这个充满挑战和机遇的AI时代,DataWhale给予我的不仅仅是知识,更是前行的动力和方向。我将这份感激之情转化为行动,继续在我的AI旅程上不断进步,希望将来也能为这个社区做出自己的贡献。在此,我再次向DataWhale表示最诚挚的谢意,并期待未来有更多机会参与这样有意义的活动。',

4. 其他

从 DataWhale 上摘录的 大模型有用的资源
大模型知识
大模型白盒子构建指南:从原理出发、以“白盒”为导向、围绕大模型全链路的“手搓”大模型指南
https://github.com/datawhalechina/tiny-universe

大模型基础: 一文了解大模型基础知识
https://github.com/datawhalechina/so-large-lm

如果你想从0手写代码,构建大语言模型,本项目很适合你。
https://github.com/datawhalechina/llms-from-scratch-cn

吴恩达系列课程
https://github.com/datawhalechina/llm-cookbook

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • wordpress网站“ERR_CONNECTION_REFUSED”错误
  • string模拟
  • leetcode 21-30(2024.08.16)
  • P2460[SDOI2007] 科比的比赛
  • PyTorch--深度学习
  • 开源通用验证码识别OCR —— DdddOcr 源码赏析(一)
  • [C#]winform基于opencvsharp结合Diffusion-Low-Light算法实现低光图像增强黑暗图片变亮变清晰
  • 基于改进YOLOv8的景区行人检测算法
  • C语言——函数专题
  • LSTM 模型原理
  • Python----爬虫
  • django之select_related 与 prefetch_related用法
  • windows C++- C++/WinRT和COM组件(下)
  • Python编写Word文档
  • css-定位
  • 收藏网友的 源程序下载网
  • 自己简单写的 事件订阅机制
  • 0x05 Python数据分析,Anaconda八斩刀
  • 2017-08-04 前端日报
  • 4月23日世界读书日 网络营销论坛推荐《正在爆发的营销革命》
  • electron原来这么简单----打包你的react、VUE桌面应用程序
  • iOS仿今日头条、壁纸应用、筛选分类、三方微博、颜色填充等源码
  • Linux Process Manage
  • magento 货币换算
  • v-if和v-for连用出现的问题
  • Vue源码解析(二)Vue的双向绑定讲解及实现
  • Vue组件定义
  • Webpack4 学习笔记 - 01:webpack的安装和简单配置
  • 阿里云购买磁盘后挂载
  • 高程读书笔记 第六章 面向对象程序设计
  • 后端_ThinkPHP5
  • 前端攻城师
  • 数组的操作
  • 运行时添加log4j2的appender
  • Hibernate主键生成策略及选择
  • ​学习笔记——动态路由——IS-IS中间系统到中间系统(报文/TLV)​
  • # 学号 2017-2018-20172309 《程序设计与数据结构》实验三报告
  • #define MODIFY_REG(REG, CLEARMASK, SETMASK)
  • #define、const、typedef的差别
  • #Ubuntu(修改root信息)
  • #绘制圆心_R语言——绘制一个诚意满满的圆 祝你2021圆圆满满
  • #我与Java虚拟机的故事#连载11: JVM学习之路
  • (01)ORB-SLAM2源码无死角解析-(66) BA优化(g2o)→闭环线程:Optimizer::GlobalBundleAdjustemnt→全局优化
  • (delphi11最新学习资料) Object Pascal 学习笔记---第13章第1节 (全局数据、栈和堆)
  • (html5)在移动端input输入搜索项后 输入法下面为什么不想百度那样出现前往? 而我的出现的是换行...
  • (java版)排序算法----【冒泡,选择,插入,希尔,快速排序,归并排序,基数排序】超详细~~
  • (附源码)ssm失物招领系统 毕业设计 182317
  • (附源码)基于SpringBoot和Vue的厨到家服务平台的设计与实现 毕业设计 063133
  • (黑马出品_高级篇_01)SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式
  • (四)stm32之通信协议
  • (完整代码)R语言中利用SVM-RFE机器学习算法筛选关键因子
  • (转载)Linux 多线程条件变量同步
  • . Flume面试题
  • .halo勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .NET/C# 使窗口永不激活(No Activate 永不获得焦点)