当前位置: 首页 > news >正文

大语言模型的sft

https://zhuanlan.zhihu.com/p/692892489icon-default.png?t=N7T8https://zhuanlan.zhihu.com/p/6928924891.常见的sft的开发流程

a.根据业务场景调整提示词;越详细越好,不要让模型理解歧义,拆分。

b.尝试闭源和开源,以评估LLM能够解决这类场景问题。

c.准备数据,包括多个子任务。

d.训练上线迭代。

2.训练数据要注重什么?

a.确保回答格式和风格的统一。gpt4的回答风格是先复述理解问题,再回答,再总结。经验是训练数据的格式和风格越统一,越能最大限度的发挥模型在具体任务的效果上线。在LIMA,YI,Reformatted alignment中都有提到。

b.训练集既要包含难也要包含易。

相关文章:

  • 图片和PDF展示预览、并支持下载
  • 3040. 相同分数的最大操作数目 II Medium
  • 构建LangChain应用程序的示例代码:14、使用LangChain、GPT和Activeloop的Deep Lake来处理代码库
  • 稍微学学react
  • 56.WEB渗透测试-信息收集- 端口、目录扫描、源码泄露(4)
  • 43.bug:mapper接口参数使用@param重命名导致的错误
  • 怎么换自己手机的ip地址
  • C语言---深入指针(4)
  • springboot+minio+kkfileview实现文件的在线预览
  • 09 platfrom 设备驱动
  • 【Linux】信号(二)
  • 光伏电站绘制软件的基本方法
  • html标签
  • Swift 序列(Sequence)排序面面俱到 - 从过去到现在(三)
  • 【全部更新完毕】2024全国大学生数据统计与分析竞赛B题思路代码文章教学数学建模-电信银行卡诈骗的数据分析
  • ➹使用webpack配置多页面应用(MPA)
  • Bootstrap JS插件Alert源码分析
  • Computed property XXX was assigned to but it has no setter
  • css布局,左右固定中间自适应实现
  • Electron入门介绍
  • Fundebug计费标准解释:事件数是如何定义的?
  • Java到底能干嘛?
  • Joomla 2.x, 3.x useful code cheatsheet
  • js学习笔记
  • QQ浏览器x5内核的兼容性问题
  • spark本地环境的搭建到运行第一个spark程序
  • Vue2.0 实现互斥
  • WePY 在小程序性能调优上做出的探究
  • 关于使用markdown的方法(引自CSDN教程)
  • 坑!为什么View.startAnimation不起作用?
  • 强力优化Rancher k8s中国区的使用体验
  • 使用Maven插件构建SpringBoot项目,生成Docker镜像push到DockerHub上
  • 使用阿里云发布分布式网站,开发时候应该注意什么?
  • 为什么要用IPython/Jupyter?
  • 限制Java线程池运行线程以及等待线程数量的策略
  • 在Unity中实现一个简单的消息管理器
  • 字符串匹配基础上
  • Nginx惊现漏洞 百万网站面临“拖库”风险
  • 国内开源镜像站点
  • 数据库巡检项
  • ​VRRP 虚拟路由冗余协议(华为)
  • ​学习笔记——动态路由——IS-IS中间系统到中间系统(报文/TLV)​
  • # 达梦数据库知识点
  • $refs 、$nextTic、动态组件、name的使用
  • (二)Eureka服务搭建,服务注册,服务发现
  • (附源码)ssm基于微信小程序的疫苗管理系统 毕业设计 092354
  • (三)终结任务
  • (四)React组件、useState、组件样式
  • (原)本想说脏话,奈何已放下
  • (转)linux 命令大全
  • (最全解法)输入一个整数,输出该数二进制表示中1的个数。
  • *2 echo、printf、mkdir命令的应用
  • .Net - 类的介绍
  • .net core 6 集成 elasticsearch 并 使用分词器
  • .net core使用ef 6