当前位置: 首页 > news >正文

LLaMA-Factory 使用 alpaca 格式的数据集

LLaMA-Factory 使用 alpaca 格式的数据集

flyfish

alpaca 格式最初与Stanford大学的一个研究项目相关联,该项目旨在通过少量高质量的数据来微调大型语言模型。它受到了Alpaca模型(一种基于LLaMA的指令跟随模型)的影响,该模型是在Meta AI的LLaMA基础上进行改进而来的。

alpaca 格式的数据集应遵循以下格式:

[{"instruction": "user instruction (required)","input": "user input (optional)","output": "model response (required)","system": "system prompt (optional)","history": [["user instruction in the first round (optional)", "model response in the first round (optional)"],["user instruction in the second round (optional)", "model response in the second round (optional)"]]}
]

在 data/dataset_info.json 文件中提供您的数据集定义,并采用以下格式:

对于 alpaca 格式的数据集,其 dataset_info.json 文件中的列应为:

"dataset_name": {"file_name": "dataset_name.json","columns": {"prompt": "instruction","query": "input","response": "output","system": "system","history": "history"}
}

字段作用

instruction: 用户给出的指令或问题,是必须提供的信息。
input: 可选的额外输入信息,可以为空,用于提供给定指令的上下文或具体例子。
output: 模型根据指令和输入产生的响应,是必须提供的信息。
system: 可选的系统提示,用来为整个对话设定场景或提供指导原则。
history: 一个列表,包含之前轮次的对话记录,每一对都是用户消息和模型回复。这有助于保持对话的一致性和连贯性。

示例1: 单轮对话

[{"instruction": "解释一下什么是人工智能。","input": "","output": "人工智能(Artificial Intelligence, AI)是指由人制造出来的具有一定智能的系统,能够理解和学习人类的行为,并且能够执行任务、解决问题以及适应新环境。它通常包括机器学习、自然语言处理、计算机视觉等技术领域。","system": "你是一位专业的AI讲师。","history": []}]

在这个例子中:

instruction 是用户给模型的指令。
input 字段为空,因为没有额外的信息提供给模型。
output 是模型根据指令生成的回答。
system 提供了一个角色设定,让模型扮演一位AI讲师。
history 列表为空,表示这是一个新的对话,之前没有对话历史。

示例2: 多轮对话

[{"instruction": "告诉我明天济南的天气。","input": "","output": "明天济南的天气预报显示是晴天,气温大约在15到25摄氏度之间。","system": "你是一位气象专家。","history": [["今天济南的天气怎么样?", "今天济南的天气是多云转晴,气温大约在10到20摄氏度之间。"]]},{"instruction": "那后天呢?","input": "","output": "后天济南可能会有小雨,气温会稍微下降一些,预计在13到22摄氏度左右。","system": "你是一位气象专家。","history": [["今天济南的天气怎么样?", "今天济南的天气是多云转晴,气温大约在10到20摄氏度之间。"],["告诉我明天济南的天气。", "明天济南的天气预报显示是晴天,气温大约在15到25摄氏度之间。"]]}]

在这个多轮对话的例子中:

第一条记录包含了用户询问明天济南天气的指令,以及模型给出的回答。
history 包含了前一轮对话的内容,这样可以让模型理解当前对话的上下文。
第二条记录则是继续上一轮的对话,询问后天的天气情况,同时history也更新为包含前面所有对话的历史。

模型能够一次性从新闻文章中提取出多个关键信息(如事件类型、地点、时间等),alpaca格式的数据集

[{"instruction": "从以下文本中提取发生的事件类型、地点和时间。","input": "昨天,在加州的一家购物中心发生了一起火灾事故,幸好没有人员伤亡。","output": "事件类型: 火灾; 地点: 加州; 时间: 昨天","system": "你是一位信息分析师,擅长从文本中提取关键信息。","history": []},{"instruction": "从以下文本中提取发生的事件类型、地点和时间。","input": "本周三,加州市中心的一座办公楼发生了爆炸,造成多人受伤。","output": "事件类型: 爆炸; 地点: 加州市中心; 时间: 本周三","system": "你是一位信息分析师,擅长从文本中提取关键信息。","history": []},{"instruction": "从以下文本中提取发生的事件类型、地点和时间。","input": "上个月底,加州的一个工业园区内发生化学品泄漏,导致附近居民紧急疏散。","output": "事件类型: 化学品泄漏; 地点: 加州的一个工业园区; 时间: 上个月底","system": "你是一位信息分析师,擅长从文本中提取关键信息。","history": []}
]

instruction 给出了明确的任务指示,即从给定文本中提取事件类型、地点和时间。
input 是包含相关信息的原始新闻文本。
output 则是模型应该生成的答案,它以结构化的方式列出了所有的关键信息。
system 提供了角色设定,帮助模型理解其任务背景。
history 在这个情况下为空,因为每个条目都是独立的单轮对话。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Linux 常用命令 - more 【分页显示文件内容】
  • react + antDesign封装图片预览组件(支持多张图片)
  • 全面掌握大模型:从零基础到精通的终极指南,超详细教程手把手教会你,收藏我这一篇就够了
  • Java笔试面试题AI答之设计模式(5)
  • python gensim实现作者主题模型(Author-Topic Model)
  • 车路云一体化大模型数据治理方案
  • 什么是RTOS操作系统
  • 内核驱动开发之系统移植
  • mysql update语句的执行流程
  • PDB数据库中蛋白质结构文件数据格式
  • Python 类class的用法详解
  • 《重生之我在java世界做任务升级》--第一章
  • 免费的跨平台剪贴板工具,超好用!
  • 【计算机网络】计算机网络基础二
  • Java Web服务运行一段时间后出现cpu升高导致的性能下降问题排查
  • [ JavaScript ] 数据结构与算法 —— 链表
  • 【知识碎片】第三方登录弹窗效果
  • co.js - 让异步代码同步化
  • CSS进阶篇--用CSS开启硬件加速来提高网站性能
  • Eureka 2.0 开源流产,真的对你影响很大吗?
  • Intervention/image 图片处理扩展包的安装和使用
  • Java Agent 学习笔记
  • Kibana配置logstash,报表一体化
  • Markdown 语法简单说明
  • MySQL主从复制读写分离及奇怪的问题
  • nginx 负载服务器优化
  • windows-nginx-https-本地配置
  • 程序员最讨厌的9句话,你可有补充?
  • 开年巨制!千人千面回放技术让你“看到”Flutter用户侧问题
  • 使用agvtool更改app version/build
  • 手机端车牌号码键盘的vue组件
  • 延迟脚本的方式
  • 一份游戏开发学习路线
  • 用简单代码看卷积组块发展
  • 【运维趟坑回忆录】vpc迁移 - 吃螃蟹之路
  • 阿里云ACE认证学习知识点梳理
  • 如何用纯 CSS 创作一个菱形 loader 动画
  • ​​​​​​​ubuntu16.04 fastreid训练过程
  • #define用法
  • #NOIP 2014# day.1 T2 联合权值
  • #Z2294. 打印树的直径
  • (2024最新)CentOS 7上在线安装MySQL 5.7|喂饭级教程
  • (pycharm)安装python库函数Matplotlib步骤
  • (zz)子曾经曰过:先有司,赦小过,举贤才
  • (附源码)springboot 校园学生兼职系统 毕业设计 742122
  • (免费领源码)python#django#mysql公交线路查询系统85021- 计算机毕业设计项目选题推荐
  • (三)终结任务
  • (深入.Net平台的软件系统分层开发).第一章.上机练习.20170424
  • (学习日记)2024.04.10:UCOSIII第三十八节:事件实验
  • (转)拼包函数及网络封包的异常处理(含代码)
  • .htaccess配置重写url引擎
  • .NET Core MongoDB数据仓储和工作单元模式封装
  • .net core 实现redis分片_基于 Redis 的分布式任务调度框架 earth-frost
  • .NET Framework杂记
  • .Net Web项目创建比较不错的参考文章