当前位置：首页 > news >正文

大型语言模型微调新进展-4篇论文

news 来源：原创 2024/9/19 13:58:08

1. Brevity is the soul of wit: Pruning long files for code generation

发布时间：2024-06-29
链接：https://arxiv.org/abs/2407.00434
机构：伦敦大学学院 (UCL)

本研究针对大型语言模型的代码生成任务中的数据清理问题进行了探索。研究发现，仅仅剔除过长的代码文件就能显著提高模型训练的效率和性能，甚至优于基于嵌入（embedding）的复杂方法。这种方法不仅能在训练效率上带来两倍的提升，在HumanEval上的表现也提高了3.5%。然而，这也可能导致模型处理长代码文件时的困惑度增加，从而引发关于代码生成模型评估方法的思考。

2. InverseCoder: Unleashing the Power of Instruction-Tuned Code LLMs with Inverse-Instruct

发布时间：2024-07-08
链接：https://arxiv.org/abs/2407.05700
机构：中国科学院 (CAS)

本文介绍了一种名为 INVERSE-INSTRUCT 的方法，该方法通过利用代码本身来生成指令，从而进一步提升了指令微调的代码大型语言模型的能力。基于一个核心观察：将代码（形式语言）翻译成自然语言（非形式语言）比反向操作更为容易。INVERSE-INSTRUCT 利用代码大型语言模型生成代码片段的摘要，从而生成高质量的指令。通过结合原始数据集与自动生成的指令，该方法能够有效提升代码大型语言模型指令微调后的性能，在多个代码生成任务中取得了超越现有模型的成绩。

3. Curriculum Learning for Small Code Language Models

发布时间：2024-07-14
链接：https://arxiv.org/abs/2407.10194
机构：法国国立高等计算机学院 (ENSI)

本文发现课程学习能够显著提高小型代码语言模型在代码执行任务上的准确率，尽管它对代码补全的影响并不显著。研究人员提出了一种新的代码难度评估指标，并设计了一种新的课程学习时间表，证明了课程学习方法在训练代码语言模型上的有效性，为未来研究代码语言模型的课程学习应用提供了新的思路。

4. Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models

发布时间：2024-07-29
链接：https://arxiv.org/abs/2407.21077
机构：英伟达 (NVIDIA)

本文提出了一种名为 Genetic-Instruct 的方法，该方法利用自指令学习，从少量种子数据中生成大量的合成指令，从而提高大型语言模型的代码生成能力。这种方法能够有效地扩展指令生成过程，并且在多个代码生成模型的微调实验中，使用合成指令训练的模型表现出显著的性能提升。

相关文章：

北京网站建设多少钱？

辽宁网页制作哪家好_网站建设

高端品牌网站建设_汉中网站制作

Apache Cassandra：分布式NoSQL数据库

数据结构（邓俊辉）学习笔记】词典 03—— 排解冲突(1)

js遍历效率

git系统学习

【运维】Redis主从复制配置

简单的docker学习第3章 docker镜像

stm32 gpio

OpenDataLab：人工智能开放数据平台

LangChain与CI/CD的无缝对接：自动化部署的新前沿

WebRTC 初探

极狐GitLab与无问芯穹达成战略合作，共探AI落地软件智能研发场景新机遇

用Python构建一个简单的神经网络

redis面试（六）分布式锁开篇

HTML5+CSS3笔记（Xmind格式）：第三天

详细分析python下载文件的两种方式（附Demo）

【跃迁之路】【669天】程序员高效学习方法论探索系列（实验阶段426-2018.12.13）...

crontab执行失败的多种原因

JavaScript设计模式系列一：工厂模式

MySQL-事务管理（基础）

Python十分钟制作属于你自己的个性logo

React+TypeScript入门

SegmentFault 社区上线小程序开发频道，助力小程序开发者生态

Three.js 再探 - 写一个跳一跳极简版游戏

vue的全局变量和全局拦截请求器

Webpack 4 学习01（基础配置）

初探 Vue 生命周期和钩子函数

快速体验 Sentinel 集群限流功能，只需简单几步

山寨一个 Promise

使用Tinker来调试Laravel应用程序的数据以及使用Tinker一些总结

腾讯视频格式如何转换成mp4 将下载的qlv文件转换成mp4的方法

移动端唤起键盘时取消position:fixed定位

阿里云服务器如何修改远程端口？

# 数仓建模：如何构建主题宽表模型？

#微信小程序：微信小程序常见的配置传值

（1/2）敏捷实践指南 Agile Practice Guide （[美] Project Management institute 著）

（6）设计一个TimeMap

(AngularJS)Angular 控制器之间通信初探

（第三期）书生大模型实战营——InternVL(冷笑话大师)部署微调实践

（附源码）ssm考试题库管理系统毕业设计 069043

（附源码）ssm智慧社区管理系统毕业设计 101635

（附源码）基于SpringBoot和Vue的厨到家服务平台的设计与实现毕业设计 063133

（附源码）计算机毕业设计SSM基于java的云顶博客系统

（七）理解angular中的module和injector，即依赖注入

（十八）Flink CEP 详解

（转）http-server应用

... 是什么？... 有什么用处?

.NET 材料检测系统崩溃分析

.NET 依赖注入和配置系统

.NET：自动将请求参数绑定到ASPX、ASHX和MVC（菜鸟必看）

.net遍历html中全部的中文,ASP.NET中遍历页面的所有button控件

.NET单元测试使用AutoFixture按需填充的方法总结

.NET建议使用的大小写命名原则

.Net中的设计模式——Factory Method模式

.NET中的十进制浮点类型,徐汇区网站设计

.NET周刊【7月第4期 2024-07-28】