当前位置: 首页 > news >正文

2024最新版,人大赵鑫老师《大语言模型》新书pdf分享

本书主要面向希望系统学习大语言模型技术的读者,将重点突出核心概念与 算法,并且配以示例与代码(伪代码)帮助读者理解特定算法的实现逻辑。由于大语言模型技术的快速更迭,本书无法覆盖所有相关内容,旨在梳理最具代表性的基础知识内容,帮助读者更好地了解大语言模型技术的核心知识点,能够快速上手相关的科研与工程项目。为了配合本书的阅读与使用,我们创建了一个 GitHub项目网站,该网站收集了关于大语言模型的相关资源。

本书共设置了五个主要部分,分别是背景与基础知识部分、预训练部分、微调与对齐部分、大模型使用部分以及评测与应用部分,按照如下的内容组织进行设置:

• 背景与基础知识部分. 第 2 章将首先介绍大语言模型的构建过程,随后介绍大语言模型相关的背景知识以及重要概念,包括涌现能力、扩展定律以及二者之间的联系与区别;进一步介绍 GPT 系列模型的发展历程以及各个阶段的重要技术创新,从而能够更好地了解大语言模型的技术升级历史。第 3 章将介绍目前大语言模型相关的资源信息,包括公开可用的模型检查点与 API 、数据集合以及代码工具库,为读者梳理与汇总相关资源。

131.5 本书的内容组织

• 预训练部分. 第 4 章将主要介绍预训练数据的准备工作,主要包括数据的收集、清洗以及词元化方法,随后将介绍数据课程的设计方法。第 5 章将主要介绍大语言模型的架构,主要包括 Transformer 模型、各种组件的详细配置、长文本建模以及一些新型的模型架构。第 6 章将主要介绍预训练过程所涉及到的预训练任务、优化参数设置、可扩展的训练技术以及参数量计算与效率分析方法,并通过相关实战代码进行讲解。

• 微调与对齐部分. 第 7 章将主要介绍指令微调所涉及的数据构建、优化策略;进一步将介绍典型的轻量化微调技术,减少模型训练的开销;并且通过实践示例介绍指令微调的具体流程。第 8 章将主要介绍大模型的人类对齐技术,将以RLHF 为主要方法进行详细介绍,并且进一步介绍非强化学习的对齐方法,最后探讨 SFT 与 RLHF 之间的关系。

• 大模型使用部分. 第 9 章将主要介绍大模型的解码与部署方法,包括解码策略、解码加速算法、低资源部署策略以及其他模型压缩方法。第 10 章将主要介绍面向大语言模型的提示学习技术,包括基础的提示学习设计方法、上下文学习方法以及思维链方法等。第 11 章将主要介绍面向复杂任务的规划技术,探索如何将复杂任务进行有效分解,并通过回溯、反思等关键技术形成有效的解决方案;进一步,将介绍如何构建基于大语言模型的智能体以及多智能体系统。

• 评测与应用部分. 第 12 章将主要介绍面向大语言模型性能的评测方法,针对不同的能力维度介绍相关的评测集合、评测指标以及评测方法,并且指出大语言模型目前存在的问题。第 13 章将主要介绍大语言模型的应用情况,具体将分别从代表性的研究领域以及应用领域两个维度展开讨论,我们将以代表性工作为驱动,使得读者能够了解如何将大语言模型进行领域特化以及任务特化。

最后,第 14 章将对于全文的内容进行总结,进一步梳理目前每个部分存在的技术挑战以及研究趋势。

目录

本书内容截图

本书pdf免费下载地址

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • FPGA与Matlab图像处理之伽马校正
  • RusTitW:大规模语言视觉文本识别数据集(猫脸码客 第190期)
  • CAD图纸加密软件哪个好?10款2024主流CAD图纸加密软件分享!
  • 监控易监测对象及指标之:全面监控FTP服务器
  • ubuntu服务器版NVIDIA驱动失效解决方案
  • 宝塔Linux部署 Vue + Spring Boot + MySQL + Redis
  • C++中一般指针,指针数组,数组指针
  • Java入门,初识Java
  • web基础—dvwa靶场(五)File Upload
  • 【CMake】使用CMake在VIsual Studio内构建多文件夹工程
  • JavaScript 事件处理
  • Redis——常用数据类型string
  • python 使用seleniumwire获取响应数据以及请求参数
  • Android前台服务如何在后台启动activity?
  • Linux memcg lru lock提升锁性能
  • 【391天】每日项目总结系列128(2018.03.03)
  • 【vuex入门系列02】mutation接收单个参数和多个参数
  • 【腾讯Bugly干货分享】从0到1打造直播 App
  • css布局,左右固定中间自适应实现
  • Django 博客开发教程 16 - 统计文章阅读量
  • el-input获取焦点 input输入框为空时高亮 el-input值非法时
  • HTTP--网络协议分层,http历史(二)
  • JavaScript标准库系列——Math对象和Date对象(二)
  • JDK 6和JDK 7中的substring()方法
  • MySQL用户中的%到底包不包括localhost?
  • React16时代,该用什么姿势写 React ?
  • spring cloud gateway 源码解析(4)跨域问题处理
  • SpringCloud(第 039 篇)链接Mysql数据库,通过JpaRepository编写数据库访问
  • UMLCHINA 首席专家潘加宇鼎力推荐
  • Webpack 4 学习01(基础配置)
  • 动态魔术使用DBMS_SQL
  • 近期前端发展计划
  • 前端工程化(Gulp、Webpack)-webpack
  • 手机端车牌号码键盘的vue组件
  • 通过获取异步加载JS文件进度实现一个canvas环形loading图
  • 看到一个关于网页设计的文章分享过来!大家看看!
  • postgresql行列转换函数
  • 昨天1024程序员节,我故意写了个死循环~
  • # 20155222 2016-2017-2 《Java程序设计》第5周学习总结
  • #知识分享#笔记#学习方法
  • (1)安装hadoop之虚拟机准备(配置IP与主机名)
  • (day6) 319. 灯泡开关
  • (poj1.3.2)1791(构造法模拟)
  • (补充):java各种进制、原码、反码、补码和文本、图像、音频在计算机中的存储方式
  • (初研) Sentence-embedding fine-tune notebook
  • (多级缓存)缓存同步
  • (黑马出品_高级篇_01)SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式
  • (免费领源码)python#django#mysql校园校园宿舍管理系统84831-计算机毕业设计项目选题推荐
  • (七)c52学习之旅-中断
  • (四)Android布局类型(线性布局LinearLayout)
  • (算法)N皇后问题
  • (图文详解)小程序AppID申请以及在Hbuilderx中运行
  • (转)Mysql的优化设置
  • (转)利用PHP的debug_backtrace函数,实现PHP文件权限管理、动态加载 【反射】...
  • (转)自己动手搭建Nginx+memcache+xdebug+php运行环境绿色版 For windows版